이세돌이 이기기 위한 바둑+

4358

Updated at 2016-03-12 15:18:32

뭐라고 이름을 붙일까 하다가 바둑+라고 붙였는데,

쉽게 말하면 바둑판 크기를 조금 바꾸면 됩니다. 작으면 경우의 수가 줄어드니까 현재의 19*19를 늘려서 40*40짜리 바둑판에서 한번 해보자고 하면 이세돌이 초반 이득을 통해 승리할 수 있을 거라고 생각합니다.

인간이라면 바둑을 배웠다면 바둑판 크기를 조금 바꾼다고 해도 어렵지 않게 수를 풀어나갈 수 있을테지만,

알파고의 경우에는 다른 사람들이 둔 것을 통해 초반을 외우다시피 익힌 거라 바둑판 크기를 조금만 바꿔도 계산 시간이 너무 크게 늘어나면서 패배할 겁니다. 이 게임에 지더라도 인간을 따라오려면 멀었다고 말할 수 있는 이유죠. 사실 승리의 기쁨도 모를테지만.

Comments

Updated at 2016-03-12 15:19:32

경우의 수가 늘어난다고 해도 알파고 역시 충분히 대응이 가능할 것 같습니다.

예를들어 바둑판이 37*37 로 확장이 될 경우 좌상귀의 위치는 현재 4*4 가 아닌 7*7 로 우하귀의 위치는 현재 16*16 이 아닌 31*31 로 포인트가 변동될 뿐 각 화점들이 가지는 중요도는 동일하다고 봅니다.

따라서 알파고는 자신이 가지고 있는 기보를 37*37 포인트로 변환해서 초반포석이나 돌의 흐름이 유사한 기보들을 분석하고 시뮬레이션 해보겠죠.

오히려 인간보다 더 빨리 적응할 수도 있을것 같네요.

Updated at 2016-03-12 15:26:09

현재 알파고의 알고리듬이 그렇게 짜여있지 않은 걸로 알고, 딥러닝 부분이 본문에서처럼 짜여진 거라 그게 없으면 예전의 프로들에게 지던 프로그램들과 똑같습니다. 몬테카를로 기법을 통한 시뮬레이션은 오래전부터 있던 알고리듬이고,

딥러닝의 경우 격자 수가 고정된 기보를 통해 습득하는 건데, 격자수가 달라지면 자료가 없어서 습득할 수가 없을 거에요.

알파고가 화점에 두며 시작하는 건 그 전의 기보들을 통해 외운 것을 통해 그 중에 나은 것을 선택한 것이지 그것이 시뮬레이션 결과 최고라서 선택한 것이 아니에요.

2016-03-12 20:04:07

왼쪽이 바둑 (19*19) , 오른쪽이 바둑+ (37*37) 입니다.

A부터 F까지의 수는 포인트는 다르지만 바둑판 위에서 동일한 의미를 가지고 있는 수들 입니다.

바둑에서 A(4,4)의 위치는 바둑플러스에서는 (7,7)로 , E(17,14)의 위치는 바둑플러스에서는 (33,27)로 변환됩니다.

이처럼 바둑플러스에서 상대가 X,Y 위치에 돌을 놓을 경우 알파고는 (X-1)/2+1,(Y-1)/2+1 로 변환하면 자신의 알고리즘에서 시뮬레이션이 가능합니다. 그리고 그에 응수할 착점을 바둑플러스로 변환하여 수를 둘 수 있습니다.

문제는 (8,12) 같은 수를 상대가 두었을때 이를 바둑으로 변환하면 (4.5,6.5) 같이 정확한 착점이 나오지 않는다는 것 입니다.

이런 경우 (4,6) , (4,7) , (5,6) , (5,7) 4가지의 경우로 변환을 하게될텐데 이 숫자를 어떻게 처리하느냐에 따라서 알파고가 바둑플러스에 얼마나 유연하게 대처할 수 있느냐가 정해질 것 같습니다.

변환한 위치에 이미 다른 돌이 있을 수도 있고 자신의 두었던 자리에 또다시 돌을 두어야 하는 오류가 나올 수도 있습니다.

이부분에서는 확실히 응용능력을 가지고 있는 인간이 유리하겠죠.

그리고 바둑+ 가 실제로 개발된다면 아마 현재의 화점이 가지고 있는 의미를 고려하여 (6X+1) * (6X+1) 형태로 나오겠죠.

이경우 어떻게든 기존의 바둑에서 일정비율로 바둑판이 확대되기 때문에 각 지점이 가지고 있는 의미는 기존의 바둑과 유사할 것 입니다.

하지만 4X+1 , 5X+1 의 형태라든가 말씀하신 40*40 이라면 아마도 알파고가 더 많은 오류를 범하게 되겠죠.

아마 18*18 혹은 20*20 같은 형태라면 훨씬 많은 오류를 범할것 입니다.

하지만 이경우는 인간도 오류를 범하기는 마찬가지겠죠. 아마 포석을 처음부터 다시 연구해야될 것 입니다. (그래도 귀>변>중앙 순의 중요성은 불변의 진리일 것 같네요.)

물론 처음부터 다시 연구해야되는 게임을 한다면 당연이 기계보다는 인간이 유리하다고 생각합니다.

2016-03-12 20:13:36

40*40 규격이 현재 바둑의 포맷을 완전히 뒤엎는 새로운 포맷을 의도로 말씀하신 규격이라면 바스켓굿님의 의견이 100% 맞다고 생각합니다.

Updated at 2016-03-12 15:42:44

알파고의 알고리즘이 격자수가 가로세로 두배이상 늘었을때도 그거에 맞춰서 인간처럼 응용이 가능한 프로그램인가요? 그저 착점이 될수없는 점을 기보분석으로 걸러내서 남은 모든 착점에 대해서 무한 시뮬레이션 돌려서 그때그때마다 최적의 착점찾아내는 계산기에 불과한데 설령 기보분석을 해서 착점이 될수없는 지점을 최대한 걸러낸다고 하더라도 기존(361!)에서 (1600!)로 경우의 수가 기하급수적으로 늘어난상황에서 시간제한땜에 구글에서 거부하면 거부했지 현재 성능으로는 지금처럼 최적의 착점을 찾을수없을꺼같습니다.

2016-03-12 20:09:58

저도 알파고의 알고리즘에 대하여 가끔씩 님께서 알고계신 것과 동일하게 알고있습니다.

제가 말하고자 하는 부분은 "최적의 착점"이 아닌 "최적의 착점과 유사한 착점" 을 두어 바둑플러스에서도 대응이 가능할 것 이다라는 점 입니다. 중복되는 댓글이 될 겉같으니 위에 바스켓굿 님의 댓글에 달아놓은 댓글을 읽어 주시면 감사하겠습니다.

Updated at 2016-03-12 15:39:36

말이 바둑이지 알파고가 '아직' 학습하지 않은 새로운 게임을 도입한다 말씀이시죠

그렇게 한다 해도 시간 문제겠죠

Updated at 2016-03-12 15:48:03

물론 시간 문제죠. 하지만 현재는 이길 수 있습니다. 인간이라면 그 시간이 걸리지 않고요. 그리고 단지 격자가 늘어난 것을 새로운 게임으로 인식한다는 것 자체가 어떻게 보면 아직은 인간이 나은 것이라는 것이죠.

제가 정말 말하고 싶은 내용은, 이번 알파고 사건은 기계가 학습을 인간을 얼마나 따라할 수 있는가(능가가 아니라) 보여주는 좋은 예입니다. 계산 능력이 컴퓨터가 우수한 것은 어떻게 보면 지금까지도 당연한 것이었는데, 큰 그림을 그리는 기계는 불가능해보이는 것을 지금의 알파고는 해내는 것처럼 보인다는 것이 정말 놀라운 것이거든요. 하지만 그렇다고 해도 아직은 갈 길이 먼 것이. 초반 수 읽어내는데에 많은 시간이 걸리는 것을 봐도 알 수 있듯, 인간은 단번에 직관적으로 받아들이는 것들에 대해 컴퓨터는 시간이 많이 걸리고 이건 아직 효율적이지 못하다는 걸 보여주는 것이기도 하거든요.

2016-03-12 16:07:32

지금 굉장히 재밌게 잘 두네요 이세돌
오늘 현재의 이세돌도 이길수 있다는 걸 보여줬으면 하네요

2016-03-12 16:09:57

네. 알파고는 이세돌을 알지만, 이세돌은 알파고를 몰랐다는게 큰 패널티였다고 생각을 하고, 이세돌도 그동안 알파고가 어떻게 돌아가는지 공부할 시간이 있었을 거라고 생각해요.

2016-03-12 16:41:41

혹 기계가 인간을 이긴다고 인간보다 더 나은것이라는 전제가 좀 모순이네요
게다가 룰을 바꾸면 그것은 이미 바둑이 아님과 동시에 순전히 인간이 이기길 위한 게임이 되는데 의미가 있을까 싶기도 하구요
스타크래프트에서 컴퓨터랑 1:1하다가 치트키 치는 느낌?
어쨋든 알고리즘이 다르니 필승법이긴 하겠네요