챔피언을위한 조언

Go의 세계는 이전 게시물에서보고 한 것처럼 충격에 처해 있습니다. 처음으로 컴퓨터 프로그램은 프로 선수를 때렸습니다. 이 위업의 컴퓨터 프로그램 인 AlphaGo는 Google Deep Mind에서 개발했으며 몇 가지 첨단 기술을 사용합니다 (자세한 내용은 이전 게시물 참조). 체스보다 더 많은 가능성을 가진 아시아 게임 인 고 (Go)가 인공 지능의 성배로 여겨졌 기 때문에 결과는 혁신적이었습니다. 컴퓨터는 최상위 레벨에서 플레이하기 위해 직감을 나타낼 수 있어야한다고 생각 했었습니다. 이제는 할 수있는 것처럼 보입니다.

인류가 곧 더 악화 될 수 있습니다. AlphaGo는 3 월 9 일부터 3 월 15 일까지 세계 최고의 선수 중 한 명인 9 단이 세돌 (한국)과 경기를합니다. 이번 경기는 서울에서 열리고 5 경기에 걸쳐 1 백만 달러의 상금이 주어질 예정이다. 리 세돌 (AI Lee)은 AI에 대한 인간의 자존심에 대한 마지막 요새를 지키고 있습니까?

Fernand Gobet
출처 : Fernand Gobet

한국은 일본 이름이 아니라 "바둑 (baduk)"이라고 불리는 고 (Go)의 주요 국가 중 하나입니다. (아마도 AlphaGo는 AlphaBaduk로 이름을 변경해야합니다). 33 세의이 세돌 (Sedol)은 이길 것이라고 확신하지만, 바둑 지역 사회는 확신하지 못합니다.

긍정적 인면에서 Lee Sedol은 지난해 10 월 AlphaGo에 0-5로 패한 2-dan 프로와 유럽 챔피언 인 Fan Hui보다 훨씬 강하다. 차이점은 체스에서 마스터와 최고 마스터 사이의 차이와 유사합니다. 이 세돌은 팬 후이와의 경기에서 대부분 승리 할 것으로 예상된다.

부정적인면에서 Fan Hui는 경기의 모든 경기를 잃었습니다. AlphaGo는 2 단식 프로의 우위를 훨씬 능가합니다. Google Deep Mind에서 개선 된 버전을 사용할 가능성도 있습니다. 예를 들어, AlphaGo는 10 월 이후 5 개월 동안 추가 학습을 통해 순위 및 이동 선택 평가를 개선했습니다. 또한 더 강력한 하드웨어를 사용할 수도 있고 이전 데이터베이스에서 사용하지 않은 데이터베이스를 사용할 수도 있습니다. 이것은 첫 번째 움직임에서 인간의 지식을 활용할 수있게하여 오프닝 라인을 피할 수있게합니다.

이 세돌은 어떤 전략을 채택해야합니까?

일부 연구자들은 압력 수행이 "모든 것이 다"라고 부인할 수 있지만, 새로운 연구 결과 (Chib, Shimojo, & O'Doherty, 2014)가 압력을 가하면 진정한 신경 학적 발자국을 남겨 사람들이 "질식"하고 능력 수준. Sedol은 경기가 진행되는 동안 세계적인 주목을 받으면 상당한 심리적 압박을받을 것입니다. 그는 자신감이 넘치고 이미 재 시합에 관해 이야기하고 있습니다. 재 시합이 과신하지 않으면 좋은 태도입니다. 1997 년 딥 블루와의 경기에서 세계 체스 챔피언 인 게리 카스파로프 (Gary Kasparov)는 압력을 잘 처리하지 못했고 심각한 실수를 범했습니다 (Hsu, 2002). 세돌 (Sedol)이 정신적으로 자신을 준비하는 데 사용할 수있는 몇 가지 기술이 있습니다. 그는 컴퓨터 프로그램을 상대로 게임을 할 수 있으므로 컴퓨터 게임에 익숙해집니다. 사용 가능한 컴퓨터 프로그램은 AlphaGo보다 훨씬 약하므로 컴퓨터에 대해 어려운 위치를 선택해야합니다. 여기에는 물질적 장애로 시작하는 게임이 포함됩니다. 분명히, 그는 경기 일정에 동의 한 연습을해야합니다.

가능하다면 알파 – 고 (Alpha-Go) 게임이 특정 취약점을 식별 할 수 있도록 게임을 조사해야합니다. 이상적으로, 성냥 계약은 성냥 준비 중에 Alpha-Go 이 그러한 게임을 정기적으로 제공해야한다고 규정되어 있어야합니다. 경연 대회가 창립 될 것이라는 공표를 감안할 때, 우리는 이것이 사실이라고 의심합니다. 일반적으로 AlphaGo의 강점은 약점입니다. 많은 수의 마스터 게임을 배우고 사용하는 데 수백만 개의 직책이 필요합니다. 최상위 레벨 플레이어가 서로 경쟁하는 게임이 훨씬 적기 때문입니다. 따라서, 그것의 놀이는 최고 수준의 선수보다는 주인의 놀이에 모델링됩니다. 마스터는 분명히 최상위 레벨 플레이어보다 약하고, Lee Sedol과 같은 세계적 수준의 선수는이 상대적으로 열등한 지식을 이용할 수 있어야합니다. 그러나 AlphaGo는 또한 셀프 플레이로 학습합니다. 어느 정도까지는 이것이 학습에 사용 된 게임의 종류를 보완하지 않으며, 경기의 결정적인 요인이 될 수도 있습니다.

종종 인간 전문 기술의 특징으로 여겨지는 패턴 인식 (Gobet, 2015)으로 탁월한 반면, AlphaGo는 룩 어 헤드 검색에 있어서는 약합니다. 이는 검색을 수행하는 방식이 중요한 선을 검사하여 통계적으로 수행하기 때문입니다. 이 점에서 정확한 검색을 위해 최적화 된 Deep Blue의 반대입니다. 리 세돌 (Lee Sedol)은 전술적 변이를 포함하는 직책을 선택함으로써이를 활용할 수 있습니다. AlphaGo의 통계 검색은 이러한 미묘한 부분을 놓치고 대다수의 움직임에 의해 지원되지만 한 번의 이동으로 논박되는 라인으로 갈 수 있습니다.

Lee Sedol에게는 딜레마가 AlphaGo의 약점을 이용하기 위해 인간을 대항하거나 스타일을 바꾸어 플레이해야하는지 여부가 포함됩니다. 후자를 할 때 위험합니다. 체스에 대한 연구에 따르면 플레이어는 자신이 전문화 한 스타일을 벗어나 플레이 할 때 약한 레벨에서 수행됩니다 (Bilalić, McLeod, & Gobet, 2009). 이 결론은 Go에도 적용될 수 있습니다. 또한, AlphaGo의 사고 방식을 예상하려고 시도하면인지 자원이 참여하여 잘 진행되는 데 사용되지 않습니다.

AlphaGo의 탁월한 계산 능력과 탁월한 패턴 인식 능력에도 불구하고 Lee Sedol은 게임에 대해 더 깊이 이해하고 있습니다. 따라서 AlphaGo의 진정한 강점에 대한 불확실성을 고려할 때, 우리가 그에게 조언하는 것은 그가 일반적으로 뛰어나게하는 종류의 게임을 통해 경기를 시작하는 것입니다. 상황이 신 날 때만 그는 AlphaGo (약점)의 약점을 직접 이용하는 방법을 적용하려고 노력해야합니다.

Fernand Gobet와 Morgan Ereku

참고 문헌

Bilalić, M., McLeod, P., & Gobet, F. (2009). 전문가 체스 플레이어의 전문화 효과와 기억 및 문제 해결에 미치는 영향. 인지 과학, 33 , 1117-1143.

Chib, V., Shimojo, S., & O'doherty, J. (2014). 대규모 금전적 성과에 대한 성과 감소에 대한 인센티브 프레이밍의 영향 : 행동 및 신경 메커니즘. Journal of Neuroscience, 34 , 14833-14844.

Gobet, F. (2015). 전문 지식 이해 : 여러 분야의 접근 방식 . 런던 : Palgrave.

Hsu, F.-H. (2002). Deep Blue 뒤에 : 세계 체스 챔피언을 물리 치는 컴퓨터를 만드는 것 . Princeton, NJ : Princeton University Press.