과학

구글 인공지능 “알파제로”, 바둑 장기 체스 세계 챔피언 노린다


  • 우예진 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2017-12-09 19:15:51

    구글 딥마인드는 바둑과 장기, 체스를 스스로 익힐 수 있는 인공지능 알파제로(AlphaZero)를 발표했다. 딥마인드는 바둑을 마스터한 알파고로 이세돌을 체져 세계에 충격을 안긴 바 있다.

    최근 딥마인드는 세계 최초로 여러 가지 게임을 모두 익힐 수 있는 인공지능 보드게임 챔피언을 발표했다. 11월 28일 발표된 논문에 따르면 알파제로로 불리는 이 소프트웨어는 체스, 바둑, 장기를 모두 학습함으로써 사람의 능력을 능가할 수 있다고 한다.

    하나의 알파제로가 3가지 게임을 모두 학습하지는 못한다. 하지만 하나의 프로그램이 3가지 복잡한 보드게임의 챔피언을 목표로 둔다는 것은 매우 놀라운 일이다. 왜냐하면 현재의 인공지능들은 매우 전문적이고 통일된 문제를 해결하는데 집중해 왔기 때문이다. 

    최선의 인공지능이라도 여러 가지 문제를 완벽하게 해결할 수는 없다. 이것이 사람이 기계보다 앞선다고 평가받는 대표적인 이유 중 하나다. 알파제로는 전문성은 낮아도 여러 가지 기능을 갖춘 인공지능 시스템의 첫 걸음이 될 수 있다. 

    알파제로는 바둑 인공지능인 알파고 제로를 모델로 삼았다. 알파고 제로는 10월 딥마인드가 발표한 프로그램으로, 자기 대국에 의해서 학습한다. 이번 발표된 알파제로의 중심에 있는 알고리즘은 이 바둑 인공지능을 업데이트한 것이다.

    이번 딥마인드의 논문에 따르면 백지 상태의 알파제로 3대에 각각 다른 게임을 배우게 했다고 한다. 알파제로의 테스트에는 사람이 참여하지 않았다. 사람은 이미 체스, 바둑, 장기의 최고 플레이어 자리를 인공지능에게 빼앗긴 상태다.

    알파제로는 대결한 3가지 인공지능 프로그램을 모두 제치고 챔피언에 등극했다. 4시간 만에 체스 세계 챔피언이 되었고, 2시간 만에 장기 챔피언과 비슷한 수준에 이르렀고, 8시간 만에 딥마인드의 최강 바둑 플레이어인 알파고 제로를 제쳤다.

    딥마인드의 최신 기술은 스타크래프트에 대한 도전에도 도움을 줄 것이다. 스타크래프트의 경우 룰이 정해져 있어서 추상적인 보드 게임보다 쉬운 도전 상대로 보기 쉽다. 하지만, 스타크래프트 쪽이 더욱 복잡하다. 다수의 요소와 기능의 조합으로 훨씬 많은 가능성이 존재하고 플레이어는 아직 모르는 적의 행동을 예측해야 한다.

    알파제로가 실현한 것은 지능의 극히 일부에 불과하다. 사람의 뇌는 3개 이상의 보드 게임을 학습하고, 공간적, 상식적, 논리적, 예술적 그리고 사회적 난제를 해결할 수 있다. 필요한 에너지도 알파제로보다 뇌 쪽이 훨씬 적다. 딥마인드에 따르면 알파제로의 훈련에는 구글의 기계 학습용 프로세서인 텐저플로우 프로세싱 유닛(TPU)이 5,000대 이상 사용되었다고 한다.

    ▲ © 딥마인드 알파제로


    베타뉴스 우예진 기자 (w9502@betanews.net)
    Copyrights ⓒ BetaNews.net





    http://m.betanews.net/778666?rebuild=on