과학

사람의 훈수가 필요 없는 바둑 인공지능 등장, 알파고 제로


  • 우예진 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2017-10-21 20:17:23

    은퇴했다고 생각되던 세계 최강의 바둑 기사 알파고(AlphaGO)가 돌아왔다. 게다가 사람의 도움이 아예 배제된 체 자기학습으로 성장하는 알파고 제로(Zero)로 진화했다.

    알파고는 2016년 이세돌에게 승리했다. 그리고 더욱 강력해진 새로운 알파고 제로가 2017년 10월 18일 발표됐다. 알파고 제로는 지금까지 이상으로 사람들을 놀라게 할 가능성이 높다. 바둑 테스트에서는 이세돌을 이긴 버전을 100회 이상 이겼다. 2000회를 넘는 대국을 통해서 독자적인 아이디어(수)를 만들기 시작했다.

    인터뷰에서 딥마인드의 CEO인 데미스 허사비스는 “알파고의 심장부는 신약 발견과 단백질 입체 구조의 이해 등 과학적인 문제에 응용 가능합니다. 왜냐하면, 이러한 문제도 바둑과 마찬가지로 기본적인 요소가 조합된 방대한 수의 선택 사항이 있고, 수학의 바다를 항해할 필요가 있기 때문”이라고 밝혔다.

    지난해 알파고는 기계로서는 사람과 대결해 역사적인 승리를 거뒀지만 많은 사람들의 경험치가 바탕이 되었다. 왜냐하면 알파고는 인터넷 바둑 커뮤니티에서 수집한 16만 명 분량의 자료를 정밀 조사해 바둑을 학습했기 때문이다. 승리를 거둔 후에도 알파고는 100만회가 넘는 자신과의 대국을 통해서 초인적인 자기 연구를 계속해 왔다.

    알파고 제로라는 명칭은 바둑을 둘 때 사람의 지식을 아예 배제하고 자기의 대국 매커니즘을 수립했기에 붙여진 것이다. 알파고 제로는 초기에는 여러 움직임을 여러 차례 실시한다. 이는 어떤 때 경기를 이기고 어떤 때 지는지를 알기 위해서다.

    알파고 제로가 출시된 이후 학술지 네이처(Nature)의 기사에서는 알파고 제로가 2900만 번이나 자기 대국을 통해서 어떻게 지구상에서 가장 무서운 바둑 선수가 됐는지 보도됐다.

    딥마인드를 포함한 다수의 우수 연구그룹은 시행착오를 겪고 학습한 뒤 경쟁에서 승리하는 소프트웨어를 개발하기 위해 노력하고 있다. 이러한 소프트웨어는 데이터가 존재하지 않는 분야의 어려운 문제를 해결하는데 기여할 것이다.

    알파고 제로는 이전 버전보다 스마트하면서 심플하다. 원래 알파고는 2개의 학습 모듈을 갖췄다. 1개는 경기 중 바둑돌의 배치 등을 평가하고, 또 1개는 다음 수를 생각하게 특화되어 있었던 것. 딥마인드에 따르면 알파고 제로는 보다 강력한 중립 네트워크를 구사해 단 1개의 모듈에서 상황의 평가와 다음의 수의 결정이 가능하다.

    하사비스에 따르면 알파고 제로에 사용된 개념은 날씨 예측과 신체 속 단백질에 대한 이해도를 높이는데 활용할 수 있다. 구글을 비롯한 많은 기업이 기계 학습에 주력하고 있는데, 이후에는 더 많은 광고 수입을 얻을 가능성도 열려 있다.


    베타뉴스 우예진 기자 (w9502@betanews.net)
    Copyrights ⓒ BetaNews.net