Breaking
Eco/Env Korean
컴퓨터가 인간보다 ‘사회성’ 쉽게 배운다
2017-03-29 19:00:00
정세진

모든 플레이어가 협력해 최선의 결과를 얻는 형태의 게임에서는 인공지능 컴퓨터가 사람에 비해 협력의 방법을 보다 쉽게 체득한다는 연구결과가 나왔다.

인공지능(AI)을 연구하는 이들은 컴퓨터를 훈련시키는 것보다 더 어려운 일이 체스나 체커 같은 제로섬 게임에서 승리하도록 하는 것이라고 말한다.

20년 전의 슈퍼 컴퓨터는 당시 체스 세계 챔피언이었던 게리 카스파로프를 최초로 이겼다. 최근의 인공지능 연구원들은 바둑이나 포커처럼 복잡하게 계산해야 하는 게임에서 인간을 이길 수 있는 프로그램을 개발했다.

그러나 이처럼 기계가 사람을 이기는 경우는 이른바 승자독식형의 제로섬 게임에 한정돼 있었다.

연구원들은 제로섬 게임 대신 플레이어 모두에게 최선의 결과를 얻도록 하기 위해 협력하는 것이 목표인 협력 게임 훈련에 좀 더 집중하기 시작했다.

이러한 형태의 게임 중에는 ‘치킨 게임’이라고 불리는, 2대의 자동차가 서로를 향해 달려왔다가 마지막 순간 도망치는 게임도 포함됐다.

사진설명-각종 게임이론을 간단히 설명한 표

게임 이론은 죄수의 딜레마를 보여주는 전형적인 예이다. 가령 범죄 혐의로 두 명의 죄수가 기소됐을 경우, 두 사람 모두가 상대방의 범행을 부인하면 1년형을 받을 수 있다.

그러나 한 죄수가 다른 죄수를 배반하면 3년형을 받거나 혹은 무죄로 풀려난다. 둘 모두가 서로를 배반할 경우에는 2년형을 받게 된다.

게임 이론에 따르면 플레이어는 자신의 파트너를 배반하는 것이 합리적인 선택이다. 그러나 반복적으로 게임을 하다 보면 서로가 협력해 가벼운 형량을 받을 수 있다.

미국 유타 주 프로보 에있는 브리검 영 대학교의 컴퓨터 과학자 제이콥 크랜돌 박사팀은 인공지능이 이런 형태의 게임을 수행할 수 있는지를 연구했다.

이들은 인간과 컴퓨터를 대상으로 각각 죄수의 딜레마를 비롯해 비슷한 협업 전략 게임을 하도록 했다.

팀은 2명의 인간, 2대의 컴퓨터, 또는 1명의 인간과 1대의 컴퓨터로 구성됐다. 연구팀은 25 가지의 기계 학습 알고리즘, 즉 움직임과 결과 간의 상관관계를 자동으로 검색해 성능을 향상시킬 수 있는 인공 지능 프로그램을 테스트했다.

이들은 인공 지능에 "나는 내 전략을 바꾸고있다", "나는 당신의 마지막 제안을 받아들인다", "당신은 나를 배반했다"와 같은 문장을 작성해 익히도록 했다.

메시지는 파트너끼리 서로 교환할 수 있었으며, 시간이 흐르면서 컴퓨터는 학습 알고리즘을 사용해 게임의 맥락에서 협력의 의미를 알아냈다.

그 결과 게임이 끝날 때 컴퓨터로만 구성된 팀은 주어진 시간의 거의 100%를 함께 작업했지만 인간은 평균 약 60%의 시간 동안 협력하는 데 그쳤다.

사진설명-인공지능의 다양한 응용범위

크랜들 박사는 “컴퓨터가 협력 학습의 알고리즘을 충실히 배웠다”며 “이러한 의존성은 전장에서 자율 차량, 무인 항공기 또는 무기 발사에 대한 결정을 내리는 알고리즘에 도움이 될 수 있다”고 언급했다.

스웨덴 스톡홀름에 있는 KTH 왕립 공대의 로봇 공학자 다니카 크라직 박사는 “지금까지 AI 연구에 있어 협력은 1차적 목표가 아니었다”며 “우리는 얼굴 인식에서부터 포커에 이르기까지 인간의 능력을 능가하는 자율 기술에 초점을 두어왔다”고 밝혔다.

크랜들은 “기계는 경쟁하는 것 이상의 일을 해야 한다”면서 “협동을 강조해 더 나은 작업을 하는 로봇 연구가 향후 AI의 모델이 될 수 있을 것”이라고 덧붙였다.

연구팀은 또한 인공지능이 인간과 협력하는 기능을 쉽게 배울 수 있다면 양자의 관계는 보다 바람직한 방향으로 갈 수 있다고 설명했다.


Today's Top 5