이 AI 시스템은 1987년에 설립된 패커드인문학연구소의 그리스어 비문에 대한 가장 큰 디지털 데이터 세트로 학습되었으며, 텍스트 복원에만 초점을 맞춘 딥마인드와 옥스퍼드가 구축한 딥러닝 시스템을 사용하여 고대 문자 복원 플랫폼 피티아를 기반으로

AI 플랫폼 '이타카(Ithaca)' 관련 네이처 표지논문 캡처
AI 플랫폼 '이타카(Ithaca)' 관련 네이처 표지논문 캡처

고대사는 과거 문명의 사상, 언어, 사회 및 역사에 대한 증거로 비문(inscriptions) 연구인 에피그라피(Epigraphy)와 같은 학문에 의존한다. 그러나 수세기에 걸쳐 많은 비문은 읽을 수 없을 정도로 침식되었거나 부서져 조각이 누락 되는 등 손상되었으며, 기록 날짜 또한 불확실하다.

여기에, 고대 그리스 비문의 텍스트 복원, 지리적 및 연대기적 속성을 위한 옥스퍼드대학교(University of Oxford) 고전학부와 베니스의 '카 포스카리 베네치아대학교(Università Ca' Foscari Venezia)' 인문학부, 아테네경제경영대학교(Athens University of Economics and Business,) 정보학과, 구글의 딥마인드(DeepMind)는 함께 인공지능(AI) 최신 기술을 적용해 고대 그리스 문자의 복원 및 귀속에 나섰다.

손상된 아테네의 아크로폴리스에 관한 기원전 485/4년의 칙령 기록(IG I3 4B, CC BY-SA 3.0, 위키미디어)
손상된 아테네의 아크로폴리스에 관한 기원전 485/4년의 칙령 기록(IG I3 4B, CC BY-SA 3.0, 위키미디어)

연구팀의 이 AI 플랫폼 '이타카(Ithaca)'는 역사가들이 손상된 비문의 누락된 텍스트를 복원할 뿐만 아니라 원래 위치를 식별하고 기록 날짜를 설정하는 데 도움을 줄 수 있는 최초의 심층 신경망이며, 역사가의 작업 흐름을 지원하고 확장하도록 설계되었다. Ithaca의 아키텍처는 협업, 의사 결정 지원 및 해석 가능성에 중점을 둔다.

연구팀은 이 새로운 모델을 사용하여 기원전 446/445 BCE 이전에 작성된 것으로 여겨지는 일련의 중요한 아테네 칙령(勅令)의 연대를 포함하여 그리스 역사를 재조명했다.

연구팀의 인공지능으로 손상된 비문(위)을 복원(아래)한 이미지로 아테네의 아크로폴리스에 관한 기원전 485/4년의 법령 기록(이미지:영상캡처)
연구팀의 인공지능으로 손상된 비문(위)을 복원(아래)한 이미지로 아테네의 아크로폴리스에 관한 기원전 485/4년의 법령 기록(이미지:영상캡처)

옥스퍼드 고전학부 고대사 조나단 프라그(Jonathan Prag) 교수는 "작은 차이처럼 보일 수 있지만 이 날짜 이동은 고전 아테네의 정치사를 이해하는 데 중요한 의미를 갖는다"며, "연구팀의 Ithaca와 같은 모델이 AI와 인문학 간의 협력 가능성을 열어 인류 역사상 가장 중요한 시기에 대해 연구하고 쓰는 방식을 변화시킬 수 있기를 바랍니다"라고 밝혔다.

보통 많은 고대 비문은 읽을 수 없을 정도로 손상되어있으며, 원래 위치에서 멀리 옮겨져있으며, 기록 날짜가 불확실한 상태로 남아 있다. 호메로스(Homer's)의 오디세이 (Odyssey)에 나오는 그리스 섬의 이름을 따서 명명된 연구팀의 '이타카'는 새로 발견되거나 불확실한 비문을 복원하고 속성을 지정하는 데 도움을 준다.

AI 플랫폼 '이타카(Ithaca)' 로고 이미지
AI 플랫폼 '이타카(Ithaca)' 로고 이미지

이 AI 시스템은 1987년에 설립된 패커드 인문학 연구소(Packard Humanities Institute)의 그리스어 비문에 대한 가장 큰 디지털 데이터 세트로 훈련되었으며, 텍스트 복원에만 초점을 맞춘 딥마인드와 옥스퍼드가 구축한 딥러닝 시스템을 사용하여 고대 문자 복원(논문 다운) 플랫폼 피티아(Pythia-다운)를 기반으로 구축되고 확장된다.

아래 참조
아래 참조

또한, 모델 '이타카'는 협업을 염두에 두고 설계되었으며, 단독으로 손상된 텍스트를 복원할 때 62%의 정확도를 달성하는 반면, 역사가가 이 모델을 사용할 때 성능은 25%에서 72%로 뛰어났다. 또한, 71%의 정확도로 원래 위치에 비문을 되돌릴 수 있으며 실제 기록 범위에서 30년 미만의 날짜로 추론한다.

딥마인드의 야니스 아사엘(Yannis Assael) 연구원은 "우리는 현미경과 망원경이 과학의 영역을 확장한 것처럼 머신러닝을 통해 역사가들이 고대 역사에 대한 이해를 확장하고 심화하도록 지원할 수 있다고 믿습니다"라며, "고대 그리스는 지중해 세계에 대한 우리의 이해에 중요한 역할을 하지만, 그것은 여전히 ​​우리가 탐험할 수 있는 문명의 광대한 전 세계적 그림의 한 조각일 뿐입니다"라고 말했다.

딥마인드의 야니스 아사엘 연구원
딥마인드의 야니스 아사엘 연구원

연구팀은 현재, 다른 고대 언어로 훈련된 Ithaca 버전을 작업 중이며 이미, 아키텍처에서 데이터 세트를 사용하여 인류 최초의 대제국 아카디안(Akkadian)에서 이집트 상형문자의 최종진화형인 민중문자(Demotic) 및 히브리어에서 마야어(Mayan)에 이르는 다른 고대 문자 체계를 연구할 수 있다고 밝혔다.

한편, 이 연구 결과는 국제 과학 학술지 네이처(Nature) 誌에 지난 9일 '심층 신경망을 사용하여 고대 텍스트 복원 및 귀속(Restoring and attributing ancient texts using deep neural networks-다운)'란 제목으로 게재됐다.(아래는 네이처가 공개한 관련 영상)

또한 연구원, 교육자, 박물관 직원 및 기타 사람들에게 널리 제공하기 위해 딥마인드는 구글클라우드 및 구글 아트 앤 컬처(Google Arts & Culture)와 협력하여 Ithaca 의 무료 대화형 버전(다운)을 공개했으며, 또 더 긴 문자 시퀀스를 예측하거나 더 많은 복원 가설을 검사하기 위한 추가 연구를 지원하기 위해 모델 코드, 사전 훈련된 모델 및 대화형 콜라보레이터리 노트북(Collaboratory notebook-다운)을 오픈 소스(다운)로 공개했다.

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지