새로운 프레임워크 HCVAE는 질의-응답을 쌍으로 생성하는 최초의 확률론적 생성 모델로서, 극대화된 정보를 가진 문맥으로부터 다양하고 일관된 질의-응답을 생성하고 라벨링된 데이터와 라벨링 되지 않은 데이터를 동시에 학습하는 준지도학습에 특별한 성과

김동환 대표
김동환 대표

QA(Question Answering) 인공지능 스타트업 포티투마루(42Maru, 대표 김동환)가 AI 및 자연어처리(NLP) 기술의 진가를 발휘하고 발휘하면서 국내 토종 AI 스타트업의 글로벌 위상을 높이고 있다. 

컴퓨터 언어학 또는 자연어처리(NLP) 분야의 세계 최고 권위의 컴퓨터 언어학 학회인 ACL (Association for Computational Linguistics)에서 ‘다양하고 일관성 있는 문맥 기반 질의응답 생성을 위한 상호정보량 극대화 계층적 HCVAE(Hierarchical Conditional Variational AutoEncoder)’ 논문이 채택됐다.

이에 포티투마루는 시애틀 현지 시간으로 7월 5일부터 10일 사이에 온라인으로 진행되는 제 58차 ACL 연례회의에서 해당 논문에 대한 발표 및 질의응답 세션을 가질 예정이다.

제 58차 ACL 연례회의 홈페이지 캡처
제 58차 ACL 연례회의 홈페이지 캡처

포티투마루는 이미 2018년 스탠포드대에서 주관하는 SQuAD 2.0에서 구글 AI 팀과 공동 1위를 차지함으로써 그 기술력을 인정받았으며, 2019년에도 세계 최고 권위 자연어처리 학회인 EMNLP-IJCNLP에서 열린 MRQA(Machine Reading for Question Answering) 워크숍에 초대되어 적대적 학습을 이용한 도메인 비종속적 QA 모델을 소개한 바 있다

이번 ACL 해당 논문은 IITP(정보통신기획평가원)의 글로벌 SW 전문기업 육성을 위한 R&D 지원 프로그램의 일환으로 선정되어 정부 지원을 받으며 연구·개발하였고, KAIST(한국과학기술원) 황성주 교수팀과 공동 연구로 진행되었다.

포티투마루는 논문을 통해 단일 문맥에서 다양한 질문-응답을 생성하기 위한 새로운 프레임워크인 HCVAE(Hierarchical Conditional Variational AutoEncoder)를 제안했다. 이는 질의-응답을 쌍으로 생성하는 최초의 확률론적 생성 모델로서, 극대화된 정보를 가진 문맥으로부터 다양하고 일관된 질의-응답을 생성하고 라벨링된 데이터와 라벨링 되지 않은 데이터를 동시에 학습하는 준지도학습에 특별한 성과를 보였다.

ACL(Association for Computational Linguistics) 등재 논문 일부, HCVAE 프레임워크 예시
ACL(Association for Computational Linguistics) 등재 논문 일부, HCVAE 프레임워크 예시

해당 프레임워크는 이전 VAE(Variational AutoEncoder) 방식으로는 불가능했던 단일 문맥 상 다양한 잠재변수를 샘플링하여 질의-응답을 생성하고, 질문과 답변 간의 공통 정보를 극대화함으로써 답변과 맥락에 의미론적으로 관련이 있고 답변이 가능한 질문을 생성할 수 있다. 이렇게 생성된 질의-응답들은 QA(Question-Answering) 모델의 성능을 향상시킬 수 있다고 밝혔다.

특히, 인공지능 기반의 언어지능 기술을 상용화하기 위해서는 학습데이터 구축이 필수이나 현재까지는 수작업에 의존하여 시간과 비용이 많이 소요되었다. 이번 연구 결과로 학습데이터 자동 생성이 가능해 짐에 따라, 금융, 의료, 법률, 특허, 철강, 건설을 비롯하여, 교통, 물류, 제조업, 농업, 교육 등의 산업 전 분야에 걸쳐 기계독해(MRC) 기반의 질의-응답(Question-Answering) 시스템을 저비용으로 신속하게 도입이 가능하게 되었으며, 한국어 이외에도 영어, 독일어, 프랑스어, 중국어, 일본어, 베트남어 등 다국어 확장을 통한 해외 시장 선점도 가능할 것으로 기대된다.

김동환 포티투마루 대표는 “이번 논문 채택을 통해 포티투마루의 세계적 수준의 기술 리더십을 다시 한번 확인했으며, 해당 기술을 기계독해 외에도, 기계 번역, 음성 인식, 생성 요약 등 다양한 언어 지능 분야의 학습 데이터 자동 생성에도 응용 가능할 것으로 기대된다” 며, "포티투마루는 인공지능 시대에 기술이 뛰어난 창업기업에 그치지 않고 뛰어난 인재들과 함께 세계 무대에서 활약하는 기술 기업의 길을 개척해 나가겠다"고 말했다.

김동환 포티투마루 대표(왼쪽)가 장관상을 수상하고 기념촬영하고 있다(사진:본지DB)
2019년 12월 20일 김동환 포티투마루 대표(왼쪽)가 글로벌 SaaS 육성 프로젝트 과기정통부 장관상을 수상하고 기념촬영하고 있다(사진:본지DB)

한편, 포티투마루는 2018년 과학기술정보통신부 장관 표창과 2018·2019 대한민국 우수기업대상 기술혁신대상을 수상하고, ‘2019벤처창업진흥 유공 포상’에서 중소벤처기업부장관 표창 수상, 2019 글로벌 SaaS 육성 프로젝트 과기정통부 장관상 수상 등과 한국정보화진흥원(NIA)로부터 초연결 지능화 시대 D(Data) N(Network) A(A.I) 분야 혁신기업으로 선정되기도 했다. 또 포티투마루는 뛰어난 기술력을 바탕으로 안정적인 매출을 창출, 임직원에 각종 복지혜택을 비롯한 양질의 일자리를 제공해 고용노동부로부터 청년친화 강소기업으로 선정된 바 있다.

현재, 기술 스타트업으로서 우수 인공지능 인력 및 기술 개발 역량 확보를 위해 전 직원을 대상으로 국내외 대학원 진학 지원 프로그램을 운영 중이며, 글로벌 연구 역량 강화를 위해 해외 인공지능 연구소와 교환 연구원 프로그램도 추진 중에 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지