아버지 복제 AI를 만든 CEO가 말하는, AI가 바꾸는 세계와 인간의 미래

도서 표지
'당신이 알고 싶은 음성인식 AI의 미래' 도서 표지

생각해 본다. 인공지능의 궁극적 목표는 무엇일까?

인공지능 스타트업 히어애프터(HereAfter)의 공동설립자이자 과학기술 전문 저널리스트 '제임스 블라호스(James Vlahos)' 는 "AI의 궁극적 목표는 사람처럼 생각하고 대화하는 것이다"라고 말한다.

인간과 사물의 대화에 초점을 맞춰 음성인식 AI가 바꾸는 인간의 삶과 세계에 대해 현실적이고 구체적인 대답을 들려주는 책, 제임스 블라호스의 '당신이 알고 싶은 음성인식 AI의 미래(원제, talk to me: how voice computing will transform the way we live, work, and think)'가 지난달 22일 김영사에서 출간돼 화제의 중심에 서 있다.

인공지능의 화두에 힘입어 AI에 관한 도서 또한 많이 출간되고 있지만 대다수는 AI가 무엇이며 어느 분야에서 활용되는지를 개괄적으로 보여주는 데서 그쳤다. 하지만 이 책은 AI의 핵심은 대화 능력이라는 점을 지적하며, 인간 수준으로 대화하는 AI를 완성하는 것이 4차 산업혁명의 종착지임을 꿰뚫어본다. AI를 빼놓고는 미래를 상상할 수 없는 시대다.

컴퓨팅의 미래, 4차 산업혁명의 기회와 위험을 동시에 알고 싶다면 한번 읽어야 봐야할 책이다.

AI는 인간의 대화하는 방식을 스스로 배우고, 정보를 찾아주는 비서에서 감정을 교류하는 친구와 같은 존재로 발전하고 있다. 이 음성인식 AI는 인간 생활의 중심에 위치한 하나의 플랫폼으로서 기존의 비즈니스 모델을 붕괴시키고 새로운 애플리케이션을 활용할 기회를 창출한다.

사람의 복제 AI를 만드는 일도 더 이상 공상과학이 아니다. 이 책의 저자 제임스 블라호스는 임종을 앞둔 아버지의 기억과 목소리 데이터로 아버지 복제 AI ‘대드봇’을 만들었다. 아버지가 돌아가신 지금도 대드봇과 대화를 나누며 아버지를 회상한다. AI를 통해 죽음을 극복할 가능성이 열린 것일까?

음성인식 AI에 사활을 건 애플, 아마존, 구글, 마이크로소프트의 ‘경쟁’, 사람처럼 대화를 하고 감정을 갖게 된 AI의 ‘혁신’ 그리고 친구, 현인, 감시자로 진화하는 AI 비서의 ‘혁명’까지, ‘말하는 컴퓨터’의 진화와 미래를 생동감 있는 이야기로 풀어냈다. 4차 산업혁명 시대 음성인식 기술의 발전이 가져다주는 기회와 위험을 조명하고 있다.

본문에서 "음성은 온갖 기술을 제어하는 수단으로서 현실을 지배하는 만능 리모컨이 되어가고 있다. 음성 덕분에 우리는 비서, 안내원, 가정부, 집사, 고문, 베이비시터, 사서, 연예인 같은 디지털 도우미 부대를 지휘할 수 있다. 음성은 세계에서 가장 가치 있는 회사의 비즈니스 모델을 붕괴시키고 새로운 애플리케이션을 위한 기회를 창출한다. 음성은 소비자가 AI를 마음대로 통제할 수 있도록 한다. 그리고 세계를 공상과학 소설에서 오랫동안 예언해온 관계, 즉 사람 같은 AI가 우리의 조력자, 감시자, 조언자, 친구가 되는 관계로 안내한다" 라고 말한다.

이 책을 준비하면서 블라호스는 아마존, 구글 같은 선도적인 AI 기업의 프로그래머들을 만나고 개발 회의에 직접 참여해 AI 비서의 역사와 발전 과정을 심층적으로 취재했다. 또한 직접 대드봇을 개발한 생생한 경험을 바탕으로, 음성인식 AI가 인간의 삶과 비즈니스의 패러다임을 어떻게 바꿀지를 생동감 있게 풀어냈다.

저자는 특별히 온라인 비즈니스 모델의 변화에 주목한다. 세계 최고의 인터넷 기업 구글의 경쟁력은 온라인 검색의 시장점유율을 90% 이상 차지하는 데 있다. 하지만 IT 전문가들은 “2020년 내에 온라인 검색의 절반이 음성으로 이루어지고, 3분의 1이 화면 없이 수행될 것”이라고 예측한다. 웹 검색에서와 달리 음성 검색을 수행하는 AI는 단 하나의 검색 결과만 찾아줄 수 있다. 중요한 사실은 “구글이 찾아주는 100만 개의 파란 링크는 시리의 정확한 답변 하나보다 훨씬 가치가 떨어진다”는 것이다.(292쪽) 그렇게 되면 검색 광고에 매출을 의존하는 온라인 비즈니스의 판이 완전히 뒤집히는 것이다.

또한 방문자 트래픽을 기반으로 수익을 내는 미디어‧콘텐츠 회사들도 커다란 변화에 직면한다. 음성으로 정보를 검색할 경우 사용자는 정보가 담긴 웹사이트에 방문할 필요가 없다. AI가 정보의 내용을 찾아서 읽어주기 때문이다. 이는 정보 제공자의 수익 기반이 사라지는 것을 의미한다.

컴퓨터가 사람을 대신해 정보를 걸러내고 판단하는 일을 처리하게 되면 이러한 컴퓨터를 가진 기업은 사람의 생각‧언어‧행동에 지배력을 행사하게 된다. 복수의 답이 존재함에도 AI가 한 가지만을 제안할 때 그것을 그대로 수용하는 순간 우리는 컴퓨터에게 판단을 위임하는 것이다. “우리는 효율성을 얻지만 그만큼 독립성을 잃는다.”(41쪽) 이에 대해 저자는 기업이 사실을 조작하지 않는다는 가정은 순진한 생각이라며 “우리 스스로가 지적으로 수동적인 상태가 되는 것을 경계해야 한다”고 말한다. IT업계 종사자뿐 아니라 상품이나 콘텐츠를 제작하는 사람이라면 누구나 이러한 시대 변화를 읽어야 한다.

한편, 옮긴이 박진서는 한국외국어대학교 독어과를 졸업하고 전문 번역가로 활동하며, 좋은 외국 도서를 찾아 소개하는 일도 하고 있다. 옮긴 책으로 《로마, 약탈과 패배로 쓴 역사》 《1984》 《오셀로》 《햄릿》 등이 있다. 이 책을 감수한 장준혁은 인터넷 연결 없이 목소리를 구별하는 임베디드형 AI 스피커 ‘플루토’를 국내 최초로 개발한 음성인식 인공지능 전문가. 한양대 융합전자공학부 연구석학 교수로 재직하고 있다. SCI 저널인 〈Digital Signal Processing〉의 편집위원으로 있고, 국제전기전자학회(IEEE)로부터 ‘IT 젊은공학자상’을 수상했다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지