AI가 일자리를 대체할 것인가? 에 대해서 알트만은 이것이 가까운 장래에 일부 일자리를 대체할 가능성이 있으며 얼마나 빨리 일어날 수 있는지 걱정하고 있다고 밝혔다.

오픈AI CEO 샘 알트만(사진:ABC방송 캡처)
오픈AI CEO 샘 알트만(사진:ABC방송 캡처)

대화형 생성 인공지능(Generative AI) 챗GPT(ChatGPT)의 오픈AI CEO 샘 알트만(Sam Altman)는 인공지능 기술이 우리가 알고 있는 사회를 재구성할 것이라며, 실제 위험이 따르지만 우리의 삶을 획기적으로 개선하기 위해 "인류가 지금까지 개발한 가장 위대한 기술"이 될 수도 있다고 믿는다고 17일(현지시간) ABC방송 인터뷰를 통해 밝혔다.

이날 알트만은 ABC 뉴스의 수석 비즈니스, 기술 및 경제 특파원인 레베카 자비스(Rebecca Jarvis)와 독점 인터뷰를 통해 대형 AI 언어 모델이자 사전 학습된 생성형 트랜스포머 모델의 최신 버전인 GPT-4의 출시에 대한 소회(所懷)를 밝혔다

인터뷰에서 알트만은 OpenAI가 챗GPT의 출시에 가능한 한 규제 기관과 사회 모두가 관여해야 한다고 강조했다. 또한 이 기술에 대한 피드백은 기술이 인류에게 미칠 수 있는 잠재적인 부정적인 결과를 억제하는 데 도움이 될 것이라고 주장했다. 그는 정부 관리들과 정기적으로 접촉하고 있다고 덧붙였다.

불과 몇 달 전에 출시된 이 제품은 이미 역사상 가장 빠르게 성장했으며, 이 앱은 불과 3개월 만에 월 활성 사용자 수 1억 명을 돌파했다. 이에 비해 UBS 연구에 따르면 틱톡(TikTok)은 이 수준에 도달하는 데 9개월이 걸렸고 인스타그램(Instagram)은 거의 3년이 걸렸다 .

알트만에 따르면 "완벽하지는 않지만" GPT-4는 미국 변호사 시험(UBE, Uniform Bar Exam)에서 90번째 백분위수를 기록했다. 또한 SAT 수학 시험에서 만점에 가까운 점수를 얻었으며 이제 대부분의 프로그래밍 언어로 컴퓨터 코드를 능숙하게 작성할 수 있다.

또 알트만은 "GPT-4는 AI가 일반적으로 인간보다 더 똑똑한 AI 시스템으로 설명될 수 있는 강력한 임계값을 넘을 때 최종적으로 인공일반지능(AGI, Artificial General Intelligence)을 구축하려는 OpenAI의 목표를 향해 내딘 한 걸음에 불과하다"고 말했다.

아울러 알트만은 이 모델의 성공에도 불구하고 밤잠을 설치게 만들 정도로 AI의 위험한 구현 가능성을 밝히며 그는 "이러한 모델이 대규모 허위 정보에 사용될 수 있다는 점과 컴퓨터 코드를 더 잘 작성하고 있으므로 사이버 공격 등 악의적으로 사용될 수 있다"며 우려했다.

이어 그는 "우리가 설정한 안전 한계를 설정하지 않는 다른 사람들이 있을 것"이라며, "어떤 이들은 AI 사용에 있어서 안전장치 등 제한을 두지 않을 수도 있다며 어떻게 통제할지 생각해내야 하는데, 그럴 수 있는 시간은 제한돼 있다"고 했다.

그는 블라디미르 푸틴 대통령이 2017년 개학 첫날 러시아 학생들에게 AI 경주를 주도하는 사람이 "세계를 지배할 것"이라고 말한 것을 인용하며, 그 말에 대해 "오싹한 진술이다"라고 말하며, "대신 내가 희망하는 것은 우리 모두가 AI를 우리의 일상생활과 경제에 통합하고 인간 의지를 증폭시키는 다양한 방식으로 사용할 수 있는 점점 더 강력한 시스템을 지속적으로 개발하는 것입니다"라고 밝혔다.

이어 알트만은 "제가 사람들에게 가장 주의를 기울이는 것은 '환각 문제'입니다."라며, "모델은 마치 완전히 꾸며낸 사실인 것처럼 자신 있게 말하게 됩니다"라며, "이전 모델은 부분적으로 암기보다는 연역적 추론을 사용하기 때문에 이 문제가 있습니다. GPT-3.5 모델 대비 GPT-4로 본 가장 큰 차이점 중 하나는 더 나은 추론 능력입니다"라고 말했다.

알트만은 이에 대해 "우리가 만드는 모델을 생각하는 올바른 방법은 사실 데이터베이스가 아니라 추론 엔진입니다"라며, "그들은 또한 사실 데이터베이스의 역할을 할 수 있지만 그것이 그들에게 특별한 점은 아닙니다. 우리가 원하는 것은 기억하는 것이 아니라 추론하는 능력에 더 가까운 것입니다"라고 강조하며, "결국 인터넷과 자체 연역적 추론을 사용하여 사실과 허구를 구분할 수 있게 될 것입니다“라고 덧붙였다.

OpenAI에 따르면 GPT-4는 GPT-3.5보다 허용되지 않는 콘텐츠에 대한 요청에 응답할 가능성이 82% 적고 사실에 입각한 응답을 할 가능성이 40% 더 높다고 한다. 그러나 알트만은 정확한 정보의 주요 소스로 시스템에 의존하는 것은 "사용해서는 안 되는 것"이며 사용자가 프로그램 결과를 다시 확인하도록 권장한다고 밝혔다.

또한 AI가 일자리를 대체할 것인가? 에 대해서는 알트만은 이것이 가까운 장래에 일부 일자리를 대체할 가능성이 있으며 얼마나 빨리 일어날 수 있는지 걱정하고 있다고 밝혔다.

알트만은 "몇 세대에 걸쳐 인류는 주요 기술 변화에 훌륭하게 적응할 수 있음을 입증했습니다. 하지만 이런 일이 한 자릿수 년 안에 일어난다면, 이러한 변화 중 일부는 제가 가장 걱정하는 부분입니다."라며, 그러나 그는 사람들이 챗GPT를 어떤 일이나 직업에 대체품이 아닌 도구로 작용할 것이라고 말했다.

그는 이에 대해 "인간의 창의성은 무한합니다. 우리는 이를 통해 새로운 직업과 새로운 할 일을 찾을 것입니다" 라고 덧붙였다. (더 자세한 이날 인터뷰 내용을 아래 영상을 참고하면 된다.)

 

한편, 오픈AI가 14일(현지시간) GPT-4를 전격 공개했다. 고급 추론(reasoning) 기능으로 폭넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 풀 수 있다. 이를 통해 지난 몇 달 동안 폭발적인 인기를 끌었던 챗GPT(ChatGPT)는 GPT-3.5와 상호작용하는 방식이었으나 이제는 GPT-4와 상호작용하는 방식이 된 것이다.

GPT-4는 월 20달러를 지불하는 유료 서비스인 챗GPT플러스(ChatGPT Plus)에서 사용할 수 있으며 개발자를 위한 API와 무료 데모도 제공됐다.

이날 오픈AI는 GPT-4와 함께 AI 모델의 성능을 평가하기 위한 소프트웨어 프레임워크 에벌즈(Evals)를 오픈소스로 공개했다. 이 도구를 통해 누구나 모델의 문제와 단점을 제시하여 모델을 개선할 수 있다.

오픈AI는 GPT-4는 챗GPT의 약 8배인 최대 25,000단어까지 처리할 수 있으며, 안전과 정치적으로 편향되거나 극단적으로 공격적이거나 때에 따라 서로 다른 방식의 결과, 거짓말 등의 최근 이슈를 인정하고 이를 보완하기 위해 6개월을 보냈고 그동안의 피드백에 대해 학습(수많은 악성 프롬프트)했다고 밝혔다.

그러나, 이날 오픈AI 샘 알트만(Sam Altman) CEO는 트위터를 통해 “가장 성능이 뛰어나고 잘 정돈된 모델이지만 이 역시 여전히 잘못된 정보를 공유하는 경향이 있을 수 있다"고 경고했다.(GPT-4 논문 Technical Report 다운)

현재, 인공지능 세계는 영어 사용자가 지배하고 있다. 데이터에서 테스트, 연구 논문에 이르기까지 거의 모든 것이 영어로 되어 있다. 그러나 물론 대규모 언어 모델(LLM)의 기능은 모든 서면 언어에 적용 가능하며, 해당 언어에서 사용할 수 있어야 한다.

여러 언어에 걸친 MMLU의 GPT-4 3-샷 정확도(Azure Translate를 사용하여 57개 주제에 걸친 14,000개의 객관식 문제 모음인 MMLU 벤치마크를 다양한 언어로 번역. 테스트한 26개 언어 중 24개 언어에서 GPT-4는 라트비아어, 웨일스어, 스와힐리어와 같은 리소스가 적은 언어를 포함하여 GPT-3.5 및 기타 LLM(Chinchilla, PaLM)의 영어 성능을 능가
여러 언어에 걸친 MMLU의 GPT-4 3-샷 정확도(Azure Translate를 사용하여 57개 주제에 걸친 14,000개의 객관식 문제 모음인 MMLU 벤치마크를 다양한 언어로 번역. 테스트한 26개 언어 중 24개 언어에서 GPT-4는 라트비아어, 웨일스어, 스와힐리어와 같은 리소스가 적은 언어를 포함하여 GPT-3.5 및 기타 LLM(Chinchilla, PaLM)의 영어 성능을 능가

이에 GPT-4의 다국어 기능은 한국어부터 이탈리아어, 우크라이나어에 이르기까지 26개 언어에 걸쳐 수천 개의 객관식 질문에 높은 정확도로 답변할 수 있음을 보여줌으로써 AI 민주화를 위한 한 걸음을 내디뎠다.

특히, GPT-3.5에서 영어 인식 성능이 70.1%를 기록했다. 반면 새로운 GPT-4에서는 한국어 인식 성능이 놀랍게도 77%를 기록했다. 이전의 전 세계 AI 이슈를 뿌리던 챗GPT 영어 인식 성능보다 GPT-4의 한국어 인식 성능이 높다는 것은 그동안 '한국형 특화'를 내세웠던 AI 기업들은 새겨야 할 시점이다.     

또한 그 중에서도 가장 눈에 띄는 변화는 '멀티모달(Multimodal)'로 이전의 챗GPT 및 GPT-3는 텍스트로 제한되었지만 GPT-4는 이미지를 보고 이해하고 설명하고 요청한 사항을 처리한다. 예를 들어, 재료 사진에서 레시피 제안을 제공하고 캡션 및 설명을 작성할 수 있으며, 더 중요한 것은 라벨을 번역하고, 지도를 읽는 등 다양한 분야에서 이해도가 그 이상이라고 한다. (자세한 내용은 본지 15일 보도 참조)

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지