GPT-3 모델 가격 체계는 제공하는 사용량에 따라 '익스플로어(Explore)', '크리에이트(Create)', '빌드(Build)', '스케일(Scale)' 등 4가지로 나뉜다.

로고 각사 편집,본지
로고 각사 편집,본지

OpenAI의 대규모 자연어처리(NLP) 모델인 GPT-3는 공개 이후 개발자, 연구원, 기업가 및 언론인 사이에서 가장 큰 이슈이다. 게다가 머신러닝과 거리가 먼 일반인들까지 GPT-3에 대해 얘기할 정도다. 이러한 대부분은 이슈는 AI 구동 텍스트 생성기의 능력에 초점을 맞추고 있다. 사용자들은 AI를 사용하여 기사 작성에서 코드를 작성하는 직관적인 능력까지 모든 것을 생성하기 위해 흥미로운 결과를 경쟁적으로 내고 있다.

그러나 일부 반론 속에 GPT-3에 대한 많은 것은 여전히 불명확하다. 다만 인공지능이 더 높고 과감한 목표를 현실적으로 가지게 되었다는 게 GPT-3의 가장 큰 의미로 보여 진다.

이제 모든 이슈 속에 세계에서 가장 큰 자연언어처리 모델 GPT-3는 다음 달부터 유료화 된다. OpenAI는 설립 이념과 달리 이 모델을 대중에게 자유롭게 공개하는 대신 상용화를 선택한 것이다.

이 가격 책정 계획은 OpenAI가 GPT-3를 수익성 있는 사업으로 전환하는 데 필요한 것과 사용자가 이 AI로부터 어떤 종류의 조직이 혜택을 받을 수 있는지를 더 잘 평가할 수 있게 해줄 것이다. GPT-3는 이런 종류의 첫 번째 AI 모델이고, OpenAI의 가장 큰 고민은 이 거대한 심층 학습 알고리즘을 운영하는 데 드는 숨겨진 막대한 비용에 대해 어떻게 해결해야할 것인가가 핵심인 것으로 보인다.

OpenAI와 같은 AI 연구소는 그들의 연구에 자금을 유치를 위해 기술 회사들과 VC 회사들의 자금에 의존한다. 곧, 이로 인해 투자 수익을 창출하고 향후 자금을 확보할 수 있는 수익성 있는 비즈니스를 창출해야 한다.

2019년 3월 11일 영리화를 선언하는 오픈AI의 공식 블로그 캡처
2019년 3월 11일 영리화를 선언하는 오픈AI의 공식 블로그 캡처

2019년 3월 11일 OpenAI는 비영리단체에서 영리기업으로 전환하고 OpenAI는 블로그 게시물을 통해 범용인공지능(AGI, Artificial General Intelligence) 기술 중 일부를 상용화할 것이라고 선언했다. 그리고 얼마 지나지 않아 마이크로소프트는 10억 달러(약 1조1천억원)를 투자했다.

또한 OpenAI는 GPT-3 플랫폼의 전례 없는 컴퓨팅 성능이 필요했었다. 마이크로소프트는 OpenAI가 GPT-3를 지난 6월 출시하기 전 5 월 OpenAI 와의 지속적인 파트너십을 확대하고 세계 상위 5 대 슈퍼컴퓨터 중 하나를 구축하고 애저(Azure)에서 새로운 인프라를 사용하여 초대형 자연어처리(NLP) 모델 GPT-3를 학습하기 위해 맞춤형으로 설계된 애저(Azure) 호스팅 홈을 발표했었다.

OpenAI가 마이크로소프트에 독점 라이센스 부여를 이에 "연계된 관계다"라고 꼭 찝어 말할 순 없지만 지난 22일 마이크로소프트는 연례행사인 '이그나이트2020(MICROSOFT IGNITE 2020)'에서 OpenAI와 협약으로 독점 라이선스 확보했다고 발표하고 이를 활용해 마이크로소프트 고객에게 진일보한 AI 솔루션을 제공한다는 계획을 발표했다.

다시 GPT-3 요금제로 돌아본다. 지난 6 월 발표와 동시에 OpenAI는 GPT-3 아키텍처 및 사전 훈련 된 모델을 출시하지 않고 대신 7월 11일 상용 API를 통해 제공하겠다고 공개했는데 그리 놀라운 일은 아니었다. OpenAI가 심사하고 승인한 GPT-3 베타 시험버전을 무료로 이용할 수 있게 했지만 10월부터는 사용 가격이 책정된 것이다.

지난 3일 Anmol Rana 트위터 캡처
지난 3일 업로드된 Anmol Rana 트위터 캡처

기존 비공개 무료 베타 버전 사용자들도 10월 이후에는 책정된 가격 체계의 4가지 중 하나를 선택해야 한다. 제시된 GPT-3 모델 가격 체계는 제공하는 사용량에 따라 '익스플로어(Explore)', '크리에이트(Create)', '빌드(Build)', '스케일(Scale)' 등 4가지로 나뉜다.

'익스플로어'는 무료 구간이다. 이제 사용자는 토큰(token) 10만개 또는 체험기간 3개월 중 먼저 만료되는 쪽을 적용받는다. 다시 말해 무료로 토큰을 최대 10만개까지 쓸 수 있고, 이를 다 쓰지 않을 경우 3개월간 무료로 쓸 수 있다는 뜻이다. '크리에이트'는 월 100달러(약 11만7천원)로 사용자는 1개월간 토큰 200만개를 쓸 수 있고, 이를 소진하면 추가 토큰 1000개당 8센트(약 940원)를 지불하면 된다. '빌드'는 월 400달러(약 47만원)로 사용자는 1개월간 토큰 1000만개를 쓸 수 있고, 이를 소진하면 추가 토큰 1000개당 6센트(약 700원)를 내면 된다. '스케일'은 별도 가격을 책정했다.

먼저, GPT-3에 대한 올바른 구성과 배경에 대해 알아본다. 최종 딥러닝 모델을 훈련하는 것은 GPT-3 개발의 몇 가지 단계 중 하나에 불과하다. 그 전에 AI 개발자들은 계층과 매개변수를 점차 증가시켜야 했고, 그들이 목표에 도달할 때까지 언어 모델의 많은 하이퍼 파라미터들을 조작해야 했다. 그러나 배열과 그 시행착오는 신경망이 커질수록 점점 더 비싸진다.

이에 대한 OpenAI의 정확한 연구비는 알 수 없다. 그러나 일부 전문가들의 추정에 따르면 최종 모델 학습비용의 1.5~5배 정도라고 한다. 이것은 연구 개발 비용을 1,150만 달러(약 135억원)에서 2,760만 달러(약 324억원) 사이로 GPU의 오버헤드를 증가시킬 것으로 보인다. 또한 지난 6월 OpenAI가 발표한 논문(참조)에서 GPT-3는 1750억개 매개 변수로 딥러닝의 한계까지 추진돼 미세 조정없이 여러 자연어 처리 벤치마크에서 최첨단 성능을 달성했다며, 'GPT-3 small'을 포함해 8가지 언어 모델을 발표했었다. 이러한 모델을 연구하고 개발하는 비용은 이 계산에 포함되지 않았다. 

GPT-3 논문 캡처
GPT-3의 8가지 언어 모델(논문 캡처)

상대적으로 많은 기업, 기관들은 개발자들에게 신경망을 훈련시키는 시간과 비용을 줄이기 위해 미리 훈련된 버전의 모델을 제공한다. 그런 다음 모델을 로드하고 실행할 수 있는 서버나 장치만 있으면 되는데, 이는 처음부터 모델을 교육하는 것보다 컴퓨팅 집약도가 훨씬 낮다.

그러나 GPT-3의 경우, 신경망의 순전히 크기 때문에 그것을 실행하는 것이 매우 어렵다. 지난 6월 발표된 OpenAI의 위 논문에 따르면 GPT-3는 파라미터당 16비트의 반정밀 부동소수점 변수(half-precision floating-point variables)를 사용한다. 즉, 모델을 적재하고 적절한 속도로 추론을 실행하는 데만 최소 350GB의 VRAM이 필요한 것이다.

이를 비유하자면 이는 각각 32GB의 메모리를 가진 최소 11개의 테슬라 V100 GPU에 해당한다. GPU는 개당 약 9,000달러(약 1천만원) 이다. 이로 인해 GPU 클러스터의 비용이 최소 99,000달러(약 1163억원)에서 RAM, CPU, SSD 드라이브 및 전원 공급 장치의 경우 수천 달러까지 증가할 것이다. 딥러닝 트레이닝과 추론에 특화된 엔비디아의 DGX-1 서버가 좋은 기준일 것이다. 약 13만 달러(약 1억5천만원)의 DGX-1은 VRAM(8×16GB)이 부족하지만 GPT-3의 견고한 성능을 위한 다른 모든 구성 요소를 갖추고 있다.

본지 25일 보도를 공유한 페이스북 포스팅에 한 블로거가 'MS 라이선스 독점' 기사에 'CloseAI' 라고 댓글로 현 감정을 표현하기도...
본지 25일, 보도를 공유한 한 페이스북 포스팅에 블로거가 'MS 라이선스 독점' 기사에 'CloseAI' 라고 댓글로 아쉬움 표현하기도...

결론적으로 2018년 4월 뉴욕타임즈 보도에 따르면 오픈AI는 설립 초기년도에 총 1100만 달러(약 129억원)의 비용을 썼는데 이 가운데 7백만 달러(약 82억원)가 직원들의 급여와 복지 혜택으로 나갔다. 2016년 오픈AI의 직원수는 52명이었다. 현재 오픈AI의 정확한 연구원 수는 알 수 없지만 이와 비슷한 배경의 구글 딥마인드의 경우, 2018년에 700명의 직원에게 년간 4억 8300만 달러(약 5640억원) 이상을 지불했다고 한다. 오픈AI의 이번 요금제는 연구원들의 높은 연봉과 GPT-3 실행 비용에 기인한 것으로 보인다.

또한 OpenAI는 점점 더 강력해지고 파워풀한 일련의 AI 기술을 출시하고 있다. 이에 따르는 AI 능력을 위해서는 더 많은 자금이 필요하다. 그 비용을 충당하는 가장 확실한 방법은 제품을 생산하고 그 대가를 보상받는 것이며, GPT-3 모델이 출시하기까지 직간접적으로 관련된 마이크로소프트에 독점 라이선스를 부여하는 것과 이 기술의 상용화를 가속하기 위한 가장 적극적인 방법을 선택한 것으로 보인다. 이제 OpenAI는 AI연구소에서 적어도 부분적으로는 대표적인 AI 솔루션 회사가 되어가고 있는 것이다.

 

관련기사

저작권자 © 인공지능신문 무단전재 및 재배포 금지