학습 컴퓨팅 면에서 오픈AI GPT-3의 75%, 딥마인드 친칠라 AI의 40%, 구글 팜(62B)의 80%에 불과...또한, 탁월한 사용 사례 제안은 TII가 제공하는 상용화 기회인 “학습 컴퓨팅 파워(Training compute power)”를 투자 받게 된다.

팰컨 40B 영상 갈무리
팰컨 40B 영상 갈무리

아랍에미리트의 글로벌 과학연구센터 아부다비 첨단기술연구위원회(Advanced Technology Research Council, 이하, ATRC)의 기술혁신연구소(Tech Innovation Institute. 이하, TII)가 UAE 최초의 대형언어모델(LLM) 이자 생성 AI(Generative AI) 모델 '팰컨 40B(Falcon 40B)'을 연구 및 상용화를 위해 오픈 소스로 공개했다.

이 선도적인 움직임은 부문 간 협업을 촉진하고 생성형  인공지능 발전을 추진하려는 아부다비의 노력의 일환으로 400억개의 매개 변수로 1조개의 토큰으로 학습된 기본 대규모 언어 모델인 팰컨은 연구자와 중소기업 등 모두에게 전례 없는 액세스 권한을 부여했다.

TII는 보다 포괄적인 오픈 소스 패키지로서 모델의 가중치에 대한 액세스를 제공하고 있으며, 강력한 LLM 기능과 투명성과 책임을 촉진하며 현장에서 혁신과 연구를 지원하는 것을 목표로 하고 있다. 연구자와 상업적 사용자에게 팰컨 40B LLM에 대한 액세스 권한을 제공하는 중요한 발걸음을 내디딘 것이다.

오픈 소스 모델인 팰컨 40B의 출시와 함께 TII는 제안서 요청을 시작하고 기초 모델의 잠재력을 활용하는 데 열정적인 과학자, 연구자, 비전을 가진 이들을 초대했다. 이들은 자신의 혁신적인 아이디어를 기여하고 모델을 활용해 영감을 주는 사용 사례를 구축하거나 엔지니어링, 의료, 지속 가능성, 코딩 등과 같은 영역을 포함한 응용의 추가 가능성 탐색이 권장된다.

선정된 프로젝트는 뛰어난 연구 제안서에 대한 인센티브로서 투자 형태의 '학습 컴퓨팅 능력'을 받게 되며, 이를 통해 누구나 가속화된 데이터 분석, 복잡한 모델링 및 새로운 발견을 위해 강력한 컴퓨팅 리소스를 활용하도록 지원한다. 이런 지원은 참신한 아이디어의 개발을 육성하고 가속화해 상업적 실행 가능성과 사회적 혜택을 갖춘 영향력 있는 AI 솔루션으로 전환하는 데 필요한 리소스를 제공할 것이다.

ATRC 사무총장 H.E. 파이잘 에이아이 반나이(Faisal Al Bannai)는 “팰컨 40B를 오픈 소스로 공개한 것은 인공지능 혁신을 촉진하려는 우리의 노력에서 중요한 이정표로 우리는 LLM 액세스를 혁신하고 연구자와 기업가가 가장 혁신적인 사용 사례를 제시할 수 있도록 지원하고 있다"며, "우리는 벤처원을 통한 자금 지원으로서 컴퓨팅 성능을 사용해 이러한 출품작을 추가로 지원해 번성하는 연구 생태계가 발전하도록 도울 것”이라고 밝혔다.

2023년 3월에 처음 공개된 팰컨은 탁월한 성능을 선보이며 기술 발전에 대한 UAE의 의지를 강하게 나타냈다. 스탠퍼드대학교(Stanford University)의 HELM LLM(다운) 벤치마킹 도구를 기반으로 하는 팰컨 40B는 훨씬 적은 학습 컴퓨팅 파워를 활용하는 데 유명한 경쟁 언어 모델들을 능가했다.

특히, 학습 컴퓨팅 면에서 오픈AI(OpenAI) GPT-3의 75%, 딥마인드(DeepMind) 친칠라 AI(Chinchilla AI)의 40%, 구글 팜(PaLM-62B)의 80%에 불과한 이 도구는 생성형 AI의 발전에 대한 TII의 노력을 입증했다.

이번 팰컨 40B 공개는 TII의 AI 및 AIDRC가 이끄는 획기적인 프로젝트로 지난해 4월 세계 최고 100억개 매개변수의 아랍어 자연어처리 모델 '누어(NOOR-참고)'도 공개했으며, 곧 '팰컨 180B'도 발표할 예정이다.

TII의 최고경영자인 레이 O. 존슨 박사(Dr. Ray O. Johnson)는 다음과 같이 말했다. "컴퓨팅 성능은 AI 시스템 교육을 가속화하고 사용 사례를 더 빠르게 구현하는 데 중추적인 역할을 한다"며, "기술 혁신을 주도하는 새로운 연료로서 이러한 지원을 제공하는 움직임은 혁신가의 역량을 강화하는 일의 판도를 바꾸고, 프로젝트의 한계를 뛰어넘어 놀라운 발전을 달성할 수 있도록 지원하게 될 것이다"라고 말했다.

TII의 AI 센터 간 유닛 책임자인 엡티삼 알마즈루에(Ebtesam Almazrouei) 박사는 “팰컨 40B, 7.5B 및 1.3B 매개변수 AI 모델의 오픈 소스 릴리스와 고품질 REFINEDWEB 데이터 세트는 UAE의 깊이 있는 과학적 기여로 각각의 혁신을 통해 우리는 한계에 저항하고 가능성의 지형을 다시 만들고 혁신적인 영향으로 협력적인 노력을 위한 길을 닦고 있다"고 말했다.

한편, 현재 팰컨 AI 모델은 세계 최대 플랫폼이자 커뮤니티인 허깅 페이스(Hugging Face)를 통해 다운(다운)받거나 애플리케이션 사례 요청 제안서를 제출할 수 있다. 지금까지 공개된 팰컨 LLM은 광범위한 무료 사용을 허용하는 오픈 소스 Apache 2.0 소프트웨어의 원칙에 따라 구축된 라이선스에 따라 제공된다.

UAE는 최근 2023년 유엔 프론티어 기술 준비도 인덱스(UN Frontier Technologies Readiness Index 2023)의 166개국 중 5위 상승하여 최고의 아랍 국가로 선정됐다. 진보적인 기술 이정표의 긴 목록을 보완하는 오픈 소스 생성 AI 모델은 UAE가 메인스트림 AI 플레이어로서의 자격을 강화하도록 출시되었다.
 

저작권자 © 인공지능신문 무단전재 및 재배포 금지