메타가 차세대 인공지능(AI) 대규모 언어 모델(LLM) '라마 2(LLaMa2)'를 오픈 소스로 18일(현지시간), 공개했다.모델은 70억, 130억, 700억 개의 파라미터로 사전 학습되고 미세 조정된 모델로 2조 개의 토큰으로 훈련되었으며 이전 모델 'Llama 1'보다 컨텍스트 길이가 두 배이며, 100만 개 이상의 인간 주석으로 훈련되었다.메타는 이날 공개와 더불어 "우리는 이러한 대규모 언어 모델에 힘을 발휘하고 있습니다"라며, "Llama의 최신 버전인 Llama 2는 이제 개인, 크리에이터, 연구원 및 기업이 사용할
글로벌 데이터 클라우드 기업 스노우플레이크(Snowflake)가 지난 26일부터 29일까지 미국 라스베이거스에서 열린 연례 사용자 컨퍼런스 '스노우플레이크 서밋 2023'에서 지난해 9월 인수한 애플리카(Applica)의 생성 AI 기술로 구축한 대규모 언어 모델(LLM) ‘도큐먼트 AI(Document AI)’를 공개했다.이를 통해 고객이 문서를 이해하고 비정형 데이터를 쉽고 빠르게 활용할 수 있도록 했다.또한 스노우플레이크는 ‘아이스버그 테이블(Iceberg Table)’을 통해 개방형 테이블 포맷을 사용, 스노우플레이크 카탈로
인공지능(AI) 번역 서비스 네이버 ‘파파고’ 앱의 글로벌 월간 활성 이용자 수(MAU)가 1천만(파파고 내부 집계 기준)을 돌파했다. 이는 지난해보다 약 30% 증가한 수준으로, 파파고 웹 버전의 MAU도 약 740만을 기록하며 국내 대표 번역 서비스로서의 입지를 공고히 하고 있다.실제로, 파파고는 6년 연속으로 번역 앱 부문에서 국내 1위를 유지하고 있다. 해외에서의 인기도 지속적으로 높아지는 추세다. 해외 이용자 수는 지난해 대비 1.5배 증가해, 매월 300만 명 이상이 해외에서 파파고를 이용 중이다. 특히, 일본, 베트남,
2000년, 다음커뮤니케이션(현 카카오)의 사내 인큐베이팅으로 '다음소프트'로 출발한 대한민국 최초이자 최대 빅데이터·인공지능 전문 기업 바이브컴퍼니(대표 김성언. 이하, 바이브)가 자체 생성 AI 언어모델인 바이브GeM을 기반으로 한 차세대 뉴럴서치 엔진 ‘바이브 서치(VAIV Search)’를 19일 정식 출시했다.바이브 서치는 바이브가 지난 2일 공개한 맞춤형 LLM(Large Language Model, 초거대 언어모델) 모델인 바이브GeM을 활용한 바이브 서치GPT와 MRC(Machine Reading Comprehensi
2000년, 다음커뮤니케이션(현 카카오)의 사내 인큐베이팅으로 '다음소프트'로 출발한 대한민국 최초이자 최대 빅데이터·인공지능 전문 기업 '바이브컴퍼니(대표 김성언. 이하, 바이브)'가 자체 생성형 AI 언어모델인 '바이브GeM(VAIV Generative Model for language, VAIVGeM)'을 출시했다.바이브는 지난 2일 인공지능·빅데이터 연구소 주관의 기술 워크숍인 '바이브 테크데이(VAIV Tech-day)'를 통해 바이브GeM과, 뉴럴서치(Neural Search, 신경망 검색) 기술과 언어생성 기술을 결합한
구글이 대화형 생성 인공지능(Generative AI) '바드(Bard)'를 지난 3월 미국과 영국에서 출시하고 말도 많고 탈도 많았던 바드가 두 달도 채 안돼 훨씬 더 뛰어난 새로운 대형언어모델(LLM)인 '팜2(PaLM 2)' 기반으로 고급 수학 및 추론 기술과 코딩 기능 등을 포함하고 10일(현지시간) 한국을 비롯한 180개국에 동시 출시했다.이날 미국 캘리포니아주 마운틴뷰 쇼어라인 엠피씨어터에서 개최한 '구글 연례 개발자 회의(I/O)'에서 구글과 모회사 알파벳(Alphabet)의 CEO 순다르 피차이(Sundar Picha
엔비디아가 대규모 언어 모델(Large Language Models. 이하, LLM)이 독점 데이터 소스에서 정확한 정보를 검색하고 사용자 쿼리에 대해 사람과 같은 대화형 답변을 생성할 수 있도록 지원하는 네모(NeMo)의 새로운 서비스를 공개했다.이 서비스는 기업들의 독점 데이터로 LLM을 보강해 추가적인 학습을 하거나 처음부터 다시 시작할 필요 없이 모델의 지식 베이스를 자주 업데이트할 수 있다.오늘날 사용 가능한 LLM은 풍부한 지식을 갖추고 있지만, 마치 타임캡슐과 같은 특성을 가지고 있다. LLM이 확보한 정보는 처음 훈련
구글이 대형언어모델(Large Language Model, LLM)이자 대화형 생성 인공지능(generative AI) '바드(Bard)'를 21일(현지시간) 미국과 영국에서 출시했다. 바드는 구글 계정 로그인을 통해 이용할 수 있으며 피드백을 받는다고 설명하고 점차 더 많은 국가와 언어로 확장할 예정이라고 밝혔다.이날 구글이 공개한 바드는 시험판이며, 특히 가볍고 최적화된 람다(LaMDA)를 기반으로 구동되며 시간이 지남에 따라 더 새롭고 더 많은 기능을 갖춘 모델로 업데이트 된다. 바드의 추론 능력은 프롬프트가 주어지면 다음에
국내 대표 AI 플랫폼 기업 마인즈랩(대표 유태준)이 챗GPT(ChatGPT) 알고리즘에 산업과 도메인에 특화된 지식을 학습시킨 '마음GPT(maumGPT)', 챗GPT 등 생성 AI 모델 및 초거대 언어모델(LLM)을 사용해서 AI서비스와 비즈니스를 손쉽게 개발할 수 있는 '마음 오케스트라 3.0'을 13일 오픈하고 본격 서비스에 들어갔다.국내 초거대 인공지능 공급업체로 선정된 이후로 산업과 도메인에 활용가능한 초거대 언어모델을 개발해온 마인즈랩은, 챗GPT의 알고리즘이 공개된 후에 그동안 수집해 온 산업과 도메인의 데이터셋을 발
누구나 ‘눈 뜬 챗GPT’를 카카오톡에서 활용할 수 있다. 인공지능(AI) 스타트업 업스테이지(대표 김성훈)가 국민 모바일 메신저 카카오톡에 업스테이지의 광학문자인식(OCR) 기술과 챗GPT를 더한 AskUp을 론칭, 입소문으로만 만 3일 만에 채널친구 3만 명을 모았다.AskUp은 업스테이지가 개발한 생성 인공지능 챗봇 '챗GPT’를 기반으로 업스테이지의 OCR 기술을 결합, 사용자가 문서의 사진을 찍거나 전송하면 그 내용을 읽고 이해하고 답변할 수 있는 '눈달린 챗GPT’로 탄생했다. 업스테이지가 개발한 OCR 기술은 다양한 글
지난 몇 주 동안 지구촌의 최고의 화두는 오픈 AI의 '챗GPT(ChatGPT)', 구글의 '바드(Bard)', 마이크로소프트의 '빙(Bing)' 등의 언어 생성 AI(Generative AI) 모델에 집중되어 있다. 역시, 이 분야에서 중요한 작업을 계속 이어온 페이스북의 모회사인 메타(Meta)가 24일(한국시간 25일, 새벽 12시 48분) '라마(LLaMA)'라는 새로운 AI 언어 생성 모델을 발표했다.이날 마크 저커버그(Mark Zuckerberg) 메타 CEO가 페이스북을 통해 "오늘 우리는 연구자들의 연구 발전을 돕기
챗GPT 등 대화형 AI 기술의 채택이 비지니스 및 생활 속에 자리잡아 가고 있다. 향후 이 기술에 대한 신뢰도는 이 기술의 성공 여부에 따라 크게 좌우될 것으로 유지 관리의 용이성과 수직적, 수평적 확장이 가능한 기능이 핵심적인 역할을 할 것으로 예상된다.글로벌 대화형 AI 플랫폼 선도 기업 코어에이아이(Kore.ai)가 생성 AI(Generative AI)와 대규모 언어 모델(이하, LLM)을 지원해 가상 비서의 설계 및 개발 대폭 간소화시키는 대화형 AI플랫폼의 최신 버전인 코어에이아이 기업 경험 최적화(XO) 플랫폼(Kore
인공지능과 빅데이터 기술로 조선왕조실록, 일성록(日省錄), 개인 문집류 등 고문헌의 한자를 지금보다 좀 더 빠르게 확인하고 연구할 수 있는 길이 열렸다. 단국대학교(총장 김수복) 부설 한문교육연구소(소장 김우정 교수)와 자율형블록체인융합연구소(소장 박용범 교수)는 고문헌에 표기된 흘림체 글자 등 복잡한 한자에 AI로 한자를 자동으로 분할하고 인식하는 모델을 개발하는데 성공했다.이를 바탕으로 3억 자 이상의 한자 이미지를 데이터베이스로 구축, 사용자가 사용할 경우 전체 한자의 90% 이상을 판별할 수 있다. 인공지능 한자인식 기술은
인공지능으로 가장 정확한 필기 인식 엔진을 지원하고 세계 70개 이상의 언어에 걸쳐 수백만 개의 작문 샘플에 대해 훈련된 신경망은 텍스트, 수학, 다이어그램, 도형, 이모티콘 및 악보를 인식하는 AI 필기기술 기업으로 eNote 경험을 제공하는 프랑스의 마이스크립트(MyScript)가 자유로운 노트 필기 경험을 제공하는 ‘네보 4.0(Nebo 4.0)’을 출시했다고 11일(현지시간) 밝혔다.네보 4.0은 마이스크립트가 기존의 확장 가능한 자유형 캔버스 타입의 네보 노트(Nebo Note)를 혁신적으로 업그레이드한 필기 애플리케이션이
고려대학교 안암병원 순환기내과 주형준 교수팀(순환기내과 주형준 교수, 김종호 교수, 언어학과 송상헌 교수, 한양대학교 김영민 교수, 가톨릭대학교 김유중 교수)이 인공지능(AI) 한국어 의료 자연어처리(NLP) 기술을 개발했다.이번에 개발된 기술은 몇 문장만 입력하면 적절한 진료과를 추천해주는 인공지능 기반의 기술이다.연구팀은 올해 초 26,986개의 의학용어를 정리하고, 한국어 일반 자연어처리 모델인 KR-BERT를 기반으로 의학관련 지식(논문 및 기사 등) 통해 약 6백만개의 문장과 약 1억 1천 6백만개의 단어를 학습시켜서 의료
카카오브레인이 ‘카카오디벨로퍼스’에 자체 개발한 한국어 특화 초거대 인공지능(AI) 언어 모델 ‘KoGPT’를 오픈 소스로 지난 13일부터 공개했다.‘카카오디벨로퍼스’는 웹 서비스, 모바일 앱, 기타 응용 프로그램 개발에 필요한 플랫폼 및 카카오의 다양한 서비스와 연계할 수 있는 부가 기능을 제공하는 개발자 전용 웹사이트다. 카카오의 AI 기술, 카카오톡 접점이 필요한 파트너나 개인 누구나 사용 가능하며 카카오 기술 혹은 무료 제공하는 오픈 API를 활용해 AI 서비스를 만들 수 있다. 현재 소셜통합, 비즈니스, 인공지능 등 다양한
지금까지 대화형 언어 인공지능(AI)에 대한 기존의 공개 연구는 통제된 환경에서 주석자와의 인간 모델 대화에 초점을 맞췄다. 그러나 연구자가 연구 환경에서만 모든 대화 시나리오를 예측하거나 시뮬레이션 할 수는 없다.AI 언어 인공지능 모델은 인간처럼 우리를 이해하고, 참여하며, 대화할 수 있는 진정한 지능형 AI 시스템과는 아직 거리가 멀다. 실제 환경에 더 적응할 수 있는 모델을 구축하기 위해서는 AI는 사람들과 함께 다양하고 광범위한 시각에서 학습해야 한다. 이것들은 아직 미해결 문제이며, 공동체에 의해 수행되어야 하는 새로운
인공지능(AI) 챗봇 '심심이(대표 최정회)'가 인공지능 및 빅데이터 연구자를 위한 데이터 공개를 본격화한다. 심심이에 따르면 20년 동안 축적해 온 초거대 대화 데이터를 7월부터 인공지능·빅데이터 연구·개발 커뮤니티에 공개한다고 1일 밝혔다.심심이는 대화 데이터 특성을 감안해 웹서비스 깃허브(GitHub) 등에 전면 공개하는 방식을 적용하지 않고 연구자 또는 연구팀 개별 신청을 접수 받은 뒤 심사, 비밀 유지 서약 등 관련 절차를 마친 다음 요구사항에 따라 제공 및 관리하는 방식을 활용하기로 결정한 것이다. 심심이 대화 데이터를
대규모 언어 모델(Large Language Model. 이하, LLM)의 크기와 복잡성이 지속적으로 확대되고 있다. 최대 30%의 훈련 속도 향상을 제공하는 엔비디아의 '네모 메가트론(NeMo Megatron)' 프레임워크의 업데이트를 최근 진행했다.이번 업데이트는 두 가지 선도적인 기술과 여러 GPU에서 LLM 훈련을 최적화하고 확장하는 초 매개변수(hyper parameter) 도구를 포함한다. 이를 통해 엔비디아 AI 플랫폼으로 모델을 훈련하고 구축할 수 있는 새로운 기능을 제공한다.1,760억 개의 매개변수를 가진 세계 최
초거대 AI 개발 플랫폼 '페리플로우(PeriFlow)'를 제공하는 서울대학교 컴퓨터공학부 전병곤 교수의 교원창업 기업 ‘프렌들리에이아이(FriendliAI)가 GPT-3와 같은 생성 모델의 효율을 획기적으로 끌어올리는 ‘오르카(Orca)’ 시스템을 발표했다.‘Orca’는 초거대 AI 모델의 효율적인 추론을 가능하게 하는 서빙 시스템(serving system)이다. 기존 서빙 시스템에서 일어나던 비효율적인 지연을 없애기 위해 ‘반복 단위 스케줄링’과 ‘선택적 배치 처리’라는 핵심 기술을 적용했다.기존 시스템이 가장 목마를 오래 타