알리바바그룹의 디지털 기술 및 인텔리전스의 알리바바 클라우드가 최신 인공지능(AI) 이미지 생성 모델인 ‘통이 완샹(Tonyi Wanxiang)을 공개했다.'완샹'은 '수만 개의 이미지'라는 뜻을 지닌 중국어로, 통이 완샹은 현재, 중국 내 기업 고객을 대상으로 베타 테스트가 진행 중이다.이와 함께 알리바바 클라우드는 ‘모델스코프(ModelScope)’의 다양한 AI 모델을 활용해 언어, 시각, 음성 영역에서 복잡하고 전문적인 AI 작업을 수행할 수 있도록 지원하는 다목적 프레임워크 ‘모델스코프GPT(ModelScopeGPT)’를
카카오브레인의 텍스트 형태의 제시어를 기반으로 이미지를 생성하는 인공지능(AI) 아티스트 ‘칼로’가 사실감 넘치는 이미지를 단 3초 안에 그려내는 초거대 AI 이미지 생성 모델 ‘칼로(Karlo) 2.0’으로 진화됐다.카카오브레인이 새롭게 선보인 ‘칼로 2.0’은 약 3억 장 규모의 텍스트-이미지 데이터셋을 학습한 초거대 AI 아티스트다. ‘칼로 2.0’은 글로벌 Top Tier 수준의 언어 이해력을 기반으로 완성도 높은 그림을 생성할 수 있는 성능을 갖췄다.예를 들어 ‘밝은 파란 눈동자를 가진 고양이 (A cat has light
LG AI연구원이 현지시간 18일부터 22일까지 캐나다 밴쿠버에서 열리는 '컴퓨터비전과 패턴인식 학술대회(CVPR 2023)'에서 18일, 이미지 검색 시장에 변화를 가져올 ‘캡셔닝 AI(Captioning AI)’를 처음 공개했다.이날 'CVPR 2023 NICE 워크숍'을 통해 LG AI연구원이 처음으로 외부에 공개한 ‘생성형 AI’ 상용화 서비스인 ‘캡셔닝 AI’는 ‘인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI’로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다.LG AI연구원은
메타(Meta)가 기존 이미지 생성 AI 모델들을 뛰어넘는 미완성 이미지를 더 정확하게 분석하고 완성할 수 있는 새로운 '인간과 같은(human-like)' 인공지능 모델과 구성 요소를 오픈소스로 13일(현지시간) 공개했다.이 모델인 I-JEPA는 다른 생성형 AI 모델처럼 주변 픽셀만 보는 것이 아니라 외부 세계에 대한 배경 지식을 사용하여 이미지의 누락된 부분을 채운다.이 접근 방식은 뉴욕대학교(NYU) 교수이자 메타의 최고 AI 과학자 얀 르쿤(Yann LeCun)이 AI 시스템이 동물과 인간처럼 학습하고 추론할 수 있도록 하
네이버의 일본 자회사 라인(LINE. 대표이사·사장 '이데자와 다케시/Idezawa Takeshi')는 라인 메신저의 프로필 이미지 생성 서비스인 ‘라인 프로필 스튜디오(LINE PROFILE STUDIO)’에서 인공지능(AI)이 사용자가 등록한 사진을 이용해 자동으로 다양한 스타일의 이미지를 만들어주는 ‘AI 셀카’ 기능을 출시했다.‘AI 셀카’는 별도의 앱 다운로드 없이 라인 메신저 앱 내 프로필 화면의 프로필 스튜디오에서 바로 사용 가능하다.사용자가 자신의 사진을 10장에서 20장 등록하면, 실제 사진과 유사한 ‘베이직’, 가
중국 상하이에 본사를 둔 베리실리콘(VeriSilicon) AI 기반 초고해상도 IP SR2000 출시했다. 저해상도 비디오 소스의 해상도와 품질을 향상시키는 기능을 갖춘 SR2000은 저해상도 비디오 스트림을 엣지에서 고해상도 이미지 품질로 표시하는 동시에 네트워크 대역폭을 낮출 수 있다.새로 출시된 IP는 인공지능을 통해 만족스러운 결과를 얻을 수 있는 제어 가능한 향상 기능을 제공한다. 가전, 데이터센터, 감시 및 의료를 포함한 광범위한 응용 분야에 적합하다.베리실리콘의 SR2000은 작은 실리콘 면적과 낮은 전력 소비로 고품
인공지능(AI) 전문 기업 딥브레인AI(대표 장세영)는 생성 AI(Generative AI)가 만든 얼굴 이미지를 기반으로 대화형 가상인간(Virtual Human)을 13일 발표했다.딥브레인AI가 새롭게 선보인 가상인간은 딥러닝 기반의 페이스 스왑(Face Swap) 기술이 적용됐다. 페이스 스왑은 사진 혹은 영상에 있는 얼굴을 인식하여 얼굴 부분을 변환시키는 안면 교체 기술이다. 국내 최초로 실제 사람이 아닌 AI 기반으로 생성된 얼굴 이미지를 2D AI 휴먼(AI Human) 모델 바디에 합성한 전신(全身) 모습의 가상인간 1
카카오브레인이 자사 이미지 생성 AI 모델 ‘칼로(Karlo)’를 기반으로 한 이미지 생성 및 공유 플랫폼 ‘비 디스커버(B^ DISCOVER)’에 ‘AI 프로필’ 서비스를 28일 추가했다. ‘AI 프로필’은 사용자가 지정한 이미지를 바탕으로 AI가 다양한 프로필 이미지를 생성하는 서비스다. 이용 방법은 간단하다. ‘비 디스커버’ 앱에서 사용자의 연령과 성별을 선택하고, 사용자의 사진 파일 하나만 업로드한 후 ‘생성(Generate)’버튼을 클릭하면 된다.AI는 업로드된 이미지와 사용자 정보에 기반해 판타지(Fantasy), 타임슬
세계적으로 가장 널리 사용되는 실시간 3D 콘텐츠 제작 및 운영 플랫폼을 제공하는 유니티(unity)가 ‘테크니컬 아티스트를 위한 유니티: 주요 툴 세트 및 워크플로’ 가이드를 공개했다.‘테크니컬 아티스트를 위한 유니티: 주요 툴 세트 및 워크플로’는 유니티가 테크니컬 아티스트를 위해 제공하는 새로운 유형의 무료 가이드로, 유니티에서 가장 경험이 풍부한 유니티 테크니컬 아티스트와 ‘더 헤러틱(The Heretic)’ 및 ‘에너미즈(Enemies)’ 데모를 제작한 유니티 데모팀의 의견을 바탕으로 제작됐다.또한, 유니티 2021 LTS
업계 최초로 엔비디아가 셔터스톡(Shutterstock)과 맞춤형 3D 모델을 훈련시키기 위한 협업을 진행한다고 밝혔다.셔터스톡은 혁신적인 브랜드와 미디어 기업을 위한 선도적인 크리에이티브 플랫폼(보기)으로, 양사는 협업을 통해 간단한 텍스트 프롬프트에서 생성형 3D 에셋을 생성하는 맞춤형 3D 모델을 훈련할 전망이다.이번 협업은 엔비디아 피카소(Picasso) 생성 AI 클라우드 서비스를 사용해 셔터스톡 애셋으로 3D 모델을 훈련하는 방식으로 진행된다. 이를 통해 텍스트를 고품질의 3D 콘텐츠로 변환할 수 있으며, 기존에 몇 시간
텔레다인 테크놀로지스(Teledyne Technologies)의 자회사인 텔레다인 플리어(Teledyne FLIR)는 임베디드 시스템에 간단하게 구축할 수 있는 소형 인공지능(AI) 모델을 갖춘 새로운 '프리즘 AI(Prism AI)'을 발표했다.새로운 릴리스는 인식 시스템 개발 엔지니어들이 첨단 운전자 지원 시스템(ADAS)과 자율주행 자동차(AV) 시스템을 위한 열화상 카메라를 신속하게 통합하고, 이전 버전의 프리즘 AI 릴리스보다 물체 추적 성능을 최대 24%까지 향상시킬 수 있도록 해준다.텔레다인 플리어의 제품관리 부문 부사
카카오브레인(대표 김일두)이 사용자의 무한한 상상력을 이미지로 구현하는 ‘B^ EDIT(비 에디트)’ 웹 서비스를 오픈 베타로 7일 공개했다. ‘B^ EDIT’는 카카오브레인의 초거대 AI 이미지 생성 모델 ‘칼로(Karlo)’를 기반으로한 ‘B^ DISCOVER(비 디스커버)’에 이은 두 번째 서비스다. 사용자는 ‘B^ EDIT’로 원하는 화풍의 이미지 생성은 물론, 다양한 기능을 활용해 이미지를 수정하는 등 자신의 상상력을 마음껏 표현할 수 있다.사용자가 ‘B^ EDIT’에 접속해 바로크, 3D 렌더, 일본 애니메이션 등 총 3
서울시특별시 관제인력 1인이 평균 958대의 CCTV를 담당하는 등 열악한 우리나라 관제 여건으로 CCTV 무용론까지 언급되는 가운데, 과학기술연합대학원대학교(총장 김이환. 이하, UST) 박사과정생 2인이 첨단 딥러닝 기술을 적용한 지능형 CCTV 기술을 개발, 적은 인력으로 이상행동을 감지하는 역량의 대폭 향상 등 파급효과가 기대된다.UST 한국전자통신연구원(ETRI) 스쿨에 재학 중인 김형민, 전호범 박사과정생(지도교수 김도형)은 다수의 이상상황을 복합적으로 검출, 판단할 수 있는 인공지능(AI) 기반 통합 프레임워크 기술을
국내 최초로 AI 아티스트의 작품이 잡지 표지에 실렸다.카카오브레인(대표 김일두)은 AI·빅데이터 전문 기업 바이브컴퍼니(대표 이재용·김성언)와 협업해 생성AI(Generative AI) 'AI 아티스트(칼로)'로 미국의 글로벌 경제전문지 ‘포춘(FORTUNE)’의 한국판인 ‘FORTUNE KOREA’의 2월호 표지 디자인을 구현했다.국내 최초로 인간과 AI 기술의 협업으로 빅데이터로 사람들이 생각하는 AI 아티스트의 얼굴을 텍스트화하고, AI 아티스트가 이를 이미지로 그려낸 것이다.표지 제작을 위해 바이브컴퍼니는 블로그, 트위터,
연세대학교 의과대학 용인세브란스병원(병원장 김은경) 영상의학과 이시은, 김은경 교수팀이 인공지능(AI) 판독 보조프로그램을 활용한 유방암 위험도 분석의 효용성을 확인했다고 18일 밝혔다.이는 전문의가 악성 종양일 가능성이 크다고 평가하거나, 침윤암 또는 높은 병기의 유방암일수록 인공지능이 판단한 위험도 또한 높아진다는 내용이다.인공지능 판독 보조프로그램을 활용한 유방촬영술이 유방암 진단의 정확도 향상에 도움이 된다는 결과가 발표되면서 그 활용이 점차 증가하고 있다. 이에 연구팀은 인공지능 판독 보조프로그램이 나타내는 위험도와 유방암
수면무호흡, 코골이 등과 같은 수면호흡장애를 진단하는 가장 정확한 진단법인 수면다원검사는 병원 검사실을 방문해 몸에 다양한 센서를 붙이고 하룻밤 자면서 뇌파, 근전도 등을 측정해야 하는 불편함이 있다.최근 수면 상태를 간편하게 확인하는 스마트폰 앱이나 웨어러블 디바이스가 많이 나와 있지만, 이는 코골이 소리와 뒤척이는 잡음을 구별하지 못하거나 실제로 건강에 나쁜 수면무호흡은 소리가 없어 정상 호흡으로 진단되는 제한이 있었다.아주대학교병원 이비인후과 김현준 교수팀(박도양 교수·안준영 연구원, 아주대 미디어학과 신현준 교수·양명현 연구
이전의 많은 연구들은 하나의 손 또는 손과 물체가 상호작용하는 상황을 고려하여 포즈를 추정하는 것에 초점을 두고 있다. 또한 이미지에서 손의 위치 상자가 주어져 있다고 가정하여 손 포즈를 추정하는 모델의 입력으로 손 영역을 기준으로 자른 이미지를 사용한다.하지만 실제상황에서 사람들은 물체와 상호작용을 할 때 양손을 모두 사용하며 손의 위치 상자에 대한 정보는 주어지지 않는다.UNIST(총장 이용훈) 인공지능대학원 백승렬 교수팀이 지난 10월 24일 ‘유럽컴퓨터비전학회(ECCV 2022’에서 주최한 HBHA(Human Body, Ha
네이버의 실시간 음란물 필터링 시스템 ‘엑스아이(X-eye) 2.0’이 ‘클로바 그린아이(CLOVA GreenEye)’로 재탄생한다. 오픈 API 형태로 외부에 기술을 개방함으로써, 건전한 인터넷 환경 조성 및 이용자 보호에 더욱 기여할 것으로 기대된다.‘엑스아이’는 네이버가 2017년 출시한 24시간 실시간 음란 이미지 필터링 기술로, 네이버에 축적된 수백만장의 이미지를 학습해, 부적절한 이미지나 동영상(음란물)이 네이버에 등록될 경우 인공지능(AI)로 이를 실시간으로 감지해 검색 노출을 차단한다. 네이버는 검색 외에도 카페, 블
대만의 글로벌 인공지능(AI) 안면 인식 플랫폼 기업 사이버링크(CyberLink)의 페이스미(FaceMe) 안면 인식 엔진이 FIDO 얼라이언스의 UAF 레벨 1 인증을 획득했다.이 엔진은 전통적인 암호 방식의 로그인보다 복잡한 메커니즘을 갖춰 은행, 증권, 보험, 전자 결제 및 기타 금융 분야의 인증·거래 보안에 활용되고 있는 기술이다.FIDO는 비밀번호에 의존한 본인 인증을 줄이기 위해 인증 표준을 제정했다. FIDO 표준은 서버 측 리스크를 줄이기 위해 본인 인증을 디바이스 측으로 변경하는 것, 보안과 편의성을 높이기 위해
브라질 마토그로수두술 연방대학교(Mato Gross do Sul Federal University)의 훌리오 크로다(Julio Croda) 박사가 이끄는 국제 연구팀이 루닛(대표 서범석)의 흉부 엑스레이 AI 영상분석 솔루션 '루닛 인사이트 CXR'을 교도소 수감자에 적용한 결과, 세계보건기구(WHO)의 결핵 검진 성능기준에 부합하고 압도적인 정확도를 보였다.해당 연구 결과는 세계적으로 권위 있는 의학저널 란셋(The Lancet) 그룹이 발행하는 국제학술지 'The Lancet Regional Health-Americas'에 게재