흑백 사진은 컬러 사진과 달리, 색으로부터 벗어나 질감, 선, 패턴, 대비 등에 초점을 맞춰 사진을 표현할 수 있다. 이 같은 특징을 살려 최근 인스타그램 등 소셜 네트워크 서비스(SNS)에서 심미적 효과를 연출하는 데 널리 활용되면서 흑백 사진이 새롭게 주목받고 있다.그동안 컴퓨터 비전 분야의 연구는 컬러에서 흑백 영상으로 변환은 심미적 완성도를 높이기 위한 것보다는 단순히 다른 과업을 수행하기 위한 전처리(preprocessing) 단계로서, 또한 변환 과정에서 정보를 잃지 않는 것을 목표로 다루어졌다.심미적 목적의 흑백 사진을
인공지능(AI)을 통해서 국민 배우 나문희씨가 영화 ‘수상한 그녀‘처럼 20대 리즈 시절로 돌아갔다. AI 엔터테인먼트 기술 분야의 선두주자인 ㈜엠씨에이(대표이사 박재수, 이하 MCA)는 한국마사회와의 협업으로 'AI 나문희 배우'와 함께 하는 흥미로운 브랜디드 콘텐츠를 선보였다'나문희의 첫사랑'이라는 제목으로 공개된 이번 영상은 AI로 구현한 현재의 나문희 배우와 젊어진 나문희 배우가 동시에 등장하여, 스타가 할 수 없는 것을 가능하게 하고 대중들에게 새로운 경험을 선사한다. 이번 MCA의 첫 번째 프로젝트는 나문희 배우의 AI
엔비디아가 단 몇 초 만에 텍스트를 3D 그래픽으로 변환하는 생성형 AI 모델 라떼3D(Large-scale Amortized Text-To-Enhanced3D Synthesis, LATTE3D)를 24일(현지시간) 공개했다. 라떼3D는 가상 3D 프린터처럼 텍스트 프롬프트를 1초 안에 사물과 동물의 3D 그래픽으로 변환할 수 있다.라떼3D는 표준 렌더링 애플리케이션에 널리 사용되는 포맷으로 제작됐다. 비디오 게임, 광고 캠페인, 디자인 프로젝트 또는 로보틱스용 가상 훈련장 개발 등을 위한 가상 환경을 쉽게 구현할 수 있다.엔비디아
엔비디아가 비주얼 콘텐츠 제공업체를 위해 새로운 이미지 제어 기능인 3D 생성형 AI를 발표했다. 엔비디아 '에디파이(NVIDIA Edify)'는 비주얼 생성 인공지능을 위한 멀티모달 아키텍처로, 새로운 차원으로 나아가고 있다.3D 애셋 생성은 에디파이가 개발자와 비주얼 콘텐츠 제공업체에 제공하는 최신 기능 중 하나로, 개발자는 AI 이미지 생성을 더욱 창의적으로 제어할 수 있다.멀티미디어 콘텐츠와 데이터 제공업체인 셔터스톡(Shutterstock)은 에디파이 아키텍처 기반으로 만들어진 API(애플리케이션 프로그래밍 인터페이스)에
네이버페이(대표이사 박상진)가 경희대학교 서울캠퍼스에서 인공지능(AI) 얼굴인식 기술 기반의 ‘페이스사인(Facesign) 결제’ 서비스를 시작한다고 11일 밝혔다.네이버페이 ‘페이스사인 결제’는 사용자가 자신의 스마트폰을 활용해 얼굴정보를 간편하게 등록하고, 카드나 스마트폰 없이 얼굴인식 만으로 빠르고 편리하게 결제할 수 있는 서비스다. 이번 경희대 서울캠퍼스 내 도입은 네이버페이 ‘페이스사인 결제’ 서비스가 상용화 된 첫 사례로, 기존에는 네이버 사옥 ‘1784’에서 네이버 임직원들의 사내 출입, 결제, 시스템 로그인 등에 활용
분당서울대병원 응급의학과 김중희 교수·순환기내과 조영진 교수 연구팀은 스마트폰으로 심전도 이미지를 분석해 부정맥, 응급상황, 심장 기능 이상 등을 평가하는 의료 인공지능 어플리케이션 ‘ECG Buddy’를 자체 개발하고 최근 식약처 인증을 획득했다.응급실에서 빠른 평가와 처치는 환자의 예후와 직결된다. 중장년 주요 사망 원인인 심근경색 중 가장 심각한 유형인 ‘ST-분절 상승형 심근경색’은 10분 내로 질환 유무를 판정하고 시술을 결정해야 하고, 폐부종 환자는 호흡부전에 빠지기 전 이뇨제를, 고칼륨혈증은 심각한 부정맥이 오기 전에
멀티 모달 이미지 생성 AI 모델 개발 및 배포 분야의 혁신적인 스타트업 스태빌리티 AI(Stability AI)는 새로운 경량화 대형언어모델(smaller Large Language Model. 이하, sLLM)로 Stable LM 2 시리즈의 첫 번째 언어 모델인 16억 개 매개변수의 기본 모델로 인스트럭션 튜닝(특정의 지시에 근거해 튜닝한) 버전인 'Stable LM 2 1.6B'모델을 지난 19일(현지시간) 공개했다.스태빌리티 AI의 이 모델은 현재까지 가장 강력한 sLLM 중 하나로 지난 16일 출시한 'Stable Cod
엔비디아가 CES 2024에서 세계적인 비주얼 콘텐츠 제작 플랫폼이자 시장 선도 업체인 게티이미지(Getty Images)의 ‘아이스톡 생성형 AI(Generative AI by iStock)’ 출시를 지원했다고 밝혔다.아이스톡 생성형 AI는 저작권을 보유한 독점 데이터 라이브러리로 학습된 저렴하고 상업적으로 안전한 이미지 생성 서비스이다.‘아이스톡 생성형 AI’는 맞춤형 AI 모델을 위한 파운드리인 엔비디아 피카소(NVIDIA Picasso)를 기반으로 구축됐다. 이는 디자이너와 기업에게 텍스트-이미지 생성 툴을 제공해 저작권이
최근 놀라운 화질을 구현하는 동영상 생성 인공지능 모델이 등장하고 있으며, 다수의 경우 놀라운 화질을 선보이고 있다. 현재, 비디오 생성의 병목 현상 중 하나는 일관된 대형 모션을 생성하는 기능이다. 그러나 주요 모델조차도 작은 모션을 생성하거나 큰 모션을 생성할 때 눈에 띄는 아티팩트(Artifacts)가 나타나는 경우가 많다.여기에 31명의 연구원으로 구성된 구글 리서치(Google Research) 연구팀이 비디오 생성에서 언어 모델의 적용을 탐색하기 위해 텍스트 대 비디오, 이미지 대 비디오, 비디오 스타일화 등 다양한 비디
이미지 생성 인공지능(AI) 전문 기업 딥브레인AI(대표 장세영)가 한 장의 사진과 10초 분량의 음성만 있으면 2분 이내에 나와 닮은 가상인간을 제작할 수 있는 ‘드림아바타’ 솔루션을 22일 선보였다.딥브레인AI의 드림아바타는 본인과 닮은 아바타를 손쉽게 만들 수 있는 초개인화 가상인간 제작 솔루션이다. 사용자가 입력한 텍스트를 AI가 실제 사람이 녹음한 것처럼 음성을 합성하는 TTS(Text to Speech)와 텍스트를 디지털 영상 콘텐츠로 자동 변환·제작하는 TTV(Text to Video)를 기반으로 설계됐다.드림아바타 솔
아모레퍼시픽이 인공지능(AI) 기반 피부 진단 시스템, ‘닥터 아모레(Dr.AMORE®)’의 개발 과정과 성능, 활용 가능성에 관한 연구 결과를 발표했다.‘닥터 아모레(Dr.AMORE®)’는 한국 여성들의 피부 이미지를 바탕으로, 피부 임상 전문가의 평가를 학습한 인공지능 딥러닝 기반 진단 시스템으로 주름, 색소 침착, 모공, 적색 반점 등 주요 피부 고민을 사진만으로 바로 진단할 수 있다.‘닥터 아모레’를 활용한 분석 결과는 피부 임상 전문가들의 육안 평가와 높은 상관관계를 보이며, 관련 연구를 통해 아모레퍼시픽이 개발한 인공지능
인간은 `보라색 포도'와 `노란 바나나' 같은 개념을 학습하고, 이를 분리한 뒤 재조합해 `노란 포도'나 `보라색 바나나'와 같이 본 적 없는 개념을 상상하는 능력이 있다. 이런 능력은 체계적 일반화 혹은 조합적 일반화라고 불리며, 범용 인공지능(Artificial General Intelligence, AGI)을 구현하는 데 있어 핵심적인 요소로 여겨진다.체계적 일반화 문제는 1988년 미국의 저명한 인지과학자 제리 포더(Jerry Fodor)와 제논 필리쉰(Zenon Pylyshyn)이 인공신경망이 이 문제를 해결할 수 없다고
텔레다인 테크놀로지스(Teledyne Technologies)의 자회사인 텔레다인 플리어(Teledyne FLIR)가 열화상 및 다중 스펙트럼 애플리케이션의 성능을 극대화할 수 있도록 설계된 임베디드 시스템을 위한 고도로 최적화된 이미지 프로세싱 소프트웨어 개발 키트(SDK)인 프리즘 ISP(Prism™ ISP) 버전 1.0을 출시했다퀄컴(Qualcomm) 및 엔비디아(NVIDIA)의 저전력 CPU 상에서 동작하도록 설계된 프리즘 ISP는 노이즈 감소, 초고해상도, 전자 이미지 안정화, 적외선(IR) 및 전기광학(EO) 비디오 융합
라인 주식회사(LINE Corporation/이하 라인. 대표 이데자와 다케시/Idezawa Takeshi)는 인공지능(AI)이 사용자가 등록한 사진을 이용해 자신과 닮은 복고풍 감성의 10대 이미지를 자동으로 만들어주는 ‘AI 틴즈’ 기능을 26일 출시했다.AI 틴즈는 사용자가 자신의 얼굴 사진을 8장에서 12장 등록하면, AI가 자동으로 10대의 발랄한 ‘하이틴’ 감성 이미지 30장을 만들어 준다.AI 학습 기술을 활용하여 사용자와 닮은 10대의 모습에 레트로하고 자유분방한 헤어스타일, 포즈, 의상을 적용한 다양한 이미지를 구현
미드저니(Midjourney), 스테이블리티 AI(Stability AI) 등 이미지 생성 AI 경쟁이 가열되고 있는 가운데 오픈AI(OpenAI)가 21일(현지시간) 텍스트-이미지 생성 및 변환 도구인 달리(DALL-E)의 업그레이드 버전 '달리 3(DALL-E 3)'을 공개했다.DALL·E 3은 현재, 연구용 프리뷰 단계에 있으며, 10월부터 유료버전인 챗GPT 플러스(ChatGPT Plus) 및 기업 고객에게 API를 통해 제공될 예정이다. 특히, 이 도구는 AI 챗봇인 챗GPT를 사용하여 프롬프트 작성의 수고를 혁신적으로 덜
의료 인공지능의 경우 학습에 사용된 이미지 양식과 다른 이미지가 모델에 입력되면 성능이 크게 하락하는 일이 빈번하게 일어난다.예를 들면, A사의 스캐너로 취득된 MRI 데이터로 학습된 모델에 B사 스캐너로 취득한 MRI 데이터가 입력되면 성능이 하락할 수 있다. 또한, CT와 MRI 등 다중 모달리티 영상을 취득하기 어려운 경우에도 CT 영상으로부터 MRI로 변환한 데이터셋을 생성해 더 정확한 분석을 할 수 있다.최근 이미지의 스타일을 변화시켜주는 연구들이 제안되고 있지만 대부분 일반영상의 스타일 변환에 집중하고 있어 이미지 변환
알리바바 그룹의 디지털 기술 및 인텔리전스 중추인 알리바바 클라우드가 개방형 대규모 시각 언어 모델(Large Vision Language Model, 이하, LVLM) 'Qwen-VL'과 대화형 모델 'Qwen-VL-Chat'을 출시했다. 두 모델은 프롬프트의 이미지, 텍스트 및 경계상자를 이해할 수 있으며 영어와 중국어로 다중 라운드 질문에 대한 답변을 지원한다.먼저, Qwen-VL은 알리바바 클라우드의 70억 개 매개변수로 구성된 대규모 언어 모델인 통이치엔원 (Tongyi Qianwen)의 멀티모달 버전으로, 모델스코프(Mo
웹툰, 웹소설 제작에 사용되는 생성형 AI 도입이 탄력을 받을 것으로 전망된다. 김준구 네이버웹툰 CEO는 지난 24일 네이버의 기술 방향성과 사업 전략을 공유하는 컨퍼런스 ‘단(DAN) 23’에서 올해 말에서 내년초부터는 생성형 AI를 활용해 작가들과의 협업을 시작할 것이라고 말했다. 전 세계 창작자들의 신규 콘텐츠 창출과 성장을 지속할 이용자층을 확보하겠다는 의도다.김 대표는 뒤이어 “최근 생성형 AI에 많은 저작권 논란이 있다는 것을 잘 안다.”며 “이런 논란이 없으면서도 실제로 쓸 수 있는 AI에 접근하려고 한다. 특정 작가
카카오브레인이 상상 속 이미지를 완벽하게 구현하는 이미지 생성 웹 서비스 ‘칼로’를 공개했다. ‘칼로’ 웹 서비스는 카카오브레인이 지난 3월 오픈 베타로 공개한 ‘비 에디트(B^ EDIT)’에 대한 사용자 피드백을 바탕으로 새롭게 개편했다.카카오브레인은 자사의 이미지 생성 도구의 브랜딩을 강화하고자, 새롭게 공개하는 웹 서비스명으로 회사의 이미지 생성 모델 ‘칼로(Karlo)’를 그대로 사용하기로 했다. 또한 주요 편의 기능을 추가 및 개선함으로써 초보 사용자들의 진입 장벽을 낮추고, 전문가들의 창작 활동을 효과적으로 지원할 수 있
하이퍼볼릭(Hyperbolic) 공간은 우리가 일상적으로 경험하는 3차원 공간과 달리 굽은 형태를 지닌 비(非)유클리드 공간 중 하나다. 수학 및 물리학의 다양한 문제를 연구하는데 사용되며 상대성이론, 네트워크 구조 연구, 그래프 이론 등에서 중요한 역할을 한다.참고로 비(非)유클리드 기하학은 공간의 곡률, 평행선의 성질, 거리의 정의 등을 수정하거나 확장한 다양한 공간을 다루는 기하학. 하이퍼볼릭 기하학은 비유클리드 기하학의 대표적인 예로, 평면 위에서 음의 곡률을 가진다.하이퍼볼릭 공간에서는 데이터 간의 계층적 관계를 보다 효율