벨로다인 라이다(Velodyne Lida)가 벨라(Vella) 소프트웨어 제품군의 베타 버전을 출시한다고 1일(현지시간) 발표했다. 이 솔루션은 고객이 자율주행 애플리케이션에 들어가는 라이다 기반 비전 솔루션을 신속하게 개발할 수 있도록 지원한다.벨로다인 센서 고객은 온라인 플랫폼인 벨라 포털을 기반으로 라이다 센서 관리용 벨라 고(Vella Go), 애플리케이션 개발에 활용하는 벨라 퍼셉션(Vella Perception), 인공지능(AI) 기능을 위한 벨라 클라우드 서비스(Vella Cloud Services) 등 벨라의 소프트웨
지능형 로봇, 자율주행 등 머신이 주변 환경을 지능적으로 인지하고 추론하기 위해서는 시각적 장면을 구성하는 객체들과 그들의 관계를 파악하는 능력이 필수적이다.하지만, 이 분야의 연구는 대부분 영상의 각 픽셀에 대응하는 객체의 라벨을 사람이 일일이 표시해야 하는 지도적 학습 방식을 사용했다. 이 같은 수작업은 오류가 발생하기 쉽고 많은 시간과 비용을 요구한다는 단점이 있다.여기에, KAIST(총장 이광형) 전산학부 안성진 교수 연구팀이 미국 럿거스대학교(Rutgers University)와 공동연구를 통해 사람의 라벨링 없이 인간과
카카오브레인(대표 김일두)이 입력 제시한 문자를 바탕으로 고품질의 이미지를 빠르게 만들어내는 AI 아티스트 ‘Karlo(이하, 칼로)’ 모델을 오픈소스로 1일 공개했다.‘칼로’는 카카오브레인이 지난해 12월 글 넘어 그림까지 그리는 멀티모달 초거대 인공지능 모델 ‘minDALL-E(다운)’를 비롯한 ‘RQ-Transformer’ 등 초거대 이미지 생성 AI 모델을 발전시켜 하나의 페르소나로 재탄생한 AI 아티스트다.이 새로운 모델은 1.2억 장 규모의 텍스트-이미지 데이터셋을 학습하여, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로
엣지 컴퓨팅의 글로벌 리더인 에이디링크 테크놀로지(ADLINK)가 더 쉽고 빠르게 인공지능 비전 모델을 개발, 배포할 수 있는 엔비디아 젯슨 나노(NVIDIA Jetson Nano) 기반 비전 개발 키트인 AI 카메라 개발 키트를 출시했다.에이디링크는 AI 비전 개발의 빠른 개념 검증 및 실행 가능성 테스트 요구를 충족시키기 위해 25년의 머신비전 설계 경험을 적용한 포켓 사이즈의 개발 키트다.이 키트에는 이미지 센서, 렌즈, 버티컬 I/O, 다양한 기능을 갖춘 주변 장치 및 독점적인 에이디링크 엣지 비전 분석 소프트웨어인 EVA
신호처리 기반의 이미지 보간 기술(Bicubic interpolation)은 이미지의 특정 위치를 지정하여 다양한 환경에서 원하는 이미지 영상을 보전해주는 기술로 메모리와 속도가 절감된다는 장점이 있지만, 화질열화 현상이 발생하여 이미지가 변형되는 문제가 발생하게 된다.이러한 문제를 해결하기 위해 딥러닝 기반의 초고해상도 영상 이미지 변환 기술들이 등장하였지만, 대부분 합성곱 인공지능망기반 기술로, 픽셀과 픽셀 사이의 값들 추정이 부정확하여 이미지가 변형된다는 단점이 있다.이러한 단점을 극복하고자 함축 표현 신경망(implicit
마이크로소프트가 오픈AI(OpenAI)의 텍스트를 입력해 사용자 맞춤 이미지를 만드는 인공지능(AI) 모델로 AI 이미지 생성 프로그램 '달리2(DALL-E 2)'를 애저의 인공지능 서비스인 애저 오픈AI 서비스(Azure OpenAI Service)에서 제공된다.DALL·E 2는 지난해 1월 발표한 DALL·E 보다 4배 더 높은 해상도로 보다 사실적이고 정확한 이미지를 생성한다.앞으로 마이크로소프트 고객은 애저가 제공하는 보안, 컴플라이언스, 책임 있는 AI를 위한 가드레일 조항과 함께 보다 광범위한 AI 모델을 활용, 간단한
KAIST 김재철AI대학원 주재걸 교수팀과 내스타일(대표 이용균)은 현지시간 23일부터 27일까지 이스라엘 텔아비브에서 개최되는 컴퓨터비전 분야 글로벌 최고학회 중의 하나인 ‘유럽컴퓨터비전학술대회 2022(European Conference on Computer Vision. 이하, ECCV 2022)’에서 패션 AI 분야의 핵심기술인 가상 피팅을 주제로 한 연구 논문이 채택되는 성과를 이루었다.ECCV 2022에서는 약 7,000편의 논문이 제출됐는데 그중 24%인 약 1,600편만 발표 대상 논문으로 선정됐다. 이는 지난해 CV
오는 10월 23일부터 27일까지 이스라엘 텔아비브에서 개최되는 ‘유럽컴퓨터비전학술대회 2022(European Conference on Computer Vision. 이하, ECCV 2022)’에서 인하대학교(총장 조명우) 전기컴퓨터공학과 송병철 교수의 컴퓨터비전 및 영상처리 연구실 소속 이승현 박사과정과 김대하 박사과정의 각각의 연구 성과 논문이 채택됐다.ECCV는 세계 3대 컴퓨터비전 학술대회로, 2년마다 개최된다. 올해는 약 7,000편의 논문이 제출됐는데 그중 24%인 약 1,600편만 발표 대상 논문으로 선정됐다.이승현
머리, 눈 및 시선 추적, 감정 AI와 표정 분석, 활동 및 신체 포즈 추적, 물체 감지 등 인공지능(AI)을 이용해 복잡한 환경 속 인간 행동을 이해하고 지원 및 예측하는 선도기업인 스마트아이(Smart Eye)와 세계적인 반도체 회사인 ST마이크로일렉트로닉스(STMicroelectronics. 이하, ST)가 고감도 1-LED 운전자 모니터링 시스템(Driver Monitoring System. 이하, DMS)을 공동 개발했다.이 새로운 DMS는 운전자 모니터링 알고리즘 및 광학 시스템 설계에 대한 스마트아이의 인공지능 기술과
카카오브레인이 초거대 인공지능(AI) 연구 개발 저변을 확대하고자 국내 최대 규모의 '이미지-텍스트' 데이터 세트를 외부에 공개한다.카카오브레인(대표 김일두)이 약 7억 4천만 개의 이미지-텍스트로 이루어진 데이터셋 ‘Coyo(이하, 코요)’를 31일부터 카카오브레인 공식 홈페이지를 통해 공개한다. 초거대 AI 개발의 기반이자 기업의 핵심 자산인 데이터셋을 외부에 공개하는 것은 매우 이례적이다.데이터셋은 초거대 AI 모델이 정교한 결과값을 구현하는 데 필요한 핵심 요소 중 하나다. 높은 성능을 위해 많은 기업들이 수작업으로 이미지-
설명가능한 인공지능(eXplainable AI, XAI) 이란 사람이 이해할 수 있고 신뢰할 수 있는 설명을 제공할 수 있는 인공지능 기법이다.기존의 수학적 알고리즘으로 학습되는 인공지능은 학습예제에 편향되어 신뢰할 수 없거나, 수천억개의 매개변수를 사람이 이해할 수 없다는 문제점을 해결하기 위해, 왜 인공지능이 특정 결과를 추론했는지 판단근거를 설명할 수 있다.또한, 설명가능한 인공지능은 어떤 이유에 의해서 인공지능의 의사결정에 큰 영향을 주었는지 설명할 수 있다는 점에서 기존의 인공지능보다 정확성, 공정성, 신뢰성을 보장할 수
지스트(광주과학기술원·김기선 총장) 연구진이 영상 속 ‘깊이 정보’를 인공지능(AI) 알고리즘을 통해 정확하게 추정할 수 있는 기술을 개발했다.이를 통해 통해 영상 속에서 보다 정확한 깊이 정보를 얻어낼 수 있어 3D 가상현실(VR)·증강현실(AR) 영상 품질 개선, 메타버스, 영상 기반 인지 탐지 등과 같은 컴퓨터 비전 응용 분야의 발전에 기여할 것으로 기대된다.영상 속의 깊이 정보는 AR·VR의 3차원 공간, 자연스러운 이미지 합성 등 응용하는 여러 분야에서 핵심 요소로 이용되는데, 만약 깊이 정보가 없으면 3차원 공간에 대한
병원균의 조기 식별은 감염질환 치료에 필수적이다. 치명적인 상태로 진행되기 전에 감염균에 맞는 효과적인 항생제의 선택과 투여가 가능해지기 때문이다. 하지만 지금까지 일상적 병원균 식별에는 수일이 소요된다.이로 인해 감염 초기 식별 결과 없이 실증적인 처방으로 항생제를 투여하는 사례가 빈번하며, 이로 인해 패혈증의 경우 치명률이 50%에 달하며 항생제 남용으로 인한 슈퍼박테리아 문제도 발생한다.기존 방법으로 병원균 식별이 오래 걸리는 원인은 긴 박테리아 배양 시간이다. 질량 분석기로 대표되는 식별 기술들은 일정량 이상의 박테리아 표본
비디오 중심의 스마트 사물인터넷(IoT) 솔루션과 서비스를 제공하는 세계적 기업 다화테크놀로지(Dahua Technology)가 '풀컬러 스마트 듀얼 일루미네이터 카메라(Full-color Smart Dual Illuminator Camera)' 시리즈를 공식 출시했다.최신 풀컬러 시리즈는 웜라이트(warm light)와 적외선의 두 가지 일루미네이터를 3가지 보조 조명 모드와 통합해 웜라이트를 계속 사용하지 않고도 선명하고 생생한 풀컬러 이미지를 구현할 수 있도록 했다. 이로써 야간이나 조도가 낮은 다양한 감시 환경에 적합한 유연
퀀텀(quantum)이 방송, 후반 작업, 스포츠 및 기타 미디어 워크플로우에 사용되는 비디오 콘텐츠를 분석하고 강화할 수 있는 새로운 인공지능(AI) 기반 콘텐츠 분석 자동화 솔루션을 최근 발표했다.이 솔루션은 퀀텀 CatDV 자산 관리 및 자동화 플랫폼을 통합하고, 엔비디아 A2 Tensor Core GPU 인프라 및 엔비디아 AI 플랫폼을 활용한다. 엔비디아 딥스트림(DeepStream), 엔비디아 리바(Riva), 엔비디아 맥신 SDK(Maxine SDK)는 퀀텀 CatDV 소프트웨어에 AI/ML 기능을 제공하는 엔비디아 A
국내 연구진이 영상 내 변형 영역을 더욱 정밀하게 탐지하기 위해 영상내 색상 정보와 주파수 정보를 함께 활용하는 인공지능 엔진 기술을 학계 처음으로 개발하였다.이번 개발 기술은 기존 기술보다 정밀도와 정확도를 크게 높여 위변조 탐지 기술의 기술 유용성을 일정 수준 확보할 수 있는 기반을 제공한다는 점에서 그 의미가 크다. KAIST에서 각종 위변조 영상들을 잡아낸다는 의미를 지닌 `카이캐치(KaiCatch)' 소프트웨어는 이미지, 영상뿐만 아니라 CCTV 비디오 변형 여부도 분석할 수 있다.KAIST(총장 이광형)는 전산학부 이흥규
2019년에 설립된 최고의 디지털 제작 솔루션 개발을 목표로 하는 스타트업 '힛파우(HitPaw)'는 완전히 새로운 인공지능(AI) 기반 비디오 향상 소프트웨어인 '히트파우 비디오 인핸서(HitPaw Video Enhancer)'를 지난 27일 발표했다. 이 새로운 영상 인핸서는 인공지능으로 다양한 유형의 목적을 위해 자동으로 비디오를 업스케일링하고 저품질 카메라와 저조도로 인한 노이즈, 픽셀 및 과다 노출을 줄이는 새로운 방법을 제시한 것이다.인핸서는 일반 '노이즈 제거', '애니메이션' 및 '얼굴' 모델 등 세 가지 모델을 제공
인공지능(AI)의 발전과 진화에 따르는 보다 편리한 생활, 그 이면에는 사회·문화 등에서 알고리즘의 잘못된 학습은 차별, 편견, 오류 등의 심각한 문제를 발생시키기도 한다.인공지능(AI)의 발전과 진화에 속도를 내고 있다. 그러나 그 이면에는 사회·문화 등에서 알고리즘의 잘못된 학습은 차별, 편견, 오류 등의 심각한 문제를 초래할 수 있다. 예를 들어, 'AI는 흑인 피고인들에게 백인보다 재범할 가능성이 두 배나 높다(참조)'는 잘못된 추론을 냈다. 또한, 흑인 환자에게 지출되는 비용이 적기 때문에 흑인 환자는 똑같이 아픈 백인 환
췌장암 진단을 받은 사람의 5년 생존율은 11%로 모든 암 중에서 가장 빠르게 성장하고 일반적으로 발견하기 어려운 암이기 때문에 다른 암에 비해 생존율이 현저히 낮다.췌장은 인체의 가장 깊숙한 곳에 위치하기 때문에 발병한 사람들은 증상을 잘 느끼지 못하기 때문에 암이 진행될 때까지 자발적인 건강검진을 받지 않는 경우가 많다.복부 초음파와 같은 간단한 영상 검사로는 췌장 전체를 관찰하기 어렵고, 병변 부위를 식별하기 어렵다는 점은 췌장암의 조기 발견을 더욱 어렵게 만든다.여기에, 후지쯔는 일본 뇌신경질환연구소(Institute for
자율주행 자동차를 향한 꿈이 어느덧 현실에 가까워지고 있지만, 여전히 상용화를 위해선 넘어야 할 과제들이 있다. 갑자기 끼어든 보행자 등 예상치 못한 도로 상황에 즉각적으로 대응해야 하는 데다가, 악천후 상황에서도 주변을 정확하게 인식해야 하기 때문이다. 이는 탑승자의 안전과도 직결되기 때문에 더욱 중요하게 여겨진다.여기에, POSTECH(포항공과대학교, 총장 김무환) 인공지능대학원 컴퓨터공학과 곽수하 교수, 인공지능대학원 통합과정 이소현(제1저자), 손태영(제2저자) 석사 연구팀은 짙은 안개가 낀 날씨에서도 사람, 자동차, 도로,