마이크로소프트, 애저에서 인지 서비스 비전 및 검색 서비스에 대한 새로운 '커스텀 비전 서비스' 제공
마이크로소프트, 애저에서 인지 서비스 비전 및 검색 서비스에 대한 새로운 '커스텀 비전 서비스' 제공
  • 최창현 기자
  • 승인 2018.03.02 17:47
  • 댓글 0
이 기사를 공유합니다

이제 개발자는 서비스를 통해 자신의 데이터로 분류자를 쉽게 학습하고 모델을 내보낼 수 있으며, 이러한 사용자 지정 분류기를 응용 프로그램에 직접 포함할 수 있게 됐으며, 또 iOS 11 용 CoreML 형식과 Android 용 TensorFlow 형식으로 모델을 내보낼 수 있다.
그림 1 : Azure 미리보기에서 사용할 수 있는 사용자 정의 비전 서비스
그림 1 : Azure 미리보기에서 사용할 수 있는 사용자 정의 비전 서비스

최근 인공지능(AI)은 디지털 방식의 비즈니스 변화의 가장 파괴적인 요소 중 하나로 부상했다. 마이크로소프트는 개발자, 데이터 과학자 및 기업 모두가 독창적이고 차별화 된 방식으로 인간의 창의력을 향상시키기 위해 AI의 혜택을 누릴 수 있어야 한다고 말한다 . MS는 그동안 20 년 이상 인공지능에 대한 연구를 해왔으며, 이를 제품과 서비스에 도입했다. 이제는 간단하면서도 강력한 도구를 통해 모든 사람들에게 제공하고 있다.

도구 중 하나는 MS 인지 서비스(Cognitive Services) 개발자가 시각, 음성, 언어, 지식 및 검색을 위한 AI 기능을 iOS, Android 및 Windows와 같은 장치 및 플랫폼 전반에 응용 프로그램에 쉽게 추가할 수 있게 해주는 클라우드 호스팅 API로 현재까지 백만 명이 넘는 개발자들이 인지 서비스를 이용해 왔다. 마이크로소프트의 인공지능 및 연구담당 부사장인 요셉 시로쉬(Joseph Sirosh)는 1일(현지시각) 애저 블로그를 통해 애저에서 인지 서비스 비전 및 검색 서비스를 위한 새로운 서비스로 모든 개발자에게 비전 기능 제공하는 '마이크로소프트 커스텀 비전 서비스(Custom Vision service)'를 공개했다.

이제 개발자는 Microsoft Custom Vision 서비스를 통해 자신의 데이터로 분류자를 쉽게 교육하고 모델을 내보낼 수 있으며, 이러한 사용자 지정 분류기를 응용 프로그램에 직접 포함 할 수 있게 됐다. 또 iOS, Android 및 기타 여러 에지 장치에서도 실시간으로 오프라인으로 실행할 수 있다.

아울러 몇 번의 클릭만으로 커스텀 비전 서비스를 다양한 시나리오에 사용할 수 있어 소매업자는 카탈로그(드레스, 신발 등)에서 이미지를 자동 분류할 수 있는 모델을 쉽게 만들 수 있으며, 소셜 사이트에서는 이미지를 보다 효과적으로 필터링하고 분류할 수 있어, 특정 제품 또는 국립공원에서 카메라의 이미지에 야생 동물이 포함되어 있는지 여부를 감지할 수 있다. 또한 iOS 11 용 CoreML 형식과 Android 용 TensorFlow 형식으로 모델을 내보낼 수 있으며, 내 보낸 모델은 모바일 장치의 조건에 맞게 최적화되어 있으므로 장치 분류가 실시간으로 이루어진다.

그림 2 : Face API는 이제 백만 가지 규모의 인식을 포함하여 여러 개선 사항을 통합
그림 2 : Face API는 이제 백만 가지 규모의 인식을 포함하여 여러 개선 사항을 통합

Face API는 얼굴 감정 인식을 제공하는 일반적으로 사용이 가능한 클라우드 기반 서비스로 그것은 사용자 경험을 개인화하는 데 사용할 수 있는 이미지에서 인간의 얼굴과 감정의 위치와 속성을 감지한다. 개발자는 Face API를 사용하여 두 얼굴이 같은 사람에게 속하는지 확인하고 이전에 태그가 지정된 사람을 식별하고 컬렉션에서 비슷한 얼굴을 찾고 컬렉션에서 같은 사람의 사진을 찾거나 그룹화 할 수 있다.

이처럼 Face API는 백만 가지 규모의 인식을 통해 여러 가지 개선 사항을 통합하고 고객이 비전 시나리오를 보다 효과적으로 활용할 수 있게 한다 (그림 2). 백만 단위 인식 기능은 현재 최대 100 만 명을 수용할 수 있는 새로운 유형의 개인 그룹과 최대 백만 개의 얼굴을 가진 새로운 유형의 얼굴 목록을 나타낸다. 이 업데이트를 통해 개발자는 Face API를 학습시켜 최대 100 만 명을 인식할 수 있으며, 빠른 응답을 얻을 수 있다.

일반적으로 AI 투자의 또 다른 주요 영역은 검색과 관련되어 있다. 전 세계 모든 사람들이 Bing Search에서 풍부한 정보를 수집하여 웹을 쿼리할 수 ​​있지만 여러 검색 API를 통해 개발자가 이를 활용할 수 있는 권한을 부여하며. 몇 줄의 코드만으로 모든 앱에 퍼가기만 하면 사용자가 전체의 지식 중에서 올바른 정보를 찾을 수 있다. 또 Bing Entity Search는 인지 서비스의 검색 기능 중 하나로서 사용자, 장소, 사물 및 지역 비즈니스에 대한 풍부한 정보를 모든 앱, 블로그 또는 웹 사이트에 제공하여 보다 매력적인 사용자 경험을 제공하며, Bing Entity Search가 현재 애저 포털에서 일반적으로 제공되고 있다.

그림 3 : 엔티티 검색 결과로 컨텐츠 확장
그림 3 : 엔티티 검색 결과로 컨텐츠 확장

Bing Entity 검색을 통해 개발자는 검색된 용어를 기반으로 가장 관련 있는 Entity를 식별하고 해당 Entity에 대한 기본 세부 정보를 제공할 수 있다 (그림 3) Entity는 유명한 사람, 장소, 영화, TV 프로그램, 비디오 게임 및 도서에 대한 정보를 포함하여 여러 국제 시장과 시장 유형에 걸쳐 있다. Bing Entity Search로 많은 시나리오를 다룰 수 있다. 예를 들어 메시징 응용 프로그램은 레스토랑의 Entity 스냅 샷을 제공할 수 있으므로 그룹이 저녁을 쉽게 계획할 수 있다. 소셜 미디어 앱은 각 사진의 위치에 대한 정보로 사용자의 사진을 보완할 수 있으며, 뉴스 앱은 기사의 Entity에 대한 Entity 스냅 샷을 제공할 수 있다.

한편 커스텀 비전 서비스는 애플리케이션 개발을 보다 쉽게 하고 고객 데이터를 존중할 수 있는 엔터프라이즈급 툴을 통해 AI 플랫폼을 모든 비즈니스 시나리오에 적합하게 만든다. AI가 어떻게 디지털 변환 작업을 보강하고 강화할 수 있는지에 대한 자세한 정보는 www.azure.com/ai를 방문하거나 마이크로소프트의 AI 스쿨 을 시작하여 개발자가 이러한 인공지능 기술을 최대한 빨리 익힐 수 있도록 도와준다.

 


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.