문서 내 텍스트뿐만 아니라 이미지 속 텍스트도 추출 가능

이미지:사이넵소프트
이미지:사이넵소프트

AI∙전자문서 전문기업 사이냅소프트(대표 전경헌)는 ‘사이냅 문서필터’가 인공지능 OCR과의 연동으로 텍스트 추출 기술력을 강화하게 되었다고 14일 밝혔다. 두 솔루션의 결합으로 문서에 포함된 이미지 내 텍스트도 추출할 수 있어 사이냅 문서필터만의 차별화된 경쟁력을 갖추게 됐다.

사이냅 문서필터는 문서에서 텍스트를 추출하는 솔루션이다. 400+ 문서 포맷의 종류를 식별하고 50+ 포맷의 문서 파일로부터 텍스트를 추출한다. 다국어 인코딩 지원, 빠른 속도와 안정성으로 검색 엔진, 메일, 보안 솔루션의 첨부파일 텍스트 필터링에 활용되고 있다.

문서필터는 네이버, 카카오 등 대형 포털 사이트에 적용될 정도로 빠르고 안정적인 텍스트 추출에 강점을 지닌 솔루션이다. 하지만 문서 내 이미지에 포함된 텍스트는 추출할 수 없는 아쉬움이 있었다.

사이냅소프트는 이러한 한계를 보완하기 위해 문서필터에 인공지능 딥러닝 기술을 활용하여 다양한 형태 이미지에 포함된 텍스트를 인식하는 ‘사이냅 OCR’를 연동했다. 두 솔루션의 결합으로 일반 텍스트는 물론 이미지 내 텍스트까지 인식과 추출이 가능해졌다. 문서에 포함된 모든 텍스트를 완벽히 추출할 수 있게 되어 문서필터의 가치를 한 단계 끌어 올렸다.

사이냅 문서필터는 사이냅 OCR과의 연동을 통해 SK텔레콤, 안랩 등 다양한 레퍼런스를 확보하며 문서필터 시장을 이끌어 가고 있다.

사이냅소프트의 김시연 부사장은 “기존 문서필터에서 이미지 내 텍스트 추출을 필요로 하는 고객사의 요구가 있었다.”며 “사이냅 문서필터와 사이냅 OCR의 연동으로 고객 요구를 충족하며 대한민국 문서필터 1위 기업의 자리를 공고히 하겠다”라고 말했다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지