토종식물자원 주권 보호의 시급성과 식물자원의 보유‧활용 현황을 진단하고, 연구‧산업 현장 활용 확대를 위한 3대 추진전략을 마련

이미지:본지
이미지:본지

유전체 빅데이터를 활용한 다양한 산업이 각광받고 있는 가운데 최근 빅데이터 분석기술의 발전으로 유전체 정보를 활용한 육종, 소재개발 등 활용도가 높아지면서 바이오산업 핵심요소인 유전체 빅데이터 확보를 위한 연구개발을 경쟁적으로 추진하고 있다.

우리나라의 경우, 보유한 식물자원은 8,073 여종(미세조류 제외)으로 지금까지 확보된 유전체 빅데이터 양은 보유자원 수 대비 1%에도 못 미치고 있다.

또한, 국내 바이오 기업들이 사용하는 해외 생명 자원 중 식물이 69%로 가장 큰 비중을 차지하고 있어 식물자원 국산화 기반을 우선하여 마련할 필요가 있다.

이에 농림축산식품부(장관 김현수), 과학기술정보통신부(장관 최기영), 환경부(장관 한정애), 해양수산부(장관 문성혁), 농촌진흥청(청장 허태웅), 산림청(청장 최병암)은 토종식물자원의 지속 가능한 다양성과 바이오산업 경쟁력 확보를 위한 ‘한반도 토종식물자원 생명 정보 빅데이터 구축전략’ 방안이 제17회 과학기술 관계 장관회의에서 심의 의결됐다고 30일 밝혔다.

‘한반도 토종식물자원 생명 정보 빅데이터 구축전략’은 부처 협력을 통해 멸종위기종, 재래종 등 토종식물의 다양성과 유전체 빅데이터를 확보하고, 식물 소재 국산화와 바이오 데이터 자립화를 통해 바이오 산업적 활용 촉진 등 공동연구 협력방안을 마련하기 위함이다.

이를 위해 토종식물자원 주권 보호의 시급성과 식물자원의 보유‧활용 현황을 진단하고, 연구‧산업 현장 활용 확대를 위한 3대 추진전략을 마련했다.

3대 추진전략은 재래종, 희귀종 등 현재 보유 중인 8,073종을 2030년까지 9,700여 종 이상으로 확대 수집과 경제‧생태적 가치가 높은 1,135종 토종식물을 선정하고 유전체 빅데이터를 대량 구축해 맞춤형 유전체 정보제공, 식물 분야 빅데이터 활용 전문인력 양성과 연구‧산업 현장 지원 등이다.

유전체 빅데이터 확보를 통해 연구‧산업 현장에서는 비용과 시간을 획기적으로 줄이고 고부가 기능성 물질 유전자 탐색과 바이오소재 발굴에 활용할 수 있다. 또한, 인공지능 기반 디지털 육종과 생태계 관리, 보전에도 적극적으로 활용될 수 있을 것으로 기대된다.

허태웅 농촌진흥청 청장은 “토종식물 유전자원이 연구와 산업현장에서 활용도를 높이기 위해 실물자원의 보존뿐 아니라 유전체의 디지털 빅데이터 확보가 필수적이다.”라며, “바이오산업의 핵심요소인 식물유전자원이 체계적으로 관리될 수 있도록 관계부처와 협업으로 성과를 창출해 가겠다.”고 밝혔다.

한국바이오협회 이승규 부회장은 “부처 간 협력으로 일궈낸 토종식물자원 생명 정보 빅데이터 구축전략 마련을 환영한다.”라며, “양적, 질적으로 우수한 생명 정보 빅데이터 확보, 정보공유 활용체계 구축을 위한 정부의 지속적인 투자가 필요하다.”라고 말했다.

한편, 국내에서는 인공지능(AI) 기반 생물 유전체 빅데이터 분석기업 인포보스(손장혁, 박종선 공동대표)가 현재, 세계 최대 식물 게놈 데이터베이스 'Plant Genome Database(이하, PGD)'를 구축하고 모든 데이터 접근이 가능한 무료 웹서비스로 공개되어 관련 업계에 주목을 받고 있다.

PGD는 GenomeArchive®에서 제공되는 표준화된 구조를 바탕으로 자료 접근이 가능한 식물 게놈 데이터를 통합한 데이터베이스로, 주석이 된 정보들 또한 제공하며 BLAST를 포함한 여러 생물정보학 도구들을 사용할 수 있다.

PGD는 현재 638종으로부터 총 1986개의 식물 게놈을 보유하고 있다. 수집된 게놈 총 길이는 무려 939,574,681,579 bp로 인간 게놈 길이(3.2Gbp)의 약 293배에 달한다.

PGD의 메인 페이지에서는 가장 원시적인 식물인 회청조식물(Glaucophyte)부터 속씨식물(Angiosperm)까지 분류학 순서대로 나열되어 있으며, 각 분류별로 게놈의 양이 표시된다. 또한, 통합검색 및 BLAST 검색을 수행할 수 있다.

게놈 브라우저 탭은 시퀀스, 유전자, 단백질, tRNA, miRNA등을 포함한 정보를 제공하고 있다. 각 단백질별 상세 화면에서는 InterProScan에 예측된 기능도메인과, TMHMM에 의해 예측된 막횡단 헬릭스(transmembrane helix) 정보도 같이 조회된다. 또한, PGD는 36,946,879 개의 단순반복염기서열 (Simple Sequence Repeat) 데이터를 같이 제공해준다.

아울러 PGD는 유저들이 웹 상에서 대상(object; 예, 유전체, 염기서열 등)을 저장하고, 분석 프로그램을 구동할 수 있는 GlobalScrap®이 적용되어 있다. GlobalScrap®는 웹에서 다양한 형태의 정보를 관리하고 BLAST와 같은 분석 도구들을 실행할 수 있게 해주는 웹 기반 플랫폼이다.

인포보스는 한국지능정보사회진흥원에서 주관하는 '빅데이터 플랫폼 및 센터 구축'사업 중 산림빅데이터 플랫폼 분야의 산림생물종 유전체 빅데이터부분을 서비스하고 있으며, 산림빅데이터 거래소를 통해 일부 무료 데이터 및 유료 데이터를 제공하고 있다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지