로봇의 센서에서 나오는 시계열 데이터를 분석하는 순환 신경망을 사용함으로써 암시적으로 지반 특성을 예측하는 인공신경망 구조를 도입

(뒷줄 두번째 황보제민 교수) KAIST 기계공학과 황보제민 교수 연구실 단체사진(사진:KAIST)
(뒷줄 두번째 황보제민 교수) KAIST 기계공학과 황보제민 교수 연구실 단체사진(사진:KAIST)

모래, 눈, 풀밭과 같은 변형하는 지형은 지구 표면을 상당 부분 차지하고 있는데, 로봇 보행 기술은 바퀴와 달리 빠짐이나 미끄러짐으로부터 비교적 자유로워서 기동성 측면에서 이러한 지형에서 유리하다.

기존 제어 방법은 지반의 변형을 고려하기 위해서 수치화된 지반 특성이 필요한데, 이는 날씨나 장소 등에 의해 쉽게 변화되기 때문에 실시간으로 추정되어야 하여 외부 환경에서의 실현을 어렵게 만든다.

반면, 모델프리(Model-free) 강화학습을 기반으로 하는 사족 제어기는 명시적으로 지반 반력 모델을 가지고 있지 않기 때문에 지반 특성에 대한 정확한 추정에 의존하지 않는다.

KAIST(총장 이광형)는 기계공학과 황보제민 교수 연구팀이 모래와 같이 변형하는 지형에서도 민첩하고 견고하게 보행할 수 있는 인공지능(AI) 강화학습(RL) 기반 사족 로봇 제어기술을 개발했다.

황보 교수 연구팀은 모래와 같은 입상 물질로 이루어진 지반에서 로봇 보행체가 받는 힘을 모델링하고, 이를 사족 로봇에 시뮬레이션하는 기술로 사전 정보 없이도 다양한 지반 종류에 스스로 적응해가며 보행하기에 적합한 인공신경망 구조를 도입해 강화학습(Reinforcement Learning)에 적용했다.

제시된 제어기의 다양한 지반 환경에 대한 적응력. 넓은 범위에서 무작위화된 입상 매체 시뮬레이션에서 학습한 제어기는 다양한 자연 발생한 지형 및 인공 지형에의 적응력을 보였으며, 고속 보행 능력과 에너지 효율성을 입증했다.
제시된 제어기의 다양한 지반 환경에 대한 적응력. 넓은 범위에서 무작위화된 입상 매체 시뮬레이션에서 학습한 제어기는 다양한 자연 발생한 지형 및 인공 지형에의 적응력을 보였으며, 고속 보행 능력과 에너지 효율성을 입증했다.

학습된 신경망 제어기는 해변 모래사장에서의 고속 이동과 에어 매트리스 위에서의 회전을 선보이는 등 변화하는 지형에서의 견고성을 입증해 사족 보행 로봇이 적용될 수 있는 영역을 넓힐 것으로 기대된다.

적용된 강화학습은 임의의 상황에서 여러 행동이 초래하는 결과들의 데이터를 수집하고 이를 사용해 임무를 수행하고 필요한 데이터의 양이 많아 실제 환경의 물리 현상을 근사하는 시뮬레이션으로 빠르게 데이터를 모으는 방법이 널리 사용되고 있다.

특히 보행 로봇 분야에서 학습 기반 제어기들은 시뮬레이션에서 수집한 데이터를 통해서 학습된 이후 실제 환경에 적용돼 다양한 지형에서 보행 제어를 성공적으로 수행해 온 바 있다.

다만 학습한 시뮬레이션 환경과 실제 마주친 환경이 다른 경우 학습 기반 제어기의 성능은 급격히 감소하기 때문에, 데이터 수집 단계에서 실제와 유사한 환경을 구현하는 것이 중요하다. 따라서, 변형하는 지형을 극복하는 학습 기반 제어기를 만들기 위해서는 시뮬레이터는 유사한 접촉 경험을 제공해야 한다.

연구팀은 기존 연구에서 밝혀진 입상 매체의 추가 질량 효과를 고려하는 지반 반력 모델을 기반으로 보행체의 운동 역학으로부터 접촉에서 발생하는 힘을 예측하는 접촉 모델을 정의했다. 나아가 시간 단계마다 하나 혹은 여러 개의 접촉에서 발생하는 힘을 풀이함으로써 효율적으로 변형하는 지형을 시뮬레이션했다.

연구팀은 또한 로봇의 센서에서 나오는 시계열 데이터를 분석하는 순환 신경망을 사용함으로써 암시적으로 지반 특성을 예측하는 인공신경망 구조를 도입했다.

입상 매체 시뮬레이션을 위한 접촉 모델 정의. 연구팀은 입상 매체와의 접촉이 점에서 일어나는 것으로 근사하면서 수직 방향 힘에 대해서는 추가 질량 효과를 고려한 모델을, 수평 방향으로는 쿨롱(Coulomb) 마찰 모델을 사용했다. 나아가 발의 옆면에서 발생할 수 있는 지면의 저항력을 모사하는 모델을 도입, 시뮬레이션에 사용했다.
입상 매체 시뮬레이션을 위한 접촉 모델 정의. 연구팀은 입상 매체와의 접촉이 점에서 일어나는 것으로 근사하면서 수직 방향 힘에 대해서는 추가 질량 효과를 고려한 모델을, 수평 방향으로는 쿨롱(Coulomb) 마찰 모델을 사용했다. 나아가 발의 옆면에서 발생할 수 있는 지면의 저항력을 모사하는 모델을 도입, 시뮬레이션에 사용했다.

학습이 완료된 제어기는 연구팀이 직접 제작한 로봇 `라이보'에 탑재돼 로봇의 발이 완전히 모래에 잠기는 해변 모래사장에서 최대 3.03 m/s의 고속 보행을 선보였으며, 추가 작업 없이 풀밭, 육상 트랙, 단단한 땅에 적용됐을 때도 지반 특성에 적응해 안정하게 주행할 수 있었다.

또한, 에어 매트리스에서 1.54 rad/s(초당 약 90°)의 회전을 안정적으로 수행했으며 갑작스럽게 지형이 부드러워지는 환경도 극복하며 빠른 적응력을 입증했다.

연구팀은 지면을 강체로 간주한 제어기와의 비교를 통해 학습 간 적합한 접촉 경험을 제공하는 것의 중요성을 드러냈으며, 제안한 순환 신경망이 지반 성질에 따라 제어기의 보행 방식을 수정한다는 것을 입증했다.

연구팀이 개발한 시뮬레이션과 학습 방법론은 다양한 보행 로봇이 극복할 수 있는 지형의 범위를 넓힘으로써 로봇이 실제적 임무를 수행하는 데에 이바지할 수 있을 것으로 기대된다.

제1 저자인 최수영 연구원은 "학습 기반 제어기에 실제의 변형하는 지반과 가까운 접촉 경험을 제공하는 것이 변형하는 지형에 적용하는 데 필수적이라는 것을 보였다ˮ 라며 "제시된 제어기는 지형에 대한 사전 정보 없이 기용될 수 있어 다양한 로봇 보행 연구에 접목될 수 있다ˮ 라고 말했다.

한편 KAIST 기계공학과 최수영 박사과정이 제1 저자로 참여한 이번 연구는 국제 학술지 `사이언스 로보틱스(Science Robotics)에 '변형 가능한 지형에서의 4족 보행 학습(Learning quadrupedal locomotion on deformable terrain-보기)'의 제목으로 25일(현지시간) 게재됐다.(아래는 시연 영상)

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지