e비즈*솔루션

[re:Invent2024] 생성형AI로 더 똑똑해진 협동로봇…“듣고 말하고 악수까지”

라스베이거스(미국)=권하영 기자

두산로보틱스의 이재석 어드밴스드SW혁신연구소장이 아마존웹서비스(AWS)가 5일(현지시간) 미국 네바다주 라스베이거스의 베네시안 호텔에서 개최한 ‘AWS 리인벤트 2024(AWS re:Invnet 2024)’에서 한국 기자들과 인터뷰를 진행하고 있다. [Ⓒ 디지털데일리]

[디지털데일리 권하영기자] 글로벌 협동로봇 기술 강자 두산로보틱스가 생성형 인공지능(AI) 혁신을 가속화한다.

아마존웹서비스(AWS)가 5일(현지시간) 미국 네바다주 라스베이거스의 베네시안 호텔에서 연례 기술 컨퍼런스 ‘AWS 리인벤트 2024(AWS re:Invnet 2024)’를 개최한 가운데, 글로벌 협동로봇 시장 4위이자 국내 1위 기업인 두산로보틱스의 이재석 어드밴스드SW혁신연구소장을 이날 현장에서 만났다.

두산로보틱스는 크게 ‘코봇(Cobot, Collaborative robot)’, ‘솔루션’, ‘소프트웨어(SW)’ 등 3가지 포트폴리오를 가지고 국내외 협동로봇 시장을 주도하고 있다. 무게와 길이 등에 따라 다양한 코봇 라인업을 갖췄고, 코봇에 그리퍼(물체를 잡는 장비)나 비전카메라 등 주변장치를 결합해 공정(Palletizing)을 실행하는 다양한 솔루션들, 그리고 일련의 과정들을 통합 제어하는 SW 플랫폼 ‘다트 스위트(Dart-Suite)’를 서비스한다.

기존의 협동로봇 사업은 사실 여러 도전과제들에 직면해 있었다. 프로그래밍 과정이 상당히 복잡한 절차를 수반한 데 따른 문제점들이다. 협동로봇에 적용되는 다양한 기술들을 통합해야 하는 과제(Tech Integration Challenge), 같은 기술을 반복적으로 사용할 수 있는 재사용성(Limited Flexibility), 공정 프로그래밍의 복잡성(Programming Complexity), 제품 설정 변경시 일일이 재프로그래밍해야 하는 어려움(Difficulty Adaptating to Change) 등이 그랬다.

이에 두산로보틱스는 2가지 해결책을 고안해 냈다. 먼저, 기술 통합과 재사용성 측면을 보완하기 위해 내놓은 게 다트 스위트다. 다트 스위트는 쉽게 말해 스마트폰 애플리케이션들을 말한다. SW 플랫폼상으로 제공되는 여러 기능을 바탕으로 애플리케이션을 만들어 협동로봇을 유연하고 편리하게 제어할 수 있는 것이다. 이를 통해 다양한 기술이 통합될 수 있고, 한번 만들어놓은 애플리케이션을 지속적으로 사용해 재사용성도 충족한다.

이재석 소장은 “예컨대 다트 스위트에서 그리퍼 애플리케이션, 비전카메라 애플리케이션, 커피 레시피 애플리케이션 등을 다운로드 하면 커피로봇이 만들어지는 것”이라며 “사용자가 익숙한 아이콘 형태 애플리케이션을 스토어에서 내려받아 쓸 수 있게 하는 생태계가 다트 스위트고, 이는 기존에는 일일이 프로그래밍을 해야 했던 방식에서 이제 애플리케이션 다운로드 방식으로 패러다임을 변화시킨 것”이라고 설명했다.

이 소장은 “다트 스위트는 지난 10월 외부에 개방하면서 누구나 애플리케이션을 만들고 다운로드 받을 수 있게 해놨다”며 “유니버셜로봇 등 SW 플랫폼을 먼저 시작한 곳도 있지만, 스토어를 구현해 사용자가 애플리케이션 다운로드 받을 수 있게 한 건 우리가 처음”이라고 설명했다.

또 다른 문제점인 프로그래밍 복잡성과 재프로그래밍의 번거로움은 생성형 AI를 도입해 해소하기로 했다. 공정이 바뀔 때마다, 정보가 변경될 때마다 개발자가 프로그래밍을 하지 않아도 되도록, 이제는 비전 AI 등 센서로 변동 사항을 감지하고 생성형 AI 스스로 변경 코드를 만드는 등 로봇 프로세스의 자동화를 꾀하겠다는 것이다.

그 결과로, 두산로보틱스가 현재 데모 버전으로 내놓은 생성형 AI 기반 협동로봇은 좋은 반응을 얻고 있다. 겉으로 보기엔 로봇 팔(Arm) 구성이 전부인 것처럼 보이지만, 실제로는 눈과 귀 역할을 하는 요소들이 더해져 음성인식이 가능하고, 시각적인 상황을 파악하며, 문맥을 이해하는 대화를 할 수 있고, 실제 모션도 생성해내는 훨씬 고도화된 작업을 수행할 수 있는 로봇이다.

두산로보틱스는 이러한 생성형 AI 도입을 위해 ‘아마존 베드록’을 적극 활용한 사례다. 아마존 베드록은 아마존 자체 AI 모델은 물론 주요 AI 파트너사들의 파운데이션모델들을 동시에 제공함으로써 고객이 여러 모델들을 조합해 맞춤 애플리케이션을 만들 수 있는 생성형 AI 개발도구다. 두산로보틱스는 아마존 베드록에서 앤스로픽의 ‘클로드’, 메타의 ‘라마’ 등 AI 모델을 활용해 협동로봇을 고도화하는 데 힘썼다.

이 소장은 “사실 처음에는 그냥 아마존 베드록이라는 서비스가 있다고 해서 써 본 정도였지만, 막상 사용해보니 쓰길 정말 잘했다는 생각이 들었다”며 “사실 클로드는 코드 생성을 더 잘하고 라마는 이미지 생성을 더 잘하는 등 각 LLM(거대언어모델)마다 장점이 다 다르기 때문에, 목적에 맞게 LLM을 구성할 수 있었던 데다 이 모든 과정을 단 두시간 만에 처리할 수 있었다”고 언급했다.

AWS가 제공하는 이노베이션 워크숍을 통해 프로토타이핑 프로젝트부터 심도 있는 기술 지원을 받을 수 있었던 점도 다행이었다. 두산로보틱스는 AWS 엔지니어들과 1단계로 2주에 한번씩 스프린트 작업을 통해 관련 논문과 트렌드를 조사하며 6주간 긴밀한 협업을 진행했고, 개념검증(PoC) 형태로 시뮬레이션을 진행하면서 기술에 대한 확신을 얻을 수 있었다는 전언이다. 이를 바탕으로 2단계에선 두산로보틱스 자체적으로 개발 성과를 내고, 전단계보다 고도화된 서비스를 구성하는 데 성공했다.

이 소장은 “1단계에선 빨간색 박스를 파란색 캔이 있는 위치로 옮기라는 텍스트를 입력해 그 작업을 수행하게 하는 검증이었고, 2단계에선 다국어 음성인식과 인사나 악수 등 모션 생성 등 기술을 추가로 구현할 수 있었다”며 “이러한 과정에선 아마존 베드록으로 다양한 LLM을 지원받은 것뿐만 아니라, 음성인식 서비스 ‘아마존 트랜스크라이브’, 텍스트 음성변환용 ‘아마존 폴리’, 물체인식을 위한 ‘LangSAM’과 ‘그라운딩DINO’ 등을 적재적소에 활용했다”고 소개했다.

다만 “로봇이 작업을 수행하는 시간이 아직은 길다는 게 한계”라며 “1단계 시뮬레이션 당시에는 빨간 박스를 파란 캔 옆으로 옮기는 데 걸리는 시간이 4분30초나 됐다”고 지적했다. 그는 “최근에는 클로드에서 리얼타임 API를 발표하면서 한번에 여러 작업을 동시에 수행하는 비동기처리가 가능해져, 이 같은 작업 시간이 적으면 22초 길어도 2분 정도로 많이 개선됐다”고 덧붙였다.

두산로보틱스는 이번 성과를 기점으로 생성형 AI 기반 협동로봇 사업을 계속 진전시켜나갈 계획이다. 이 소장은 “이제 첫 번째 PoC를 하고 실제 개발 제품 공정에 적용해본 상태로, 앞으로 사례를 더욱 늘려서 검증을 진행할 예정”이라며 “밸류에이션은 충분하다고 생각한다”고 피력했다.

회사는 올해 초 세계 최대 가전·IT 전시회 ‘CES 2024’에서 일찌감치 신규 로봇 라인업을 공개한 바 있다. 공정용 로봇 외에도 사람의 감정을 인식해 그에 맞는 칵테일 레시피로 제조해주는 칵테일 제조 로봇이 많은 관심을 받았다. 이 소장은 “공정용 로봇은 예측 AI, 칵테일 제조 로봇은 생성 AI 기술이고, 이번 작업은 여기에 모션 생성 AI까지 확대된 것”이라며 “선도적으로 AWS 신규 서비스들을 사용해보면서 이런 사례들을 계속 만들어나갈 것”이라고 밝혔다.

라스베이거스(미국)=권하영 기자
kwonhy@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널