일반

"애플 비전 프로와도 찰떡궁합"...LLM+디바이스 결합 잠재력은? [real! AI pro]

이건한 기자

AI 대전환의 시대, 쏟아지는 이슈와 키워드 중 '꼭 알아야 할 것'과 '알아두면 좋은' 것을 구분하기란 쉽지 않습니다. 뜬구름 잡는 이야기도 많습니다. [real! AI Pro]는 이 고민을 현업 전문가들이 직접 선정한 주제와 인사이트를 담아 명쾌하게 정리해드립니다. <편집자주>

[디지털데일리 이건한 기자] 한국인 10명 중 1명은 매달 챗GPT를 사용한다는 통계처럼, PC와 모바일 기기에서 만나는 대화형 AI 서비스들은 이제 꽤 친숙합니다. 특히 그냥 친구에게 하듯 꾸밈없이 말해도 알아듣고 자연스럽게 답변하는 것이 이런 LLM(대형언어모델) 기반 서비스들의 매력인데요.

이런 LLM이 이제 스마트폰을 떠나 휴머노이드 로봇과 만난다면? 체감상 상품 결제까지 화면을 20번쯤 터치하는 것 같은 키오스크(Kiosk, 정보제공·결제 무인단말기)에 접목된다면? 혹은 애플의 비전 프로 같은 3D 혼합현실 디바이스(Device, 장치·기기)와 만난다면? 우리 사회는 분명 또 한번 새로운 사용자경험(UX)의 진보를 맞이하게 될 텐데요. 이는 실제로, 이미 곳곳에서 시작된 변화이기도 합니다. 아직 우리가 잘 몰랐던 그 일면의 사례들과 앞으로의 전망을 AI 언어 데이터 전문회사인 플리토의 이정수 대표가 소개해 드립니다.

[ⓒ 디지털데일리]
[ⓒ 디지털데일리]

공상과학의 흔한 일면, 이미 또 현실이 되는 중

안녕하세요, 이정수입니다. 사람의 언어를 자연스럽게 이해하고 구사하는 AI, 즉 발전한 LLM 기술과 디바이스의 결합은 사실 필연적 흐름이라 볼 수 있습니다. 흔한 미래 공상과학 영화만 떠올려도 사람과 대화하는 로봇, 가전, 비서와 같은 이미지는 그리 놀라운 상상이 아닌 것처럼 말입니다.

특히 올해는 AI가 물리적 세상을 이해하는 데 필요한 센서와 컴퓨터 비전(Vision), 로봇 기술의 발전은 물론이고 기존 LLM 기술도 한층 진보했습니다. 기존 LLM과 성능은 비슷하게 유지하면서 소형화 및 최적화가 이뤄져 운영에 필요한 컴퓨팅 자원, 비용이 줄고 있는 추세지요. 또한 이는 더 많은 로봇과 기기에 사람과 소통 가능한 AI가 탑재될 수 있는 길이 열린 것과 같았습니다.

다만 그것이 언제 어떻게, 무엇이 어떤 모습으로 먼저 구현될 것인지가 관건이었는데요. 현재 가시적인 변화는 주로 제조산업에서 관찰되며, 이들은 숙련된 노동 인력 부족 문제를 해결하기 위해 특히 LLM과 같은 생성형 AI 기술이 접목된 로봇 기술에 큰 관심을 보이고 있습니다.

과연 누구를 위한 키오스크였을까?

우선 큰 변화가 기대되는 분야는 키오스크입니다. 키오스크는 요즘 공공장소에서 사람을 대신해 다양한 정보를 제공하거나, 매장에서 무인결제 기기로 널리 쓰이고 있죠. 하지만 원하는 정보를 얻거나 상품을 주문하기까지 생각보다 많은 화면 터치가 필요한데요. 사실 그 과정이 사람과 대화하는 과정과 크게 다르지 않습니다. 하지만 말로 의사를 주고받는 것과 화면에 펼쳐진 수많은 그림과 글자 사이에서 미간을 찌푸리며 내가 눌러야 할 곳을 찾아야 하는 것은 UX의 질이 다릅니다. 그런 환경은 사실 사용자보단 대부분 키오스크 제공자 중심적이라고 볼 수 있죠.

외국 공항·병원 이용... 이제 두렵지 않을 것

그러나 앞으로는 언어 데이터를 능숙히 처리하는 대화형 AI와 키오스크가 만나 많은 것이 달라집니다. 플리토도 지난 9월부터 최근까지 인천국제공항 내 주요 안내센터에 AI 실시간 통번역 솔루션인 '챗 트랜스레이션'을 접목한 가상인간 기반 안내원을 시범 운영한 바 있습니다. 최대 38개 언어로 국내외 이용자들에게 공항 이용에 필요한 정보를 제공했는데요.

인천국제공항 3층 종합안내소에서 시범운영 중인 플리토의 AI 다국어 동시통역 서비스 [ⓒ 플리토]
인천국제공항 3층 종합안내소에서 시범운영 중인 플리토의 AI 다국어 동시통역 서비스 [ⓒ 플리토]

특히 미리 정해진 질문만 답하는 게 아니라, 공항 이용에 특화된 언어 데이터가 학습되어 사용자들의 다양한 민원을 정확하게 이해하고 도움을 줄 수 있는 점에서 기존 키오스크와 다릅니다. 또한 실시간 RAG(검색증강생성) 데이터와도 연계해 실시간 항공기 운항 상황처럼 실질적으로 유용한 정보를 확인해 줄 수도 있죠. 예를 들면, “유실물을 찾던 중 비행기를 놓쳤는데, 도쿄로 가는 다른 항공편이 있나요?”라고 질문하면, 현재 시간 기준 탑승이 가능한 항공편을 실시간으로 안내해 줍니다. 물론 내가 질문한 모국어로 안내를 받을 수 있습니다.

AI 안내원은 유실물 보관소 안내, 실시간 항공편 안내, 근처 숙박 및 식사 정보 등의 정보를 다양하게 제공했다. [ⓒ 플리토]
AI 안내원은 유실물 보관소 안내, 실시간 항공편 안내, 근처 숙박 및 식사 정보 등의 정보를 다양하게 제공했다. [ⓒ 플리토]

대화 상대도 사람을 닮은 가상인간이므로 소통이 더욱 자연스러운 느낌을 줍니다. 그동안 키오스크 조작이 어려웠던 노약자, 장애인을 위한 접근성도 높아집니다. 나아가 만약 이런 시스템을 병원에 적용하면 어떨까요? 국내외 어디든 위급상황 중 소통이 쉽지 않은 외국인 환자와 의사소통을 도와 진단 및 치료 과정이 훨씬 수월해질 것으로 기대할 수 있겠습니다.

시공간 제약에 언어장벽까지 사라질 '리얼 메타버스'

가상현실(VR), 증강현실(AR) 기반 서비스 경험도 한층 개선될 수 있습니다. 마찬가지로 저희 플리토 사례를 예로 들면, 지난 11월 애플의 공간 컴퓨팅 기기인 비전 프로(Vision pro)에 AI 동시통역 앱을 탑재한 결과, 사용자들이 비전 프로를 착용한 상태에서 시공간의 벽과 언어의 벽이 동시에 허물어졌을 때 상당한 만족감을 보인다는 점을 확인했습니다.

이는 마치 영화 '마이너리티 리포트'처럼 가상과 현실을 넘나드는 공간 컴퓨팅의 영역이 언어의 구애를 받지 않는 전세계 무대로 확장됨을 의미합니다. 디바이스가 공간을 허물고, AI가 소통을 담당하는 환상의 시너지를 기대할 수 있게 된다는 이야기죠. 언어가 다른 사람들끼리 가상공간에서 만나 회의나 업무를 함께하고, 실시간 여행 가이드를 받는 등 생산성과 엔터테인먼트를 넘나드는 디지털 월드 경험의 확장이 기대됩니다. 또한 이것이야 말로 진짜 '메타버스(Metaverse)'라고 말할 수 있을 것입니다.

[ⓒ DALL·E AI 생성 이미지]
[ⓒ DALL·E AI 생성 이미지]

AI 언어테크, 인류의 수천년 숙원을 푼다

한편으로, 이런 변화의 시작점은 결국 이런 AI 기반 언어테크가 지난 수년 사이 폭발적인 속도로 발달한 결과물이기도 합니다. '언어의 장벽이 완전히 허물어지는 것'에 대한 사람들의 욕구는 수천년 전부터 존재했지만, 실제로는 얼마 전까지도 부분적 해소에 그쳤습니다. 전문 통번역사, 웹·모바일 번역 앱 등을 통해서 말이죠.

그러나 이제는 AI가 통번역에 필요했던 최소한의 지연시간마저 점차 제로에 가까운 수준으로 만들어 나가고 있는 중입니다. 이로써 사람들은 더이상 소통의 벽을 신경 쓸 필요 없이 문화 교류와 국제 협력을 비롯해 보다 생산적이고, 즐거운 활동에 몰두할 수 있게 될 것인데요. 궁극적으로는 이런 AI 혁신이 물리적 세계에 존재하는 모든 디바이스와 하나씩 결합될수록, 우리는 점점 더 기계를 배우는 것이 아니라 기계가 우리를 배우는 인간 중심적 사회를 살아갈 수 있게 될 겁니다. 또한 그것이 바로 우리가 꿈꿨던 진정한 AI 사회로 진입하는 첫걸음이 아닐까요?

이건한 기자
sugyo@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널