[인터뷰] (주)엑스와이지, 카페 로봇을 넘어 공존형 AI 로봇에 도전하다 바리스브루 기반 무인 매장 실증 통해 데이터 축적 임승환 기자 2025-07-04 13:20:03

카페 로봇 솔루션을 개발하고 있는 (주)엑스와이지가 로봇 산업의 미래는 알고리즘이 아닌 상호작용에 있다고 밝혔다. 동사는 카페 로봇을 시작점으로 실제 공간에서 사람과 감정적으로 교감할 수 있는 피지컬 AI(Physical AI) 로봇을 개발 중에 있으며, 서비스 운영과 기술 개발을 병행해 공존형 AI 로봇의 새로운 길을 개척하고자 한다.

 

(주)엑스와이지 로봇 지능화 연구소 조인성 연구소장 / 사진. 로봇기술

 

실사용 데이터로 진화하는 AI 로봇 구현의 청사진
국산 로봇 AI 기업 (주)엑스와이지(XYZ, 이하 엑스와이지)가 서비스로봇 지능화를 향한 행보를 가속화하고 있다. 카페 로봇 솔루션 ‘바리스브루(Barisbrew)’를 중심으로 다양한 AI 기술을 적용하고, 휴머노이드 로봇과 온디바이스 AI 등 차세대 로보틱스 기술 개발도 병행하며 피지컬 AI(Physical AI) 기업으로의 전환을 추진 중이다.


엑스와이지 로봇 지능화 연구소 조인성 연구소장은 “엑스와이지는 B2B와 B2C를 아우르는 리테일 로봇 솔루션 기업으로, 자사 카페 운영을 통해 실사용 데이터 기반의 AI 기술을 개발하고 있다”라며 “로봇이 사람과 대화하고, 원격지에서 명령을 받아 움직이는 지능화 기술을 적극 연구 중”이라고 밝혔다.

 

카페 로봇 솔루션 ‘바리스브루(Barisbrew)’ / 사진. 엑스와이지


대표적인 제품은 로봇 바리스타 ‘바리스브루’와 이를 소형화한 ‘바리스브루 X(Barisbrew X)’, 핸드드립 전문 로봇 ‘바리스드립(Barisdrip)’, 아이스크림 로봇 ‘아리스(Aris)’ 등과 함께 빌딩 내 AMR 기반 배송 로봇 ‘스토리지(Storage)’와 광고 로봇 ‘루미(Lumi)’ 들도 함께 개발하고 있다. 모든 제품은 로봇 자동화 기술에 AI 기반 인터페이스를 접목해 사용자 경험을 높이는 데 집중하고 있다. 특히, 실제 무인 매장에 바리스브루를 배치해 기술 개발과 동시에 실증을 병행하고 있다.

 

배송 로봇 ‘스토리지(Storage)’ / 사진. 엑스와이지

 

AI 기술·디지털 트윈 기반 로봇 지능화 고도화
엑스와이지는 현재 바리스브루와 같은 로봇에 적용 중이며 개발 중인 AI를 비전, 음성, 조작, 의사결정의 네 가지 축을 중심으로 지능화하고 있다.


‘비전엑스(VisionX)’는 로봇 주변의 물체나 사람의 위치를 인식해 충돌을 방지하고, 효율적인 작업 동선을 구현하는 역할을 한다. ‘보이스엑스(VoiceX)’는 안내 멘트 기능에서 시작해 궁극적으로는 자연어 기반의 대화형 주문 기능까지 확장되며, 키오스크 사용에 어려움을 겪는 고령층 사용자의 불편을 해소할 수 있을 것으로 기대된다.

 

‘보이스엑스(VoiceX)’ / 사진. 엑스와이지


‘그리퍼엑스(GripperX)’는 로봇 팔 끝단에 카메라를 부착해 정밀 조작을 가능하게 하며, 컵 위치에 따라 유연하게 대응하거나 텀블러에 직접 음료를 제조할 수 있도록 한다. 마지막으로 ‘브레인엑스(BrainX)’는 AI 연산 전용 컴퓨터를 별도로 탑재해 음료 제조 흐름과 고객 응대를 총괄하고, 상황에 맞는 타이밍과 행동을 결정하는 의사결정 AI의 역할을 수행한다.


현재는 한국과학기술정보연구원(KIST), 성균관대학교, 디퍼아이(Deeper-I)와 함께 ‘버티컬 AI 기반 제로터치 로봇 서비스’ 실증 프로젝트를 수행 중이다. 이 프로젝트는 중소벤처기업부 R&D 과제로 선정된 사업으로, 로봇이 단순 반복 작업을 넘어서 고객의 다양한 요청에 지능적으로 응답할 수 있도록 만드는 것이 핵심이다. 예를 들어, 고객이 음료를 주문한 뒤 ‘얼음을 더 넣어 달라’는 요청을 하면 로봇이 이를 인식하고 추가 동작을 수행할 수 있도록 하는 기능이다.


이 과제는 로봇 내 온디바이스 AI 기술과도 연계된다. 기존 로봇이 외부 서버를 기반으로 동작하는 데 비해, 본 과제에서는 국산 NPU(Neural Processing Units) 기반 AI 모듈을 로봇 내부에 탑재해 네트워크 연결이 불안정한 상황에서도 안정적이며 실시간성의 서비스를 제공할 수 있도록 한다. 엑스와이지는 프로젝트의 총괄 기관으로 1세부를 담당하고 있다고 밝혔다.

 

유니티(Unity) 엔진 기반 ‘트윈엑스(TwinX)’ / 사진. 엑스와이지


이와 함께 엑스와이지는 로봇과 실제 환경을 연결하는 디지털 트윈 기술에도 적극적이다. 유니티(Unity) 엔진을 기반으로 개발 중인 ‘트윈엑스(TwinX)’는 단순한 모니터링 기능을 넘어, 실제 공간과 동일한 가상환경을 구현해 로봇의 동작을 실시간으로 감시하고 시뮬레이션하는 플랫폼이다. 이를 통해 음료 제조 과정을 가상 공간에서 그대로 재현하고, 로봇의 이상 동작이나 긴급 상황을 원격으로 처리할 수 있다. 향후에는 화면을 통해 커피가 쏟아진 상황을 인식하고, 이에 대한 반응과 해결까지 수행하는 수준으로 기능을 확장할 계획이다.


조인성 연구소장은 “디지털 트윈은 단순한 모사에 그치지 않고, 모니터링부터 시뮬레이션, 원격 조작, 그리고 자율화로 이어지는 다단계 발전 구조를 갖는다”라며 “관제 수준을 넘어 향후 시뮬레이션 기반 의사결정과 자율 동작까지 가능하도록 시스템을 고도화할 계획”이라고 설명했다.

 

AI와 현실 세계의 연결
다양한 디지털 기반 기술들과 함께 엑스와이지는 로봇의 물리적 행동과 자율 판단을 융합한 피지컬 AI 개념에도 초점을 맞추고 있다. 기존 룰 기반 로봇이 정해진 시나리오 내에서만 움직였던 것과 달리, 피지컬 AI는 실제 상황을 인식하고 판단하며 동작할 수 있는 능력을 갖춘 로봇을 의미한다고 조인성 연구소장은 말했다. 이러한 피지컬 AI는 엑스와이지에서 향후 개발 중인 상반신 휴머노이드 로봇을 시작으로, 모바일 휴머노이드 로봇의 형태로 확장될 전망이다.


조인성 연구소장은 “피지컬 AI는 대규모 언어 모델(Large Language Model, 이하 LLM)을 단순히 음성 응답 도구로 쓰는 것을 넘어, 실제 물리적 행동으로 이어지게 만드는 핵심 기술”이라며 “동일한 응답을 반복하거나 현실 세계의 맥락을 이해하지 못하는 LLM의 한계를 넘기 위해서는 여기에 축적한 비전 데이터와 행동 피드백을 결합해야 진정한 의미의 피지컬 AI를 실현할 수 있다. 이를 위해 동사는 소프트웨어를 중심으로 피지컬 AI를 개발할 것”라고 강조했다.

 

정서적 인터랙션 기반 공존형 AI 개발
AI의 기술 진화는 단순 기능 중심에서 인간과의 상호작용을 기반으로 한 ‘정서적 공감’으로도 이어진다. 엑스와이지는 현재 정서적 인터랙션이 가능한 로봇 파운데이션 모델을 개발 중이다. 이를 바탕으로 실제 사람과 함께 있는 공간에서 음성, 표정, 행동 등 다양한 데이터를 수집해 로봇이 상황에 맞는 반응을 학습하도록 하고 있다. 이는 시뮬레이션으로는 대체할 수 없는 영역으로, 실제 사용자 반응을 기반으로 학습된 AI만이 공존형 로봇으로 진화할 수 있다는 엑스와이지의 기조가 담겨 있다.

 

‘바리스브루(Barisbrew)’ / 사진. 로봇기술


조인성 연구소장은 “사람의 반응을 시뮬레이션할 수 없기 때문에, 실제 사람과 상호작용하는 로봇 환경을 통해 데이터를 수집해야 한다”라며 “엑스와이지가 실증 중인 바리스브루를 활용한 카페 로봇 솔루션이 이에 해당되며, 이러한 기술 개발 과정을 로봇에 철학을 가르치는 행위라고 생각하고 있다. 궁극적으로 로봇과 사람이 공존하는 것이 목표”라고 말했다.


엑스와이지는 향후 카페 이외에도 의료 분야, 사무공간, 가정 등 다양한 공간에 AI 로봇 서비스를 확장할 계획이다. 이는 단순히 기술을 넘어서, 서비스 산업 전반의 자동화와 인간·로봇 협업의 실질적 모델을 제시할 수 있는 전환점이 될 것으로 기대된다.