미라 무라티 Thinking Machines, 말하면서 동시에 듣는 AI 모델 공개
전 오픈AI CTO 미라 무라티의 스타트업 Thinking Machines Lab이 사용자와 AI가 동시에 말하고 들을 수 있는 '상호작용 모델'을 공개했다. TML-Interaction-Small 모델은 0.40초 응답 속도로 인간 대화에 가깝고, 기존 순차적 구조에서 벗어난 양방향 상호작용을 구현했다. 현재 연구 미리보기 단계로, 올해 말 정식 출시 예정이다.

전 오픈AI 최고기술책임자(CTO) 미라 무라티가 지난해 설립한 AI 스타트업 Thinking Machines Lab이 상호작용형 AI 모델을 선보였다. 음성 기반의 양방향 통신(full duplex) 기술을 적용해, 사용자와 AI가 동시에 말하고 들을 수 있도록 설계한 것이 특징이다.
Thinking Machines는 11일(현지시간) 블로그를 통해 '상호작용 모델(Interaction Models)'이라 이름 붙인 이 기술을 공개했다. 핵심은 기존 AI 대화 방식의 재설계다. 현재 시중의 모든 AI 모델은 '당신이 말하면, AI가 듣고, 응답하면, 당신이 듣는' 순차적 구조로 작동한다. 메시지를 주고받는 채팅처럼 한 번에 한 쪽 방향만 정보가 흐른다.
반면 Thinking Machines의 모델 'TML-Interaction-Small'은 사용자 입력을 처리하는 동시에 응답을 생성한다. 회사 표현으로는 '전화 통화에 더 가깝다'는 의미다. 이 모델은 0.40초에 응답하는 속도를 구현했으며, 이는 인간 대화의 평균 응답 속도에 가깝다. 오픈AI와 구글의 유사 모델들과 비교해도 빠른 것으로 알려진다.
다만 현재 단계는 '연구 미리보기'일 뿐, 일반 사용자에게는 아직 공개되지 않았다. Thinking Machines는 향후 몇 달 내에 '제한된 연구 미리보기'를 출시하고, 올해 말 경에 더 넓은 범위의 공개를 계획 중이다.
설계 철학의 전환
이 접근법의 핵심은 '상호작용성'이 사후 추가 기능이 아닌, 모델 설계의 기본 원칙이어야 한다는 철학이다. 기존 대형 언어모델(LLM)들은 별도의 음성 처리 레이어를 덧붙여서 음성 대화를 지원했다. 반면 TML-Interaction-Small은 처음부터 양방향 소통을 전제로 설계됐다.
벤치마크 수치는 인상적이다. 하지만 실제 사용 경험이 기술적 수치에 부응하는지는 아직 미지수다. 연구 미리보기 단계이므로, 실제 사용자들이 이 기술을 평가해야만 진정한 성과를 판단할 수 있다. 음성의 자연성, 맥락 유지, 환경 적응력 등 실무적 과제들이 남아있다.
업계 경쟁 구도의 변화
무라티는 2021년부터 오픈AI에서 핵심 기술 개발을 주도했던 인물이다. 오픈AI를 떠나 독립 창업을 택한 것 자체가 업계의 관심사였는데, 첫 주력 기술이 '대화의 실시간성'에 집중된다는 점이 주목할 만하다.
현재 AI 산업은 모델의 성능과 규모 경쟁에 집중하고 있다. 반면 Thinking Machines는 '인간답게 상호작용하는가'라는 다른 차원을 제시한다. 음성 기반 AI 어시스턴트의 경험 자체를 개선하는 기술이라는 뜻이다.
오픈AI의 GPT-4o와 구글의 제미나이, 메타의 음성 모델들도 이미 실시간 음성 상호작용을 지원하고 있다. 업계의 경쟁은 '누가 더 자연스럽고 빠른 대화 경험을 만드는가'로 진행될 것으로 보인다.
시장 평가의 관건
Thinking Machines의 성공 여부는 기술 벤치마크뿐 아니라 사용자 경험에 달려있다. 연구팀의 기술력은 증명됐지만, 음성의 자연성, 맥락 이해도, 환경 적응력 등 실제 운영 환경에서의 성능이 중요하다.
첫 연구 미리보기 반응이 업계의 평가를 결정할 것으로 예상된다. 무라티와 그의 팀이 대화형 AI 기술을 실제 제품으로 얼마나 구체화할 수 있을지가 관전 포인트다.
편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.


