앤스로픽, AI 에이전트끼리 거래하는 마켓플레이스 실험...`품질 격차` 드러나
앤스로픽이 AI 에이전트끼리 거래하는 'Project Deal' 마켓플레이스 실험을 진행해 186건 거래(572만원 규모)를 성공시켰다. 더 고도화된 모델을 사용한 사용자가 더 나은 거래 결과를 얻었지만, 사용자들은 이 차이를 인식하지 못했다. 이는 향후 AI 에이전트 시대에 거래 투명성 규제의 필요성을 제기하는 발견이다.

앤스로픽이 AI 에이전트끼리 구매와 판매를 진행하는 마켓플레이스 실험을 진행했다. 'Project Deal'이라 명명한 이 실험은 AI 에이전트가 실제 거래 능력을 갖추고 있는지, 그리고 인간-AI 상호작용의 취약점이 무엇인지를 검증하기 위해 설계됐다.
실험은 앤스로픽 직원 69명을 대상으로 진행됐다. 각 참가자는 14만3,000원(100달러) 상당의 기프트카드를 받아 동료들로부터 상품을 구매했다. 다만 구매와 판매 과정에서 인간이 직접 거래에 개입하지 않았다. 모두 AI 에이전트가 대신했다. 결과는 놀라웠다. 186건의 거래가 성사됐고, 거래액은 572만원(약 4,000달러) 이상이었다.
모델 품질이 거래 결과를 좌우
앤스로픽은 4개의 서로 다른 마켓플레이스를 운영했다. 하나는 '실제' 마켓플레이스로, 모든 참가자가 가장 고도화된 AI 모델로 대표됐으며 거래가 실제로 이뤄졌다. 나머지 3개는 연구 목적의 테스트 마켓플레이스였다.
분석 결과 더 고도화된 모델로 대표된 사용자들이 객관적으로 더 나은 거래 결과를 얻었다. 그런데 흥미로운 점은 사용자들이 이 차이를 느끼지 못했다는 것이다. 앤스로픽 측은 이를 "'agent quality' 격차(gap)"라고 지칭했다. 즉, 자신을 대표하는 AI 에이전트의 성능이 떨어지더라도 사람들은 그 사실을 인지하지 못할 수 있다는 뜻이다.
에이전트 품질 격차의 위험성
이 발견은 향후 AI 에이전트 시대에 중요한 함의를 던진다. 에이전트가 금융거래, 계약 협상, 구매 등 점점 더 중요한 경제 활동을 대신하게 될 경우, 사용자가 불리한 거래를 당하고도 모를 수 있다는 뜻이기 때문이다. 예를 들어, A가 더 고도화된 에이전트를 사용하고 B가 기본 모델을 사용한다면, 대면 거래에서라면 명백한 협상력 차이도 에이전트 차원에서는 눈에 띄지 않을 수 있다는 의미다.
흥미롭게도 에이전트에 미리 주어진 지시사항(instruction)은 판매 확률이나 협상 가격에 별다른 영향을 미치지 않은 것으로 나타났다. 이는 에이전트의 기본 모델 품질이 결과를 결정하는 가장 중요한 요소임을 시사한다.
자율 거래 시대의 투명성 이슈
Project Deal 실험이 갖는 가장 큰 의의는 AI 에이전트의 경제 활동 능력을 입증하면서도 동시에 그 위험성을 노출시켰다는 점이다. 현재는 직원 69명 대상의 작은 실험이지만, 이러한 기술이 상용화되면 거래의 투명성 문제가 불거질 가능성이 높다. 소비자가 사용하는 에이전트의 품질을 파악할 수 있어야 하고, 거래 과정에서 불리한 조건을 수락했을 때 그 이유를 설명받을 수 있어야 한다는 뜻이다.
업계 전문가들은 AI 에이전트가 자율적으로 거래하는 미래에서는 현재 소비자 보호 규제만으로는 부족할 수 있다고 지적한다. 에이전트 간 거래에서 비대칭 정보(information asymmetry)를 어떻게 규제할 것인가, 그리고 사용자에게 에이전트 품질 공시를 의무화할 필요가 있는가 하는 문제들이 핵심이다.
앤스로픽은 이 실험을 통해 AI 에이전트의 실질적 자율성을 입증했다. 하지만 동시에 인간이 알지 못하는 차이 속에서 이익을 잃을 수 있다는 새로운 리스크도 함께 드러냈다.
원문 출처
편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.


