앤트로픽 Opus 4.7 공개...코딩 3배 향상, 개발자용 정밀 도구로 진화

앤트로픽(Anthropic)이 16일(현지시각) 차세대 대규모언어모델(LLM) '클로드 오퍼스 4.7(Claude Opus 4.7)'을 정식 공개했다. 소프트웨어 엔지니어링 성능을 전작 대비 최대 3배 향상시킨 것이 핵심이며, 가격은 오퍼스 4.6과 동일하게 유지했다. 개발자와 기업 고객을 정조준한 업그레이드라는 평가가 나온다.

앤트로픽은 블로그에서 "오퍼스 4.7은 복잡하고 장시간 진행되는 작업을 정밀함과 일관성을 갖고 처리하며, 지시사항에 세심히 주의를 기울이고, 보고하기 전에 스스로 결과물을 검증하는 방법을 고안할 수 있다"고 밝혔다. Claude 제품군 전반, API, 아마존 베드락(Amazon Bedrock), 구글 클라우드 버텍스 AI(Vertex AI), 마이크로소프트 파운드리(Microsoft Foundry)에서 동시 이용 가능하다.

소프트웨어 엔지니어링 '3배' 향상의 의미

오퍼스 4.7의 가장 큰 변화는 코딩 성능이다. 라쿠텐 SWE-Bench(Rakuten-SWE-Bench) 기준으로 오퍼스 4.6 대비 실제 프로덕션 태스크를 3배 더 해결했고, 93개 태스크로 구성된 내부 코딩 벤치마크에서는 13% 향상됐다. 개발자 에이전트 평가인 커서벤치(CursorBench)에서는 70점을 기록해 전작의 58점을 크게 뛰어넘었다.

특히 XBOW가 진행한 '시각적 정확도(visual-acuity)' 벤치마크에서는 98.5%를 기록해 오퍼스 4.6의 54.5%를 거의 두 배로 끌어올렸다. 앤트로픽은 "사용자들이 가장 어려운 코딩 작업을 오퍼스 4.7에 자신 있게 맡길 수 있다"고 자평했다.

금융·분석 분야에서도 개선이 두드러진다. GDPval-AA 평가에서 업계 최고 점수를 기록했고, 일반 금융 모듈(General Finance)에서는 0.813점으로 전작 0.767점을 앞섰다. 데이터브릭스(Databricks)의 OfficeQA Pro 문서 추론 테스트에서는 오류율을 21% 줄였다.

비전 해상도 3배, 새 토크나이저 도입

멀티모달 역량도 대폭 강화됐다. 긴 축 기준 최대 2,576 픽셀(약 3.75 메가픽셀) 이미지를 직접 처리할 수 있는데, 기존 클로드 모델 대비 3배 이상 높아진 해상도다. 화학 구조식이나 기술 다이어그램 같은 전문 문서의 세부까지 파악 가능해졌다는 설명이다.

토크나이저도 업데이트됐다. 콘텐츠 유형에 따라 동일한 입력이 1.0~1.35배 더 많은 토큰으로 매핑되는데, 정밀한 처리를 위한 구조적 변경이다. 다만 기존 모델용으로 작성된 프롬프트는 더 엄격한 지시사항 해석으로 예상치 못한 결과를 낼 수 있다고 앤트로픽은 안내했다.

'xhigh' 모드와 엔터프라이즈 개발자 공략

오퍼스 4.7 공개와 함께 '노력 레벨(effort level)' 체계도 확장됐다. 기존 high와 max 사이에 xhigh라는 새 단계가 추가됐고, 클로드 코드(Claude Code)의 기본 노력 레벨이 전체 요금제에서 xhigh로 상향됐다. 더 정밀한 결과가 필요한 코딩 작업을 위한 조치다.

클로드 코드에는 또 /ultrareview라는 새 명령어가 도입됐다. 버그 탐지 전용 코드 리뷰 세션으로, 프로(Pro)와 맥스(Max) 요금제 사용자에게는 월 3회 무료 제공된다. API 사용자를 위한 '태스크 예산(task budgets)' 기능도 퍼블릭 베타로 열렸다. 토큰 소비 상한선을 설정해 비용을 관리하는 기능이다.

오퍼스 4.7 가격은 입력 토큰 100만 개당 5달러(약 7,150원), 출력 토큰 100만 개당 25달러(약 3만5,750원)로 오퍼스 4.6과 동일하다. 성능은 올리면서 가격 인상은 피한 전략이다.

'미토스'와의 이원화 전략

이번 공개에서 주목할 또 하나의 포인트는 앤트로픽의 안전 전략이다. 오퍼스 4.7의 사이버 보안 능력은 고위험 모델 '미토스(Mythos Preview)'보다 의도적으로 낮게 설정됐다. 앤트로픽은 훈련 과정에서 사이버 능력을 차별적으로 줄이는 실험을 진행했으며, 금지된 고위험 사이버 보안 요청을 자동 탐지·차단하는 보호 장치도 탑재했다고 밝혔다.

이는 극단적 능력은 검증된 기관에만 미토스로 제공하고, 대중용 최상위 모델은 통제된 범위 안에서 운영하는 이원화 전략이다. 정직성과 프롬프트 인젝션 공격 저항력은 4.6 대비 향상됐고, 기만이나 아첨성 응답 비율도 줄었다고 앤트로픽은 설명했다.

남은 질문

오퍼스 4.7 출시는 앤트로픽이 AI 모델 경쟁에서 '개발자 생산성'이라는 축으로 차별화를 노리고 있음을 보여준다. 3배 늘어난 태스크 해결 능력은 단순 벤치마크 개선을 넘어, 실제 엔지니어링 팀이 AI에 위임할 수 있는 업무 범위가 질적으로 확장됐음을 의미한다.

다만 오픈AI의 GPT-5 계열과 구글 제미나이(Gemini) 진영이 같은 시기 반격을 준비하고 있는 상황에서, 오퍼스 4.7의 우위가 얼마나 지속될지는 미지수다. 또한 토크나이저 변경으로 기존 프롬프트 호환성이 일부 깨지는 점은 대규모 프로덕션 환경을 운영하는 기업에게 마이그레이션 부담으로 작용할 전망이다.

원문 출처

편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.

Claude Code

대규모언어모델

Claude Opus 4.7

소프트웨어 엔지니어링

Amazon Bedrock

Anthropic

AI 코딩

AIB프레스

앤트로픽 Opus 4.7 공개...코딩 3배 향상, 개발자용 정밀 도구로 진화

앤트로픽 Opus 4.7 공개...코딩 3배 향상, 개발자용 정밀 도구로 진화

소프트웨어 엔지니어링 '3배' 향상의 의미

비전 해상도 3배, 새 토크나이저 도입

'xhigh' 모드와 엔터프라이즈 개발자 공략

'미토스'와의 이원화 전략

남은 질문

원문 출처

관련 기사

오픈AI, 정치헌금 전면 거부...AI 정책은 '당파 아닌 투명성으로'

엔다바, 'AI 에이전트 조직' 선포...시니어 판단을 코드화하다

OpenAI, AI 안전 평가 표준화 가이드 공개...하네스 역할 강조