오픈AI, GPT-5.5로 ChatGPT 의료 능력 의사 수준으로 강화

gen_ai

9분 읽기

AIB프레스 편집팀

2026.06.20

오픈AI가 새로운 모델 GPT-5.5 Instant로 ChatGPT의 의료 상담 능력을 대폭 강화했다. 긴급 상황 인식, 불확실성 표현, 복합 의료 정보 이해에서 기존 모델을 크게 앞질렀으며, 특히 오픈AI의 최고 사양 'Thinking' 모델과 동등한 수준의 성능을 보였다.

오픈AI는 18일 공식 블로그에서 이 같은 성과를 발표했다. ChatGPT는 현재 주간 2억 3,000만 명 이상이 건강 및 웰니스 관련 질문을 위해 이용하고 있으며, 의료 정보 이해, 검사 결과 해석, 보험 가입 안내, 건강한 습관 구축 등에 활용되고 있다.

의사와 협력한 다층 평가 체계 구축

개선의 핵심은 국제 의료 전문가 네트워크의 체계적 평가에 있다. 오픈AI는 60개국, 49개 언어권에서 활동하는 260명 이상의 의사와 협력해 ChatGPT의 의료 응답을 측정·개선하고 있다. 의료 특화 분야는 26개 분야를 아우른다.

이들 의사는 모델 응답의 정확성, 명확성, 완전성, 적절한 주의 수준, 실용성을 평가한다. 응급 상황이나 추가 정보 필요 여부를 놓치는 경우, 과신 표현, 다음 조치 불명확 등 부작용을 식별한다. 현재까지 의료 현장 사용 패턴을 반영한 70만 건 이상의 모델 응답을 검토했으며, 몇 분마다 새로운 응답을 평가하고 있다. 이러한 피드백은 HealthBench Professional 같은 평가 지표와 평가 기준으로 번환되어 모델 개선에 활용된다.

정량적 성과: 오류율 71% 감소

성능 개선을 정량화하면 매우 구체적이다.

첫째, 'HealthBench Professional' 등 의료 특화 평가지표에서 GPT-5.5 Instant는 GPT-5.3 Instant 대비 현격히 향상됐으며, 오픈AI의 최고급 'Thinking' 모델과 동등한 수준에 도달했다.

둘째, 별도의 의사 패널 평가에서 GPT-5.5 Instant 응답이 의사가 직접 작성한 응답(무제한 시간, 인터넷 접근 가능)보다 높은 점수를 받았다. 3,500건의 검토 응답을 대상으로 정확성, 의사소통, 완전성, 지시 준수, 의료 의사결정 지원도를 기준으로 평가했을 때 GPT-5.5 Instant가 우수했다.

셋째, 실제 운영 환경 모니터링도 개선을 입증한다. 오픈AI는 의료 응답에 대한 프라이버시 보호 모니터를 운영하고 있으며, 주간 수십억 건의 메시지를 분석한 결과 팩트 오류가 최근 2개월간 71% 감소했다.

의료 전문성 뒤에 숨은 구조적 노력

이 개선은 단순한 모델 성능 향상을 넘어선다. 오픈AI는 의료 응답의 정의, 측정, 개선에 의사들을 직접 참여시키는 구조를 만들었다. 의사들의 루브릭(평가 기준)이 AI 학습의 근거가 되고, 실시간으로 모델의 약점을 식별한다. 이는 의료처럼 오류가 직접적 해에 연결되는 분야에서 매우 중요한 접근이다.

특히 GPT-5.5 Instant는 다음 능력에서 기존 모델과 의사 응답 대비 월등했다:

지역 의료 시스템에 맞춘 조정 부족 경우 감소
위험 신호 및 병원 의뢰 누락 감소
환자에게 추가 정보 요청 필요성 인식 개선

헬스케어 생태계 확대로 이어져

이번 기술 개선은 임상의 대상 도구 'ChatGPT for Clinicians'와 'OpenAI for Healthcare'로도 확대되고 있다. 이들은 의료 전문가의 문서화, 연구, 진료 전달 업무를 지원한다.

오픈AI는 "AGI가 가져올 가장 개인적이고 구체적인 영향 중 하나가 인간 건강 개선"이라며 "모델이 개선될수록 더 많은 사람에게 더 정확하고 유용한 ChatGPT를 제공할 것"이라고 밝혔다.

원문 출처

https://openai.com/index/improving-health-intelligence-in-chatgpt

편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.

ChatGPT

GPT-5.5

의료 AI

헬스케어

의료 지능

AIB프레스

오픈AI, GPT-5.5로 ChatGPT 의료 지능 대폭 강화…의사 평가 동점

의사와 협력한 다층 평가 체계 구축

정량적 성과: 오류율 71% 감소

의료 전문성 뒤에 숨은 구조적 노력

헬스케어 생태계 확대로 이어져

원문 출처

AI·테크 핵심 뉴스, 매주 한 통으로

관련 기사

OpenAI o3가 희귀 소아 유전질환 진단 돕다...기존 분석 놓친 사례 4.8% 발견

OpenAI, ChatGPT Enterprise 지출 통제 강화…기업 AI 비용 추적·관리 한 눈에

앤트로픽의 클로드 페이블 5, 백악관과의 규제 분쟁 심화