OpenAI, 약물 발견 AI 'GPT-Rosalind' 공개...신약 개발 단축

gen_ai

17분 읽기

AIB프레스 편집팀

2026.04.22

OpenAI가 생명과학 분야 전담 인공지능(AI) 모델 'GPT-Rosalind'를 공개했다. 신약 개발 초기 단계의 시간 소모적 업무를 자동화해 10~15년이 소요되는 개발 사이클을 획기적으로 단축할 수 있다는 평가를 받고 있다.

OpenAI 생명과학 연구 플러그인

신약 개발의 '병목' 단계 타깃

신약 개발은 역사상 가장 비용이 크고 시간이 오래 걸리는 사업 중 하나다. 미국에서 신약 후보 발견부터 규제 승인까지 걸리는 시간은 평균 10~15년이다. 그런데 실제로는 돌파적 발견의 순간보다 문헌 검토, 화학 설계, 생물학적 데이터 해석 같은 반복적이고 분석 집약적인 업무에 대부분의 시간이 소모된다.

OpenAI의 GPT-Rosalind는 이 '병목 구간'을 직접 공략한다. 신약 발굴 초기 단계에서의 성과가 파이프라인 후반으로 영향을 미쳐 더 나은 표적 선택, 더 강한 생물학적 가설, 더 높은 품질의 실험으로 이어진다는 원리를 기반으로, 이 모델은 초기 단계 업무를 AI로 가속화하도록 설계됐다.

GPT-Rosalind는 복합적인 다단계 워크플로우를 보조하는 도구로 위치하며, 증거 합성, 가설 생성, 실험 계획 등 다단계 연구 작업을 지원하도록 설계됐다. 이 모델이 전문 데이터베이스에 쿼리하고, 최신 과학 문헌을 파싱하고, 계산 도구와 상호작용하며 새로운 실험 경로를 제시할 수 있으며, 이 모든 것이 동일 인터페이스 내에서 가능하다.

벤치마크 성능: 인간 전문가 능가

OpenAI가 공개한 성능 지표는 학계와 업계의 주목을 받았다. GPT-Rosalind는 생물정보학 및 데이터 분석 벤치마크인 BixBench에서 0.751의 통과율을 달성했다. 이는 생물정보학자들이 실제로 수행하는 작업인 DNA 서열 데이터 처리, 통계 분석, 게놈 출력 해석 등을 기반으로 설계된 평가 체계에서의 성과다.

특히 주목할 점은 실제 미발표 생물학적 데이터에 대한 성능이다. Dyno Therapeutics와의 파트너십에서 비공개 RNA 서열을 대상으로 예측 평가를 수행했을 때, 모델의 최상위 10개 제출이 예측 작업에서 인간 전문가의 95 백분위수를 넘었고 서열 생성에서는 84 백분위수에 도달했다. 공개되지 않은 데이터에서 인간 전문가 수준 이상의 성능을 낸 것이다.

LABBench2 벤치마크에서는 기존의 GPT-5.4를 11개 작업 중 6개에서 능가했다. 특히 분자 복제 프로토콜의 시약 설계를 요하는 CloningQA 작업에서 가장 큰 성과를 기록했다.

GPT-Rosalind 모델 성능 비교

50개 과학 도구 통합으로 워크플로우 혁신

OpenAI는 동시에 생명과학 연구 플러그인을 Codex를 통해 무료로 공개했다. 이 플러그인은 과학자들이 50개 이상의 과학 도구 및 데이터 소스와 모델을 연결할 수 있도록 돕는다. 이는 연구자들이 문헌 검색 도구, 데이터베이스, 계산 파이프라인을 일일이 전환하며 소비하던 시간을 크게 줄인다.

연구 시간을 소모하는 작은 비효율들—올바른 데이터셋 찾기, 참고문헌 재확인, 다른 도구를 위한 입력값 형식 변환—이 개선되면 전체 업무 속도가 대폭 향상될 수 있다는 것이 OpenAI의 설계 철학이다. 실제 제약사 연구원들의 관점에서 이런 자잘한 시간 절약이 쌓이면 신약 개발 전체 일정에 큰 영향을 미칠 수 있다.

제한된 접근 정책, 신뢰성 우선

다만 GPT-Rosalind는 신중한 배포 전략을 따른다. 현재 ChatGPT, Codex, OpenAI API를 통해 연구 미리보기로 사용 가능하지만 미국 내 자격 있는 고객의 신뢰 접근 프로그램을 통해서만 접근 가능하다.

접근 신청 조직은 인간의 건강 개선에 기여하는 연구, 정당한 생명과학 연구, 강력한 보안 및 거버넌스 통제를 유지하는 조직이어야 한다. OpenAI는 생물학적 구조를 재설계할 수 있는 모델의 힘을 인식하고, 일반 공개나 광범위한 오픈소스 배포 대신 신뢰할 수 있는 접근 기준을 철저히 적용하고 있다.

도메인 특화 모델의 시대 신호

OpenAI는 미세 조정(fine-tuning)과 강화학습(RLHF)이 언어 모델을 코드 생성이나 명령어 따르기로 특화시킨 것처럼, 이제 유전자 서열, 화학 구조, 실험 프로토콜에 대해 의미있게 추론할 수 있는 모델을 만들기 위해 유사한 전략을 적용하고 있다.

약물 발굴은 역사상 가장 비용이 많이 들고 시간이 걸리는 노력이며, 표적 발견부터 미국의 규제 승인까지 걸리는 시간은 보통 10~15년이라는 현실을 감안할 때, 이런 도메인 특화 접근은 제약 산업에 실질적인 변화를 가져올 수 있다.

암젠, 모더나 등 주요 제약사 채택 개시

OpenAI는 암젠(Amgen), 모더나(Moderna), Allen Institute, Thermo Fisher Scientific 등과 함께 GPT-Rosalind를 신약 발견 가속화 워크플로우에 적용하고 있다. 암젠의 AI·데이터 담당 수석 부사장은 "OpenAI와의 협업이 최첨단 역량과 도구를 새롭고 혁신적인 방식으로 적용할 수 있게 해주며, 환자에게 의약품을 더 빠르게 제공하는 방식을 가속화할 잠재력이 있다"고 밝혔다.

또한 Los Alamos 국립 연구소와 협력해 AI 기반 단백질 및 촉매 설계를 진행 중이다.

GPT-Rosalind 통합 워크플로우

글로벌 경쟁 확대, 생명과학 AI 판 짜이기 시작

이번 발표는 OpenAI의 노보 노디스크(Novo Nordisk) 전략적 제휴(4월 14일 발표)에 이은 공격적인 생명과학 진출의 일환이다. Amazon 생물 발굴(Bio Discovery), NVIDIA, 알파벳(Alphabet/Isomorphic Labs), Anthropic 등이 신약 개발 시간을 단축하려는 경쟁을 펼치는 와중에 OpenAI가 이 기술을 공개했다.

도메인 특화 모델의 경쟁이 본격화되는 신호다. GPT-Rosalind의 성공 여부는 단순한 벤치마크 수치를 넘어, 실제 제약 연구 환경에서 신뢰성 있는 생물학적 추론이 가능한가라는 질문에 달려 있다. 이것이 OpenAI가 신중한 접근 정책을 택한 이유이기도 하다.

AI가 단순 보조 도구에서 신약 발견 파이프라인의 핵심으로 이동하는 순간이 포착되고 있다.

원문 출처

편집 안내 | 이 기사는 AI 기술을 활용하여 글로벌 뉴스 소스를 분석·종합한 후, AIB프레스 편집팀의 검수를 거쳐 발행되었습니다. 정확한 정보 전달을 위해 노력하고 있으며, 원문 출처를 함께 제공합니다.

OpenAI

약물 발견

생명과학 AI

GPT-Rosalind

신약 개발

AIB프레스

OpenAI, 약물 발견 전담 AI 'GPT-Rosalind' 공개...신약 개발 10~15년 단축

신약 개발의 '병목' 단계 타깃

벤치마크 성능: 인간 전문가 능가

50개 과학 도구 통합으로 워크플로우 혁신

제한된 접근 정책, 신뢰성 우선

도메인 특화 모델의 시대 신호

암젠, 모더나 등 주요 제약사 채택 개시

글로벌 경쟁 확대, 생명과학 AI 판 짜이기 시작

원문 출처

관련 기사

오픈AI, ChatGPT 메모리 '몽상학습' Dreaming V3 출시...자동 개인화 강화

엔다바, AI 에이전트 중심으로 개발 프로세스 재설계...11,000명 글로벌 조직 전환

오픈AI, 정치헌금 전면 거부...AI 정책은 '당파 아닌 투명성으로'