의료 데이터 분석, 몇 주가 며칠로 단축된다
- AWS SageMaker Data Agent: 자연어로 의료 데이터 분석하는 AI 에이전트
- 코호트 비교, 생존 분석까지 코드 없이 수행 가능
- 2025년 11월 출시, SageMaker Unified Studio에서 무료 사용
무슨 일이 일어났나?
AWS가 의료 데이터 분석을 위한 AI 에이전트 SageMaker Data Agent를 공개했다. 역학자나 임상 연구자가 자연어로 질문하면, AI가 알아서 SQL과 Python 코드를 생성하고 실행한다.[AWS]
기존에는 의료 데이터 분석을 위해 여러 시스템을 돌아다니며 데이터 접근 권한을 기다리고, 스키마를 이해하고, 코드를 직접 작성해야 했다. 이 과정이 몇 주씩 걸렸다. SageMaker Data Agent는 이걸 며칠, 심지어 몇 시간으로 단축한다.[AWS]
왜 중요한가?
솔직히, 의료 데이터 분석은 항상 병목이었다. 역학자들이 데이터 준비에 80% 시간을 쓰고 실제 분석은 20%만 하는 구조였다. 분기당 2~3개 연구밖에 못 하는 게 현실이었다.
SageMaker Data Agent는 이 비율을 뒤집는다. 데이터 준비 시간을 대폭 줄여서 실제 임상 분석에 집중할 수 있게 해준다. 개인적으로는 이게 환자 치료 패턴 발견 속도에 직접적인 영향을 미칠 거라고 본다.
특히 코호트 비교와 Kaplan-Meier 생존 분석 같은 복잡한 작업을 자연어로 요청할 수 있다는 게 인상적이다. “남성 바이러스성 부비동염 환자 vs 여성 환자 생존 분석해줘”라고 말하면 AI가 알아서 계획을 세우고 코드를 작성하고 실행한다.[AWS]
어떻게 동작하나?
SageMaker Data Agent는 두 가지 모드로 동작한다. 첫째, 노트북 셀에서 직접 인라인 프롬프트로 코드를 생성할 수 있다. 둘째, Data Agent 패널에서 복잡한 분석 작업을 구조화된 단계로 분해해 처리한다.[AWS]
에이전트는 현재 노트북 상태를 파악하고, 데이터 카탈로그와 비즈니스 메타데이터를 이해해서 맥락에 맞는 코드를 생성한다. 단순히 코드 조각을 뱉어내는 게 아니라 전체 분석 계획을 세운다.[AWS]
앞으로 어떻게 될까?
Deloitte 조사에 따르면 의료 경영진 92%가 생성형 AI에 투자하거나 실험 중이다.[AWS] 의료 AI 분석 도구 수요는 계속 늘어날 것이다.
SageMaker Data Agent 같은 에이전트형 AI가 의료 연구 속도를 높이면, 신약 개발이나 치료 패턴 발견에도 긍정적 영향을 줄 수 있다. 근데 한 가지 우려되는 건 데이터 품질이다. AI가 아무리 빨라도 입력 데이터가 엉망이면 결과도 엉망이니까.
자주 묻는 질문 (FAQ)
Q: SageMaker Data Agent 비용은?
A: SageMaker Unified Studio 자체는 무료다. 다만 실제 컴퓨팅 리소스(EMR, Athena, Redshift 등)는 사용한 만큼 과금된다. 노트북은 처음 2개월간 250시간 무료 티어가 있어서 가볍게 테스트해볼 수 있다.
Q: 어떤 데이터 소스를 지원하나?
A: AWS Glue Data Catalog, Amazon S3, Amazon Redshift, 그리고 다양한 데이터 소스에 연결된다. 기존 AWS 데이터 인프라가 있다면 바로 연동할 수 있다. 의료 데이터 표준인 FHIR이나 OMOP CDM과도 호환된다.
Q: 어떤 리전에서 사용 가능한가?
A: SageMaker Unified Studio가 지원되는 모든 AWS 리전에서 사용할 수 있다. 서울 리전 지원 여부는 AWS 공식 문서에서 확인하는 게 좋다.
이 글이 유용했다면 AI Digester를 구독해주세요.
참고 자료
- Agentic AI for healthcare data analysis with Amazon SageMaker Data Agent – AWS (2026-02-03)
- Introducing Amazon SageMaker Data Agent – AWS (2025-11-21)
- Amazon SageMaker Unified Studio – AWS