医疗数据分析,从数周缩短到数天
- AWS SageMaker Data Agent: 使用自然语言分析医疗数据的AI代理
- 无需编写代码即可执行队列比较和生存分析
- 2025年11月发布,可在SageMaker Unified Studio中免费使用
发生了什么?
AWS发布了SageMaker Data Agent,一款用于医疗数据分析的AI代理。当流行病学家或临床研究人员用自然语言提问时,AI会自动生成并执行SQL和Python代码。[AWS]
以前,进行医疗数据分析需要访问多个系统来获取数据。需要等待权限、理解数据架构、手动编写代码。这个过程需要数周时间。SageMaker Data Agent将其缩短到数天或数小时。
为什么重要?
坦率地说,医疗数据分析一直是瓶颈。流行病学家将80%的时间花在数据准备上,实际分析只用了20%。现实是每季度只能进行2-3项研究。
SageMaker Data Agent颠覆了这一比例。通过大幅减少数据准备时间,研究人员可以专注于实际的临床分析。我认为这将直接影响发现患者治疗模式的速度。
特别令人印象深刻的是,队列比较和Kaplan-Meier生存分析等复杂任务可以用自然语言请求。只需说”分析男性病毒性鼻窦炎患者与女性患者的生存率”,AI就会自动制定计划、编写代码并执行。[AWS]
如何运作?
SageMaker Data Agent有两种运行模式。首先,可以在笔记本单元格中使用内联提示直接生成代码。其次,Data Agent面板将复杂的分析任务分解为结构化步骤并进行处理。[AWS]
Agent了解当前笔记本状态、数据目录和业务元数据,并生成符合上下文的代码。它不是生成代码片段,而是制定完整的分析计划。[AWS]
未来展望
根据Deloitte的调查,92%的医疗高管正在投资或尝试生成式AI。[AWS] 对医疗AI分析工具的需求将持续增长。
像SageMaker Data Agent这样的代理型AI如果能加快医疗研究速度,可能会对新药开发和治疗模式发现产生积极影响。然而,令人担忧的一点是数据质量。AI再快,如果输入数据是垃圾,结果也会是垃圾。
常见问题 (FAQ)
Q: SageMaker Data Agent的费用是多少?
A: SageMaker Unified Studio本身是免费的。但是,实际的计算资源(EMR、Athena、Redshift等)会根据使用量收费。笔记本在前两个月有250小时的免费额度,可以轻松测试。
Q: 支持哪些数据源?
A: 可连接AWS Glue Data Catalog、Amazon S3、Amazon Redshift及各种数据源。如果有现有的AWS数据基础设施,可以立即连接。此外,它与医疗数据标准FHIR和OMOP CDM兼容。
Q: 在哪些区域可用?
A: 在所有支持SageMaker Unified Studio的AWS区域都可使用。关于是否支持中国区域,建议查看AWS官方文档。
如果这篇文章对你有帮助,请订阅AI Digester。
参考资料
- Agentic AI for healthcare data analysis with Amazon SageMaker Data Agent – AWS (2026-02-03)
- Introducing Amazon SageMaker Data Agent – AWS (2025-11-21)
- Amazon SageMaker Unified Studio – AWS