医疗数据分析,几周缩短至几天
- AWS SageMaker Data Agent:使用自然语言分析医疗数据的 AI 代理
- 无需代码即可执行队列比较和生存分析
- 2025 年 11 月发布,可在 SageMaker Unified Studio 中免费使用
发生了什么?
AWS 发布了用于医疗数据分析的 AI 代理 SageMaker Data Agent。流行病学家或临床研究人员可以用自然语言提问,AI 会自动生成并执行 SQL 和 Python 代码。[AWS]
过去,为了进行医疗数据分析,需要访问多个系统,等待数据访问权限,理解模式,并直接编写代码。这个过程需要几周时间。SageMaker Data Agent 将其缩短到几天,甚至几个小时。[AWS]
为什么重要?
坦率地说,医疗数据分析一直是一个瓶颈。流行病学家花费 80% 的时间准备数据,而实际分析只占 20%。现实情况是,每个季度只能进行 2-3 项研究。
SageMaker Data Agent 颠倒了这个比例。它大大减少了数据准备时间,使您可以专注于实际的临床分析。我个人认为,这将直接影响患者治疗模式的发现速度。
特别是,能够用自然语言请求诸如队列比较和 Kaplan-Meier 生存分析之类的复杂任务令人印象深刻。 如果您说“对男性病毒性鼻窦炎患者与女性患者进行生存分析”,AI 会自动制定计划、编写和执行代码。[AWS]
如何运作?
SageMaker Data Agent 以两种模式运行。 首先,您可以直接在笔记本单元格中使用内联提示来生成代码。 其次,Data Agent 面板将复杂的分析任务分解为结构化步骤进行处理。[AWS]
该代理了解当前的笔记本状态,并理解数据目录和业务元数据,以生成上下文相关的代码。它不是简单地吐出代码片段,而是制定完整的分析计划。[AWS]
未来会怎样?
德勤的一项调查显示,92% 的医疗管理人员正在投资或试验生成式 AI。[AWS] 对医疗 AI 分析工具的需求将继续增长。
如果像 SageMaker Data Agent 这样的代理型 AI 提高了医疗研究的速度,它也可能对新药开发或治疗模式的发现产生积极影响。 但一个令人担忧的问题是数据质量。 无论 AI 多么快,如果输入数据混乱,结果也会混乱。
常见问题 (FAQ)
问:SageMaker Data Agent 的费用是多少?
答:SageMaker Unified Studio 本身是免费的。 但是,实际的计算资源(EMR、Athena、Redshift 等)会按使用量收费。 笔记本电脑在前 2 个月有 250 小时的免费套餐,因此您可以轻松地进行测试。
问:支持哪些数据源?
答:连接到 AWS Glue Data Catalog、Amazon S3、Amazon Redshift 和各种数据源。 如果您有现有的 AWS 数据基础设施,您可以立即连接。 它还与医疗数据标准 FHIR 或 OMOP CDM 兼容。
问:哪些区域可用?
答:SageMaker Unified Studio 支持的所有 AWS 区域均可使用。 最好在 AWS 官方文档中查看是否支持首尔区域。
如果这篇文章对您有帮助,请订阅 AI Digester。
参考资料
- Agentic AI for healthcare data analysis with Amazon SageMaker Data Agent – AWS (2026-02-03)
- Introducing Amazon SageMaker Data Agent – AWS (2025-11-21)
- Amazon SageMaker Unified Studio – AWS