深海时刻一周年:Qwen 衍生模型 11.3 万个,Llama 四倍

深搜时刻 1年,数字证明的3种变化

  • Qwen 衍生模型突破 11.3 万个 — Meta Llama(2.7 万个)的 4 倍
  • Hugging Face 最多关注者第 1 名 DeepSeek,第 4 名 Qwen
  • 中国 AI 组织们,“开源即战略”方向转变

发生了什么事?

Hugging Face 发布了 ‘深搜时刻’ 1 周年分析报告。[Hugging Face] 这是整理了 2025 年 1 月 DeepSeek 登场后中国开源 AI 生态系统如何发展的数据的三部曲系列的最后一篇。

从核心数据开始看。以 Qwen(阿里巴巴)为基础制作的衍生模型截至 2025 年年中超过了 11 万 3 千个。如果加上标记 Qwen 的存储库,则超过 20 万个。[Hugging Face] 与 Meta 的 Llama(2.7 万个)或 DeepSeek(6 千个)相比,这是一个压倒性的数字。

为什么重要?

说实话,一年前很多人还把中国 AI 看作是 ‘山寨’。但现在不同了。

Hugging Face 人气论文上位圈有字节跳动、DeepSeek、腾讯、Qwen 等。关注者数 DeepSeek 排名第 1,Qwen 排名第 4。如果以阿里巴巴整体来看,衍生模型数量与 Google 和 Meta 加起来的差不多。[Hugging Face]

我个人关注的是阿里巴巴的战略。Qwen 不是单一的旗舰模型,而是由 ‘家族’ 构成。支持多种大小、工作、模态。简单来说就是 “把我们的模型当作通用 AI 基础设施来使用”。

今后会怎么样?

Hugging Face 分析说 “开源是中国 AI 组织们的短期支配战略”。解释说,不仅共享模型,还共享论文、发布基础设施,旨在实现大规模整合和发布。

深搜时刻不是一次性事件,这一点在 1 年后通过数字得到了确认。全球 AI 开源生态系统的重心正在转移。

常见问题 (FAQ)

Q: Qwen 衍生模型比 Llama 多的理由是?

A: 阿里巴巴以多种大小和模态公开 Qwen,适用范围扩大。特别是中国开发者 많이 活用한다. 持续更新 Hugging Face 和 ModelScope 两者的战略也奏效了。

Q: DeepSeek 仍然重要吗?

A: 是的。在 Hugging Face 中拥有最多关注者的组织是 DeepSeek。但是,在衍生模型数量上落后于 Qwen。DeepSeek 在论文和研究贡献方面有优势,Qwen 则专注于生态系统扩展,存在差异。

Q: 对韩国开发者有什么意义?

A: 基于 Qwen 的模型正在加强韩语支持。由于是开源的,因此可以自由进行本地发布和微调。成为了一个适合无负担地进行实验的环境。但是,许可条件因模型而异,因此需要确认。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

Fitbit创始人离开谷歌两年后发布家庭健康AI“Luffu”

Fitbit 创始人,Google 离职 2 年后以家庭健康 AI 回归

  • Fitbit 联合创始人 James Park·Eric Friedman,发布新创业公司 Luffu
  • AI 整合管理整个家庭的健康数据,自动检测异常迹象
  • 目标是美国 6300 万家庭护理人口,计划先发布应用程序,然后扩展硬件

发生了什么事?

创建 Fitbit 的 James Park 和 Eric Friedman 在离开 Google 两年后,发布了新的创业公司 Luffu(卢夫)。[PRNewswire]

Luffu 声称是“智能家庭护理系统”。它是一个通过 AI 整合管理整个家庭(而非个人)健康数据的平台。包括孩子、父母、配偶,甚至宠物。[TechCrunch]

目前约有 40 名员工,大部分来自 Google 和 Fitbit。它由自有资金运营,没有接受外部投资。[PRNewswire]

为什么重要?

我个人认为这个发布很有趣,因为如果说 Fitbit 专注于“个人健康”,那么 Luffu 试图创建一个新的类别“家庭健康”。

在美国,负责家庭护理的成年人约有 6300 万。[PRNewswire] 他们忙于同时照顾孩子、事业和年迈的父母。但大多数医疗保健应用程序都是为个人设计的,因此难以进行家庭单位的管理。

Luffu 瞄准的正是这个空白。坦率地说,Apple Health 或 Google Fit 几乎没有家庭共享功能。这个市场还没有人真正抓住。

James Park 说:“在 Fitbit,我们专注于个人健康,但在 Fitbit 之后,对我来说,健康不仅仅是考虑我自己。”[PRNewswire]

如何运作?

Luffu 的核心是 AI 在后台默默工作。无需像聊天机器人一样不断对话。

  • 数据收集:通过语音、文本、照片输入健康信息。也可以与设备或医疗门户网站联动
  • 模式学习:AI 掌握每个家庭成员的日常模式
  • 异常检测:自动提醒漏服药物、生命体征变化、睡眠模式异常等
  • 自然语言问题:AI 回答“爸爸的新饮食对血压有影响吗?”之类的问题

它还强调隐私。它旨在发挥“保护者而非监视者”的作用,用户可以控制与谁共享哪些信息。[PRNewswire]

未来会怎样?

Luffu 计划从应用程序开始,然后扩展到硬件。这与 Fitbit 走过的路相似,但这次他们似乎打算为整个家庭构建一个设备生态系统。

目前正在进行非公开 Beta 测试,您可以在网站 (luffu.com) 上注册候补名单。[PRNewswire]

它由自有资金运营,没有外部投资,这可以理解为他们希望专注于产品,而不受风险投资的压力。这与 Fitbit 时期的方法不同。

常见问题 (FAQ)

问:Luffu 何时发布?

答:目前正在进行有限的公开 Beta 测试。正式发布日期尚未公布。在 luffu.com 上注册候补名单,您可以收到 Beta 测试邀请。应用程序将首先发布,之后将添加专用硬件。

问:它与 Fitbit 联动吗?

答:官方公告仅提到它与设备和医疗门户网站联动。与 Fitbit 的直接联动尚未得到确认。Google 收购了 Fitbit,创始人离开了 Google,因此预计关系会很复杂。

问:价格是多少?

答:定价政策尚未公布。由于它由自有资金运营,因此有可能采用订阅模式或高级功能付费,但我们需要等待官方公告。硬件发布时可能会单独定价。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

Claude Code 大规模故障:开发者被迫“咖啡休息”

Claude Code 故障:3 个核心要点

  • Anthropic 的所有 Claude 模型 API 错误率急剧上升
  • Claude Code 用户因 500 错误而中断工作
  • Microsoft AI 团队也在使用此服务 — 影响整个行业

发生了什么事?

Claude Code 遭遇大规模故障。开发者在连接服务时遇到 500 错误,Anthropic 正式宣布“所有 Claude 模型”的 API 错误率均有所上升。[The Verge]

Anthropic 方面表示,他们正在识别问题并进行修复工作。目前,状态页面显示故障已解决。[Anthropic Status]

为什么重要?

Claude Code 不仅仅是一个 AI 工具。它已成为包括 Microsoft AI 团队在内的众多开发者在日常工作中依赖的关键基础设施。

坦率地说,这种故障并不常见。根据 Anthropic 状态页面,Claude Code 的 90 天正常运行时间为 99.69%。但问题是,不到 1% 的停机时间对开发者的生产力影响很大。

我个人认为,这次事件是对 AI 编码工具依赖性的警告。如果将所有工作流程都放在单一服务上,一旦发生故障,就没有任何替代方案。

最近 Anthropic 服务问题

值得注意的是,这次故障并非一次性的:

  • 昨天(2 月 2 日):Claude Opus 4.5 发生错误
  • 本周初:修复了 AI 信用系统购买问题
  • 1 月 31 日:Claude Code 2.1.27 内存泄漏 — 已通过 2.1.29 修复

在短时间内连续发生多个问题,在服务稳定性方面令人遗憾。

今后会怎样?

Anthropic 正在迅速采取行动,这是一个好兆头。但对于开发者来说,现在是考虑备份计划的时候了。

Claude Code 的替代方案包括 Goose(免费)、pi-mono(开源)等工具。虽然它们不是完全的替代品,但有助于在发生故障时保持最低限度的工作连续性。

常见问题 (FAQ)

Q: Claude Code 故障发生的频率有多高?

A: 根据 Anthropic 官方数据,90 天正常运行时间为 99.69%。像这次这样的大规模故障并不常见,但最近几周发生过多次小规模问题。不能完全忽视。

Q: 发生故障时有什么替代方案?

A: Goose 是一个免费的 AI 编码代理,pi-mono 是一个在 GitHub 上获得 5.9k 星的开源替代方案。两者都不能涵盖 Claude Code 的所有功能,但它们是在紧急情况下继续工作的选项。

Q: Anthropic 会提供补偿吗?

A: 截至目前,Anthropic 尚未宣布针对故障的单独补偿政策。对于付费用户,由于采用基于使用量的计费方式,因此故障期间不会产生费用,这实际上是一种补偿。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

AWS SageMaker Data Agent:将医疗数据分析从数周缩短至数天

医疗数据分析,几周缩短至几天

  • AWS SageMaker Data Agent:使用自然语言分析医疗数据的 AI 代理
  • 无需代码即可执行队列比较和生存分析
  • 2025 年 11 月发布,可在 SageMaker Unified Studio 中免费使用

发生了什么?

AWS 发布了用于医疗数据分析的 AI 代理 SageMaker Data Agent。流行病学家或临床研究人员可以用自然语言提问,AI 会自动生成并执行 SQL 和 Python 代码。[AWS]

过去,为了进行医疗数据分析,需要访问多个系统,等待数据访问权限,理解模式,并直接编写代码。这个过程需要几周时间。SageMaker Data Agent 将其缩短到几天,甚至几个小时。[AWS]

为什么重要?

坦率地说,医疗数据分析一直是一个瓶颈。流行病学家花费 80% 的时间准备数据,而实际分析只占 20%。现实情况是,每个季度只能进行 2-3 项研究。

SageMaker Data Agent 颠倒了这个比例。它大大减少了数据准备时间,使您可以专注于实际的临床分析。我个人认为,这将直接影响患者治疗模式的发现速度。

特别是,能够用自然语言请求诸如队列比较和 Kaplan-Meier 生存分析之类的复杂任务令人印象深刻。 如果您说“对男性病毒性鼻窦炎患者与女性患者进行生存分析”,AI 会自动制定计划、编写和执行代码。[AWS]

如何运作?

SageMaker Data Agent 以两种模式运行。 首先,您可以直接在笔记本单元格中使用内联提示来生成代码。 其次,Data Agent 面板将复杂的分析任务分解为结构化步骤进行处理。[AWS]

该代理了解当前的笔记本状态,并理解数据目录和业务元数据,以生成上下文相关的代码。它不是简单地吐出代码片段,而是制定完整的分析计划。[AWS]

未来会怎样?

德勤的一项调查显示,92% 的医疗管理人员正在投资或试验生成式 AI。[AWS] 对医疗 AI 分析工具的需求将继续增长。

如果像 SageMaker Data Agent 这样的代理型 AI 提高了医疗研究的速度,它也可能对新药开发或治疗模式的发现产生积极影响。 但一个令人担忧的问题是数据质量。 无论 AI 多么快,如果输入数据混乱,结果也会混乱。

常见问题 (FAQ)

问:SageMaker Data Agent 的费用是多少?

答:SageMaker Unified Studio 本身是免费的。 但是,实际的计算资源(EMR、Athena、Redshift 等)会按使用量收费。 笔记本电脑在前 2 个月有 250 小时的免费套餐,因此您可以轻松地进行测试。

问:支持哪些数据源?

答:连接到 AWS Glue Data Catalog、Amazon S3、Amazon Redshift 和各种数据源。 如果您有现有的 AWS 数据基础设施,您可以立即连接。 它还与医疗数据标准 FHIR 或 OMOP CDM 兼容。

问:哪些区域可用?

答:SageMaker Unified Studio 支持的所有 AWS 区域均可使用。 最好在 AWS 官方文档中查看是否支持首尔区域。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

莲花健康AI,免费AI私人医生获3500万美元投资

获得 3500 万美元投资的免费 AI 家庭医生

  • Lotus Health AI 在 A 轮融资中从 CRV·Kleiner Perkins 处获得 3500 万美元投资
  • 提供 50 种语言的 24 小时免费初级保健服务,在美国所有 50 个州运营
  • 每周有 2.3 亿人向 ChatGPT 提出健康问题,AI 医疗市场正式进入竞争

发生了什么?

Lotus Health AI 在由 CRV 和 Kleiner Perkins 共同领投的 A 轮融资中获得了 3500 万美元的投资。[TechCrunch] 这家初创公司利用大型语言模型 (LLM) 提供 50 种语言的 24 小时免费初级保健服务。

创始人 KJ Dhaliwal 曾于 2019 年以 5000 万美元的价格出售了南亚约会应用程序 Dil Mil。[Crunchbase] 他受到童年时期为父母担任医疗翻译的经历的启发,于 2024 年 5 月推出了 Lotus Health AI,旨在解决美国医疗系统的低效率问题。

为什么重要?

坦率地说,这项投资规模引人注目。AI 医疗保健初创公司的平均投资额为 3440 万美元,而 Lotus Health AI 在 A 轮融资中达到了这一水平。[Crunchbase]

了解背景后就明白了。根据 OpenAI 的数据,每周有 2.3 亿人向 ChatGPT 提出与健康相关的问题。[TechCrunch] 这意味着人们已经在向 AI 寻求健康建议。但 ChatGPT 无法进行医疗行为。Lotus Health AI 正是瞄准了这个缺口。

就我个人而言,“免费”模式最令人兴奋。考虑到美国医疗费用有多么昂贵,免费的初级保健是一个相当具有颠覆性的价值主张。当然,盈利模式仍然不明确。

未来会怎样?

AI 医疗市场竞争预计将全面展开。OpenAI 也在今年 1 月推出了 ChatGPT Health,加入了这个市场。它与 Apple Health、MyFitnessPal 等集成,提供个性化的健康建议。[OpenAI]

监管风险依然存在。即使是 OpenAI 也在其服务条款中明确表示“不要将其用于诊断或治疗目的”。因 AI 医疗建议造成的损害诉讼也已有多起正在进行中。有必要关注 Lotus Health AI 如何管理这些风险。

常见问题 (FAQ)

问:Lotus Health AI 真的免费吗?

答:对患者是免费的。但是,具体的盈利模式尚未公开。存在多种可能性,例如针对保险公司或雇主的 B2B 模式,或增加高级服务等。由于在所有 50 个州提供服务,因此似乎旨在实现规模经济。

问:它与普通 AI 聊天机器人有什么不同?

答:Lotus Health AI 是一项专门用于初级保健的医疗服务。与普通聊天机器人不同,它在美国 50 个州拥有医疗服务许可证。核心区别在于,它不仅提供简单的健康信息,还可以执行实际的医疗行为。

问:它支持韩语吗?

答:它表示支持 50 种语言,但具体的语言列表尚未公开。需要确认是否支持韩语。目前,该服务仅在美国境内可用,尚未公布海外扩张计划。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

H公司Holo2:UI本地化基准测试第一名

235B 参数模型颠覆了 UI 自动化领域

  • ScreenSpot-Pro 基准测试达到 78.5% 的 SOTA
  • 通过 Agentic Localization 实现了 10-20% 的性能提升
  • 即使在 4K 高分辨率界面中也能准确找到小的 UI 元素

发生了什么?

H Company 公开了 UI Localization(用户界面元素位置识别)专业模型 Holo2-235B-A22B。[Hugging Face] 这个 235B 参数规模的模型可以从屏幕截图中找到按钮、文本字段、链接等 UI 元素的准确位置。

核心是 Agentic Localization 技术。它不是一次性给出答案,而是通过多个步骤来完善预测。因此,即使是 4K 高分辨率屏幕上的小 UI 元素也能准确地识别出来。[Hugging Face]

为什么重要?

GUI 代理领域非常热门。Claude Computer Use、OpenAI Operator 等大型科技公司都在竞相推出 UI 自动化功能。然而,一家小型创业公司 H Company 却在该领域的基准测试中排名第一。

我个人关注的是 Agentic 方式。以前的模型试图一次性匹配位置,但经常失败,而多次尝试并完善的方法非常有效。10-20% 的性能提升证明了这一点。

坦率地说,235B 参数相当庞大。需要在实际生产环境中观察它的运行速度。

未来会怎样?

随着 GUI 代理竞争的加剧,UI Localization 的准确性将成为关键的差异化因素。由于 H Company 模型是开源的,因此其他代理框架很可能会将其集成。

它也可能影响 RPA(机器人流程自动化)市场。如果说以前的 RPA 工具是基于规则的,那么现在基于视觉的 UI 理解可能会成为标准。

常见问题 (FAQ)

Q: UI Localization 到底是什么?

A: 是一种通过查看屏幕截图来找出特定 UI 元素(按钮、输入框等)的准确坐标的技术。简单来说,就是 AI 知道在屏幕上应该点击哪里。它是 GUI 自动化代理的核心技术。

Q: 与现有模型有什么不同?

A: 核心是 Agentic Localization。它不是试图一次性匹配,而是通过多个步骤来完善。就像人浏览屏幕并寻找目标的方式一样。通过这种方式,性能提高了 10-20%。

Q: 可以直接使用该模型吗?

A: 它已在 Hugging Face 上以研究目的公开。但是,由于它是 235B 参数模型,因此需要大量的 GPU 资源。它更适合研究或基准测试,而不是实际的生产应用。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

苹果 Xcode 26.3:同时搭载 Anthropic Claude Agent + OpenAI Codex

AI 编码代理双雄并立,同时登陆 Xcode

  • Anthropic Claude Agent 和 OpenAI Codex 可在 Xcode 内直接使用
  • 支持 Model Context Protocol,第三方代理也可连接
  • 发布候选版本 (RC) 今日起向开发者计划会员开放

发生了什么?

Apple 宣布 Xcode 26.3 将正式支持代理编码 (agentic coding)。[Apple Newsroom] Anthropic 的 Claude Agent 和 OpenAI 的 Codex 可直接在 IDE 内使用。

所谓代理编码,是指 AI 不仅仅是提出代码片段,而是分析项目结构,自主分解任务,并自主运行构建-测试-修改循环。简单来说,AI 就像初级开发者一样工作。

Apple 全球开发者关系副总裁 Susan Prescott 表示:“代理编码可以最大限度地提高生产力和创造力,使开发者能够专注于创新。”[Apple Newsroom]

为什么重要?

我个人认为这是一个相当大的变化。原因有二。

首先,Apple 正式参与 AI 编码工具的竞争。此前,Cursor、GitHub Copilot、Claude Code 等独立工具扩大了市场,现在平台所有者亲自下场了。

其次,同时拥抱 Anthropic 和 OpenAI。通常,大型科技公司会与一家 AI 公司建立独家合作伙伴关系。但 Apple 脚踏两只船。虽然名义上是为了给开发者选择权,但说实话,可能是因为不知道哪个模型会胜出,所以买了保险。

Model Context Protocol(MCP) 的支持也值得关注。这是一个连接 AI 代理和外部工具的开放标准,由 Anthropic 主导。[TechCrunch] Apple 采用它,表明其封闭的生态系统战略有所退让。

未来会怎样?

超过 100 万的 iOS/macOS 开发者使用 Xcode。如果他们习惯了代理编码,开发范式本身可能会发生改变。

但是,也有担忧。如果 AI 自主修改代码,可能会产生安全漏洞或意想不到的错误。需要关注 Apple 如何管理这部分。

竞争格局也很有趣。OpenAI 在一天前独立发布了 macOS 版 Codex 应用。[TechCrunch] 与 Apple 的整合公告就在第二天,时机很微妙。

常见问题 (FAQ)

Q: Xcode 26.3 何时正式发布?

A: 目前发布候选版本 (RC) 已向 Apple 开发者计划会员开放。正式版本即将通过 App Store 发布。具体日期尚未公布。

Q: 应该使用 Claude Agent 还是 Codex?

A: 这取决于项目的性质。Claude 擅长理解长篇代码和安全性,Codex 擅长快速生成代码。可以都试试,选择适合自己的。这就是 Apple 给予选择权的原因。

Q: 现有的 Xcode 26 用户可以升级吗?

A: 是的。这是对 Xcode 26 中引入的 Swift 编码助手功能的扩展,现有用户更新到 26.3 即可立即使用代理编码功能。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

苹果 Xcode 26.3:Anthropic Claude Agent + OpenAI Codex 同时加载

AI双层编码代理系统,同时登陆Xcode

  • Anthropic Claude Agent 和 OpenAI Codex 可以在 Xcode 中直接使用
  • 第三方代理也将连接到 Model Context Protocol 的支持
  • 从今天开始,开发人员计划成员可以使用候选版本 (RC)

Apple 官方发布。

Xcode 26.3 中对代理编码的支持。[Apple Newsroom] Anthropic 的 Claude Agent 和 OpenAI 的 Codex 可以在 IDE 中直接使用。

代理编码是指 AI 不仅仅是编写代码。它超越了建议的级别,分析项目结构,独立划分任务,并自主执行构建、测试和修改的循环。简而言之,AI 的作用就像一个初级开发人员。

Apple 全球开发者关系副总裁 Susan Prescott 表示:“代理编码最大限度地提高了生产力和创造力,使开发人员能够专注于创新。”[Apple 新闻室]

为什么重要?

我个人认为,这是一个相当大的变化。原因有两个:

首先,Apple 正在认真参与 AI 编码工具的竞争。一方面,Cursor、GitHub Copilot、Claude Code 等独立工具一直在推动市场增长,但现在平台所有者直接参与其中。

其次,它同时采用了 Anthropic 和 OpenAI。通常,大型科技公司会与一家 AI 公司建立独家合作伙伴关系。但苹果公司越过了这条线。虽然表面上是为了让开发者有选择,但说实话,感觉更像是保险,因为他们不知道哪个模型会成为赢家。

模型上下文协议 (MCP) 的支持也值得关注。这是一个连接 AI 代理和外部工具的开放标准,Anthropic 在这方面处于领先地位。[TechCrunch]Apple 采用它标志着他们与标准渐行渐远。封闭生态系统战略。这是一个他们已经辞职的信号。

未来会怎样?

超过 100 万的 iOS/macOS 开发者使用 Xcode。一旦他们习惯了代理编码,开发范例本身可能会发生变化。

但也有一些担忧。如果 AI 自主修改代码,可能会出现安全漏洞或意外错误。我们仍然不知道 Apple 将如何管理这部分。

竞争格局也很有趣。 OpenAI 在前一天独立发布了适用于 macOS 的 Codex 应用程序。[TechCrunch]第二天宣布与 Apple 集成,因此时机很奇怪。

常见问题 (FAQ)

问:Xcode 26.3 何时正式发布?

答:候选版本 (RC) 现已在 Apple Developer Program 中提供。成员。完整版本预计很快将通过 App Store 分发。确切日期尚未公布。

问:我应该使用 Claude Agent 还是 Codex?

答:这取决于项目的性质。 Claude 擅长理解长代码和安全性,而 Codex 专注于快速代码生成。尝试两者,然后选择适合您的。这就是 Apple 让我们有选择的原因。

问:现有的 Xcode 26 用户也可以升级吗?

答:是的。这是,id=”%EC%B0%B8%EA%B3%A0-%EC%9E%90%EB%A3%8C”>参考文献

Amazon Bedrock AgentCore:企业 AI 代理的 9 条规则

企业 AI 代理,9 个核心规则

  • AWS 公开了 Amazon Bedrock AgentCore 最佳实践
  • 提出了会话隔离 microVM、多代理协作模式
  • 区分代理式与确定性代码是关键

发生了什么?

AWS 公布了基于 Amazon Bedrock AgentCore 的企业 AI 代理构建指南。[AWS] AgentCore 是一个大规模生成、部署和管理 AI 代理的平台。

9 个规则是核心。缩小范围、可观测性、工具定义、自动评估、多代理、扩展、代码分离、测试、组织扩展。

为什么重要?

坦率地说,AI 代理演示和生产是不同的游戏。本指南试图弥合这一差距。

AgentCore Gateway 引人注目。它统一管理 MCP 服务器、Lambda 等分散的工具。通过语义搜索找到合适的工具。

会话隔离也是一个特点。每个会话都在单独的 microVM 中运行,并在会话结束时关闭 VM。

未来会怎样?

我个人认为“代理式 vs 确定性代码”的区分是最实用的。日期计算用代码,意图理解用代理。找到这种平衡的团队将会获胜。

常见问题 (FAQ)

Q: AgentCore 和现有 Bedrock Agents 的区别?

A: Bedrock Agents 侧重于构建单个代理。AgentCore 是一个企业平台,包括多个代理的大规模运营、工具集成和会话管理。

Q: 多代理协作呢?

A: 支持顺序型、分层型、P2P 模式。AgentCore Memory 用于共享上下文,OpenTelemetry 用于监控切换。

Q: 如何保证安全?

A: Identity 负责认证,Policy 负责授权,Gateway 负责执行前验证。每个会话都在隔离的 microVM 中运行。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

Amazon Bedrock AgentCore:企业 AI 代理的 9 条规则

Enterprise AI agent, 9 core rules

  • AWS 发布 Amazon Bedrock AgentCore 最佳实践
  • 会话隔离 microVM,呈现多代理协作模式
  • 区分 agentic 代码和确定性代码是关键

What happened?

AWS 发布了基于 Amazon Bedrock AgentCore 构建企业 AI 代理的指南。[AWS] AgentCore 是一个用于大规模创建、部署和管理 AI 代理的平台。

9 条规则是关键。缩小范围、可观察性、工具定义、自动评估、多代理、扩展、代码分离、测试、扩展组织。

Why is it important?

老实说,AI 代理演示和生产是不同的游戏。本指南旨在填补这一空白。

AgentCore Gateway 脱颖而出。集成管理分散的工具,例如 MCP 服务器和 Lambda。通过语义搜索找到合适的工具。

会话隔离也是一个特性。每个会话都在一个单独的 microVM 中运行,当终止时,VM 也会终止。

What will happen in the future?

就我个人而言,“Agentic The “vs 确定性代码”的区别是最实用的。用代码计算日期,用代理确定意图。找到这种平衡的团队将会获胜。

Frequently Asked Questions

Q: AgentCore 和现有的 Bedrock Agents 有什么区别?

A: Bedrock Agents 专注于构建单个代理。AgentCore 是一个企业平台,包括多个代理的大规模运营、工具集成和会话管理。

Q: 多代理协作怎么样?

A: 支持顺序、分层和 P2P 模式。上下文与 AgentCore Memory 共享,并通过 OpenTelemetry 监控切换。

Q: 如何确保安全性?

A: Identity 负责身份验证,Policy 负责授权,Gateway 负责执行前验证。每个会话都在一个隔离的 microVM 中运行。


如果您觉得这篇文章有用,请订阅 AI Digester。

References