使用 AWS Bedrock 自动生成营销图片:3 个关键点

保持品牌一致性,自动生成营销图像

  • 参考过往营销资料,保持品牌一致性
  • 无需专业设计师,几秒内即可制作定制视觉效果
  • 通过 Amazon Bedrock API 实现营销工作流程自动化

发生了什么?

AWS 发布了 Amazon Bedrock 营销图像生成指南的第二部分。[AWS ML Blog] 该指南介绍了如何参考企业的历史营销资料,在保持品牌标识的同时生成新图像。

关键在于在提示词中包含过去活动的风格和调色板。[Amazon Bedrock]

为什么重要?

传统的图像制作需要几天甚至几周的时间。AWS 的方法将其缩短到几分钟。AI 解决了负责人变更或活动扩展时品牌基调不稳定的问题。[AWS Docs]

未来会怎样?

下一步是多模态输入。直接参考现有图像并应用风格迁移的方式将更加精细。Google Imagen、OpenAI DALL-E 3 也在攻克同一领域。

常见问题 (FAQ)

Q: Bedrock 中使用哪些图像模型?

A: 提供 Stable Diffusion、Amazon Titan Image Generator 等。可以根据用途选择模型,并通过 API 传递提示词。

Q: 如何保持品牌一致性?

A: 在提示词中明确品牌颜色代码、图像基调以及应避免的要素。分析并反映过去营销资料的特点即可。

Q: AI 生成图像的版权?

A: 美国版权局不承认 AI 生成物的版权。内部营销用途没有问题,但外部发布时建议咨询法务团队。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

Muon 优化器提速 3.4 倍:UNSO 变革 AI 学习

Newton-Schulz 正交化,FLOPs 减少 3.4 倍

  • 将 Newton-Schulz 正交化整合为单一运算,FLOPs 减少 3.4 倍
  • 正交化误差减少 96 倍 (3.838 → 0.040)
  • 通过可学习系数确保收敛稳定性

发生了什么事?

中国研究团队发布了 Newton-Schulz 正交化的新集成框架 UNSO。[arXiv] 它用单一多项式运算替代了现有的 NS 迭代。核心是“消除无意义的项并引入可学习的系数”。

以 128×512 矩阵为基准,FLOPs 从 2.533×10^8 降至 8.831×10^7。[arXiv]

为什么重要?

Muon 作为替代 AdamW 的优化器而备受关注。它以 175 美元的价格训练了 GPT-2 XL,并且被用于 Kimi K2。[Keller Jordan] 但 Newton-Schulz 迭代是一个瓶颈。

UNSO 打破了这个瓶颈。它不是减少迭代,而是完全消除迭代。正交化误差也减少了 96 倍。误差累积是学习不稳定性的原因,而 UNSO 解决了这个问题。

未来会怎样?

PyTorch 2.10 正式包含了 Muon。[PyTorch] NVIDIA NeMo 也支持它。[NVIDIA] UNSO 很有可能被迅速吸收。

常见问题 (FAQ)

Q: 现在可以使用 UNSO 吗?

A: 是的。作者们在 GitHub 上公开了代码。可以在 PyTorch 环境中以替代现有 Muon 的形式使用。但建议在生产应用之前进行自身基准测试。

Q: 应该用 Muon 代替 AdamW 吗?

A: 视情况而定。Muon 仅适用于隐藏层。嵌入或输出层需要 AdamW。组合使用两个优化器是标准做法。

Q: 实际学习时间会减少多少?

A: 在正交化阶段快 3.4 倍。整体学习时间取决于模型大小。正交化比重越大,UNSO 的优势就越大。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

沃尔夫斯堡足球俱乐部引入ChatGPT企业版:赋能全体350名员工AI能力

德甲联赛最初: AI将草坪病也诊断

  • VfL沃尔夫斯堡,通过导入ChatGPT Enterprise,强化350名全体员工的AI能力
  • 从草坪病诊断到翻译、行政自动化,立即应用于实务
  • 发布德甲联赛最初生成型AI白皮书的俱乐部的下一步

无甚么事情发生了?

德国德甲联赛俱乐部VfL沃尔夫斯堡于2026年2月4日发表声明,将在公司范围内导入OpenAI的ChatGPT Enterprise。[VfL Wolfsburg] 约350名员工将活用此AI工具。

沃尔夫斯堡从2023年开始试验生成型AI,并于2024年6月发布了德甲联赛最初的生成型AI白皮书。[VfL Wolfsburg] 这次导入ChatGPT Enterprise是其延续。

具体来说,到底做什么?

活用领域很有趣。草坪病诊断、翻译、信息结构化、重复行政业务自动化等。[VfL Wolfsburg]

草坪病诊断?想到足球场草坪管理有多重要,就能理解了。原本由专家肉眼判断的事情,AI来辅助。

俱乐部将指定内部AI协调员,使创新实际传递到各部门。将AI不是作为单独的工具,而是作为日常业务的标准构成要素。

为什么重要呢?

职业体育俱乐部在公司范围内导入AI还是罕见的例子。在选手影像分析或球探中使用AI很常见,但向350名全体员工提供ChatGPT Enterprise是不同的层面。

商务总监米夏埃尔·梅斯克表示:“AI在足球中不再是未来的主题。是真正的竞争优势”。[VfL Wolfsburg]

我个人认为这是核心。不是将AI作为“未来技术”来观望,而是宣言现在就活用为竞争力。其他俱乐部也不得不行动。

今后会怎么样呢?

沃尔夫斯堡有与德勤合作制作AI白皮书的先例。体系化的接近是强项。不仅仅是扔给工具,而是同时构建各部门定制型应用程序和内部教育体系。

其他欧洲足球俱乐部跟随的可能性很高。特别是财政有余力的英超联赛俱乐部预计会发表类似声明。

经常问的问题 (FAQ)

Q: ChatGPT Enterprise与普通ChatGPT有什么不同?

A: 是企业用版本。不对对话内容进行AI学习,提供获得SOC 2认证的安全环境。追加了单点登录、管理者仪表盘、无限使用量等企业运营所需的功能。在安全和管理方面比普通版本更上一层楼。

Q: 如何在草坪病诊断中使用AI?

A: 推测为上传草坪照片后,分析症状,提出疾病种类和应对方法的方式。GPT-4 Vision以后图像分析功能大大提高。预计将发挥1次筛选和信息提供作用,而不是代替专家判断。

Q: 其他足球俱乐部也在使用AI吗?

A: 很多俱乐部在选手影像分析、对方球队战术分析、受伤预测等方面活用AI。但是,像沃尔夫斯堡一样向全体员工提供ChatGPT Enterprise的公司范围导入还很少见。西雅图雷恩FC也有活用ChatGPT开发防守战术的事例。


如果这篇文章有用,请订阅AI Digester。

参考资料

AI 机器人占据了 52% 的网络流量:比人类还多

网络流量的过半是 AI 机器人 — 核心数字 3 个

  • 整体网络流量的 52.3% 来自 AI 机器人[AI CERTs]
  • LLM 学习用爬虫流量在 8 个月内从 2.6% 增加到 10.1%,增长了 4 倍[2026 AI Bot Impact Report]
  • Meta AI 机器人占据整体 AI 爬虫流量的 52%,远超 Google(23%) 和 OpenAI(20%)

发生了什么?

进入 2026 年,AI 机器人占据了互联网流量的过半数。根据 2026 AI Bot Impact Report,整体网络流量的 52% 来自机器人,超过了人类用户流量(47.7%)。[2026 AI Bot Impact Report]

特别是 LLM 学习用爬虫急剧增加。 OpenAI、Anthropic、Google DeepMind 等 AI 企业为了模型学习而大规模收集网络信息,该部门的流量就达到了 35%。[AI CERTs]

OpenAI 的 GPTBot 在追踪期间增长了 305%,执行 JavaScript 的用户行为爬取也在 2025 年增加了 15 倍。[2026 AI Bot Impact Report]

为什么重要?

坦率地说,这是互联网的根本经济结构正在动摇的信号。

网站通过广告收入运营。但是如果超过一半的访问者是不看广告的机器人呢?广告模式本身受到威胁。我个人认为,这对整个内容产业的影响仍然被低估了。

更严重的是服务器负载。 AI 机器人消耗高达 70% 的动态资源,加剧了共享主机环境中的“吵闹的邻居”问题。一个网站的机器人流量会降低同一服务器上其他网站的性能。

Cloudflare 等企业推出了 AI 爬虫拦截工具,一些发行商开始采用“按爬取收费”模式。免费抓取内容的时代即将结束。

今后会怎么样?

AI 机器人流量预计会继续增加。 AI 企业的模型学习需求没有减少的迹象,随着 AI 代理的出现,机器人直接浏览网站的情况也在增加。

网站运营者面临选择。有数据显示,拦截 AI 爬虫会减少 75% 的流量。[2026 AI Bot Impact Report] 拦截的话担心搜索曝光,允许的话服务器费用会飙升。

最终,AI 企业和内容创作者之间似乎需要达成新的协议。现在的免费搭车结构是不可持续的。

常见问题 (FAQ)

Q: AI 机器人流量会影响我的网站速度吗?

A: 是的。 AI 爬虫比普通用户更快地请求更多页面。如果使用共享主机,由于同一服务器上其他网站的机器人流量,我的网站也可能会变慢。 Core Web Vitals 分数下降会对 SEO 产生负面影响。

Q: 拦截 AI 爬虫会降低搜索排名吗?

A: Google 或 Bing 等搜索引擎爬虫与 AI 学习用爬虫不同。即使拦截 GPTBot 或 Anthropic 爬虫,也不会直接影响 Google 搜索排名。但是,在 AI 搜索服务中的曝光可能会减少。

Q: 如何查看我的网站的 AI 机器人流量?

A: 可以通过分析服务器日志中的 User-Agent 来查看。查找 GPTBot、ClaudeBot、Google-Extended 等字符串。如果使用 Cloudflare 等 CDN,可以在机器人管理仪表板中单独查看 AI 爬虫流量。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

沃伦参议员对 Gemini 购物结账中的“监视定价”表示担忧 — 国会或将展开调查

沃伦参议员对 Gemini 购物中的“监视定价”表示担忧

  • 伊丽莎白·沃伦正式提出对 Google Gemini 结账的隐私问题
  • 消费者团体警告说“人工智能可能会利用聊天数据高价出售”
  • 84% 的美国人担心人工智能价格操纵

发生了什么?

伊丽莎白·沃伦参议员正式质疑 Google Gemini 的购物结账功能对用户隐私的影响。[The Verge] 沃伦批评这“显然是错误的”,并指出 Google 诱使消费者花费更多钱。[Yahoo News]

这是继 1 月 Groundwork 的 Lindsay Owens 警告说 Google 的 UCP 可能会实现“监视定价”之后的后续行动。[TechCrunch]

为什么重要?

Google 在 1 月份宣布了一项功能,可以直接从 Gemini 应用程序中付款。[The Register] Shopify、Target 和 Walmart 参与其中作为合作伙伴。

Owens 在 X 上警告说“Google 可能会利用聊天数据高价出售”。如果人工智能分析购物模式并判断“这个人即使价格高也会购买”,则可能会显示更高的价格。

Google 反驳说“禁止提供高于其网站的价格”。[Search Engine Journal]

未来会怎样?

很可能会导致议会层面的调查。坦率地说,我更担心未来。如果 Google 对广告的依赖模式得到加强,我怀疑现在的安全措施是否会得到维持。

常见问题 (FAQ)

问:什么是 Gemini 购物结账?

答:这是一种在 Gemini 应用程序中搜索产品后,无需离开 Google 平台即可直接付款的功能。它使用 Google Pay,目前正在美国的一些零售商处进行试运行。

问:什么是监视定价?

答:人工智能分析用户数据,并以不同的价格向不同的人出售相同的产品。例如,如果从富裕社区访问,可能会显示更高的价格。

问:我可以阻止我的数据被使用吗?

答:Gemini Personal Intelligence 采用选择加入方式。如果您在 Google 设置中关闭 Gemini Apps Activity,您可以停止保存对话历史记录。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

ElevenLabs以110亿美元估值融资5亿美元

红杉资本领投,一年内企业估值增长3倍

  • 红杉资本领投,融资5亿美元
  • 企业估值110亿美元 – 一年内增长3倍
  • 语音AI领域最大规模投资

发生了什么?

语音AI初创公司ElevenLabs在红杉资本的带领下,获得了5亿美元的投资。[TechCrunch] 企业估值为110亿美元。红杉资本的安德鲁·里德合伙人将加入董事会。

ElevenLabs由波兰创始人于2022年创立。提供文本转语音、语音克隆、AI配音等服务。[Wikipedia]

为什么重要?

12个月前,企业估值为33亿美元。2025年9月达到66亿美元,现在为110亿美元。[Sacra] 一年内增长了3倍以上。

2025年6月推出的Eleven v3支持70多种语言。已被YouTube用户、游戏开发者、出版商等各种行业广泛使用。还通过实时语音代理平台进军企业市场。

未来会怎样?

预计本次融资将投入到研发和全球扩张中。能否在与OpenAI、谷歌等大型科技公司的竞争中保持语音质量优势,值得关注。

常见问题 (FAQ)

Q: ElevenLabs是一家什么样的公司?

A: 是一家成立于2022年的语音AI公司。提供文本转语音、语音克隆、AI配音、语音代理平台。成立仅3年就实现了110亿美元的企业估值。

Q: 现有投资者有哪些?

A: a16z、红杉资本、ICONIQ Growth等是主要投资者。2024年1月跻身独角兽行列,此后经过C轮融资持续增长。

Q: ElevenLabs的主要技术是什么?

A: Eleven v3模型是核心。支持70多种语言,能够表达情感和进行多方对话。Scribe v2的语音-文本转换准确度是行业领先水平。


如果这篇文章对您有帮助,请订阅AI Digester。

参考资料

Roblox 4D:用AI创建“移动”的3D物体

Roblox 4D:用AI创建“会动”的3D对象

  • Roblox推出4D创作开放测试版
  • 超越静态模型,生成可交互的对象
  • 基于Cube 3D,已生成180万个对象

发生了什么?

Roblox公开了4D创作功能的开放测试版。 不仅可以创建简单的静态3D模型,还可以创建实际运行的对象。[TechCrunch]

Roblox于2025年3月发布了开源AI模型Cube 3D。 它已被用于生成超过180万个3D对象。[TechCrunch]

为什么重要?

现有工具侧重于制作静态模型。 4D是不同的。 家具、车辆和配件实际上会移动。 门会打开,轮子会滚动。

创作者的工作方式正在改变。 无需单独制作3D模型和编写交互代码。 AI会进行集成处理。

未来会怎样?

Roblox是一个拥有8000万日活跃用户的平台。 预计4D正式发布后,UGC生态系统将会发生变化。 无需编码即可实现复杂的交互。

常见问题 (FAQ)

Q: 4D和Cube 3D的区别是什么?

A: Cube 3D仅生成静态模型。 4D添加了交互。 AI会自动实现开门、按钮操作等。 从“观看”的模型演变为“使用”的对象。

Q: 所有人都可以使用吗?

A: 是的。 从2026年2月4日起,所有Roblox开发者都可以使用。 以前只能进行早期访问。 无需单独申请,可以直接在Roblox Studio中使用。

Q: 可以创建哪些对象?

A: 家具、车辆、配件等各种各样的东西。 例如,可以打开的抽屉、移动的汽车、可以佩戴的帽子等。 AI会分析形状并赋予适当的交互。


如果这篇文章对您有帮助,请订阅AI Digester。

参考资料

GitHub Agent HQ:一站式管理6个AI代理

GitHub Agent HQ:6 个 AI 代理集中在一个地方

  • 集成 Claude、Codex、Jules 等
  • 通过 Mission Control 同时管理
  • Copilot Pro+ 用户,本周发布

发生了什么?

GitHub 发布了 Agent HQ。[1] Claude、Codex、Jules 在 GitHub 内部运行。通过 Mission Control 指挥代理。[2]

为什么重要?

AI 编码代理市场变得碎片化。Agent HQ 解决了这个问题。Anthropic CPO 表示“Claude 接收问题并响应 PR”。[3]

未来会怎样?

Pro+ 用户从本周开始使用 Codex。Claude、Jules 将在今年内发布。

常见问题 (FAQ)

Q: 免费吗?

A: 不是。需要 Copilot 付费订阅。

Q: 在哪里使用?

A: 在 Web、VS Code、移动设备、CLI 中同样使用。

Q: AGENTS.md 是什么?

A: 组织编码标准设置文件。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

Mistral Voxtral:以每分钟0.1分的价格撼动大型科技公司的语音AI

Mistral Voxtral:以每分钟 0.1 美分的价格撼动大型科技公司的语音 AI

  • Mistral AI 公开了开源语音模型 Voxtral
  • 价格是 Whisper 的一半,但准确率更高
  • 提供 24B 和 3B 两个版本

发生了什么?

Mistral AI 以开源形式发布了语音识别模型 Voxtral。[Mistral AI] API 的价格为每分钟 0.001 美元,是 Whisper 的一半。

Small (24B) 用于生产环境,Mini (3B) 用于边缘环境。[Hugging Face]

为什么重要?

这是语音 AI 市场的价格破坏。Voxtral Small 击败了 Gemini 2.5 Flash 和 GPT-4o-mini。[Slator] 支持包括韩语在内的 13 种语言。实时模式下的延迟低于 200 毫秒。

未来会怎样?

开源领域出现了一个强大的替代方案。OpenAI 和 Google 的应对措施备受关注。

常见问题 (FAQ)

问:与 Whisper 有什么不同?

答:价格减半,性能更高。Whisper 生态系统更加成熟。

问:可以本地运行吗?

答:可以使用 Mini (3B) 版本。采用 Apache 2.0 许可证。

问:支持韩语吗?

答:已包含在官方支持的 13 种语言中。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

Tinder 推出 AI 功能,解决滑动疲劳

Tinder 引入 AI:3 行总结

  • Tinder 发布基于 OpenAI API 的“The Game Game”,可以与聊天机器人练习调情
  • 个性化匹配工具“Chemistry”测试中,提供定制匹配代替无限滑动
  • 78% 的约会应用用户经历过倦怠,整个行业都在寻找 AI 突破口

发生了什么?

Tinder 公开了两项基于 AI 的新功能。第一个是“The Game Game”,这是一个利用 OpenAI Realtime API 的语音聊天机器人。[eMarketer] 用户可以与 AI 练习虚拟的初次见面场景。第二个是名为“Chemistry”的匹配工具。它基于提示和个人数据,每天提供精选的匹配。[Global Dating Insights]

Tinder 产品副总裁希拉里·佩恩表示:“更有效率地将用户引导至连接和火花是更好的体验。”[Global Dating Insights]

为什么重要?

约会应用行业正面临严重的危机。 Forbes Health 的一项调查显示,78% 的用户在使用应用程序时经历了情绪和精神上的疲惫。 Gen Z 有 79% 的人感到倦怠。 考虑到普通用户每天花费超过 50 分钟进行滑动,这是理所当然的结果。

Tinder 的业绩也在下滑。 截至 2025 年第三季度,付费用户为 920 万至 930 万,同比下降 7%。 美国 MAU 从 2022 年初的 1800 万人骤降至约 1100 万人。 Bumble (-16%)、Hinge 等竞争对手的情况也类似。

AI 已成为解决此问题的方法。 它提供更少但更准确的匹配,而不是无限滑动。 Bumble 预告将于 2026 年推出 AI 产品,而 Grindr 已经引入了 AI 推荐提要。

未来会怎样?

有一个有趣的信号。 在 Tinder 年终报告中,用户在 2026 年约会方面选择最多的词不是“疲劳”或“指导”,而是“充满希望”。 如果 AI 改善用户体验,则存在反弹的机会。

但是,也存在自相矛盾的情况。 2025 年下半年的研究表明,单身人士希望减少技术,增加线下会面。 无论 AI 如何改善应用内体验,它是否能解决“想要离开应用本身”的根本需求仍是未知数。

常见问题 (FAQ)

问:Tinder 的 The Game Game 如何运作?

答:这是一个利用 OpenAI Realtime API 的语音聊天机器人功能。 用户可以与 AI 语音练习虚拟的初次见面场景。 它旨在提高实际匹配之前的对话技巧。 您可以以游戏化的形式轻松尝试调情。

问:什么是滑动疲劳?

答:这是由约会应用的无限滑动机制引起的情绪和精神疲惫现象。 Forbes Health 的一项调查显示,78% 的用户都经历过这种情况。 原因包括每天平均滑动超过 50 分钟、匹配质量低以及重复失败。 在 Z 世代中尤其严重。

问:其他约会应用也采用 AI 吗?

答:整个行业都在加速采用 AI。 Bumble 预告将于 2026 年推出基于 AI 的新产品。 Grindr 已经在运营 AI 推荐提要。 Hinge 正在改进其匹配算法。 共同目标是提供质量高于数量的匹配。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料