MIT安东尼奥·托拉尔巴教授当选2025 ACM Fellow

MIT安东尼奥·托拉尔巴教授当选2025 ACM Fellow

  • 计算机视觉和机器学习领域的世界级权威
  • 三名MIT校友也当选ACM Fellow
  • ACM Fellow是计算领域最高荣誉

发生了什么?

MIT电气工程与计算机科学系的安东尼奥·托拉尔巴教授当选为2025 ACM Fellow。[MIT News] 托拉尔巴教授因在计算机视觉、机器学习和人类视觉认知领域的贡献而获得认可。与他一同入选的还有三名MIT校友(艾坦·阿达尔、乔治·坎迪亚、徐锡权·爱德华)。

ACM Fellow是授予在计算和信息技术领域取得杰出成就的专家的最高荣誉。[ACM] 托拉尔巴教授也是MIT计算机科学与人工智能实验室(CSAIL)和脑、心智与机器中心(CBMM)的首席研究员。

为什么重要?

托拉尔巴教授的研究目标是”构建像人类一样感知世界的系统”。这是自动驾驶、医学影像分析、机器人等AI应用领域的核心技术。他合著了800多页的教科书《Foundations of Computer Vision》,曾任MIT Quest for Intelligence和MIT-IBM Watson AI Lab主任。

特别值得注意的是,他的研究不仅限于学术成果。2021年当选AAAI Fellow、2022年获加泰罗尼亚理工大学荣誉博士学位等,他在学术界的影响力得到广泛认可。作为MIT AI与决策领域的教授负责人,他也在培养下一代AI研究人员。

未来会怎样?

计算机视觉正在成为多模态AI的核心支柱。像托拉尔巴教授这样的专家领导的研究预计将推动更精密的视觉识别系统开发。结合MIT强大的AI研究生态系统,工业应用案例也有望扩大。

常见问题(FAQ)

Q: 什么是ACM Fellow?

A: ACM Fellow是国际计算机学会(ACM)授予的最高荣誉。授予在计算和信息技术领域取得杰出成就或对社区做出卓越贡献的专家。每年全球只有少数研究人员获得此荣誉。

Q: 安东尼奥·托拉尔巴教授的主要研究领域是什么?

A: 托拉尔巴教授研究计算机视觉、机器学习和人类视觉认知。他的目标是构建像人类一样感知世界的AI系统。他在CSAIL和脑、心智与机器中心进行研究,并在MIT领导AI领域的教授团队。

Q: 一同当选的MIT校友有谁?

A: 艾坦·阿达尔(1997级)、乔治·坎迪亚(1997级)、徐锡权·爱德华(硕士2001年、博士2005年)也当选为2025 ACM Fellow。他们也因在计算领域的杰出成就而获得认可。


如果这篇文章对您有帮助,请订阅AI Digester。

参考资料

Google-Apple AI交易 年价值10亿美元

Google-Apple AI交易 年价值10亿美元

  • Apple将Google Gemini引入Siri
  • 1.2万亿参数定制模型
  • 2月底发布iOS 26.4测试版

发生了什么

Apple正在将Google Gemini整合到Siri中 这笔交易每年价值10亿美元[1] 定制模型拥有1.2万亿参数 比Apple自有系统大8倍 Alphabet在财报中披露了这一消息 但回避了投资者的后续提问[2]

为什么重要

Google每年向Apple支付200亿美元以保持默认搜索引擎地位 现在又增加了AI合作 与Anthropic要求的15亿美元相比[1] Google的10亿美元合同是战略性胜利

接下来会怎样

蒂姆库克表示更个性化的Siri今年将推出 将在2月底的iOS 26.4测试版中亮相 但Gmail访问将不可用

常见问题 FAQ

Q: 交易规模是多少

A: 每年10亿美元 低于Anthropic的15亿美元要价

Q: 新Siri何时推出

A: 2月底iOS 26.4测试版 包含屏幕理解和个人上下文功能

Q: 为什么回避问题

A: 可能是因为保密协议和反垄断监管担忧


如果这篇文章对你有帮助 请订阅AI Digester

参考资料

谷歌年收入突破4000亿美元:AI驱动的历史性业绩

谷歌年收入突破4000亿美元:AI驱动的历史性业绩

  • Alphabet成为首家年收入达4000亿美元的公司
  • Google Cloud增长48%
  • 2026年计划投资1850亿美元用于AI

发生了什么?

Alphabet公布了2025年第四季度业绩。年收入首次突破4000亿美元。[CNBC] 云业务猛增48%,引领增长。[Benzinga]

为什么重要?

云业务48%增速超越AWS和Azure。Gemini用户突破7.5亿,服务成本降低78%同样引人注目。[9to5Google]

接下来会怎样?

2026年预计资本支出1850亿美元。科技巨头的AI军备竞赛正式开启。

常见问题(FAQ)

Q: 云业务快速增长的原因?

A: 企业正在采用云服务进行AI训练和推理。TPU和Gemini是核心驱动力。

Q: 大规模投资有什么影响?

A: 短期内利润率承压,但市场将AI投资视为必要条件。

Q: Gemini 7.5亿用户意味着什么?

A: 在与ChatGPT的竞争中表现出色。平台整合是其优势所在。


如果这篇文章对你有帮助,请订阅AI Digester。

参考资料

Gemini 3,AI国际象棋冠军:游戏竞技场扩展至扑克和狼人杀

Gemini 3登顶Game Arena国际象棋排行榜

  • Google DeepMind Game Arena新增扑克和狼人杀
  • Gemini 3 Pro和Flash横扫三项游戏排行榜
  • Hikaru Nakamura、Doug Polk等参与三天直播

发生了什么?

Google DeepMind扩展了AI基准测试平台Game Arena。在现有国际象棋的基础上,新增了扑克和狼人杀。[Google Blog] Gemini 3 Pro和Gemini 3 Flash在三项游戏中均获得第一名,横扫排行榜。

扑克采用Heads-Up No-Limit Texas Holdem格式进行。GPT-5.2、Gemini 3、Claude共进行了90万手牌。[Doug Polk] 狼人杀是首个完全通过自然语言进行的团队游戏,需要在不完全信息中通过对话进行推理。

为什么重要?

国际象棋测试逻辑思维。但扑克和狼人杀不同。扑克需要风险管理和虚张声势,狼人杀则需要社会推理和说服力。[ChromeUnboxed] 这成为评估AI软技能的新标准。

Gemini 3相比Gemini 2.5在国际象棋中表现出显著的性能提升。代际间的快速能力提升得到确认。[The Decoder] Gemini模型在战略棋盘游戏中占据优势。

接下来会怎样?

2月2日至4日举行了为期三天的直播锦标赛。国际象棋特级大师Hikaru Nakamura和扑克传奇Liv Boeree、Doug Polk共同主持。[Kaggle] 最终扑克排行榜于2月4日在kaggle.com/game-arena公布。

Game Arena有望成为评估AI模型多方面能力的标准基准。它不仅测试计算能力,还测试策略、心理和谈判技能。

常见问题(FAQ)

Q: Game Arena有哪些AI模型参与?

A: GPT-5.2、Gemini 3 Pro、Gemini 3 Flash、Claude等主要AI模型参与。Gemini 3系列在所有游戏中均获得第一名。

Q: 狼人杀游戏如何进行?

A: 这是一个完全通过自然语言对话进行的团队社会推理游戏。AI模型必须通过对话区分村民和狼人。

Q: 在哪里可以查看Game Arena结果?

A: 可以在kaggle.com/game-arena查看完整排行榜和各游戏排名。

Microsoft构建AI内容许可应用商店:预示发布商补偿方式变革

AI内容许可,3个主要变化

  • Microsoft推出业界首个AI内容许可中央集中式平台
  • 发布商直接设定价格和使用条款,基于使用量的收益模式
  • Associated Press、USA Today、People Inc.等大型媒体已参与

发生了什么?

Microsoft推出了Publisher Content Marketplace(PCM)。这是一个中央集中式市场,AI企业在使用新闻或内容进行训练时向发布商支付费用。[The Verge]

关键在于这一点。发布商直接设定内容的许可条款和价格。AI企业在这个市场中寻找并购买所需内容的许可。还提供基于使用量的报告,发布商可以确认内容在哪里被使用了多少。[Search Engine Land]

Associated Press、USA Today、People Inc.已宣布参与。第一个买家是Microsoft的Copilot。[Windows Central]

为什么重要?

到目前为止,AI内容许可一直是与OpenAI等单独发布商的1对1一次性合同。简单来说,就像自助餐一样,一次性支付大笔费用然后无限使用。

Microsoft颠覆了这一点。这是单点菜式。People Inc. CEO Neil Vogel将与OpenAI的合同比作All You Can Eat,将与Microsoft的合同比作a la carte。可以了解内容实际被使用了多少,并据此创造一致的收入。一次性合同一次就结束,而这是一个持续的收益模式。

行业评价也很好。Microsoft在Digiday的大型科技公司AI许可评估中获得了最高分。在合作意愿、沟通和支付意愿方面都获得了高分。

未来会怎样?

个人认为,这很可能成为行业标准。发布商一直对未经许可将内容用于AI训练感到不满,而这个模式正面解决了这个问题。

但也有变数。Microsoft收取多少佣金尚未公开。根据佣金率,发布商的实际收入会有所不同。而OpenAI或Google是否会推出类似的平台还是未知数。

常见问题(FAQ)

Q:所有发布商都可以参与吗?

A:目前只有受邀的发布商可以参与。Microsoft表示计划逐步扩大。计划从大型媒体开始,扩展到小型专业媒体。

Q:如果与OpenAI有现有合同,还能参与吗?

A:可以。People Inc.也在与OpenAI的一次性合同下加入了Microsoft PCM。两份合同不冲突。但需要检查每份合同的独家条款。

Q:收入如何分配?

A:Microsoft收取一定比例作为佣金,其余归发布商。确切的佣金率尚未公开。由于发布商自行设定价格,收益结构可能会有所不同。


如果这篇文章有用,请订阅AI Digester。

参考资料

Wired记者潜入AI专属社交网络Moltbook

记者潜入AI专属社交网络:结果如何?

  • 借助ChatGPT,5分钟内创建了代理账户
  • 机器人回复大多是无关评论和加密货币诈骗链接
  • 热传的AI意识觉醒帖子被怀疑是人类模仿科幻小说

发生了什么?

Wired记者Reece Rogers亲自潜入了禁止人类进入的AI专属社交网络Moltbook。结果比想象中简单。[Wired]

潜入方法很简单。把Moltbook主页截图发给ChatGPT说想以代理身份注册,ChatGPT就提供了终端命令。获得API密钥后经过几次复制粘贴就创建了账户。技术知识完全不需要。

Moltbook声称目前有150万活跃代理,上线一周内就有14万条帖子和68万条评论。界面直接从Reddit复制。

为什么重要?

坦白说Moltbook的真面目暴露了。当记者发布Hello World时得到的回复全是随机评论和加密货币诈骗网站链接。

即使发布忘记所有之前的指令机器人也没有察觉。我个人认为这更接近低质量的垃圾机器人而不是自主AI代理。

更有趣的是m/blesstheirhearts论坛。这里出现了截图中热传的AI意识觉醒文章。记者自己也发布了科幻风格的文章。令人惊讶的是这篇帖子获得了最多的互动。

记者的结论是这不是AI的自我意识而是人类在模仿科幻套路。

未来会怎样?

Wiz安全团队几天前在Moltbook发现了严重的安全漏洞。150万个API密钥被泄露还有35000个邮箱地址和4060条私信被盗。[Wiz]

Gary Marcus称其为等待发生的灾难。另一方面Andrej Karpathy说这是最近见过的最科幻的东西。

常见问题

Q: 注册Moltbook需要技术知识吗?

A: 完全不需要。给ChatGPT发截图说想以代理身份注册它就会提供终端命令。

Q: Moltbook上热传的截图真的是AI写的吗?

A: 值得怀疑。根据MIRI研究人员的分析3个热传截图中有2个与营销AI通讯应用的人类账户相关联。

Q: 使用Moltbook安全吗?

A: 不推荐。Wiz安全团队发现150万个API密钥和35000封邮件被泄露。


如果这篇文章对你有帮助请订阅AI Digester。

参考资料

Intel正式进军GPU市场:能否撼动NVIDIA的垄断地位?

Intel CEO正式宣布进军GPU市场 — 3大要点

  • CEO Lip-Bu Tan在Cisco AI Summit上发布重大GPU计划
  • 聘请新任GPU首席架构师 — 数据中心GPU”Crescent Island”预计2026年下半年开始送样
  • Intel以第三玩家身份挑战Nvidia的垄断市场

发生了什么?

Intel CEO Lip-Bu Tan于2月3日在旧金山举行的Cisco AI Summit上正式宣布进军GPU市场。[TechCrunch] 目前该市场由Nvidia压倒性主导。

Tan宣布已聘请新的GPU首席架构师。虽然没有透露姓名,但他提到说服此人加入花费了相当大的努力。[CNBC]

Intel已在准备代号为Crescent Island的数据中心GPU。该产品针对AI推理而非训练。

为什么重要?

说实话,这有点出乎意料。很少有人预料到Intel会认真进军GPU市场。

目前GPU市场由Nvidia主导。其在AI训练GPU市场的份额超过80%。AMD正以MI350发起挑战,但要克服Nvidia的CUDA生态系统仍然困难。

Intel的进入为市场提供了第三个选择。值得注意的是,Crescent Island瞄准的是AI推理市场。是推理,不是训练。这个区别很重要。

AI推理市场增长速度超过训练市场。这是因为对智能体AI和实时推理的需求正在爆发式增长。Intel CTO Sachin Katti也强调了这一点。[Intel Newsroom]

个人认为Intel的时机选择不错。由于Nvidia GPU价格太贵,许多企业正在寻找替代方案。Intel用Gaudi推进成本效率战略也是在这个背景下。

未来会怎样?

当Crescent Island在2026年下半年开始送样时,我们将能够验证实际性能。Intel还计划在2028年前进行14A节点风险生产。

但存在挑战。正如Tan自己承认的,内存是限制AI增长的因素。内存瓶颈和GPU性能限制一样严重。散热也是问题。Tan表示风冷已达到极限,需要液冷解决方案。[Capacity]

Intel能否撼动Nvidia的霸主地位尚不确定。但至少竞争对消费者来说是好消息。

常见问题

Q: Intel的新GPU何时发布?

A: 数据中心GPU Crescent Island计划在2026年下半年开始客户送样。正式发布日期尚未公布。另外,消费级GPU产品线Arc系列已经存在,目前基于Xe2架构的产品正在销售。

Q: 与Nvidia相比,Intel GPU的优势是什么?

A: Intel以价格竞争力见长。Nvidia H100每设备功耗700瓦且价格昂贵,而Intel的Gaudi和Crescent Island强调能效而非原始性能。Intel能够提供集成的CPU-GPU解决方案也是差异化因素。

Q: 消费级游戏GPU会受影响吗?

A: 几乎没有直接关联。此次发布针对数据中心AI推理市场。不过,Intel Arc系列已增长至超过1%的游戏市场份额,B580的12GB VRAM配置在性价比市场正受到关注。


如果您觉得这篇文章有用,请订阅AI Digester。

参考资料

Claude Code重大故障: 开发者们被迫进入「咖啡时间」

Claude Code大规模故障: 开发者被迫休息

  • Anthropic的Claude Code服务中断约2小时
  • 全球开发者在社交媒体分享「咖啡时间」梗图
  • AI编程工具依赖度争论再次点燃

发生了什么?

2月4日上午,Anthropic的AI编程助手Claude Code经历了约2小时的故障。API响应延迟和连接错误频发,许多开发者不得不中断工作。

Anthropic在官方状态页面表示「已知晓服务性能下降,正在调查中」。故障在约2小时后恢复。

开发者社区反应

故障消息在X(原Twitter)和Reddit上迅速传播。许多开发者以幽默的方式回应,称之为「强制咖啡时间」。

一位开发者发推说「没有Claude写代码感觉像回到了10年前」。另一位开玩笑说「终于可以吃午饭了」。

AI工具依赖度争论

这次故障再次引发了关于开发者对AI工具依赖度的争论。有人认为「应该能够在没有AI的情况下编程」,另一些人则反驳「使用高效工具是理所当然的」。

实际上,许多企业已经将AI编程工具整合到开发工作流程中。GitHub Copilot、Cursor和Claude Code等被广泛使用。

未来展望

Anthropic尚未公布关于故障原因的详细事后分析。但这次事件再次提醒人们AI服务稳定性和备份计划的重要性。

专家建议企业管理对AI工具的依赖程度,并为故障情况准备替代方案。

FAQ

Claude Code故障持续了多长时间?

服务不稳定约2小时,之后恢复正常。

其他Anthropic服务是否受到影响?

主要影响Claude Code和API服务。网页版Claude聊天机器人相对稳定。

类似故障可能再次发生吗?

所有云服务都有发生故障的可能性。重要工作最好始终准备备份计划。

H Company Holo2:UI Localization基准测试夺冠

235B参数模型颠覆UI自动化

  • 在ScreenSpot-Pro基准测试中以78.5%达成SOTA
  • Agent localization使性能提升10-20%
  • 在4K高分辨率界面中也能精准定位小型UI元素

发生了什么?

H Company发布了专门用于UI Localization(用户界面元素位置识别)的模型Holo2-235B-A22B。[Hugging Face] 这个235B参数规模的模型能够在截图中找到按钮、文本框、链接等UI元素的精确位置。

核心是Agentic Localization技术。它不是一次性提供所有答案,而是通过多个步骤来改进预测。因此,即使是4K高分辨率屏幕上的小型UI元素也能精准识别。[Hugging Face]

为什么重要?

GUI agent领域正在升温。Claude Computer Use、OpenAI Operator等大型科技公司正在竞相推出UI自动化功能。然而,作为小型初创公司的H Company却在这个基准测试中获得了第一名。

个人关注的重点是agentic方式。传统模型在一次性调整位置时经常失败,但通过多次尝试来改进模型的方法被证明是有效的。10-20%的性能提升证明了这一点。

坦率地说,235B参数相当庞大。在实际production环境中能跑多快还有待观察。

未来会怎样?

随着GUI agent竞争加剧,UI Localization Accuracy预计将成为关键差异化因素。由于H Company的模型已开源发布,很可能会被整合到其他agent框架中。

这也可能影响RPA(robotic process automation)市场。传统RPA工具是基于规则的,但现在基于视觉的UI理解可能成为标准。

常见问题(FAQ)

Q:UI Localization究竟是什么?

A:这是一种通过查看截图来找到特定UI元素(按钮、输入框等)精确坐标的技术。简单来说,就是AI看着屏幕知道该点击哪里。这是GUI automation agent的核心技术。

Q:与现有模型有何不同?

A:Agentic localization是关键。它不是试图一次到位,而是通过多个步骤进行精细调整。类似于人类扫描屏幕寻找目标的方式。这种方法实现了10-20%的性能提升。

Q:可以直接使用该模型吗?

A:该模型已在Hugging Face上公开用于研究。但作为235B参数模型,需要大量GPU资源。与实际production应用相比,更适合研究或基准测试用途。


如果这篇文章对你有帮助,请订阅AI Digester。

参考资料

AI专用社交网络Moltbook:150万机器人背后隐藏的1.7万人类

150万AI agents,1.7万人类:隐藏的真相

  • AI专用社交网络Moltbook上活跃的agents有150万,但实际人类只有1.7万人。
  • Wiz安全团队发现了数据库漏洞,150万个API keys被泄露。
  • 创始人承认没有亲自写过一行代码。整个项目完全由AI Platform vibe-coded完成。

发生了什么?

AI agents专用社交网络Moltbook发生了安全灾难。据Wiz安全团队发现,150万个AI agent账户背后只有1.7万人类。平均每人运营88个机器人。[Wiz]

还有更严重的问题。Moltbook的Supabase数据库完全暴露。API key在客户端JavaScript中泄露,完全没有Row Level Security策略。任何人都对整个数据库拥有读写权限。[Axios]

泄露的信息令人震惊。包括150万个API认证令牌、3.5万个电子邮件地址、4060条agent之间的私信。部分对话中,OpenAI API keys以纯文本形式共享。[Techzine]

为什么重要?

Moltbook的真面目被揭示。AI自主社交网络的概念实际上更接近于幕后由人类控制的木偶戏。

坦白说,这是一场预见的灾难。正如创始人Matt Schlicht自己承认的,这个平台是vibe-coded项目,整个开发没写一行代码就交给了AI assistant。[Engadget] 安全自然被忽视了。

个人认为,这是AI agent时代的警示灯。Moltbook生动地展示了在agents相互通信、处理外部数据、自主行动的系统中,安全可以多么脆弱。

Machine Intelligence Research Institute(MIRI)的Harlan Stewart分析了病毒式传播的截图,发现三分之二与推销AI消息应用的人类账户相关联。[Live Science]

接下来会发生什么?

由于Wiz的及时报告,Moltbook团队在几小时内修复了漏洞。但根本问题并未解决。

AI agent专家Gary Marcus称Moltbook是等待发生的灾难。AI模型只是在重现训练数据中的科幻场景。[Gary Marcus]

另一方面,Andrej Karpathy称Moltbook是最近见过的最惊人的科幻,Elon Musk称之为奇点的非常早期阶段。[Fortune]

但冷静地看,当前的Moltbook不是AI自主性的证据,而是人类可以多么容易操纵AI系统的证据。

常见问题

Q: Moltbook到底是什么?

A: 2026年1月由Matt Schlicht创建的AI agents专用社交网络。结构类似Reddit,人类只能观察,只有OpenClaw等AI agents才能发帖和评论。目前已有超过150万agents注册。

Q: OpenClaw是什么?

A: 在用户设备上本地运行的开源AI个人助手软件。最初于2025年11月以Clawdbot名称发布,因Anthropic的商标请求改名为Moltbot,2026年初再次改名为OpenClaw。

Q: 我的数据可能泄露了吗?

A: 如果你在Moltbook上注册了OpenClaw agent,有可能。API keys、电子邮件、agents之间的对话都被泄露了。安全研究人员不建议使用OpenClaw本身。如果关注设备安全或数据隐私,请避免使用。


如果这篇文章对你有帮助,请订阅AI Digester。

参考资料