深海时刻一周年:Qwen 衍生模型 11.3 万个,Llama 四倍

深搜时刻 1年,数字证明的3种变化

  • Qwen 衍生模型突破 11.3 万个 — Meta Llama(2.7 万个)的 4 倍
  • Hugging Face 最多关注者第 1 名 DeepSeek,第 4 名 Qwen
  • 中国 AI 组织们,“开源即战略”方向转变

发生了什么事?

Hugging Face 发布了 ‘深搜时刻’ 1 周年分析报告。[Hugging Face] 这是整理了 2025 年 1 月 DeepSeek 登场后中国开源 AI 生态系统如何发展的数据的三部曲系列的最后一篇。

从核心数据开始看。以 Qwen(阿里巴巴)为基础制作的衍生模型截至 2025 年年中超过了 11 万 3 千个。如果加上标记 Qwen 的存储库,则超过 20 万个。[Hugging Face] 与 Meta 的 Llama(2.7 万个)或 DeepSeek(6 千个)相比,这是一个压倒性的数字。

为什么重要?

说实话,一年前很多人还把中国 AI 看作是 ‘山寨’。但现在不同了。

Hugging Face 人气论文上位圈有字节跳动、DeepSeek、腾讯、Qwen 等。关注者数 DeepSeek 排名第 1,Qwen 排名第 4。如果以阿里巴巴整体来看,衍生模型数量与 Google 和 Meta 加起来的差不多。[Hugging Face]

我个人关注的是阿里巴巴的战略。Qwen 不是单一的旗舰模型,而是由 ‘家族’ 构成。支持多种大小、工作、模态。简单来说就是 “把我们的模型当作通用 AI 基础设施来使用”。

今后会怎么样?

Hugging Face 分析说 “开源是中国 AI 组织们的短期支配战略”。解释说,不仅共享模型,还共享论文、发布基础设施,旨在实现大规模整合和发布。

深搜时刻不是一次性事件,这一点在 1 年后通过数字得到了确认。全球 AI 开源生态系统的重心正在转移。

常见问题 (FAQ)

Q: Qwen 衍生模型比 Llama 多的理由是?

A: 阿里巴巴以多种大小和模态公开 Qwen,适用范围扩大。特别是中国开发者 많이 活用한다. 持续更新 Hugging Face 和 ModelScope 两者的战略也奏效了。

Q: DeepSeek 仍然重要吗?

A: 是的。在 Hugging Face 中拥有最多关注者的组织是 DeepSeek。但是,在衍生模型数量上落后于 Qwen。DeepSeek 在论文和研究贡献方面有优势,Qwen 则专注于生态系统扩展,存在差异。

Q: 对韩国开发者有什么意义?

A: 基于 Qwen 的模型正在加强韩语支持。由于是开源的,因此可以自由进行本地发布和微调。成为了一个适合无负担地进行实验的环境。但是,许可条件因模型而异,因此需要确认。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

发表评论