Mistral Voxtral:以每分钟0.1分的价格撼动大型科技公司的语音AI

Mistral Voxtral:以每分钟 0.1 美分的价格撼动大型科技公司的语音 AI

  • Mistral AI 公开了开源语音模型 Voxtral
  • 价格是 Whisper 的一半,但准确率更高
  • 提供 24B 和 3B 两个版本

发生了什么?

Mistral AI 以开源形式发布了语音识别模型 Voxtral。[Mistral AI] API 的价格为每分钟 0.001 美元,是 Whisper 的一半。

Small (24B) 用于生产环境,Mini (3B) 用于边缘环境。[Hugging Face]

为什么重要?

这是语音 AI 市场的价格破坏。Voxtral Small 击败了 Gemini 2.5 Flash 和 GPT-4o-mini。[Slator] 支持包括韩语在内的 13 种语言。实时模式下的延迟低于 200 毫秒。

未来会怎样?

开源领域出现了一个强大的替代方案。OpenAI 和 Google 的应对措施备受关注。

常见问题 (FAQ)

问:与 Whisper 有什么不同?

答:价格减半,性能更高。Whisper 生态系统更加成熟。

问:可以本地运行吗?

答:可以使用 Mini (3B) 版本。采用 Apache 2.0 许可证。

问:支持韩语吗?

答:已包含在官方支持的 13 种语言中。


如果这篇文章对您有帮助,请订阅 AI Digester。

参考资料

发表评论