Mistral Voxtral:以每分钟 0.1 美分的价格撼动大型科技公司的语音 AI
- Mistral AI 公开了开源语音模型 Voxtral
- 价格是 Whisper 的一半,但准确率更高
- 提供 24B 和 3B 两个版本
发生了什么?
Mistral AI 以开源形式发布了语音识别模型 Voxtral。[Mistral AI] API 的价格为每分钟 0.001 美元,是 Whisper 的一半。
Small (24B) 用于生产环境,Mini (3B) 用于边缘环境。[Hugging Face]
为什么重要?
这是语音 AI 市场的价格破坏。Voxtral Small 击败了 Gemini 2.5 Flash 和 GPT-4o-mini。[Slator] 支持包括韩语在内的 13 种语言。实时模式下的延迟低于 200 毫秒。
未来会怎样?
开源领域出现了一个强大的替代方案。OpenAI 和 Google 的应对措施备受关注。
常见问题 (FAQ)
问:与 Whisper 有什么不同?
答:价格减半,性能更高。Whisper 生态系统更加成熟。
问:可以本地运行吗?
答:可以使用 Mini (3B) 版本。采用 Apache 2.0 许可证。
问:支持韩语吗?
答:已包含在官方支持的 13 种语言中。
如果这篇文章对您有帮助,请订阅 AI Digester。