Mistral Voxtral: 1分あたり0.1セントでビッグテックの音声AIを揺るがす
- Mistral AIがオープンソース音声モデルVoxtralを公開
- Whisperの半分の価格でより高い精度
- 24B、3Bの2バージョンを提供
何が起こったのか?
Mistral AIが音声認識モデルVoxtralをオープンソースで公開した。[Mistral AI] APIは1分あたり0.001ドル。Whisperの半分だ。
Small(24B)はプロダクション用、Mini(3B)はエッジ用だ。[Hugging Face]
なぜ重要なのか?
音声AI市場の価格破壊だ。Voxtral SmallはGemini 2.5 FlashとGPT-4o-miniを上回った。[Slator] 韓国語を含む13言語をサポート。リアルタイムモードは200ms未満の遅延だ。
今後どうなるのか?
オープンソースに強力な代替案が生まれた。OpenAIとGoogleの対応が注目される。
よくある質問 (FAQ)
Q: Whisperと何が違うのか?
A: 価格は半分、性能はより高い。Whisperのエコシステムはより成熟している。
Q: ローカル実行は可能か?
A: Mini(3B)で可能だ。Apache 2.0ライセンスだ。
Q: 韓国語のサポートは?
A: 公式13言語に含まれている。
この記事が役に立ったなら、AI Digesterを購読してください。