Mistral Voxtral: 1분당 0.1센트로 빅테크 음성 AI를 뒤흔든다

Mistral Voxtral: 1分あたり0.1セントでビッグテックの音声AIを揺るがす

  • Mistral AIがオープンソース音声モデルVoxtralを公開
  • Whisperの半分の価格でより高い精度
  • 24B、3Bの2バージョンを提供

何が起こったのか?

Mistral AIが音声認識モデルVoxtralをオープンソースで公開した。[Mistral AI] APIは1分あたり0.001ドル。Whisperの半分だ。

Small(24B)はプロダクション用、Mini(3B)はエッジ用だ。[Hugging Face]

なぜ重要なのか?

音声AI市場の価格破壊だ。Voxtral SmallはGemini 2.5 FlashとGPT-4o-miniを上回った。[Slator] 韓国語を含む13言語をサポート。リアルタイムモードは200ms未満の遅延だ。

今後どうなるのか?

オープンソースに強力な代替案が生まれた。OpenAIとGoogleの対応が注目される。

よくある質問 (FAQ)

Q: Whisperと何が違うのか?

A: 価格は半分、性能はより高い。Whisperのエコシステムはより成熟している。

Q: ローカル実行は可能か?

A: Mini(3B)で可能だ。Apache 2.0ライセンスだ。

Q: 韓国語のサポートは?

A: 公式13言語に含まれている。


この記事が役に立ったなら、AI Digesterを購読してください。

参考資料

コメントする