Mistral Voxtral: 1분당 0.1센트로 빅테크 음성 AI를 뒤흔든다

Mistral Voxtral: 1分あたり0.1セントでビッグテックの音声AIを揺るがす

Mistral AIが音声認識モデルVoxtralをオープンソースで公開した。^{[Mistral AI]} APIは1分あたり0.001ドル。Whisperの半分だ。

Small(24B)はプロダクション用、Mini(3B)はエッジ用だ。^{[Hugging Face]}

音声AI市場の価格破壊だ。Voxtral SmallはGemini 2.5 FlashとGPT-4o-miniを上回った。^[Slator] 韓国語を含む13言語をサポート。リアルタイムモードは200ms未満の遅延だ。

オープンソースに強力な代替案が生まれた。OpenAIとGoogleの対応が注目される。

Q: Whisperと何が違うのか？

A: 価格は半分、性能はより高い。Whisperのエコシステムはより成熟している。

Q: ローカル実行は可能か？

A: Mini(3B)で可能だ。Apache 2.0ライセンスだ。

Q: 韓国語のサポートは？

A: 公式13言語に含まれている。

この記事が役に立ったなら、AI Digesterを購読してください。