Mistral Voxtral: 분당 0.1센트로 빅테크 음성 AI 뒤흔든다

Mistral Voxtral: 분당 0.1센트로 빅테크 음성 AI 뒤흔든다

  • Mistral AI가 오픈소스 음성 모델 Voxtral 공개
  • Whisper 절반 가격에 더 높은 정확도
  • 24B, 3B 두 버전 제공

무슨 일이 일어났나?

Mistral AI가 음성 인식 모델 Voxtral을 오픈소스로 공개했다.[Mistral AI] API는 분당 0.001달러. Whisper의 절반이다.

Small(24B)은 프로덕션용, Mini(3B)는 엣지용이다.[Hugging Face]

왜 중요한가?

음성 AI 시장의 가격 파괴다. Voxtral Small은 Gemini 2.5 Flash와 GPT-4o-mini를 제쳤다.[Slator] 한국어 포함 13개 언어 지원. 실시간 모드는 200ms 미만 지연이다.

앞으로 어떻게 될까?

오픈소스에 강력한 대안이 생겼다. OpenAI와 Google 대응이 주목된다.

자주 묻는 질문 (FAQ)

Q: Whisper와 뭐가 다른가?

A: 가격 절반, 성능은 더 높다. Whisper 생태계가 더 성숙하다.

Q: 로컬 실행 가능한가?

A: Mini(3B)로 가능하다. Apache 2.0 라이선스다.

Q: 한국어 지원은?

A: 공식 13개 언어에 포함됐다.


이 글이 유용했다면 AI Digester를 구독해주세요.

참고 자료

댓글 남기기