Voxtral: Mistral AI’ın Yeni Açık Kaynak Ses Modeli Rakiplerine Meydan Okuyor

Mistral AI’dan Devrim: Açık Kaynaklı Ses Modeli Voxtral Tanıtıldı

Yapay zeka alanında adından sıkça söz ettiren Mistral AI, profesyonel kullanıma yönelik geliştirdiği ilk açık kaynaklı ses modeli olan Voxtral’ı duyurdu. Bu yeni model, piyasadaki ucuz ve düşük kaliteli açık sistemler ile pahalı ve kapalı çözümler arasında kalan kullanıcılara güçlü bir alternatif sunuyor.

Voxtral’ın Öne Çıkan Yetenekleri

Voxtral, arkasındaki Mistral Small 3.1 büyük dil modelinin gücüyle dikkat çekiyor. Modelin sunduğu temel özellikler şunlardır:

  • Ses Dökümü: 30 dakikaya kadar olan ses kayıtlarını başarıyla yazıya dökebilme.
  • İçerik Anlama: 40 dakikaya kadar olan ses içeriklerini anlayarak özet çıkarma, komut verme veya API çağırma gibi ileri düzey işlemleri gerçekleştirme.
  • Çoklu Dil Desteği: İngilizce, İspanyolca, Fransızca, Portekizce, Hintçe, Almanca, Felemenkçe ve İtalyanca gibi yaygın dillerle uyumlu çalışma.

Voxtral Small ve Voxtral Mini: İhtiyaca Yönelik Modeller

Mistral AI, Voxtral’ı farklı kullanım senaryoları için iki ayrı model olarak sunuyor:

Voxtral Small

Bu model, 24 milyar parametre ile donatılmış olup ticari projeler için tasarlanmış güçlü bir versiyondur. ElevenLabs Scribe ve GPT-4o-mini gibi popüler sistemlere doğrudan rakip olarak konumlandırılmıştır. Yapay zekada parametre sayısı, modelin öğrenme kapasitesini ve karmaşık problemleri çözme yeteneğini belirleyen en önemli faktörlerden biridir.

Voxtral Mini

3 milyar parametreye sahip olan Voxtral Mini, daha düşük donanımlı veya çevrimdışı çalışması gereken cihazlar için ideal bir çözümdür. Ayrıca, yalnızca sesi metne dönüştürme görevine odaklanan ve Mini Transcribe adı verilen daha hafif bir sürümü de mevcuttur. Mistral AI’a göre bu sürüm, OpenAI’ın popüler Whisper modelinden hem daha hızlı hem de daha ekonomik bir performans sergiliyor.

Erişim, Entegrasyon ve Fiyatlandırma

Voxtral API’si, geliştiricilerin kullanımına Hugging Face platformu üzerinden ücretsiz olarak sunulmuştur. Modeli kendi uygulamalarına entegre etmek isteyen profesyoneller için ise başlangıç fiyatı dakikada 0.001 dolar gibi oldukça rekabetçi bir seviyede belirlenmiştir.

Bu duyuru, Paris merkezli şirketin geçtiğimiz ay tanıttığı adım adım akıl yürüten Magistral modellerinin hemen ardından geldi. Mistral AI’ın şu anda 1 milyar dolarlık yeni bir yatırım turu için görüşmeler yaptığı da gelen bilgiler arasında.