Önde gelen metin-okuma uygulamalarından Speechify, Chrome tarayıcı uzantısını sesli yazma ve yapay zeka tabanlı sesli asistan özellikleriyle güçlendiriyor. Bu güncelleme, son bir yılda hızla gelişen ses tanıma teknolojilerinin rüzgarını arkasına alıyor ve kullanıcıların ellerini klavyeden uzak tutmayı hedefliyor.
Sesli Yazma Aracı: Hız mı, Doğruluk mu?
Speechify'nin yeni sesli yazma özelliği, İngilizce dil desteğiyle çalışıyor. Sistem, konuşma hatalarını düzeltiyor ve 'ee', 'şey' gibi dolgu kelimeleri otomatik siliyor. Gmail ve Google Docs gibi platformlarda sorunsuz işleyen araç, WordPress gibi sitelerde ise tetikleme ve performans sorunları yaşayabiliyor. Şirket, popüler web siteleri için optimizasyonları kademeli olarak ekleyeceğini belirtiyor.
Kısa testlerde, Speechify'nin kelime hata oranı Wispr Flow, Willow ve Monologue gibi rakiplerden daha yüksek çıktı. Ancak şirket, modelin kullanım arttıkça hızla öğrendiğini ve hata oranının düşeceğini savunuyor. Eleştirel bir bakışla, bu tür araçlar erişilebilirlik açısından büyük potansiyel taşısa da, başlangıçtaki doğruluk sorunları kullanıcı frustrasyonuna yol açabilir. Özellikle gürültülü ortamlarda veya aksanlı konuşmalarda performans düşüşü bekleniyor.
- Sesli yazma: Hata düzeltme ve dolgu kelime kaldırma.
- Destek: Şimdilik İngilizce, Gmail/Google Docs uyumlu.
- Gelecek: Popüler sitelere optimizasyon ve mobil masaüstü entegrasyonu.
Tarayıcı Yan Çubuğunda Sesli AI Asistan
Uzantının yan çubuğunda yer alan sesli asistan, ziyaret ettiğiniz web sayfası hakkında sorularınıza yanıt veriyor. 'Üç ana fikir nedir?' veya 'Basitçe açıkla' gibi komutlarla içerik özetleyebiliyor. Speechify yetkilisi Rohan Pavuluri, ChatGPT ve Gemini gibi araçlarda sesin ikincil kaldığını, kendi ürünlerinde ise sesi ön plana çıkardıklarını vurguluyor.
Biz biliyoruz ki, Speechify kullanıcılarının büyük bir kısmı uygulamayı her açtıklarında sesli etkileşimi varsayılan olarak istiyor. Ses, ChatGPT ve Gemini'de her zaman arka planda kalacak. - Rohan Pavuluri, Speechify CBO
Karşıt görüşte, OpenAI'nin Atlas, Perplexity'nin Comet ve Dia gibi yerleşik yan çubuk asistanları bu özelliği gölgeliyor. Speechify, Chrome'un devasa kullanıcı tabanına odaklanarak bu sorunu minimize etmeyi planlıyor. Gelecekte, randevu alma veya müşteri hizmetlerinde bekleme gibi ajan tabanlı görevler eklenecek; Truecaller ve Cloaked gibi rakiplerle rekabet artacak.
Bu yenilikler, ses teknolojilerinin günlük üretkenlikteki rolünü güçlendirirken, gizlilik endişeleri ve model bağımlılığını da gündeme getiriyor. Kullanıcılar için veri güvenliği ve kesintisiz entegrasyon kritik olacak. Speechify, özellikleri tüm masaüstü ve mobil uygulamalarına yaymayı hedefliyor.
Kaynak: Bu haber, TechCrunch kaynaklıdır.