Ses tanıma yazılımlarını insan düzeyine çekmeye yıllardır çabalayan fakat hata payını yeni yeni % 10 altına çekmeyi başaran teknoloji dünyasına iyi haber geldi.

IBM, son olarak % 6.9 olan ses tanıma hata oranını yeni yaptığı açıklamada % 5.5 düzeyine indirdiğini belirtti. Bu gelişme, Siri ve Alexa gibi sesli yardımcılar konusunda çığır açabilecek gelişmelere yol açacak bir başarı. 

Günlük hayatımızda navigasyon cihazları, telefon operatörleri gibi konularda karşımıza çıkan ses tanıma meselesi yazılım firmalarını zorluyordu

2016 ekim ayında Microsoft da benzeşen sözcük kümelerini birleştirerek modellediği nöral dil algoritmasıyla % 5.9 düzeyine indiğini açıklamıştı. Şirket, o dönem bunun insani denklik düzeyinde olduğunu belirtse de IBM bünyesindeki bilim insanlarının işaret ettiği hata payı % 5.1 olmuştu.

  • Ses tanıma becerisi, özellikle gelişigüzel konuşmalar esnasında oldukça karmaşık hâle gelebilen bir süreç. Bizzat insanların dahi diğerlerinin konuşmaları anlamadaki becerisi değişken olabiliyor. Julia Hirschberg - Columbia Üniversitesi Bilgisayar Bilimleri Bölüm Başkanı

IBM'in önemli gelişmelere esin olabilecek başarısı yapay bir sinirsel ağ olan "kısa dönem büyük hafıza" ile üç güçlü akustik şablon içeren WaveNet dil modellerini birleştirilmesiyle oluştu. Sonrasında da Siwtchboard adı verilen ve yıllardır ses tanıma yazılımlarının baz veri olarak kullandığı telefon görüşmeleriyle ölçüm yapıldı.

 

 


SEN DE DÜŞÜNCELERİNİ PAYLAŞ!
2000
Kalan karakter : 2000
Kredi hesaplama, kur çevirici, "bir depo kaça dolar?" ve fazlası için tıklayın.
Sermaye Piyasası Araçları Vergilendirme