Meta AI: Yazılı olmayan dilleri tercüme eden teknoloji!
Meta AI kullanıcılarının daha kolay etkileşime geçebilmeleri için anında konuşmadan konuşmaya çeviri geliştirme programı Evrensel Konuşma Tercümanı (UST) programının bir parçası haline gelecek
YAZILI OLMAYAN DİLLER GERÇEK ZAMANLI ÇEVİRİLECEK
Dünyada bilinen 7.000 dilden neredeyse yarısı ve 10 dilden 4’ü yazıya dökülmeden direkt olarak konuşuluyor. Yazıya dökülmemiş bu diler özellikle dijital algoritmaların çeviri sistemlerinde tercüme edilemiyor.
“Evrensel Konuşma Tercümanı” üzerinde çalışan Meta, Temmuz 2022’de “No Language Left Behind (NLLB)” projesi içerisinde Asturyasça, Luganda ve Urduca gibi çevirisi zor yapılan 200 dil üzerinde çalıştığını duyurdu.
Meta AI ise yürüttüğü çalışma ile bu engelin önüne geçmeyi planlıyor. Meta araştırmacıları, Asya’nın azınlıklarında konuşulan ve Tayvan’ın resmi dillerinden biri olan fakat yazılı olmayan Hokkien dilini incelediler.
Yazılı olmayan dilleri çevirmek için algoritma oluşturmaya çalışan Meta AI normalde makine çevirilerinde dilin hem yazılı hem de sözlü örneklerini kullanarak işler.
MARK ZUCKERBERG NASIL ÇEVİRİ YAPILDIĞINI AKTARDI
CEO Mark Zuckerberg yayınladığı blog yazsısında, “Bunun üstesinden gelmek için, “giriş konuşmasını doğrudan Meta’nın öncülük ettiği yolda bir dizi akustik birime dönüştürmek için konuşmadan birime çeviri (S2UT) kullandık. Ardından birimlerden dalga formları oluşturduk. Ayrıca UnitY, ilk geçiş kod çözücünün ilgili bir dilde (Mandarin) metin oluşturduğu ve ikinci geçiş kod çözücünün birimler oluşturduğu iki geçişli bir kod çözme mekanizması için benimsendi ” dedi.
“Önce İngilizce (veya Hokkien) konuşmayı Mandarin metnine çevirdiğimiz ve ardından Hokkien’e (veya İngilizce’ye) çevirdiğimiz ve eğitim verilerine eklediğimiz sözde etiketler oluşturmak için Mandarin’i bir ara dil olarak kullandık” diye devam etti.
Şu anda sistem Hokkien konuşan birinin, İngilizce bilen birisiyle ara dil kullanılarak konuşmasını sağlıyor. Bir seferde yalnızca bir tam cümle çevrilebiliyor. Ancak Mark Zuckerberg tekniğin geliştirilerek daha fazla dilde ve gerçek zamanlı çeviride kullanılabileceğini düşünüyor.
NEDEN YAZILI OLMAYAN DİLLERE ODAKLANILDI?
Çünkü birçok algoritma tarafından artık İngilizce, İspanyolca, gibi diller yüksek doğruluk oranlarında desteklenerek çevrilebiliyor. Ancak Meta’nın paylaştığı verilere göre dünya nüfusunun kullandığı yüzde 20’lik diller bu sistemler tarafından desteklenmiyor.