Google, çarşamba günü yeni yapay zekası Translatotron’u tanıttı. Translatotron, henüz geliştirme aşamasında olan bir konuşmayı konuşmaya çevirme yapay zekası.
Dünya üzerinde simultane çeviri yapmaya çalışan ilk yapay zeka bu değil ancak Google’ın yapay zekası, konuşmak için sizin sesinizi kullanmasıyla bir ilk. Yani mekanik bir sesle konuşmak yerine bu yapay zeka sizin ses tonunuzla konuşuyor. Bu da küresel dil engelinin aşılması yolunda önemli bir adım.
Google’ın yapay zeka bloguna göre, çoğu konuşmayı konuşmaya dönüştüren çeviri sistemi üç adımlı bir işlemi takip ediyor. Önce konuşmayı yazıya döküyor, sonra yazıyı çeviriyor ve elindeki yazıyı okuyor. Translatotron ise metin kısmını tamamen pas geçiyor ve konuşmayı bir spektograma çeviriyor. Spektogram, ses frekanslarını gösteren bir görsel. Sistem daha sonra hedef dilde yeni bir spektogram oluşturup onu okuyor.
Bu sistemle çeviri yapmak çok daha kolay hale geliyor çünkü işlem sayısı bire inmiş oluyor. Ayrıca spketogramlar ile orijinal konuşmadaki bileşenleri kaydetmek daha kolay, örneğin konuşmacının sesini ya da aksanını yansıtmak mümkün.
Sistem şu anda henüz yayınlanmaya hazır değil ve Google’ın GitHub sayfasındaki sesler hala biraz robotik. Çeviriler de mükemmel olmaktan uzak ancak ilk adımlar olarak göz önüne alındığında oldukça dikkat çekici. Ayrıca bu yapay zekayı kullanarak, bütün konuşmaları otomatik olarak çeviren bir kulaklık yapıp da adını babil balığı koymazlarsa çok büyük bir fırsatı kaçırmış olacaklar.