Yapay zekâ teknolojilerinin gelişimiyle kendimizin veya bir başkasının sesini klonlayabilir, bu sesle cümleler söyletebilir olmuştuk. ElevenLabs ve Uberduck gibi platformlar bu konuda zirvede bulunurken bugün Meta’dan sürpriz bir hamle geldi.
Meta, yapay zekâ ile konuşmalar üretmenizi sağlayan yeni “Voicebox” yapay zekâsını duyurdu. Voicebox, tıpkı az önce bahsettiklerimiz gibi sesinizi klonlamanızı, bu ses ile yazdığınız metni seslendirmenizi sağlıyor. Elbette asıl olay, metnin seslendirilmesinin tıpkı bir insan gibi yapılmasında yatıyor.
Karşınızda Meta’nın ses teknolojisi Voicebox:
- Voicebox ile konuşma tarzı klonlama.
Meta’nın “konuşmada üretken yapay zekâlar için çığır açan buluş” olarak paylaştığı Voicebox, sadece ses taklit etme ve yazılanı okumak gibi fonksiyonlara sahip olmayacak. Yapay zekâ, bundan farklı dillerde konuşmanızı sağlamak dahil çok daha fazlasını yapacak:
Voicebox, sizin sesinizi alarak, İngilizce, Fransızca, Almanca, İspanyolca, Polonyaca veya Portekizce olarak bir içeriği seslendirebilecek.
Üstelik farklı dillerde seslendirme için o dilde yazı veya ses sunmanız gerekmeyecek. Yapay zekâ, Fransızca bir sesi veya metni İngilizce veya diğer tüm desteklenen dillere çevirebilecek.
Sadece 2 saniyede ses klonlanabilecek:
Günümüz ses klonlama platformları, klonlama işlemi için en az 5 dakikalık kayıtlar isterken Meta burada gerçekten çığır açmayı başardı. Şirket, Voicebox’ın sadece 2 saniyelik bir kayıtla ses stilini öğrenebildiğini ve bu stili seslendirmeye aktarabildiğini ifade etti.
- Ses düzenleme çalışması.
Tüm bunların yanı sıra ses kaydı alırken fark etmeden yanlış telaffuz ettiğiniz kelimeler, Voicebox ile yapay zekâ aracılığıyla sonradan düzenlenebilecek.
Şirket, Voicebox hakkındaki araştırma makalesini yayınladı. Ayrıca kullanıcıların yapay zekânın ilk seslerini duyabilecekleri demo sayfasını da yayınladı. Ancak yapay zekâ, kötüye kullanım ihtimalleri nedeniyle henüz kullanıma sunulmadı. Şimdilik yalnızca bilimsel çalışmalara açık olacak.