Yapay zekâ teknolojilerinin gelişimiyle kendimizin veya bir başkasının sesini klonlayabilir, bu sesle cümleler söyletebilir olmuştuk. ElevenLabs ve Uberduck gibi platformlar bu konuda zirvede bulunurken bugün Meta’dan sürpriz bir hamle geldi.
Karşınızda Meta’nın ses teknolojisi Voicebox:
- Voicebox ile konuşma tarzı klonlama.
Voicebox, sizin sesinizi alarak, İngilizce, Fransızca, Almanca, İspanyolca, Polonyaca veya Portekizce olarak bir içeriği seslendirebilecek.
Üstelik farklı dillerde seslendirme için o dilde yazı veya ses sunmanız gerekmeyecek. Yapay zekâ, Fransızca bir sesi veya metni İngilizce veya diğer tüm desteklenen dillere çevirebilecek.
Sadece 2 saniyede ses klonlanabilecek:
Günümüz ses klonlama platformları, klonlama işlemi için en az 5 dakikalık kayıtlar isterken Meta burada gerçekten çığır açmayı başardı. Şirket, Voicebox’ın sadece 2 saniyelik bir kayıtla ses stilini öğrenebildiğini ve bu stili seslendirmeye aktarabildiğini ifade etti.
- Ses düzenleme çalışması.
Tüm bunların yanı sıra ses kaydı alırken fark etmeden yanlış telaffuz ettiğiniz kelimeler, Voicebox ile yapay zekâ aracılığıyla sonradan düzenlenebilecek.
Şirket, Voicebox hakkındaki araştırma makalesini yayınladı. Ayrıca kullanıcıların yapay zekânın ilk seslerini duyabilecekleri demo sayfasını da yayınladı. Ancak yapay zekâ, kötüye kullanım ihtimalleri nedeniyle henüz kullanıma sunulmadı. Şimdilik yalnızca bilimsel çalışmalara açık olacak.