OpenAI, Ses Klonlama Aracı Voice Engine'i Tanıttı: Sadece 15 Saniyelik Bir Örnekle İnsan Sesini Kopyalayabiliyor!

Gökay Uyan —

3 dk okuma süresi

29 Mart 2024 Cuma, 22:55

OpenAI, Voice Engine ismini verdiği yeni bir ses üretme aracı duyurdu. Bu araç, insan seslerini gerçekçi bir şekilde kopyalayabiliyor ve metinleri sese çevirebiliyor.

Yapay zekâ deyince akla gelen ilk şirket şüphesiz OpenAI. Teknoloji devi, sohbet botlarından görsel üretmeye kadar birçok farklı alandaki modeliyle âdeta girdiğimiz yeni çağa öncülük ediyor. Son olarak kendisini herkesin ağzını açık bırakacak derecede gerçekçi videolar oluşturan “Sora” modeliyle görmüştük.

OpenAI, şimdi de yepyeni bir modelini duyurdu. “Voice Engine” ismi verilen bu araç, insan sesini gerçekçi bir şekilde kopyalıyor.

15 saniyede gerçek insan sesini klonlayabiliyor

Bu şirketin ses odaklı ilk hamlesi değil. Hâlihazırda yapay zekâ destekli ses araçlarına sahipti. ChatGPT’yle konuşmamızı sağlayan özellik bunun en iyi örneği. Voice Engine de şirketin metinden ses üretme çabalarının bir parçası. OpenAI’a göre bu araç, aslında 2022’den beri küçük bir grup üzerinde test ediliyor.

Voice Engine’in ne olduğunu kısaca açıklayalım. Bu araç, aslında bir ses klonlama modeli. Sadece 15 saniyelik bir örnekle gerçek bir insanın sesini ayırt edilemeyecek derecede kopyalayabiliyor. Bunun ardından kullanıcı istediği bir metni girerek yapay zekânın ürettiği kopya sese istediği şeyi okutabiliyor. Ayrıca klonlanan sesi farklı dillere de çevirmek mümkün oluyor.

İLGİLİ HABER

OpenAI'ın Uygulama Mağazasının Müşterileri Belli Oldu: Kopyacılar ve Yatırımcılar

OpenAI, paylaştığı blog gönderisinde modelin nerelerde kullanılabileceğine dair bilgiler de verdi. Bunlar arasında okuma yardımı, içerik çevirisi, konuşma bozukluklarına sahip kişilere yardım etme gibi hedefler yer alıyor.

OpenAI, güvenlik endişeleri nedeniyle henüz Voice Engine’i kullanıma sunmuyor

Voice Engine, geniş çapta kullanıma sunulmadı. Şirket, bunun ana nedeninin böyle bir klonlama teknolojisinin getireceği riskler olduğunu ifade ediyor. Hatta en başta geliştiricilerin katılabileceği bir program oluşturmayı planladığı ancak oluşabilecek sorunlardan dolayı iptal ettiğini bile ekliyor. Zaten şu an test edilen gruba da rızası olmadan ses kullanımını yasaklayan sözleşmeler imza atılmış.

Güvenlik konusu gerçekten ciddi bir problem. Günümüzde deepfake teknolojilerin ne kadar geliştiğini biliyoruz. Her yerde sahte görüntüler ve sesler görüyoruz. Ünlü isimleri taklit eden uygunsuz içerikler, dolandırıcılık amaçlayan görüntüler ve selser bunların en iyi örnekleri. Bu yüzden OpenAI’ın Voice Engine modeli çok riskli. Şirket de bunun farkında. Bu yüzden henüz geniş çapta çıkarma gibi bir planları yok. Yani ne zaman geleceğini bilemiyoruz.

İLGİLİ HABER

OpenAI, Sanatçıların "Sora" Modeli Hakkındaki İlk İzlenimlerini Paylaştı: Ağzınızı Açık Bırakacak Yeni Videolar da Yayımlandı

OpenAI, Voice Engine ile oluşturulan ses kayıtlarını sitesinden paylaştı. Yukarıdaki videodan örneklere ulaşabilrisiniz. İkili veya üçlü olarak paylaşılan kayıtlarda üstte bulunanlar gerçek insanlara, “Generated audio” olarak paylaşılan alttakiler ise yapay zekâya ait.

Webtekno’yu X’te takip et, haberleri kaçırma

BU TELEFON TÜRKİYE'de YOK SATAR! - Honor 200 Pro Kutu Açılışı ve İnceleme

Emoji İle Tepki Ver

Yorumlar(1)

Tüm Yorumlar

Ziyaretçi 4 ay önce

2025 en çok beklenen oyunu çok manidar

Yanıtla

OpenAI, Ses Klonlama Aracı Voice Engine'i Tanıttı: Sadece 15 Saniyelik Bir Örnekle İnsan Sesini Kopyalayabiliyor!

15 saniyede gerçek insan sesini klonlayabiliyor

OpenAI'ın Uygulama Mağazasının Müşterileri Belli Oldu: Kopyacılar ve Yatırımcılar

OpenAI, güvenlik endişeleri nedeniyle henüz Voice Engine’i kullanıma sunmuyor

OpenAI, Sanatçıların "Sora" Modeli Hakkındaki İlk İzlenimlerini Paylaştı: Ağzınızı Açık Bırakacak Yeni Videolar da Yayımlandı

%100 Şarj Zararlı mı? Elektrikli Otomobiller İçin En Sağlıklı Şar...

Her Ay Ödeme Yapmaktan Bıkanlara: ChatGPT Yakında Ömür Boyu Geçer...

Yapay Zekâlardan Kısa Cevaplar İstemenin Halüsinasyon Görme İhtim...

Yapay Zekâ ile Soru Çözebileceğiniz 10 Ücretsiz Uygulama

Samsung'un Apple'a iPhone Fold İçin Üreteceği Ekranın, Galaxy Fol...

Türkiye'ye Özel Olarak Üretilen Yeni BYD SEAL Design, İddialı Fiy...

Almadan Önce Aman Dikkat: Çakma-Sahte Bir AirPods Nasıl Anlaşılır...

iPhone'da Google Maps Kullananları Sevindirecek Yeni Bir Özellik...

Europa Universalis V Duyuruldu: Hem de Türkçe Dil Desteğiyle Geli...

Nissan Denildiği Zaman Akla Gelen İkonik Otomobiller

%100 Şarj Zararlı mı? Elektrikli Otomobiller İçin En Sağlıklı Şar...

Her Ay Ödeme Yapmaktan Bıkanlara: ChatGPT Yakında Ömür Boyu Geçer...

Yapay Zekâlardan Kısa Cevaplar İstemenin Halüsinasyon Görme İhtim...

Yapay Zekâ ile Soru Çözebileceğiniz 10 Ücretsiz Uygulama

Samsung'un Apple'a iPhone Fold İçin Üreteceği Ekranın, Galaxy Fol...

Türkiye'ye Özel Olarak Üretilen Yeni BYD SEAL Design, İddialı Fiy...

Almadan Önce Aman Dikkat: Çakma-Sahte Bir AirPods Nasıl Anlaşılır...

iPhone'da Google Maps Kullananları Sevindirecek Yeni Bir Özellik...

Europa Universalis V Duyuruldu: Hem de Türkçe Dil Desteğiyle Geli...

Nissan Denildiği Zaman Akla Gelen İkonik Otomobiller

Rockstar'dan GTA 6'ya Daha da Hayran Bıraktıran Açıklama: Fragman...

Apple Yöneticisinden Çarpıcı İtiraf: "Bundan 10 Yıl Sonra iPhone...

Spotify, Müzik Dinleme Deneyimini Katlayacak Yepyeni Özelliklerin...

Eski PlayStation Patronundan Oyuncuları Kızdıracak Açıklama: "Sev...

Windows 12 Ne Zaman Çıkacak? Nasıl Özelliklerle Gelecek? İşte Bil...

GTA 6'nın Türkçe Dublajlı 2. Fragmanı Paylaşıldı [Video]

Samsung'un Kullanışlı Now Bar'ına One UI 8 ile Yeni Özellikler Ge...

Kod Bilmenize Gerek Yok! Uygulama Geliştirmek İçin Kullanabileceğ...

Netflix TV Uygulaması Baştan Aşağı Değişiyor: İşte Yeni Tasarımda...

GTA 6'nın Fiyatı Gerçekten 100 Dolar Olabilir mi? Gelin Hep Birli...