Üretken yapay zekâ modelleri, artık sadece fotoğraf değil, gerçeğinden ayırt edilemeyen videolar da oluşturabiliyor. Bunun en iyi örneği, OpenAI tarafından geçtiğimiz aylarda tanıtılan “Sora”. Henüz geniş çapta kullanıma sunulmayan bu model, metinlerden çok kısa sürede ultra gerçekçi videolar oluşturabiliyordu.
Şimdi ise OpenAI’ın Sora’sına ciddi rakip olabilecek bir model tanıtıldı. “Vidu” ismini alan bu yapay zekâ aracı, Çin’den geldi.
Tek bir tıkla 16 saniyelik 1080p çözünürlükte videolar oluşturabiliyor!
*Videoyu görüntüleyemiyorsanız buradaki bağlantıya tıklayın.
Çin’in ilk metinden görsel oluşturma modeli olarak nitelendirilen Vidu, bugün Pekin’de düzenlenen teknoloji etkinliği Zhongguancun Forum kapsamında tanıtıldı. Modelden paylaşılan örnekler, üretken yapay zekâ yarışının sadece ABD’de değil, tüm dünyada kızışacağını ortaya koydu.
Vidu, Çinli yapay zekâ firması Shengshu Technology ile Tsinghua Üniversitesi iş birliğinde geliştirildi. Yapılan açıklamada, modelin metin komutları yoluyla 16 saniye uzunluğunda 1080p çözünürlükte videolar oluşturabildiği aktarıldı.
Şirketin China Daily’ye yaptığı açıklamaya göre Vidu, hem daha uzun sürelerde videolar oluşturabiliyor hem de yüksek seviyede tutarlılık sunuyor. Ayrıca Sora seviyesine çok yakın olduğu da iddia ediliyor. Paylaşılan örneklere baktığımızda, gerçekten de bunu görebiliyoruz. Gerçek çekimler gibi gözüken videoları en az Sora kadar başarılı bir şekilde oluşturabiliyor.
Shengshu Technology, modelin temel mimarisinin Eylül 2022’den beri geliştirildiğini ifade etti. Bu da Sora’dan daha uzun süredir üzerinde çalışıldığı anlamına geliyor. Ayrıca rakibinin aksine Çin kültürüne özgü panda ve ejderha gibi unsurları anlayabildiği de gelen bilgiler arasında. Modelin ne zaman kullanıcılara sunulacağı konusunda ise henüz bir bilgi yok.