OpenAI, DALL-E modelini karşımıza ilk çıkardığında basit tariflerle o dönem kaliteli sayılabilecek görseller elde edebilmemize şaşırıyorduk. O zamandan bu zamana kadar köklü şekilde gelişen görsel üretme araçları DALL-E’yi geride bırakırken ChatGPT’nin doğuşuna ve günümüzdeki GPT-4’e kadar süren gelişimine şahit olduk.
Güncel olarak da GPT-4 kullanan ChatGPT, kullanımı en basit ve en iyi sonuç veren model olarak biliniyor. En azından OpenAI, şimdiye kadar ortaya koyduğu en büyük dil modeli olan Sora’yı çıkarana kadar durum buydu. Tabii gecenin bi’ vakti önümüze konulan bu modelin ne olduğunu ve diğerlerinden farkını ilk bakışta anlamamız zor. Bu yüzden de Sora’nın ne olduğunu, nasıl çalıştığını ve nelere imkân sağlayacağını sizlere anlatacağız.
DALL-E bize nasıl tariflerden görsel veriyorsa Sora da aynı şekilde video veriyor. Fakat hepsi bu değil.
- Sora'dan örnek video
Sora, dediğimiz gibi OpenAI’ın şimdiye kadar ürettiği en büyük dil modeli. Yapabildikleri de video üretimiyle sınırlı değil. Sabit fotoğrafları canlandırıyor, videoları ileri ya da geri saracak şekilde uzatabiliyor, video haricinde sade fotoğraf üretebiliyor, videoları birbirine bağlayabiliyor, hem görsel, hem video hem de prompt ile tarif alabiliyor, kamera hareketinde daha nesneleri ve insanları daha tutarlı hareket ettiriyor, obje karenin dışına çıkıp döndüğünde bile tutarlı görünmesini sağlıyor vb. birçok konuda Sora, benzerlerinin çok ötesinde.
Peki bu model, farklı sektörlerde nasıl karşımıza çıkabilir?
Bağımsız oyun geliştiricileri, Sora sayesinde daha az çabayla daha kaliteli ara sahneler yapabilirler.
Sora hem yazı hem video hem metin hem de görsel girişiyle kaliteli video çıktıları verdiği ve bunları tutarlı bir şekilde birleştirebildiği için bu alanda iş görecektir.
Hayatını kaybetmiş oyuncuların yeni yapımlarda yer alması, bu yapay zekâ modeliyle daha az iş gücü gerektirebilir.
Sinema tarafına bir diğer katkısı da oyuncuları, tonla makyaj yapmadan gençlendirip yaşlandırma imkânı olabilir.
Stok video ve fotoğraf arayışınızı saniyeler içinde çözebilir.
Normal şartlarda After Effects gibi programlarda saatlerinizi alacak efektleri Sora ile saniyeler içinde videolarınıza ekleyebilirsiniz.
Sora, benzerleri gibi küçük boyutlu videolar üzerinde çalışmıyor. Onun yerine 1080 x 1920 ve 1920 x 1080 aralığındaki tüm videoları örnekleyebiliyor.
Bu da farklı platformlar için farklı en/boy oranına sahip videolar üretebilirsiniz demek.
Yine oyun tarafına dönersek, Sora ile videoların belirli kısımları üzerinde oynayıp objeleri değiştirebiliyorsunuz.
Bu da ortam veya nesne değiştirmek için maskeleme, alan doldurma gibi yüklerle uğraşmadan sahneleri oluşturup nesnenizi oraya eklemenizi mümkün kılacaktır. Bu durum tam tersi de olabilir, yaratıcılığınıza kalmış. Örneğin üstteki videoda farklı ortamlara kayıpsız geçiş yapıldığını görebilirsiniz.
Bağımsız oyun geliştiricilerinden bahsettik. Fakat kısa film çekenler de normalde devasa ücretlere denk gelecek sahneleri gerçekçi bir şekilde oluşturabilir.
Tabii modelimiz, start-up ve girişimcilik tarafındaki pazarlama yöntemlerini de köklü şekilde değiştirecektir.
Arkaya oyun görüntüleri koyup üzerine konuşan içerik üreticileri de Sora’nın imkânlarından faydalanabilir.
Sadece geçici görüntüler değil, tasviri zor olan anlatımlar da Sora sayesinde kolayca önümüze gelebilir.
Tabii Sora şu an için pek de mükemmel değil.
Şu an için bu model, bazı fizik kurallarını işleyemediği için yukarıdaki videoda gördüğünüz plastik sandalyeyi veya kırılması gereken bir cam bardağı tam olarak olması gerektiği gibi işleyemiyor. Fakat alttaki videoya bir bakın.
Daha üzerinden 1 yıl geçmemişken bu aşamaya gelebildiysek, Sora çok kısa zamanda bu problemleri de aşacaktır. Sizin düşünceleriniz neler?