2010 yılında kurulan ve 2014 yılında Google bünyesine katılan yapay zekâ ekibi DeepMind, bugün oldukça heyecanlandırıcı bir teknoloji tanıttı. Ekip, DALL-E 2 ve MidJourney gibi yapay zekâ araçlarının aksine bu kez var olan bir şeyi daha da büyük çaplı bir şeye dönüştürebilen bir yapay zekâ geliştirdi.
DeepMind’ın ‘Transframer’ ismini verdiği yeni yapay zekâsı, sadece tek bir resmi baz alarak resmin içinde yaşamanızı sağlayacak 30 saniyelik videolar oluşturabiliyor. Elde edilen video, GIF olarak kaydedilebiliyor. Gelin, yeni yapay zekânın yapabildiklerine yakından bakalım.
Fotoğraftaki alan ve çevresi, üç boyutlu olarak hayal ediliyor:
Transframer, yüklediğiniz bir fotoğrafı analiz ediyor ve bu fotoğrafta yer alan objeleri ve objelerin çevresini tahmin ediyor. Bu işlemin ardından yapay zekâ, objelerin farklı açılardan nasıl görülebileceğini de düşünüyor. En sonunda ortaya çıkan görüntü ise gerçekten orada çekilen bir video gibi oluyor.
Transframer, bir objenin farklı açılardan nasıl gözükebileceğini şu şekilde oluşturuyor:
[GIPHY:n9CkFr4m6QbDHKX9Df][/GIPHY]
Peki bu teknoloji ile neler yapılabilecek?
Transframer, tıpkı DALL-E 2 ve MidJourney gibi sonsuz seçeneklere kapı açıyor. Bu yapay zekâ sanat, bilimsel analiz ve yapay zekânın daha ileri gelişimi için kullanılabileceği gibi aynı zamanda belki de DALL-E 2 ve MidJourney ile oluşturulan hayali alanları da 360 derecelik bir alana çevirebilir. Bu alanlar da gelecekte sanal gerçeklikte bulunabileceğimiz alanlar olarak hayatımızda yer edinebilir. Yapay zekâ ile yapılabilecekler, sadece hayal gücümüzle sınırlı olacak.
Yapay zekâ henüz herkesin kullanımına açılmamış olsa da DeepMind ekibi, bu teknolojiyi mümkün kılan algoritmaları yayımladıkları araştırmada paylaştı. Yazılım meraklıları, bu algoritlamara ve algoritmaların açıklamalarına bu bağlantıya tıklayarak ulaşabilirler.