2016 senesinde ortaya çıkan ve çok kısa sürede sosyal medyada trend hale gelen zamanı durdurma akımı Mannequin Challenge eminiz ki hâlâ hepimizin aklında. Google araştırmacıları da bu akımı unutmamış olacak ki yapay zeka teknolojisinin geliştirilmesinde bu kez de bu akımdan yardım alındı.
Basit olarak anlatacak olursak hareketsiz şekilde duran bir grup insanın etrafında dönen kamera temeline dayanan akım, aslında derinlik algısının anlaşılmasında kullanılabilecek en iyi kaynaklardan biri sayılabilir. Araştırmacılar da depth prediction algoritm denilen derinlik tahmin algoritmasını geliştirmek için bu veriyi işlemeyi tercih etmiş.
2 binin üzerinde videodan yararlanıldı
Google AI araştırmacıları derinlik haritaları ve derinlik tahminlerini oluşturmak için doğal olmayan kaynaklar yerine YouTube’da yer alan 2 binin üzerindeki Mannequin Challenge videolarından faydalanmayı uygun bulmuş. Bu akımın bilimsel bir yönü olacağı kimin aklına gelirdi? Ancak eğer bu akım ortaya çıkmamış olsaydı muhtemelen araştırmacılar insanların doğal eylemlerinin gerçekçi bir şekilde modellenmesi ve oluşturulması için yapay veriler kullanmak zorunda kalacaktı.
Yapay verilerin işlenmesinin de birtakım aksilikler barındırabileceğini tahmin etmek zor değil. Tüm modellerin sabit olup sadece kameranın hareket ettiği bu akım sayesinde multi view stereo gibi yöntemler kullanılarak içinde insanların olduğu sahnelerin derinlik haritalarının çıkarılmasını önü açıldı.
Derinlik tahminleri için tek görüntü üzerinden giden yöntemler geliştirilse de araştırmacıların çoklu görüntüler kullanarak topladıkları bilgileri dikkate almasının, sonuçların verimli hale gelmesine yardımcı olacağı çok açık. İki farklı bakış açısı arasında konum değiştiren nesnelerin hareketi derinliği, ölçümde kullanılan önemli bir anahtar. Hareket halindeki insanların olduğu derinlik testlerinde ise insanın hareket ettiği alanın arkasında kalan bölgeler videonun diğer karelerinden alınan piksellerle doldurularak derinlik algısını geliştirilmesi sağlanıyor.