Galler Prensesi Kate Middleton’ın Videosuyla Tekrar Gündeme Gelen 'Deepfake Tespit Araçları' Nasıl Çalışıyor?

Çığ gibi büyüyen temelsiz iddialar sonrası sosyal medya, bir deepfake söylentisiyle daha karşımızda. Fakat bu sefer, bu belirsizliği ortadan kaldıran araçların nasıl çalıştığına bakacağız.

Galler Prensesi Kate Middleton, karın ameliyatı olmasının ardından ortalıkta görünmeyince endişeler artmıştı. Kendisinden haftalarca haber alınamaması, endişeler artınca manipüle edilmiş fotoğraflarının gerçek diye servis edilmesi ve son olarak da gerçekliği sorgulanan bir videonun "Prenses iyi durumda." diye paylaşılması komplo teorilerini tetiklemişti. Neyse ki Catherine dışarıda görüntülenince herkes rahatladı.

Fakat olaylar bitmedi. Kate Middleton, Galler Prensi ve Prensesi’nin resmî sosyal medya hesaplarından bir açıklama yaptı ve kendisine kanser teşhisi konulduğunu belirtti. Söylediğine göre Catherine, kemoterapi  tedavisinin daha erken aşamalarında. Fakat sosyal medyada dönen söylentiler, bu videonun deepfake olduğu ve yapay zekâ ile yapıldığı yönündeydi. 

Deepfake tespit siteleri ise videonun orijinal olduğunu gösterdi. İyi de bu siteler neye göre karar veriyor?

Bu siteler arasında en popüler olan şüphesiz Deepware. Farklı modeller kullanarak söz konusu videoya deepfake skoru atayan uygulama, söz konusu Kate Middleton videosunda Deepfake olmadığını öne sürdü. Bu sonucu dayandırdığı 4 ayrı model var. Bunlar; Avatarify, Deepware, Seferbekov ve Ensemble olarak geçiyor. Bunun haricinde sonuç ekranına baktığımızda hem video hem de ses detaylarını görebiliyoruz.

Avatarify, ironik şekilde aslında deepfake videolar oluşturmanızı sağlıyor. Uygulama, makine öğrenimi kullanarak kendisine verdiğiniz bir fotoğrafa animasyon ve ses ekliyor ve onu canlandırıyor. En büyük kolaylığı ise videoları bulutta değil, direkt mobil cihaz üzerinde işliyor olması. Deepfake alanındaki birikimi, Deepware üzerindeki deepfake tespitinde de kullanılıyor.

2018’den beri kullanılan Deepware Scanner ise sürekli farklı yöntemleri araştırmasıyla biliniyor.

Evrişimsel sinir ağları mimarisinden EfficientNet-B7 modeli üzerinde çalışan Deepware Scanner, az kaynak kullanımıyla yüksek doğruluk oranı sunuyor. Ayrıca kendisi, içinde 120.000 video verisi bulunduran CFDC veri setini kullanıyor. Bu videolar arasında 4chan Real, Celeb-DF, YouTube ve başka birçok farklı platformdan örnekler yer alıyor. Bu bağlamda hem organik hem de canlı videolardan beslendiği için deepfake olanları ayırt etmesi kolaylaşıyor.

Seferbekov ve Ensemble’a da göz atalım.

Selim Seferbekov tarafından geliştirilen Seferbekov, videoları kare kare inceleyerek değerlendiriyor. 3 aşamalı sinir ağlarından oluşan MTCNN yüz tanıma sistemi, Seferbekov’un modelinde bulunuyor. Bu sistemle Seferbekov, videolarda yüzleri kutu içine alıyor, videolardan çıkarıyor, yüzün ana hatlarını belirliyor, daha sonra karşılaştırma için SSIM maskeleri çıkarıyor ve karşılaştırmaları gerçekleştiriyor. Seferbekov’un değerlerini kullanan Deepware, kendi sonuçlarını üretip sunuyor.

Ensemble ise sitede yer alan bilgiye göre Deepware’ın tarayıcısıyla Seferbekov’un tarayıcısının güçlerini birleştiriyor.

Tek paydada toplayalım.

Sistemler ve sundukları çözümler farklılık gösterse de en etkili olanın, gerçek görüntüleri sahte olanlardan ayırmaya yarayan evrişimsel sinir ağları olduğu belirtiliyor. Bunun haricinde sistemlerde kullanılan yöntemler farklılaşabilse de özünde hepsinin derin öğrenmeden yararlandığını belirtelim. Deepfake ise makine öğrenimiyle yaratılıyor.

Gözümüze her ne kadar basit görünse de söz konusu sistemin ardında birbirinden farklı süreçler ve modeller dönüyor. Şüphe duyduğunuz videolar için bu linkten Deepware'a ulaşabilirsiniz.

Makine öğrenimi ve derin öğrenme kavramlarını birbirine karıştıranları şuraya alalım:

“Tamam bu sistemler deepfake’i bu şekilde anlayabiliyor da biz nasıl anlayacağız?” diye düşünenleri de şöyle alalım:

Kaynaklar: selimsef, Papers with CodeAccuracy and Robustness of State of the Art Deepfake Detection Models, deepware, Antispoofing, Medium