İnternette sağlıklı bir şekilde gezinmenin temelde üç bileşeni vardır; sağlıklı bir bağlantı, sağlıklı bir internet sitesi ve sağlıklı bir cihaz. Bir sitenin düzgün çalışabilmesi, saldırı almaması ya da kötü niyetli kişilerden zarar görmemesi için alınan pek çok güvenlik önlemi var. Bunların da belki de en bilinenlerinden biri Captcha testleri.
Son dönemde Captcha testlerinde sürekli olarak yaya geçitlerini, trafik ışıklarını ya da araçları tanımaya çalışıyoruz. Peki sorulabilecek binlerce farklı şey varken neden ehliyet kursundaymışız gibi sürekli trafikle mücadele ediyoruz?
Bilgisayarlar, trafiği bizim sayemizde çözmeye çalışıyor.
Captcha testi dediğimiz şey, bilgisayarla insanları ayırt etmek için kullanılan basit bir Turing testi. Turing testi de kabaca insana kolay gelen ama bilgisayarın çözemediği test çeşidi. Captcha testlerinde sık sık trafikle ilgili görseller görmemizin sebebi ise bu görsellerin bilgisayarlar tarafından tanınmasının zor olmasıdır.
Bilgisayarlar görselleri bizim gibi algılamazlar. Testlerde yer alan trafik ışıkları, yaya geçitleri, bisikletler, otobüsler gibi nesneleri bilgisayarlar görür görmez tanıyamaz. Bu nesnelerin şekli, rengi, konumu ve arka planı bilgisayarlar için karmaşık olabilir.
Örneğin, bir trafik ışığının yeşil olduğunu söylemek kolay gibi görünse de ışığın parlaklığı, açısı ve çevresindeki diğer nesneler bilgisayarın yanılmasına neden olabiliyor. Bu yüzden insanlardan bu görselleri ayırmaları istenirken bilgisayarların ya da yazılımların sitelere girişi engelleniyor.
Bilgisayarlar bir şeyleri ayırt etmeyi nasıl öğreniyor?
Yapay zeka sayesinde bilgisayarlar bir şeyleri diğer şeylerden ayırmayı öğrenebiliyor. Öğrenme süreçleri belli olsa da öğrendikten sonra yapay zekanın kafasının nasıl çalıştığını henüz tam olarak bilmiyoruz, karmaşık bir yapay ağ işin içine giriyor.
Öncelikle kendimize bir bot ya da yapay zeka yapmadığımız sürece elde edebileceğimiz bilgiler kısıtlı zira yapay zekalar ve botlar, firmalar için çok değerli ve çok sıkı korunan ticari sırlardır. Çok genel bilgiler dışında bir detay vermezler. Yine de genel yaklaşım az çok bellidir.
Son yıllarda popüler olan nöral ağ sistemlerine de bir bakalım.
Özellikle son yıllarda popüler olan nöral ağ sistemleri için temelde iki tane bot üretilir. Bu botlardan ilki yeni botlar üretir, ikincisi ise yeni botları test eder. Yazının buradan sonrasını kafa karıştırmadan anlatmak için bunlara üretici bot, eğitmen bot ve öğrenci bot diyeceğim.
Üretici bot, öğrenci botlar üretip bunları eğitmen bota gönderir. Eğitmen bot yapmak istediğimiz ayrımı bilmez ancak elinde, cevaplanmış sorulardan oluşan bir test vardır. Bu testi öğrenci botlara uygular. Test sonuçlarıyla birlikte öğrencileri, üreticiye geri gönderir.
Çocuklar okuldan dönünce üretici bot, iyi sonuç alanları kenara ayırıp ötekileri yok eder; yerlerine başarılı örneklerden yola çıkarak başka öğrenci botlar yapar. Yeni botlar yapılması ve test edilmesi süreci bir süre döngü olarak devam eder.
İlk başta şanslı olan öğrenciler hayatta kalırken, bir noktada artık az çok istenilen işi şans eseri değil, yapısı sayesinde yapabilen bir bot ortaya çıkar. O bottan sonraki iterasyonlarda hayatta kalmak için gereken başarı oranı gittikçe artar.
En sonunda da nasıl çalıştığını tam bilmesek de başarıyla çalışan bir yapay zeka botu elde ederiz. Biz insanlar, Captcha testleri ile bu testlere girecek milyarlarca bota uygulanacak milyonlarca soruluk testlerin cevap anahtarlarını oluşturuyoruz.
Bilgisayarlar, öğrendiklerini elbette kullanacak yerlere sahip.
Captcha testlerinden gelen bilgiler, ilk aşamada Google Haritalar gibi hizmetlerin geliştirilmesinde kullanılıyor. Google, Captcha testlerinde kullandığı trafikle ilgili görselleri insanlardan gelen yanıtlarla eşleştirerek haritalarını daha doğru ve güncel tutmaya çalışır. Böylece, Captcha testleri hem web sitelerinin güvenliğini sağlamak hem de haritalama hizmetlerini iyileştirmek için kullanılır.
Bir diğer nokta ise elbette ki otonom sürüş sistemleri. Bu sistemlerin gelişimi için çok büyük miktarda veri gerekiyor. Bu kadar büyük veriyi toplamanın en etkili yollarından biri ise internette gezinen milyarlarca insana görseller hakkında sorular sorarak hali hazırda kontrol verileri oluşturmaktır.
Yani günün sonunda insanlar, Captcha testlerinde botları eğitmek için o kadar trafik sembolüyle mücadele ediyor. Böylece gelecekte daha doğru haritaları takip eden otonom arabalarımız olacak.