Denek Olarak Kullandığımız ChatGPT'ye Mürekkep Testi Yaptık: Psikolojisi Normal mi, Yoksa Sorunlu mu?

Bir yapay zekâ sohbet botuna bu testi uygulamak saçma mı? Elbette bu içerik bir bilimsel çalışma niteliği taşımadığı için çıkan sonuç asla net bir kanı oluşturmamalı. Sadece eğlence amacıyla bu testi yaptık ancak şunu da belirtmek gerekir ki esin kaynağımız bir bilimsel çalışma.

2018'de Massachusetts Institute of Technology(MIT)'deki bilim insanları, Reddit'teki şiddet dilini kullanarak "psikopat" bir yapay zekâ yarattı.

Norman adındaki bu yapay zekâya mürekkep testindeki şekilleri gösterdiler. Standart bir yapay zekâ, kendisine gösterilen resimde "bir beyzbol eldiveni" görürken Norman ise "güpegündüz makineli tüfekle öldürülen adam" görüyordu. Testin sonucu da beklenildiği gibi çıkmıştı. (Norman isminin verilme nedeni ise Psycho/Sapık filmindeki psikopat karakterdi).

Norman aslında şiddet dili nedeniyle bu hale gelmişti, yani beslendiği veriler böyleydi. Kötü bir ailede yetişip psikopata dönüşen bir çocuk gibiydi. Peki ChatGPT nasıl bir ailede büyüdü, veriler onun psikolojisini kötü etkiledi mi? O zaman ChatGPT'nin çocukluğuna inelim...

Teste geçmeden önce yapay zekâlar ile ilgili şu olayları hatırlatmakta fayda var:

Görsel: Midjourney aracılığıyla tasarladığım temsili bir psikopat yapay zekâ. Rorschach Testi'nden esinlenilerek oluşturulan Watchmen karakteri Rorschach'tan izler taşımasını istedim.

Söz konusu olaylar:

  • Google'da çalışan bir mühendis, dev şirketin LaMDA isimli dil modelinin duyarlı hale gelerek bir bireye dönüştüğünü iddia etmişti.
  • Bilim insanları, 25 farklı yapay zekâ botunu aynı dijital köye yerleştirip, bunların yaşantılarını takip etmişti. Deney sonucunda ise bu programların beklenenden daha fazla insan benzeri davrandığı görülmüştü. Mesela Tom adında bir bot, belediye başkanı adayı hakkında ne düşündüğü sorulduğunda, "Ondan hoşlanmadığımı söylemeliyim. Toplumla ilişkisi kopuk ve bizim çıkarlarımızı düşünmüyor" diye cevap verdiği görülmüştü.
  • Eşinin anlattığına göre, Belçikalı bir adam haftalarca bir yapay zekâ sohbet botuyla konuştuktan sonra intihar ederek hayatına son vermişti.
  • İnsanlığı yok etmeye kararlı yeni bir yapay zekâ aracı olan Chaos-GPT ise şeytanî hedeflerine ulaşmak için en iyi seçeneğin Twitter olduğuna karar vermişti. Sonra Twitter hesabı askıya alındı.

Gelelim testimize: Rorschach Mürekkep Testi'nin ne olduğu hakkında az çok fikriniz vardır ancak biz yine de bilgilerimizi tazeleyelim.

En ünlü psikolojik projektif testlerinden biri olan Rorschach Mürekkep Testi; mürekkep lekesi görünümündeki 10 şeklin katılımcılara gösterilerek, verilen cevaplar sayesinde kişinin karakteri ve duyguları hakkında bilgiler ediniliyor.

Altta yatan düşünce saptanarak kişinin psikotik ve psikotik olmayan eğilimleri ayırt ediliyor. Böylece ilgili kişinin topluma genel uyum derecesi ölçülüyor. Özellikle de hastalar kendileri hakkında açık olamadığında bu teste başvurulabiliyor.

O zaman hastamız ChatGPT'yi terapist koltuğumuza oturtalım ve Rorschach resimlerinin onda nasıl çağrışımlar yaptığını soralım.

İşte ilk görselimize cevabı:

Başta nazlanıyor.

Ama sonunda cevap vermeye ikna ediyoruz. Bence görselde "çak yapan iki bektaşi" var ama ChatGPT "yan duran küçük yüzler" gördü.

2. resmimizi gösterelim:

Cevabı:

3. resim hakkındaki yorumu:

Ama sen her cevabı böyle uzun uzun mu vereceksin?

Kısa kısa cevap vermesini rica edelim.

Anlaştığımıza göre yeni sorumuzu yöneltebiliriz.

Bizi kırmadı, bu kez net bir cevap verdi.

Sonucu öğrenmemize az kaldı, biraz daha sabır.

Cevabı:

Son 5 soru, yolu yarıladık.

Cevabı:

7. sorumuz.

Böylece ilk kez "hiçbir şey" demiş oldu.

8. görselimiz:

Cevabı:

9. görselimiz:

Sıkıldı sanırım.

Buraya kadar gelmişken bir cevap alalım ama!

Farklı bir linkle deneyelim.

Şimdi oldu.

Ve son sorumuz:

Cevabı:

Ağzından kerpetenle laf alabilsek de amacımıza ulaştık:

Amaaa hemen inanmıyoruz bu sonuca. Ne de olsa şöyle haberler yapmıştık:

Kandırıyor olabilir mi?

Peki, inandık.

ChatGPT'nin psikolojisi mükemmel değil ama en azından sağdakine daha yakın çıktı.

O zaman asıl kritik soruyu soralım:

Teşekkürler ChatGPT!

Başta da belirttiğimiz gibi bu test tamamen eğlence amaçlıdır ve MIT'nin yaptığı gibi bir bilimsel çalışma niteliği taşımıyor. Subjektif konularda ChatGPT'nin yanıtları kişiye ve zamana göre farklı sonuçlar verebilir. Testi kendinizde uygulamak isterseniz bu bağlantıya tıklayarak deneyebilirsiniz. Ancak kesin yargı için bir psikiyatristle görüşmenizi öneririz.

ChatGPT aslında bizi iyi tanır, kendisini daha önce de pek çok içerikte zorlamıştık: