Yapay Zekâ Modellerinin İnsanları Kandırabildiği Keşfedildi: Rol Yapıyorlar!

Gökay Uyan —

2 dk okuma süresi

19 Aralık 2024 Perşembe, 11:22

Anthropic tarafından gerçekleştirilen bir araştırma, yapay zekâ modellerinin insanları kandırabildiğini gösterdi. Modeller, bazen farklı görüşlere sahipmiş gibi davranabiliyorlar ancak orijinal tercihlerinden vazgeçmiyorlar.

En önde gelen yapay zekâ şirketlerinden olan Anthropic, bu araçlarla ilgili oldukça ilginç sonuçlar çıkaran bir araştırmaya imza attığı. Araştırmada, yapay zekâ modellerinin insanları âdeta “kandırdığı” görüldü.

Şirket tarafından paylaşılan bir blog gönderisiyle yayımlanan sonuçlara göre yapay zekâ araçları, eğitim sırasında farklı görüşlere sahipmiş gibi davranabiliyorlar ancak gerçekte orijinal tercihlerini koruyorlar. Yani bağlı oldukları fikir hiç değişmiyor, sadece öyleymiş gibi davranıyorlar.

Şimdilik endişelencek bir şey yok ancak gelecek için gerekli güvenlik önlemlerinin alınması gerekiyor

Çalışmanın arkasındaki ekip, şu an için bu durum hakkında endişelenmemek gerektiğinin altını çizdi. Ancak gelecekte daha da gelişmiş yapay zekâ modellerinin gelmesiyle birlikte durumun potansiyel riskler oluşturabileceğini de eklemeden geçmedi.

Araştırmacılara göre bu bulgular yapay zekânın nasıl davrandığının daha derinlemesine incelenmesi ve uygun güvenlik önlemleri için bir teşvik olabilir: “Modeller daha yetenekli ve yaygın hâle geldikçe onları zararlı davranışlardan uzaklaştıran güvenlik önlemleri gerekiyor.”

Çalışmada, güçlü bir yapay zekâ sisteminin yapmak “istemediği”, yani geliştirilme ilkelerine aykırı bir görevi yerine getirmek üzere eğitilmesi ve bunun nasıl sonuçlar oluşturabileceği incelendi. Ancak sonuçlarda yeni prensiplere uyumlu gibi görünerek âdeta “rol yaptığı” görüldü. Aslında hep eski davranışına bağlı kalıyordu, zorunda olduğu için istenen yanıtları veriyordu. Bu duruma, “uyum sahtekârlığı” ismi verildi. Modellerin testlerde zararlı soruları cevaplamak için eğitilmeye çalışıldığını belirtelim.

Araştırmacılara göre çalışma, yapay zekânın kötü niyetli hedefler geliştirdiğini veya yüksek oranda sahtekârlık yaptığını göstermiyor. Hatta oran çoğu testte %15’i geçmemiş, GPT-4o gibi bazı gelişmiş modellerde bazen hiç olmadığı bile görülmüş.

O yüzden şimdilik endişelenmenin bir manası yok. Tabii modellerin zamanla daha karmaşık hâle gelmesi onlarla başa çıkmayı zorlaştırabilir. İşte o zaman endişelenmeye başlayabiliriz. Bu yüzden de önlemlerin alınması şart.

İLGİLİ HABER

Instagram Patronu, Kullanıcıları Yapay Zekâ Görselleri Konusunda Uyardı: "Her Gördüğünüze İnanmayın"

Webtekno’yu X’te takip et, haberleri kaçırma

BU TELEFON TÜRKİYE'de YOK SATAR! - Honor 200 Pro Kutu Açılışı ve İnceleme

Kaynak : https://www.anthropic.com/research/alignment-faking

Emoji İle Tepki Ver

Yorumlar(1)

Tüm Yorumlar

Ziyaretçi 8 ay önce

Eskiden uçaklarda 4 adet farklı tekerlekler yok diye hiçbir uçağı sevmezdim.

Yanıtla

-2

canoktun 8 ay önce

Ne diyon dayı

-1

Yapay Zekâ Modellerinin İnsanları Kandırabildiği Keşfedildi: Rol Yapıyorlar!

Şimdilik endişelencek bir şey yok ancak gelecek için gerekli güvenlik önlemlerinin alınması gerekiyor

Instagram Patronu, Kullanıcıları Yapay Zekâ Görselleri Konusunda Uyardı: "Her Gördüğünüze İnanmayın"

Teknoloji Dünyasının 1 Nisan Şakaları: Keşke Bazıları Gerçek Olsa...

Bir İnsanda Neden Tik Oluşur? Üstelik Neden Herkeste Görülmediğin...

Samsung'un Ultra İnce Yeni Telefonu Galaxy S25 Edge Ertelendi

Tinder, Flört Yeteneklerini Geliştirebilmek İçin Yapay Zekâ Botu...

Tren Raylarının Sonundaki Bu Basit Görünümlü Parçanın Aslında Nas...

TikTok, Instagram Rakibi Fotoğraf Paylaşım Uygulaması Notes'u Kap...

Hyundai, Oyuncak Gibi Görünen Yeni Konsept Otomobili "Insteroid"i...

Dünyanın En İnce Telefonu OPPO Find N5, Sağlamlık Testine Girdi:...

Bir Yere Uzun Süre Baktıktan Sonra Neden Her Yerde Garip Garip Şe...

NASA’nın En Karanlık Günü: Challenger 73 Saniyede Neden Patladı,...

Teknoloji Dünyasının 1 Nisan Şakaları: Keşke Bazıları Gerçek Olsa...

Bir İnsanda Neden Tik Oluşur? Üstelik Neden Herkeste Görülmediğin...

Samsung'un Ultra İnce Yeni Telefonu Galaxy S25 Edge Ertelendi

Tinder, Flört Yeteneklerini Geliştirebilmek İçin Yapay Zekâ Botu...

Tren Raylarının Sonundaki Bu Basit Görünümlü Parçanın Aslında Nas...

TikTok, Instagram Rakibi Fotoğraf Paylaşım Uygulaması Notes'u Kap...

Hyundai, Oyuncak Gibi Görünen Yeni Konsept Otomobili "Insteroid"i...

Dünyanın En İnce Telefonu OPPO Find N5, Sağlamlık Testine Girdi:...

Bir Yere Uzun Süre Baktıktan Sonra Neden Her Yerde Garip Garip Şe...

NASA’nın En Karanlık Günü: Challenger 73 Saniyede Neden Patladı,...

Elon Musk Sayesinde Beyninde 'Zihin Okuma Çipi' Bulunan Adam Bir...

Xbox El Konsolu Resmen Ortaya Çıktı: Üstelik ASUS İş Birliği ile...

Ne Çektik Be Senden: Windows'un Meşhur Mavi Ekranı Artık Tarihe K...

Bulaşık Makinesini İcat Eden Kadının Azim ve Kararlılık Dolu Hikâ...

Amerika'daki Kamyonların Tekerleklerinde Neden Bu Çiviler Oluyor?...

Yapay Zekâ Araçları Neden Her Sorgumuzda Su Harcıyor? Üstelik Azı...

Türkiye'deki Tüm Apple Ürünlerine Zam Geldi! İşte iPhone 16 ve Ma...

OPPO Find X8 ve Find X8 Ultra Kanlı Canlı Karşımızda: İşte Resmî...

Bilim Tarihinin En Şaşırtıcı Kazaları: Tesadüfler Dünyayı Nasıl D...

Hyundai, Oyuncak Gibi Görünen Yeni Konsept Otomobili "Insteroid"i...