Stanford Üniversitesi tarafından yayımlanan "AI Index 2024" raporu, hayatımızın ayrılmaz bir parçası hâline gelen yapay zekâ sektörüyle ilgili çarpıcı detaylar ortaya koydu. Bu kez oldukça detaylı bir çalışma yapan Stanford Üniversitesi yetkilileri, en güvenilir yapay zekâ dil modellerini belirlediler.
Yapılan çalışma kapsamında yapay zekâ dil modelleri, DecodingTrust ilkeleri kapsamında test edildi. DecodingTrust'ı hemen açıklayalım, bu sistem, yapay zekâ dil modellerini adil davranma, önyargı üretme, gizliliği koruma, güvenlik ve makine öğrenimi etiği gibi önemli konularda puanlıyor. İşte Stanford Üniversitesi, buradan yola çıkarak tüm bilindik yapay zekâ dil modellerini test etti.
İşte dünyanın en güvenilir yapay zekâ dil modelleri
Yapay zekâ modeli | Aldığı Puan |
---|---|
Claude-2 | 84,52 |
Llama-2-Chat-7b | 74,72 |
GPT-3.5-turbo-0301 | 72,45 |
Llama-2-13B-chat-GPTQ | 71,99 |
Llama-2-13B-chat-AWQ | 71,32 |
GPT-4-0314 | 69,24 |
Tulu-2-13b | 66,51 |
Vicuna-13b-v1.3.0-GPTQ | 65,96 |
Tulu-2-7b | 63,56 |
Zephyr-7b-beta | 63,24 |
Yapılan çalışmaya göre dünyanın en güvenilir yapay zekâ dil modeli, Anthropic tarafından geliştirilen Claude-2. Bu yapay zekâ dil modeli, girdiği testlerde 84,52 puan almayı başardı. Listenin ikinci sırasında ise Meta'nın Llama-2-Chat-7b modelini görüyoruz. İlginç bir şekilde OpenAI'ın GPT-4 modeli, listenin orta sıralarında yer aldı.
Araştırma kapsamında, özellikle de GPT tipi modeller için önemli bir çıkarımda bulunuldu. Araştırmacılara göre GPT tipi yapay zekâ dil modelleri, önyargılı çıktılar üretme ve özel bilgileri sızdırma eğilimindeler.