Yapay zekâ sektörünün bir numarası OpenAI, "SWE-Lancer" olarak isimlendirdiği yeni bir yapay zekâ test mekanizması duyurdu. Şirketin açıklamasına göre 1.400'den fazla yazılım mühendisliği görevini içeren SWE-Lancer'ın toplam ödül büyüklüğü ise 1 milyon dolar.
SWE-Lancer görevleri, en gelişmiş yapay zekâ modellerini bile zorluyor
OpenAI, SWE-Lancer testi ile ilgili dikkat çeken bir bilgi verdi. Yapılan açıklamaya göre bu test içerisinde yer alan en azından bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile çözülemiyor. Bu da testin, yapay zekâ modelleri için önemli bir kıyas aracı hâline geleceği anlamına geliyor.
OpenAI, SWE-Lancer'ın "SWE-Lancer Diamond" isimli bir versiyonunu açık kaynak kodlu olacak şekilde paylaştı. Şirket, bu test ile yapay zekâ modellerinin sağlayacağı ekonomik kazançlar hakkında araştırmalar yapılabileceğini ve nispeten somut verilere ulaşılacağını söylüyor.