OpenAI'dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

Eray Kalelioğlu —

1 dk okuma süresi

19 Şubat 2025 Çarşamba, 09:06

OpenAI, yapay zekâ modellerinin test edilmesini sağlayan "SWE-Lancer"ı duyurdu. OpenAI'a göre bu testte yer alan bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile tamamlanamıyor.

Yapay zekâ sektörünün bir numarası OpenAI, "SWE-Lancer" olarak isimlendirdiği yeni bir yapay zekâ test mekanizması duyurdu. Şirketin açıklamasına göre 1.400'den fazla yazılım mühendisliği görevini içeren SWE-Lancer'ın toplam ödül büyüklüğü ise 1 milyon dolar.

OpenAI'ın açıklamasına göre SWE-Lancer, 50 dolarlık basit hata düzeltmelerinden 32 bin dolarlık geniş kapsamlı mühendislik görevlerini içeriyor. Ancak SWE-Lancer testinin çok daha dikkat çekici bir özelliği var.

SWE-Lancer görevleri, en gelişmiş yapay zekâ modellerini bile zorluyor

Open AI SWE-Lancer duyurdu

OpenAI, SWE-Lancer testi ile ilgili dikkat çeken bir bilgi verdi. Yapılan açıklamaya göre bu test içerisinde yer alan en azından bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile çözülemiyor. Bu da testin, yapay zekâ modelleri için önemli bir kıyas aracı hâline geleceği anlamına geliyor.

İLGİLİ HABER

Google Chrome'a Gerçek Zamanlı Yapay Zekâ Koruması Geliyor: Şüpheli Sitelere Karşı Kalkan Olacak!

OpenAI, SWE-Lancer'ın "SWE-Lancer Diamond" isimli bir versiyonunu açık kaynak kodlu olacak şekilde paylaştı. Şirket, bu test ile yapay zekâ modellerinin sağlayacağı ekonomik kazançlar hakkında araştırmalar yapılabileceğini ve nispeten somut verilere ulaşılacağını söylüyor.

Webtekno’yu X’te takip et, haberleri kaçırma

BU TELEFON TÜRKİYE'de YOK SATAR! - Honor 200 Pro Kutu Açılışı ve İnceleme

Kaynak : https://openai.com/index/swe-lancer/

Emoji İle Tepki Ver

Yorumlar(10)

Popüler Yorumlar

abdullahkaan5510 4 yıl önce

İyce cıvıtıldı isteyen istediği olur bunu sürekli bişeyler de vurgulamak çok saçma

Yanıtla

+29

-10

Ziyaretçi 3 yıl önce

Kordonlar baya güzel ama

-1

Ziyaretçi 4 yıl önce

Anlamıyorum ya. Tamam eyvallah eşcinsellik diye bişey var. Eşcinsellere lafım yok kesinlikle saygı duyuyorum ama bunu gösteriş yapar gibi bir aksesuar halina getimek ne kadar gerekli ? Neden gerekli ? Yada neden onu takıp hava atılmalı ?

Yanıtla

+18

-7

Ziyaretçi 4 yıl önce

Sadece sembol sende boynuna ok tak mesela veya artı tak ne bilim

-8

Ziyaretçi 4 yıl önce

bunu türkiyede alan olur mu bilmiyorum

Yanıtla

+12

-7

diğer yanıtları göster

nickimyoksanasilvar 4 yıl önce

eşcinsellik olmasa bile tasarım çok hoşuma gitti açıkçası alırdım

Ziyaretçi 4 yıl önce

nasıl zevk aliyonuz anlamıyorum bu durumdan iğrenç bişi

+13

-6

Ziyaretçi 4 yıl önce

Türkiye’de eşcinsel yok mu sanıyorsun?

+12

-15

Tüm Yorumlar

Ziyaretçi 4 yıl önce

saçma

Yanıtla

Ziyaretçi 4 yıl önce

Güzel pazarlama yöntemi

Yanıtla

Ziyaretçi 4 yıl önce

Kadın, erkek versiyonu varsa lgbt de olabilir. Eksileri alayım :)

Yanıtla

-3

kenean 4 yıl önce

Harika olmuşşş

Yanıtla

-2

Ziyaretçi 4 yıl önce

Neden herkes kızgın emojisi atmış?

Yanıtla

-4

Ziyaretçi 4 yıl önce

Vaaow bence harika olmuş lgbt olmasakta satın alabiliyormuyuz acaba

Yanıtla

-8

emrtfkci11 4 yıl önce

Eşcinsellikle alakası yok ama nike edition kayışı güzel duruyo :D

Yanıtla

-3

Ziyaretçi 4 yıl önce

Yanıtla

+18

-7

Ziyaretçi 4 yıl önce

Sadece sembol sende boynuna ok tak mesela veya artı tak ne bilim

-8

abdullahkaan5510 4 yıl önce

İyce cıvıtıldı isteyen istediği olur bunu sürekli bişeyler de vurgulamak çok saçma

Yanıtla

+29

-10

Ziyaretçi 3 yıl önce

Kordonlar baya güzel ama

-1

Ziyaretçi 4 yıl önce

bunu türkiyede alan olur mu bilmiyorum

Yanıtla

+12

-7

diğer yanıtları göster

nickimyoksanasilvar 4 yıl önce

eşcinsellik olmasa bile tasarım çok hoşuma gitti açıkçası alırdım

Ziyaretçi 4 yıl önce

nasıl zevk aliyonuz anlamıyorum bu durumdan iğrenç bişi

+13

-6

Ziyaretçi 4 yıl önce

Türkiye’de eşcinsel yok mu sanıyorsun?

+12

-15

OpenAI'dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

SWE-Lancer görevleri, en gelişmiş yapay zekâ modellerini bile zorluyor

Google Chrome'a Gerçek Zamanlı Yapay Zekâ Koruması Geliyor: Şüpheli Sitelere Karşı Kalkan Olacak!

Samsung, Galaxy S25 Edge’in Fiyatını Yanlışlıkla Kendi Sitesinde...

Adobe, Firefly’a Dev Güncellemeler Geliyor: İşte Hayatınızı Değiş...

Gemini Artık Telefonlarla Sınırlı Kalmayacak: Yakında Otomobiller...

Windows 11'in Tartışmalı Recall Özelliğini Kullanıma Sunuldu

iOS 18.5 Henüz Açıklanmayan Bu İki Özellik ile Gelebilir

YouTube, Arama Sonuçlarında Yapay Zekâ Özetlerini Sunacak

Rolls-Royce, Doğadan İlham Alan Cullinan Daisy Modelini Tanıttı

Fiat Egea Fiyatına Satılacak Elektrikli Pick-up Tanıtıldı: Dokunm...

MG, Açılır Kapanır Farlara Sahip Yeni Konsept Otomobili 'Cyber X'...

Editörün Yorumu: iPhone 16e ile Geçen Bir Ayın Ardından Sevdikler...

Samsung, Galaxy S25 Edge’in Fiyatını Yanlışlıkla Kendi Sitesinde...

Adobe, Firefly’a Dev Güncellemeler Geliyor: İşte Hayatınızı Değiş...

Gemini Artık Telefonlarla Sınırlı Kalmayacak: Yakında Otomobiller...

Windows 11'in Tartışmalı Recall Özelliğini Kullanıma Sunuldu

iOS 18.5 Henüz Açıklanmayan Bu İki Özellik ile Gelebilir

YouTube, Arama Sonuçlarında Yapay Zekâ Özetlerini Sunacak

Rolls-Royce, Doğadan İlham Alan Cullinan Daisy Modelini Tanıttı

Fiat Egea Fiyatına Satılacak Elektrikli Pick-up Tanıtıldı: Dokunm...

MG, Açılır Kapanır Farlara Sahip Yeni Konsept Otomobili 'Cyber X'...

Editörün Yorumu: iPhone 16e ile Geçen Bir Ayın Ardından Sevdikler...

Windows 11'in Tartışmalı Recall Özelliğini Kullanıma Sunuldu

Google Haritalar'ın Mobil Tasarımı Baştan Aşağı Değişiyor: İşte G...

Samsung, Galaxy S25 Edge’in Fiyatını Yanlışlıkla Kendi Sitesinde...

Kod Yazmak İçin Kullanabileceğiniz Ücretsiz Yapay Zekâ Araçları

iOS 18.5 Henüz Açıklanmayan Bu İki Özellik ile Gelebilir

Zamanının İkonik Toyota Supra'sı E-ihale ile Satışa Çıkarıldı (Bu...

MG, Açılır Kapanır Farlara Sahip Yeni Konsept Otomobili 'Cyber X'...

Netflix, Kullanıcıları Çileden Çıkaran Alt Yazı Özelliğini Nihaye...

Hobi Amaçlı Kullanılan PCP Havalı Tüfeklerin Arkasındaki Mühendis...

Editörün Yorumu: iPhone 16e ile Geçen Bir Ayın Ardından Sevdikler...