Bir süredir yapay zekâ sektöründeki çalışmalarına hız veren Çinli e-ticaret devi Alibaba, "Qwen2.5-Max" olarak isimlendirdiği yeni yapay zekâ modelini duyurdu. Qwen2.5 üzerine inşa edilen yeni model, Alibaba'nın bile Çinli yapay zekâ girişimi DeepSeek'ten tedirgin olmaya başladığını gözler önüne seriyor. Zira Alibaba, Çin'de tatil dönemine girilmiş olunan bir dönemde bu duyuruyu gerçekleştirdi.
İşte Qwen2.5-Max için yayımlanan test sonuçları
Qwen2.5-Max'in girdiği testlere baktığımız zaman en etkileyici sonucun Arena-Hard testinde alındığını görüyoruz. LiveBench testinde de tüm rakiplerini geride bırakan yapay zekâ modeli MMLU-Pro tesinde üçüncü, GPQA-Diamond ile LiveCodeBench testlerinde ise ikinci oldu. Yapay zekânın birinci olduğu Arena-Hard testinin insan tercihlerini tahmin etmeye yönelik olduğunu belirtelim. Yani Qwen2.5-Max, rakiplerine kıyasla en çok insan gibi düşünebilen yapay zekâ modeli oldu.
Alibaba, yeni yapay zekâ modelini burada bulunan bağlantı üzerinden ulaşabileceğiniz Owen Chat arayüzü üzerinden erişime açmış durumda. Yeni modelin gerçek kullanımda neler sunacağı, kullanıcılar tarafından yapılacak testler ile gün yüzüne çıkmış olacak.