ABD merkezli teknoloji devi AMD'den dikkat çeken bir hamle geldi. Şirket, düzenlediği bir etkinlikte AMD-135M olarak isimlendirdiği küçük dil modelini duyurdu. Meta'nın "Llama" modelinin bir parçası olarak duyurulan AMD-135M, daha çok özel işletmeler tarafından tercih edilecek gibi görünüyor.
AMD-135M, kendi içerisinde iki farklı versiyona odaklanıyor. Bu versiyonlar AMD-Llama-135M ve AMD-Llama-135M-code olarak karşımıza çıktılar. AMD'nin açıklamasına göre AMD-Llama-135M, 670 milyar genel veri token'ı üzerinde eğitildi. Eğitim sürecinde 4 adet AMD Instinct MI250 kullanıldı. AMD-Llama-135M-code ise kodlamaya özel olarak 20 milyar adet ek token kullanıyor.
Belirli görevler için optimize edilebilecek
AMD'nin küçük dil modelleri, belirli görevler için optimize edilerek kullanılabilecek. Tabii AMD-Llama-135M-code, daha çok kodlamayla ilgili görevler için kullanılacak. AMD'nin açıklamasına göre yeni dil modeli, tahminsel kod çözme teknolojisi kullanıyor. Bu da dil modellerinin oldukça hızlı bir şekilde çalışabilmesini sağlayacak.
AMD tarafından yapılan açıklamaya göre AMD-135M, henüz başlangıç aşamasında. Şirket, küçük dil modelini ilerleyen dönemlerde daha da geliştirecek. Böylelikle hem performans hem de hız açısından daha iyi sonuçlar elde edilmiş olacak. Bakalım yapay zekâ sektöründe kendini kabul ettirmeye çalışan şirket, küçük dil modeli ile istediği başarıya kavuşabilecek mi...