IBM, Resimler İçin Başlık Üretebilen Bir Yapay Zeka Geliştirdi

8
3
2
1
1
Hızla gelişen yapay zekâ, artık resimler için başlık üretebiliyor ve resimleri isimlendirebiliyor. IBM'deki bir grup araştırmacı, resimlerin yapay zekâ yardımıyla isimlendirilmesini sağlayan bir algoritma geliştirdi.

Resimlere başlık yazmak sıkıcı ancak gerekli ve genellikle editörler tarafından sevilmeyen bir iş. Neyse ki bunu da artık yapay zekâ yapabilecekmiş gibi duruyor. Bilgisayar Görüşü ve Desen Tanıma 2019 adlı konferansta IBM’deki bir grup araştırmacı tarafından yeni bir model sunuldu. Bu model, resimlere ikna edici bir şekilde insan yapımı gibi duran, farklı ve yaratıcı başlıklar üretebiliyor.

Modeli tasarlamak kolay bir süreç değildi. Algoritma tasarlanırken otomatik başlık üretiminin ana sorununu çözmeyi gerektirdi. Bu sorun; söz dizimsel olarak doğru ancak homojen, yapay ve anlamsal olarak anlaşılmayan cümlelerin ortaya çıkmasıydı. Araştırmacılar, bu sorunu dikkat çekme modeli adını verdikleri bir modülle çözdüler. Bu modül, incelediği fotoğraftaki kareleri kullanarak cümleler oluşturmasını sağlıyor. Her oluşturma aşamasında takımın yapa zekâ modeli, bir önceki aşamadan sözlü ya da görsel işaretlerden yararlanma seçimine sahip.

Oluşturulan başlıkların fazla yapay olmasını önlemek için araştırma takımı, 'Üretken Muhalif Ağ' (GANs) adını verdikleri bir sistemden yararlandı. Bu iki parçalı ağ, örnek üreten kaynaklardan ve gerçek örnekleri oluşturulmuş örneklerden ayırmaya çalışan bir ayrıştırıcıdan oluşuyordu. Bir başka ayrıştırıcı modülü ise cümlelerin doğallığını ölçüyordu.

Algoritmanın çözmesi gereken diğer bir sorun ise aşırı uygunluktu. Aşırı uygunluk, öğrenilen objelerin görünmeyen içeriklerinde ortaya çıkmasına neden oluyordu. Yapay zekânın eğitim verisindeki bu sapmayı önlemek için araştırmacıların bir teşhis cihazı inşa etmesi gerekti. Böylelikle araştırmacılar, hangi başlıklarda aşırı uyumluluk olduğunu görebildiler.

Başlık üretme algoritması insanlı bir deneye de sokulmuş. Deneyde; insanlardan hangi başlıkların makine tarafından üretildiğini seçmeleri ve başlıkların, verilen resimlerle ne kadar ilgili olduklarını değerlendirilmesi istenmiş. Modelin deney sonucunda iyi performans sergilendiği belirtiliyor.

Araştırmacılar, “Resimlerin otomatik olarak isimlendirilmesi ve görüntü anlama özelliği, yapay zekâyı görme konusunda sıkıntısı olan insanlar için daha kullanışlı bir hâle getirecek ve onların gündelik yaşamlarını kolaylaştıracak“ şeklinde bir açıklamada da bulundu.

Kaynak : https://venturebeat.com/2019/06/20/ibms-ai-automatically-generates-creative-captions-for-images/
8
3
2
1
1
Emoji İle Tepki Ver
8
3
2
1
1