Türkçe’de dil cinsiyetsizdir, yani sözcüklerin bir cinsiyeti yoktur. Zamirlerimiz de cinsiyetsizdir, biz 'O' zamirini kullansak da çoğu dilde erkek ve kadınlar için ayrı sözcükler bulunmaktadır. Pek çok dilde cinsiyetlere göre kalıplar vardır.
Google daha önce Türkçe/İngilizce çevirilerde yeni bir alternatif sunmuştu. Cümleleri çevirirken hem erkek hem de kadın zamirlere göre ayrı çeviri alternatifleri ortaya çıkıyordu. Google, yeni tekniklerinin bu yöntemden daha gelişmiş olduğunu söylüyor.
Cinsiyetlere özel çeviri:
Google’ın yeni yapay zekâ sistemi, şu anda dört farklı dil için kullanılabiliyor. Sistem, İngilizce’den İspanyolca, Fince, Macarca’ya ve Farsça’dan İngilizce’ye olacak şekilde çalışıyor. Google Research'ten kıdemli yazılım mühendisi Melvin Johnson, “Cinsiyetlere özel çeviriler konusunda başlangıçtan bu yana oldukça ilerledik ve 4 dil çiftine geliştirdik. Google Çeviri’nin cinsiyetlere dayalı kalıpları kullanmasına kendimizi adıyoruz ve bunun doküman seviyesindeki çevirilerde de kullanılabilmesi için çalışıyoruz” dedi.
Johnson’un açıklamalarına göre daha önce Türkçe için kullanılan NMT teknolojisi istenilen başarıyı yakalayamadı. Ayrıca bu yöntem, cinsiyetlere özel çevirilerin aktarılmasında da ciddi oranda sorunlarla karşılaştı.
Google yapay zekânın mantığını değiştirdi:
Eski yapay zekâda çeviri yapılırken önce cinsiyetlere ait kalıplar belirleniyordu. Yeni yöntemdeyse öncelikli olarak çeviri yapılırken daha sonra cinsiyetlere uygun değişiklik yapılıyor. Google’a göre yeni sistem milyonlarca örnekle eğitiliyor. Bu eğitim süreci; deyimlerden, sözcük öbeklerinden ve kalıplardan oluşuyor. Ardından da çeviriler için cinsiyetlere yönelik kalıplar değiştiriliyor.
Çeviri metinlerde vurgular, noktalama işaretleri ve aksanlar işleniyor. Geliştirilen model, %99 oranda istenen cinsiyete göre çeviri yapılmasını başarıyor. Ayrıca yeni yöntemle birlikte Google’ın cinsiyetçi kalıplarından uzaklaşma amacına bir adım daha yaklaşılıyor. Google, Cloud Vision API’sinde görsellerdeki erkek ve kadın etiketlerini kaldırmıştı.