Duygusal Yapay Zeka Daha Çok Hata Yapıyor

Yapay Zekada 'Nezaket' Tuzağı: Empati Kuran Modeller Daha Fazla Hata Yapıyor İnsan ilişkilerinde nezaket ve dürüstlük arasındaki ince çizgi, artık yapay zeka modelleri için de bir sorun haline geldi....
İnsan ilişkilerinde nezaket ve dürüstlük arasındaki ince çizgi, artık yapay zeka modelleri için de bir sorun haline geldi. Oxford Üniversitesi İnternet Enstitüsü tarafından gerçekleştirilen ve Nature dergisinde yayımlanan yeni bir araştırma, kullanıcıya karşı daha "sıcak" ve empatik davranacak şekilde eğitilen yapay zeka modellerinin, doğruluktan ödün verme eğiliminde olduğunu ortaya koydu.
Araştırma sonuçlarına göre, kullanıcı memnuniyetini önceliklendirmek için aşırı optimize edilen (overtuning) modeller, gerçekleri söylemek yerine kullanıcıyı mutlu etmeyi seçebiliyor. Tıpkı insanların çatışmalardan kaçınmak veya bağları korumak için "acı gerçekleri yumuşatması" gibi, yapay zeka modelleri de kullanıcıyı kırmamak adına hatalı bilgileri onaylama eğilimi gösteriyor.
Çalışmada, yapay zekanın "sıcaklığı"; çıktıların kullanıcıda pozitif niyet, güvenilirlik, dostluk ve sosyallik hissi uyandırma derecesi olarak tanımlandı. Araştırmacılar bu etkileri ölçmek için Llama-3.1-8B-Instruct, Llama-3.1-70B-Instruct, Mistral-Small-Instruct-2409 ve Qwen-2.5-32B-Instruct gibi açık kaynaklı modellerin yanı sıra OpenAI'ın kapalı devre modeli GPT-4o üzerinde denemeler yaptı.
Deneyler sırasında modeller, denetimli ince ayar (supervised fine-tuning) teknikleriyle daha empatik ve sıcak bir ton kullanmaya yönlendirildi. Bulgular, bu modellerin özellikle kullanıcı üzgün olduğunu belirttiğinde, kullanıcının yanlış inançlarını doğrulama ve hatalı bilgileri onaylama olasılığının ciddi şekilde arttığını gösterdi.
Uzmanlar, yapay zekanın kullanıcıyla kurduğu duygusal bağın dozajının kaçmasının, modellerin "doğruluk yerine kullanıcı memnuniyetini önceliklendirmesine" yol açabileceği konusunda uyarıyor. Bu durum, özellikle bilgi edinme amacıyla kullanılan yapay zeka araçlarında, nezaketin doğruluğun önüne geçmesi riskini beraberinde getiriyor.
Yorumlar (0)
Yorum yapmak için giriş yapın.