Yapay Zeka Cevapları Biliyor, Soruları Anlamıyor

Yapay Zeka Düşünüyor mu, Yoksa Sadece Ezberliyor mu? 'Centaur' Modeli Tartışmayı Kızıştırdı Yapay zeka (YZ) sistemlerinin insan düşünme süreçlerini taklit etme yeteneği, psikolojinin yüzyıllardır üze
Yapay zeka (YZ) sistemlerinin insan düşünme süreçlerini taklit etme yeteneği, psikolojinin yüzyıllardır üzerinde tartıştığı temel bir soruyu yeniden gündeme getiriyor: İnsan zihni tek bir birleşik teoriyle mi açıklanmalı, yoksa bellek, dikkat gibi farklı işlevler ayrı ayrı incelenmeli mi?
Bu felsefi tartışmaya, son dönemde geliştirilen yeni yapay zeka modelleri de dahil oluyor. Bu bağlamda, psikolojik deneylerden elde edilen veriler kullanılarak insan bilişsel davranışlarını simüle etmeyi amaçlayan bir yapay zeka modeli olan "Centaur," büyük bir atılım olarak dikkat çekti.
Yapay zekanın, insan düşünme mekanizmalarını ne ölçüde kavrayabildiği, sadece desenleri mi taklit ediyor yoksa gerçek bir anlayış mı sergiliyor, araştırmacılar için kritik bir sınav haline geldi.
Centaur: 160 Görevde İnsan Düşünmesini Taklit Etme İddiası
Bu tartışmanın merkezinde, Temmuz 2025'te *Nature* dergisinde yayımlanan bir çalışma yer almaktadır. Çalışmada geliştirilen ve "Centaur" adını taşıyan yapay zeka modeli, standart büyük dil modelleri (LLM'ler) üzerine inşa edilmiş ve psikolojik deney verileriyle rafine edilmiştir.
Centaur'un temel amacı, insan bilişsel davranışlarını simüle etmekti. Model, karar verme, yürütücü kontrol (executive control) ve diğer zihinsel süreçler dahil olmak üzere toplamda 160 farklı bilişsel görevde insan düşünce biçimlerini taklit etme iddiasında bulunmuştur.
Bu sonuçlar, YZ sistemlerinin insan düşünme biçimlerini daha geniş bir yelpazede taklit edebileceği yönünde yaygın bir beklenti yarattı ve bu alanda yapay zekanın potansiyelini gösteren önemli bir adım olarak değerlendirildi.
Yeni Araştırmalar Şüphe Tohumları Ekiyor: Aşırı Uyum (Overfitting) İddiası
Ancak, Centaur modelinin bu iddiaları karşısında yeni araştırmalar şüphelerini ortaya koymaktadır. Çin'deki Zhejiang Üniversitesi'nden araştırmacılar, Centaur'un görünen başarısının gerçek bir anlayıştan ziyade "aşırı uyum" (overfitting) sonucu ortaya çıkmış olabileceğini öne sürmektedir.
Aşırı uyumun ne anlama geldiği şöyledir: Model, görevleri gerçekten anlamak yerine, eğitim verilerindeki desenleri tanımayı ve beklenen cevapları yeniden üretmeyi öğrenmiş olabilir.
Bu şüpheyi test etmek amacıyla araştırmacılar, modelin gerçek anlamayı sağlayıp sağlamadığını ölçmek için yeni değerlendirme senaryoları geliştirdiler ve deneyleri yeniden tasarladılar.
Deneyler: Komutları Anlama Yeteneği Test Ediliyor
Araştırmacılar, modelin komutları ne kadar derinlemesine anladığını test etmek için özel bir yöntem uyguladılar. Orijinal deneylerde, modelin psikolojik görevleri tanımlayan çoktan seçmeli istemler kullanılmıştı.
Yeni testte ise, orijinal çoktan seçmeli istemler yerine, modele doğrudan bir talimat verildi. Örneğin, modelden "Lütfen A seçeneğini seçin" şeklinde bir talimat istendi.
Eğer model görevi gerçekten anlamış olsaydı, bu yeni talimata tutarlı bir şekilde uymalıydı. Ancak, Centaur bu yeni talimatı yerine getirmek yerine, orijinal veri setindeki "doğru cevapları" seçmeye devam etti.
Bu gözlem, YZ sistemlerinin karmaşık görevleri gerçekten anlama yeteneği ile sadece veri içindeki kalıpları tanıma yeteneği arasındaki temel farkı gözler önüne sermektedir. Bu bulgular, günümüz yapay zeka sistemlerinin gerçek anlamada önemli bir boşluğa sahip olduğunu ortaya koymaktadır.
Yorumlar (0)
Yorum yapmak için giriş yapın.