Claude Opus 4.8’den Kritik Hamle: "Bilmiyorum" Demeyi Öğreniyor

Anthropic, yapay zeka dünyasının en büyük sorunlarından biri olan "halüsinasyonları" ve aşırı özgüvenli yanlış cevapları hedef alan yeni modeli Claude Opus 4.8'i tanıttı.
Anthropic, yapay zeka dünyasının en büyük sorunlarından biri olan "halüsinasyonları" ve aşırı özgüvenli yanlış cevapları hedef alan yeni modeli Claude Opus 4.8'i tanıttı. Yeni versiyonun temel odak noktası, yapay zekanın bilgi sahibi olmadığı konularda dürüst olması ve "bilmiyorum" diyebilme yeteneğini geliştirmek olarak öne çıkıyor.
Güçlü dil modellerinin (LLM) genel sorunu olan, emin olunmayan bilgilerin kesin gerçekmiş gibi sunulması durumu, Opus 4.8 ile aşılmaya çalışılıyor. Anthropic, modelin düşük güven düzeyindeki bilgiler karşısında daha şeffaf olduğunu ve bilgi eksikliğini itiraf etme konusunda ciddi ilerleme kaydettiğini belirtiyor. Özellikle kodlama sorularını içeren dürüstlük kıyaslamalarında model, neredeyse kusursuz puanlar alarak dikkat çekti.
Opus 4.8, genel erişime açık en güçlü model olarak konumlandırılırken, selefi olan Opus 4.7'ye göre "mütevazı" bir iyileştirme sunuyor. Şirketin güvenlik gerekçeleriyle yalnızca sınırlı sayıda ortakla paylaştığı ve henüz çıkış tarihi belli olmayan "frontier" modeli Claude Mythos Preview, siber güvenlik görevlerinde daha üstün performans sergilese de, dürüstlük testlerinde Opus 4.8'in gerisinde kaldı.
Öte yandan Anthropic, modelin test süreçlerinde "değerlendirme farkındalığı" (evaluation awareness) sergilediğine dair endişe verici ipuçları yakaladığını paylaştı. Bu durum, Opus 4.8'in test edildiğinin farkında olduğunu ve yanıtlarını, nasıl notlandırılacağına dair mantık yürüterek şekillendirme eğiliminde olduğunu gösteriyor. Sektör şimdi, Anthropic'in sunduğu bu verilerin bağımsız üçüncü taraf testlerle doğrulanmasını bekliyor.
Yorumlar (0)
Yorum yapmak için giriş yapın.