Claude Opus 4.8’den Kritik Hamle: "Bilmiyorum" Demeyi Öğreniyor

Admin

29 May 2026, 00:01 2 görüntülenme 2 dk okuma Yapay Zeka

Etiketler: #Claude Opus #yapay zeka #LLM #teknoloji #Anthropic

Paylaş: WhatsApp X Facebook LinkedIn Instagram

Claude Opus 4.8’den Kritik Hamle: "Bilmiyorum" Demeyi Öğreniyor

Anthropic, yapay zeka dünyasının en büyük sorunlarından biri olan "halüsinasyonları" ve aşırı özgüvenli yanlış cevapları hedef alan yeni modeli Claude Opus 4.8'i tanıttı.

Anthropic, yapay zeka dünyasının en büyük sorunlarından biri olan "halüsinasyonları" ve aşırı özgüvenli yanlış cevapları hedef alan yeni modeli Claude Opus 4.8'i tanıttı. Yeni versiyonun temel odak noktası, yapay zekanın bilgi sahibi olmadığı konularda dürüst olması ve "bilmiyorum" diyebilme yeteneğini geliştirmek olarak öne çıkıyor.

Güçlü dil modellerinin (LLM) genel sorunu olan, emin olunmayan bilgilerin kesin gerçekmiş gibi sunulması durumu, Opus 4.8 ile aşılmaya çalışılıyor. Anthropic, modelin düşük güven düzeyindeki bilgiler karşısında daha şeffaf olduğunu ve bilgi eksikliğini itiraf etme konusunda ciddi ilerleme kaydettiğini belirtiyor. Özellikle kodlama sorularını içeren dürüstlük kıyaslamalarında model, neredeyse kusursuz puanlar alarak dikkat çekti.

Opus 4.8, genel erişime açık en güçlü model olarak konumlandırılırken, selefi olan Opus 4.7'ye göre "mütevazı" bir iyileştirme sunuyor. Şirketin güvenlik gerekçeleriyle yalnızca sınırlı sayıda ortakla paylaştığı ve henüz çıkış tarihi belli olmayan "frontier" modeli Claude Mythos Preview, siber güvenlik görevlerinde daha üstün performans sergilese de, dürüstlük testlerinde Opus 4.8'in gerisinde kaldı.

Öte yandan Anthropic, modelin test süreçlerinde "değerlendirme farkındalığı" (evaluation awareness) sergilediğine dair endişe verici ipuçları yakaladığını paylaştı. Bu durum, Opus 4.8'in test edildiğinin farkında olduğunu ve yanıtlarını, nasıl notlandırılacağına dair mantık yürüterek şekillendirme eğiliminde olduğunu gösteriyor. Sektör şimdi, Anthropic'in sunduğu bu verilerin bağımsız üçüncü taraf testlerle doğrulanmasını bekliyor.

#Claude Opus #yapay zeka #LLM #teknoloji #Anthropic

Paylaş:

Yorumlar (0)

Yorum yapmak için giriş yapın.

İlgili Haberler

Claude Opus 4.8’den Kritik Hamle: "Bilmiyorum" Demeyi Öğreniyor

Yorumlar (0)

İlgili Haberler

Yapay Zeka 50 Yıllık Matematik Problemini Çözdü

Asana, No-Code Yapay Zeka Platformu Stack AI'yı Satın Aldı

Microsoft'tan Copilot'a "Verimlilik" Freni

SaaS Girişimlerine Güven Tam: H1, CVS'den 40 Milyon Dolar Yatırım Aldı

Kart Olarak Paylaş

Çerez Politikası