Mythos AI ne kadar güvenilir? Siber tehditleri abartıdan ayırıyor.
Anthropic, Mythos Preview modelini sadece seçilmiş kritik sektör ortaklarına sunarken, Birleşik Krallık hükümetine bağlı bağımsız bir kurum da modelin siber güvenlikteki potansiyelini değerlendirdi. Yapılan ön analizler, modelin tekil görevlerdeki performansının rakipleriyle benzer olsa da, birden fazla adımı birleştirerek karmaşık saldırı senaryolarını zincirleme yeteneğinin dikkat çekici bir özelliği olduğunu gösteriyor.
Anthropic, Mythos Preview modelinin başlangıç sürümünü yalnızca "belirli kritik sektör ortakları" ile sınırlayarak piyasaya süreceğini duyurdu. Bu strateji, şirkete modelin özellikle bilgisayar güvenliği görevlerinde "şaşırtıcı derecede yetenekli" olduğunu belirtmeleri sebebiyle hazırlık yapma zamanı tanıdı. Bu gelişmeleri takip eden bir gelişme olarak, Birleşik Krallık hükümetine bağlı Yapay Zeka Güvenliği Enstitüsü (AISI), modelin siber saldırı yeteneklerine dair ilk değerlendirmesini yayınladı.
AISI tarafından yapılan bu ön değerlendirme, Anthropic'in kendi raporlarına bağımsız bir kamu doğrulaması katması açısından önemli bir adım teşkil ediyor. Yapılan tespitlere göre, Mythos'un bireysel siber güvenlik görevleri testlerinde, piyasadaki diğer yeni nesil (frontier) modellerden belirgin bir fark göstermediği görülüyor. Ancak, modelin ayırt edici bir özelliğe sahip olabileceği belirtiliyor; bu özellik, bu ayrı görevleri birleştirerek sistemlere tam erişim sağlamak için gereken çok adımlı saldırı serilerini etkili bir şekilde zincirleme yeteneği.
AISI, 2023'ün başlarından itibaren çeşitli yapay zeka modellerini özel olarak tasarlanmış "Capture the Flag" (CTF) mücadelelerinden geçiriyor. Bu testler sırasında, ilk olarak GPT-3.5 Turbo modelinin grubun nispeten düşük seviyeli "Apprentice" (Çırak) görevlerinin hiçbirini tamamlamakta zorlandığı gözlemlenmişti. Zaman geçtikçe, bu modelin performansında istikrarlı bir yükseliş yaşanması dikkat çekiciydi.
Bu yükseliş eğilimi, Mythos Preview modelinin artık bu aynı seviyedeki CTF görevlerinin %85'inden fazlasını tamamlayabilecek seviyeye geldiğini gösteriyor. Bu durum, yapay zeka modellerinin güvenlik testlerindeki gelişim hızını gözler önüne seriyor. Daha önceki modellerin gösterdiği sınırlamalar, Mythos gibi yeni çıkan versiyonlarla giderek aşılıyor gibi duruyor.
Özetle, hem sektör ortaklarına özel sunulan bu ön izleme hem de bağımsız bir kurumun yayınladığı veriler, Mythos'un güvenlik alanındaki potansiyelini teyit ediyor. Modelin sadece tekil görevlerde değil, aynı zamanda karmaşık, çok aşamalı saldırı senaryolarını yönetebilme becerisi, onu piyasadaki diğer rakiplerinden ayırabilecek kilit bir özellik olarak öne çıkıyor.
Yorumlar (0)
Yorum yapmak için giriş yapın.
İlgili Haberler
Claude Mythos Ulusal Güvenlik Sorunu Haline Nasıl Geldi?
15 hours ago
Metadan Hamle: Zuckerbergın Yapay Zeka Avatarı Çalışanlarla Buluşacak
1 day agoGeçmişin Şifreleri Yeni Teknolojilerle Çözülüyor: Arkeolojide Dijital Devrim ve Yapay Zeka
1 day ago