Sakana'dan Devrim: 7B Model, GPT, Claude ve Gemini'yi Yönetiyor!

Yapay zeka dünyasında, LangChain gibi platformlar üzerinden manuel olarak kurgulanan (hardcoded) iş akışları, kullanıcı sorgularının yapısı değiştiği anda kırılmaya mahkum kalıyor.
Yapay zeka dünyasında, LangChain gibi platformlar üzerinden manuel olarak kurgulanan (hardcoded) iş akışları, kullanıcı sorgularının yapısı değiştiği anda kırılmaya mahkum kalıyor. Sakana AI araştırmacıları, bu darboğazı ortadan kaldırmak amacıyla geliştirdikleri yeni sistemle yapay zeka orkestrasyonunda yeni bir dönem başlatıyor.
Sakana AI tarafından tanıtılan "RL Conductor", farklı görevlerde uzmanlaşmış bir grup dil modelini (worker LLMs) yönetmek üzere pekiştirmeli öğrenme (reinforcement learning) yöntemiyle eğitilmiş küçük bir dil modeli. RL Conductor, gelen girdileri dinamik olarak analiz ediyor, iş yükünü çalışan modeller arasında paylaştırıyor ve ajanlar arasındaki koordinasyonu otomatik olarak sağlıyor.
Bu otomatik koordinasyon mekanizması; karmaşık akıl yürütme ve kodlama testlerinde (benchmarks) çarpıcı sonuçlar ortaya koydu. RL Conductor; GPT-5 ve Claude Sonnet 4 gibi sektörün en güçlü modellerini ve pahalı, insan eliyle tasarlanmış çoklu ajan (multi-agent) sistemlerini geride bırakmayı başardı. Üstelik bu yüksek performansı, rakiplerine kıyasla çok daha düşük maliyetle ve daha az API çağrısı kullanarak sunuyor. Sistem, Sakana AI'nın ticari çoklu ajan orkestrasyon servisi olan Fugu'nun temel taşını oluşturuyor.
Mevcut ajan tabanlı çerçevelerin en büyük sorunu ise esneklik eksikliği. Büyük dil modellerinin (LLM) sahip olduğu gizli yetenekleri tam kapasiteyle kullanabilmek, genellikle manuel olarak tasarlanmış iş akışlarına dayanıyor. Ancak bu yapılar, doğası gereği katı ve sınırlayıcı. Makalenin yazarlarından Yujin Tang, VentureBeat'e yaptığı açıklamada mevcut sistemlerin neden yetersiz kaldığını şu sözlerle özetliyor: "LangChain veya Mixture-of-Agents gibi sabit iş akışlarına sahip çerçeveler belirli kullanım durumlarında iyi çalışabilir; ancak üretim aşamasında, çok geniş ve heterojen taleplere sahip kullanıcı kitlelerine hitap ederken kaçınılmaz bir darboğaz oluşuyor."
Tang, gerçek dünyadaki karmaşık ve değişken uygulamalarda genelleme yeteneğine ulaşabilmek için insan eliyle tasarlanmış sabit modellerin ötesine geçilmesi gerektiğini vurguluyor. Dayanıklı ajan sistemleri inşa etmenin önündeki bir diğer engel ise, hiçbir modelin tüm görevler için en optimum seçenek olmaması. Farklı modeller farklı alanlarda uzmanlaşırken, bu uzmanlıkların verimli bir şekilde yönetilmesi kritik bir önem taşıyor.
Yorumlar (0)
Yorum yapmak için giriş yapın.
İlgili Haberler
Trump Yönetimi'nden Nükleer Startuplara Plütonyum Hamlesi
35 seconds ago
Casus Yazılımlara Karşı Telefonunuzdaki Gizli Kalkanlar: İşte Koruyucu Özellikler
3 days ago
Ekran Kartınıza Göre Hangi Oyunlar Çalışır? GPU ve Donanım Uyumluluk Rehberi
3 days ago