Yapay Zekada 1000 Kat Verimlilik İddiası: Gözler Kanıtlarda!

Miami merkezli yeni girişim Subquadratic, yapay zeka dünyasında taşları yerinden oynatabilecek iddialı bir duyuruyla gizlilik perdesini kaldırdı.
Miami merkezli yeni girişim Subquadratic, yapay zeka dünyasında taşları yerinden oynatabilecek iddialı bir duyuruyla gizlilik perdesini kaldırdı. Şirket, 2017'den bu yana tüm büyük yapay zeka sistemlerini kısıtlayan matematiksel engeli tamamen aşan ilk büyük dil modelini (LLM) geliştirdiğini öne sürüyor.
Şirketin piyasaya sürdüğü ilk model olan SubQ 1M-Preview, tamamen "subquadratic" (alt-karesel) bir mimari üzerine inşa edildi. Bu mimari sayesinde hesaplama maliyetleri, bağlam uzunluğuyla doğru orantılı olarak doğrusal bir şekilde artıyor. Eğer bu iddialar doğrulanırsa, yapay zeka sistemlerinin ölçeklendirilme biçiminde gerçek bir kırılma noktası yaşanmış olacak. Subquadratic, 12 milyon token seviyesinde, kendi mimarisinin dikkat (attention) hesaplamalarını diğer öncü modellere kıyasla yaklaşık 1.000 kat azalttığını savunuyor. Bu rakam, bağımsız olarak onaylanması durumunda, mevcut tüm verimlilik artışlarını gölgede bırakacak seviyede.
Teknolojik atılımın yanı sıra şirket, üç yeni ürününü kapalı beta sürecine taşıyor: Tam bağlam penceresine erişim sağlayan bir API, komut satırı tabanlı bir kodlama ajanı olan SubQ Code ve gelişmiş bir arama aracı olan SubQ Search. Finansman tarafında ise Tinder kurucu ortağı Justin Mateen ve eski SoftBank Vision Fund ortağı Javier Villamizar'ın yanı sıra Anthropic, OpenAI, Stripe ve Brex'in erken dönem yatırımcılarından 29 milyon dolarlık tohum yatırım alan girişimin, The New Stack tarafından 500 milyon dolar değerleme ile karşılandığı bildirildi.
Subquadratic tarafından paylaşılan olağanüstü rakamlar, yapay zeka araştırma topluluğunda geniş bir yankı uyandırdı. Sektördeki tepkiler, yoğun bir meraktan "vaporware" (gerçekte var olmayan ürün) suçlamalarına kadar geniş bir yelpazeye yayılıyor. Bu şüphelerin temelinde ise şirketin çözdüğünü iddia ettiği "karesel ölçekleme" probleminin, bugüne kadar OpenAI, Anthropic ve Google gibi devlerin kullandığı tüm Transformer tabanlı modellerin merkezinde yer alması yatıyor. Mevcut sistemlerde her token'ın diğer tüm token'larla karşılaştırıldığı "attention" mekanizması, girdi miktarı arttıkça gereken hesaplama gücünün katlanarak artmasına neden oluyor ve bu durum tüm endüstrinin ekonomik sınırlarını belirliyor.
Yorumlar (0)
Yorum yapmak için giriş yapın.