Yapay Zekada Darboğaz Bellek: Çip Girişimi 135 Milyon Dolar Yatırım Aldı

ChatGPT'ye her soru sorduğunuzda, arka planda karmaşık bir veri bayrak yarışı başlıyor.
ChatGPT'ye her soru sorduğunuzda, arka planda karmaşık bir veri bayrak yarışı başlıyor. Bilgiler bellekten çıkıp ön işleme için CPU'ya, ardından ağır hesaplamalar için GPU'ya gidiyor ve üretilen her bir kelime için bu yolculuk tekrarlanıyor. Sektörün en pahalı ve yüksek enerji tüketen çiplerini kullanan bu yapısal darboğaz, yapay zeka operasyonlarında ciddi bir verimsizliğe yol açıyor.
Güney Kore ve ABD merkezli girişim XCENA, tam olarak bu sorunu çözmeyi hedefliyor. Dört yıllık girişim, hesaplama yeteneklerini DRAM (işlemcinin aktif olarak kullandığı hızlı kısa süreli bellek) çiplerine çok daha yakın konumlandıran yenilikçi bir çip tasarladı. Bu mimari sayesinde rutin veri işlemleri, CPU, GPU ve bellek arasındaki maliyetli veri trafiğine gerek kalmadan doğrudan belleğe yakın noktalarda gerçekleştirilebiliyor.
Yapay zeka altyapı maliyetlerini radikal şekilde düşürme potansiyeli taşıyan bu teknoloji, yatırımcıların büyük ilgisini çekmiş durumda. XCENA, 570 milyon dolarlık değerleme ile Seri B turunda 135 milyon dolar yatırım topladı ve toplam yatırım miktarını 185 milyon dolara çıkardı. Şirket; Samsung ve SK Hynix gibi Nvidia'nın GPU'larını besleyen bellek devlerinde deneyim kazanmış isimler olan CEO Jin Kim, CTO Dohun Kim ve CPO Harry Juhyun Kim tarafından 2022 yılında kuruldu.
TechCrunch'a konuşan CEO Jin Kim, CPU ve GPU'ların on yıllardır akıllandığını ancak belleğin aynı gelişimi göstermediğini belirterek, yapay zeka altyapısının "bellek merkezli mimarilere" doğru kaydığını vurguladı. Kim, yapay zekadaki "çıkarım" (inference) sürecinin artık sadece bir hesaplama problemi değil, aynı zamanda bir bellek ölçeklendirme problemi olduğunu savunuyor.
Şirketin geliştirdiği MX1 çipi, işlemci ile bellek arasında özel bir hızlı şerit görevi gören CXL (Compute Express Link) üzerinden CPU'ya bağlanıyor. Veriyi bellek modülünden çıkmadan önce işleyen bu sistemle, verinin işlemciye gitmesi yerine hesaplama gücünün veriye getirilmesi sağlanıyor. XCENA, bu teknoloji sayesinde daha önce 10 sunucu gerektiren işlemlerin tek bir sunucuda çalıştırılabileceğini iddia ediyor.
GPU'ların yapay zeka eğitimi için kritik olan matris çarpımlarında uzmanlaştığını ancak ön işleme, KV önbellek yönetimi ve veri önbelleğe alma gibi veri düzenleme görevlerinin hâlâ CPU'lar üzerinde yürütüldüğünü belirten Kim, MX1 çipinin bu görevleri doğrudan bellek modülü içerisinde hallettiğini ifade etti.
Yorumlar (0)
Yorum yapmak için giriş yapın.