Strava, Halka Arz Öncesi Veri Kazıyıcılara Savaş Açtı

Yapay zeka şirketlerinin modellerini eğitmek için ihtiyaç duyduğu devasa veri setleri, bu şirketleri adeta "veri canavarına" dönüştürmüş durumda.
Yapay zeka şirketlerinin modellerini eğitmek için ihtiyaç duyduğu devasa veri setleri, bu şirketleri adeta "veri canavarına" dönüştürmüş durumda. Bu açlığı gidermek isteyen birçok yapay zeka girişimi, internetin temel taşlarından biri olan ve otomatik tarayıcılara hangi bölümlerin yasak olduğunu bildiren "robots.txt" dosyalarını görmezden gelerek agresif veri kazıma (scraping) yöntemlerine başvuruyor. Bu durum, web sitelerini verilerini korumak için erişim kısıtlamaları getirmeye veya yapay zeka şirketleriyle mali lisans anlaşmaları imzalamaya zorluyor.
Popüler fitness ve sosyal koşu platformu Strava, bu küresel trende karşı sert önlemler alarak web sitesine erişimi kısıtlama ve geliştirici erişimleri için ücretlendirme sistemine geçme kararı aldı. Veri kazıma faaliyetlerini durdurmak isteyen şirket, web sitesi güvenliğini artırarak belirli verilere erişimi yalnızca kimliği doğrulanmış (giriş yapmış) kullanıcılara açacak. Daha önce kamuya açık profiller ve fitness kulübü listeleri gibi detaylar giriş yapmadan görüntülenebilirken, artık tüm bu veriler yetkisiz yapay zeka taramalarını önlemek amacıyla kimlik doğrulama duvarının arkasına alınacak.
Geliştirici tarafında da köklü değişikliklere giden Strava, API erişim modelini güncelliyor. Daha önce geliştiriciler, ücretsiz ve kademeli bir erişim programı aracılığıyla temel erişimle başlayıp uygulamaları büyüdükçe daha fazla yetki talep edebiliyordu. Ancak yeni düzenleme ile tüm geliştiriciler için aylık 11,99 dolarlık sabit bir ücret getiriliyor. Şirket, bu fiyatın coğrafi bölgelere göre değişiklik gösterebileceğini belirtirken, geliştirici topluluğunun geçen yılki 185 bin üyeden bu yıl 241 bin üyeye yükseldiğini ve bu ekosistemi desteklemeye devam edeceklerini vurguladı.
Strava'nın veri kontrol stratejisi kapsamında, yapay zeka asistanlarının ve uygulamalarının harici verilere yapılandırılmış bir şekilde erişmesini sağlayan yeni bir standart olan Model Context Protocol (MCP) desteği eklenmesi planlanıyor. Bu hamle, Strava'nın hangi verilerin nasıl paylaşıldığı üzerinde daha kesin bir kontrol sahibi olmasını sağlayacak. Ayrıca, kulüp detayları gibi spesifik verileri çeken bazı API uç noktaları (endpoints), kullanıcı verilerini korumak amacıyla tamamen kullanımdan kaldırılacak.
Şirket aslında 2024 yılı içerisinde API kurallarını çoktan sıkılaştırmış, verilerin yapay zeka eğitimi için kullanılmasını yasaklamış ve üçüncü taraf uygulamaların diğer kullanıcıların verilerini görüntülemesini sınırlandırmıştı. Bu kararlar, uygulamalarının ciddi şekilde etkileneceğini belirten geliştiriciler arasında tepkiyle karşılanmıştı. Bazı geliştiriciler abonelik ücretini kabul etse de, belirli API uç noktalarının kapatılması bağımlı uygulamalar için risk oluşturmaya devam ediyor. Strava, bu geçiş süreci için geliştiricilere 90 günlük bir ek süre tanıdı.
Strava CEO'su Michael Martin, TechCrunch'a verdiği röportajda, denetimsiz yapay zeka taramalarının "açık internetin ölüm fermanı" olabileceği konusunda uyardı. Martin, yapay zeka şirketlerinin eğitim verisi ihtiyacı nedeniyle kamuya açık web sitelerini acımasızca kazıdığını ve bunun genel site performanslarını düşürdüğünü belirtti. Son birkaç ayda, bu taramalar nedeniyle sistem performanslarının azaldığını ve bazı durumlarda ciddi şekilde bozulduğunu ifade eden CEO, yapay zeka şirketlerinin API kullanım şartlarını görmezden gelerek verilere erişmeye çalıştığını ekledi.
Martin, önde gelen yapay zeka laboratuvarlarından gelen veri lisanslama tekliflerini reddettiklerini açıkladı. Özellikle yapay zeka tabanlı arama girişimi Perplexity'yi hedef alan CEO, şirketin reddedilmesine rağmen veri kazıma işlemlerini gizlemek için toplayıcı servisler (aggregator services) kullandığını iddia etti. Bu durum, Perplexity'nin daha önce başka platformlarda da benzer davranışlarla suçlanmasıyla paralellik gösteriyor.
Sistem üzerindeki baskının tek sebebi yapay zeka şirketleri değil; Martin, "vibe-coded" olarak adlandırılan, verimsiz yapılandırılmış ve sistem üzerinde orantısız yük oluşturan kötü tasarlanmış uygulamaların da sunucuları aşırı yüklediğini belirtti. Bu durum, Meta'nın geçtiğimiz yıl WhatsApp'taki üçüncü taraf sohbet botlarını sistem yükü gerekçesiyle yasaklamasıyla benzerlik taşıyor.
Strava'nın bu hamlelerinin zamanlaması da dikkat çekici. Şirketin bu yıl başında gizlice halka arz (IPO) başvurusu yaptığı biliniyor. Verilerini koruma altına alma girişimi, potansiyel yatırımcılara "veri disiplini" konusunda güçlü bir sinyal verme amacı taşıyor olabilir. Reddit'in 2024'teki tartışmalı API kısıtlamalarıyla kıyaslanan bu süreçle ilgili olarak Martin, Reddit'in çağrı başına ücretlendirme yaparak birçok geliştiriciyi dışladığını, ancak Strava'nın sabit ücret modeliyle geliştirici ekosistemini korumayı hedeflediğini savundu.
Kapanışta kullanıcı deneyimine ve güvenliğe odaklanan CEO, kullanıcıların kendi verilerinin sahibi olduklarını hissetmelerini ve Strava'nın bu verileri nasıl kontrol edip güvence altına aldığı konusunda rahat olmalarını istediklerini, ancak aynı zamanda geliştiricilerin büyümeye ve gelişmeye devam etmesini arzuladıklarını belirtti.
Yorumlar (0)
Yorum yapmak için giriş yapın.