OpenAI API'ye Sesli Zeka Özelliği Geldi: Sesli Etkileşimde Yeni Dönem

OpenAI, geliştiricilerin sesli etkileşim kurabilen, konuşmaları yazıya dökebilen ve anlık çeviri yapabilen uygulamalar geliştirmesine olanak tanıyan yeni ses zekası özelliklerini duyurdu.
OpenAI, geliştiricilerin sesli etkileşim kurabilen, konuşmaları yazıya dökebilen ve anlık çeviri yapabilen uygulamalar geliştirmesine olanak tanıyan yeni ses zekası özelliklerini duyurdu. Şirket, API ekosistemine dahil edilen bu yeni araçlarla sesli yapay zeka deneyimini bir üst seviyeye taşımayı hedefliyor.
Yeni duyurulan GPT-Realtime-2 modeli, kullanıcılarla son derece gerçekçi bir ses simülasyonu üzerinden iletişim kurabiliyor. Önceki sürüm olan GPT-Realtime-1.5'ten farklı olarak bu model, daha karmaşık kullanıcı taleplerini karşılamak amacıyla "GPT-5 sınıfı" bir muhakeme yeteneğiyle donatıldı. Bu gelişme, yapay zekanın sadece konuşmakla kalmayıp, söylenenleri derinlemesine analiz edebileceği anlamına geliyor.
Çeviri tarafında ise GPT-Realtime-Translate devreye giriyor. Doğal bir konuşma akışına uyum sağlayacak şekilde tasarlanan bu özellik, 70'ten fazla giriş dilini anlayabiliyor ve 13 farklı dilde anlık çıktı verebiliyor. Ayrıca, konuşmaları gerçekleştiği anda metne dönüştüren canlı transkripsiyon yeteneği GPT-Realtime-Whisper, sesli etkileşimleri eş zamanlı olarak yazıya dökme imkanı sunuyor.
OpenAI, bu modellerin bir araya gelerek gerçek zamanlı ses teknolojisini basit bir "soru-cevap" mekanizmasından çıkarıp; dinleyen, muhakeme yapan, çeviren ve konuşma ilerledikçe aksiyon alabilen gerçek bir sesli arayüze dönüştürdüğünü belirtti. Bu güncellemelerin özellikle müşteri hizmetleri, eğitim, medya, etkinlik yönetimi ve içerik üreticisi platformları gibi geniş bir yelpazede devrim yaratması bekleniyor.
Yeni araçların kötüye kullanım riskine karşı da önlem alan OpenAI, spam, dolandırıcılık veya çevrimiçi taciz gibi durumları engellemek amacıyla sisteme çeşitli güvenlik bariyerleri yerleştirdiğini açıkladı. Şirket, zararlı içerik kurallarının ihlal edildiği tespit edildiğinde konuşmaların otomatik olarak durdurulmasını sağlayan tetikleyicilerin sisteme entegre edildiğini vurguladı.
Yorumlar (0)
Yorum yapmak için giriş yapın.
İlgili Haberler
Trump Yönetimi'nden Nükleer Startuplara Plütonyum Hamlesi
2 minutes ago
Casus Yazılımlara Karşı Telefonunuzdaki Gizli Kalkanlar: İşte Koruyucu Özellikler
3 days ago
Ekran Kartınıza Göre Hangi Oyunlar Çalışır? GPU ve Donanım Uyumluluk Rehberi
3 days ago