- Katılım
- Ocak 22, 2025
- Mesajlar
- 259,595
- Tepkime puanı
- 0
- Puanları
- 36
OpenAI, haftalık aktif kullanıcı sayısının 800 milyonun üzerine çıktığını, bunların yaklaşık yüzde 0,15'inin intihar eğilimli içeriklerle sohbet ettiğini belirtiyor. Analize göre yüzde 0,07'lik bir kitle psikotik atak ya da mani gibi acil müdahale gerektiren belirtiler sergiliyor. Bir diğer yüzde 0,15'lik kesimse yapay zekâya sağlıksız bir duygusal bağlılık geliştirme riski taşıyor. Veriler, modelin bilgi asistanından çok bir dert anlatma durağına da dönüştüğünü gösteriyor.
OpenAI, varsayılan modeli daha güvenli hale getirmek için kriz dili, yatıştırıcı üslup ve yönlendirme protokolleri üzerinde çalıştığını söylüyor. Amaç, tehlikeli içeriklerde sert uyarılar vermekle kalmayıp kullanıcıyı doğru kaynaklara yönlendirmek. Bu kapsamda uzun diyaloglarda ara verme hatırlatmaları eklendi, yardım hatlarına erişim daha görünür hale getirildi. İlk ölçümlere göre kendine zarar verme konularında uygunsuz yanıt oranı yaklaşık yüzde 65 azalırken, yapay zekâya aşırı duygusal bağ içeren konuşmalarda istenmeyen yanıtlar yüzde 80'e varan oranda düştü.
Samsung yine erteledi: One UI 8.5 ne zaman çıkacak?
OpenAI, eğitim verilerini ve kılavuzlarını sürekli güncelleyerek krize duyarlı yanıtları daha hızlı ve tutarlı hale getirmeyi hedefliyor. Uzmanlarla kurulan çalışma hattının kalıcı olacağı, kullanıcı geri bildirimlerinin de sürece dahil edileceği ifade ediliyor. Kısacası, modelin bilgi doğruluğu kadar duygusal güvenliği de artık performans ölçütü haline geliyor.
Model nasıl değişti?
OpenAI, varsayılan modeli daha güvenli hale getirmek için kriz dili, yatıştırıcı üslup ve yönlendirme protokolleri üzerinde çalıştığını söylüyor. Amaç, tehlikeli içeriklerde sert uyarılar vermekle kalmayıp kullanıcıyı doğru kaynaklara yönlendirmek. Bu kapsamda uzun diyaloglarda ara verme hatırlatmaları eklendi, yardım hatlarına erişim daha görünür hale getirildi. İlk ölçümlere göre kendine zarar verme konularında uygunsuz yanıt oranı yaklaşık yüzde 65 azalırken, yapay zekâya aşırı duygusal bağ içeren konuşmalarda istenmeyen yanıtlar yüzde 80'e varan oranda düştü.
Sonraki adımlar
Samsung yine erteledi: One UI 8.5 ne zaman çıkacak?
OpenAI, eğitim verilerini ve kılavuzlarını sürekli güncelleyerek krize duyarlı yanıtları daha hızlı ve tutarlı hale getirmeyi hedefliyor. Uzmanlarla kurulan çalışma hattının kalıcı olacağı, kullanıcı geri bildirimlerinin de sürece dahil edileceği ifade ediliyor. Kısacası, modelin bilgi doğruluğu kadar duygusal güvenliği de artık performans ölçütü haline geliyor.