Türkgün | Bilim Teknoloji | Bilim insanlarından yapay zeka uyarısı: Değerlendirme testlerinde kusur tespit edildi

Bilim insanlarından yapay zeka uyarısı: Değerlendirme testlerinde kusur tespit edildi

Araştırmacılar, yapay zekanın güvenliğini kontrol eden 445 testte geçerliliği zedeleyen kusurlar buldu. İncelemelerde, büyük teknoloji firmalarının kullandığı testlerin yeterliliği konusunda kritik uyarılar yapıldı. Bu durum, yapay zeka gelişiminde sağlıklı ölçümlerin önemini ortaya koyuyor.

Araştırmacılar, yapay zekanın güvenliğini kontrol eden 445 testte geçerliliği zedeleyen kusurlar buldu. İncelemelerde, büyük teknoloji firmalarının kullandığı testlerin yeterliliği konusunda kritik uyarılar yapıldı. Bu durum, yapay zeka gelişiminde sağlıklı ölçümlerin önemini ortaya koyuyor.

Bilim insanlarından yapay zeka uyarısı: Değerlendirme testlerinde kusur tespit edildi

YAYINLAMA: 04 Kasım 2025 - 15:03

YAZAR: Serpil Çıracı

KAYNAK: AA

Facebook'ta Paylaş X'de Paylaş Whatsapp'tan Gönder

Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde “sonuçların geçerliliğini zedeleyecek” kusurlar tespit etti. Çalışmaya İngiltere Yapay Zeka Güvenlik Enstitüsü ile Stanford, Berkeley ve Oxford üniversiteleri dahil 14 kurumdan 29 araştırmacı katıldı.

Yapay Zeka Alt Dalları Sistematik Olarak İncelendi

Araştırmada, doğal dil işleme ve makine öğrenimi alanlarının önde gelen konferanslarından alınan 445 test sistematik olarak incelendi. İncelemeler sonucunda, testlerin neredeyse tamamının geçerliliği zedeleyebilecek kusurlara sahip olduğu ortaya çıktı.

Uzmanlardan Kritik Uyarı

Çalışmanın baş yazarı Andrew Bean, kullanılan testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen yapay zeka modellerinin değerlendirilmesinde kullanıldığını belirtti. Bean, ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğinin anlaşılmasının zorlaştığını vurguladı.

Yorumlar

İsim*

Yorum Yazın (500 Karakter)

Yorum yazma kurallarını okumuş ve kabul etmiş sayılırsınız

Yorumlar yükleniyor...