Bilim insanları yapay zekâ testlerinde ciddi kusurlar tespit etti

Bilim insanları, yapay zekâ sistemlerinin güvenliği ve etkinliğini değerlendirmek amacıyla gerçekleştirilen 445 testte ciddi kusurlar tespit etti. Araştırmada, bu testlerin sonuçlarının geçerliliğini zedeleyebilecek hatalar içerdiği ve yapay zekâ modellerinin performansını doğru şekilde yansıtmayabileceği belirlendi. Uzmanlar, söz konusu kusurların yapay zekâ uygulamalarının güvenilirliğini ve doğruluğunu riske atabileceğine dikkat çekti.

Bilim insanları, yapay zekâ sistemlerinin güvenliği ve etkinliğini değerlendirmek amacıyla gerçekleştirilen 445 testte ciddi kusurlar tespit etti. Araştırmada, bu testlerin sonuçlarının geçerliliğini zedeleyebilecek hatalar içerdiği ve yapay zekâ modellerinin performansını doğru şekilde yansıtmayabileceği belirlendi. Uzmanlar, söz konusu kusurların yapay zekâ uygulamalarının güvenilirliğini ve doğruluğunu riske atabileceğine dikkat çekti.

Bilim insanları yapay zekâ testlerinde ciddi kusurlar tespit etti

YAYINLAMA: 04 Kasım 2025 - 16:54

YAZAR: İlknur Karakelle

KAYNAK: AA

Facebook'ta Paylaş X'de Paylaş Whatsapp'tan Gönder

İngiltere Yapay Zeka Güvenlik Enstitüsünden bilgisayar bilimciler ile Stanford, Berkeley ve Oxford üniversitelerinin de aralarında bulunduğu 14 kurumdan 29 araştırmacı, "Önemli Olanı Ölçmek: Büyük Dil Modeli Kıyaslamalarında Yapı Geçerliği" başlıklı bir çalışma yaptı.

Bilim İnsanları 445 Yapay Zekâ Testini İnceledi

Bilim insanları çalışmada, yapay zekanın alt dallarından olan "doğal dil işleme" ve "makine öğrenimi" alanlarının önde gelen konferanslarından alınan 445 değerlendirme testini sistematik olarak inceledi.
İncelemeler sonucunda, testlerin neredeyse hepsinin "sonuçların geçerliliğini zedeleyebilecek" kusurlara sahip olduğu sonucuna ulaşıldı.
Çalışmanın baş yazarı, Oxford İnternet Enstitüsünden Andrew Bean, çalışmaya ilişkin Guardian'a yaptığı açıklamada, kullanılan bu testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen son yapay zeka modellerinin değerlendirilmesinde kullanıldığını söyledi.

Bean, değerlendirme testlerinin yapay zekayla ilgili tüm iddiaların temelini oluşturduğuna vurgu yaparak ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğini anlamanın zorlaştığını kaydetti.

Yorumlar

İsim*

Yorum Yazın (500 Karakter)

Yorum yazma kurallarını okumuş ve kabul etmiş sayılırsınız

Yorumlar yükleniyor...