Bilim insanları, yapay zekanın güvenliği ve etkinliğini kontrol eden 445 değerlendirme testinde “sonuçların geçerliliğini zedeleyecek” kusurlar tespit etti. Çalışmaya İngiltere Yapay Zeka Güvenlik Enstitüsü ile Stanford, Berkeley ve Oxford üniversiteleri dahil 14 kurumdan 29 araştırmacı katıldı.
Yapay Zeka Alt Dalları Sistematik Olarak İncelendi
Araştırmada, doğal dil işleme ve makine öğrenimi alanlarının önde gelen konferanslarından alınan 445 test sistematik olarak incelendi. İncelemeler sonucunda, testlerin neredeyse tamamının geçerliliği zedeleyebilecek kusurlara sahip olduğu ortaya çıktı.

Uzmanlardan Kritik Uyarı
Çalışmanın baş yazarı Andrew Bean, kullanılan testlerin büyük teknoloji şirketleri tarafından piyasaya sürülen yapay zeka modellerinin değerlendirilmesinde kullanıldığını belirtti. Bean, ortak tanımlar ve sağlıklı ölçümler olmadan modellerin gerçekten gelişip gelişmediğinin anlaşılmasının zorlaştığını vurguladı.