Yapay zekâ artık yalnızca teknoloji şirketlerinin laboratuvarlarında değil, gündelik hayatımızın her alanında etkili bir şekilde kullanılıyor. Telefonun sabah alarmı ertelerken ekran parlaklığını otomatik ayarlaması, kameranızın fotoğrafı çektikten sonra saniyeler içinde görüntüyü netleştirmesi, navigasyonun trafik durumuna göre rotayı değiştirmesi… Bunların hepsi aslında arka planda çalışan yapay zekâ benzeri sistemlerin eseridir.
Bu gelişmelerin ardından ortaya çıkan en önemli tartışmalardan biri şudur: Yapay zekâ gerçekten akıl yürütebiliyor mu yoksa sadece daha önce öğrendiği örnekleri mi tekrar ediyor?
Yapay Zekânın Akıl Yürütme Becerisi Nasıl Ölçülür?
İnsan zekâsı yalnızca bilgiyi depolama değil, onu yeni durumlara uyarlama becerisi olarak da tanımlanır. Bir insan daha önce hiç görmediği bir bulmacayı bile az sayıda örnekten kural çıkararak çözebilir.
Günümüzde yapay zekâ sistemleri özellikle de büyük dil modelleri (LLM) çok büyük miktarda veriyle eğitilerek etkileyici sonuçlar üretebiliyor. Fakat bu başarı çoğu zaman önceden öğrenilen bilgilerin hatırlanması temellidir. Model daha önce çok miktarda benzer örnekle eğitildiyse başarılı olur ama yetersiz veriyle eğitildiğinde ya da yeni bir durumla karşılaştığında çoğu zaman başarısız kalır. İşte bu noktada ARC-AGI devreye girer.
2019’da François Chollet tarafından geliştirilen Yapay Genel Zekâ için Soyutlama ve Mantık Yürütme Testi (ARC-AGI) yapay zekânın “akışkan zekâ” denilen özelliğini ölçer. Bu kavram bir sistemin sınırlı deneyimle yeni bir problemi çözebilme becerisini tanımlar. Yani bir modeli binlerce örnekle eğitmek yerine modelin az sayıda örnekten kural çıkarma yani veriler arasındaki örüntüleri belirleme yeteneğini test eder. Bu sayede sınırlı sayıdaki örnekten yola çıkarak yeni durumlara uyum sağlayabilen sistemlerle yalnızca büyük veri kümeleri üzerinden bilgiyi hatırlayan sistemleri birbirinden ayırmak mümkün olur.






