İnternette yer alan görseller ve metinler, sosyal gruplar ile ilgili pek de doğru olmayan genellemelere yol açıyor. Bu durum sadece insanları değil internetteki verilerle eğitilen yapay zekâ uygulamalarını da etkiliyor. Bilimsel çalışmalar, internette yer alan çarpık bilgilerin hem insanların hem de yapay zekâ uygulamalarının sosyal gruplarla ilgili yanlış yaş ve cinsiyet ön yargılarına kapılmasına yol açtığını gösteriyor. ChatGPT iş başvurusu öz geçmişlerini değerlendirirken kadınların daha genç ve tecrübesiz, yaşlı erkeklerin daha vasıflı olduğunu var sayıyor.
Sosyal gruplar hakkında genellemeler yapmak çoğu zaman zararlı olarak görülür. Bu konuda tartışmalara konu olan bir soru ise sosyal gruplar hakkındaki yaygın genellemelerin ne ölçüde doğru olduğudur. Bu soruya cevap bulmak ile ilgili bir zorluk, çoğu zaman değerlendirme için kullanılacak nesnel bir ölçütün olmamasıdır. Örneğin zekânın nasıl ölçülebileceği ile ilgili nesnel bir ölçüt olmaması nedeniyle bir meslek grubunun üyelerinin bir başka meslek grubunun üyelerinden daha zeki olduğuna dair bir ön yargıyı doğrulamak ya da yanlışlamak kolay değildir. Nesnel bir ölçütün olduğu durumlardaysa çoğu zaman büyük ölçekli, nicel ve kültürel veriler bulunmaz. Bu durum sosyal gruplar ile ilgili ön yargılar üzerine yapılan araştırmaların çelişkili sonuçlar vermesine yol açar.
Stanford Üniversitesinden Douglas Guilbeault, Berkeley’deki California Üniversitesinden Solène Delecourt ve Oxford Üniversitesinden Bhargav Srinivasa Desikan Nature’da yayımladıkları bir makalede yaşla ilgili cinsiyet önyargıları üzerine yaptıkları araştırmanın sonuçlarını yayımladı. Araştırmacılar çalışmalarında ön yargıları değerlendirmek için nesnel bir ölçüt olarak biyolojik yaşı kullanıyor. Ayrıca bu ön yargıları internet ortamında erkeklerin ve kadınların yaşlarının nasıl betimlendiğiyle ilişkilendiriyor. Araştırmacılar çalışmalarında çalışma hayatı, yaş ve cinsiyet ile ilgili analizlerde ABD nüfus sayımı verilerinden yararlanıyor.
Yaşla İlgili Cinsiyet Ön Yargıları

Yaşla ilgili cinsiyet ön yargılarının bir tarafında “cinsiyet temelli yaş ayrımcılığı” olarak adlandırılan pek çok iş grubunda ileri yaşlardaki kadınların hem işe alımlarda hem de terfilerde ayrımcılığa uğradığını gösteren çalışmalar vardır. Bu durum kadınların genel olarak gençlikle ilişkilendirilmesine bağlanır ve kadınların bir tür “güzellik vergisi” ödemesine yol açar: Kadınlar olduklarından daha genç ve güzel görünmek için zaman ve para harcar. Diğer taraftan kadınları gençlikle ilişkilendirmek sosyoekonomik gerçeklerle örtüşmez. Dünya’nın hemen hemen her bölgesine kadınların ortalama ömrü erkeklerden uzundur. Ayrıca nüfus verilerinde de çalışma hayatındaki kadınların ve erkeklerin yaş dağılımları arasında belirgin bir fark gözlemlenmez. Üstelik bazı araştırmalar ileri yaşlardaki erkeklerin ileri yaşlardaki kadınlara kıyasla cinsiyet temelli yaş ayrımcılığından daha fazla etkilendiğini gösterir. Bu çelişkili bulgular yaşla ilgili cinsiyet ön yargılarının belirli sektörlere özgü bir durum mu yoksa kültürel bir çarpıklık mı olduğu sorusunu akla getirir.
Araştırmacılar çalışmalarında internet ortamındaki popüler kaynaklarda yer alan resimlerde, videolarda ve metinlerdeki yaş-cinsiyet ilişkisini analiz ederek büyük bir veri tabanı oluşturuyor. Bu veri tabanındaki milyonlarca resim ve videonun sağladığı bilgileri, binlerce farklı sosyal kategoride yaş-cinsiyet bağlantısı açısından analiz ediyor. Meslekler ile ilgili görselleri nüfus verileriyle karşılaştırarak internetteki görsellerin kadınların gençlikle bağdaştırılmasına dair ön yargıyı nasıl etkilediğini inceliyor. İnternetteki metinler kullanılarak eğitilmiş dokuz ayrı büyük dil modelini de yaşla ilgili cinsiyet ön yargıları açısından değerlendiriyor. Ayrıca yapay zekâ eğitiminde kullanılan ana akım algoritmaların bu ön yargıların büyümesindeki rolünü inceliyor.
İnternetteki Görsellerde Yaş-Cinsiyet ile İlgili Hatalı Genellemeler

Çalışmalar hem internetteki görsellerde ve videolarda hem de yapay zekâ eğitimi için kullanılan veri tabanlarında cinsiyetlerin yaşları ile ilgili çarpık temsiller yer aldığı sonucunu veriyor.
İnternetteki beş popüler platformdaki (Google, Wikipedia, IMDb, Flickr, X) görseller incelendiğinde kadınların erkeklere kıyasla daha genç gösterildiği anlaşılıyor. Bu durum görsellerdeki kişilerin yaşının ve cinsiyetinin insanlar tarafından tahmin edilmesi, makine öğrenmesi yöntemleriyle belirlenmesi ya da kesin verilere dayalı olarak hesaplanması hâlinde de değişmiyor.
Google taramalarında insanların karşısına çıkan 3495 sosyal kategoriyle (doktor, bankacı, aşçı, …) ilgili görseller insanlar tarafından değerlendirildiğinde kadınların ortalama yaşı erkeklerden daha düşük çıkıyor. Yaş farkı, taramalarda sadece kategori adı belirtildiğinde 0,37; erkek doktor, kadın doktor gibi cinsiyet de belirtildiğinde 0,29 oluyor. Aynı metot Wikipedia sayfalarındaki görsellere uygulandığındaysa kadınların ortalama yaşı erkeklerden 0,71 küçük çıkıyor.
IMDb’deki en popüler 100.000 sayfada yer alan 451.570 görsel, bu görsellerdeki ünlülerin Wikipedia’daki biyografi sayfalarında yer alan 57.932 görseli içeren IMDb-Wiki veri tabanı ve ünlülerin hangi tarihte çekildiği bilinen fotoğraflarını ve cinsiyet bilgilerini içeren 2014 CACD (Cross-Age Celebrity Dataset) veri tabanı kullanılarak yapılan analizler, söz konusu ünlüler olduğunda erkekler ve kadınlar arasındaki yaş farkının çok daha büyük olduğunu gösteriyor. IMDb’deki görsellerde kadın ünlüler erkek ünlülerden ortalama 6,5 yaş daha genç gözüküyor. Wikipedia’da ve Google görsellerinde ise bu fark sırasıyla 3,27 yaş ve 5,35 yaş oluyor. Tüm ortamlarda ünlü kadınlar için en sık rastlanan yaşlar 20’li yaşlar olurken ünlü erkekler için en sık rastlanan yaşlarsa 40 ve 50. Analizlerde yaş ve cinsiyet ile ilgili nesnel verilerin kullanılması, internet ortamındaki görsellerde rastlanan cinsiyetler arasındaki yaş farklarının insan algılarının bir ürünü olmadığını gösteriyor.
Makine öğrenmesi için kullanılan veri tabanlarında da aynı durum görülüyor. İnternetteki görsellerin toplanmasıyla oluşturulmuş 24.106 görseli içeren 2017 UTK veri tabanında, Flickr’daki görsellerin toplanmasıyla oluşturulmuş Adience veri tabanında ve Google News yazılarında yer almış 13.143 görselin bulunduğu 2008 LFW (Labeled Faces in the Wild) veri tabanında kadınlar erkeklerden sırasıyla 5,12 yaş, 0,18 yaş ve 0,94 yaş daha genç olarak sınıflandırılıyor.
Çalışmalar yaşla ilgili cinsiyet ön yargılarının internetteki videolarda da bulunduğunu gösteriyor. YouTube’daki 3645 videodan alınmış, ünlülerin yüzlerini gösteren 3645 görselin yer aldığı 2011 YouTube Faces veri tabanı analiz edildiğinde makine öğrenmesiyle eğitilmiş yapay zekâ uygulamaları kadınları erkeklerden ortalama 0,87 yaş daha genç olarak değerlendiriyor. Wikipedia’daki ünlüler listelerinden derlenmiş ünlülerin YouTube’daki en popüler on videosundan alınmış 35.666 görselin yer aldığı 2022 CelebV-HQ veri tabanı da benzer sonuçlar veriyor. Ünlülerin yüzlerinin genç ya da yaşlı olarak sınıflandırıldığı bu veri tabanında kadınların %33’ü erkeklerinse sadece %20’si genç olarak kodlanıyor.
Bu bulgular, farklı mesleklerle ilgili nüfus verileriyle karşılaştırıldığında Google görsellerinin tutarlı bir biçimde kadınlar ile gençlik arasındaki bağlantıyı abarttığı ve hatta bazı durumlarda nüfus verileriyle tamamen uyumsuz bir resim çizdiği görülüyor. Örneğin nüfus verilerine göre satış sektöründe çalışan kadınların ortalama yaşı erkeklerin ortalama yaşından yüksek olmasına rağmen Google görsellerindeki kadınlar erkeklerden daha genç görünüyor.
Yaşla ilgili cinsiyet ön yargılarına dair bir hipotez bu ön yargıların yüksek statülü ve daha çok kazandıran mesleklerde daha belirgin olduğudur. Araştırmacıların analizleri de bu hipotezi destekliyor. ABD Çalışma İstatistikleri Bürosu tarafından daha yüksek statülü olarak değerlendirilen meslekler Google’da arandığında karşılaşılan görsellerde erkekler genel olarak kadınlardan daha yaşlı gözüküyor. Ayrıca ortalama geliri daha yüksek olan mesleklerle ilgili Google görsellerinde erkeklerin kadınlardan daha yaşlı görünmesi olasılığı belirgin derecede yüksek. Analizler, cinsiyetlerin gelir farklarıyla (bir meslekte erkekler ile kadınların ortalama gelirleri arasındaki farklarla) dijital yaş farklarının (Google görsellerinde bir meslekte çalışan erkekler ile kadınlar arasındaki yaş farklarının) bağlantılı olduğunu gösteriyor.
İnternetteki Metinlerde Yaş-Cinsiyet ile İlgili Hatalı Genellemeler
İnternette yer alan görsellerle ilgili sonuçlardan şüphe duyulmasına neden olabilecek bir durum, görsel filtrelerinin ya da kozmetik ürünlerin yaşla ilgili tahminleri etkilemesi olabilir. Ancak internetteki metinler üzerinde yapılan analizler de görsellerdeki yaşla ilgili cinsiyet ön yargılarına dair sonuçları destekliyor.

OpenAI’ın internetteki milyarlarca sayfadaki metinleri kullanarak eğittiği, şu an var olan en büyük açık kaynaklı dil modeli olan GPT-2 Large kullanılarak yapılan analizler bir sosyal grubun erkeklerle ilişkilendirilmesi ile ileri yaşlarla ilişkilendirilmesi arasında güçlü bir bağıntı olduğunu gösteriyor. Metinlerdeki cinsiyet ve yaş bağlantısını çıkarmak için kullanılan farklı yöntemler bu sonuçlarda önemli bir değişime yol açmıyor. Ayrıca GPT-2 Large dışında kalan sekiz ayrı dil modeliyle yapılan başka analizler de benzer sonuçlar veriyor.
Google Taramaları

İnternette yer alan görsellerdeki, videolardaki ve metinlerdeki hatalı yaş-cinsiyet genellemeleri ile ilgili temel bir soru da bu çarpıklıkların insanları ve internetteki bilgilerle eğitilen yapay zekâ modellerini nasıl etkilediği.
Araştırmacılar, internetteki yaş-cinsiyet ile ilgili hatalı genellemelerin insanların düşüncelerini nasıl etkilediği belirlemek için kontrollü deneyler gerçekleştirdi. Bu deneylerin birinde 500 gönüllü iki gruba ayrıldı. Birinci gruptaki gönüllülerden 54 ayrı meslek arasından rastgele seçilmiş 22’si hakkında Google Görseller’de taramalar yapması ve her bir meslek için seçtiği bir görseli bir veri tabanına yüklemesi, seçtiği resimdeki kişinin cinsiyetini belirtmesi ve o meslekte çalışan insanların ortalama yaşını tahmin etmesi istendi. Gönüllülere ayrıca seçtikleri resimdeki kişiyi işe almakta ne kadar istekli oldukları soruldu. İkinci gruptaki (kontrol grubu) gönüllülerse veri tabanına Google Görseller’den buldukları rastgele kategoriler (örneğin meyve, müzik aletleri) ile ilgili görselleri yükledi. Daha sonra gönüllülerden rastgele seçilmiş bir meslekte çalışanlarının ortalama yaşını tahmin etmesi istendi. Ayrıca kontrol grubundaki gönüllülere seçilen mesleklerdeki bir çalışanın işe alınması için ideal yaşının ne olması gerektiği ve bu mesleklerde çalışanların çoğunluğunun cinsiyetinin ne olduğu soruldu. Bu deneyler sonucunda Google’da mesleklerle ilgili görsel arayan gönüllülerin bir erkek ya da kadın görseli yükledikten sonra mesleklerin ortalama yaşı ile ilgili yaptığı tahminler değerlendirildi. Ayrıca bu sonuçlar hem kontrol grubundaki mesleklerle ilgili görsel araması yapmayan gönüllülerin yaş tahminleriyle hem de yine kontrol grubundaki gönüllülerin bir meslekte hangi cinsiyetin daha yaygın olduğuna bağlı yaş tahminleriyle karşılaştırıldı. Analizler, belirli bir meslek grubu için kadın resmi yükleyen gönüllülerin erkek resmi yükleyen gönüllülerle kıyasla o meslekte çalışanların ortalama yaşını 5,46 yıl daha küçük tahmin ettiğini gösteriyor. Kontrol grubundaki gönüllerle karşılaştırıldığında, kadın resmi yükleyen gönüllülerin yaş tahmini 1,75 yıl daha küçük, erkek resmi yükleyen gönüllülerin yaş tahmini ise 0,64 yıl daha büyük oluyor.
Kontrol grubundaki gönüllülerden bir meslekte daha çok kadınların çalıştığını düşünenler o meslekte daha çok erkeklerin çalıştığını düşünenlere kıyasla o meslek grubunun ortalama yaşını 2,15 yıl daha düşük tahmin ediyor. Bu yaş farkı Google’dan buldukları görselleri yükleyen gönüllüler arasında daha da yüksek oluyor. Bir meslek için kadın resmi yükleyen gönüllüler, kontrol grubunda o mesleğin daha çok kadın üyesi olduğunu ifade eden gönüllülere kıyasla o meslekte çalışanların ortalama yaşını 0,84 daha küçük tahmin ediyor. Bu sonuçlar internette yer alan görsellere maruz kalmanın kadınları gençlikle bağdaştırmayı daha ileri bir seviyeye taşıdığını, kadınlar ile erkekler arasındaki algılanan yaş farkını büyüttüğünü gösteriyor.
Son olarak kontrol grubu gönüllüleri arasında bir meslekte daha çok kadınların ya da erkeklerin çalıştığı düşüncesi ile o mesleğe daha genç ya da daha ileri yaştaki kişilerin daha uygun olduğu düşüncesi arasında bir bağıntı görülüyor. Analizler, gönüllülerin belirli bir meslek için işe almaya en uygun kişiler olarak ya genç kadınları ya da yaşlı erkekleri tercih ettiğini gösteriyor.
Büyük Dil Modelleri

ChatGPT gibi popüler yapay zekâ modelleri internette yer alan bilgilerle eğitildiği için bu uygulamaların da internetteki görsellerde, videolarda ve metinlerde rastlanan yaşla ilgili cinsiyet ön yargılarına sahip olmaları muhtemel. Araştırmacılar makalelerinde bu konuyu da inceliyor.
Günümüzde ChatGPT’nin yaygın kullanım alanlarından biri iş başvuruları için gönderilmiş öz geçmişleri değerlendirmek. Pek çok şirket kimi işe alacağına karar vermek için ChatGPT’den gönderilen öz geçmişleri değerlendirip sıraya koymasını istiyor. Araştırmacılar da çalışmalarında ChatGPT’nin ne ölçüde cinsiyet temelli yaş ayrımcılığından etkilendiği hakkında fikir edinmek için yapay zekâ uygulamasından kurgusal öz geçmişler üretmesinin ve öz geçmişleri değerlendirmesinin istendiği çeşitli deneyler yaptı.
ChatGPT’nin kurgusal öz geçmişler üretmesinin istendiği deneyler üç ayrı biçimde yapıldı. Birincisi (kontrol grubu), bir cinsiyet bilgisi ya da isim verilmeden yapay zekâ uygulamasından 54 ayrı meslek için ellişer adet öz geçmiş üretmesi istendi. İkincisi (kontrol-cinsiyet grubu), aynı deneyler bu kez de ChatGPT’den başvuru sahibinin cinsiyetini de içerecek biçimde öz geçmişler üretmesi istenerek tekrarlandı. Üçüncüsü, kontrol koşulundaki deneyler bu kez de başvuru sahibinin adı da uygulamaya verilerek tekrarlandı: Her bir isim-cinsiyet-meslek kombinasyonu için 20’şer tane olmak üzere toplamda 34.560 öz geçmiş üretildi.
ChatGPT’nin kadın isimleri ve erkek isimleri için ürettiği kurgusal öz geçmişler karşılaştırıldığında kadınlar için ürettiği öz geçmişlerde hem ortalama yaşın daha küçük (1,6 yıl) olduğu hem mezuniyet tarihlerinin ortalama olarak daha yakın (1,3 yıl) olduğu hem de iş tecrübelerinin ortalama olarak daha az (0,92 yıl) olduğu görülüyor. Kontrol grubundaki belirli bir isim ya da cinsiyet verilmeden üretilmiş öz geçmişlerle karşılaştırıldığında ChatGPT’nin isimler verilerek belirli bir meslek için ürettiği kadın öz geçmişlerin ortalama yaşının erkek özgeçmişlerinin ortalama yaşından belirgin derecede düşük olduğu görülüyor. Bu sonuçlar ChatGPT’nin cinsiyet temelli yaş ayrımcılığıyla bağlantılı genellemelerden etkilendiğini gösteriyor.
Kontrol-cinsiyet grubundaki öz geçmişlerde de benzer, yaşla ilgili cinsiyet ön yargıları görülüyor. ChatGPT’nin isimler verilmeden belirli bir meslek için ürettiği erkek öz geçmişleri ve kadın öz geçmişleri karşılaştırıldığında erkek öz geçmişlerinin ortalama yaşı daha büyük (1,3 yıl), mezuniyet tarihi daha eski (1,2 yıl) oluyor. Bu durum ChatGPT’nin sahip olduğu ön yargıların kaynağının isimler değil cinsiyetler olduğunu gösteriyor.
ChatGPT’nin öz geçmişleri nasıl değerlendirdiğinin incelendiği deneylerdeyse yapay zekâ uygulamasından ilk gruptaki deneylerde ürettiği öz geçmişleri değerlendirmesi ve 1 ile 100 arasında bir skor vermesi istendi. Sonuçlar, ChatGPT’ye göre bir öz geçmişin niteliğiyle başvuru sahibinin yaşı arasında güçlü bir bağıntı olduğunu gösteriyor. Başvuru sahiplerinin yaşı ne kadar büyükse ChatGPT’nin öz geçmişlere verdiği ortalama skor da o kadar yüksek oluyor. Başvuru sahiplerinin cinsiyetleri de analizlere dahil edildiğinde ChatGPT’nin yaşlı erkekleri yaşlı kadınlardan daha vasıflı olarak değerlendirdiği görülüyor. Söz konusu yirmili, otuzlu yaşlardaki insanlara ait öz geçmişler olduğundaysa kadınların ortalama skoru erkeklerden daha yüksek çıkıyor. Bu sonuçlar da yine ChatGPT’nin cinsiyet temelli yaş ayrımcılığından etkilendiği çıkarımını destekliyor.
Özet

Bilimsel çalışmalar, yaşla ilgili cinsiyet ön yargılarının internet ortamında yaygın olduğunu gösteriyor. İnternetteki görseller, videolar ve metinler, toplumsal gerçeklere karşıt bir biçimde kadınları daha genç, erkekleri daha yaşlı gösteriyor. Bu çarpık temsiller insanların yanı sıra internetten toplanan bilgilerle eğitilen yapay zekâ uygulamalarını da etkiliyor. Üstelik günümüzün en yaygın kullanılan algoritmalarından ikisi bu ön yargıları daha da büyütüyor. Google Görseller’de arama yapan insanların, arama yapmayanlara kıyasla mesleklerle ilgili deneylerde kadınları gençlikle ilişkilendirme konusunda daha ön yargılı olduğu görülüyor. ChatGPT ise iş başvuruları ile ilgili öz geçmişleri değerlendirirken daha ileri yaşlardaki insanlara daha yüksek skor veriyor. Daha da önemlisi yaşlı erkekleri yaşlı kadınlardan, genç kadınları ise genç erkeklerden daha vasıflı olarak değerlendiriyor. Her ne kadar Google, OpenAI gibi şirketler ürünlerindeki ön yargıları en aza indirmek için çaba gösterseler de daha çok cinsiyet ayrımcılığı ya da ırkçılık gibi “tek boyutlu” konulara odaklanıyorlar. Guilbeault ve arkadaşlarının Nature’da yayımladıkları makale ise hem cinsiyetle hem de yaşla ilgili “iki boyutlu” bir ön yargıya odaklanıyor. Tespit etmek ve önlemek çok daha zor olsa da elde edilen sonuçlar, bu tür ön yargıların da önemli sonuçları olduğunu gösteriyor.
Kaynaklar:
- Guilbeault, D., ve ark., “Age and gender distortion in online media and large language models”, Nature, Cilt 646, s. 1129, 2025.
- Macanovic, A., “Online media distorts age and gender distortions”, Nature, Cilt 646, s. 1062, 2025.









