Prevela i prilagodila: Antonija Dujmović

Muškarce se u literaturi najviše opisuje riječima koje se odnose na ponašanje, dok se pridjevi koji se pripisuju ženama obično povezuju s fizičkim izgledom. Lijepa i seksi dva su pridjeva koji se najčešće koriste za opisivanje žena, dok se za opis muškaraca najviše koriste pridjevi pravedan, racionalan i hrabar – pokazala je analiza tri i pol milijuna knjiga koju su proveli informatički znanstvenici sa Sveučilišta u Kopenhagenu.

Danska informatičarka Isabelle Augenstein zajedno s kolegama iz SAD-a istraživala je ogromnu količinu knjiga pokušavajući otkriti postoji li razlika u vrstama riječi koje se u literaturi koriste za opisivanje muškaraca i žena. Koristeći novi računalni model, istraživači su analizirali podatke u tri i pol milijuna knjiga objavljenih na engleskom jeziku u periodu između 1900. i 2008. godine.

“Jasno smo uvidjeli da se riječi koje se koriste za opis žena odnose puno više na njihov izgled u usporedbi s riječima kojima se opisuju muškarci. Dakle, uspjeli smo i statistički potvrditi ovu već ranije raširenu percepciju”, kaže informatičarka i docentica Isabelle Augenstein sa Odjela za računarske znanosti Sveučilišta u Kopenhagenu.

Negativni glagoli povezani s izgledom pet puta više se koriste za žene nego za muškarce

Istraživači su izdvojili pridjeve i glagole povezane s rodno specifičnim imenicama (poput „kći“ i „stjuardesa“). Tako su, na primjer, uzeli kombinaciju riječi “seksi stjuardesa” ili “djevojke ogovaraju”, zatim su analizirali imaju li riječi pozitivan, negativan ili neutralan prizvuk i na koje se kategorije mogu podijeliti (osjećaji, ponašanje, izgled…).

Njihove analize pokazuju da se negativni glagoli povezani s tijelom i izgledom koriste pet puta više za žene nego za muškarce. Analize također pokazuju da se pozitivni i neutralni pridjevi koji se odnose na tijelo i izgled javljaju otprilike dvostruko češće u opisima žena, dok se muškarci najčešće opisuju pomoću pridjeva koji se odnose na njihovo ponašanje i osobine.

I u prošlosti su lingvisti analizirali rodni jezik i pristranost, ali koristeći manje podatkovne skupove. Sada su informatičari u mogućnosti implementirati algoritme za analizu ogromnih podataka – u ovom slučaju analizirano je 11 milijardi riječi.

Istraživači ističu da ova analiza ima svoja ograničenja, jer ne uzima u obzir tko je napisao pojedinačne odlomke, jesu li knjige objavljene u ranijem ili kasnijem promatranom razdoblju i ne razlikuje žanrove djela kao niti stupnjeve pristranosti.

Algoritmi za razvoj digitalnih aplikacija putem naših riječi usvajaju rodne stereotipe i predrasude

Iako su mnoge knjige objavljene prije nekoliko desetljeća, one i dalje igraju aktivnu ulogu, ističe Isabelle Augenstein. Naime, algoritmi koji se koriste za razvoj aplikacija hrane se podacima u obliku tekstualnog materijala koji je dostupan na mreži. To je tehnologija koja omogućava pametnim telefonima da prepoznaju naše glasove i omogućuje Googleu da daje prijedloge ključnih riječi.

“Algoritmi funkcioniraju tako da identificiraju obrasce i ako se bilo koji od ovih obrazaca odnosi na pristrani jezik, rezultat će također biti pristran. Sustavi usvajaju, da tako kažemo, jezik koji mi koristimo, a samim tim i rodne stereotipe i predrasude “, kaže Isabelle Augenstein i daje primjer gdje bi to moglo biti značajno:

“Ako se jezik koji koristimo za opisivanje muškaraca i žena razlikuje, na primjer, u preporukama zaposlenika, to će utjecati kome se nudi posao u slučajevima kada tvrtke koriste IT sustave za sortiranje putem aplikacija za posao.”

Kako umjetna inteligencija i jezična tehnologija postaju sve značajniji u društvu, važno je koristiti rodno osviješten jezik. Augenstein smatra da se to mora uzeti u obzir prilikom razvoja digitalnih modela, bilo korištenjem manje pristranog teksta ili prisiljavanjem modela da ignoriraju, odnosno da se suprotstave pristranosti.