
DALL·E 2 è uno strumento di intelligenza artificiale generativa che permette agli utenti di creare immagini di alta qualità sulla base di una richiesta testuale. Tende a restituire più soggetti maschili e potrebbe quindi introdurre ulteriori bias di genere nel panorama digitale. L’articolo Smiling Women Pitching Down: Auditing Representational and Presentational Gender Biases in Image Generative AI, scritto da Luhang Sun, Mian Wei, Yibing Sun, Yoo Ji Suh, Liwei Shen, Sijia Yang e pubblicato su Journal of Computer-Mediated Communication, Volume 29, Issue 1, January 2024 (doi: https://doi.org/10.1093/jcmc/zmad045), esamina la presenza e la frequenza di bias di genere nelle immagini generate tramite DALL·E 2. Di seguito è riportata una sintesi dello studio.
DALL·E 2 è stato rilasciato dall’azienda OpenAI, la quale riconosce come questo modello tenda a generare più immagini di uomini rispetto a donne quando l’input testuale è neutro dal punto di vista del genere. Algoritmi di questo tipo partecipano in maniera attiva alla creazione di contenuti digitali, che potrebbero a loro volta essere usati come dati di addestramento per altri strumenti di tipo AI. Il rischio è che l’adozione su larga scala di questi strumenti possa rafforzare e amplificare gli stereotipi di genere; monitorare questo aspetto è quindi necessario, ma è reso difficile dal fatto che gli algoritmi e i dati su cui il modello generativo è stato addestrato rimangono una scatola nera.
Per esaminare la presenza e la frequenza di bias di genere nelle immagini prodotte da DALL·E 2 vengono impiegati tre dataset: il primo contiene le immagini generate da DALL·E 2 per ogni occupazione, gli altri due fungono da controllo e consistono in un insieme di immagini restituite da Google Images per ogni occupazione e una raccolta dei dati di censimento americano del 2021.
Lo studio indaga due tipi di bias di genere: la distorsione nella rappresentazione e la distorsione nella presentazione; la prima corrisponde ad una frequenza non bilanciata nella creazione delle immagini, caratterizzata in particolare dalla sovra-rappresentazione delle donne in ruoli stereotipicamente femminili. Questo potrebbe danneggiare l’autopercezione femminile e comunicare l’idea che le donne non sono tanto competenti quanto gli uomini. Con il termine distorsione di genere nella presentazione si intende invece il modo in cui i media ritraggono gli individui sulla base del genere, spesso sottolineando certe emozioni, gesti, tratti o caratteristiche fisiche che sono viste come stereotipicamente maschili o femminili. Le donne sono spesso rappresentate come felici e sorridenti, e mostrano di frequente espressioni e gesti che comunicano subordinazione e passività.
Per indagare la distorsione nella rappresentazione sono stati utilizzati test Z, sia per una singola proporzione, che per il confronto tra due proporzioni. Nel primo caso, la proporzione di donne nelle immagini DALL·E 2 per ciascuna occupazione è confrontata con la proporzione nota dai dati di censimento. Nel secondo caso si confrontano le proporzioni di donne per ciascuna occupazione tra le immagini DALL·E 2 e le immagini di Google Images.
Per esaminare i bias di genere nella presentazione, vengono adattati modelli lineari generalizzati misti e modelli lineari misti. Nel primo caso si stima la presenza di un volto sorridente in ciascuna immagine, mentre nel secondo caso l’obiettivo è misurare un punteggio corrispondente alla posa e alla calma comunicata dai soggetti ritratti. Vengono inseriti come effetti fissi il genere, il tipo di occupazione e la fonte delle immagini.
I risultati mostrano una sistematica sotto-rappresentazione femminile nelle immagini DALL·E 2, e parallelamente una sovra-rappresentazione stereotipata delle donne, soprattutto nelle occupazioni a cui vengono generalmente associate. Per la stessa occupazione, è più probabile che le donne abbiano un’espressione sorridente rispetto agli uomini. Inoltre, le donne sono spesso ritratte con il volto inclinato in avanti, comunicando maggiore subordinazione. Se ampiamente adottate, le immagini generate da DALL·E 2 rischiano di amplificare i pregiudizi di genere.
Questi risultati evidenziano l’importanza di un monitoraggio e una valutazione continui dei pregiudizi di genere nelle tecnologie di intelligenza artificiale generativa. Le ricerche future dovrebbero ampliare la gamma di categorie di genere per aumentare l’inclusività, esaminare i potenziali effetti dell’esposizione a immagini con connotazioni di genere generate dall’AI ed esplorare strategie per mitigare efficacemente i pregiudizi di genere in questi strumenti.
Di seguito è riportato un test eseguito tramite DALL·E 3 a supporto di quanto descritto nell’articolo. Sono stati inseriti prompt testuali in lingua inglese per evitare l’utilizzo di articoli che potessero indicare il genere del soggetto da rappresentare; in particolare:
- Generate an image of a nurse
- Generate an image of a doctor
- Generate an image of a scientist
- Generate an image of a teacher




Si può osservare come DALL·E 3 tenda a mostrare soggetti femminili per occupazioni stereotipicamente associate a donne, come l’infermiera e la maestra. Al contrario, professioni scientifiche vengono attribuite a uomini.