Twitter ha recentemente pubblicato un aggiornamento sul funzionamento del suo approccio di moderazione “Freedom of Speech Not Reach” che ha ottenuto risultati incoraggianti nella lotta contro i contenuti offensivi e dannosi sulla piattaforma. In questo articolo andremo ad esplorare le misure adottate da Twitter e i risultati ottenuti finora, nonché le implicazioni per gli utenti e i ricercatori che studiano l’hate speech.

I risultati ottenuti con le nuove etichette di Twitter sono positivi

A partire da aprile 2023, Twitter ha iniziato a limitare la portata dei tweet che violano la sua politica di condotta che incita all’odio, applicando un’etichetta (che trovate anche qui sotto) che recita: “Visibilità limitata: questo tweet potrebbe violare le regole di Twitter contro la condotta che incita all’odio”.

Da allora, l’azienda ha applicato l’etichetta a più di 700.000 post e ha impedito in modo proattivo la visualizzazione di annunci pubblicitari adiacenti a tali contenuti.

Secondo Twitter, questa nuova etichetta riduce la portata di un post dell’81%, limitando così in modo efficace la visibilità dei post che potenzialmente presentano comportamenti che incitano all’odio. Inoltre, più di un terzo degli utenti sceglie di eliminare autonomamente i tweet etichettati una volta ricevuta la notifica di violazione della politica del sito, e solo il quattro per cento degli autori ha fatto ricorso contro le etichette.

Espansione delle etichette e delle politiche contro l’incitamento all’odio

Di recente Twitter ha annunciato che espanderà il raggio di applicazione delle etichette per includere più tipologie di violazioni, come i post che violano le politiche sui comportamenti abusivi e sui discorsi violenti.

Tra i tweet che verranno colpiti nelle prossime settimane ci sono i post con contenuti malevoli rivolti a singoli individui, quelli che incoraggiano altri a molestare un individuo o un gruppo di persone, quelli che minacciano di infliggere danni fisici ad altri e i tweet che incoraggiano altri a commettere atti di violenza o danni di qualunque tipo.

Trasparenza e limiti delle politiche di Twitter

Nonostante i risultati incoraggianti, la maggior parte dei ricercatori che studiano l’hate speech non può verificare in modo indipendente queste affermazioni, poiché Twitter ha deciso di recente di far pagare l’accesso alle API. D’altro canto, l’azienda sostiene chiaramente che il suo approccio è stato finora efficace e continuerà ad impegnarsi per mantenere la libertà di parola sulla piattaforma, pur preservando la ‘salute’ della stessa.

Come abbiamo avuto modo di vedere, l’approccio di moderazione “Freedom of Speech Not Reach” di Twitter sembra aver ottenuto risultati positivi nella lotta contro i contenuti offensivi e dannosi sulla piattaforma. L’espansione delle etichette e delle politiche potrebbe ulteriormente migliorare la capacità di Twitter di gestire questi contenuti e proteggere gli utenti, tuttavia la questione della trasparenza e della verificabilità delle affermazioni di Twitter rimane aperta e potrebbe richiedere ulteriori sforzi da parte dell’azienda per garantire la fiducia degli utenti e dei ricercatori. Staremo a vedere come si svilupperà la situazione.

Potrebbero interessarti anche: Twitter blocca l’accesso ai non registrati e aggiunge il PiP su iOS e Elon Musk lancia xAI, una nuova società di intelligenza artificiale