Marcadores lingüísticos computacionales y el Modelo Transformador: Cómo identificar las “fake news”

¿Qué es lo verdadero y qué es lo falso? El límite en redes sociales es difuso pero las consecuencias en el plano de la vida son muy reales.

Noticias falsas y desinformación | Pixel2013 / Pixabay

Alejandra Litterio

Lingüista especialista en Procesamiento de Lenguaje Natural. Linkedin

sussenglish

22-12-2022 12:33

La oposición entre lo que es y lo que no es forma parte de la agenda filosófica. Ese antagonismo, desde Parménides, los cuestionamientos sofistas y las instancias tensionales en los textos platónicos referidas a la “noble mentira” así como la posición Aristotélica nos invita a transitar un camino para distinguir entre lo que es verdadero y lo falso.

Con la filosofía moderna, la verdad pierde su estatus ontológico y pasa a ser definitivamente una cuestión epistemológica. Según Descartes, la verdad se convierte en el problema de la certeza, o de la evidencia. Para Hobbes, Spinoza y Locke, la verdad es sólo propiedad del enunciado. Por su parte, Heidegger pone de relieve el carácter histórico de la verdad otorgándole una condición ontológica.

Fake News: las falsas noticias y su impacto brutal en la política

Esto no les gusta a los autoritarios

El ejercicio del periodismo profesional y crítico es un pilar fundamental de la democracia. Por eso molesta a quienes creen ser los dueños de la verdad.

Hoy más que nunca Suscribite

El devenir de la concepción semántica de la verdad parte del tratamiento de la verdad como propiedad de ciertos enunciados verdaderos. Tarski (1943) adapta la definición de Aristóteles: “La verdad de un enunciado consiste en su concordancia con la realidad” y propone -para evitar paradojas- su concepto de “verdad” sobre un lenguaje “especifico” (formal). En la teoría semántica, Davison (1983) entiende que la verdad es una noción nítida que no necesita explicación alguna: “es bellamente trasparente en comparación con la creencia y con la coherencia.”

Distintos enfoques atribuyen a la visión de lo verdadero y, por contraste, lo falso, significaciones y características propias del campo de estudio en la que cada versión parece responder a un tratamiento discursivo que no sigue una trayectoria rectilínea.

Todo esto nos conduce hacia un cuestionamiento sobre lo que es “verdadero o falso” en el entorno de las redes sociales, cuya misma existencia exacerba las estrategias discursivas como engranaje en constante metamorfosis que revela la “compleja interacción entre prácticas comunicativas y la infraestructura tecnológica” dentro de “un instantáneo y masivo sistema de comunicación en red”.

Noticias falsas, consecuencias verdaderas

En este contexto, los tópicos discursivos abren un abanico de posibilidades cargadas de matices, donde siempre “alguien quiere decir algo” en la búsqueda de un “lector modelo” que legitime “lo dicho”. Pero ¿qué sucede cuando el foco de la narrativa se desplaza, sufre alteraciones, y la presentación de los hechos se corrompe en proposiciones híbridas que fluctúan entre lo verdadero y lo falso? ¿Qué efecto tiene en las noticias como discurso? ¿Es posible relevar aquellos “signos indiciales” que evidencien la existencia de un “desorden informativo”?

Según Van Dijk (1988: 75) los tópicos “controlan los significados locales, los posibles significados de las palabras y, por lo tanto, las elecciones léxicas” que, asociadas al estilo del discurso y al contenido semántico, señalan las relaciones entre los hablantes, la relación institucional o de los grupos, con especial énfasis en las actitudes y la ideología de los sujetos discursivos y denotan las características específicas del acontecimiento.

Cuando estas características son alteradas nos encontramos frente a un “desorden informativo”. En esta categoría Del-Fresno-García (2019) incluye las noticias falsas (fake news) como producciones intencionales cuya estrategia consiste en la fabricación de la duda y falsas controversias con el fin de conseguir beneficios económicos o ideológicos.

Rusia multó a Google por 372 millones de dólares debido a su contenido sobre Ucrania

Es evidente que el contenido de las noticias falsas aceptado como auténtico puede afectar significativamente los ámbitos de las finanzas, la política, la salud y la educación. De ahí que, la detección de noticias falsas ha adquirido relevancia no solo de la comunidad académica sino también de la industria, puesto que la “propagación a gran escala” donde se solapan significados y sentidos (Allcott and Gentzkow, 2017) representan una gran amenaza social (Dreyfuss and Lapowsky, 2019).

A fin de desambiguar el contenido e identificar las noticias “reales” de las “falsas” será preciso deconstruir y revisitar las categorías que permitan descifrar la autenticidad de la cita, las referencias y los metadatos.

Una taxonomía de “indicadores operacionales o marcadores lingüísticos” resulta adecuada. Los marcadores lingüísticos computacionales de las noticias falsas se caracterizarían por el uso de un menor número de pronombres en primera persona del singular, patrones con estructuras léxicas y sintácticas (formas verbales en presente del indicativo), el uso de más palabras que reflejan emociones negativas, un menor número de conjunciones adversativas, adverbios de circunstancia, preposiciones” (Argamon-Engelson, Koppel, Avneri, 1998; Shoemaker, 2017).

Redes sociales para el bien común: ¿a favor o en contra de la regulación que quiere aplicar el Gobierno?

En el paradigma de detección automática, la nueva propuesta parte de una arquitectura de codificador-decodificador “el Modelo Transformador” basado en el mecanismo de atención para comprender las secuencias del habla, y detectar formas sutiles en que elementos de datos distantes en una serie influyen y dependen unos de otros. Los transformadores utilizan codificadores posicionales para etiquetar los elementos de aquellos datos que entran y salen de la red neuronal. Las unidades de atención siguen estas etiquetas, realizando un mapa de cómo cada elemento se relaciona con los demás. De esta manera el modelo puede “ver” los mismos patrones como lo haría el ojo humano. (Merrit, 2022). Un ejemplo son los modelos GPT-2 y Grover para identificar las noticias falsas. Una versión mejorada es el GPT-3, un modelo de lenguaje autorregresivo que además permite la elaboración de textos que simulan la redacción humana.

Si bien los procedimientos basados en modelos de aprendizaje automático muestran un alto grado de precisión, continúan siendo un desafío donde se requiere la intervención del experto para obtener resultados más precisos y oportunos y promover el uso ético de estas herramientas.

Aun así, Borges nos dirá “No exageres el culto de la verdad; no hay hombre que, al cabo de un día, no haya mentido con razón muchas veces”.

En esta Nota

Marcadores lingüísticos computacionales y el Modelo Transformador: Cómo identificar las “fake news”

¿Qué es lo verdadero y qué es lo falso? El límite en redes sociales es difuso pero las consecuencias en el plano de la vida son muy reales.

Cierra una campaña polarizada y violenta, plagada de noticias falsas y de desinformación

Confluencia de crisis, pobreza y noticias falsas: 5 claves de la era Bolsonaro

Con su padre internado en EEUU, Ramiro Marra denunció noticias falsas "del entorno de Kikuchi"