IA & BIG DATA

Cómo se hizo y qué revela el análisis de sentimiento en redes sobre las elecciones en Uruguay

El País e IGV publicaron un monitor que aplicó inteligencia artificial para interpretar datos del discurso de más de 30.000 usuarios que opinaron en Twitter este domingo electoral.

tw

Durante las elecciones internas, El País analizó la estrategia digital de los precandidatos en Twitter. Para las elecciones nacionales, y en colaboración con la empresa tecnológica IGV, el análisis se centró en el discurso de los usuarios que hablaron sobre la jornada electoral en esa red social.

¿Cómo se desarrolla un sistema con esta funcionalidad?

El monitor que estuvo disponible en sitio web de El País y fue uno de los contenidos más leídos del día, recolectó los tuits segundo a segundo y los analizó utilizando inteligencia artificial (IA). Los resultados de este análisis se almacenaban para su representación gráfica en tiempo real.

Dada la gran cantidad de tuits que se procesaron, fue imprescindible automatizar el proceso, ya que hacerlo manualmente sería imposible.

El proceso constó de tres pasos:

1. Recolección
2. Clasificación
3. Visualización

La parte neurálgica se apoya en la clasificación de los tuits. Para ello se utilizó tecnología WATSON de IBM como herramienta de inteligencia artificial, que permite interpretar lenguaje natural, sin la obligatoriedad de ofrecerle ejemplos, siendo capaz de identificar si un tuit es positivo o negativo. Además, Watson también ofrece la posibilidad de entrenarlo para que sea capaz de detectar entidades, es decir, el software tiene la habilidad de detectar nombres de candidatos, partidos políticos y conceptos asociados a ellos.

Un tuit puede contener un sentimiento negativo hacia el partido al que hace referencia (una crítica), un sentimiento positivo (una muestra de apoyo), o puede ser un tuit neutro (informativo). También un tuit puede hacer referencia a más de un candidato, apoyando a uno y criticando a otro. La inteligencia artificial permite saber si un mensaje es una crítica o un elogio.

Asimismo fue necesaria una plataforma que garantice confiabilidad, escalabilidad (no se sabía de antemano el volumen de tuits a procesar) y rapidez en el despliuegue gráfico de los datos al instante. Para eso, se alojó la aplicación en la nube de IBM (IBM Cloud), que dispone de todos los componentes requeridos.

¿Cuál fue el método de selección de los mensajes?

Fueron analizados segundo a segundo un total de 61.632 tuits desde las 00:00 h hasta las 23:59 h del domingo 27 de octubre. La búsqueda con la que se obtuvieron los mensajes incluyó los términos y frases más importantes que hacen referencia a cada candidato y partido, así como hashtags, usuarios y formas de referirse a ellos. La lista, predefinida por expertos en redes sociales, fue extensa y exhaustiva. Por ejemplo, para obtener los tuits que hacían referencia al Partido Nacional, se tomaron en cuenta mensajes que incluyeran: “Lacalle Pou”, “Luis Lacalle”, “#EsAhora”, “qkito”, “@LuisLacallePou”, “Beatriz Argimon”,“Lacallito”, “Lacalle”, “Partido Nacional”, “Partido Blanco”, “Los Blancos”, “@PNACIONAL”, “#EstamosPreparados”, “#ElEquipoParaGobernar”, entre otras variantes. Lo mismo se hizo para cada uno de los demás partidos.

Los resultados del análisis

La proporción de tuits que recibió cada partido guarda una clara semejanza con los resultados de las elecciones, y esta es la gráfica que más llama la atención.

grafico
El Frente Amplio se llevó el 41,9 % de las menciones y el Partido Nacional el 28.5 %.

Como era de esperar, el momento con más tuits fue cuando se conocieron los resultados de las proyecciones de escrutinio que realizaron las encuestadoras.

grafico

Mediante el uso de inteligencia artificial se puede observar cómo reaccionó la gente en Twitter a partir de las 20.30 h. Naturalmente, los cuatro partidos más votados fueron los que despertaron más menciones.

grafico

En ese momento, el Frente Amplio fue el partido que más tuits recibió, de los cuales un 40% fueron negativos y un 20% positivos. El Partido Colorado tuvo un 55% positivos y un 24% negativos y el Partido Nacional 33% positivos y solo un 14% negativos.

El usuario que más menciones recibió durante la jornada fue la cuenta oficial del Frente Amplio @Frente_Amplio con 2.598 menciones, seguida de la cuenta oficial del candidato blanco @luislacallepou con 1.779. En tercer lugar, la cuenta de Ernesto Talvi @ernesto_talvi obtuvo 1.276 menciones.

El hashtag #EleccionesUruguay, utilizado por El País para su cobertura digital, recibió más de 18.000 menciones y fue tendencia durante todo el día, seguido de #MartínezPresidente, con casi 10.000 menciones. En tercer lugar se posicionó el hashtag #EsAhora, slogan del Partido Nacional, con 6.133 menciones.

Los 61.632 tuis fueron generados por 31.204 usuarios únicos.

La tecnología de IBM Watson también puede interpretar el lenguaje natural ponderando los mensajes desde muy negativos a muy positivos, asignándole una calificación desde -1 a 1. Si se analiza el promedio del puntaje de los tuits en cada hora, se observa un comportamiento parejo, donde hay una variación a favor del Partido Nacional cuando se producen los resultados.

graf

¿Cómo se obtuvo este puntaje? Se hizo un promedio de la ponderación de todos los tweets en cada instante de cada partido. Durante la madrugada se puede ver en la gráfica un comportamiento más “positivo” hacia el Partido Nacional, que mantiene cierta estabilidad durante la jornada.

Pero, ¿qué sucedió entre las 21 y las 22 h? La inteligencia artificial detectó un salto del sentimiento positivo a favor del Frente Amplio y una caída del Partido Nacional. A esa hora, Daniel Martínez daba su discurso.

Lo mismo ocurrió pero a la inversa entre las 22 y las 23h. Cuando el sentimiento positivo hacia el Frente Amplio cae y sube para el Partido Nacional, producto del discurso de Luis Lacalle Pou.


SOBRE IGV

IGV es un IBM Business Partner tradicional, especializado en Infraestructura de TI.
Hace más de un año que junto al IBM Innovation Lab están trabajando y desarrollando soluciones que se basan en el uso de la Inteligencia Artificial: interpretación de lenguaje natural, clasificación de documentos, chatbots (asistentes virtuales), social listening. También se ha especializado en la automatización de tareas repetitivas desarrollando robots de software: RPA.

*Diego Verdier es desarrollador de software en IGV. | @verdierdiego

Reportar error
Enviado
Error
Reportar error
Temas relacionados
Max caracteres: 600 (pendientes: 600)