Inteligencia artificial para redes sociales

Inteligencia artificial para
analizar redes sociales

Black box

Slider

El influencer ideal para mi marca

En el estado actual del mercado de influencers, el gold-standard es escoger a un influenciador por su volumen de seguidores. En este trabajo mostramos que ese criterio, como factor único de decisión, es insuficiente para evaluar adecuadamente al influenciador. 
El marketing de influencers es la estrategia que utilizan las empresas para hacer publicidad en colaboración con personas conocidas en redes sociales. A través de publicaciones, recomendaciones y testimonios, los influencers sugieren un comportamiento de compra sobre un mercado específico, haciendo resaltar una marca y favoreciendo sus ventas.

Transmite la marca

Sin embargo, no basta con encontrar una persona que publique sobre el producto, debe inspirar confianza en la audiencia y ser referente en el tema del que habla. Por ejemplo, empresas como Adidas o Yanbal, contratan figuras con una base de seguidores significativa, como Paulina Vega (@paulinavegadiep) o Ita María (@itamaria83). Estos influenciadores no son escogidos al azar, Paulina Vega es reconocida por ser Miss Universo 2014, un logro que difícilmente pudo ser alcanzado sin mantener un estilo de vida saludable, lo que la hace una perfecta candidata para apoyar a la marca deportiva.

Paulina Vega recomienda adida
Publicación de Paulina Vega donde recomienda un “look” Adidas para ejercitarse.

Por otro lado, como la moda y el maquillaje van de la mano, Yanbal escogió a Ita María como una de las embajadora de su marca, quien se llama a sí misma como una “Fashion Insider”.

Ita Maria promociona Yanbal
Publicación de Ita María donde promociona un concurso de Yanbal.

¿Es el influenciador ideal para la marca?

Medir la eficacia de un influenciador no resulta fácil. En diferentes estudios como el elaborado por Cha et al. (2010), se puede caracterizar a las personas influyentes de acuerdo a métricas como número de seguidores, menciones y retweets. La influencia está dada por el valor del usuario (menciones) y el valor de sus mensajes (retweets). Asimismo, caracterizan a las celebridades de mayor influencia por ser más mencionados, a los medios de comunicación por tener más seguidores y a los agregadores de contenidos por ser más retweeteados. 

Asimismo, existe una línea de estudios como el de Segev (2018), que trata de validar la veracidad de las métricas de redes sociales usando modelos de regresión para predecir el alcance o número de vistas de una publicación dado el número de comentarios, followers y likes. Los autores concluyen que el volumen de seguidores por sí solo no es un buen indicio del alcance, comparado con otras métricas de interacción como los likes y comentarios.  

La mejor manera de estudiar a un influenciador es considerando el mayor número de métricas posibles. Sin embargo, las dimensiones convencionales de las redes sociales pueden arrojar resultados sesgados, puesto que no tienen en cuenta el sentimiento de los comentarios y no hay forma de identificar la veracidad de los mismos.

Por ejemplo, un usuario que tiene muchos followers, likes y comentarios probablemente sería identificado como un buen influenciador; pero si los comentarios reflejan un sentimiento negativo hacia el personaje, puede ir en contra de los objetivos de negocio. 

 Procesamiento de Lenguaje Natural

Debido al crecimiento del marketing de influencers, ha surgido un gran mercado alrededor de las redes sociales. Ahora es posible comprar likes, followers y comentarios, desencadenando un gran problema, en donde el usuario parece ser un mejor influenciador de lo que realmente es.

Considerando esta situación, en Grupodot creamos un producto que ataca directamente el primer problema, permitiendo caracterizar a los influenciadores, no solo utilizando métricas tradicionales, sino incorporando el análisis de sentimiento por medio de Procesamiento de Lenguaje Natural (NLP)

Con esta herramienta es posible analizar el desempeño de diferentes influencers en Instagram,  de modo que sea fácil identificar cuáles son más apropiados para la identidad de la marca o la intención de la campaña.

Al integrar indicadores tradicionales como el número de seguidores, junto con el análisis de sentimiento, sobre un volumen de textos relacionados con un influenciador, es posible cuantificar la reputación de éste, en términos de sentimientos, asociados a los comentarios que recibe de sus seguidores.

Análisis de influenciadores

Para el análisis de influenciadores, construimos una herramienta de scraping que extrae data de redes sociales como Instagram y hace uso de la API de Google de Natural Language Processing (NLP), para realizar el análisis de sentimiento sobre los comentarios asociados a publicaciones importantes de los influenciadores seleccionados, de acuerdo a la necesidad del cliente. 

A partir de los resultados del análisis de sentimiento podemos obtener: 

  1. Métricas de performance por cada publicación.
  2. Un ranking de influencers, a partir de las métricas por cada uno.
  3. Visualizaciones que permiten entender de forma clara y concreta el performance global de cada uno.

Análisis de una publicación en Instagram 

Mediante la técnica de scraping, extraemos de forma automatizada todos los comentarios relacionados con determinado número de publicaciones de cada influenciador. Así, por cada publicación conseguimos los siguientes atributos (Figura 1): 

  • Número total de likes
  • Número total de comentarios
  • Texto completo de cada comentario
Data extraida de publicacion
Figura 1. Ejemplo de data que se extrae de una publicación en Instagram. 
(El número de comentarios no es visible directamente en la página web de la publicación pero si en el código html de la misma).

El proceso de scraping está estructurado de manera que se obtienen dos tipos de tablas:

  • Una tabla con el total de likes y comentarios por cada publicación e influenciador (Tabla 1).
  • Un conjunto de tablas por cada influenciador, donde cada tabla guarda el detalle de todos los comentarios de una publicación (Tabla 2).
Total likes y comentarios de influenciadores
Tabla 1. Ejemplo de tabla con total de likes y comentarios obtenidos por publicación e influenciador.
Comentarios extraidos de publicacion
Tabla 2. Ejemplo de detalle del texto de los comentarios extraídos de una publicación.

En este punto, es importante mencionar que cada vez que se usa la API para analizar un bloque de texto, obtenemos como resultado dos números que se llaman score y magnitude, los cuales se interpretan como una medida de la positividad (score > 0), negatividad (score < 0) y el tamaño del texto (magnitude > 0), respectivamente. 

Para nuestro caso, estos números se calculan por cada comentario y con base en los resultados, definimos indicadores de sentimiento únicos por publicación. Entonces, para medir el performance de una publicación particular, definimos el PPS o Post Sentiment Score (m0). Esta métrica es un promedio ponderado de los sentimientos de todos los comentarios de dicha publicación, donde se promedian los scores usando como pesos de ponderación las magnitudes así:

Post sentiment score

Para entender mejor estos resultados, se puede realizar un gráfico de dispersión de todos los comentarios de la publicación, donde los ejes del mismo sean precisamente el score y el magnitude. El resultado es un mapa que nos permite ver la distribución de sentimiento de todos los comentarios de una publicación (figura 2).

Mapa de sentimientos

Luego, se hacen conteos para obtener el total de comentarios positivos, negativos y neutrales por publicación, construyendo una tabla con las métricas de cada una. (tabla 3):

Tabla desentimientos y resultados en una publicacion
Tabla 3. Ejemplo de tabla con resultados de sentimiento por publicación: En el recuadro rojo se evidencian las magnitudes contenidas en la definición del PSS y en el recuadro azul se evidencian los centroides de sentimiento por cada publicación. 

Análisis de influenciadores en Instagram 

Los resultados de la tabla 3 se agrupan por influenciador, para calcular una métrica que permita caracterizar a cada uno con un puntaje único. Para esto, se considera un promedio ponderado de los PSS de las publicaciones recientes del influenciador, esta métrica considera que los pesos de ponderación son una suma de términos proporcionales al número de likes, comentarios y vistas:

Metrica de ponderacion likes comentarios y vistas

Aquí consideramos unos porcentajes relevantes según el objetivo de la campaña (reach o engagement). Al puntaje calculado por influenciador lo denominamos IGM (Influencer Generalized Metric)

Influencer Generalized Metric

Por otro lado, es interesante considerar una métrica que involucre solamente el sentimiento que generan las publicaciones de un influenciador, sin importar el volumen de seguidores que este tenga, (para evaluar micro-influenciadores). Por ello es útil considerar el PSS promedio de todas las publicaciones del influenciador como otra métrica adicional, a la cual denominamos MSS (Mean Sentiment Score)

Usando estas fórmulas, construimos tablas de ranking considerando varios influenciadores reconocidos en el país:

Tablas ranking influenciadores

En ambos casos, el influenciador número 1 es @jbalvin, gracias a su gran número de seguidores, los pesos del IGM fueron escogidos para darle mayor importancia al volumen de seguidores. De esta manera, si se quiere tener puntajes que reflejan el efecto de los otros indicadores, bastaría con modificar los porcentajes dentro del IGM

También vemos que para tener un ranking más acertado, es necesario crear categorías de influenciadores separados por cuartiles, después de esto, realizar otro cálculo de ranking para cada categoría: El IGM normaliza likes, comments y views con las medianas sobre todo el conjunto de influenciadores. Esto significa que estas métricas para un mismo influenciador, varían según los otros influenciadores con quienes este está siendo comparado. De esta manera, comparar a @greeicy, @la_segura, @el_mindo y @paulinavegadiep sin considerar a @jbalvin puede ser mucho más preciso y exacto.

Si comparamos ahora los histogramas de sentimiento del top 5 de nuestro ranking:

Histograma de sentimientos de influenciadores

Vemos que @jbalvin no tiene las publicaciones con el mejor sentimiento, en su lugar, resulta que @greeicy1 y @paulinavegadiep son quienes muestran una conexión más positiva con su influenciadores. Esto puede sugerir que las publicaciones contenidas en ese grupo de puntajes super positivos, poseen un tipo de mensaje muy diferente al de las demás publicaciones de ese influenciador. 

Otra manera de visualizar comparaciones entre influenciadores es usando diagramas de telaraña para evidenciar cuales son los puntos fuertes de cada uno:

Diagrama telaraña de los influenciadores

¿Cuál es el más indicado?

En este diagrama consideramos las variables variables diagrama  las cuales representan los promedios de comentarios, likes y el total de comentarios negativos, neutrales y positivos, respectivamente. Con este ejemplo observamos que:

  • Los influenciadores que más likes reciben no son necesariamente reciben más comentarios.
  • Dentro del top 5, todos tienen tendencia a que los comentarios sean positivos.

Acá podemos analizar que si se quiere lograr bastantes likes con las campañas, @greeicy1 es la influencer más indicada, por otro lado, si el objetivo es lograr que la gente participe dejando sus comentarios, entonces @la_segura es más apropiada.

Es curioso notar que @jbalvin no es el lider en ninguna de esas dos métricas variables diagrama lo cual evidencia que un influencer con gran número de seguidores, no necesariamente va a lograr el reach o engagement que requiera cierta campaña de publicidad.

Esta es una exploración más profunda de las interacciones con los seguidores, en términos de varias métricas como el número de likes y comentarios, y el análisis de texto usando algoritmos de procesamiento de lenguaje natural para determinar el sentimiento, ofreciendo indicadores más precisos de la reputación del influenciador dentro de su volumen de audiencia. 

A continuación resaltamos los siguientes avances: 

  • Se creó un índice estándar que incorpora métricas tradicionales (likes y comentarios) y el sentimiento generado por un influenciador.
  • Mediante visualizaciones como histogramas de sentimiento y diagramas de telaraña, se puede evidenciar que hay influenciadores con mejor sentimiento o mayor engagement, aunque tengan audiencias más pequeñas.

Para evidenciar los puntos fuertes de cada uno, se pueden clasificar los influencers en dos grupos: Los de más interacción (con mayores comentarios) y los que tienen mayor alcance (más likes). 

Sin embargo, para poder determinar con mayor certeza la eficiencia e impacto de un influenciador, es pertinente desarrollar un sistema de detección de métricas falsas.

De esta manera, el puntaje del influenciador será mucho más confiable, permitiendo informar a las compañías para garantizar un mayor retorno a su inversión. 

En el mundo del advertising, Instagram es una red social que se considera relevante entre aquellos usuarios que son personalidades famosas o que cuentan con una base de seguidores muy grande. Por otro lado, Twitter es una red social que si bien es popular en temas políticos, es preferida por muchos micro-influenciadores en temas publicitarios. En una próxima entrega, mostraremos cómo hacer analítica avanzada para caracterizar micro-influenciadores en Twitter.