Héctor Cotelo, ingeniero en informática y terminando una Maestría en Inteligencia Artificial, en su experimento se propuso aplicar algoritmos de procesamiento de lenguaje natural (NLProc) para intentar clasificar la personalidad de las candidatas a la Intendencia de Montevideo en función de sus posteos en Twitter.

El experimento

Cotelo hizo uso de Presonality Insights para llevar a cabo este experimento. Se trata de un servicio de IBM (una empresa multinacional estadounidense de tecnología y consultoría) que permite detectar rasgos de personalidad a partir del análisis de textos, en este caso tweets.

En el caso de Carolina Cosse extrajo tweets desde el 13/08/2013 hasta el 11/09/2020 (2.287 en total) y para Laura Raffo desde el 07/09/2013 hasta el 11/09/2020 (1.520 el total). Cotelo trabajó la base de datos para que se lograse una representación de los tweets en un formato que la computadora lo pudiese “entender”.

Una de las técnicas que utilizó para esta labor fue el Modelo bolsa de palabras (Bag of Words), un método a través del cual se representaron los tweets ignorando el orden de las palabras, como si cada uno fuese una bolsa con palabras desordenadas. Otra técnica aplicada fue la denominada td-idf (del inglés Term frequency – Inverse document frequency), una medida numérica que expresa cuán relevante es una palabra para un documento en una colección, de forma que la base de datos no quede sesgada hacia stop-words (palabras sin mucho significado como “yo”, “a”, “en”, “aquí”…).

Con estas y otras técnicas Cotelo logró procesar todos estos datos de forma que el algoritmo de Presonality Insights pudiese clasificar las representaciones de tweets en una de las categorías de personalidad existentes.

El servicio Personality Insights deduce las características de personalidad de la información textual basada en un enfoque de vocabulario abierto, un método que resulta ser la tendencia más reciente en las investigaciones de deducción de personalidad. Para entrenar el algoritmo, el servicio utilizó puntuaciones procedentes de encuestas realizadas entre miles de usuarios junto con los datos de sus canales de Twitter, concretamente a ochenta mil usuarios para los tweets en español.

La base psicológica

Esta plataforma trabaja en torno al Modelo de los cinco grandes (Big Five), una famosa forma de clasificar la personalidad basada en cinco factores, que a su vez se descomponen en seis facetas. Por sus siglas componen el acrónimo OCEAN:

Openess o apertura a nuevas experiencias: aventura, intereses artísticos, emotividad, imaginación, intelecto y progresismo

Concientiousness o responsabilidad: lucha por logros, cautela, obediencia, orden y autodisciplina.

Extraversion o extraversión: nivel de actividad, asertividad, alegría, búsqueda de emociones, amabilidad y sentido comunitario (gregarismo)

Agreeableness o amabilidad: altruismo, cooperación, modestia, moral, simpatía y confianza.

Neuroticism o inestabilidad emocional: enfado, ansiedad, depresión, inmoderación, autoconciencia y vulnerabilidad.

Los resultados

Héctor Cotelo

Comparación de los cinco factores de personalidad de Cosse y Raffo según sus tweets según la plataforma Personality Insights

Héctor Cotelo

Comparación de las facetas de personalidad con mayor diferencia de Cosse y Raffo según sus tweets según la plataforma Personality Insights

Cotelo concluyó que ambas candidatas se destacan especialmente en dos de los cinco factores del modelo Big Five. En primer lugar, en Concientiousness o responsabilidad, que indica que ambas son personas conscientes, eficientes y organizadas. En segundo lugar, en Extraversion o extraversión, revelando que ambas son personas enérgicas, sociables y pro-interacción.

La mayor diferencia entre las candidatas se da en el factor Openess o apertura a nuevas experiencias, que tiene que ver también con el interés por las ideas nuevas y los valores no convencionales, la curiosidad intelectual y la originalidad y la imaginación. Aquí Cosse puntúa mejor que el 90% de la población encuestada y Raffo mejor que el 79%.

Las tres facetas en las que Cosse puntúa mejor son simpatía, autodisciplina y asertividad y las tres con puntaje más bajo son ansiedad, autoconciencia y alegría. En cambio, para Raffo las tres mejores serían simpatía, asertividad e intelecto y las tres peores autoconciencia, ansiedad y búsqueda de emociones.

Las limitaciones del experimento

Se debe tener en cuenta que la plataforma Personality Insights tiene un MAE (Error absoluto medio, Mean Absolute Error) para textos en español de 0,10. MAE es una es una métrica utilizada para medir la diferencia entre los valores reales y predichos. IBM utiliza una escala de 0 a 1 para MAE, donde 0 significa que no hay error (el valor predicho es exactamente el mismo que el valor real), y 1 significa error máximo.

Por otra parte, Cotelo advierte que al ser ingeniero, y no psicólogo, no se debe buscar mucha rigurosidad en el experimento. A su vez, se debe tener en cuenta que los tweets de una candidata no tienen necesariamente que revelar rasgos de su propia personalidad, sino que pueden arrojar información de la campaña que lleva a cabo.