Héctor Cotelo, ingeniero en informática que está terminando una maestría en Inteligencia Artificial se propuso aplicar en su experimento algoritmos de procesamiento de lenguaje natural (NLProc) para intentar clasificar la personalidad de las candidatas a la Intendencia de Montevideo en función de sus posteos en Twitter.
El experimento
Cotelo hizo uso de Presonality Insights para llevar a cabo este experimento. Se trata de un servicio de la empresa IBM que permite detectar rasgos de personalidad a partir del análisis de textos, en este caso tuits.
En el caso de Carolina Cosse extrajo tuits desde el 13/08/2013 hasta el 11/09/2020 (2.287 en total) y para Laura Raffo desde el 07/09/2013 hasta el 11/09/2020 (1.520 el total). Cotelo trabajó la base de datos para que se lograse una representación de los tuits en un formato que la computadora pudiese “entender”.
Una de las técnicas que utilizó para esta labor fue el Modelo bolsa de palabras (Bag of Words), un método a través del cual se representaron los tuits ignorando el orden de las palabras, como si cada uno fuese una bolsa con palabras desordenadas. Otra técnica aplicada fue la denominada tf-idf (del inglés Term frequency – Inverse document frequency), una medida numérica que expresa cuán relevante es una palabra para un documento en una colección, de forma que la base de datos no quede sesgada hacia stop-words (palabras sin mucho significado como “yo”, “a”, “en”, “aquí”…).
Con estas y otras técnicas, Cotelo logró procesar todos estos datos de forma que el algoritmo de Presonality Insights pudiese clasificar las representaciones de tuits en una de las categorías de personalidad existentes.
El servicio Personality Insights deduce las características de personalidad de la información textual basada en un enfoque de vocabulario abierto, un método que resulta ser la tendencia más reciente en las investigaciones de deducción de personalidad. Para entrenar el algoritmo, el servicio utilizó puntuaciones procedentes de encuestas realizadas entre miles de usuarios junto con los datos de sus cuentas de Twitter, concretamente a ochenta mil usuarios para los tuits en español.
La base psicológica
Esta plataforma trabaja en torno al Modelo de los cinco grandes (Big Five), una famosa forma de clasificar la personalidad basada en cinco factores, que a su vez se descomponen en seis facetas. Por sus siglas componen el acrónimo OCEAN:
-
Openess o apertura a nuevas experiencias: aventura, intereses artísticos, emotividad, imaginación, intelecto y progresismo.
-
Concientiousness o responsabilidad: lucha por logros, cautela, obediencia, orden y autodisciplina.
-
Extraversion o extraversión: nivel de actividad, asertividad, alegría, búsqueda de emociones, amabilidad y sentido comunitario (gregarismo).
-
Agreeableness o amabilidad: altruismo, cooperación, modestia, moral, simpatía y confianza.
-
Neuroticism o inestabilidad emocional: enfado, ansiedad, depresión, inmoderación, autoconciencia y vulnerabilidad.
Los resultados
Héctor Cotelo
Comparación de los cinco factores de personalidad de Cosse y Raffo según sus tweets según la plataforma Personality Insights
Héctor Cotelo
Comparación de las facetas de personalidad con mayor diferencia de Cosse y Raffo según sus tweets según la plataforma Personality Insights
Cotelo concluyó que ambas candidatas se destacan especialmente en dos de los cinco factores del modelo Big Five. En primer lugar, en Concientiousness o responsabilidad, que indica que ambas son personas conscientes, eficientes y organizadas. En segundo lugar, en Extraversion o extraversión, revelando que ambas son personas enérgicas, sociables y pro-interacción.
La mayor diferencia entre las candidatas se da en el factor Openess o apertura a nuevas experiencias, que tiene que ver también con el interés por las ideas nuevas y los valores no convencionales, la curiosidad intelectual y la originalidad y la imaginación. Aquí Cosse puntúa mejor que el 90% de la población encuestada y Raffo mejor que el 79%.
Las tres facetas en las que Cosse puntúa mejor son simpatía, autodisciplina y asertividad y las tres con puntaje más bajo son ansiedad, autoconciencia y alegría. En cambio, para Raffo las tres mejores son simpatía, asertividad e intelecto y las tres peores autoconciencia, ansiedad y búsqueda de emociones.
Las limitaciones del experimento
Se debe tener en cuenta que la plataforma Personality Insights tiene un MAE (Error absoluto medio, Mean Absolute Error) para textos en español de 0,10. MAE es una es una métrica utilizada para medir la diferencia entre los valores reales y predichos. IBM utiliza una escala de 0 a 1 para MAE, donde 0 significa que no hay error (el valor predicho es exactamente el mismo que el valor real), y 1 significa error máximo.
Por otra parte, Cotelo advierte que al ser ingeniero, y no psicólogo, no se debe buscar mucha rigurosidad en el experimento. A su vez, se debe tener en cuenta que los tuits de una candidata no tienen necesariamente que revelar rasgos de su propia personalidad, sino que pueden arrojar información de la campaña que lleva a cabo.