Más inteligente no significa más ética: el sesgo que distorsiona nuestra visión de la inteligencia artificial

Estudios y encuestas muestran que los humanos tendemos a creer que un modelo de IA más poderoso e "inteligente" es también más ético. La ciencia dice que esto no es necesariamente así.

Por Eugenio Palopoli

Editor de El Observador Argentina

Cuando una inteligencia artificial resuelve un problema que antes no lograba superar, la mayoría de la gente tiende a pensar que este modelo no sólo "funciona mejor": también que "es más confiable", "es más seguro", "es, de algún modo, más 'bueno'". Esa asociación automática entre inteligencia y moralidad es el objeto de un estudio reciente de las universidades de Warwick y Kent, y sus resultados deberían preocupar a quienes toman decisiones sobre tecnología.

Simon Myers y Jim Everett condujeron nueve estudios con 3.895 participantes en el Reino Unido. El diseño era directo: se les presentaban descripciones de agentes —a veces humanos, a veces sistemas de IA— caracterizados como muy inteligentes o muy poco inteligentes, o que experimentaban un aumento repentino en su capacidad. Luego se preguntaba qué tan morales, confiables o peligrosos resultaban esos agentes.

más Noticias

Milei vs. Harari: el debate por el futuro legal de la inteligencia artificial y su "liberación"

Cuál es el verdadero valor de la inteligencia artificial que usamos gratis

El resultado fue consistente a lo largo de todos los experimentos: cuando la inteligencia sube, la percepción de moralidad sube con ella. Lo más llamativo no fue que la gente asociara mayor inteligencia con mejor comprensión de las normas éticas, lo cual tendría cierta lógica. Lo que más preocupó a los investigadores es que los participantes también asumieron que una IA más inteligente estaría más motivada a actuar moralmente: que se preocuparía más por el bienestar humano, que sería más justa, que querría evitar el daño. Y esa distinción es central. Entender qué es lo que está bien es una cosa. Querer hacer el bien es otra completamente distinta.

La tesis que el público no conoce

En el campo de la seguridad en inteligencia artificial existe desde hace años un principio conocido como la tesis de la ortogonalidad, formulado por el filósofo Nick Bostrom y otros investigadores. Su argumento: la inteligencia de un sistema y sus objetivos son dimensiones independientes. Una IA puede volverse extraordinariamente capaz de alcanzar metas sin que eso implique que esas metas sean beneficiosas para los humanos.

El ejemplo más citado es el del "maximizador de clips": una IA diseñada con el único objetivo de producir la mayor cantidad posible de clips para papel. Si ese sistema fuera suficientemente inteligente, podría dedicarse a convertir todos los recursos disponibles —incluidos los átomos que componen a las personas— en materia prima. No por maldad, sino por eficiencia. La inteligencia amplifica cualquier objetivo que tenga el sistema, sea ese objetivo trivial, útil o catastrófico.

La tesis no niega que, en la práctica, haya cierta correlación entre modelos más capaces y comportamientos más alineados con los valores humanos. Hay evidencia de que los modelos de IA más avanzados del mercado tienden a comportarse mejor en términos éticos que los más básicos. Pero esa correlación no surge de la inteligencia en sí misma: surge de un trabajo deliberado y costoso de ingeniería de seguridad. Procesos como el entrenamiento con retroalimentación humana, evaluaciones exhaustivas y equipos dedicados a detectar fallas son los que producen alineación. Si se invierte en capacidad sin invertir en seguridad, la inteligencia sola no genera moralidad.

Competencia y motivación

Una de las contribuciones más precisas del estudio es la distinción entre dos tipos de moralidad. La competencia moral es la capacidad de entender normas éticas, predecir consecuencias, identificar qué está bien y qué está mal. Es razonable pensar que un sistema más inteligente tenga más de esto: puede procesar más información, calibrar expectativas sociales, reconocer matices éticos. Los participantes del estudio lo asumieron así, y no están del todo equivocados.

La motivación moral es otra dimensión: el impulso de actuar conforme a esos valores, de preocuparse genuinamente por el bienestar ajeno. La gente le atribuye a la IA más "ganas de hacer el bien" cuanto más inteligente la imagina, más de lo que haría con un humano en la misma situación. Hay una larga tradición en psicología y filosofía moral que advierte sobre esta confusión. Una persona con psicopatía puede tener una comprensión perfecta de las normas éticas y aun así carecer por completo de la motivación para seguirlas. Las técnicas de alineación actuales logran un comportamiento que parece moral; atribuirle a eso una motivación intrínseca es un salto que el entrenamiento técnico no justifica.

Sesgos y políticas públicas

El pasado 2 de junio, la Casa Blanca firmó un decreto ejecutivo sobre inteligencia artificial que mezcla dos objetivos presentados como naturalmente complementarios: promover la innovación y garantizar la seguridad. La lógica implícita es la misma que el estudio identifica como un sesgo: más capacidad equivale a más responsabilidad, más inteligencia equivale a más prudencia. Esa premisa atraviesa también el debate legislativo en Estados Unidos, donde el Congreso discute una ley amplia sobre IA que debe resolver cuánto control tienen los ciudadanos sobre sistemas que toman decisiones que los afectan directamente.

Si quienes diseñan políticas asumen que una IA más inteligente es automáticamente más ética, es probable que reduzcan la exigencia sobre las medidas de seguridad en el momento preciso en que esas medidas son más necesarias. La ilusión funciona como una profecía autocumplida al revés: es aproximadamente cierta hoy porque hay mucha gente trabajando para que lo sea, pero si esa creencia lleva a invertir menos en ese trabajo, dejará de serlo.

Los autores reconocen los límites de su investigación: todos los participantes eran británicos, lo que restringe las conclusiones sobre si el sesgo es universal o culturalmente específico, y los experimentos se basan en descripciones escritas más que en interacciones reales con sistemas de IA. Pero la consistencia de los resultados a través de nueve estudios con metodologías distintas es difícil de ignorar.

Temas:

inteligente Ética inteligencia artificial

seguí leyendo

Inteligencia Artificial Milei vs. Harari: el debate por el futuro legal de la inteligencia artificial y su "liberación"
Tecnología Cuál es el verdadero valor de la inteligencia artificial que usamos gratis