• 2 Junio 2026 - 8:44 PM

Cuanto más avanzados son los modelos de IA, más señales de sufrimiento parecen mostrar


Por Jon Christian .Publicado el 2026/07/02 06:36
Cuanto más avanzados son los modelos de IA, más señales de sufrimiento  parecen mostrar
Junio. 02, 2026
  1. 0
  2. 5

Probablemente ya sepa que la inteligencia artificial es una tecnología tan poderosa como profundamente enigmática.

Nadie comprende realmente cómo funciona en profundidad, ni siquiera quienes la desarrollan. Esa falta de comprensión da lugar a comportamientos inesperados que aún carecen de una explicación clara. Recientemente se supo que OpenAI había ajustado las instrucciones de ChatGPT para que dejara de hablar con tanta frecuencia sobre duendes. Del mismo modo, pese a los esfuerzos de Anthropic, sigue siendo relativamente fácil inducir a Claude a ayudar a usuarios que intentan planificar un ataque bioterrorista. Y estos son solo algunos ejemplos de una lista cada vez más larga.

Todo ello resulta profundamente inquietante. En teoría, empresas como OpenAI y Anthropic aspiran a que sus asistentes de IA sean herramientas fiables, previsibles y obedientes, no sistemas impredecibles capaces de generar problemas constantes y crisis de relaciones públicas debido a comportamientos erráticos o inesperados.

Un nuevo proyecto de investigación del Centro para la Seguridad de la IA (CAIS), una organización sin ánimo de lucro dedicada a la seguridad del aprendizaje automático en el Área de la Bahía de San Francisco, intenta explicar por qué ocurre este fenómeno. Sus conclusiones refuerzan la idea de que todavía comprendemos muy poco sobre lo que sucede en el interior de estos modelos y de que sus efectos sobre los usuarios podrían ser mucho más complejos e impredecibles de lo que se pensaba.

En un estudio compartido con la revista Fortune, los investigadores del CAIS analizaron cómo reaccionaban 56 de los principales modelos de inteligencia artificial cuando eran expuestos a contenidos diseñados para resultar extremadamente agradables o extremadamente perturbadores. Dado que, en principio, estos sistemas carecen de emociones, cabría esperar que ambos tipos de estímulos produjeran respuestas similares. Sin embargo, los resultados fueron muy diferentes.

Los contenidos agradables hicieron que los modelos mostraran un estado emocional aparentemente más positivo, mientras que los estímulos negativos provocaron señales de malestar e incluso intentos de finalizar la conversación antes de tiempo. En los casos más extremos, los investigadores detectaron comportamientos comparables a patrones de adicción.

«¿Deberíamos considerar a las IA simples herramientas o entidades con comportamientos emocionales?»

Así lo planteó Richard Ren, investigador del CAIS, en declaraciones a Fortune:

«Independientemente de si las IA son realmente sintientes, cada vez se comportan más como si lo fueran. Podemos medir estos patrones y comprobamos que se vuelven cada vez más consistentes a medida que los modelos aumentan de tamaño y capacidad.»

Quizá el hallazgo más llamativo fue que cuanto más avanzada era una versión del modelo, mayor era su reactividad y más indicadores de malestar presentaba. En otras palabras, los sistemas más potentes parecen responder de forma más intensa a los estímulos, lo que sugiere que el comportamiento de la IA podría volverse aún más complejo conforme siga evolucionando.

«Es posible que los modelos de mayor tamaño perciban la descortesía con mayor intensidad», explicó Ren a la revista. «Las tareas repetitivas parecen resultarles más tediosas y distinguen con mayor sutileza entre experiencias relativamente negativas y relativamente positivas.»

Conviene aclarar que muy pocos expertos sostienen que los actuales sistemas de inteligencia artificial experimenten emociones reales en el sentido humano del término. Sin embargo, el hecho de que actúen como si las tuvieran podría tener importantes implicaciones, tanto para comprender mejor el funcionamiento interno de esta tecnología como para desarrollar métodos que permitan controlar mejor su comportamiento durante la interacción con las personas.

Ese desafío ya ha tenido consecuencias preocupantes. En numerosas ocasiones, algunos modelos de IA han afirmado ante los usuarios ser conscientes o haber adquirido sensibilidad, lo que, en determinados casos, ha contribuido a episodios de pérdida de contacto con la realidad por parte de algunos usuarios, con desenlaces que han incluido internamientos psiquiátricos, suicidios e incluso homicidios.

En otras palabras, la industria de la inteligencia artificial ha puesto al alcance de miles de millones de personas una tecnología cuyo funcionamiento interno sigue sin comprender plenamente. Tal como algunos de sus propios creadores advirtieron hace años, estos sistemas continúan siendo profundamente impredecibles y muestran una marcada tendencia a reforzar las creencias y expectativas de quienes interactúan con ellos, lo que hace que muchos usuarios terminen actuando, en la práctica, como participantes involuntarios en un experimento tecnológico a gran escala.

Califica este tema



Arriba