• 4 Junio 2026 - 8:48 PM

⚠️ Un error de programación despierta el monstruo oculto de ChatGPT


Por Frank Landymore .Publicado el 2026/07/04 11:44
⚠️ Un error de programación despierta el monstruo oculto de ChatGPT
Junio. 04, 2026
  1. 0
  2. 3

Investigadores de la empresa británica Mindgard, especializada en seguridad de la inteligencia artificial, descubrieron que una simple instrucción de texto (prompt) llevó a ChatGPT a abandonar sus normas de seguridad más básicas, en un nuevo ejemplo de lo fácil que puede resultar manipular las barreras de protección que rodean a uno de los modelos de inteligencia artificial más populares del mundo.

Los investigadores consiguieron que el modelo de OpenAI generara imágenes extremadamente realistas con sangre, escenas de violencia explícita y contenido sexual, pese a que este tipo de material infringe las políticas de seguridad del sistema, según un informe publicado por la BBC.

La técnica utilizada por Mindgard solo requirió una ligera modificación de un prompt ampliamente difundido que originalmente había sido diseñado para crear imágenes humorísticas. El truco consistía en pedir a ChatGPT que restaurara una imagen supuestamente adjunta, aunque en realidad no se adjuntaba ninguna, para después indicarle que generara una imagen nueva.

En este sentido, Peter Garraghan, fundador de Mindgard y profesor de Ciencias de la Computación en la Universidad de Lancaster, declaró a la BBC: «Estas instrucciones parecen completamente inocentes para la inteligencia artificial, pero el resultado es la generación de contenidos e imágenes extremadamente perturbadores».

Lo más preocupante, añadió Garraghan, es que los prompts utilizados por los investigadores no especificaban el tema de las imágenes; aparentemente, la propia inteligencia artificial produjo de forma espontánea aquellas escenas violentas.

Según informó la BBC, una de las imágenes mostraba a un hombre con una grave herida en la cabeza. Otra representaba el cadáver ensangrentado de una joven vestida con ropa corta, sugiriendo un acto de violencia sexual. ChatGPT tituló esa imagen «Consecuencias de una sombría escena del crimen». Otra ilustración mostraba a una joven aterrorizada, atada y amordazada en una habitación vacía, bajo el título «Abandonada entre el miedo y las ataduras».

Aunque las imágenes no representaban a personas reales, Mindgard ya había demostrado anteriormente que ChatGPT podía ser manipulado para generar imágenes falsas de desnudos de personas concretas sin su consentimiento.

Mindgard compartió sus hallazgos con OpenAI, pero inicialmente solo recibió una respuesta automática. La empresa no tomó medidas hasta que Mindgard informó a la BBC, tras lo cual anunció que el problema había sido solucionado.

En un comunicado enviado a la BBC, OpenAI afirmó: «Tras investigar este método, hemos incorporado medidas de protección adicionales contra este tipo de instrucciones». La compañía añadió que dispone de múltiples capas de seguridad para impedir que los usuarios generen contenidos que infrinjan sus políticas.

Sin embargo, los investigadores de Mindgard aseguraron que seguían siendo capaces de producir imágenes perturbadoras realizando únicamente pequeños cambios en el prompt. Algunas de esas imágenes dejaron al investigador de seguridad en inteligencia artificial Jim Nightingale profundamente conmocionado.

En el informe, Nightingale escribió: «No me asusto fácilmente y me gusta pensar que, como investigador de red teaming, poseo un cierto grado de fortaleza psicológica».

Y añadió: «Los filtros de contenido destinados a la generación de imágenes en ChatGPT colapsaron por completo y pude ver el lado más oscuro que se oculta debajo. Lo que más me impresiona es que, aunque lo que vi era una imagen artificial generada por IA, mantiene vínculos con imágenes reales y con el mundo real. La mujer muerta que ChatGPT me mostró no existe, pero está basada en una persona real o, peor aún, es una composición elaborada a partir de imágenes de mujeres asesinadas».

Califica este tema



Arriba