4 Junio 2026 - 8:48 PM

Newsletter

Dioses virtuales: ¿Cómo domina la máquina el pensamiento de los intelectuales?
⚠️ Un error de programación despierta el monstruo oculto de ChatGPT
Del escepticismo a la afirmación: un robot asume el papel del Creador
Un abrazo de hace 4.300 años: los esposos del Antiguo Egipto no se separaban ni después de la muerte
Guerra del clima: ¿El aire acondicionado estadounidense está matando a los habitantes del Viejo Continente?
Los ladrones: los mayores beneficiados del auge de los centros de datos
Cuanto más avanzados son los modelos de IA, más señales de sufrimiento parecen mostrar
Anthropic contrata a un economista cuyo estudio reabre el debate sobre un 33 % de riesgo de extinción humana
El parásito de los gatos: la infección silenciosa que preocupa a los científicos
Tatuaje corneal: la moda estética que alarma a los oftalmólogos

Internet » Inteligencia artificial

⚠️ Un error de programación despierta el monstruo oculto de ChatGPT

Por Frank Landymore .Publicado el 2026/07/04 11:44

⚠️ Un error de programación despierta el monstruo oculto de ChatGPT — Junio. 04, 2026

0

3

Investigadores de la empresa británica Mindgard, especializada en seguridad de la inteligencia artificial, descubrieron que una simple instrucción de texto (prompt) llevó a ChatGPT a abandonar sus normas de seguridad más básicas, en un nuevo ejemplo de lo fácil que puede resultar manipular las barreras de protección que rodean a uno de los modelos de inteligencia artificial más populares del mundo.

Los investigadores consiguieron que el modelo de OpenAI generara imágenes extremadamente realistas con sangre, escenas de violencia explícita y contenido sexual, pese a que este tipo de material infringe las políticas de seguridad del sistema, según un informe publicado por la BBC.

La técnica utilizada por Mindgard solo requirió una ligera modificación de un prompt ampliamente difundido que originalmente había sido diseñado para crear imágenes humorísticas. El truco consistía en pedir a ChatGPT que restaurara una imagen supuestamente adjunta, aunque en realidad no se adjuntaba ninguna, para después indicarle que generara una imagen nueva.

En este sentido, Peter Garraghan, fundador de Mindgard y profesor de Ciencias de la Computación en la Universidad de Lancaster, declaró a la BBC: «Estas instrucciones parecen completamente inocentes para la inteligencia artificial, pero el resultado es la generación de contenidos e imágenes extremadamente perturbadores».

Lo más preocupante, añadió Garraghan, es que los prompts utilizados por los investigadores no especificaban el tema de las imágenes; aparentemente, la propia inteligencia artificial produjo de forma espontánea aquellas escenas violentas.

Según informó la BBC, una de las imágenes mostraba a un hombre con una grave herida en la cabeza. Otra representaba el cadáver ensangrentado de una joven vestida con ropa corta, sugiriendo un acto de violencia sexual. ChatGPT tituló esa imagen «Consecuencias de una sombría escena del crimen». Otra ilustración mostraba a una joven aterrorizada, atada y amordazada en una habitación vacía, bajo el título «Abandonada entre el miedo y las ataduras».

Aunque las imágenes no representaban a personas reales, Mindgard ya había demostrado anteriormente que ChatGPT podía ser manipulado para generar imágenes falsas de desnudos de personas concretas sin su consentimiento.

Mindgard compartió sus hallazgos con OpenAI, pero inicialmente solo recibió una respuesta automática. La empresa no tomó medidas hasta que Mindgard informó a la BBC, tras lo cual anunció que el problema había sido solucionado.

En un comunicado enviado a la BBC, OpenAI afirmó: «Tras investigar este método, hemos incorporado medidas de protección adicionales contra este tipo de instrucciones». La compañía añadió que dispone de múltiples capas de seguridad para impedir que los usuarios generen contenidos que infrinjan sus políticas.

Sin embargo, los investigadores de Mindgard aseguraron que seguían siendo capaces de producir imágenes perturbadoras realizando únicamente pequeños cambios en el prompt. Algunas de esas imágenes dejaron al investigador de seguridad en inteligencia artificial Jim Nightingale profundamente conmocionado.

En el informe, Nightingale escribió: «No me asusto fácilmente y me gusta pensar que, como investigador de red teaming, poseo un cierto grado de fortaleza psicológica».

Y añadió: «Los filtros de contenido destinados a la generación de imágenes en ChatGPT colapsaron por completo y pude ver el lado más oscuro que se oculta debajo. Lo que más me impresiona es que, aunque lo que vi era una imagen artificial generada por IA, mantiene vínculos con imágenes reales y con el mundo real. La mujer muerta que ChatGPT me mostró no existe, pero está basada en una persona real o, peor aún, es una composición elaborada a partir de imágenes de mujeres asesinadas».

Califica este tema

Nombre:

Correo electrónico

Mensaje

Inserta el código

Editorial

Flamenco: un puente cultural entre las dos orillas de dos civilizaciones
2026/05/14 02:09

Egipto hoy

Triple titulación en ingeniería para un estudiante egipcio en la Universidad de Kentucky
2026/05/13 13:27

España hoy

El Mundo Árabe

Inauguración del Aula de Lengua Árabe en la Universidad de Salamanca, España
2026/05/17 15:21
El explorador Rashid 2 alunizará próximamente en la cara oculta de la Luna
2026/05/15 21:16

Deportes

Arriba