-
El Congreso de EEUU pone fin al cierre del gobierno
-
Banco Santander anuncia la compra del estadounidense Webster Bank por más de 12.200 millones de dólares
-
Nueva York desplegará observadores para vigilar a los agentes de inmigración
-
El presidente electo de Chile insta a aliados conservadores en Europa a movilizarse para "influir y ganar"
-
México anuncia un plan que aumenta la inversión pública en 2% del PIB este año
-
La policía británica abre una investigación sobre exembajador británico por sus vínculos con Epstein
-
En el mundo operan hasta 800 navíos de la "flota fantasma", según EEUU
-
La economía rusa se desacelera y crece un 1% en 2025, anuncia Putin
-
Cuba registra un récord de temperatura mínima de 0 ºC
-
Una oficial musulmana asumirá como portavoz en árabe del ejército de Israel, según una fuente militar
-
La OTAN comenzó a planificar su misión de defensa del Ártico, anuncia un portavoz
-
El Barcelona confirma la candidatura del Camp Nou para acoger la final de la Champions 2029
-
Al menos 15 peregrinos muertos en un accidente de bus en el noreste de Brasil
-
Un aclamado filme iraquí muestra el yugo de Sadam Husein a través de la mirada infantil
-
El exembajador británico Mandelson dejará la Cámara de los Lores por sus vínculos con Epstein
-
La Cámara de EEUU avanza en poner fin a la parálisis del gobierno
-
La OMS afirma que cerca de 4 de cada 10 cánceres están ligados a factores evitables
-
Parte de la península ibérica en alerta ante la llegada de fuertes lluvias
-
Vonn confía en competir en los Juegos pese a una lesión de rodilla
-
La UE examinará si el excomisario europeo Mandelson violó normas de conducta por el caso Epstein
-
El hijo de la princesa heredera de Noruega se declara no culpable de violación
-
Corte europea condena a Rusia por "trato inhumano" al líder opositor Navalni
-
La fiscalía francesa aleja una candidatura de Le Pen a la presidencial de 2027
-
Una jueza estadounidense impide revocar el sistema de protección de los migrantes haitianos
-
Más de 50.000 evacuados en el norte de Marruecos por fuertes lluvias
-
Francia acusa a 10 hombres por drogar y violar a un niño de 5 años
-
Alemania tiene la mayor proporción de trabajadores de más de 55 años en la Unión Europea
-
¿Homenaje o propaganda? Un desfile sobre Lula para Carnaval desata polémica en Brasil
-
Brigadistas combaten los incendios que arrasaron 60 mil hectáreas en la Patagonia argentina
-
Jeffrey Epstein niega ser "el diablo" en un video revelado por las autoridades de EEUU
-
Trump recibe a Petro en la Casa Blanca para su primer cara a cara
-
Rusia reanuda los ataques masivos a Ucrania bajo un frío extremo
-
EEUU apuesta por una Venezuela "democrática", dice la jefa diplomática
-
La presidenta electa anuncia un plan que apunta a la concentración de poder en Costa Rica
-
Trump asegura que México dejará de enviar petróleo a Cuba
-
El príncipe Lorenzo de Bélgica reconoce que tuvo contacto con Epstein dos veces
-
Un juez de EEUU permite reanudar un proyecto eólico en un nuevo revés para Trump
-
Trabajadores a favor y en contra del gobierno exigen mejoras salariales en Venezuela
-
Walt Disney designa a Josh D'Amaro como su próximo director ejecutivo
-
"Un viaje humillante", denuncia una palestina a su regreso de Egipto
-
Anuncian una investigación a la red X en Reino Unido por imágenes falsas de carácter sexual
-
La UE examinará si excomisario europeo Mandelson violó normas de conducta por caso Epstein
-
Rusia advierte sobre una coyuntura peligrosa, por el final del acuerdo nuclear con EEUU
-
La NASA aplaza su misión lunar Artemis 2 al detectar una fuga de combustible
-
El narcotráfico satura las rutas marítimas con métodos cada vez más sofisticados
-
La OMS pide 1.000 millones de dólares para hacer frente a las crisis sanitarias en 2026
-
Controlado el gran incendio declarado en un bazar de Teherán
-
Petro espera lograr un borrón y cuenta nueva con Trump en la Casa Blanca
-
Rusia reanuda ataques masivos a Ucrania bajo un frío extremo
-
Petro extradita a un capo del narco a EEUU a horas de su reunión con Trump
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
A.Aguiar--PC