-
Un Donald Trump dichoso recibe el primer Premio de la Paz de la FIFA
-
La FIFA le entrega su Premio de la Paz a Trump en inicio del sorteo del Mundial
-
Hallazgo de estatuillas en una tumba resuelve un misterio en una necrópolis de Egipto
-
Otro bolso Birkin que perteneció a Jane Birkin fue subastado por 2,8 millones de dólares en Abu Dabi
-
El planeta fútbol aguarda el sorteo del Mundial con Trump en el centro
-
El gobierno español "no excluye" que el origen del foco de peste porcina africana sea una fuga de laboratorio
-
La inflación en EEUU volvió subir en septiembre, al 2,8% anual
-
Meta se asocia con medios de comunicación para ampliar el contenido de su asistente de IA
-
Delegaciones de Ucrania y EEUU sostendrán otra reunión en Miami este viernes
-
Trump revive la Doctrina Monroe para América Latina
-
Norris vuelve a superar a Verstappen en los segundos libres de Abu Dabi
-
Milei anuncia el regreso de Argentina al mercado internacional de deuda
-
Putin seguirá suministrando petróleo a India, pese a la presión de EEUU
-
Frente al negacionismo, el jefe del IPCC recuerda el rol de los humanos en el cambio climático
-
Macron urge mantener el "esfuerzo de guerra" en favor de Ucrania al cierre de su visita en China
-
El Parlamento alemán adopta un proyecto para implantar un servicio militar voluntario
-
Netflix comprará Warner Bros Discovery por casi 83.000 millones de dólares
-
World Athletics abandona su controvertida reforma del salto de longitud
-
La UE impone una multa de 120 millones de euros a X, la red social de Elon Musk
-
Norris supera por poco a Verstappen en los primeros ensayos de Abu Dabi
-
El Mundial de 2026, una ocasión inmejorable para el lucimiento de Trump
-
Putin seguirá suministrando petróleo a India, pese a presión de EEUU
-
Venezuela elige reina de belleza en medio de la tensión militar con EEUU
-
La justicia turca ordena el arresto de 29 futbolistas en el caso de las apuestas
-
Trump quiere reajustar la presencia global de EEUU y aumentar el predominio en América Latina, según su nueva estrategia global
-
Un gran jurado decide no acusar a la fiscal general de Nueva York, enemiga de Trump
-
La política de Trump lleva a la legendaria cantante de folk Joan Baez a volver al estudio
-
La producción industrial en España sigue al alza en octubre
-
OpenAI llega a un acuerdo para construir un centro de IA de 4.600 millones en Australia
-
Un nuevo ataque de EEUU a una supuesta narcolancha en el Pacífico causa cuatro muertos
-
La policía recupera el huevo de Fabergé que un ladrón se tragó en Nueva Zelanda
-
Venezuela queda aislada tras la suspensión de vuelos de las aerolíneas internacionales
-
Jefe de Softbank dice que una super-IA podría convertir a humanos "en peces" o ganar un Nobel
-
Un sorteo por todo lo alto para el Mundial XXL con Trump como superstar
-
TikTok cumplirá con la prohibición de redes sociales a menores de 16 años en Australia
-
Lluvias dificultan limpieza en Sri Lanka tras inundaciones que azotaron varios países de Asia
-
OpenAI llega a un acuerdo para construir centro de IA de USD 4.600 millones en Australia
-
Corte aprueba el despliegue provisional de Guardia Nacional en Washington
-
La 13.ª Conferencia Global de Logística de la GLA concluye con éxito en Bangkok, Tailandia
-
Consejo de Seguridad de la ONU afirma estar dispuesto a apoyar a Siria durante visita
-
Las aerolíneas panameñas Copa Airlines y Wingo suspenden vuelos a Venezuela por dos días
-
Arrestan a sospechoso en caso de bombas cerca del Capitolio de EEUU en 2021, según medios
-
Ucrania acusa a Rusia de enviar a niños ucranianos a campos de "reeducación" en Corea del Norte
-
Una comisión insta a Finlandia a reparar las injusticias cometidas contra los samis
-
Putin tiene "responsabilidad moral" en el envenenamiento de una británica, según una investigación
-
Alexander-Arnold estará unos dos meses de baja por lesión en un muslo
-
La gira "Lux" de Rosalía llegará a Latinoamérica en julio de 2026
-
Kate Winslet, "orgullosa" de dirigir su primer filme, con guion de su hijo
-
La exjefa diplomática de la UE imputada por corrupción dimite como rectora del Colegio de Europa
-
Asfura, favorito de Trump, retoma la ventaja en las presidenciales de Honduras
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
A.Aguiar--PC