-
Bielsa-De la Fuente, la noche y el día se citan en el Estadio Guadalajara
-
Líbano afirma que disparos israelíes matan a dos personas en el sur
-
Pese a los problemas dentro y fuera de EEUU, Trump sigue sumando aliados en América Latina
-
Presentadora de EEUU pide ayuda tras reportes de muerte de su madre secuestrada
-
Observadores electorales europeos descartan "irregularidades" en el balotaje de Colombia
-
Marco Rubio llega al Golfo para tranquilizar a sus aliados golpeados por la guerra
-
Al menos 40 personas murieron ahogadas en Francia durante la ola de calor
-
EEUU impone sanciones contra cinco empresas cubanas y la esposa del hijo de Raúl Castro
-
Una delegación del gobierno talibán negocia con la UE la repatriación de afganos
-
La Torre Eiffel y el Louvre adelantan la hora de cierre por la ola de calor
-
Marco Rubio viaja al Golfo para tranquilizar a sus aliados golpeados por la guerra
-
30 minutos de pausa, 13 kilómetros: protocolo en caso de tormenta en el Mundial 2026
-
Starmer quiere "una transición lo más fácil posible" tras anunciar su dimisión
-
Cucurella, esta vez su canción sí rima con estrella
-
Una delegación del gobierno talibán llega a Bruselas para negociar la repatriación de afganos
-
Un décimo aniversario del Brexit entre dudas de la población británica
-
El presidente Arévalo descarta operaciones militares de EEUU en Guatemala
-
Kenia detiene las obras de un centro de cuarentena para el ébola tras un fallo judicial
-
El calor pone en alerta a casi toda España
-
Francia rinde su máximo homenaje al historiador y resistente Marc Bloch
-
Pedro Sánchez defiende seguir pese a las "dificultades" tras la condena a su ex mano derecha
-
El derrumbe de valores tecnológicos arrastra las bolsas mundiales
-
Una comisión de la ONU denuncia un "genocidio" en Gaza por los ataques contra niños
-
Cientos de arrestos en Ankara antes de la cumbre de la OTAN
-
Rusia acusa a EEUU de desviarse de su rol de "mediador imparcial" en la guerra de Ucrania
-
Un bombardeo ruso mata a tres personas en la ciudad natal del presidente ucraniano
-
Heineken nombra al brasileño Rafael Oliveira como director general
-
El líder norcoreano promete fortalecer la defensa del país ante el riesgo de una "guerra nuclear"
-
Empieza la Semana de la Moda masculina de París en plena ola de calor
-
La ola de calor gana terreno en Europa
-
El izquierdista Sánchez pide anular los votos del extranjero de los resultados electorales en Perú
-
El DT de la RD Congo ve en Colombia un escalón hacia los dieciseisavos del Mundial
-
El candidato izquierdista llama a "la calma" tras las protestas contra el triunfo de la ultraderecha en Colombia
-
El seleccionador de Portugal reivindica al "ícono" Cristiano Ronaldo
-
Se busca socio para Luis Díaz en el choque mundialista entre Colombia y RD Congo
-
Trump amenaza con prisión por daños al estanque reflectante de Washington
-
El FBI arresta a dos personas más por un presunto complot contra un evento en la Casa Blanca
-
Un tiroteo en Montreal deja tres muertos, incluido el sospechoso
-
Descubren un altar maya que servía para sacrificios humanos en Guatemala
-
Trump amenaza con no ayudar a los países de la OTAN si se lo piden
-
El eventual regreso del Reino Unido vuelve al radar de la UE... con reticencias
-
Julián Álvarez pide salir del Atlético: "Lo mejor es una transferencia"
-
Un juez de EEUU ve represalia política en citaciones del gobierno Trump
-
La relación de Venezuela y EEUU, en el "camino correcto" tras la captura de Maduro, dice Rodríguez
-
La Liga Árabe confirma al diplomático egipcio Nabil Fahmy como secretario general
-
Messi, Mbappé, Haaland, Kane, Lamine, Salah... ¿dónde está Ronaldo?
-
El derrumbe de valores tecnológicos arrastra las bolsas de Asia y Europa
-
El jefe de la ONU pide a los directivos de la IA decir "toda la verdad" sobre el coste climático de los centros de datos
-
Jefe de la ONU pide a los directivos de la IA decir "toda la verdad" sobre coste climático de los centros de datos
-
Messi lleva a Argentina a 16avos y logra un récord de goleador en el Mundial
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
A.Aguiar--PC