-
Bombardeios russos na Ucrânia deixam mais de 20 mortos horas antes de possível trégua
-
Arsenal vence Atlético de Madrid (1-0) e vai à final da Champions
-
Transportadores fazem greve e bloqueiam estradas na Bolívia devido à crise de combustíveis
-
Corinthians aposta em Lingard para tentar garantir classificação antecipada na Libertadores
-
Exército dos EUA diz estar preparado para retomar combates contra Irã se receber ordem para isso
-
Trump diz perante grupo de crianças que faz exercícios 'um minuto por dia'
-
Morre José 'Piculín' Ortiz, lenda do basquete porto-riquenho
-
Edin Terzic é o novo técnico do Athletic Bilbao
-
Estêvão volta ao Brasil para tratar lesão com objetivo de ir à Copa do Mundo
-
Lula pode se reunir com Trump em Washington na quinta-feira
-
Molière volta aos palcos graças a peça criada com IA
-
Sabalenka se diz disposta a boicotar Grand Slams para exigir melhor divisão de receitas
-
Fifa convida federação iraniana a Zurique para 'preparar' Copa do Mundo
-
Febre K-pop: fãs aguardam ansiosos a chegada do BTS no México
-
Cruzeiro com hantavírus procura porto e OMS aponta para Espanha
-
Israel prolonga detenção de Thiago Ávila e ativista espanhol-palestino
-
Califórnia nas mãos de um republicano? Divisão entre democratas pode abrir caminho
-
Paraíso sob terror: violência assola destino turístico da Colômbia
-
Ex-crianças-soldado aprendem ofícios para reconstruir a vida na República Centro-Africana
-
Ex-modelo acusa caça-talentos francês de recrutá-la para Epstein
-
Ucrânia denuncia 'cinismo absoluto' da Rússia por ataques antes da trégua
-
Explosão em mina de carvão deixa nove mortos na Colômbia
-
Hostilidades em torno de Ormuz ameaçam cessar-fogo entre EUA e Irã
-
Rússia decreta trégua em 8 e 9 de maio, e Ucrânia anuncia seu próprio cessar-fogo a partir de 4ª feira
-
Suspeito de iniciar incêndio em Los Angeles ressentia os ricos, dizem promotores
-
Blake Lively e Justin Baldoni chegam a acordo para encerrar longa batalha judicial
-
Prêmios Pulitzer reconhecem cobertura sobre governo Trump
-
Hostilidades aumentam no Golfo com início de operação dos EUA em Ormuz
-
City empata com Everton e Arsenal passa a depender só de si pelo título inglês
-
Amazon disponibiliza rede de logística para qualquer empresa
-
Dolly Parton cancela residência em Las Vegas para cuidados médicos
-
Cofundador da OpenAI depõe em julgamento iniciado por Musk
-
Santos abre sindicância sobre incidente entre Neymar e Robinho Jr.
-
Netflix anuncia estreia mundial nos cinemas de 'Nárnia' em 2027
-
'É um sonho ter a chance de disputar uma final de Champions', diz Arteta
-
Suprema Corte dos EUA restabelece envio de pílula abortiva por correio
-
Palmeiras visita Sporting Cristal em confronto direto por liderança do grupo na Libertadores
-
Suposto surto de hantavírus deixa quase 150 pessoas presas em cruzeiro em Cabo Verde
-
Neymar esgota ingressos no Paraguai em jogo da Sul-Americana crucial para o Santos
-
Atropelamento na Alemanha deixa 2 mortos
-
Avião cai em prédio e deixa dois mortos em Belo Horizonte
-
Ricos e famosos se preparam para o Met Gala, a influente data da moda
-
Britney Spears admite direção imprudente em acordo com a Justiça
-
Demi Moore, Chloé Zhao e Stellan Skarsgard estão entre jurados de Cannes
-
Guerrilha ELN propõe retomar negociações de paz com o próximo governo da Colômbia
-
Orlando Magic demite técnico Jamahl Mosley após eliminação nos playoffs da NBA
-
Papa Leão XIV receberá Marco Rubio na quinta-feira, anuncia Vaticano
-
Irã dispara mísseis como 'advertência' contra navios militares dos EUA
-
Ex-ministro espanhol nega corrupção em julgamento por compra de máscaras na pandemia
-
Chelsea perde em casa para Nottingham Forest e segue em queda livre no Inglês
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
F.Cardoso--PC