-
Nova York registra 13 mortes relacionadas ao frio desde o fim de janeiro
-
Bill e Hillary Clinton vão depor em investigação do Congresso sobre Epstein
-
Presidente interina da Venezuela se reúne com chefe de missão diplomática dos EUA
-
Oitavas da Copa da França começam com Olympique de Marselha e Lyon como favoritos após eliminação do PSG
-
Musk funde xAI com SpaceX em tentativa de desenvolver datacenters espaciais
-
Chefe do instituto que mede a inflação na Argentina renuncia
-
Cuba e EUA estão em 'comunicação', mas 'não existe diálogo', diz vice-chanceler
-
Zagueiro Jérémy Jacquet vai deixar Rennes após fim da temporada para jogar no Liverpool
-
Trump diz que México 'deixará' de enviar petróleo a Cuba
-
Trump diz que conversará sobre narcotráfico com Petro
-
Ressurgimento de Yamal aumenta otimismo do Barça, que enfrenta Albacete na Copa do Rei
-
María Corina considera reunião com Delcy para definir 'cronograma de transição' na Venezuela
-
Trump insta Congresso dos EUA a acabar com 'shutdown'
-
Insatisfeito, Benzema deixa Al-Ittihad e assina com rival Al-Hilal
-
Sunderland vence Burnley (3-0) e é 8º na Premier League
-
Governo Milei anuncia libertação de um dos argentinos presos na Venezuela
-
Roma perde na visita à Udinese (1-0) e fica em 5º lugar no Italiano
-
Presidente eleita da Costa Rica diz contar com Bukele em sua estratégia contra o narcotráfico
-
Atlético de Madrid contrata meio-campista mexicano Obed Vargas
-
Trabalhadores a favor e contra o governo exigem melhorias salariais na Venezuela
-
Trump anuncia acordo comercial com Índia após conversa com Modi
-
Seleção feminina do Brasil fará amistosos contra Costa Rica, Venezuela e México
-
Relação entre Colômbia e EUA 'será relançada' com visita de Petro, diz chanceler
-
Crystal Palace contrata atacante norueguês Larsen em 'transferência recorde' para o clube
-
França aprova orçamentos para 2026 após meses de debates
-
A improvável trajetória dos Patriots e dos Seahawks até a revanche no Super Bowl
-
Presidente da Autoridade Palestina convoca primeiras eleições ao Parlamento da OLP
-
'Fiz o possível e o impossível' para voltar ao Flamengo, diz Paquetá
-
Portugal se soma a países que querem proibir redes sociais para menores de 16 anos
-
Mamadou Sarr retorna ao Chelsea após período de empréstimo no Strasbourg
-
Pacientes palestinos começam a chegar ao Egito após abertura limitada da passagem de Rafah
-
Napoli contrata por empréstimo o atacante brasileiro Alisson Santos, do Sporting
-
Nasa realizas testes essenciais antes de lançar missão lunar Artemis 2
-
Menino que não tinha dinheiro para passagem de ônibus participará da abertura dos Jogos de Inverno
-
Irã se prepara para negociações com EUA sobre seu programa nuclear
-
Chile, México e Brasil impulsionam candidatura de Bachelet para secretária-geral da ONU
-
Milan desiste de contratar Mateta, do Crystal Palace, após exames médicos
-
Juventus reforça defesa com lateral sueco Emil Holm, que estava no Bologna
-
Maracanã vai receber jogo da NFL na temporada de 2026
-
Rússia confirma conversas com Ucrânia na quarta e na quinta-feira em Abu Dhabi
-
Iranianos na Turquia observam de longe agitação em seu país natal
-
Observatório astronômico europeu celebra cancelamento de projeto de hidrogênio verde no Chile
-
Cuba sofreu forte queda no turismo em 2025
-
Incerteza no Congresso dos EUA sobre as negociações orçamentárias
-
Kendrick Lamar: o poeta do rap consagrado no Grammy
-
Russell diz estar 'pronto' para desafiar Verstappen pelo título da F1
-
Começa a limpeza profunda do Juízo Final de Michelangelo na Capela Sistina
-
Verona e Pisa, último e penúltimo do Campeonato Italiano, demitem seus treinadores
-
México reforça operação de busca por mineradores sequestrados
-
Técnico do Chelsea não impõe prazo para retorno de Estêvão, que está no Brasil por motivos pessoais
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
F.Cardoso--PC