-
Timber está fora e De Jong é dúvida na seleção holandesa contra a Suécia
-
Governo da Bolívia e central sindical fecham acordo após semanas de crise
-
Marrocos vence Escócia (1-0) pelo grupo do Brasil na Copa
-
James Burrows, diretor de 'Friends', morre aos 85 anos
-
Neutralizar 'velocidade' da Costa do Marfim será fundamental para vitória, diz técnico da Alemanha
-
Bradley Barcola agita concorrência no ataque da França
-
Yan Diomandé, da Costa do Marfim, vive Copa do Mundo como homenagem à irmã falecida
-
Kane diz que viveu um de seus melhores momentos com a seleção da Inglaterra ao som de 'Wonderwall'
-
Museu de IA oferece imersão sensorial na Floresta Amazônica
-
Embalada, Suécia enfrenta seleção holandesa pressionada no Grupo F da Copa
-
Estados Unidos vencem Austrália (2-0) e se classificam para próxima fase da Copa do Mundo
-
EUA recebe novo Air Force One doado pelo Catar
-
Uruguai precisará ter paciência contra uma seleção de Cabo Verde 'muito física', diz Bentancur
-
Koné passa por cirurgia e está fora da Copa do Mundo
-
Polônia retira condecoração de Zelensky
-
Presidente da Costa Rica é evacuada de área de garimpo ilegal após explosão
-
Argentina avalia mudanças para garantir classificação contra a Áustria
-
Lula diz que Neymar está fazendo 'home office' na Copa do Mundo
-
Opositora encarregada de diálogo com governo na Venezuela vai aos EUA para reuniões
-
Argélia apresenta reclamação à Fifa por 'arbitragem injusta' em jogo contra Argentina
-
Nos "Altos de Trump", israelenses gostam de Trump apesar do acordo com Irã
-
Raoni é transferido para hospital em São Paulo para seguir tratamento
-
CR7 é 'foco de atenção', mas todo o elenco português está 'em questão', diz Rúben Dias
-
Sabalenka bate Bartunkova e avança às semifinais do WTA 500 de Berlim
-
Macron critica centros de deportação para migrantes e rejeita financiamento da UE
-
Lamine Yamal considera 'desnecessário' jogar 90 minutos contra Arábia Saudita
-
Agricultores indígenas decidem endurecer protestos na Bolívia
-
Israel e Hezbollah pactuam trégua no Líbano, com acordo EUA-Irã em suspenso
-
Zverev enfrentará Fritz nas semifinais do ATP 500 de Halle
-
Governo francês ativa célula de crise por onda de calor
-
De la Fuente se apega à sua estratégia para sucesso da Espanha na Copa do Mundo
-
Itália reage com indignação a comentários de Trump sobre Meloni
-
Últimos bombardeios israelenses deixam ao menos 47 mortos no Líbano (governo)
-
Equador precisa vencer Curaçao para sonhar com classificação na Copa do Mundo
-
Alemanha busca impor domínio na Copa do Mundo diante da Costa do Marfim
-
Torcedores africanos viram as costas à África do Sul na Copa do Mundo após violência xenófoba
-
México garante vaga no mata-mata enquanto Brasil precisa de vitória contra Haiti
-
Hospital de Milão testa robô que promete liberar tempo da equipe de saúde
-
França julgará astro marroquino Achraf Hakimi por estupro
-
Quanto menos ajuda ao desenvolvimento, mais migrações, adverte OIM
-
Burnham consegue vaga no Parlamento britânico e inicia batalha trabalhista para derrubar Starmer
-
E se os homens japoneses também limpassem suas casa e não só os estádio?
-
Manuscrito inédito de Mozart encontrado em Paris
-
Achraf Hakimi será julgado na França por acusação de estupro, confirma tribunal de apelação
-
Rival de Starmer vence eleição crucial no Reino Unido e ameaça liderança do primeiro-ministro
-
EUA e Irã adiam negociações programadas para a Suíça
-
México vence Coreia do Sul (1-0) e é 1º classificado para 16-avos de final da Copa
-
Vice-presidente dos EUA adia viagem à Suíça para negociações com Irã
-
Lateral neozelandês Tim Payne se transfere para o Olimpia, do Paraguai, após ganhar fama no Instagram
-
Montella questiona 'caos' de críticas à Turquia antes do jogo contra o Paraguai
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
F.Cardoso--PC