-
BTS lança novo álbum antes de seu tão aguardado retorno aos palcos
-
Índia pode revolucionar combate à obesidade com medicamentos genéricos de baixo custo
-
Princesa Mette-Marit da Noruega diz que foi 'manipulada e enganada' por Epstein
-
Fifa multa Federação Israelense de Futebol por 'discriminação'
-
Israel anuncia mais ataques contra o Irã, país que considera prestes a ser 'dizimado'
-
Presidente da Venezuela anuncia mudança no comando militar
-
Comissão aprova moeda comemorativa com imagem de Trump
-
Seis países se declaram 'dispostos a contribuir' para segurança no Estreito de Ormuz
-
Flamengo vai enfrentar Estudiantes na Libertadores; Palmeiras cai em grupo acessível
-
Organizações humanitárias condenam ameaças de guerrilheiros a delegações na Colômbia
-
LeBron James iguala recorde de jogos disputados na NBA
-
Swiatek é eliminada em sua estreia no WTA 1000 de Miami
-
Neymar vai enfrentar San Lorenzo em sua volta à Copa Sul-Americana
-
México convoca Fidalgo e veterano Ochoa para amistosos contra Portugal e Bélgica
-
Luis Díaz é destaque da lista de convocados da Colômbia para amistosos contra Croácia e França
-
'É necessário dinheiro para matar os caras maus', diz Hegseth sobre custo da guerra
-
Espanha e Inglaterra se impõem nas oitavas da Liga Europa e da Conference League
-
Morre, aos 84 anos, Umberto Bossi, fundador do partido Liga Norte
-
Seleção iraniana de futebol feminino é homenageada em Teerã
-
Irã está prestes a ser 'dizimado', garante premiê israelense
-
Fifa aprova regra para aumentar número de treinadoras no futebol feminino
-
Cunningham sofre pneumotórax e vai desfalcar Pistons na NBA
-
Em pré-campanha, Flávio Bolsonaro elogia modelo de segurança de Bukele
-
Celta elimina Lyon de Endrick nas oitavas da Liga Europa
-
Netanyahu nega que Israel tenha 'arrastado' EUA para a guerra
-
Irã alerta que não haverá 'moderação' em meio a ataques contra infraestruturas energéticas
-
Novo técnico da seleção marroquina apoia decisão da Confederação Africana
-
MLS revela detalhes de sua temporada 'sprint' de 2027
-
Fifa se diz confiante em realizar Copa do Mundo com "todas as seleções" previstas
-
FMI se diz preocupado com inflação global e produção por guerra no Irã
-
Venezuelano detido por 10 meses por serviços de imigração é libertado nos EUA
-
Pretendido pelo Atlético, Cristian Romero prefere focar "na situação" do Tottenham
-
Rússia recomenda enviar psicólogos a mulheres que não querem ser mães
-
Enzo Fernández está 'feliz' no Chelsea, garante seu treinador
-
Petróleo dispara por medo de crise energética global após Irã atacar instalações-chave
-
Neymar tem novo técnico no Santos: Cuca
-
Candidato de Trump para Departamento de Segurança Interna aprovado pela comissão do Senado
-
Mbappé é destaque na lista de convocados da França para amistosos contra Brasil e Colômbia
-
Jovens Karl e Urbig são convocados pela 1ª vez pela Alemanha
-
Courtois sofre lesão na coxa e vai desfalcar Real Madrid contra o Bayern na Champions
-
Com cortes na internet, Moscou retrocede 'vinte anos'
-
Uso intensivo de redes sociais prejudica o bem-estar dos jovens
-
Guerra no Irã consolida o poder da Guarda Revolucionária
-
Coreia do Norte se classifica para Copa do Mundo Feminina de 2027, no Brasil
-
Osimhen sofreu fratura no braço e Lang passará por cirurgia no polegar, informa Galatasaray
-
As instalações de petróleo e gás afetadas pela guerra no Oriente Médio
-
Irã vai boicotar os Estados Unidos, não a Copa do Mundo, afirma presidente da federação
-
Novo Parlamento da Tailândia confirma Anutin Charnvirakul como primeiro-ministro
-
Trump ameaça destruir campos de gás do Irã após ataques contra o Catar
-
EUA ameaça destruir campo de gás do Irã em caso de novo ataque no Catar
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
F.Cardoso--PC