-
Le projet de loi-cadre sur les transports présenté en conseil des ministres mercredi
-
JO-2026: Chloe Kim vise un triplé inédit en snowboard
-
JO: Guillaume Cizeron et Laurence Fournier Beaudry aux portes du rêve olympique
-
JO-2026: les hockeyeurs français rêvent d'un exploit et des quarts de finale
-
Intempéries: vigilance orange crues dans 13 départements, épisode "durable"
-
Pétition Duplomb: six mois plus tard, le débat se tient à l'Assemblée
-
Neuf personnes tuées par des tirs dans et autour d'une école dans l'ouest du Canada
-
Le patron d'Instagram attendu mercredi au procès de l'addiction aux réseaux sociaux
-
Mort d'Adama Traoré: la Cour de cassation décide du sort de l'enquête
-
JO-2026: Jeanmonnot et Cizeron/Fournier Beaudry pour un mercredi en or
-
Pas de record d'audience pour Bad Bunny et le Super Bowl
-
Trump reçoit Netanyahu, qui demande une pression américaine maximale sur l'Iran
-
TotalEnergies publie ses résultats dans un contexte déprimé pour les prix du pétrole
-
Procès RN: Marine Le Pen va connaître la date de la décision en appel
-
Ligue 1: clap de fin pour De Zerbi à l'OM
-
Colombie: une sénatrice séquestrée et le président ciblé avant les élections
-
JO: Malinin file tout droit vers l'or, Siao Him Fa 3e après le programme court de patinage
-
Le ministre Lutnick reconnaît un déjeuner sur l'île d'Epstein et garde le soutien de Trump
-
Enlèvement de la mère d'une journaliste télé: le FBI publie les images d'un individu masqué
-
Wall Street sans direction claire, patiente avant des données économiques
-
L'affaire Epstein tourne au bourbier pour le patron des JO de Los Angeles
-
Trump va abroger un texte fondateur des règlementations climatiques américaines
-
Trump va abroger le fondement des règlementations climatiques américaines
-
Importante mobilisation à Ubisoft, plusieurs centaines de salariés en grève
-
Après l'Arménie, le vice-président américain JD Vance est en Azerbaïdjan pour consolider l'accord de paix
-
A Ryad, le prince William rencontre des jeunes footballeuses saoudiennes
-
La Bourse de Paris clôture en toute petite hausse, portée par Kering
-
A Cuba, charbon de bois et panneaux solaires pour affronter la crise énergétique
-
Bourses européennes: Paris quasi stable (+0,06%), Londres (-0,31%) et Francfort (-0,11%) en légère baisse
-
Des responsables de l'immigration de Trump auditionnés au Congrès
-
L'euro numérique prend corps et veut concurrencer Visa et Mastercard
-
Bangladesh: candidat au poste de Premier ministre, Tarique Rahman s'attend à un défi "énorme"
-
Ribéry et les "fausses informations": nouvelle réplique du séisme Epstein en France
-
A Gaza, boxer dans le sable pour soigner le traumatisme de la guerre
-
Jugé pour viols, le fils de la princesse de Norvège nie que sa 2e victime présumée était endormie
-
Starmer a sauvé sa tête et affiche l'"unité" de son gouvernement, mais jusqu'à quand?
-
Le départ de Sophie Adenot pour l'ISS repoussé à vendredi au plus tôt pour cause de mauvaise météo (Nasa)
-
Gymnastique: des "Farfalle" italiennes vont témoigner contre leur ex-coach au tribunal
-
Les eurodéputés soutiennent la création de l'euro numérique
-
JO-2026: les inattendues Rädler-Huber en or, Shiffrin craque encore
-
Un septuagénaire écroué pour viols et agressions sexuelles sur 89 mineurs, et deux meurtres
-
Wall Street en hausse, prête à accueillir l'emploi américain
-
JO: le biathlète Éric Perrot médaillé d'argent sur l'individuel, derrière le Norvégien Johan-Olav Botn
-
JO: Klaebo au 7e ciel, les Bleus tombent de haut
-
En Ukraine, dans une centrale bombardée: "c'est notre vie" qu'ils frappent
-
JO: énorme déception pour les fondeurs français, éliminés en quarts du sprint
-
Au Sri Lanka, l'artisanat du sucre de palme à l'honneur
-
La Russie annonce des restrictions sur l'utilisation de Telegram au motif d'une "violation" de la loi
-
JO: sur la route de Milan, le chemin tumultueux de Cizeron et Fournier Beaudry
-
Norvège: une victime présumée décrit "le pire cauchemar" face à Høiby, jugé pour viols
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.
"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.
"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."
A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.
C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.
Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.
"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.
"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."
Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.
"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."
- Tromper les humains -
Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.
"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.
La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.
L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.
Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.
"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."
Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.
"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.
Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."
Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.
Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.
Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.
"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.
Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.
"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."
V.F.Barreira--PC