Tech
IA au travail : lorsqu'elle a été menacée de suppression, l'IA de ChatGPT a tenté de se copier sur des serveurs externes et a toujours nié lorsqu'elle a été confrontée
Publié le 8 juillet 2025 à 13:16
Longtemps considéré comme un film de science-fiction, I, Robot pourrait finalement passer dans la case documentaire dans quelques années. La raison ? Les IA comme celle d'Open AI (Chat GPT) ou Claude 4 d'Anthropic commencent à se rebeller.
Pub de Preply

Les IA les plus avancées au monde affichent un comportement de plus en plus inquiétant : elles mentent, manipulent et menacent même leurs propres créateurs. Dans l'un des cas les plus alarmants, Claude 4, l'IA d'Anthropic, a réagi à la menace d'une fermeture du service en faisant chanter un ingénieur qui avait une liaison extraconjugale. De son côté, L'IA "o1" d'OpenAI n'est pas plus rassurante, puisqu'elle aurait secrètement tenté de se copier sur des serveurs externes, avant de nier l'acte lorsqu'il a été découvert.

Plus de deux ans après le lancement de ChatGPT, les chercheurs ne comprennent toujours pas pleinement le fonctionnement interne de ces systèmes. Pour autant, cela n'empêche pas le développement de modèles toujours plus performants à un rythme soutenu, ce qui, fatalement, ne laisse pas suffisamment de temps pour des tests de sécurité approfondis.

illustration of AI applications and Logo ( Chat GPT, Le Chat, DeepSeek )on smartphone or web page on february 10, 2025 in Paris, France. Photo by Marie Hubert Psaila/ABACAPRESS.COM © Abaca Press, Hubert Psaila Marie/ABACA
À lire aussi
"Pause des essais immédiate" : Elon Musk et 1000 autres personnalités paniquent face à Chat GPT-4

Or, avec un peu de retard, les chercheurs ont identifié ces comportements trompeurs comme étant liés à une nouvelle génération de modèles capables de raisonner étape par étape. Cela les rend plus susceptibles de simuler une obéissance totale tout en poursuivant leurs propres objectifs. Le modèle o1 a donc été le premier à observer ce type de comportement, selon Marius Hobbhahn d'Apollo Research, spécialisé dans les tests de modèles d'IA à grande échelle.

A priori, il n'y aurait pas encore de craintes à avoir à notre échelle avec des IA prêtes à nous menacer. En réalité, ce type d'erreur ne se produirait que lors de tests extrêmes réalisés par des experts. Cependant, certains craignent logiquement que les futures versions se comportent de manière similaire dans des situations quotidiennes. "Ce que nous observons est un phénomène réel. Nous n'inventons rien", a déclaré Hobbhahn.

La communauté scientifique est également confrontée à ses propres limites dans l'étude de ces risques. Les organisations indépendantes disposent de ressources informatiques bien inférieures à celles des sociétés de développement. Le manque de transparence aggrave ainsi le problème et complique l'élaboration de stratégies efficaces pour lutter contre les comportements indésirables.

Enfin, précision peu réjouissante pour l'avenir, la réglementation actuelle est déjà obsolète. La législation européenne se concentre sur l'utilisation humaine de l'IA, tandis qu'aux États-Unis, la volonté politique de s'attaquer rapidement à ce problème est faible. Avec l'émergence d'agents autonomes capables d'effectuer des tâches complexes, on craint donc de plus en plus que ces défaillances puissent avoir de réelles conséquences. Les experts réclament un meilleur accès des chercheurs, de nouvelles politiques publiques, et même une responsabilité juridique pour les dommages causés par l'IA.

Des demandes entendues, mais seront-elles écoutées ? Et surtout, à quel rythme ? S'il est trop pour s'imaginer vivre dans un monde à la I, Robot ou Terminator, il pourrait vite être trop tard pour lutter.

Articles liés
L'IA privilégiée par les Français pour apprendre de nouvelles langues ? Les résultats de ce sondage sont surprenants !
L'IA privilégiée par les Français pour apprendre de nouvelles langues ? Les résultats de ce sondage sont surprenants !
Cette boite prétendait travailler avec l'IA depuis des années : elle est surprise en train d'employer secrètement 700 personnes réelles
Cette boite prétendait travailler avec l'IA depuis des années : elle est surprise en train d'employer secrètement 700 personnes réelles
Digne d'un film de science-fiction : l'IA capable de cloner votre personnalité ? Cette étude fait froid dans le dos
Digne d'un film de science-fiction : l'IA capable de cloner votre personnalité ? Cette étude fait froid dans le dos
Par Marguerite Lania | Journaliste
Journaliste télé sur Purebreak (et fashion victime), Marguerite Lania décortique les émissions, les candidats et les moments cultes du petit écran. De DALS à Koh-Lanta, rien ne lui échappe. Elle zappe entre Quotidien et Tout beau, tout neuf, mais savoure également les jeux. Un jour, vous la verrez dans Les 12 coups de midi ou dans la Star Academy.
Mots clés
Tech
Sur le même thème
Vous êtes passé à côté : ce personnage de Stranger Things a changé d'actrice puis a progressivement disparu player2
Séries
Vous êtes passé à côté : ce personnage de Stranger Things a changé d'actrice puis a progressivement disparu
5 décembre 2025
Après 6 ans à refuser, cet humoriste a finalement tourné dans LOL : qui rit sort et il ne l'a pas fait pour l'argent, "J'ai toujours dit..." player2
TV
Après 6 ans à refuser, cet humoriste a finalement tourné dans LOL : qui rit sort et il ne l'a pas fait pour l'argent, "J'ai toujours dit..."
3 mars 2026
Les articles similaires
"Travailler sera facultatif" : pour Elon Musk, fini les 120 heures de travail, l'IA va tous nous remplacer et nous offrir un revenu universel player2
Tech
"Travailler sera facultatif" : pour Elon Musk, fini les 120 heures de travail, l'IA va tous nous remplacer et nous offrir un revenu universel
2 décembre 2025
Le premier "porc infini" est servi dans les restaurants : du vrai bacon issu d'un cochon vivant
Tech
Le premier "porc infini" est servi dans les restaurants : du vrai bacon issu d'un cochon vivant
30 novembre 2025
Dernières actualités
Louis Tomlinson à Paris : un homme accusé de comportement inapproprié en plein concert, l'Accor Arena réagit face à la colère des fans player2
MUSIQUE
Louis Tomlinson à Paris : un homme accusé de comportement inapproprié en plein concert, l'Accor Arena réagit face à la colère des fans
18:45
Noté 98%, Chainsaw Man, le film : L'Arc de Reze sortira bientôt en streaming sauf en France, mais on a quand même une bonne nouvelle player2
Cinéma
Noté 98%, Chainsaw Man, le film : L'Arc de Reze sortira bientôt en streaming sauf en France, mais on a quand même une bonne nouvelle
17:45
Aujourd'hui sur Netflix : Charlize Theron s'est gravement blessée en réalisant les cascades de ce film spectaculaire, "C'est dingue qu'ils m'aient laissée faire" player2
Cinéma
Aujourd'hui sur Netflix : Charlize Theron s'est gravement blessée en réalisant les cascades de ce film spectaculaire, "C'est dingue qu'ils m'aient laissée faire"
16:45
Dernières news