Tech
IA au travail : lorsqu'elle a été menacée de suppression, l'IA de ChatGPT a tenté de se copier sur des serveurs externes et a toujours nié lorsqu'elle a été confrontée
Publié le 8 juillet 2025 à 13:16
Longtemps considéré comme un film de science-fiction, I, Robot pourrait finalement passer dans la case documentaire dans quelques années. La raison ? Les IA comme celle d'Open AI (Chat GPT) ou Claude 4 d'Anthropic commencent à se rebeller.
Pub de Preply

Les IA les plus avancées au monde affichent un comportement de plus en plus inquiétant : elles mentent, manipulent et menacent même leurs propres créateurs. Dans l'un des cas les plus alarmants, Claude 4, l'IA d'Anthropic, a réagi à la menace d'une fermeture du service en faisant chanter un ingénieur qui avait une liaison extraconjugale. De son côté, L'IA "o1" d'OpenAI n'est pas plus rassurante, puisqu'elle aurait secrètement tenté de se copier sur des serveurs externes, avant de nier l'acte lorsqu'il a été découvert.

Plus de deux ans après le lancement de ChatGPT, les chercheurs ne comprennent toujours pas pleinement le fonctionnement interne de ces systèmes. Pour autant, cela n'empêche pas le développement de modèles toujours plus performants à un rythme soutenu, ce qui, fatalement, ne laisse pas suffisamment de temps pour des tests de sécurité approfondis.

illustration of AI applications and Logo ( Chat GPT, Le Chat, DeepSeek )on smartphone or web page on february 10, 2025 in Paris, France. Photo by Marie Hubert Psaila/ABACAPRESS.COM © Abaca Press, Hubert Psaila Marie/ABACA
À lire aussi
"Pause des essais immédiate" : Elon Musk et 1000 autres personnalités paniquent face à Chat GPT-4

Or, avec un peu de retard, les chercheurs ont identifié ces comportements trompeurs comme étant liés à une nouvelle génération de modèles capables de raisonner étape par étape. Cela les rend plus susceptibles de simuler une obéissance totale tout en poursuivant leurs propres objectifs. Le modèle o1 a donc été le premier à observer ce type de comportement, selon Marius Hobbhahn d'Apollo Research, spécialisé dans les tests de modèles d'IA à grande échelle.

A priori, il n'y aurait pas encore de craintes à avoir à notre échelle avec des IA prêtes à nous menacer. En réalité, ce type d'erreur ne se produirait que lors de tests extrêmes réalisés par des experts. Cependant, certains craignent logiquement que les futures versions se comportent de manière similaire dans des situations quotidiennes. "Ce que nous observons est un phénomène réel. Nous n'inventons rien", a déclaré Hobbhahn.

La communauté scientifique est également confrontée à ses propres limites dans l'étude de ces risques. Les organisations indépendantes disposent de ressources informatiques bien inférieures à celles des sociétés de développement. Le manque de transparence aggrave ainsi le problème et complique l'élaboration de stratégies efficaces pour lutter contre les comportements indésirables.

Enfin, précision peu réjouissante pour l'avenir, la réglementation actuelle est déjà obsolète. La législation européenne se concentre sur l'utilisation humaine de l'IA, tandis qu'aux États-Unis, la volonté politique de s'attaquer rapidement à ce problème est faible. Avec l'émergence d'agents autonomes capables d'effectuer des tâches complexes, on craint donc de plus en plus que ces défaillances puissent avoir de réelles conséquences. Les experts réclament un meilleur accès des chercheurs, de nouvelles politiques publiques, et même une responsabilité juridique pour les dommages causés par l'IA.

Des demandes entendues, mais seront-elles écoutées ? Et surtout, à quel rythme ? S'il est trop pour s'imaginer vivre dans un monde à la I, Robot ou Terminator, il pourrait vite être trop tard pour lutter.

Articles liés
L'IA privilégiée par les Français pour apprendre de nouvelles langues ? Les résultats de ce sondage sont surprenants !
L'IA privilégiée par les Français pour apprendre de nouvelles langues ? Les résultats de ce sondage sont surprenants !
Cette boite prétendait travailler avec l'IA depuis des années : elle est surprise en train d'employer secrètement 700 personnes réelles
Cette boite prétendait travailler avec l'IA depuis des années : elle est surprise en train d'employer secrètement 700 personnes réelles
Digne d'un film de science-fiction : l'IA capable de cloner votre personnalité ? Cette étude fait froid dans le dos
Digne d'un film de science-fiction : l'IA capable de cloner votre personnalité ? Cette étude fait froid dans le dos
Par Marguerite Lania | Journaliste
Journaliste télé sur Purebreak (et fashion victime), Marguerite Lania décortique les émissions, les candidats et les moments cultes du petit écran. De DALS à Koh-Lanta, rien ne lui échappe. Elle zappe entre Quotidien et Tout beau, tout neuf, mais savoure également les jeux. Un jour, vous la verrez dans Les 12 coups de midi ou dans la Star Academy.
Mots clés
Tech
Sur le même thème
Ni Ingrid Chauvin, ni Mimie Mathy : cette actrice de TF1 a été virée au dernier moment du casting de Danse avec les stars 2026 player2
TV
Ni Ingrid Chauvin, ni Mimie Mathy : cette actrice de TF1 a été virée au dernier moment du casting de Danse avec les stars 2026
29 décembre 2025
La saison 2 de Frieren a enfin été diffusée et est déjà entrée dans l'histoire avec un record qu'aucun autre anime n'a réalisé jusqu'à présent player2
Séries
La saison 2 de Frieren a enfin été diffusée et est déjà entrée dans l'histoire avec un record qu'aucun autre anime n'a réalisé jusqu'à présent
19 janvier 2026
Les articles similaires
L'IA ressuscite Val Kilmer dans la première image de As Deep as the Grave : "Cela peut paraître controversé, mais c'est ce qu'il voulait" player2
Cinéma
L'IA ressuscite Val Kilmer dans la première image de As Deep as the Grave : "Cela peut paraître controversé, mais c'est ce qu'il voulait"
21 mars 2026
"Honteux" : une chanson créée par IA débarque sur Skyrock pour la première fois, les internautes fulminent player2
MUSIQUE
"Honteux" : une chanson créée par IA débarque sur Skyrock pour la première fois, les internautes fulminent
27 avril 2026
Dernières actualités
Si vous avez aimé E.T. et Stranger Things, vous allez adorer ce film fantastique cet été... et il est français player2
Cinéma
Si vous avez aimé E.T. et Stranger Things, vous allez adorer ce film fantastique cet été... et il est français
19:15
Le Diable s'habille en Prada 2 : il ne vous reste que 2 jours pour shopper ce vinyle rare de la BO avec Lady Gaga player2
MUSIQUE
Le Diable s'habille en Prada 2 : il ne vous reste que 2 jours pour shopper ce vinyle rare de la BO avec Lady Gaga
18:10
C'est le meilleur anime de foot à regarder durant la Coupe du Monde 2026 et il est français player2
Séries
C'est le meilleur anime de foot à regarder durant la Coupe du Monde 2026 et il est français
17:02
Dernières news