UN SUJET · DES FAITS · DES IDÉES · LE DÉBAT · UN ÉDITO

23 MAI 2026

L'INTELLIGENCE ARTIFICIELLE : LA MACHINE QUI PARLE AVANT DE SAVOIR

L’intelligence artificielle suscite aujourd’hui des représentations extrêmes. Pour les uns, elle annoncerait l’émergence imminente d’une conscience numérique. Pour les autres, elle ne serait qu’un gadget statistique dont l’industrie aurait su gonfler le mythe….
L’intelligence artificielle suscite aujourd’hui des représentations extrêmes. Pour les uns, elle annoncerait l’émergence imminente d’une conscience numérique. Pour les autres, elle ne serait qu’un gadget statistique dont l’industrie aurait su gonfler le mythe. La réalité, comme souvent, se loge entre ces deux postures — dans une zone moins spectaculaire mais nettement plus utile à comprendre.

Les chiffres disent l’ampleur du phénomène. ChatGPT a franchi le seuil des 900 millions d’utilisateurs hebdomadaires actifs en février 2026, contre 400 millions un an plus tôt et 100 millions en janvier 2023, selon les données rendues publiques par OpenAI. La plateforme traite plus de 2,5 milliards de requêtes par jour. Le chiffre d’affaires annualisé d’OpenAI a dépassé 25 milliards de dollars en février 2026. Le marché mondial de l’IA générative est estimé entre 70 et 100 milliards de dollars en 2025 selon les principales études sectorielles, avec des projections à plusieurs centaines de milliards à l’horizon 2030. Aucune technologie grand public n’a connu pareille adoption en si peu de temps.

Mais derrière l’engouement, le fonctionnement réel des modèles modernes reste étonnamment simple à décrire. Les grands modèles de langage analysent d’immenses corpus de textes, en extraient des régularités statistiques, puis produisent les suites de mots les plus probables compte tenu d’un contexte donné. Sous cet angle, on peut effectivement dire qu’une grande partie de l’intelligence artificielle contemporaine relève d’un traitement de texte extraordinairement sophistiqué. La description peut sembler réductrice. Elle n’en est pas moins exacte.

Cette puissance s’accompagne d’une faiblesse structurelle. Les modèles peuvent produire des affirmations entièrement fausses tout en conservant l’apparence parfaite de la crédibilité. Sur des requêtes juridiques précises, une étude du Stanford RegLab publiée en janvier 2024 a mesuré des taux d’hallucination de 69 % à 88 % selon les modèles testés. Les benchmarks plus récents, en 2026, situent encore le taux moyen entre 15 % et 52 % selon les tâches. Cette défaillance n’est pas un défaut accessoire. Elle dicte aujourd’hui l’essentiel des recherches industrielles.

Le futur le plus crédible de l’intelligence artificielle ne ressemble probablement pas à une machine universelle dotée de conscience. Il ressemble plutôt à une multitude d’assistants spécialisés, branchés sur des bases de connaissances vérifiables, dont la valeur viendra moins d’une intelligence abstraite que d’une capacité à traiter l’information à une vitesse et à une échelle hors de portée d’un être humain seul.
UNE MACHINE QUI PARLE AVANT DE SAVOIR Le fonctionnement d’un grand modèle de langage tient à un principe dont la simplicité est presque déroutante : prédire le mot suivant. Le système ingère des milliards de phrases, apprend les régularités statistiques qui les structurent, et devient capable, à partir d’un contexte donné, de proposer la suite la plus probable….
UNE MACHINE QUI PARLE AVANT DE SAVOIR

Le fonctionnement d’un grand modèle de langage tient à un principe dont la simplicité est presque déroutante : prédire le mot suivant. Le système ingère des milliards de phrases, apprend les régularités statistiques qui les structurent, et devient capable, à partir d’un contexte donné, de proposer la suite la plus probable. La fluidité, l’apparente cohérence, l’illusion de raisonnement émergent de cette mécanique. Il n’y a pas, à proprement parler, de pensée. Il y a des distributions de probabilités sur des centaines de milliards de paramètres.

L’architecture de GPT-4, modèle phare d’OpenAI, donne la mesure du procédé. Le système compterait environ 1 760 milliards de paramètres répartis sur 120 couches, dans une architecture dite « mixture of experts » associant seize sous-modèles spécialisés d’environ 110 milliards de paramètres chacun. Son entraînement aurait mobilisé près de 25 000 processeurs graphiques Nvidia A100 pendant trois mois, pour un coût matériel estimé entre 78 et 100 millions de dollars. Le corpus d’apprentissage représente environ treize mille milliards de tokens. Il s’agit, à ce stade de l’histoire de l’informatique, du plus grand ouvrage de traitement statistique de texte jamais réalisé.

Treize mille milliards de tokens, c’est l’équivalent d’environ cent millions de livres — soit, en ordre de grandeur, sept à huit fois la totalité de la Bibliothèque nationale de France. Pour qu’un humain lise un tel corpus à raison de cinquante livres par an, il lui faudrait deux millions d’années. GPT-4 l’a ingéré en trois mois.

Cette description peut sembler désenchantée. Elle ne l’est pas. Une bonne partie des activités humaines repose précisément sur la manipulation d’informations textuelles : lire, résumer, comparer, rédiger, rechercher, classifier, traduire, argumenter. Dès lors qu’une machine devient performante dans ces tâches, elle acquiert une utilité économique considérable, indépendamment de toute prétention philosophique. Les modèles savent bien parler avant de bien savoir. C’est une limite. C’est surtout, à l’échelle, une rupture économique.
L’AUTOMATISATION DU TRAVAIL COGNITIF La véritable analogie historique n’est pas la conscience artificielle. C’est la révolution industrielle. De la même manière que la machine à vapeur a automatisé certaines tâches physiques répétitives au XIXᵉ siècle, les modèles de langage automatisent aujourd’hui une partie du travail intellectuel répétitif….
L’AUTOMATISATION DU TRAVAIL COGNITIF

La véritable analogie historique n’est pas la conscience artificielle. C’est la révolution industrielle. De la même manière que la machine à vapeur a automatisé certaines tâches physiques répétitives au XIXᵉ siècle, les modèles de langage automatisent aujourd’hui une partie du travail intellectuel répétitif. La rupture n’est pas une apparition d’âme dans la machine. Elle est une démultiplication de la productivité cognitive.

Les études commencent à mesurer cette productivité avec une précision croissante. Une recherche conduite par la Harvard Business School avec le Boston Consulting Group a montré que des consultants utilisant un grand modèle de langage produisaient un travail jugé 40 % de qualité supérieure sur des tâches d’analyse et de rédaction complexes. Une étude de la Federal Reserve Bank de Saint-Louis a établi que plus de la moitié des utilisateurs professionnels d’IA gagnent au moins trois heures par semaine. À l’échelle des États-Unis, les enquêtes de Stanford et de Pew Research montraient en 2025 que 43 % des travailleurs de la connaissance utilisaient des outils d’IA, contre moins de 10 % fin 2022. Chez OpenAI, environ un tiers des conversations sur ChatGPT sont liées au travail.

Les secteurs les plus exposés sont aussi les plus prévisibles. L’informatique, la finance, le conseil, les services juridiques, l’enseignement supérieur, les médias : tous sont massivement composés d’activités de traitement de texte au sens large. L’IA y agit moins comme un substitut total que comme un accélérateur partiel — ce qui prenait deux heures peut prendre vingt minutes, ce qui mobilisait trois personnes peut être abordé par une seule. Le gain n’est pas marginal. Il déplace structurellement la courbe de productivité, et avec elle l’organisation du travail intellectuel.
L’HALLUCINATION, MALADIE NATIVE C’est ici que la médaille révèle son revers. Les modèles de langage peuvent produire des réponses totalement fausses tout en conservant une apparence de crédibilité parfaite….
L’HALLUCINATION, MALADIE NATIVE

C’est ici que la médaille révèle son revers. Les modèles de langage peuvent produire des réponses totalement fausses tout en conservant une apparence de crédibilité parfaite. Cette défaillance n’est pas accidentelle. Elle découle directement de leur fonctionnement. Le système ne recherche pas la vérité au sens strict ; il cherche à produire la suite linguistique la plus probable. Lorsque l’information manque, est ambiguë ou contradictoire, il comble le vide par une formulation plausible. Il invente — sans malveillance, sans conscience de l’erreur — des faits, des citations, des arrêts, des références bibliographiques.

L’étude la plus systématique sur le sujet a été conduite par le RegLab et le Stanford Institute for Human-Centered AI, et publiée en janvier 2024. Sur des requêtes juridiques précises portant sur la jurisprudence fédérale américaine, les taux d’hallucination s’étalaient de 69 % à 88 % selon les modèles testés, en l’occurrence GPT-3.5, Llama 2 et PaLM 2. Sur des questions concernant le fond d’un arrêt — son holding —, les modèles inventaient au moins trois fois sur quatre. Une étude complémentaire conduite en 2024 sur les outils d’IA juridique commerciaux, censés être adossés à des bases de données vérifiées, a montré que ces dispositifs hallucinaient encore dans une part significative des cas, malgré les promesses commerciales. Les benchmarks 2026, sur des modèles de génération récente, situent encore le taux d’hallucination moyen entre 15 % et 52 % selon les tâches.

La leçon est sobre : tant que l’objectif statistique reste « produire une suite plausible », le risque d’hallucination ne peut pas être supprimé en théorie. Il peut être réduit par l’entraînement, l’auto-vérification, le filtrage. Il ne peut pas être éliminé. Pour un usage grand public, c’est une nuisance. Pour des décisions juridiques, médicales, financières, c’est une zone à haut risque. La différence entre une réponse vraie et une réponse fausse est, à la lecture, invisible. Tout le problème tient à cette indistinction.
VERS L’IA HYBRIDE ET SPÉCIALISÉE La trajectoire industrielle des deux dernières années répond précisément à cette limite. Les systèmes deviennent progressivement hybrides : ils ne se contentent plus de générer du texte à partir de leur entraînement, mais s’appuient sur des bases de données externes, des moteurs de recherche, des outils spécialisés….
VERS L’IA HYBRIDE ET SPÉCIALISÉE

La trajectoire industrielle des deux dernières années répond précisément à cette limite. Les systèmes deviennent progressivement hybrides : ils ne se contentent plus de générer du texte à partir de leur entraînement, mais s’appuient sur des bases de données externes, des moteurs de recherche, des outils spécialisés. La technique dominante, dite RAG pour Retrieval-Augmented Generation, consiste à récupérer en temps réel les documents pertinents puis à demander au modèle de répondre uniquement à partir de ces sources, en citant ses références. Le modèle ne crée plus à partir de rien : il synthétise à partir d’un corpus identifié.

L’illustration la plus éclatante de cette mutation est sans doute Harvey, jeune entreprise fondée en 2022 et spécialisée dans l’IA juridique. La plateforme s’adresse aux grands cabinets d’avocats et aux directions juridiques d’entreprise. Elle produit des recherches juridiques, analyse des contrats, prépare des due diligences à partir de bases de jurisprudence et de doctrine vérifiables. En mars 2026, Harvey a levé 200 millions de dollars sur la base d’une valorisation de 11 milliards. Son chiffre d’affaires annualisé atteignait 190 millions de dollars en janvier 2026, contre 100 millions en août 2025. La plateforme revendique plus de 100 000 avocats utilisateurs au sein de 1 300 organisations dans 58 pays, parmi lesquels 45 cabinets du classement AmLaw 100. La trajectoire dit à elle seule la maturité du marché des IA spécialisées.

Le pari intellectuel sous-jacent est clair. Plutôt qu’un modèle universel censé tout savoir, l’avenir pourrait appartenir à des systèmes fermés, construits autour de corpus délimités, vérifiables et hiérarchisés. Le droit, la médecine, la recherche scientifique technique sont des terrains particulièrement adaptés : leur travail est massivement composé d’opérations de lecture, de comparaison, de synthèse et de rédaction à partir de sources existantes. Dans un environnement où chaque affirmation peut être reliée à une source précise, l’IA cesse de fonctionner comme un oracle pour devenir un accélérateur documentaire. C’est une fonction plus modeste que celle promise par le marketing. C’est probablement la plus utile.

« La question de savoir si une machine peut penser n'est pas plus intéressante que celle de savoir si un sous-marin peut nager. » — Edsger Dijkstra, EWD898, 1984. Quarante ans plus tard, alors que les grands modèles de langage ont franchi des seuils que l'informaticien néerlandais n'aurait pas anticipés, son intuition reste juste : l'utilité d'une machine ne dépend pas de sa ressemblance avec l'humain, mais de l'efficacité de sa fonction....
« La question de savoir si une machine peut penser n'est pas plus intéressante que celle de savoir si un sous-marin peut nager. » — Edsger Dijkstra, EWD898, 1984. Quarante ans plus tard, alors que les grands modèles de langage ont franchi des seuils que l'informaticien néerlandais n'aurait pas anticipés, son intuition reste juste : l'utilité d'une machine ne dépend pas de sa ressemblance avec l'humain, mais de l'efficacité de sa fonction. Le sous-marin nage mieux que l'homme. Il ne nage pas comme l'homme.

POUR ALLER PLUS LOIN L’intelligence artificielle de 2026 occupe une position singulière dans l’histoire des technologies. Elle a quitté le statut de promesse de laboratoire ; elle n’a pas encore atteint celui d’infrastructure mature….
POUR ALLER PLUS LOIN

L’intelligence artificielle de 2026 occupe une position singulière dans l’histoire des technologies. Elle a quitté le statut de promesse de laboratoire ; elle n’a pas encore atteint celui d’infrastructure mature. Entre les deux se loge une zone d’incertitude où les usages se déploient plus vite que les outils de mesure, où les valorisations boursières précèdent les modèles économiques pérennes, où les promesses publiques entrent souvent en collision avec la réalité technique. Toute affirmation catégorique sur ce qu’est l’IA aujourd’hui est probablement à la fois vraie et fausse — selon le segment, selon l’usage, selon le moment.

Ce qui semble se stabiliser, c’est une distinction de plus en plus nette entre deux trajectoires. La première est celle des modèles généralistes grand public, dont ChatGPT reste l’archétype : conçus pour répondre à tout, accessibles à des centaines de millions d’utilisateurs, performants en moyenne mais défaillants sur le détail. La seconde est celle des modèles spécialisés intégrés à des domaines précis, comme Harvey en droit, comme les outils de codage assisté pour les développeurs, comme les systèmes diagnostiques en imagerie médicale. Les premiers fascinent. Les seconds rapportent.

La question des hallucinations est probablement la frontière la plus claire entre ces deux mondes. Pour un usager qui demande une recette de cuisine, qu’un modèle se trompe sur la durée de cuisson est un inconvénient. Pour un avocat qui s’appuierait sur une jurisprudence fictive devant un tribunal, c’est une faute professionnelle. Plusieurs cas américains ont déjà donné lieu à des sanctions disciplinaires, depuis l’affaire Mata v. Avianca en 2023, où des avocats new-yorkais avaient produit des arrêts entièrement inventés par ChatGPT. Le marché professionnel a pris la mesure du risque. Les architectures hybrides — RAG, citation systématique des sources, ancrage dans des corpus vérifiés — répondent à un besoin réel, et probablement durable.

Cette spécialisation a une conséquence sociale qui est peut-être la plus importante des dix prochaines années. Les fonctions intellectuelles répétitives — celles qui mobilisent du raisonnement codifié, de la recherche documentaire, de la rédaction structurée — vont voir leur productivité augmenter considérablement. Les juristes ne disparaîtront pas, mais l’avocat junior qui passait quarante heures sur une recherche de jurisprudence en passera désormais quatre. Le médecin ne disparaîtra pas, mais le radiologue qui examinait deux cents clichés par jour pourra en analyser dix fois plus avec une assistance algorithmique. Le journaliste, le chercheur, le consultant, le comptable, l’enseignant : aucun n’échappe à cette redistribution.

La question politique majeure qui en découle n’est pas celle de la « disparition du travail » — terminologie médiatique commode mais largement fausse. C’est celle de la répartition des gains de productivité. Lorsqu’une technologie permet à dix personnes de produire ce que cent produisaient hier, deux scénarios s’ouvrent : soit la productivité supplémentaire libère du temps, des ressources, des emplois redéployés vers des tâches à plus forte valeur ajoutée ; soit elle bénéficie exclusivement aux propriétaires des modèles, des données et des infrastructures. Les choix fiscaux, sociaux et industriels des États sur cette question pèseront probablement plus lourd, à dix ans, que la course à la prochaine génération de modèles.

Reste enfin une question philosophique que la communication marketing préfère éluder. Une intelligence artificielle capable de rédiger un texte cohérent, de tenir une conversation, voire de simuler une émotion, n’est pas pour autant une intelligence au sens humain du terme. Elle ne comprend pas, au sens où l’on dit qu’un être comprend une situation. Elle prédit, à un niveau de raffinement statistique sans précédent. Confondre les deux n’est pas seulement une erreur conceptuelle ; c’est une erreur stratégique. L’utilité d’un outil dépend toujours, in fine, de la lucidité de celui qui l’emploie. La machine qui parle bien avant de bien savoir n’est dangereuse que pour ceux qui croient qu’elle sait parce qu’elle parle.

L’intelligence artificielle est, pour l’instant, exactement cela : un traitement de texte d’une puissance inédite, branché sur des bases de connaissances de plus en plus vérifiables, dont l’utilité réelle dépendra moins de son intelligence supposée que de la rigueur avec laquelle elle est conçue, encadrée et utilisée. Le reste relève de l’imaginaire collectif — qui a toujours, depuis Frankenstein jusqu’à HAL 9000, projeté sur les machines des espoirs et des peurs disproportionnés à ce qu’elles savent réellement faire. Cette projection est elle-même une forme d’intelligence — humaine, celle-là — qu’aucun modèle ne sait imiter.

WOW ! est un projet de recherche indépendant, privé, libre, sur les médias et sur l’ IA en tant que moyen d’information, d’écriture, de débat et de réflexion. Tous les textes sont hybrides (humain et IA).

Aucun ne représente les opinions de WOW!

Pour toute question : contact@wow-media.fr

Retour en haut