Chargement en cours

IA en entreprise : le grand fossé du ROI en 2025, selon une étude du MIT

Malgré 30 à 40 milliards de dollars investis par les entreprises, 95 % des initiatives d’IA générative ne produisent aucun retour sur investissement. C’est le constat central d’une étude du MIT (projet NANDA) qui documente un paysage en deux vitesses : une poignée d’organisations convertissent quelques pilotes en gains mesurables, tandis que la majorité reste bloquée au stade de l’expérimentation, sans impact sur le compte de résultat. Le facteur décisif n’est ni la qualité des modèles ni les contraintes juridiques : c’est la capacité des systèmes à apprendre des usages, à retenir du contexte et à s’insérer dans les processus réels.

Adoption massive, transformation minimale

La popularité des assistants généralistes (ChatGPT, Copilot) ne fait guère de doute : plus de 80 % des organisations les ont explorés ou testés et près de 40 % déclarent un déploiement. Mais ces usages améliorent surtout la productivité individuelle ; ils ne se traduisent que rarement dans le P&L. À l’inverse, les outils « entreprise » — solutions spécialisées ou sur mesure — peinent à passer à l’échelle : 60 % des organisations les évaluent, 20 % seulement atteignent le pilote et 5 % la production. L’obstacle ? Des workflows fragiles, une absence d’apprentissage contextuel et un faible alignement avec l’opérationnel.

La « transformation sectorielle » reste, elle aussi, circonscrite. Sur les grands secteurs étudiés, seuls la technologie et les médias-télécoms montrent des signaux nets de disruption, loin des bouleversements structurels associés à d’autres technologies générales. Ailleurs, on observe des gains d’efficacité localisés, sans recomposition des rapports de force.

Le cœur du problème : des systèmes qui n’apprennent pas

Pour les auteurs, le principal frein n’est pas l’infrastructure mais le “learning gap” : la plupart des outils n’emmagasinent pas le retour d’expérience, n’adaptent pas leurs réponses au contexte et ne s’améliorent pas au fil des interactions. L’usage reste plaisant pour des tâches simples, mais dès que l’on touche aux activités complexes ou longues, les équipes se tournent vers… les humains. Dans l’enquête, l’IA est plébiscitée pour les e-mails et résumés rapides ; pour les projets multi-semaines, les répondants préfèrent un humain dans des proportions de 9 pour 1.

Une juriste interrogée résume cette limite : l’outil « ne retient pas nos préférences et répète les mêmes erreurs », ce qui la conduit à réserver l’IA aux brouillons et au brainstorming, pas aux contrats sensibles. Autrement dit, l’IA “gagne la guerre des tâches simples” mais perd celle des workflows critiques, faute de mémoire et d’adaptabilité.

L’« économie de l’IA de l’ombre »

Paradoxe : alors que les déploiements officiels patinent, les usages officieux explosent. Les salariés automatisent déjà une partie de leur travail avec des comptes personnels (ChatGPT, Claude), souvent sans aval de l’IT. Les chiffres frappent : si seulement 40 % des entreprises ont acheté un abonnement LLM, des employés de plus de 90 % d’entre elles déclarent utiliser régulièrement des outils personnels pour des tâches professionnelles. Cette « shadow AI » révèle ce qui fonctionne réellement — des outils souples, réactifs — et sert de vivier d’idées aux organisations les plus pragmatiques.

Où le ROI est observé : des gains discrets mais concrets

L’étude met au jour une autre ligne de fracture : les budgets privilégient le visible. Entre 50 % et 70 % des dépenses IA se concentrent sur le commercial et le marketing, domaines où il est facile d’attribuer un résultat (volumes de démo, temps de réponse). Pourtant, les retours les plus nets se logent souvent dans le back-office : opérations, finance, conformité.

Sur le front-office, l’IA améliore la vitesse de qualification des leads (+40 %) et la rétention client (+10 %) grâce aux relances intelligentes. Mais les économies les plus tangibles viennent de l’arrière-boutique : remplacement ou réduction de l’externalisation (BPO, Business Process Outsourcing) avec 2 à 10 millions de dollars d’économies annuelles sur le service client et le traitement documentaire ; –30 % de dépenses d’agence externe pour la production de contenus ; ≈1 million épargné en contrôles de risque dans la finance. Ces gains s’obtiennent sans plans massifs de licenciements : l’impact se concentre sur la baisse des coûts externes et quelques fonctions standardisées déjà externalisées.

Pourquoi les pilotes échouent : récit d’une “chute” annoncée

De nombreuses directions métiers disent préférer l’interface familière des assistants généralistes aux outils « intégrés » vendus à grands frais ; elles jugent ces derniers rigides, trop coûteux à configurer et fragiles aux cas limites. D’où un goulet d’étranglement massif : beaucoup d’explorations, peu de pilotes et presque pas de mises en production — seulement 5 % pour les outils spécialisés, avec des grands groupes particulièrement lents à convertir l’essai quand des entreprises de taille intermédiaire bouclent l’industrialisation en environ 90 jours.

Comment certains ont franchi le fossé

Du côté des acheteurs, les organisations qui réussissent achètent plutôt qu’elles ne bâtissent seules : les partenariats externes aboutissent deux fois plus souvent que les développements internes (≈ 67 % contre ≈ 33 % dans l’échantillon). Autre trait commun : la décision est décentralisée vers les managers de terrain, tout en restant redevable d’objectifs business (coût par ticket, délai de clôture, taux de résolution, DSO, etc.). Les « prosumers » — ces utilisateurs qui ont déjà adopté ChatGPT/Claude à titre personnel — servent souvent de catalyseurs pour sélectionner, adapter et diffuser les bons outils.

Du côté des fournisseurs, les vainqueurs ne vendent pas des « démos » : ils s’encastrent dans le processus et apprennent avec l’usage. Ils commencent étroit (revue de contrats, catégorisation de dépenses, résumés et routage d’appels) avec peu de configuration et un time-to-value rapide, puis étendent leur empreinte. Le bouche-à-oreille entre pairs, les intégrateurs et les marketplaces pèsent davantage que la fiche de fonctionnalités.

Trois scènes de terrain

Dans un centre de relation client B2C, un agent vocal résume et route les appels, conserve l’historique des préférences et s’intègre au CRM. Résultat : baisse sensible du recours au BPO et économies à sept chiffres à l’année, avec un niveau de satisfaction client préservé.

Dans la comptabilité fournisseurs, un agent documentaire classe, extrait et rapproche les pièces, signale les anomalies et trace chaque action pour l’audit ; la clôture s’accélère, les erreurs diminuent et l’entreprise dégonfle progressivement ses contrats d’outsourcing.

Dans un cabinet juridique, la revue de clauses s’appuie sur un système qui retient les préférences internes, réduit le temps de cycle et baisse les escalades vers les seniors — une bascule permise justement par la mémoire persistante qui manquait aux outils génériques.

La prochaine marche : de l’agent à « l’Agentic Web »

Pour combler le « learning gap », les entreprises s’intéressent à des agents dotés de mémoire persistante et capables d’orchestration end-to-end. Des briques d’interopérabilité (MCP, A2A, NANDA) émergent, annonçant une couche d’action distribuée où des agents spécialisés coopèrent et se coordonnent au-delà des silos applicatifs. Les auteurs évoquent même une fenêtre de 18 mois : à mesure que les organisations verrouillent leurs choix et que les systèmes apprennent des données et des feedbacks, les coûts de changement s’accroissent.

Ce que les chiffres disent — et ce qu’ils impliquent

Pris ensemble, ces résultats dessinent un mode d’emploi sobre : cesser d’empiler des « wrappers » de modèles et exiger des systèmes qui apprennent, jugés non pas sur des métriques de laboratoire mais sur des indicateurs opérationnels assortis d’économies externes réelles (BPO, agences, consulting). Commencer là où la valeur est mesurable — souvent le back-office — puis élargir, en s’appuyant sur des partenariats plutôt que des reconstructions internes. Et accepter que l’IA utile soit moins un « produit » qu’un service évolutif au plus près des métiers.

Méthodologie : l’étude s’appuie sur 52 entretiens structurés, l’analyse de plus de 300 initiatives publiques et une enquête auprès de 153 cadres ; la réussite est définie comme un déploiement au-delà du pilote avec des KPI mesurables.

Définitions : BPO (Business Process Outsourcing) : externalisation de processus métier, typiquement service client, traitements administratifs et fonctions standardisées. (L’étude observe que les gains de ROI proviennent davantage de la réduction de ces dépenses externes que de coupes drastiques dans les effectifs internes.) 

Sources : MIT NANDA, « The GenAI Divide — State of AI in Business 2025 », juillet 2025. 

Voir aussi article de l’usine digitale à ce sujet