Le Model Context Protocol (MCP), lancé fin 2024 comme solution universelle pour connecter les LLM aux outils externes, suscite aujourd'hui des interrogations croissantes. Présenté comme "l'USB-C de l'écosystème IA", ce protocole fait face à des critiques de plus en plus nombreuses de la part des développeurs qui l'utilisent quotidiennement. Entre consommation excessive de contexte, problèmes de fiabilité et redondance avec les solutions existantes, le MCP montre ses limites dans les environnements de production réels.
Comprendre le Model Context Protocol et ses promesses initiales
Le MCP a été conçu pour standardiser la connexion entre les grands modèles de langage et les outils tiers comme GitHub, Linear, Notion ou Slack. L'objectif était louable : créer une interface unifiée permettant aux IA de communiquer avec n'importe quel service externe sans développement spécifique pour chaque plateforme.
Cette approche rappelle les tentatives de standardisation qu'on observe dans d'autres domaines technologiques. Tout comme les mises à jour logicielles majeures cherchent à unifier l'expérience utilisateur, le MCP visait à simplifier l'intégration des outils IA. Cependant, la théorie se heurte souvent à la réalité du terrain.
Depuis mai 2026, Claude Code a introduit le Tool Search avec chargement différé, réduisant la consommation de contexte de plus de 85%. Cette amélioration adresse partiellement le problème principal du MCP, mais ne résout pas l'ensemble des défis architecturaux et opérationnels.
Problème majeur : la fenêtre de contexte dévorée par les définitions d'outils
La fenêtre de contexte d'un LLM fonctionne comme un bureau de travail. Lorsque vous connectez des serveurs MCP, les définitions d'outils occupent une partie substantielle de cet espace précieux, laissant moins de place pour le travail réel.
Mesures concrètes de consommation de contexte
Les mesures effectuées sur une stack réelle révèlent des chiffres préoccupants. Avec quatre serveurs MCP connectés (Linear, Notion, Slack, Postgres), 10,5% de la fenêtre de contexte est consommée uniquement par les définitions d'outils, avant même toute utilisation effective.
| Serveur MCP | Nombre d'outils | Caractères estimés | Tokens estimés |
|---|---|---|---|
| Linear | 42 | ~51 229 | ~12 807 |
| Notion | 14 | ~16 156 | ~4 039 |
| Slack | 12 | ~15 168 | ~3 792 |
| Postgres | 9 | ~1 755 | ~438 |
| Total | 77 | ~84 308 | ~21 077 |
Pour Claude avec sa fenêtre de 200 000 tokens, cela représente 10,5% de capacité perdue. Pour GPT-4o limité à 128 000 tokens, l'impact grimpe à 16,5%. Linear seul mobilise plus de 12 800 tokens avec ses 42 définitions d'outils, même si vous n'utilisez finalement que deux fonctions.
L'analogie du restaurant surchargé
Imaginez un restaurant où, dès votre arrivée, dix menus différents sont étalés sur la table. Il ne reste plus d'espace pour poser votre assiette. À chaque commande, tous les menus doivent être consultés à nouveau. C'est exactement ce qui se passe avec MCP : les définitions d'outils occupent un espace permanent, réduisant la capacité de traitement disponible pour vos tâches réelles.
Cette problématique de gestion des ressources est similaire aux défis rencontrés dans l'optimisation du code JavaScript, où chaque octet compte pour les performances.
Fiabilité opérationnelle : les failles du protocole en production
Au-delà de la consommation de contexte, le MCP présente des problèmes de fiabilité qui impactent directement l'expérience utilisateur et la productivité des développeurs.
Les défaillances courantes observées
- Échecs d'initialisation répétés : nécessité de démarrer et maintenir un processus séparé, avec des demandes d'authentification récurrentes
- Ralentissement des réponses IA : chaque appel d'outil nécessite un aller-retour vers un serveur externe
- Crashs en cours de session : les processus serveur MCP peuvent s'interrompre brutalement
- Permissions opaques : difficultés à comprendre précisément quelles autorisations chaque outil possède réellement
Les benchmarks comparatifs montrent que MCP est 3 fois plus lent par appel qu'une API REST directe, et jusqu'à 9,4 fois plus lent lors du premier appel incluant l'initialisation. Cette surcharge n'est pas spécifique à un service particulier, elle découle de l'architecture même du protocole qui ajoute une couche de processus entre le LLM et l'API sous-jacente.
Impact sur les workflows de développement
Pour les équipes qui intègrent l'IA dans leurs processus quotidiens, ces problèmes de fiabilité deviennent rapidement bloquants. Contrairement aux workflows d'automatisation de contenu qui peuvent tolérer quelques secondes de latence, les interactions en temps réel nécessitent une réactivité constante.
La redondance avec les outils CLI et API existants
L'un des arguments les plus convaincants contre MCP réside dans sa redondance avec des solutions éprouvées et déjà maîtrisées par les développeurs.
Comparaison CLI/API versus MCP
| Aspect | CLI / API | MCP |
|---|---|---|
| Parité humain-machine | Mêmes commandes pour tous | Uniquement dans les conversations LLM |
| Composabilité | Pipes, jq, grep librement combinables | Limité au format de retour du serveur |
| Débogage | Reproduction immédiate en terminal | Uniquement dans le contexte conversationnel |
| Données d'entraînement | Déjà apprises (man pages, StackOverflow) | Nécessite des définitions séparées |
| Coût d'installation | Généralement déjà installé | Configuration serveur, auth, gestion de processus |
Exemple concret : recherche d'un ticket Linear
La différence de consommation de tokens entre MCP et CLI est spectaculaire. Pour rechercher un même ticket Linear, l'approche CLI consomme environ 200 tokens (50 pour la commande curl, 150 pour la réponse), tandis que MCP en mobilise 12 957 (12 807 pour les définitions d'outils toujours chargées, plus 150 pour l'appel et la réponse). Soit un ratio de 1 à 65.
Cette efficacité rappelle l'importance de l'optimisation des prompts pour maximiser les performances des modèles IA.

Les alternatives viables au Model Context Protocol
Face aux limites du MCP, plusieurs approches alternatives émergent, offrant des compromis différents entre simplicité, performance et fonctionnalités.
Stratégie CLI-First : revenir aux fondamentaux
L'approche CLI-first privilégie l'utilisation directe des interfaces en ligne de commande existantes. Les LLM ont déjà été entraînés sur des millions de pages de documentation, de man pages et de discussions StackOverflow. Pourquoi réinventer la roue ?
Avantages de cette approche :
- Aucun token gaspillé en définitions d'outils
- Interface identique pour humains et IA, facilitant le débogage
- Combinaison libre avec des pipelines Unix standards
- Pas de processus serveur supplémentaire à maintenir
Le pattern Skills : charger uniquement ce dont vous avez besoin
Si MCP revient à "étaler tous les menus sur la table dès l'arrivée", le pattern Skills fonctionne comme "demander au bibliothécaire uniquement le livre nécessaire". Les instructions CLI sont intégrées dans des Skills qui ne sont chargées qu'à la demande.
Exemple de Skill Linear :
# Linear Issue Lookup Skill
- Linear API: https://api.linear.app/graphql
- Auth: Bearer Token ($LINEAR_TOKEN env var)
- Get issue: curl -s -H "Authorization: Bearer $LINEAR_TOKEN" -H "Content-Type: application/json" -d '{"query":"{ issue(id: \"ISSUE-ID\") { title state { name } assignee { name } } }"}' https://api.linear.app/graphql
- Search issues (GraphQL): ajuster le champ query pour un filtrage type JQL
- Résultats en JSON, parser avec jq

Cette méthode ne charge les informations que lorsque la Skill est invoquée, évitant la surcharge permanente de 42 définitions d'outils. L'approche s'apparente aux techniques utilisées dans l'utilisation optimisée des générateurs d'images IA, où chaque ressource est sollicitée au moment opportun.
Cas particulier des bases de données : MCP garde-t-il un avantage ?
Les bases de données représentent un cas d'usage spécifique où MCP peut conserver une certaine pertinence, malgré ses défauts généraux.
L'approche Skills + CLI pour les bases de données
Les LLM maîtrisent déjà SQL et les requêtes MongoDB. En fournissant le schéma de base et les commandes CLI dans une Skill, l'IA peut générer et exécuter des requêtes efficacement :
# Postgres Skill
- Host: postgres://localhost:5432/myapp
- Tables: users (id, name, email), orders (id, user_id, status)
- CLI: psql -h localhost -d myapp -c "SELECT * FROM users WHERE ..."
Quand MCP reste justifié pour les bases de données
Malgré la simplicité de l'approche CLI, MCP présente deux avantages décisifs pour les bases de données en production :
- Sécurité des requêtes : les serveurs MCP peuvent imposer un mode lecture seule et bloquer les requêtes dangereuses au niveau serveur. Skills + CLI ne peuvent pas empêcher un LLM d'exécuter un DROP TABLE
- Protection des identifiants : l'approche CLI peut exposer les chaînes de connexion dans le prompt. Les serveurs MCP gèrent les credentials en interne
| Scénario | Recommandation | Justification |
|---|---|---|
| Développement local / DB personnelle | Skills + CLI | Léger et rapide. Récupération facile en cas d'erreur |
| DB production / équipe partagée | MCP | Garde-fous essentiels. Validation de requêtes et contrôle d'accès au niveau serveur |
Cette distinction rappelle les enjeux de sécurité qu'on retrouve dans d'autres domaines IA, comme les risques liés aux deepfakes où la protection des données sensibles devient critique.
MCP comme argument marketing : le nouveau "AI-powered"
En mai 2026, pratiquement chaque page d'accueil de SaaS affiche fièrement "MCP supporté" dans sa liste de fonctionnalités. Peu importe si le serveur MCP est stable ou combien de contexte il consomme : l'objectif est de cocher la case "nous faisons aussi du MCP".
Ce schéma rappelle les vagues précédentes de buzzwords marketing : "AI-powered", "blockchain-based", "cloud-native". La présence du label compte plus que la qualité de l'implémentation. Lorsque les utilisateurs connectent réellement ces serveurs, ils découvrent des dizaines de définitions d'outils chargées, des échecs d'initialisation et des crashs en pleine session.
Cette tendance s'observe également dans d'autres secteurs technologiques, comme le marketing des PC IA où les promesses dépassent souvent la réalité technique.
Approche pragmatique : combiner les trois stratégies selon le contexte
Chez Quandri, l'équipe d'ingénierie a adopté une approche hybride, utilisant les trois méthodes selon les besoins spécifiques de chaque service.
Répartition stratégique des approches
- Bash + CLI pour les outils utilisés quotidiennement (gh, psql, aws) : coût de contexte nul, flexibilité maximale, débogage direct en terminal
- Skills pour les workflows multi-étapes répétables comme la rédaction de commits et les revues de PR : chargement à la demande uniquement
- MCP pour les services sans CLI robuste (Slack, Linear, Notion) et lorsque l'authentification d'équipe ou le contrôle de permissions importe (accès aux bases de données de production)
Cette flexibilité permet d'optimiser chaque cas d'usage. Si un CLI existe et s'authentifie localement, c'est généralement l'option la plus légère. Si un service n'a pas de CLI ou nécessite une authentification uniforme pour toute l'équipe, MCP justifie son existence.
L'approche rappelle la diversification nécessaire dans les stratégies de monétisation IA, où aucune solution unique ne convient à tous les scénarios.

Résultats mesurables de l'approche hybride
Le remplacement de serveurs MCP par des Skills enrobant des CLI existants a libéré environ 21 000 tokens de contexte, éliminé les échecs d'initialisation des workflows quotidiens, et maintenu le débogage dans le terminal où il appartient naturellement.
Quand MCP conserve sa pertinence en 2026
Malgré ses défauts structurels, MCP n'est pas complètement obsolète. Certains cas d'usage justifient encore son utilisation :
- Absence de CLI : services web uniquement où MCP peut être la seule méthode de connexion
- Utilisateurs non-développeurs : MCP reste plus accessible pour ceux qui ne maîtrisent pas le terminal
- Communication bidirectionnelle en temps réel : scénarios dépassant la simple requête-réponse
- Environnements de production sécurisés : lorsque les garde-fous au niveau serveur sont essentiels
Dans ces contextes spécifiques, les avantages de MCP compensent ses inconvénients. La clé réside dans l'évaluation honnête de vos besoins réels plutôt que dans l'adoption aveugle d'une technologie à la mode.
Cette réflexion s'applique aussi à d'autres domaines, comme la préservation des recettes familiales par IA, où la technologie doit servir un besoin authentique.
Perspectives d'évolution et recommandations pour 2026
L'introduction du Tool Search avec chargement différé par Claude Code marque une évolution positive, réduisant de 85% la consommation de contexte. Cependant, les problèmes de performance, de débogage et d'architecture persistent.
Recommandations pour les équipes de développement
- Auditer votre consommation de contexte actuelle : mesurez précisément combien de tokens vos serveurs MCP mobilisent
- Privilégier CLI + Skills pour les nouveaux outils : sauf nécessité spécifique justifiant MCP
- Maintenir MCP pour les bases de données de production : où les garde-fous de sécurité sont critiques
- Documenter les Skills avec des exemples CLI concrets : maximiser la réutilisabilité et la clarté
- Tester régulièrement la fiabilité de vos serveurs MCP : anticiper les défaillances avant qu'elles n'impactent la production
L'avenir du protocole MCP
MCP pourrait évoluer vers une solution plus mature en adressant ses faiblesses actuelles : optimisation du chargement des définitions, amélioration de la fiabilité des serveurs, meilleure gestion des permissions. Mais en mai 2026, pour la majorité des workflows de développement, les alternatives CLI et Skills offrent un meilleur rapport efficacité/complexité.
L'enseignement fondamental reste : enseigner efficacement les outils à l'IA importe davantage que multiplier les connexions. Chargez uniquement ce dont vous avez besoin, au moment où vous en avez besoin, avec des instructions CLI intégrées. C'est cette approche pragmatique qui gagne aujourd'hui.
Pour aller plus loin dans votre maîtrise des outils IA et découvrir comment optimiser vos workflows de création de contenu, créez votre compte gratuit sur Roboto et explorez nos fonctionnalités de génération intelligente.