Tu connais le rituel. Avant de demander quoi que ce soit d'utile à ton IA, tu recolles le décor : l'architecture, la décision d'hier, les conventions, le bout de code concerné. Ça marche, une fois. Le problème, c'est que tu le refais à chaque session, sur chaque projet, et que ce geste a un coût qui grandit avec toi.
Le rituel du copier-coller de contexte
Le copier-coller de contexte est devenu un réflexe parce qu'il est la seule mémoire dont dispose ton assistant : sa fenêtre, que tu remplis à la main. On l'a vu dans pourquoi ton IA oublie tout, l'assistant repart de zéro à chaque session, donc tu recharges.
Au début, ça passe. Un petit projet, deux ou trois fichiers, une décision. Mais le réflexe ne tient pas la distance.
Pourquoi ça ne passe pas à l'échelle
Trois forces font échouer le copier-coller dès que le projet grossit.
- Le temps. Chaque session commence par plusieurs minutes de recontextualisation. Multiplié par tes sessions quotidiennes, sur la durée d'un projet, ça représente des heures à répéter ce que tu as déjà écrit.
- L'oubli. Tu ne colles jamais tout. Tu oublies la décision prise la semaine dernière, la convention implicite, l'essai qui a échoué. L'assistant répond donc à côté, et tu corriges, ce qui prend encore du temps.
- L'incohérence. Le contexte que tu colles est figé à l'instant où tu le colles. Dès que ta connaissance évolue, ton copier-coller est périmé. Tu maintiens, à la main, une copie partielle et datée de ce que tu sais déjà ailleurs.
Le copier-coller ne scale pas parce qu'il fait de toi la mémoire de ton IA. C'est ta charge mentale qui paie la facture.
Le faux remède : tout mettre dans le prompt
La réaction naturelle est de coller plus : tout le README, plusieurs fichiers, l'historique complet. Mauvaise idée. Comme expliqué dans mémoire long terme vs fenêtre de contexte, gaver la fenêtre coûte cher en tokens, noie le signal pertinent dans le bruit, et se vide quand même à la session suivante.
Plus de copier-coller n'est pas la solution. C'est le symptôme poussé à l'extrême.
La vraie solution : une mémoire que l'IA interroge
Inverse le sens du flux. Au lieu de pousser ton contexte vers l'IA à la main, laisse l'IA tirer ce dont elle a besoin dans ta connaissance.
C'est le principe d'une mémoire externe interrogeable : ta connaissance vit à un endroit stable, et l'assistant retrouve, pour chaque question, le passage pertinent. Tu ne colles plus rien ; tu poses ta question, l'assistant consulte ta mémoire et répond avec le bon contexte, sourcé. Le mécanisme, c'est le RAG local ; le tuyau qui le relie à ton assistant, c'est MCP.
Smart Brain : ta connaissance retrouvée à la demande
Smart Brain est cette mémoire, en local. Il indexe ta connaissance et, plutôt que de tout réinjecter, sert le passage juste : recherche hybride (BM25 plus embeddings Qwen3), graphe des liens, reranking cross-encoder, avec une précision mesurée (Hit@1 de 0,909, Hit@5 de 0,98). Le détail est sur la page technique.
Le résultat concret : tu arrêtes de recoller. Ta décision d'il y a trois semaines, ta convention de nommage, ta note d'échec, tout reste accessible à ton assistant sans que tu aies à t'en souvenir ni à le retrouver toi-même. Et comme tout tourne sur ta machine, ta connaissance ne part nulle part.
Reprendre le temps que l'amnésie te prend
Le copier-coller de contexte est l'impôt invisible de l'IA sans mémoire. Tu le paies en minutes, en oublis et en charge mentale, à chaque session. Une mémoire que ton assistant interroge te rend ce temps.
Si tu veux brancher cette mémoire sur ta propre connaissance, vois comment donner une mémoire persistante à Claude Code, la documentation pour l'installation, et les offres qui incluent Smart Brain.