Quand ton IA répond à côté, c'est presque toujours un problème de contexte : elle ne sait pas ce que tu sais. Tu as trois façons de le lui donner, et elles ne se valent pas selon l'échelle. Voici les trois, leurs forces, leurs limites, et celle qui tient la distance.
Option 1 : coller un fichier
La méthode la plus directe : tu copies un fichier, une note, un bout de doc dans la conversation. L'assistant a le contexte sous les yeux.
C'est parfait pour du ponctuel : une question sur un document précis, ici et maintenant. Mais ça montre vite ses limites. Tu colles à la main, tu oublies toujours une partie, et ce que tu as collé devient périmé dès que ta connaissance évolue. À l'échelle d'un projet, ce copier-coller permanent ne scale pas.
Option 2 : écrire un prompt système
Plus durable en apparence : tu mets ton contexte dans un prompt système, chargé à chaque conversation. Tes conventions, ton style, des règles.
Utile pour un petit socle stable : qui tu es, comment tu veux les réponses. Mais le prompt système a trois plafonds :
- il est figé : tu le maintiens à la main, et il vieillit ;
- il est limité en taille : impossible d'y mettre toute ta connaissance ;
- il est coûteux : chargé à chaque appel, il pèse en tokens.
On développe le rôle exact du prompt système dans injecter ta mémoire dans le prompt système. En résumé : bon pour un cadre stable, pas pour une mémoire qui grandit.
Option 3 : brancher une mémoire interrogeable
La troisième voie inverse la logique. Au lieu de pousser ton contexte (fichier ou prompt), tu laisses l'IA tirer ce dont elle a besoin dans une mémoire externe.
Concrètement, ta connaissance est indexée par un RAG local, et pour chaque question, le système retrouve le passage pertinent, sourcé. Tu ne charges pas tout : tu sers le bon extrait, à la demande. On explique le montage dans comment donner une mémoire à un agent IA.
Comparaison à l'échelle
| Critère | Fichier collé | Prompt système | Mémoire interrogeable |
|---|---|---|---|
| Mise en place | immédiate | simple | technique |
| Taille gérable | petite | limitée | tout ton vault |
| À jour | non, figé | maintenu à la main | oui, automatique |
| Coût en tokens | selon ce que tu colles | payé à chaque appel | seul le passage utile |
| Sourcé | non | non | oui |
Le constat est net : fichier et prompt conviennent au petit et au stable ; dès que la connaissance grandit et évolue, seule la mémoire interrogeable tient.
Les trois sont complémentaires
Ce n'est pas tout ou rien. Un bon usage combine : un prompt système pour le socle stable, et une mémoire interrogeable pour le fond mouvant. Le fichier collé reste pratique pour un cas vraiment ponctuel.
Ce qui change, c'est où tu mets ta connaissance de fond : pas dans des copier-coller jetables, mais dans une mémoire que ton assistant consulte. C'est ce qui le fait passer d'un outil amnésique à un outil qui connaît ton contexte.
Passer à la mémoire
Si tu en es au stade où tu recolles ton contexte à chaque session, c'est le signe qu'il te faut une mémoire. Smart Brain la fournit en local, interrogeable depuis Claude Code, mesurée (Hit@1 de 0,909, voir la page technique). Les offres l'incluent.
Donner du contexte, ce n'est pas en coller toujours plus. C'est arrêter de coller, et laisser ton IA puiser dans ta mémoire.