Quelle est la meilleure façon de donner du contexte à une IA ?

Pour un besoin ponctuel, coller un fichier ou écrire un prompt système suffit. Pour une connaissance qui grandit et évolue, une mémoire interrogeable (un RAG) est la meilleure option : elle sert le bon passage à la demande sans tout charger.

Pourquoi ne pas tout mettre dans le prompt système ?

Un prompt système est figé, limité en taille et coûteux à charger à chaque appel. Au-delà d'un petit socle stable, il vaut mieux une mémoire externe qui retrouve dynamiquement ce qui est pertinent pour chaque question.

Donner du contexte à ton IA : fichier, prompt ou mémoire ?

Quand ton IA répond à côté, c'est presque toujours un problème de contexte : elle ne sait pas ce que tu sais. Tu as trois façons de le lui donner, et elles ne se valent pas selon l'échelle. Voici les trois, leurs forces, leurs limites, et celle qui tient la distance.

Option 1 : coller un fichier

La méthode la plus directe : tu copies un fichier, une note, un bout de doc dans la conversation. L'assistant a le contexte sous les yeux.

C'est parfait pour du ponctuel : une question sur un document précis, ici et maintenant. Mais ça montre vite ses limites. Tu colles à la main, tu oublies toujours une partie, et ce que tu as collé devient périmé dès que ta connaissance évolue. À l'échelle d'un projet, ce copier-coller permanent ne scale pas.

Option 2 : écrire un prompt système

Plus durable en apparence : tu mets ton contexte dans un prompt système, chargé à chaque conversation. Tes conventions, ton style, des règles.

Utile pour un petit socle stable : qui tu es, comment tu veux les réponses. Mais le prompt système a trois plafonds :

il est figé : tu le maintiens à la main, et il vieillit ;
il est limité en taille : impossible d'y mettre toute ta connaissance ;
il est coûteux : chargé à chaque appel, il pèse en tokens.

On développe le rôle exact du prompt système dans injecter ta mémoire dans le prompt système. En résumé : bon pour un cadre stable, pas pour une mémoire qui grandit.

Option 3 : brancher une mémoire interrogeable

La troisième voie inverse la logique. Au lieu de pousser ton contexte (fichier ou prompt), tu laisses l'IA tirer ce dont elle a besoin dans une mémoire externe.

Concrètement, ta connaissance est indexée par un RAG local, et pour chaque question, le système retrouve le passage pertinent, sourcé. Tu ne charges pas tout : tu sers le bon extrait, à la demande. On explique le montage dans comment donner une mémoire à un agent IA.

Comparaison à l'échelle

Critère	Fichier collé	Prompt système	Mémoire interrogeable
Mise en place	immédiate	simple	technique
Taille gérable	petite	limitée	tout ton vault
À jour	non, figé	maintenu à la main	oui, automatique
Coût en tokens	selon ce que tu colles	payé à chaque appel	seul le passage utile
Sourcé	non	non	oui

Le constat est net : fichier et prompt conviennent au petit et au stable ; dès que la connaissance grandit et évolue, seule la mémoire interrogeable tient.

Les trois sont complémentaires

Ce n'est pas tout ou rien. Un bon usage combine : un prompt système pour le socle stable, et une mémoire interrogeable pour le fond mouvant. Le fichier collé reste pratique pour un cas vraiment ponctuel.

Ce qui change, c'est où tu mets ta connaissance de fond : pas dans des copier-coller jetables, mais dans une mémoire que ton assistant consulte. C'est ce qui le fait passer d'un outil amnésique à un outil qui connaît ton contexte.

Passer à la mémoire

Si tu en es au stade où tu recolles ton contexte à chaque session, c'est le signe qu'il te faut une mémoire. Smart Brain la fournit en local, interrogeable depuis Claude Code, mesurée (Hit@1 de 0,909, voir la page technique). Les offres l'incluent.

Donner du contexte, ce n'est pas en coller toujours plus. C'est arrêter de coller, et laisser ton IA puiser dans ta mémoire.