On lit « RAG » et « mémoire IA » comme s'ils étaient interchangeables. Ils sont liés, mais ce ne sont pas deux noms pour la même chose. Confondre l'outil et le but mène à des malentendus : on attend d'un RAG qu'il « se souvienne » alors qu'il faut le concevoir comme une mémoire. Clarifions.
Le RAG, un mécanisme
RAG veut dire retrieval augmented generation : augmenter la génération par de la récupération. C'est une technique. Étape par étape : une question arrive, le système retrouve les passages pertinents dans une source, et les donne au modèle avant qu'il réponde.
Le RAG décrit donc le comment : comment on va chercher la bonne information et on la fournit au modèle. On en détaille la mécanique dans qu'est-ce qu'un RAG local.
La mémoire IA, un usage
La mémoire IA décrit un résultat : un assistant qui dispose d'un contexte persistant, qu'il peut consulter d'une session à l'autre. C'est le besoin de fond, celui qu'on pose dans pourquoi ton IA oublie tout.
Une mémoire suppose deux propriétés que le RAG seul n'impose pas : la persistance (la connaissance dure dans le temps) et la pertinence pour toi (c'est ta connaissance, pas un corpus quelconque). La mémoire est donc un usage particulier du RAG, orienté vers ton contexte durable.
L'un est l'outil, l'autre le but
L'analogie : le RAG est un moteur de recherche, la mémoire est une bibliothèque personnelle. Tu peux utiliser un moteur de recherche pour plein de choses ; quand tu l'appliques à ta propre connaissance, persistante et organisée, tu obtiens une mémoire.
Concrètement :
- tout RAG n'est pas une mémoire (il peut interroger une base ponctuelle, sans notion de durée ni de « toi ») ;
- mais une mémoire IA bien faite s'appuie presque toujours sur un RAG, parce qu'il faut retrouver le bon passage sans tout relire.
Pourquoi la distinction compte
Voir le RAG comme une simple recherche conduit à de mauvaises attentes. On lui reproche de ne pas « comprendre » ou de ne pas « apprendre ». Mais ce n'est pas son rôle : il retrouve. C'est en le pensant comme la brique d'une mémoire qu'on l'utilise bien.
À l'inverse, viser une mémoire sans un bon retrieval donne une mémoire inutile : si le système ramène le mauvais passage, l'assistant raisonne sur du bruit. La qualité de la mémoire dépend de la qualité du RAG, c'est pourquoi le retrieval de Smart Brain est mesuré (Hit@1 de 0,909, Hit@5 de 0,98, voir la page technique). On approfondit ce lien dans comment ton IA retrouve le bon souvenir.
Le cas d'une mémoire locale
Quand le RAG tourne en local et indexe ta connaissance persistante, tu obtiens une mémoire IA au sens fort : à jour, sourcée, privée. C'est l'approche de Smart Brain, qui fait du RAG le moteur d'une mémoire pour ton assistant, interrogeable depuis Claude Code via MCP.
Ce qu'il faut retenir
RAG et mémoire IA ne sont pas opposés : l'un sert l'autre. Le RAG est le mécanisme de récupération ; la mémoire est l'usage durable qu'on en fait avec ta connaissance. Tu veux une mémoire ; pour l'obtenir, tu utilises un RAG.
Pour la différence avec l'entraînement, vois RAG vs fine-tuning. Pour passer à la pratique, comment donner une mémoire à un agent IA.