Pourquoi mon IA ne se souvient pas de nos échanges précédents ?

Parce qu'un assistant n'a qu'une fenêtre de contexte, vidée à chaque nouvelle session. Sans mémoire externe qui stocke et retrouve ta connaissance, il repart de zéro à chaque fois.

Comment donner une mémoire persistante à une IA ?

En branchant une mémoire externe interrogeable : un système qui indexe ta connaissance (code, décisions, notes) et retrouve le bon passage à la demande. Un RAG local joue ce rôle, sur ta machine, sans cloud.

Pourquoi ton IA oublie tout entre deux sessions (et ce que ça te coûte)

Tu ouvres une nouvelle session avec ton assistant IA. Tu lui réexpliques sur quoi tu travailles, les choix que tu as déjà tranchés, les conventions de ton projet. Il répond bien. Demain, tu recommences depuis le début. Ton outil le plus puissant est aussi le plus amnésique, et ce n'est pas un défaut passager : c'est son architecture.

L'amnésie n'est pas un bug, c'est l'architecture

Un modèle de langage ne « se souvient » de rien. À chaque session, il lit une fenêtre de contexte, le texte que tu lui fournis maintenant, et génère une réponse à partir de ça. Quand la session se ferme, cette fenêtre disparaît. Il ne reste aucune trace de ce que tu lui as appris.

Ce que le modèle a appris pendant son entraînement est figé et général. Il ne connaît ni ton code, ni tes décisions, ni la manière dont ton équipe fait les choses. La seule chose qu'il sait de toi, c'est ce que tu colles dans la fenêtre, à l'instant. Ferme l'onglet, et tu repars d'une page blanche.

C'est pour ça qu'augmenter la taille de la fenêtre ne résout pas le problème de fond. Une fenêtre plus grande, c'est un bureau plus large, pas une mémoire. On détaille cette distinction dans mémoire long terme vs fenêtre de contexte.

Ce que l'oubli te coûte vraiment

L'amnésie de ton IA a un prix concret, même si tu ne le factures jamais.

Du temps de recontextualisation. Chaque session démarre par un rituel : tu recolles l'architecture, tu rappelles la décision d'hier, tu réexpliques pourquoi tel choix. Multiplié par toutes tes sessions, ça représente des heures par semaine passées à répéter ce que tu as déjà dit.
Des décisions reperdues. Tu as tranché un point délicat il y a deux semaines. Ton IA ne s'en souvient pas, te propose l'option que tu avais écartée, et tu refais le débat. La connaissance existait, elle n'était juste pas accessible au bon moment.
Des réponses hors-sol. Sans ton contexte, l'assistant répond dans le vide, avec des conventions génériques qui ne sont pas les tiennes. Tu passes plus de temps à corriger qu'à avancer.
De la charge mentale. C'est toi qui sers de mémoire. Tu retiens où sont les décisions, ce qui a été tranché, ce qu'il faut réinjecter. Cette charge devrait être portée par l'outil, pas par toi.

Le copier-coller permanent de ton contexte est le symptôme le plus visible de ce coût. On explique pourquoi ce réflexe ne passe pas à l'échelle.

À quoi ressemble une vraie mémoire pour ton IA

Une mémoire persistante, ce n'est pas une fenêtre plus grande. C'est un système externe à la conversation, qui survit à la fermeture de l'onglet et que l'assistant peut interroger à la demande.

Trois propriétés la définissent :

Elle persiste. Ta connaissance est stockée hors de la session : ton code, tes décisions, tes notes, tes conventions. Elle reste là quand la conversation se ferme.
Elle est interrogeable. L'assistant ne lit pas tout à chaque fois (ce serait coûteux et bruyant). Il retrouve le passage pertinent pour ta question, et seulement celui-là.
Elle est sourcée. Tu vois d'où vient l'information. Pas un souvenir flou reconstitué, mais le passage exact de ta propre connaissance, vérifiable.

C'est exactement le rôle d'un RAG local : retrouver le bon passage dans ta connaissance et le fournir au modèle, sur ta machine.

Comment Smart Brain donne cette mémoire à ton IA

Smart Brain est le moteur de mémoire d'Artefact Neural. Il prend ta connaissance, tes notes, tes décisions, ta documentation, et la rend interrogeable en langage naturel, en local.

Concrètement, il ne sert pas juste le morceau de texte le plus proche de ta question. Il empile trois étages pour servir le bon passage :

une recherche hybride qui combine BM25 (les termes exacts, un acronyme, un nom de fichier) et des embeddings Qwen3 (le sens), pour ne rien rater ;
un graphe qui suit tes liens entre notes et fait remonter le contexte voisin ;
un reranking par cross-encoder qui replace le passage le plus juste en tête.

Le tout est mesuré, pas promis sur parole : Hit@1 de 0,909 et Hit@5 de 0,98 sur des références datées, sur un vault d'environ 23 500 chunks. Les détails sont sur la page technique.

Le point important : tout tourne sur ta machine, via Ollama et une base vectorielle locale. Ta mémoire ne part pas dans un cloud. C'est ta connaissance qui devient le contexte de ton IA, pas l'inverse.

L'amnésie n'est pas une fatalité

Ton IA n'a pas besoin d'être plus intelligente. Elle a besoin de se souvenir de ce que tu sais déjà. Le jour où ton assistant connaît ton code, tes décisions et ton contexte sans que tu aies à les recoller, tu arrêtes de payer l'impôt de l'amnésie.

C'est tout l'objet de ce silo. Pour la suite, vois comment donner une mémoire persistante à Claude Code, ou comment un RAG local sert de mémoire à un agent de code. Et si tu veux brancher Smart Brain sur ta propre connaissance, regarde les offres.