« Une IA qui connaît ton code. » La formule est séduisante et un peu trompeuse, parce qu'elle laisse imaginer un assistant qui aurait tout appris par cœur. Ce n'est pas comme ça que ça marche, et c'est tant mieux : le vrai mécanisme est plus simple, plus honnête et plus utile.
« Connaître ton code » ne veut pas dire l'avoir mémorisé
Un modèle de langage ne mémorise pas ton projet. Après son entraînement, ses connaissances sont figées et générales. Il ne retient rien de tes sessions : on l'explique dans pourquoi ton IA oublie tout.
Donc quand on dit qu'une IA « connaît » ton code, ça ne peut pas vouloir dire qu'elle l'a appris. Ça veut dire qu'elle peut y accéder au bon moment. La différence est fondamentale.
Le mécanisme : retrieval, pas mémorisation
Le mot juste est retrieval : retrouver. Au lieu de demander au modèle ce qu'il croit savoir, on lui fournit le passage exact tiré de ta connaissance, juste avant qu'il réponde.
Le flux est simple :
- ta connaissance (code, décisions, notes) est indexée dans une mémoire externe ;
- tu poses une question ;
- le système retrouve les passages pertinents pour cette question précise ;
- le modèle répond en s'appuyant dessus, en citant la source.
C'est ce qu'on appelle un RAG local. L'IA ne sait pas ton code par cœur ; elle sait où le chercher, et elle le cite.
Ce que ton IA va vraiment retrouver
Erreur courante : croire que « connaître ton code » se limite aux fichiers source. Le code, ton assistant peut souvent le lire dans ton éditeur. Ce qui lui manque, c'est tout ce qui n'est pas dans le code :
- les décisions d'architecture et leur justification ;
- les conventions d'équipe, les choix de nommage, les patterns maison ;
- les pourquoi : pourquoi telle option a été écartée, pourquoi tel compromis ;
- l'historique : ce qui a déjà été tenté, ce qui a échoué.
Cette connaissance vit dans tes notes et tes décisions, pas dans les fonctions. Une IA qui « connaît ton code » au sens utile, c'est une IA qui peut consulter ce contexte-là, celui qui te fait habituellement perdre du temps à réexpliquer.
Pourquoi le local change la donne
Pour qu'une IA accède à ton code et à tes décisions, il faut bien que cette connaissance soit lisible quelque part. La question devient : où, et qui y a accès ?
En local, la réponse est nette : ta connaissance reste sur ta machine. Le retrieval tourne chez toi, via Ollama et une base vectorielle locale ; rien ne part dans un cloud. Pour du code propriétaire et des décisions internes, ce n'est pas un confort, c'est une condition. On développe ce point dans RAG local vs RAG cloud.
Smart Brain en pratique
Smart Brain incarne ce mécanisme. Il rend ta connaissance interrogeable et sert le bon passage, pas juste le morceau le plus proche, grâce à trois étages : recherche hybride (BM25 plus embeddings Qwen3), graphe des liens entre notes, et reranking par cross-encoder. La qualité est mesurée : Hit@1 de 0,909, Hit@5 de 0,98, sur un vault d'environ 23 500 chunks. Le détail est sur la page technique.
Le résultat est toujours sourcé. Tu ne reçois pas un souvenir reconstitué, mais le passage exact de ta connaissance, avec sa provenance, vérifiable d'un coup d'oeil.
Une formule honnête
« Une IA qui connaît ton code » est une bonne promesse à condition de la comprendre : pas une IA qui a tout appris, mais une IA qui sait où chercher dans ce que tu sais déjà, et qui te le cite. C'est exactement ce que fait une mémoire externe bien branchée.
Pour la suite, vois comment donner cette mémoire à Claude Code, ou la différence entre mémoire long terme et fenêtre de contexte.