RAG local : le moteur qui donne une mémoire à ton IA, sans cloud
Le RAG local, c'est le moteur qui retrouve le bon passage dans ta connaissance et le fournit à ton IA, sans envoyer tes données dans un cloud : c'est ce qui transforme tes notes et ton code en mémoire interrogeable. Ce silo couvre le cœur technique : comment on découpe la connaissance en chunks, comment on la retrouve par embeddings et par BM25, comment un knowledge graph et un reranking affinent le résultat, et comment tout ça tourne en local avec Ollama et une base vectorielle.
Articles du silo
Les embeddings expliqués : comment l'IA comprend le sens
Les embeddings transforment un texte en vecteur de sens, ce qui permet de retrouver par l'idée et pas seulement par les mots. Explication claire, avec le modèle local utilisé par Smart Brain.
Le chunking expliqué : découper tes notes pour le retrieval
Le chunking découpe tes notes en morceaux interrogeables. Voici pourquoi c'est nécessaire, le compromis sur la taille des chunks, et comment Smart Brain sert le passage plutôt que le fichier.
Qu'est-ce qu'un RAG local et pourquoi héberger ton propre Smart Brain
Un RAG local interroge tes notes sans cloud. Voici ce que c'est, comment ça marche, et pourquoi héberger ton propre Smart Brain change ton rapport à la connaissance.
Retrieval hybride : embeddings, BM25 et knowledge graph expliqués
La plupart des RAG renvoient le chunk le plus proche et espèrent. Le retrieval hybride empile embeddings, BM25 et graphe pour servir le bon passage. Voici comment.
Reranking cross-encoder : servir le bon passage, pas le fichier entier
Le retrieval ramène de bons candidats, le reranking choisit le meilleur. Comment un cross-encoder sert le passage exact et réduit les tokens.