RAG local

RAG local : le moteur qui donne une mémoire à ton IA, sans cloud

Le RAG local, c'est le moteur qui retrouve le bon passage dans ta connaissance et le fournit à ton IA, sans envoyer tes données dans un cloud : c'est ce qui transforme tes notes et ton code en mémoire interrogeable. Ce silo couvre le cœur technique : comment on découpe la connaissance en chunks, comment on la retrouve par embeddings et par BM25, comment un knowledge graph et un reranking affinent le résultat, et comment tout ça tourne en local avec Ollama et une base vectorielle.

Articles du silo

Retrieval

Les embeddings expliqués : comment l'IA comprend le sens

Les embeddings transforment un texte en vecteur de sens, ce qui permet de retrouver par l'idée et pas seulement par les mots. Explication claire, avec le modèle local utilisé par Smart Brain.

28 juin 20263 min

RAG local

Le chunking expliqué : découper tes notes pour le retrieval

Le chunking découpe tes notes en morceaux interrogeables. Voici pourquoi c'est nécessaire, le compromis sur la taille des chunks, et comment Smart Brain sert le passage plutôt que le fichier.

28 juin 20263 min

RAG local

Qu'est-ce qu'un RAG local et pourquoi héberger ton propre Smart Brain

Un RAG local interroge tes notes sans cloud. Voici ce que c'est, comment ça marche, et pourquoi héberger ton propre Smart Brain change ton rapport à la connaissance.

26 juin 20263 min

Retrieval

Retrieval hybride : embeddings, BM25 et knowledge graph expliqués

La plupart des RAG renvoient le chunk le plus proche et espèrent. Le retrieval hybride empile embeddings, BM25 et graphe pour servir le bon passage. Voici comment.

22 juin 20262 min

Reranking

Reranking cross-encoder : servir le bon passage, pas le fichier entier

Le retrieval ramène de bons candidats, le reranking choisit le meilleur. Comment un cross-encoder sert le passage exact et réduit les tokens.

18 juin 20262 min