Donner une mémoire à ton IA, c'est-à-dire un contexte persistant qu'elle peut interroger, peut se faire de deux manières : en local, sur ta machine, ou dans le cloud, chez un fournisseur. Des outils comme Mem ou Rewind représentent l'approche cloud ; un RAG local comme Smart Brain représente l'autre. Le choix n'est pas une question de mode, mais d'axes de fond qui ne périment pas.
Deux façons de donner une mémoire à ton IA
Les deux approches répondent au même besoin : ton IA oublie tout entre les sessions, comme on l'explique dans pourquoi ton IA oublie tout, et tu veux une mémoire externe qui survive aux conversations.
Là où elles divergent, c'est sur où vit cette mémoire et qui la contrôle. C'est cet axe, plus que la liste des fonctionnalités du moment, qui détermine ce que tu gagnes et ce que tu cèdes.
L'axe qui ne périme pas : où vivent tes données
Les fonctionnalités d'un produit changent vite ; sa nature, non. Une solution cloud, par conception, traite et stocke ta connaissance sur un serveur tiers. Une solution locale, par conception, la garde sur ta machine. Tout le reste découle de là.
- Cloud : tes données partent chez un fournisseur. C'est ce qui rend ces outils simples à démarrer (rien à héberger), mais ça implique de faire confiance à un tiers pour des notes potentiellement sensibles.
- Local : tes données restent chez toi. C'est plus exigeant à mettre en place, mais la confidentialité est garantie par l'architecture, pas par une promesse.
Les solutions cloud (Mem, Rewind), prudemment
Des produits comme Mem ou Rewind proposent une mémoire IA hébergée. Leur force est généralement la simplicité : tu démarres vite, sans installation technique, et la mémoire est accessible depuis leurs applications. Leurs fonctionnalités exactes évoluent vite, donc vérifie leur documentation à jour plutôt que de te fier à une description figée.
Ce qui ne change pas, c'est le modèle : tes données sont hébergées, et l'accès passe généralement par un abonnement récurrent. Pour certains usages, ce compromis est parfaitement acceptable. Pour du code propriétaire, des notes clients ou de la recherche non publiée, il l'est moins.
La mémoire locale : confidentialité, coût stable, contrôle
L'approche locale, celle de Smart Brain, inverse les compromis :
- Confidentialité par conception. Le retrieval tourne sur ta machine (Ollama plus base vectorielle ChromaDB). Rien ne sort, aucune télémétrie. On détaille l'argument dans RAG local vs RAG cloud.
- Coût stable. Pas d'abonnement, pas de facturation au token. Le modèle d'Artefact Neural est un paiement unique : tu héberges, tu exécutes.
- Sources citées. Smart Brain sert le passage exact avec son origine, vérifiable. Tu ne reçois pas un souvenir reconstitué.
- Contrôle des composants. Tu choisis l'embedder, le reranker, les réglages. Le système t'appartient.
Et la qualité n'est pas sacrifiée : recherche hybride (BM25 plus embeddings Qwen3), graphe des liens, reranking cross-encoder, avec une précision mesurée (Hit@1 de 0,909, Hit@5 de 0,98). Les chiffres sont sur la page technique.
Comparaison sur les axes de fond
| Axe | Mémoire locale (Smart Brain) | Mémoire cloud (catégorie) |
|---|---|---|
| Où vivent tes données | sur ta machine | sur un serveur tiers |
| Confidentialité | par conception | selon le fournisseur |
| Modèle de coût | paiement unique, pas de token | abonnement récurrent, généralement |
| Sources citées | oui, passage et origine | variable |
| Contrôle des composants | total | limité |
| Mise en route | technique, tu héberges | grand public, généralement |
Les limites du local, honnêtement
Le local a un coût réel : il faut l'installer et l'exécuter. Artefact Neural est un système que tu héberges, pensé pour des utilisateurs à l'aise avec un flux technique (Claude Code, un vault de notes), pas un produit grand public en deux clics. Si tu cherches le démarrage le plus simple possible et que tes données ne sont pas sensibles, une solution cloud peut être un meilleur choix. Reconnaître ça, c'est ce qui rend la comparaison utile.
Pour qui chaque approche
Choisis le cloud si la priorité est la simplicité immédiate et que ta connaissance n'est pas sensible. Choisis le local si tu tiens à ce que tes données ne sortent pas, à un coût qui ne dérive pas, et à un retrieval que tu contrôles et qui cite ses sources.
Si c'est ton cas, la page technique détaille le moteur et les offres incluent Smart Brain. Pour le principe général d'une mémoire IA, vois le silo Mémoire pour ton IA.