Que signifie vraiment 100% local pour une IA ?

Que tous les composants tournent sur ta machine : embeddings, base vectorielle, retrieval. Rien n'est envoyé à une API distante ni stocké dans un cloud, et il n'y a pas de télémétrie. Tes données ne quittent pas ta machine.

Une IA locale est-elle moins performante qu'une IA cloud ?

Pas par nature. Le retrieval local de Smart Brain est mesuré (Hit@1 de 0,909, Hit@5 de 0,98). La performance dépend du pipeline et des modèles, pas du fait d'être local ou cloud.

IA 100% locale : ce que ça veut dire vraiment

« 100% local » est devenu un argument marketing qu'on colle un peu partout, parfois à tort. Un produit qui calcule une partie en local mais envoie tes données à une API pour le reste n'est pas 100% local. Avant de te fier à l'étiquette, voici la définition stricte, et ce qu'elle implique vraiment.

La définition stricte

Une IA 100% locale, ça veut dire que tous les composants qui touchent à tes données s'exécutent sur ta machine. Pas une partie, pas la plupart : tous. Si une étape envoie ton texte à un serveur distant, l'étiquette tombe.

Pour un système de mémoire comme Smart Brain, les composants concernés sont précis :

le modèle d'embeddings qui vectorise tes notes ;
la base vectorielle qui les stocke et les retrouve ;
le retrieval complet : recherche hybride, graphe, reranking.

Si l'un de ces maillons sortait vers un cloud, ce ne serait plus 100% local.

Ce qui tourne sur ta machine

Concrètement, Smart Brain exécute :

les embeddings via Ollama, avec un modèle ouvert (Qwen3-Embedding-0.6B), voir les embeddings expliqués ;
le stockage et la recherche vectorielle via ChromaDB, une base locale ;
le reranking par cross-encoder, localement aussi.

Tout le pipeline vit chez toi. Tes notes sont vectorisées sur ta machine, stockées sur ta machine, retrouvées sur ta machine.

Ce que ça exclut

Le revers de la définition est aussi important que l'endroit. 100% local, ça exclut :

les API distantes : aucun appel à un service tiers pour embedder ou répondre ;
le stockage cloud : ton index ne part pas chez un fournisseur ;
la télémétrie : aucune donnée d'usage envoyée, pas de traçage.

C'est cette exclusion qui rend la confidentialité structurelle plutôt que contractuelle. Tu ne fais pas confiance à une politique de confidentialité ; il n'y a tout simplement rien qui sort. On compare cette approche au cloud dans RAG local vs RAG cloud et mémoire IA locale vs cloud.

Local ne veut pas dire dégradé

Un préjugé tenace : le local serait un compromis sur la qualité. C'est faux par nature. La performance d'un retrieval dépend de son pipeline et de ses modèles, pas du fait qu'il tourne chez toi ou ailleurs.

Smart Brain le montre par la mesure : sur le vault de référence, Hit@1 de 0,909 et Hit@5 de 0,98, en restant entièrement local. Les chiffres sont sur la page technique, et ils sont annoncés tels quels, sans 100% magique.

Les limites honnêtes du local

Le local a un coût réel qu'il serait malhonnête de cacher. Tu héberges et exécutes le système sur ta machine, donc tu dépends de ton matériel, et la mise en place demande un profil technique. Ce n'est pas un produit grand public en deux clics.

C'est le compromis assumé : un peu plus d'effort à l'installation, en échange d'une confidentialité par conception et d'un coût qui ne dérive pas (pas d'abonnement, pas de facturation au token).

L'étiquette qui veut dire quelque chose

« 100% local » n'a de valeur que si c'est vrai de bout en bout. Vérifie que rien ne sort, à aucune étape. Quand c'est le cas, tu obtiens une garantie que le cloud ne peut pas offrir : ta connaissance reste à toi.

Pour les implications réglementaires, vois RGPD et IA. Pour le moteur, le silo RAG local.