C'est quoi un embedding ?

Un embedding est la représentation d'un texte sous forme de vecteur de nombres, calculée par un modèle, de sorte que des textes au sens proche aient des vecteurs proches. Ça permet de mesurer la proximité de sens entre ta question et tes notes.

Pourquoi les embeddings et pas une simple recherche par mot-clé ?

La recherche par mot-clé exige le terme exact ; les embeddings retrouvent par le sens, même si la formulation diffère. Les deux sont complémentaires : un bon retrieval combine embeddings et BM25 dans une recherche hybride.

Les embeddings expliqués : comment l'IA comprend le sens

Comment une IA peut-elle retrouver une idée que tu as notée avec des mots différents de ta question ? La réponse tient en un mot : les embeddings. C'est la brique qui permet de chercher par le sens plutôt que par les caractères exacts. Voici une explication simple, sans équations, de ce qui se passe vraiment.

Le problème : retrouver par le sens

La recherche classique, par mot-clé, a une faiblesse connue : elle suppose que tu te rappelles du terme exact. Si ta note parle de « contexte persistant » mais que tu cherches « mémoire longue », le mot-clé rate, alors que c'est la même idée.

Or en pratique, la même notion se formule de dix façons. Une mémoire utile doit retrouver par l'intention, pas seulement par les mots. C'est exactement ce que les embeddings rendent possible.

Qu'est-ce qu'un embedding

Un embedding, c'est la traduction d'un texte en une liste de nombres, un vecteur. Ce vecteur est calculé par un modèle entraîné de sorte qu'une propriété simple soit vraie : deux textes au sens proche ont des vecteurs proches.

Tu peux te représenter chaque texte comme un point dans un grand espace. Les textes qui parlent de la même chose se retrouvent voisins, ceux qui parlent de choses différentes s'éloignent. La distance entre deux vecteurs devient une mesure de proximité de sens.

Comment l'IA comprend le sens

Le modèle n'a pas de compréhension au sens humain. Mais en ayant vu énormément de texte, il a appris à placer dans le même voisinage les formulations qui jouent le même rôle. « Biais de confirmation » et « tendance à privilégier les preuves qui confirment » finissent proches, même sans mot commun.

Quand tu poses une question, le système calcule son embedding, puis cherche les chunks de tes notes dont les vecteurs sont les plus proches. Il retrouve ainsi par le sens, pas par la lettre.

Le modèle utilisé : Qwen3, en local

Concrètement, Smart Brain calcule ces embeddings avec Qwen3-Embedding-0.6B, de dimension 1024, exécuté en local via Ollama. « Dimension 1024 » veut simplement dire que chaque texte est représenté par un vecteur de 1024 nombres : assez riche pour capturer des nuances de sens.

Le point important : ce calcul tourne sur ta machine. Tes notes ne sont pas envoyées à un service tiers pour être vectorisées. On développe l'intérêt du local dans IA 100% locale.

Embeddings et BM25 : complémentaires

Les embeddings ont un angle mort : ils captent le sens mais peuvent rater un terme rare et précis, un acronyme, un nom de fichier, là où la correspondance exacte compte. C'est le rôle de BM25, la recherche par termes exacts.

Un bon retrieval ne choisit pas : il combine les deux dans une recherche hybride, embeddings pour le sens et BM25 pour la lettre, puis fusionne les scores. On détaille cette combinaison dans le retrieval hybride.

La brique qui capte l'intention

Les embeddings sont ce qui transforme un tas de notes en une mémoire interrogeable par l'idée. Sans eux, tu serais condamné à te souvenir du mot exact ; avec eux, tu décris, et le système retrouve.

Ils s'appliquent à des chunks bien découpés, et alimentent le pipeline complet de Smart Brain. Pour les chiffres mesurés, vois la page technique.