Au-dessus du retrieval, Smart Brain orchestre six agents. Chacun a un rôle précis et tourne sur un modèle adapté à sa tâche, du moins cher au plus capable. L'idée : ne pas payer un gros modèle pour un travail que fait un petit, et garder une qualité contrôlée de bout en bout.
Le pipeline
Chaque mission traverse la même chaîne : estimation, retrieval sourcé, exécution, audit qualité, jugement, capitalisation.
Les rôles
- accountant (Haiku). Estime le budget de tokens et pose les garde-fous de coût. Il peut stopper une mission qui dérape.
- librarian (Sonnet). Récupère le contexte depuis le vault, sourcé, avec un tag de confiance. Il ne paraphrase jamais de mémoire : toute information factuelle est sourcée.
- builder (Opus). Exécute la tâche, écrit et modifie le code ou le contenu, et produit un diff.
- auditor (Opus). Gardien de la qualité. Il relit le diff contre la demande pour détecter les régressions et les dérives, et tranche par un verdict.
- challenger (Opus). Le juge du goût. Sur les sorties visuelles, il compare au niveau de référence et refuse tant qu'un critère critique n'est pas vert.
- reflector (Haiku). Capitalise en fin de mission, met à jour la mémoire et ferme le journal avec les tokens réellement consommés.
Pourquoi des modèles différenciés
Un seul gros modèle pour tout, c'est cher et lent. Une cascade Haiku vers Sonnet vers Opus place la puissance là où elle compte (l'exécution, l'audit, le jugement) et garde le reste léger (l'estimation, la capitalisation). Tu obtiens une qualité élevée à un coût maîtrisé.
Sourcé, toujours
Le fil conducteur des six agents est la traçabilité. Le contexte vient du retrieval sourcé décrit dans les trois étages, et chaque étape laisse une trace vérifiable. C'est ce qui distingue une orchestration sérieuse d'un simple enchaînement d'appels.