Semble : Recherche de code IA avec 98 % moins de tokens

Semble est une bibliothèque de recherche de code rapide et économe en tokens, conçue spécifiquement pour les agents de codage IA comme Claude Code, Cursor, Codex et OpenCode. Elle renvoie des extraits de code pertinents à partir de requêtes en langage naturel ou de code, en utilisant ~98 % de tokens en moins que l'approche de repli typique grep+read.

Comment ça marche

Semble combine des embeddings statiques Model2Vec (avec leur propre modèle potion-code-16M) et BM25, fusionnés via RRF et réordonnancés avec des signaux adaptés au code. Tous les calculs s'exécutent sur CPU — pas de GPU, pas de clés API, pas de services externes. L'indexation d'un dépôt moyen prend ~250 ms, et les requêtes s'effectuent en ~1,5 ms sur CPU.

Fonctionnalités clés

Économe en tokens : 98 % de tokens en moins que grep+read — ne renvoie que les extraits pertinents.
Rapide : ~250 ms pour indexer un dépôt typique, ~1,5 ms par requête (les très grands dépôts peuvent prendre plus de temps).
Précis : 0,854 NDCG@10 sur leur benchmark d'environ 1250 paires requête/document réparties sur 63 dépôts et 19 langages — 99 % de la meilleure configuration transformer (137M paramètres) avec une indexation ~200x plus rapide et des requêtes ~10x plus rapides.
Zéro configuration : Aucune clé API, GPU ou service externe requis.
Serveur MCP : Prêt à l'emploi pour Claude Code, Cursor, Codex, OpenCode et tout agent compatible MCP.
Local et distant : Passez un chemin local ou une URL git. Les index sont mis en cache par session et mis à jour automatiquement lors des modifications de fichiers.

Installation et configuration

Serveur MCP (recommandé pour les agents)

Nécessite uv d'installé. Pour Claude Code :

claude mcp add semble -s user -- uvx --from "semble[mcp]" semble

Pour Codex, ajoutez à ~/.codex/config.toml :

[mcp_servers.semble]
command = "uvx"
args = ["--from", "semble[mcp]", "semble"]

Pour OpenCode, ajoutez à ~/.opencode/config.json :

{
  "mcp": {
    "semble": {
      "type": "local",
      "command": ["uvx", "--from", "semble[mcp]", "semble"]
    }
  }
}

Pour Cursor, ajoutez à ~/.cursor/mcp.json ou .cursor/mcp.json :

{
  "mcpServers": {
    "semble": {
      "command": "uvx",
      "args": ["--from", "semble[mcp]", "semble"]
    }
  }
}

Intégration Bash (alternative)

Installez avec pip ou uv, puis ajoutez l'extrait de recherche de code à AGENTS.md ou CLAUDE.md :

pip install semble
uv tool install semble

Puis dans AGENTS.md :

## Recherche de code
Utilisez `semble search` pour trouver du code en décrivant ce qu'il fait ou en nommant un symbole/identifiant, au lieu de grep :
```bash
semble search "flux d'authentification" ./mon-projet
```

Outils MCP

Le serveur MCP expose deux outils :

search — Recherche dans une base de code avec une requête en langage naturel ou en code. Passez repo comme chemin de répertoire local ou URL git https://.
find_related — Étant donné un chemin de fichier et un numéro de ligne, renvoie les extraits sémantiquement similaires au code à cet emplacement.

📖 Lire la source complète : HN AI Agents

Semble : Recherche de code pour agents IA utilisant 98 % de tokens en moins que grep+read

Comment ça marche

Fonctionnalités clés

Installation et configuration

Outils MCP

👀 See Also

Le Référentiel de Créativité Humaine : Distinguer Convergence et Divergence dans l'Évaluation de la Créativité de l'IA

Nakkas MCP Server Génère des SVGs Animés à Partir de Descriptions IA

Logseq Brain v0.6.0 : Plugin de mémoire persistante pour Claude Code avec journal de bord et lectures ciblées par section

Sylve : Un plan de gestion FreeBSD pour la virtualisation, les conteneurs et le stockage