Semble : Recherche de code pour agents IA utilisant 98 % de tokens en moins que grep+read

Semble est une bibliothèque de recherche de code rapide et économe en tokens, conçue spécifiquement pour les agents de codage IA comme Claude Code, Cursor, Codex et OpenCode. Elle renvoie des extraits de code pertinents à partir de requêtes en langage naturel ou de code, en utilisant ~98 % de tokens en moins que l'approche de repli typique grep+read.
Comment ça marche
Semble combine des embeddings statiques Model2Vec (avec leur propre modèle potion-code-16M) et BM25, fusionnés via RRF et réordonnancés avec des signaux adaptés au code. Tous les calculs s'exécutent sur CPU — pas de GPU, pas de clés API, pas de services externes. L'indexation d'un dépôt moyen prend ~250 ms, et les requêtes s'effectuent en ~1,5 ms sur CPU.
Fonctionnalités clés
- Économe en tokens : 98 % de tokens en moins que grep+read — ne renvoie que les extraits pertinents.
- Rapide : ~250 ms pour indexer un dépôt typique, ~1,5 ms par requête (les très grands dépôts peuvent prendre plus de temps).
- Précis : 0,854 NDCG@10 sur leur benchmark d'environ 1250 paires requête/document réparties sur 63 dépôts et 19 langages — 99 % de la meilleure configuration transformer (137M paramètres) avec une indexation ~200x plus rapide et des requêtes ~10x plus rapides.
- Zéro configuration : Aucune clé API, GPU ou service externe requis.
- Serveur MCP : Prêt à l'emploi pour Claude Code, Cursor, Codex, OpenCode et tout agent compatible MCP.
- Local et distant : Passez un chemin local ou une URL git. Les index sont mis en cache par session et mis à jour automatiquement lors des modifications de fichiers.
Installation et configuration
Serveur MCP (recommandé pour les agents)
Nécessite uv d'installé. Pour Claude Code :
claude mcp add semble -s user -- uvx --from "semble[mcp]" semble
Pour Codex, ajoutez à ~/.codex/config.toml :
[mcp_servers.semble] command = "uvx" args = ["--from", "semble[mcp]", "semble"]
Pour OpenCode, ajoutez à ~/.opencode/config.json :
{
"mcp": {
"semble": {
"type": "local",
"command": ["uvx", "--from", "semble[mcp]", "semble"]
}
}
}Pour Cursor, ajoutez à ~/.cursor/mcp.json ou .cursor/mcp.json :
{
"mcpServers": {
"semble": {
"command": "uvx",
"args": ["--from", "semble[mcp]", "semble"]
}
}
}Intégration Bash (alternative)
Installez avec pip ou uv, puis ajoutez l'extrait de recherche de code à AGENTS.md ou CLAUDE.md :
pip install semble uv tool install semble
Puis dans AGENTS.md :
## Recherche de code Utilisez `semble search` pour trouver du code en décrivant ce qu'il fait ou en nommant un symbole/identifiant, au lieu de grep : ```bash semble search "flux d'authentification" ./mon-projet ```
Outils MCP
Le serveur MCP expose deux outils :
search— Recherche dans une base de code avec une requête en langage naturel ou en code. Passezrepocomme chemin de répertoire local ou URL git https://.find_related— Étant donné un chemin de fichier et un numéro de ligne, renvoie les extraits sémantiquement similaires au code à cet emplacement.
📖 Lire la source complète : HN AI Agents
👀 See Also

Le Référentiel de Créativité Humaine : Distinguer Convergence et Divergence dans l'Évaluation de la Créativité de l'IA
Contra Labs présente le Human Creativity Benchmark (HCB), un cadre qui distingue les critères objectivement vérifiables (ex. respect de la consigne) des goûts subjectifs (ex. attrait visuel) dans l'évaluation de l'IA générative pour le travail créatif. Le benchmark révèle qu'aucun modèle actuel n'est à la fois fiable et orientable, abordant l'effondrement modal et le besoin de résultats différenciés.

Nakkas MCP Server Génère des SVGs Animés à Partir de Descriptions IA
Nakkas est un serveur MCP où l'IA construit des configurations SVG animées complètes à partir de descriptions, générant des SVG animés propres avec des formes, des dégradés, des animations et des filtres. Il prend en charge les courbes paramétriques, 15 préréglages de filtres, les animations CSS @keyframes et SMIL, et fonctionne partout où le SVG s'affiche.

Logseq Brain v0.6.0 : Plugin de mémoire persistante pour Claude Code avec journal de bord et lectures ciblées par section
Logseq Brain v0.6.0 ajoute un journal de bord pour toutes les opérations, des lectures ciblées par section pour économiser des tokens, et une divulgation progressive pour les fichiers de compétences.

Sylve : Un plan de gestion FreeBSD pour la virtualisation, les conteneurs et le stockage
Sylve est un plan de gestion sous licence BSD-2 pour FreeBSD qui offre un contrôle unifié des machines virtuelles Bhyve, des prisons FreeBSD, du stockage ZFS et de la mise en réseau. Il utilise un modèle de consensus RAFT pour le clustering et inclut la gestion des partages Samba avec automatisation des instantanés ZFS.