Ory Lumen : Plugin de recherche sémantique locale open source pour Claude Code

Ory Lumen est un plugin Claude Code conçu pour résoudre les problèmes de performance lors du travail avec de grandes bases de code. Le développeur l'a créé après avoir observé que Claude Code met trop de temps à relire les mêmes fichiers, échoue parfois à trouver tous les fichiers et voit sa qualité se dégrader avec les grands projets.
Fonctionnement
Le plugin indexe votre base de code en utilisant un modèle d'incorporation de code via Ollama (qui est gratuit et rapide), puis indique à Claude Code d'utiliser Ory Lumen pour la recherche sémantique de code. Il utilise SQLite-vec pour les fonctionnalités de base de données vectorielle.
Détails du développement
Le projet a été construit en utilisant Claude Code lui-même et a traversé plusieurs cycles de résolution des problèmes de performance et d'amélioration de la qualité de la récupération. Claude a géré les propositions de conception, l'implémentation et la construction des benchmarks. Un temps considérable a été investi dans l'amélioration de l'analyseur TreeSitter et AST ainsi que du découpeur de contenu. Les mises à jour récentes incluent la prise en charge de l'indexation efficace des arbres de travail git.
Performance et tests
Le développeur a créé un banc d'essai de type SWE que les utilisateurs peuvent employer pour reproduire les résultats fournis par Ory Lumen. Dans leur travail, il augmente régulièrement la vitesse par rapport à l'utilisation de Claude Code standard, avec des résultats de qualité égale ou supérieure.
Disponibilité et maintenance
L'outil est entièrement gratuit et fonctionne uniquement en local. Le développeur le maintient activement et encourage les utilisateurs à créer des problèmes ou à soumettre des demandes de fusion.
📖 Read the full source: r/ClaudeAI
👀 See Also

CostClaw : Tableau de bord gratuit de suivi des coûts locaux pour les agents OpenClaw
CostClaw est un plugin local gratuit qui capture chaque appel LLM via les hooks natifs d'OpenClaw et fournit un tableau de bord affichant la répartition des modèles, les coûts par session et les graphiques de dépenses horaires. Le développeur a découvert que son agent heartbeat exécutait Claude Sonnet toutes les 3 minutes 24h/24, coûtant 60$/mois, et que le passage à Haiku a réduit sa facture d'environ 65%.

Détecteur de Fuites Swarm : Outil Gratuit pour Scanner les Clés API Exposées dans les Configurations OpenClaw
Un développeur a publié swarm-leak-detector, un outil sous licence MIT sans dépendances qui recherche plus de 21 modèles d'identifiants (OpenAI, Anthropic, OpenRouter, Stripe, etc.) dans des fichiers de configuration JSON en texte brut. Exécutez-le avec npx swarm-leak-detector scan ~/.clawdbot/ pour vérifier les fuites en environ 30 secondes.

Plugin Pair Programmer Ajoute un Contexte d'Écran en Direct, Vocal et Audio à Claude Code
Un développeur a créé un plugin appelé Pair Programmer qui donne à Claude Code une perception en temps réel du bureau en capturant les flux d'écran, de microphone et d'audio système. L'architecture utilise des agents spécialisés fonctionnant en parallèle pour différents types d'entrées, avec l'indexation actuellement gérée par des modèles cloud mais conçue pour être indépendante du modèle.

Krasis LLM Runtime présente des améliorations de vitesse de 8,9x en préremplissage et de 4,7x en décodage par rapport à Llama.cpp.
Le runtime LLM Krasis exécute désormais entièrement le préremplissage et le décodage sur GPU avec différentes stratégies d'optimisation, obtenant un préremplissage 8,9 fois plus rapide et un décodage 4,7 fois plus rapide que llama.cpp sur Qwen3.5-122B avec un seul GPU 5090.