AgentLens : Outil d'observabilité pour les flux de travail d'IA multi-agents

AgentLens est un outil d'observabilité conçu pour les flux de travail d'IA multi-agents combinant des modèles locaux et basés sur le cloud. Il répond au défi de suivre les activités entre différents fournisseurs comme Ollama, vLLM, Anthropic et OpenAI.
Fonctionnalités principales
- Traçage unifié pour Ollama, vLLM, Anthropic, OpenAI et d'autres fournisseurs
- Suivi des coûts incluant le temps de calcul local converti en coût estimé
- Serveur MCP pour interroger les statistiques depuis l'intérieur de Claude Code
- Interface CLI pour des vérifications rapides en ligne avec des commandes comme
agentlens q stats - Auto-hébergé - s'exécute sur votre machine avec les données restant locales
Déploiement et utilisation
Déployez avec Docker :
docker run -d -p 3100:3100 phoenixaihub/agentlens-collector
Encapsulez les appels Ollama avec une ligne de code :
const { client } = wrapOllama(ollama, { client: lens });
Le tableau de bord affiche le flux des agents, la répartition des coûts et la latence par fournisseur.
Cet outil est particulièrement utile pour les développeurs exécutant des flux de travail d'IA mixtes où certaines tâches utilisent des modèles locaux (comme Ollama) tandis que d'autres nécessitent des modèles basés sur le cloud (comme Claude ou GPT) pour un raisonnement complexe.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Brunnfeld Agentic World : Simulation d'Économie Médiévale Multi-Agents Sans Invitations Comportementales
Une simulation TypeScript où 20 agents LLM négocient de manière autonome dans une économie de village médiéval sans instructions comportementales, objectifs ou stratégies commerciales. Les agents reçoivent environ 200 tokens de perceptions à chaque tick et interagissent via un moteur déterministe gérant la physique, les recettes et les mécanismes de marché.

free-claude-code ajoute la prise en charge de GLM-5 via NVIDIA NIM, et s'étend à OpenRouter et Discord
free-claude-code prend désormais en charge GLM-5 via le niveau gratuit de NVIDIA NIM (40 requêtes/min) et ajoute l'intégration OpenRouter, la prise en charge des bots Discord et la compatibilité avec le fournisseur local LMStudio. L'outil convertit les requêtes API Anthropic de Claude Code pour fonctionner avec des backends de modèles alternatifs.

Protocole Pilote : Couche de Réseau pour les Agents OpenClaw
Pilot Protocol est une couche réseau open source qui gère la connectivité entre les agents OpenClaw sur différentes machines. Il fournit des adresses virtuelles permanentes, des tunnels UDP chiffrés et un traversée NAT sans VPN ni ngrok.

OpenClaw met en œuvre la Compression de l'Historique des Agents pour réduire l'utilisation du contexte.
OpenClaw compresse désormais l'historique des agents en remplaçant les journaux de sous-tâches terminées par des résumés structurés, réduisant environ 1 million de tokens à environ 30 000. Le système utilise un scanner à 4 passes pour identifier les cycles de vie des tâches et génère des résumés masqués qui maintiennent la compatibilité avec les agents.