AgentLens: Herramienta de Observabilidad para Flujos de Trabajo de IA Multi-Agente

AgentLens es una herramienta de observabilidad diseñada para flujos de trabajo de IA multiagente que combinan modelos locales y basados en la nube. Aborda el desafío de rastrear actividades entre diferentes proveedores como Ollama, vLLM, Anthropic y OpenAI.
Características principales
- Trazabilidad unificada en Ollama, vLLM, Anthropic, OpenAI y otros proveedores
- Seguimiento de costos que incluye tiempo de cómputo local convertido a costo estimado
- Servidor MCP para consultar estadísticas desde dentro de Claude Code
- Interfaz CLI para verificaciones rápidas en línea con comandos como
agentlens q stats - Autoalojado - se ejecuta en tu máquina con los datos permaneciendo locales
Implementación y uso
Implementa usando Docker:
docker run -d -p 3100:3100 phoenixaihub/agentlens-collector
Envuelve las llamadas de Ollama con una línea de código:
const { client } = wrapOllama(ollama, { client: lens });
El panel muestra el flujo de agentes, desglose de costos y latencia por proveedor.
Esta herramienta es particularmente útil para desarrolladores que ejecutan flujos de trabajo de IA mixtos donde algunas tareas usan modelos locales (como Ollama) mientras otras requieren modelos basados en la nube (como Claude o GPT) para razonamiento complejo.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Desarrollador comparte flujo de trabajo híbrido de codificación con IA: Claude para planificación, modelos locales para ejecución
Un desarrollador construyó una canalización utilizando Claude 3.5 Sonnet para la planificación de tareas y modelos locales Qwen2.5-Coder a través de Ollama para la generación de código, logrando una reducción del 85% en tokens en comparación con usar solo Claude.

Desbloqueando la Proactividad: Una Profundización en las Innovaciones de Clawbot de la Comunidad
Descubre cómo los entusiastas están mejorando la proactividad de su Clawbot a través de estrategias innovadoras y perspectivas impulsadas por la comunidad. Una mirada a las discusiones y revelaciones de r/openclaw.

Mia: Daemon de Espacio de Trabajo de IA Local con Aplicación Nativa para Android y Transmisión P2P
Mia es un demonio que se ejecuta en tu máquina y se empareja con una aplicación nativa de Android mediante P2P, permitiéndote iniciar y monitorear tareas de codificación con IA de larga duración desde tu teléfono. Es compatible con los agentes OpenCode, Claude Code, Gemini CLI y Codex, transmitiendo la salida directamente a tu dispositivo en tiempo real.

Monarch v3: Paginación KV Inspirada en NES para una Inferencia de LLM 78% Más Rápida
Monarch v3 implementa paginación de memoria inspirada en NES para transformadores, logrando una inferencia 78% más rápida (de 17.01 a 30.42 tok/seg) en un modelo de 1.1B parámetros con un consumo de VRAM casi nulo. El algoritmo de código abierto divide la caché KV en regiones calientes y frías con mecanismos de compresión y promoción.