Matriz LLM: Comparaciones de Modelos Votados por la Comunidad Construida con Claude Code

Un desarrollador ha creado LLM Matrix, un sitio web que permite a los usuarios explorar y votar sobre modelos de lenguaje grandes en múltiples dimensiones. La herramienta aborda las preocupaciones sobre los sitios de evaluación centralizados implementando clasificaciones impulsadas por la comunidad.
Qué hace LLM Matrix
- Explorar puntuaciones de LLM en 2 a N dimensiones simultáneamente
- Los usuarios votan sobre modelos, y esos votos moldean las clasificaciones
- Datos iniciales sembrados con solo 20 votos por modelo basados en puntuaciones agregadas de fuentes públicas de internet
- Votos restantes y clasificaciones determinados por la entrada de la comunidad
Detalles de desarrollo
Todo el proyecto fue construido usando Claude Code. El desarrollador mencionó específicamente dos complementos que fueron esenciales para el desarrollo:
- complemento de grado de producción:
https://github.com/nagisanzenin/claude-code-production-grade-plugin - complemento claude-mem:
https://github.com/thedotmack/claude-mem
El sitio está actualmente alojado en llm-matrix.vercel.app y representa un enfoque alternativo para la evaluación de LLM que prioriza el consenso de la comunidad sobre métricas centralizadas potencialmente sesgadas.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Puente IDE de Claude de Código Abierto Conecta Dispatch, Aplicación de Escritorio y Claude Code
El claude-ide-bridge es una herramienta de código abierto con licencia MIT que conecta Claude Code a tu IDE, proporcionando acceso a LSP, depurador, terminales, git y GitHub a través de 124 herramientas. Permite un flujo de trabajo donde las tareas enviadas mediante Dispatch desde un teléfono son manejadas por la aplicación de escritorio de Claude, que usa Claude Code para escribir código y ejecutar pruebas mientras interactúa con el IDE.
PullMD v2.4.1 añade conector nativo MCP para claude.ai web y autenticación multiusuario
PullMD v2.4.1 ahora admite el diálogo de conector personalizado de claude.ai mediante OAuth 2.1 + PKCE-S256 y añade modos de autenticación multiusuario. Convierte cualquier URL en Markdown limpio a través de MCP autoalojado.

Mentor de Carreras Multi-Agente Desarrollado con Ollama y MCP para IA Local
Un desarrollador construyó un sistema de IA de 5 agentes que analiza currículums y genera informes de inteligencia profesional usando Ollama con llama3 localmente. El sistema encadena las salidas de los agentes para que cada uno se base en el contexto anterior, con MCP manejando la integración de herramientas.

Desarrollador Crea Habilidad de IA de Código Abierto para Validar Ideas de Startups, y Mata su Propia Idea en 10 Minutos
Un desarrollador creó una habilidad de IA de código abierto llamada startup-design que guía a través de 8 fases de validación de startups, desde la lluvia de ideas hasta las proyecciones financieras. Al probarla en su propia idea de startup, la habilidad hizo preguntas difíciles que revelaron que no era el fundador adecuado para ese concepto en particular.