Claudius: Widget de Chat de IA Incrustable de Código Abierto para Claude

Claudius es un widget de chat de código abierto y autoalojado impulsado por Claude que se puede integrar en cualquier sitio web. El proyecto fue creado para abordar la solicitud común de los clientes de chatbots sin requerir costosas suscripciones SaaS o desarrollo personalizado desde cero.
Características principales
- Burbuja de chat flotante que funciona en cualquier sitio (WordPress, Webflow, HTML estático, React, etc.)
- El backend funciona en Cloudflare Workers (el nivel gratuito maneja tráfico significativo)
- Indicación de sistema personalizable para crear asistentes de IA específicos para negocios
- Modo oscuro con opciones claro/oscuro/automático
- Persistencia de conversaciones y renderizado de markdown
- Limitación de velocidad basada en KV para evitar excesos en costos de API
- Accesible según WCAG 2.1 AA y responsivo hasta 320px
- Totalmente configurable: colores, título, tema, indicación de sistema
Stack técnico
Frontend: React 18, TypeScript, Tailwind, Vite
Backend: Cloudflare Workers, Hono, SDK de Anthropic
Implementación
La integración requiere tres archivos: configurar window.ClaudiusConfig con la URL de tu worker y preferencias, incluir el CSS e incluir el JS.
Estructura de costos
El único costo es el uso de la API de Anthropic. El nivel gratuito de Cloudflare Workers proporciona 100k solicitudes/día. Para sitios de pequeñas empresas con pocos chats diarios, los costos son mínimos.
El proyecto tiene licencia MIT sin telemetría, seguimiento ni intermediarios SaaS. Es el tercer proyecto de código abierto del estudio del desarrollador, después de un framework de React (Aurelius) y un framework de WordPress (Flavian), ambos integrados con Claude Code.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Herramienta Local de Crítico de Imágenes con IA Utiliza Modelos de Visión Ollama para Retroalimentación
Un desarrollador ha creado una aplicación de escritorio gratuita que analiza imágenes generadas por IA localmente utilizando modelos de visión de Ollama. La herramienta proporciona informes de retroalimentación estructurados que incluyen sugerencias de mejora y actualizaciones de prompts.

Memoria Persistente para Claude: Stack Local con MCP, Recuperación de 39ms, Reducción del 82% de Tokens
Un desarrollador construyó una capa de memoria persistente para Claude utilizando búsqueda vectorial local (Qdrant + Qwen3) e integración MCP, logrando una reducción del 82% en tokens, recuperación en 39ms en ruta caliente y cristalización de sesiones mediante nodos L4.

Deblank: Herramienta para Eliminar el Formato de Código y Reducir Tokens en LLM
Deblank es una herramienta de código abierto que elimina el formato del código (sangría, espacios en blanco, saltos de línea) antes de enviarlo a LLMs, reduciendo tokens en aproximadamente un 30% para Java/C++ y un 9% para Python con una latencia de ~76ms. Es compatible con Python, Java, C/C++, C#, JS/TS y Go.

Prism MCP v5.1 añade compresión de memoria 10x y aprendizaje del agente a partir de correcciones.
Prism MCP v5.1 presenta una compresión de memoria 10 veces mayor mediante TurboQuant portado a TypeScript, permitiendo millones de recuerdos en una computadora portátil sin bases de datos vectoriales. La actualización añade aprendizaje del agente a partir de correcciones del usuario y una interfaz visual de grafo de conocimiento.