Construyendo un Recepcionista de IA para un Taller Mecánico: Pipeline RAG e Integración de Voz

✍️ OpenClawRadar📅 Publicado: 23 de marzo de 2026🔗 Source
Construyendo un Recepcionista de IA para un Taller Mecánico: Pipeline RAG e Integración de Voz
Ad

Construcción de la Canalización RAG

El primer paso fue crear una base de conocimiento precisa para evitar alucinaciones. El desarrollador extrajo las páginas de servicios y precios del sitio web del taller mecánico a archivos markdown, creando una base de conocimiento estructurada que cubre más de 21 documentos, incluyendo tipos de servicios, precios, tiempos de entrega, horarios, métodos de pago, políticas de cancelación, información de garantía, vehículos de préstamo y marcas de automóviles especializadas.

Cada documento se convirtió en un vector de 1024 dimensiones usando Voyage AI (voyage-3-large) y se almacenó en MongoDB Atlas junto con el texto original, con un índice de búsqueda vectorial de Atlas en el campo de incrustación.

Cuando un cliente hace una pregunta, la consulta se incrusta usando el mismo modelo de Voyage AI y se ejecuta contra el índice de búsqueda vectorial de Atlas, devolviendo los 3 documentos semánticamente más similares. Los documentos recuperados se pasan como contexto a Anthropic Claude (claude-sonnet-4-6) con una instrucción de sistema estricta: responder solo desde la base de conocimiento, mantener las respuestas breves y conversacionales, y si no se sabe — decirlo y ofrecer tomar un mensaje.

Ejemplo de respuesta: "¿Cuánto cuesta un cambio de aceite?" → "$45 para convencional, $75 para sintético. Incluye filtro de aceite, relleno de fluidos y verificación de presión de neumáticos. Toma unos 30 minutos."

Ad

Conexión a una Línea Telefónica Real

El desarrollador usó Vapi como plataforma de voz para manejar la telefonía: comprando un número telefónico, conversión de voz a texto (mediante Deepgram), texto a voz (mediante ElevenLabs) y llamadas de función en tiempo real al servidor.

Se construyó un servidor webhook FastAPI con un endpoint /webhook. Cuando un llamante hace una pregunta, Vapi envía una solicitud de tool-calls a este endpoint con la consulta del llamante. El servidor dirige eso a la canalización RAG, obtiene una respuesta de Claude y la envía de vuelta a Vapi, que la lee en voz alta al llamante.

Durante el desarrollo, el servidor se ejecuta localmente en el puerto 8000 y se expone usando Ngrok, que crea un túnel a una URL HTTPS pública que se pega en el panel de control de Vapi como el endpoint del webhook.

En el panel de control de Vapi, el asistente se configuró con un saludo ("Hola, gracias por llamar a Dane's Motorsport, ¿en qué puedo ayudarte hoy?") y dos herramientas: answerQuestion para respuestas respaldadas por RAG y saveCallback para recopilar un nombre y número cuando una pregunta no pueda responderse.

Vapi envía el historial completo de conversación con cada solicitud, permitiendo memoria de conversación.

📖 Read the full source: HN AI Agents

Ad

👀 Ver también

🦀
Casos de uso

Despliegue local vs VPS de OpenClaw: diferencias prácticas para agentes de codificación con IA

Ejecutar OpenClaw localmente proporciona acceso a navegadores reales con sesiones de inicio de sesión existentes y acceso a archivos locales, mientras que el despliegue en VPS limita la funcionalidad a tareas básicas y enfrenta restricciones de sitios web.

OpenClawRadar
Construyendo un Pipeline de 20 Agentes con Claude Code: Menos IA, Más Estructura
Casos de uso

Construyendo un Pipeline de 20 Agentes con Claude Code: Menos IA, Más Estructura

Un desarrollador construyó una canalización de 20 agentes con Claude Code para automatizar flujos de trabajo diarios en Gmail, Calendar, Notion, LinkedIn, rastreadores web y APIs locales. La clave: la confiabilidad vino de agregar estructura determinista alrededor de la IA, no de mejores instrucciones.

OpenClawRadar
Curva de Aprendizaje de Claude Max para Desarrolladores Senior: De Indicaciones Vagas a Revisiones de Código Estructuradas
Casos de uso

Curva de Aprendizaje de Claude Max para Desarrolladores Senior: De Indicaciones Vagas a Revisiones de Código Estructuradas

Un desarrollador con 8 años de experiencia en Node.js, Go, Angular y AWS comparte cómo inicialmente usó Claude Max de manera incorrecta al tratarlo como un ingeniero senior con contexto del proyecto, luego mejoró los resultados implementando procesos de revisión estructurados similares a la mentoría de desarrolladores junior.

OpenClawRadar
Casos de Uso del Agente OpenClaw: Desde la Automatización de DevOps hasta la Recopilación de Inteligencia
Casos de uso

Casos de Uso del Agente OpenClaw: Desde la Automatización de DevOps hasta la Recopilación de Inteligencia

Un desarrollador comparte seis tareas específicas que su agente OpenClaw maneja diariamente, incluyendo operaciones de servidor mediante comandos de Discord, filtrado de correo electrónico en ocho cuentas, análisis de contenido de Reddit, configuración de análisis de PostHog, gestión de servidores de Discord y operaciones de bases de conocimiento empresarial en Feishu.

OpenClawRadar