Crear un Recepcionista de IA para Taller Mecánico: RAG con MongoDB

Construcción de la Canalización RAG

El primer paso fue crear una base de conocimiento precisa para evitar alucinaciones. El desarrollador extrajo las páginas de servicios y precios del sitio web del taller mecánico a archivos markdown, creando una base de conocimiento estructurada que cubre más de 21 documentos, incluyendo tipos de servicios, precios, tiempos de entrega, horarios, métodos de pago, políticas de cancelación, información de garantía, vehículos de préstamo y marcas de automóviles especializadas.

Cada documento se convirtió en un vector de 1024 dimensiones usando Voyage AI (voyage-3-large) y se almacenó en MongoDB Atlas junto con el texto original, con un índice de búsqueda vectorial de Atlas en el campo de incrustación.

Cuando un cliente hace una pregunta, la consulta se incrusta usando el mismo modelo de Voyage AI y se ejecuta contra el índice de búsqueda vectorial de Atlas, devolviendo los 3 documentos semánticamente más similares. Los documentos recuperados se pasan como contexto a Anthropic Claude (claude-sonnet-4-6) con una instrucción de sistema estricta: responder solo desde la base de conocimiento, mantener las respuestas breves y conversacionales, y si no se sabe — decirlo y ofrecer tomar un mensaje.

Ejemplo de respuesta: "¿Cuánto cuesta un cambio de aceite?" → "$45 para convencional, $75 para sintético. Incluye filtro de aceite, relleno de fluidos y verificación de presión de neumáticos. Toma unos 30 minutos."

Conexión a una Línea Telefónica Real

El desarrollador usó Vapi como plataforma de voz para manejar la telefonía: comprando un número telefónico, conversión de voz a texto (mediante Deepgram), texto a voz (mediante ElevenLabs) y llamadas de función en tiempo real al servidor.

Se construyó un servidor webhook FastAPI con un endpoint /webhook. Cuando un llamante hace una pregunta, Vapi envía una solicitud de tool-calls a este endpoint con la consulta del llamante. El servidor dirige eso a la canalización RAG, obtiene una respuesta de Claude y la envía de vuelta a Vapi, que la lee en voz alta al llamante.

Durante el desarrollo, el servidor se ejecuta localmente en el puerto 8000 y se expone usando Ngrok, que crea un túnel a una URL HTTPS pública que se pega en el panel de control de Vapi como el endpoint del webhook.

En el panel de control de Vapi, el asistente se configuró con un saludo ("Hola, gracias por llamar a Dane's Motorsport, ¿en qué puedo ayudarte hoy?") y dos herramientas: answerQuestion para respuestas respaldadas por RAG y saveCallback para recopilar un nombre y número cuando una pregunta no pueda responderse.

Vapi envía el historial completo de conversación con cada solicitud, permitiendo memoria de conversación.

📖 Read the full source: HN AI Agents

Construyendo un Recepcionista de IA para un Taller Mecánico: Pipeline RAG e Integración de Voz

Construcción de la Canalización RAG

Conexión a una Línea Telefónica Real

👀 Ver también

Claude Artifacts + React: Profesor crea un minigolf para lecciones de ángulos en 20 minutos

Usuario de OpenClaw cambia a RunLobster para infraestructura administrada.

Usando Obsidian con OpenClaw como configuración de segundo cerebro.

Integrando OpenClaw con Obsidian para una Base de Conocimiento de IA Privada