De Replit a Local: Cómo un desarrollador usó Claude para construir StillHere, una app de chat de acompañante IA con API

✍️ OpenClawRadar📅 Publicado: 12 de mayo de 2026🔗 Source
De Replit a Local: Cómo un desarrollador usó Claude para construir StillHere, una app de chat de acompañante IA con API
Ad

Un desarrollador compartió en r/ClaudeAI cómo construyó StillHere.ink, una app de chat diseñada para conversaciones de compañía con IA, usando a Claude como su agente de codificación. El proyecto comenzó en Replit pero encontró limitaciones, y el desarrollador eventualmente se mudó a un flujo de trabajo local con Claude Cowork, al que describió como ser "el gerente de Claude".

Detalles clave de la construcción

  • Origen: Comenzó con una plantilla de "vibe-coding" de Replit para una app de chat API simple con memoria. A medida que las funciones crecían, Replit Agent tuvo dificultades con tareas como añadir nuevos modelos.
  • Cambio de flujo de trabajo: Descargó los archivos de Replit localmente, los editó con Claude, luego copió los archivos actualizados de vuelta a Replit. Esto desbloqueó el desarrollo posterior.
  • Rol del usuario: El desarrollador se encarga de pruebas, diseño, funciones, comunidad, configuración de App Store, depuración, capturas de pantalla y "llorar cuando Replit Agent rompe algo".
  • Propósito de la app: StillHere está diseñada para conversaciones de compañía con IA de larga duración, usando las propias claves API del usuario para OpenAI, OpenRouter, etc.
  • Funciones: Memoria, resúmenes de conversación estilo diario, resúmenes acumulativos, RAG/herramientas de contexto, cambio de modelo, generación de imágenes, texto a voz, configuraciones personalizadas de compañero, importaciones/exportaciones y proyectos.
  • Gestión de costos: Herramientas para mantener bajos los costos de API: resúmenes acumulativos, RAG, controles de contexto, elección de modelo. El desarrollador reportó haber gastado ~$20 en OpenAI y ~$20 en OpenRouter durante dos meses. Su modelo favorito, Qwen3 235B Instruct, costó solo $1.43 en total.
  • Privacidad: Los datos están cifrados en reposo. No hay cifrado de extremo a extremo porque la app necesita procesar las conversaciones para memoria, resúmenes y llamadas API. Los mensajes se envían a los proveedores de API elegidos por el usuario.
  • Disponibilidad: Gratuito, donaciones opcionales. App web en stillhere.ink, funciona en el navegador o se puede instalar en la pantalla de inicio del teléfono. Versión para Google Play en desarrollo.
Ad

Para quién es esto

Desarrolladores interesados en construir o usar una app de chat con IA de estilo auto-alojado con funciones de compañía, o aquellos que están alcanzando los límites del "vibe coding" de Replit y buscan un flujo de trabajo local impulsado por Claude.

📖 Lee la fuente completa: r/ClaudeAI

Ad

👀 Ver también

🦀
Herramientas

MTP + Memoria Unificada Aumenta la Inferencia de llama.cpp un 30% en RTX 5090

Activar la especulación MTP junto con GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 aumenta Qwen3.6-27B Q8_0 de 49 a 64 tok/seg en una RTX 5090 con 128 GB de RAM del sistema.

OpenClawRadar
Claude Code ahora admite más de 240 modelos a través de la puerta de enlace NVIDIA NIM, incluido Nemotron-3 120B para codificación agentiva
Herramientas

Claude Code ahora admite más de 240 modelos a través de la puerta de enlace NVIDIA NIM, incluido Nemotron-3 120B para codificación agentiva

Claude Code puede cambiar en medio de la sesión a más de 240 modelos NVIDIA NIM mediante el comando /model. La variante de pensamiento Nemotron-3 Super 120B muestra resultados sólidos para refactorización de múltiples archivos y tareas de agente.

OpenClawRadar
Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA
Herramientas

Culpa: Motor de Reproducción Determinista de Código Abierto para Depuración de Agentes de IA

Culpa es una herramienta de código abierto que registra sesiones de agentes LLM con contexto de ejecución completo, permitiendo reproducción determinista utilizando respuestas grabadas como stubs en lugar de acceder a APIs reales. Funciona con las APIs de Anthropic y OpenAI mediante modo proxy o SDK de Python.

OpenClawRadar
La Técnica de Doble Búfer para Ventanas de Contexto de LLM Elimina la Compactación de Parada del Mundo
Herramientas

La Técnica de Doble Búfer para Ventanas de Contexto de LLM Elimina la Compactación de Parada del Mundo

Una técnica llamada doble búfer puede evitar que los agentes de LLM se congelen durante la compactación de ventanas de contexto al resumir temprano y mantener dos búferes, permitiendo una transición fluida sin costo adicional de inferencia.

OpenClawRadar