Couche mémoire auto-hébergée pour Claude fonctionne gratuitement sur Cloudflare

Un utilisateur de Reddit a créé second-brain-cloudflare, un serveur MCP open source qui ajoute une mémoire persistante à Claude. Il fonctionne entièrement sur le niveau gratuit de Cloudflare en utilisant Workers, D1 (SQLite), Vectorize et Workers AI.
Fonctionnalités clés
- Quatre outils MCP :
remember,recall,list_recent,forget. - Recherche sémantique via
recall: les notes sont converties en vecteurs à l'aide du modèlebge-small-en-v1.5via Workers AI et stockées dans Cloudflare Vectorize. Les recherches correspondent par sens, pas par mots-clés. - Fonctionne avec Claude Desktop, Claude Code et
claude.ai(via des connecteurs personnalisés).
Comment ça marche
Vous ajoutez des instructions au prompt système de Claude. Le serveur est déployé via un bouton de déploiement en un clic sur le dépôt. Contexte : remember stocke une note, recall recherche des embeddings sémantiques, list_recent affiche les notes récentes, forget supprime une note. La stack : TypeScript, Cloudflare Workers + D1 + Vectorize + Workers AI.
Compromis et détails d'implémentation
L'auteur note que la recherche sémantique a des compromis — la qualité des embeddings, la latence et le coût sont discutés dans le fil Reddit. Le niveau gratuit gère un usage personnel sans problème.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Skales : Agent IA de bureau avec support Ollama, 300 Mo de RAM au repos
Skales est une application de bureau native Electron qui fournit un agent IA autonome avec des installateurs .exe/.dmg, fonctionne avec Ollama pour l'inférence locale ou des fournisseurs cloud, et utilise environ 300 Mo de RAM au repos avec les données stockées localement dans ~/.skales-data.

Claude Code v2.1.144 : Sessions en arrière-plan, cadrage /modèle et délai de démarrage de 15s
Claude Code v2.1.144 ajoute /resume pour les sessions en arrière-plan, limite /model à la session en cours et corrige un blocage de 75 secondes au démarrage lorsque api.anthropic.com est inaccessible avec un délai d'attente de 15 secondes.

skill-depot : Un système de mémoire et de compétences local-first pour agents IA compatibles MCP
skill-depot est un système de récupération qui stocke les connaissances des agents sous forme de fichiers Markdown et utilise des embeddings vectoriels pour rechercher sémantiquement et charger sélectivement uniquement le contenu pertinent. Il fonctionne à 100 % en local sans clés API, est compatible avec tout agent compatible MCP et peut être configuré avec npx skill-depot init.

Stage CLI : Modifications générées par l'IA locale révisées sous forme de chapitres logiques
Stage CLI regroupe votre diff local en chapitres logiques (via n'importe quel agent d'IA) et ouvre une interface navigateur pour une révision étape par étape. Installez-le avec 'npm install -g stagereview' et ajoutez la compétence via 'npx skills add ReviewStage/stage-cli'.