Bespoke AI v0.8.1 : Extension d'auto-complétion VS Code pour le code et le texte

Bespoke AI v0.8.1 est une extension VS Code qui fournit une fonctionnalité d'autocomplétion à la fois pour le code et le texte non-code. Le développeur l'a créée après avoir constaté l'absence de projets open source décents d'autocomplétion fonctionnant bien pour le texte.
Détails clés
L'extension exploite les abonnements existants Claude Code via le SDK Agent d'Anthropic, permettant aux utilisateurs d'accéder à une autocomplétion pleine puissance (y compris Opus) sans engendrer de frais d'API. Alternativement, les utilisateurs peuvent la configurer pour utiliser n'importe quelle API de leur choix, y compris Ollama.
L'extension est disponible sur le VS Code Marketplace à https://marketplace.visualstudio.com/items?itemName=TrentMcNitt.bespoke-ai et le code source est hébergé sur GitHub à https://github.com/trentmcnitt/bespoke-ai-vscode-ext.
Le développeur recherche des testeurs pour valider l'extension sur des configurations autres que la sienne. Les retours peuvent être fournis via les commentaires sur le post Reddit, les messages directs, ou en créant des issues sur le dépôt GitHub.
📖 Read the full source: r/ClaudeAI
👀 See Also

Application iOS Hyper : Enregistreur vocal avec transcription en temps réel et extraction d'actions
Hyper est une application d'enregistrement vocal iOS qui retranscrit les conversations en temps réel, fournit des résumés et des points d'action, et permet des requêtes en plein milieu d'une conversation via la détection de mot d'activation. Elle est conçue pour les réunions non structurées comme les entretiens individuels, les discussions informelles et les points quotidiens.

mentionné.to vs outils de surveillance plus larges : une comparaison des flux de travail centrés sur Reddit
mentioned.to est un outil de surveillance spécialement conçu pour les flux de travail Reddit, se concentrant sur le suivi des publications pertinentes, la mise en avant des opportunités de réponse, l'analyse du contenu performant et la rédaction de réponses, plutôt que sur une surveillance générale de la marque sur plusieurs canaux.

Qwen 3.6 27B atteint une vitesse 2,5x avec le décodage spéculatif MTP sur llama.cpp
Un utilisateur de Reddit rapporte une inférence 2,5 fois plus rapide sur Qwen 3.6 27B en utilisant le décodage spéculatif MTP avec une PR personnalisée de llama.cpp, atteignant 28 tok/s sur Mac M2 Max 96GB. Inclut des quants GGUF pré-convertis et des modèles de chat fixes.

Expérience de revue de code en face-à-face comparant trois outils d'IA sur la même base de code.
Une expérience vidéo teste Codex, Claude Code et Claude Code avec Sextant sur des tâches identiques de revue de code, avec Codex vérifiant les résultats et jugeant quel rapport est le plus utile. L'accent est mis sur la façon dont le flux de travail et la structure affectent ce que l'IA remarque et priorise.