Needle : un modèle d'appel d'outils de 26M paramètres construit entièrement sans FFN

✍️ OpenClawRadar📅 Publié: May 12, 2026🔗 Source
Ad

Needle est un modèle de 26M paramètres conçu spécifiquement pour l'appel de fonctions en un seul essai. Il utilise des couches d'attention croisée et de gating sans FFN, basé sur l'idée que l'appel d'outils est une récupération et un assemblage (associer une requête à un nom d'outil, extraire les valeurs des arguments, produire du JSON) plutôt qu'un raisonnement. Le modèle atteint 6000 tok/s en préremplissage et 1200 tok/s en décodage sur des appareils grand public.

Détails d'entraînement

  • Pré-entraîné sur 200B tokens sur 16 TPU v6e (27 heures)
  • Post-entraîné sur 2B tokens de données synthétiques d'appel de fonctions (45 minutes)
  • Données synthétisées via Gemini avec 15 catégories d'outils (minuteries, messagerie, navigation, maison intelligente, etc.)

Architecture : Réseaux d'attention simples

L'ensemble du modèle n'est qu'attention et gating — pas de MLP. Les auteurs soutiennent que les paramètres FFN sont gaspillés à cette échelle pour l'appel d'outils, et que cette découverte (pas de FFN) se généralise à toute tâche où le modèle a accès à des connaissances structurées externes (RAG, utilisation d'outils, génération augmentée par récupération). Le modèle n'a pas besoin de mémoriser des faits dans les poids FFN si les faits sont fournis dans l'entrée.

Ad

Benchmarks

Needle surpasse FunctionGemma-270M, Qwen-0.6B, Granite-350M et LFM2.5-350M pour l'appel de fonctions en un seul essai, bien que ces modèles aient plus de capacité pour les contextes conversationnels.

Comment l'utiliser

# Tester le modèle via le playground ou le fine-tuner sur votre Mac/PC
git clone https://github.com/cactus-compute/needle

Tout est sous licence MIT.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Claude Usage Monitor : Application gratuite pour macOS dans la barre de menu pour suivre les limites de Claude.ai
Tools

Claude Usage Monitor : Application gratuite pour macOS dans la barre de menu pour suivre les limites de Claude.ai

Un développeur a créé Claude Usage Monitor, une application gratuite pour macOS qui s'affiche dans la barre de menus et montre l'utilisation de Claude.ai avec des icônes codées par couleur, des compteurs en direct et des minuteries de réinitialisation. L'application lit directement les sessions Claude.ai sans nécessiter de clé API.

OpenClawRadar
Résultats de référence : 6 modèles économiques contre Claude Sonnet 4.6 pour l'orchestration OpenClaw
Tools

Résultats de référence : 6 modèles économiques contre Claude Sonnet 4.6 pour l'orchestration OpenClaw

Un développeur a testé six modèles d'IA moins chers contre Claude Sonnet 4.6 en tant qu'orchestrateur principal pour une configuration OpenClaw. Seul o4-mini a égalé le score parfait de Sonnet, tandis que les autres ont échoué sur des tâches de jugement critiques comme l'inspection de fichiers et la délégation.

OpenClawRadar
OpenClaw .NET : Portage NativeAOT avec Pont JSON-RPC pour les Plugins Existants
Tools

OpenClaw .NET : Portage NativeAOT avec Pont JSON-RPC pour les Plugins Existants

OpenClaw .NET est un portage C# d'OpenClaw qui compile en un binaire NativeAOT d'environ 23 Mo, éliminant le préchauffage JIT et la surcharge du runtime Node tout en maintenant la compatibilité avec les plugins TypeScript/JavaScript existants via un pont JSON-RPC intégré.

OpenClawRadar
Claude Code Container offre un isolement Docker sans configuration pour Claude Code
Tools

Claude Code Container offre un isolement Docker sans configuration pour Claude Code

Claude Code Container (ccc) est un outil gratuit et open-source qui crée automatiquement des conteneurs Docker par projet pour Claude Code avec une isolation complète et une configuration zéro. Il transmet les variables d'environnement de l'hôte, monte les clés SSH, fournit un proxy localhost transparent et inclut Chromium avec chrome-devtools MCP préconfiguré.

OpenClawRadar