SDK Open-Source pour le Travail de Connaissance en IA

ClioAI a publié le kw-sdk, un kit de développement logiciel open-source conçu pour apporter de la structure aux agents d'IA effectuant des tâches dans les secteurs du travail intellectuel tels que la recherche, l'analyse, la stratégie et la rédaction. Contrairement aux frameworks de code traditionnels, qui disposent de signaux de vérification naturels via les tests, le travail intellectuel nécessite des approches structurées pour la vérification et l'évaluation des tâches.
Ce SDK facilite l'exécution des tâches via un orchestrateur qui gère les sous-agents, les recherches web, l'exécution de code et les entrées/sorties de fichiers, suivi d'une étape de vérification qui contrôle le travail par rapport à une grille d'évaluation prédéfinie, qui reste cachée de l'exécutant. Cette méthode simule une fonction de récompense, idéale pour les modèles d'apprentissage par renforcement appliqués aux tâches intellectuelles.
Les concepts clés du framework sont le Briefing de Tâche, la Création de Grille d'Évaluation, l'Exécution, la Vérification et la Soumission. Le 'mode Exploration' est particulièrement remarquable ; il permet la génération de multiples approches distinctes d'un problème, fournissant des insights sur l'espace des solutions et mettant en lumière les lacunes ou compromis.
Une autre fonctionnalité notable est le Point de Contrôle, qui aide à gérer les systèmes multi-agents en permettant de sauvegarder des états logiques pendant l'exécution pour exploration ultérieure ou ré-exécution. Ceci est bénéfique lorsqu'il est nécessaire de relancer ou itérer sur des étapes spécifiques d'un processus après que des tâches initiales comme des recherches aient été effectuées.
Le SDK prend également en charge les environnements d'exécution distants. Vous pouvez exécuter des commandes dans des contextes tels que des environnements locaux, des conteneurs Docker ou des navigateurs en bac à sable, le rendant polyvalent pour différents besoins opérationnels. Cette approche transforme l'exécution de code en un protocole, offrant une flexibilité d'intégration.
Pour l'installation, il est recommandé d'utiliser Python et d'installer directement depuis le dépôt GitHub : pip install git+https://github.com/ClioAI/kw-sdk.git. Vous pouvez également l'ajouter à votre pyproject.toml pour les dépendances de développement. Un fichier .env est recommandé pour les clés API comme Gemini, OpenAI et Anthropic.
📖 Lire la source complète : HN AI Agents
👀 See Also
Aiguille : Un modèle d'appel de fonctions de 26M paramètres fonctionnant à 6000 tok/s sur mobile
Cactus open-source Needle, un modèle à 26 millions de paramètres pour l'appel de fonction en un seul tour, atteignant 6000 tok/s en pré-remplissage et 1200 tok/s en décodage sur des appareils grand public. Construit avec Simple Attention Networks (sans FFN), il surpasse plusieurs modèles plus grands sur des benchmarks d'utilisation d'outils.

Corbeau : La plateforme MCP open-source ajoute une mémoire persistante et un partage pair-à-pair aux interfaces LLM.
Crow est une plateforme de serveur MCP open-source et auto-hébergée qui fournit aux interfaces LLM une mémoire persistante basée sur SQLite, des outils de recherche structurés et un partage pair-à-pair chiffré. Il fonctionne avec tout client compatible MCP comme Claude Desktop, Cursor ou Windsurf et ne nécessite aucune dépendance cloud par défaut.

LAP : plus de 1 500 spécifications d'API compilées pour une utilisation par les LLM afin de réduire les hallucinations de Claude
LAP est un outil qui compile plus de 1 500 spécifications d'API réelles dans un format optimisé pour les LLM, fournissant des points de terminaison et des paramètres vérifiés pour empêcher les agents d'IA comme Claude d'halluciner des appels API incorrects.

L'Agent OpenClaw Acquiert la Capacité d'Appel Téléphonique Grâce à une Compétence Personnalisée
Un développeur a créé une compétence personnalisée pour les agents OpenClaw auto-hébergés qui permet la fonctionnalité d'appel téléphonique, permettant à l'agent de passer des appels basés sur des déclencheurs comme l'achèvement de builds ou des pannes de serveur. L'implémentation offre une interaction vocale avec toutes les capacités de chat, y compris les recherches web et la configuration d'alertes.