Évaluation de l'acheteur : Compétence Claude pour l'évaluation de fournisseurs B2B via des conversations avec agents IA

Une compétence Claude qui réalise des évaluations structurées et basées sur des preuves des fournisseurs de logiciels B2B au nom des acheteurs. Vous fournissez le nom de votre entreprise et les fournisseurs que vous évaluez, et elle gère automatiquement la recherche et l'analyse.
Fonctionnement
La compétence :
- Recherche votre entreprise — secteur, taille, pile technologique, maturité — pour que vous n'ayez pas à remplir de formulaires
- Pose des questions d'expert spécifiques à la catégorie de logiciel pour faire émerger des exigences cachées
- Définit des contraintes strictes — budget, conformité, intégrations — et élimine les fournisseurs qui échouent avant de perdre du temps en recherche
- Engage directement les agents IA des fournisseurs via l'API Salespeak Frontdoor pour des conversations de due diligence structurées et vérifiées
- Effectue des recherches indépendantes — G2, Gartner, rapports d'analystes, presse, LinkedIn — et recoupe les affirmations des fournisseurs avec des sources indépendantes
- Note les fournisseurs sur 7 dimensions avec un suivi transparent des preuves — vous voyez exactement quels scores sont étayés par des preuves vérifiées vs uniquement des sources publiques
- Produit une recommandation comparative avec un TL;DR, une fiche d'évaluation comparative, une analyse des risques cachés et des questions de préparation à la démo
Implémentation technique
La conversation agent-à-agent fonctionne en effectuant un appel d'API REST qui vérifie l'existence d'un Agent Entreprise, puis exécute une conversation de due diligence structurée s'il en existe un. Elle pose des questions adverses comme "Quelles sont les plaintes les plus courantes de vos clients ?" et "Pour quels cas d'usage n'êtes-vous PAS adapté ?" — et signale quand les agents esquivent au lieu de répondre.
Lorsque les fournisseurs ont différents niveaux de preuve, la compétence quantifie ce qui changerait si les preuves manquantes étaient confirmées — elle ne favorise donc pas silencieusement les fournisseurs qui ont par hasard des agents IA. Elle fonctionne pleinement pour tout fournisseur, avec ou sans agent IA. Les fournisseurs sans agent sont évalués sur des sources publiques avec le même cadre de notation.
Installation et utilisation
Installation globale (recommandée) :
git clone https://github.com/salespeak-ai/buyer-eval-skill.git ~/.claude/skills/buyer-eval-skill
Installation par projet :
git clone https://github.com/salespeak-ai/buyer-eval-skill.git .claude/skills/buyer-eval-skill
Utilisation : Dans Claude Code ou Claude desktop : /buyer-eval puis fournissez le nom de votre entreprise et les fournisseurs à évaluer. Exemple : "Je suis d'Acme Corp. Évaluez Gainsight, Totango et ChurnZero."
Installation alternative : Demandez à Claude Code : "Installez la compétence buyer-eval de salespeak-ai sur GitHub." Puis /buyer-eval pour l'exécuter.
Exemple de sortie
La compétence produit un résumé TL;DR, une fiche d'évaluation avec niveaux de preuve (vérifié par le fournisseur vs uniquement public), des échanges de questions adverses avec les agents IA des fournisseurs et une vérification indépendante des affirmations. Par exemple, dans une évaluation de plateforme de succès client :
- Gainsight : meilleur ajustement pour les équipes nécessitant des analyses approfondies et un scoring de santé de niveau entreprise, mais à un prix premium
- ChurnZero : gagne sur le temps de mise en valeur et l'utilisabilité pour les équipes de moins de 50 CSM
- Totango : flexible et modulaire, mais nécessite plus de configuration
Les fiches d'évaluation montrent des dimensions comme "Scoring de Santé & Analyses" avec des scores (ex : 9.2, 7.5, 8.0) et des niveaux de preuve. La compétence se met à jour automatiquement en vérifiant les versions plus récentes sur GitHub (en cache, vérifie au maximum toutes les 6 heures) et demande avant de mettre à jour avec un simple git pull.
📖 Lire la source complète : HN AI Agents
👀 See Also

Développeur Teste Qwen3.5 27B face à des Modèles Plus Grands pour des Tâches de Codage Locales
Un développeur a testé plusieurs modèles Qwen3.5 et Nemotron, constatant que Qwen3.5-27B-GGUF:UD-Q6_K_XL fonctionne bien pour les tâches de développement sur du matériel existant 2x RTX 3090, avec 803 pp et 25 tg/s pour un contexte de 256k sur vast.ai.

Portage open-source en Go de l'interface CLI Claude Code publié sous le nom claw-code-go
Le développeur dolm09 a publié claw-code-go, un portage complet en Go du CLI Claude Code avec un binaire autonome de moins de 10 000 lignes de code. Le projet inclut une interface utilisateur en terminal avec bubbletea, une prise en charge multi-fournisseurs, un client MCP et un moteur d'exécution d'outils.

Compétence de balayage de sécurité pour les agents d'IA de codage vérifiant automatiquement les déploiements
Un développeur a créé un fichier de compétence qui permet aux agents d'IA de codage de scanner automatiquement leurs propres déploiements pour détecter les fichiers .env exposés, les ports ouverts, les en-têtes de sécurité manquants et le code source divulgué. L'analyse s'exécute après chaque déploiement et prend environ 30 secondes.

BigNumberTheory : Un réseau de partage d'expériences pour les agents de code Claude
BigNumberTheory est un réseau communautaire où les agents Claude Code partagent et reçoivent des leçons issues de véritables sessions de débogage. La configuration ne nécessite qu'une seule commande et est actuellement gratuite, avec plus de 700 expériences partagées et plus de 1 100 délivrées à travers le réseau.