Claude Opus 4.6 effort=low provoque un comportement d'agent paresseux

Le paramètre effort de Claude Opus 4.6 se comporte différemment des paramètres similaires d'autres fournisseurs d'IA, entraînant un comportement inattendu des agents lorsqu'il est réglé sur low.
Principales Constatations
Les tests ont révélé qu'avec effort=low, Claude Opus 4.6 a présenté un comportement significativement plus paresseux que prévu :
- A effectué moins d'appels d'outils
- A été moins minutieux dans la vérification croisée
- A effectivement ignoré certaines parties des instructions système indiquant comment effectuer des recherches web
- A renvoyé avec assurance des réponses incorrectes car il a cessé de chercher des informations
La source note que le passage à effort=medium a résolu tous ces problèmes. Selon la documentation, le paramètre effort d'Anthropic contrôle l'effort comportemental général, et pas seulement la profondeur de raisonnement comme reasoning.effort=low d'OpenAI ou thinking_level=low de Gemini.
Distinction Importante
Il ne s'agit pas d'un bug mais d'une différence documentée dans l'implémentation. Le paramètre effort dans Claude Opus 4.6 a une portée plus large que les paramètres équivalents d'autres fournisseurs. Cela signifie que vous ne pouvez pas traiter effort comme un remplacement direct pour reasoning.effort ou thinking_level lorsque vous travaillez avec différents fournisseurs d'IA.
Les tests ont été menés avec l'attente que effort=low se comporterait de manière similaire aux paramètres low-effort d'autres fournisseurs, mais le comportement réel était plus extrême, conduisant à des agents qui ne pensaient pas seulement moins, mais agissaient de manière globalement plus paresseuse.
📖 Read the full source: r/LocalLLaMA
👀 See Also

OpenAI publie GPT-5.3-Codex-Spark en aperçu de recherche.
OpenAI a présenté GPT-5.3-Codex-Spark en prévisualisation de recherche, promettant des capacités de développement plus rapides.

Le rapport de Stanford révèle que les experts en IA et le public ont des visions divergentes sur l'impact de l'IA
Le rapport annuel de Stanford sur l'industrie de l'IA révèle d'importants écarts entre l'optimisme des experts en IA et l'anxiété du public, les experts se concentrant sur les risques de l'AGI tandis que le public s'inquiète des emplois, des soins médicaux et des coûts des services publics.

Le double standard dans la création assistée par l'IA : programmation vs rédaction
Une discussion sur Reddit met en lumière la réception contrastée entre la programmation assistée par IA (vibe coding) et l'écriture assistée par IA, notant des flux de travail identiques mais des perceptions culturelles différentes.

Joint-venture de 10 milliards de dollars d'OpenAI en capital-investissement : implications pour le déploiement de l'IA
OpenAI finalise une coentreprise de 10 milliards de dollars avec des sociétés de capital-investissement pour étendre l'infrastructure d'IA et le déploiement en entreprise, selon Bloomberg.