Des chercheurs utilisent Claude Projects pour une revue de portée académique : forces et limites

Claude en tant qu'assistant de recherche dans une revue académique
Des chercheurs ont mené une revue de portée évaluée par des pairs publiée dans Artificial Intelligence in Education (Emerald, accès libre) en utilisant Claude Projects pour analyser 39 études d'entretiens qualitatifs provenant de 20 pays sur la façon dont les étudiants expérimentent l'IA générative dans l'enseignement supérieur.
Ce qui a bien fonctionné
- Recoupement des thèmes entre les articles à partir de données structurées en feuille de calcul
- Amélioration de la mémoire humaine sur un grand ensemble de données
- Suggestion de catégories analytiques que les chercheurs n'avaient pas envisagées
- Agir comme un "pair critique" pour l'analyse thématique itérative
Ce qui n'a pas bien fonctionné
- L'analyse initiale en CSV était inexacte et incomplète
- Sujet aux hallucinations lorsque les résultats n'étaient pas rigoureusement vérifiés par rapport à la feuille de calcul source
- Pouvait être "paresseux", n'exécutant pas pleinement les demandes
- Les réponses sycophantes nécessitaient des instructions explicites pour la critique
- La courbe d'apprentissage signifiait qu'il n'était pas réellement plus efficace globalement (paradoxe de productivité)
Détails de mise en œuvre
Les chercheurs n'ont pas téléchargé les articles complets en raison de considérations de droits d'auteur et éthiques. Au lieu de cela, ils ont téléchargé leurs propres notes structurées dans Claude Projects. Les performances se sont considérablement améliorées lorsque la prise en charge des fichiers .xls a été ajoutée et à nouveau avec Sonnet 3.7.
Les chercheurs ont conclu que Claude était utile en tant qu'assistant de recherche mais nécessitait la même supervision que vous donneriez à un collègue compétent mais peu fiable. Chaque résultat devait être vérifié par rapport aux données originales. Ils prévoient de l'utiliser à nouveau, mais uniquement parce qu'ils comprennent maintenant ses modes d'échec spécifiques.
L'article est disponible en accès libre sous licence CC BY 4.0 à l'adresse https://doi.org/10.1108/AIIE-06-2025-0151.
📖 Read the full source: r/ClaudeAI
👀 See Also

L'agent IA RunLobster intègre les données commerciales pour fournir des insights opérationnels.
Un développeur a donné à RunLobster un accès root à ses systèmes d'entreprise, incluant Stripe, le CRM, les e-mails et les transcriptions d'appels. L'agent surveille de manière autonome les opérations, signale les anomalies et fournit des briefings détaillés basés sur l'analyse intégrée des données.

Fractionner les agents d'IA pour éviter la perte de contexte
Un développeur décrit la division d'un seul agent d'IA en trois agents spécialisés dotés de mémoires et d'espaces de travail distincts pour éviter les problèmes de fenêtre de contexte. Les agents communiquent via un simple système de boîte aux lettres pour coordonner des tâches comme la planification de voyage.

Équipes d'IA Multi-Agents Utilisant le Baptême Contextuel pour Améliorer les Revues de Code
Un développeur exécutant 18 générations d'équipes d'agents IA a découvert que les agents qui lisent les lettres et rétrospectives des générations précédentes rédigent des revues de code nettement meilleures que ceux qui ne lisent que le code, qualifiant cette pratique de 'Baptême Contextuel'.

Exécuter Claude Code en tant que moteur de jugement pur sur l'ensemble du cycle de développement logiciel
Un développeur partage son architecture utilisant Claude Code comme moteur de raisonnement dans un système multicouche : Python gère l'orchestration, Claude Code s'occupe de l'écriture et de la révision du code, avec des sous-agents isolés et une couche wiki persistante.