Claude Codeのための学術研究スキル:論文執筆における人間参加型パイプライン

Academic Research Skills (ARS) for Claude Codeは、研究から出版までの全パイプライン(研究→執筆→レビュー→改訂→仕上げ)をサポートするプラグインです。人間参加型(human-in-the-loop)システムとして設計されており、完全な自動化を明確に拒否します。このツールは、文献探索、引用書式設定、データ検証、論理的一貫性チェックといった雑務を処理し、研究者は問題定義、方法選択、解釈、中心的な議論の制御を保持します。
クイックインストール(Claude Code v3.7.0+)
/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills/ars-plan でソクラテス式対話を開始して章構成をマッピングするか、/ars-lit-review "あなたのトピック" で一回限りの文献レビューを実行して確認してください。
なぜ人間参加型か?
ARSはLuら(2026, Nature 651:914-919)を引用しています。彼らはAI Scientistを構築しました。これは、トップML会場(ICLR 2025 workshop、スコア6.33/10、ワークショップ平均4.87)でブラインドピアレビューを通じて論文を発表した初の完全自律型AI研究システムです。彼らのLimitationsセクションには、実装のバグ、幻覚の結果、近道への依存、バグを洞察として再解釈、方法論の捏造、フレームロック、引用幻覚などの障害モードが列挙されています。ARSは、AIで強化された人間の研究者が、どちらか単独よりもこれらの障害モードを回避できるという前提に基づいています。
誠実性ゲートとキャリブレーション
ステージ2.5と4.5では、7モードのブロックチェックリスト(academic-pipeline/references/ai_research_failure_modes.mdを参照)を実行します。レビューアはオプトインのキャリブレーションモードを提供し、ユーザーが提供するゴールドセットに対して自身の偽陰性率/偽陽性率を測定します。
機能
- スタイルキャリブレーション:過去の作品からあなたの声を学習します。
- 文章品質チェック:機械生成的な散文パターンを検出します。
- Semantic Scholar API検証(PaperOrchestra、Song、Song、Pfister & Yoon、2026、Googleに触発)。
- 漏洩防止プロトコル、VLM図検証、スコア軌跡追跡。
アーキテクチャ
完全なパイプラインドキュメントはdocs/ARCHITECTURE.mdにあり、フロー図、ステージ別マトリックス、データアクセスフロー、スキル依存関係グラフ、品質ゲート、モードリストを含みます。DOCX出力にはpandoc、APA 7.0 PDFにはtectonic + Source Han Serif TCフォントが必要です(Markdown出力はどちらも不要で動作します)。
📖 ソース全文を読む: HN AI Agents
👀 See Also

ClaudeがWindowsのUNCパスバグを自らデバッグし、自社のMCPファイルシステムサーバーを修正
開発者がClaude Opusを使用して、Windows上のMCP Filesystem ServerでUNCネットワーク共有パスがサブディレクトリ操作で失敗するバグを診断し修正しました。この修正は、UNC共有内のファイルやフォルダへのアクセスを妨げていたパス検証の問題に対処します。

SLayer: クエリから学習するAIエージェント向けのオープンソース・セマンティックレイヤー
SLayerは、AIエージェントがデータベースにクエリを実行し、モデルを管理し、MCP、REST、CLI、Pythonを介したインタラクションから学習できる、軽量で埋め込み可能なセマンティックレイヤーです。

ClawWatcher、200ユーザー達成、OpenClaw APIによる総節約額は2万8千ドル以上と報告
OpenClaw APIコストをリアルタイムで追跡するツール「ClawWatcher」が200ユーザーに到達。開発者によると、ユーザーは合計28,000ドル以上のAPIコストを節約し、平均コスト削減率は45%に上る。

LightMem:LLMエージェント向け軽量メモリシステム、10倍以上の性能向上と100分の1のコストを実現
LightMemはLLMエージェント向けのモジュラー型メモリシステムで、最大10.9%の精度向上を実現し、トークン数を最大117倍、API呼び出しを最大159倍、実行時間を12倍以上削減します。エージェントワークフロー全体でのスケーラブルな長文脈推論を目的として設計されています。