RelayCode VS Code拡張機能は、Claudeのコードを主権的なRDU経由でルーティングします

OpenGPUはRelayCodeをリリースしました。これはAIコーディングエージェント向けのローカルプロキシとして機能するVS Code拡張機能です。このツールはClaude CodeやGitHub Copilotからのリクエストを傍受し、OpenGPU Relayネットワークを経由して、主権的なインフラ上で動作するオープンウェイトモデルにルーティングします。
主な詳細
この拡張機能は、いくつかの具体的な機能とパフォーマンス特性を提供します:
- インフラストラクチャ: ワークロードはInfercomの再構成可能データフロー・ユニット(RDU)を経由してルーティングされます。これは専用の主権的コンピュートであり、米国の管轄外で、設計上GDPRに準拠しています。
- パフォーマンス: ベンチマークでは、DeepSeek-R1(671B)で250+トークン/秒、MiniMax M2.5で400+トークン/秒を達成しています。データフローアーキテクチャにより、モデル切り替えはほぼ瞬時(ミリ秒単位)です。
- コンテキスト管理: 拡張機能は
CLAUDE_AUTOCOMPACT設定を自動的に管理し、エージェントがモデルのコンテキストウィンドウ内に収まり、クラッシュしないようにします。 - プライバシー: コードはローカルマシン上に留まり、推論リクエストのみがデータ保持なしでリレーネットワークに送信されます。
- 現在の状況: チームは約23件のインストールを報告しており、コミュニティからのリレー遅延に関するフィードバックを求めています。
- アクセス: RDUの速度を無料でテストできるプロモーションクレジットが利用可能です。
このツールは、Anthropic APIのコストを削減しながらClaude CLIのワークフローを維持する方法として位置づけられており、特にリファクタリング作業に有用です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

OpenClawスキルにより、アクセシビリティツリートークンが60万から1.3千に削減されます。
開発者が、現代のWebページをスクレイピングする際のアクセシビリティツリーにおけるトークン肥大化に対処するOpenClawスキルを作成しました。このスキルは、データをLLMに送信する前に、機械学習を用いて要素をランク付けし、不要な部分を刈り込むものです。

オープンソースフレームワークがClaude Code CLIを使用してGitHubリポジトリの自動監視を実現
開発者が、複数のリポジトリにわたるGitHubアクティビティを定期的に監視するためにClaude Code CLIをcronスケジュールで実行するフレームワークをオープンソース化しました。このツールには状態追跡、重複排除、Discord通知、および変更がない場合にAPIコストを回避する事前チェックシステムが含まれています。

Definable AIは、単一フラグでセルフホスト型のオブザーバビリティダッシュボードを追加します。
Definable AIは、AIエージェントを構築するためのオープンソースPythonフレームワークで、1つのフラグで有効化できる組み込みのオブザーバビリティダッシュボードを追加しました。このダッシュボードは、外部依存なしでリアルタイムイベントストリーミング、トークン管理、レイテンシーメトリクス、実行再生を提供します。

Claweの探求:オープンソースのマルチエージェント調整システム
Claweは、効率的なマルチエージェント調整を可能にするオープンソースツールで、スケジューリング、タスク管理、リアルタイム通知などの機能を提供します。