エア:Rustで書かれたPython用SIMDコンパイラ

Eäの機能
EäはSIMDカーネル用のコンパイラで、一般的なワークフローの問題を解決します:Pythonコードを書き、ホットループを見つけるためにプロファイリングし、Cで書き直し、ctypesと格闘し、ポインタをデバッグし、最終的に5倍の高速化を得る——そして翌週には同じプロセスを繰り返すという問題です。
仕組み
Eäでは、以下の手順で行います:
- 小さな.eaファイルを書く
- 1つのコマンドを実行する
- 通常の関数のようにPythonから呼び出す
カーネルはネイティブのベクトル化速度で実行されます。使用例:
import ea
kernel = ea.load("fma.ea")
result = kernel.fma_f32x8(a, b, c, out) # NumPyより6.6倍高速
技術詳細
コンパイラは以下を生成します:
- 共有ライブラリ
- Pythonラッパー
- Rust、C++、PyTorch、CMakeバインディングも
ターゲットアーキテクチャ:
- x86-64(AVX2 / AVX-512)
- AArch64(NEON)
コンパイラ自体:
- 約12,000行のRust
- 475のテスト
- ctypes、ヘッダーファイル、ビルドシステムは不要
開発背景
開発者はAIモデルの助けを借りてEäを構築し、Claudeで重い作業を行いながらアーキテクチャの制御を維持しました。主な洞察は、SIMD自体よりもすべての「接着コード」を処理することが重要であり、開発者がカーネルにのみ集中できるようにすることでした。
ベンチマーク
ベンチマークでは、fma_f32x8の例でNumPyよりも6.6倍高速な性能を示しています。開発者は、これらはかなり単純なセットアップからのものですが、公平で再現可能な状態を保つよう努めたと述べています。
📖 Read the full source: r/ClaudeAI
👀 See Also

LLM協議会の分析が明らかにする実用的なClaudeコードトークン最適化戦略
ある開発者がLLM Councilツールを5つのペルソナで使用し、Claude Codeの使用パターンを分析した結果、デフォルトでの拡張思考モードが最大のトークン消費要因であることを特定しました。結果として得られたプレイブックにより、出力品質を同等以上に保ちながら60〜70%のトークン削減を達成しました。

MCPサーバーがClaudeをCellarTrackerワイン在庫に接続
ある開発者が、ClaudeをCellarTrackerアカウントに直接接続するMCPサーバーを構築しました。これにより、ワインコレクションを問い合わせる際の手動CSVエクスポートが不要になります。

Galadriel: 永続的Claudeエージェント向けオープンソースのウォームキャッシュハーネス
Galadrielは、Claude用の3層スタックキャッシュハーネスで、100Kトークンプロンプトのコストを87%削減し、レイテンシを3秒未満に抑えます。永続的なベクターメモリのためにMemPalaceを統合しています。

Weejur: GitHub Pages公開のためのシンプルなUIフロントエンド
Weejurは、GitHub Pagesを介してウェブサイトを公開するための簡素化されたUIを提供する無料ツールで、OAuthログイン後にHTMLを貼り付けたりファイルをアップロードしたりできます。