AI Functions: ランタイムコード自動生成と自動検証の完全ガイド

AI Functionsは、Strands Agents SDK上に構築されたStrands Labsの新プロジェクトで、継続的な自動検証を伴う実行時AIコード生成を可能にします。人間が統合するためのテキストを生成するだけでなく、呼び出し時にアプリケーション内で実行されるコードを生成し、DataFrame、Pydanticモデル、データベース接続などのネイティブなPythonオブジェクトを返します。

AI Functionsの仕組み

中核となる抽象化は@ai_functionデコレータです。実装コードの代わりに自然言語の仕様をdocstringに記述したPython関数を作成します。関数が呼び出されると、デコレータが呼び出しを傍受し、docstringからプロンプトを構築（引数を置換）、LLMに送信し、生成されたコードをPythonプロセス内で実行し、結果をネイティブオブジェクトとして返します。

以下はソースからの基本的な例です：

from ai_functions import ai_function

@ai_function
def translate_text(text: str, lang: str) -> str:
    """
    以下のテキストを指定言語に翻訳します：{lang}。
    {text}
    """
result = translate_text("The quarterly results exceeded expectations.", lang="French")

重要な差別化要素：自動検証

重要な機能は事後条件です。これは正しい出力がどのようなものかを定義するプレーンなPythonアサーションです。これらはデプロイ前だけでなく、すべての関数呼び出しで実行されます。検証が失敗すると、システムはエラーをフィードバックとして自動的に再試行します。人間は生成されたコードを検査せず、事後条件が毎回検証を処理します。

Software 3.1の概念

この記事は、Andrej Karpathyのフレームワーク（Software 3.0は「人間がプロンプトし、LLMが生成し、人間が検証」）からの進化として「Software 3.1」と位置付けています。AI Functionsは「人間が仕様を定義し、LLMが生成・実行し、機械が検証する（実行時に）」を表します。実行モデルは根本的に異なります：LLMは人間が統合するためのテキストを生成するのではなく、アプリケーション内で直接実行されるコードを生成します。

これにより、3つの側面が同時に変化します：AIがソフトウェアのどこに適合するか（開発時だけでなく実行時）、何を生成するか（シリアライズされたテキストではなくメソッドを呼び出せるライブオブジェクト）、どのように信頼するか（一度限りの人間のレビューではなく継続的な自動検証）。

📖 完全なソースを読む： HN AI Agents