AI機能:自動検証によるランタイムコード生成

AI Functionsは、Strands Agents SDK上に構築されたStrands Labsの新プロジェクトで、継続的な自動検証を伴う実行時AIコード生成を可能にします。人間が統合するためのテキストを生成するだけでなく、呼び出し時にアプリケーション内で実行されるコードを生成し、DataFrame、Pydanticモデル、データベース接続などのネイティブなPythonオブジェクトを返します。
AI Functionsの仕組み
中核となる抽象化は@ai_functionデコレータです。実装コードの代わりに自然言語の仕様をdocstringに記述したPython関数を作成します。関数が呼び出されると、デコレータが呼び出しを傍受し、docstringからプロンプトを構築(引数を置換)、LLMに送信し、生成されたコードをPythonプロセス内で実行し、結果をネイティブオブジェクトとして返します。
以下はソースからの基本的な例です:
from ai_functions import ai_function
@ai_function
def translate_text(text: str, lang: str) -> str:
"""
以下のテキストを指定言語に翻訳します:{lang}。
{text}
"""
result = translate_text("The quarterly results exceeded expectations.", lang="French")
重要な差別化要素:自動検証
重要な機能は事後条件です。これは正しい出力がどのようなものかを定義するプレーンなPythonアサーションです。これらはデプロイ前だけでなく、すべての関数呼び出しで実行されます。検証が失敗すると、システムはエラーをフィードバックとして自動的に再試行します。人間は生成されたコードを検査せず、事後条件が毎回検証を処理します。
Software 3.1の概念
この記事は、Andrej Karpathyのフレームワーク(Software 3.0は「人間がプロンプトし、LLMが生成し、人間が検証」)からの進化として「Software 3.1」と位置付けています。AI Functionsは「人間が仕様を定義し、LLMが生成・実行し、機械が検証する(実行時に)」を表します。実行モデルは根本的に異なります:LLMは人間が統合するためのテキストを生成するのではなく、アプリケーション内で直接実行されるコードを生成します。
これにより、3つの側面が同時に変化します:AIがソフトウェアのどこに適合するか(開発時だけでなく実行時)、何を生成するか(シリアライズされたテキストではなくメソッドを呼び出せるライブオブジェクト)、どのように信頼するか(一度限りの人間のレビューではなく継続的な自動検証)。
📖 完全なソースを読む: HN AI Agents
👀 See Also

OpenClaw 清掃員スキル:自動化システム管理とセキュリティ強化のための
開発者が、Claude Codeを使用してOpenClawマシンにSSH接続し、サンドボックス化、OSの健全性、チャネルセキュリティなどの設定を強化し、CLAUDE.mdに監査手順を記載したプロジェクトフォルダを維持するスキルを作成しました。

LetMeWatch: PythonプラグインがFFmpegのシーン検出を介してClaudeに動画分析機能を追加
開発者がLetMeWatchという約200行のPythonプラグインを作成し、FFmpegを使用してシーン検出を行い、視覚的な変化があるフレームのみを抽出してタイムスタンプを付け、バッチでClaudeのマルチモーダル視覚機能に送信することで、Claudeが動画を分析できるようにしました。

Claude Codeベストプラクティスリポジトリ、AIエージェントで完全構築し5万スター達成
Claudeのベストプラクティスが詰まったGitHubリポジトリで、自律型Claudeコードワークフローにより100%開発・保守されています。5万スターを突破し、2026年にパキスタンで最もスターを獲得したリポジトリとなりました。

AlterSpec v1.0:AIエージェントのためのランタイムポリシー強制
AlterSpec v1.0は、AIエージェントとそのツールの間に位置するオープンソースのランタイム強制エンジンであり、実行前にYAMLで定義されたポリシーに対してアクションを評価します。許可/拒否/レビューの決定、暗号化されたポリシー署名、監査ログ機能を提供します。