KI-Funktionen: Laufzeit-Codegenerierung mit automatisierter Verifizierung

AI Functions ist ein neues Projekt von Strands Labs, das auf dem Strands Agents SDK aufbaut und Laufzeit-AI-Codegenerierung mit kontinuierlicher automatisierter Verifizierung ermöglicht. Anstatt nur Text für die Integration durch Menschen zu generieren, erzeugt es Code, der zur Aufrufzeit innerhalb Ihrer Anwendung läuft und native Python-Objekte wie DataFrames, Pydantic-Modelle oder Datenbankverbindungen zurückgibt.

Wie AI Functions funktionieren

Die Kernabstraktion ist der @ai_function-Dekorator. Sie schreiben eine Python-Funktion mit einer natürlichen Sprachspezifikation im Docstring anstelle von Implementierungscode. Wenn die Funktion aufgerufen wird, fängt der Dekorator den Aufruf ab, konstruiert eine Eingabeaufforderung aus dem Docstring (mit Argumentersetzung), sendet sie an ein LLM, führt den generierten Code in Ihrem Python-Prozess aus und gibt das Ergebnis als natives Objekt zurück.

Hier ist das grundlegende Beispiel aus der Quelle:

from ai_functions import ai_function

@ai_function
def translate_text(text: str, lang: str) -> str:
    """
    Übersetzen Sie den folgenden Text in die angegebene Sprache: {lang}.
    {text}
    """
result = translate_text("The quarterly results exceeded expectations.", lang="French")

Wesentlicher Unterschied: Automatisierte Verifizierung

Das entscheidende Merkmal sind Nachbedingungen – einfache Python-Assertions, die definieren, wie eine korrekte Ausgabe aussehen soll. Diese werden bei jedem Funktionsaufruf ausgeführt, nicht nur vor dem Deployment. Wenn die Verifizierung fehlschlägt, wiederholt das System automatisch mit dem Fehler als Feedback. Der Mensch inspiziert niemals den generierten Code; die Nachbedingungen übernehmen die Verifizierung jedes Mal.

Software 3.1 Konzept

Der Artikel positioniert dies als "Software 3.1" – eine Weiterentwicklung von Andrej Karpathys Framework, bei dem Software 3.0 "menschliche Eingabeaufforderungen, LLM generiert, Mensch verifiziert" ist. AI Functions repräsentieren "Mensch spezifiziert, LLM generiert und führt aus, Maschine verifiziert – zur Laufzeit." Das Ausführungsmodell unterscheidet sich grundlegend: Das LLM erzeugt nicht Text für die menschliche Integration, sondern Code, der direkt in Ihrer Anwendung läuft.

Dies verändert drei Aspekte gleichzeitig: wo AI in Ihrer Software passt (Laufzeit statt nur Entwicklungszeit), was sie produziert (lebende Objekte, auf die Sie Methoden aufrufen können, statt serialisiertem Text) und wie Sie ihr vertrauen (kontinuierliche automatisierte Verifizierung statt einmaliger menschlicher Überprüfung).

📖 Read the full source: HN AI Agents

KI-Funktionen: Laufzeit-Codegenerierung mit automatisierter Verifizierung

Wie AI Functions funktionieren

Wesentlicher Unterschied: Automatisierte Verifizierung

Software 3.1 Konzept

👀 Siehe auch

OpenPlawd: OpenClaw-Fähigkeit für automatisierte Plaud-Besprechungsnotizen

Einführung in Swarmcore: Ein skalierbares Multi-Agenten-Framework in Python

Benchmark-Ergebnisse: GitHub CLI vs. MCP-Ansätze für KI-Agenten

Orion: Umgehung von CoreML zur direkten Ausführung und Schulung von LLMs auf der Apple Neural Engine