KI-Funktionen: Laufzeit-Codegenerierung mit automatisierter Verifizierung

AI Functions ist ein neues Projekt von Strands Labs, das auf dem Strands Agents SDK aufbaut und Laufzeit-AI-Codegenerierung mit kontinuierlicher automatisierter Verifizierung ermöglicht. Anstatt nur Text für die Integration durch Menschen zu generieren, erzeugt es Code, der zur Aufrufzeit innerhalb Ihrer Anwendung läuft und native Python-Objekte wie DataFrames, Pydantic-Modelle oder Datenbankverbindungen zurückgibt.
Wie AI Functions funktionieren
Die Kernabstraktion ist der @ai_function-Dekorator. Sie schreiben eine Python-Funktion mit einer natürlichen Sprachspezifikation im Docstring anstelle von Implementierungscode. Wenn die Funktion aufgerufen wird, fängt der Dekorator den Aufruf ab, konstruiert eine Eingabeaufforderung aus dem Docstring (mit Argumentersetzung), sendet sie an ein LLM, führt den generierten Code in Ihrem Python-Prozess aus und gibt das Ergebnis als natives Objekt zurück.
Hier ist das grundlegende Beispiel aus der Quelle:
from ai_functions import ai_function
@ai_function
def translate_text(text: str, lang: str) -> str:
"""
Übersetzen Sie den folgenden Text in die angegebene Sprache: {lang}.
{text}
"""
result = translate_text("The quarterly results exceeded expectations.", lang="French")
Wesentlicher Unterschied: Automatisierte Verifizierung
Das entscheidende Merkmal sind Nachbedingungen – einfache Python-Assertions, die definieren, wie eine korrekte Ausgabe aussehen soll. Diese werden bei jedem Funktionsaufruf ausgeführt, nicht nur vor dem Deployment. Wenn die Verifizierung fehlschlägt, wiederholt das System automatisch mit dem Fehler als Feedback. Der Mensch inspiziert niemals den generierten Code; die Nachbedingungen übernehmen die Verifizierung jedes Mal.
Software 3.1 Konzept
Der Artikel positioniert dies als "Software 3.1" – eine Weiterentwicklung von Andrej Karpathys Framework, bei dem Software 3.0 "menschliche Eingabeaufforderungen, LLM generiert, Mensch verifiziert" ist. AI Functions repräsentieren "Mensch spezifiziert, LLM generiert und führt aus, Maschine verifiziert – zur Laufzeit." Das Ausführungsmodell unterscheidet sich grundlegend: Das LLM erzeugt nicht Text für die menschliche Integration, sondern Code, der direkt in Ihrer Anwendung läuft.
Dies verändert drei Aspekte gleichzeitig: wo AI in Ihrer Software passt (Laufzeit statt nur Entwicklungszeit), was sie produziert (lebende Objekte, auf die Sie Methoden aufrufen können, statt serialisiertem Text) und wie Sie ihr vertrauen (kontinuierliche automatisierte Verifizierung statt einmaliger menschlicher Überprüfung).
📖 Read the full source: HN AI Agents
👀 Siehe auch

Warum Ihre Claude Code UI-Ausgabe driftet und wie eine strukturierte Spezifikation das Problem behebt
Ein Entwickler erklärt, dass inkonsistente UI-Ausgaben von Claude Code kein Prompt-Problem sind – es ist ein Format-Problem. Die Angabe exakter Hex-Codes, Schriftstärken, Abstände, Bildschirmzustände und Übergänge beseitigt Drift. Außerdem haben sie einen MCP-Server als Open Source veröffentlicht, der Bildschirmaufnahmen in strukturierte Spezifikationen umwandelt.

OmniCoder-9B: Ein 9-Milliarden-Parameter-Codierungsagent, feinabgestimmt auf 425.000 agentische Trajektorien
Tesslate hat OmniCoder-9B veröffentlicht, ein 9-Milliarden-Parameter-Modell für Coding-Agenten, das auf der hybriden Architektur von Qwen3.5-9B feinabgestimmt wurde. Es wurde mit über 425.000 kuratierten agentischen Coding-Trajektorien von Claude Opus 4.6, GPT-5.4, GPT-5.3-Codex und Gemini 3.1 Pro trainiert.

antirezs DS4: Ausführen von DeepSeek V4 Flash mit 1M Kontext auf Mac Metal und DGX
Redis-Erfinder Salvatore Sanfilippo hat DS4 veröffentlicht, ein Projekt, um DeepSeek V4 Flash mit einem 1M-Kontextfenster auf Mac Metal Hardware und DGX auszuführen, mit OpenAI/Anthropic-Endpunkten für agentische Codierungstools.

Kontext-Gateway: Ein Open-Source-Proxy zur Komprimierung von KI-Agenten-Kontext
Context Gateway ist ein Open-Source-Proxy, der zwischen Coding-Agenten und LLMs sitzt und Tool-Ausgaben komprimiert, bevor sie in das Kontextfenster gelangen. Es verwendet kleine Sprachmodelle, um Signale im Kontext zu erkennen, führt Hintergrundkomprimierung bei 85% Fensterkapazität durch und beinhaltet Ausgabenobergrenzen, ein Dashboard und Slack-Benachrichtigungen.