💡 Tipps
Schnelle Tipps für mehr Produktivität

Fix Ollama Cloud Model maxTokens: Obergrenze ist 16K, nicht der Konfigurationswert
Ollama Cloud begrenzt die Ausgabe auf 16.384 Token, unabhängig von der maxTokens-Konfiguration. Setze maxTokens auf 14.000, um EOF-Fehler zu vermeiden. Strukturiere lange Ausgaben um oder leite schwere Agents direkt an den Anbieter weiter.

Die meisten Menschen nutzen Claude nur zu 5 % seiner Kapazität – So beheben Sie das
Nach über 60 Stunden Testen von Prompts auf Claude Opus 4.7 teilt ein Nutzer ein 5-Schritte-Rezept: Rolle zuweisen, spezifischen Kontext laden, Einschränkungen setzen, Ausgabeformat definieren, Forcing-Funktion hinzufügen.

OpenClaw Dashboard trennt nach Update 2026.5.27 ab? Fix: Entfernen des hängenden Update-Launchd-Jobs
Nach dem Update auf 2026.5.27 verursacht ein hängengebliebener Update-launchd-Job WebSocket-Abbrüche im Dashboard und Telegram-Ausfälle. Das Entfernen des Jobs stellt die Stabilität wieder her.

Claude CLI v2.1.154 bricht lokales vLLM — Einzeiliger Patch behebt es
Claude CLI ≥2.1.154 fügt drei neue API-Rollen (ctx, msg, system) hinzu, die die lokale vLLM-Kompatibilität brechen. Ein einzeiliger Patch für vLLMs Anthropic-Protokoll stellt sie wieder her.

Arbeiteragenten sollten nicht direkt Speicher schreiben: Ein Kurator-Agent-Muster
Ein Reddit-Beitrag beschreibt ein Memory-Curator-Muster, das verhindert, dass Worker-Agenten direkt in den gemeinsamen Speicher schreiben, indem Ereignisse durch eine Validierungs- und Bereichsschicht geleitet werden.

Schreib nicht einfach KI-Text ab – bring deine eigene Perspektive ein
Ein direkter Appell an Entwickler: Hört auf, KI-Antworten wortwörtlich zu kopieren. Nutzt KI als Schreibpartner, formuliert dann aber in eigenen Worten.

Wie man die Claude-Limits vermeidet: Behandle jede Sitzung wie ein Token-Budget
Ein Nutzer zeigt, wie er tägliche Claude-Limits umgeht, indem er Nachrichtenbloat vermeidet – Aufgaben eingenzen, nur relevanten Kontext laden, nach jeder Sitzung löschen. Inklusive praktischem Workflow und Infografik.

KI-gestützte Entwicklung mit 100.000 Zeilen Rust: Verträge, spezifikationsgetriebene Entwicklung und Leistung
Cheng Huang hat mit AI-Agenten eine Rust-basierte Multi-Paxos-Engine entwickelt, die 300.000 Operationen pro Sekunde erreicht. Kernmethoden: KI-geschriebene Code-Contracts, leichtgewichtige spezifikationsgetriebene Entwicklung und aggressive Optimierung.

Gute KI-gestützte Entwicklung findet auf Systemebene statt, nicht auf Aufgabenebene
Ein Reddit-Nutzer erklärt, wie der Wechsel von der Korrektur von KI-Agenten-Ausgaben zur Gestaltung von Einschränkungen – wie einer Linter-Regel, die UI-Navigation erzwingt – ganze Fehlerklassen dauerhaft verhindert.

3 Wochen OpenClaw: Token-Kosten, Loops und Kompaktierung – Lehren aus der Praxis
Nachdem er Tokens für Heartbeat-Checks mit Opus verbrannt, Agenten-Loops bekämpft und Kontext durch Kompaktierung verloren hat, teilt ein Reddit-Nutzer die mühsam erarbeiteten Lösungen: günstigere Modelle für triviale Aufgaben verwenden, Anti-Loop-Regeln schreiben und Entscheidungsprotokolle führen.

Routing Agent Subtasks zu günstigeren Modellen senkte Kosten von $18 auf $4 bei gleicher Refaktorisierung
Ein Entwickler senkte die Kosten für Agentenläufe von 18 $ auf 4 $, indem er Routineaufgaben (Lint, Umbenennungen, Konfigurationsänderungen) an günstige Modelle wie DeepSeek V4 Pro und Tencent Hunyuan Hy3 weiterleitete und Opus 4.7 für komplexe Überlegungen reservierte.

Behandlung von Agentendurchläufen als Überprüfungspakete: Ein praktisches Muster für Claude Code & Codex
Ein Entwickler berichtet, wie das Erstellen eines strukturierten Ordners pro Agentenlauf (Recherche, Entwürfe, Auswertungen, Freigabepaket, Metriken, Gedächtnis) Fehler sichtbar macht und Iterationen beschleunigt.