Der Aufbau eines autonomen Forschungsagents mit C# und lokalen LLMs

Hier ist ein Blick auf einen neuen autonomen Forschungsagenten, der in C# erstellt wurde und lokale LLMs nutzt, insbesondere Ollama sowie das Modell llama3.1:8b. Der Agent automatisiert den Prozess der URL-Verarbeitung, indem er Suchanfragen generiert, Websuchen über die Brave Search API durchführt und relevante Daten extrahiert, was schließlich in einem strukturierten Markdown-Bericht gipfelt.
Wichtige Details
- Der Agent akzeptiert eine Themen Eingabe, zum Beispiel "persistent memory for AI agents".
- Er formuliert autonom 5-8 Suchanfragen.
- Die Suchen werden über die Brave Search API durchgeführt, und die besten Quellen werden abgerufen und analysiert.
- Der Agent liest 8-12 Quellen und extrahiert 5-8 wichtige Ergebnisse.
- Alle Datenverarbeitung erfolgt lokal mit dem Ollama (llama3.1:8b) Modell, ohne auf OpenAI/Anthropic APIs angewiesen zu sein.
- Das Ergebnis ist ein Markdown-Bericht mit vollständigen Zitaten.
Leistung und Architektur
Die aktuelle Konfiguration läuft auf einem Ryzen 5 5500, nur mit CPU, mit 16 GB RAM und benötigt etwa 15 Minuten pro Forschungszyklus. Der Entwickler stellt fest, dass 3B-Modelle, wie llama3.2, unzureichend für Tool-Aufrufe sind, weshalb 8B ein notwendiges Minimum für zuverlässige Leistung darstellt.
Wichtige Herausforderungen umfassen die Notwendigkeit, Ergebnisse vor der Synthese zu kürzen, um zu verhindern, dass das Modell bei langen Kontexten ins Stocken gerät, sowie gelegentliche fehlerhafte Tool-Aufrufe, selbst mit 8B-Modellen, die durch erneutes Versuchen mit veränderten Eingabeaufforderungen behoben werden. Der Agent nutzt SQLite in Verbindung mit Embeddings, um den Speicher auf persönlicher Ebene zu verwalten, wodurch die Notwendigkeit einer Vektordatenbank entfällt.
Technologie-Stack
- C# / .NET 8
- Ollama
- SQLite
- Brave Search API (kostenfreies Kontingent)
Für Entwickler, die ihren eigenen Agenten erstellen möchten, gibt es ein Starter-Kit und einen 8-kapiteligen Leitfaden auf dem GitHub-Repository des Projekts, bereitgestellt unter der MIT-Lizenz, zusammen mit dem vollständigen Quellcode: hex-dynamics.
📖 Vollständige Quelle lesen: r/LocalLLaMA
👀 Siehe auch

Pilot: Ein Browser-Automatisierungstool, vollständig mit Claude Code erstellt
Ein Nicht-Entwickler nutzte Claude Code, um Pilot zu erstellen, ein Chrome-Automatisierungstool, das KI ermöglicht, Browser über die Navigation im Barrierefreiheitsbaum zu steuern. Das Tool weist klickbaren Elementen Nummern zu, sodass Claude Befehle wie 'click 5' ausgeben kann, anstatt Bildschirmpositionen zu erraten.

claude-sessions: Terminal-Benutzeroberfläche zum Durchsuchen von Claude-Code-Transkripten
claude-sessions ist ein Open-Source-Terminal-UI-Tool, das lokale Claude-Code-Transkriptdateien scannt und es Entwicklern ermöglicht, vergangene Sitzungen zu durchsuchen, zu suchen und fortzusetzen. Mit Claude Code selbst erstellt, bietet es WASD-Navigation, Stichwortsuche und Ein-Klick-Sitzungsfortsetzung.

Testreel: Programmatische Demo-Video-Erstellung mit Claude Code
Testreel ist ein npm-Paket, das aus JSON-, YAML- oder Playwright-Interaktionsbeschreibungen professionelle Produktdemo-Videos erzeugt. Es erstellt Webm/MP4/GIF-Videos mit Cursor-Overlays, Klick-Effekten und Farbverlaufs-Hintergründen.

Tendr Skill: Deterministische CLI-Operationen für die Agentenspeicherverwaltung
Tendr Skill ist eine Agent Skill, die das Denken von der Ausführung trennt, um strukturiertes Langzeitgedächtnis zu ermöglichen. Sie erlaubt es Agenten zu entscheiden, was geändert werden muss, während ein CLI-Tool die strukturellen Operationen deterministisch ausführt. Sie unterstützt [[wikilinks]] und explizite semantische Hierarchien über Dateien hinweg.