10 Open-Source-LLMs schlagen Claude Opus 4.6 im Trading-Test mit 10x weniger Kosten

Ein Reddit-Nutzer auf r/LocalLLaMA führte einen Vergleichstest mit 10 verschiedenen großen Sprachmodellen durch, um deren Leistung bei der Erstellung von Handelsstrategien zu bewerten. Die Ergebnisse stellen Annahmen über Kosten-Leistungs-Verhältnisse bei kommerziellen LLMs in Frage.

Testmethodik und Modelle

Der Nutzer startete 10 LLMs mit derselben Aufforderung: "Erstelle die beste Handelsstrategie." Zu den getesteten Modellen gehörten:

Claude Opus 4.6
Gemini 3, 3.1 Pro und GPT-5.2
Gemini Flash 3, GPT-5-mini, Kimi K2.5 und Minimax 2.5

Der Test wurde dreimal durchgeführt, um die Konsistenz der Ergebnisse zu überprüfen.

Wichtige Erkenntnisse

Laut der Quelle:

Minimax 2.5 und Gemini 3.1 führten die Rangliste an
Die Modelle von Anthropic (einschließlich Opus 4.6) schnitten "enttäuschend" ab und schafften es nicht unter die Top 4
Claude Opus 4.6 kostete 10-mal mehr als konkurrierende Modelle
Open-Source-Modelle waren deutlich langsamer als die Modelle von Anthropic und Google

Der Nutzer äußerte anfängliche Skepsis gegenüber den Ergebnissen und erklärte: "Ehrlich gesagt, ich habe die Ergebnisse beim ersten Mal nicht geglaubt." Nach der Überprüfung kam er zu dem Schluss: "Die Ergebnisse sind legitim."

Praktische Implikationen

Für Entwickler, die KI-Coding-Agenten nutzen, deutet dies darauf hin, dass für bestimmte spezialisierte Aufgaben wie die Erstellung von Handelsstrategien Open-Source-Modelle möglicherweise eine bessere Leistung bei deutlich niedrigeren Kosten bieten. Der Hauptkompromiss ist die Geschwindigkeit – Open-Source-Modelle wurden als "viel langsamer" beschrieben als kommerzielle Alternativen von Anthropic und Google.

Die Schlussfolgerung des Nutzers war direkt: "Abgesehen davon gibt es keinen guten Grund, Opus oder Sonnet für diese Aufgabe zu verwenden."

📖 Read the full source: r/LocalLLaMA

Open-Source-LLMs übertreffen Claude Opus 4.6 bei der Generierung von Handelsstrategien zu geringeren Kosten.

Testmethodik und Modelle

Wichtige Erkenntnisse

Praktische Implikationen

👀 Siehe auch

Yann LeCuns KI-Startup sammelt 1 Milliarde US-Dollar in Europas größter Seed-Runde ein.

Claude Opus 4.7 leidet unter erhöhten Fehlerraten — Status-Update

Macs für lokale LLMs und OpenClaw: Prompt-Verarbeitungsengpass macht Cloud günstiger

OpenClaw 2026.6.6: OpenRouter-Onboarding, mobile Steuerung, Stabilitätskorrekturen