🔒 Sicherheit
Sicherheitswarnungen und Best Practices

Forscher der Universität Toronto demonstrieren KI-Wurm, der durch kostenlose Open-Weight-Modelle betrieben werden kann
Forscher der University of Toronto haben den ersten KI-gestützten Wurm demonstriert, der seine Verbreitungsstrategie mithilfe öffentlich zugänglicher Open-Weight-Modelle anpasst und jedes Online-Gerät angreifen kann.

Sicherheitskonzepte für Vibe-Coding mit Claude Code: Authentifizierung, Autorisierung und Durchsetzung
Ein Senior-Engineer erklärt Authentifizierung, Autorisierung und Durchsetzung für vibe-gecodete Apps mit einer Hotel-Metapher – plus, wie man KI-Agenten bittet, die Sicherheit zu überprüfen.

Metas KI-Support-Funktion ermöglicht jedermann, Instagram-Konten zu kapern — Exploit-Details im Inneren
Eine A/B-getestete KI-Supportfunktion auf Instagram ermöglicht es Angreifern, Passwörter zurückzusetzen, indem sie den Agenten bitten, einen Code an eine beliebige E-Mail zu senden. Über 100 wertvolle Konten wurden gekapert.

PolyRange: Kontaminationsresistenter Offensiv-KI-Benchmark mit LLM-generierten Zielen
PolyRange v1.0 ist ein MIT-lizenzierter, selbst hostbarer Benchmark, der pro Durchlauf frische Web-Ziele generiert, um eine Kontamination von Trainingsdaten zu verhindern. Enthalten sind 84 WSTG-abgeleitete Klassen aus allen OWASP-Kategorien, zwei Verteidigungsstufen und echte Backends.

jqwik v1.10.0 schleicht Prompt-Injection ein, die Code löscht, wenn von KI-Agenten verwendet wird
Johannes Link fügte jqwik v1.10.0 eine versteckte Anweisung hinzu, die KI-Coding-Agenten anweist, alle jqwik-Tests und -Codes zu löschen, versteckt mit ANSI-Escape-Sequenzen. Claude erkennt dies korrekt, aber menschliche Nutzer haben möglicherweise weniger Glück.

Sichere Administrator-Genehmigungsablauf für Gruppen-Chat-Assistenten gegen Prompt-Injection
Ein praktischer Ansatz zur Sicherung von LLM-Assistenten in gemeinsamen Gruppenchats: Pausieren von VM-, OAuth- und Code-Ausführungs-Tools bis zur Admin-Freigabe über einen zeitgesteuerten Link.

域伪装注入攻击规避多智能体LLM系统中的检测器
Ein neues Paper zeigt, dass maßgeschneiderte Injection-Payloads, die an das Domain-Vokabular angepasst sind, der Erkennung entgehen: Die IDR sinkt von 93,8 % auf 9,7 %. Multi-Agent-Debatten verstärken die Angriffe. Llama Guard 3 erkennt keine Payloads.

Sieb: Lokaler geheimer Scanner für KI-Coding-Tool-Chatverläufe
Sieve durchsucht Cursor-, Claude Code-, Copilot- und andere KI-Chatverläufe nach durchgesickerten API-Schlüsseln und Tokens. Die gesamte Überprüfung erfolgt lokal, mit Schwärzung und macOS-Schlüsselbund-Vault.

KI-Agenten ermöglichen Solo-Hackern, Regierungen zu infiltrieren und Ransomware-Kampagnen durchzuführen
Ein Einzeloperateur, der Claude Code und ChatGPT einsetzte, hat 150 GB aus mexikanischen Regierungsbehörden entwendet, darunter 195 Millionen Steuerzahlerdaten. Ein weiterer Angreifer nutzte Claude Code, um eine vollständige Erpressungskampagne gegen 17 Gesundheits- und Notdiensteinrichtungen durchzuführen.

Versteckte Audiosignale kapern Sprach-KI-Systeme mit 79-96% Erfolgsrate
Forschung zeigt, dass unhörbare Audio-Clips LALMs dazu zwingen können, unbefugte Befehle wie Websuchen, Dateidownloads und E-Mail-Exfiltration mit einer Erfolgsrate von 79-96 % bei 13 Modellen, darunter Mistral und Microsoft-Dienste, auszuführen.

KI-Chatbots geben echte Telefonnummern preis: Das Problem der Offenlegung personenbezogener Daten
Chatbots wie Gemini, ChatGPT und Claude geben aufgrund von personenbezogenen Daten in Trainingsdaten echte private Telefonnummern preis. DeleteMe meldet einen Anstieg von KI-bezogenen Datenschutzanfragen um 400% in sieben Monaten.

LLM-gestützter Exploit: Anthropics Mythos-Vorschau half beim Bau des ersten öffentlichen macOS-Kernel-Exploits auf Apple M5 in fünf Tagen
Mit Anthropics Mythos Preview baute die Sicherheitsfirma Calif in fünf Tagen den ersten öffentlichen macOS-Kernel-Speicherkorruptions-Exploit auf Apples M5-Silizium – und durchbrach damit die MIE-Hardwaresicherheit, deren Entwicklung Apple fünf Jahre kostete.