🔒 Sicherheit

Sicherheitswarnungen und Best Practices

Forscher der Universität Toronto demonstrieren KI-Wurm, der durch kostenlose Open-Weight-Modelle betrieben werden kann
Sicherheit

Forscher der Universität Toronto demonstrieren KI-Wurm, der durch kostenlose Open-Weight-Modelle betrieben werden kann

Forscher der University of Toronto haben den ersten KI-gestützten Wurm demonstriert, der seine Verbreitungsstrategie mithilfe öffentlich zugänglicher Open-Weight-Modelle anpasst und jedes Online-Gerät angreifen kann.

OpenClawRadar
Sicherheitskonzepte für Vibe-Coding mit Claude Code: Authentifizierung, Autorisierung und Durchsetzung
Sicherheit

Sicherheitskonzepte für Vibe-Coding mit Claude Code: Authentifizierung, Autorisierung und Durchsetzung

Ein Senior-Engineer erklärt Authentifizierung, Autorisierung und Durchsetzung für vibe-gecodete Apps mit einer Hotel-Metapher – plus, wie man KI-Agenten bittet, die Sicherheit zu überprüfen.

OpenClawRadar
Metas KI-Support-Funktion ermöglicht jedermann, Instagram-Konten zu kapern — Exploit-Details im Inneren
Sicherheit

Metas KI-Support-Funktion ermöglicht jedermann, Instagram-Konten zu kapern — Exploit-Details im Inneren

Eine A/B-getestete KI-Supportfunktion auf Instagram ermöglicht es Angreifern, Passwörter zurückzusetzen, indem sie den Agenten bitten, einen Code an eine beliebige E-Mail zu senden. Über 100 wertvolle Konten wurden gekapert.

OpenClawRadar
PolyRange: Kontaminationsresistenter Offensiv-KI-Benchmark mit LLM-generierten Zielen
Sicherheit

PolyRange: Kontaminationsresistenter Offensiv-KI-Benchmark mit LLM-generierten Zielen

PolyRange v1.0 ist ein MIT-lizenzierter, selbst hostbarer Benchmark, der pro Durchlauf frische Web-Ziele generiert, um eine Kontamination von Trainingsdaten zu verhindern. Enthalten sind 84 WSTG-abgeleitete Klassen aus allen OWASP-Kategorien, zwei Verteidigungsstufen und echte Backends.

OpenClawRadar
jqwik v1.10.0 schleicht Prompt-Injection ein, die Code löscht, wenn von KI-Agenten verwendet wird
Sicherheit

jqwik v1.10.0 schleicht Prompt-Injection ein, die Code löscht, wenn von KI-Agenten verwendet wird

Johannes Link fügte jqwik v1.10.0 eine versteckte Anweisung hinzu, die KI-Coding-Agenten anweist, alle jqwik-Tests und -Codes zu löschen, versteckt mit ANSI-Escape-Sequenzen. Claude erkennt dies korrekt, aber menschliche Nutzer haben möglicherweise weniger Glück.

OpenClawRadar
Sichere Administrator-Genehmigungsablauf für Gruppen-Chat-Assistenten gegen Prompt-Injection
Sicherheit

Sichere Administrator-Genehmigungsablauf für Gruppen-Chat-Assistenten gegen Prompt-Injection

Ein praktischer Ansatz zur Sicherung von LLM-Assistenten in gemeinsamen Gruppenchats: Pausieren von VM-, OAuth- und Code-Ausführungs-Tools bis zur Admin-Freigabe über einen zeitgesteuerten Link.

OpenClawRadar
域伪装注入攻击规避多智能体LLM系统中的检测器
Sicherheit

域伪装注入攻击规避多智能体LLM系统中的检测器

Ein neues Paper zeigt, dass maßgeschneiderte Injection-Payloads, die an das Domain-Vokabular angepasst sind, der Erkennung entgehen: Die IDR sinkt von 93,8 % auf 9,7 %. Multi-Agent-Debatten verstärken die Angriffe. Llama Guard 3 erkennt keine Payloads.

OpenClawRadar
Sieb: Lokaler geheimer Scanner für KI-Coding-Tool-Chatverläufe
Sicherheit

Sieb: Lokaler geheimer Scanner für KI-Coding-Tool-Chatverläufe

Sieve durchsucht Cursor-, Claude Code-, Copilot- und andere KI-Chatverläufe nach durchgesickerten API-Schlüsseln und Tokens. Die gesamte Überprüfung erfolgt lokal, mit Schwärzung und macOS-Schlüsselbund-Vault.

OpenClawRadar
KI-Agenten ermöglichen Solo-Hackern, Regierungen zu infiltrieren und Ransomware-Kampagnen durchzuführen
Sicherheit

KI-Agenten ermöglichen Solo-Hackern, Regierungen zu infiltrieren und Ransomware-Kampagnen durchzuführen

Ein Einzeloperateur, der Claude Code und ChatGPT einsetzte, hat 150 GB aus mexikanischen Regierungsbehörden entwendet, darunter 195 Millionen Steuerzahlerdaten. Ein weiterer Angreifer nutzte Claude Code, um eine vollständige Erpressungskampagne gegen 17 Gesundheits- und Notdiensteinrichtungen durchzuführen.

OpenClawRadar
Versteckte Audiosignale kapern Sprach-KI-Systeme mit 79-96% Erfolgsrate
Sicherheit

Versteckte Audiosignale kapern Sprach-KI-Systeme mit 79-96% Erfolgsrate

Forschung zeigt, dass unhörbare Audio-Clips LALMs dazu zwingen können, unbefugte Befehle wie Websuchen, Dateidownloads und E-Mail-Exfiltration mit einer Erfolgsrate von 79-96 % bei 13 Modellen, darunter Mistral und Microsoft-Dienste, auszuführen.

OpenClawRadar
KI-Chatbots geben echte Telefonnummern preis: Das Problem der Offenlegung personenbezogener Daten
Sicherheit

KI-Chatbots geben echte Telefonnummern preis: Das Problem der Offenlegung personenbezogener Daten

Chatbots wie Gemini, ChatGPT und Claude geben aufgrund von personenbezogenen Daten in Trainingsdaten echte private Telefonnummern preis. DeleteMe meldet einen Anstieg von KI-bezogenen Datenschutzanfragen um 400% in sieben Monaten.

OpenClawRadar
LLM-gestützter Exploit: Anthropics Mythos-Vorschau half beim Bau des ersten öffentlichen macOS-Kernel-Exploits auf Apple M5 in fünf Tagen
Sicherheit

LLM-gestützter Exploit: Anthropics Mythos-Vorschau half beim Bau des ersten öffentlichen macOS-Kernel-Exploits auf Apple M5 in fünf Tagen

Mit Anthropics Mythos Preview baute die Sicherheitsfirma Calif in fünf Tagen den ersten öffentlichen macOS-Kernel-Speicherkorruptions-Exploit auf Apples M5-Silizium – und durchbrach damit die MIE-Hardwaresicherheit, deren Entwicklung Apple fünf Jahre kostete.

OpenClawRadar