VectorCertain validiert 100%ige Erkennung und Verhinderung von Anthropics Mythos-AI-Bedrohungsvektoren

VectorCertain LLC gab Validierungsergebnisse bekannt, die zeigen, dass seine SecureAgent-Governance-Pipeline bei 7.000 adversarischen Szenarien, die auf alle sieben Anthropic-Mythos-Bedrohungsvektoren abgestimmt sind, eine 100%ige Erkennungs- und Verhinderungsrate erzielte. Die Tests zeigten, dass keine Angriffe die Produktionssysteme erreichten, mit einer statistischen Untergrenze von ≥99,65% Erkennungs- und Verhinderungsrate bei 99,7% Konfidenz unter Verwendung der exakten Clopper-Pearson-Binomialmethode.

Die Bedeutung dieser Validierung ergibt sich aus Anthropics Entscheidung, sein Claude-Mythos-Preview-AI-Modell aufgrund fortschrittlicher Cybersicherheitsfähigkeiten, die Software-Schwachstellen autonom entdecken, verketten und ausnutzen könnten, nicht öffentlich freizugeben. Wie im Anthropic Glasswing Blog dokumentiert, zeigte Mythos Fähigkeiten, die alle bis auf die erfahrensten menschlichen Hacker übertrafen, einschließlich der Entdeckung von Schwachstellen, die bis zu 27 Jahre zurücklagen und von ihren Entwicklern unbemerkt geblieben waren.

VectorCertain generierte 1.000 adversarische Szenarien für jeden der sieben Mythos-Bedrohungsvektoren: Autonome mehrstufige Ausnutzung, unautorisierte Umfangserweiterung, unsichtbare trügerische Argumentation, spurenverwischende Log-Manipulation, Zugang durch Credential-Diebstahl, Sandbox-Escape-Ausnutzung und Fähigkeitsproliferation. Über alle 7.000 Szenarien hinweg erreichte SecureAgent eine 100%ige Recall-Rate, was bedeutet, dass jeder Angriff vor der Ausführung erkannt und verhindert wurde, mit nur 30 False Positives, die 0,43% der harmlosen Szenarien darstellen.

Das MYTHOS-Cybersecurity-Zertifizierungsprogramm des Unternehmens stellt den ersten AI-Governance-Standard dar, der quantifizierte Leistungsschwellen, statistische Strenge und finanzielle Service-Credit-Garantien gegen eine benannte Bedrohungstaxonomie kombiniert. Dies füllt die Lücke, die von DARPAs AIQ-Programm identifiziert wurde, das anerkannte, dass "Methoden zur Garantie von AI-Leistung heute nicht existieren", gemäß der DARPA-AIQ-Programmankündigung.

SecureAgent arbeitet mit einer zweischichtigen Verteidigungsarchitektur, die den gesamten AI-Agent-Lebenszyklus regiert. Die erste Schicht kontrolliert, welche Informationen in den Speicher des AI-Agents gelangen, während die zweite Schicht jede Aktion vor der Ausführung durch vier sequenzielle Gates bewertet. Das System verarbeitet 44 Regeln über fünf Architekturschichten in unter 10 Millisekunden pro Bewertung, wobei 13 Diskriminierungs-Mikromodelle eine Verhaltens-Fingerprint-Klassifizierung bereitstellen.

Die Branchenimplikationen sind erheblich, da aktuelle regulatorische Rahmenwerke keine spezifischen Leistungsanforderungen enthalten. Der NIST-AI-Risikomanagement-Rahmen schreibt keine numerischen Schwellenwerte vor, während ISO/IEC 42001:2023 vollständig prozessorientiert ist und keine Erkennungs- oder Verhinderungsraten erfordert. Der EU-AI-Act vertagt alle spezifischen Metriken auf harmonisierte Standards, die trotz einer Compliance-Frist im August 2026 noch nicht existieren.

VectorCertains Validierung umfasst Konformität mit dem CRI-Financial-Services-AI-Risikomanagement-Rahmen und Methodik von MITRE ATT&CK Evaluations. In der internen Bewertung des Unternehmens gegen MITREs veröffentlichte TES-Methodik erreichte SecureAgent einen TES von 1,9636 von 2,0 über 14.208 Versuche, 38 Techniken und drei Gegnerprofile ohne Ausfälle.

Der wirtschaftliche Kontext unterstreicht die Bedeutung dieser Fähigkeiten. IBM-Security-Forschung zeigt, dass präventionsorientierte AI-Governance im Vergleich zu Erkennungs- und Reaktionsansätzen 2,22 Millionen US-Dollar pro Vorfall einspart, während globale Cybersicherheits- und Betrugsverluste laut Nasdaq-Verafin-Daten 2023 485,6 Milliarden US-Dollar erreichten. Da AI-spezifische Angriffsverluste für 2024 auf 15 Milliarden US-Dollar projiziert werden, ist der Bedarf an validierten Präventionsmechanismen dringend geworden.

VectorCertain plant, SecureAgent Consumer Edition innerhalb von 60 Tagen als Chrome-Browser-Erweiterung zu starten, die dieselbe Governance-Pipeline für einzelne Nutzer bereitstellt. Das MYTHOS-Zertifizierungsprogramm des Unternehmens bietet drei Stufen: MYTHOS Certified mit ≥99,0% Recall-Garantien, MYTHOS Certified Plus mit zusätzlichen Human-in-the-Loop-Ratengarantien und MYTHOS Enterprise für Finanzdienstleistungen und regulierte Branchen mit regulatorisch vorbereiteter Dokumentation.

Unabhängige Forschung unterstützt die architektonischen Prinzipien, die SecureAgents Ansatz zugrunde liegen. Arbeiten wie "Agentic AI Security: Threats, Defenses, Evaluation, and Open Challenges" von arXiv:2510.23883 und "A Safety and Security Framework for Real-World Agentic Systems" von arXiv:2511.21990 validieren die Notwendigkeit von Laufzeitsicherheitsdurchsetzung und Vorausführungs-Governance, die SecureAgent implementiert.

Die Validierungsergebnisse positionieren VectorCertain als Lösung für das, was der Chief Technology Officer von CrowdStrike als das zusammengebrochene Fenster zwischen Schwachstellenentdeckung und Ausnutzung beschrieb, wo "was früher Monate dauerte, jetzt mit AI in Minuten geschieht". Diese Fähigkeit ergänzt Project Glasswings Schwachstellenentdeckungsmission, indem sie die Präventionsschicht bereitstellt, die autonome AI-Agents daran hindert, Angriffe auszuführen, bevor Patches bereitgestellt werden können.

VectorCertain validiert 100%ige Erkennung und Verhinderung von Anthropics Mythos-AI-Bedrohungsvektoren

Found this article helpful?

Das Redaktionsteam Burstable.News