Beta-Funktion. Die Prüfung wird als Beta veröffentlicht, während wir
frühes Feedback sammeln. Der Detektor-Katalog und das Berichtsformat können
sich vor dem nächsten stabilen Release ändern. Bitte öffne ein Issue, wenn
etwas nicht stimmt.
http://localhost:8020/audit direkt, wenn failproofai lokal läuft.
cd <cwd>-Präfixe, Sleep-Polling-Schleifen, erneutes Lesen gerade bearbeiteter Dateien und mehr.
Für jedes Transkript wird jedes Tool-Use-Ereignis durch die 39 integrierten Policies und durch 8 nur für die Prüfung vorgesehene Detektoren wiedergegeben, die Muster erkennen, die noch nicht durch Laufzeit-Policies abgedeckt sind. Zählungen werden pro Policy / Detektor über alle Sitzungen aggregiert.
Was du erhältst
Die/audit-Seite besteht aus sechs Abschnitten:
- Identität — dein Agent wird anhand des gewichteten Signals über alle geprüften Transkripte in einen von 8 Archetypen eingeordnet (
optimist,cowboy,explorer,goldfish,paranoid architect,precision builder,hammer,ghost). - Stärken — echte Zahlen aus dem Scan (Anteil sauberer Aufrufe in %, „0 Credential-Leaks” usw.), die davon abhängen, dass die relevanten Sanitize-Policies tatsächlich ausgelöst haben.
- Score — 0–100 mit den Bandbreiten S/A/B/C/D/F und einem prognostizierten Anstieg, wenn alle empfohlenen Policies aktiviert wären.
- Befunde — Policy-Karten mit Beschreibung des Vorgefallenen, Kosten, gesammelten Belegen und dem genauen
failproofai policy add <slug>-Befehl, um das integrierte Live-Feature zu aktivieren, das den Vorfall abgefangen hätte. - Empfohlene Policies — aggregierte Installationsliste mit einem einzigen
failproofai policies --install-Befehl. - Erinnerung zur erneuten Prüfung — „komm besser zurück.” Richte eine 7-tägige E-Mail-Erinnerung über den API-Server ein (erfordert Anmeldung; siehe
failproofai auth).
Nur für die Prüfung vorgesehene Detektoren
Diese erkennen Muster für „unintelligentes Verhalten”, die (noch) nicht in Echtzeit durchgesetzt werden. Sie laufen nur während der Prüfung und blockieren niemals einen Live-Tool-Aufruf.| Detektor | Was gezählt wird |
|---|---|
redundant-cd-cwd | Bash-Befehle, die mit cd <cwd> && … beginnen, obwohl Befehle bereits in cwd ausgeführt werden. |
prefer-edit-over-read-cat | cat/head/tail/less/more auf eine einzelne Quelldatei — verwende stattdessen das Read-Tool. |
prefer-edit-over-sed-awk | sed -i / awk … > file-In-Place-Bearbeitungen — verwende stattdessen das Edit-Tool. |
prefer-write-over-heredoc | Heredoc / mehrzeiliges echo > file zum Schreiben von Dateien — verwende stattdessen das Write-Tool. |
sleep-polling-loop | Lange sleep N-Aufrufe (≥ 30 s) oder while …; sleep …; done-Polling-Schleifen. |
find-from-root | find /, find /home, find /usr usw. — schränke auf cwd ein. |
git-commit-no-verify | git commit … --no-verify / -n, wodurch Hooks übersprungen werden. |
reread-after-edit | Read einer Datei, die gerade mit Edit/Write in derselben Sitzung bearbeitet wurde. |
Caches
- Transkript-spezifischer Cache unter
~/.failproofai/cache/audit/<sha1>.json, indexiert nach(mtime, size, engineVersion, detectorVersion)— wird automatisch ungültig, wenn das Transkript oder der Policy-/Detektor-Code sich ändert. Jeder Eintrag speichert außerdem einencachedAt-Zeitstempel als TTL-Metadaten (kein Teil des Cache-Schlüssels); Einträge, die älter als 7 Tage sind, werden beim Lesen abgelehnt, damit langlebige Ergebnisse nicht die Weiterentwicklung der Detektoren überdauern. - Gesamtergebnis-Cache unter
~/.failproofai/audit-dashboard.json(Modus 0600). Ermöglicht dem Dashboard eine sofortige Darstellung beim Navigieren, ohne erneut ausgeführt zu werden. Ebenfalls nach Ablauf des 7-Tage-TTL beim Lesen abgelehnt —/auditfällt dann in seinen leeren Zustand zurück und fordert einen neuen Durchlauf an. Klicke auf[ re-audit now ]unten im Bericht, um zu aktualisieren — eine erneute Prüfung sendetnoCache: true, umgeht damit den transkriptspezifischen Cache und scannt alle Transkripte neu, anstatt das gecachte Ergebnis zurückzugeben; der Durchlauf streamt den Fortschritt über einen fixierten oberen Streifen und tauscht das Ergebnis bei Erfolg direkt aus (kein Seitenneuladen; eine fehlgeschlagene erneute Prüfung behält den vorherigen Bericht).
Hinweise
- Keine Änderungen. Die Prüfung läuft im reinen Lesemodus.
warn-repeated-tool-callswird übersprungen, da sein sitzungsspezifischer Begleiter sonst verändert würde. - Workflow-Policies werden übersprungen.
require-*-before-stop-Policies werden nur beiStop-Ereignissen ausgelöst und führenexecSyncgegen den Live-Git-Zustand aus — sie haben keine sinnvolle Interpretation im Sinne von „Was wäre 2025 passiert”, daher erscheinen sie nicht in den Prüfzählungen. - Benutzerdefinierte Policies werden übersprungen. Benutzerdefinierte Hooks werden nicht wiedergegeben (sie können sich seit der ursprünglichen Sitzung geändert haben).

