Vergangene Sitzungen prüfen (Beta)

Beta-Funktion. Die Prüfung wird als Beta veröffentlicht, während wir frühes Feedback sammeln. Der Detektor-Katalog und das Berichtsformat können sich vor dem nächsten stabilen Release ändern. Bitte öffne ein Issue, wenn etwas nicht stimmt.

Die Prüfung ist jetzt als /audit-Dashboard-Seite verfügbar, nicht als CLI-Unterbefehl. Öffne sie über die Dashboard-Navigationsleiste (zwischen Policies und Projekten) oder besuche http://localhost:8020/audit direkt, wenn failproofai lokal läuft.

failproofai          # open the dashboard, then click "Audit"

Das Dashboard scannt vergangene Agent-CLI-Transkripte auf diesem Gerät (Claude Code, Codex, Copilot, Cursor, OpenCode, Pi, Gemini) und meldet, wie oft der Agent Dinge getan hat, die failproofai verhindern soll — Umgebungsvariablen-Prüfungen, Force-Pushes, redundante cd <cwd>-Präfixe, Sleep-Polling-Schleifen, erneutes Lesen gerade bearbeiteter Dateien und mehr. Für jedes Transkript wird jedes Tool-Use-Ereignis durch die 39 integrierten Policies und durch 8 nur für die Prüfung vorgesehene Detektoren wiedergegeben, die Muster erkennen, die noch nicht durch Laufzeit-Policies abgedeckt sind. Zählungen werden pro Policy / Detektor über alle Sitzungen aggregiert.

Was du erhältst

Die /audit-Seite besteht aus sechs Abschnitten:

Identität — dein Agent wird anhand des gewichteten Signals über alle geprüften Transkripte in einen von 8 Archetypen eingeordnet (optimist, cowboy, explorer, goldfish, paranoid architect, precision builder, hammer, ghost).
Stärken — echte Zahlen aus dem Scan (Anteil sauberer Aufrufe in %, „0 Credential-Leaks” usw.), die davon abhängen, dass die relevanten Sanitize-Policies tatsächlich ausgelöst haben.
Score — 0–100 mit den Bandbreiten S/A/B/C/D/F und einem prognostizierten Anstieg, wenn alle empfohlenen Policies aktiviert wären.
Befunde — Policy-Karten mit Beschreibung des Vorgefallenen, Kosten, gesammelten Belegen und dem genauen failproofai policy add <slug>-Befehl, um das integrierte Live-Feature zu aktivieren, das den Vorfall abgefangen hätte.
Empfohlene Policies — aggregierte Installationsliste mit einem einzigen failproofai policies --install-Befehl.
Erinnerung zur erneuten Prüfung — „komm besser zurück.” Richte eine 7-tägige E-Mail-Erinnerung über den API-Server ein (erfordert Anmeldung; siehe failproofai auth).

Nur für die Prüfung vorgesehene Detektoren

Diese erkennen Muster für „unintelligentes Verhalten”, die (noch) nicht in Echtzeit durchgesetzt werden. Sie laufen nur während der Prüfung und blockieren niemals einen Live-Tool-Aufruf.

Detektor	Was gezählt wird
`redundant-cd-cwd`	Bash-Befehle, die mit `cd <cwd> && …` beginnen, obwohl Befehle bereits in `cwd` ausgeführt werden.
`prefer-edit-over-read-cat`	`cat`/`head`/`tail`/`less`/`more` auf eine einzelne Quelldatei — verwende stattdessen das `Read`-Tool.
`prefer-edit-over-sed-awk`	`sed -i` / `awk … > file`-In-Place-Bearbeitungen — verwende stattdessen das `Edit`-Tool.
`prefer-write-over-heredoc`	Heredoc / mehrzeiliges `echo > file` zum Schreiben von Dateien — verwende stattdessen das `Write`-Tool.
`sleep-polling-loop`	Lange `sleep N`-Aufrufe (≥ 30 s) oder `while …; sleep …; done`-Polling-Schleifen.
`find-from-root`	`find /`, `find /home`, `find /usr` usw. — schränke auf `cwd` ein.
`git-commit-no-verify`	`git commit … --no-verify` / `-n`, wodurch Hooks übersprungen werden.
`reread-after-edit`	`Read` einer Datei, die gerade mit `Edit`/`Write` in derselben Sitzung bearbeitet wurde.

Caches

Transkript-spezifischer Cache unter ~/.failproofai/cache/audit/<sha1>.json, indexiert nach (mtime, size, engineVersion, detectorVersion) — wird automatisch ungültig, wenn das Transkript oder der Policy-/Detektor-Code sich ändert. Jeder Eintrag speichert außerdem einen cachedAt-Zeitstempel als TTL-Metadaten (kein Teil des Cache-Schlüssels); Einträge, die älter als 7 Tage sind, werden beim Lesen abgelehnt, damit langlebige Ergebnisse nicht die Weiterentwicklung der Detektoren überdauern.
Gesamtergebnis-Cache unter ~/.failproofai/audit-dashboard.json (Modus 0600). Ermöglicht dem Dashboard eine sofortige Darstellung beim Navigieren, ohne erneut ausgeführt zu werden. Ebenfalls nach Ablauf des 7-Tage-TTL beim Lesen abgelehnt — /audit fällt dann in seinen leeren Zustand zurück und fordert einen neuen Durchlauf an. Klicke auf [ re-audit now ] unten im Bericht, um zu aktualisieren — eine erneute Prüfung sendet noCache: true, umgeht damit den transkriptspezifischen Cache und scannt alle Transkripte neu, anstatt das gecachte Ergebnis zurückzugeben; der Durchlauf streamt den Fortschritt über einen fixierten oberen Streifen und tauscht das Ergebnis bei Erfolg direkt aus (kein Seitenneuladen; eine fehlgeschlagene erneute Prüfung behält den vorherigen Bericht).

Hinweise

Keine Änderungen. Die Prüfung läuft im reinen Lesemodus. warn-repeated-tool-calls wird übersprungen, da sein sitzungsspezifischer Begleiter sonst verändert würde.
Workflow-Policies werden übersprungen. require-*-before-stop-Policies werden nur bei Stop-Ereignissen ausgelöst und führen execSync gegen den Live-Git-Zustand aus — sie haben keine sinnvolle Interpretation im Sinne von „Was wäre 2025 passiert”, daher erscheinen sie nicht in den Prüfzählungen.
Benutzerdefinierte Policies werden übersprungen. Benutzerdefinierte Hooks werden nicht wiedergegeben (sie können sich seit der ursprünglichen Sitzung geändert haben).

​Was du erhältst

​Nur für die Prüfung vorgesehene Detektoren

​Caches

​Hinweise

Was du erhältst

Nur für die Prüfung vorgesehene Detektoren

Caches

Hinweise