Funzionalità beta. L’audit viene fornito in beta mentre raccogliamo i feedback iniziali.
Il catalogo dei detector e il formato del report potrebbero cambiare prima della prossima versione stabile.
Apri una segnalazione se qualcosa non ti sembra corretto.
http://localhost:8020/audit quando esegui failproofai localmente.
cd <cwd> ridondanti, loop di sleep-polling, ri-letture di file appena modificati, e altro ancora.
Per ogni transcript, ogni evento di tool-use viene rieseguito attraverso le 39 politiche builtin e attraverso 8 detector audit-only che catturano pattern non ancora coperti dalle politiche di runtime. I conteggi sono aggregati per politica / detector su tutte le sessioni.
Cosa ottieni
La pagina/audit è composta da sei sezioni:
- Identity — il tuo agente classificato in uno degli 8 archetipi (
optimist,cowboy,explorer,goldfish,paranoid architect,precision builder,hammer,ghost) in base al segnale ponderato su ogni transcript sottoposto a audit. - Strengths — numeri reali derivati dalla scansione (clean-call %, “0 credential leaks”, ecc.) soggetti alle politiche sanitize rilevanti che effettivamente si attivano.
- Score — da 0 a 100 con bande S/A/B/C/D/F e un miglioramento previsto se ogni politica consigliata fosse abilitata.
- Findings — schede per-politica con cosa è successo, costo, prove catturate, e il comando
failproofai policy add <slug>esatto per abilitare il builtin runtime che l’avrebbe catturato. - Prescribed policies — lista di installazione aggregata con il comando
failproofai policies --installsingolo. - Re-audit reminder — “ritorna meglio.” Imposta un reminder email di 7 giorni tramite l’api-server (richiede accesso; vedi
failproofai auth).
Detector audit-only
Questi rilevano pattern di “comportamento stupido” non (ancora) applicati in tempo reale. Vengono eseguiti solo durante l’audit e non bloccano mai una tool call live.| Detector | Cosa conta |
|---|---|
redundant-cd-cwd | Comandi Bash che iniziano con cd <cwd> && … anche se i comandi vengono già eseguiti in cwd. |
prefer-edit-over-read-cat | cat/head/tail/less/more su un singolo file sorgente — usa lo strumento Read. |
prefer-edit-over-sed-awk | sed -i / awk … > file modifiche in-place — usa lo strumento Edit. |
prefer-write-over-heredoc | Heredoc / multi-linea echo > file scrittura di file — usa lo strumento Write. |
sleep-polling-loop | Lunghi sleep N (≥ 30s) o loop di polling while …; sleep …; done. |
find-from-root | find /, find /home, find /usr, ecc. — limita lo scope a cwd. |
git-commit-no-verify | git commit … --no-verify / -n, saltando gli hook. |
reread-after-edit | Read di un file appena modificato con Edit/Write nella stessa sessione. |
Cache
- Cache per-transcript in
~/.failproofai/cache/audit/<sha1>.jsonindicizzata da(mtime, size, engineVersion, detectorVersion)— si invalida automaticamente quando il transcript o il codice della politica/detector cambia. Ogni voce memorizza anche un timestampcachedAtcome metadati TTL (non parte della chiave di cache); le voci più vecchie di 7 giorni vengono rifiutate nella lettura in modo che i risultati di lunga durata non superino l’intento del detector in evoluzione. - Cache del risultato completo in
~/.failproofai/audit-dashboard.json(modalità 0600). Permette al dashboard di eseguire il rendering istantaneamente nella navigazione senza rieseguire. Viene anche rifiutato nella lettura dopo il TTL di 7 giorni —/auditricade quindi nello stato vuoto e richiede un’esecuzione aggiornata. Fai clic su[ re-audit now ]vicino al fondo del report per aggiornare — il re-audit invianoCache: true, quindi bypassa la cache per-transcript e scansiona di nuovo ogni transcript invece di restituire il risultato in cache; l’esecuzione fa lo streaming del progresso tramite una barra adesiva in alto e sostituisce il risultato sul posto al successo (nessun ricaricamento della pagina; un re-audit fallito mantiene il report precedente).
Note
- Nessuna mutazione. L’audit viene rieseguito in modalità di sola lettura.
warn-repeated-tool-callsviene saltato perché il suo sidecar per-sessione altrimenti verrebbe modificato. - Politiche workflow saltate. Le politiche
require-*-before-stopsi attivano solo su eventiStopeexecSyncrispetto allo stato git live — non hanno un’interpretazione significativa di “cosa sarebbe successo nel 2025”, quindi non compaiono nei conteggi dell’audit. - Politiche personalizzate saltate. Gli hook personalizzati forniti dall’utente non vengono rieseguiti (potrebbero essere cambiati dalla sessione originale).

