AI DevTool

Claude Analysis

Ouvrir le capot d'un assistant IA. Qu'est-ce qu'on lui envoie vraiment à chaque requête ? Quelle part d'espace sert au contenu utile, quelle part au reste ?

De quoi il s'agit

Les sessions JSONL exposées par Claude Code ne reflètent pas le contexte réel envoyé à l'API. Il manque la moitié des tool_results, les skills injectés, le vrai prompt système.

La capture

Mitmproxy intercepte le trafic HTTPS entre Claude Code et l'API Anthropic. Chaque requête est stockée au complet : prompt système, tool definitions, messages, tool_results. Un hook on-ingest déclenche l'analyse dès qu'un exchange est capturé.

Les métriques

Trois indicateurs quantitatifs : entropie du prompt système (sa charge informative), ratio signal/bruit des messages, taux de répétition outil vers contenu. Un endpoint `/api/overview` agrège le tout en un curl.

Le constat

63 % du contexte d'une session Claude Code est occupé par les tool definitions built-in. C'est inamovible. Le levier est ailleurs : la pertinence des tool_results et le choix des skills injectés.

Le pivot

Les scores automatiques ne suffisent pas à juger la qualité d'un prompt. L'outil assume une évaluation manuelle : afficher, comparer, décider. Pas un dashboard de KPIs, un scalpel.

Stack

React Zustand FastAPI Python mitmproxy