arrow_back Retour au lab
AI DevTool

Claude Analysis

Ouvrir le capot d'un assistant IA. Qu'est-ce qu'on lui envoie vraiment à chaque requête ? Quelle part d'espace sert au contenu utile, quelle part au reste ?

De quoi il s'agit

Les sessions JSONL exposées par Claude Code ne reflètent pas le **contexte réel** envoyé à l'API. Il manque la moitié des tool_results, les skills injectés, le vrai prompt système. ## La capture **Mitmproxy** intercepte le trafic HTTPS entre Claude Code et l'API Anthropic. Chaque requête est stockée au complet : prompt système, tool definitions, messages, tool_results. Un hook on-ingest déclenche l'analyse dès qu'un exchange est capturé. ## Les métriques Trois indicateurs quantitatifs : **entropie du prompt système** (sa charge informative), **ratio signal/bruit** des messages, **taux de répétition** outil vers contenu. Un endpoint `/api/overview` agrège le tout en un curl. ## Le constat **63 % du contexte** d'une session Claude Code est occupé par les tool definitions built-in. C'est inamovible. Le levier est ailleurs : la pertinence des tool_results et le choix des skills injectés. ## Le pivot Les scores automatiques ne suffisent pas à juger la qualité d'un prompt. L'outil assume une **évaluation manuelle** : afficher, comparer, décider. Pas un dashboard de KPIs, un scalpel.

Stack

React Zustand FastAPI Python mitmproxy