Dire qu’un système “scale” n’a de valeur que si l’on précise :
- quelle charge augmente,
- quelle performance doit rester stable.
Les load parameters (QPS, volume, ratio lecture/écriture, taille payload, fan-out) décrivent la pression réelle. Les métriques (latence, throughput, durée batch) décrivent l’impact observable.
Sur les systèmes interactifs, la moyenne est insuffisante :
- p50 pour le comportement central,
- p95/p99 pour la queue de latence,
- et leur évolution sous charge pour savoir si le système reste prévisible.