Load Parameters and Percentiles

Décrire la charge et mesurer les bonnes latences pour comprendre quand un système scale réellement.

← Retour au concept

Dire qu’un système “scale” n’a de valeur que si l’on précise :

  1. quelle charge augmente,
  2. quelle performance doit rester stable.

Les load parameters (QPS, volume, ratio lecture/écriture, taille payload, fan-out) décrivent la pression réelle. Les métriques (latence, throughput, durée batch) décrivent l’impact observable.

Sur les systèmes interactifs, la moyenne est insuffisante :

  • p50 pour le comportement central,
  • p95/p99 pour la queue de latence,
  • et leur évolution sous charge pour savoir si le système reste prévisible.