Hardware, Software, Human Faults

Comprendre les trois grandes familles de fautes qui rendent un système non fiable en production.

← Retour au concept

En production, les incidents ne viennent pas tous de la même nature de faute.

Les pannes hardware, les erreurs software et les erreurs humaines n’ont pas le même profil de propagation. Ce point est crucial car chaque famille demande des défenses différentes.

  • Hardware : redondance, réplication, bascule
  • Software : limitation du blast radius, rollback, isolation
  • Human : garde-fous opératoires, procédures sûres, observabilité

L’objectif n’est pas d’éviter tout incident, mais d’empêcher qu’un incident local devienne une panne produit globale.