En production, les incidents ne viennent pas tous de la même nature de faute.
Les pannes hardware, les erreurs software et les erreurs humaines n’ont pas le même profil de propagation. Ce point est crucial car chaque famille demande des défenses différentes.
- Hardware : redondance, réplication, bascule
- Software : limitation du blast radius, rollback, isolation
- Human : garde-fous opératoires, procédures sûres, observabilité
L’objectif n’est pas d’éviter tout incident, mais d’empêcher qu’un incident local devienne une panne produit globale.