Mettre en place des outils informatiques redondants
La redondance fait partie des mécanismes indispensables à mettre en œuvre si l’entreprise veut bénéficier d’une bonne tolérance aux pannes.
- Réduire le risque d’indisponibilité
- Permettre la continuité d’activité en cas d’incident
- Augmenter la capacité et/ou les performances globales
- Cartographier de manière exhaustive l’ensemble des infrastructures, aussi bien physiques, virtuelles, cloud et applicatives
- Tester la tolérance aux pannes
- Ne pas oublier la redondance du réseau
La redondance consiste à déployer au moins deux exemplaires de chaque élément d’une infrastructure, voire davantage. L’objectif est qu’en cas de panne sur un élément, les autres puissent prendre le relais pour éviter les interruptions de service. Cela permet une meilleure tolérance aux pannes et une haute disponibilité. Une telle architecture peut également être utilisée pour faire face à des pics d’activité, les ressources en double étant alors utilisées pour maintenir un niveau de performance constant, à travers des dispositifs comme la répartition de charge (load-balancing).
La redondance peut intervenir à de multiples niveaux : infrastructure physique, couches logicielles, cloud…
Sur une infrastructure physique de production, il faut notamment veiller à doubler les serveurs (et dans ces derniers, les disques, les processeurs et la mémoire), mais aussi les répartiteurs de charge, les alimentations, les équipements de réseau et de stockage. Le déploiement de clusters de serveurs facilite la mise en œuvre de la redondance.
Prévoyez également de doubler les couches applicatives critiques : machines virtuelles, systèmes de gestion de bases de données, serveurs web, messageries et annuaires, instances d’applications, etc.
Enfin, si tout ou partie de votre infrastructure est dans le cloud, il faut prévoir au moins deux instances qui s’exécutent en parallèle. Celles-ci doivent être hébergées si possible dans des data centers situés dans des zones géographiques différentes : cela offre une sécurité supplémentaire en cas d’événement de type incendie, inondation ou autre catastrophe de grande ampleur.
Soyez particulièrement vigilants lors de la mise en place d’une telle architecture : si certains composants n’ont pas de doublon, ils représentent alors des points uniques de défaillance (SPOF ou Single Point Of Failure), qui en cas de panne peuvent bloquer l’ensemble du système. Par exemple, sur un serveur si tous les composants sont en double, sauf l’alimentation électrique, celle-ci est un SPOF.
En règle générale, dans une architecture redondante il existe une brique primaire et une ou plusieurs briques secondaires, destinées à prendre le relais au moindre problème sur la brique primaire. Un système de bascule (fail-over) permet de passer de l’un à l’autre, soit de façon automatique soit de façon manuelle. Dans l’idéal, l’infrastructure primaire et l’infrastructure secondaire ne sont pas hébergées sur le même site, pour se prévenir contre les risques décrits plus haut.
Pour vérifier que les mécanismes de haute disponibilité désirés fonctionnent bien, vous pouvez simuler une panne sur différents éléments, et voir ce qui se passe.