Cloud Computing - Les 10 règles structurelles (5/11)

 Dans cet article, je traite de ma quatrième règle structurelle sur le Cloud Computing sur le principe de la continuité de la disponibilité de la ressource.

la guérison automatique ou le principe de la continuité de la disponibilité de la ressource

Un des intérêts majeur du Cloud Computing pour un DSI est la capacité de la plateforme à garantir la continuité d’activité de manière automatique ou semi-automatique en utilisant les concepts de redondance et de résilience des infrastructures.

la guérison automatique de l’infrastructure

  • Une solution de Cloud Computing doit pouvoir garantir qu’en cas de défaillance de l’une de ses ressources, cette dernière va être remplacée afin de continuer à garantir à l’utilisateur le même niveau de service. On va retrouver ce concept mis en application à tous les niveaux du système d’information ; en redondant les éléments critiques comme par exemple les baies de stockages ; en permettant le redémarrage des machines virtuelles sur un autre hôte avec un mécanisme de haute disponibilité ; en mettant en œuvre un cluster applicatif, etc. La continuité de service requise est évaluée en fonction de la criticité des applications délivrées aux utilisateurs avec un niveau de SLA adapté à chaque type de criticité. Nous avons par exemple, sur des environnements peu critiques (pré-production par exemple), un système qui garantit le redémarrage des machines virtuelles en quelques minutes avec un SLA bronze. En revanche, sur l’application métier critique pour l’entreprise, nous avons un SLA gold avec un RPO et un RTO de zéro.
     
  • une application ou un service s’exécutant dans un environnement Cloud Computing doit avoir la propriété de s’auto-réparer ; c’est-à-dire qu’en cas de défaillance de cette ressource, un mécanisme de redémarrage à chaud, ou bien de fault tolerance prend le relais pour minimiser l’indisponibilité et délivrer à nouveau le service et cela de manière transparente pour l’utilisateur final.
     
  • en mettant en place ce principe de continuité de disponibilité de la ressource, on va au-delà d’un système de cluster qui est très complexe à gérer. On garantit à l’utilisateur final que la ressource qu’il est train d’utiliser aura la capacité, en cas de défaillance d’un composant, de se redémarrer quelque part dans le nuage.

la continuité de la disponibilité de l’information

Si en tant que client je souscris à une offre de Cloud Computing, c’est en partant du principe fondamental que j’améliore mon accès à l’information et que cette dernière est tout le temps disponible. Une infrastructure Cloud doit être conçue « by design » pour permettre d’améliorer de manière tangible la disponibilité de l’information ; notamment en travaillant sur la résilience de l’infrastructure, ce qui permet de lisser le risque.

Dans un prochain article, j’aborderai un autre enjeu majeur du Cloud Computing : l’interopérabilité avec les systèmes d’informations tiers.
 

Olivier Domy

Je suis un pragmatique qui a cœur de proposer des solutions cohérentes et en phase avec un contexte client spécifique. Je travaille essentiellement autour des concepts liés à la rationalisation des infrastructures des systèmes d’information et particulièrement sur les projets de transformation des environnements utilisateurs.