cloud computing et high performance computing : un oxymoron ? (2/2)

Pour faire suite à mon dernier post, je dresse une classification rapide du type de cloud privilégié en fonction des principales communautés utilisatrices de high performance computing (HPC dans la suite du texte).

la communauté scientifique et universitaire

Il s'agit sans doute du contexte le plus exigeant en matière de performance, en raison de la complexité et des ordres de grandeur des problèmes à traiter. La notion de collaboration nationale ou internationale est également importante, car le partage de données est essentiel, les équipes de recherche étant réparties géographiquement autour du globe pour un sujet donné.

Le type de Cloud (1) utilisé est en général mixte, car il fait appel aux ressources les plus puissantes du marché et à des réseaux performants, appartenant en général aux différents organismes publics ou privés gérant ces ressources. L’accès à ces ressources via Internet est rendu nécessaire par les échanges inhérents à ce type de collaborations et s’appuie sur les réseaux nationaux de la recherche (Renater), européens (GEANT), et leurs équivalents américains et asiatiques.

  • exemples : CERN, EMBL et ESA avec Helix Nebulathe science cloud, Météorologie Internationale & Océanographie, multiples projets européens dans le domaine du calcul (PRACE)
  • types de cloud : cloud public et semi-public (partagé par la communauté), voire national ou supra-national (projets européens, voire globaux)

(1) Les coopérations dans le domaine de la recherche existent depuis longtemps et le calcul en grille (grid computing) est déjà en place (European Grid Infrastructure ou EGI par exemple). Le passage au Cloud est en cours avec Helix Nebula.

la communauté industrielle

Faisant partie intégrante de la chaîne de création d'un produit dans les domaines automobile et aéronautique par exemple, le HPC est utilisé dès les premières études et les simulations multi-physiques autour d’un modèle numérique du produit sous ses différentes représentations en fonction de l’étape dans la conception (maillages différents pour les études de design et de rendu réaliste, pour les étapes de calcul de structure, l’aerodynamisme, la compatibilité électromagnétique, …) .

La rapidité du cycle de développement, souvent itératif, étant crucial, le besoin en performance est central. En revanche, la confidentialité peut être un frein à l'utilisation d'un réseau non dédié ou non parfaitement sécurisé.

  • exemples : constructeurs automobiles ou aéronautiques, laboratoires de recherche pharmaceutiques.
  • types de cloud : cloud privé et semi-privé (partagé partiellement par les entreprises collaborant aux projets).

les communautés commerciales et Internet

Que ce soit pour des calculs de risque, des simulations financières, l'optimisation des requêtes, les transactions, des services web, le datamining ou les différentes utilisations de MapReduce, les exemples de besoins HPC sont également légions dans les domaines commercial, tertiaire et Internet.

Plus le nombre de données est important, plus les statistiques, extractions ou analyses portant sur ces données deviennent complexes et consommatrices en temps de calcul.

Les applications utilisées sont quelquefois intrinsèquement parallèles, car les tâches sont indépendantes les unes des autres et peuvent être exécutées indépendamment, comme dans les moteurs de recherche.

  • exemples : calcul de risques et échanges bancaires complexes en temps-réel (salles de marché), détection de fraude basée sur du datamining, de l'indexation et de la classification.
  • types de cloud : cloud privé et/ou dédié (éventuellement avec un opérateur intermédiaire spécialisé), cloud public  (type Amazon) lorsque la confidentialité n’est pas recherchée mais seule la puissance de calcul pour une courte période (utilisée par certains hackers)

Avec les différents projets de cloud national en cours de discussion, et les avancées en termes de cloud dédié à la recherche, tel Helix Nebula, la forme des clouds futurs adaptés au high performance computing est difficile à prévoir, mais ne sommes-nous pas au début d’une nouvelle ère pour ce domaine, attiré également par la puissance à la demande ?

Gilles

Crédit photo : © ag visuell - Fotolia.com

Gilles Deghilage

Passionné de physique, et spécialisé en simulation numérique, j’ai démarré mon expérience par des simulations de fluide turbulent 3D et de trajectographie spatiale. Pour comprendre les architectures nécessaires au calcul scientifique, toujours plus parallèles,  j’ai rejoint des constructeurs aux Etats Unis et en Europe, et ai suivi les évolutions vers le Grid Computing puis le Cloud Computing. Expert technique et commercial des solutions du domaine,  je me concentre aujourd’hui au « Business Development » Cloud en m’appuyant sur mon réseau dans l’écosystème IT.