Cécile CAVET, Ingénieur Système Cloud Expert, et Antoine PETITEAU, maître de conférence à l’Université Paris Diderot (Paris 7), ont collaborés au sein du laboratoire APC (AstroParticule et Cosmologie).

Antoine Petiteau et Cécile Cavet - APC
Antoine Petiteau et Cécile Cavet

 

Bonjour Cécile, bonjour Antoine. Question habituelle d’ouverture de nos interviews : pouvez-vous vous présenter en quelques mots ?

Cécile CAVET
J’ai fait des études de physique qui m’ont amenée à faire un doctorat en astrophysique en 2010. Après ce doctorat, je me suis rendu compte que la partie technique de la thèse était celle qui m’intéressait le plus.
Il y avait dans le cadre du LabEx UnivEarthS un poste ingénieur de recherche pour 4 ans dédié à la valorisation des infrastructures de calcul, avec notamment une dimension de valorisation des infrastructures de cloud qui m’attirait particulièrement.

J’ai eu le poste !

 

Antoine PETITEAU
J’ai fait des études de physique et un master d’astrophysique, comme Cécile. J’ai poursuivi par un doctorat sur la mission eLISA, puis un post-doc de 4 ans en Allemagne. Je suis maintenant maître de conférences depuis 2011 à Paris Diderot et à l’APC.

Mes thématiques de recherche portent sur l’observation de l’univers avec les ondes gravitationnelles basse fréquence. C’est différent de la détection des ondes gravitationnelles par les interféromètres au sol qui sont sensibles au-delà de 10 Hz. Ici, on se met dans l’espace pour avoir des bras d’interféromètre plus longs et ne pas être soumis aux bruits sismiques. On peut observer des sources émettant entre 0,01 à 0,1 mHz voire 1 Hz.

Je m’intéresse aussi à la détection des ondes gravitationnelles avec des pulsars. Les pulsars sont des étoiles à neutrons qui émettent comme un phare. Ils émettent des pulses toutes les dizaines de millisecondes. On peut observer ces pulses avec les radiotélescopes. La signature d’une onde gravitationnelle est le décalage d’un pulse. C’est une méthode sensible dans la fenêtre de 10-9 à 10-7 Hz. Je suis impliqué dans une collaboration européenne avec 5 radiotélescopes dont celui de Nançay.

 

Comment en êtes-vous venus à collaborer ?

Cécile CAVET
L’année dernière (2014), Antoine cherchait une machine pour faire tourner des codes pour les stagiaires. J’ai proposé de les faire tourner sur des machines virtuelles. Nous avons utilisé le cloud StratusLab du LAL pour cela.

StratusLab est un projet européen démarré en 2010 et son infrastructure de cloud est opérationnelle depuis 2012. La solution StratusLab est basée sur une autre solution, OpenNebula. Elle propose un environnement de services qui facilitent l’utilisation de l’infrastructure de cloud. Lorsque j’ai démarré mes activités sur le cloud en 2012, les autres solutions comme OpenStack n’offraient pas encore les mêmes services qu’aujourd’hui. Depuis, OpenStack a pris son envol et pris le pas sur StratusLab.

 

Antoine PETITEAU
J’ai apprécié la simplicité d’utilisation de StratusLab. Avec quelques commandes de base, j’ai pu créer les machines virtuelles dont j’avais besoin. Nous avons automatisé les scripts de configuration de ces machines virtuelles. Je les utilise pour quatre différents types d’applications et je suis maintenant autonome grâce à Cécile qui m’a montré « les recettes de cuisine ».

Mes applications sont les suivantes :

  • Faire tourner des codes pour eLISA. Les machines virtuelles sont utilisées pour offrir des environnements de travail aux stagiaires et partager les codes.
  • Dans le cadre de la collaboration sur les pulsars, j’ai créé une machine virtuelle pour les trente utilisateurs de la collaboration. Ce qui est compliqué aujourd’hui avec d’autres méthodes, c’est la création de comptes pour les collaborateurs distants. Avec les machines virtuelles sur le cloud, il n’y a pas de procédure à suivre. Les collaborateurs fournissent leurs clefs SSH et peuvent accéder à la machine virtuelle. Celle-ci peut être détruite en cas de problème.
  • Ma troisième utilisation se place dans le cadre d’un projet de nano satellite (30cmx10cm) conçu par les étudiants de l’université. Ce projet requiert l’utilisation des logiciels ROOT et Geant4. Nous avons créé une machine virtuelle avec ces deux logiciels et donné la possibilité aux étudiants d’y accéder. A nouveau, le cloud fournit l’installation et l’accès à la ressource ; plus besoin de passer du temps à installer les logiciels sur les postes personnels de chacun des nouveaux membres du groupe.
  •  

    Engin spatial d'eLISA
    Engin spatial d’eLISA

  • La dernière application concerne la mission LISA PATHFINDER, démonstrateur technologique de la mission eLISA. Nous avons besoin de puissance de calcul pour l’analyse des données. Les codes d’analyse tournent sur le cluster de l’APC avec MPI. Si le cluster est surchargé, il est possible de transférer une partie de la charge directement sur le cloud. Cécile a créé sur le cloud un cluster virtuel à l’aide de SlipStream car cet outil permet de gérer le déploiement simultané de plusieurs machines virtuelles. Le cluster de l’APC est physiquement au Centre François Arago et le cloud StratusLab est physiquement au LAL. Cette possibilité d’utiliser le cloud comme cluster virtuel pour gérer des pics de charge est prometteuse pour l’analyse des données d’eLISA. Elle permet en effet de gérer ces pics sans investir dans des infrastructures qui seraient sous-exploitées hors de ces pics.
  •  

    Cécile CAVET
    Il y a tellement de possibilités sur le cloud qu’il faut choisir une façon de travailler. En tant qu’ingénieur dans un laboratoire de recherche, je suis architecte de solutions de cloud. J’administre les machines virtuelles, je crée les scripts pour automatiser le portage d’applications sur ces machines virtuelles.

    L’outil SlipStream a été développé pour s’abstraire de la solution cloud sur l’infrastructure locale. Nous pourrons donc dans quelques temps utiliser StratusLab ou OpenStack de façon transparente. L’apparition d’outils comme SlipStream est très importante car ils permettent aussi de créer de véritables clusters virtuels en gérant plusieurs machines virtuelles simultanément.

    A la base, mon travail était destination des utilisateurs du LabEx (APC, IPGP) car ce sont des sujets de science et des besoins différents. Dans un premier temps, je me suis concentré sur les utilisateurs de l’APC dont la thématique est proche de ma formation initiale. J’ai aussi intégré la fédération de cloud France-Grilles qui m’a mis en contact avec des utilisateurs d’autres disciplines. A part le groupe eLISA de l’APC, il y a d’autres utilisateurs qui ont essayé d’utiliser le cloud mais qui se sont découragés car StratusLab était instable au début. En cas de panne, il faut recréer la machine virtuelle de zéro. Aujourd’hui, les mécanismes existent pour recréer la machine virtuelle par des scripts shell ou avec SlipStream.

     

    Antoine, tu as été un utilisateur pionnier. Comment vois-tu l’avenir ?

    Antoine PETITEAU
    J’utilise le cloud de plus en plus. Dès qu’un code intéresse plusieurs personnes, je le mets sur une machine virtuelle pour le partager avec des stagiaires ou des collaborateurs. Une machine virtuelle permet de partager un même environnement sur une même machine et réduit le risque d’erreurs liés à des mauvaises configurations ou des versions différentes des logiciels.

     

    Cécile CAVET
    Les images disques des machines virtuelles permettent la préservation des environnements de calcul sur le cloud. En effet, elles permettent d’encapsuler un instantané de la configuration et des algorithmes utilisés. Par contre, il reste à creuser le problème de la pérennité de la technologie de virtualisation, ancienne mais qui évolue rapidement.

     

    Antoine PETITEAU
    Dans le programme d’eLISA, la France a la responsabilité du centre de traitement de l’ensemble des données de la mission. Les établissements français impliqués sont le CNES, le CNRS et l’Observatoire de Paris. Le CNES finance la participation française. La mission est prévue pour 2034. L’idée de la mission a été émise en 1974. Elle a grandi dans le cadre d’une collaboration entre l’ESA et la NASA. En 2011, suite au retrait de la NASA pour des raisons financières, l’ESA a décidé de continuer seule le programme.

    Le principe est de lancer trois satellites en orbite autour du soleil, de telle sorte qu’ils restent en triangle. La distance entre les satellites est de 1 million de kms, soit trois fois la distance terre-lune. Les satellites sont à 52 millions de kilomètres de la terre pour les éloigner au maximum de toute perturbation terrestre tout en gardant la capacité de les transférer rapidement. Les satellites s’envoient des faisceaux lasers : 1 watt à l’émission et 10 pico watts à la réception. Les satellites devraient n’être influencés que par la gravitation. Pour cela, une masse de 2 kilogramme d’or et de platine est placée au centre de chacun des satellites. Le satellite est constamment réajusté autour à l’aide de micros fusées.
    La mission LISA PATHFINDER envoie cette année un satellite pour voir si la technologie est mure pour gérer une masse en chute libre.

    L’APC est le principal partenaire du CNES dans la mise au point du centre de traitement de données d’eLISA. Le volume de données est de l’ordre d’une centaine de Gigaoctet par an. Par contre, les besoins de calculs sur ces données seront très importants.

    L’univers a été observé par les photons principalement. Nous proposons d’étudier l’univers à l’aide des ondes gravitationnelles. L’observation des ondes gravitationnelles est un moyen d’étude des trous noirs qui ne peuvent pas être directement observé avec les ondes électromagnétiques. Elles permettent de voir très loin dans l’Univers car elles sont peu atténuées.

    Une phase d’étude préliminaire a été menée pour évaluer les coûts et l’option cloud a été clairement identifiée pour la gestion des pics de besoin de traitement.

     

    Merci beaucoup pour le temps que vous nous avez accordé et bonne continuation dans le Cloud.

    (Propos recueillis par Silvia GERVOIS)


    Haut de page