Le candidat retenu rejoindra le projet NumPEx Exa-DI.

Si vous êtes prêt à relever le défi, n'hésitez pas à poser votre candidature !

 

 

Contexte

ASTRA est un projet de 4 ans sélectionné dans le cadre d’un appel à projets compétitif du programme de recherche français NumPEx (Numérique pour l’Exascale) PEPR. Axé sur la radioastronomie dans le contexte des instruments de nouvelle génération tels que LOFAR2.0 et SKA, il vise à concevoir et à déployer une plateforme unifiée d’orchestration et de gestion de données basée sur des conteneurs, fédérant des ressources HPC, cloud et de stockage distribué pour exécuter des flux de travail reproductibles à grande échelle sur des infrastructures hétérogènes, formant ainsi l’épine dorsale du futur Centre régional français du SKA (FR-SRC). Quatre cas d’utilisation représentatifs seront ciblés pour la démonstration : la détection d’ondes gravitationnelles avec des réseaux de synchronisation de pulsars, la détection du signal 21 cm décalé du Cosmic Dawn, la cartographie du gaz atomique galactique et les études de continuum à grand champ.

Pour soutenir ce projet, NumPEx recherche un expert en intégration, packaging et CI/CD pour diriger la définition et la mise en œuvre d’un cadre robuste de déploiement et de gestion du changement pour les flux de travail de radioastronomie à grande échelle déployés à travers des infrastructures HPC et cloud.

Même si le candidat retenu travaillera spécifiquement sur le projet ASTRA, il sera intégré dans le programme NumPEx au sens large, et plus particulièrement au sein de l’équipe Exa-DI. Exa-DI travaille en étroite interaction avec les communautés d’application pour identifier les principaux modèles algorithmiques et de communication dans les applications exascales, développer des mini-applications représentatives basées sur la pile logicielle NumPEx, et évaluer leurs performances et leur portabilité sur des systèmes HPC à grande échelle.

Cet environnement offre un accès direct à une expertise de haut niveau en matière de calcul exascale, d’analyse des performances, de méthodologies de co-conception, de CI/CD pour le HPC et d’analyse comparative à grande échelle. Le poste offre donc à la fois l’autonomie de diriger les efforts d’intégration et de déploiement au sein d’ASTRA et le soutien d’un écosystème national dédié à la performance, à l’évolutivité et à l’excellence de l’ingénierie logicielle pour le calcul scientifique.

La mission

Le candidat retenu concevra et appliquera une méthodologie d’intégration partagée entre tous les contributeurs d’ASTRA, remplaçant les environnements d’intégration fragmentés et hétérogènes par des modèles d’exécution unifiés, reproductibles et basés sur des conteneurs, ainsi que par des pratiques clairement définies de gestion des versions, des versions et des dépendances. Il jouera le rôle de responsable technique pour la gestion du déploiement et de l’évolution du système (flux de travail + infrastructure sous-jacente), en garantissant des processus de changement contrôlés, un alignement entre les équipes et une reproductibilité à l’échelle du système.

Les principales responsabilités sont les suivantes :

  • Concevoir des stratégies reproductibles de packaging et de conteneurisation (Docker/Singularity/OCI) pour les environnements hybrides HPC-cloud.
  • Définir et mettre en œuvre des pipelines CI/CD de pointe avec des tests de flux de travail automatisés, la validation et l’analyse comparative des performances.
  • Établir des lignes directrices en matière d’intégration, des politiques en matière de versions et des procédures de gestion du changement
  • Coordonner les versions et assurer la compatibilité entre les différentes équipes participantes.
  • Former et aligner les contributeurs sur les meilleures pratiques en matière de DevOps, de tests et d’évolution des systèmes gérés.

Ce rôle combine le leadership technique, l’expertise DevOps et la coordination entre les équipes pour garantir un écosystème de flux de travail durable, évolutif et de niveau de production.

Compétences requises

  • Master, diplôme d’ingénieur ou doctorat en informatique ou dans un autre domaine lié au calcul scientifique.
  • Solide expérience en DevOps et en conception CI/CD, y compris les tests automatisés, la gestion des versions et les stratégies de versionnement (flux de travail basés sur Git, GitLab CI ou équivalent).
  • Expertise avérée en matière de conteneurisation et de déploiements reproductibles : Docker, Singularity/Apptainer, gestionnaires de paquets Guix/Spack et environnements hybrides HPC-cloud.
  • Expérience des plateformes d’orchestration (par exemple, Kubernetes) et des architectures orientées services / microservices.
  • Solide compréhension des environnements HPC (ordonnanceurs batch tels que SLURM, systèmes de fichiers partagés, nœuds GPU, contraintes de performance).
  • Capacité à définir et à appliquer des lignes directrices en matière d’intégration, de gestion des dépendances et de processus de changement contrôlé au sein de plusieurs équipes.
  • Expérience de la mise en œuvre de la validation automatisée des flux de travail, des tests de régression et de l’analyse comparative des performances.
  • Familiarité avec les systèmes de stockage distribués (y compris le stockage d’objets), l’hétérogénéité de l’infrastructure et la gestion sécurisée des accès.
  • Une forte réflexion au niveau du système et une vision architecturale
  • Capacité à aligner les contributeurs sur des pratiques d’ingénierie partagées
  • Des capacités de communication et de formation claires
  • Expérience du travail dans des environnements collaboratifs et multi-institutionnels

Privacy Preference Center