Poste de doctorat en modélisation et simulation de systèmes de stockage Exascale
Exa-MA : Méthodes et algorithmes pour Exascale
Poste de doctorant
Les candidatures doivent être déposées en ligne sur le site dédié. Pour plus d'informations, veuillez contacter François Tessier, chercheur à l'INRIA Rennes - Centre de recherche Bretagne Atlantique et à l 'IRISA (CNRS/Université de Rennes), [email protected].
Contexte
Lancé en 2023 pour une durée de 6 ans, The NumPEx PEPR a pour objectif de contribuer à la conception et au développement de méthodes numériques et de composants logiciels qui équiperont les futures machines européennes Exascale et post-Exascale. NumPEx vise également à aider les applications scientifiques et industrielles à exploiter pleinement leur potentiel.
Exa-MA vise à révolutionner les méthodes et algorithmes pour l’échelle exascale : discrétisation, résolution, apprentissage et réduction d’ordre, problème inverse, optimisation et incertitudes. Nous contribuons à la pile logicielle des futurs ordinateurs européens.
Mission
L’équipe KerData est une petite équipe de 8 scientifiques et 5 étudiants en doctorat qui mènent plusieurs projets et collaborations internationales. L’équipe se consacre à la recherche expérimentale, validée par la mise en œuvre et l’expérimentation de prototypes de logiciels avec des applications réelles.
La gestion de ce degré élevé d’hétérogénéité du stockage constitue un véritable défi pour les flux de travail et les applications scientifiques. Cette thèse propose de modéliser et de simuler des systèmes de stockage hétérogènes afin d’étudier leur comportement, de prédire leur performance et de proposer des approches algorithmiques innovantes pour une meilleure utilisation des ressources.
Principales activités
L’un des objectifs de cette thèse est de mieux utiliser les ressources de stockage pour les applications scientifiques et les flux de travail destinés à fonctionner sur des supercalculateurs Exascale. Dans un premier temps, les systèmes de stockage tels que Lustre et DAOS seront étudiés, modélisés et simulés dans un simulateur existant basé sur WRENCH, appelé StorAlloc, développé par l’équipe. Cette étude mettra en lumière les critères qui influencent la performance de ces systèmes. Deuxièmement, des algorithmes avancés d’allocation des ressources seront proposés, mis en œuvre et évalués dans le simulateur afin de surmonter les limites des méthodes existantes (par exemple, Lustre utilise les disques de son système de stockage d’une simple manière round-robin). Plusieurs critères peuvent être pris en compte dans ces algorithmes, tels que la contention ou l’énergie. Les outils développés par le CEA, notamment le moteur politique Robinhood et les résultats du projet européen IO-SEA, seront également utilisés pour valider ces contributions sur des systèmes réels. Pour ce travail, l’accent sera mis sur les collaborations internationales, en particulier avec l’Université de Manoa (HI, USA), et sur les partenariats nationaux tels que l’équipe française du SKA qui fournit un cas d’utilisation pertinent pour ce travail. Le candidat aura également la possibilité d’être accueilli pour des stages de 3 à 6 mois à l’étranger afin de renforcer la visibilité internationale de son travail et de bénéficier de l’expertise d’autres chercheurs dans le domaine.
Compétences requises
- Un excellent master en informatique ou équivalent
- La réalisation d’une unité d’enseignement dans le domaine du calcul à haute performance ou de l’informatique distribuée est un avantage.
- Compétences en programmation en C/C++ et Python
- Bonne capacité de communication en anglais, à l’oral et à l’écrit.
- Ouverture d’esprit, fortes capacités d’intégration et esprit d’équipe