Stage - Machine Learning pour sorties fonctionnelles
Société : CEA Lieu : Bouches-du-Rhône (Provence-Alpes-Côte-D'Azur)
Descriptif du poste
Société : CEA Catégorie : Stage Filiere : IT/Etudes, développement et intégration Lieu : Bouches-du-Rhône (Provence-Alpes-Côte-D'Azur)
Mission
Description de l'offreEn intégrant nos équipes, vous mettrez vos compétences et votre enthousiasme au service de projets sociétaux majeurs.Le stage aura pour but d’étudier et développer des approches de machine learning adaptées à des sorties temporelles et/ou spatiales, basées sur des techniques de réduction de dimension, et avec pour objectif de permettre une propagation des incertitudes en entrée des simulateurs numériques utilisés dans le laboratoire.L'analyse des accidents nucléaires pour l'évaluation des risques s'appuie fortement sur des codes informatiques permettant de simuler et prévoir les phénomènes physiques, afin d’estimer par exemple des marges de sûreté. Or, ces codes se basent sur de nombreux paramètres d'entrée incertains, conduisant à des sorties elles aussi entachées d’incertitudes. Evaluer l'impact des incertitudes associées aux paramètres d’entrée sur les résultats du simulateur numérique est donc essentielle pour l'analyse de sûreté.Or, une propagation des incertitudes via des approches de type Monte Carlo est souvent difficilement réalisable sur les simulateurs utilisés, en raison du temps de calcul nécessaire à chaque simulation. Seul un petit nombre de simulations (plusieurs centaines à quelques milliers) est en pratique réalisable et disponible. Une approche classique est alors d’entraîner un modèle de machine learning (apprentissage statistique supervisé) sur les simulations disponibles. Ce modèle mathématique est ensuite utilisé pour réaliser les études statistiques plus gourmandes en nombre d’évaluations (propagation fine des incertitudes, analyse de sensibilité détaillée, etc.).Dans le cadre du stage, on s’intéresse plus particulièrement aux simulateurs fournissant en sortie des variables fonctionnelles : variables temporelles et/ou spatiales, permettant de décrire le phénomène au cours du temps et/ou dans l’espace.Tout l’enjeu est alors d’adapter les modèles de machine learning à ce type de variables. Une stratégie éprouvée consiste à réaliser une première étape de réduction de dimension de la sortie avant d’entraîner des modèles de machine learning sur chacun des coefficient de la décomposition.L’objectif du stage sera de mettre en œuvre et comparer différentes techniques de réduction de dimension, plus ou moins complexes, telles que l’analyse en composantes principales fonctionnelle, la décomposition en ondelettes, ou encore la compression par auto-encodeur.L’objectif sera aussi de quantifier et prendre en compte la perte d’information liée à cette réduction de dimension et d’évaluer son impact sur la prédiction du modèle de machine learning final. Moyens / Méthodes / LogicielsPython, R, unix, latex, git Profil du candidat Vous préparez un Bac+5 (Diplôme École d'Ingénieurs ou équivalents) en mathématiques appliquées et tout particulière en science des données (réduction de dimension, analyse en composantes principales).Une expérience avec les modèles d'apprentissage statistiques, en particulier les réseaux de neurones, serait un plus. Vous êtes à l'aise avec un environnement informatique de type Unix (linux).La maîtrise de l'outil de suivi de version git et du langage latex seraient un plus.Adressez-nous votre candidature pour rejoindre l'équipe et contribuer auxprojets structurants et innovants du CEA !Conformément aux engagements pris par le CEA en faveur de l’intégration des personnes en situation d’handicap, cet emploi est ouvert à toutes et à tous. Le CEA propose des aménagements et/ou des possibilités d'organisation.CLIQUER ICI POUR POSTULER