Stage 2025 - Data Science et Machine Learning/AI practitionner - Sujet : Causal Fairness Analysis: de la théorie à la pratique (H/F/N)
Société : Ekimetrics Lieu : Paris (Île-de-France)
Descriptif du poste
Société : Ekimetrics Catégorie : Stage Filiere : IT/Etudes, développement et intégration Lieu : Paris (Île-de-France)
Mission
Ekimetrics est leader en data science et fournisseur de solutions AI. Depuis 2006, nous utilisons la data science au service de l’optimisation de performance marketing, business et de la transition vers une performance plus durable.Si vous êtes passionné.e de data, ou de technologie en général, et que vous avez envie d’être de votre avenir professionnel, votre place est sûrement chez Ekimetrics ! Et si nous vous présentions quelques datas ? • 400 en data science • 1000 projets divers et variés pour plus de 350 clients • 5 bureaux : Paris, Hong Kong, Shanghai, Londres et New York • 1 milliard de $ de profits générés pour nos clients depuis 2006 Chez Ekimetrics nous avons l’ambition d’accompagner nos clients à repenser leur business model, en réconciliant performance économique et objectifs durables, grâce à la data science. C’est pourquoi nous avons en interne toutes les compétences nous permettant de répondre aux besoins de nos clients : Product Managers, Product Designers, Data Architects, Lead Tech, Data Engineers, DevOps Engineers, Data Scientists. L’équipe Data Science que vous pourriez rejoindre Pourquoi recrutons-nous ? Au sein d’Ekimetrics, le département Innovation travaille sur des sujets de recherche en IA en collaboration avec nos partenaires industriels et académiques. Le département regroupe plusieurs docteurs experts dans le domaine de l’IA générative,du deep learning, de la vision par ordinateur, de la série temporelle, de l’explicabilité, et de la causalité. Deux thèses CIFRE sont en cours, et deux débuteront en 2025. Autour de chaque expert des équipes sont constituées en charge de tester les algorithmes état de l’art et les adapter à des problématiques business spécifiques, de créer de nouvelles méthodologies ou algorithmes répondant à un problème relevé, et d’’assurer la passation en vue d’une intégration dans l’écosystème industriel d’Ekimetrics.L'équipe Causalité du département Innovation d’Ekimetrics vise à aborder un large ensemble de tâches causales, comprenant la découverte causale, l'estimation d'effets causaux et le raisonnement contrefactuel, par le biais d'une recherche de pointe dans le domaine de l'inférence causale. Nous tirons parti des dernières techniques d'IA et de modélisation statistique, notamment l'apprentissage automatique, l'apprentissage profond et la modélisation bayésienne. En testant continuellement de nouveaux algorithmes et en auditant les pratiques d'Ekimetrics en matière de raisonnement causal, l'équipe Causalité affine les méthodologies existantes et en développe de nouvelles pour répondre à de nouveaux problèmes et élargir le champ d'expertise d'Ekimetrics. Ainsi, au-delà de l'analyse des corrélations, Ekimetrics s'assure de rester à l'avant-garde de la prise de décision basée sur les données, en permettant à ses clients d'utiliser le raisonnement causal.Objectifs du stage : Causal Fairness Analysis: de la théorie à la pratiqueL'intelligence artificielle (IA) est largement utilisée dans les entreprises et les institutions comme outil d'aide à la décision dans diverses applications, y compris dans des secteurs sensibles tels que la santé, la politique et la finance. Malgré l'avantage concurrentiel indéniable que les systèmes d'IA peuvent apporter à certaines organisations, il est crucial de s'assurer que les droits humains fondamentaux sont respectés. C'est pourquoi les systèmes d'IA sont aujourd'hui de plus en plus réglementés, notamment en Europe avec l'AI Act, qui exige que tous les systèmes d'IA classés à haut risque évaluent leur conformité et leur impact sur les droits fondamentaux, y compris le droit à la non-discrimination [1].L'analyse des préjugés et de la discrimination dans les systèmes d'IA, généralement appelée « fairness analysis », repose sur deux concepts clés : le « traitement disparate » et l’ « impact disparate » [2, 3]. Même si ce n'est pas la seule façon de dériver une analyse de fairness, le raisonnement causal est un point de vue nécessaire à considérer, en particulier en ce qui concerne les notions de traitement et d'impact disparates [4, 5]. Récemment, Plečko et Bareinboim ont développé un cadre pour l'analyse causale de la fairness, appelé Causal Fairness Analysis (CFA) [6], fondé sur ces doctrines et les ont traduites en langage mathématique en utilisant des formulations contrefactuelles. Même si le framework CFA est riche et théoriquement fondé, sa mise en œuvre pratique dans des cas d'utilisation réels reste difficile (par exemple, les incertitudes liées à la validité des hypothèses et les complexités techniques liées à l'identification et à l'estimation des contrefactuels dans des régimes de données finies).C'est pourquoi ce stage vise à mettre en œuvre et à évaluer le framework CFA dans des cas d'utilisation réels. L'implémentation se fera en utilisant des approches de Double Machine Learning (DML) [7, 8] et en intégrant des composants d'analyse de sensibilité [9, 10]. En ce qui concerne les applications réelles, nous nous concentrerons sur les secteurs de la finance et des services publics, en démarrant sur l'ensemble de données COMPAS [11].Ce stage offre l'opportunité de s'engager dans la recherche de pointe en IA et de poursuivre potentiellement dans un programme de doctorat ou en tant que Data Scientist en IA avec Ekimetrics.Plus particulièrement vos responsabilités seront de :• Développer des connaissances dans le domaine de l'inférence causale et de la fairness en matière d'IA• Réaliser une analyse bibliographique complète des modèles et techniques de pointe dans le domaine de l’AI fairness causale• Mettre en œuvre et expérimenter des approches d’apprentissage automatique doubles, appelées Double Machine Learning (DML) [7, 8], améliorées par des analyses de sensibilité [9, 10].• Travailler avec ton N+1 pour concevoir, mettre en œuvre et évaluer des prototypes de modèles sur des ensembles de données synthétiques et réelles.• Partager les résultats avec les équipes internes et contribuer à l'élaboration de stratégies à long terme pour l'IA responsable chez Ekimetrics.Le profil et les compétences recherchées :• Actuellement en dernière année de master ou de diplôme d'ingénieur, avec de solides bases en statistiques, apprentissage automatique et programmation.• Expérience avec Python, données tabulaires• Appétence pour les projets pluridisciplinaires à l'intersection des statistiques, de la réglementation et de l’économie.• Solides compétences en matière d'analyse et de résolution de problèmes, avec un intérêt pour le développement de modèles d'IA équitables et responsables.• Curiosité et désir de s'investir dans l'apprentissage des fondements de l'inférence causale• Maîtrise de l'anglais Pourquoi nous rejoindre ?Rejoindre Ekimetrics, c’est intégrer une entreprise dont les valeurs s’appliquent au quotidien :• Evoluer dans un environnement type start-up et non traditionnel (#curiosité)• Être capable de prendre le feedback pour s’améliorer (#excellence)•Se former dès son arrivée et en continu grâce à une expérience apprenante unique et riche de nombreuses ressources (internes, externes, live et digital) alliant savoirs techniques, savoir-être et savoir-faire (#transmission)• Faire partie d’une communauté accueillante et soudée (#plaisir)• Imaginer des solutions inattendues & sortir de sa zone de confort (#créativité) En 2023, Ekimetrics a obtenu le statut d’entreprise à mission qui témoigne de notre ambition forte en matière de RSE. Nous sommes également certifiés Great Place to Work. Vous aurez accès à … • Au catalogue de formation EkiA qui contient des programmes qui vous feront monter en compétences sur nos solutions et nos métiers, des parcours apprenants sur notre plateforme digitale ainsi que des programmes dédiés à nos enjeux prioritaires, dont la sensibilisation aux sujets environnementaux avec la Climate School AXA.• Une vie sportive, artistique, musicale, ludique, caritative et engagée : de notre salle de sport privatisée à nos expositions d’art, en passant par des jeux vidéo et des concerts, ou encore les défis RSE sur la plateforme Vendredi ;• De nombreux évènements et séminaires pour rester proche de votre communauté ; • Des locaux modernes dans un quartier dynamique au cœur de Paris (Grands boulevards)• Une politique de télétravail flexible. Notre processus recrutement Un test technique sur HackerRank Un entretien RH avec un(e) Talent Acquisition Une étude de cas avec un(e) Consultant(e) Un entretien final avec un(e) Consultant(e) SeniorNous serions de vous donner de plus amples informations lors d’un entretien et attendons votre candidature avec impatience ! References:[1] Section 2 - Article 8. Requirements for high-risk AI systems: Compliance with the requirements. Of Regulation (EU) 2024/1689 of the European Parliament and of the Council of 13 June 2024 laying down harmonised rules on artificial intelligence and amending Regulations (EC) No 300/2008, (EU) No 167/2013, (EU) No 168/2013, (EU) 2018/858, (EU) 2018/1139 and (EU) 2019/2144 and Directives 2014/90/EU, (EU) 2016/797 and (EU) 2020/1828 (Artificial Intelligence Act) [2] Solon Barocas and Andrew D. Selbst. Big data’s disparate impact. California Law Review, 104-671. 2016[3] Solon Barocas, Moritz Hardt, and Arvind Narayanan. Fairness and Machine Learning: Limitations and Opportunities. MIT Press. 2023[4] Michael Moor. Causation in the Law. The Stanford Encyclopedia of Philosophy. 2019[5] Joseph Y. Halpern. Actual Causality. MIT Press. 2016[6] Drago Plečko and Elias Bareinboim. Causal Fairness Analysis. Foundations and Trends in Machine Learning: Vol. 17, No. 3, pp 1–238. 2024[7] Victor Chernozhukov, Denis Chetverikov, Mert Demirer, Esther Duflo, Christian Hansen, Whitney Newey and James Robins. Double/Debiased Machine Learning for Treatment and Causal Parameters. ArXiv preprint. 2024. [8] Helmut Farbmacher, Martin Huber, Lukáš Lafférs, Henrika Langen and Martin Spindler. Causal mediation analysis with double machine learning. ArXiv preprint. 2021. [9] Philipp Bach, Victor Chernozhukov, Malte S. Kurz and Martin Spindler. DoubleML - An Object-Oriented Implementation of Double Machine Learning in Python, Journal of Machine Learning Research, 23(53): 1-6, 2022 [10] Maresa Schröder, Dennis Frauen, and Stefan Feuerriegel. Causal fairness under unobserved confounding: a neural sensitivity framework. 12th International Conference on Learning Representations, 2023.[11] Julia Angwin, Jeff Larson, Surya Mattu, and Lauren Kirchner. Machine Bias: There’s software used across the country to predict future criminals. And it’s biased against blacks. ProPublica . 2016En tant qu’employeur, Ekimetrics offre à tous les mêmes opportunités d’accès à l’emploi sans distinction de genre, ethnicité, religion, orientation sexuelle, statut social, handicap et d’âge. Ekimetrics veille à développer un environnement de travail inclusif qui reflète la diversité dans ses équipes. €1,800 - €1,800 a monthCLIQUER ICI POUR POSTULER