ANF MLM4S 2024 : Action Nationale de Formation Modèles Larges Multimodaux pour la Science (MLM4S) : Utilisation et application des modèles larges multimodaux aux problématiques scientifiques

Les instituts CNRS Sciences Informatiques, CNRS Terre et Univers et le réseau des ingénieurs CNRS du PNRIA s'associent pour organiser une formation avancée en Intelligence Artificielle.

PRESENTATION

Aussois

Depuis le début des années 2010 l’intelligence artificielle numérique, prenant ses fondements dans les techniques d’apprentissage profond, est en plein essor. Cela se matérialise par de nombreux outils qui voient le jour dans le quotidien de tout un chacun et accessibles au plus grand nombre comme ChatGPT. Au niveau scientifique, ces évolutions sont permises grâce à trois facteurs principaux, l’accès à des ressources de calcul suffisantes, l’utilisation de grands jeux de données et le développement de frameworks d’IA alliant bien entendu les compétences techniques et scientifiques d’ingénieurs et de chercheurs dans ces domaines de l’informatique.


Ainsi le CNRS assure la gestion et le support du supercalculateur Jean Zay depuis 2019 via son unité de service IDRIS située sur le plateau de Saclay. Dans le cadre d’une initiative ministérielle PNRIA (Programme National de la Recherche en Intelligence Artificielle), 20 ingénieurs spécialistes en IA et sciences des données ont été recrutés sur 5 sites (IDRIS Saclay, GRICAD Grenoble, IRIT Toulouse, IRISA Rennes, LORIA Nancy) pour assurer le support de Jean Zay et participer à des projets d’ingénierie en IA à destination de l’ensemble des unités du CNRS, tous instituts confondus.


Le constat qui est fait par la communauté IA et par les ingénieurs en particulier est que les technologies dans ce domaine évoluent très rapidement avec une périodicité de l’ordre de 6 mois et qu’il est absolument fondamental pour les agents travaillant sur cette thématique scientifique de se tenir à jour, d’assurer une veille technologique active et de partager les connaissances entre eux.


Néanmoins, cela nécessite également de pouvoir se former sur de nouveaux concepts, de les mettre en pratique et donc de disposer d’un temps dédié pour réaliser cette tâche. Ce constat nous amène donc à proposer cette formation en Intelligence Artificielle, axée sur le deep learning et à destination d’un public expérimenté, ouverte à l'ensemble du CNRS et de ses partenaires.

OBJECTIFS

Les enjeux autour de cette formation sont multiples, à la fois scientifiques, afin de faire monter en compétence les équipes de recherche sur le domaine de l’IA mais aussi organisationnels en créant un effet réseau autour de cette thématique. En effet, cette ANF permettra de réunir sur un même site une quarantaine d’ingénieurs en IA dont ceux du PNRIA mais également pour moitié des spécialistes d’autres unités CNRS. Ce noyau dur pourra ensuite rejouer l’action et former localement à l’échelle de leur unité ou à travers la politique locale de site.


Des enjeux techniques liés à des sujets connexes seront également vus pendant l’ANF. On peut citer la meilleure gestion des données et les sujets afférents (Propriété Intellectuelle, problématiques de licences), la valorisation des outils nationaux comme l’utilisation du supercalculateur Jean Zay mais aussi d’aborder les enjeux environnementaux comme l’optimisation des calculs, la meilleure gestion des ressources sur le plan énergétique, l’IA frugale.

PRE-REQUIS ET AXES PEDAGOGIQUES

Cette formation s'adresse à un public d'ingénieurs et chercheurs en data science et Intelligence Artificielle expérimentés. Les pré-requis pour pouvoir assister à cette ANF sont d'avoir une première expérience dans le domaine de l'IA ou par exemple d'avoir suivi la formation FIDLE du CNRS (https://fidle.cnrs.fr/w3/programme.html).

A l’issue de la formation les stagiaires seront capables de :

  • Monter un projet OpenScience collaboratif en IA applicative et y participer.
  • Connaître les outils indispensables et les frameworks de Deep Learning.
  • Réfléchir et acquérir les enjeux, la méthodologie et l’éthique inhérente au domaine de l’IA.

Sur le plan technique, ils auront perfectionné leurs compétences pour l’usage de supercalculateurs, notamment Jean Zay, amélioré leur expertise de développement en science des données et maîtriseront les outils de gestion de modèles de très grande taille.

PROGRAMME

Le programme est en cours de finalisation et sera détaillé prochainement dans le menu programme dédié du site.

La formation comme son nom l'indique se focalisera sur le sujet de la multi-modalité en apprentissage profond et se déroulera sur 4 jours répartis sur 5 et les sujets suivants seront traités :

  • jour 1 : Revue des dernières avancées sur les LLM (Large Language Models), notamment avec prise en compte des contraintes. Formateur : François Yvon , Directeur de Recherche CNRS dans l'équipe MLIA de l'Institut des systèmes intelligents et de robotique (ISIR - CNRS/Sorbonne Université)
  • jour 2 : Première approche de la multimodalité appliquée à l'image et au texte
  • jour 3 : Multimodalités dans les sciences, traitement de données en parallèle, agrégation de gros datasets de données multimodales, méthodologie open-science
  • jour 4 : Poursuite des développements sur la multimodalité vus le jour précédent, puis introduction sur les problématiques de sobriété énergétique

 

LOGISTIQUE

L'ANF aura lieu au centre CAES Paul Langevin, à Aussois du lundi 9 décembre 14h au vendredi 13 décembre midi.

CAES du CNRS
Centre Paul-Langevin
24, rue du Coin
73500 Aussois

Les déjeuners du midi (les midis du lundi 9 et vendredi 13 décembre inclus) ainsi que les dîners du soir seront pris en charge dans le cadre de l'ANF. L'hébergement des participants est également pris en charge au sein du centre Paul Langevin.

Par contre, pour les agents CNRS, le transport pour se rendre sur le lieu de l'ANF et autres frais annexes sont pris en charge par la Délégation ou l'entité dont dépend la/le participant(e). Merci de vous rapprocher du service formation permanente de celle-ci.


INSCRIPTION

Les inscriptions sont ouvertes jusqu'au 04 octobre 2024 dans le menu Inscription https://anf-mlm4s.sciencesconf.org/registration?lang=fr

Les candidats retenus seront informés par email courant octobre.

DROIT À L'IMAGE

Sauf indication contraire de votre part, vous êtes supposé être d’accord pour figurer sur les photographies et vidéos prises au cours de la manifestation. Aucune exploitation commerciale des photographies et vidéos prises au cours de la manifestation par les participants n’est autorisée.

PROTECTION DES DONNEES PERSONNELLES

Les informations recueillies vous concernant vont faire l’objet d’un traitement par les organisateurs CNRS de l'action de formation.

Le/la Délégué/e à la Protection des Données du CNRS peut être contacté/e pour toute question sur la protection des données personnelles.Ses coordonnées sont les suivantes : CNRS Service protection des données, 2 rue Jean Zay, 54519 Vandoeuvre-lès-Nancy; mail: dpd.demandes@cnrs.fr.

Les données à caractère personnel sont collectées et traitées pour l’organisation des colloques. La base légale du traitement est l’intérêt légitime poursuivi par le responsable de traitement(cf. article 6.1.fdu Règlement européen sur la protection des données).

En fonction de leurs besoins respectifs, sont destinataires des données : les instituts CNRS Sciences Informatiques et CNRS Terre et Univers.

Aucun transfert de données hors de l'Union européenne n'est réalisé.

Vos données à caractère personnel seront conservées pour une durée de 1 mois après la fin du colloque.

Vous disposez des droits suivants pour l’utilisation qui est faite de vos données :-le droit d’opposition : vous pouvez à tout moment vous opposer au traitement de vos données et disposez du droit de retirer votre consentement -le droit d’accès et de rectification de vos données -le droit d’effacement -le droit à une utilisation restreinte lorsque vos données ne sont pas nécessaires ou ne sont plus utiles -le droit à la portabilité : communiquer vos données à la personne de votre choix.

Vous pouvez exercer ces droits en vous adressant à : ins2i-cellule-ia@cnrs.fr

Vous pouvez contacter également votre DPD à l’adresse suivante : DPD –2 rue Jean Zay–54519 –Vandoeuvre lès Nancy Cedex -dpd.demandes@cnrs.fr. Si vous estimez, après nous avoir contactés, que vos droits Informatique et Libertés ne sont pas respectés, vous avez la possibilité d’introduire une réclamation en ligne auprès de la CNIL ou par courrier postal.

Personnes connectées : 1 Vie privée
Chargement...