FedMalin : le Groupe La Poste soutient un Défi Inria dans son exploration des possibilités offertes par l'apprentissage fédéré

L’apprentissage fédéré (federated learning en anglais) est aujourd’hui l’un des champs les plus prometteurs des sciences des données. Lancé le 28 novembre 2022 au centre Inria de Paris, le défi FedMalin porté par Inria vise à faire progresser la recherche sur ce thème hautement stratégique, avec de multiples applications possibles, notamment dans le champ de la santé. Mobilisant des équipes et moyens sans précédent sur la thématique, il bénéficie d’un soutien décisif du Groupe La Poste dans le cadre de son mécénat conclu avec la Fondation Inria.

28 novembre 2022 / mis à jour le 28 avril 2023

L’apprentissage fédéré, un champ dynamique et prometteur de recherche

Nouveau paradigme dans le champ des algorithmes, des bases de données et de l’apprentissage automatique (machine learning), l’apprentissage fédéré consiste à déployer des algorithmes de machine learning sur des données de plusieurs entités stockées localement. Ainsi, si les données sont décentralisées et restent la propriété de leurs entités hôtes, les résultats des apprentissages et de leur exploitation peuvent être mis en commun entre membres d’un même réseau.

En travaillant sur des volumes toujours plus importants de données, cette mécanique d’apprentissage fédéré permet d’obtenir des résultats significatifs et de développer des modèles prédictifs dans de nombreux champs. Mais elle soulève également de nouvelles questions telles que la confidentialité des données sous-jacentes, la consommation d’énergie des systèmes d’apprentissage, la personnalisation ou encore les effets des corrélations spatiales et temporelles. C’est pour répondre à ces questions qu’Inria a lancé le Défi FedMalin (Federated Machine Learning over the Internet), soutenu par la Fondation Inria et le mécénat du Groupe La Poste. D’une ampleur inédite, ce défi scientifique regroupe 10 équipes de recherche (COATI, COMETE, DYOGENE, EPIONE, MAGNET, MARACAS, NEO, SPIRALS, TRIBE, WIDE) et se structure autour de 6 work packages. La responsabilité scientifique est assurée par Aurélien Bellet et Giovanni Neglia (Inria).

6 work packages pour répondre aux défis de l’apprentissage fédéré :

  1. Privacy and Fairness : répondre aux questions spécifiques relatives à la protection des données dans un contexte d’apprentissage fédéré.
  2. Energy : quantifier les consommations énergétiques des algorithmes actuels et en développer de nouveaux, plus sobres.
  3. Personalization : explorer les possibilités théoriques et pratiques de personnalisation (recommandations, autocompletion de textes) à l’échelle de l’utilisateur grâce à des résultats issus d’un apprentissage fédéré.
  4. Location-dependent models : développer des modèles d’apprentissage fédéré basés sur des flux de données captés localement (capteurs sur un bâtiment, smart city…).
  5. Experimentation and software development : développer un environnement de logiciels et technologies à même de faciliter les expérimentations des autres work packages et plus globalement de la communauté scientifique.
  6. Concrete Use Case : développer des applications concrètes, notamment dans les champs de la médecine et de la « mesure de foules » (crowdsensing).

Des applications prometteuses, à condition de relever le défi de la protection des données

Les travaux du Défi FedMalin sont pour le moment essentiellement dédiés à des applications dans le monde hospitalier et de la santé. Il vise trois objectifs : analyser et garder les données localement, enrichir les modèles centraux avec les éléments appris localement et adapter les modèles locaux à leurs biais particuliers.

Dans le cadre de ce défi, des collaborations avec la Cnil et plusieurs institutions médicales telles qu’Unicancer Hospitals, le CHU de Lille et le Groupement de Coopération Sanitaire G4 (qui, depuis 2004, réunit les CHU d’Amiens, Caen, Lille et Rouen) sont prévues pour lancer différentes expérimentations d’apprentissage fédéré.

En déployant des algorithmes de machine learning sur les données médicales d’un nombre important de structures de santé (imagerie médicale, données cliniques et biologiques), il devient possible de construire des modèles statistiques prédictifs quant à l’évolution de l’état de santé des patients concernés.

Si les possibilités médicales ouvertes par l’apprentissage fédéré sont vastes, la sensibilité des données sous-jacentes (données de santé personnelles des patients) est importante. Le Défi FedMalin s’attache ainsi à développer ses expérimentations en garantissant la confidentialité de ces données et en réduisant les risques d’intrusions. Cela passe notamment par la mise en place de protocoles respectueux des règles de confidentialité des données locales, le renforcement de la sécurité des algorithmes, ou la préférence pour des solutions open source, transparentes pour les parties prenantes du système.

C’est cette articulation entre sécurité des données, mobilisation d’un système distribué et enrichissement de modèles centraux qui a notamment motivé le soutien du Groupe La Poste.

Une recherche décisive dans un environnement fortement compétitif

Le lancement de ce défi se fait dans un moment d’accélération des recherches en matière d’apprentissage fédéré. Toutefois, si la recherche progresse, les applications restent encore limitées. En mettant en place un programme de recherche de cette ampleur, Inria prend une position centrale sur cette thématique stratégique. Le développement de solutions open source, concurrentes des logiciels propriétaires existants, permettra des avancées à large échelle de la communauté et une contribution décisive des équipes Inria.

L’apprentissage fédéré fait ainsi figure d’alternative aux modèles centralisés de type cloud portés par les grandes firmes américaines : les données restent la propriété des parties prenantes, sont stockées localement, traitées par des logiciels open source, tout en ouvrant des possibilités de traitement de jeux de données à grande échelle.

Exploiter les potentiels d’innovation des données et du machine learning par des solutions décentralisées, transparentes et respectueuses des personnes et de l’environnement : il s’agit là d’un projet emblématique de l’enjeu de société numérique de confiance porté par la Fondation Inria avec le soutien décisif du Groupe La Poste.

Crédits photo : Inria / photo G. Scagnelli

Le Groupe La Poste, Inria et la Fondation Inria : un partenariat fort pour une société numérique fondée sur la confiance 

Le 30 mars 2021, La Poste, Inria et la Fondation Inria signaient une convention de mécénat pour faire avancer ensemble la recherche en sciences et technologies du numérique. Exploitation éthique des données, développement de la e-santé… retour sur les premiers projets et actions à impact lancés dans le cadre de ce partenariat guidé par l’intérêt général.

30 septembre 2022 / mis à jour le 18 mars 2023

Un mécénat pour restaurer la confiance dans le numérique

Réunis autour d’un socle de valeurs communes, La Poste, Inria et la Fondation Inria partagent la volonté de construire une société numérique fondée sur la confiance. Conjuguant l’engagement de La Poste sur les sujets de transformation technologique et l’expertise scientifique d’Inria sur les enjeux de souveraineté numérique, le partenariat de mécénat qui se déploie depuis avril 2021 vient soutenir le développement de solutions responsables face à la digitalisation de la société.

Portant sur des thèmes correspondant aux engagements sociétaux du Groupe La Poste – le numérique au service du développement durable, la santé numérique ou encore la sécurité et la protection des données des usagers -, le cadre du mécénat décline ses actions selon trois modalités prioritaires :

  • projets de recherche-développement contribuant de manière significative au progrès des connaissances fondamentales diffusées librement au sein de la communauté scientifique internationale et participant à la résolution de problèmes concrets à fort impact applicatif dans des domaines scientifiques en synergie avec les problématiques technologiques du Groupe La Poste ;
  • valorisation de la recherche menée par Inria à travers le soutien au développement des activités de son Startup Studio, suivant les sujets d’intérêt de La Poste ;
  • développement des opportunités de carrières offertes aux doctorants, ingénieurs et post-doctorants afin de répondre aux besoins croissants d’expertise et de compétences en matière de technologies de pointe en France. Inria contribue ainsi à la formation au numérique de près d’un millier de jeunes chercheurs et ingénieurs qui quittent chaque année l’institut après avoir été associés au développement de projets technologiques de haut niveau.

Un soutien résolu à la prise de risque scientifique

Les premières réalisations du mécénat se sont portées vers le soutien aux « Actions exploratoires », un dispositif mis en place par Inria visant à faire émerger des thématiques de recherche novatrices en donnant aux scientifiques les moyens de tester des idées originales mais risquées. La conduite de ces projets, sous forme de galops d’essai, donne la part belle à l’intuition des chercheurs en mobilisant des ressources suffisantes pour une période exploratoire de 18 à 24 mois. Un certain nombre d’actions exploratoires ont ainsi été soutenues dès la première année de mécénat, répondant à deux thématiques prioritaires parmi celles identifiées en 2021.

Améliorer les services numériques dans le domaine de la santé

Les outils numériques, tout en permettant des progrès significatifs dans le domaine de la santé, mettent à l’épreuve la protection des données des patients. Parmi les pistes explorées, le projet FLAMED propose d’étudier une approche décentralisée de l’intelligence artificielle appliquée à la santé. En étroite collaboration avec le Centre hospitalier universitaire de Lille, cette action exploratoire soutenue par La Poste expérimente un système d’apprentissage machine de pointe, garant de la conservation des données en interne. Action connexe bénéficiant aussi du soutien de La Poste, MAMMALS vise pour sa part à fournir des inférences à faible latence en exécutant, à proximité de l’utilisateur final, des modèles simples d’apprentissage automatique qui peuvent également exploiter une (petite) base des données locales.

Redonner confiance dans le numérique

Les algorithmes, responsables aujourd’hui d’un certain nombre de décisions, présentent un biais initial : la quantité et la sélection d’informations auxquelles ils donnent accès. Les projets Inria proposent de rendre plus transparent et intelligible le fonctionnement sous-jacent de ces logiciels. C’est le cas, notamment, de l’action exploratoire IDEM soutenue par La Poste, dont la vocation est de développer de nouveaux modèles mathématiques permettant de prédire le comportement d’agents autonomes dans le cadre d’une prise de décision décentralisée.

Un mécénat qui s’inscrit dans la durée

La Poste et la Fondation Inria inscrivent leur collaboration dans le temps long, celui de la recherche. Elles le font particulièrement via le financement de « Défis » – projets de recherche de grande envergure menés par plusieurs équipes Inria sur une période de quatre années. C’est le cas, notamment, du Défi FedMalin (FEDerated MAchineLearning over the Internet), qui sera lancé en novembre prochain et qui vise à apporter une contribution décisive au champ prometteur de l’apprentissage fédéré. C’est le cas, également, du Défi HyAiAi qui porte sur la création d’un « machine learning interprétable » à travers l’étude et la conception d’approches hybrides combinant des modèles numériques de pointe avec des modèles symboliques explicables. Plus précisément, l’objectif est ici de pouvoir intégrer des contraintes de haut niveau dans les modèles d’apprentissage automatique, de donner aux concepteurs de modèles des informations sur les parties les moins performantes du modèle et de fournir au profane des explications compréhensibles sur les résultats de ce dernier.

Un an et demi après la signature de la convention de partenariat, les échanges nourris entre La Poste, Inria et la Fondation Inria ont permis d’identifier et lancer des actions structurantes dans les domaines de la santé aussi bien que du numérique responsable. Avec la médiation active de la fondation, la collaboration entre les équipes s’est organisée et intensifiée à travers un comité de suivi des projets, des groupes de travail thématiques ou des visites de site.

Crédits photo : Pixabay

Pour un numérique de confiance : signature d’un accord de mécénat entre La Poste, Inria et la Fondation Inria  

Le Groupe La Poste, Inria et la Fondation Inria viennent de conclure, le 30 mars 2021, un accord de mécénat pour répondre de manière positive aux enjeux soulevés par la numérisation de la société. Ce partenariat stratégique donnera à Inria les moyens d’amplifier de manière significative les recherches menées pour résoudre les défis scientifiques que pose le développement de technologies numériques dont on puisse contrôler l’impact et en lesquelles chacun puisse avoir confiance.

1 avril 2021 / mis à jour le 18 mars 2023

Un partenariat fort au service de l’intérêt général

S’appuyant sur un socle de valeurs communes, le partenariat conclu entre La Poste, Inria et la Fondation Inria vise à soutenir le développement d’un numérique responsable et de confiance, respectueux de l’humain, de la société et de la planète.

Entreprise multi-activités de 240 000 personnes et aux métiers variés, La Poste a en effet placé la transition numérique au cœur de son modèle. Devenue, en juillet 2021, la première entreprise publique française à adopter le statut d’entreprise à mission, elle a fait de son engagement numérique l’un des quatre grands axes structurants de son nouveau statut. Déjà tiers de confiance pour les échanges physiques, La Poste est désormais un tiers de confiance numérique qui vise à démocratiser l’accès à l’innovation et à retisser le lien entre l’humain et les technologies.

C’est autour de cet enjeu de confiance que La Poste, Inria et la Fondation Inria se sont naturellement retrouvées en se fixant une ambition commune : permettre à la recherche en sciences et technologies du numérique de contribuer à la diffusion large de connaissances fondamentales au sein de la communauté scientifique internationale et de participer à la résolution de problèmes concrets à fort impact applicatif.

Soucieuse de renforcer les liens existant entre la recherche et l’entrepreneuriat, La Poste accompagnera également, dans les domaines de développement prioritaires du Groupe, Inria Startup Studio dans son ambition de créer 100 projets de startups par an. De plus, elle apportera son soutien à la formation d’ingénieurs et de chercheurs d’Inria en proposant des missions ou des opportunités de carrière dans l’entreprise.

« Je suis fier d’initier cette collaboration emblématique avec Inria, centre de recherche de renommée mondiale dans les sciences du numérique, avec qui nous partageons le même sens de l’intérêt général et la même vision d’un numérique éthique et responsable au service de la souveraineté numérique de la France. Les travaux menés dans le cadre de ce partenariat serviront à anticiper les ruptures technologiques à venir et seront un catalyseur d’innovations en réponse aux attentes de la société et de nos clients. »

Quatre thématiques d’actions prioritaires

Afin d’agir avec efficacité, des réunions préalables entre les trois parties ont permis de déterminer quatre axes prioritaires de collaboration scientifique autour d’enjeux qui apparaissent majeurs pour la décennie qui vient. Ces thématiques ne sont pas figées et seront amenées à évoluer ou à être enrichies au cours du temps selon les besoins qui viendraient à émerger.

Numérique et développement durable

Alors que les usages du numérique sont appelés à se développer fortement en lien avec les objets connectés, la 5G, l’IA… les impacts environnementaux du numérique deviennent un sujet majeur documenté par une littérature récente et abondante. Fabrication des outils numériques, consommation d’énergie, directe ou déportée, fonctionnements induits ou déchets produits… le secteur du numérique pris isolément va contribuer de plus en plus significativement à notre empreinte environnementale. Mais parallèlement, par la virtualisation, par l’optimisation, il permet des réductions significatives de l’empreinte carbone dans de nombreux domaines.

Alors que la préservation de l’environnement est devenue une préoccupation majeure de nos sociétés et de la sphère économique, l’enjeu est d’éclairer les conséquences positives comme négatives des usages du numérique sur l’environnement, de favoriser l’éco-conception de services numériques et de promouvoir des outils/simulateurs numériques d’aide à la décision.

Vers un écosystème numérique de confiance

Dans une large mesure, le niveau de confiance que l’on peut mettre dans un système d’information dépend de la nature et de l’efficacité des mécanismes de sécurité qui sont mis en œuvre dans ce système pour empêcher une entité non autorisée d’accéder, de modifier et/ou de rendre indisponibles des données ou des services. La cybersécurité consiste ainsi à assurer trois propriétés majeures de l’information, des services et de l’infrastructure informatique générale (réseau, stockage, etc.) : confidentialité, intégrité, disponibilité. À quoi ajouter encore une autre propriété de plus en plus importante aux yeux des utilisateurs : la protection de leurs données personnelles.

Inria est très engagé dans la résolution de problèmes scientifiques touchant à la prévention, à la détection ou au traitement des risques et des attaques. Authentification, cryptanalyse, cryptographie post-quantique, « obfuscation »… La Poste a à cœur de soutenir les travaux de l’institut dans ces domaines d’expertise cruciaux pour un usage confiant des technologies numériques.

Demain, la confiance numérique pour tous

Un autre élément est devenu crucial aujourd’hui pour établir la confiance : l’assurance que certains principes sont effectivement respectés par le système et son opération. Ceci concerne aussi bien la protection des données personnelles que la fiabilité des algorithmes, en particulier ceux relevant de l’apprentissage automatique. S’agissant de la protection de la vie privée, plusieurs approches sont mobilisées comme la cryptographie, l’anonymisation ou la distribution. Pour leur part, les logiciels apprenants, tout particulièrement à base d’apprentissage supervisé, font aujourd’hui l’objet de nombreuses recherches au niveau mondial, impliquant au plus haut point les équipes Inria.

Le traitement des biais d’apprentissage (biais de genre, d’ethnie, de langue…), l’explicabilité d’un résultat produit par un réseau de neurones profond, la garantie formelle du résultat… sont autant de défis que La Poste, Inria et la Fondation Inria souhaitent affronter ensemble.

Le numérique au service d’une santé pour tous

Les données de santé suscitent un engouement croissant, comme l’illustrent les développements récents autour des entrepôts de données de santé des CHU ou la création du Health Data Hub. L’espoir est qu’une plus grande disponibilité de plus gros volumes de données de santé permette des avancées significatives dans de nombreux domaines, comme la prévention, l’assistance au diagnostic, au pronostic ou à la décision, l’épidémiologie, la pharmacologie… Mais cette volonté d’augmenter les volumes des données disponibles entraîne une tension liée à la nécessité de garantir le respect de la vie privée des patients ou des assurés sociaux.

Anonymisation ou pseudonymisation des données, stockage distribué ou centralisé, consentement des individus, ontologies médicales permettant d’interpréter avec rigueur les données de santé et en particulier les données provenant de sources différentes… ces sujets et d’autres font l’objet d’une recherche dynamique mobilisant une cinquantaine d’équipes-projets au sein d’Inria.

« Inria et sa fondation ont pour ambition de construire une société numérique fondée sur la confiance. Ce mécénat signé avec le Groupe La Poste repose d’abord sur une communauté de valeurs fortes et un sens partagé du service public. Il permettra la mise en commun de nos expertises pour faire émerger un numérique à visage humain. » 

Un partenariat sur la durée au service d’une recherche « engagée »

Parce que la recherche a besoin de temps, la convention de mécénat conclue entre le Groupe La Poste, Inria et la Fondation Inria porte sur une durée initiale de trois ans. Fenêtre ouverte sur la recherche en train de se faire et sur les technologies qui en découlent, cette collaboration offrira à La Poste l’opportunité d’éclairer l’avenir et d’anticiper des ruptures technologiques. Le résultat des recherches menées dans le cadre de ce mécénat sera diffusé publiquement.

À voir : Philippe Wahl, PDG du Groupe La Poste, et Bruno Sportisse, PDG d’Inria, partagent leur vision du partenariat

Crédits photo : Freepik