La Fondation Inria porte le consortium Scikit-learn

La société fait face à des défis considérables auxquels les plateformes open source comme Scikit-learn permettent d’apporter des réponses collectives innovantes, en favorisant le partage d’expériences et de connaissances dans le domaine du numérique.

© Scikit-learn

 

 

Sprint Scikit-learn à Paris en 2019

Scikit-learn est une bibliothèque Python libre et Open Source destinée à l’apprentissage automatique. Elle est développée et régulièrement enrichie par de nombreux contributeurs. Notamment dans le monde académique par des instituts français d’enseignement supérieur et de recherche comme Inria.

Scikit-learn est utilisée par plus d’un demi-million de personnes dans le monde, avec des applications allant de l’imagerie médicale à la recommandation de produits. Elle propose de nombreux algorithmes à utiliser clés en main, à disposition des data scientists.
La qualité de ses algorithmes, ses interfaces, et sa documentation, sont universellement reconnues. Son développement suit un processus rigoureux pour maintenir cette qualité.

La Fondation Inria porte le consortium Scikit-learn et donne des moyens pour continuer à garantir la qualité et permettre de relever de nouveaux défis. En particulier, elle emploie des contributeurs centraux du projet, au service de la communauté Scikit-learn, pour développer des nouvelles fonctionnalités ambitieuses. Les priorités du consortium sont fixées en commun par la communauté, les adhérents, et les mécènes.

  • Un logiciel libre est un logiciel dont l’utilisation, l’étude, la modification et la duplication par autrui en vue de sa diffusion sont permises, techniquement et légalement, ceci afin de garantir certaines libertés induites, dont le contrôle du programme par l’utilisateur et la possibilité de partage entre individus.

  • La désignation open source, s’applique aux logiciels dont la licence respecte des critères précisément établis par l’Open Source Initiative, c’est-à-dire les possibilités de libre redistribution, d’accès au code source et de création de travaux dérivés. Mis à la disposition du grand public, ce code source est généralement le résultat d’une collaboration entre programmeurs.

  • En informatique, le code source est un texte qui présente les instructions composant un programme sous une forme lisible, telles qu’elles ont été écrites dans un langage de programmation. Afin d’être exécuté par le processeur, celui-ci est traduit par un assembleur ou compilateur en code binaire.
    Scikit-learn donne accès au code source des algorithmes et ainsi permet à l’utilisateur de le lire, de le comprendre, et de le modifier en toute transparence.

  • L’arrivée du web a permis le développement des modes de travail collaboratifs ou en réseau qui évoluent parfois vers la constitution de communautés organisées. Elles peuvent se baser sur l’expérience de communautés de chercheurs, de développeurs, de l’entreprise, des associations et des communautés ouvertes. Ce mode de collaboration a démontré son efficacité et son dynamisme dans de nombreux domaines, en particulier pour le développement de logiciels libres communautaires.

  • En développement logiciel, un sprint est un rassemblement de personnes impliquées dans un projet afin de se concentrer sur le développement de ce projet. Un sprint dure en général de deux à sept jours. Un avantage essentiel de l’organisation de sprints, est que les membres du projet se rencontrent en personne de manière conviviale et établissent une communication plus efficace que lorsqu’ils travaillent ensemble à distance.

Scikit-learn permet de fournir des ressources utiles dans de nombreux contextes et ainsi de soutenir des projets pour le bien commun.
En 2020, face à la pandémie, des ingénieurs du consortium Scikit-learn, des ingénieurs et chercheurs des équipes Parietal, SequeL, Zenith, et du service expérimentation et développement du centre Inria de Paris se sont mobilisés pour appuyer l’AP-HP sur le volet du traitement des données de la crise. Ce partenariat et l’utilisation de logiciels libres, dont Scikit-learn, ont permis de développer un outil sur mesure, ScikitEDS, permettant de visualiser et de suivre quotidiennement et automatiquement les données de plus de 100 000 patients.

+ 0

utilisateurs par mois

+ 0

contributeurs

0 ème

logiciel de machine learning le plus populaires sur Github

Rejoindre le consortium Scikit-learn

Pour accompagner et stimuler l’écosystème Scikit-learn, des entreprises soutiennent le projet au sein de la fondation partenariale Inria. Avec l’appui de ses partenaires, les ingénieurs de développement assurent la qualité du projet (correction de bogues) et l’intégration des contributions de la communauté, ainsi que l’ajout de nouvelles fonctionnalités ambitieuses.
Les soutiens de l’initiative et les membres de la communauté sont associés à la définition des priorités de développement et bénéficient de la communication autour de Scikit-learn en tant que partenaires du projet.