Scikit-Learn : la bibliothèque française de l’intelligence artificielle

Logiciel open source phare d’Inria, Scikit-Learn est l’une des bibliothèques de machine learning parmi les plus populaires et les plus utilisées au monde. Développée par une large communauté de contributeurs, elle entend démocratiser l’utilisation du Big Data et de l’intelligence artificielle dans de nombreux domaines. Depuis 2018, elle bénéficie du soutien du Consortium Scikit-Learn, porté par la Fondation Inria, qui rassemble une dizaine de mécènes. 

Scikit-Learn : la bibliothèque Python incontournable 

Scikit-Learn est une bibliothèque Python, libre et open source, destinée à l’apprentissage automatique. Initiée en 2007 et pilotée par Inria, elle rassemble plus de 2 000 contributeurs à travers le monde et compte près de 30 millions de visites sur son site en 2022, faisant d’elle le troisième logiciel libre de machine learning le plus utilisé au monde. En une quinzaine d’années, elle est ainsi devenue une référence en matière d’intelligence artificielle. Plus de 80 % des data scientists confient l’utiliser quotidiennement en 2022.

Utilisée par plus d’un million de personnes par mois, avec des applications allant de l’imagerie médicale à la recommandation de produits, Scikit-Learn met à disposition de tous de nombreux algorithmes à utiliser clés en main. Inria, bien sûr, mais aussi Spotify, Evernote, Booking.com, BNP Paribas Cardif… nombreuses sont les entreprises ou universités à travers le monde qui mettent à contribution la bibliothèque dans de nombreux contextes.

À titre d’exemple, en 2020, face à la pandémie, plusieurs équipes-projets Inria se sont mobilisées pour appuyer l’AP-HP dans le traitement des données des patients souffrant du Covid-19 et donc une meilleure prise en charge de ces derniers. S’appuyant sur l’utilisation de logiciels libres, dont Scikit-Learn, elles ont pu développer ScikitEDS, un outil sur mesure permettant de visualiser et de suivre quotidiennement et automatiquement les données de plus de 100 000 patients et de faciliter ainsi le pilotage opérationnel de la crise par les personnels de santé de l’AP-HP. 

Un logiciel open source pour une IA de confiance 

La popularité de Scikit-Learn est en grande partie due à sa facilité d’utilisation et à sa large gamme d’algorithmes de machine learning. Les utilisateurs peuvent facilement implémenter des tâches courantes telles que la classification, la régression et le clustering en utilisant des fonctions simples et intuitives. La bibliothèque offre également des outils tels que l’inspection de modèles, la sélection d’hyperparamètres ou la validation croisée, assurant aux utilisateurs que les modèles qu’ils développent sont robustes et fiables, évitant ainsi les biais algorithmiques. 

Nos sociétés font face à des défis considérables auxquels les plateformes open source comme Scikit-Learn permettent d’apporter des réponses collectives innovantes, en favorisant le partage d’expériences et de connaissances dans le domaine du numérique. Si la qualité de ses algorithmes, ses interfaces et sa documentation sont mondialement reconnues, c’est parce que Scikit-Learn est un logiciel open source sans cesse développé, enrichi et amélioré par de nombreux contributeurs. En donnant accès au code source de ses algorithmes, Scikit-Learn permet à l’utilisateur de le lire, de le comprendre et de le modifier en toute transparence. 

« L’une des missions de la Fondation Inria est de participer au développement des infrastructures de logiciel open source, dans l’intérêt de la communauté des chercheurs et des entreprises. Scikit-Learn illustre parfaitement l’impact, potentiellement très fort, de ces plateformes. »

Un consortium d’entreprises et de contributeurs engagés dans le partage de connaissances

Une communauté qui ne cesse de s’élargir 

Porté par la Fondation Inria, le consortium Scikit-Learn regroupe un ensemble d’entreprises sponsors qui apportent au projet les moyens nécessaires pour continuer à garantir sa qualité et lui permettre de relever de nouveaux défis. À travers lui, la Fondation Inria emploie les contributeurs centraux du projet, au service de la communauté Scikit-Learn tout entière, pour développer de nouvelles fonctionnalités ambitieuses. Les axes stratégiques du consortium sont fixés en concertation par la communauté et les mécènes de Scikit-Learn. 

Et pourquoi pas vous ?

Tous les partenaires sont les bienvenus pour soutenir ce projet. Par un financement direct ou en mettant des ressources à disposition, vous participez à promouvoir le développement de logiciels libres, transparents et inclusifs. 

Crédits photo : Pexels