Scikit-Learn : Titan du Machine Learning, Champion de l’open source - Gaël Varoquaux (Co Founder @SickitLearn & Probabl) #70 | Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Description

Gaël Varoquaux, cofondateur de Sickit Learn et Probabl et directeur de recherche à l’INRIA est l’invité de l’épisode 70 du podcast Data Driven 101.

Comment Scikit-learn est-il devenu un outil incontournable pour les data scientists, et comment est-il né ?

Gaël Varoquaux nous révèle les origines de cette librairie open source incontournable pour l'apprentissage statistique en Python, l'organisation et les défis de ce projet open source qui a révolutionné le monde de la data science.

Un épisode riche en enseignements sur l'apprentissage statistique, la gouvernance des projets open source et les défis de la collaboration dans le monde de la data science.

🔑 MOTS CLÉS

Open source : Un logiciel open source est un logiciel dont le code source est accessible au public et peut être librement utilisé, modifié et distribué.

Apprentissage supervisé : L'apprentissage supervisé est une technique d'apprentissage automatique où un modèle est entraîné sur un ensemble de données étiquetées, c'est-à-dire des données pour lesquelles la sortie souhaitée est connue.

Apprentissage non supervisé : L'apprentissage non supervisé est une technique d'apprentissage automatique où un modèle est entraîné sur un ensemble de données non étiquetées, c'est-à-dire des données pour lesquelles la sortie souhaitée n'est pas connue.

Réduction de dimensions : La réduction de dimensionnalité est une technique qui vise à réduire le nombre de variables (ou dimensions) d'un jeu de données tout en conservant autant d'informations que possible.

Clustering : Le clustering (ou regroupement) est une technique d'apprentissage non supervisé qui vise à regrouper des données similaires en groupes (ou clusters).

GitHub: GitHub est une plateforme de développement collaboratif qui permet aux développeurs de stocker, partager et gérer leur code source.

🎙 SOUTENEZ LE PODCAST

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

Épisode #52 Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)

Épisode #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative

Épisode #51 Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard)

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Dans ce podcast IA & Data 100% en français, Marc Sanselme reçoit des professionnels de fonctions et d’horizons variés pour nous parler de leurs aventures, leurs succès, leurs échecs, leurs espoirs, leurs techniques, leurs astuces, leurs histoires et leurs convictions.

De la Business Intelligence à la Generative AI (LLM, RAG, Agents...) ou à la Computer Vision, toutes les thématiques liées à l'IA sont décortiquées épisode après épisode par Marc Sanselme et ses invités issus de la French tech et d'ailleurs.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio no-code pour construire des automatisations et des Agents IA sur mesure.
Draft'n run est également éditrice du produit Never Drop, outil d'automatisation CRM (Hubspot) pour commerciaux.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Description

Gaël Varoquaux, cofondateur de Sickit Learn et Probabl et directeur de recherche à l’INRIA est l’invité de l’épisode 70 du podcast Data Driven 101.

Comment Scikit-learn est-il devenu un outil incontournable pour les data scientists, et comment est-il né ?

Un épisode riche en enseignements sur l'apprentissage statistique, la gouvernance des projets open source et les défis de la collaboration dans le monde de la data science.

🔑 MOTS CLÉS

Open source : Un logiciel open source est un logiciel dont le code source est accessible au public et peut être librement utilisé, modifié et distribué.

Clustering : Le clustering (ou regroupement) est une technique d'apprentissage non supervisé qui vise à regrouper des données similaires en groupes (ou clusters).

GitHub: GitHub est une plateforme de développement collaboratif qui permet aux développeurs de stocker, partager et gérer leur code source.

🎙 SOUTENEZ LE PODCAST

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

Épisode #52 Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)

Épisode #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative

Épisode #51 Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard)

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Embed

You may also like

Description

Gaël Varoquaux, cofondateur de Sickit Learn et Probabl et directeur de recherche à l’INRIA est l’invité de l’épisode 70 du podcast Data Driven 101.

Comment Scikit-learn est-il devenu un outil incontournable pour les data scientists, et comment est-il né ?

Un épisode riche en enseignements sur l'apprentissage statistique, la gouvernance des projets open source et les défis de la collaboration dans le monde de la data science.

🔑 MOTS CLÉS

Open source : Un logiciel open source est un logiciel dont le code source est accessible au public et peut être librement utilisé, modifié et distribué.

Clustering : Le clustering (ou regroupement) est une technique d'apprentissage non supervisé qui vise à regrouper des données similaires en groupes (ou clusters).

GitHub: GitHub est une plateforme de développement collaboratif qui permet aux développeurs de stocker, partager et gérer leur code source.

🎙 SOUTENEZ LE PODCAST

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

Épisode #52 Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)

Épisode #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative

Épisode #51 Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard)

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Description

Gaël Varoquaux, cofondateur de Sickit Learn et Probabl et directeur de recherche à l’INRIA est l’invité de l’épisode 70 du podcast Data Driven 101.

Comment Scikit-learn est-il devenu un outil incontournable pour les data scientists, et comment est-il né ?

Un épisode riche en enseignements sur l'apprentissage statistique, la gouvernance des projets open source et les défis de la collaboration dans le monde de la data science.

🔑 MOTS CLÉS

Open source : Un logiciel open source est un logiciel dont le code source est accessible au public et peut être librement utilisé, modifié et distribué.

Clustering : Le clustering (ou regroupement) est une technique d'apprentissage non supervisé qui vise à regrouper des données similaires en groupes (ou clusters).

GitHub: GitHub est une plateforme de développement collaboratif qui permet aux développeurs de stocker, partager et gérer leur code source.

🎙 SOUTENEZ LE PODCAST

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

Épisode #52 Météo, océan et climat : prédire et modéliser grâce à l’intelligence artificielle - Louis Thiry (chercheur @ INRIA)

Épisode #35 Nataniel Ruiz (Research Scientist @ Google Search) : Dreambooth, faire apprendre de nouveaux objets à une IA générative

Épisode #51 Qualité de l’IA, qualité de la data - Jean-Marie John Matthew (Cofondateur @ Giskard)

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Embed