Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français | #33 Guillaume Lample (Co-fondateur & Chief Scientist @ Mistral AI) : Les secrets des Large Language Models

Description

Guillaume Lample, Cofounder & Chief Scientist chez Mistral AI est l’invité de l’épisode 33 de Data Driven 101. Mistral AI entraîne des modèles de langues à destination des entreprises avec un accès open source. Il nous explique notamment :

les difficultés et subtilités pour entraîner un LLM
les découvertes inattendues faites sur le chemin
les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Dans ce podcast IA & Data 100% en français, Marc Sanselme reçoit des professionnels de fonctions et d’horizons variés pour nous parler de leurs aventures, leurs succès, leurs échecs, leurs espoirs, leurs techniques, leurs astuces, leurs histoires et leurs convictions.

De la Business Intelligence à la Generative AI (LLM, RAG, Agents...) ou à la Computer Vision, toutes les thématiques liées à l'IA sont décortiquées épisode après épisode par Marc Sanselme et ses invités issus de la French tech et d'ailleurs.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Description

les difficultés et subtilités pour entraîner un LLM
les découvertes inattendues faites sur le chemin
les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Embed

Copy link

You may also like

Description

les difficultés et subtilités pour entraîner un LLM
les découvertes inattendues faites sur le chemin
les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Description

les difficultés et subtilités pour entraîner un LLM
les découvertes inattendues faites sur le chemin
les caractéristiques de leur premier modèle à destination du grand public

🔑 MOTS CLÉS

Dataset : un ensemble de données utilisé pour entraîner un modèle d'apprentissage automatique.
Token : un morceau de mot utilisé pour entraîner un modèle de langage. Un mot peut être découpé en plusieurs tokens.
Embedding : une représentation vectorielle d'un mot ou d'une phrase utilisée pour entraîner un modèle de langage.
Open source : un logiciel dont le code source est disponible pour tout le monde et peut être modifié et distribué librement.
Fine-tuning : une technique d'entraînement de modèles de langage qui consiste à ajuster un modèle pré-entraîné sur un ensemble de données spécifique à une tâche donnée.
NLP (Natural Language Processing) : un domaine de l'informatique qui se concentre sur l'interaction entre les ordinateurs et le langage humain.

🎙 SOUTENEZ LE PODCAST GRATUITEMENT

> Abonnez-vous 🔔

> Laissez 5 étoiles et un avis 🥰

Sur Spotify : ici

Sur Apple Podcast : ici

Sur Deezer : ici

Sur Google Podcast : ici

🧐 DANS LA MÊME THÉMATIQUE

👉🏼Episode 29 : Arthur André ( Co-fondateur @ Praiz ) : Synthétiser ses réunions grâce à l'IA

👉🏼 Episode 23 : Hamza Tajmo uati (Head of AI & Data @ Iktos ) : L’IA générative pour créer des médicaments

👉🏼Episode HS1 : Nikolaj Groeneweg (Founder @ Everyme.ai) - Générer des images grâce à l'IA

👋 PLUS DE CONTENU DATA ?

> Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

> Suivez-nous sur Tiktok 📳

> Abonnez-vous à notre chaîne Youtube

🚀 BESOIN D’EXPERTISE IA & DATA ?

Réserver un créneau de 30 min avec Marc Sanselme et profiter des connaissances et du savoir-faire d’un expert IA qui saura vous aiguiller sur vos projets d’IA.

Réservez votre séance de 30 minutes maintenant

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

About Intelligence Artificielle - Data Driven 101 - Le podcast IA & Data 100% en français

Sur Data Driven 101, on s’intéresse aux applications pratiques de l'Intelligence Artificielle et de la data dans toute leur diversité avec un objectif : démystifier ces concepts.

Marc Sanselme est un spécialiste en Intelligence artificielle et dirige la société Draft'n run, studio de développement no-code d'IA sur mesure.

Équipe : Clémence Reliat, Jean-Christophe Corvisier, Marc Sanselme

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Embed

Copy link