Description
Edouard d'Archimbaud ingénieur en machine learning et CTO fondateur de Kili Technology , est l’invité de l’épisode 21 de #DataDriven101. Il nous parle des difficultés liées à l'annotation de données pour le machine learning et explique pourquoi la qualité de la donnée est essentielle pour obtenir des modèles fiables.
Garbage in -> Garbage out !
Mots clés :
- Dataset: un ensemble de données qui est utilisé pour entraîner, tester et évaluer des modèles de machine learning.
- Métadonnées: des données qui décrivent les caractéristiques des données, telles que leur format, leur source, leur qualité et leur provenance.
- Batch: un ensemble de données qui est traité en même temps, souvent divisé en lots plus petits pour faciliter l'annotation et le traitement.
- Plateforme d'annotation: une plateforme logicielle conçue pour faciliter l'interaction entre les humains et les données, permettant de visualiser, de naviguer et d'annoter des données de manière efficace et précise.
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.