- Speaker #0
Bonjour à tous, je suis Jean-Baptiste Clottier et bienvenue dans Tech in Sport, un podcast Alliancy, médias numériques et business. Performance sportive, cybersécurité des événements, data, intelligence artificielle. Dans ce podcast, nous allons traiter de tous les impacts du numérique sur le monde du sport avec en ligne de mire les JO de Paris 2024. Alors aujourd'hui nous allons voir comment l'analyse du Big Data peut servir pour détecter les futurs pépites du sport et pour ça on est avec Quentin Delaroche-Lambert, bonjour Quentin Bonjour Jean-Baptiste Tu es chercheur à l'INSEP sur ces sujets et tu as notamment travaillé avec la Fédération Française de Ski et pour parler de ça on est donc dans cet endroit iconique du sport, dans le bois de Vincennes Tout à fait,
- Speaker #1
on est à l'INSEP, l'Institut National du Sport et de l'Expertise de la Performance donc il y a presque 800 sportifs qui s'entraînent ici quotidiennement Presque 300 internes qui habitent ici. Et il y a également deux laboratoires de recherche. Donc c'est l'aspect expertise de la performance sur lequel on travaille autour des sciences du sport.
- Speaker #0
Et vous êtes à peu près une cinquantaine à travailler dans ces deux laboratoires. C'est ça. Dont toi qui travaille sur la détection et tu travailles sur les dynamiques de performance. Alors dis-nous-en un peu plus.
- Speaker #1
Sur cet aspect de la détection des jeunes talents, on a tendance à... instinctivement, et c'est logique, à évaluer la performance à un instant T, de manière instantanée. Or, moi, j'étudie un peu l'intérêt de prendre en compte la dynamique de la performance dans l'estimation des potentiels.
- Speaker #0
Oui, c'est-à-dire que toi, tu as réussi à notamment faire, via des modèles mathématiques, des modèles statistiques, en analysant une masse de données de la Fédération Française de Ski, des millions de données, c'est ça ?
- Speaker #1
C'est ça, à peu près 2 millions de données qui remontent à peu près depuis la saison 2004-2005.
- Speaker #0
Donc ça fait vraiment beaucoup beaucoup d'informations à traiter. Et donc tu as pu faire notamment une relation âge-performance.
- Speaker #1
Ça a été étudié depuis longtemps, mais il y a un certain Dan Ashmoor qui l'a modélisé avec une équation il y a une cinquantaine d'années. Et moi j'ai réutilisé cette équation en ski pour justement pouvoir détecter les jeunes talents avec leur propre. relation âge-performance individuelle.
- Speaker #0
Oui, parce que pourquoi est-ce que c'est vraiment intéressant d'analyser la dynamique de performance d'un sportif ?
- Speaker #1
On s'est rendu compte au fur et à mesure des travaux qu'on a effectués ici sur ce sujet que dans une certaine mesure, la dynamique de performance, elle peut avoir plus d'importance sur la performance future que la seule performance à un instant T, notamment au plus jeune âge.
- Speaker #0
Oui, c'est ça. C'est-à-dire que plus on est jeune, plus il peut y avoir des dynamiques qui doivent être prises en compte plutôt qu'un résultat un jour à une compétition à l'instant T.
- Speaker #1
Exactement.
- Speaker #0
Et donc ça, tu as pu l'observer ? dans les catégories d'âge les plus jeunes ? Parce que c'est à ça que tu t'es intéressé, pour détecter les jeunes en fait.
- Speaker #1
Voilà, c'est ça. Donc les premières compétitions nationales en ski, c'est en U14, donc U14 ans, donc c'est catégorie 13-14 ans, et catégorie 15-16 ans. Donc ça c'est les premières compétitions nationales et internationales en ski.
- Speaker #0
En fait, tu as observé une espèce de petite injustice qui a fait que c'était intéressant de travailler sur la dynamique de performance, parce qu'à l'instant T, dans une catégorie d'âge, Il y a quand même des gens qui ont un écart entre ceux qui sont nés en janvier et décembre.
- Speaker #1
C'est ça, donc on souhaite prendre les meilleurs à un instant T de chaque catégorie d'âge. Sauf qu'au sein de cette catégorie d'âge, tous les individus, tous les skieurs n'ont pas le même âge. Il y en a qui sont nés en début d'année, il y en a qui sont nés en fin d'année. Du coup, on observe une surreprésentation des individus dans les systèmes de sélection et de détection en compétition nationale, des individus qui sont nés en début d'année par rapport à ceux qui sont nés en fin d'année. Ça s'appelle l'effet de l'âge relatif. Relatif à quoi ? Relatif tout simplement à la date de naissance, le fait que... Dans une même catégorie d'âge, on n'a pas tous le même âge relatif à la date de naissance.
- Speaker #0
Oui, parce que logiquement, ils sont plus grands, peut-être un peu plus forts que ceux qui sont de fin d'année. Et donc, à chaque sélection, ils sont devant les autres.
- Speaker #1
Par rapport à leur propre relation âge-performance, ils sont plus avancés par rapport aux autres.
- Speaker #0
Et donc toi, pour essayer de pallier cette injustice, tu as mis en place une solution pour essayer d'équilibrer ça.
- Speaker #1
C'est ça. Donc moi, je me base sur la relation entre l'âge et la performance, qui en fait continue, mais je la découpe par catégorie d'âge, et je calcule, entre guillemets, le nombre de... points, donc la performance en ski c'est en points, et bien le nombre de points moyens qu'on gagne par mois supplémentaire de naissance. Ce coefficient va me permettre de rééquilibrer la performance selon le mois dans lequel en fait on est né.
- Speaker #0
C'est à dire que si je suis né en janvier, ou plutôt si je suis né en décembre, j'aurais une surcote de mon score par rapport à quelqu'un qui est né en janvier.
- Speaker #1
Exactement.
- Speaker #0
Et là on arrive finalement à voir sur une année qui sont les meilleurs.
- Speaker #1
Finalement c'est ça, on annule entre guillemets un peu l'effet de l'âge au niveau global sur la performance et ça permet de comparer tous les skieurs, tous les sportifs. indépendamment de leur mode de naissance.
- Speaker #0
Est-ce que c'est facile à mettre en place au quotidien ? Ce serait facile à mettre en place pour une fédération ?
- Speaker #1
Justement, notre méthode, elle est basée sur une méthode qui est assez simple. Ce coefficient qui est simple, qui est juste le nombre de points qu'on gagne par mois de naissance supplémentaire, il est assez instinctif. Et du coup, pour un entraîneur, pour un cadre fédéral, au moment des sélections, c'est assez facile de pouvoir rééquilibrer juste avec ce coefficient.
- Speaker #0
Il y a aussi quelque chose que tu as observé, c'est que les performances des très jeunes, entre 10 et 12 ans, elles sont... peu déterminante pour la suite. C'est-à-dire que les écarts entre le premier et le dernier, c'est assez peu déterminant.
- Speaker #1
Exactement. Nous, ce qu'on a remarqué, c'est que les individus, les skieurs qui réalisent les meilleures performances étant jeunes, à l'âge de 12-13 ans, finalement, ils ont 3% de chance. s'ils continuent jusqu'à 25 ans, d'arriver parmi les individus qui performent le plus. Et ceux qui performent le moins, finalement, ils ont à peu près 2%, ce qui fait 1% de différence entre les meilleurs et les moins bons.
- Speaker #0
Donc c'est vraiment un écart qui est très faible. Et quand on est dans les moins bons, dans les compétitions à cet âge-là, on peut quand même continuer à y croire. Tu as observé que c'est à peu près vers quel âge que c'est vraiment décisif ?
- Speaker #1
En fait, il n'y a pas d'âge où c'est décisif. La différence de chance, finalement, elle augmente au fur et à mesure des âges. Donc c'est quelque chose qui est assez continu. Mais en tout cas, chez les âges les plus jeunes, c'est de 1 à 2%. Dans un système où on sélectionne sur la performance à un instant T, c'est une fois qu'on a réalisé cette étude qu'on s'est posé la question est-ce qu'il n'y a pas d'autres facteurs à regarder qui pourraient être aussi déterminants sur la performance ? Et donc on s'est intéressé à la dynamique.
- Speaker #0
Et alors pour essayer de prédire finalement des performances de joueurs ou de jeunes sportifs, donc toi tu es basé sur la statistique, il y a une forme d'intelligence artificielle, c'est quoi la différence ?
- Speaker #1
L'intelligence artificielle finalement c'est reproduire un raisonnement qui semble humain avec un ordinateur ou une machine. Et moi qui suis statisticien de base, je me sers des statistiques pour créer ce raisonnement qui va s'adapter avec les nouvelles données qu'on a à disposition.
- Speaker #0
Donc en fait tu crées une espèce d'intelligence artificielle qui te permettrait de prédire.
- Speaker #1
Oui voilà exactement. Dans tous nos travaux on a... Pour but aussi justement de mettre une incertitude en ce qui concerne le potentiel, je pars souvent d'estimation et non de prédiction parce qu'on ne va pas tenter de prédire une performance à un instant T, mais de prédire un potentiel qui est finalement déjà présent chez les individus quand ils sont jeunes. Et en effet, en fait, le modèle qu'on a mis en place, le modèle mathématique statistique, permet d'estimer en fait une multitude de courbes possibles de relations âge-performance individuelles et du coup de créer une estimation autour de ce potentiel.
- Speaker #0
Pour en revenir à l'écart très faible entre les moins bons et les meilleurs quand ils ont 10-12 ans... Il y a un syndrome qui s'appelle l'Underdog Effect. Alors, qu'est-ce que c'est que l'Underdog Effect ?
- Speaker #1
Alors, l'Underdog Effect, c'est finalement, si on repart du principe que les individus qui sont nés en début d'année sont surreprésentés dans les systèmes de sélection et de détection, c'est que finalement, parmi ceux qui sont sélectionnés mais qui sont nés en fin d'année, eh bien, finalement, ces individus, par la force de la résilience, etc., ont plus de chances finalement d'arriver au plus haut niveau. à l'âge adulte.
- Speaker #0
Oui, parce qu'on observe quand même, c'est ça, qu'en fin d'année, comme globalement, ils ont des résultats moins bons, il y a un taux d'abandon qui est assez supérieur. Et ce que tu expliques, c'est que si finalement, ils s'accrochent, plus tard, ils seront plus résilients.
- Speaker #1
C'est une théorie. Elle n'a jamais été vérifiée parce qu'il y a une autre théorie aussi sur cet underdog effect. C'est que finalement, le simple fait d'être sélectionné alors qu'on est né en fin d'année, c'est tout simplement qu'on est sur sa courbe H performance. On est juste plus fort. On a une performance supérieure.
- Speaker #0
C'est avant, finalement... que tu mets en place la solution pour équilibrer.
- Speaker #1
Exactement.
- Speaker #0
Tu as déjà des gens qui sont plus jeunes, mais très bons, qui arrivent à être sélectionnés, donc potentiellement qui sont déjà meilleurs que ceux de début d'année.
- Speaker #1
Exactement.
- Speaker #0
Et ça, c'est des travaux que vous menez ici à l'INSEP.
- Speaker #1
On est plusieurs à travailler sur ce sujet. On a monté un groupe qui s'appelle les stacks, estimations et trajectoires. On est quatre à travailler sur ce projet. Et on travaille avec diverses fédérations, donc la Fédération française de ski que je représente, la Fédération française de natation et d'athlétisme.
- Speaker #0
Oui, parce qu'en fait, là, ce que tu observes, Au sein de la Fédération Française de Ski, ça a été observé partout ?
- Speaker #1
Ça a été observé dans beaucoup de sports à l'international, et pas seulement, ça a été observé aussi à la base, c'était dans les systèmes scolaires, on observait davantage d'individus qui étaient nés au début d'année dans les grandes écoles finalement.
- Speaker #0
Dans tes travaux, qu'est-ce que le numérique vraiment t'apporte ? En quoi ça t'aide les technologies numériques pour réussir à mettre en place des modèles comme ça ?
- Speaker #1
Étant donné qu'on s'intéresse à une masse de données relativement élevée, ça va permettre de faire tourner des modèles qui seront plus puissants et finalement en moins de temps.
- Speaker #0
Avant c'était plus compliqué ? Ça prenait plus de temps, on avait moins de données peut-être ?
- Speaker #1
On avait moins de données. Déjà le fait d'archiver maintenant les données qui sont beaucoup plus facilement disponibles sur Internet. Donc en effet, le fait d'avoir des données plus facilement disponibles et après le fait de pouvoir faire des tournées, des modèles qui sont plus gourmands.
- Speaker #0
Donc là on va faire un petit saut dans le futur et on va se projeter dans quelques années. Avec l'arrivée de l'intelligence artificielle qui est de plus en plus performante, qu'est-ce que tu pourrais toi attendre des technologies numériques pour avoir des modèles encore plus fiables ?
- Speaker #1
Il y a une célèbre citation qui dit tous les modèles sont faux mais certains sont utiles Donc en effet, les modèles statistiques par nature... les modèles inférentiels, ils sont faux. On va essayer d'approcher la réalité, mais sans jamais vraiment l'atteindre, mais on va essayer toujours de l'approcher le plus proche possible. Et en effet, les nouveaux modèles d'intelligence artificielle, mathématiques, statistiques, ils vont permettre d'approcher de mieux en mieux cette réalité.
- Speaker #0
De gagner finalement en précision.
- Speaker #1
Exactement.
- Speaker #0
Merci Quentin de nous avoir accueillis à l'INSEP et de nous avoir permis de comprendre comment l'analyse du Big Data permettait de dénicher des pépites du sport.
- Speaker #1
Merci Jean-Baptiste
- Speaker #0
Et merci à vous de nous avoir écoutés n'hésitez pas à repartager le podcast et à vous abonner sur toutes les plateformes et on se retrouve très vite avec un nouvel invité pour décrypter la montée en puissance de la tech dans le monde du sport