Description
Aujourd’hui, on parle d’« apprentissage zero-shot », ou ZSL pour zero shot learning.
En clair, c’est la capacité d’un modèle d'IA à reconnaître ou classer des choses qu’il n’a jamais vues lors de son entraînement.
Et voici l’essentiel en trois points sur la base d'un document d'explication d'IBM.
Le ZSL, à quoi ça sert ?
Alors dans un premier temps, à quoi ça sert et en quoi c’est différent des méthodes d'apprentissage classiques utilisées par les concepteurs d'intelligence artificielle.
La plupart des modèles d'IA apprennent en mode supervisé. C'est à dire qu'on leur montre des milliers d’exemples étiquetés, d'un chat par exemple. Et le système apprend à reconnaître un chat avec cette méthode.
Le problème, c'est que étiqueter des données coûte cher, prend du temps, et surtout que certaines classes sont rares, voire inédites, comme les nouvelles maladies, des espèces animales peu documentées, ou encore un nouveau type d’attaque informatique. Le zero-shot répond donc à cette contrainte.
Le ZSL, comment ça marche ?
Au lieu d’apprendre à reconnaître un oiseau en regardant des photos étiquetées, l'entraînement consiste à lire à l'IA une définition qui contient par exemple plumes, bec, et ailes. L'IA apprend ainsi à reconnaître un oiseau sans l’avoir vu auparavant.
Le modèle s’appuie donc sur des connaissances auxiliaires. Le modèle ne dessine donc pas directement une frontière entre les classes qu’il a vues, mais calcule des scores de probabilité à partir des connaissances auxiliaires.
À noter que les grands modèles de langage, les LLM, excellent souvent dans l'exercice de zero-shot. Pourquoi ? Parce qu’ils comprennent les étiquettes en langage naturel et peuvent classer, extraire, résumer ou suivre des instructions sans exemples, simplement via la consigne, c'est à dire le prompt.
Le zero-shot a aussi ses limites
Enfin, le troisième point, c'est que le zero-shot a aussi ses limites. Et je vous donne direct un exemple pour que vous compreniez bien.
En se basant sur les étiquettes et non les images étiquetées, difficile de savoir si le mot jaguar fait référence à une marque de voiture ou à un animal.
Cette sensibilité sémantique fait chuter les performances si le domaine réel s’éloigne trop de ce que le modèle d'IA a appris.
Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.