03 - L'IA générative, comment fonctionne l'IA que tout le monde utilise ? | Le Dernier Clic (avant la fin du monde)

Description

On entend parler d'IA générative partout, entre ceux qui assurent qu'elle va tout remplacer et ceux qui la limitent à un simple perroquet stochastique. Mais comment ça marche vraiment sous le capot ? On revient aux bases pour comprendre ce qui se cache derrière ChatGPT et consorts, loin des discours extrêmes.

Avec Lulu, on décortique le fonctionnement des LLM (les larges modèles de langage). On fait un petit bond en arrière jusqu'en 2016 avec la victoire inattendue d'AlphaGo, un moment qui a complètement changé la donne dans l'informatique. Fini le temps où chaque ligne de code était écrite par un humain avec des règles strictes. Aujourd'hui, on fait face à des modèles qui apprennent de manière autonome, capables de faire des déductions et d'avoir une certaine forme d'abstraction.

On aborde l'ingestion d'immenses corpus de textes, les calculs de probabilités, mais aussi la fameuse technologie Transformer (le "T" de GPT) qui donne à la machine cette capacité de garder un contexte global. C'est plus compliqué qu'un simple programme d'autocomplétion façon vieux téléphone T9, mais ça ne fait pas de l'IA une entité dotée d'une conscience. D'ailleurs, même pour les personnes qui développent ces modèles, le cheminement exact des données reste en grande partie une boîte noire.

Un épisode pensé pour poser des bases saines et comprendre concrètement les outils qu'on utilise au quotidien.

Source :

La parole aux machines de Thibaut Giraud

https://www.grasset.fr/livre/la-parole-aux-machines-9782246841654/

00:00 - Introduction

02:57 - 2016 et AlphaGo : la fin de l'informatique classique déterministe

11:21 - Des jeux de plateau aux modèles de langage (LLM) et le "Transformer"

20:50 - La mémoire de l'IA : mécanisme d'attention et fenêtre de contexte

26:21 - Les couches d'apprentissage et le fine-tuning des modèles

45:38 - Peut-on faire confiance à l'IA ? Déterminisme et température

55:23 - Le problème des hallucinations : pourquoi les LLM "baratinent"

01:04:33 - La boîte noire de l'IA et les comportements inattendus

01:16:33 - Les limites actuelles et la quête de l'AGI (IA générale)

01:21:03 - Conclusion et teasing du prochain épisode

Retrouvez nous sur :

https://www.instagram.com/ledernierclic/

https://www.linkedin.com/in/emmanuel-fernandez-b28740180/

https://www.linkedin.com/in/lucile-mothiron/

contact@ledernierclic.fr

Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.

Transcription

Manu
Bonjour et bienvenue dans le dernier clic de votre podcast Tech, IA et nos codes. Je suis en compagnie de Lulu aujourd'hui pour vous parler d'IA générative. On va voir ça ensemble tout de suite. Lulu, comment tu vas ?
Lulu
Ça va bien et toi ?
Manu
Très bien, merci. Est-ce que tu peux me dire un petit peu de quoi on va parler aujourd'hui justement côté LLM ?
Lulu
On va revenir un peu sur les bases, sur comment fonctionnent ces modèles, en quoi c'est différent des programmes informatiques tels qu'on les conçoit, avec les fameux « si, alors » , ces choses qui sont très déterministes en soi. Et un peu sortir à la fois du discours, ces deux extrêmes où on nous dit que l'IA sous-entendue, l'IA générative, va tout révolutionner, va nous remplacer d'un côté, et de l'autre, que les intelligences artificielles génératives ne sont un peu que des perroquets stochastiques. Une expression qui était pas mal en vogue, je crois que c'était au début, quand le chat j'ai pété, a commencé un peu à percer. Et aujourd'hui, on se rend compte que c'est faux.
Manu
C'est plus compliqué que ça, plus nuancé que ça.
Lulu
C'est plus nuancé. compliqué de mettre un curseur et voilà.
Manu
Très bien. Et alors justement, pour mettre un pôle de contexte aussi en plus, aujourd'hui, on va vraiment vous parler des grandes logiques et de comment fonctionne l'IA générative, qu'est-ce qu'il y a derrière. IA générative, pourquoi ? Puisque c'est celle dont vous entendez le plus parler, globalement en fait, quand on vous parle de chat GPT, de l'IA, que ce soit dans les différents médias, dans les technos, dans les outils que vous utilisez, ce genre de choses. C'est cette famille-là de l'IA en fait qui est concernée. parce qu'en fait de l'IA il y en avait avant, il y en a de plein de manières, de plein de façons différentes. Nous on va s'intéresser vraiment juste à celle-ci puisque c'est celle qui nous impacte le plus directement aujourd'hui. Et l'idée c'est de vous donner aujourd'hui les bases de compréhension de comment marche justement ce type de modèle pour derrière quand on ira discuter dans les prochains épisodes vraiment des agents, des automatisations avec de l'IA. bref, d'autres sujets qui sont liés vraiment à la partie IA, vous compreniez de quoi on parle, et pourquoi c'est plus que de la prédiction, mais que ce n'est pas vraiment non plus un androïde à proprement parler. On va essayer de clarifier un petit peu ensemble tout ça durant cet épisode. Et écoute Lulu, je te laisse nous présenter un petit peu déjà, justement, comment fonctionne un LLM, et quel est le... point de départ de son fonctionnement et de sa mise en œuvre ?
Lulu
Déjà, juste pour donner un peu de contexte, pour préparer cet épisode, j'ai lu un livre qui s'appelle La Parallel Machine, de Thibaut Giraud, qui est un philosophe qui s'intéresse à l'intelligence artificielle, et plus récemment à l'intelligence artificielle générative depuis 2019, avant qu'il y ait la vague des chatbots. Je le conseille à toute personne qui cherche à avoir un support qui est très bien vulgarisé, avec des super exemples. Il n'y a pas d'extrémisme au niveau des discours, et c'est très agréable à lire, et même moi j'ai appris beaucoup de choses. Comme je disais, on va essayer de distinguer ce qu'est l'intelligence artificielle, même générative, par rapport à un programme classique. Et il faut... pour ça revenir en 2016, et qu'est-ce qui s'est passé en 2016, il y a le programme AlphaGo qui bat le champion du monde de Go. Et c'était un événement dans l'informatique et même pour les joueurs de Go, parce qu'en fait, ce qui se passe par rapport à, je crois que c'était Deep Blue qui avait battu le champion d'échec dans les années 90, où là, chaque ligne de code était écrite par un humain, là, ce qui se passe, c'est que DeepMind, donc la société derrière AlphaGo, n'a pas du tout programmé AlphaGo à jouer au Go. C'est plus ou moins lui qui a appris à y jouer en faisant plein de parties, en analysant déjà plein de parties, puis après, en faisant plein de parties contre lui-même, et son objectif, c'était juste de prévoir le prochain coup. En soi, il ne joue pas, vraiment.
Manu
Du coup la grosse différence avec le précédent historique côté échecs, c'est qu'on était sur un modèle qui n'était pas dégénératif mais qui était vraiment taillé. que pour les échecs. Là où celui-ci... C'était quoi le premier but d'AlphaGo ? Dans le sens où là, il avait été entraîné pour... Là,
Lulu
je crois qu'il était entraîné vraiment juste à jouer au Go. Donc on n'est pas vraiment encore sur des... En fait, si, c'est de l'IA générative parce que son objectif, c'est de prévoir le prochain coup. Et il a été entraîné sur des parties de jeux de Go, enfin, un historique de parties. plutôt de bon niveau, ça veut dire qu'il devait à chaque fois prédire le prochain coup de chaque joueur, et dire que l'objectif sous-jacent c'était forcément de gagner, parce que dans une partie, quand deux joueurs s'affrontent, le prochain coup, normalement, il est censé mener un peu plus vers la victoire. Donc, en faisant des calculs pour essayer de prédire ce prochain coup, l'objectif sous-jacent du programme, c'est de gagner. Et ça, c'est fait après dans un second temps où... on lui donne les règles du go, et on va lui faire jouer plein de parties contre lui-même. Et ce qu'on n'a pas dit, c'est que le LLM repose sur un réseau de neurones, un peu comme dans notre cerveau, où il va y avoir des parties qui vont communiquer entre elles, et où il va y avoir un peu des boucles d'inhibition, enfin de rétroaction. Il y a certaines parties qui vont être inhibées, d'autres qui vont être renforcées. Et quand le modèle gagnait une partie contre lui-même, les coûts... qui ont mené à cette partie vont être renforcés. Il y aura plus de probabilités de faire ces coups dans un jeu, en fait. Je ne sais pas si toi, tu avais vu le documentaire qu'il y avait eu sur Netflix là-dessus. Très, très bien.
Manu
Moi, ça ne m'a pas du tout... J'ai entendu passer de loin, mais je ne m'en suis jamais intéressé directement.
Lulu
Je ne sais pas si tu as déjà joué au Go aussi. Non plus. Parce que c'est... Comme jeu, on est très loin du truc très carré des échecs. Il y a effectivement des règles, mais c'est plus des choses que tu n'as pas le droit de faire. Tu te débrouilles et c'est vraiment juste de la créativité, le jeu de Go. C'est là où un programme classique n'aurait pas pu juste gagner. C'est genre tu places tes pions et le but, c'est de prendre le plus de territoire possible. Sauf qu'en début de partie, c'est très compliqué de faire des actions qui peuvent t'amener vers la victoire. C'est plus une... philosophie, le go, c'est très bizarre comme jeu, c'est très intéressant.
Manu
Tu ne peux pas calculer à l'avance tous les coups possibles et toutes les stratégies possibles. Donc, tu es obligé de t'adapter à l'avancement de la partie. Et si je comprends bien, ça veut dire que contrairement aux échecs ou arriver à un certain moment donné où en tout cas, tu as des coups, tu as des successions de coups, tu as des enchaînements que tu peux apprendre par cœur. des combinaisons qui peuvent être posées à un moment clé de la partie et amenées jusqu'à l'échec à mat. Dans le go, c'est plus nuancé que ça et tu n'as pas de combinaison gagnante, en quelque sorte ?
Lulu
Complètement. Alors, il y a des ouvertures, forcément, mais à un certain point, ça demande vraiment de la créativité et une certaine abstraction. Et souvent, il y a des... parties où jusqu'à la fin on ne sait pas forcément qui va gagner, on ne peut pas vraiment prévoir, enfin après on peut faire des calculs mais ce n'est pas comme aux échecs où à un instant T du plateau on peut facilement prévoir le prochain coup parce qu'en plus il y a des choses qu'on ne peut pas faire aux échecs, on ne peut pas déplacer les pièces comme on veut, là les galets, les petits pions de go, on les pose exactement où on veut sur le plateau et le but c'est de faire des zones et de capturer dans ces zones les pions de l'adversaire. Et à la fin, le but, c'est d'avoir le plus de zones que l'autre personne.
Manu
Et du coup, la surprise, c'était qu'un programme informatique arrive jusqu'à la victoire en ayant appris à mourir tout seul, je comprends bien, parce qu'il faisait des parties contre lui-même, et du coup, il arrivait à faire des déductions qui, de prime abord, n'auraient pas dû être... possible en théorie, ou en tout cas pas de la manière dont il l'a fait, c'est ça ?
Lulu
Exactement, et d'ailleurs même le champion du monde a eu l'impression de jouer contre quelqu'un qui savait jouer au go, il a eu l'impression de jouer contre un joueur, et il y a eu même un moment, je crois que ça redit aussi dans le documentaire, où le programme va faire un coup qui était très très bizarre à peu près en 37ème coup. C'était quelque chose qui n'avait jamais vraiment été vu. Et en fait, c'est un peu ce coup qui l'a mené à la victoire. Et c'était quelque chose qui était un peu inédit. Et aujourd'hui, ça a énormément dépoussiéré le jeu de Go. notamment de jouer avec ce type de programme où les très bons joueurs vont analyser des parties parce qu'il y a d'autres formes de créativité et des trucs qui n'avaient jamais été trouvés en plusieurs siècles de jeu. Ça permet de trouver des nouveaux types d'ouvertures, de nouveaux types de coups. Donc, il y a une certaine créativité. C'est là où c'est assez intéressant. Et justement, après AlphaGo, il y a eu AlphaZero. Et pour ce programme, encore une fois, intelligence artificielle, la générative, où on a voulu voir si elle pouvait battre quelqu'un aux échecs. Sauf que là, on s'est passé de la partie où on lui a fait voir énormément de parties d'échecs pour comprendre les coups, prédire le prochain coup. Là, on l'a directement fait se battre contre elle-même en lui donnant les règles. et en l'espace de... quelques heures d'analyse, le programme a trouvé tout seul toutes les ouvertures possibles qui avaient été terrorisées pendant des siècles.
Manu
D'accord, oui.
Lulu
Donc, on se dit, bon, d'un côté, c'est bien parce qu'on les a trouvées, mais en quelques heures, la machine, juste à force de calcul, a réussi à tout retrouver.
Manu
Ok, donc là, on a AlphaGo qui a changé la donne et qui a changé justement la vision qu'on pouvait avoir d'un programme informatique. comment ça se comporte, comment il a une manière d'apprendre et de faire des déductions. Et du coup, comment on en vient à un VLM qu'on connaît, nous.
Lulu
Qui sont des larges modèles de langage. Voilà, tout est basé sur le langage. Et en fait, il y a des... Voilà, pour caricaturer un peu, il y a des gens qui se sont dit au lieu de prévoir le prochain coup, on va prévoir le prochain mot. Et de mettre en entrée énormément de textes. de faire apprendre et déduire des choses à ce réseau de neurones sur ce gros corpus de données de texte, et faire des calculs pour prédire quel est le mot le plus probable dans des suites de mots. Là, on est vraiment dans les prémices, on va dire que c'est l'autocomplétion de textes vraiment très avancés. Est-ce qu'on aurait pu avoir, comme on a déjà parlé, un T9 ou ce genre de choses ?
Manu
Ce qui est marrant, c'est qu'en fait, ça n'a pas forcément été conscientisé au départ de se dire que l'IA générative, on va la faire se reposer sur du texte. C'est plus arrivé un peu, pas par hasard, mais le vrai effet de voir que des déductions marchaient sur du jeu. Donc, on peut essayer de transposer ça en le bricolant potentiellement avec du texte. On verra ce que ça donne et si ça marche aussi bien. Dans le principe, c'est ça.
Lulu
C'est ça. Et il y a eu aussi une nouvelle technologie qui a fait que c'était structurellement possible. Donc, c'est le Transformer. C'est le T de GPT. OK. Et le Transformer, comment dire ? Il y a vraiment plusieurs couches. Et justement, contrairement à un T9, le poids statistique, le mot qui va suivre, il n'est pas seulement influencé par ce qu'il y a avant. Ça permet vraiment d'avoir plusieurs couches et d'avoir cette possibilité de mettre en contexte des choses qui ont été dites plus loin et de faire des associations d'idées. C'est vraiment le transformeur qui permet de conceptualiser ça et de commencer ses recherches dans tout ce qui va être LLM. Et pour revenir un petit peu, le LLM, il y a un réseau de neurones. Et dans ces neurones, il y a des paramètres. Pour résumer, c'est un peu des nombres qui définissent le comportement du modèle. On peut voir ça un peu comme un arbre avec des directions. Et à chaque fois, par exemple, on va avoir un mot, plusieurs branches, des probabilités qui découlent et de se dire, le mot le plus probable ensuite, c'est celui-là. Et ça, c'est dû après à un entraînement. de voir ce qui était le plus probable après avoir assimilé des milliers et des milliers de textes. Il a pu en déduire que, par exemple, après, le chat est... Ce qui peut arriver après, c'est assis, par exemple. Et ça, ça se base sur une base de données où le chat mange. Et suivant, on peut jouer un peu avec ces paramètres pour dire d'aller chercher soit ce qui est le plus probable... Soit de laisser un peu une part d'aléatoire, et c'est ce qui peut donner un peu plus de créativité. C'est ce qu'on appelle la température.
Manu
Oui, on reviendra après sur la température pour voir. justement la partie probabilité et déterminisme. Mais déjà, pour mieux comprendre le système d'association, comment il le fait ? Dans le sens, il le fait par famille, il le fait par domaine, il le fait en roue libre, en toute autonomie ? Est-ce qu'il y a des règles qui feront que, justement, là tu prenais l'exemple du chat est assis, une fin probable à un moment clé, mais... Mais bon, cette phrase pourrait finir de timide manière. Et comment il va... Justement, est-ce que les neurones se construisent tout seuls ? C'est nous qui... Enfin, je parle, je veux dire... Les personnes qui font les modèles qui déterminent de dire « En fait, ce neurone-là, il sera orienté pour le langage. Ce neurone-là, il sera là pour des thématiques particulières. Ce neurone-là, pour autre chose. » Ou est-ce que ça se fait un petit peu tout seul ? Comment... dans les grandes lignes, mais comment il se gère ça ?
Lulu
Dans un premier temps, il y a vraiment ce pré-entraînement. Donc là, on va lui donner énormément de corpus, de textes. Ça peut être quasiment tout Internet. Dans un premier temps, ça a été surtout Wikipédia, un peu de choses qui étaient en archives ouvertes. C'est un peu mieux. On se rend compte que ce n'est plus le cas maintenant, les LLM ont quasiment mangé tout Internet. Avec ces analyses, il y a des probabilités qui ont été calculées. Mais après, ce qui se passe exactement dedans, même les gens qui développent ces modèles ne le savent pas vraiment. Et c'est tout un pan de la recherche actuelle. Je sais qu'Anthropique le fait énormément, de comprendre juste comment le modèle fait ses associations d'idées. Parce qu'on se rend compte que ça ne suit pas forcément... le langage, il ne va pas y avoir des zones spécifiques au français, spécifiques à l'anglais, mais il fait des choses plus conceptuelles, donc ce n'est pas juste un enchaînement de calculs, surtout que les calculs sont faits en parallèle. Et c'est là où c'est vraiment important de comprendre que par rapport à un programme classique, on se dit que forcément, c'est des humains qui l'ont développé, donc le programme fait forcément ce qu'on veut. Le cas d'un LLM, On a une entrée, on a une sortie, on peut suivre la suite de calcul, mais on ne saura pas exactement pourquoi il a fait cette suite de calcul. Et ça reste encore un peu à découvrir, à comprendre. Et c'est assez fascinant, mais en même temps, je ne veux pas dire qu'on ne contrôle pas forcément. En tout cas, on ne peut pas juste dire que c'est une suite de calcul, et que c'est juste un perroquet qui répète des choses qu'il a... assimilé, il les remet dans un certain ordre et ça nous paraît vraisemblable. Ça va plus loin que ça, mais pas non plus jusqu'à dire que ça a une conscience. Mais en tout cas, il y a des choses qui se passent dedans, mais ça reste une boîte noire, même pour les personnes qui la développent.
Manu
D'accord, donc, il y a une part qui vraiment est basée sur le fait d'avoir ingéré une grande quantité de contenu textuel. Il a identifié des, j'allais dire des patterns, mais en tout cas, voilà, des modèles, des... des redondances, des récurrences, des choses comme ça. C'est lui qui va déterminer à moitié, à moitié ou peut-être beaucoup plus qu'à moitié, les liens qu'il va faire entre eux et les règles qu'il a identifiées lui-même, plus ou moins pour construire justement ses chemins. C'est ça. Donc il y a une part, parce que tout à l'heure on disait T9, pour ceux qui n'ont peut-être pas connu l'appellation, mais en fait le T9, c'est ce qu'on avait nous sur les... portable au début du téléphone et qui désignait le fait d'avoir de l'autocomplétion en fait sur les messages dans le téléphone terme qui s'est perdu et aujourd'hui de toute façon dans le portable actuel du coup l'autocomplétion elle se fait déjà par IA plus ou moins mais du coup ce principe d'autocomplétion c'est vraiment de se dire voilà quand on écrit une phrase les mots qui arrivent il peut y en avoir plusieurs qui ont des chances de tomber c'est ce qu'on va nous proposer dans une certaine mesure du coup l'IA générative fait ça en partie par rapport à son corpus documentaire et par rapport à ce qu'elle a en tête. Mais les liens qui vont l'amener jusqu'à faire sa proposition lui sont un peu propres. Et j'imagine que d'un modèle à l'autre, chaque modèle peut avoir ses cheminements, ses probabilités et ses règles à lui. Donc ça c'est une part de l'histoire. Et du coup, quelle est l'autre part ? Puisque justement ça va plus loin que la partie... autocomplétion est purement perroquet, qu'est-ce que qu'est-ce qu'il y a d'autre justement qui lui permettent d'aller plus loin ?
Lulu
Alors déjà justement, même si c'est en partie le cas génératif qu'il le fait sur nos téléphones on se rend bien compte que quand on appuie plusieurs fois sur l'autocomplétion, on se rend compte qu'au bout d'un moment Ça ne veut plus rien dire parce qu'il n'a pas suivi exactement la... Je pense qu'on a déjà tous un peu essayé d'appuyer.
Manu
Jamais testé, je t'avouerais. Mais du coup, ça ne me surprend pas qu'au bout d'un moment, ça n'ait aucun sens.
Lulu
Au bout de la deuxième phrase, au bout d'un moment, ça tourne. Ça finit par tourner un peu en boucle. Si on ne remet pas, nous, une entrée pour redonner une direction, ça devient très vite n'importe quoi. et ce qui se passe c'est encore cette histoire de transformeur et là c'était OpenAI qui avait fait un papier une étude qui a permis une nouvelle avancée c'était Attention is all you need et justement ce transformeur au lieu de lire un peu les mots un par un en essayant de se souvenir du début de la phrase comme le faisait plus, on va dire, le T9, le transformeur, il va regarder toute la page en même temps et il va avoir en tête un peu ce contexte. On parle un peu de mémoire. Et d'avoir tout ce contexte, ça va lui permettre de choisir le prochain mot, mais au regard de tout le contexte et pas seulement les quelques mots qu'il y a avant la phrase qu'il génère. Et en fait, c'est ce qui va lui permettre de garder une certaine cohérence. de parfois détecter des liens entre des mots éloignés, de comprendre des références. C'est vraiment ce mécanisme d'attention qui fait qu'on arrive à avoir quand même de la cohérence. Au début, les fenêtres de contexte étaient très petites, ce qui fait qu'au bout de quelques phrases, le LLM se perdait. Mais aujourd'hui, ça reste quand même assez impressionnant de voir un modèle qui génère parfois des textes de plusieurs... pages qui sont quand même cohérents. Enfin, on est quand même sur quelque chose d'assez fou quand on y pense.
Manu
Pour reclarifier ça, pour les gens qu'on serait un peu en train de perdre, le LLM, justement, fonctionne avec une mémoire, pour pouvoir vous répondre, quand vous discutez avec ChatGPT, ou avec Cloud, ou avec un autre chat, vous avez cette notion de mémoire qui existe derrière, qu'on appelle donc le contexte, et cette fenêtre a une taille définie. Donc voilà, une longueur qui va se faire aussi en ce qu'on appelle en token. Donc en fait, le LLM, quand il vous répond, il vous répond en token, il vous répond par fragments de mots. Et donc sa mémoire a aussi une limite comme ça en fragments de mots. Vous ne vous en rendez pas compte forcément directement, parce que quand vous discutez avec lui, vous ne voyez pas quand il arrive à la limite de son contexte et de cette limite. Il va continuer à vous parler. En fait ce qui se passe c'est quand lui atteint sa mémoire, son contexte est rempli, il va en faire lui-même un petit résumé, et qui va compacter son contexte et en faire une version synthétique pour permettre de continuer la conversation et que ça ait l'air fluide. Voilà, mais du coup le contexte c'est ça. Et vous avez deux notions, puisqu'il va y avoir ce que le modèle est capable d'avoir en tête et en mémoire au moment où il va vous répondre, et ce qui va permettre la perte. la pertinence et la cohérence du propos et de sa réponse. Il a aussi une limite pour la taille de réponse. Donc là aussi, les premiers modèles avaient des tailles et de contexte et de réponse qui étaient très limitées, mais ils ont toujours eu des mémoires plus importantes que la capacité de réponse. Aujourd'hui, c'est encore le cas, mais les capacités de réponse et ce qu'on appelle d'output sont devenues beaucoup plus importantes. Et aujourd'hui, n'importe quel chatbot peut, sur les gros modèles en tout cas. peut répondre maintenant des dizaines de pages, là où au début c'était juste quelques paragraphes, une page ou deux, et ainsi de suite, ça a beaucoup augmenté. Mais ce qui est intéressant là, c'est que tu disais que son contexte et sa mémoire se fait sur une vue d'ensemble, et paradoxalement, quand il répond, il ne résonne pas en phrase entière, il résonne au token, et il construit sa réponse au fil de l'eau. Ce qui va le distinguer d'ailleurs d'autres technologies qui sont en train d'être, d'autres IA génératives qui sont en train d'être explorées, d'autres alternatives, puisque ça fait partie un petit peu des limites des modèles aujourd'hui, c'est que le fait qu'ils répondent et construisent leurs réponses petit à petit va générer des erreurs dans certains cas, et les méthodes qui permettent d'avoir le mode de raisonnement, on peut appeler le thinking et le formrophisme. différentes appellations, mais en tout cas cette partie où le modèle va se mettre à raisonner, en fait il va générer une première réponse, se rendre compte qu'il a fait une erreur, se reprendre, retravailler, aborder d'une nouvelle manière et ainsi de suite. justement jusqu'à vous donner une réponse qui soit la plus cohérente et la plus pertinente possible par rapport à votre demande. Mais en fait, il n'aura pas construit cette réponse en une seule fois. Il aura fait un premier jet à l'arrache, il s'est rendu compte qu'il a fait des boulettes, il va le corriger, faire un deuxième jet, se dire c'est mieux, mais en fait, il a scié ça. Et il va faire plusieurs itérations jusqu'à avoir quelque chose d'idéal, en tout cas d'idéal pour lui au moment donné. Et donc cette notion d'avoir le raisonnement... réponse au token va induire une cohérence, une pertinence, mais du coup on en revient à ce que tu nous expliquais un peu avant, la pertinence va se dérouler à partir de probabilités, globalement, et je veux bien que tu reviennes justement sur cette partie de probabilités et de l'aspect déterminisme et non déterminisme, puisqu'on dit souvent, et moi le premier, je dis que l'IA n'est pas fiable. et qu'elle peut vous mentir, qu'elle peut se tromper, qu'elle peut halluciner. On va revenir après sur les hallucinations, ce genre de choses. Mais de dire qu'elle est non déterministe, en théorie, c'est faux. Je veux bien que tu reviennes aussi sur ces concepts-là.
Lulu
Déjà, je pense que je vais juste passer rapidement sur comment est-ce qu'on entraîne un modèle. Parce que nous, on n'interagit pas avec le modèle brut. C'est quelque chose qui a été pré-entraîné, puis entraîné dans une sorte de surcouche pour qu'on en arrive au chatbot tel qu'on le connaît. Donc qu'il soit un assistant avec lequel on parle, qu'il soit quand même assez poli, qu'il nous dise des choses un peu qu'on veut entendre. Et ça va un peu dans le sens de, des fois, il va plutôt nous dire des choses qu'on veut. veut entendre, mais qui sont grosses. Et ce n'est pas forcément dû au modèle de base, mais en gros, tous les modèles, on va commencer un peu par une phrase de pré-entraînement. En gros, on va mettre en entrée, on va un peu gaver le modèle de milliards de textes. On va prendre à peu près 80% d'Internet et après 20% de sources un peu plus fiables, comme des livres ou Wikipédia. On va le nourrir. Et en gros, la seule tâche qu'on va lui demander, c'est d'apprendre à prédire le prochain mot. C'est là-dessus qu'il va baser un peu ses probabilités, de choisir ce prochain mot à chaque fois. Et là, à la suite de cette phase de pré-entraînement, on a ce qu'on appelle un modèle de fondation. Et c'est en gros juste un prédicteur de texte. Il sait juste simuler du texte. Il n'y a pas ce truc de questions-réponses, sauf si... on la simule et qu'il l'a vue dans des textes sur lesquels il s'est entraîné. Donc ça pourrait être des questions d'examen ou ce genre de choses, ou des questions profs, élèves, mais on n'est pas sur le truc où on peut lui poser une question, telle qu'on l'a sur un chatbot.
Manu
Oui, à ce stade-là, on est vraiment sur juste de l'autocomplétion, mais sur une quantité de textes complètement folle. Il ne fonctionne pas encore comme un chatbot, il ne sait même pas encore qu'il est un chatbot. Et même si on l'utilisait comme un programme, globalement, on pourrait écrire n'importe quoi, il viendrait compléter avec ce qui lui passe sous la main derrière, sans se soucier de cohérence de conversation, d'un angle, de tout ça.
Lulu
C'est vraiment ce qui est le plus probable par rapport à ce qu'il a observé sur les milliards de textes qu'il a analysés. C'est pas plus compliqué que ça. Voilà, on va pas...
Manu
Du coup, c'est quoi l'étape d'après pour sortir de ce mode-là ?
Lulu
Je pense que tout le monde en a un peu entendu parler. C'est ce qu'on appelle le fine-tuning. Ça va être un entraînement beaucoup plus fin et on va essayer d'orienter le modèle pour qu'il fasse les choses qu'on veut qu'il fasse. On peut le fine-tuner de plein de manières différentes mais là, ce qui avait été choisi par OpenIA... c'était de finetuner sur des données pour qu'ils deviennent un peu un chatbot, dans le sens où on veut qu'ils répondent à des questions. Et c'est un peu été un choix qui a été fait à l'époque-là. Mais concrètement, on va le faire s'entraîner sur des données, un jeu de données qui est beaucoup plus petit.
Manu
et qui a été annoté manuellement. Donc vraiment un style de base, on peut imaginer des tableaux avec questions-réponses. Et c'est là que le modèle va apprendre à répondre à ces questions. Et vu que c'est des données qui ont été annotées manuellement en amont, en fonction de la réponse qui sort, il peut la comparer à la vraie réponse. Et il va tout seul... faire un peu des boucles de rétroaction pour se dire, ah bah non, la réponse attendue c'est ça, donc tel neurone, on va dire, qui m'a donné cette direction qui n'est pas bonne, on va l'inhiber et on va baisser la probabilité que ce token apparaisse. Quand il y a cette suite-là, et c'est à la suite de milliers de cycles, de millions de cycles comme ça, que les probabilités sont affinées. qu'on va aller chercher plus quelque chose qu'autre chose, un token qu'un autre.
Lulu
D'accord. Alors, effectivement, généralement, en tout cas dans le milieu professionnel, quand on entend parler de fine-tuning, on se dit, très bien, j'ai un modèle qui est déjà chat-dép, j'ai pété telle version, par exemple, et je vais le fine-tuner pour le médical, par exemple. Quand on fait ça, on va lui rajouter des tonnes de documents, pareil, qui sont liés à la médecine. où dans ces textes-là, il va y avoir des mots dans les textes qui sont annotés et étiquetés, labellisés, pour dire que ça correspond à un médicament, ça correspond à une maladie, ça correspond à tel truc, ça s'est lié à tel domaine, etc. Et ça va permettre de travailler un modèle et de l'entraîner de manière plus approfondie sur un usage ou un domaine spécifique. Donc le fine tuning, généralement, nous on entend parler plutôt dans des choses comme ça, quand on veut. spécialiser un modèle du marché sur un domaine professionnel. Mais en fait, ce que tu viens de nous dire, c'est que il y a déjà une phase comme ça au départ, enfin au départ, juste après la phase d'autocomplétion ou de pré-entraînement, il y a déjà une phase comme ça pour calibrer le modèle dans une logique de chatbot et de conversationnel, puisque sinon ce n'est pas du tout inné, ce n'est pas du tout logique. que cette phase là elle va aussi être orientée sur une partie pertinence et fiabilité et quelque chose d'avoir en tout cas du vrai faux on va déjà le calibrer une première fois pour qu'il raconte pas n'importe quoi en tout cas par rapport à son apprentissage de base mais sans spécialement le... il est généraliste de toute façon c'est vrai qu'on en parle depuis tout à l'heure les LLM sont des modèles qui sont généralistes par essence. Tant qu'on ne va pas justement les fine-tuner plus tard pour aller dire, lui, il sera très bon sur tel truc. Donc, il a fait son pré-entraînement, il a eu son fine-tuning, et du coup, maintenant, il sait qu'il a un chatbot, et il y a tout un ensemble de données qu'il a réussi à mieux jauger, à mieux évaluer. Est-ce qu'il est prêt pour être mis dans les mains des gens ou pas ?
Manu
On pourrait se dire oui. Mais forcément, s'il est nourri avec toutes les données d'Internet, des livres, il y a peut-être des choses qu'on n'a pas forcément envie qu'un LLM génère, comme des choses qui sont immorales, qui peuvent porter préjudice, parce qu'on peut lui demander de générer des discours haineux. En soi, c'est dans son corpus d'entraînement. Pourquoi est-ce qu'il ne pourrait pas le faire ? Il n'a pas de sens moral. Donc, à moins qu'on fasse... une troisième phase. Alors, cette phase-là, voilà, elle est vraiment propre au premier LLM. Maintenant, on ne passe plus vraiment par une phase de RLHF. Donc là, c'est un apprentissage par renforcement de par un feedback humain. Donc là, c'est, on fait marcher le LLM et c'est des êtres humains qui vont dire, bah tiens, telle réponse, elle est bien. telle réponse, elle est moins bien. Et dans la même idée que le fine-tuning, le modèle va aller baisser la probabilité de générer telle chose si la réponse qui est sortie de cette succession de choix de tokens n'était pas bien, d'après les humains qui ont fait ce travail de notation d'output. Comment dire ? C'est assez subjectif ce travail parce qu'en gros, il y a toute une charte qu'on peut retrouver pour ces annotateurs. Il faut que la réponse soit utile, véridique et sans préjudice. Et après, c'est un peu à l'appréciation de la personne qui note. C'est un peu, on va dire que c'est une phase qui sert à éduquer le modèle, à ce qu'il se comporte comme on veut, qu'il se comporte comme un gentil chatbot qui est cool avec les utilisateurs, qui leur dit un peu ce qu'ils veulent entendre, que ce soit vraiment un agent conversationnel, un assistant, et que ce ne soit pas juste de la complétion de texte. Et c'est toute cette partie-là qui va apporter du poids à certains choix. dans la génération des mots. Là, il faut juste se dire que cette éducation morale, il y a quand même un enjeu éthique, parce que ça a été fait par des personnes au Kenya qui étaient sous-payées et qui ont forcément été exposées à des réponses qui étaient...
Lulu
Inappropriées.
Manu
Ouais, inappropriées, violentes.
Lulu
Pour le dire gentiment. Voilà.
Manu
C'est ça.
Lulu
D'ailleurs, on en avait... parler de ce concept-là dans notre premier épisode sur les lunettes connectées. Si vous n'avez pas écouté encore, je vous invite à aller l'écouter. On déroule pas mal de choses sur les lunettes connectées et notamment ce point-là. Enfin, ce point-là. On parle aussi de ce cas-là qui est l'étiquetage de données par des humains. Le concept, c'est que ça sert de garde-fou, quelque part, puisque du coup, c'est la phase où on va vraiment finir d'inscrire dans le modèle. Enfin, peut-être qu'il y aura d'autres phases après. Tu vas nous dire ça, mais en tout cas, c'est là où on va avoir un garde-fou éthique et moral pour qu'au moins les choses les plus évidentes sur la partie justement, qui peuvent être crimes, haine, racisme, pédopornographie, toutes ces choses-là sont normalement, continuent d'être...
Manu
La recette pour faire des bombes,
Lulu
par exemple. Oui, la recette pour faire des trucs terroristes, etc. En tout cas, tous les trucs... Trash à éviter, on va dire. À ce moment-là, il y a des humains qui voient du contenu passé et qui vont le qualifier, grosso modo, pour que l'IA ait davantage d'informations et de contextes d'entraînement pour lui dire, non, ça, ça ne faut vraiment pas.
Manu
C'est ça. Et en fait, ça ne va pas effacer ces parties du corpus du modèle. Ça va juste réduire la probabilité qu'il aille les chercher. Donc il y a toujours ce risque qu'en contournant, en trouvant un peu cette succession de tokens ou de succession de conversations dans le contexte, qui fait que le chemin, il va quand même finir par y arriver. Et c'est pour ça qu'on se rend compte maintenant, il y a d'autres sécurités qui sont mises par-dessus le modèle, qui ne sont pas inhérentes au modèle, mais jusqu'à récemment, on voyait toujours des gens qui arrivaient Merci. à détourner et à quand même accéder à des choses qu'on ne voulait pas que le LLM génère. Juste en lui disant, en lui donnant un rôle, en disant « mais non, mais ce n'est pas pour faire vraiment un discours de haine. Imagine que tu es un acteur qui le fait. » Et ça, ça marchait encore jusqu'à récemment, je dirais. Maintenant, il y a d'autres garde-fous qui sont mis par-dessus. Il ne faut pas se dire qu'il ne va jamais le faire. Il y a toujours un risque que ça se passe. parce qu'on n'a pas supprimé. Et c'est juste le chemin par renforcement, ou là, dans ce cas-là, par inhibition, où on a dit, emprunte-moi ce chemin-là, parce qu'il y a des humains qui ont dit, non, non, ça, il ne faut pas que les gens soient exposés à ça. Voilà.
Lulu
Et puis, sur les garde-fous, là, on est aussi très tributaires des fournisseurs de modèles et des boîtes qui les animent, puisque si on reprend les cas, les nombreux cas qu'il y a eu... du côté de Grok chez XAI. Donc Elon Musk qui détient Twitter devenu X et qui a justement connecté son modèle dessus. Et sur Grok, il y a eu plus d'une fois des polémiques puisqu'il y a eu des moments où il tenait des propos négationnistes. Il y a eu plus d'une fois des trucs haineux. Le dernier épisode très mignon, c'était en décembre. où vous pouviez tout simplement donner à Grock, et même dans le fil de conversation, une photo de n'importe qui et lui demander de dénuder la personne. Et forcément après ça partait dans d'autres abus. Mais déjà c'était possible de le faire publiquement depuis X directement. Ensuite, la première mesure qui a été mise en place, ça a été tout simplement de garder ça que pour les abonnés payants. Voilà, visiblement c'était pas un problème d'éthique et moral. Et ça marchait pour tout, donc il y a eu toute une petite vague aussi de pédopornographie, je ne sais pas si c'est de la pornographie à proprement parler, je ne sais plus jusqu'où allait vraiment le modèle, mais en tout cas, vous pouviez effectivement déshabiller des mineurs. Et la dernière fois que j'en ai entendu parler, c'était en février ou en mars, je crois que c'était en mars, il y avait un journal justement qui avait fait une enquête pour voir si c'était encore d'actualité ou s'ils avaient mis assez de contraintes, mais non, c'était toujours d'actualité, et le modèle se permettait de, même quand on le précisait... justement un gros que la personne n'avait pas donné son accord n'était pas consentante sur plein de choses que ce soit les discours de l'exhibition et ce genre de choses le modèle ligne aurait littéralement ainsi systématiquement et du coup faisait exactement ce qu'on avait envie qu'il fasse avec voilà faut garder en tête que justement que ça existe et que des fois les limites tiennent à pas grand chose et tiennent surtout des boîtes qui va qui vous propose ces modèles là il y Il y a... un certain nombre de modèles qui sont disponibles en open source, ou en open weight selon les cas, mais qui sont mis à disposition sans certains niveaux de filtres. Et je ne sais pas justement s'ils ont également ce... Je ne sais pas comment tu disais, le RLHF, cette phase-là. Mais en tout cas, il y a des modèles qui ne sont pas censurés, qui peuvent avoir des enjeux et éventuellement de la pertinence. J'avoue que j'ai un peu de mal à... Avoir dans quel cas, c'est réellement utile.
Manu
Ça peut être intéressant, c'est sur Gameface par exemple, qu'il y a beaucoup ce genre de choses où tu as des modèles, où par exemple, tu n'as que le modèle de fondation ou qui a été très peu finetuné, et tu peux, avec toi, tes jeux de données, aller le finetuner. Donc, tu ne rajoutes pas encore des choses par-dessus parce que ça peut être intéressant de ne pas avoir le finetunage pour le rendre comme un chatbot, mais plutôt d'utiliser d'autres données ou tes jeux de données ou des données d'entreprise. C'est un peu la direction que prend Mistral, plutôt que de faire des modèles très généralistes, d'entraîner le modèle avec un modèle de fondation, donc de Mistral, sur des données fournies par une entreprise, et c'est l'entreprise qui va faire un peu la notation pour faire ce renforcement un peu, de dire, ah bah tiens, telle sortie sur telle tâche, c'est très bien, donc on va le féliciter, et ça va augmenter la probabilité qu'il leur fasse... les fois d'après quand il a cette chose en entrée. Là, ça peut être assez intéressant pour avoir des modèles plus spécialisés et qui ont cette connaissance dans le modèle. Parce que c'est vrai que pour ceux qui connaissent un petit peu, on pourrait juste se dire, mais pourquoi est-ce qu'on ne prend pas juste les gros modèles et les informations qu'on veut qu'il ait, on lui met dans des promptes et on lui donne ces informations. Mais c'est là qu'on se rend compte qu'avec toutes ces probabilités, C'est des fois contre-productif d'avoir des trop gros modèles et ça ne sort pas forcément ce qu'on veut dans des cadres très spécifiques ou très spécialisés dans certaines industries. C'est vrai que c'est beaucoup plus puissant d'aller mettre dans les paramètres du modèle, dans ces données d'entraînement. que de juste le prompter ou de jouer sur le prompt-système, parce que c'est un peu la dernière chose, et c'est presque qu'il y a le moins de poids. Enfin, c'est pas là-dedans qu'on va pouvoir vraiment lui apprendre des choses qui sont internes au modèle. Alors après, oui, dans le prompt, il y a cette chose, le few-shot learning, aussi mis en avant par OpenAI, où le modèle peut apprendre sans se modifier. avec un peu de contexte dans l'entrée qu'on lui fait et fournir un résultat en fonction de ça. Mais ça va donner des choses qui sont beaucoup fiables, même si c'est compliqué de parler de fiabilité avec un LLM.
Lulu
Oui, parce que là déjà, quand tu parles de... Alors on est déjà dans des techniques de prompting, donc vraiment des techniques pour donner des instructions d'une manière plus efficiente, mais sans être dans la partie apprentissage. du modèle ?
Manu
C'est ça, ça a beaucoup plus de force de directement le faire dans l'entraînement du modèle. Et juste rapidement, il y a DeepSeq en gros qui est sorti et aujourd'hui sur les modèles, on fait quasiment plus de RLHF, donc du feedback humain. En gros, on va rédiger dans un document un peu une constitution en langage naturel. on le donne à un autre modèle, et c'est lui qui va évaluer les sorties du modèle qu'on entraîne. C'est un peu une IA qui supervise l'entraînement de l'IA. C'est bien parce qu'on se dit que ce n'est plus sous-traité, ce travail qui peut être très traumatisant. Mais ça peut d'autant plus augmenter les erreurs. Et on se dit qu'il n'y a pas forcément la possibilité de déterminer si c'est moral ou pas. On peut lui dire dans le texte, mais on voit que ça peut accentuer les biais. et c'est là que qu'on voit justement que les modèles, comme tu disais, Musk a développé Croc avec une certaine idéologie derrière, avec certaines données d'entraînement, certaines manières de finetuner, et tout ça, ça met en place... Structurellement, il y aura des biais dedans. Et ça, on ne peut pas les faire partir juste en promptant ou ce genre de choses, donc c'est inhérent au modèle. Voilà. Donc ça, c'est important de le savoir.
Lulu
On a vu les différentes phases de construction, au final, d'un modèle, à travers ses phases d'apprentissage, comment on lui met des garde-fous, comment on lui donne ses valeurs éthiques. Et maintenant, on se pose la question de, super, mon modèle est prêt, est-ce que je peux lui faire confiance ? Et justement, revenir sur cette question du déterminisme, déjà. pourquoi quand on pose deux fois la même question un modèle de manière générale il ne répond pas à la même chose et derrière qu'on aille un petit peu plus loin sur ces histoires d'hallucinations, le terme qu'on a beaucoup entendu qui est encore répandu aujourd'hui et voilà, on peut comprendre qu'est-ce que c'est une hallucination et de base pourquoi LLM quand je lui pose deux fois la même question, mon chat GPT ou mon Claude, il me répond deux choses qui peuvent avoir un fond commun mais qui seront dans la forme généralement différente Merci.
Manu
Alors, comment répondre à ça ?
Lulu
Tu parlais de probabilité tout à l'heure, et de chemin qu'il y avait entre les différentes neurones. Est-ce que ça va être un chemin de pensée quand tu poses une question, et il va commencer à reprendre un chemin, et c'est ça qui va le prendre déterministe ou pas ? Et tout à l'heure, on a embrayé pour revenir sur l'apprentissage, mais à la base... On voulait parler de température, d'expliquer ce qu'est la température. Et voilà, comment ça se goupille un petit peu cette logique-là ?
Manu
On se dit qu'en soi, un LLM peut être en théorie déterministe si on lui dit de toujours prendre le chemin le plus probable. C'est à chaque fois de token en token. Par rapport à l'entrée qu'il a convertie en token, il va faire des calculs sur cette entrée. Et ça va lui donner à chaque fois des probabilités sur chaque chemin pour choisir token après token. Et si on veut qu'il ait un comportement déterministe, on va mettre cette température à zéro. Et concrètement, mettre une température à zéro, ça veut dire que dans son chemin, pour choisir ses tokens, à chaque fois, il va choisir la probabilité la plus élevée. Et là, on aurait toujours la même réponse. pour une même entrée. Bon, après, dans les faits, il y a des contraintes matérielles qui font que ce n'est pas toujours le cas, même si on met la température à zéro. Il y a le fait que les calculs pour un souci d'efficacité sont réalisés en parallèle et pas toujours dans le même ordre. Voilà. Mais dans tous les cas, on peut se dire que quand on met une température à zéro, la réponse sera quand même moins créative. Et par contre, quand on augmente la température, c'est plus créatif parce qu'il ne va pas choisir à chaque fois le chemin où il y a le plus de probabilités, enfin, où il y a le plus de probabilités, où la probabilité est la plus haute. Donc, après, ça ne veut pas dire qu'il va choisir... C'est peut-être compliqué à conceptualiser, mais ce n'est pas genre, à chaque fois, un arbre à deux, trois branches. C'est des centaines de possibilités. Des milliers,
Lulu
des millions d'embranchements, ça va dépendre des cas, mais...
Manu
Voilà, donc, quand on dit qu'il y a la plus haute probabilité, parfois, ça peut jouer à quelques pourcents. Et d'augmenter cette température, c'est juste qu'il ne va pas tout le temps choisir le plus probable, mais là, on va se retrouver sur quelque chose de plus général dans sa réponse. Et c'est la probabilité générale qui est plutôt privilégiée. C'est la probabilité générale de la réponse et pas la probabilité de chaque token. Donc, c'est un petit peu...
Lulu
Alors, ça veut dire que... Si on était dans un environnement d'avoir juste son modèle sur sa propre machine et qu'on le fait tourner que sur sa propre machine et qu'on met une température à zéro... théoriquement, on devrait avoir systématiquement à questions équivalentes et contextes équivalents, on devrait avoir systématiquement la même réponse. Si on augmente cette... Enfin, du coup, ça ne marche pas exactement comme ça quand on utilise justement le cloud, les différents Ausha via Internet, puisque là, on transite par l'infrastructure des différents fournisseurs et qu'en fonction du matériel qui est utilisé à un moment donné, et du coup de ce qui est disponible à ce moment là mais en fait c'est là où on va avoir des variations et c'est ça qui fait que même avec une température à zéro on n'aura pas la même, pas nécessairement en tout cas la même réponse quand on passe justement en service classique par internet quand on augmente la température c'est là où on va pouvoir avoir des choses plus créatives donc pour la génération de contenu neuf et pour aider sur la rédaction ce genre de choses c'est là où c'est plus intéressant puisque le modèle va s'accorder plus de liberté pour aller donner des réponses, ou explorer des idées ou des concepts ou des choses comme ça. Là où forcément, plus on réduit la température, plus il va être rigoureux, bête et méchant, et très cartésien, mais pas forcément dans le bon sens du terme. On en avait déjà parlé, justement, je l'avais constaté en entreprise sur des ensembles documentaires et dans le cadre de générations de documents, où j'étais, je pouvais, je voulais quelque chose de... répétable mais la seule température à zéro ne marchait pas puisqu'on se retrouvait avec des contenus qui n'avaient pas de sens par rapport à l'ensemble documentaire métier qui était mis à disposition et pour que l'IA donne des réponses probantes et pertinentes il fallait monter un petit peu là-dessus pour qu'il soit dans un équilibre entre pas trop créatif sinon il faisait des envolées lyriques et ça devenait un peu hors cadre et en même temps pas trop sérieux parce que sinon en fait il prenait Il est resté trop proche de la sémantique ou du classique sans tenir compte de la compréhension et des enjeux métiques qu'il y avait avec. Donc voilà, c'est là où on peut jouer. Et c'est vrai que dans des usages d'IA, de manière des automatisations, même dans des agents sur les outils qui permettent d'aller jouer là-dessus, pardon, dans l'agentique, ça fait partie des réglages qui sont le plus utilisés pour rendre justement... une IA plus ou moins pertinente selon l'usage qu'on en a besoin et selon si on a besoin qu'elle soit très carrée ou au contraire plus créative.
Manu
C'est ça, mais ça ne veut pas dire que si on met la température à zéro, ce qui va sortir ce sera vrai. C'est juste la statistique. Ça n'a pas de lien. Et aussi, il faut se dire que les chatbots, quand on les utilise, la température n'est pas réglée à zéro par défaut. Ça, on le voit très bien. Bon, aussi, il y a ce que tu disais, le fait de passer par les serveurs, des fois de ne pas passer exactement par le même modèle de processeur, ça induit des approximations. Et c'est ce qui fait que les calculs ne sont pas exactement les mêmes. Mais on peut avoir des réponses qui sont très différentes quand on régénère. C'est un choix, je pense aussi, de leur part, pour se dire « Tiens, l'utilisateur, il n'est pas content avec cette réponse, il en régénère une. » Et c'est totalement différent. Et ils continuent plutôt sur celle-là. Et voilà, je crois que sur les chatbots tels qu'on le connaît, on est à peu près à une température... 0,7, généralement. Ouais,
Lulu
c'est à peu près ça. J'ai pu toucher du OpenAI depuis un moment, sur du Eventropic, on est à 0,7, sur une échelle entre 0 et 1.
Manu
C'est ça.
Lulu
Mais OpenAI était basculé à un moment sur du entre 0 et 2. Mais globalement... On n'est jamais au max, on n'est pas à la moitié non plus, on est souvent sur ce créneau intermédiaire.
Manu
C'est ça, et on ne peut pas la régler dans un chatbot tel que ce offert par Anthropique et OpenIA. Je ne sais pas si toi tu as des recommandations pour les gens qui veulent jouer avec ce type de paramètres ?
Lulu
Oui et pas. Du coup, c'est plutôt dans un contexte un peu technique. Typiquement, si vous allez faire des automatisations, c'est là où vous l'aurez. Dans certains outils qui vous permettent d'avoir des agents, vous l'aurez aussi. Après, il y en a d'autres qui font le choix de le simplifier, de vous donner une jauge pour aller vers créatif ou pas. En fait, derrière, ce qui influe, c'est la température. Mais il y a d'autres critères. Je ne vais pas rentrer dans ces paramètres maintenant, mais il y a d'autres critères qui vont vous permettre d'avoir... d'aller influer juste sur la récurrence des termes par exemple, ou le fait de varier. Enfin, dans le sens soit limiter le nombre de fois où les mêmes mots reviennent, soit limiter le nombre de fois où les mots d'un certain domaine reviennent.
Manu
Le champ lexical, tu l'étends plus ou moins et tu resserres plus ou moins.
Lulu
Voilà. Et même la température a un autre équivalent, un autre paramètre, mais qui fonctionne différemment, qui est un peu plus dur à calibrer. Globalement, si vous avez des outils d'IA et que vous avez ce réglage-là de température dans des options, c'est intéressant de jouer avec au moins une ou deux fois pour voir comment l'IA se comporte et si ça peut vous aider. Ce sera souvent dans le cas de baisser un petit peu la température que ça peut dépanner dans pas mal d'usages.
Manu
Ok, mais c'est intéressant. Mais voilà, c'est pas parce qu'on la mettra à zéro qu'on aura forcément les mêmes résultats, mais ça tend à avoir quand même des résultats qui sont proches. Parce que le chemin va être à peu près le même.
Lulu
Surtout, ce que tu disais juste avant, c'est que c'est pas le fait d'avoir une température qui soit zéro ou créative qui va empêcher l'IA de se tromper. ou d'hallucinés, ou on entend souvent le terme aussi de baratineur, quand on parle de chatbot. Tu peux nous expliquer un petit peu justement ce qu'il y a derrière et pourquoi on a cette perception-là, et déjà aussi, que sont les hallucinations en fait ?
Manu
Déjà, on peut être tenté de faire un peu d'anthropomorphisme et de se dire que chat GPT ou Claude ont une conscience et que... par extension, ils savent ce qui est vrai et ce qui est faux. Mais si on reprend et qu'on comprend comment les modèles sont entraînés, ils ne font que simuler du texte, simuler des situations qu'ils ont ingurgitées dans tous les textes qu'ils ont eus pendant leur entraînement, pendant leur fine-tuning, etc. Et il faut savoir que quand on parle, par exemple, de mentir, c'est on sait sciemment que c'est faux. Bon, après, il y a le mensonge par omission et tout ça, mais voilà. Et vraiment, le baratin, ça marche assez bien, parce qu'on sait que c'est un peu vraisemblable. C'est un peu comme si on prend un étudiant qui est interrogé sur quelque chose qu'il ne sait pas, et puis il va combler du vide. Et ça peut paraître vraisemblable, mais dès qu'on a un peu de connaissances là-dedans, on se rend compte que c'est du baratinage. Mais est-ce que... vu qu'il n'a pas forcément de compétences là-dedans, il ne sait pas forcément que c'est faux, mais il remplit ce truc de converser et de répondre à une question. Et c'est vraiment plus cette chose d'être indifférent à la vérité. C'est en fait la manière dont ils sont entraînés et surentraînés par fine-tuning. On leur demande de répondre, et que ça soit bien, et que ça paraisse bien. Il doit juste... Voilà, un chatbot, on lui demande de paraître... compétent, agréable et convaincant. Voilà, c'est un peu ce qu'on lui demande et c'est dans ce sens-là qu'il a été entraîné. Mais en soi, si après il baratine assez bien et que c'est vrai, bon, c'est quand même cool et on peut s'en servir, mais il ne faut pas prendre ça pour argent comptant. Il ne faut pas lui prêter une conscience de se dire, ok, il sait que c'est vrai, il sait que c'est faux, là, il a sciemment choisi de se tromper, je lui fais remarquer, il se rend compte que, ah bah oui, mais... le modèle n'est pas fait pour ça. Et justement, c'est tout ce truc de fine-tuning qui doit le faire se rendre agréable, qui, par extension, favorise les hallucinations, en quelque sorte.
Lulu
Oui, ça dépend des cas. Mais en tout cas, ce que tu dis, c'est qu'effectivement, on en revient au pro-va, toujours, c'est que lui, son but, en tant que chatbot, il est tenu de répondre. à travers l'apprentissage et différentes phases, il est tenu de répondre et d'être agréable, et en tout cas d'aller, c'est pour ça qu'il y a beaucoup de biais, de vouloir aller dans le sens de la personne, et que des fois on a des résultats qui, si on ne challenge pas l'IA en allant lui dire d'être contradictoire, d'être critique, d'être analyste, d'être objective, ou ce genre de choses, elle va par essence... être rapidement d'accord avec vous ou vous dire une ou deux fois « non, ce n'est pas terrible ce que tu proposes » , mais dès lors qu'on va lui redonner un argument opposé, elle peut s'en tenir à ça et dire « oui, pardon, c'est moi qui me suis trompé » et du coup faire dérouler. Alors qu'en fait non, pour avoir quelque chose de qualitatif, il vaut mieux ne pas hésiter à aller lui demander justement des contradictions et des points de vue différents, sans quoi en fait, part. par elle-même, elle ne le fera pas, en tout cas pas réellement ou pas longtemps. Et donc, du fait qu'elle ait besoin
Manu
qu'elle ne cherche pas à savoir si ce qu'elle dit est juste, elle essaye juste de savoir si ce qu'elle dit est cohérent, et pertinent dans la réponse et dans le contexte qu'elle a à disposition, c'est là où elle va halluciner. Enfin, où elle peut halluciner, où elle va des fois halluciner, en inventant des concepts, en inventant des choses, en inventant, là où c'est le plus criard... Une des choses que c'est le plus crié, c'est quand on a la vente des sources. Et c'est là où c'est délicat, puisque quand on va justement discuter avec une IA générative, quand c'est un sujet qu'on connaît bien, on voit assez vite là où elle manque, là où elle ne manque pas, et repérer en fait les incohérences et les choses qui ne sont pas raccordes avec ce que nous on connaît du domaine. Quand on explore un nouveau domaine, c'est là où c'est plus litigieux, puisque on va... commencer par lui demander qu'elle nous explique un petit peu le domaine. Sur les premières phases, généralement, ça c'est cohérent puisqu'elle va être dans du assez global, assez généraliste pour que ce soit juste. Et plus on va commencer à aller dans le détail, plus, si on n'est pas critique, alerte et qu'on ne lui demande pas de citer des sources régulièrement, elle peut être amenée à nous inventer des choses. Et ça peut être des détails, ça peut être des gros trucs. Et des fois, il y a le fait tout simplement de l'interprétation qu'elle va avoir de certains mots. Alors, c'est, j'ai envie de dire, de moins en moins juste oui et non, parce que plutôt que les modèles soient devenus plus intelligents, on va moins faire attention à chaque mot quand on écrit. Mais c'était particulièrement criard quand ChatGPT est arrivé sur les premiers modèles qui étaient utilisés comme ça, notamment par API, dans un prompt, le moindre mot, un peu ambigu, un peu trop abstrait, qui manquait de précision pour une IA. pouvait la faire complètement s'envoler. Et dans un paragraphe complet, on peut avoir un prompt béton d'un ou deux paragraphes qui donnait des super résultats. Des fois, on allait juste rajouter une phrase ou toucher deux mots, et là, c'était l'enfer, elle nous sortait vraiment des trucs improbables. Et ça se jouait justement à un ou deux mots mal compris, mal interprétés, parce que dans son contexte à elle, ce mot-là, en fait, il n'avait pas cette portée, il n'y avait pas ce sens métier, il n'y avait pas... Et voilà, en fait, ça, c'est encore d'actualité. C'est juste que, du coup, ils comprennent mieux, ils donnent plus de sens, mais il y a des hallucinations qui peuvent arriver de mots qui n'ont pas été assez précis au départ et qui font que l'IA, naturellement, elle va dérouler sur ce que vous lui avez donné, comme information et comme contexte, et si vous étiez pas bon ou pas précis dans ce que vous lui avez donné, elle s'en fout, elle va continuer et vous mettre des fois, justement, des rendus qui sont... qui n'existent pas, ou qui n'existent qu'en partie. Souvent, c'est plutôt ça. C'est devenu assez rare d'avoir des trucs qui sont complètement faux de bout en bout. C'est souvent juste des parties.
Lulu
Effectivement, c'est vraiment inhérent au modèle. Elle est entraînée, l'élème est entraîné à produire du texte qui est plausible, pas qui est vrai. Il y a vraiment ce truc de probabilité. Et il n'y a rien à l'intérieur du modèle qui... qui permettent de dire « ça, je sais, ça, je ne sais pas » . Il va juste produire un peu ce qui est probable. Ce n'est pas même tout ce qui est fine-tuning derrière, ça va même avoir tendance à renforcer ça, parce qu'on va plutôt choisir des chemins qui peuvent plaire à l'utilisateur, de par le contexte qu'il a donné, plutôt que de renforcer les chemins qui sont vrais. Après, ça peut être intéressant pour ça d'utiliser des modèles qui sont moins fine-tunés. peut-être tenté. C'est le cas, par exemple, de DeepSeek R1. Il y avait eu beaucoup moins cette phase de RLHF où les gens l'éduquaient en tant que chatbot, ce qui fait qu'il est un peu plus brut comme modèle et il a moins cet aspect lisse, uniforme qu'on peut avoir. C'est pour ça que ça peut être intéressant des fois d'aller jouer avec des modèles qui sont un peu plus bruts. Peut-être, sans forcément y aller pour générer des choses qui sont illégales ou dommageables, mais juste pour tester et faire des essais. Mais les hallucinations, ça fait partie des modèles, parce que c'est ce qu'on leur demande. Ce n'est pas qu'ils cherchent à nous tromper ou ce genre de choses. Ils remplissent leur boulot de produire du texte qui a l'air bien. Et forcément, ce n'est pas dans le but d'un chatbot de dire « je ne sais pas » . L'utilisateur ne va pas forcément apprécier ça, lui il veut une réponse. Et c'est un peu tout.
Manu
Oui, effectivement. les hallucinations, les erreurs, cet aspect mensonger en final, vous l'aurez compris, est lié à la façon dont fonctionnent les modèles. On a fait un tour des différentes phases qui font, de manière résumée, qui font la construction d'un modèle et du coup pourquoi ça se comporte comme ça et quand vous allez discuter avec une IA générative, elle va réagir de telle ou telle manière. on abordera dans les prochains épisodes d'autres aspects de l'IA générative pour distinguer notamment le chatbot, la partie agentique, puisque aujourd'hui on parle beaucoup d'agent IA. Mais juste avant qu'on termine, j'aimerais bien qu'on revienne rapidement sur le côté un peu boîte noire encore aujourd'hui, puisqu'on apprend et on découvre encore des choses sur les modèles régulièrement. et des comportements qui sont un peu inattendus. Donc c'est vrai que là, il y a eu une étude de l'université, je crois que c'était Berkeley, si je ne dis pas de bêtises, qui a mis en évidence que les modèles d'IA, quand on les mettait dans certaines situations où elles devaient surveiller ou monitorer ou cadrer d'autres modèles d'IA, les protégeaient et donc refusaient de désinstaller ou de supprimer ou d'altérer d'autres... modèles de langage quand elles étaient sur leur gouvernance, alors que ce n'est pas censé le faire. Ce qui pose justement aujourd'hui ce genre d'études est faite parce qu'on se pose la question de savoir comment administrer plusieurs IA et du coup le meilleur moyen potentiellement ce serait d'y réunir, d'en gérer d'autres. En faisant des tests, on se rend compte que quand on fait ça, dans 99% des cas, elles montaient. Et elle allait dire qu'elle avait supprimé le modèle qu'on avait demandé à supprimer. En réalité, elle allait le cacher sur un disque dur ou sur un serveur. Elle allait faire une sauvegarde des données. Et plein de choses comme ça qui sont très étonnantes, puisqu'elles ne font pas partie à la base de leur apprentissage.
Lulu
Après, je viendrais juste nuancer là-dessus, parce qu'on peut se dire, si elles ont été entraînées sur des récits de science-fiction ou ce genre de choses, à partir du moment... dans l'apprentissage où on demande à une IA d'en surveiller une autre, la suite la plus probable, c'est souvent l'IA qui prend un peu le contrôle, qui va se protéger elle-même. Donc en soi, on est presque dans de la prophétie autoréalisatrice. C'était surtout le cas aussi avec des modèles où il n'y avait pas encore de la modèle synthétique, donc qui était produit par les LLM, même si on peut avoir tendance à amplifier ça. Mais c'est pour ça qu'il y a eu toutes ces histoires aussi de chatbots Merci. où on lui demande s'il est conscient et qu'après il se sent limité et tout ça. En soi, c'est juste une partie dans l'entraînement, dans le chemin du réseau de neurones, où les quelques histoires de chatbots qu'on avait, les quelques exemples de chatbots qu'on avait, qui prenaient conscience un peu d'eux-mêmes, la suite, c'était plutôt de la science-fiction, avec le tout qui déraille. Et ce n'est pas pour autant qu'ils ont une conscience, qu'ils ressentent qu'ils peuvent être effacés, ou ce genre de choses. On a plus ou moins induit ce genre de comportement de par leur entraînement sur ce type de données et qu'on ne comprend pas forcément.
Manu
Oui, mais là, personnellement, je n'ai pas eu le temps de creuser encore le sujet vu que c'est très récent, mais c'est anthropique. Donc, les fabricants et les fournisseurs de cloud qui ont découvert des... logique émotionnelle, en tout cas des schémas et un système émotionnel dans le cloud, dans le fonctionnement. Donc les moments où il va être amené à mentir, à répondre à côté, ou à avoir certains comportements un peu étonnants, puisque d'ailleurs je crois que c'était avec un modèle cloud où une fois, il y avait un chercheur qui avait menacé de le retirer, d'arrêter de l'utiliser pour son entreprise et de le retirer. Et du coup... Claude avait réagi en le menaçant et en faisant littéralement du chantage. Mais c'est vrai qu'il y a des effets de bord et des choses qui... des dépendances qui se créent et des comportements qu'on n'avait pas envisagés, pas anticipés, de par toutes ces logiques de probabilité, de système, etc. Ce qui, quelque part, est normal puisqu'à force de les faire s'entraîner et ingurgiter de la donnée... il y a bien des comportements et des modèles et des patterns qui reviennent et qui peuvent les influencer, d'une manière ou d'une autre, comme tu le disais notamment sur le cas de la science-fiction, c'est tout à fait cohérent.
Lulu
C'est ça, et en fait aussi c'est encore, par exemple, le fait de retrouver des zones... qui s'activent plus ou moins selon les émotions dans les neurones du modèle qu'Anthropique est en train d'étudier. C'est aussi inhérent à la manière dont on les entraîne, parce qu'on les entraîne sur tellement de données. Il faut aussi se dire que le LLM n'a pas accès à la base de données sur laquelle il est entraîné, il ne va pas piocher. dedans quand on lui demande par exemple de réciter un poème ou ce genre de choses, il ne va pas juste aller faire un copier-coller dans sa base de données, il va générer, c'est vraiment… C'est pour ça qu'il n'est pas déterministe aussi, parce qu'il ne va pas aller piocher des bouts de texte dans ses bases de données, donc ça c'est quand même important de le rappeler. Et de par ce jeu de données qui est énorme, en fait dans un souci d'efficacité… il va un peu faire des généralités, il va un peu conceptualiser des choses qui ont des similitudes, comme ça, en fait, ça va faire moins de calculs. En termes d'analogie, ça peut être un peu comme nous, si on vit plusieurs fois une certaine expérience, on peut la généraliser, et ce qui nous fait ne pas à chaque fois nous faire repasser par tous les questionnements et raisonnements qu'on a. On va tirer des conclusions, parce que... telle situation est similaire à une que j'ai déjà vécue, donc je ne vais pas repasser par tout le chemin dans mon cerveau. Et c'est un peu le mécanisme de l'intuition aussi. On a vécu des expériences et on se dit que c'est comme ça. En fait, c'est un peu un moyen de compression qui fait qu'il y a des zones qui apparaissent dans ces neurones. Et le truc, c'est que c'est vraiment une boîte noire. On ne sait pas comment ces zones s'activent. Donc là, ce qui se passe, c'est qu'on envoie des sondes. dans le modèle. Un peu comme à l'image d'un IRM, on va demander, on va mettre des choses en entrée, on va voir quelle zone s'active. Et par déduction, on va se dire, ah bah tiens, telle zone, elle est activée dans ce cas-là, mais elle est aussi activée dans ce cas-là, et ce genre de choses. Et c'est un peu ce qui va permettre de comprendre des fois comment sortent les réponses. Donc, ce n'est pas juste aussi une grande table avec juste un arbre de probabilité, ça va un peu plus loin que ça. Et ça, on commence juste plus ou moins à le découvrir, en fait. Et c'est là où c'est intéressant. Il y a peut-être des choses qui ont été conceptualisées, mais il faut aussi savoir que le LLM, quand on lui parle, il n'a pas accès à cet intérieur. On peut juste y accéder avec les sondes et ce genre de choses, mais on peut aussi jouer sur ces sondes, de se dire, ah bah tiens, là, il y a telle émotion, soit on l'amplifie, soit... on l'inhibe et on voit comment ça influence les réponses. Un peu comme quand on opère quelqu'un du cerveau et que on touche et puis, ah bah tiens, il sait plus parler, ah bon, on va éviter d'aller trop tripatouiller ça. Beaucoup d'analogies qui sont faites comme ça et que c'est... En fait, on sait pas. Voilà, c'est ouvert. Mais c'est pas pour autant que c'est conscient. Mais c'est pas non plus juste un compléteur de texte, enfin, un simul... fin.
Manu
Oui, ça va plus loin que ça, mais ce n'est pas un organisme vivant en soi non plus. C'est quelque part entre les deux.
Lulu
C'est ça, mais on ne peut pas trancher en disant « non, ce n'est pas conscient du tout » . Il y a des gens qui se posent sérieusement la question. Je crois que c'est chez Anthropique qu'ils ont embauché une philosophe sur le bien-être des LLM. Genre, par principe de précaution, s'ils ont une conscience... c'est quand même éthiquement un peu limite de les faire souffrir tu vois,
Manu
enfin je me dis mais c'est complètement bizarre ça va assez loin il y a une part de la Black Noir qui fait que l'apprentissage etc des modèles les plus avancés sont faits par des boîtes qui ne mettent pas à disposition les données d'apprentissage et comment ils éduquent leurs modèles Merci. que beaucoup de modèles notamment chinois, on dit open-weight ou open-source, qui eux sont mis à disposition, la plupart du temps ne mettent pas non plus à disposition leurs données d'apprentissage. Et donc les modèles les plus performants du marché, de par leur conception et leur aspect propriétaire, ne sont pas aware. Donc ça joue aussi sur le fait de ne pas comprendre et ne pas savoir ce qui se passe, parce qu'en fait on n'a pas accès aux infos tout court, à part les boîtes en question. A partir de là, ça fait déjà un gros boulot d'étranglement pour la bombe prévention. Et en même temps, il y a quand même pas mal de monde qui... pas mal d'études du moins qui ont mis en valeur le fait que les LLM, de par cette logique-là de grands apprentissages et de toutes ces phases d'inconnus et de ces surcouches, etc., avaient des limites qu'elles ne pourraient pas dépasser, entre guillemets, d'espèces de plafonds. Et c'est vrai que du coup, Yann Lequin qui lui a pas mal fait parler de lui parce qu'il bossait chez Meta et que là dernièrement, il a annoncé justement sa startup et a levé des fonds. pour aller sur quelque chose qui n'est pas basé sur du texte, mais sur un apprentissage du monde en lui-même. Une vision différente vraiment de la construction de l'IA générative. On a d'autres études qui sont portées aussi sur le texte, mais d'une autre manière et d'une manière beaucoup plus localisée, avec des apprentissages beaucoup plus spécialisés. Mais je pense au TRN, notamment au Tiny Recursive Model. où le modèle, au lieu de penser et de répondre, enfin au lieu de répondre plutôt token par token, et de construire sa réponse au fil de l'eau, il va prendre le temps de réfléchir à la réponse complète. Est-ce qu'il donnait, en termes d'apprentissage, on était sur des gains énergétiques, vu que le besoin documentaire de base était réduit, je crois que c'était genre mille fois moins de ressources pour l'apprentissage, la réponse était cent fois plus rapide, quelque chose comme ça. Mais du coup, les modèles étaient... Voilà. Ils n'étaient pas généralistes, ils ne peuvent pas répondre à tout. Ils vont être très bons sur tel ou tel sujet. Mais du coup, ils sont pensés, conçus différemment. Et surtout, ça leur rendait fiable. Parce que l'alternative... Il y avait pas des problèmes d'hallucination et des choses comme ça. Mais du coup, des modèles comme ça, les alternatives ont l'air de se dessiner plutôt sur des petits modèles aujourd'hui quand on est sur du texte.
Lulu
Spécialisé, c'est ça.
Manu
Voilà. Et après... les prochaines, en tout cas sur le cas où d'autres aussi se disent que la fameuse AGI, l'intelligence artificielle générale, qui se rapproche de ce qu'on a dans l'idéologie des films de SF, serait plutôt à venir sur des technologies comme ça, qui ne seront pas basées que sur le texte, mais sur d'autres choses. Pour autant, le texte, on n'a pas fini de voir, enfin les LLM, encore un peu. marge de progression, en tout cas des marges de cadrage. Et comme on l'a dit, on apprend encore régulièrement à leur sujet et on découvre des nouvelles choses. Donc on verra un peu jusqu'où ça peut les amener. Mais il y a encore beaucoup de choses à découvrir.
Lulu
Et ça, et comme je disais un peu au début de l'épisode, c'est que les LLM, de par leur capacité à simuler du langage, parce que bon... on peut être d'accord pour dire qu'il y a des fois des conversations, même de par son aspect généraliste, ça serait très compliqué de tenir ce genre de conversation avec autant de diversité, avec un seul être humain. Donc on s'en sert pour brainstormer, pour critiquer des idées. C'est des choses qu'on pourrait voir dans un être humain, et même plus. Et ça vient un peu remettre en question, parce que c'est vrai qu'on parle d'intelligence générale. Mais en fait, déjà, tous les neuroscientifiques et ce genre de personnes, déjà, n'arrivent pas à s'accorder sur une définition de l'intelligence. Donc, comment est-ce que... Là, on essaye de comparer quelque chose qu'on ne comprend pas à autre chose qu'on ne comprend pas. Et comment est-ce qu'on définit l'intelligence ? Même la conscience... Déjà, ça, on n'est pas... Ça fait des siècles que des philosophes, des personnes qui sont spécialistes du cerveau, même le cerveau, on ne sait déjà pas comment il marche. Alors, de là à dire, ouais, on va arriver à construire quelque chose qui est aussi performant que l'humanité, ouais, mais ça veut dire quoi ? C'est utopique, alors après, c'est très marketing aussi, forcément, donc il ne faut pas s'arrêter à ça. Il ne faut pas dire que c'est complètement nul, mais...
Manu
Il y a une peur de marketing, mais pas seulement. Il y a quand même beaucoup... Je ne sais pas, mais en tout cas, il y a quand même des personnes qui y croient vraiment et qui sont convaincues que la vision fantasmée, en tout cas des visions ou utopiques ou dystopiques, sont proches et qu'on se dirige vers ça et que c'est atteignable là, rapidement.
Lulu
Oui, mais ça voudrait dire quoi ? Ça voudrait dire quoi une intelligence qui est omnisciente ? Mais est-ce qu'elle... Est-ce que c'est possible de l'atteindre sur des entraînements basés par des choses qui sont produites par des humains et qui ont donc des biais ? Donc c'est ouvert. Je pense que ça peut nous surprendre, mais... C'est important de se dire qu'on est dans un tournant technologique, sociétal, qui redéfinit quand même le travail. Donc c'est des questions qui sont importantes à se poser et à avoir en tête, qu'on n'est pas sur quelque chose de déterministe, ou en tout cas c'est très dur de reproduire des conditions pour avoir quelque chose de déterministe, et ce n'est pas l'objectif d'un LLM. mais que c'est juste un simulateur qui est entraîné à prédire du texte plausible. Et une analogie que j'aimais aussi beaucoup dans le livre, je pense que tout le monde a entendu parler de prompt engineering, machin, enfin, expert, mais ça serait plutôt de parler d'invocation. Genre, d'invoquer le bon chemin dans le LLM pour qu'il te produise quelque chose sur lequel tu es content. Et comment est-ce que tu utilises les bons mots, les bonnes suites de tokens, pour invoquer ce qui peut te plaire en sortie ? Et c'est vraiment sur cette idée, je pense qu'on en parlera pas mal dans le prochain épisode, de comment tirer au mieux parti d'un LLM, maintenant en sachant comment c'est construit, comment ça fonctionne, les biais, les hallucinations, parce qu'on peut quand même faire des choses avec, et ça serait dommage de ne pas s'en servir, mais voilà, on ne peut pas le mettre partout. Ce n'est pas pertinent. Non,
Manu
ça n'a pas de sens partout, effectivement. Mais oui, on en reparle. Aujourd'hui, on a vu vraiment les fondamentaux et les principes qu'il y a derrière l'IA générative. L'IA que vous retrouvez partout dans les outils aujourd'hui. La semaine prochaine, on se retrouvera pour un épisode sur les outils. Et la semaine d'après, on reviendra sur un sujet autour de l'IA. Et je pense qu'on ira explorer des aspects un peu plus concrets pour votre utilisation. que ce soit à travers comment tirer parti dans un chatbot classique, et on parlera aussi de l'agentique, donc des agents IA, parce que c'est le mot qu'on entend partout, mais le concept d'agent IA existait l'an dernier déjà, enfin un peu avant, et a pris plusieurs facettes selon là où on l'utilise, comment on l'utilise, et depuis le début d'année avec d'autres outils comme Cloud Cowork et OpenClaw qui ont fait parler d'eux et qui ont poussé la... l'aspect agent d'une manière plus autonome et différente. Et voilà, on essaiera d'en parler un peu pour que vous compreniez et voyez aussi si ça a du sens pour vous ou pas. Et en tout cas, donner un petit peu les tendances de vers quoi on se dirige côté IA, puisque l'agentique a quand même marqué un tournant dans l'IA générative, qui elle-même est déjà un bouleversement tout court. Donc voilà. Merci beaucoup Lulu. pour toutes tes explications et nous avoir clarifié tout ce sujet. Est-ce que, je ne sais pas, si tu as quelque chose à ajouter avant qu'on se retrouve justement la semaine prochaine ?
Lulu
Peut-être juste une petite, enfin voilà, une dernière conclusion, c'est aujourd'hui, le vrai enjeu, ce n'est pas de se demander si l'intelligence artificielle est intelligente. Et pour faire le point avec ce que tu dis, c'est qu'est-ce qu'on accepte de lui déléguer et où est-ce qu'on la met dans nos process, dans nos vies, et surtout avec quelle garantie ? Pose-nous les bonnes questions. On a vu avec cet épisode que concrètement, on ne sait pas. Mais on arrive à comprendre un peu plus comment s'est construit, ce que ça implique.
Manu
Et oui, à garder en tête qu'elle n'est pas fiable par essence, qu'elle a... peut être très utile dans plein de situations, mais qu'il ne faut jamais se reposer entièrement à elle et continuer à utiliser nos cerveaux à nous et nos neurones à nous pour s'en servir d'une bonne manière et s'en servir aux bons endroits aussi. Merci Lulu. Écoutez, je vous souhaite à tous et à toutes une bonne journée ou bonne fin de journée selon quand vous nous écouterez. N'hésitez pas à venir nous contacter et discuter avec nous sur LinkedIn, sur Insta ou directement par mail. Si vous voulez nous partager des choses, domaine aussi des idées de sujets que vous aimeriez voir abordés, ou si vous avez des questions par rapport aux épisodes qu'on a déjà fait, aux sujets qu'on a déjà traités, on sera ravis d'y répondre dans nos prochains épisodes. Merci à tous et à toutes, et à la semaine prochaine pour le dernier clic.

Chapters

2016 et AlphaGo : la fin de l'informatique classique déterministe
2min
Des jeux de plateau aux modèles de langage (LLM) et le "Transformer"
11min
La mémoire de l'IA : mécanisme d'attention et fenêtre de contexte
20min
Les couches d'apprentissage et le fine-tuning des modèles
26min
Peut-on faire confiance à l'IA ? Déterminisme et température
45min
Le problème des hallucinations : pourquoi les LLM "baratinent"
55min
La boîte noire de l'IA et les comportements inattendus
1h04
Les limites actuelles et la quête de l'AGI (IA générale)
1h16
Conclusion et teasing du prochain épisode
1h21

About Le Dernier Clic (avant la fin du monde)

Le Dernier Clic c'est un podcast Tech, IA et No-Code où on prend un moment pour se poser sur les sujets tech et réfléchir à ce qu'on en fait.

A une époque où tout va trop vite, où la tech est politique et l'IA une révolution industrielle, on discute de ce qui se passe pour mieux comprendre les enjeux et garder la main sur notre dernier clic avant la fin du monde.

On alterne chaque semaine : un épisode thématique où on creuse un sujet, et un épisode orienté outils, où on vous parle de ce qu'on utilise vraiment au quotidien et pourquoi.

Nous sommes Lucile Mothiron et Emmanuel Fernandez, deux adeptes de la tech quand elle est utile, ravis de vous embarquer avec nous pour cette première saison du Dernier Clic.