Description
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Description
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Transcription
Générique Générique Générique Ami, le podcast tech Guillaume Richardot, Franck Lefebvre
Générique Générique
Oh, quel joli son et voici une cloche reposée mais une cloche qui a chaud quand même Non mon cher Franck, tu n'es pas une cloche c'est ta cloche personnelle dont je parle, vas-tu bien ?
Super Guillaume effectivement, la cloche a chaud mais ce n'est pas la seule actuellement à avoir chaud en France Merci.
Bon, ben écoute, en tous les cas, je salue ta cloche qui a chaud, et puis tu reviens de vacances, donc tu es tout frais, et moi je salue au passage notre ami Bruno, qui fait avec talent les montages de nos podcasts, parce que lui aussi doit avoir chaud. Bienvenue donc dans Ami le podcast, et j'ai ma copine à côté de moi, dont je ne peux pas me débarrasser en ce moment, c'est, si vous l'entendez, ma petite bouteille d'eau. Très importante, la bouteille d'eau. Alors justement, tiens, aujourd'hui, j'ai envie de parler d'eau, figure-toi. J'ai envie de parler d'eau et de technologie, bien sûr, parce que j'ai souvent entendu à la radio, dans des émissions qui ne sont pas toujours précises, que les data centers volaient de l'eau. C'est-à-dire que dans certaines régions, quand il y a un data center pas loin, du coup, les habitants du coin ont moins d'eau. Et je me posais une question, pourquoi ? Parce qu'on se doute bien que l'eau, elle refroidit les data centers. Elle est utilisée pour ça. Mais après, une fois qu'elle la refroidit, elle peut repartir dans des tuyaux et être recyclée ou réutilisée. Non, je me trompe. Donc, je voulais parler de chaleur et de data center.
Je crois que tu ne te trompes pas. Je suis sûr que tu ne te trompes pas. D'autant plus que... La notion de consommation d'eau, puis on reviendra après sur les data centers. La notion de consommation d'eau, elle est très relative, puisqu'il y a trois façons de consommer de l'eau. Il y a une façon qui est de la salir. Donc, normalement, il y a des stations d'épuration qui viennent derrière, mais il y a des coûts énergétiques et environnement qui peuvent être importants. Et puis, parfois, on salit l'eau d'une façon qui fait que... qu'elle est très difficilement nettoyable. On connaît par exemple les résidus médicamenteux qu'il peut y avoir dans nos urines et donc qu'on retrouve dans l'eau. La deuxième façon d'abîmer de l'eau, c'est de l'évaporer. Et donc effectivement, l'eau qu'on a évaporée, elle ne va pas être disponible au niveau où elle a été captée. Bien entendu, on connaît tous le cycle de l'eau, on sait qu'elle va revenir sur Terre. mais elle n'est plus disponible à l'endroit où on se trouve. Et puis, la dernière façon, c'est de la réchauffer. Et quand on la réchauffe, elle est moins disponible. Et puis surtout, sa capacité à refroidir quelque chose est bien moindre. Donc, c'est pour ça que... C'est pour ça, par exemple, qu'il y a certains scénarios qui peuvent être assez inquiétants avec des centrales nucléaires, puisque le problème est exactement le même pour les centrales nucléaires, et des centrales nucléaires qui risqueraient à un moment de se trouver à proximité d'un cours d'eau qui assure le rafraîchissement et sur lequel on peut soit manquer d'eau, soit avoir de l'eau qui serait trop chaude, puisque ce qui est intéressant, c'est le gradient de température. La différence, c'est... entre la température de l'eau que l'on prend et la température de l'eau que l'on rejette. Et bien entendu, comme ce qu'on veut, c'est la réchauffer, plus elle est chaude dans l'entrée, moins on va pouvoir l'utiliser pour refroidir. Donc, si je reviens sur nos data centers, ça vaut le coup de dire que les data centers n'élaborent pas d'eau, que les data centers ne salissent pas l'eau, mais que les data centers peuvent réchauffer de l'eau, ce qui peut effectivement poser un problème. Je ne suis pas un super spécialiste de ça, donc j'entends par là que je ne pourrais pas donner des chiffres très précis. Mais je pense que souvent les arguments qui sont apportés par les personnes sur ces sujets-là sont très orientés et sont souvent très peu documentés. C'est-à-dire que si demain tu peux inviter à notre micro quelqu'un qui nous parle réellement avec des chiffres, de dire voilà quel est... Quel est l'impact réel sur l'eau ? Et par exemple, est-ce que l'eau qui aujourd'hui est utilisée pour arroser nos maïs, est-ce que les maïs consomment moins d'eau que les data centers ? Et est-ce que l'eau qui a été réchauffée par les data centers ne peut pas être utilisée pour arroser les maïs ? Là, je pense qu'on arrive à des sujets vraiment intéressants.
Bon alors, justement, je fais une petite... Si vous êtes spécialiste, que vous y connaissez vraiment bien en data center et en refroidissement des data centers, rentrez en contact avec nous, contact.ami.podcast.com ou alors le 01 76 21 18 10 et on se fera un plaisir d'enregistrer un podcast avec vous sur ce sujet qui est passionnant et grandement d'actualité.
Tout à fait, tout à fait. Maintenant, pour aller un tout petit peu plus loin sur le sujet avec les connaissances qu'on a, là, comme il fait chaud et on se dit, ah ben là, réchauffer de l'eau, c'est un problème, il ne faut pas oublier que nous sommes dans des régions tempérées dans lesquelles l'hiver est plus froid, et qu'aujourd'hui, on utilise une partie très importante de l'énergie que l'on consomme, et de l'énergie fossile, on utilise beaucoup de gaz, encore un peu de fuel, on utilise beaucoup de gaz. pour réchauffer des maisons l'hiver. Ce qui est objectivement complètement incroyable, parce que quand on brûle du gaz pour réchauffer une maison, ça veut dire qu'on va avoir produit de la chaleur, mais sans produire aucun travail autre. Tu vois, quand tu as un moteur à explosion, par exemple, ton moteur à explosion, il va produire de la chaleur, parce que c'est une machine thermodynamique, donc il va produire de la chaleur, il va produire de la chaleur qui va être directement associée à un travail. Donc on peut se dire que même si c'est pas terrible, au moins on a, quand on crame notre énergie, on a du travail, donc le moteur tourne et puis on traîne quelque chose, et puis on a de la chaleur, puis l'idéal cette chaleur, c'est peut-être de l'utiliser pour réchauffer les bâtiments, puisque sinon brûler du gaz sans travail pour avoir de la chaleur, exclusivement de la chaleur, c'est complètement délirant, t'es d'accord avec moi ?
Donc on pourrait mettre des petits data centers à côté de chaque maison pour les réchauffer en hiver, mais on était évidemment moins probants.
C'est vrai, c'est vrai. Sauf que ça fait partie, à une époque, il y a même des gens qui ont eu une offre comme ça. Ils proposaient des PC qui étaient intégrés, des systèmes de calcul. Dans des radiateurs. Exactement. Oui, j'avais vu,
incroyable. Oui, tout à fait.
Voilà. Après, je voudrais revenir sur l'idée du data center. Parce que ça fait partie, je crois, de ces termes un peu fantasmatiques. Aujourd'hui, on utilise des data centers pour gérer deux activités. La première, c'est celle qui est dans le nom data center, c'est de gérer de la donnée et gérer du stockage de données. Donc, ce sont des endroits dans lesquels on a des quantités très importantes de disques durs et de machines qui vont gérer tout ça. Le deuxième usage, c'est pour faire du calcul. Et donc, historiquement, on en fait peu. Des gens qui font ce qu'on appelle du HPC, du iPower Computing, pour faire de la simulation numérique et tout. Historiquement, on en utilise relativement peu, mais il y en a quelques-uns en France qui sont significatifs. C'est ceux qu'on utilise, par exemple, pour simuler à une époque. On en a parlé beaucoup. On parlait de simulation des bombes atomiques. Plutôt que d'aller les faire péter directement dans le Pacifique, et bien On a créé des modèles, on fait de la simulation. C'est extrêmement gourmand en calcul, mais il y a un tas d'autres choses qui sont gourmandes en calcul. Mais jusqu'à très récemment, quand on parlait de data center, on parlait surtout de stockage de données et un peu plus de calcul. Aujourd'hui, le stockage de données consomme relativement peu d'énergie. Alors que le calcul haute performance consomme beaucoup d'énergie. Je vais te donner un indicateur, par exemple, tout à l'heure. Il consomme beaucoup plus d'énergie et donc il va générer beaucoup plus de chaleur. Donc ça peut être un vrai problème, mais à quoi c'est imputable ça aujourd'hui ? C'est imputable, tout le monde le sait, à la croissance des systèmes d'intelligence artificielle qui font qu'on a besoin de faire de plus en plus de calculs. Or on a besoin de faire du calcul pour deux choses. Le premier c'est l'entraînement. Tout le monde a entendu dire que pour faire un modèle, un grand modèle de langage, comme ceux qui sont utilisés chez le GPT Mistral Cloud pour prendre ce dont on parle tous les jours à la radio, ça demande des capacités de calcul gigantesques, donc des quantités d'énergie gigantesques, et puis des processeurs en nombre gigantesques, et ainsi de suite. Mais une fois que ton modèle existe, ça ne demande plus cette énergie. Une fois que ton modèle existe, tu vas pouvoir l'utiliser. Quand tu fais une requête sur chaque GPT, ce n'est pas du tout la même. Tu vas utiliser le modèle qui a été créé lors de sa phase d'apprentissage.
Ça dépense beaucoup moins que de l'entraîner, c'est ça que tu veux dire ?
Exactement, c'est ce qu'on appelle l'inférence. Et donc l'inférence, ça consomme... beaucoup moins, mais on entend encore, on va dire, tiens, tu vois, une requête achat de GPT, c'est l'équivalent de 10 requêtes à Google ou quelque chose comme ça. Ce sont des métriques qui n'ont aucun sens. Je ne cherche pas du tout à dire que ça ne consomme pas beaucoup d'énergie, entendons-nous bien. Je dis que ces comparaisons n'ont absolument aucun sens, puisque une requête achat de GPT, ça peut demander des quantités de calcul qui varie très facilement d'un autre... de l'ordre de 1 à 10, 50, 100. Donc tu vois, tu ne peux pas dire une requête égale X requête, ça, ça ne marche pas.
Ça dépend de ta question, j'imagine. Si tu lui demandes quelle heure il est à Moscou, c'est une petite requête. Et si tu lui demandes de te raconter l'histoire du pape ou des moteurs hybrides, ça va être plus compliqué.
Exactement, parce qu'en vrai, comment ça se passe au niveau du modèle, c'est que comment on utilise un modèle ? On utilise un modèle en lui envoyant un paquet de textes. On pourra un jour, aujourd'hui on n'aura pas le temps, mais on pourra revenir un jour là-dessus si tu veux. On envoie au LLM, au grand modèle de langage, on lui envoie un bloc de texte et puis il nous renvoie un bloc de texte. mais il faut bien comprendre que le bloc de texte ça n'est pas la question que tu as posée si tu dis quelle heure est-il à Mouscon c'est pas ça, il va y avoir plein d'autres informations dans le bloc de texte, il va y avoir ce qu'on appelle le système prône qui va être toutes les directives que l'on va donner pour que ton assistant fasse son travail et puis il va y avoir également la question que tu poses Merci. Mais imagine, si ce n'est pas une question que tu as posée, mais si c'est un échange que vous avez eu, il va y avoir l'intégralité de l'échange, très certainement. Donc tu vois bien que le volume va changer, ces volumes vont être très différents les uns des autres. Et puis, en plus, en fonction de ta demande, si tu dis quel temps fait-il à Moscou, par exemple, le modèle de langage, lui, il n'a aucune idée. du temps qu'il fait à Moscou. Mais par contre, il a accès à ce qu'on appelle des tools, des outils qui font que quand tu vas envoyer cette demande-là, lui, il va exécuter, il va aller appeler une fonction qui, par exemple, va aller chercher la météo à Moscou, et puis il va réinjecter le résultat dans le LLM de manière à fabriquer ta réponse. Ce qui fait que dans l'exemple que tu viens de donner, on n'a pas un aller-retour, mais on a au minimum deux allers-retours. Et dans la pratique, on a très souvent 4, 5, 10, 20 allers-retours. C'est-à-dire que ce qui pourrait sembler être une demande, en vrai, ce n'est pas une demande, c'est 20 demandes. Tu me suis, Guillaume ?
Oui, je te suis complètement.
Voilà. Et donc, aujourd'hui, quand on parle d'inférence, on donne des métriques qui souvent sont fausses, mais il est certain que... comme l'adoption, les usages de l'IA augmentent de façon très importante, la consommation augmente de façon très importante, de façon absolument gigantesque. Sauf qu'il faut être également conscient que ces choses-là sont en train d'évoluer très vite et qu'on commence à voir arriver des processeurs qui sont optimisés pour faire de l'inférence.
J'allais y venir. de poser une question bête, mais je te la poserai après parce que je crois que tu vas répondre à ma question avant que je te la pose.
Et qui vont consommer beaucoup moins. Et entendons-nous bien, ce n'est pas du technosolutionnisme que je fais. C'est juste une certaine lucidité. Et puis, posons-nous la question du comment peut-on effectivement optimiser ces choses-là. Elles vont se faire de toute façon puisque puisqu'il va falloir réduire le prix de ce type de transactions au fur et à mesure où elles augmentent, puisque toi, quand tu poses une question, tu veux avoir une réponse, mais ta réponse, tu ne veux pas la payer 10 euros. Donc, il va falloir réduire le coût, et comme le coût de l'énergie est à peu près stable, même si sur votre facture, vous voyez bouger, je veux dire que ça ne s'arrive pas dans des facteurs de 1 à 100, alors que l'efficacité du matériel qu'on peut avoir derrière... peut facilement varier de 1 à 100, comme l'efficacité des modèles, puisqu'on voit aujourd'hui des modèles qui sont pensés pour être moins consommateurs que d'autres. Donc, ces choses-là vont évoluer. Donc, je ne suis pas forcément optimiste sur la quantité totale d'énergie consommée, mais pour répondre à ta question sur Quid d'un data center, on peut être aujourd'hui à peu près certain que... Que l'inférent, premièrement que l'entraînement va consommer de moins en moins. Aujourd'hui ça consomme beaucoup parce que chacun veut son modèle. Il y a plein de gens qui font des modèles et je me demande pourquoi parce que très souvent ils fabriquent des modèles qui sont pourris par rapport à ce qui existe. En tout cas aujourd'hui il y aura une centaine d'acteurs qui fabriquent des modèles. Demain j'imagine qu'il y en aura beaucoup moins puis qu'on arrivera également à un plafonnement du modèle qui fait qu'on n'aura plus besoin d'en fabriquer autant. En tout cas, le modèle, une fois qu'il est fait, on n'a plus besoin du datacenter qui a servi pour le produire. Et pour l'inférence, on va avoir de plus en plus d'inférences dites on-edge, c'est-à-dire d'inférences qui ne seront plus faites dans des datacenters, mais qui seront faites sur des processeurs spécialisés qui seront soit sur ton ordinateur, dans ton téléphone ou peut-être même dans tes oreillettes.
Oui, donc tu en arrivais là et donc tu n'as pas vraiment répondu à la question que je ne t'ai pas encore posée. Donc ça tombe bien. Mais je sens que tu y allais. Je pense qu'aussi, l'avenir, ça va être des processeurs, dont tu venais de parler à l'instant, qui seront plus puissants et qui seront en local dans nos machines pour permettre que, quand tu poses à ta machine une question à la con, comme mon glouglou, quand je lui demande quelle heure est-il ou que je lui demande d'allumer la lumière, il n'est pas besoin d'aller faire travailler un data center, mais qu'en local, il puisse répondre à ma question. pour faire ce genre de choses ou même peut-être d'autres ?
Absolument, c'est ce que je décrivais à l'instant. Et puis en utilisant des modèles qui sont… Je vais te donner un exemple. On voit, je te l'ai dit tout à l'heure, qu'il y a plein d'entreprises qui sortent des modèles. Et d'ailleurs, on peut se demander comment le marché du capital… n'évolue pas plus vite parce que ce qu'on nous décrit coûter des milliards de l'autre côté de l'océan Atlantique, on voit par exemple, toujours dans le cadre d'une guerre économique qui alimente souvent nos débats, on voit les Chinois qui sont en train de proposer gratuitement des modèles qui coûtent des milliards à fabriquer. On voit bien en quoi ce sont des armes absolument dingues pour l'économie. Mais si on parle d'écologie et si on parle de chiffres, aujourd'hui, on trouve des modèles chinois open source, que tu peux installer chez toi et que tu peux faire tourner chez toi, qui ont une puissance qui est équivalente à celle d'un chat de GPT d'il y a un an. Et pour te donner des chiffres... La taille de ces modèles, c'est environ 1 Teraoctet. Donc, c'est l'équivalent de votre disque dur si vous avez un PC à peu près récent. Et la puissance de calcul qui est nécessaire pour faire tourner ça, elle est de l'ordre de, je ne sais pas, compter quelque chose entre 5 et 10 GPU de dernière génération. Ce qui veut dire que si vous devez payer ça, la facture va être de l'ordre de 500 000 euros. Donc, tu peux installer chez toi un gros PC qui va te coûter environ 500 000 euros et qui te rend totalement indépendant de M. Anthropique, de M. Mistral, de M. OpenAI, etc. Donc, tu vas me dire, c'est très cher. Oui, c'est très cher, mais si tu regardes l'évolution d'une façon générale de l'informatique, Un truc qui... Et aujourd'hui, parce qu'il est fait en très peu d'exemplaires et parce qu'il y a une tension sur le marché et coûte 500 000 euros, la probabilité pour qu'il coûte moins de 5 000 euros dans les 24 mois, elle est très haute, en vrai. Très, très haute. Subsiste la consommation électrique. Donc, on peut imaginer que quand sera disponible un truc 10 fois moins cher, il consommera moins d'électricité. Mais imagine ton bidule à 500 000 euros qui te permet de dépendre de personne aujourd'hui. Il va consommer. Quelque chose comme 5 kW. Donc 5 kW, c'est 3 radiateurs électriques. Donc tu vas me dire, c'est beaucoup pour un ordinateur. Mais dans l'absolu, la consommation électrique, elle n'est pas gigantesque. Parce que quand il va faire ça, pour faire ça, il va pouvoir alimenter les usages IA de quelques dizaines, voire centaines d'utilisateurs. c'est-à-dire que si tu... Si tu rapportes ça à l'utilisateur, c'est pas gigantesque. 5 kW aujourd'hui, c'est 10 fois moins que la consommation d'une voiture.
D'accord, là tu me parles de gros bidules qui, en local, pour des professionnels, pourraient faire tourner des IA d'entreprise. Et pour les petits bidules comme nos téléphones dans nos poches,
tu es d'accord ? Je vais te parler des petits bidules, mais imagine, le gros bidule que je voudrais bien insister, la consommation du système qui va gérer l'inférence, donc aujourd'hui qui permet de répondre aux besoins de quelques dizaines, centaines de personnes par rapport aux usages actuels, la consommation en électricité du truc est l'équivalent d'un dixième d'une voiture qui tourne. Donc tu vois, il faut remettre les choses. Je ne dis pas qu'il ne faut pas devenir frugal, je ne dis pas du tout ça, mais je dis que Merci. Quand les gens disent « Ah, mais tu te rends compte, la consommation énergétique de ce machin est absolument gigantesque » , elle est absolument gigantesque parce que comme les data centers mettent au même endroit toutes ces capacités de calcul, effectivement, c'est beaucoup, mais la consommation individuelle d'un de ces systèmes, pas d'un de ces data centers, d'une de ces machines d'inférence, c'est dix fois moins que la voiture que tu utilises. peut-être pour aller chercher ta reguette le matin. Donc, si vraiment on veut parler d'optimisation de l'énergie, à nouveau, soyons très attentifs à mettre des chiffres, des vrais chiffres, pour de façon à ne pas être dans le fantasme et dans le slogan, mais à être sur des vraies évaluations. Et donc, c'est pas beaucoup. Si vraiment on veut être économe en énergie, Arrêtons de rouler dans des voitures thermiques, et là c'est sûr, ou en tout cas réservons l'usage des voitures thermiques pour des trajets qui ne peuvent pas se faire autrement, et prendre une voiture pour aller chercher sa baguette de pain qu'on pourrait aller chercher en vélo, ça, il est démontré aujourd'hui que c'est la plus grosse consommation énergétique, et qui plus est, c'est le plus gros système émetteur de carbone oxydé, et qui plus est, c'est le plus gros système émetteur de particules fines. Il y a peut-être des gens... Parmi ceux qui nous écoutent, qui ne sont pas d'accord avec nous, eh bien, qui nous appelle, et puis on alignera et on comparera nos chiffres, ce sera avec grand plaisir. Maintenant, pour revenir sur les petits... Ah tiens,
j'en profite, 01-76-21-18-10, si vous n'êtes pas d'accord, ou alors contacte-lepodcast.com, notez-le dans un coin sur vos tablettes.
Hop, on finit avec les petits bidules qu'on aura dans les oreilles. Donc, c'est difficile d'évaluer ces choses à toi. Je trouve ça intéressant de donner les chiffres des trucs d'aujourd'hui parce qu'ils sont intéressants et parce qu'on est sûr de ça. Qu'est-ce que ça va devenir ? Ça va dépendre beaucoup des usages. Et donc, si tu veux, ma croyance, jusqu'à maintenant, je donnais des chiffres, j'étais prêt à débattre des chiffres. Maintenant, ma croyance, ce ne sont plus des chiffres, c'est dans ma petite tête, pas moi. Je pense que la consommation énergétique de ces... petites bidules va devenir toute petite, en tout cas absolument ridicule par rapport à l'énergie qu'on gâche sur d'autres choses et que si on a vraiment des sujets qui doivent nous interpeller, c'est par exemple l'utilisation des métaux qui sont utilisés pour faire ces petites bidules parce que les métaux qui sont utilisés, on est sur ce qu'on appelle des usages dispersifs ici, c'est-à-dire des usages qui sont en quantité tellement petite que ça ne vaut pas le coup d'aller rechercher le métal. Tu vois, ta voiture, aller rechercher l'acier de ta voiture, c'est super intéressant parce qu'on va aller retrouver une tonne d'acier à l'état quasiment pur. On va juste le cuire et puis ça marchera. Alors que pour aller rechercher... L'or ou l'étain qui traîne dans tes Airpods, c'est beaucoup plus difficile. Et surtout, les usages sont tellement dispersifs qu'on va dépenser plus d'énergie et de matière pour aller les chercher que ce qu'on va les récupérer. Pas dans tous les cas, mais dans un certain nombre de cas. Donc, si vraiment on veut penser des choses de façon durable, imaginons des appareils électriques qui sont bien pensés, qui sont modularisés, qui sont durables. et qui font qu'on n'en change pas tous les trois mois.
Qui sont réparables aussi plus facilement. Pour terminer la boucle de nos petits appareils qu'on a dans la poche, tu es assez d'accord avec moi, je pense, pour dire que toutes les commandes qu'on va leur faire, on parle souvent des téléphones agentiques qui vont arriver quand je vais demander à mon téléphone de me supprimer des mails, quand je vais demander à mon téléphone de me mettre telle radio, quand je vais lui demander de me mettre Ami le podcast. ça, ça va pouvoir se faire en local et il n'aura plus besoin d'interroger un data center.
Mais ça, ça se fait déjà en local. Oui,
mais ça va se faire de plus en plus, ça va être dans l'air du temps.
Oui, mais c'est, voilà, on a tous fréquenté des engins qui savaient déjà faire ça et ça ne consomme absolument rien du tout. Mais ça, ce n'est pas de l'intelligence, ça, c'est ce qu'on appelle du contrôle-commande. Le niveau d'intelligence est très, très faible. Donc oui, bien entendu, ça se fait, ça fait 30 ans qu'on a des bidules qui fonctionnent. plus ou moins bien, mais assez bien. Donc certes, ils fonctionnent de mieux en mieux. Est-ce qu'il faut aller sur le réseau pour les faire fonctionner ? Bien entendu non, ça n'a pas de sens.
Bon, et une dernière petite question avant qu'on se quitte, parce que là, je n'ai pas du tout la réponse. Samsung avait fait un truc que j'avais trouvé absolument génial. Je ne sais pas s'il n'y a qu'eux qui l'ont fait, mais c'est sur certaines télécommandes de télévision, des petits panneaux solaires, pour que quand tu retournes ta télécommande et que tu la poses sur ta table, elle se recharge pendant la journée le temps que tu ne l'utilises pas. Et ma question toute bête, c'est pourquoi personne n'a fait ça sur le dos d'un téléphone portable ? Parce que ça pourrait être sympa pour le recharger, ou le recharger partiellement, mais ça pourrait être aussi une source d'économie.
Donc, clairement non. On en avait parlé il y a quelques années. Pour les voitures. Exactement, tu te souviens ? Pour les mêmes raisons. C'est que la surface... L'énergie maximum que tu peux capter, elle est... Comment dirais-je ? Quand tu as un panneau solaire, l'énergie maximum que tu peux capter, c'est l'énergie du soleil que tu vas recevoir sur cette surface. Tu es d'accord avec moi ?
Tout à fait. Du soleil ou de la luminosité ? Parce que les télécommandes de Samsung, elles sont censées se charger même avec la lumière de ton plafond ou avec la lumière qui rentre par la fenêtre.
Mais non ! Non, la lumière de mon plafond et celle qui rentre par la fenêtre, ce n'est pas la même. Parce que celle de mon plafond, aujourd'hui, elle est émise par une LED. Et donc la LED, elle est justement optimisée pour faire le maximum d'énergie avec très peu d'énergie. Le même maximum de lumière avec très peu d'énergie. Elle a un très très bon rendement, c'est pour ça qu'elle ne chauffe pas, par exemple. C'est-à-dire que pour te donner une idée aujourd'hui, tu dois utiliser des LED qui... vont te donner, qui vont produire, imagine, sur 180 degrés, sur une hémisphère, qui vont produire quelque chose, qui vont consommer quelque chose comme 5 watts, si en face de ça, tu as quelque chose qui fait 10 centimètres carrés et que tu es à 2 mètres de la source d'émission, donc je n'ai pas fait le calcul, mais tu dois être à quelque chose du genre 5 milliwatts, C'est-à-dire qu'en imaginant que tu captes ça maximum 5 milliwatts, et donc ton téléphone, la consommation de ton téléphone aujourd'hui, elle doit être elle-même de l'ordre de 5 watts quand il ne fait plus rien. Donc, ce qui veut dire que pour utiliser ton téléphone pendant une heure, il faudrait que tu le laisses 1000 heures sous ta LED.
Oui, évidemment.
D'accord, mais attention parce que je t'ai parlé...
Ça va évoluer un jour ça je pense.
Le soleil c'est différent. Le soleil c'est différent si t'es en plein soleil. Tu auras beaucoup plus d'énergie, mais premièrement, tu n'auras pas suffisamment d'énergie de toute façon pour charger ton téléphone de façon... Et puis ton téléphone, il est dans ta poche ou il est chez toi quand tu es chez toi. Pardon. La quantité maximum d'énergie solaire qui rentre chez toi, c'est la taille de tes vitres. Elle est définie par les tailles de tes vitres. Donc, quand tu as ta fenêtre et puis tu es à 10 mètres de ta vitre, tu es dans ta cuisine, eh bien... Toi, tu y vois bien parce que ton œil est quelque chose de très efficace, mais la quantité d'énergie solaire qui arrive, elle est absolument ridicule. Donc, sur le principe, est-ce qu'on peut tirer de l'énergie ? Oui. Est-ce qu'on peut tirer une quantité d'énergie qui pourrait être utilisée, même très marginalement, pour recharger le téléphone ? C'est un piège à Google.
Oui, et puis en plus, on se dit, allez ! Je vais poser mon téléphone dehors sur la table, il sera en plein soleil. Il risque de ne pas aimer parce qu'il va chauffer. Et quand il est en plein soleil, il n'aime pas.
Absolument. Et de toute façon, la quantité d'énergie électrique que tu capteras sera absolument, même dans ces conditions absolument ridicules par rapport à la consommation de ton téléphone.
Bon, écoute, c'est parfait. On va s'arrêter là-dessus. C'était clair, net et précis. Donc, mon cher Bruno, toi qui vas faire le montage de cette émission, ne reste pas en plein soleil. Ça ne va pas te charger les neurones. De toute façon, ils vont déjà très bien comme ça. Et je te remercie d'avance. Mon cher Franck, je te remercie aussi. C'est toujours un plaisir de décrypter ces merveilles technologiques qui nous entourent. Et donc, c'est toujours un plaisir. Donc, ce sera un plaisir de te retrouver bientôt. 01 76 21 18 10. Ça, c'est pour vos commentaires audio avec la belle voix que vous avez ou que vous n'avez pas. Mais on vous diffusera. Et si vous voulez venir enregistrer... des podcasts avec nous sur des sujets qui vous passionnent, et bien appelez-nous. Alors si vous êtes timide de la voix, désormais contacte-ami-le-podcast.com contacte-ami-le-podcast.com Mon cher Franck, je retourne à ma bouteille d'eau, je te remercie mille fois et je te dis à bientôt pour de nouvelles aventures !
Amis, le podcast, 01 76 21 18 10, si vous voulez commenter l'Infotech.
Description
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Transcription
Générique Générique Générique Ami, le podcast tech Guillaume Richardot, Franck Lefebvre
Générique Générique
Oh, quel joli son et voici une cloche reposée mais une cloche qui a chaud quand même Non mon cher Franck, tu n'es pas une cloche c'est ta cloche personnelle dont je parle, vas-tu bien ?
Super Guillaume effectivement, la cloche a chaud mais ce n'est pas la seule actuellement à avoir chaud en France Merci.
Bon, ben écoute, en tous les cas, je salue ta cloche qui a chaud, et puis tu reviens de vacances, donc tu es tout frais, et moi je salue au passage notre ami Bruno, qui fait avec talent les montages de nos podcasts, parce que lui aussi doit avoir chaud. Bienvenue donc dans Ami le podcast, et j'ai ma copine à côté de moi, dont je ne peux pas me débarrasser en ce moment, c'est, si vous l'entendez, ma petite bouteille d'eau. Très importante, la bouteille d'eau. Alors justement, tiens, aujourd'hui, j'ai envie de parler d'eau, figure-toi. J'ai envie de parler d'eau et de technologie, bien sûr, parce que j'ai souvent entendu à la radio, dans des émissions qui ne sont pas toujours précises, que les data centers volaient de l'eau. C'est-à-dire que dans certaines régions, quand il y a un data center pas loin, du coup, les habitants du coin ont moins d'eau. Et je me posais une question, pourquoi ? Parce qu'on se doute bien que l'eau, elle refroidit les data centers. Elle est utilisée pour ça. Mais après, une fois qu'elle la refroidit, elle peut repartir dans des tuyaux et être recyclée ou réutilisée. Non, je me trompe. Donc, je voulais parler de chaleur et de data center.
Je crois que tu ne te trompes pas. Je suis sûr que tu ne te trompes pas. D'autant plus que... La notion de consommation d'eau, puis on reviendra après sur les data centers. La notion de consommation d'eau, elle est très relative, puisqu'il y a trois façons de consommer de l'eau. Il y a une façon qui est de la salir. Donc, normalement, il y a des stations d'épuration qui viennent derrière, mais il y a des coûts énergétiques et environnement qui peuvent être importants. Et puis, parfois, on salit l'eau d'une façon qui fait que... qu'elle est très difficilement nettoyable. On connaît par exemple les résidus médicamenteux qu'il peut y avoir dans nos urines et donc qu'on retrouve dans l'eau. La deuxième façon d'abîmer de l'eau, c'est de l'évaporer. Et donc effectivement, l'eau qu'on a évaporée, elle ne va pas être disponible au niveau où elle a été captée. Bien entendu, on connaît tous le cycle de l'eau, on sait qu'elle va revenir sur Terre. mais elle n'est plus disponible à l'endroit où on se trouve. Et puis, la dernière façon, c'est de la réchauffer. Et quand on la réchauffe, elle est moins disponible. Et puis surtout, sa capacité à refroidir quelque chose est bien moindre. Donc, c'est pour ça que... C'est pour ça, par exemple, qu'il y a certains scénarios qui peuvent être assez inquiétants avec des centrales nucléaires, puisque le problème est exactement le même pour les centrales nucléaires, et des centrales nucléaires qui risqueraient à un moment de se trouver à proximité d'un cours d'eau qui assure le rafraîchissement et sur lequel on peut soit manquer d'eau, soit avoir de l'eau qui serait trop chaude, puisque ce qui est intéressant, c'est le gradient de température. La différence, c'est... entre la température de l'eau que l'on prend et la température de l'eau que l'on rejette. Et bien entendu, comme ce qu'on veut, c'est la réchauffer, plus elle est chaude dans l'entrée, moins on va pouvoir l'utiliser pour refroidir. Donc, si je reviens sur nos data centers, ça vaut le coup de dire que les data centers n'élaborent pas d'eau, que les data centers ne salissent pas l'eau, mais que les data centers peuvent réchauffer de l'eau, ce qui peut effectivement poser un problème. Je ne suis pas un super spécialiste de ça, donc j'entends par là que je ne pourrais pas donner des chiffres très précis. Mais je pense que souvent les arguments qui sont apportés par les personnes sur ces sujets-là sont très orientés et sont souvent très peu documentés. C'est-à-dire que si demain tu peux inviter à notre micro quelqu'un qui nous parle réellement avec des chiffres, de dire voilà quel est... Quel est l'impact réel sur l'eau ? Et par exemple, est-ce que l'eau qui aujourd'hui est utilisée pour arroser nos maïs, est-ce que les maïs consomment moins d'eau que les data centers ? Et est-ce que l'eau qui a été réchauffée par les data centers ne peut pas être utilisée pour arroser les maïs ? Là, je pense qu'on arrive à des sujets vraiment intéressants.
Bon alors, justement, je fais une petite... Si vous êtes spécialiste, que vous y connaissez vraiment bien en data center et en refroidissement des data centers, rentrez en contact avec nous, contact.ami.podcast.com ou alors le 01 76 21 18 10 et on se fera un plaisir d'enregistrer un podcast avec vous sur ce sujet qui est passionnant et grandement d'actualité.
Tout à fait, tout à fait. Maintenant, pour aller un tout petit peu plus loin sur le sujet avec les connaissances qu'on a, là, comme il fait chaud et on se dit, ah ben là, réchauffer de l'eau, c'est un problème, il ne faut pas oublier que nous sommes dans des régions tempérées dans lesquelles l'hiver est plus froid, et qu'aujourd'hui, on utilise une partie très importante de l'énergie que l'on consomme, et de l'énergie fossile, on utilise beaucoup de gaz, encore un peu de fuel, on utilise beaucoup de gaz. pour réchauffer des maisons l'hiver. Ce qui est objectivement complètement incroyable, parce que quand on brûle du gaz pour réchauffer une maison, ça veut dire qu'on va avoir produit de la chaleur, mais sans produire aucun travail autre. Tu vois, quand tu as un moteur à explosion, par exemple, ton moteur à explosion, il va produire de la chaleur, parce que c'est une machine thermodynamique, donc il va produire de la chaleur, il va produire de la chaleur qui va être directement associée à un travail. Donc on peut se dire que même si c'est pas terrible, au moins on a, quand on crame notre énergie, on a du travail, donc le moteur tourne et puis on traîne quelque chose, et puis on a de la chaleur, puis l'idéal cette chaleur, c'est peut-être de l'utiliser pour réchauffer les bâtiments, puisque sinon brûler du gaz sans travail pour avoir de la chaleur, exclusivement de la chaleur, c'est complètement délirant, t'es d'accord avec moi ?
Donc on pourrait mettre des petits data centers à côté de chaque maison pour les réchauffer en hiver, mais on était évidemment moins probants.
C'est vrai, c'est vrai. Sauf que ça fait partie, à une époque, il y a même des gens qui ont eu une offre comme ça. Ils proposaient des PC qui étaient intégrés, des systèmes de calcul. Dans des radiateurs. Exactement. Oui, j'avais vu,
incroyable. Oui, tout à fait.
Voilà. Après, je voudrais revenir sur l'idée du data center. Parce que ça fait partie, je crois, de ces termes un peu fantasmatiques. Aujourd'hui, on utilise des data centers pour gérer deux activités. La première, c'est celle qui est dans le nom data center, c'est de gérer de la donnée et gérer du stockage de données. Donc, ce sont des endroits dans lesquels on a des quantités très importantes de disques durs et de machines qui vont gérer tout ça. Le deuxième usage, c'est pour faire du calcul. Et donc, historiquement, on en fait peu. Des gens qui font ce qu'on appelle du HPC, du iPower Computing, pour faire de la simulation numérique et tout. Historiquement, on en utilise relativement peu, mais il y en a quelques-uns en France qui sont significatifs. C'est ceux qu'on utilise, par exemple, pour simuler à une époque. On en a parlé beaucoup. On parlait de simulation des bombes atomiques. Plutôt que d'aller les faire péter directement dans le Pacifique, et bien On a créé des modèles, on fait de la simulation. C'est extrêmement gourmand en calcul, mais il y a un tas d'autres choses qui sont gourmandes en calcul. Mais jusqu'à très récemment, quand on parlait de data center, on parlait surtout de stockage de données et un peu plus de calcul. Aujourd'hui, le stockage de données consomme relativement peu d'énergie. Alors que le calcul haute performance consomme beaucoup d'énergie. Je vais te donner un indicateur, par exemple, tout à l'heure. Il consomme beaucoup plus d'énergie et donc il va générer beaucoup plus de chaleur. Donc ça peut être un vrai problème, mais à quoi c'est imputable ça aujourd'hui ? C'est imputable, tout le monde le sait, à la croissance des systèmes d'intelligence artificielle qui font qu'on a besoin de faire de plus en plus de calculs. Or on a besoin de faire du calcul pour deux choses. Le premier c'est l'entraînement. Tout le monde a entendu dire que pour faire un modèle, un grand modèle de langage, comme ceux qui sont utilisés chez le GPT Mistral Cloud pour prendre ce dont on parle tous les jours à la radio, ça demande des capacités de calcul gigantesques, donc des quantités d'énergie gigantesques, et puis des processeurs en nombre gigantesques, et ainsi de suite. Mais une fois que ton modèle existe, ça ne demande plus cette énergie. Une fois que ton modèle existe, tu vas pouvoir l'utiliser. Quand tu fais une requête sur chaque GPT, ce n'est pas du tout la même. Tu vas utiliser le modèle qui a été créé lors de sa phase d'apprentissage.
Ça dépense beaucoup moins que de l'entraîner, c'est ça que tu veux dire ?
Exactement, c'est ce qu'on appelle l'inférence. Et donc l'inférence, ça consomme... beaucoup moins, mais on entend encore, on va dire, tiens, tu vois, une requête achat de GPT, c'est l'équivalent de 10 requêtes à Google ou quelque chose comme ça. Ce sont des métriques qui n'ont aucun sens. Je ne cherche pas du tout à dire que ça ne consomme pas beaucoup d'énergie, entendons-nous bien. Je dis que ces comparaisons n'ont absolument aucun sens, puisque une requête achat de GPT, ça peut demander des quantités de calcul qui varie très facilement d'un autre... de l'ordre de 1 à 10, 50, 100. Donc tu vois, tu ne peux pas dire une requête égale X requête, ça, ça ne marche pas.
Ça dépend de ta question, j'imagine. Si tu lui demandes quelle heure il est à Moscou, c'est une petite requête. Et si tu lui demandes de te raconter l'histoire du pape ou des moteurs hybrides, ça va être plus compliqué.
Exactement, parce qu'en vrai, comment ça se passe au niveau du modèle, c'est que comment on utilise un modèle ? On utilise un modèle en lui envoyant un paquet de textes. On pourra un jour, aujourd'hui on n'aura pas le temps, mais on pourra revenir un jour là-dessus si tu veux. On envoie au LLM, au grand modèle de langage, on lui envoie un bloc de texte et puis il nous renvoie un bloc de texte. mais il faut bien comprendre que le bloc de texte ça n'est pas la question que tu as posée si tu dis quelle heure est-il à Mouscon c'est pas ça, il va y avoir plein d'autres informations dans le bloc de texte, il va y avoir ce qu'on appelle le système prône qui va être toutes les directives que l'on va donner pour que ton assistant fasse son travail et puis il va y avoir également la question que tu poses Merci. Mais imagine, si ce n'est pas une question que tu as posée, mais si c'est un échange que vous avez eu, il va y avoir l'intégralité de l'échange, très certainement. Donc tu vois bien que le volume va changer, ces volumes vont être très différents les uns des autres. Et puis, en plus, en fonction de ta demande, si tu dis quel temps fait-il à Moscou, par exemple, le modèle de langage, lui, il n'a aucune idée. du temps qu'il fait à Moscou. Mais par contre, il a accès à ce qu'on appelle des tools, des outils qui font que quand tu vas envoyer cette demande-là, lui, il va exécuter, il va aller appeler une fonction qui, par exemple, va aller chercher la météo à Moscou, et puis il va réinjecter le résultat dans le LLM de manière à fabriquer ta réponse. Ce qui fait que dans l'exemple que tu viens de donner, on n'a pas un aller-retour, mais on a au minimum deux allers-retours. Et dans la pratique, on a très souvent 4, 5, 10, 20 allers-retours. C'est-à-dire que ce qui pourrait sembler être une demande, en vrai, ce n'est pas une demande, c'est 20 demandes. Tu me suis, Guillaume ?
Oui, je te suis complètement.
Voilà. Et donc, aujourd'hui, quand on parle d'inférence, on donne des métriques qui souvent sont fausses, mais il est certain que... comme l'adoption, les usages de l'IA augmentent de façon très importante, la consommation augmente de façon très importante, de façon absolument gigantesque. Sauf qu'il faut être également conscient que ces choses-là sont en train d'évoluer très vite et qu'on commence à voir arriver des processeurs qui sont optimisés pour faire de l'inférence.
J'allais y venir. de poser une question bête, mais je te la poserai après parce que je crois que tu vas répondre à ma question avant que je te la pose.
Et qui vont consommer beaucoup moins. Et entendons-nous bien, ce n'est pas du technosolutionnisme que je fais. C'est juste une certaine lucidité. Et puis, posons-nous la question du comment peut-on effectivement optimiser ces choses-là. Elles vont se faire de toute façon puisque puisqu'il va falloir réduire le prix de ce type de transactions au fur et à mesure où elles augmentent, puisque toi, quand tu poses une question, tu veux avoir une réponse, mais ta réponse, tu ne veux pas la payer 10 euros. Donc, il va falloir réduire le coût, et comme le coût de l'énergie est à peu près stable, même si sur votre facture, vous voyez bouger, je veux dire que ça ne s'arrive pas dans des facteurs de 1 à 100, alors que l'efficacité du matériel qu'on peut avoir derrière... peut facilement varier de 1 à 100, comme l'efficacité des modèles, puisqu'on voit aujourd'hui des modèles qui sont pensés pour être moins consommateurs que d'autres. Donc, ces choses-là vont évoluer. Donc, je ne suis pas forcément optimiste sur la quantité totale d'énergie consommée, mais pour répondre à ta question sur Quid d'un data center, on peut être aujourd'hui à peu près certain que... Que l'inférent, premièrement que l'entraînement va consommer de moins en moins. Aujourd'hui ça consomme beaucoup parce que chacun veut son modèle. Il y a plein de gens qui font des modèles et je me demande pourquoi parce que très souvent ils fabriquent des modèles qui sont pourris par rapport à ce qui existe. En tout cas aujourd'hui il y aura une centaine d'acteurs qui fabriquent des modèles. Demain j'imagine qu'il y en aura beaucoup moins puis qu'on arrivera également à un plafonnement du modèle qui fait qu'on n'aura plus besoin d'en fabriquer autant. En tout cas, le modèle, une fois qu'il est fait, on n'a plus besoin du datacenter qui a servi pour le produire. Et pour l'inférence, on va avoir de plus en plus d'inférences dites on-edge, c'est-à-dire d'inférences qui ne seront plus faites dans des datacenters, mais qui seront faites sur des processeurs spécialisés qui seront soit sur ton ordinateur, dans ton téléphone ou peut-être même dans tes oreillettes.
Oui, donc tu en arrivais là et donc tu n'as pas vraiment répondu à la question que je ne t'ai pas encore posée. Donc ça tombe bien. Mais je sens que tu y allais. Je pense qu'aussi, l'avenir, ça va être des processeurs, dont tu venais de parler à l'instant, qui seront plus puissants et qui seront en local dans nos machines pour permettre que, quand tu poses à ta machine une question à la con, comme mon glouglou, quand je lui demande quelle heure est-il ou que je lui demande d'allumer la lumière, il n'est pas besoin d'aller faire travailler un data center, mais qu'en local, il puisse répondre à ma question. pour faire ce genre de choses ou même peut-être d'autres ?
Absolument, c'est ce que je décrivais à l'instant. Et puis en utilisant des modèles qui sont… Je vais te donner un exemple. On voit, je te l'ai dit tout à l'heure, qu'il y a plein d'entreprises qui sortent des modèles. Et d'ailleurs, on peut se demander comment le marché du capital… n'évolue pas plus vite parce que ce qu'on nous décrit coûter des milliards de l'autre côté de l'océan Atlantique, on voit par exemple, toujours dans le cadre d'une guerre économique qui alimente souvent nos débats, on voit les Chinois qui sont en train de proposer gratuitement des modèles qui coûtent des milliards à fabriquer. On voit bien en quoi ce sont des armes absolument dingues pour l'économie. Mais si on parle d'écologie et si on parle de chiffres, aujourd'hui, on trouve des modèles chinois open source, que tu peux installer chez toi et que tu peux faire tourner chez toi, qui ont une puissance qui est équivalente à celle d'un chat de GPT d'il y a un an. Et pour te donner des chiffres... La taille de ces modèles, c'est environ 1 Teraoctet. Donc, c'est l'équivalent de votre disque dur si vous avez un PC à peu près récent. Et la puissance de calcul qui est nécessaire pour faire tourner ça, elle est de l'ordre de, je ne sais pas, compter quelque chose entre 5 et 10 GPU de dernière génération. Ce qui veut dire que si vous devez payer ça, la facture va être de l'ordre de 500 000 euros. Donc, tu peux installer chez toi un gros PC qui va te coûter environ 500 000 euros et qui te rend totalement indépendant de M. Anthropique, de M. Mistral, de M. OpenAI, etc. Donc, tu vas me dire, c'est très cher. Oui, c'est très cher, mais si tu regardes l'évolution d'une façon générale de l'informatique, Un truc qui... Et aujourd'hui, parce qu'il est fait en très peu d'exemplaires et parce qu'il y a une tension sur le marché et coûte 500 000 euros, la probabilité pour qu'il coûte moins de 5 000 euros dans les 24 mois, elle est très haute, en vrai. Très, très haute. Subsiste la consommation électrique. Donc, on peut imaginer que quand sera disponible un truc 10 fois moins cher, il consommera moins d'électricité. Mais imagine ton bidule à 500 000 euros qui te permet de dépendre de personne aujourd'hui. Il va consommer. Quelque chose comme 5 kW. Donc 5 kW, c'est 3 radiateurs électriques. Donc tu vas me dire, c'est beaucoup pour un ordinateur. Mais dans l'absolu, la consommation électrique, elle n'est pas gigantesque. Parce que quand il va faire ça, pour faire ça, il va pouvoir alimenter les usages IA de quelques dizaines, voire centaines d'utilisateurs. c'est-à-dire que si tu... Si tu rapportes ça à l'utilisateur, c'est pas gigantesque. 5 kW aujourd'hui, c'est 10 fois moins que la consommation d'une voiture.
D'accord, là tu me parles de gros bidules qui, en local, pour des professionnels, pourraient faire tourner des IA d'entreprise. Et pour les petits bidules comme nos téléphones dans nos poches,
tu es d'accord ? Je vais te parler des petits bidules, mais imagine, le gros bidule que je voudrais bien insister, la consommation du système qui va gérer l'inférence, donc aujourd'hui qui permet de répondre aux besoins de quelques dizaines, centaines de personnes par rapport aux usages actuels, la consommation en électricité du truc est l'équivalent d'un dixième d'une voiture qui tourne. Donc tu vois, il faut remettre les choses. Je ne dis pas qu'il ne faut pas devenir frugal, je ne dis pas du tout ça, mais je dis que Merci. Quand les gens disent « Ah, mais tu te rends compte, la consommation énergétique de ce machin est absolument gigantesque » , elle est absolument gigantesque parce que comme les data centers mettent au même endroit toutes ces capacités de calcul, effectivement, c'est beaucoup, mais la consommation individuelle d'un de ces systèmes, pas d'un de ces data centers, d'une de ces machines d'inférence, c'est dix fois moins que la voiture que tu utilises. peut-être pour aller chercher ta reguette le matin. Donc, si vraiment on veut parler d'optimisation de l'énergie, à nouveau, soyons très attentifs à mettre des chiffres, des vrais chiffres, pour de façon à ne pas être dans le fantasme et dans le slogan, mais à être sur des vraies évaluations. Et donc, c'est pas beaucoup. Si vraiment on veut être économe en énergie, Arrêtons de rouler dans des voitures thermiques, et là c'est sûr, ou en tout cas réservons l'usage des voitures thermiques pour des trajets qui ne peuvent pas se faire autrement, et prendre une voiture pour aller chercher sa baguette de pain qu'on pourrait aller chercher en vélo, ça, il est démontré aujourd'hui que c'est la plus grosse consommation énergétique, et qui plus est, c'est le plus gros système émetteur de carbone oxydé, et qui plus est, c'est le plus gros système émetteur de particules fines. Il y a peut-être des gens... Parmi ceux qui nous écoutent, qui ne sont pas d'accord avec nous, eh bien, qui nous appelle, et puis on alignera et on comparera nos chiffres, ce sera avec grand plaisir. Maintenant, pour revenir sur les petits... Ah tiens,
j'en profite, 01-76-21-18-10, si vous n'êtes pas d'accord, ou alors contacte-lepodcast.com, notez-le dans un coin sur vos tablettes.
Hop, on finit avec les petits bidules qu'on aura dans les oreilles. Donc, c'est difficile d'évaluer ces choses à toi. Je trouve ça intéressant de donner les chiffres des trucs d'aujourd'hui parce qu'ils sont intéressants et parce qu'on est sûr de ça. Qu'est-ce que ça va devenir ? Ça va dépendre beaucoup des usages. Et donc, si tu veux, ma croyance, jusqu'à maintenant, je donnais des chiffres, j'étais prêt à débattre des chiffres. Maintenant, ma croyance, ce ne sont plus des chiffres, c'est dans ma petite tête, pas moi. Je pense que la consommation énergétique de ces... petites bidules va devenir toute petite, en tout cas absolument ridicule par rapport à l'énergie qu'on gâche sur d'autres choses et que si on a vraiment des sujets qui doivent nous interpeller, c'est par exemple l'utilisation des métaux qui sont utilisés pour faire ces petites bidules parce que les métaux qui sont utilisés, on est sur ce qu'on appelle des usages dispersifs ici, c'est-à-dire des usages qui sont en quantité tellement petite que ça ne vaut pas le coup d'aller rechercher le métal. Tu vois, ta voiture, aller rechercher l'acier de ta voiture, c'est super intéressant parce qu'on va aller retrouver une tonne d'acier à l'état quasiment pur. On va juste le cuire et puis ça marchera. Alors que pour aller rechercher... L'or ou l'étain qui traîne dans tes Airpods, c'est beaucoup plus difficile. Et surtout, les usages sont tellement dispersifs qu'on va dépenser plus d'énergie et de matière pour aller les chercher que ce qu'on va les récupérer. Pas dans tous les cas, mais dans un certain nombre de cas. Donc, si vraiment on veut penser des choses de façon durable, imaginons des appareils électriques qui sont bien pensés, qui sont modularisés, qui sont durables. et qui font qu'on n'en change pas tous les trois mois.
Qui sont réparables aussi plus facilement. Pour terminer la boucle de nos petits appareils qu'on a dans la poche, tu es assez d'accord avec moi, je pense, pour dire que toutes les commandes qu'on va leur faire, on parle souvent des téléphones agentiques qui vont arriver quand je vais demander à mon téléphone de me supprimer des mails, quand je vais demander à mon téléphone de me mettre telle radio, quand je vais lui demander de me mettre Ami le podcast. ça, ça va pouvoir se faire en local et il n'aura plus besoin d'interroger un data center.
Mais ça, ça se fait déjà en local. Oui,
mais ça va se faire de plus en plus, ça va être dans l'air du temps.
Oui, mais c'est, voilà, on a tous fréquenté des engins qui savaient déjà faire ça et ça ne consomme absolument rien du tout. Mais ça, ce n'est pas de l'intelligence, ça, c'est ce qu'on appelle du contrôle-commande. Le niveau d'intelligence est très, très faible. Donc oui, bien entendu, ça se fait, ça fait 30 ans qu'on a des bidules qui fonctionnent. plus ou moins bien, mais assez bien. Donc certes, ils fonctionnent de mieux en mieux. Est-ce qu'il faut aller sur le réseau pour les faire fonctionner ? Bien entendu non, ça n'a pas de sens.
Bon, et une dernière petite question avant qu'on se quitte, parce que là, je n'ai pas du tout la réponse. Samsung avait fait un truc que j'avais trouvé absolument génial. Je ne sais pas s'il n'y a qu'eux qui l'ont fait, mais c'est sur certaines télécommandes de télévision, des petits panneaux solaires, pour que quand tu retournes ta télécommande et que tu la poses sur ta table, elle se recharge pendant la journée le temps que tu ne l'utilises pas. Et ma question toute bête, c'est pourquoi personne n'a fait ça sur le dos d'un téléphone portable ? Parce que ça pourrait être sympa pour le recharger, ou le recharger partiellement, mais ça pourrait être aussi une source d'économie.
Donc, clairement non. On en avait parlé il y a quelques années. Pour les voitures. Exactement, tu te souviens ? Pour les mêmes raisons. C'est que la surface... L'énergie maximum que tu peux capter, elle est... Comment dirais-je ? Quand tu as un panneau solaire, l'énergie maximum que tu peux capter, c'est l'énergie du soleil que tu vas recevoir sur cette surface. Tu es d'accord avec moi ?
Tout à fait. Du soleil ou de la luminosité ? Parce que les télécommandes de Samsung, elles sont censées se charger même avec la lumière de ton plafond ou avec la lumière qui rentre par la fenêtre.
Mais non ! Non, la lumière de mon plafond et celle qui rentre par la fenêtre, ce n'est pas la même. Parce que celle de mon plafond, aujourd'hui, elle est émise par une LED. Et donc la LED, elle est justement optimisée pour faire le maximum d'énergie avec très peu d'énergie. Le même maximum de lumière avec très peu d'énergie. Elle a un très très bon rendement, c'est pour ça qu'elle ne chauffe pas, par exemple. C'est-à-dire que pour te donner une idée aujourd'hui, tu dois utiliser des LED qui... vont te donner, qui vont produire, imagine, sur 180 degrés, sur une hémisphère, qui vont produire quelque chose, qui vont consommer quelque chose comme 5 watts, si en face de ça, tu as quelque chose qui fait 10 centimètres carrés et que tu es à 2 mètres de la source d'émission, donc je n'ai pas fait le calcul, mais tu dois être à quelque chose du genre 5 milliwatts, C'est-à-dire qu'en imaginant que tu captes ça maximum 5 milliwatts, et donc ton téléphone, la consommation de ton téléphone aujourd'hui, elle doit être elle-même de l'ordre de 5 watts quand il ne fait plus rien. Donc, ce qui veut dire que pour utiliser ton téléphone pendant une heure, il faudrait que tu le laisses 1000 heures sous ta LED.
Oui, évidemment.
D'accord, mais attention parce que je t'ai parlé...
Ça va évoluer un jour ça je pense.
Le soleil c'est différent. Le soleil c'est différent si t'es en plein soleil. Tu auras beaucoup plus d'énergie, mais premièrement, tu n'auras pas suffisamment d'énergie de toute façon pour charger ton téléphone de façon... Et puis ton téléphone, il est dans ta poche ou il est chez toi quand tu es chez toi. Pardon. La quantité maximum d'énergie solaire qui rentre chez toi, c'est la taille de tes vitres. Elle est définie par les tailles de tes vitres. Donc, quand tu as ta fenêtre et puis tu es à 10 mètres de ta vitre, tu es dans ta cuisine, eh bien... Toi, tu y vois bien parce que ton œil est quelque chose de très efficace, mais la quantité d'énergie solaire qui arrive, elle est absolument ridicule. Donc, sur le principe, est-ce qu'on peut tirer de l'énergie ? Oui. Est-ce qu'on peut tirer une quantité d'énergie qui pourrait être utilisée, même très marginalement, pour recharger le téléphone ? C'est un piège à Google.
Oui, et puis en plus, on se dit, allez ! Je vais poser mon téléphone dehors sur la table, il sera en plein soleil. Il risque de ne pas aimer parce qu'il va chauffer. Et quand il est en plein soleil, il n'aime pas.
Absolument. Et de toute façon, la quantité d'énergie électrique que tu capteras sera absolument, même dans ces conditions absolument ridicules par rapport à la consommation de ton téléphone.
Bon, écoute, c'est parfait. On va s'arrêter là-dessus. C'était clair, net et précis. Donc, mon cher Bruno, toi qui vas faire le montage de cette émission, ne reste pas en plein soleil. Ça ne va pas te charger les neurones. De toute façon, ils vont déjà très bien comme ça. Et je te remercie d'avance. Mon cher Franck, je te remercie aussi. C'est toujours un plaisir de décrypter ces merveilles technologiques qui nous entourent. Et donc, c'est toujours un plaisir. Donc, ce sera un plaisir de te retrouver bientôt. 01 76 21 18 10. Ça, c'est pour vos commentaires audio avec la belle voix que vous avez ou que vous n'avez pas. Mais on vous diffusera. Et si vous voulez venir enregistrer... des podcasts avec nous sur des sujets qui vous passionnent, et bien appelez-nous. Alors si vous êtes timide de la voix, désormais contacte-ami-le-podcast.com contacte-ami-le-podcast.com Mon cher Franck, je retourne à ma bouteille d'eau, je te remercie mille fois et je te dis à bientôt pour de nouvelles aventures !
Amis, le podcast, 01 76 21 18 10, si vous voulez commenter l'Infotech.
Share
Embed
You may also like
Description
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Transcription
Générique Générique Générique Ami, le podcast tech Guillaume Richardot, Franck Lefebvre
Générique Générique
Oh, quel joli son et voici une cloche reposée mais une cloche qui a chaud quand même Non mon cher Franck, tu n'es pas une cloche c'est ta cloche personnelle dont je parle, vas-tu bien ?
Super Guillaume effectivement, la cloche a chaud mais ce n'est pas la seule actuellement à avoir chaud en France Merci.
Bon, ben écoute, en tous les cas, je salue ta cloche qui a chaud, et puis tu reviens de vacances, donc tu es tout frais, et moi je salue au passage notre ami Bruno, qui fait avec talent les montages de nos podcasts, parce que lui aussi doit avoir chaud. Bienvenue donc dans Ami le podcast, et j'ai ma copine à côté de moi, dont je ne peux pas me débarrasser en ce moment, c'est, si vous l'entendez, ma petite bouteille d'eau. Très importante, la bouteille d'eau. Alors justement, tiens, aujourd'hui, j'ai envie de parler d'eau, figure-toi. J'ai envie de parler d'eau et de technologie, bien sûr, parce que j'ai souvent entendu à la radio, dans des émissions qui ne sont pas toujours précises, que les data centers volaient de l'eau. C'est-à-dire que dans certaines régions, quand il y a un data center pas loin, du coup, les habitants du coin ont moins d'eau. Et je me posais une question, pourquoi ? Parce qu'on se doute bien que l'eau, elle refroidit les data centers. Elle est utilisée pour ça. Mais après, une fois qu'elle la refroidit, elle peut repartir dans des tuyaux et être recyclée ou réutilisée. Non, je me trompe. Donc, je voulais parler de chaleur et de data center.
Je crois que tu ne te trompes pas. Je suis sûr que tu ne te trompes pas. D'autant plus que... La notion de consommation d'eau, puis on reviendra après sur les data centers. La notion de consommation d'eau, elle est très relative, puisqu'il y a trois façons de consommer de l'eau. Il y a une façon qui est de la salir. Donc, normalement, il y a des stations d'épuration qui viennent derrière, mais il y a des coûts énergétiques et environnement qui peuvent être importants. Et puis, parfois, on salit l'eau d'une façon qui fait que... qu'elle est très difficilement nettoyable. On connaît par exemple les résidus médicamenteux qu'il peut y avoir dans nos urines et donc qu'on retrouve dans l'eau. La deuxième façon d'abîmer de l'eau, c'est de l'évaporer. Et donc effectivement, l'eau qu'on a évaporée, elle ne va pas être disponible au niveau où elle a été captée. Bien entendu, on connaît tous le cycle de l'eau, on sait qu'elle va revenir sur Terre. mais elle n'est plus disponible à l'endroit où on se trouve. Et puis, la dernière façon, c'est de la réchauffer. Et quand on la réchauffe, elle est moins disponible. Et puis surtout, sa capacité à refroidir quelque chose est bien moindre. Donc, c'est pour ça que... C'est pour ça, par exemple, qu'il y a certains scénarios qui peuvent être assez inquiétants avec des centrales nucléaires, puisque le problème est exactement le même pour les centrales nucléaires, et des centrales nucléaires qui risqueraient à un moment de se trouver à proximité d'un cours d'eau qui assure le rafraîchissement et sur lequel on peut soit manquer d'eau, soit avoir de l'eau qui serait trop chaude, puisque ce qui est intéressant, c'est le gradient de température. La différence, c'est... entre la température de l'eau que l'on prend et la température de l'eau que l'on rejette. Et bien entendu, comme ce qu'on veut, c'est la réchauffer, plus elle est chaude dans l'entrée, moins on va pouvoir l'utiliser pour refroidir. Donc, si je reviens sur nos data centers, ça vaut le coup de dire que les data centers n'élaborent pas d'eau, que les data centers ne salissent pas l'eau, mais que les data centers peuvent réchauffer de l'eau, ce qui peut effectivement poser un problème. Je ne suis pas un super spécialiste de ça, donc j'entends par là que je ne pourrais pas donner des chiffres très précis. Mais je pense que souvent les arguments qui sont apportés par les personnes sur ces sujets-là sont très orientés et sont souvent très peu documentés. C'est-à-dire que si demain tu peux inviter à notre micro quelqu'un qui nous parle réellement avec des chiffres, de dire voilà quel est... Quel est l'impact réel sur l'eau ? Et par exemple, est-ce que l'eau qui aujourd'hui est utilisée pour arroser nos maïs, est-ce que les maïs consomment moins d'eau que les data centers ? Et est-ce que l'eau qui a été réchauffée par les data centers ne peut pas être utilisée pour arroser les maïs ? Là, je pense qu'on arrive à des sujets vraiment intéressants.
Bon alors, justement, je fais une petite... Si vous êtes spécialiste, que vous y connaissez vraiment bien en data center et en refroidissement des data centers, rentrez en contact avec nous, contact.ami.podcast.com ou alors le 01 76 21 18 10 et on se fera un plaisir d'enregistrer un podcast avec vous sur ce sujet qui est passionnant et grandement d'actualité.
Tout à fait, tout à fait. Maintenant, pour aller un tout petit peu plus loin sur le sujet avec les connaissances qu'on a, là, comme il fait chaud et on se dit, ah ben là, réchauffer de l'eau, c'est un problème, il ne faut pas oublier que nous sommes dans des régions tempérées dans lesquelles l'hiver est plus froid, et qu'aujourd'hui, on utilise une partie très importante de l'énergie que l'on consomme, et de l'énergie fossile, on utilise beaucoup de gaz, encore un peu de fuel, on utilise beaucoup de gaz. pour réchauffer des maisons l'hiver. Ce qui est objectivement complètement incroyable, parce que quand on brûle du gaz pour réchauffer une maison, ça veut dire qu'on va avoir produit de la chaleur, mais sans produire aucun travail autre. Tu vois, quand tu as un moteur à explosion, par exemple, ton moteur à explosion, il va produire de la chaleur, parce que c'est une machine thermodynamique, donc il va produire de la chaleur, il va produire de la chaleur qui va être directement associée à un travail. Donc on peut se dire que même si c'est pas terrible, au moins on a, quand on crame notre énergie, on a du travail, donc le moteur tourne et puis on traîne quelque chose, et puis on a de la chaleur, puis l'idéal cette chaleur, c'est peut-être de l'utiliser pour réchauffer les bâtiments, puisque sinon brûler du gaz sans travail pour avoir de la chaleur, exclusivement de la chaleur, c'est complètement délirant, t'es d'accord avec moi ?
Donc on pourrait mettre des petits data centers à côté de chaque maison pour les réchauffer en hiver, mais on était évidemment moins probants.
C'est vrai, c'est vrai. Sauf que ça fait partie, à une époque, il y a même des gens qui ont eu une offre comme ça. Ils proposaient des PC qui étaient intégrés, des systèmes de calcul. Dans des radiateurs. Exactement. Oui, j'avais vu,
incroyable. Oui, tout à fait.
Voilà. Après, je voudrais revenir sur l'idée du data center. Parce que ça fait partie, je crois, de ces termes un peu fantasmatiques. Aujourd'hui, on utilise des data centers pour gérer deux activités. La première, c'est celle qui est dans le nom data center, c'est de gérer de la donnée et gérer du stockage de données. Donc, ce sont des endroits dans lesquels on a des quantités très importantes de disques durs et de machines qui vont gérer tout ça. Le deuxième usage, c'est pour faire du calcul. Et donc, historiquement, on en fait peu. Des gens qui font ce qu'on appelle du HPC, du iPower Computing, pour faire de la simulation numérique et tout. Historiquement, on en utilise relativement peu, mais il y en a quelques-uns en France qui sont significatifs. C'est ceux qu'on utilise, par exemple, pour simuler à une époque. On en a parlé beaucoup. On parlait de simulation des bombes atomiques. Plutôt que d'aller les faire péter directement dans le Pacifique, et bien On a créé des modèles, on fait de la simulation. C'est extrêmement gourmand en calcul, mais il y a un tas d'autres choses qui sont gourmandes en calcul. Mais jusqu'à très récemment, quand on parlait de data center, on parlait surtout de stockage de données et un peu plus de calcul. Aujourd'hui, le stockage de données consomme relativement peu d'énergie. Alors que le calcul haute performance consomme beaucoup d'énergie. Je vais te donner un indicateur, par exemple, tout à l'heure. Il consomme beaucoup plus d'énergie et donc il va générer beaucoup plus de chaleur. Donc ça peut être un vrai problème, mais à quoi c'est imputable ça aujourd'hui ? C'est imputable, tout le monde le sait, à la croissance des systèmes d'intelligence artificielle qui font qu'on a besoin de faire de plus en plus de calculs. Or on a besoin de faire du calcul pour deux choses. Le premier c'est l'entraînement. Tout le monde a entendu dire que pour faire un modèle, un grand modèle de langage, comme ceux qui sont utilisés chez le GPT Mistral Cloud pour prendre ce dont on parle tous les jours à la radio, ça demande des capacités de calcul gigantesques, donc des quantités d'énergie gigantesques, et puis des processeurs en nombre gigantesques, et ainsi de suite. Mais une fois que ton modèle existe, ça ne demande plus cette énergie. Une fois que ton modèle existe, tu vas pouvoir l'utiliser. Quand tu fais une requête sur chaque GPT, ce n'est pas du tout la même. Tu vas utiliser le modèle qui a été créé lors de sa phase d'apprentissage.
Ça dépense beaucoup moins que de l'entraîner, c'est ça que tu veux dire ?
Exactement, c'est ce qu'on appelle l'inférence. Et donc l'inférence, ça consomme... beaucoup moins, mais on entend encore, on va dire, tiens, tu vois, une requête achat de GPT, c'est l'équivalent de 10 requêtes à Google ou quelque chose comme ça. Ce sont des métriques qui n'ont aucun sens. Je ne cherche pas du tout à dire que ça ne consomme pas beaucoup d'énergie, entendons-nous bien. Je dis que ces comparaisons n'ont absolument aucun sens, puisque une requête achat de GPT, ça peut demander des quantités de calcul qui varie très facilement d'un autre... de l'ordre de 1 à 10, 50, 100. Donc tu vois, tu ne peux pas dire une requête égale X requête, ça, ça ne marche pas.
Ça dépend de ta question, j'imagine. Si tu lui demandes quelle heure il est à Moscou, c'est une petite requête. Et si tu lui demandes de te raconter l'histoire du pape ou des moteurs hybrides, ça va être plus compliqué.
Exactement, parce qu'en vrai, comment ça se passe au niveau du modèle, c'est que comment on utilise un modèle ? On utilise un modèle en lui envoyant un paquet de textes. On pourra un jour, aujourd'hui on n'aura pas le temps, mais on pourra revenir un jour là-dessus si tu veux. On envoie au LLM, au grand modèle de langage, on lui envoie un bloc de texte et puis il nous renvoie un bloc de texte. mais il faut bien comprendre que le bloc de texte ça n'est pas la question que tu as posée si tu dis quelle heure est-il à Mouscon c'est pas ça, il va y avoir plein d'autres informations dans le bloc de texte, il va y avoir ce qu'on appelle le système prône qui va être toutes les directives que l'on va donner pour que ton assistant fasse son travail et puis il va y avoir également la question que tu poses Merci. Mais imagine, si ce n'est pas une question que tu as posée, mais si c'est un échange que vous avez eu, il va y avoir l'intégralité de l'échange, très certainement. Donc tu vois bien que le volume va changer, ces volumes vont être très différents les uns des autres. Et puis, en plus, en fonction de ta demande, si tu dis quel temps fait-il à Moscou, par exemple, le modèle de langage, lui, il n'a aucune idée. du temps qu'il fait à Moscou. Mais par contre, il a accès à ce qu'on appelle des tools, des outils qui font que quand tu vas envoyer cette demande-là, lui, il va exécuter, il va aller appeler une fonction qui, par exemple, va aller chercher la météo à Moscou, et puis il va réinjecter le résultat dans le LLM de manière à fabriquer ta réponse. Ce qui fait que dans l'exemple que tu viens de donner, on n'a pas un aller-retour, mais on a au minimum deux allers-retours. Et dans la pratique, on a très souvent 4, 5, 10, 20 allers-retours. C'est-à-dire que ce qui pourrait sembler être une demande, en vrai, ce n'est pas une demande, c'est 20 demandes. Tu me suis, Guillaume ?
Oui, je te suis complètement.
Voilà. Et donc, aujourd'hui, quand on parle d'inférence, on donne des métriques qui souvent sont fausses, mais il est certain que... comme l'adoption, les usages de l'IA augmentent de façon très importante, la consommation augmente de façon très importante, de façon absolument gigantesque. Sauf qu'il faut être également conscient que ces choses-là sont en train d'évoluer très vite et qu'on commence à voir arriver des processeurs qui sont optimisés pour faire de l'inférence.
J'allais y venir. de poser une question bête, mais je te la poserai après parce que je crois que tu vas répondre à ma question avant que je te la pose.
Et qui vont consommer beaucoup moins. Et entendons-nous bien, ce n'est pas du technosolutionnisme que je fais. C'est juste une certaine lucidité. Et puis, posons-nous la question du comment peut-on effectivement optimiser ces choses-là. Elles vont se faire de toute façon puisque puisqu'il va falloir réduire le prix de ce type de transactions au fur et à mesure où elles augmentent, puisque toi, quand tu poses une question, tu veux avoir une réponse, mais ta réponse, tu ne veux pas la payer 10 euros. Donc, il va falloir réduire le coût, et comme le coût de l'énergie est à peu près stable, même si sur votre facture, vous voyez bouger, je veux dire que ça ne s'arrive pas dans des facteurs de 1 à 100, alors que l'efficacité du matériel qu'on peut avoir derrière... peut facilement varier de 1 à 100, comme l'efficacité des modèles, puisqu'on voit aujourd'hui des modèles qui sont pensés pour être moins consommateurs que d'autres. Donc, ces choses-là vont évoluer. Donc, je ne suis pas forcément optimiste sur la quantité totale d'énergie consommée, mais pour répondre à ta question sur Quid d'un data center, on peut être aujourd'hui à peu près certain que... Que l'inférent, premièrement que l'entraînement va consommer de moins en moins. Aujourd'hui ça consomme beaucoup parce que chacun veut son modèle. Il y a plein de gens qui font des modèles et je me demande pourquoi parce que très souvent ils fabriquent des modèles qui sont pourris par rapport à ce qui existe. En tout cas aujourd'hui il y aura une centaine d'acteurs qui fabriquent des modèles. Demain j'imagine qu'il y en aura beaucoup moins puis qu'on arrivera également à un plafonnement du modèle qui fait qu'on n'aura plus besoin d'en fabriquer autant. En tout cas, le modèle, une fois qu'il est fait, on n'a plus besoin du datacenter qui a servi pour le produire. Et pour l'inférence, on va avoir de plus en plus d'inférences dites on-edge, c'est-à-dire d'inférences qui ne seront plus faites dans des datacenters, mais qui seront faites sur des processeurs spécialisés qui seront soit sur ton ordinateur, dans ton téléphone ou peut-être même dans tes oreillettes.
Oui, donc tu en arrivais là et donc tu n'as pas vraiment répondu à la question que je ne t'ai pas encore posée. Donc ça tombe bien. Mais je sens que tu y allais. Je pense qu'aussi, l'avenir, ça va être des processeurs, dont tu venais de parler à l'instant, qui seront plus puissants et qui seront en local dans nos machines pour permettre que, quand tu poses à ta machine une question à la con, comme mon glouglou, quand je lui demande quelle heure est-il ou que je lui demande d'allumer la lumière, il n'est pas besoin d'aller faire travailler un data center, mais qu'en local, il puisse répondre à ma question. pour faire ce genre de choses ou même peut-être d'autres ?
Absolument, c'est ce que je décrivais à l'instant. Et puis en utilisant des modèles qui sont… Je vais te donner un exemple. On voit, je te l'ai dit tout à l'heure, qu'il y a plein d'entreprises qui sortent des modèles. Et d'ailleurs, on peut se demander comment le marché du capital… n'évolue pas plus vite parce que ce qu'on nous décrit coûter des milliards de l'autre côté de l'océan Atlantique, on voit par exemple, toujours dans le cadre d'une guerre économique qui alimente souvent nos débats, on voit les Chinois qui sont en train de proposer gratuitement des modèles qui coûtent des milliards à fabriquer. On voit bien en quoi ce sont des armes absolument dingues pour l'économie. Mais si on parle d'écologie et si on parle de chiffres, aujourd'hui, on trouve des modèles chinois open source, que tu peux installer chez toi et que tu peux faire tourner chez toi, qui ont une puissance qui est équivalente à celle d'un chat de GPT d'il y a un an. Et pour te donner des chiffres... La taille de ces modèles, c'est environ 1 Teraoctet. Donc, c'est l'équivalent de votre disque dur si vous avez un PC à peu près récent. Et la puissance de calcul qui est nécessaire pour faire tourner ça, elle est de l'ordre de, je ne sais pas, compter quelque chose entre 5 et 10 GPU de dernière génération. Ce qui veut dire que si vous devez payer ça, la facture va être de l'ordre de 500 000 euros. Donc, tu peux installer chez toi un gros PC qui va te coûter environ 500 000 euros et qui te rend totalement indépendant de M. Anthropique, de M. Mistral, de M. OpenAI, etc. Donc, tu vas me dire, c'est très cher. Oui, c'est très cher, mais si tu regardes l'évolution d'une façon générale de l'informatique, Un truc qui... Et aujourd'hui, parce qu'il est fait en très peu d'exemplaires et parce qu'il y a une tension sur le marché et coûte 500 000 euros, la probabilité pour qu'il coûte moins de 5 000 euros dans les 24 mois, elle est très haute, en vrai. Très, très haute. Subsiste la consommation électrique. Donc, on peut imaginer que quand sera disponible un truc 10 fois moins cher, il consommera moins d'électricité. Mais imagine ton bidule à 500 000 euros qui te permet de dépendre de personne aujourd'hui. Il va consommer. Quelque chose comme 5 kW. Donc 5 kW, c'est 3 radiateurs électriques. Donc tu vas me dire, c'est beaucoup pour un ordinateur. Mais dans l'absolu, la consommation électrique, elle n'est pas gigantesque. Parce que quand il va faire ça, pour faire ça, il va pouvoir alimenter les usages IA de quelques dizaines, voire centaines d'utilisateurs. c'est-à-dire que si tu... Si tu rapportes ça à l'utilisateur, c'est pas gigantesque. 5 kW aujourd'hui, c'est 10 fois moins que la consommation d'une voiture.
D'accord, là tu me parles de gros bidules qui, en local, pour des professionnels, pourraient faire tourner des IA d'entreprise. Et pour les petits bidules comme nos téléphones dans nos poches,
tu es d'accord ? Je vais te parler des petits bidules, mais imagine, le gros bidule que je voudrais bien insister, la consommation du système qui va gérer l'inférence, donc aujourd'hui qui permet de répondre aux besoins de quelques dizaines, centaines de personnes par rapport aux usages actuels, la consommation en électricité du truc est l'équivalent d'un dixième d'une voiture qui tourne. Donc tu vois, il faut remettre les choses. Je ne dis pas qu'il ne faut pas devenir frugal, je ne dis pas du tout ça, mais je dis que Merci. Quand les gens disent « Ah, mais tu te rends compte, la consommation énergétique de ce machin est absolument gigantesque » , elle est absolument gigantesque parce que comme les data centers mettent au même endroit toutes ces capacités de calcul, effectivement, c'est beaucoup, mais la consommation individuelle d'un de ces systèmes, pas d'un de ces data centers, d'une de ces machines d'inférence, c'est dix fois moins que la voiture que tu utilises. peut-être pour aller chercher ta reguette le matin. Donc, si vraiment on veut parler d'optimisation de l'énergie, à nouveau, soyons très attentifs à mettre des chiffres, des vrais chiffres, pour de façon à ne pas être dans le fantasme et dans le slogan, mais à être sur des vraies évaluations. Et donc, c'est pas beaucoup. Si vraiment on veut être économe en énergie, Arrêtons de rouler dans des voitures thermiques, et là c'est sûr, ou en tout cas réservons l'usage des voitures thermiques pour des trajets qui ne peuvent pas se faire autrement, et prendre une voiture pour aller chercher sa baguette de pain qu'on pourrait aller chercher en vélo, ça, il est démontré aujourd'hui que c'est la plus grosse consommation énergétique, et qui plus est, c'est le plus gros système émetteur de carbone oxydé, et qui plus est, c'est le plus gros système émetteur de particules fines. Il y a peut-être des gens... Parmi ceux qui nous écoutent, qui ne sont pas d'accord avec nous, eh bien, qui nous appelle, et puis on alignera et on comparera nos chiffres, ce sera avec grand plaisir. Maintenant, pour revenir sur les petits... Ah tiens,
j'en profite, 01-76-21-18-10, si vous n'êtes pas d'accord, ou alors contacte-lepodcast.com, notez-le dans un coin sur vos tablettes.
Hop, on finit avec les petits bidules qu'on aura dans les oreilles. Donc, c'est difficile d'évaluer ces choses à toi. Je trouve ça intéressant de donner les chiffres des trucs d'aujourd'hui parce qu'ils sont intéressants et parce qu'on est sûr de ça. Qu'est-ce que ça va devenir ? Ça va dépendre beaucoup des usages. Et donc, si tu veux, ma croyance, jusqu'à maintenant, je donnais des chiffres, j'étais prêt à débattre des chiffres. Maintenant, ma croyance, ce ne sont plus des chiffres, c'est dans ma petite tête, pas moi. Je pense que la consommation énergétique de ces... petites bidules va devenir toute petite, en tout cas absolument ridicule par rapport à l'énergie qu'on gâche sur d'autres choses et que si on a vraiment des sujets qui doivent nous interpeller, c'est par exemple l'utilisation des métaux qui sont utilisés pour faire ces petites bidules parce que les métaux qui sont utilisés, on est sur ce qu'on appelle des usages dispersifs ici, c'est-à-dire des usages qui sont en quantité tellement petite que ça ne vaut pas le coup d'aller rechercher le métal. Tu vois, ta voiture, aller rechercher l'acier de ta voiture, c'est super intéressant parce qu'on va aller retrouver une tonne d'acier à l'état quasiment pur. On va juste le cuire et puis ça marchera. Alors que pour aller rechercher... L'or ou l'étain qui traîne dans tes Airpods, c'est beaucoup plus difficile. Et surtout, les usages sont tellement dispersifs qu'on va dépenser plus d'énergie et de matière pour aller les chercher que ce qu'on va les récupérer. Pas dans tous les cas, mais dans un certain nombre de cas. Donc, si vraiment on veut penser des choses de façon durable, imaginons des appareils électriques qui sont bien pensés, qui sont modularisés, qui sont durables. et qui font qu'on n'en change pas tous les trois mois.
Qui sont réparables aussi plus facilement. Pour terminer la boucle de nos petits appareils qu'on a dans la poche, tu es assez d'accord avec moi, je pense, pour dire que toutes les commandes qu'on va leur faire, on parle souvent des téléphones agentiques qui vont arriver quand je vais demander à mon téléphone de me supprimer des mails, quand je vais demander à mon téléphone de me mettre telle radio, quand je vais lui demander de me mettre Ami le podcast. ça, ça va pouvoir se faire en local et il n'aura plus besoin d'interroger un data center.
Mais ça, ça se fait déjà en local. Oui,
mais ça va se faire de plus en plus, ça va être dans l'air du temps.
Oui, mais c'est, voilà, on a tous fréquenté des engins qui savaient déjà faire ça et ça ne consomme absolument rien du tout. Mais ça, ce n'est pas de l'intelligence, ça, c'est ce qu'on appelle du contrôle-commande. Le niveau d'intelligence est très, très faible. Donc oui, bien entendu, ça se fait, ça fait 30 ans qu'on a des bidules qui fonctionnent. plus ou moins bien, mais assez bien. Donc certes, ils fonctionnent de mieux en mieux. Est-ce qu'il faut aller sur le réseau pour les faire fonctionner ? Bien entendu non, ça n'a pas de sens.
Bon, et une dernière petite question avant qu'on se quitte, parce que là, je n'ai pas du tout la réponse. Samsung avait fait un truc que j'avais trouvé absolument génial. Je ne sais pas s'il n'y a qu'eux qui l'ont fait, mais c'est sur certaines télécommandes de télévision, des petits panneaux solaires, pour que quand tu retournes ta télécommande et que tu la poses sur ta table, elle se recharge pendant la journée le temps que tu ne l'utilises pas. Et ma question toute bête, c'est pourquoi personne n'a fait ça sur le dos d'un téléphone portable ? Parce que ça pourrait être sympa pour le recharger, ou le recharger partiellement, mais ça pourrait être aussi une source d'économie.
Donc, clairement non. On en avait parlé il y a quelques années. Pour les voitures. Exactement, tu te souviens ? Pour les mêmes raisons. C'est que la surface... L'énergie maximum que tu peux capter, elle est... Comment dirais-je ? Quand tu as un panneau solaire, l'énergie maximum que tu peux capter, c'est l'énergie du soleil que tu vas recevoir sur cette surface. Tu es d'accord avec moi ?
Tout à fait. Du soleil ou de la luminosité ? Parce que les télécommandes de Samsung, elles sont censées se charger même avec la lumière de ton plafond ou avec la lumière qui rentre par la fenêtre.
Mais non ! Non, la lumière de mon plafond et celle qui rentre par la fenêtre, ce n'est pas la même. Parce que celle de mon plafond, aujourd'hui, elle est émise par une LED. Et donc la LED, elle est justement optimisée pour faire le maximum d'énergie avec très peu d'énergie. Le même maximum de lumière avec très peu d'énergie. Elle a un très très bon rendement, c'est pour ça qu'elle ne chauffe pas, par exemple. C'est-à-dire que pour te donner une idée aujourd'hui, tu dois utiliser des LED qui... vont te donner, qui vont produire, imagine, sur 180 degrés, sur une hémisphère, qui vont produire quelque chose, qui vont consommer quelque chose comme 5 watts, si en face de ça, tu as quelque chose qui fait 10 centimètres carrés et que tu es à 2 mètres de la source d'émission, donc je n'ai pas fait le calcul, mais tu dois être à quelque chose du genre 5 milliwatts, C'est-à-dire qu'en imaginant que tu captes ça maximum 5 milliwatts, et donc ton téléphone, la consommation de ton téléphone aujourd'hui, elle doit être elle-même de l'ordre de 5 watts quand il ne fait plus rien. Donc, ce qui veut dire que pour utiliser ton téléphone pendant une heure, il faudrait que tu le laisses 1000 heures sous ta LED.
Oui, évidemment.
D'accord, mais attention parce que je t'ai parlé...
Ça va évoluer un jour ça je pense.
Le soleil c'est différent. Le soleil c'est différent si t'es en plein soleil. Tu auras beaucoup plus d'énergie, mais premièrement, tu n'auras pas suffisamment d'énergie de toute façon pour charger ton téléphone de façon... Et puis ton téléphone, il est dans ta poche ou il est chez toi quand tu es chez toi. Pardon. La quantité maximum d'énergie solaire qui rentre chez toi, c'est la taille de tes vitres. Elle est définie par les tailles de tes vitres. Donc, quand tu as ta fenêtre et puis tu es à 10 mètres de ta vitre, tu es dans ta cuisine, eh bien... Toi, tu y vois bien parce que ton œil est quelque chose de très efficace, mais la quantité d'énergie solaire qui arrive, elle est absolument ridicule. Donc, sur le principe, est-ce qu'on peut tirer de l'énergie ? Oui. Est-ce qu'on peut tirer une quantité d'énergie qui pourrait être utilisée, même très marginalement, pour recharger le téléphone ? C'est un piège à Google.
Oui, et puis en plus, on se dit, allez ! Je vais poser mon téléphone dehors sur la table, il sera en plein soleil. Il risque de ne pas aimer parce qu'il va chauffer. Et quand il est en plein soleil, il n'aime pas.
Absolument. Et de toute façon, la quantité d'énergie électrique que tu capteras sera absolument, même dans ces conditions absolument ridicules par rapport à la consommation de ton téléphone.
Bon, écoute, c'est parfait. On va s'arrêter là-dessus. C'était clair, net et précis. Donc, mon cher Bruno, toi qui vas faire le montage de cette émission, ne reste pas en plein soleil. Ça ne va pas te charger les neurones. De toute façon, ils vont déjà très bien comme ça. Et je te remercie d'avance. Mon cher Franck, je te remercie aussi. C'est toujours un plaisir de décrypter ces merveilles technologiques qui nous entourent. Et donc, c'est toujours un plaisir. Donc, ce sera un plaisir de te retrouver bientôt. 01 76 21 18 10. Ça, c'est pour vos commentaires audio avec la belle voix que vous avez ou que vous n'avez pas. Mais on vous diffusera. Et si vous voulez venir enregistrer... des podcasts avec nous sur des sujets qui vous passionnent, et bien appelez-nous. Alors si vous êtes timide de la voix, désormais contacte-ami-le-podcast.com contacte-ami-le-podcast.com Mon cher Franck, je retourne à ma bouteille d'eau, je te remercie mille fois et je te dis à bientôt pour de nouvelles aventures !
Amis, le podcast, 01 76 21 18 10, si vous voulez commenter l'Infotech.
Description
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
Transcription
Générique Générique Générique Ami, le podcast tech Guillaume Richardot, Franck Lefebvre
Générique Générique
Oh, quel joli son et voici une cloche reposée mais une cloche qui a chaud quand même Non mon cher Franck, tu n'es pas une cloche c'est ta cloche personnelle dont je parle, vas-tu bien ?
Super Guillaume effectivement, la cloche a chaud mais ce n'est pas la seule actuellement à avoir chaud en France Merci.
Bon, ben écoute, en tous les cas, je salue ta cloche qui a chaud, et puis tu reviens de vacances, donc tu es tout frais, et moi je salue au passage notre ami Bruno, qui fait avec talent les montages de nos podcasts, parce que lui aussi doit avoir chaud. Bienvenue donc dans Ami le podcast, et j'ai ma copine à côté de moi, dont je ne peux pas me débarrasser en ce moment, c'est, si vous l'entendez, ma petite bouteille d'eau. Très importante, la bouteille d'eau. Alors justement, tiens, aujourd'hui, j'ai envie de parler d'eau, figure-toi. J'ai envie de parler d'eau et de technologie, bien sûr, parce que j'ai souvent entendu à la radio, dans des émissions qui ne sont pas toujours précises, que les data centers volaient de l'eau. C'est-à-dire que dans certaines régions, quand il y a un data center pas loin, du coup, les habitants du coin ont moins d'eau. Et je me posais une question, pourquoi ? Parce qu'on se doute bien que l'eau, elle refroidit les data centers. Elle est utilisée pour ça. Mais après, une fois qu'elle la refroidit, elle peut repartir dans des tuyaux et être recyclée ou réutilisée. Non, je me trompe. Donc, je voulais parler de chaleur et de data center.
Je crois que tu ne te trompes pas. Je suis sûr que tu ne te trompes pas. D'autant plus que... La notion de consommation d'eau, puis on reviendra après sur les data centers. La notion de consommation d'eau, elle est très relative, puisqu'il y a trois façons de consommer de l'eau. Il y a une façon qui est de la salir. Donc, normalement, il y a des stations d'épuration qui viennent derrière, mais il y a des coûts énergétiques et environnement qui peuvent être importants. Et puis, parfois, on salit l'eau d'une façon qui fait que... qu'elle est très difficilement nettoyable. On connaît par exemple les résidus médicamenteux qu'il peut y avoir dans nos urines et donc qu'on retrouve dans l'eau. La deuxième façon d'abîmer de l'eau, c'est de l'évaporer. Et donc effectivement, l'eau qu'on a évaporée, elle ne va pas être disponible au niveau où elle a été captée. Bien entendu, on connaît tous le cycle de l'eau, on sait qu'elle va revenir sur Terre. mais elle n'est plus disponible à l'endroit où on se trouve. Et puis, la dernière façon, c'est de la réchauffer. Et quand on la réchauffe, elle est moins disponible. Et puis surtout, sa capacité à refroidir quelque chose est bien moindre. Donc, c'est pour ça que... C'est pour ça, par exemple, qu'il y a certains scénarios qui peuvent être assez inquiétants avec des centrales nucléaires, puisque le problème est exactement le même pour les centrales nucléaires, et des centrales nucléaires qui risqueraient à un moment de se trouver à proximité d'un cours d'eau qui assure le rafraîchissement et sur lequel on peut soit manquer d'eau, soit avoir de l'eau qui serait trop chaude, puisque ce qui est intéressant, c'est le gradient de température. La différence, c'est... entre la température de l'eau que l'on prend et la température de l'eau que l'on rejette. Et bien entendu, comme ce qu'on veut, c'est la réchauffer, plus elle est chaude dans l'entrée, moins on va pouvoir l'utiliser pour refroidir. Donc, si je reviens sur nos data centers, ça vaut le coup de dire que les data centers n'élaborent pas d'eau, que les data centers ne salissent pas l'eau, mais que les data centers peuvent réchauffer de l'eau, ce qui peut effectivement poser un problème. Je ne suis pas un super spécialiste de ça, donc j'entends par là que je ne pourrais pas donner des chiffres très précis. Mais je pense que souvent les arguments qui sont apportés par les personnes sur ces sujets-là sont très orientés et sont souvent très peu documentés. C'est-à-dire que si demain tu peux inviter à notre micro quelqu'un qui nous parle réellement avec des chiffres, de dire voilà quel est... Quel est l'impact réel sur l'eau ? Et par exemple, est-ce que l'eau qui aujourd'hui est utilisée pour arroser nos maïs, est-ce que les maïs consomment moins d'eau que les data centers ? Et est-ce que l'eau qui a été réchauffée par les data centers ne peut pas être utilisée pour arroser les maïs ? Là, je pense qu'on arrive à des sujets vraiment intéressants.
Bon alors, justement, je fais une petite... Si vous êtes spécialiste, que vous y connaissez vraiment bien en data center et en refroidissement des data centers, rentrez en contact avec nous, contact.ami.podcast.com ou alors le 01 76 21 18 10 et on se fera un plaisir d'enregistrer un podcast avec vous sur ce sujet qui est passionnant et grandement d'actualité.
Tout à fait, tout à fait. Maintenant, pour aller un tout petit peu plus loin sur le sujet avec les connaissances qu'on a, là, comme il fait chaud et on se dit, ah ben là, réchauffer de l'eau, c'est un problème, il ne faut pas oublier que nous sommes dans des régions tempérées dans lesquelles l'hiver est plus froid, et qu'aujourd'hui, on utilise une partie très importante de l'énergie que l'on consomme, et de l'énergie fossile, on utilise beaucoup de gaz, encore un peu de fuel, on utilise beaucoup de gaz. pour réchauffer des maisons l'hiver. Ce qui est objectivement complètement incroyable, parce que quand on brûle du gaz pour réchauffer une maison, ça veut dire qu'on va avoir produit de la chaleur, mais sans produire aucun travail autre. Tu vois, quand tu as un moteur à explosion, par exemple, ton moteur à explosion, il va produire de la chaleur, parce que c'est une machine thermodynamique, donc il va produire de la chaleur, il va produire de la chaleur qui va être directement associée à un travail. Donc on peut se dire que même si c'est pas terrible, au moins on a, quand on crame notre énergie, on a du travail, donc le moteur tourne et puis on traîne quelque chose, et puis on a de la chaleur, puis l'idéal cette chaleur, c'est peut-être de l'utiliser pour réchauffer les bâtiments, puisque sinon brûler du gaz sans travail pour avoir de la chaleur, exclusivement de la chaleur, c'est complètement délirant, t'es d'accord avec moi ?
Donc on pourrait mettre des petits data centers à côté de chaque maison pour les réchauffer en hiver, mais on était évidemment moins probants.
C'est vrai, c'est vrai. Sauf que ça fait partie, à une époque, il y a même des gens qui ont eu une offre comme ça. Ils proposaient des PC qui étaient intégrés, des systèmes de calcul. Dans des radiateurs. Exactement. Oui, j'avais vu,
incroyable. Oui, tout à fait.
Voilà. Après, je voudrais revenir sur l'idée du data center. Parce que ça fait partie, je crois, de ces termes un peu fantasmatiques. Aujourd'hui, on utilise des data centers pour gérer deux activités. La première, c'est celle qui est dans le nom data center, c'est de gérer de la donnée et gérer du stockage de données. Donc, ce sont des endroits dans lesquels on a des quantités très importantes de disques durs et de machines qui vont gérer tout ça. Le deuxième usage, c'est pour faire du calcul. Et donc, historiquement, on en fait peu. Des gens qui font ce qu'on appelle du HPC, du iPower Computing, pour faire de la simulation numérique et tout. Historiquement, on en utilise relativement peu, mais il y en a quelques-uns en France qui sont significatifs. C'est ceux qu'on utilise, par exemple, pour simuler à une époque. On en a parlé beaucoup. On parlait de simulation des bombes atomiques. Plutôt que d'aller les faire péter directement dans le Pacifique, et bien On a créé des modèles, on fait de la simulation. C'est extrêmement gourmand en calcul, mais il y a un tas d'autres choses qui sont gourmandes en calcul. Mais jusqu'à très récemment, quand on parlait de data center, on parlait surtout de stockage de données et un peu plus de calcul. Aujourd'hui, le stockage de données consomme relativement peu d'énergie. Alors que le calcul haute performance consomme beaucoup d'énergie. Je vais te donner un indicateur, par exemple, tout à l'heure. Il consomme beaucoup plus d'énergie et donc il va générer beaucoup plus de chaleur. Donc ça peut être un vrai problème, mais à quoi c'est imputable ça aujourd'hui ? C'est imputable, tout le monde le sait, à la croissance des systèmes d'intelligence artificielle qui font qu'on a besoin de faire de plus en plus de calculs. Or on a besoin de faire du calcul pour deux choses. Le premier c'est l'entraînement. Tout le monde a entendu dire que pour faire un modèle, un grand modèle de langage, comme ceux qui sont utilisés chez le GPT Mistral Cloud pour prendre ce dont on parle tous les jours à la radio, ça demande des capacités de calcul gigantesques, donc des quantités d'énergie gigantesques, et puis des processeurs en nombre gigantesques, et ainsi de suite. Mais une fois que ton modèle existe, ça ne demande plus cette énergie. Une fois que ton modèle existe, tu vas pouvoir l'utiliser. Quand tu fais une requête sur chaque GPT, ce n'est pas du tout la même. Tu vas utiliser le modèle qui a été créé lors de sa phase d'apprentissage.
Ça dépense beaucoup moins que de l'entraîner, c'est ça que tu veux dire ?
Exactement, c'est ce qu'on appelle l'inférence. Et donc l'inférence, ça consomme... beaucoup moins, mais on entend encore, on va dire, tiens, tu vois, une requête achat de GPT, c'est l'équivalent de 10 requêtes à Google ou quelque chose comme ça. Ce sont des métriques qui n'ont aucun sens. Je ne cherche pas du tout à dire que ça ne consomme pas beaucoup d'énergie, entendons-nous bien. Je dis que ces comparaisons n'ont absolument aucun sens, puisque une requête achat de GPT, ça peut demander des quantités de calcul qui varie très facilement d'un autre... de l'ordre de 1 à 10, 50, 100. Donc tu vois, tu ne peux pas dire une requête égale X requête, ça, ça ne marche pas.
Ça dépend de ta question, j'imagine. Si tu lui demandes quelle heure il est à Moscou, c'est une petite requête. Et si tu lui demandes de te raconter l'histoire du pape ou des moteurs hybrides, ça va être plus compliqué.
Exactement, parce qu'en vrai, comment ça se passe au niveau du modèle, c'est que comment on utilise un modèle ? On utilise un modèle en lui envoyant un paquet de textes. On pourra un jour, aujourd'hui on n'aura pas le temps, mais on pourra revenir un jour là-dessus si tu veux. On envoie au LLM, au grand modèle de langage, on lui envoie un bloc de texte et puis il nous renvoie un bloc de texte. mais il faut bien comprendre que le bloc de texte ça n'est pas la question que tu as posée si tu dis quelle heure est-il à Mouscon c'est pas ça, il va y avoir plein d'autres informations dans le bloc de texte, il va y avoir ce qu'on appelle le système prône qui va être toutes les directives que l'on va donner pour que ton assistant fasse son travail et puis il va y avoir également la question que tu poses Merci. Mais imagine, si ce n'est pas une question que tu as posée, mais si c'est un échange que vous avez eu, il va y avoir l'intégralité de l'échange, très certainement. Donc tu vois bien que le volume va changer, ces volumes vont être très différents les uns des autres. Et puis, en plus, en fonction de ta demande, si tu dis quel temps fait-il à Moscou, par exemple, le modèle de langage, lui, il n'a aucune idée. du temps qu'il fait à Moscou. Mais par contre, il a accès à ce qu'on appelle des tools, des outils qui font que quand tu vas envoyer cette demande-là, lui, il va exécuter, il va aller appeler une fonction qui, par exemple, va aller chercher la météo à Moscou, et puis il va réinjecter le résultat dans le LLM de manière à fabriquer ta réponse. Ce qui fait que dans l'exemple que tu viens de donner, on n'a pas un aller-retour, mais on a au minimum deux allers-retours. Et dans la pratique, on a très souvent 4, 5, 10, 20 allers-retours. C'est-à-dire que ce qui pourrait sembler être une demande, en vrai, ce n'est pas une demande, c'est 20 demandes. Tu me suis, Guillaume ?
Oui, je te suis complètement.
Voilà. Et donc, aujourd'hui, quand on parle d'inférence, on donne des métriques qui souvent sont fausses, mais il est certain que... comme l'adoption, les usages de l'IA augmentent de façon très importante, la consommation augmente de façon très importante, de façon absolument gigantesque. Sauf qu'il faut être également conscient que ces choses-là sont en train d'évoluer très vite et qu'on commence à voir arriver des processeurs qui sont optimisés pour faire de l'inférence.
J'allais y venir. de poser une question bête, mais je te la poserai après parce que je crois que tu vas répondre à ma question avant que je te la pose.
Et qui vont consommer beaucoup moins. Et entendons-nous bien, ce n'est pas du technosolutionnisme que je fais. C'est juste une certaine lucidité. Et puis, posons-nous la question du comment peut-on effectivement optimiser ces choses-là. Elles vont se faire de toute façon puisque puisqu'il va falloir réduire le prix de ce type de transactions au fur et à mesure où elles augmentent, puisque toi, quand tu poses une question, tu veux avoir une réponse, mais ta réponse, tu ne veux pas la payer 10 euros. Donc, il va falloir réduire le coût, et comme le coût de l'énergie est à peu près stable, même si sur votre facture, vous voyez bouger, je veux dire que ça ne s'arrive pas dans des facteurs de 1 à 100, alors que l'efficacité du matériel qu'on peut avoir derrière... peut facilement varier de 1 à 100, comme l'efficacité des modèles, puisqu'on voit aujourd'hui des modèles qui sont pensés pour être moins consommateurs que d'autres. Donc, ces choses-là vont évoluer. Donc, je ne suis pas forcément optimiste sur la quantité totale d'énergie consommée, mais pour répondre à ta question sur Quid d'un data center, on peut être aujourd'hui à peu près certain que... Que l'inférent, premièrement que l'entraînement va consommer de moins en moins. Aujourd'hui ça consomme beaucoup parce que chacun veut son modèle. Il y a plein de gens qui font des modèles et je me demande pourquoi parce que très souvent ils fabriquent des modèles qui sont pourris par rapport à ce qui existe. En tout cas aujourd'hui il y aura une centaine d'acteurs qui fabriquent des modèles. Demain j'imagine qu'il y en aura beaucoup moins puis qu'on arrivera également à un plafonnement du modèle qui fait qu'on n'aura plus besoin d'en fabriquer autant. En tout cas, le modèle, une fois qu'il est fait, on n'a plus besoin du datacenter qui a servi pour le produire. Et pour l'inférence, on va avoir de plus en plus d'inférences dites on-edge, c'est-à-dire d'inférences qui ne seront plus faites dans des datacenters, mais qui seront faites sur des processeurs spécialisés qui seront soit sur ton ordinateur, dans ton téléphone ou peut-être même dans tes oreillettes.
Oui, donc tu en arrivais là et donc tu n'as pas vraiment répondu à la question que je ne t'ai pas encore posée. Donc ça tombe bien. Mais je sens que tu y allais. Je pense qu'aussi, l'avenir, ça va être des processeurs, dont tu venais de parler à l'instant, qui seront plus puissants et qui seront en local dans nos machines pour permettre que, quand tu poses à ta machine une question à la con, comme mon glouglou, quand je lui demande quelle heure est-il ou que je lui demande d'allumer la lumière, il n'est pas besoin d'aller faire travailler un data center, mais qu'en local, il puisse répondre à ma question. pour faire ce genre de choses ou même peut-être d'autres ?
Absolument, c'est ce que je décrivais à l'instant. Et puis en utilisant des modèles qui sont… Je vais te donner un exemple. On voit, je te l'ai dit tout à l'heure, qu'il y a plein d'entreprises qui sortent des modèles. Et d'ailleurs, on peut se demander comment le marché du capital… n'évolue pas plus vite parce que ce qu'on nous décrit coûter des milliards de l'autre côté de l'océan Atlantique, on voit par exemple, toujours dans le cadre d'une guerre économique qui alimente souvent nos débats, on voit les Chinois qui sont en train de proposer gratuitement des modèles qui coûtent des milliards à fabriquer. On voit bien en quoi ce sont des armes absolument dingues pour l'économie. Mais si on parle d'écologie et si on parle de chiffres, aujourd'hui, on trouve des modèles chinois open source, que tu peux installer chez toi et que tu peux faire tourner chez toi, qui ont une puissance qui est équivalente à celle d'un chat de GPT d'il y a un an. Et pour te donner des chiffres... La taille de ces modèles, c'est environ 1 Teraoctet. Donc, c'est l'équivalent de votre disque dur si vous avez un PC à peu près récent. Et la puissance de calcul qui est nécessaire pour faire tourner ça, elle est de l'ordre de, je ne sais pas, compter quelque chose entre 5 et 10 GPU de dernière génération. Ce qui veut dire que si vous devez payer ça, la facture va être de l'ordre de 500 000 euros. Donc, tu peux installer chez toi un gros PC qui va te coûter environ 500 000 euros et qui te rend totalement indépendant de M. Anthropique, de M. Mistral, de M. OpenAI, etc. Donc, tu vas me dire, c'est très cher. Oui, c'est très cher, mais si tu regardes l'évolution d'une façon générale de l'informatique, Un truc qui... Et aujourd'hui, parce qu'il est fait en très peu d'exemplaires et parce qu'il y a une tension sur le marché et coûte 500 000 euros, la probabilité pour qu'il coûte moins de 5 000 euros dans les 24 mois, elle est très haute, en vrai. Très, très haute. Subsiste la consommation électrique. Donc, on peut imaginer que quand sera disponible un truc 10 fois moins cher, il consommera moins d'électricité. Mais imagine ton bidule à 500 000 euros qui te permet de dépendre de personne aujourd'hui. Il va consommer. Quelque chose comme 5 kW. Donc 5 kW, c'est 3 radiateurs électriques. Donc tu vas me dire, c'est beaucoup pour un ordinateur. Mais dans l'absolu, la consommation électrique, elle n'est pas gigantesque. Parce que quand il va faire ça, pour faire ça, il va pouvoir alimenter les usages IA de quelques dizaines, voire centaines d'utilisateurs. c'est-à-dire que si tu... Si tu rapportes ça à l'utilisateur, c'est pas gigantesque. 5 kW aujourd'hui, c'est 10 fois moins que la consommation d'une voiture.
D'accord, là tu me parles de gros bidules qui, en local, pour des professionnels, pourraient faire tourner des IA d'entreprise. Et pour les petits bidules comme nos téléphones dans nos poches,
tu es d'accord ? Je vais te parler des petits bidules, mais imagine, le gros bidule que je voudrais bien insister, la consommation du système qui va gérer l'inférence, donc aujourd'hui qui permet de répondre aux besoins de quelques dizaines, centaines de personnes par rapport aux usages actuels, la consommation en électricité du truc est l'équivalent d'un dixième d'une voiture qui tourne. Donc tu vois, il faut remettre les choses. Je ne dis pas qu'il ne faut pas devenir frugal, je ne dis pas du tout ça, mais je dis que Merci. Quand les gens disent « Ah, mais tu te rends compte, la consommation énergétique de ce machin est absolument gigantesque » , elle est absolument gigantesque parce que comme les data centers mettent au même endroit toutes ces capacités de calcul, effectivement, c'est beaucoup, mais la consommation individuelle d'un de ces systèmes, pas d'un de ces data centers, d'une de ces machines d'inférence, c'est dix fois moins que la voiture que tu utilises. peut-être pour aller chercher ta reguette le matin. Donc, si vraiment on veut parler d'optimisation de l'énergie, à nouveau, soyons très attentifs à mettre des chiffres, des vrais chiffres, pour de façon à ne pas être dans le fantasme et dans le slogan, mais à être sur des vraies évaluations. Et donc, c'est pas beaucoup. Si vraiment on veut être économe en énergie, Arrêtons de rouler dans des voitures thermiques, et là c'est sûr, ou en tout cas réservons l'usage des voitures thermiques pour des trajets qui ne peuvent pas se faire autrement, et prendre une voiture pour aller chercher sa baguette de pain qu'on pourrait aller chercher en vélo, ça, il est démontré aujourd'hui que c'est la plus grosse consommation énergétique, et qui plus est, c'est le plus gros système émetteur de carbone oxydé, et qui plus est, c'est le plus gros système émetteur de particules fines. Il y a peut-être des gens... Parmi ceux qui nous écoutent, qui ne sont pas d'accord avec nous, eh bien, qui nous appelle, et puis on alignera et on comparera nos chiffres, ce sera avec grand plaisir. Maintenant, pour revenir sur les petits... Ah tiens,
j'en profite, 01-76-21-18-10, si vous n'êtes pas d'accord, ou alors contacte-lepodcast.com, notez-le dans un coin sur vos tablettes.
Hop, on finit avec les petits bidules qu'on aura dans les oreilles. Donc, c'est difficile d'évaluer ces choses à toi. Je trouve ça intéressant de donner les chiffres des trucs d'aujourd'hui parce qu'ils sont intéressants et parce qu'on est sûr de ça. Qu'est-ce que ça va devenir ? Ça va dépendre beaucoup des usages. Et donc, si tu veux, ma croyance, jusqu'à maintenant, je donnais des chiffres, j'étais prêt à débattre des chiffres. Maintenant, ma croyance, ce ne sont plus des chiffres, c'est dans ma petite tête, pas moi. Je pense que la consommation énergétique de ces... petites bidules va devenir toute petite, en tout cas absolument ridicule par rapport à l'énergie qu'on gâche sur d'autres choses et que si on a vraiment des sujets qui doivent nous interpeller, c'est par exemple l'utilisation des métaux qui sont utilisés pour faire ces petites bidules parce que les métaux qui sont utilisés, on est sur ce qu'on appelle des usages dispersifs ici, c'est-à-dire des usages qui sont en quantité tellement petite que ça ne vaut pas le coup d'aller rechercher le métal. Tu vois, ta voiture, aller rechercher l'acier de ta voiture, c'est super intéressant parce qu'on va aller retrouver une tonne d'acier à l'état quasiment pur. On va juste le cuire et puis ça marchera. Alors que pour aller rechercher... L'or ou l'étain qui traîne dans tes Airpods, c'est beaucoup plus difficile. Et surtout, les usages sont tellement dispersifs qu'on va dépenser plus d'énergie et de matière pour aller les chercher que ce qu'on va les récupérer. Pas dans tous les cas, mais dans un certain nombre de cas. Donc, si vraiment on veut penser des choses de façon durable, imaginons des appareils électriques qui sont bien pensés, qui sont modularisés, qui sont durables. et qui font qu'on n'en change pas tous les trois mois.
Qui sont réparables aussi plus facilement. Pour terminer la boucle de nos petits appareils qu'on a dans la poche, tu es assez d'accord avec moi, je pense, pour dire que toutes les commandes qu'on va leur faire, on parle souvent des téléphones agentiques qui vont arriver quand je vais demander à mon téléphone de me supprimer des mails, quand je vais demander à mon téléphone de me mettre telle radio, quand je vais lui demander de me mettre Ami le podcast. ça, ça va pouvoir se faire en local et il n'aura plus besoin d'interroger un data center.
Mais ça, ça se fait déjà en local. Oui,
mais ça va se faire de plus en plus, ça va être dans l'air du temps.
Oui, mais c'est, voilà, on a tous fréquenté des engins qui savaient déjà faire ça et ça ne consomme absolument rien du tout. Mais ça, ce n'est pas de l'intelligence, ça, c'est ce qu'on appelle du contrôle-commande. Le niveau d'intelligence est très, très faible. Donc oui, bien entendu, ça se fait, ça fait 30 ans qu'on a des bidules qui fonctionnent. plus ou moins bien, mais assez bien. Donc certes, ils fonctionnent de mieux en mieux. Est-ce qu'il faut aller sur le réseau pour les faire fonctionner ? Bien entendu non, ça n'a pas de sens.
Bon, et une dernière petite question avant qu'on se quitte, parce que là, je n'ai pas du tout la réponse. Samsung avait fait un truc que j'avais trouvé absolument génial. Je ne sais pas s'il n'y a qu'eux qui l'ont fait, mais c'est sur certaines télécommandes de télévision, des petits panneaux solaires, pour que quand tu retournes ta télécommande et que tu la poses sur ta table, elle se recharge pendant la journée le temps que tu ne l'utilises pas. Et ma question toute bête, c'est pourquoi personne n'a fait ça sur le dos d'un téléphone portable ? Parce que ça pourrait être sympa pour le recharger, ou le recharger partiellement, mais ça pourrait être aussi une source d'économie.
Donc, clairement non. On en avait parlé il y a quelques années. Pour les voitures. Exactement, tu te souviens ? Pour les mêmes raisons. C'est que la surface... L'énergie maximum que tu peux capter, elle est... Comment dirais-je ? Quand tu as un panneau solaire, l'énergie maximum que tu peux capter, c'est l'énergie du soleil que tu vas recevoir sur cette surface. Tu es d'accord avec moi ?
Tout à fait. Du soleil ou de la luminosité ? Parce que les télécommandes de Samsung, elles sont censées se charger même avec la lumière de ton plafond ou avec la lumière qui rentre par la fenêtre.
Mais non ! Non, la lumière de mon plafond et celle qui rentre par la fenêtre, ce n'est pas la même. Parce que celle de mon plafond, aujourd'hui, elle est émise par une LED. Et donc la LED, elle est justement optimisée pour faire le maximum d'énergie avec très peu d'énergie. Le même maximum de lumière avec très peu d'énergie. Elle a un très très bon rendement, c'est pour ça qu'elle ne chauffe pas, par exemple. C'est-à-dire que pour te donner une idée aujourd'hui, tu dois utiliser des LED qui... vont te donner, qui vont produire, imagine, sur 180 degrés, sur une hémisphère, qui vont produire quelque chose, qui vont consommer quelque chose comme 5 watts, si en face de ça, tu as quelque chose qui fait 10 centimètres carrés et que tu es à 2 mètres de la source d'émission, donc je n'ai pas fait le calcul, mais tu dois être à quelque chose du genre 5 milliwatts, C'est-à-dire qu'en imaginant que tu captes ça maximum 5 milliwatts, et donc ton téléphone, la consommation de ton téléphone aujourd'hui, elle doit être elle-même de l'ordre de 5 watts quand il ne fait plus rien. Donc, ce qui veut dire que pour utiliser ton téléphone pendant une heure, il faudrait que tu le laisses 1000 heures sous ta LED.
Oui, évidemment.
D'accord, mais attention parce que je t'ai parlé...
Ça va évoluer un jour ça je pense.
Le soleil c'est différent. Le soleil c'est différent si t'es en plein soleil. Tu auras beaucoup plus d'énergie, mais premièrement, tu n'auras pas suffisamment d'énergie de toute façon pour charger ton téléphone de façon... Et puis ton téléphone, il est dans ta poche ou il est chez toi quand tu es chez toi. Pardon. La quantité maximum d'énergie solaire qui rentre chez toi, c'est la taille de tes vitres. Elle est définie par les tailles de tes vitres. Donc, quand tu as ta fenêtre et puis tu es à 10 mètres de ta vitre, tu es dans ta cuisine, eh bien... Toi, tu y vois bien parce que ton œil est quelque chose de très efficace, mais la quantité d'énergie solaire qui arrive, elle est absolument ridicule. Donc, sur le principe, est-ce qu'on peut tirer de l'énergie ? Oui. Est-ce qu'on peut tirer une quantité d'énergie qui pourrait être utilisée, même très marginalement, pour recharger le téléphone ? C'est un piège à Google.
Oui, et puis en plus, on se dit, allez ! Je vais poser mon téléphone dehors sur la table, il sera en plein soleil. Il risque de ne pas aimer parce qu'il va chauffer. Et quand il est en plein soleil, il n'aime pas.
Absolument. Et de toute façon, la quantité d'énergie électrique que tu capteras sera absolument, même dans ces conditions absolument ridicules par rapport à la consommation de ton téléphone.
Bon, écoute, c'est parfait. On va s'arrêter là-dessus. C'était clair, net et précis. Donc, mon cher Bruno, toi qui vas faire le montage de cette émission, ne reste pas en plein soleil. Ça ne va pas te charger les neurones. De toute façon, ils vont déjà très bien comme ça. Et je te remercie d'avance. Mon cher Franck, je te remercie aussi. C'est toujours un plaisir de décrypter ces merveilles technologiques qui nous entourent. Et donc, c'est toujours un plaisir. Donc, ce sera un plaisir de te retrouver bientôt. 01 76 21 18 10. Ça, c'est pour vos commentaires audio avec la belle voix que vous avez ou que vous n'avez pas. Mais on vous diffusera. Et si vous voulez venir enregistrer... des podcasts avec nous sur des sujets qui vous passionnent, et bien appelez-nous. Alors si vous êtes timide de la voix, désormais contacte-ami-le-podcast.com contacte-ami-le-podcast.com Mon cher Franck, je retourne à ma bouteille d'eau, je te remercie mille fois et je te dis à bientôt pour de nouvelles aventures !
Amis, le podcast, 01 76 21 18 10, si vous voulez commenter l'Infotech.
Share
Embed
You may also like