- Manu
Bonjour et bienvenue dans le dernier clic, votre podcast Tech, IA et nos codes. On se retrouve cette semaine pour un épisode thématique. Je suis avec Lulu. Comment tu vas Lulu ?
- Lulu
Ça va et toi ?
- Manu
Très bien et ravi de te retrouver du coup pour notre épisode du jour où on va parler des communs numériques. Alors un très bref rappel pour celles et ceux qui nous retrouvent, qui nous découvrent pour la première fois. Chaque semaine, on va parler justement de sujets Tech, IA et nos codes en alternant une semaine sur les outils numériques vraiment. les épisodes côté outils, c'est ce qu'on avait la semaine dernière et voilà on va parler vraiment de nos outils à nous et de ce qu'on utilise pour bosser globalement ou dans notre vie perso aussi. Et les autres semaines on est sur des thématiques où on avait déjà parlé des fondamentaux de l'IA, on avait aussi parlé justement de l'IA agentique et des lunettes connectées. Si vous n'avez pas encore écouté, je vous invite à justement aller écouter tout ça et aujourd'hui on va continuer un peu dans la foulée de l'IA. et d'un sujet un petit peu plus étendu, puisqu'il ne concerne pas strictement que l'IA, il impacte aussi, mais qui est plus important d'un point de vue éthique et même politique, en quelque sorte, au niveau tech, qui est le sujet des communs et des communs numériques. Alors, Lulu, je sais que tu as lu un livre très intéressant sur le sujet, notamment pour préparer cet épisode. Alors, est-ce que tu peux nous parler un petit peu, justement, de jeunes. présenter très rapidement le livre en question qui a servi de référence et nous présenter un petit peu justement les communs et qu'on rentre dans le vif du sujet.
- Lulu
Oui, alors moi c'est vrai que le sujet des communs, j'en ai entendu parler sans vraiment me pencher dessus, il y a tout l'environnement et tout ça open source, mais ça va beaucoup plus loin que ça. Donc le livre que j'ai lu c'est Vive les communs numériques de Serge Abitboul et François Bansilon. C'est un livre qui est assez récent. Alors, dedans, ça ne parle pas encore de l'IA, même si c'est sorti en 2025. Mais ça refait un peu un historique des communs et de voir un peu les enjeux qu'il y a derrière et que ce n'est pas juste rendre des ressources gratuites et accessibles. Ça va quand même beaucoup plus loin que ça.
- Manu
D'ailleurs, on mettra le lien du livre dans l'épisode, que vous puissiez le retrouver. C'est vrai qu'on n'a même pas dit pourquoi on était allé sur les communs, mais parce que... On s'était rendu compte justement en discutant, notamment d'IA, de formation et de certains contextes, que le terme commun était un mot qu'on était tous les deux amenés à employer et qu'on comprenait, mais qui n'était pas forcément compris de tous. Et voilà, ce qui nous a fait un peu nous questionner sur le fait que oui, en fait, il y a peut-être quelque chose à creuser pour que ce soit parlant et compris de tout le monde.
- Lulu
Et que c'est un sujet qui revient beaucoup avec la souveraineté en ce moment. à cause de tout ce qui se passe au niveau géopolitique. Et c'est vrai que l'IA rabat aussi beaucoup de cartes et fait beaucoup se poser de questions sur où est-ce qu'on met les données, est-ce qu'on est dépendant d'autres pays ou pas, pour tout ce qui va être logiciel et ce genre de choses. Donc, je ne sais pas si tu voulais juste remettre un peu en contexte par rapport à l'actualité, parce que c'est vrai qu'on est aussi partis de là parce que toi, tu as installé Linux, entre autres.
- Manu
Entre autres, oui, c'est vrai. Un mélange de plusieurs choses. D'une part, parce que c'est vrai que dans le cadre de ce que je fais en ce moment, sur le développement assisté par IA, j'avais envie de créer des ressources et pouvoir les partager et s'en réutiliser. Donc j'ai employé les termes de commun et on a commencé à discuter du sujet. Dernièrement, il y a eu le fait, j'en avais parlé dans les épisodes précédents, que j'avais migré un de mes deux ordis sur Linux, donc sur une distribution Ubuntu. Et j'en suis ravi et j'avoue que... depuis que je suis passé dessus, c'est vraiment mon système principal dessus. Je suis amené à basculer sur Windows très ponctuellement, mais pour des questions de sauvegarde et pas pour des questions d'usage. Et c'est vrai que c'est justement une question qu'on voit aussi passer au niveau, comme tu l'as dit, au niveau politique, puisqu'on a eu des déclarations au niveau de l'État sur, je ne sais plus quel ministère a l'annoncé, mais globalement justement, 2,5 millions de postes. qui seraient migrés sur du Linux dans les années à venir. Je crois que la première annonce était sur du Auton, mais il me semble qu'il y avait un petit couac, et qu'en fait c'était le ministère qui va mettre en place ça. Je ne sais plus si c'est la Dynum, je n'ai pas envie de dire de bêtises, mais en gros, ils ont un petit poisson pilote qui est de 250 postes qui migrent d'abord en interne. et ensuite qui veulent étendre justement d'un point de vue administratif et ministériel et à plusieurs filiales. Je ne sais pas si on dit filiale d'ailleurs pour l'État, je ne suis pas sûr. Mais bon, en tout cas, ça fait partie d'une volonté politique d'aller sur des solutions qui sont dites plus libres et ouvertes pour ne plus être tributaires d'acteurs comme Microsoft à travers la suite Office. Parce que c'est juste un des maillons de la chaîne, il y en a plusieurs, et à travers ce que tu vas nous expliquer aujourd'hui, on va bien voir qu'il y a... plusieurs sujets, enfin plusieurs sujets, plusieurs couches en fait à la partie commune et que ça va de l'infrastructure à la solution en elle-même, aux usages, à ce qu'on en fait, à la gouvernance et ainsi de suite. Mais aujourd'hui, il y a une vraie question de se dire en fait, on est très dépendant des acteurs américains sur l'infrastructure et sur les outils qu'on utilise au quotidien. Un des premiers leviers... et des premières choses qu'on peut mettre en oeuvre c'est de changer justement les outils donc le système d'exploitation en est une une solution de basculer de Windows vers du Linux mais elle a des implications puisque justement au niveau des outils qui sont derrière qui sont déjà en place il faut pouvoir s'adapter que les gens arrivent à s'en servir à faire autant de choses qu'avant et d'une manière qui soit assez fluide pour que ça puisse se faire dans la durée puisque comme dans tout projet informatique tout projet tout court un des points essentielle, c'est la conduite du changement. Et voilà, c'est une des choses qui fait que on n'a pas tous du Linux aujourd'hui, c'est que la conduite du changement en individuel, elle n'est pas forcément évidente et que ce n'est pas quelque chose qui est poussé naturellement aussi en vue des marges, puisque du Office, du Word, Excel, c'est accessible, tout le monde l'a déjà vu, on ne peut pas dire que tout le monde sait s'en servir, en tout cas, c'est un acquis relativement commun dans les entreprises et dans le public aussi.
- Lulu
Et que si quand t'achètes un PC, il y a Windows installé dessus, enfin voilà, t'es directement baigné, c'est presque je pense que si tu vas voir une personne un peu lambda, un PC, c'est forcément Windows dessus et c'est même indissociable du PC enfin, il y a quand même les Chromebooks je crois où il y avait un autre OS dessus effectivement les trois que tu peux trouver en magasin un peu partout,
- Manu
ça va être les machines sous Windows, les machines sous Mac donc côté Apple et les Chromebooks qui ont justement un OS AE made in Google mais on reste aussi chez Degafam avec un système Google qui lui est envoyé vraiment plutôt sur les machines d'entrée de gamme et les petits portables qui peut fonctionner très bien pour certains usages bibliothiques très simples. Et après, aujourd'hui c'est vrai que si on veut du Linux par défaut, ça va être chez certains revendeurs qui permettent d'en installer. ou tout simplement en faisant après soi-même ou par quelqu'un qu'on connaît. Mais ce n'est pas la voie facile, ce n'est pas la voie commerciale, ce n'est pas la solution qu'on trouve.
- Lulu
Ça reste assez niche encore, même si dans certaines boîtes, les gens vont être poussés à utiliser du Linux pour ne pas être sur du Windows et potentiellement aussi participer à l'univers Linux. Ça, je vais parler, donc peut-être commencer par revenir sur les communs. Oui ? Oui,
- Manu
juste avant de revenir sur les communs, un petit truc qui est amusant quand même, parce qu'on parle de Linux dans ce cadre-là, mais un des paradoxes de ça, c'est qu'en termes de grand public, le Linux est considéré, et niche, puisqu'il y a peu de gens qui en servent au quotidien, mais en revanche, côté infrastructure technique, dans énormément de choses qu'on utilise, les systèmes derrière tournent sur du Linux, globalement, parce qu'il va être appareil embarqué, appareil réseau, les serveurs, les... En réalité, c'est ce qui tourne en arrière-fond d'énormément de choses dans notre quotidien sans qu'on en ait conscience. Fin de la parenthèse. Je te laisse reprendre la chronologie.
- Lulu
Le commun, c'est prix Nobel d'économie 2009 à Elinor Ostrom, aussi première femme qui est prix Nobel d'économie, qui vient un peu démonter la théorie de tragédie des communs de Hardin qui dit que dès qu'il y a des ressources qui sont mises en commun, on va penser plus à des ressources naturelles parce que de base c'est plutôt ça, ça va être les rivières, tout ce qui va être pâturage, les zones où on peut cultiver sans que ça soit une propriété privée. Et que la tragédie c'est que si on laisse ça en libre un peu service, ça va forcément amener à une surexploitation et à une mauvaise gestion. Et elle a été étudiée d'autres... commun, même encore naturel, et de voir que ça peut très bien se passer s'il y a les quatre éléments d'un commun qui sont là. Donc, on parle pour ça d'une ressource partagée, d'une communauté qui la maintient, avec des règles aussi de gouvernance qui sont explicites, et le dernier qu'on oublie peut-être parfois, c'est le mécanisme de sanction et de résolution des conflits. Ça, c'est vraiment ce qui fait qu'un commun est un commun et qu'un commun fonctionne et peut perturber. perdurer dans le temps.
- Manu
C'est marrant, à ce point-là, je pensais que ça faisait partie de la gouvernance, mais en fait, préalablement.
- Lulu
Il y a un moment où, par exemple, s'il y a des conflits, on peut dire, on peut nommer un dictateur bienveillant, par exemple. D'accord. Le mec ou la meuf, c'est malheureusement, dans le côté open source et des communs, c'est surtout un milieu encore... très masculin, notamment du côté du numérique. Ça, voilà, il faut que les familles aillent un peu plus, je pense. Mais il y a ça, ou alors ça va être des règles avec des votes de la communauté. Ça peut être comme dans Wikipédia ou ce genre de choses. On va aussi parler de Wikipédia. Là, en fait, on a trois types de biens. Donc d'un côté, on a les biens privés. Donc là, ça va être vraiment... Ils sont exclusifs et vont être rivaux. Ça veut dire que si j'ai ma maison, je ne vais pas forcément la partager et ça prend de la place par rapport à une autre... C'est rival en termes de ressources. On va avoir aussi les biens publics qui sont gérés par l'État. Donc là, ça va être tout ce qui va être routes, infrastructures publiques. Et après, les communs qui sont gérés par une communauté et qui sont non exclusifs. Ça peut être, par exemple, le pâturage d'un village. Et voilà. Mais là, on est dans des ressources qui sont rivales parce que si... On cultive qu'il y a une pomme. Si je mange la pomme, les autres ne peuvent pas manger la pomme. Et c'est là où le numérique change complètement parce qu'on est sur des biens qui ne sont pas rivaux. Parce que si je copie, par exemple, un logiciel et que je l'ai sur ma machine, il est disponible pour tout le monde. Et c'est même quelque chose qui va amplifier le commun.
- Manu
Donc là, Madame... Attends, j'ai oublié, non, pardon. Donc là, Madame... Ostrom, en fait, ce qu'elle a mis en exergue, c'est le fait que, du coup, c'était viable, réellement, d'avoir des communs qui fonctionnent bien et qui sont, justement, qui répondent aux règles que tu as énumérées, donc qui sont partagées, qu'il y a une communauté qui les maintient, qu'il y a un ensemble de règles et de sanctions ou de mécanismes, en tout cas, qui permettent, justement, de maintenir ça dans la durée et de faire que ça prospère et que ça soit partagé. D'un point de vue, vraiment, enfin, justement... elle, ce qu'elle a beaucoup observé, c'était sur la partie vraiment physique. On avait notamment vu des histoires de pâturage, on en a parlé, qu'il y avait aussi des pêcheries, des forêts, qu'il y avait plusieurs environnements physiques et un écosystème pas réellement utile, et directement utile et directement utilisé par les gens, et qui, justement, était comme ça administré. Et là où le numérique a apporté quelque chose d'un peu différent, c'est que, déjà, à partir du moment où c'est plus physique, ça veut dire que quand tu vas... Prendre quelque chose, tu n'es pas en train de l'enlever à quelqu'un d'autre, tu n'es pas en train d'empiéter sur son espace physique, vital, propriété, etc. Et du coup, ça apporte un rapport différent au commun.
- Lulu
C'est ça. Bon, après, le numérique n'est pas exclusivement non-rival. Est-ce qu'on peut le voir même avec... Après, on n'est pas dans le cadre d'un commun, mais par exemple, s'il y a de l'intelligence artificielle qui est administrée sur un serveur, le fait qu'il y ait beaucoup de monde qui utilise cette IA va... la couper pour d'autres personnes ou réduire les usages. Il y a quand même du physique derrière. Donc c'est nuancé, mais on est quand même très loin du commun historique. Ce qui est aussi un avantage du commun numérique, c'est que là, plus on va l'utiliser, plus la communauté grandit et plus la ressource vit. Donc c'est même complètement contraire au commun physique. Et c'est pour ça aussi que ça explose depuis 30 ans. Donc la question des communs, on en parle peut-être plus récemment, mais du côté souveraineté, gouvernance. Mais dès le début d'Internet, il y a eu ce qu'on appelle les libristes. Enfin voilà, toutes des personnes qui se disaient qu'il fallait rendre tout ça accessible, gratuit et pas mettre de... copyright ou de licence dessus.
- Manu
Oui, mais d'ailleurs, on ne verra pas que du coup, sur les communs, ça ne veut pas dire qu'il n'y a pas de licence, c'est qu'il y a même... des licences qui existent pour protéger un petit peu justement ces communs et le fait de pouvoir partager de la ressource.
- Lulu
On peut décrire les différents types de communs, parce qu'on parle pas mal de logiciels, systèmes d'exploitation, mais ça va beaucoup, il y en a plus, et on peut citer quelques exemples.
- Manu
Je ne sais pas si tu veux commencer. Juste pour passer à ce qu'on vient de dire juste avant, on est d'accord, un commun numérique n'est pas nécessairement non rival. justement parce que ça peut être lié à l'infrastructure, mais à travers les communs numériques, il va y avoir plusieurs familles, que tu veux nous présenter. Et c'est vrai que quand on parle de communs numériques, on a l'habitude justement de parler à la base d'outils et de logiciels, mais en fait ça va plus loin que ça, et il y a plusieurs manières de l'envisager. Donc je te laisse nous dire un petit peu justement quelles sont ces familles, et si tu as des exemples un petit peu... à nous donner de chaque ?
- Lulu
Oui, vraiment la base, ça va être les données. Et aujourd'hui, c'est un peu le fer de lance de toutes les sociétés. Donc c'est là aussi où il y a un peu des réticences à ouvrir. Donc à chaque fois, c'est un peu politique et ce genre de choses. Donc c'était très passionnant dans le bouquin. Mais en gros, on va avoir même dans les jeux de données, différents types de données, ça va être les jeux qui vont être... crowdsourcés, enfin vraiment, c'est la communauté qui va les créer ou alors après ça peut être l'État aussi qui ouvre des données qui existaient déjà avant pour les mettre à disposition. Mais par exemple, dans les communs de données, on peut penser à OpenStreetMap. Enfin, StreetMap.
- Manu
Qui est une alternative du coup à Google Maps. Enfin, pour les gens qui ont peut-être jamais lu. C'est ça.
- Lulu
Et c'est très gros.
- Manu
Contrairement à Google Maps. Oui, c'est...
- Lulu
On ne le sait pas forcément,
- Manu
mais oui. Encore, je dis contrairement. Non, parce que Google Maps, j'avais découvert qu'on pouvait aussi contribuer d'ailleurs dessus. Mais non, le principe, c'est vraiment à la base d'être amené justement par les gens, comme tu l'as dit, le côté crowdsourcé. Et en revanche, il est visité, lui, par des acteurs assez importants.
- Lulu
Oui. Parce que de base, ça partait un peu de personnes qui étaient... frustré de ne pas avoir les itinéraires ou des zones qui étaient peut-être délaissées ou en tout cas un système qui n'était pas unifié au niveau des données, tout ce qui va être cartographie. Ça peut être des cyclistes en Bretagne qui n'avaient pas forcément les bonnes routes et qui se sont mis à cartographier. Il y a 1,5 million de contributeurs dans le monde, donc on n'est clairement pas sur de l'anecdotique. C'est... utilisé par des GAFAM, comme Apple et Meta, pour concurrencer Google Maps. Alors, je ne sais pas s'ils contribuent à OpenStreetMap derrière. Des fois, il y a les grosses entreprises privées qui peuvent contribuer, parce que c'est dans leur intérêt aussi, parce qu'ils s'en servent. D'autres fois, non. Mais c'est aussi utilisé par IGN et La Poste comme base d'adresse nationale. Ce n'est pas forcément fait que... parce que ça amuse les gens, c'est aussi fait par stratégie. Je crois que c'était avant que la poste, enfin avant que ça soit remutualisé, que ça soit la poste ou même les secours n'avaient pas une base de données d'adresse qui était centralisée et commune. Et des fois, ça pouvait mener à des choses qui étaient assez tragiques, de ne pas pouvoir bien se repérer, alors que maintenant... On a des bases de données qui sont vraiment relationnelles avec tout qui est cartographié, avec l'adresse, mais aussi les coordonnées GPS, et à chaque fois dans les deux sens. Donc c'était dans l'intérêt même général d'arriver à une ressource qui est ouverte et partagée et collaborative.
- Manu
Oui, parce que c'est vrai que quand on fait du développement, c'est un peu la première chose qu'on va utiliser. Si tu as besoin d'une carte... Deux options, ça va être soit tu te connectes justement du Google Maps et ça va être gratuit jusqu'à une certaine quantité d'utilisation et après tu payes pour ton utilisation auprès de Google. Et donc à partir de là, tu rentres déjà dans un écosystème propriétaire avec licence, tarifs, etc. Soit tu pars justement sur du OpenStreetMap. Alors il y en a d'autres, mais c'est vrai que c'est le plus connu et le plus gros et celui qu'on a le plus tendance à implémenter, mais qui va te permettre d'accéder justement à cette information. qui est quand même costaud, en vrai, pour l'avoir déjà utilisé ou vu tourner dans des projets, c'est quand même solide. Et ils permettent d'avoir cette approche justement à contre-courant, raison pour laquelle Apple et des métas s'en servent pour avoir leur propre, je ne sais plus comment ils s'appellent, le Google Map sur Mac, tu vois, typiquement.
- Lulu
Je crois que c'est Plan. Tout simplement.
- Manu
Ok. Mais sur lequel, eux, en faire l'interface et une surcouche un peu par-dessus pour avoir leur touche Apple, mais où derrière, toute la partie cartographique, elle est utilisée, elle s'appuie justement sur ça.
- Lulu
C'est ça. Et je crois qu'ils emploient quatre salariés à temps plein. Aujourd'hui, avant, c'était complètement du... Enfin, c'était des... personnes qui se contribuaient, voilà, c'est ça. Mais il fallait quand même des personnes pour valider la donnée et tout ça, donc ça reste quand même un gros travail de fourmi.
- Manu
Ah, tu vois, que quatre personnes en vœux. En vrai, j'aurais pensé qu'il y avait plus de gens que ça. Alors,
- Lulu
dans le bouquin, c'était les derniers chiffres, il me semble, mais après, le livre date quand même de 2025, donc ça reste... Je pense qu'il y a quand même énormément de monde qui contribue, juste aussi... Alors, peut-être que dans certaines entreprises... ou associations, peut-être que ces gens sont payés et contribuent de part le travail dans leur entreprise à contribuer à OpenStreetMap, parce qu'ils s'en servent et tout ça, sans être salariés.
- Manu
J'imagine bien ça, justement, dans un contexte Apple ou
- Lulu
Meta. C'est ce qui se passe beaucoup pour Linux aussi, d'ailleurs. On n'est pas du tout Linux dans le cadre. Tout le monde contribue bénévolement. Il y a la moitié des gens qui contribuent à Linux qui sont payés.
- Manu
Je crois que c'est même plus que ça, il me semble.
- Lulu
Et c'est 50% normalement, de ce que j'avais lu.
- Manu
Mais c'est vrai que oui, parce que Linux, ça passe à travers des gros noms comme Red Hat, et comme on disait très rapidement tout à l'heure sur la partie infrastructure, mais en fait, ça fait partie des équipements qui sont implémentés dans le monde entier, et qui servent à des millions de boîtes. Et derrière, il y a besoin de gens pour mettre en place ces infrastructures, ces logiciels, les faire tourner, les administrer, les sécuriser. Et même avec des systèmes comme ça qui sont libres et pour lesquels il n'y a pas de licence propriétaire à proprement parler, les gens vont se financer justement à travers les services qu'ils proposent pour faire vivre tout l'écosystème.
- Lulu
Encore en données, on peut aussi citer Open Food Facts, qui est une création française, créée à la base par Stéphane Gigandet. Et en gros, c'est aussi avec énormément de bénévoles qui vont prendre en photo tous les emballages d'alimentation et tout ça pour avoir un maximum de données nutritionnelles sur énormément d'aliments. Et on ne pense pas forcément à Open Food Facts en premier. Si on parle de scanner des produits ou ce genre de choses, on va plutôt penser à Yuka, qui se basait à la base... sur les données d'Open Food Facts et qui, après, je crois qu'ils sont passés sur leurs données à eux, qui est plutôt fermée, mais ils continuent de contribuer énormément à la base de données ouverte.
- Manu
D'accord.
- Lulu
Donc voilà, par exemple, Yuka, c'est un produit commercial et ce n'est pas un commun, contrairement à Open Food Facts.
- Manu
Je ne connaissais pas du tout l'Open Food Facts.
- Lulu
Je crois que c'est un peu plus ou moins aussi à l'origine du Nitri-Score et ce genre de choses. C'est vraiment entraîné. par toutes ces initiatives un peu citoyennes. Enfin voilà, c'est... Alors, il y a aussi quand même une mini... Je ne sais pas si vraiment dans la définition du commun, il faut que ça serve à une idéologie derrière ou que ça serve au plus grand nombre. Ce n'est pas forcément le cas. Donc, ce n'est pas forcément que des projets éthiques ou ce genre de choses. Si on prend les quatre... Les quatre caractéristiques d'un commun, ça ne doit pas servir non plus au plus grand nombre, tant qu'il y a une communauté, que c'est régi, que c'est ouvert. Ensuite, en deuxième catégorie de commun, ça va être vraiment le commun d'information. Donc là, c'est au-delà juste de la donnée, on va dire, simple. Mais pour ça, on peut citer par exemple Wikipédia. Je pense que tout le monde connaît et c'est presque devenu un... Comment dire ? Voilà, Wikipédia, c'est là, quoi. C'est un peu grandi avec, ça s'est développé. Et c'est un commun qui est un peu en danger aujourd'hui. On voit notamment avec les attaques de Musk, ce genre de choses. Donc, c'est important de soutenir. Et aussi, notamment, là, avec toute la partie IA qui va taper dans Wikipédia, sans rétribuer non plus.
- Manu
Oui, d'ailleurs, là-dessus, il y avait deux choses pour mettre en contexte ça. Donc effectivement la construction de ce site Musk, c'est parce qu'ils ont lancé Grokipédia. qui est ni plus ni moins qu'une copie de Wikipédia, mais censurée et remaniée à la sauce musk. Donc voilà, ses interventions à lui, ses débordements sont retraités, et certains éléments historiques aussi. On prend le savoir commun mis à disposition sur Wikipédia, on en fait une version arrangée, et on la remet à disposition justement, à éviter évidemment, et à faire comme la peste. Mais donc ça y est. ça existe. Et je voulais dire autre chose en rapport avec Wikipédia.
- Lulu
Avec l'IA qui va taper dedans ?
- Manu
Oui.
- Lulu
Sans rétribuer.
- Manu
Effectivement. Et en fait, justement, je ne sais plus avec quel acteur, mais il me semble que Wikipédia a signé un accord justement avec certains acteurs de l'IA pour être rémunérés sur la consommation qui était faite des LLM. Parce qu'en fait, ils avaient deux problèmes. C'est qu'en gros, les robots qui passaient pour analyser les données et les reprendre, tabassaient leur infrastructure et consommaient comme si énormément de gens étaient en train de faire de la lecture. Et ce qui posait un vrai problème, puisque du coup, justement, à travers leur histoire, ils ont eu plusieurs passages un petit peu à vide Wikipédia, puisqu'on est sur du libre et on est sur quand même un gros morceau qui a fait de l'appel aux dons et de l'appel aux contributions une perte de foi. Mais dès lors que la partie technique, infrastructure, commencent à devenir en difficulté et donc exigerait plus d'argent plus d'investissements ou plus de personnel pour gérer tout ça mélange de l'ensemble voilà c'est plus jouable et j'ai un voilà j'ai plus non des acteurs en tête si c'est entre enfin si c'est tous les gros acteurs juste certains mais je sais qu'ils ont passé un accord justement pour que ce soit un peu dondonnant et qu'en fait les lesia et des canaux dédiés pour aller taper dans l'info d'Wikipédia, puisque quitte à se faire voler la donnée, autant que ce soit fait dans un système qui, eux, ne les mette pas en péril, et voilà. Sachant que,
- Lulu
bon, quand même, les grands modèles d'IA sont entraînés sur toute la base Wikipédia, donc c'est quand même un juste retour des choses. Et c'est là où on peut voir que, dès que ça va sur l'infrastructure, là, on est sur du... Il y a une rivalité. Parce que, effectivement, s'il y a beaucoup de trafic, notamment via des robots, ça empêche potentiellement des utilisateurs de continuer à se servir convenablement de ce commun. Ou ça peut ralentir sa progression, ce genre de choses. Juste quelques chiffres, on est à peu près à 100 000 contributeurs actifs. Il y a 60 millions d'articles dans plus de 300 langues. Et on est environ à 500 millions de visiteurs par mois. Et Wikipédia, voilà, il regroupe. tous les éléments au Strom, donc à savoir il y a la ressource, il y a la communauté, des règles où il faut une neutralité, de la source, de la vérifiabilité. Et aussi spécifique à la France, je crois qu'ils essayent aussi de réglementer le contenu généré par IA. Alors après, on commence à avoir de plus en plus de tirés quadratins dans les articles. Alors après, si vous voulez aller contribuer et les enlever et le signaler, ça peut être un petit moyen aussi de participer et de... continuer à avoir un contenu humain, quitte à reformuler si on voit des choses qui ont l'air générées par IGA. Et il y a aussi la dernière partie, sanctions, avec une partie révocation, blocage, où il me semble aussi qu'il y a des votes. Et il y a quelques cas historiques d'articles où il y a eu des gros... Comment dire ? Des grosses disputes et tout ça. Et là, il a fallu qu'une personne intervienne pour dire non, on choisit telle partie et... Et il faut se dire que Wikipédia, là, on est dans le cas d'un commun qui a remplacé un acteur privé qui était installé depuis plus de deux siècles. Donc, c'était l'encyclopédie Britannica qui était vendue encore à la base en porte-à-porte, puis a essayé un passage au CD-ROM quand l'informatique est arrivée. Et après, il y a eu Wikipédia et les gens ont arrêté d'acheter l'encyclopédie. après l'entreprise a fait un virage parce que elle a senti que ce n'était plus un bon créneau. Et là, on est vraiment dans le cadre d'un commun qui s'est imposé par-dessus un acteur qui était déjà bien installé et qui semblait indétrônable. Dans d'autres cas, les communs ne vont pas réussir à prendre la place ou alors il peut y avoir aussi des communs qui coexistent avec des acteurs du marché, ce qui se passe pas mal pour le logiciel.
- Manu
Oui, parce que là, c'est un petit peu le cas. Le remplacement complet... d'un acteur propriétaire, c'est quand même pas la norme. Oui, il y a quelques cas même aussi dans l'informatique où je crois que c'était avec MySQL notamment. Enfin voilà, là c'est encore d'autres choses, mais où ça s'est vraiment imposé alors que le marché semblait ultra stabilisé avec que des acteurs privés. Et il y a MySQL qui arrive et ça rabatte toutes les cartes et il arrive quand même à se faire une place là-dedans et à prendre 20% du marché. au niveau des formats de base de données, ce qui est quand même assez énorme. Et c'est là où on voit que ce n'est pas juste marginal et que ce n'est pas juste un truc communautaire dans son coin pour des très niches. C'est utilisé en entreprise, c'est utilisé, et c'est aussi bien, voire mieux dans certains cas, que les solutions propriétaires. Et juste par rapport à la catégorie commune d'information, pour un contre-exemple, par exemple, il y a... Facebook, où on a une grande communauté. On a un partage qui est assez massif d'informations, mais on n'a pas de gouvernance ouverte, pas de règles partagées, parce que la ressource appartient à Meta, donc là, on n'est pas dans un commun. Ce n'est pas parce que c'est un service avec communauté que c'est forcément un commun, parce qu'il manque quelques parties, il manque des caractéristiques propres au commun. Voilà.
- Lulu
Oui, commencer par le... La modération, le check des fake news et plein de choses dans ce goût-là, où ils ont été en retirant petit à petit des acteurs et des règles pour laisser passer de plus en plus de choses en roue libre.
- Manu
Là, après, on peut passer au commun de logiciel avec l'exemple de Linux. Juste pour donner une petite idée, c'est utilisé par plus de 18 000 entreprises. On n'est clairement pas dans quelque chose de niche. Comme je disais avant, on n'est pas dans du pur altruisme. Quand les personnes contribuent à Linux, c'est des personnes qui sont rétribuées soit par leur employeur qui contribue à Linux parce qu'ils s'en servent eux dans leur entreprise et pour développer soit des choses qui sont très spécifiques à leur activité, ils vont mettre leur développeur dessus et ça passe en open source et c'est pour tout le monde. Soit c'est directement des gens qui sont rétribués par la fondation Linux. Et il y a aussi ce point où Microsoft a toujours été très anti-open source. C'était presque dans l'ADN de la boîte, mais je crois que c'est en 2014, quand ils changent de directeur, lui va plutôt passer côté open source. Alors, ce n'est pas non plus par altruisme ou ce genre de choses, c'est parce qu'ils ont aussi quelque chose à y gagner. Et en 2017, Microsoft, par un peu ironie du sort, devient le plus gros contributeur mondial à l'open source. Voilà, ils ont essayé, avec la suite Office et tout ça, de casser toutes les initiatives qu'il y a pu y avoir. Là, il y a quand même cet intérêt à aller contribuer. Je crois que c'est VS Code aussi qui est open source et qui est utilisé par... énormément... Donc voilà, ils contribuent en apportant... En tout cas, il y a un logiciel de développement qu'ils ont mis en open source. C'est peut-être Gascode,
- Lulu
je ne l'ai plus en tête. Je ne sais plus si c'est bien lui. Eux aussi s'appuient justement sur des librairies, sur des branches open source et ce genre de choses pour leur propre développement. Ils ont tout intérêt à être acteurs de l'écosystème. Aujourd'hui, ils ont... Du coup, ça a apporté après d'autres travers, ce genre de choses, puisque aujourd'hui, c'est notamment Microsoft qui détient GitHub, ou passe quasiment tout le code de la planète, et qui amène des questionnements aujourd'hui sur l'IA, puisque justement, eux aussi ont mis en place de l'IA côté GitHub, qui permet de lire le code et donc de lire les contributions. Sur GitHub, en fait, il y avait quand même aussi une notion de commun, puisqu'on peut avoir des repositories. Donc en gros, le code que vous allez mettre en œuvre, quand vous allez développer, vous pouvez soit le garder en privé pour votre boîte ou pour votre asso, enfin voilà pour vous, soit le mettre en public et le partager justement aux autres pour qu'ils puissent reprendre ce code là et selon la licence que vous avez mis à disposition ils vont pouvoir le reprendre tel quel dans leur programme à eux, pour le revendre ou pour des usages personnels enfin voilà, il y a plein de manières après de le réexploiter mais aujourd'hui il y a un enrôlement, enfin il y a Voilà, un enjeu d'un point de vue IA et sur toute cette partie apprentissage, et où est le commun, où ne l'est plus, justement, quand il y a de l'apprentissage qui est fait sur le code privé. Et d'ailleurs, c'est... Je crois que c'est arrivé dernièrement par défaut, les gens qui font un compte GitHub maintenant sont automatiquement, il me semble, avec l'IA qui est en mesure de lire leur code. Alors que voilà, c'était au lieu de ce soit un opt-in, c'est devenu un opt-out et voilà, ils font des petites choses comme ça. Et l'autre point étant, aussi on en revient à la question géopolitique, qui est de dire, demain s'ils veulent couper GitHub en Europe, ça veut dire que l'immense majorité des boîtes n'a plus accès à son code source. et donc en moyen de continuer à bosser sur leur propre logiciel et leurs propres outils. Il y a des alternatives, toujours pareil, qui existent, mais en tout cas ça fait partie des enjeux. Et Microsoft a injecté des ressources dedans et contribue justement au développement de l'écosystème. Et maintenant aujourd'hui, même dans un Windows, tu peux avoir du Ubuntu sans avoir à l'installer complètement. Je crois que par défaut, tu as une machine virtuelle ou quelque chose comme ça. Ils ont intégré un certain nombre de choses pour que tu puisses t'en servir. Même quand tu mets en place une machine virtuelle avec les serveurs Windows, pareil, il y a des choses qui sont facilitées pour certaines distributions Linux. Mais de la part d'un gros acteur comme ça, ce n'est pas gratuit derrière.
- Manu
C'est intéressé. Des fois, certaines entreprises contribuent à l'open source pour redorer un peu leur image, mais il y a toujours cet aspect contribuer pour s'en servir et généralement, ils contribuent. pas assez par rapport aux bénéfices qu'ils tirent de ce qui est en open source. D'ailleurs, souvent, il y a une mini-distinction à faire entre ce qui est logiciel libre et logiciel open source. Parce qu'on les utilise souvent comme synonyme, mais c'est encore un peu différent. Open source, c'était surtout pour que ça passe plus côté industrie et privé parce qu'il n'y avait pas cette notion de gratuité. C'était un enjeu pour que les entreprises se saisissent un peu plus de l'open source. Mais c'est un peu ce qui se passe avec l'IA, où on a de l'open wide, c'est de l'open source. Donc il y a une petite distinction, mais après, là, on commence à rentrer dans des détails. Oui,
- Lulu
moi sur l'IA, on en reviendra un petit peu, mais c'est de dire que dans un cas, on a accès littéralement à tout, ce qui fait le logiciel. et dans le cas de l'IA, à l'ensemble de comment un modèle est fait et ce qui a servi à l'entraîner en mesure de le reproduire de bout en bout. Et Open Weight étant la déclinaison qu'on voit le plus aujourd'hui dans l'IA, qui permet de prendre un modèle et de l'héberger quelque part et de le faire tourner chez soi et de l'utiliser dans un cercle fermé et sécurisé, mais qui ne permet pas de reproduire l'apprentissage du modèle et de le reconstruire depuis le début.
- Manu
C'est ça. Et on va dire, il y a Stallman qui est un peu le papa du logiciel libre. Et pour lui, il y a vraiment une dimension éthique aussi derrière pour le logiciel libre, avec vraiment cette notion de liberté et de partage. Et en anglais, c'est free software, il me semble. Et c'est pour ça où il y avait vraiment cette traduction en free qui aurait pu poser problème encore plus dans l'industrie. pas vouloir du tout contribuer et c'est pour ça qu'il y a eu un peu cette bifurcation open source. On peut passer à la quatrième famille. Je crois que ça va partir sur deux épisodes en fait.
- Lulu
Oui, ça de toute façon, on ne l'a pas précisé au début, aujourd'hui j'ai un impératif qui fait qu'on fera forcément un épisode court comme on voulait se l'imposer depuis le début et qu'à chaque fois on déborde mais on fera une suite comme on avait traité il y a deux temps, on avait d'abord abordé les fondamentaux. puis la partie vraiment agentique et les briques d'un agent. Aujourd'hui, on va finir ce tour complet des familles de communs et que vous ayez déjà un premier aperçu assez important pour vous faire une idée de ce que c'est, de quoi on parle. Et la prochaine fois, on ira creuser justement sur la partie IA et sur d'autres points. Mais je te laisse reprendre et continuer justement sur les familles de connaissances. Pas les communs de connaissances, pardon.
- Manu
Oui, c'est ça. Donc là, ça va être... C'est encore au-dessus. de la base de données et du commun d'informations. Là, on va construire des connaissances par-dessus. C'est un peu de rajouter des ontologies. L'ontologie, c'est une manière de structurer l'information en définissant des caractéristiques. Il y a plusieurs modèles d'ontologie. Par exemple, on a aussi Wikidata, qui est une base de connaissances Wikimédia en accès libre multilingue.
- Lulu
Du coup, pour bien comprendre, parce que j'ai eu du mal à le visualiser, concrètement, c'est quoi la différence avec un Wikipédia sur ce type de base de connaissances ?
- Manu
Wikipédia, on va être sur de l'information et de la connaissance, il me semble que c'est encore la couche au-dessus où tu vas la trier et interpréter sur cette information.
- Lulu
Ok, ouais, donc en gros, c'est comme si tu prenais Wikipédia, t'en isolais les infos pour en faire un niveau d'abstraction encore au-dessus et où tu... Les différentes infos, tu vas les éclater au lieu de les avoir... Je pense que tu as dans un article sur Wikipédia, là, tu vas l'en avoir potentiellement dans plusieurs bases de données avec des liens entre eux. Oui,
- Manu
c'est ça. Et reclasser et tout ça, oui, vraiment le principe de l'ontologie où tu vas... C'est pas vraiment facile à définir. Et puis, on peut chacun définir son ontologie pour classer ses dossiers ou ce genre de choses. Ou classer... C'est beaucoup ce qui est fait aussi en biologie pour... classer les espèces, par exemple, d'avoir plusieurs niveaux et de définir, tiens, telle espèce, elle a telle caractéristique, ce qui fait qu'on la classe dans telle famille, dans telle sous-espèce. Donc, c'est tout des manières de classer l'information et ensuite de pouvoir visualiser ces données-là et pas juste avoir de la donnée brute. Par exemple, ça, c'est un contre-exemple, mais on a le Google Knowledge Graph. qui lui utilise vraiment des sources ouvertes, mais qui lui n'est pas ouvert. Donc il va utiliser de l'info ouverte, mais derrière il n'ouvre pas comment il s'en sert. Voilà, dans le bouquin, ils en parlaient un peu comme un cas de pillage de commandes numériques, ce que beaucoup de gros acteurs font.
- Lulu
Oui, sachant que Google Knowledge Graph, parce que je n'arrivais pas à me représenter où c'était, mais c'est le... L'espèce de truc que tu as quand tu navigues sur une page Google et que tu as sur la droite avec juste les infos, les chiffres, ce genre de choses.
- Manu
Exactement, et ça va généralement chercher de Wikipédia. Ou alors, c'est par exemple quand tu parcours une page de recherche et que tu cliques et que tu as un petit onglet et que ça te fait un mini résumé de la page en dessous. C'est ça en fait, ça va aller chercher de l'information et ça va te la mettre sous une autre forme. Et par contre, il y a Quant. qui est un navigateur de recherche. Je ne sais pas si on appelle ça comme ça.
- Lulu
Je pense que c'est un moteur de recherche. C'est une alternative
- Manu
Google moteur, oui.
- Lulu
Je ne sais plus s'ils font navigateur aussi ou s'ils ont que le moteur de recherche.
- Manu
Ah oui. Eux, ils font aussi du knowledge graph, mais quand ils vont chercher l'info sur Wikipédia, ils citent la source. Donc, c'est un moyen et ils peuvent appeler, par exemple, ça peut être un moyen aussi de rediriger, d'appeler aux dons, enfin de rétribuer en tout cas, là où ils vont pomper l'information. Donc, je ne sais pas si c'est un peu plus clair la distinction information-connaissance.
- Lulu
Du coup, maintenant, oui, effectivement. Pour moi, Wikipédia, c'était déjà de la connaissance. C'est pour ça que je vois mieux.
- Manu
Et en toute dernière famille, on a les communs de réseau. Là, on passe sur quelque chose qui est un peu plus proche du physique. Mais par exemple, on a Internet et le web. Donc ça, il y a une gouvernance qui était à l'origine totalement informelle et technique. Et c'est ce qui a permis, paradoxalement, d'énormément développer Internet et le web. Et c'était déjà... Enfin, c'est un peu les... premiers communs numériques, avant même qu'on parle de communs.
- Lulu
Oui, parce que, à toute origine, c'était l'ARPAN. Oui, parce qu'avant ça, justement, c'était l'ARPANET qui était un usage militaire, qui avait été, du coup, décliné, ouvert, justement, au public à travers Internet, qui a pris la forme du web plus tard. Et oui, l'idée de départ est quand même, justement, de partager l'information, la connaissance, les outils, etc. sur l'étendue du numérique en connectant tout le monde. Et là, derrière, on a rajouté les différents acteurs, propriétaires, etc., qui utilisent au final ce réseau et ces réseaux.
- Manu
C'est ça. Et là, un peu pour conclure sur les différentes familles et les communs numériques, une question qu'on peut se poser si on veut réussir à distinguer un commun d'un service, c'est est-ce que la communauté, elle décide et elle contribue activement ? et son avis est pris en compte ou est-ce que la communauté est juste utilisatrice ? Et là, on a déjà les plusieurs caractéristiques qui transparaissent là-dedans.
- Lulu
D'accord. Merci Lulu pour cette présentation déjà des différentes familles je sais pas si il y avait autre chose justement que t'avais en tête là pour un petit mot de la fin entre guillemets avant qu'on se quitte
- Manu
Ben là c'était en fait surtout pour rappeler que les communs numériques c'est quelque chose qui s'est construit depuis longtemps et qui est presque inhérent à internet et au web C'est presque une évolution naturelle et on va dire que ça converge vers là. Mais il y a eu un gros tournant en 2022 et je pense qu'on pourra repartir de ça la prochaine fois.
- Lulu
Oui, avec plaisir. Je regarde la trame et effectivement, il y a encore plein de choses chouettes à dire et desquelles parler en tout cas pour les prochaines fois. Est-ce que tu nous fais un petit teaser justement de l'épisode de Dans deux semaines ? Ce qu'on va aborder un petit peu justement dans cette suite des communs.
- Manu
Tu peux m'aider un peu aussi, bien ?
- Lulu
Oui, oui, oui. Non, mais parce qu'effectivement, on va parler un peu de l'approche française. Et c'est vrai qu'on avait cité quelques cas au début. Il y a aussi des cas contradictoires. On mentionnera notamment l'éducation nationale parmi eux. Et après, en fait, on ira également dans la partie IA. Donc, on va revenir un petit peu plus peut-être sur l'aspect et politique et IA dans le prochain épisode. pour mettre ça en contexte avec notre réalité d'aujourd'hui, au niveau des communes numériques.
- Manu
Ça, je pense que je ferais un petit aparté sur la science ouverte aussi, parce que c'est quelque chose qui me parle beaucoup, de par mes études, et même l'affection que j'ai pour la science et la manière dont elle peut contribuer à tout le monde. Et que les revues scientifiques mettent un peu des barrières à tout ça, mais qu'il y a des superbes initiatives derrière, pour ne pas spoiler. N'allez surtout pas chercher vos articles sur Saïeb. Il ne faut pas, ce n'est pas bien. Il y avait un mouvement comme ça, c'était trop marrant sur Twitter. C'était encore Twitter à l'époque, mais tu as des gens, des scientifiques qui se plaignaient justement de ça et tu as tout le monde qui était « Oh non, il ne faut pas utiliser Saïeb. » Et puis surtout, attendez, je vous mets le lien, parce qu'il ne faut surtout pas l'utiliser, il faut le blacklister. C'était trop, trop marrant. Mais tout le monde utilise ça et c'est trop cool de voir ce genre de piratrice.
- Lulu
Oui, tu nous présenteras justement ce que c'est. C'est vrai que moi, c'est un outil que je n'utilisais pas du tout, enfin que je n'ai pas eu à utiliser jusqu'à présent. Justement, ce sera intéressant de voir le pourquoi du comment. Merci Lulu pour cet épisode. Merci à toi aussi. Et du coup, on se retrouve dans deux semaines pour la suite de cette thématique sur les communs numériques. On se retrouve la semaine prochaine pour un épisode côté outils où on reviendra sur nos outils numériques. Et je pense qu'on parlera un petit peu de... On parlera encore de Cloud, on continue à l'utiliser. Et je pense qu'on reviendra un petit peu aussi sur la partie développement assistée par IA. On n'est pas trop allé dessus au dernier côté outil. Et c'est vrai qu'il y a quand même quelques... Disons qu'on a des choses à dire depuis les dernières fois où on a abordé le sujet.
- Manu
Oui, pas mal de petits projets, petits et gros projets en préparation. Ce sera l'occasion de repartir.
- Lulu
Bon, merci, Ludu. Bonne journée ou bonne fin de journée à tous et à toutes et on se retrouve la semaine prochaine pour un nouvel épisode du Dernier Clic.
- Manu
Salut !