#ANAÏS THEVIOTAlors, Big Data, c'est un terme qui revêt de nombreux fantasmes, qui fait toujours réagir. Alors parfois juste par son emploi, parce que c'est un anglicisme. Mais encore plus souvent en lien avec les imaginaires associés. La notion de big data est souvent couplée à de la peur, l'impression qu'on serait tous surveillés, mais aussi dépassés par les progrès de l'intelligence artificielle. Il apparaît à la fois déjà galvaudé, et en même temps il fait état d'un changement majeur dans la profusion des données disponibles. Aujourd'hui on parle de pétaoctets, de zétaoctets, pour désigner des volumes conséquents que représentent les big data. Pour mieux s'en rendre compte de cette masse de données, il faut s'imaginer que chaque seconde, 29 000 gigaoctets sont publiés dans le monde, soit 2,5 hexaoctets par jour. Hexa, c'est 10 puissance 18, un milliard de milliards. Donc la masse de données, elle est considérable. Les big data ou méga données correspondent à une masse de données qui ne peut plus être gérée par des capacités humaines ou informatiques basiques, et doit faire appel à des outils sophistiqués pour son traitement, tels que les algorithmes. Il faut dire que l'internaute laisse des traces partout, et souvent sans s'en rendre compte. Il y a des auteurs d'un des chapitres de cet ouvrage qui parlent d'ailleurs de consentement résigné. Il suffit de faire des courses en ligne, d'activer la géolocalisation, de cliquer sur une publicité pour laisser des données sur nos habitudes de consommation, nos déplacements, nos préférences, qui peuvent être ensuite captés, loués et revendus. Les algorithmes font parler ces données dites « brutes » et leur confèrent du sens pour les décideurs. En croisant ces données, il est ainsi possible de segmenter les publics et d'obtenir des profils types pour cibler les messages envoyés, que ce soit à des fins commerciales, informationnelles ou politiques. [♫ FOND SONORE ♫] Alors l'humain, c'est le deuxième terme que j'ai choisi effectivement. Vous ne trouverez pas de ligne de code dans cet ouvrage, mais des humains. Derrière les algorithmes, il y a bien des humains qui inscrivent une intention de départ, des objectifs dans la conception d'un algorithme. L'hypothèse d'une plus grande objectivité des décisions politiques, par exemple, par le recours des données, travaillées par des algorithmes qui sont censés être neutres, elle n'est pas tenable. Les algorithmes naissent dans des organisations, pris dans des écosystèmes professionnels variés et avec des routines internes. Derrière l'exploitation des données, il y a bien des visions du monde. Il s'agit alors de penser l'algorithme comme un objet politique et social, produit par des acteurs, comme on dit en sciences humaines et sociales, et issu de commandes privées et même désormais publiques. Ces lignes de code et de calcul ne peuvent être dissociées de leurs conditions de production. Si on poursuit la chaîne, après la production, il y a ceux qui vendent ces algorithmes et qui cherchent à convaincre de leur efficacité et de la valeur ajoutée de ces lignes de code. Plusieurs chapitres portent le regard sur cette rhétorique de l'innovation, comme dans le cas des prestataires en big data électoral, qui affirment qu'utiliser ces dispositifs pourrait faire la différence dans les urnes. Ils travaillent aussi leur image en se démarquant des usages américains marqués par des affaires autour de la protection des données, tel que le scandale Cambridge Analytica. Plusieurs chapitres portent sur ceux qui utilisent ces algorithmes, les usagers. Par exemple, en ouvrant la boîte noire de l'algorithme de l'application Waze, Antoine Courmont montre comment celui-ci évolue dans la pratique avec l'apport des utilisateurs eux-mêmes. Les usagers rendent donc plus intelligent l'algorithme en lui fournissant des données. On est dans une cofabrication de l'algorithme. Nous sommes dans la machine. Et enfin, au bout de cette chaîne, il y a ceux qui cherchent à légiférer sur ces algorithmes ou à travailler à la protection de nos données personnelles. On le voit bien, il y a tout un nouveau marché de la donnée qui s'est mis en place ces dernières années, allant de la conception des algorithmes à la protection des données personnelles. Et tout au long de cet ouvrage, on porte le regard sur ces humains, derrière les algorithmes, ceux qui les créent, les vendent, les utilisent et ceux qui protègent nos données. Il s'agit donc d'analyser l'épaisseur sociale des données. [♫ FOND SONORE ♫] Politiste, c'est ce que je suis. Je suis chercheuse en sciences politiques. Je n'ai pas choisi ce terme pour mon côté égocentrique, mais plutôt parce qu'il rend bien compte du fil conducteur de cet ouvrage. Étudier les big data, les algorithmes, avec un regard de politiste et plus largement de chercheur en sciences sociales. En lisant cet ouvrage, vous allez pénétrer dans le monde des données massives et de l'intelligence artificielle, mais pas d'un point de vue technique. Dans une perspective de sociologie politique. Les publications sur l'analyse des big data, elles ont d'abord été portées par des informaticiens, des mathématiciens, avec des débats orientés davantage sur des enjeux techniques. Il s'agit dans cet ouvrage de remettre en contexte la donnée, ou pour le dire autrement, d'inscrire socialement et politiquement la donnée dans l'ensemble des réseaux qui l'ont fait naître et se développer, puis dans les relations qu'elle va organiser et reconfigurer. En somme, l'ambition, c'est de comprendre et de décrypter ce que font les mégadonnées à la démocratie et plus largement à la société via des enquêtes empiriques poussées. La diversité des cas d'études permet de saisir comment les données massives participent au mode de gouvernance, que ce soit étatique, marchand ou scientifique. Et le format du collectif, c'est un vrai atout. Il permet d'interroger des domaines variés, tels que la recherche scientifique, les politiques publiques, la gestion des collectivités territoriales, la propagande électorale, l'information en ligne et même la régulation de la circulation routière. La donnée en ligne et hors ligne, ça devient une ressource clé de la gouvernance et ça représente à ce titre un enjeu politique fort.