- Speaker #0
Bienvenue dans DeepMedia, le podcast qui décrypte les médias à l'heure du numérique. Je suis Julien Bougeot, consultant social média et IA générative, mais avant tout passionné et curieux de l'univers média depuis plus de 15 ans. Dans un écosystème en perpétuelle transformation, comment les médias s'adaptent-ils ? Comment se réinventer face aux nouvelles technologies et aux géants du numérique ? Quel avenir pour l'information et ceux qui la produisent ? Si ces questions vous intriguent, alors vous êtes au bon endroit. DeepMedia, c'est un temps de réflexion et d'échange avec celles et ceux qui façonnent l'avenir du secteur. Aujourd'hui, je vous présente un épisode spécial consacré au dernier projet éditorial mené dans le monde des médias grâce à l'IA générative. Cet épisode a été généré grâce à la fonctionnalité résumé audio de Google Notebook LM, ainsi que grâce à IA Media Lab, mon chatbot de veille IA et Média que vous pouvez utiliser gratuitement vous aussi. Je vous mets le lien en description de l'épisode. A présent, je vous laisse découvrir cet épisode et je passe la parole à mes deux co-AI animateurs. Bonne écoute !
- Speaker #1
Un résumé du match de la veille qui vient d'être généré en temps réel, avec un angle de caméra super spécifique. Et cette version exacte, elle n'existe pour absolument personne d'autre sur Terre.
- Speaker #2
Ouais, et le pire, enfin le plus fascinant, c'est que c'est plus de la science-fiction du tout.
- Speaker #1
Mais c'est ça. C'est exactement ce qu'on voit se déployer de manière ultra concrète depuis février, dans l'industrie des médias. Et notre mission pour cette exploration aujourd'hui, c'est vraiment de décrypter... comment l'intelligence artificielle est en train de reconfigurer toute la chaîne de valeur.
- Speaker #2
Parce que la phase d'expérimentation, on peut lire, elle est terminée. On assiste vraiment à une industrialisation massive, de la production jusqu'à la diffusion.
- Speaker #1
Et pour commencer, prenons le salon. On a vu en mars que Google a intégré ses nouvelles fonctions Gemini directement sur Google TV. Et là, on ne parle plus juste d'un algo de recommandations classiques.
- Speaker #2
Non, c'est ce qu'ils appellent les « sport briefs » , des résumés générés à la volée par l'IA. Juste en répondant à une demande vocale.
- Speaker #1
Et le mécanisme en dessous est fondamental. C'est vraiment le passage d'un mode browse, donc je zappe, à un mode ask, où je requête.
- Speaker #2
C'est vrai que pendant des décennies, le public zappait pour trouver un truc à regarder.
- Speaker #1
Exactement.
- Speaker #2
Et maintenant, on exige une info ultra précise tout de suite.
- Speaker #1
Mais attends, si l'interface commence à filtrer et digérer le contenu comme ça, c'est un cauchemar absolu pour le modèle économique des chaînes traditionnelles, non ?
- Speaker #2
Ah bah c'est une... désintermédiation totale. Le pouvoir glisse vraiment des créateurs de contenu vers ceux qui possèdent l'interface.
- Speaker #1
En fait, c'est un peu comme passer, je ne sais pas, d'une flânerie tranquille le dimanche dans les rayons d'une librairie à exiger qu'un robot entre, lise et recrache juste les trois meilleurs chapitres d'un bouquin en deux secondes.
- Speaker #2
Ouais, c'est une super analogie. Le lien avec l'éditeur d'origine s'évapore complètement. L'interface de la télé devient le média principal, en fait.
- Speaker #1
Et j'imagine que cette exigence d'avoir des résumés sur Mayur, ça crée un genre d'effet domino derrière ?
- Speaker #2
C'est obligé. Puisque l'audience requête des extraits très précis, l'industrie doit soudainement pouvoir les produire de manière industrielle et instantanée.
- Speaker #1
D'où l'explosion de ce qu'on appelle les usines à highlights. Si on prend la revue de presse de ces derniers mois, il y a le cas de NBC Sports qui est assez dingue.
- Speaker #2
Ah oui, avec la reconnaissance faciale.
- Speaker #1
C'est ça, ça. Ils utilisent cette techno, pas pour la sécurité, mais pour isoler et suivre en permanence le visage d'un athlète précis. Et ça génère automatiquement un format vidéo vertical pour les téléphones. Comment ça marche ? Techniquement, ça ?
- Speaker #2
Au lieu d'avoir un réalisateur humain qui sélectionne manuellement les plans pour suivre l'action, là, c'est l'algorithme qui identifie les vecteurs du visage.
- Speaker #1
À travers tous les flux de caméra en direct ?
- Speaker #2
Oui, tous les flux. Et il recadre, il zoome, il coupe le flux dynamiquement pour garder ce visage au centre de l'écran vertical. Zéro intervention humaine.
- Speaker #1
C'est un peu comme avoir un sous-chef numérique dans une cuisine. L'IA hache et prépare tous les ingrédients bruts. Les milliers d'heures de vidéos pour que le plat soit prêt à servir ?
- Speaker #2
C'est exactement l'idée, oui.
- Speaker #1
Mais justement, j'ai envie de challenger un peu ça. L'algorithme traque mathématiquement le visage, ok ? Mais est-ce qu'il comprend la tension dramatique ?
- Speaker #2
C'est-à-dire ?
- Speaker #1
Je suis assez sceptique sur sa capacité à capter une hésitation avant un pénalty ou l'émotion pure d'un regard. Est-ce qu'on n'est pas en train de remplacer la narration humaine par de la donnée pure et dure ?
- Speaker #2
Si, totalement. Et je suis convaincu que c'est la grande limite actuelle du système. L'action est super bien documentée, mais l'intention éditoriale passe au second plan au profit du volume.
- Speaker #1
Et ce volume crée d'autres problèmes, non ?
- Speaker #2
Bah oui, un goulot d'étranglement. Les marchés locaux saturent très vite de ces vidéos sur mesure. Pour que ça soit rentable, il faut les exporter dans le monde entier, à moindre coût.
- Speaker #1
Et instantanément. Ce qui nous amène à la course à la localisation. Dans les projets récents, on a vu émerger des outils de doublage comme DeepDub. pour l'industrie ou 3 Play Média.
- Speaker #2
Oui, des acteurs majeurs aujourd'hui.
- Speaker #1
Et DeepDub a introduit cette notion de... Attends, c'est quoi le terme « coworker agentique » ? En quoi c'est différent d'un bête logiciel de synthèse vocale ?
- Speaker #2
Le mot « agentique » est clé ici. Ça veut dire que le système prend des décisions autonomes. Il ne va pas juste traduire et lire un texte bêtement.
- Speaker #1
Il fait quoi de plus ?
- Speaker #2
Il ajuste la synchronisation labiale en modifiant un peu l'image. Il adapte l'intonation selon le contexte de la scène. Et il s'autocorrige si la longueur de la phrase diffère entre le français et l'anglais, par exemple.
- Speaker #1
Donc la localisation devient une arme de croissance, pas juste un centre de coup.
- Speaker #2
C'est ça. Sauf que, forcément, ça crée d'immenses frictions.
- Speaker #1
Ah oui, sur le droit d'auteur, l'authenticité. D'ailleurs, c'est lié aux Oscars qui ont resserré leurs règles dernièrement.
- Speaker #2
Tout à fait. L'Académie exige maintenant une traçabilité stricte. Il faut prouver qu'il y a eu une intervention humaine claire dans la création des œuvres.
- Speaker #1
On veut la vie. vitesse de la machine, mais on cherche désespérément à protéger la valeur humaine.
- Speaker #2
C'est exactement le point de bascule où on se trouve.
- Speaker #1
Ce qui amène une dernière question assez provocatrice pour clôturer cette analyse. Si on y pense, toutes ces technologies modifient ce qu'on considère comme la vérité d'une œuvre juste pour s'adapter à la personne qui regarde.
- Speaker #2
L'hyperpersonnalisation à l'extrême.
- Speaker #1
Voilà. Si les algos décident des extraits, de la langue, du montage vocal et même de l'angle de caméra en temps réel, est-ce qu'on va finir par regarder des versions d'une série ou d'un match de sport que personne d'autre au monde n'a vu de la même manière ?
- Speaker #2
C'est la grande question.
- Speaker #1
Est-ce que c'est la fin de l'expérience culturelle partagée ? On laisse ça à la réflexion de tout le monde. Merci d'avoir suivi cette exploration au cœur de l'industrie des médias.
- Speaker #0
Merci d'avoir écouté cette session de veille IA et Média. généré avec Google Notebook LM et IA Media Lab, outil de veille dont je vous mets le lien d'inscription en description d'épisode. Je suis preneur de tous vos retours à propos de ce format. Je vous donne rendez-vous prochainement pour de nouvelles interviews inédites où l'on va continuer d'exploiter le futur des médias à l'heure du numérique. En attendant, pour ne pas manquer les prochains épisodes, abonnez-vous à ce podcast et mettez les commentaires et étoiles adéquates. DeepMedia est un podcast autoproduit par Follow Me Conseil, agence de formation et conseil stratégique spécialisé en IA générative. et social media. A très bientôt !