Description
Aujourd'hui, nous plongeons dans les coulisses de la conduite autonome avec une percée majeure signée Waymo.
La filiale d'Alphabet vient de dévoiler son "Waymo World Model", une intelligence artificielle génératrice de mondes virtuels capable de simuler des situations de conduite avec un réalisme jamais atteint.
Ce n'est pas seulement une prouesse technique, c'est le moteur qui va permettre aux véhicules autonomes de franchir un cap critique en matière de sécurité et de passage à l'échelle.
Créer des environnements 3D photoréalistes et interactifs
Concrètement, ce modèle s'appuie sur Genie 3, l'IA de Google DeepMind, pour créer des environnements 3D photoréalistes et interactifs.
Le premier point de rupture, c'est la gestion des cas limites, ce que les ingénieurs appellent le "long-tail".
En s'appuyant sur une connaissance du monde apprise via des milliards de vidéos, le simulateur peut inventer des scénarios que la flotte de Waymo n'a jamais croisés dans la réalité, comme une rencontre fortuite avec un éléphant ou une tornade en pleine ville.
Là où les simulateurs classiques sont limités par les données collectées sur route, le World Model s'en affranchit donc pour préparer l'IA à l'imprévisible.
Contrôlabilité
Mais attention, il ne s'agit pas de simples vidéos passives. Le deuxième pilier de cette technologie, c'est la contrôlabilité.
Les ingénieurs peuvent modifier une scène par un prompt ou changer la trajectoire du véhicule pour tester des scénarios contrefactuels. Comme par exemple que se serait-il passé si la voiture avait accéléré au lieu de freiner ?
L'IA recalcule alors en temps réel non seulement l'image de la caméra, mais aussi les données LiDAR, indispensables pour la perception de la profondeur.
C'est cette fusion multi-capteurs qui garantit que ce qui est appris en simulation est directement applicable sur le bitume.
Waymo peut transformer n'importe quelle vidéo amateur en une simulation 3D
Enfin, la force de ce modèle réside dans sa capacité de conversion.
Waymo peut désormais transformer n'importe quelle vidéo amateur ou de dashcam en une simulation 3D.
Une rue enneigée filmée par un smartphone devient donc un terrain d'entraînement multi-modal.
Associé à une optimisation de l'inférence qui permet de simuler des séquences longues sans explosion des coûts de calcul, Waymo dispose ainsi d'un outil de validation scalable.
Au final, la course à l'autonomie ne se gagne plus seulement sur la route, mais dans la capacité à générer et maîtriser des milliards de kilomètres virtuels hyper-réalistes.
Le ZD Tech est sur toutes les plateformes de podcast ! Abonnez-vous !
Hébergé par Ausha. Visitez ausha.co/politique-de-confidentialite pour plus d'informations.
