Xpeng cherche définitivement à s'émanciper de son image classique de constructeur de véhicules électriques. À l'occasion de son “IA Day 2025”, le 5 novembre, l'entreprise chinoise a annoncé sa feuille de route comprenant le déploiement, dès l'année prochaine, d'un modèle d'IA vision-langage-action (VLA) pouvant être, d'après elle, appliqué “simultanément aux véhicules autonomes, aux robots humanoïdes et aux voitures volantes”.
Ce modèle, baptisé VLA 2.0 et conçu pour une diffusion à grande échelle, est défini par Xpeng comme “un modèle génératif d'actions et un modèle du monde physique permettant la compréhension et la prédiction. Il est capable d'un apprentissage auto-évolutif tout en appréhendant les lois d'interaction du monde réel.” Le modèle repose sur une nouvelle approche, intitulée “Vision-Implicit Token-Action”, permettant de supprimer l'étape de traduction vision-langage et ainsi de passer directement des repères visuels aux commandes.
Un modèle entraîné sur 100 millions de vidéos de conduite réelles
Xpeng affirme que VLA 2.0 a été entraîné sur plus de 100 millions de vidéos de conduite réelle, le tout sans annotation des données. Pour parvenir à déployer ce modèle sur de futurs véhicules, le constructeur a développé une pile logicielle basée sur Turing, sa puce d'IA propriétaire. “Grâce à l'optimisation complète du cycle "puce/opérateur/modèle", Xpeng est parvenu à installer le VLA 2.0, avec une échelle de paramètres de l'ordre du milliard, sur le modèle Ultra (2 250 TOPS)”, assure l'entreprise.
La particularité de ce modèle réside en outre dans son ouverture au reste de l'écosystème. En amont de son déploiement au grand public, le prototype VLA 2.0 sera mis à disposition des partenaires internationaux de Xpeng en open source. Le client de lancement n'est autre que Volkswagen, qui pourra non seulement intégrer le modèle dans ses futurs véhicules, mais aussi faire tourner ses logiciels sur les puces de Xpeng. Une opération quelque peu salvatrice pour le constructeur allemand, à la traîne dans l'Empire du Milieu notamment en raison d'importantes difficultés rencontrées dans sa division logicielle Cariad.
Une solution de conduite autonome basée sur un “système de vision pure”
Xpeng espère être le premier acteur à mettre au point “le premier taxi autonome entièrement conçu et produit en Chine”. Les véhicules, qui intégreront deux modèles d'IA dont le VLA 2.0, seront équipés de quatre puces Turing du constructeur. À la différence de nombreux concurrents, la solution de conduite autonome ne comprend ni lidar ni outils de cartographie en haute définition, mais repose uniquement sur “un système de vision pure”, un choix rarement privilégié dans le secteur.
Pour rassurer sur la sécurité, Xpeng affirme que son système sera “équipé d'une architecture matérielle à double redondance, où les deux ensembles de matériel peuvent se relayer, permettant une commutation rapide même en cas de panne”. De premiers tests devraient débuter à Guangzhou – où l'entreprise a son siège – et dans d'autres villes chinoises, avant le lancement de trois modèles autonomes l'année prochaine.
En redoublant d'efforts dans la conduite autonome, Xpeng espère se mesurer aux chinois WeRide, Pony.ai ou Momenta, qui disposent déjà d'importantes flottes dans l'Empire du Milieu. Elle mise également sur son système composé uniquement de caméras et d'outils de computer vision pour réduire les coûts. Reste à savoir si cette stratégie sera payante : Tesla, dont la solution de conduite autonome repose sur une base similaire, peine à séduire avec son service lancé cet été.
Un robot humanoïde doté de 82 degrés de liberté
Xpeng a profité de l'évènement pour présenter la deuxième génération de son robot humanoïde Iron, comprenant d'après l'entreprise “une colonne vertébrale humanoïde et des muscles biomimétiques”. Doté de 82 degrés de liberté dont 22 au niveau de la main, Iron est alimenté par des batteries à semi-conducteurs et équipé de trois puces Turing, portant la puissance de calcul à 3000 TOPS. Il intègre trois modèles d'IA dédiés à l'interaction, à la marche et à la conversation.
L'entreprise vise une production à grande échelle de ses robots humanoïdes pour fin 2026. Elle cite plusieurs cas d'usage comme les “visites guidées, les accompagnements shopping et la gestion du trafic”. Elle s'est en outre associée au géant chinois de l'acier Baosteel afin d'explorer des applications industrielles, en particulier dans l'inspection.


![[ÉNERGIES] Déployez vos projets IA à l’échelle, inspirez-vous du cas ENGIE Entreprises et Collectivités](https://cdn.webikeo.com/webinar_logo/2025-10-24-ac93013fcd6c2ea907b5a091f0e74c90.png)
