Ce que prépare Apple en 3D devrait inquiéter Google et Microsoft
La firme à la pomme dévoile un nouveau modèle capable de recréer un objet en volume à partir d’une seule photo, mais pas que.
Apple a présenté en mai 2025 deux modèles d’intelligence artificielle, Matrix3D et StreamBridge, tous deux liés à la 3D et à l’analyse vidéo en temps réel. Matrix3D permet notamment de créer des objets en trois dimensions à partir de seulement deux ou trois photos, là où les méthodes classiques en exigeaient des centaines. Cupertino franchit aujourd’hui une nouvelle étape dans ce domaine en publiant un nouveau modèle baptisé LiTo, qui va encore plus loin.
Une seule photo pour un objet 3D complet
LiTo, pour « Surface Light Field Tokenization », a récemment été publié sur le blog d’Apple. Ce modèle transforme une simple photo en un objet tridimensionnel complet grâce à l’IA, avec une particularité notable par rapport à ses prédécesseurs et ses concurrents. LiTo sépare en effet l’objet photographié de la lumière qui l’entoure, ce qui lui permet de comprendre comment chaque surface réagit à un éclairage donné.
Si vous prenez en photo une tasse métallique posée sur une table, le modèle saura par exemple reproduire les reflets que cette tasse produirait dans n’importe quel environnement virtuel, que ce soit sous une lampe de bureau ou un éclairage tamisé. Les résultats obtenus surpassent d’ailleurs selon Apple ceux de TRELLIS, le modèle concurrent de Microsoft. Ce dernier est considéré comme une référence dans le domaine.

© Apple
La 3D comme terrain de jeu favori d’Apple
Cette avancée s’inscrit dans une stratégie plus large de la firme à la pomme autour de la modélisation 3D. Le capteur LiDAR des iPhone Pro permet depuis 2020 de numériser des pièces entières depuis votre téléphone, et les personas du Vision Pro reproduisent le visage de chaque utilisateur en volume avec un réalisme impressionnant.
Apple semble en effet vouloir relier toutes ces briques entre elles. Le LiDAR capture l’espace réel, les modèles IA comme LiTo transforment des images en objets numériques exploitables, et le Vision Pro peut afficher le résultat dans un environnement immersif. Un fabricant de meubles pourrait par exemple photographier une chaise avec son iPhone, et vous pourriez ensuite la visualiser dans votre salon à travers le casque, ou avec les futures Apple Glass.
Apple n’a pas encore précisé quand LiTo sera accessible aux développeurs, mais Meta propose déjà SAM 3D depuis novembre 2025 et Google a racheté en janvier 2026 la start-up Common Sense Machines pour renforcer ses propres capacités dans ce domaine.
