Comprendre l’Espace : Les Défis des Modèles Visuels-Linguistiques dans la Perception Spatiale
La perception spatiale est une composante essentielle des applications du monde réel, telles que la conduite autonome et la manipulation par des robots humanoïdes. Cependant, les modèles visuels-linguistiques (VLM) peinent…