Études sur la vision de l’intelligence artificielle

Des chercheurs se penchent sur la création de modèles d’intelligence artificielle (IA) capables de reproduire des images à partir de l’activité cérébrale humaine. Cependant, ce défi rencontre divers obstacles, notamment la taille limitée des jeux de données d’activité cérébrale disponibles et les questions éthiques liées à la confidentialité de ces données personnelles. De plus, les méthodes d’enregistrement de l’activité cérébrale, telles que l’imagerie par résonance magnétique fonctionnelle (IRMf) et l’électroencéphalographie (EEG), présentent des limitations en termes de résolution spatio-temporelle. Pour surmonter ces obstacles, les chercheurs ont développé NeuroImagen, un pipeline innovant utilisant l’EEG pour extraire deux niveaux d’information sur l’image perçue, permettant une reconstruction efficace et précise des stimuli visuels.
NeuroImagen se distingue en décodant à partir des signaux EEG à la fois une vue d’ensemble “grossière” de l’image perçue et les détails qui la composent. La combinaison de ces informations guide un modèle de diffusion latente dans la phase de débruitage, aboutissant à une reconstruction à haute résolution. Les résultats expérimentaux indiquent que ce pipeline surpasse d’autres modèles existants en termes de qualité de reconstruction, mesurée par diverses métriques. Outre son potentiel pour les interfaces cerveau-machine, cette méthode contribue à la compréhension de la représentation des stimuli visuels dans le cerveau, favorisant des avancées simultanées en neurosciences et en IA.
Cette approche novatrice offre des progrès tant quantitatifs que qualitatifs et souligne l’importance des collaborations entre l’IA et les neurosciences. Bien que la reproduction exacte d’images à partir de l’activité cérébrale soit encore une fiction, cette étude représente une avancée significative dans la compréhension de la représentation cérébrale des stimuli visuels.