Lire la mémoire visuelle

Navigation thèmes
Pigments, couleurs	Courr. des lecteurs
Substrats, supports	Liants et procédés
Procédés de dessin	Sculpture
Outils	Produits auxiliaires
Concepts phys-chim	Concepts techniques

Réseau ArtRéalité

Qui sommes-nous ?

Sites amis

- LaCritique.org

- LEntrepot.fr

Navig. page/section

_____

Sous cette page

_____

Pages soeurs

Edito «Hi-tech»
Fontaines laser
Verre liquide
Winscape
Pigments à nano-charges
Ciments autonettoyants
L'aérogel
Bleu Mn-YIn
Les opales "polymères"
Les vertus du plomb
Films haut-parleurs
Caoutchouc réparable
La marche des gouttes
Holographie temps réel
Holographie animée 2
Lire la mémoire visuelle

_____

Tous droits réservés.
Précisions cliquer ici

Lire la mémoire visuelle

De quoi notre mémoire visuelle est-elle faite : la réponse (partielle) à cette question est un événement scientifique bouleversant mais elle souffre d'une désastreuse communication. Un remarquable travail peut se trouver voilé, partiellement gâché, par une communication inadéquate. La prouesse réalisée par Shinji Nishimoto, An T. Vu, Thomas Naselaris, Yuval Benjamini, Bin Yu et Jack L. Gallant de Berkeley (Université de Californie, Usa) est ainsi "abîmée" par des déclarations un peu trop spectaculaires déformées à leur tour, encore bien davantage, par la presse généraliste. Dans ce texte, après avoir exposé les données de cette découverte, nous effectuons une analyse critique pour conclure sur sa nature réelle. [Exposé] Les mots peut-être imprudents de Jack L. Gallant ont donné lieu, dans la presse généraliste francophone, à des articles atteignant certains sommets. Ainsi le Nouvel Observateur titre "Lire dans les pensées : bientôt possible ?", le Monde "Des scientifiques sur le point de lire dans les pensées d'autrui" (articles parus tous deux le 27/9/2011). On est là dans un univers de science-fiction d'un kitsch suranné et hors sujet.			Lien YouTube :
			*Sommaire* Exposé Analyse critique Conclusion : de quoi s'agit-il vraiment ?

Pour commencer, donnons un lien vers le résumé de la publication (en anglais) : cliquer ici. [Si ce lien ou la vidéo YouTube cessaient de fonctionner, merci de nous le signaler, nous mettrions en ligne des copies de sauvegarde]

Ainsi, un nouveau "modèle procédural" (un algorithme donnant lieu à un programme informatique) mis au point par cette équipe permet de décrire, sur la base d'examens IRMf (lien vers une recherche Google), les écarts de signaux magnétiques émis, dans le cerveau, par le sang qui est plus ou moins oxygéné en fonction des stimulations électrochimiques en provenance, en l'occurrence, de l'appareil visuel. En fait c'est surtout le mouvement de ces "écarts BOLD" (blood-oxygen-level dependent, « dépendant du niveau d'oxygène sanguin ») qui révèle indirectement l'activité neuronale par le biais de l'activité magnétique des noyaux d'hydrogène (protons) du système neurovasculaire cérébral.

Ce modèle peut décrire des stimulations provoquées par le visionnement d'images animées, ce qui est nouveau. Dans l'exemple ci-dessus, il s'agit de vidéos hollywoodiennes. Il fallait en quelque sorte, pour ces chercheurs, expliquer comment en temps réel - c'est la véritable nouveauté - ces informations sont représentées dans les régions corticales visuelles (non loin de la nuque) et temporales (mémoire) : « les signaux BOLD mesurés par IRMf sont très lents (...), donc il a été difficile de modéliser l'activité cérébrale suscitée par des stimuli dynamiques tels que des films naturellement visionnés. » ^[1].

Le résultat est un ensemble d'aperçus (insights) tridimensionnels de représentations mentales "décodées" : « Nous avons enregistré des signaux BOLD dans le cortex occipitotemporal de sujets humains qui visionnaient naturellement des films et ajusté le modèle séparément à des voxels individuels. » ^[2], voxel signifiant pixel volumétrique, c'est-à-dire tridimensionnel.

« La visualisation du modèle ajusté révèle combien les régions visuelles primaires représentent l'information des vidéos. » ^[3]

« Pour démontrer la puissance de notre approche, nous avons aussi construit un décodeur bayesien [de Bayes, inventeur d'un audacieux théorème de calcul analytique probabiliste au XVIII^ème siècle] (...) en combinant des modèles d'encodage probabilistes avec un film préalablement visionné. Le décodeur a fourni de remarquables reconstructions des films vus. Ces résultats démontrent que l'activité cérébrale dynamique mesurée dans des conditions naturelles peut être décodée grâce à la technologie IRMf. » ^[4]

[Analyse critique]

Fort bien ! Et les résultats sont absolument remarquables. Un travail de haut vol.

Cependant, c'est très clair : cela ne fonctionne qu'avec des sujets ayant déjà vu la vidéo - on citera au passage le Nouvel Observateur « le programme ne peut reconstruire que des films que les scientifiques connaissent au préalable » - et l'analyse concerne les lobes temporaux et corticaux, donc la mémoire et l'appareil visuel. Alors de quoi parle-t-on : de vision ou de mémoire visuelle ?

La vue vient à la conscience, dit-on, lorsque l'information située dans le cortex visuel "arrose" (ou active) de nombreux autres lobes cérébraux. L'étude dont il est question ici évoque le cortex "occipitotemporal".

Les lobes temporaux ont d'innombrables fonctions, toutes très importantes. Ils sont notamment le dictionnaire et la grammaire de notre pensée, mais plus fondamentalement la mémoire auditive, visuelle et linguistique. Ils ne peuvent être confondus avec le cortex visuel où cinq régions (dites v1 à v5) analysent et reconstruisent (ou plutôt construisent) une image mentale très fine à partir des flux photoniques reçus de manière brute par les opsines et le rétinal (lire passage in La vue) et prétraités par des entités neuronales intermédiaires (pulvinars, corps genouillés, nerf et chiasma optiques, ganglions, ...) de sorte à restituer in fine lumière, couleurs, contrastes, relief et mouvement. Nos tempes et notre cortex visuel ne font pas le même travail et le cortex visuel, notamment la région v5, diffuse l'information à d'autres parties du cerveau, ce qui n'est pas le phénomène ici observé. On n'a pas vu la vue.

On ne peut avancer des affirmations aussi frivoles que « nous ouvrons une fenêtre sur les films projetés dans notre esprit » (Jack L. Gallant cité par Le Monde, ibidem) sans exposer l'ensemble d'une recherche absolument passionnante et révolutionnaire au risque d'être, comme c'est le cas, caricaturée - involontairement - par une presse qui, du fait de ses automatismes, en fait évidemment un douteux thriller de science-fiction : « Lire dans les pensées : bientôt possible ? » (cité en début d'article). Un désastre pour le grand public qui est ici induit en erreur.

[Conclusion : de quoi s'agit-il vraiment]

On peut par contre préciser pour conclure que cet admirable procédé de reconstruction de l'image via un IRMf et un traitement informatique nouveau inspiré des travaux de Bayes concerne très probablement des flux d'informations entre la mémoire (temporale) et le cortex visuel, donc un processus de recognition et non de cognition. L'image reconstituée tient du souvenir visuel ou peut-être d'un processus de comparaison.

En cela, elle a une valeur intrinsèque considérable : de quoi notre mémoire visuelle est-elle faite est une question ancienne à laquelle des réponses sont apportées ici de manière magistrale et bouleversante.

Nos connaissances de la composition artistique peuvent en être changées. A tout le moins seront-elles précisées.

_____

^[1] « (...) (BOLD) signals measured via fMRI are very slow (...), so it has been difficult to model brain activity elicited by dynamic stimuli such as natural movies. » A noter que "natural movies" n'est pas aisé à traduire. Il faut sans doute entendre que ces films, qui n'ont rien de naturel puisqu'on y trouve des effets spéciaux, ont juste été visionnés, sans artifices.

^[2] « We recorded BOLD signals in occipitotemporal visual cortex of human subjects who watched natural movies and fit the model separately to individual voxels. »

^[3] « Visualization of the fit models reveals how early visual areas represent the information in movies. »

^[4] « To demonstrate the power of our approach, we also constructed a Bayesian decoder (...) by combining estimated encoding models with a sampled natural movie prior. The decoder provides remarkable reconstructions of the viewed movies. These results demonstrate that dynamic brain activity measured under naturalistic conditions can be decoded using current fMRI technology. »

Cliquer sur le bouton « Précédent » de votre navigateur pour revenir dans le corps du texte.

Retour début de page

Communication