Pour commencer, donnons un lien vers le résumé de la
publication (en anglais) :
cliquer ici. [Si ce lien ou la vidéo YouTube cessaient de fonctionner, merci de
nous le signaler, nous mettrions en ligne des
copies de sauvegarde]
Ainsi, un nouveau "modèle procédural" (un algorithme donnant lieu à
un programme informatique) mis au point par cette équipe permet de
décrire, sur la base d'examens IRMf (lien
vers une recherche Google), les écarts de signaux magnétiques émis, dans
le cerveau, par le sang qui est plus ou moins oxygéné en fonction des
stimulations électrochimiques en provenance, en l'occurrence, de l'appareil
visuel. En fait c'est surtout le mouvement de ces "écarts BOLD" (blood-oxygen-level
dependent, « dépendant du niveau d'oxygène sanguin ») qui révèle
indirectement l'activité neuronale par le biais de l'activité magnétique
des noyaux d'hydrogène (protons) du système neurovasculaire cérébral.
Ce modèle peut décrire des stimulations provoquées par le visionnement
d'images animées, ce qui est nouveau. Dans l'exemple ci-dessus, il s'agit de
vidéos hollywoodiennes. Il fallait en quelque sorte, pour ces chercheurs,
expliquer comment en temps réel - c'est la véritable nouveauté - ces
informations sont représentées dans les régions corticales visuelles (non
loin de la nuque) et temporales (mémoire) : « les signaux BOLD mesurés
par IRMf sont très lents (...), donc il a été difficile de modéliser
l'activité cérébrale suscitée par des stimuli dynamiques tels que des films
naturellement visionnés. » [1].
Le résultat est un ensemble d'aperçus (insights) tridimensionnels de
représentations mentales "décodées" : « Nous avons enregistré des signaux
BOLD dans le cortex occipitotemporal de sujets humains qui visionnaient
naturellement des films et ajusté le modèle séparément à des voxels
individuels. » [2], voxel signifiant
pixel volumétrique, c'est-à-dire tridimensionnel.
« La visualisation du modèle ajusté révèle combien les régions
visuelles primaires représentent l'information des vidéos. » [3]
« Pour démontrer la puissance de notre approche, nous avons aussi
construit un décodeur bayesien [de Bayes, inventeur d'un audacieux théorème
de calcul analytique probabiliste au XVIIIème siècle] (...) en
combinant des modèles d'encodage probabilistes avec un film préalablement
visionné. Le décodeur a fourni de remarquables reconstructions des films
vus. Ces résultats démontrent que l'activité cérébrale dynamique mesurée
dans des conditions naturelles peut être décodée grâce à la technologie
IRMf. » [4]
[Analyse critique]
Fort bien ! Et les résultats sont absolument remarquables. Un travail de
haut vol.
Cependant, c'est très clair : cela ne fonctionne qu'avec des sujets
ayant déjà vu la vidéo - on citera au passage le Nouvel Observateur « le
programme ne peut reconstruire que des films que les scientifiques
connaissent au préalable » - et l'analyse concerne les lobes
temporaux et corticaux, donc la mémoire et
l'appareil visuel. Alors de quoi parle-t-on : de vision ou de mémoire
visuelle ?
La vue vient à la conscience, dit-on, lorsque l'information située dans
le cortex visuel "arrose" (ou active) de nombreux autres lobes
cérébraux. L'étude dont il est question ici évoque le cortex
"occipitotemporal".
Les lobes temporaux ont
d'innombrables fonctions, toutes très importantes. Ils sont notamment le
dictionnaire et la grammaire de notre pensée, mais plus fondamentalement
la mémoire auditive, visuelle et linguistique.
Ils ne peuvent être confondus avec le cortex visuel où cinq régions
(dites v1 à v5) analysent et reconstruisent (ou plutôt construisent) une
image mentale très fine à partir des flux photoniques reçus de manière
brute par les opsines et le rétinal (lire
passage in La vue) et prétraités par des entités neuronales
intermédiaires (pulvinars, corps genouillés, nerf et chiasma optiques,
ganglions, ...) de sorte à restituer in fine lumière,
couleurs, contrastes, relief et mouvement. Nos tempes et notre cortex
visuel ne font pas le même travail et le cortex visuel, notamment la
région v5, diffuse l'information à d'autres parties du cerveau, ce qui
n'est pas le phénomène ici observé. On n'a pas vu la vue.
On ne peut avancer des affirmations aussi frivoles que « nous ouvrons
une fenêtre sur les films projetés dans notre esprit » (Jack L.
Gallant cité par Le Monde, ibidem) sans exposer l'ensemble d'une
recherche absolument passionnante et révolutionnaire au risque d'être,
comme c'est le cas, caricaturée - involontairement - par une presse qui, du fait de ses
automatismes, en fait évidemment un douteux thriller de science-fiction : « Lire dans les pensées : bientôt possible ? »
(cité en début d'article). Un désastre pour le grand public qui est ici
induit en erreur.
[Conclusion : de quoi
s'agit-il vraiment]
On peut par contre préciser pour conclure que cet admirable procédé de reconstruction
de l'image via un IRMf et un traitement informatique nouveau inspiré des travaux
de Bayes concerne très probablement des flux d'informations entre la
mémoire (temporale) et le cortex visuel, donc un processus de
recognition et non de cognition. L'image reconstituée tient du souvenir
visuel ou peut-être d'un processus de comparaison.
En cela, elle a une valeur intrinsèque considérable :
de quoi notre mémoire visuelle est-elle faite
est une question ancienne à laquelle des réponses sont apportées
ici de manière magistrale et bouleversante.
Nos connaissances de la composition artistique
peuvent en être changées. A tout le moins seront-elles précisées.
_____
[1] « (...)
(BOLD) signals measured via fMRI are very slow (...), so it has been
difficult to model brain activity elicited by dynamic stimuli such as
natural movies. » A noter que "natural movies" n'est pas aisé à
traduire. Il faut sans doute entendre que ces films, qui n'ont rien de
naturel puisqu'on y trouve des effets spéciaux, ont juste été visionnés,
sans artifices.
[2] « We
recorded BOLD signals in occipitotemporal visual cortex of human
subjects who watched natural movies and fit the model separately to
individual voxels. »
[3] « Visualization
of the fit models reveals how early visual areas represent the
information in movies. »
[4] « To
demonstrate the power of our approach, we also constructed a Bayesian
decoder (...) by combining estimated encoding models with a sampled
natural movie prior. The decoder provides remarkable reconstructions of
the viewed movies. These results demonstrate that dynamic brain activity
measured under naturalistic conditions can be decoded using current fMRI
technology. »
Cliquer sur le bouton
« Précédent » de votre navigateur pour revenir dans le corps du texte.
Retour
début de page