[MUSIQUE] [MUSIQUE] Dans la séquence précédente, nous avons vu comment nous pouvons utiliser l'eye-tracking pour mesurer des processus assez contenus, comme par exemple l'orientation sociale ou la réponse à l'attention conjointe. Mais dans la vie au quotidien, les interactions sociales sont souvent plus complexes. On n'a pas uniquement une personne qui est en train de nous regarder à travers l'écran, il peut y avoir plusieurs personnes qui sont en train d'interagir en même temps. On peut aussi utiliser l'eye-tracking pour répondre à la question de comment la personne comprend ces interactions sociales. C'est le processus qu'on appelle cognition sociale. Pour discuter de ça aujourd'hui, nous sommes avec Nada, qui s'intéresse beaucoup à cette question. Nada, est-ce que tu pourrais nous dire ce qui est intéressant dans la perception des interactions sociales et comment on peut faire ça avec l'eye-tracking? >> La manière dont on perçoit une interaction sociale, on pense, peut aussi avoir une influence sur la manière dont on interagit. Si par exemple on est un peu inconscient des indices qui viennent des yeux, alors on va les rater aussi probablement dans une interaction sociale. Ce qui est aussi très important c'est que pour les personnes avec un TSA qui n'ont pas accès au langage, c'est peut-être la seule manière de savoir quelle est leur manière de voir le monde social. >> Est-ce qu'on pourrait peut-être regarder ensemble une séquence d'eye-tracking et puis la commenter? >> Je propose qu'on voie ensemble une séquence du film Le Deuxième Souffle, qui a été visionné d'abord par un adolescent âgé de 17 ans qui ne présentait pas de symptômes TSA, et ensuite, on va voir la même séquence visionnée par un enfant qui présentait un TSA. [BRUIT] [BRUIT] >> Merci. [BRUIT] >> J'ai des nouvelles. C'est pour les papiers. Il faut deux photos. Je file à Paris et je me démerde avec le rouleau. Maintenant, autre chose. 200 millions, ça te dirait? Des gars qui ont besoin qu'on leur prête la main. Et la part de chacun, c'est 200 millions. >> 200 briques? Parce qu'à toi, 200 briques, ça ne te plaît pas? >> Il y a trop de risque. Je suis trop vieux. >> Ben, elle est bien bonne celle-là ! Et Gu, alors? Pour lui, il n'y a pas de risque? Demande-lui donc si avant la guerre [INCOMPRÉHENSIBLE] de garage. >> Je ne suis pas mort, moi. >> Et ton ami Roger? Il joue aux billes, peut-être? >> Personne ne l'avait obligé à venir. >> Toi non plus, personne ne t'oblige à faire des conneries. >> Moi, ce n'est pas pareil, je n'ai pas le choix, figure-toi. >> Ça ne se passera pas comme ça. Tu n'iras pas. Tu entends? >> Ton affaire, tu peux me dire qui? >> Paul. Paul Ricci. >> Paul? [INCOMPRÉHENSIBLE] >> D'accord. >> Si j'avais connu la suite, ce n'est pas à toi que je me serais adressé, tu peux me croire. >> Écoute, Manouche! >> Ce qui est très intéressant sur cette vidéo, on voit que l'attention de cet adolescent est tellement flexible. Pas seulement qu'il va répondre aux indices des différents personnages, mais il va aussi anticiper. Il s'agit d'une scène relativement complexe aussi au niveau verbal, au niveau émotionnel. Il y a des émotions assez fortes, et on voit que la façon dont il emploie son attention est très, très efficace. >> Oui. On voit effectivement qu'il est extrêmement rapide dans ses saccades visuelles. Et alors, pour un adolescent qui serait sur le spectre de l'autisme? >> Ce qu'on voit sur cette même scène, c'est que lui, il va focaliser d'autres choses. Il va aussi regarder tous les trois personnages, ce qui est très bien, mais il y a un long moment où il va focaliser le personnage qui se trouve plutôt à droite de l'écran. Il va aussi faire beaucoup attention dans la zone de la manche. On ne voit pas ce qui se passe, ce n'est pas une zone qui nous paraît très intéressante, et pourtant il va y passer beaucoup de temps. Parail aussi pour le collier de la femme qui est sur la scène, il va observer longuement le collier. Ces détails semblent être des détails qui prennent son attention, et l'attention n'est pas si flexible comme chez l'adolescent qu'on vient de voir. >> Moi, ce qui me frappe, c'est ces moments où on voit que la taille du rond est en train d'augmenter, c'est-à -dire qu'il est en train de fixer ça de manière prolongée. Ça, c'est quoi? >> Il s'agit d'un emploi d'attention qu'on ne trouve pas fonctionnel toujours, c'est l'attention plutôt gluante. Lui, il passe beaucoup de temps sur cet endroit-là , et on n'est pas sûr qu'il s'agisse d'un vrai investissement attentionnel. Ce qu'on pourrait faire par la suite, c'est voir au niveau de la dilatation des paupières, est-ce qu'il y avait vraiment un investissement attentionnel ou pas sur ce moment, ou il s'agit vraiment d'une absence. >> Du coup, il était pris dans quelque chose d'autre, et il n'arrivait plus à suivre cette interaction sociale? >> Pris par ce détail, ou peut-être complètement absent par moments. C'est la réponse qu'on peut chercher par la suite. >> Là , ce que tu nous a montré, c'est une séquence qui est relativement complexe, dans laquelle il y a un langage avec des sous-entendus, il y a beaucoup d'interactions qui sont assez subtiles sur le plan non verbal. Pour des enfants qui sont plus petits, comment est-ce qu'on fait ça? >> Pour ces enfants-là , notre premier objectif c'est de capter leur attention, donc on ne va pas forcément choisir des scènes si complexes, si intenses émotionnellement aussi. On va choisir quelque chose qui leur parle : des dessins animés ou des scènes plus simples, plus ralenties. >> Et puis après, une fois que tu as enregistré ces moments dans lesquels soit un adolescent, soit un enfant est en train de regarder l'écran, comment est-ce qu'on fait des analyses quantitatives? >> On a une grande littérature qui nous montre que l'emploi d'attention dans la population avec un TSA est atypique, et donc, on sait que ces personnes-là vont moins regarder le visage, et s'ils regardent le visage, ils vont focaliser plutôt la bouche par rapport aux yeux. Du coup, ce qu'on peut faire c'est qu'on peut prédéfinir ces régions d'intérêt, et ensuite, chaque fixation qui se trouve dans ces régions qu'on a prédéfinies va être considérée différemment par rapport aux régions qu'on n'a pas définies. >> Donc, il faut qu'on ait un a priori sur quelles sont les régions qui sont intéressantes? >> C'est très utile, mais par contre, il faut avoir l'a priori. Il faut savoir où une idée s'arrête et l'autre commence. Par exemple, qu'est-ce qu'on va faire avec la partie plutôt centrale du visage. Une autre chose qui est très importante pour l'attention visuelle, c'est qu'elle est très dépendante du contexte. Par exemple, si on est en train de voir deux personnes qui interagissent, on va plutôt faire attention à leurs visages. Alors que si ces deux personnes sont présentes dans une scène mais n'interagissent pas, elles sont en train de manipuler un objet ou des objets, on va plutôt focaliser les mains, parce que ce sont les mains qui sont très pertinentes à ce moment-là . Du coup, avec cette approche qui est plutôt a priori, on risque de passer à côté de ces choses, de ces subtilités. >> Est-ce qu'il y aurait d'autres approches qui ne sont pas a priori? >> On a des approches qu'on peut considérer plutôt data driven, où on va partir de données. On va prendre nos données, et ensuite, on va laisser à côté nos a priori. Par exemple, si on regarde une scène relativement simple de deux enfants qui sont en train d'interagir, il y a les objets, il y a les enfants qui interagissent. Il n'y a pas trop de langage verbal. C'est plus une communication non verbale. Ce qu'on pourrait faire c'est qu'on peut faire une agrégation de toutes les données visuelles qui appartiennent à un groupe témoin qui ne présente pas les symptômes, les mettre ensemble et faire une sorte de heatmap, et ensuite voir comment l'attention cette fois d'une population qui ne présente pas les symptômes se déplace. Ce qui est assez frappant c'est qu'elle n'est pas toujours au visage, elle n'est pas seulement dans les objets, elle est très dynamique. Il y a des moments où les objets sont très pertinents, parce que des fois, les objets sont le focus d'attention entre les deux personnages, et il y a des moments où un visage est plus important que l'autre. C'est vraiment dans la temporalité aussi qu'on trouve l'essence. >> Ce que tu nous dis là , c'est qu'on a souvent cet a priori de se dire : ce qui est intéressant, c'est le stimulus social, c'est-à -dire, est-ce qu'on est en train de regarder dans les visages ou dans les yeux. Mais en fait, il y a tout un autre ensemble qui se passe dans la séquence à ce moment-là , comme la rapidité avec laquelle on regarde un objet plutôt qu'un autre. Est-ce qu'il y aurait d'autres facteurs que le manque d'orientation sociale, qui pourraient expliquer pourquoi une personne qui est sur le spectre regarde une scène différemment qu'une autre, quelque chose qui n'est pas uniquement : il n'est pas intéressé par l'information sociale? >> Les résultats de méta-analyses récentes montrent qu'effectivement, dans l'autisme, on parle d'une attention sociale diminuée, donc il y a moins d'intérêt pour les stimuli plutôt sociaux. Mais lorsqu'elle est employée sur les stimuli sociaux, elle est différente, effectivement. Par exemple, s'il y a une interaction et si les personnes qui ne présentent pas les symptômes voient cette interaction, au moment où ils regardent les visages, les pupilles vont montrer une dilatation. Ça ne va pas être forcément le cas chez les personnes avec un TSA, ce qui nous montre déjà qu'au niveau de l'engagement attentionnel sur le contenu social, on ne parle pas de la même chose forcément. Il y a aussi des choses de l'ordre plutôt de la complexité sociale. On sait que l'attention sociale est assez comparable entre les personnes avec et sans TSA lorsqu'il s'agit de contenu social relativement simple, c'est-à -dire une seule personne qui parle ; alors que s'il y en a deux ou trois qui interagissent, là , ça devient beaucoup plus complexe. >> Et s'il y a des distracteurs ou d'autres choses dans la salle? >> Souvent, on voit que l'attention de ces personnes-là n'est pas du tout immune aux distracteurs, et surtout si ces distracteurs tombent un peu dans les intérêts de la personne, par exemple un avion ou des objets assez mécaniques, des trains, des choses comme ça. Ça peut biaiser. >> Du coup, ça va amener une compétition vis-à -vis du stimuli social et plus d'intérêt pour l'objet d'intérêt. >> Et on sait aussi que cette attention qui est plutôt menée par des mécanismes exogènes, par ce qui est saillant dans l'environnement, que ce sont des mécanismes très présents dans l'autisme, que les contrastes d'intensité, toutes ces propriétés très physiques peuvent influencer l'attention. >> Donc, au total, il y a vraiment énormément de processus qui rentrent en jeu. Et avec ce type de méthodes dont tu nous a parlé, quelles sont les méthodes qui sont basées sur des régions d'intérêt, ou les méthodes qui sont plus data driven, donc dans lesquelles on va regarder comment un ensemble d'adolescents qui ont un développement typique regardent la scène et comparer une personne par rapport à ça. Mais il y a pas mal de potentiel de pouvoir extraire une mesure précise qui corrélerait avec des symptômes? Est-ce que ça commence à se faire? >> Ça commence à se faire, et aussi, la compréhension, je pense qu'elle est dans des études plus longitudinales. Parce que c'est très différent de voir une personne une seule fois par rapport à pouvoir la suivre et voir aussi comment son attention se développe. Donc, ce que nous on commence à voir dans nos études, c'est qu'avec l'âge, chez les enfants avec un développement typique, on voit que l'attention commence à être synchronisée, qu'à chaque instant d'une vidéo, les enfants avec un développement typique vont presque savoir ce qu'il faut regarder, et avec l'âge, ça va être de plus en plus précis. Par contre, on ne voit pas du tout le même processus dans une population avec un TSA. On voit une grosse hétérogénéité, et cette hétérogénéité, elle a tendance à augmenter avec l'âge. Et probablement, comme ce qu'on a appris, ce sont les distractions aussi qui influencent pas mal. >> Concrètement, ce qu'on a vu c'est que ce type d'études étaient extrêmement importantes parce qu'elles pouvaient nous amener des mesures non biaisées de la cognition sociales, dans lesquelles on arrive à avoir une valeur quantitative de ce qu'une personne est en train de comprendre d'une interaction sociale. Ça, c'est vrai que ça amène pas mal de potentiel dans le domaine de l'autisme, parce qu'on peut imaginer que ça puisse nous aider, à la fois à diagnostiquer un autisme, et éventuellement plus précocement si on a des stimuli qui sont adaptés comme on vient de le voir, ou même à pouvoir avoir des mesures reproductibles au cours du temps pour mesurer l'évolution des symptômes chez ces enfants, ces adolescents, ou ces adultes. [MUSIQUE] [MUSIQUE] [MUSIQUE]