Aller au contenu

Du son au sens – vidéo

Du son au sens. Ou comment le cerveau/esprit humain passe quasi-instantanément de la perception à la compréhension du langage oral. Le Professeur Jean-Luc Nespoulous nous  commente les processus mis en œuvre tels que décrits dans différents modèles psycholinguistiques de perception et de compréhension de la parole.

Le texte ci-dessous rédigé par J.-L. Nespoulous est la retranscription de la vidéo

Introduction

Production et compréhension sont de toute évidence les deux versants cruciaux de l’activité langagière humaine, et ce à l’oral comme à l’écrit.
Pendant très longtemps, et bien avant la naissance de la psycholinguistique, ces deux versants ont été conçus comme symétriques : les modèles de la production du langage ayant pour objectif de rendre compte des processus cognitifs sous-tendant la transmutation du sens en son (à l’oral) chez l’émetteur d’un message et les modèles de la compréhension du langage devant, à rebours, spécifier les processus conduisant le récepteur à extraire du signal de parole le contenu sémantique qu’il est censé véhiculer.
Une telle symétrie se retrouve dans les premiers schémas du « circuit de la communication », que ceux-ci émanent de linguistes, de psycholinguistes ou de spécialistes en traitement de l’information : Ferdinand de Saussure (1915), Shannon & Weaver (1964), Borrell & Nespoulous (1973).
Tous ces modèles initiaux, dans leur rusticité, sont de type « séquentiel », qu’ils traitent de production ou de compréhension.

les modèles « séquentiels »

Dans leurs versions les plus récentes, bon nombre de modélisations de la production du langage (Garrett, 1980 ; Levelt, 1989) sauvegardent pour l’essentiel cette « séquentialité ». Ils reposent tous sur la mobilisation chronologique, ordonnée, de divers types de processus. Ceci étant, dans le modèle proposé avec André Borrell, dès 1973, l’accent est déjà mis sur le fait que, en compréhension, si une certaine séquentialité reste bien de mise (et incontournable) dans le traitement de l’information, il n’en demeure pas moins qu’un certain parallélisme procédural est, de toute évidence, à l’œuvre : dès qu’un premier tronçon de message peut être traité aux niveaux inférieurs (perceptifs), il est aussitôt « repris » à des niveaux plus profonds (jusqu’aux niveaux sémantique et pragmatique). On retrouve donc là en germe le traitement « incrémental » dont parle Levelt dans son modèle (1989).

S’agissant, en revanche, des modèles de compréhension des dernières décennies, ceux-ci manifestent une rupture abrupte avec une vision séquentielle du traitement de l’information. Au centre de ceux-ci se retrouve la notion de « traitement hautement interactif » dont Marslen-Wilson & Tyler (1980), dans un article célèbre, soulignent l’importance, une interactivité synchronique permettant de mieux appréhender la très grande rapidité du traitement langagier, une rapidité difficile à imaginer dans un cadre strictement séquentiel.
Pour comprendre un message, une des premières opérations consiste bien évidemment à analyser le continuum sonore qui nous parvient de notre interlocuteur. Marslen-Wilson et Tyler parlent ici de « priorité de bas en haut » : il faut bien percevoir un fragment de parole avant de se lancer dans un ensemble de processus interprétatifs de plus haut niveau, syntaxiques, sémantiques et pragmatiques. Du fait du mode de fonctionnement « incrémental » déjà évoqué, ces processus de plus haut niveau vont venir donner une première interprétation aux premiers fragments de discours perçus (mots, syntagmes), anticipant même la suite du message, au risque de déboucher, ultérieurement, sur une reconsidération de cette première interprétation partielle, si celle-ci s’avérait erronée.
De plus, les travaux sur la perception/compréhension du langage oral ont clairement démontré qu’un auditeur pouvait interpréter un message tout à fait correctement même si celui-ci est partiellement incomplet ou si certains fragments ont été masqués, par un bruit par exemple. Ceci montre bien les capacités d’anticipation et même de « restauration » du cerveau/esprit humain, y compris en situation de communication dégradée. On pourrait ici évoquer aussi brièvement la non-nécessité d’un traitement exhaustif du signal d’entrée en LECTURE cette fois. En effet, sauf chez l’enfant qui commence à déchiffrer le langage écrit, le lecteur adulte, lui, n’a pas besoin de poser son regard sur chaque lettre de chaque mot, de chaque syntagme… pour comprendre le message qu’il est en train de lire (d’où les saccades oculaires que l’on peut de nos jours enregistrer finement grâce à tout une série d’oculomètres de plus en plus sophistiqués.
Finalement, sur la base des quelques éléments que nous venons d’évoquer, on comprend bien à présent qu’un modèle de la perception/compréhension du langage ne peut s’accommoder de la notion de séquentialité. Un tel modèle se doit d’être interactif et envisager un va-et-vient constant entre « processus de bas en haut » (bottom-up, data driven, dans les termes de Marslen & Wilson) et « processus de haut en bas » (top-down, knowledge driven, chez ces mêmes auteurs).

 

Présentation d’un modèle « interactif »

Plus récemment, et directement inspiré du modèle de Hagoort (2003), Magne ( 2005) propose le modèle de la compréhension de phrases suivant :

Dans ses termes (pp. 272-274) : « Le processus de compréhension de phrases parlées peut être modélisé par trois étapes de traitement : l’identification, l’intégration et la fixation.

Les deux premières étapes, identification et intégration, sont réalisées pour chaque mot présenté, tandis que l’étape de fixation ne se produit que lorsque le dernier mot de la phrase a été présenté. En outre, lors de chaque étape du traitement, des informations de nature syntaxique, sémantique et prosodique sont mobilisées en même temps, se complètent et éventuellement se compensent.
Lors de l’étape d’identification des mots, la prosodie permet un découpage du signal de parole en mots ou groupe de mots, facilitant ainsi l’accès au lexique. De plus, des facteurs syntaxiques, tels que la catégorie grammaticale et les règles d’accords, interviennent également.
Ces mots, ou groupes de mots, sont ensuite intégrés au fur et à mesure afin de construire une représentation cohérente de l’énoncé. Lors de cette étape d’intégration, les aspects syntaxique et sémantique seraient en étroite interaction afin d’élaborer les relations actancielles, ou thématiques (c’est-à-dire : qui fait quoi à qui…), entre les différents éléments de l’énoncé. La représentation partielle de l’énoncé, élaborée lors de l’étape d’intégration, permettrait, en outre, de susciter des attentes (i.e. anticipations) sur les mots qui vont suivre. Ces attentes peuvent éventuellement être modulées par deux autres types d’informations : le contexte dans lequel l’énoncé est présenté, et la tâche (dans le cas d’une expérience) qui focalise l’attention de l’auditeur sur un niveau de traitement particulier.
Enfin, l’étape de fixation intervient lorsque la fin de la phrase est signalée, par exemple, grâce à un allongement syllabique ou par une pause ».

La compréhension « au-delà des mots »

S’il est bien évident que l’extraction du contenu d’un message passe par la reconnaissance et le décodage des mots qui le composent de même que par le traitement de leur agencement syntaxique, il est non moins clair que son interprétation finale nécessite la mobilisation d’autres types de représentations et de processus, lesquels conduisent inéluctablement le décodeur à se détacher de la forme immédiate, littérale, du message pour inférer certaines informations qui n’y figurent pas explicitement.
Prenons à présent quelques exemples de processus inférentiels particulièrement importants pour la bonne compréhension d’un message et de sa portée :

1. le contexte linguistique

Comme nous l’avons brièvement évoqué précédemment, avec la citation de Cyril Magne, le décodeur doit être capable de gérer à tout moment (a) les informations anciennes (= celles qu’il a déchiffrées, au moins à un premier niveau, quelques instants auparavant) et (b) les informations nouvelles. Ainsi, une même phrase ne sera pas décodée de la même façon selon le contexte discursif dans lequel elle est prononcée.
Exemple : « Il finit par acheter la Dépêche du Midi » dans le contexte A vs. B ci-dessous :
Contexte A : « A la Maison de la Presse, souhaitant acheter un journal, Pierre hésita. Il finit par acheter … » (i.e. l’exemplaire du jour du journal).
Contexte B : « Pierre venait de faire un gros héritage. Longtemps, il se demande comment il pourrait investir cet argent. Il finit… » (i.e. l’entreprise dans son ensemble).

2. la situation d’énonciation

La compréhension d’un message, en situation de dialogue tout particulièrement, passe également très souvent par la mise en relation de celui-ci avec la situation dans laquelle il est énoncé.
Exemple : « Je vous invite ici demain »
La compréhension d’un tel message ne peut s’opérer sans que ne soit pris en compte (a) la personne qui dit « je », (b) la ou les personne(s) qui correspondent au « vous », (c) le lieu dans lequel le message est produit et (d) le moment (présent) où le message est énoncé (permettant ainsi de comprendre le sens de « demain »). Un tel message est donc ininterprétable « hors situation »

3. l’appréhension de l’intentionnalité du locuteur

Tel que nous venons de le rappeler, le langage humain ne se limite pas à la seule manipulation de la Grammaire de telle ou telle langue. Comprendre un message, c’est tout autant appréhender la portée (l’intentionnalité) que le locuteur souhaite lui conférer. Dans les termes d’ Austin et de Searle, c’est donc saisir tout à la fois son contenu propositionnel (« p ») et sa force illocutoire (« F »), et ce d’autant plus que les « actes de parole » sont loin d’être tous « directs ».
Exemple :
« As-tu du feu ? » appelle éventuellement le décodeur à dire « oui » mais également, et surtout, à donner du feu à celui qui a posé la (fausse) question.

En bref, au-delà de la seule mobilisation des processus requis pour le traitement des éléments linguistiques explicités dans un message, la compréhension, pleine et entière, de ce dernier requiert que soient effectuées les bonnes inférences permettant d’extraire sa substantifique moelle, sa portée, sa fonction pragmatique in situ. Force est alors de constater que la plupart des modèles existants tendent à minimiser, voire à négliger, ces divers paramètres pragmatiques. Il est vrai qu’il y a là un véritable défi !
Ceci étant, à ne pas tenter ce dernier, on condamnerait nos modélisations à ne rendre compte que d’une partie de l’histoire !!!

Note : La totalité des éléments utilisés dans ce document émanent de diverses publications de leur auteur et mentionnent explicitement les sources issues des travaux d’autres auteurs.

Cette vidéo a été enregistrée à l’Université Toulouse Jean-Jaurès lors de la réalisation du Mooc Sons Communication et Parole. Seuls des extraits ont été publiés dans le Mooc en raison des contraintes liées au format « cours scénarisé » de ce genre de production. Vous bénéficiez ainsi de l’intégralité du propos de J.-L. Nespoulous. En tout, quatre vidéos seront publiées sur les thèmes qu’il a abordés dans cette ressource numérique.

Vous trouverez ici la présentation de l’auteur ainsi que la première vidéo qu’il m’a fait l’amitié de confier à Au son du fle 

Photo credit: All Kinds of New on VisualHunt.com

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Abonnez-vous à l'infolettre

afin de recevoir les nouveaux articles du blog

Bienvenue!

Pin It on Pinterest

Share This