samedi 15 octobre 2011

Un bébé dans l'amphi

Voici une petite expérience de pensée : prenons un très jeune nourrisson qui n'a pas encore appris à parler, et mettons le dans un amphi d'université, dans lequel a lieu un cours magistral proféré par un professeur qui n'accomplit aucune action, ne fait aucun geste. Tout au plus le professeur peut-il s'adresser à ses étudiants, leur poser des questions, et ceux-ci sont libres de répondre ce qu'ils veulent. Mais eux aussi n'ont pas le droit de faire des gestes. Ainsi, dans ce dispositif, le nourrisson entendra des paroles, mais seulement des paroles, aucun geste, ni action. Maintenant, demandons-nous combien de temps mettra l'enfant avant de savoir parler la langue utilisée dans l'amphithéâtre. Ma réponse à cette expérience est qu'il ne parviendra jamais à maîtriser cette langue, jamais il ne la comprendra. On pourrait laisser l'enfant dans la salle un temps infini, cela ne changerait rien à ce constat. Et cela n'a aucun rapport non plus avec le niveau de langue utilisé, ou la difficulté des propos. Le professeur pourrait utiliser un vocabulaire de deux cents mots, faire des phrases dont la syntaxe est minimale, mais le nourrisson ne pourrait toujours pas les comprendre (alors même que le nourrisson est capable d'apprendre une centaine de mots par jour!).
Pour quelle raison le nourrisson ne pourrait-il pas apprendre cette langue, même en restant un temps infini avec des personnes qui l'utilisent? Parce qu'apprendre une langue consiste à en connaître le sens, et connaître le sens d'une phrase signifie savoir quand on peut l'utiliser, et quand on ne peut pas. La signification d'une phrase est son usage (l'usage pouvant être les circonstances dans laquelle elle est vraie, si on veut décrire la réalité, mais aussi donner un ordre, saluer, conduire un raisonnement, etc.). Or, dans un contexte où le langage est justement utilisé en dehors de tout contexte (c'est la spécificité même de l'école : le seul contexte où le discours se retrouve détaché de son contexte), alors l'apprentissage de la langue n'est plus possible. Ne pouvant pas comprendre dans quel contexte une phrase peut être employée, l'enfant ne pourra jamais avoir l'idée du sens de cette phrase. L'enfant entend des phrases, des réponses, de longues tirades, etc. mais jamais il ne peut attacher ces phrases à des situations, des conditions de vérité. Pour l'enfant, la langue tourne à vide, tout peut être dit à n'importe quel moment. C'est pourquoi il ne pourra jamais apprendre une langue en restant dans cet amphi. Pour tirer profit des paroles qui s’échangent dans de tels lieux, où la parole circule indépendamment de tout contexte, il faut avoir une maîtrise préalable de la langue, donc avoir déjà associé les phrases que l'on utilise à des conditions contextuelles précises. 
Néanmoins, supposons que le nourrisson soit extrêmement attentif à tout ce qui se dit, notamment en ce qui concerne les séquences de mots et de phrases, et qu'il finisse par repérer certaines régularités dans leurs apparitions. Il remarquera par exemple que les phrases commençant par "est-ce que" entraînent une réponse de la part des étudiants, qui répondent à cette phrase toujours en commençant par "oui" ou par "non". Il remarquera peut être ensuite que certains termes sont toujours précédés par un très petit nombre de termes : il aura découvert la catégorie grammaticale des noms communs et des déterminants. S'il assiste à un cours sur Platon, il remarquera bien vite que les mots "nul n'est méchant" sont toujours suivis de "volontairement". Bref, l'enfant qui serait extrêmement attentif pourrait parvenir à découvrir les structures grammaticales de la langue, ainsi que peut-être, l'enchaînement de certaines phrases ou de certaines expressions qui reviennent souvent.

Ce dernier point est de grande importance pour comprendre ce qu'est la pensée, et il a été abondamment discuté dans le cadre des débats sur les ordinateurs. En effet, un ordinateur est dans la même situation que cet enfant très attentif, qui finirait par avoir une connaissance parfaite de la syntaxe de la langue, et de toutes les séquences normales de mots et de phrases. L'ordinateur puissant serait capable de réécrire un cours complet sur Platon juste en se servant des phrases qu'il a pu capter en assistant aux séances dans l'amphi. Pourtant, intuitivement, nous sentons bien que cet ordinateur qui produit des phrases seulement en tenant compte de considérations syntaxiques et de l'apparition statistique des mots et des phrases ne connaît pas vraiment cette langue, il n'en comprend pas le sens, il ne pense pas. Mais que lui manque-t-il donc?
La réponse est tellement simple, alors que le sujet a été tellement discuté, que je me dis que je dois faire erreur. Pourtant, comment rejeter cette réponse? La réponse est simplement que l'ordinateur ne dispose pas d'un système sensoriel lui permettant de retrouver les conditions contextuelles de l'utilisation des phrases et expressions qu'il utilise. Il dispose des conditions linguistiques (ce que nous indique la grammaire), mais pas de l'usage des phrases. Il sait que les noms communs doivent être mis après un déterminant, il sait que "nul n'est méchant" doit être suivi de "volontairement", mais il ne sait pas ce que signifient les mots qu'il utilise. Bref, il ne parle pas, il n'est qu'une machine de traitement et de production de sigles vocaux ou écrits. 
Ainsi, que faut-il pour parler? Il faut d'une part une capacité de recevoir et de produire des signes, donc un système d'entrée et de sortie de l'information, mais il faut encore au moins une deuxième entrée d'information, afin que la première entrée puisse être corrélée avec la seconde. Cette corrélation constitue justement la signification. Un mot ne prend son sens que parce que l'enfant humain est capable de corréler une certaine information sonore avec une situation visuelle, tactile, gustative ou olfactive. S'il n'avait pas au moins deux canaux d'entrée de l'information, jamais l'enfant ne pourrait comprendre le contexte d'usage des mots, jamais il ne comprendrait le sens des informations qui lui viennent par le premier canal. L'enfant touche un cube de la main, sa mère lui dit "cube", et il a ainsi appris à utiliser ce mot. Alors que cent mille ans de discussions mathématiques sur le cube ne suffiraient pas à l'enfant pour comprendre ce que signifie le mot "cube".

Ainsi, on peut distinguer de manière tranchée l'enfant virtuose, qui, enfermé dans un amphi, aurait appris à reproduire des suites de mot de manière parfaitement acceptable pour toutes les autres personnes présentes, et l'enfant ordinaire, qui a appris la langue comme nous tous. Le dernier parle vraiment, le premier ne fait que manipuler des signes sans les comprendre. Il lui manque tout simplement un deuxième canal d'information, qui lui aurait permis de mettre en relation les mots et les situations, d'établir les conditions d'usage des mots. Alors que le second, utilisant ses cinq canaux d'information, est capable de comprendre tout ce que les hommes peuvent dire.
Le problème de la parole (et de la pensée) des ordinateurs est donc résolu : un ordinateur pourra parler lorsqu'il disposera d'un dispositif de perception de la réalité, quel qu'il soit, de façon à attacher les informations qui lui sont envoyées par l'utilisateur ou le programme, avec les éléments pertinents de la réalité qu'il aura relevés grâce à ce dispositif. Un ordinateur avec une webcam, à qui on envoie l'information "Maman", chaque fois qu'une personne passe dans son champ de vision, apprendra à parler aussi bien que tous les nourrissons de l'espèce humaine.

2 commentaires:

  1. Je pense qu’il manque à ton ordinateur le désir, ainsi qu’une certaine motricité, corrélative à l’apprentissage du sentir. Je crois que le sens ne prend sens qu’au sein d’un projet (qui commence avec celui de persévérer dans son être). A la limite, le fait que l’ordinateur associe tel être vivant, détecté avec une webcam, avec le mot « Maman » constituerait pour cet ordinateur une simple redondance : pourquoi y aurait-il pour lui plus de sens dans une image que dans un mot (tous deux traduits en langage binaire pour lui…) ? Je ne crois pas qu’une image soit plus porteuse de contexte pour l’ordinateur que des mots. L’association de deux images ou de deux mots ou encore d’un mot et d’une image, est, je crois, à son niveau, équivalente, en tant qu’il ne « veut » rien en faire.

    On peut toujours lui faire faire des associations, mais le sens sera dans ce que vise un être vivant à partir de tout cela : est-il utile de retenir ceci ou cela pour satisfaire mes besoins ou mes désirs ? Que m’importe que tel être vivant passe devant moi si je ne fais que retenir son nom pour retenir son nom ? Le sens de ce passage réside dans la relation que j’entretiens avec cet être, le passage d’une mère devant son nourrisson peut le rassurer, etc. Pour que l’ordinateur comprenne ce que cela signifie, il faudrait non seulement qu’il soit affecté…mais aussi qu’il perçoive tout le contexte, ce qui présuppose une motricité (là-dessus, voir La phénoménologie de la perception de Merleau-Ponty ).

    Ce qui, à mon sens, manquerait surtout au nourrisson dans l’amphi que tu décris au début de l’expérience de pensée est certes un contexte, mais que ce contexte soit son contexte (qu’il se trouve impliqué dans une situation d’énonciation). On sait que les enfants apprennent plus vite si on s’adresse à eux, si on les implique dans une conversation, du moins dans des échanges, que si l’on procède à des associations devant eux (il faut en moyenne faire six fois une association qui ne les concerne pas dans ce sens pour qu’un tout-petit retienne ce qu’il aurait retenu en une fois si l’on s’était adressé à lui ; référence : un documentaire scientifique critique sur la chaine Baby First, destinée aux nourrissons).

    Bref, pour apprendre à parler, il faut(entre autres conditions)être en présence d'un contexte, cet apprentissage étant plus rapide si le contexte nous concerne; l'ordinateur ne peut percevoir de contexte, de plus, il me semble qu'aucun contexte en particulier ne fait sens pour lui, et qu'il n'accède pas au sens, puisqu'il est purement mécanique et n'accède pas à la notion d'intérêt.(l'enfant a un intérêt à apprendre à parler, pour mieux comminiquer avec ses semblables, tandis qu'un ordinateur peut bien être programmé pour apprendre un langage, même si les modalités de cet apprentissage doivent être discutées, mais il n'accèdera jamais au sens en tant qu'il y est tout simplement indifférent, ou plus exactement "insensible").

    RépondreSupprimer
  2. Mille fois d'accord, et tu fais bien de m'envoyer cette piqure de rappel contre l'intellectualisme auquel j'ai succombé en écrivant ce post. En effet, jamais le fait d'avoir une seconde source d'information ne constituera un contexte tant que cette seconde source d'information n'est pas associée à des besoins, des intérêts, des actions finalisées. Il ne suffit pas d'avoir établi une correspondance des sons et des images pour savoir parler. Il faut encore savoir quoi faire avec le langage, et donc savoir ce que l'on veut obtenir. Mon pauvre ordinateur qui dirait Maman chaque fois qu'une certaine personne passe devant la caméra ne maîtrise pas ce mot. Imaginez un enfant de cinq ans qui prononce continument Maman chaque fois que sa mère est présente! Mon ordinateur maîtrisera donc le langage seulement lorsqu'il comprendra que ce mot sert aussi à évoquer la personne en son absence, sert aussi à l'appeler pour qu'elle vienne, sert à attirer son attention quand elle est présente, etc., et que ce mot peut aussi ne pas être utilisé, quand on veut dire des choses plus importantes! En effet, un langage est une ressource pour des activités liées à des besoins, et pas un stock de signes corrélés à d'autres signes venant d'une deuxième source. Comme tu le dis, des signes corrélés au monde sont simplement redondants, tant que l'être n'investit pas par des désirs et des projets les choses de ce monde.

    Donc, si je puis corriger les horreurs que j'ai écrites plus haut, je dirais la chose suivante : un être, quel qu'il soit, peut parler s'il dispose d'au moins deux dispositifs d'entrée et de sortie de l'information (un pour les paroles, un autre pour le monde), mais aussi un autre dispositif d'évaluation de la qualité des états (nous humains parlerions de plaisir et de peine, de bonheur et de malheur). L'être qui sait parler utilise le langage dans l'optique d'arriver à un état désirable. Généralement, cet état de plaisir ou de peine dépendra de l'état du monde, donc l'être emploiera le langage afin de produire, dans le monde, les circonstances le mettant dans le meilleur état possible.

    RépondreSupprimer