_: | Université de Savoie U.F.R . Lettres , Langues et Sciences Humaines Les réseaux de neurones écologiques : leurs apports à la compréhension et à la simulation de phénomènes psychologiques Thèse de doctorat nouveau régime mention Psychologie présentée et soutenue publiquement le 19 décembre 2003 par Adeline PAIGNON Laboratoire de Psychologie et NeuroCognition ( CNRS , UMR 5105 ) Ecole doctorale Sciences de l' Homme , des Humanités et de la Société Directeur de Thèse : Serge CARBONNEL , Professeur à l' Université de Savoie ( Laboratoire de Psychologie et NeuroCognition , Grenoble-Chambéry ) Co-directeurs : Olivier DESRICHARD et Thierry BOLLON , Maîtres de Conférences à l' Université de Savoie ( Laboratoire de Psychologie Sociale , Grenoble-Chambéry ) Membres du jury Nicole Dubois , Professeur à l' université de Nancy II Bernard Amy , Ingénieur recherche au CNRS , IMAG Yannick Blandin , Professeur à la faculté des Sciences du Sport de Poitiers Frank van Overwalle , Professeur à Vrije Universiteit Brussel Sommaire PREAMBULE L' intérêt grandissant des chercheurs en psychologie pour l' utilisation des modèles connexionistes a suscité la question de départ de ce travail de thèse : ce formalisme peut -il constituer une nouvelle stratégie de recherche en psychologie sociale ? Le connexionisme permet de concevoir des modèles répliquant le fonctionnement cognitif de l' individu au cours d' une situation sociale ( Chapitre théorique 1 ) . Par référence à l' inspiration neurologique dont ils sont issus , les modèles connexionistes , ou en réseaux de neurones artificiels , postulent que le système cognitif est une structure d' unités simples interconnectées qui sont capables d' apprendre en codant les informations de façon non symbolique ( Hatfield , 1991 ; Hinton , McClelland & Rumelhart , 1986 ) . L' introduction des modèles connexionistes en psychologie sociale marque l' intérêt de cette approche comme une nouvelle façon de concevoir et d' interpréter les phénomènes psychologiques en proposant des stratégies de recherches radicalement différentes ( Kashima van Overwalle Smith , 1996 ) . En effet , les propriétés inhérentes au traitement parallèle des informations et leur format de stockage contribuent à la compréhension des activités cognitives mises en jeu lors des interactions sociales . De plus , les modèles connexionistes peuvent fournir un substrat d' étude et proposer des hypothèses alternatives à celles des théories classiques . Ceci , en donnant la possibilité de considérer des mécanismes intégratifs explicatifs des phénomènes étudiés , à partir de la structure et du fonctionnement du modèle connexioniste ( Smith & DeCoster , 1998 ) . De plus , ils peuvent être utilisés , à partir de la simulation , pour proposer des prédictions comportementales humaines et ils permettent la réflexion dynamique autour des processus qu' ils modélisent . Ce sont toutes ces propriétés qui finalement intéressent les chercheurs en psychologie sociale et nous intéressent nous même . Néanmoins , les modèles connexionistes actuels présentent une contrainte d' utilisation forte . En effet , le réseau de neurones implémentant le phénomène étudié nécessite une phase préalable de définition des informations dont il doit disposer pour être en mesure d' émettre des réponses appropriées . Dès lors , cela implique de définir au préalable le type d' exemplaires devant être appris par le réseau de neurones pour répliquer un phénomène existant et de créer une seconde base d' exemplaires sur laquelle le réseau de neurones pourra être testé . Nous proposerons de dépasser cette contrainte , en nous inspirant de l' idée du formalisme écologique développée en vie artificielle ( Cecconi , Nolfi & Parisi , 1990 ; Parisi , 1997 ) pour développer nous même un modèle dont les contraintes d' apprentissage seront définies par l' environnement social et/ou physique . Tout en maintenant les mêmes propriétés que celles des modèles connexionistes classiques , ce formalisme offre la possibilité de prendre en compte non seulement les processus impliqués pour l' individu , mais de considérer ses interactions avec l' environnement . Dans cette perspective , le modèle connexioniste n' est plus envisagé comme un outil statique de réception d' informations prédéfinies , mais comme un outil dynamique d' intégration d' informations provenant de l' environnement . Le réseau de neurones est considéré comme un agent actif pour lequel les conditions d' apprentissage résultent de ses interactions avec l' environnement , et non d' une base d' informations prédéfinies . L' originalité réside ici dans la conception d' agents considérés comme acteur de leur perception et de leur apprentissage puisqu' ils bénéficient de leur interaction avec l' environnement . Afin de rendre compte de l' intérêt d' introduire ce nouveau formalisme en psychologique sociale , nous nous appuierons sur une théorie impliquant par essence la présence de plusieurs individus : la théorie de l' apprentissage par observation ( Bandura , 1977 , 1986 ) . Cette théorie propose qu' à partir de l' observation des comportements émis par autrui , l' individu est en mesure de les apprendre , de les intégrer et de les reproduire dans des situations analogues , ou de les adapter à de nouvelles situations ( Chapitre théorique 2 ) . Selon Bandura ( 1977 ) , l' apprentissage par observation met en jeu des processus cognitifs répartis en une phase d' acquisition permettant l' élaboration d' une représentation symbolique des comportements observés et en une phase de production impliquant l' utilisation de cette représentation comme guide au comportement ultérieur . Ceci est soutenu par nombre d' études indiquant que la seule phase d' acquisition ( observation ) ne suffit pas à reproduire le comportement observé et qu' une phase de production est indispensable . Selon certains auteurs , cette phase où l' individu produit effectivement le comportement s' avère déterminante de la qualité de la performance obtenue en reproduction ( Deakin & Proteau , 2000 ) . Nous émettrons cependant quelques réserves quant à l' efficacité supposée de cette phase de production . Nous nous intéresserons en particulier à l' apprentissage par observation des habiletés motrices pour lesquelles nous montrerons que la nécessité de la construction d' une représentation symbolique ne va pas de soi . Bien que nombre d' auteurs s' accordent sur l' importance de la représentation symbolique construite ( Abravanel Bandura Carroll & Bandura , 1982 , 1985 , 1987 , 1990 ; Berger , Carli , Hammersla , Kashmer & Sanchez , 1979 ; Williams , 1987 ) , peu d' éléments nous semblent soutenir que la transformation des actions perçues en symbole soit le seul moyen de parvenir à un apprentissage efficace . Nous envisagerons l' hypothèse d' un apprentissage par observation médiatisé par la construction d' une représentation distribuée du comportement observé . Dans la deuxième partie de ce manuscrit , nous proposons de concevoir un modèle connexioniste écologique de l' apprentissage par observation des habiletés motrices et de tester sa fiabilité et sa capacité prédictive . Après avoir exposé les caractéristiques de base que nous avons retenues pour concevoir l' implémentation connexioniste écologique de l' apprentissage par observation , nous testerons sa fiabilité à répliquer le phénomène d' apprentissage par observation ( chapitre expérimental 1 ) . Pour cela nous vérifierons qu' il simule efficacement l' acquisition de nouveaux comportements comme résultants du déterminisme réciproque entre facteur personnel , comportement et environnement ( Bandura , 1986 ) . Suite à la vérification du fonctionnement du modèle , et notamment l' efficacité de l' implémentation du guidage du comportement émis par la représentation distribuée ( simulation 1 ) , nous nous intéresserons à sa capacité à produire des comportements différenciés ( simulation 2 ) . Ces simulations nous amènerons à considérer le formalisme connexioniste écologique comme un moyen de rendre compte de ce multi déterminisme de l' apprentissage . Par ailleurs , nous pensons que la validation d' un modèle connexioniste nécessite de vérifier sa capacité à répliquer certains résultats classiques . Nous nous appuierons , pour cela , sur les résultats obtenus par Bandura et Jeffery ( 1973 ) sur la dégradation de performance entre représentation construite et comportement produit . Nous verrons qu' au-delà de la simple réplication , notre modèle permet de suggérer une explication de cette dégradation ( simulation 3 ) . De plus , nous avons indiqué que l' utilisation du formalisme écologique maintenait les mêmes propriétés que celles exhibées par les modèles connexionistes classiques . Néanmoins , il convient d' en proposer une vérification . Ainsi , nous vérifierons que l' utilisation du formalisme écologique maintient les propriétés de généralisation et de transfert des connaissances et ce en regard des résultats obtenus sur des tâches de transfert avec des sujets humains ( simulation 4 ) . Si notre modèle connexioniste satisfait les critères de fiabilité précédents , nous proposons de tester sa capacité prédictive ( chapitre expérimental 2 ) . Pour cela , nous présenterons trois études au cours desquelles desquelles les prédictions proposées par le modèle seront confrontées aux données recueillies auprès de sujets humains pour une tâche équivalente . La théorie de l' apprentissage par observation conduit à considérer les phases d' acquisition et de production comme indispensables à l' apprentissage efficace de nouveaux comportements . Cependant , l' influence de chacune de ces phases est difficilement dissociable dans les études actuelles . En effet , selon Carroll et Bandura ( 1990 ) la phase d' acquisition est déterminante de la performance puisque cette phase conduit à l' élaboration d' une représentation du comportement observé à partir de laquelle la production est guidée . Cela conduit à suggérer que plus la représentation est fiable , meilleure est la reproduction . Néanmoins , selon Deakin et Proteau ( 2000 ) la phase de production est déterminante , puisqu' elle permet de détecter et de corriger les erreurs de comportement et par extension les erreurs de mémorisation . Si les deux propositions nous semblent complémentaires , il n' en demeure pas moins qu' elles font suite à des études où l' influence de chacune des phases ne peut être dissociée puisqu' elles sont conduites selon un protocole intercalant l' observation et la pratique . Pour répondre à cette ambiguïté , nous envisagerons de façon spécifique l' influence de chacune des phases , en examinant l' évolution de l' apprentissage en fonction des conditions d' observation et de pratique ( étude 1 et 2 ) . Par ailleurs , nous nous intéresserons à l' influence de la qualité de la démonstration observée sur l' apprentissage ( étude 3 ) . Nous proposerons dans une dernière partie d' envisager les contributions d' un tel modèle . Nous discuterons ainsi de l' hypothèse d' un apprentissage par observation médiatisé par la construction écologique d' une représentation non symbolique et des capacités prédictives du modèle . PARTIE THEORIQUE Chapitre 1 : Apport de l' approche connexioniste à la psychologie sociale Le connexionisme réapparaît au milieu des années 1980 suite à la publication influente des travaux de McClelland et du groupe PDP ( Parallel Distributed Process ) en 1986 . Cette approche considère les activités cognitives non plus comme relevant de la manipulation de symboles , mais comme un système unique dans lequel connaissances et processus ne sont pas dissociés . L' approche connexioniste s' inspire des propriétés de base des neurones du cerveau humain et postule qu' un système cognitif peut être simulé par un réseau de neurones artificiel capable d' apprendre en codant les informations de façon non symbolique ( Hinton , McClelland Hatfield , 1991 ) . L' hypothèse principale à la base de l' essor du connexionisme est que le comportement intelligent est sous-tendu par un ensemble de mécanismes mentaux qui peuvent être simulés par un réseau de neurones artificiel . Le point d' ancrage des recherches fondées sur cette approche se situe dans la compréhension des activités cognitives , et leur introduction en psychologie sociale marque l' intérêt de cette approche comme une nouvelle façon de concevoir et d' interpréter les phénomènes psychologiques en proposant des stratégies de recherche radicalement différentes . En effet , dans les postulats de tels modèles , il est considéré que les unités et les processus sont un ensemble indissociable . L' information est traitée en parallèle et aucune règle pré-établie ne définit la façon dont cette information doit être traitée . Néanmoins , comme nous le verrons , les modèles connexionistes développés en psychologie sociale utilisent le formalisme classique des réseaux de neurones dont les contraintes d' utilisation ne permettent pas de rendre compte des interactions auxquelles les individus sont soumis . Nous nous proposons de prendre en compte ces interactions d' une façon plus dynamique en utilisant le formalisme des réseaux de neurones écologiques ( Parisi , Cecconi & Nolfi , 1990 ) . Ce formalisme propose d' utiliser le réseau de neurones non plus comme une entité statique mais comme un agent actif . Ce principe permet de prendre en compte non plus les processus impliqués pour l' individu dans des situations prédéfinies , mais de considérer qu' il est acteur de ses perceptions et qu' il entretient avec son environnement une relation qui détermine ses apprentissages . Après avoir exposé brièvement les principes fondamentaux de l' approche symbolique , nous examinerons quelques notions relatives à l' organisation des réseaux de neurones . Il existe certes de nombreux modèles de réseaux de neurones , nous ne présenterons cependant que les éléments nécessaires à la suite de l' exposé . Nous proposons pour cela de décrire successivement leur architecture et leur fonctionnement pour illustrer ensuite les notions d' apprentissage et de mémorisation . Nous exposerons par ailleurs le principe des réseaux de neurones écologiques afin d' en définir les apports complémentaires au formalisme classique . La dernière section de ce chapitre est destinée à présenter quelques travaux actuellement réalisés en psychologie sociale à partir de ce type de modèle et les apports d' un tel formalisme à la compréhension des phénomènes sociaux . 1 . D' une conception symbolique à une conception connexioniste 1.1 . Les modèles symboliques Les modèles symboliques postulent que l' individu stocke en mémoire des représentations construites à partir des symboles langagiers ( concepts ) . Ce sont les règles de manipulation de ces symboles qui sont à l' origine des activités cognitives . Comme le définit Newell ( 1980 ) , l' approche symbolique propose de considérer « un ensemble d' entités , appelées symboles , qui sont des structures physiques qui peuvent apparaître comme des composantes d' un autre type d' entités dites expressions . ( ... ) En outre , le système contient un ensemble de procédures qui transforment les expressions en d' autres expressions » . Ainsi , les symboles stockés sont traités par combinaison , comparaison , ou ajustement , et renvoient les réponses de l' individu . Par exemple , un individu peut utiliser les concepts de « verre » , « rempli » et « eau » , pour construire une proposition du type « le verre est rempli d' eau » . Les modèles symboliques postulent que l' individu stocke en mémoire des représentations construites à partir des symboles langagiers ( concepts ) . Ce sont les règles de manipulation de ces symboles qui sont à l' origine des activités cognitives . Comme le définit Newell ( 1980 ) , l' approche symbolique propose de considérer « un ensemble d' entités , appelées symboles , qui sont des structures physiques qui peuvent apparaître comme des composantes d' un autre type d' entités dites expressions . ( ... ) En outre , le système contient un ensemble de procédures qui transforment les expressions en d' autres expressions » . Ainsi , les symboles stockés sont traités par combinaison , comparaison , ou ajustement , et renvoient les réponses de l' individu . Par exemple , un individu peut utiliser les concepts de « verre » , « rempli » et « eau » , pour construire une proposition du type « le verre est rempli d' eau » . Parmi les caractéristiques principales de ces modèles , les notions de représentations discrètes et de distinction entre représentation et processus sont les plus importantes . La construction des représentations symboliques implique chez l' individu une activité cognitive particulière qui conduit , à partir de la perception des informations à la construction de concepts . Ces représentations symboliques ont la particularité d' être stockées et maintenues en mémoire sous forme d' unités discrètes et indépendantes , chacune étant porteuse de sens ( Honavar , 1994 ) . Suite aux diverses situations rencontrées , l' individu construit un ensemble de schémas représentant des successions d' événements reliés entre eux . Chaque unité ( ou schéma ) peut être accessible , changée , ou ajoutées sans qu' aucune des autres unités n' en soit pour autant modifiée . Ces unités porteuses de sens se distinguent des processus impliqués dans leurs manipulations . Même si elles sont parfois altérées par certains processus , elles n' en demeurent pas moins sous forme statique et figée . Les processus impliqués dans la manipulation des symboles peuvent être définis comme des règles qui permettent la transformation et la génération de nouvelles représentations . Le développement des modèles symboliques a permis jusqu'alors de comprendre comment en situation sociale , l' individu traite l' information et l' utilise . Par exemple , lors de la perception des personnes , l' individu cherche à travers les concepts stockés en mémoire ceux qui coïncident au plus près avec les caractéristiques de la personne perçue afin de lui attribuer un ensemble de traits , de stéréotypes . Ce processus implique un traitement séquentiel des informations et une recherche de correspondance entre ce qui est perçu et ce qui est stocké en mémoire . La rapidité avec laquelle l' individu réalise ce traitement suppose un effet automatique sous-jacent à la perception . Bien que les modèles classiques proposent des solutions adéquates à l' explication de ce phénomène et à bien d' autres , l' introduction des modèles connexionistes permet d' envisager ces phénomènes sous l' angle d' une indissociation entre les connaissances et leurs traitements . 1.2 . Les modèles connexionistes 1.2.1 . Origine du connexionisme Le connexionisme trouve son origine dans les travaux de McCulloch et Pitts ( 1943 ) sur le neurone formel . Ces auteurs essayaient de comprendre le fonctionnement du système nerveux à partir de ses composants élémentaires : les neurones . Ils considéraient le neurone comme un calculateur logique , répondant de façon binaire ( 1 ou 0 ) aux activations des synapses qui lui étaient connectées . Ces neurones calculaient leur niveau d' activation et étaient considérés comme actifs à partir d' une valeur seuil . Le résultat le plus important de ces recherches a été de montrer que tous processus pouvant être satisfaits par un nombre fini d' opérations logiques pouvaient être exécutés par un réseau de neurones composé d' unités dont l' activation est binaire ( excite ou inhibe l' unité suivante ) . Pendant la même période , Hebb ( 1949 ) cherchait à expliquer les effets de mémorisation et proposait qu' un groupe de cellule est capable d' apprendre en modifiant l' intensité des connexions qui les relient . Il énonçait ainsi ce qui deviendra le fondement de la loi de Hebb : l' activation simultanée de plusieurs cellules renforce leurs liens . Le Perceptron de Rosenblatt ( 1957 ) a permis d' introduire la notion de poids de connexions comme une force reliant les unités de façon continue plutôt que binaire et de proposer que si plusieurs unités d' entrée sont connectées à une même unité de sortie , alors il est possible d' obtenir une réponse fiable sans que les réponses des unités prises séparément ne le soient . S' intéressant à la modélisation de l' activité perceptive , Rosenblatt a développé un modèle de la rétine . Ce modèle lui a permis de mettre en évidence que s' il existe un ensemble de poids qui donne les réponses correctes à un ensemble de configuration , alors le réseau apprend à répondre correctement au terme d' un nombre fini de répétitions de la procédure d' apprentissage . L' extension du Perceptron par l' Adaline de Widrow-Hoff dans les années soixante a permis d' aller plus loin en proposant de coder les informations de façon continue plutôt que binaire ; cela étant rendu possible par l' introduction de nouvelles fonctions , sur lesquelles nous reviendrons ultérieurement . Cependant , malgré ces développements , les chercheurs se sont heurtés à différentes limites : l' incapacité de ce type de réseau à résoudre des problèmes non linéairement séparables , c' est-à-dire pour lesquels il n' existait pas de surface de décision de type hyper plan séparant les cas présentés en classes ; l' utilisation d' un apprentissage limité à une association plus ou moins forte entre les unités ; la lenteur observée pour l' acquisition des connaissances et la faiblesse de performances ont été largement soulignés lors de la publication de l' ouvrage Perceptrons par Minsky et Papert ( 1969 révisé en 1988 ) . Cet ouvrage est reconnu pour sonner le glas des réseaux de neurones en insistant notamment sur l' incapacité du Perceptron à résoudre des problèmes aussi simple que l' opération logique du « ou exclusif » ( XOR ) . Il a fallu attendre 1986 et la publication des deux volumes de McClelland , Rumelhart et le groupe PDP pour que les réseaux de neurones voient un développement nouveau . De nouvelles architectures sont apparues , telles que le Perceptron Multi Couche qui implique non plus une couche d' unités d' entrée et une couche d' unités de sortie mais plusieurs couches de cellules intercalées ( Anderson & Hinton , 1981 ) , les réseaux de Hopfield , les réseaux de Kohonen ( 1995 ) et de nouvelles règles d' apprentissage telles que la règle delta ( ou de Widrow-Hoff ) , le delta généralisé ont amené un nouvel essor dans la modélisation en réseaux de neurones ou modélisation connexioniste . Essor qui va dès lors se propager dans de nombreuses disciplines telles que la physique , la biologie et la psychologie . 1.2.2 . Caractéristiques de base et fonctionnement des modèles connexionistes Avant d' entrer dans le détail de l' utilisation des réseaux de neurones , il convient d' introduire quelques notions fondamentales de la modélisation connexioniste . Nous proposons dans cette sous-section quelques définitions et principes afin de nous familiariser avec les concepts et le langage utilisé par la suite . Il convient tout d' abord de préciser que nous distinguerons le modèle connexioniste du réseau de neurones qui l' implémente . Nous utiliserons le terme de réseaux de neurones lorsque nous définirons les caractéristiques techniques des modèles connexionistes , et parlerons de modèles connexionistes comme modèles théoriques à la base de l' explication d' un phénomène . Définir ce qu' est un modèle connexioniste nécessiterait un exposé entier , et nous nous attacherons à considérer la notion dans son sens le plus large , à savoir un outil proposant une nouvelle façon de concevoir et d' interpréter les phénomènes psychologiques . Ces modèles conduisent à proposer des explications alternatives à celle envisagées par les théories classiques , en considérant dans une seule et même structure les connaissances , leurs traitements et leurs applications . Pour cela , ils sont implémentés par des réseaux de neurones permettant de simuler les activités cognitives telles que la mémorisation et la récupération d' information . Figure 1 : Illustration d' un réseau de neurones du type Perceptron Comme nous l' avons précédemment mentionné un réseau de neurones est un ensemble d' unités élémentaires actives ( ou neurones ) reliées par des connexions représentées schématiquement sur la figure 1 . Le rôle d' un réseau de neurones est double : traiter et produire de l' information . Pour cela , il possède trois caractéristiques fondatrices : une architecture des unités computationnelles interconnectées , une méthode de codage de l' information et une méthode de récupération de cette information . Architecture des unités computationnelles L' architecture des unités composant un réseau de neurones définit la façon dont les informations , codées sous forme de valeur d' activation , vont être traitées et produites . Ces informations vont être transmises entre les unités selon un flux d' activation qui se propage par le biais des connexions qui les relient . La structure des connexions entre les unités définit l' architecture d' un réseau de neurones , et de cette architecture dépend la façon dont le flux d' activation entre unités va être propagé . Nombre d' architectures sont possibles et dépendent de l' existence ou non , à l' intérieur de la structure , de connexions de rétro-action ( cf. Annexe 1 , p . 2 ) . Parmi ces architectures , le Perceptron et le Perceptron Multi Couche possèdent une structure d' unités arrangées en couches , où la propagation du flux d' activation est unidirectionnelle . Il n' y a pas de connexion entre les unités d' une même couche , et la propagation de l' activation au travers des connexions ne se fait qu' avec les unités des couches suivantes . Ce type d' architecture permet de définir la couche d' unités d' entrée , celles qui reçoivent les informations de l' extérieur et la couche d' unités de sortie qui émettent la réponse du réseau en regard des informations d' entrée . Le Perceptron Multi Couche possède en plus une couche d' unités intermédiaires correspondant à une couche cachée . Le flux d' activation se propage donc des unités d' entrée aux unités de sortie . Nous reviendrons plus en détail sur ce type d' architecture qui nous intéresse tout particulièrement . Les réseaux de neurones récurrents se composent d' unités disposées en couche , pour lesquelles des connexions de retour sont introduites entre les unités d' une même couche ou avec des unités des couches antérieures . Ils sont principalement utilisés pour leur capacité à accéder aux informations passées . Le flux d' activation passe de la couche d' entrée à la couche de sortie , tout en effectuant une boucle de récurrence sur certaines couches ou certaines unités d' une même couche . D' autres architectures , telles que les mémoires auto-associatives et les réseaux de Hopfield , se caractérisent par des unités toutes connectées entre elles . Les unités d' entrée et de sortie sont alors les mêmes . Ce type de réseau stocke de l' information récupérable à partir de l' interrogation du système sur une partie de l' information . Ce sont des mémoires adressables par le contenu qui sont , par exemple , utilisées pour la reconstruction de l' information ( complétion ) . Les mémoires hétéro-associatives et les cartes de Kohonen distinguent les unités d' entrée et celles de sortie , et proposent d' associer à chaque information d' entrée une réponse différenciée . Ces réseaux de neurones sont utilisés en particulier pour la reconnaissance de formes ou la classification . Bien que ces différents types de réseaux de neurones partagent des principes communs , nous ne présenterons que le fonctionnement des réseaux de type Perceptron Multi Couche que nous utiliserons dans la suite de notre travail . Architecture d' un Perceptron Multi Couche A la base d' un Perceptron Multi Couche , nous trouvons des unités reliées par des connexions . Il existe deux types d' unités potentielles , celles en contact direct avec l' extérieur - les unités d' entrée et les unités de sortie - et celles sans lien direct avec l' extérieur - les unités cachées . Les unités d' entrée sont des unités qui reçoivent des informations de l' extérieur , elles représentent la couche d' entrée du réseau de neurones . Les unités de sortie sont des unités émettant de l' information à destination de l' extérieur , elles définissent la couche de sortie . Les unités cachées qui n' ont aucun lien direct avec l' extérieur s' insèrent entre les unités d' entrée et de sortie auxquelles elles sont connectées et définissent la ou les couche ( s ) cachée ( s ) . La présence et le nombre d' unités composant la couche cachée dépend du type de phénomène étudié . Par ailleurs , la couche cachée permet de donner au réseau de neurones un espace de solution plus ou moins important à la résolution d' une tâche . Nous illustrons par la figure 2 , un exemple de réseau de neurones de type Perceptron Multi Couche qui se compose d' une couche d' entrée ( trois unités de codage de l' information ) , d' une couche cachée ( deux unités ) et d' une couche de sortie ( trois unités de codage de la réponse ) . Figure 2 : Succession des couches représentatives d' un réseau de neurones de type Perceptron Multi Couche Principe de fonctionnement des unités computationnelles Si les principes qui suivent sont applicables à nombre de réseaux de neurones , nous considérerons plus particulièrement le fonctionnement de ces unités dans le cadre d' un Perceptron Multi Couche . L' activité de toutes les unités est définie par deux éléments : l' activation d' entrée de l' unité et l' activation de sortie de l' unité . Chaque unité reçoit une activation d' entrée ( aSi les principes qui suivent sont applicables à nombre de réseaux de neurones , nous considérerons plus particulièrement le fonctionnement de ces unités dans le cadre d' un Perceptron Multi Couche . L' activité de toutes les unités est définie par deux éléments : l' activation d' entrée de l' unité et l' activation de sortie de l' unité . Chaque unité reçoit une activation d' entrée ( aii ) et propose une activation de sortie ( s ) et propose une activation de sortie ( sii ) calculée par l' application d' une fonction de transfert ( f ) sur l' activation d' entrée , illustrée par l' équation : s ) calculée par l' application d' une fonction de transfert ( f ) sur l' activation d' entrée , illustrée par l' équation : sii = f ( a = f ( aii ) . Le choix de la fonction de transfert dépend du problème à traiter et de l' intervalle de valeurs que le chercheur souhaite obtenir ( les fonctions identité , seuil , logarithmique , sigmoïde sont illustrées en annexe 2 , p . 3 ) . ) . Le choix de la fonction de transfert dépend du problème à traiter et de l' intervalle de valeurs que le chercheur souhaite obtenir ( les fonctions identité , seuil , logarithmique , sigmoïde sont illustrées en annexe 2 , p . 3 ) . Unités de la couche d' entrée Les unités d' entrée codent les informations extérieures sous forme de valeurs numériques continues ou non . Ces valeurs décomposent les caractéristiques de la situation à laquelle est confronté le réseau de neurones . L' ensemble de ces valeurs est présenté aux unités de la couche d' entrée sous forme de vecteur de valeurs et chacune des unités calcule son activation de sortie par application d' une fonction de transfert . Par exemple , les unités d' entrée peuvent coder la proposition de description d' un individu « c' est un homme , bien habillé , intelligent , et beau » par un vecteur où chaque valeur correspond à un concept de la proposition . Ce vecteur pourrait avoir la forme de « bien habillé » , « intelligent » et « beau » . Au contraire , ces unités pourraient recevoir un vecteur de type [ 1 0 0 0 ] correspondant à la description du prototype inverse ( un homme , mal habillé , pas intelligent et laid ) . Unités de la couche cachée et de la couche de sortie L' activation d' entrée des unités cachées et de sortie est définie en fonction des activations de sortie des unités précédentes et des connexions entre unités . Chacune des connexions est indépendante et possède une valeur : le poids . L' activation d' entrée ( aL'activation d' entrée des unités cachées et de sortie est définie en fonction des activations de sortie des unités précédentes et des connexions entre unités . Chacune des connexions est indépendante et possède une valeur : le poids . L' activation d' entrée ( aii ) est alors générée par la somme des activations de sortie ( s ) est alors générée par la somme des activations de sortie ( sii ) reçues des unités précédentes , qui lui sont reliées , pondérées par les poids de connexions ( w ) reçues des unités précédentes , qui lui sont reliées , pondérées par les poids de connexions ( wijij ) selon l' équation a ) selon l' équation aii = = & 239;& 129;& 147;& 239;& 129;& 147;wwijij . s . sii . . De la même façon que les unités d' entrée , les unités cachées et de sortie calculent leur activation de sortie par l' application d' une fonction de transfert . L' activation produite par les unités cachées est propagée au niveau des unités de sortie et l' activation de sortie proposée par les unités de sortie correspond à la réponse du réseau de neurones . Cette réponse dépend donc du flux d' activation propagé au travers du réseau de neurones en fonction des valeurs du vecteur d' entrée auquel le réseau a été soumis et des poids de connexions . Par exemple , en réponse au vecteur d' entrée [ 1 1 1 1 ] codant la description d' un « homme bien habillé , intelligent , et beau » , une unité de sortie pourrait émettre une réponse codant le niveau de sympathie estimé pour cet individu , par exemple émettre la réponse 1 correspondant à « sympathique » . Pour résumer , un réseau de neurones est composé d' unités correspondant à une entité qui calcule l' activation qu' elle reçoit et propage ce résultat aux unités auxquelles elle est connectée . Chaque unité possède une activation d' entrée ( aPour résumer , un réseau de neurones est composé d' unités correspondant à une entité qui calcule l' activation qu' elle reçoit et propage ce résultat aux unités auxquelles elle est connectée . Chaque unité possède une activation d' entrée ( aii ) et une activation de sortie ( s ) et une activation de sortie ( sii ) qui est calculée par une fonction de transfert . La transmission de l' activation est réalisée à travers les poids de connexions qui déterminent la pondération de l' activation transmise entre unités . Comme le résume la figure 3 , pour la présentation d' un vecteur d' information ( v ) qui est calculée par une fonction de transfert . La transmission de l' activation est réalisée à travers les poids de connexions qui déterminent la pondération de l' activation transmise entre unités . Comme le résume la figure 3 , pour la présentation d' un vecteur d' information ( vii ) en entrée d' un Perceptron Multi Couche , les unités propagent un flux d' activation déterminant la réponse du réseau de neurones à cette information en sortie . ) en entrée d' un Perceptron Multi Couche , les unités propagent un flux d' activation déterminant la réponse du réseau de neurones à cette information en sortie . Figure 3 : Propagation du flux d' activation induit par la présentation d' un vecteur [ v 1 , v 2 ] sur les unités de la couche d' entrée ( a 1 , a 2 ) jusqu'à l' émission d' une réponse ( s 4 ) sur l' unité de la couche de sortie ( a 4 ) dans un réseau de neurones de type Perceptron Multi Couche Méthode de codage de l' information Nous avons indiqué que les informations étaient codées sous forme de valeur d' activation , il convient cependant de distinguer deux approches du codage de l' information dans un réseau de neurones : l' approche localiste et l' approche distributive ( cf. Rumelhart & Todd , 1993 ) . L' approche localiste considère chaque unité du réseau comme porteuse de sens . La représentation d' un concept est alors contenue par une seule et même unité . Lorsqu' une unité est activée , le chercheur peut en donner une signification conceptuelle précise : chaque unité représente alors un concept ( Grainger & Jacobs , 1998 , McClelland & Rumelhart , 1981 ) . Par exemple , dans un réseau localiste la représentation correspondant à « un homme noir avocat » et celle correspondant à « une femme blanche avocate » peuvent être codées sur cinq unités . Deux unités codent le genre : lorsque la première est activée par une valeur de 1 alors le concept « homme » est présent lorsque c' est la seconde qui est activée alors le concept « femme » est présent . De la même façon , deux autres unités peuvent coder la couleur , enfin une troisième codera la profession . L' approche localiste présente l' avantage de faciliter l' explication du sens de chaque unité activée ; néanmoins elle implique des contraintes d' utilisations très fortes . Notamment , la quantité d' unités nécessaires au codage . En effet , cette approche implique de définir spécifiquement chaque concept devant être représenté , donc d' envisager le nombre d' unités nécessaires au codage des concepts . Cela rend difficile l' implémentation de situations complexes puisqu' elles nécessiteraient un réseau comportant un très grand nombre d' unités . Si nous voulions implémenter dans un réseau localiste toutes les informations contenues dans un stéréotype , il faudrait un nombre conséquent d' unités pour les coder toutes ou sélectionner au préalable les concepts strictement nécessaires . Afin de remédier à cet inconvénient , l' approche distribuée considère qu' une unité n' a pas de sens en elle-même . La représentation est distribuée sur plusieurs unités si bien qu' un concept est représenté par un ensemble indissociable d' unités . De prime abord , cela peut conduire à penser que si un concept est représenté par plusieurs unités , alors il en faudra d' autant plus que le nombre de concepts à représenter est important . Pourtant il n' en est rien : l' unité n' a certes pas de signification en soi , mais la signification résulte de l' activation générée sur un ensemble d' unité . Pour chaque Afin de remédier à cet inconvénient , l' approche distribuée considère qu' une unité n' a pas de sens en elle-même . La représentation est distribuée sur plusieurs unités si bien qu' un concept est représenté par un ensemble indissociable d' unités . De prime abord , cela peut conduire à penser que si un concept est représenté par plusieurs unités , alors il en faudra d' autant plus que le nombre de concepts à représenter est important . Pourtant il n' en est rien : l' unité n' a certes pas de signification en soi , mais la signification résulte de l' activation générée sur un ensemble d' unité . Pour chaque pattern d' activation différent des mêmes unités , un concept différent peut être associé . Comme le souligne Hinton , d' activation différent des mêmes unités , un concept différent peut être associé . Comme le souligne Hinton , McClelland , et Rumelhart ( 1986 ) , « chaque concept est associé à un ensemble d' unités et chaque unité participe à la représentation du concept » . L' unité n' a dès lors pas signification en dehors de sa prise en considération dans l' ensemble du ( 1986 ) , « chaque concept est associé à un ensemble d' unités et chaque unité participe à la représentation du concept » . L' unité n' a dès lors pas signification en dehors de sa prise en considération dans l' ensemble du pattern d' activation dans lequel elle intervient ( cf. van Gelder , 1991 ) . D' après van Gelder ( 1990 , 1991 , 1998 ) la représentation distribuée des connaissances dans un réseau de neurones peut être considérée comme une superposition intégrative des situations rencontrées . Chaque situation peut être vue comme une feuille de papier différente , et la représentation distribuée comme la compression de toutes ces feuilles jusqu'à en obtenir une seule . Cette dernière possédant toutes les informations stockées sur chacune des feuilles de départ . Accéder à l' une des connaissances , c' est nécessairement accéder à toutes , puisque toutes les connaissances sont contenues dans la même structure d' unités . Il y a donc émergence de caractéristiques dont les propriétés ne peuvent être prédites à partir d' une quelconque combinaison de ses composantes élémentaires ( Rumelhart & McClelland , 1986 ) . d' activation dans lequel elle intervient ( cf. van Gelder , 1991 ) . D' après van Gelder ( 1990 , 1991 , 1998 ) la représentation distribuée des connaissances dans un réseau de neurones peut être considérée comme une superposition intégrative des situations rencontrées . Chaque situation peut être vue comme une feuille de papier différente , et la représentation distribuée comme la compression de toutes ces feuilles jusqu'à en obtenir une seule . Cette dernière possédant toutes les informations stockées sur chacune des feuilles de départ . Accéder à l' une des connaissances , c' est nécessairement accéder à toutes , puisque toutes les connaissances sont contenues dans la même structure d' unités . Il y a donc émergence de caractéristiques dont les propriétés ne peuvent être prédites à partir d' une quelconque combinaison de ses composantes élémentaires ( Rumelhart & McClelland , 1986 ) . Par exemple , un réseau de neurones ayant « rencontré » un « homme noir avocat » et « une femme blanche avocate » en élabore une représentation distribuée sur plusieurs unités . D' une part , aucune unité ne codera en particulier chacun des concepts présents dans chacune des propositions . D' autre part , toutes les unités participeront à la reconstruction de la représentation de l' une ou l' autre des propositions . Il n' est alors pas possible de dissocier chaque concept sans prendre en compte l' intégralité des unités qu' il active . C' est à partir de la re-création d' un état d' activation particulierPar exemple , un réseau de neurones ayant « rencontré » un « homme noir avocat » et « une femme blanche avocate » en élabore une représentation distribuée sur plusieurs unités . D' une part , aucune unité ne codera en particulier chacun des concepts présents dans chacune des propositions . D' autre part , toutes les unités participeront à la reconstruction de la représentation de l' une ou l' autre des propositions . Il n' est alors pas possible de dissocier chaque concept sans prendre en compte l' intégralité des unités qu' il active . C' est à partir de la re-création d' un état d' activation particulier [ 1 ] , suite à l' activation des unités d' entrée , que la représentation émerge et que la production de la réponse est possible . Contrairement à l' approche localiste , l' approche distribuée permet d' intégrer sur un nombre restreint d' unités un grand nombre de concepts . Cette intégration conduit à superposer toutes les situations dans une seule et même représentation , ce qui en facilite l' apprentissage et la récupération. , suite à l' activation des unités d' entrée , que la représentation émerge et que la production de la réponse est possible . Contrairement à l' approche localiste , l' approche distribuée permet d' intégrer sur un nombre restreint d' unités un grand nombre de concepts . Cette intégration conduit à superposer toutes les situations dans une seule et même représentation , ce qui en facilite l' apprentissage et la récupération . Ainsi , qu' ils soient d' architecture unidirectionnelle ou récurrente , les réseaux de neurones peuvent être considérés comme localistes ou distribués . Si pour l' approche localiste l' unité possède une signification interprétable en soi , l' approche distribuée considère la représentation comme étant stockée sous forme de Ainsi , qu' ils soient d' architecture unidirectionnelle ou récurrente , les réseaux de neurones peuvent être considérés comme localistes ou distribués . Si pour l' approche localiste l' unité possède une signification interprétable en soi , l' approche distribuée considère la représentation comme étant stockée sous forme de pattern d' activité , distribuée sur un ensemble d' éléments où chacun est impliqué dans la représentation de plusieurs concepts ( Hatfield , 1991 d' activité , distribuée sur un ensemble d' éléments où chacun est impliqué dans la représentation de plusieurs concepts ( Hatfield , 1991 ; Hinton , 1986 ; Goschke & Koppelberg , 1991 ) . Selon l' approche utilisée , la signification des concepts est proposée par une ou plusieurs unités , et les liens qui les relient déterminent dans quelle mesure ces unités doivent être prises en considération . ; Hinton , 1986 ; Goschke & Koppelberg , 1991 ) . Selon l' approche utilisée , la signification des concepts est proposée par une ou plusieurs unités , et les liens qui les relient déterminent dans quelle mesure ces unités doivent être prises en considération . Méthode de stockage et de récupération de l' information Stockage de l' information dans un réseau de neurones Pour que les informations contenues dans les unités puissent être interprétées et pour qu' un réseau de neurones soit en mesure de traiter ou récupérer de l' information , il faut que celle -ci soit stockée . Ceci qu' il ait été conçu selon une approche localiste ou distribuée de la représentation des concepts . Pour cela , la première phase d' utilisation d' un réseau de neurones consiste en une phase d' apprentissage . Selon Touzet ( 1992 ) « l' apprentissage est une phase du développement d' un réseau de neurones durant laquelle le comportement du réseau est modifié jusqu'à l' obtention du comportement désiré . L' apprentissage neuronal fait appel à des exemples de comportement » . Cette phase nécessite de définir , au préalable , une méthode d' ajustement des paramètres internes du réseau de neurones afin de traiter ( i.e. apprendre ) efficacement les exemplaires rencontrés . L' apprentissage consiste en fait en une mise à jour des poids de connexions afin de réussir la tâche demandée . Deux types d' apprentissages sont régulièrement opposés dans l' approche connexioniste : l' apprentissage non supervisé et l' apprentissage supervisé . L' apprentissage non supervisé consiste à laisser le réseau de neurones déterminer les similarités des exemplaires auxquels il est confronté . Aucune indication sur la réponse attendue n' est fournit au réseau de neurones suite à la présentation d' un vecteur d' entrée particulier . Le réseau s' adapte pas à pas par détection des régularités statistiques entre les consiste à laisser le réseau de neurones déterminer les similarités des exemplaires auxquels il est confronté . Aucune indication sur la réponse attendue n' est fournit au réseau de neurones suite à la présentation d' un vecteur d' entrée particulier . Le réseau s' adapte pas à pas par détection des régularités statistiques entre les patterns d' activations présentés en entrée . En détectant les similitudes , il est à même de générer des catégories et de classer correctement de nouvelles informations . Différentes formes d' apprentissage non supervisé ont été développées telles que : la méthode compétitive du Vector Quantitization » , les « Self Organizing Map » de Kohonen ( 1995 ) et l' « Adaptative Resonance Theory » de Carpenter et Grossberg ( 1988 ) . d' activations présentés en entrée . En détectant les similitudes , il est à même de générer des catégories et de classer correctement de nouvelles informations . Différentes formes d' apprentissage non supervisé ont été développées telles que : la méthode compétitive du Vector Quantitization » , les « Self Organizing Map » de Kohonen ( 1995 ) et l' « Adaptative Resonance Theory » de Carpenter et Grossberg ( 1988 ) . L' apprentissage supervisé , que nous utiliserons ultérieurement , consiste à faire apprendre au réseau de neurones un ensemble de couples entrée-sortie . Pour cela , il est nécessaire de présenter au réseau de neurones un ensemble d' exemplaires associant une information présentée en entrée à une réponse attendue en sortie et utiliser une règle d' apprentissage . L' objectif est d' obtenir une configuration de poids permettant au réseau de neurones de proposer en sortie , une réponse aussi proche que possible de celle attendue suite à la présentation des informations en entrée . Cela résulte de l' application d' une règle d' apprentissage permettant d' intégrer tous les exemples de situations auxquels le réseau est confronté dans un seul et même , que nous utiliserons ultérieurement , consiste à faire apprendre au réseau de neurones un ensemble de couples entrée-sortie . Pour cela , il est nécessaire de présenter au réseau de neurones un ensemble d' exemplaires associant une information présentée en entrée à une réponse attendue en sortie et utiliser une règle d' apprentissage . L' objectif est d' obtenir une configuration de poids permettant au réseau de neurones de proposer en sortie , une réponse aussi proche que possible de celle attendue suite à la présentation des informations en entrée . Cela résulte de l' application d' une règle d' apprentissage permettant d' intégrer tous les exemples de situations auxquels le réseau est confronté dans un seul et même pattern de poids de connexions . Pour réaliser cet objectif , plusieurs règles d' apprentissage peuvent être utilisées , par exemple celle de Widrow-Hoff ou delta généralisé ou la règle du gradient descendant de l' erreur ( cf . Abdi , 1994 ) . Quelle que soit la règle , il s' agit d' adapter les valeurs de poids de connexions pour converger vers une solution stable dans l' approximation d' une fonction liant les entrées aux sorties ( Bourret , Reggia Jodouin , 1994a et b ; de poids de connexions . Pour réaliser cet objectif , plusieurs règles d' apprentissage peuvent être utilisées , par exemple celle de Widrow-Hoff ou delta généralisé ou la règle du gradient descendant de l' erreur ( cf. Abdi , 1994 ) . Quelle que soit la règle , il s' agit d' adapter les valeurs de poids de connexions pour converger vers une solution stable dans l' approximation d' une fonction liant les entrées aux sorties ( Bourret , Reggia Jodouin , 1994a et b ; Renders , 1994 ) . L' adaptation des poids de connexions est réalisée suite à l' apparition simultanée d' une information présentée en entrée et d' une réponse proposée en sortie du réseau de neurones . Par exemple , la règle de Hebb ( 1949 ) consiste à renforcer les connexions entre deux unités lorsqu' elles sont activées simultanément . Ainsi , par l' augmentation ou la diminution des poids de certaines connexions il est possible de sélectionner les réponses en sortie qui correspondent à la réponse correcte . La règle delta ( ou de Widrow-Hoff ) a pour but de faire évoluer le réseau de neurones vers une solution d' approximation des couples entrée-sortie la plus efficace possible . Pour cela , les poids des connexions sont modifiés à chaque présentation d' un exemplaire en entrée afin de réduire l' écart obtenu entre l' activation de sortie attendue et celle observée , et sont adaptés selon l' équation : W ( t + 1 ) = W ( t ) + n . ( tRenders , 1994 ) . L' adaptation des poids de connexions est réalisée suite à l' apparition simultanée d' une information présentée en entrée et d' une réponse proposée en sortie du réseau de neurones . Par exemple , la règle de Hebb ( 1949 ) consiste à renforcer les connexions entre deux unités lorsqu' elles sont activées simultanément . Ainsi , par l' augmentation ou la diminution des poids de certaines connexions il est possible de sélectionner les réponses en sortie qui correspondent à la réponse correcte . La règle delta ( ou de Widrow-Hoff ) a pour but de faire évoluer le réseau de neurones vers une solution d' approximation des couples entrée-sortie la plus efficace possible . Pour cela , les poids des connexions sont modifiés à chaque présentation d' un exemplaire en entrée afin de réduire l' écart obtenu entre l' activation de sortie attendue et celle observée , et sont adaptés selon l' équation : W ( t + 1 ) = W ( t ) + n . ( tii- s- sii ) . a ) . aii , avec W le poids , t , avec W le poids , tii l' activation de sortie attendue , s l' activation de sortie attendue , sii l' activation de sortie observée , a l' activation de sortie observée , aii l' activation d' entrée et n le coefficient d' apprentissage ( le pas d' apprentissage ) choisi par le chercheur entre 0 et 1 . l' activation d' entrée et n le coefficient d' apprentissage ( le pas d' apprentissage ) choisi par le chercheur entre 0 et 1 . L' algorithme d' apprentissage par rétropropagation du gradient descendant de l' erreur , que nous utiliserons nous-même , correspond à la généralisation de la règle delta . Lorsqu' une information est présentée en entrée du réseau , il produit en sortie une réponse qui est comparée à la réponse attendue . L' algorithme permet l' ajustement des réponses du réseau à la réponse souhaitée par adaptation des poids ( cf. Stroeve , 1998 ) . Pour cela , l' algorithme cherche à minimiser l' erreur entre sortie attendue et sortie obtenue , c' est-à-dire à minimiser la fonction coût ( coût correspondant à chaque configuration des poids ) . Cela peut consiste à chercher sur la surface de coût la position de coût minimal . La minimisation du gradient ( estimation de la pente de la surface de coût ) permet de parcourir cette surface pour trouver la configuration de poids résultant en un coût le plus faible possible , ce qui traduit le minima global . Ce que beaucoup considère comme un problème majeur de cet algorithme est que l' apprentissage peut conduire à des minima locaux dans lesquels la configuration de poids peut « tomber » . Ces configurations de poids permettent seulement une solution approximative de la résolution de la tâche . Nous verrons qu' il est parfois intéressant d' utiliser ces minima locaux notamment afin d' obtenir des propositions de solutions différentes pour une même tâche . Plus précisément , la règle de rétropropagation du gradient descendant de l' erreur se décompose en deux étapes . La première consiste à mettre à jour l' activation des unités de sortie en fonction du vecteur d' entrée , et la seconde à rétropropager l' erreur observée entre la sortie obtenue et la sortie attendue . Par exemple , si nous souhaitons qu' un réseau de neurones apprenne à juger la sympathie des personnes selon leur apparence physique . Plusieurs exemplaires sont présentés en entrée du réseau codant , par exemple , la beauté ( beau et laid ) et la tenue vestimentaire ( bien habillé et mal habillé ) de chaque personne . A chaque exemplaire est associé une réponse attendue indiquant le niveau de sympathie devant être estimé par le réseau . Ainsi , pour une personne dont les caractéristiques sont « beau et bien habillé » , la réponse attendue pourrait être une valeur en sortie de 1 correspondant à une personne sympathique . Pour une personne « mal habillée et laide » , la réponse attendue serait une valeur de 0 correspondant à une personne non sympathique . Pour chaque exemplaire présenté en entrée le réseau propose , avant apprentissage , une réponse incohérente du point de vue du niveau de sympathie . L' apprentissage consiste alors à déterminer l' erreur entre l' activation des sorties proposée et celle attendue , et de la rétropropager au travers du réseau . Ce qui améliore l' estimation de la réponse que le réseau propose par la suite . De façon simplifiée , lorsque la sortie prédite est supérieure à celle attendue , les poids sont diminués ; lorsqu' elle est inférieure les poids sont augmentés . Cette règle permet l' adaptation des poids de connexion pour ajuster les réponses du réseau de neurones à un stimulus donné en entrée , et permet l' apprentissage d' un ensemble d' associations entrée-sortie ( Egmont-Peterson , Talmon , Hasman & Ambergen , 1998 ; Freeman & Skapura , 1992 ) . Pour chaque entrée présentée , le réseau est alors capable de proposer une réponse adaptée dépendante de toutes les associations apprises ou des expériences passées . Plus précisément , la règle de rétropropagation du gradient descendant de l' erreur se décompose en deux étapes . La première consiste à mettre à jour l' activation des unités de sortie en fonction du vecteur d' entrée , et la seconde à rétropropager l' erreur observée entre la sortie obtenue et la sortie attendue . Par exemple , si nous souhaitons qu' un réseau de neurones apprenne à juger la sympathie des personnes selon leur apparence physique . Plusieurs exemplaires sont présentés en entrée du réseau codant , par exemple , la beauté ( beau et laid ) et la tenue vestimentaire ( bien habillé et mal habillé ) de chaque personne . A chaque exemplaire est associé une réponse attendue indiquant le niveau de sympathie devant être estimé par le réseau . Ainsi , pour une personne dont les caractéristiques sont « beau et bien habillé » , la réponse attendue pourrait être une valeur en sortie de 1 correspondant à une personne sympathique . Pour une personne « mal habillée et laide » , la réponse attendue serait une valeur de 0 correspondant à une personne non sympathique . Pour chaque exemplaire présenté en entrée le réseau propose , avant apprentissage , une réponse incohérente du point de vue du niveau de sympathie . L' apprentissage consiste alors à déterminer l' erreur entre l' activation des sorties proposée et celle attendue , et de la rétropropager au travers du réseau . Ce qui améliore l' estimation de la réponse que le réseau propose par la suite . De façon simplifiée , lorsque la sortie prédite est supérieure à celle attendue , les poids sont diminués ; lorsqu' elle est inférieure les poids sont augmentés . Cette règle permet l' adaptation des poids de connexion pour ajuster les réponses du réseau de neurones à un stimulus donné en entrée , et permet l' apprentissage d' un ensemble d' associations entrée-sortie ( Egmont-Peterson , Talmon , Hasman & Ambergen , 1998 ; Freeman & Skapura , 1992 ) . Pour chaque entrée présentée , le réseau est alors capable de proposer une réponse adaptée dépendante de toutes les associations apprises ou des expériences passées . Récupération de l' information dans un réseau de neurones L' apprentissage d' un réseau de neurones conduit donc à l' élaboration d' une représentation intégrant tous les exemplaires appris et l' interrogation du réseau permet de considérer les connaissances acquises . Les réseaux peuvent être interrogés sur les exemplaires appris mais aussi sur des exemplaires qu' ils n' ont jamais rencontrés . Lors de la présentation d' un exemplaire rencontré en apprentissage , la propagation de l' activation des unités d' entrée jusqu'aux unités de sortie conduit à l' émission d' une réponse correcte . L' activation est propagée par les poids de connexions qui ont été adaptés si bien qu' une réponse correcte émerge . Par exemple , suite à l' apprentissage du jugement de sympathie en fonction de l' apparence physique , si un exemplaire de type « beau et bien habillé » est présenté en entrée du réseau , alors il répondra par la valeur 1 en sortie ( « c' est une personne sympathique » ) , tout comme il pourra répondre par la valeur 0 ( « ce n' est pas une personne sympathique » ) , à un exemplaire « mal habillé et laid » . Pour un nouvel exemplaire présenté au réseau , la configuration d' activation émergeante induit la réponse du réseau . Elle intègre toutes les situations acquises préalablement et reflète la proximité du nouvel exemplaire avec les anciens . Il y a émergence d' un nouveau Pour un nouvel exemplaire présenté au réseau , la configuration d' activation émergeante induit la réponse du réseau . Elle intègre toutes les situations acquises préalablement et reflète la proximité du nouvel exemplaire avec les anciens . Il y a émergence d' un nouveau pattern d' activation , et ce d' activation , et ce pattern inclut toutes les expériences auxquelles le réseau a été soumis . Pour la présentation d' un exemplaire inconnu « beau et mal habillé » le réseau sera en mesure de proposer une évaluation de son niveau de sympathie en fonction des exemplaires appris . Pour illustrer , il pourrait proposer une valeur de 0.5 indiquant une personne moyennement sympathique si chaque caractéristique possédait une force équivalente à l' élaboration de la représentation d' une personne sympathique . L' un des avantages de l' intégration de toutes les situations dans une seule et même structure de poids est qu' un réseau de neurones répond de façon raisonnable à l' information incomplète , et que tout endommagement du tout n' aboutit pas à des non-réponses . Ainsi , en présentant seulement la caractéristique « beau » le réseau de neurones peut émettre une réponse adaptée . De plus , les réseaux de neurones possèdent un fort pouvoir de généralisation à partir des exemplaires appris du fait de l' utilisation de la représentation distribuée , puisqu' ils peuvent répondre pour des exemplaires inconnus et trouver des similitudes avec ceux appris . inclut toutes les expériences auxquelles le réseau a été soumis . Pour la présentation d' un exemplaire inconnu « beau et mal habillé » le réseau sera en mesure de proposer une évaluation de son niveau de sympathie en fonction des exemplaires appris . Pour illustrer , il pourrait proposer une valeur de 0.5 indiquant une personne moyennement sympathique si chaque caractéristique possédait une force équivalente à l' élaboration de la représentation d' une personne sympathique . L' un des avantages de l' intégration de toutes les situations dans une seule et même structure de poids est qu' un réseau de neurones répond de façon raisonnable à l' information incomplète , et que tout endommagement du tout n' aboutit pas à des non-réponses . Ainsi , en présentant seulement la caractéristique « beau » le réseau de neurones peut émettre une réponse adaptée . De plus , les réseaux de neurones possèdent un fort pouvoir de généralisation à partir des exemplaires appris du fait de l' utilisation de la représentation distribuée , puisqu' ils peuvent répondre pour des exemplaires inconnus et trouver des similitudes avec ceux appris . Pour résumer , les modèles connexionistes utilisant l' approche distribuée considèrent que la totalité des poids de connexions est une seule et même représentation intégrant l' ensemble des connaissances dérivées des expériences d' apprentissage . Accéder à l' une des connaissances c' est nécessairement accéder à toutes , puisque toutes les connaissances sont contenues dans la même configuration de poids de connexions . Nous avons souligné l' intérêt de cette approche impliquant les propriétés de complétion , de généralisation mais aussi vu que les capacités d' apprentissage et de récupération des informations pouvaient être adaptées facilement à un exemple de jugement . Nous voyons ici , l' intérêt d' une telle approche pour la modélisation en psychologie sociale . Mais avant d' aller plus loin sur le développement de cet intérêt , nous proposons un détour par le formalisme des réseaux de neurones écologiques . L' idée sous-jacente à ce formalisme nous semble tout particulièrement intéressante car elle considère non plus le réseau de neurones comme un simple outil mathématique mais comme un substrat d' étude des interactions . Nous pensons qu' au-delà des apports de la modélisation connexioniste classique , l' utilisation du formalisme écologique permet de prendre en compte l' un des fondements des théories de psychologie sociale , à savoir la notion d' interaction . 2 . Les réseaux de neurones écologiques Si les réseaux de neurones classiques possèdent de nombreux avantages , notamment l' absence de dissociation entre les unités et leur traitement , la capacité de généralisation à partir d' exemplaire appris ou la rapidité d' intégration de nouvelles connaissances , nous pouvons avancer une limite dans leur utilisation en psychologie sociale . Comme le soulignent Rumelhart et McClelland ( 1986 ) « ( ... ) nous ne pouvons comprendre la nature des systèmes sociaux à travers l' étude des individus isolément , et nous ne pouvons comprendre le comportement d' un réseau de neurones à partir de l' étude d' un neurone ( ... ) » . Retenons la première partie de cette affirmation , nous ne pouvons comprendre les phénomènes sociaux qu' à partir de la prise en compte des éléments d' interaction entre les individus et leurs relations avec l' environnement . La principale limite des réseaux de neurones classiques apparaît ici : la non interaction dynamique du réseau avec son environnement . En effet , lors de la conception d' un modèle connexioniste , un soin tout particulier doit être apporté aux situations d' apprentissage retenues . A partir de l' apprentissage d' une base d' exemplaires prédéfinie , caractéristiques de situations particulières , le réseau de neurones est capable de généraliser cet apprentissage à des situations nouvelles . Cela implique que le concepteur définisse deux bases d' exemplaires ceux à apprendre et ceux sur lesquels la généralisation portera . Il y donc un effet statique et fixe de cette base de données , ne laissant pas de place à un apprentissage qui serait dirigé par le réseau lui-même . Les recherches menées en vie artificielle proposent de dépasser cette limite en utilisant ce que nous définissons comme le formalisme des réseaux de neurones écologiques ( Parisi , Cecconi & Nolfi , 1990 ) . 2.1 . Principe fondamental des réseaux de neurones écologiques Les réseaux de neurones écologiques sont des réseaux de neurones équivalents à ceux classiquement utilisés , néanmoins ils s' en différencient par la façon dont ils sont utilisés . Ils possèdent donc les mêmes propriétés que les réseaux précédemment exposés , mais le chercheur n' adopte pas la même stratégie d' utilisation pour le stockage et la récupération d' informations . Les réseaux de neurones écologiques sont définis comme des agentsLes réseaux de neurones écologiques sont des réseaux de neurones équivalents à ceux classiquement utilisés , néanmoins ils s' en différencient par la façon dont ils sont utilisés . Ils possèdent donc les mêmes propriétés que les réseaux précédemment exposés , mais le chercheur n' adopte pas la même stratégie d' utilisation pour le stockage et la récupération d' informations . Les réseaux de neurones écologiques sont définis comme des agents [ 2 ] qui apprennent et qui évoluent dans un environnement ( Parisi , Cecconi & Nolfi , 1990 ) . Ces agents peuvent être implémentés par l' une des architectures de réseau de neurones présentées précédemment ; l' unique contrainte est de disposer d' un réseau de neurones distinguant les unités d' entrée de celles de sortie . Ceci est nécessaire pour que l' agent et l' environnement soient en situation d' interaction . Comme présenté sur le schéma 2 , le caractère écologique du réseau de neurones implique un agent placé dans un environnement . Dans cette situation , la relation est dynamique puisque l' agent en percevant une situation particulière de l' environnement propose un comportement , et l' environnement répond à ce comportement en fournissant la nouvelle situation en entrée de l' agent . Nous sommes ici dans une conception dynamique de la relation , où l' agent est acteur de sa perception . C' est en fonction du comportement produit par l' agent que sa relation à l' environnement est changée , si bien que ses perceptions en sont modifiées . qui apprennent et qui évoluent dans un environnement ( Parisi , Cecconi & Nolfi , 1990 ) . Ces agents peuvent être implémentés par l' une des architectures de réseau de neurones présentées précédemment ; l' unique contrainte est de disposer d' un réseau de neurones distinguant les unités d' entrée de celles de sortie . Ceci est nécessaire pour que l' agent et l' environnement soient en situation d' interaction . Comme présenté sur le schéma 2 , le caractère écologique du réseau de neurones implique un agent placé dans un environnement . Dans cette situation , la relation est dynamique puisque l' agent en percevant une situation particulière de l' environnement propose un comportement , et l' environnement répond à ce comportement en fournissant la nouvelle situation en entrée de l' agent . Nous sommes ici dans une conception dynamique de la relation , où l' agent est acteur de sa perception . C' est en fonction du comportement produit par l' agent que sa relation à l' environnement est changée , si bien que ses perceptions en sont modifiées . Schéma 1 : Schéma de l' interaction entre réseau de neurones écologique et l' environnement 2.2 . Architecture et apprentissage des réseaux de neurones écologiques Même si tout format d' implémentation est envisageable , les études actuelles considèrent plus généralement les agents comme des réseaux de neurones de type Perceptron Multi Couche ayant pour règle d' apprentissage l' algorithme de rétropropagation du gradient descendant de l' erreur . L' architecture de base des réseaux écologiques inclut des unités d' entrée recevant des informations sensorielles de l' environnement et des unités de sortie codant les réponses comportementales produites ( Parisi , Cecconi & Nolfi , 1990 ) . Dès lors , les réseaux de neurones écologiques peuvent être considérés comme des agents dynamiques évoluant dans un environnement autonome . Les informations données à l' agent sont déterminées par l' environnement ; les réponses produites par l' agent induisent un changement dans la relation agent-environnement qui se traduit par de nouvelles informations fournies en entrée . A partir du comportement produit par l' agent , la relation agent-environnement change et l' environnement définit les nouvelles entrées . Ces nouvelles entrées sont totalement dépendantes du comportement produit suite à la perception des entrées précédentes . Nous avions souligné que les réseaux de neurones classiques impliquent la définition par le concepteur d' une base d' exemplaires pour l' apprentissage et pour le test ; le formalisme écologique au contraire n' implique pas une telle contrainte . L' agent évolue dans un environnement ( Nolfi Parisi , 1997 ; A partir du comportement produit par l' agent , la relation agent-environnement change et l' environnement définit les nouvelles entrées . Ces nouvelles entrées sont totalement dépendantes du comportement produit suite à la perception des entrées précédentes . Nous avions souligné que les réseaux de neurones classiques impliquent la définition par le concepteur d' une base d' exemplaires pour l' apprentissage et pour le test ; le formalisme écologique au contraire n' implique pas une telle contrainte . L' agent évolue dans un environnement ( Nolfi Parisi , 1997 ; Cecconi & Parisi , 1998 ) qui détermine entièrement les conditions d' apprentissage . L' agent est donc considéré comme actif dans son apprentissage puisque c' est en fonction de son propre comportement et des réponses que lui fournit l' environnement que l' apprentissage prend place . Cecconi & Parisi , 1998 ) qui détermine entièrement les conditions d' apprentissage . L' agent est donc considéré comme actif dans son apprentissage puisque c' est en fonction de son propre comportement et des réponses que lui fournit l' environnement que l' apprentissage prend place . En phase d' apprentissage , l' agent ( le réseau de neurones écologique ) est placé dans l' environnement . L' environnement est implémenté par un algorithme qui en détermine sa structure , sa fonctionnalité et ses propriétés . Par exemple , l' environnement peut modéliser un espace dans lequel l' agent peut se déplacer . L' algorithme de l' environnement pourra définir alors les conséquences du comportement de l' agent en terme de position dans l' espace . L' apprentissage dans cette situation résulte des changements produits par les comportements de l' agent dans sa relation avec l' environnement et de l' adaptation du comportement en fonction de la tâche à accomplir ( Parisi , Cecconi & Nolfi , 1990 ) . 2.3 . Exemples d' utilisation des réseaux de neurones écologiques L' axe de recherche principal des réseaux de neurones écologiques considère leur capacité à prédire les conséquences de leur propre comportement en s' appuyant sur la méthodologie des algorithmes génétiques ( Holland , 1975 , puis Golberg , 1994 ) . L' objectif de cette partie n' étant pas de faire une revue sur les travaux concernant les réseaux de neurones écologiques , mais de proposer ce formalisme comme complément à celui classiquement utilisé , nous n' en présenterons que quelques exemples d' applications . Pour une grande part des études , les auteurs s' intéressent à l' interaction de l' agent avec son environnement physique . Nolfi , Elman et Parisi ( 1994 ) montrent qu' un agent peut apprendre à atteindre une cible dans un environnement en deux dimensions en prédisant les conséquences de son comportement . L' apprentissage de l' agent consiste à acquérir la capacité à prédire , sur la base des informations actuelles , qu' elles seront les prochaines informations reçues en entrée . Pour ce faire , les auteurs simulent un agent à partir d' un réseau de neurones dont l' architecture est simple . Le réseau de neurones implémenté consiste en une couche d' entrée à quatre unités codant les entrées sensorielles et l' action planifiée au temps tPour une grande part des études , les auteurs s' intéressent à l' interaction de l' agent avec son environnement physique . Nolfi , Elman et Parisi ( 1994 ) montrent qu' un agent peut apprendre à atteindre une cible dans un environnement en deux dimensions en prédisant les conséquences de son comportement . L' apprentissage de l' agent consiste à acquérir la capacité à prédire , sur la base des informations actuelles , qu' elles seront les prochaines informations reçues en entrée . Pour ce faire , les auteurs simulent un agent à partir d' un réseau de neurones dont l' architecture est simple . Le réseau de neurones implémenté consiste en une couche d' entrée à quatre unités codant les entrées sensorielles et l' action planifiée au temps t 0 ; 0 ; une couche cachée de sept unités et une couche de sortie de quatre unités codant l' action planifiée au temps t 1 et l' entrée sensorielle prédite au temps t une couche cachée de sept unités et une couche de sortie de quatre unités codant l' action planifiée au temps t 1 et l' entrée sensorielle prédite au temps t 11 . Par duplication , les auteurs créent une population d' agents qu' ils laissent évoluer dans l' environnement . L' apprentissage consiste en une adaptation des poids de connexions par rétropropagation . Pour cela , l' agent reçoit les informations sensorielles en entrée et propose en sortie une action et une prédiction de l' entrée suivante . L' agent exécute cette action et reçoit les nouvelles informations en entrée résultant de l' exécution de l' action . L' erreur rétropropagée est calculée en comparant la sortie correspondant à l' entrée sensorielle prédite et l' entrée sensorielle réelle donnée par l' environnement suite à l' exécution de l' action proposée . L' agent apprend ainsi à prédire correctement les nouvelles entrées au fur et à mesure de l' apprentissage . . Par duplication , les auteurs créent une population d' agents qu' ils laissent évoluer dans l' environnement . L' apprentissage consiste en une adaptation des poids de connexions par rétropropagation . Pour cela , l' agent reçoit les informations sensorielles en entrée et propose en sortie une action et une prédiction de l' entrée suivante . L' agent exécute cette action et reçoit les nouvelles informations en entrée résultant de l' exécution de l' action . L' erreur rétropropagée est calculée en comparant la sortie correspondant à l' entrée sensorielle prédite et l' entrée sensorielle réelle donnée par l' environnement suite à l' exécution de l' action proposée . L' agent apprend ainsi à prédire correctement les nouvelles entrées au fur et à mesure de l' apprentissage . L' apprentissage étant régi par les réponses de l' environnement à un comportement donné , il s' avère que l' agent est capable de maintenir un lien temporel entre les actions qu' il produit ( Nolfi & Parisi , 1994 ) . Ceci est indispensable quand l' apprentissage consiste non seulement à prédire les actions , mais aussi à atteindre une cible . En effet , chacune des nouvelles entrées sensorielles étant déterminée par les changements résultant du cycle précédent ( réponse comportementale antérieure ) , l' agent encode la séquence dans son intégralité , notamment celle lui permettant d' atteindre la cible . Les séquences comportementales possèdent alors une signification temporelle intrinsèque , dans le sens où le comportement de l' agent peut être évalué non plus en terme d' action simple mais en terme de séquence ( voir aussi Parisi , Cecconi & Nolfi , 1990 ) . L' agent peut alors adapter son comportement en apprenant à prédire les conséquences de ses actions puisqu' il est capable de déterminer , en fonction du contexte précédent , que seraient les nouvelles actions à produire . Cela élargit considérablement la connaissance que possède l' agent sur l' environnement car il connaît la réponse de l' environnement à une action donnée ( Parisi , 1997 ) . Les auteurs testent la capacité d' une population d' agents à prédire les conséquences de leurs actions et utilisent pour cela les algorithmes génétiques . Par sélection naturelle , les auteurs montrent que le maintien et la duplication des agents les plus performants permettent de mettre en évidence une amélioration de la résolution de la tâche . Ainsi , les générations d' agents présentent non pas des habiletés différentes mais des capacités de prédiction de plus en plus efficaces ( Cecconi & Parisi , 1998 : Nolfi , Elman & Parisi , 1994 ; Parisi , Cecconi & Nolfi , 1990 ) . D' autres études s' intéressent aux interactions entre agents . Werner et Dyer ( 1992 ) montrent l' efficacité de la transmission de signaux entre agents pour générer des comportements d' évitement d' objets . Si ces études montrent l' intérêt du formalisme écologique à prendre en compte la notion d' interaction entre l' agent et l' environnement , mais aussi entre les agents ( cf. Yao , 1993 pour une revue ) , elles ne sont pas destinées à produire des modèles psychologiques de l' influence de ces interactions . Pour résumer , ce qui nous intéresse dans le formalisme des réseaux de neurones écologiques repose sur l' idée d' une prise en compte possible du dynamisme de la relation entre agent et environnement . L' agent est acteur de sa perception , puisqu' après avoir agit dans l' environnement sa perception de celui -ci en est modifiée . Nous pensons que la prise en considération des interactions est indispensable à l' élaboration d' un modèle connexioniste dont l' objet est de modéliser des phénomènes sociaux . Tout en maintenant les propriétés inhérentes aux réseaux de neurones classiques , le formalisme écologique amène un intérêt supplémentaire , en proposant d' intégrer l' influence des interactions dans la construction que fait l' individu de son environnement social . Pour résumer , ce qui nous intéresse dans le formalisme des réseaux de neurones écologiques repose sur l' idée d' une prise en compte possible du dynamisme de la relation entre agent et environnement . L' agent est acteur de sa perception , puisqu' après avoir agit dans l' environnement sa perception de celui -ci en est modifiée . Nous pensons que la prise en considération des interactions est indispensable à l' élaboration d' un modèle connexioniste dont l' objet est de modéliser des phénomènes sociaux . Tout en maintenant les propriétés inhérentes aux réseaux de neurones classiques , le formalisme écologique amène un intérêt supplémentaire , en proposant d' intégrer l' influence des interactions dans la construction que fait l' individu de son environnement social . Les réseaux de neurones écologiques semblent ouvrir un nouveau champ de recherche pour les modèles connexionistes adaptés en psychologie sociale puisqu' ils permettent l' intégration dynamique des interactions . Le modèle connexioniste que nous proposerons par la suite ( cf. partie expérimentale , chapitre 1 , p . 83 ) trouvera dans ce formalisme un point d' ancrage important . 3 . Apports de la modélisation connexioniste à la psychologie sociale Depuis une dizaine d' années , la psychologie sociale voit se développer l' utilisation des modèles connexionistes comme une nouvelle méthodologie de recherche . Ces modèles simulent la façon dont l' information est traitée , apprise , récupérée et utilisée par les individus . Sans vouloir pour autant être des répliques du fonctionnement du cerveau humain , ils amènent par leurs propriétés inhérentes , une nouvelle façon de concevoir le traitement de l' information au cours des interactions sociales . L' engouement de certains chercheurs à introduire ce nouveau formalisme est incontestable , et nous allons tenter d' en comprendre les raisons . Au cours de ses interactions avec l' environnement physique mais aussi avec son environnement social , l' individu est amené à intégrer des informations sur les objets , les personnes , les groupes , les normes , les attitudes ou les comportements . Toutes ces connaissances lui sont indispensables pour produire lui-même des comportements adaptés aux situations qu' il rencontre . Pour cela , l' individu mémorise certaines informations qu' il réutilise ensuite en fonction des situations auxquelles il est exposé . L' individu acquiert des connaissances qui lui permettent d' agir de façon adaptée en situation sociale . En retour la réponse de l' environnement à ses comportements contribue à l' élaboration et à la modification de ses connaissances . Cette capacité que possède l' individu d' intégrer et d' utiliser ces informations est parfaitement simulable par un réseau de neurones . C' est l' une des propriétés à la base des recherches menées en psychologie sociale , tout particulièrement la capacité des réseaux de neurones à mémoriser des informations par apprentissage , et à récupérer et produire des informations à partir de celles stockées . 3.1 . Intérêts des modèles connexionistes pour les psychologues sociaux La plausibilité neurologique Largement inspirés des propriétés de base des neurones du cerveau humain , les modèles connexionistes postulent qu' un système cognitif est un réseau de neurones capable d' apprendre en codant les informations de façon non symbolique ( Hinton Largement inspirés des propriétés de base des neurones du cerveau humain , les modèles connexionistes postulent qu' un système cognitif est un réseau de neurones capable d' apprendre en codant les informations de façon non symbolique ( Hinton et al. , 1986 ; Hatfield , 1991 ) . Si les modèles connexionistes sont des versions très simplifiées des circuits neurologiques impliqués dans les processus , il s' avère qu' ils exposent des propriétés identiques à celles des individus . L' intégration et l' utilisation des connaissances sont réalisées à partir d' une structure simple incluant des unités , des liens et un flux d' activation . La perception des informations est simulée par des unités d' entrée permettant de coder les informations extérieures , le traitement de ces informations est réalisé à l' intérieur du réseau de neurones et celui -ci émet des réponses sur les unités de sortie en regard des informations perçues . Selon van Overwalle et Labiouse ( 2003 ) , cette propriété d' intégration dans un même système d' une mémoire à long terme ( les poids de connexions ) , d' une mémoire à court terme ( l' activation des unités ) et de l' information extérieure ( activation externe ) est primordiale pour simuler de la façon la plus plausible possible le traitement des informations par l' individu en situation sociale . Même si les modèles connexionistes ne se veulent pas des implémentations du système nerveux humains , ils exhibent une certaine plausibilité neurologique ( Honavar , 1994 ; McClelland , Mc Naughton & O'Reilly , 1995 ) qui séduit les psychologues sociaux ( van Overwalle & Labiouse , 2003 ) . Et ce , malgré le peu de vraisemblance de certaines règles d' apprentissage telle que la rétropropagation de l' erreur. , 1986 ; Hatfield , 1991 ) . Si les modèles connexionistes sont des versions très simplifiées des circuits neurologiques impliqués dans les processus , il s' avère qu' ils exposent des propriétés identiques à celles des individus . L' intégration et l' utilisation des connaissances sont réalisées à partir d' une structure simple incluant des unités , des liens et un flux d' activation . La perception des informations est simulée par des unités d' entrée permettant de coder les informations extérieures , le traitement de ces informations est réalisé à l' intérieur du réseau de neurones et celui -ci émet des réponses sur les unités de sortie en regard des informations perçues . Selon van Overwalle et Labiouse ( 2003 ) , cette propriété d' intégration dans un même système d' une mémoire à long terme ( les poids de connexions ) , d' une mémoire à court terme ( l' activation des unités ) et de l' information extérieure ( activation externe ) est primordiale pour simuler de la façon la plus plausible possible le traitement des informations par l' individu en situation sociale . Même si les modèles connexionistes ne se veulent pas des implémentations du système nerveux humains , ils exhibent une certaine plausibilité neurologique ( Honavar , 1994 ; McClelland , Mc Naughton & O'Reilly , 1995 ) qui séduit les psychologues sociaux ( van Overwalle & Labiouse , 2003 ) . Et ce , malgré le peu de vraisemblance de certaines règles d' apprentissage telle que la rétropropagation de l' erreur . La capacité d' apprentissage Au-delà de la plausibilité neurologique , les psychologues sociaux s' appuient sur les capacités d' apprentissage et d' émergence exhibées par les réseaux de neurones artificiels ( Kashima & Kerekes , 1994 ; Kashima , Woolcock Queller Smith , 1996 ; Smith van Overwalle & Labiouse , 2003 ; van Rooy , van Hormissen , Labiouse & French , 2003 ) . En effet , les réseaux de neurones possèdent la capacité d' apprendre de nouvelles informations et de les intégrer rapidement et efficacement à une structure déjà existante . Cette capacité est indispensable puisque la plupart des phénomènes étudiés en psychologie sociale reposent sur l' intégration des connaissances et leurs utilisations . Comme nous l' avons vu , l' apprentissage d' un réseau de neurones modifie au cours du temps les poids des connexions . La phase d' apprentissage permet l' intégration des événements auxquels est confronté le réseau de neurones . La représentation élaborée suite à cette phase permet de répondre de façon efficace et correcte à la présentation de situations déjà rencontrées et à de nouvelles situations . Cette capacité résulte de l' intégration simultanée d' un ensemble d' informations en un temps très court ( Read & Miller , 1998 ) . En effet , au cours de l' apprentissage , un réseau de neurones est confronté à un ensemble d' exemplaires qu' il intègre dans une seule et même structure de poids de connexions . Dans un réseau de neurones où l' approche distribuée est privilégiée , cette intégration permet de considérer la signification de chaque exemplaire comme influencée et contrainte par la signification des autres . La perception sociale peut alors être considérée comme la solution à des contraintes qui s' influencent mutuellement ( Amy , 1996 ; Read & Miller , 1998 ) . Au-delà de la plausibilité neurologique , les psychologues sociaux s' appuient sur les capacités d' apprentissage et d' émergence exhibées par les réseaux de neurones artificiels ( Kashima & Kerekes , 1994 ; Kashima , Woolcock Queller & Smith , 2002 ; Smith , 1996 ; Smith van Overwalle van Rooy , van Hormissen , Labiouse & French , 2003 ) . En effet , les réseaux de neurones possèdent la capacité d' apprendre de nouvelles informations et de les intégrer rapidement et efficacement à une structure déjà existante . Cette capacité est indispensable puisque la plupart des phénomènes étudiés en psychologie sociale reposent sur l' intégration des connaissances et leurs utilisations . Comme nous l' avons vu , l' apprentissage d' un réseau de neurones modifie au cours du temps les poids des connexions . La phase d' apprentissage permet l' intégration des événements auxquels est confronté le réseau de neurones . La représentation élaborée suite à cette phase permet de répondre de façon efficace et correcte à la présentation de situations déjà rencontrées et à de nouvelles situations . Cette capacité résulte de l' intégration simultanée d' un ensemble d' informations en un temps très court ( Read & Miller , 1998 ) . En effet , au cours de l' apprentissage , un réseau de neurones est confronté à un ensemble d' exemplaires qu' il intègre dans une seule et même structure de poids de connexions . Dans un réseau de neurones où l' approche distribuée est privilégiée , cette intégration permet de considérer la signification de chaque exemplaire comme influencée et contrainte par la signification des autres . La perception sociale peut alors être considérée comme la solution à des contraintes qui s' influencent mutuellement ( Amy , 1996 ; Read & Miller , 1998 ) . Chaque exemplaire appris contraint l' apprentissage des autres et l' apprentissage de l' ensemble résulte en une solution satisfaisante pour répondre à chacun des exemplaires . Cet aspect suppose donc que l' apprentissage prend place à mesure que l' individu est confronté à de nouvelles situations et que les connaissances sont intégrées en mémoire . Cet aspect suppose donc que l' apprentissage prend place à mesure que l' individu est confronté à de nouvelles situations et que les connaissances sont intégrées en mémoire . Dans la perspective d' étudier la formation d' impression , Kashima , Woolcock et Kashima ( 2000 ) se sont appuyés sur la capacité d' apprentissage des réseaux de neurones . Pour cela , ils ont simulé la façon dont un individu exposé à différentes situations sociales va intégrer au cours de l' apprentissage l' ensemble de ces informations . Ils ont ainsi simulé à partir d' un modèle localiste dit Tensor Product Model ( TPM ) la façon dont l' individu encode des situations sociales selon des exemples impliquant l' acteur , le comportement , l' objet et le contexte . Ainsi , TPM peut être interrogé sur les associations faites entre ces éléments suite à l' apprentissage de situations impliquant ceux -ci . A partir du fonctionnement de TPM , ces auteurs suggèrent qu' un seul processus sous-tend la formation et le changement des impressions : le processus d' apprentissage . Ce processus rend compte de la façon dont les événements sont stockés et réactualisés afin de produire des réponses adaptées . Ainsi , TPM permet de mettre en évidence que le changement des stéréotypes est fonction du type des informations rencontrées . Cette explication implique de considérer que la rencontre avec un membre consistant avec l' impression n' altère que très peu la représentation liée à ce groupe . A l' inverse , un membre inconsistant génère la création d' une sous catégorie , puisqu' il implique une distance à la catégorie élevée . C' est à partir de la comparaison de l' état d' activation de la représentation du groupe à celui impliqué par la prise en compte du membre rencontré que s' effectue ou non une altération de la représentation ou la création d' une sous-catégorie . La capacité des réseaux de neurones d' apprentissage présente , néanmoins , une faiblesse conséquente . Ce type de modèle est dans l' incapacité d' intégrer de nouvelles informations lorsque la phase d' apprentissage est terminée , ceci est plus connu sous le nom d' oubli catastrophique ( Mc Closkey & Cohen , 1989 ) . Après la phase d' apprentissage , il est impossible de faire apprendre une nouvelle série d' exemplaires sans que la première ne soit profondément altérée , allant jusqu'à être perdue ( McClelland La capacité des réseaux de neurones d' apprentissage présente , néanmoins , une faiblesse conséquente . Ce type de modèle est dans l' incapacité d' intégrer de nouvelles informations lorsque la phase d' apprentissage est terminée , ceci est plus connu sous le nom d' oubli catastrophique ( Mc Closkey & Cohen , 1989 ) . Après la phase d' apprentissage , il est impossible de faire apprendre une nouvelle série d' exemplaires sans que la première ne soit profondément altérée , allant jusqu'à être perdue ( McClelland et al. , 1995 ; French , 1999 ) . Des solutions apparaissent dans la littérature telle que l' intégration graduelle des nouvelles connaissances à apprendre entre les anciennes ( , 1995 ; French , 1999 ) . Des solutions apparaissent dans la littérature telle que l' intégration graduelle des nouvelles connaissances à apprendre entre les anciennes ( interleaved learning de McClelland de McClelland et al. , 1995 ) ou l' utilisation de pseudo- , 1995 ) ou l' utilisation de pseudo-pattern par un modèle duel ( Ans French , Ans & Rousset , 2001 ) . par un modèle duel ( Ans French , Ans & Rousset , 2001 ) . La propriété d' émergence L' une des caractéristiques principales des modèles connexionistes réside dans leur propriété d' émergence . Elle peut être distinguée en cinq catégories : extraction de prototype , complétion de L' une des caractéristiques principales des modèles connexionistes réside dans leur propriété d' émergence . Elle peut être distinguée en cinq catégories : extraction de prototype , complétion de pattern , généralisation , satisfaction de contraintes et dégradation partielle . Ceci est une implication directe de ce formalisme qui considère un ensemble d' unités élémentaires reliées entre elles par des connexions , où les représentations et leurs traitements forment un tout indissociable dont l' application s' effectue en parallèle. , généralisation , satisfaction de contraintes et dégradation partielle . Ceci est une implication directe de ce formalisme qui considère un ensemble d' unités élémentaires reliées entre elles par des connexions , où les représentations et leurs traitements forment un tout indissociable dont l' application s' effectue en parallèle . Au cours de l' apprentissage , la représentation élaborée tient compte des régularités rencontrées qu' elle intègre sur l' ensemble des unités et des poids . La représentation distribuée tient compte des détails redondants tout en ignorant les différences ( Smith , 1996 ) . La représentation résultante correspond donc aux caractéristiques centrales des informations rencontrées . Cela implique qu' un modèle connexioniste peut extraire un prototype à partir de nombreux exemplaires . Par exemple , Labiouse et French ( 2001 ) utilisent cette propriété pour répliquer la création de stéréotypes . Pour cela , ils soumettent un réseau de neurones de type Au cours de l' apprentissage , la représentation élaborée tient compte des régularités rencontrées qu' elle intègre sur l' ensemble des unités et des poids . La représentation distribuée tient compte des détails redondants tout en ignorant les différences ( Smith , 1996 ) . La représentation résultante correspond donc aux caractéristiques centrales des informations rencontrées . Cela implique qu' un modèle connexioniste peut extraire un prototype à partir de nombreux exemplaires . Par exemple , Labiouse et French ( 2001 ) utilisent cette propriété pour répliquer la création de stéréotypes . Pour cela , ils soumettent un réseau de neurones de type auto-encoder ( association du même ( association du même pattern en entrée et en sortie par le biais d' une couche cachée ) à l' apprentissage d' exemplaires . Ces derniers correspondent à des déclinaisons d' un stéréotype , et l' interrogation du réseau de neurones sur ce stéréotype indique sa capacité à l' extraire des exemplaires appris . Les auteurs ont ainsi montré que le réseau est capable , à partir de la confrontation à des déclinaisons du stéréotype , de répondre efficacement à la présentation d' exemplaire , c' est-à-dire à produire le stéréotype en sortie . De façon analogue , Smith et DeCoster ( 1998a et b ) ont mis en évidence qu' un réseau de neurones récurrent simule la création d' un stéréotype à partir de l' apprentissage d' exemplaires de traits . en entrée et en sortie par le biais d' une couche cachée ) à l' apprentissage d' exemplaires . Ces derniers correspondent à des déclinaisons d' un stéréotype , et l' interrogation du réseau de neurones sur ce stéréotype indique sa capacité à l' extraire des exemplaires appris . Les auteurs ont ainsi montré que le réseau est capable , à partir de la confrontation à des déclinaisons du stéréotype , de répondre efficacement à la présentation d' exemplaire , c' est-à-dire à produire le stéréotype en sortie . De façon analogue , Smith et DeCoster ( 1998a et b ) ont mis en évidence qu' un réseau de neurones récurrent simule la création d' un stéréotype à partir de l' apprentissage d' exemplaires de traits . La complétion de La complétion de pattern et la généralisation rendent de nouveau compte de l' intérêt du formalisme connexioniste . Ainsi , il est possible de présenter en entrée du réseau une information déjà connue mais incomplète . Le fonctionnement d' un réseau indique que l' activation proposée en unités d' entrée se propage au travers des connexions pour activer les unités qui lui sont connectées . Si certaines de ces unités d' entrée ne reçoivent pas d' activation , celle propagée par les unités activées compensent cette absence puisqu' elles activent toutes les autres unités . Pour un et la généralisation rendent de nouveau compte de l' intérêt du formalisme connexioniste . Ainsi , il est possible de présenter en entrée du réseau une information déjà connue mais incomplète . Le fonctionnement d' un réseau indique que l' activation proposée en unités d' entrée se propage au travers des connexions pour activer les unités qui lui sont connectées . Si certaines de ces unités d' entrée ne reçoivent pas d' activation , celle propagée par les unités activées compensent cette absence puisqu' elles activent toutes les autres unités . Pour un pattern d' information incomplet présenté en entrée du réseau , la diffusion de l' activation induite par les unités activées permet au réseau d' émettre une réponse adaptée ( cf. complétion de visages , Abdi , 1994 ) . Il y a bien émergence d' une réponse adaptée en regard de toutes les situations apprises malgré l' absence d' une partie de l' information de départ . d' information incomplet présenté en entrée du réseau , la diffusion de l' activation induite par les unités activées permet au réseau d' émettre une réponse adaptée ( cf. complétion de visages , Abdi , 1994 ) . Il y a bien émergence d' une réponse adaptée en regard de toutes les situations apprises malgré l' absence d' une partie de l' information de départ . Lorsqu' un réseau a appris un certain nombre d' exemplaires , il peut être interrogé sur ces derniers mais aussi sur de nouveaux . Cela renvoie à la capacité de généralisation . Lorsqu' il est interrogé , le réseau de neurones utilise la représentation créée lors de l' apprentissage pour généraliser sa réponse au nouvel exemplaire . Après l' apprentissage , le réseau possède une structure de poids reflétant toutes les expériences vécues . Si l' activation d' entrée n' a jamais été rencontrée en apprentissage , il n' en demeure pas moins que la propagation au travers des poids adaptés induit l' émergence d' une réponse en sortie . En fonction de la proximité de la nouvelle situation par rapport à celles acquises antérieurement , le réseau fournit une réponse adéquate représentant une généralisation des connaissances . Ainsi , à partir de l' apprentissage des traits caractéristiques des membres d' un groupe , un réseau est à même de généraliser ces traits à un nouveau membre du groupe ( Smith & DeCoster , 1998b ) . Dynamique de la démarche connexioniste L' aspect dynamique de la démarche connexioniste se traduit par la possibilité de simuler autant de situations différentes que souhaitées . La validité du modèle connexioniste , proposé pour un phénomène donné , est réalisée à travers la simulation . La simulation correspond à l' utilisation du modèle conçu comme substrat d' étude . Cela revient à générer une population de réseau de neurones dont l' architecture est définie par le modèle , et tester sur cette population un ensemble de contraintes aussi diversifiées que possible . Tout comme dans une expérimentation avec sujets humains , les réseaux sont soumis à diverses conditions expérimentales . Cela autorise l' expérimentation systématique d' un ensemble de contraintes et de situations parfois non envisageables en pratique , et permet de tester différentes conditions sur un même individu . A partir de la réplique du réseau , il est possible de tester l' efficacité de plusieurs apprentissages sur un individu possédant les mêmes caractéristiques de départ . Ce qui en pratique n' est pas réalisable du fait de l' interférence que peuvent produire les apprentissages antérieurs sur les nouveaux . Dès lors , la simulation peut être envisagée comme une nouvelle stratégie de recherche en psychologie sociale . Par ailleurs , la simulation présente l' intérêt de proposer de nouveaux mécanismes théoriques alternatifs à ceux habituellement développés par les modèles symboliques classiques . Elle permet d' envisager une approche unitaire des processus à savoir ne pas distinguer la recherche de l' utilisation de connaissances puisque nous avons vu que le traitement s' effectue en parallèle . Le modèle connexioniste utilisé en simulation permet une approche intégrative des théories existantes , puisqu' une seule et même structure est capable d' exhiber les performances par ailleurs expliquées par des mécanismes indépendants ( Smith & DeCoster , 1998b ) . Ainsi , la simulation connexioniste peut , par exemple , montrer qu' un seul modèle peut rendre compte de phénomènes expliqués jusqu'alors par des mécanismes séparés . Le modèle connexioniste proposé par Queller et Smith ( 2002 ) rend très bien compte de cet intérêt , puisqu' il modélise les phénomènes de « sous-catégorisation » ( Par ailleurs , la simulation présente l' intérêt de proposer de nouveaux mécanismes théoriques alternatifs à ceux habituellement développés par les modèles symboliques classiques . Elle permet d' envisager une approche unitaire des processus à savoir ne pas distinguer la recherche de l' utilisation de connaissances puisque nous avons vu que le traitement s' effectue en parallèle . Le modèle connexioniste utilisé en simulation permet une approche intégrative des théories existantes , puisqu' une seule et même structure est capable d' exhiber les performances par ailleurs expliquées par des mécanismes indépendants ( Smith & DeCoster , 1998b ) . Ainsi , la simulation connexioniste peut , par exemple , montrer qu' un seul modèle peut rendre compte de phénomènes expliqués jusqu'alors par des mécanismes séparés . Le modèle connexioniste proposé par Queller et Smith ( 2002 ) rend très bien compte de cet intérêt , puisqu' il modélise les phénomènes de « sous-catégorisation » ( subtyping ) , de « conversion » ( ) , de « conversion » ( conversion ) et d' intégration graduelle ( ) et d' intégration graduelle ( bookkeepping ) . A partir d' un réseau de neurones récurrent ( auto associateur ) , ces auteurs proposent un ensemble de simulations répliquant les résultats d' une modification modérée et graduelle du stéréotype par l' information nouvelle ( ) . A partir d' un réseau de neurones récurrent ( auto associateur ) , ces auteurs proposent un ensemble de simulations répliquant les résultats d' une modification modérée et graduelle du stéréotype par l' information nouvelle ( bookkepping ) , une altération critique du stéréotype réévalué à partir d' un certain seuil de l' information disconfirmatoire ( ) , une altération critique du stéréotype réévalué à partir d' un certain seuil de l' information disconfirmatoire ( conversion ) et la création de sous-catégories pour les informations inconsistantes considérées comme des exceptions ( ) et la création de sous-catégories pour les informations inconsistantes considérées comme des exceptions ( subtyping ) . Ce modèle propose d' envisager sous un angle unique l' intégration des trois modèles classiques . Ainsi , le modèle connexioniste est par essence même de type ) . Ce modèle propose d' envisager sous un angle unique l' intégration des trois modèles classiques . Ainsi , le modèle connexioniste est par essence même de type bookkepping , puisqu' il intègre de façon incrémentale les situations rencontrées . De plus , il permet de proposer que le , puisqu' il intègre de façon incrémentale les situations rencontrées . De plus , il permet de proposer que le subtyping est une résultante du est une résultante du bookkeping , puisque ce n' est pas l' association entre les groupes et les attributs qui est modifiée mais l' association entre les attributs eux-mêmes qui est altéré par l' intégration d' éléments disconfirmatoires . En effet , l' information modérément disconfirmatoire est intégrée comme élément du , puisque ce n' est pas l' association entre les groupes et les attributs qui est modifiée mais l' association entre les attributs eux-mêmes qui est altéré par l' intégration d' éléments disconfirmatoires . En effet , l' information modérément disconfirmatoire est intégrée comme élément du pattern d' activation et n' implique qu' un changement modéré ; alors que l' information extrême induit un changement important au niveau du d' activation et n' implique qu' un changement modéré ; alors que l' information extrême induit un changement important au niveau du pattern d' activation . d' activation . Smith et DeCoster ( 1998b ) utilisent une modélisation distribuée et montrent de la même façon qu' un seul mécanisme peut rendre compte et reproduire les résultats des différentes explications traditionnellement utilisées dans la perception des personnes . Ces auteurs sont particulièrement intéressés par l' apprentissage des stéréotypes et leur application . L' intérêt d' un tel modèle est de proposer une seule structure explicative des trois processus traditionnellement exposés . Le premier implique un processus d' abstraction qui résume les informations spécifiques pour produire des schémas génériques ou des prototypes utilisés pour faire des inférences . Le deuxième processus contribue au stockage et la récupération d' exemplaires . Le dernier permet d' identifier le niveau d' accessibilité des informations des différentes représentations stockées . Ces processus se manifestent par : i ) la capacité de l' individu à apprendre les caractéristiques spécifiques d' une personne connue , et les appliquer par inférence à de nouveaux exemplaires ; ii ) la capacité à apprendre des traits spécifiques sur un groupe à partir de la rencontre de certains membres et leur généralisation aux autres membres ; iii ) la capacité à apprendre plusieurs structures de connaissances et les combiner pour inférer des traits à un nouvel exemplaire ; iiii ) l' importance de la récence et de la fréquence d' exposition dans les inférences de traits . Ainsi , à partir d' un réseau de neurones récurrent utilisant une règle d' apprentissage , Smith et DeCoster ( 1998b ) répliquent de façon isomorphe ces effets . Pour cela , ils proposent un modèle de type auto-associateur où toutes les unités sont systématiquement reliées à toutes les autres . Chaque unité reçoit une information en entrée et produit une réponse en sortie . Simultanément , l' activation de chacune des unités se propage aux autres de telle sorte qu' elles s' influencent mutuellement . La configuration d' activation finale dépend à la fois de l' information externe et de l' état interne du réseau ( le poids des connexions entre unités provenant de l' apprentissage du réseau ) . Suite à la phase d' apprentissage consistant à créer dans le réseau une mémoire d' expériences vécues , la présentation de nouveaux stimuli permet de tester comme pour un sujet la réponse du réseau en fonction de l' information d' entrée . Les résultats des simulations utilisant ce modèle reproduisent plusieurs effets . Par exemple , l' effet de fréquence d' exemplaires rencontrés sur les inférences , c' est-à-dire que plus le nombre d' exemplaires présentant des similarités augmente , plus ils sont utilisés pour faire des inférences sur d' autres . L' effet d' apprentissage de stéréotypes sur un groupe à partir de l' exposition à des membres de ce groupe , c' est-à-dire la création d' un prototype à partir d' exemplaires . Ce modèle contribue donc à comprendre la façon dont les individus intègrent et utilisent les informations auxquelles ils sont soumis lors de la perception des personnes . De plus , au-delà de la simple réplication de résultats existants ( nécessaire à la validation du modèle connexioniste proposé comme implémentation ) , nous pensons que la simulation permet de prédire de nouveaux résultats . Ainsi , en utilisant des situations tests non encore étudiées dans la littérature ou en proposant une approche différente des processus impliqués dans un phénomène , les performances obtenues ( quantitatives et qualitatives ) peuvent être confrontées aux données expérimentales humaines . Le rôle de la simulation n' est donc pas de remplacer l' expérimentation mais bien de faciliter la proposition d' hypothèses alternatives . La modélisation connexioniste est donc bien un nouvel outil de recherche pour la psychologie sociale . Elle ne remplace pas les modèles classiques , mais elle propose un autre point de vue sur ces modèles , c' est une alternative efficace dans l' élaboration de nouvelles hypothèses de recherche . 3.2 . Exemples d' axes d' utilisation du formalisme connexioniste émergeant en psychologie sociale . Deux axes de recherche se sont développés autour de l' introduction du connexionisme en psychologie sociale , en s' orientant soit sur l' évolution des modèles proposés , soit sur l' utilisation de modèles existants . Si le champ de la formation d' impression a fait l' objet de nombreuses publications , d' autres modèles connexionistes ont implémenté les attributions causales ou la dissonance cognitive ( Jordens Shultz & Lepper , 1996 , van Overwalle & Jordens , 2002 ) . Ces modèles proposent de la même façon , en se confrontant mutuellement , d' améliorer la compréhension et l' explication des phénomènes étudiés . La démarche envisagée ici consiste à « rebondir » sur les apports de chaque modèle . En effet , nous verrons qu' à partir d' un premier modèle connexioniste , d' autres se sont développés en intégrant les aspects positifs mais aussi en palliant les limites de leurs prédécesseurs . Par exemple , les modèles connexionistes de la formation d' impression , mettent en évidence la possibilité de remplacer plusieurs processus par un seul modèle explicatif , en présentant une évolution de conception incontestable . Les premiers modèles de satisfaction de contraintes parallèles tels que développés par Kunda et Thagard ( 1996 ) , ont donné lieu à de nombreuses critiques notamment en terme de conception statique et d' incapacité à apprendre de nouvelles situations . Kunda et Thagard ( 1996 ) ont proposé l' un des premiers modèles connexionistes de la formation d' impression dit IMP ( IMPression formation ) . Ce modèle est créé selon l' approche localiste de satisfaction de contraintes parallèles . Il décrit la façon dont un individu observateur utilise ses connaissances sur un groupe social pour se former une impression sur une personne . IMP est un réseau de neurones dont les unités codent des connaissances ( stéréotypes , traits ou comportements ) , et les poids entre unités traduisent des liens excitateurs ou inhibiteurs entre ces connaissances . Ces liens sont déterminés sur la base de données typiquement obtenue en expérimentation . IMP réplique des résultats tels que la coloration de la compréhension d' un comportement par les stéréotypes , en indiquant que cela provient du fait que l' individu observé active directement certains stéréotypes activant eux-mêmes certains traits qui en retour activent certaines interprétations du comportement . Observer quelqu' un qui pousse autrui est interprété comme un comportement agressif lorsqu' il est émis par un individu noir plutôt qu' un individu blanc du fait des connexions existantes entre les comportements , les traits et le stéréotype . IMP explique de façon intégrative comment différentes sources d' informations sur une personne peuvent s' influencer et s' intégrer mutuellement pour former une impression cohérente . Cette influence n' étant pas définie à partir de processus dissociés du traitement de certaines informations . La limite principale de ce modèle concerne son incapacité à apprendre de nouvelles informations puisqu' il ne dispose d' aucune règle d' apprentissage . Dès lors , d' autres options de modélisation ont été envisagées permettant l' intégration notamment de l' apprentissage de nouvelles situations . Si IMP était conçu de façon localiste et statique , Queller et Smith ( 2002 ) et Smith et DeCoster ( 1998a et b ) proposent d' envisager l' utilisation d' un modèle récurrent possédant une règle d' apprentissage . Ils décrivent ainsi , la façon dont l' individu utilise ses connaissances antérieures sur les individus et sur les groupes pour faire des inférences sur d' autres caractéristiques inconnues . Comme nous l' avons déjà expliqué , les résultats des simulations reproduisent les effets de fréquence d' exemplaires rencontrés sur les inférences , les effets d' apprentissage de stéréotypes de groupe à partir de l' exposition à des membres de ce groupe , des effets de fréquence et de récence sur l' accessibilité . Le modèle connexioniste proposé rend compte d' un seul mécanisme générateur de ces effets et permet d' intégrer la notion d' apprentissage . Malgré l' évitement de questions relatives au moment où le stockage des exemplaires ou encore liées à la façon d' utiliser les stéréotypes ou les exemplaires connus , il n' empêche que certaines limites demeurent . En effet , le modèle proposé est peu influencé par une fréquence de rencontres avec un stimulus dont les caractéristiques ont un poids faible , alors que les individus intègrent fortement certains indices peu courants . En parallèle , le développement proposé par Kashima Dès lors , d' autres options de modélisation ont été envisagées permettant l' intégration notamment de l' apprentissage de nouvelles situations . Si IMP était conçu de façon localiste et statique , Queller et Smith ( 2002 ) et Smith et DeCoster ( 1998a et b ) proposent d' envisager l' utilisation d' un modèle récurrent possédant une règle d' apprentissage . Ils décrivent ainsi , la façon dont l' individu utilise ses connaissances antérieures sur les individus et sur les groupes pour faire des inférences sur d' autres caractéristiques inconnues . Comme nous l' avons déjà expliqué , les résultats des simulations reproduisent les effets de fréquence d' exemplaires rencontrés sur les inférences , les effets d' apprentissage de stéréotypes de groupe à partir de l' exposition à des membres de ce groupe , des effets de fréquence et de récence sur l' accessibilité . Le modèle connexioniste proposé rend compte d' un seul mécanisme générateur de ces effets et permet d' intégrer la notion d' apprentissage . Malgré l' évitement de questions relatives au moment où le stockage des exemplaires ou encore liées à la façon d' utiliser les stéréotypes ou les exemplaires connus , il n' empêche que certaines limites demeurent . En effet , le modèle proposé est peu influencé par une fréquence de rencontres avec un stimulus dont les caractéristiques ont un poids faible , alors que les individus intègrent fortement certains indices peu courants . En parallèle , le développement proposé par Kashima et al. ( 1994 ) et Kashima , Woolcock et Kashima ( 2000 ) permet de contribuer à la prise en compte de l' évolution des stéréotypes et leur application dans des paradigmes de classification et de jugement . ( 1994 ) et Kashima , Woolcock et Kashima ( 2000 ) permet de contribuer à la prise en compte de l' évolution des stéréotypes et leur application dans des paradigmes de classification et de jugement . Par ailleurs , van Overwalle et Labiouse ( 2003 ) et van Rooy Par ailleurs , van Overwalle et Labiouse ( 2003 ) et van Rooy et al. ( 2003 ) utilisent un auto-associateur linéaire récurrent pour expliquer davantage de phénomènes de la formation d' impression . Ils proposent un réseau auto-associateur linéaire récurrent à faible taux de paramètres variables . Cela revient à définir une architecture générale dont les paramètres ( taux d' apprentissage , fonction d' activation , règle d' apprentissage , etc. ) demeurent équivalents dans toutes les simulations . Les auteurs s' appuient sur une approche localiste , en proposant que chacun des concepts utilisés soit représenté par une unité particulière . Cela leur permet d' améliorer les propositions d' explications faites par les modèles antérieurs . Ainsi , ce modèle offre une nouvelle perspective de compréhension des processus impliqués dans la perception sociale . Il décrit comment l' apprentissage de structures de connaissances prend place à travers le développement d' associations entre concepts sociaux . C' est à partir de son aspect dynamique et adaptatif induit par l' utilisation de la règle d' apprentissage du delta que ce modèle présente un pouvoir computationnel plus important que ses prédécesseurs . Si ce modèle réplique de façon isomorphe les résultats de la littérature , il permet aussi de prédire à un niveau de détail plus précis les résultats qu' obtiendraient des sujets en expérimentation . De plus , il comble certaines limites du TPM telle que l' obligation d' ajouter des mécanismes externes pour modéliser le changement de stéréotype lorsqu' une information inconsistante nécessite d' individualiser un individu . ( 2003 ) utilisent un auto-associateur linéaire récurrent pour expliquer davantage de phénomènes de la formation d' impression . Ils proposent un réseau auto-associateur linéaire récurrent à faible taux de paramètres variables . Cela revient à définir une architecture générale dont les paramètres ( taux d' apprentissage , fonction d' activation , règle d' apprentissage , etc. ) demeurent équivalents dans toutes les simulations . Les auteurs s' appuient sur une approche localiste , en proposant que chacun des concepts utilisés soit représenté par une unité particulière . Cela leur permet d' améliorer les propositions d' explications faites par les modèles antérieurs . Ainsi , ce modèle offre une nouvelle perspective de compréhension des processus impliqués dans la perception sociale . Il décrit comment l' apprentissage de structures de connaissances prend place à travers le développement d' associations entre concepts sociaux . C' est à partir de son aspect dynamique et adaptatif induit par l' utilisation de la règle d' apprentissage du delta que ce modèle présente un pouvoir computationnel plus important que ses prédécesseurs . Si ce modèle réplique de façon isomorphe les résultats de la littérature , il permet aussi de prédire à un niveau de détail plus précis les résultats qu' obtiendraient des sujets en expérimentation . De plus , il comble certaines limites du TPM telle que l' obligation d' ajouter des mécanismes externes pour modéliser le changement de stéréotype lorsqu' une information inconsistante nécessite d' individualiser un individu . Le modèle proposé par van Overwalle et Labiouse ( 2003 ) n' est pas présenté en détail , cependant , il nous semble intéressant de noter , qu' après les évolutions et les développements proposés au travers des modèles précédents , ce modèle rend compte d' un certain aboutissement . Ils utilisent le modèle présenté précédemment afin de comprendre comment l' information est encodée , structurée et activée afin d' être réactivée dans l' émission de jugements . Les résultats obtenus en simulation répliquent de façon isomorphe ceux de la littérature existante , et prédisent favorablement d' autres résultats . L' aspect prédictif proposé ici , permet d' envisager une autre façon de concevoir la recherche ; en ce sens qu' il montre la capacité de la modélisation connexioniste à proposer des hypothèses complémentaires testables en expérimentation . Il se pourrait cependant , comme le soulignent les auteurs , que l' adéquation entre données de simulations et données d' expérimentations provienne essentiellement de choix de paramètres particuliers au cours des simulations . L' intérêt d' une telle démarche réside bien dans cette capacité de la modélisation connexioniste de simplifier et réunifier les théories existantes . Au-delà de cet aspect explicatif , l' évolution qui apparaît dans la conception de ces modèles révèle un autre point d' intérêt des modèles connexionistes : l' aspect dynamique de la réflexion . Si les auteurs ne s' accordent pas sur un modèle particulier pour simuler la formation d' impression , la confrontation et l' évaluation des modèles de chacun induit des développements considérables de la recherche connexioniste autour de ce thème et amènent de nouvelle conception théorique . De même , les recherches menées autour de l' attribution causale ont amené un développement des modélisations pour aboutir principalement à un recentrage des études par le biais du modèle proposé par van Overwalle et van Rooy ( 2001 ) . C' est à partir des confrontations et de l' évaluation des prédécesseurs que ce recentrage émerge . Utilisant une approche des modèles connexionistes quelque peu différente , Read et Marcus-Newhall ( 1993 ) proposent , à partir des résultats du modèle ( ECHO ) développé par Thagard ( 1989 ) sur les explications causales , d' en tester la capacité prédictive . Nous trouvons ici une démarche différente de celle exposée précédemment qui cherchait une amélioration du modèle par utilisation d' architecture différente . Read et Marcus-Newhall ( 1993 ) proposent de tester les principes résultants de l' étude de Thagard ( 1989 ) auprès de sujets humains . Thagard ( 1989 ) propose que le choix d' une explication causale , au détriment d' une autre , est dirigé par quatre principes : la préférence pour des explications expliquant le plus d' événements , la préférence pour les explications les plus simples , l' utilisation d' explications qui sont elles-mêmes explicables et enfin un choix compétitif entre explications . Après avoir confronté les résultats proposés par le modèle et ceux obtenus par les sujets , Read et Marcus-Newhall ( 1993 ) indiquent que la simulation de chacun des principes indépendamment révèle leur rôle dans l' évaluation des explications . Si les explications proposées par Thagard étaient directement issues des simulations , il s' avère que le choix d' appliquer les quatre principes identifiés en même temps et d' implémenter une situation complexe de travail en groupe , amène le problème de validité psychologique . Read et Marcus-Newhall ( 1993 ) testent donc cette validité psychologique par une indépendance du test des principes et une confrontation aux données d' expérimentation . Le retour que proposent les auteurs sur le modèle ECHO indique que les hypothèses proposées par ECHO sont valides et trouvent une confirmation expérimentale . De la même façon que la modélisation de la formation d' impression trouvait une évolution au cours des développements de modèles , d' autres auteurs ont proposé des améliorations de l' implémentation des explications causales . Van Overwalle ( 1998 ) , dans une critique des résultats obtenus par Read et Marcus-Newhall ( 1993 ) , propose de dépasser les limites d' ECHO concernant le manque de prise en compte des problèmes de covariation d' information . A partir d' un réseau de type De la même façon que la modélisation de la formation d' impression trouvait une évolution au cours des développements de modèles , d' autres auteurs ont proposé des améliorations de l' implémentation des explications causales . Van Overwalle ( 1998 ) , dans une critique des résultats obtenus par Read et Marcus-Newhall ( 1993 ) , propose de dépasser les limites d' ECHO concernant le manque de prise en compte des problèmes de covariation d' information . A partir d' un réseau de type feedforward avec une règle d' apprentissage delta , il propose une perspective alternative des principes de cohérence dans l' explication causale qui tient compte de la confrontation à de nouvelles expériences . La réponse de Read et Montoya ( 1999 ) au modèle avec une règle d' apprentissage delta , il propose une perspective alternative des principes de cohérence dans l' explication causale qui tient compte de la confrontation à de nouvelles expériences . La réponse de Read et Montoya ( 1999 ) au modèle feedforward proposé par van Overwalle ( 1998 ) implique l' utilisation d' un réseau auto-associateur . Ce développement à partir des critiques d' ECHO et du modèle de van Overwalle ( 1998 ) permet de considérer des problèmes tels que l' asymétrie ou la compétition entre explications . Si ce modèle se développe à partir des critiques de ceux antérieurement conçus , van Overwalle et van Rooy ( 2001 ) proposent de modéliser spécifiquement les principes de covariation et de compétition de Kelley ( 1971 ) . Ils montrent ainsi que ces principes et celui de la taille des exemplaires peuvent être simulés et expliqués par un modèle connexioniste . Ils montrent non seulement comment l' individu ajuste au pas à pas ses estimations causales ( règle delta ) , mais aussi comment l' individu émet des jugements adéquats pour des situations dans lesquelles il ne dispose pas d' informations nouvelles . proposé par van Overwalle ( 1998 ) implique l' utilisation d' un réseau auto-associateur . Ce développement à partir des critiques d' ECHO et du modèle de van Overwalle ( 1998 ) permet de considérer des problèmes tels que l' asymétrie ou la compétition entre explications . Si ce modèle se développe à partir des critiques de ceux antérieurement conçus , van Overwalle et van Rooy ( 2001 ) proposent de modéliser spécifiquement les principes de covariation et de compétition de Kelley ( 1971 ) . Ils montrent ainsi que ces principes et celui de la taille des exemplaires peuvent être simulés et expliqués par un modèle connexioniste . Ils montrent non seulement comment l' individu ajuste au pas à pas ses estimations causales ( règle delta ) , mais aussi comment l' individu émet des jugements adéquats pour des situations dans lesquelles il ne dispose pas d' informations nouvelles . Conclusion du chapitre 1 Si le développement de modèles connexionistes émerge en psychologie sociale comme nouvelle stratégie de recherche , il s' avère que leur intérêt est en pratique incontestable . Au-delà d' une simple réplication de théorie existante , ces modèles proposent un regard alternatif sur les phénomènes étudiés . Néanmoins , comme nous l' avons souligné , ces modèles déjà développés utilisent le formalisme classique des réseaux de neurones dont les contraintes d' utilisation ne permettent pas de rendre compte des interactions auxquelles les individus sont soumis . Le formalisme classique nous semble , certes adéquate , mais nous pensons que la possibilité de prendre en compte les interactions entre les individus de façon plus dynamique permet d' aller plus loin . Le formalisme des réseaux de neurones écologiques pallie ce déficit , en proposant d' utiliser le réseau de neurones non plus comme une entité statique mais comme un agent actif . Cet agent évolue , apprend dans son environnement en intégrant les conséquences de son comportement . Ce principe permet de prendre en compte non plus les processus impliqués pour l' individu dans des situations prédéfinies , mais de considérer qu' il est acteur et qu' il entretient avec son environnement une relation qui détermine ses apprentissages . Les situations sociales où l' individu est en interaction avec ses pairs sont nombreuses , néanmoins , il nous semble qu' une situation où l' individu bénéficie de la présence d' autrui parce que cet autrui lui permet d' apprendre , propose un cadre de test du formalisme écologique intéressant . Ce type de situation réfère au phénomène d' apprentissage social et nous allons développer dans le second chapitre les différents aspects de cette théorie développée par Bandura ( 1986 ) . Chapitre 2 : L' apprentissage social Le choix de la théorie de l' apprentissage social ( Bandura , 1977 ) comme champ d' application des réseaux de neurones écologiques s' est imposé tout naturellement . D' une part , parce que c' est une théorie robuste déjà longuement éprouvée par une multitude de recherches . D' autre part , c' est une théorie aboutie pour laquelle les recherches actuelles amènent des compléments d' explication sans pour autant la remettre en cause . En outre , l' obligation d' impliquer deux ou plusieurs individus dans le phénomène d' apprentissage social amène naturellement à considérer un modèle connexioniste qui est capable d' entrer en relation avec son environnement social pour acquérir de nouvelles connaissances . Cela étant l' idée fondatrice du formalisme écologique , il nous semble que créer un modèle connexioniste écologique nous permettra de rendre compte de l' influence de l' interaction entre les individus . La théorie de l' apprentissage social suppose que l' individu bénéficie de la présence d' autrui , parce que cet autrui lui évite de se confronter à toutes les situations pour s' adapter . Ainsi , l' individu peut apprendre sans faire l' expérience directe des conséquences de ses comportements sur l' environnement . A partir de l' observation des comportements émis par autrui , l' individu est en mesure de les apprendre , de les intégrer de la même façon que s' il les avait lui-même vécus . Ce type d' apprentissage repose sur un ensemble de processus impliqués dans la mémorisation et dans la production éventuelle de ces comportements . Après avoir présenté les origines de la théorie de l' apprentissage social et ses fondements , nous développerons plus précisément l' une de ses composantes : l' apprentissage par observation développée par Bandura ( 1986 ) . Dans la perspective de développer un modèle connexioniste écologique de l' apprentissage par observation , nous focaliserons essentiellement notre présentation théorique sur les aspects de mémorisation et de production des comportements . La mémorisation des comportements observés relève spécifiquement des propriétés d' apprentissage et d' émergence de connaissances , et la production relève principalement de la mise en action d' un modèle dans une situation sociale . Afin d' introduire les notions nécessaires à la suite du document , l' apprentissage d' habiletés motrices fera l' objet d' un exposé détaillé . 1 . Apprentissage social L' apprentissage peut être défini comme la résultante de l' intégration au système cognitif , de façon relativement permanente , de nouvelles informations et de nouvelles stratégies d' utilisation de ces informations . Il peut être individuel ou résulter d' une interaction . L' apprentissage individuel consiste , pour l' individu , à acquérir de nouvelles structures de connaissances , de nouveaux comportements par un apprentissage de type essai-erreur . Néanmoins , une grande part des acquisitions est réalisée au travers des interactions de l' individu avec autrui , et ce type d' apprentissage réfère à l' apprentissage social . 1.1 . Origine de la théorie de l' apprentissage social Bandura publie ces premiers travaux sur l' apprentissage social au début des années soixante en suivant le chemin déjà ouvert par d' autres chercheurs sur la base de perspectives différentes . Parmi ces auteurs , Rotter ( 1954 ) s' appuie sur l' application clinique de la théorie de l' apprentissage social . Selon lui l' environnement social permettrait à l' enfant d' acquérir graduellement de nouveaux buts ( besoins psychologiques ) , habiletés , et de nouvelles attentes dépendantes des expériences ( renforcements obtenus suite aux comportements ) . L' apprentissage consiste en une généralisation des attentes de renforcement . Sears ( 1958 ) se focalise quant à lui sur les processus de socialisation et s' intéresse plus particulièrement à la façon dont les enfants internalisent les valeurs , les attitudes , et les comportements prédominants dans leur culture ( cité dans Grussec , 1992 Bandura publie ces premiers travaux sur l' apprentissage social au début des années soixante en suivant le chemin déjà ouvert par d' autres chercheurs sur la base de perspectives différentes . Parmi ces auteurs , Rotter ( 1954 ) s' appuie sur l' application clinique de la théorie de l' apprentissage social . Selon lui l' environnement social permettrait à l' enfant d' acquérir graduellement de nouveaux buts ( besoins psychologiques ) , habiletés , et de nouvelles attentes dépendantes des expériences ( renforcements obtenus suite aux comportements ) . L' apprentissage consiste en une généralisation des attentes de renforcement . Sears ( 1958 ) se focalise quant à lui sur les processus de socialisation et s' intéresse plus particulièrement à la façon dont les enfants internalisent les valeurs , les attitudes , et les comportements prédominants dans leur culture ( cité dans Grussec , 1992 [ 3 ] ) . Miller et Dollard ( 1941 ) ont proposé une théorie relativement complète de l' apprentissage social et de l' imitation fondée sur le renforcement . Le renforcement y est défini comme un moyen de réduire le ) . Miller et Dollard ( 1941 ) ont proposé une théorie relativement complète de l' apprentissage social et de l' imitation fondée sur le renforcement . Le renforcement y est défini comme un moyen de réduire le drive ( « l' activation » ) et l' imitation prend place dès lors que les réponses de l' individu ont été suffisamment renforcées pour qu' il maintienne le lien entre comportement émis et renforcement reçu . Cependant , ces auteurs ne prennent pas en considération l' acquisition de nouveaux comportements et la possibilité d' émettre des comportements observés , et ce , en l' absence du modèle . Afin de remédier à ce déficit théorique , Bandura ( 1986 ) propose de redéfinir la théorie de l' apprentissage social en intégrant spécifiquement les processus cognitifs impliqués dans ce type d' apprentissage . Il cherche notamment à comprendre comment les adultes et les enfants intègrent cognitivement leurs expériences sociales et dans quelle mesure ces opérations cognitives influencent leur comportement et leur développement . L' auteur se distingue ainsi des théories classiques de l' apprentissage social en intégrant le concept de déterminisme triadique réciproque dans l' explication du comportement humain . Ce déterminisme est défini comme l' interaction constante entre les facteurs cognitifs , comportementaux et environnementaux . De plus , Bandura considère l' apprentissage par observation comme une forme d' apprentissage social qui jusqu'alors n' avait été que peu prise en compte . C' est en 1986 qu' il rebaptise sa théorie de l' apprentissage social en « Théorie Sociale Cognitive » ( ( « l' activation » ) et l' imitation prend place dès lors que les réponses de l' individu ont été suffisamment renforcées pour qu' il maintienne le lien entre comportement émis et renforcement reçu . Cependant , ces auteurs ne prennent pas en considération l' acquisition de nouveaux comportements et la possibilité d' émettre des comportements observés , et ce , en l' absence du modèle . Afin de remédier à ce déficit théorique , Bandura ( 1986 ) propose de redéfinir la théorie de l' apprentissage social en intégrant spécifiquement les processus cognitifs impliqués dans ce type d' apprentissage . Il cherche notamment à comprendre comment les adultes et les enfants intègrent cognitivement leurs expériences sociales et dans quelle mesure ces opérations cognitives influencent leur comportement et leur développement . L' auteur se distingue ainsi des théories classiques de l' apprentissage social en intégrant le concept de déterminisme triadique réciproque dans l' explication du comportement humain . Ce déterminisme est défini comme l' interaction constante entre les facteurs cognitifs , comportementaux et environnementaux . De plus , Bandura considère l' apprentissage par observation comme une forme d' apprentissage social qui jusqu'alors n' avait été que peu prise en compte . C' est en 1986 qu' il rebaptise sa théorie de l' apprentissage social en « Théorie Sociale Cognitive » ( Social Cognitive Theory ) marquant ainsi son empreinte personnelle de l' évolution théorique qu' il défend depuis le début de ses publications sur le sujet . ) marquant ainsi son empreinte personnelle de l' évolution théorique qu' il défend depuis le début de ses publications sur le sujet . 1.2 . D' une conception béhavioriste à une conception néo-béhavioriste de la théorie de l' apprentissage social Les théories de l' apprentissage social trouvent leur origine dans une conception béhavioriste , d' une part en définissant la production d' un comportement comme une réponse à une stimulation particulière , d' autre part , en stipulant que l' apprentissage des comportements est fondé sur la régularité des renforcements à laquelle l' individu est confronté dans son environnement et au cours de son existence . En revanche , la théorie sociale cognitive envisage qu' au-delà d' une association stimilus-réponse , les facteurs individuels tiennent une place particulièrement importante dans le développement des comportements . En outre , selon Bandura ( 1986 ) , l' apprentissage n' est pas une conséquence unique du renforcement des comportements produits par l' individu mais peut apparaître sans que l' individu ne soit directement soumis aux influences environnementales . Pour cela , la théorie sociale cognitive définit le développement des comportements humains comme résultant de l' interaction dynamique entre les facteurs personnels , le comportement et l' environnement . Les facteurs personnels réfèrent aux pensées , affects , croyances , intentions , attentes et aux capacités physiques et sensorielles de l' individu . Le comportement correspond à toutes les actions de l' individu dirigées vers l' environnement extérieur . L' environnement considère à la fois les aspects physiques de celui -ci mais aussi les personnes . Ces trois facteurs s' influencent mutuellement de la manière suivante : Facteurs personnels et comportement Les liens entre les facteurs personnels et le comportement reflètent l' interaction réciproque entre les pensées , les affects et les actions . Les croyances , les expectations et les intentions de l' individu induisent une direction au comportement qu' il émet . De plus , les structures physiques et sensorielles contraignent les capacités d' actions de l' individu sur l' environnement . L' expérience des comportements détermine ou modifie , en retour , les structures cognitives . Facteurs personnels et environnement Les facteurs personnels sont influencés par l' environnement social , en ce sens que ce dernier propose des réponses que l' individu doit intégrer à son système de pensée . Par ses réponses , l' environnement véhicule de l' information et active des réactions émotionnelles chez l' individu . En retour , l' individu propose des réactions adaptées en fonction de ses caractéristiques personnelles . Comportement et environnement Selon Bandura ( 1986 , 1989 ) l' individu est le produit et le producteur de son environnement . Le comportement d' un individu détermine les aspects de l' environnement auquel il est exposé , et son comportement est modifié par l' environnement . De la même façon , le comportement d' un individu peut affecter la façon dont il expérimente l' environnement . Le déterminisme réciproque entre facteurs personnels , comportement et environnement nécessite que l' individu soit en mesure d' identifier , de stocker et d' utiliser les informations qu' il extrait de son environnement et de son propre comportement . Dans cette perspective , Bandura ( 1986 , 1989 ) indique que l' individu possède cinq capacités de base que sont la symbolisation , la vicariance , l' anticipation , l' auto régulation et l' auto réflexion , nécessaires à l' apprentissage social ( cf. Grussec , 1992 ; Ferrari , 1996 ; Cervonne , Jiwani & Wood , 1991 ) . A partir de ces capacités l' individu est en mesure d' intégrer les expériences d' autrui de la même façon que si lui-même les avait vécues ( vicariance ) en les stockant en mémoire sous forme de symboles ( symbolisation ) . En observant les conséquences du comportement d' un modèle considéré comme similaire à soi , l' individu peut formuler des croyances , des attentes quant à l' issue de ses propres actions ( anticipation ) . Il peut ainsi déterminer des buts à atteindre , utiliser ses connaissances comme standard d' exécution ( auto régulation ) . Enfin , l' évaluation des conséquences obtenues ( auto réflexion ) lui permet d' adapter , de réguler ses connaissances . 2 . Originalité de l' apprentissage social L' un des principes fondamentaux de la théorie sociale cognitive , auquel Bandura a apporté un éclairage incontestable , est la capacité de l' individu à intégrer des expériences vécues par autrui dans son système de pensée , et ce de la même façon que s' il les avait lui-même vécues ( l' apprentissage vicariantL'un des principes fondamentaux de la théorie sociale cognitive , auquel Bandura a apporté un éclairage incontestable , est la capacité de l' individu à intégrer des expériences vécues par autrui dans son système de pensée , et ce de la même façon que s' il les avait lui-même vécues ( l' apprentissage vicariant [ 4 ] ) . C' est un comportement d' apprentissage qui est substitué à un autre ; c' est-à-dire que le renforcement n' est pas directement applicable au comportement de l' apprenant mais à des comportements qu' il peut observer . Cette capacité d' apprentissage vicariant permet à l' individu d' acquérir des connaissances , des compétences , des valeurs , des habiletés motrices en l' absence d' une expérience directe avec l' environnement ( social ou physique ) . Jusqu'alors les théories traditionnelles mettaient l' accent sur l' apprentissage en tant qu' effet des actions directes de l' individu sur son environnement . Ce type d' apprentissage suppose que l' individu adapte son comportement en fonction des erreurs qu' il produit , ce qui induit une lenteur des acquisitions . Si seule cette forme d' apprentissage existait pour l' individu alors , la culture , le langage , et les normes ne pourraient être si rapidement transmis . Pour contrecarrer cette lenteur , l' individu développe une capacité d' apprentissage par observation qui permet l' acquisition d' informations , de compétences ou d' habiletés sur la base des informations convoyées par des influences modelantes ( des modèles ) . Comme le souligne Bandura « l' apprentissage serait excessivement laborieux et risqué si les individus devaient se baser uniquement sur les effets de leurs actions de façon à être informés sur ce qu' il faut faire . Heureusement , la plupart des comportements humains sont appris par observation au moyen du modelage . A partir de l' observation d' autrui , nous nous faisons une idée sur la façon dont les nouveaux comportements sont produits . Plus tard , cette information sert de guide pour l' action . Les individus sont capables d' apprendre ce qu' il faut faire à partir d' exemples vus , au moins de façon approximative , avant de produire le comportement . Cela permet d' éviter beaucoup d' épreuves inutiles » . C' est donc aussi en observant les conséquences des comportements émis par un autrui , considéré comme similaire à soi , que l' individu est capable de formuler des attentes sur les résultats de ses propres actions . C' est pour toutes ces raisons que la théorie de l' apprentissage social développée par Bandura ( 1986 ) a pu être qualifiée de néo-béhavioriste . ) . C' est un comportement d' apprentissage qui est substitué à un autre ; c' est-à-dire que le renforcement n' est pas directement applicable au comportement de l' apprenant mais à des comportements qu' il peut observer . Cette capacité d' apprentissage vicariant permet à l' individu d' acquérir des connaissances , des compétences , des valeurs , des habiletés motrices en l' absence d' une expérience directe avec l' environnement ( social ou physique ) . Jusqu'alors les théories traditionnelles mettaient l' accent sur l' apprentissage en tant qu' effet des actions directes de l' individu sur son environnement . Ce type d' apprentissage suppose que l' individu adapte son comportement en fonction des erreurs qu' il produit , ce qui induit une lenteur des acquisitions . Si seule cette forme d' apprentissage existait pour l' individu alors , la culture , le langage , et les normes ne pourraient être si rapidement transmis . Pour contrecarrer cette lenteur , l' individu développe une capacité d' apprentissage par observation qui permet l' acquisition d' informations , de compétences ou d' habiletés sur la base des informations convoyées par des influences modelantes ( des modèles ) . Comme le souligne Bandura « l' apprentissage serait excessivement laborieux et risqué si les individus devaient se baser uniquement sur les effets de leurs actions de façon à être informés sur ce qu' il faut faire . Heureusement , la plupart des comportements humains sont appris par observation au moyen du modelage . A partir de l' observation d' autrui , nous nous faisons une idée sur la façon dont les nouveaux comportements sont produits . Plus tard , cette information sert de guide pour l' action . Les individus sont capables d' apprendre ce qu' il faut faire à partir d' exemples vus , au moins de façon approximative , avant de produire le comportement . Cela permet d' éviter beaucoup d' épreuves inutiles » . C' est donc aussi en observant les conséquences des comportements émis par un autrui , considéré comme similaire à soi , que l' individu est capable de formuler des attentes sur les résultats de ses propres actions . C' est pour toutes ces raisons que la théorie de l' apprentissage social développée par Bandura ( 1986 ) a pu être qualifiée de néo-béhavioriste . Ce type d' apprentissage apparaît très tôt dans le développement de l' enfant . Meltzoff ( 1988 ) montre que des enfants de quatorze mois sont capables d' utiliser l' observation comme source d' apprentissage des gestes sur les objets . En conséquence , l' individu développe une conception de l' environnement social non seulement à partir de sa propre expérience , mais aussi au travers des expériences vicariantes ( ce qu' il voit , ce qu' il entend ) . Bandura ( 1989 ) propose que ces expériences vicariantes ( les influences modelantes ) ont plusieurs effets psychologiques . Elles servent d' instructeurs ( elles donnent des modèles à suivre ) , elles inhibent ou désinhibent certains comportements ( elles jouent sur la motivation à accomplir ou non un acte ) , elles induisent de la facilitation sociale et provoquent de l' activation émotionnelle . Tout cela permet à l' individu d' acquérir des valeurs , des attitudes et des dispositions émotionnelles à l' égard des objets et des personnes . Les déterminants et les mécanismes des effets du modelage ont été particulièrement étudiés et Bandura ( 1986 ) propose de les rassembler sous le vocable d' apprentissage par observationLes déterminants et les mécanismes des effets du modelage ont été particulièrement étudiés et Bandura ( 1986 ) propose de les rassembler sous le vocable d' apprentissage par observation [ 5 ] . Les mécanismes de cet apprentissage posent toutefois une question fondamentale : d' après le principe de l' apprentissage par renforcement , seuls les comportements émis peuvent être renforcés , dès lors comment un comportement qui n' a pas été émis , donc qui n' a pas été directement renforcé , peut -il être appris ? C' est pour répondre à ce problème que Bandura développe une théorie de l' apprentissage par observation faisant intervenir représentations et renforcements symboliques de ces représentations . Il détermine ainsi comment un individu placé en situation d' interaction avec autrui acquiert de nouveaux comportements . Qu' il résulte en l' acquisition de connaissances , de . Les mécanismes de cet apprentissage posent toutefois une question fondamentale : d' après le principe de l' apprentissage par renforcement , seuls les comportements émis peuvent être renforcés , dès lors comment un comportement qui n' a pas été émis , donc qui n' a pas été directement renforcé , peut -il être appris ? C' est pour répondre à ce problème que Bandura développe une théorie de l' apprentissage par observation faisant intervenir représentations et renforcements symboliques de ces représentations . Il détermine ainsi comment un individu placé en situation d' interaction avec autrui acquiert de nouveaux comportements . Qu' il résulte en l' acquisition de connaissances , de patterns comportementaux nouveaux , de standards de jugement , de compétences cognitives , de valeurs , de normes , et la liste pourrait être longue encore , il n' en demeure pas moins que le déroulement de l' apprentissage par observation est toujours identique . L' apprentissage résulte de l' interaction de l' individu avec ses pairs . Nous développerons , dans la partie qui suit , les mécanismes sous-jacents à l' apprentissage par observation en identifiant comment l' individu mémorise et ré-utilise les informations produites par autrui afin d' en bénéficier sans en faire directement l' expérience ( Bandura , 1986 ; Goldstone , 1998 ; Newell , 1991 ) . comportementaux nouveaux , de standards de jugement , de compétences cognitives , de valeurs , de normes , et la liste pourrait être longue encore , il n' en demeure pas moins que le déroulement de l' apprentissage par observation est toujours identique . L' apprentissage résulte de l' interaction de l' individu avec ses pairs . Nous développerons , dans la partie qui suit , les mécanismes sous-jacents à l' apprentissage par observation en identifiant comment l' individu mémorise et ré-utilise les informations produites par autrui afin d' en bénéficier sans en faire directement l' expérience ( Bandura , 1986 ; Goldstone , 1998 ; Newell , 1991 ) . 2.1 . Définition et conditions nécessaires à l' apprentissage par observation Le concept d' apprentissage par observation renvoie à la notion de vicariance , en ce sens que l' individu suite à l' observation d' un comportement émis par autrui et renforcé chez cet autrui , est capable d' intégrer ce comportement ainsi que le renforcement associé à son système de pensée . L' individu peut alors produire ce même comportement pour lequel il sait qu' il obtiendra le renforcement désiré . Les travaux de Robert ( 1970 ) sur l' apprentissage vicariant nous renseignent quant aux conditions nécessaires pour que celui -ci prenne place . La définition que cet auteur a proposée de l' apprentissage vicariant montre l' importance de l' observation dans ce type d' apprentissage . Ainsi , il estime que l' apprentissage vicariant fait suite à l' observation d' événements et résulte en la modification des réponses ou des comportements de l' individu , comme si lui-même avait été directement impliqué dans la séquence d' événement . Les trois conditions qu' il énonce pour cet apprentissage concernent l' environnement , le comportement , et l' observateur . Nous retrouvons bien l' interaction réciproque définie par Bandura ( 1986 ) dans la théorie sociale cognitive . Ces conditions peuvent être mises en évidence dans une situation simple d' apprentissage par observation , où un premier individu ( dit modèle ) émet un comportement et un second individu ( dit observateur ) observe ce comportement afin de le reproduire ultérieurement . Dans cette situation , la condition concernant l' environnement , implique que le modèle et l' observateur soient soumis aux mêmes conditions de stimulations . Le modèle est directement sous l' influence de ces stimulations alors que l' observateur ne fait que les observer ( Robert , 1970 ; Zajonc , 1969 ) . L' observateur ne doit émettre aucun comportement , il ne fait qu' observer la réponse produite par le modèle face aux stimulations ( Bandura & Jeffery , 1973 ) . Enfin , il faut que l' observateur soit en mesure de produire un comportement adapté face aux mêmes stimulations ceci en l' absence du modèle et de façon relativement permanente dans le temps . Selon Bandura et Walters ( 1963 ) « un Les travaux de Robert ( 1970 ) sur l' apprentissage vicariant nous renseignent quant aux conditions nécessaires pour que celui -ci prenne place . La définition que cet auteur a proposée de l' apprentissage vicariant montre l' importance de l' observation dans ce type d' apprentissage . Ainsi , il estime que l' apprentissage vicariant fait suite à l' observation d' événements et résulte en la modification des réponses ou des comportements de l' individu , comme si lui-même avait été directement impliqué dans la séquence d' événement . Les trois conditions qu' il énonce pour cet apprentissage concernent l' environnement , le comportement , et l' observateur . Nous retrouvons bien l' interaction réciproque définie par Bandura ( 1986 ) dans la théorie sociale cognitive . Ces conditions peuvent être mises en évidence dans une situation simple d' apprentissage par observation , où un premier individu ( dit modèle ) émet un comportement et un second individu ( dit observateur ) observe ce comportement afin de le reproduire ultérieurement . Dans cette situation , la condition concernant l' environnement , implique que le modèle et l' observateur soient soumis aux mêmes conditions de stimulations . Le modèle est directement sous l' influence de ces stimulations alors que l' observateur ne fait que les observer ( Robert , 1970 ; Zajonc , 1969 ) . L' observateur ne doit émettre aucun comportement , il ne fait qu' observer la réponse produite par le modèle face aux stimulations ( Bandura & Jeffery , 1973 ) . Enfin , il faut que l' observateur soit en mesure de produire un comportement adapté face aux mêmes stimulations ceci en l' absence du modèle et de façon relativement permanente dans le temps . Selon Bandura et Walters ( 1963 ) « un pattern comportemental est typiquement appris par segment ou dans son intégralité ( .. ) suite aux démonstrations réalisées par un modèle ou en suivant les instructions verbales du comportement désiré , et l' apprenant reproduit généralement plus ou moins l' intégralité du comportemental est typiquement appris par segment ou dans son intégralité ( .. ) suite aux démonstrations réalisées par un modèle ou en suivant les instructions verbales du comportement désiré , et l' apprenant reproduit généralement plus ou moins l' intégralité du pattern de réponses » . Les contraintes de l' apprentissage par observation sont donc particulièrement exigeantes , et ce n' est que dans ce cas qu' il conviendrait de parler d' apprentissage par observation , ce qui nous le verrons n' est pas toujours vrai dans la littérature . de réponses » . Les contraintes de l' apprentissage par observation sont donc particulièrement exigeantes , et ce n' est que dans ce cas qu' il conviendrait de parler d' apprentissage par observation , ce qui nous le verrons n' est pas toujours vrai dans la littérature . 2.2 . Comment se déroule l' apprentissage par observation ? Nous pouvons nous appuyer sur les conditions d' émergence de l' apprentissage par observation pour en développer les processus sous-jacent . A minima , deux individus sont en interaction dans le même environnement . Dans un premier temps , l' individu modèle émet un comportement pendant que l' individu observateur l' observe . Dans un second temps , l' individu observateur est amené à reproduire le comportement observé ( car il est motivé pour obtenir le même résultat ) en l' absence du modèle et ce de façon différée . Nous voyons se profiler d' ores et déjà les phases identifiées par Bandura ( 1986 ) comme sous-tendant l' apprentissage par observation . Cet apprentissage est caractérisé par deux phases impliquant différents processus permettant à l' individu de sélectionner les informations utiles dans son environnement ( social et/ou physique ) , de les mémoriser , et utiliser cette nouvelle structure de connaissances pour émettre de nouveaux comportements lorsqu' il est motivé pour atteindre un but particulier . La première phase est définie comme phase d' acquisitionNous voyons se profiler d' ores et déjà les phases identifiées par Bandura ( 1986 ) comme sous-tendant l' apprentissage par observation . Cet apprentissage est caractérisé par deux phases impliquant différents processus permettant à l' individu de sélectionner les informations utiles dans son environnement ( social et/ou physique ) , de les mémoriser , et utiliser cette nouvelle structure de connaissances pour émettre de nouveaux comportements lorsqu' il est motivé pour atteindre un but particulier . La première phase est définie comme phase d' acquisition [ 6 ] , la seconde comme phase de production . Elles impliquent , comme illustré sur le schéma 2 ( cf. page suivante ) , pour la première les processus d' attention et de rétention , pour la seconde la production et la motivation. , la seconde comme phase de production . Elles impliquent , comme illustré sur le schéma 2 ( cf. page suivante ) , pour la première les processus d' attention et de rétention , pour la seconde la production et la motivation . Schéma 2 : Illustration des phases de l' apprentissage par observation et des processus impliqués pour chacune selon Bandura ( 1986 ) Comme indiqué sur le schéma 2 , au cours de l' observation du modèle ou phase d' acquisition , les processus d' attention et de mémorisation sont sollicités pour sélectionner les informations pertinentes du comportement du modèle et les stocker en mémoire . Ce stockage est réalisé sous forme de représentation symbolique après transformation des comportements observés en images ou symboles verbaux . Ces processus d' attention et de mémorisation sont donc impliqués dans le contrôle de l' acquisition des réponses . Pendant la phase de production , la réactivation de la représentation élaborée pendant l' observation permet la production effective du comportement . Elle permet l' initiation du comportement et le contrôle de celui -ci par comparaison entre comportement effectif et représentation réactivée . Le guidage par la représentation implique un ajustement du comportement à celui mémorisé à mesure qu' il est produit . Le processus motivationnel intervient pour inciter l' individu à reproduire un comportement observé afin d' atteindre un but particulier . Ce but est fixé comme le résultat devant être obtenu suite à l' émission du comportement que l' individu a observé . Les processus de production et de motivation sont donc impliqués dans le contrôle de la performance . 2.2.1 . Les processus attentionnels et motivationnels sous-jacents à l' apprentissage par observation Pour que l' apprentissage par observation soit efficace , il est nécessaire que l' individu focalise son attention sur certains des éléments de la situation . L' attention est définie comme l' ensemble des mécanismes qui déterminent les informations pertinentes de l' environnement et leurs significations . Dans le cadre de l' apprentissage par observation , l' orientation de la focalisation attentionnelle est induite par deux types d' informations : les caractéristiques de l' observateur et celles du modèle . Les caractéristiques personnelles de l' observateur ( e.g. capacité cognitive , niveau d' activation , capacité sensorielle ) ont fait l' objet de peu d' études quant à leur influence directe ( cf . Akamatsu Ohnogi , 1986 ) . L' étude des caractéristiques situationnelles ( e.g. valence affective , pertinence , valeur fonctionnelle , caractéristique du modèle ) a été principalement envisagée sous l' angle des caractéristiques du modèle . Par exemple , celles qui relèvent de la compétence , du pouvoir , du statut , du genre ou de la sympathie ( Fisher & Harris , 1976 ) . Thomas , Due et Wigger ( 1987 ) ont montré que la compétence et le sexe du modèle sont des facteurs importants pour l' imitation chez l' enfant . Pour une tâche de lancement de balle sur une cible , les enfants étaient plus enclins à imiter la stratégie d' un modèle compétent , et l' influence du sexe du modèle n' apparaissait qu' au travers de son interaction avec la compétence de l' émetteur : les enfants imitaient plus les modèles compétents de sexe opposé que les modèles incompétents de même sexe . Plus spécifiquement , Bandura , Ross et Ross ( 1961 ) ont montré l' influence du sexe du modèle dans l' imitation des comportements agressifs . Ils ont proposé aux enfants d' observer des comportements agressifs ( physiques ou verbaux ) émis par des adultes masculins ou féminins . Les résultats indiquaient que les comportements physiques agressifs étaient plus enclins à être imités lorsqu' ils étaient émis par un modèle homme que par un modèle femme . Néanmoins , les comportements verbaux amenaient une similitude d' imitation chez les sujets confrontés à un modèle de même sexe . Les résultats de ces études corroborent pour partie la théorie de l' identification indiquant que les enfants imitent préférentiellement des modèles de même sexe qu' eux ( comportements agressifs verbaux ) , et abondent pour une autre partie ( comportements agressifs physique et lancement de balle ) dans le sens de l' hypothèse d' imitation du même sexe avancée par Perry et Perry ( 1979 ) . Selon ces auteurs , les enfants codent les comportements en fonction de leur connotation sexuelle ( masculin ou féminin ) et ils imitent les comportements appropriés pour leur propre genre . D' arripe-Longueville , Gernigon , Huet , Capodi et Winnykamen ( 2002 ) , ont utilisé la natation pour réaliser une étude avec des sujets novices associés à des tuteurs de niveaux de compétences variables ( évalués par des juges indépendants ) . Ils ont ainsi observé que la performance pour les garçons était meilleure lorsqu' ils étaient soumis à l' observation d' un modèle masculin expert plutôt qu' à un modèle de niveau intermédiaire ou novice . Pour les filles , l' observation d' un modèle féminin expert ou intermédiaire induisait une performance équivalente , et celle -ci était supérieure à celle obtenue suite à l' observation d' un modèle novice . Néanmoins , la comparaison des performances obtenues pour des binômes de sexe différents n' étant pas présentée , il nous semble de nouveau difficile de déterminer si la performance était influencée par le niveau de compétence ou par le sexe du modèle . Quelles auraient donc été les performances des filles associées à des tuteurs masculin de niveaux différents , et inversement ? Bien que la compétence du modèle ait été particulièrement étudiée en fonction du niveau d' expertise , les résultats sont contradictoires . Ils indiquent , pour certains , une efficacité équivalente de l' observation d' un modèle expert ou novice ( Pollock Weir & Leavitt , 1990 ) , pour d' autres une meilleure efficacité de l' observation d' un modèle novice ( Lee & White , 1990 ) ou encore une meilleure efficacité d' un modèle expert ( Capodi D' arripe-Longueville Bien que la compétence du modèle ait été particulièrement étudiée en fonction du niveau d' expertise , les résultats sont contradictoires . Ils indiquent , pour certains , une efficacité équivalente de l' observation d' un modèle expert ou novice ( Pollock Weir & Leavitt , 1990 ) , pour d' autres une meilleure efficacité de l' observation d' un modèle novice ( Lee & White , 1990 ) ou encore une meilleure efficacité d' un modèle expert ( Capodi D' arripe-Longueville et al. , 2002 ) . Selon Ferrari ( 1996 ) , cela proviendrait essentiellement de la nature de la tâche . Ainsi , reproduire une séquence de mouvement de bras ou une tâche de poursuite de cible n' implique pas de porter attention aux mêmes informations : pour la première l' ajustement de la reproduction est fondé sur des informations internes ( proprioception ) , pour la seconde sur des informations externes . Greenfeld et Kuznicki ( 1975 ) ont tenté de lever l' ambiguïté entre compétence du modèle et difficulté de la tâche . Pour cela , ils ont manipulé la difficulté de la tâche et ont ensuite proposé aux sujets d' évaluer le niveau de compétence estimé du modèle . Ils ont proposé à deux sujets de choisir l' un après l' autre un cheval gagnant dans une course ( tâche simple ) ou de classer trois chevaux dans leur ordre attendu d' arrivée ( tâche complexe ) . Ils ont ainsi relevé que l' apprentissage par observation était plus efficace pour une tâche simple que complexe , cela se traduisant par la supériorité de l' acquisition de réponse d' imitation entre les sujets pour la tâche simple . Cependant , en demandant au deuxième sujet d' évaluer le niveau de compétence du premier sujet effectuant le choix , Greenfeld et Kuznicki ( 1975 ) ont mis en évidence un effet du niveau de compétence supposé . Plus le sujet était évalué comme compétent plus la réponse imitative avait de chance d' émerger même si la tâche était complexe . L' influence de la compétence estimée du modèle intervient dans l' apprentissage par observation et apparaît donc difficilement dissociable de la difficulté de la tâche. , 2002 ) . Selon Ferrari ( 1996 ) , cela proviendrait essentiellement de la nature de la tâche . Ainsi , reproduire une séquence de mouvement de bras ou une tâche de poursuite de cible n' implique pas de porter attention aux mêmes informations : pour la première l' ajustement de la reproduction est fondé sur des informations internes ( proprioception ) , pour la seconde sur des informations externes . Greenfeld et Kuznicki ( 1975 ) ont tenté de lever l' ambiguïté entre compétence du modèle et difficulté de la tâche . Pour cela , ils ont manipulé la difficulté de la tâche et ont ensuite proposé aux sujets d' évaluer le niveau de compétence estimé du modèle . Ils ont proposé à deux sujets de choisir l' un après l' autre un cheval gagnant dans une course ( tâche simple ) ou de classer trois chevaux dans leur ordre attendu d' arrivée ( tâche complexe ) . Ils ont ainsi relevé que l' apprentissage par observation était plus efficace pour une tâche simple que complexe , cela se traduisant par la supériorité de l' acquisition de réponse d' imitation entre les sujets pour la tâche simple . Cependant , en demandant au deuxième sujet d' évaluer le niveau de compétence du premier sujet effectuant le choix , Greenfeld et Kuznicki ( 1975 ) ont mis en évidence un effet du niveau de compétence supposé . Plus le sujet était évalué comme compétent plus la réponse imitative avait de chance d' émerger même si la tâche était complexe . L' influence de la compétence estimée du modèle intervient dans l' apprentissage par observation et apparaît donc difficilement dissociable de la difficulté de la tâche . Concernant le statut du modèle , McCullagh ( 1986 ) a montré un effet de ce dernier sur l' attention portée par les enfants au modèle . Cependant , elle n' a relevé aucun effet du statut sur la performance émise par les sujets . Au contraire , Brewer et Wann ( 1998 ) ont montré que des adultes étaient plus efficaces dans la réalisation d' un puzzle , aussi bien au niveau de la qualité de la performance que de la rapidité de l' exécution , lorsqu' ils avaient été soumis à un modèle dont le statut était défini comme élevé en comparaison aux sujets soumis à un modèle dont le statut n' était pas défini . Il semble donc que les caractéristiques du modèle peuvent intervenir sur la qualité de l' attention portée par les sujets . Cependant , les résultats contradictoires relevés dans la littérature indiquent vraisemblablement la difficulté d' opérationnaliser leurs influences sur la reproduction des comportements . Il est vrai qu' identifier ce qui relève du statut et ce qui relève de la compétence , par exemple , est délicat , puisque les sujets semblent accorder plus de compétence à un modèle de haut statut qu' ils n' en accordent à un modèle de bas statut ( même si en réalité le statut et la compétence corrèlent de façon inverse ) . Est -ce alors un problème d' attention ou de validité de la démonstration accordée par le sujet ? Cette question pourrait faire l' objet d' un exposé en soi qui ne correspond pas à notre objectif . Nous retiendrons donc que le processus d' attention est sollicité au cours de l' observation et que cette sollicitation dépend des situations . La focalisation de l' attention permet l' extraction des indices saillants de la situation , c' est-à-dire toutes les informations nécessaires à la production du comportement . Bien que peu d' études se soient intéressées spécifiquement au processus motivationnel , celui -ci est souvent utilisé pour expliquer l' attention portée par les sujets au comportement du modèle ( Brewer D' arripe-Longueville Bien que peu d' études se soient intéressées spécifiquement au processus motivationnel , celui -ci est souvent utilisé pour expliquer l' attention portée par les sujets au comportement du modèle ( Brewer D' arripe-Longueville et al. , 2002 ) . Toutefois , il est incontestable que tous les comportements observés ne sont pas appris , et tous ceux appris par les individus ne sont pas utilisés : cela dépend de la motivation individuelle à atteindre un but particulier . Selon Bandura ( 1986 ) , la motivation conduit l' individu à sélectionner parmi les comportements observés ceux qu' il va intégrer , et elle le conduit à reproduire certains comportements adaptés aux situations . Ce processus intervient donc dans la génération des comportements que l' individu souhaite produire afin d' obtenir une récompense ou atteindre un objectif particulier . De la même façon , si le sujet ne souhaite pas être puni , il inhibera le comportement qu' il s' apprête à produire. , 2002 ) . Toutefois , il est incontestable que tous les comportements observés ne sont pas appris , et tous ceux appris par les individus ne sont pas utilisés : cela dépend de la motivation individuelle à atteindre un but particulier . Selon Bandura ( 1986 ) , la motivation conduit l' individu à sélectionner parmi les comportements observés ceux qu' il va intégrer , et elle le conduit à reproduire certains comportements adaptés aux situations . Ce processus intervient donc dans la génération des comportements que l' individu souhaite produire afin d' obtenir une récompense ou atteindre un objectif particulier . De la même façon , si le sujet ne souhaite pas être puni , il inhibera le comportement qu' il s' apprête à produire . Nous terminerons sur les processus attentionnels et motivationnels , en notant que , dans les études expérimentales , les sujets n' ont pas d' autre choix que de porter attention à ce qui leur est présenté et d' être a minima motivés , puisque l' objectif de leur participation est de réaliser cette tâche . Nous terminerons sur les processus attentionnels et motivationnels , en notant que , dans les études expérimentales , les sujets n' ont pas d' autre choix que de porter attention à ce qui leur est présenté et d' être a minima motivés , puisque l' objectif de leur participation est de réaliser cette tâche . Il est demandé explicitement ou non aux sujets de porter attention au comportement du modèle , donc de se motiver . Il est généralement admis , même si aucune mesure n' en est prise , que les seuils d' attention et de motivation sont suffisants pour que les sujets soient en situation propice à un apprentissage par observation . . Il est généralement admis , même si aucune mesure n' en est prise , que les seuils d' attention et de motivation sont suffisants pour que les sujets soient en situation propice à un apprentissage par observation . 2.2.2 . Les processus de rétention et de production sous-jacents à l' apprentissage par observation La présentation de ces processus de façon distincte est particulièrement difficile car l' influence du processus de rétention se manifeste tout particulièrement au travers du processus de production , et inversement . Le processus de rétention permet à l' individu de stocker en mémoire une représentation du comportement observé . Le processus de production conduit , à partir de la ré-activation de cette représentation , à la production effective du comportement que l' individu ajuste en fonction des modèles mémorisées . Le processus de rétention va permettre la mémorisation des indices pertinents pour la réalisation d' une tâche , sous forme de représentation symbolique : un schéma , un script ou une simple image mentale ( Adams , 1971 , 1987 ; Carroll & Bandura , 1987 ; Schmidt , 1975 ) . Cette mémorisation est sous-tendue par la capacité de symbolisation que possède l' individu . Cette capacité à utiliser les symboles est , selon Bandura ( 1989 ) , « un outil puissant [ que possède l' individu ] pour comprendre et gérer son environnement » , et le symbole est la base même des activités cognitives . La formation de symboles , sous forme d' images ou de mots , permet à l' individu de donner du sens et de la continuité à ses expériences . De plus , cette capacité à former des symboles rend possible le stockage d' informations en mémoire et leur utilisation . En manipulant les symboles issus de ses propres expériences ou des expériences vicariantes , l' individu est en mesure de comprendre les liens causaux entre comportements et conséquences et peut ainsi développer ses connaissances . Cette capacité est indispensable à la mémorisation et à la reproduction des comportements observés chez autrui . va permettre la mémorisation des indices pertinents pour la réalisation d' une tâche , sous forme de représentation symbolique : un schéma , un script ou une simple image mentale ( Adams , 1971 , 1987 ; Carroll Schmidt , 1975 ) . Cette mémorisation est sous-tendue par la capacité de symbolisation que possède l' individu . Cette capacité à utiliser les symboles est , selon Bandura ( 1989 ) , « un outil puissant [ que possède l' individu ] pour comprendre et gérer son environnement » , et le symbole est la base même des activités cognitives . La formation de symboles , sous forme d' images ou de mots , permet à l' individu de donner du sens et de la continuité à ses expériences . De plus , cette capacité à former des symboles rend possible le stockage d' informations en mémoire et leur utilisation . En manipulant les symboles issus de ses propres expériences ou des expériences vicariantes , l' individu est en mesure de comprendre les liens causaux entre comportements et conséquences et peut ainsi développer ses connaissances . Cette capacité est indispensable à la mémorisation et à la reproduction des comportements observés chez autrui . Selon Bandura , le processus de rétention , donc la mémorisation d' un comportement observé , implique une transformation des réponses comportementales observées en code symbolique . Ce codage est indispensable , et peut prendre la forme d' images , de mots descriptifs , de constructions linguistiques , mais dans tous les cas il représente de façon isomorphe les événements observés . Les études développementales tendent à soutenir que cette capacité apparaît très tôt dans le développement . Ainsi , Meltzoff ( 1988 ) a montré que suite à l' observation d' action simple sur des objets ( pousser , déplacer etc .. ) , des enfants de quatorze mois étaient capables de reproduire ces actions une semaine plus tard . Cela indique , que dès le plus jeune âge , les enfants sont capables de mémoriser de l' information et de l' utiliser ultérieurement . De la même façon , Abravanel et Fergusson ( 1998 ) ont mis en évidence un développement de la capacité à reproduire une séquence d' actions sérielles chez des jeunes enfants de 12 à 24 mois ( construire un pont ou une pyramide avec plusieurs éléments dans un ordre particulier ) . Selon certains auteurs , la capacité des jeunes enfants à reproduire des actions simples ou complexes indique , que la capacité de symbolisation apparaît tôt dans le développement et qu' elle est indispensable à l' apprentissage par observation ( Abravanel Horner , 2001 ; Meltzoff , 1988 ) . L' importance du codage symbolique des séquences observées chez l' adulte a été démontré dans le cadre de nombreuses recherches ( Bandura Carroll & Bandura , 1982 , 1985 , 1987 , 1990 ; Williams , 1987 ) . Berger , Carli , Hammersla , Kashmer et Sanchez ( 1979 ) ont montré que pour une tâche d' association de gestes de l' alphabet manuel , ce codage facilitait l' acquisition des séquences proposées par le modèle pour des observateurs familiers . En associant une lettre à chaque geste manuel observé , les sujets familiers étaient plus efficaces dans la reproduction de l' association de deux gestes de l' alphabet manuel . De plus , proposer aux sujets de coder sous forme verbale la séquence observée facilitait , quelles que soient leurs connaissances préalables , l' acquisition des gestes ( Gerst , 1971 ) . Les résultats obtenus par Bandura et Jeffery ( 1973 ) soutiennent l' hypothèse d' une facilitation de l' apprentissage par observation par le codage symbolique . Ces derniers ont montré qu' orienter les sujets sur un codage sous forme de lettres ou de chiffres améliorait de façon significative la reproduction immédiate et différée de la séquence observée en comparaison à ceux n' ayant pas eu d' instruction pour apprendre . L' aspect crucial du processus de rétention réside donc dans la capacité des individus à générer un code symbolique adéquat pour la mémorisation du comportement observé . Pour présenter plus précisément le Pour présenter plus précisément le processus de production tel que défini par Bandura ( 1986 ) , il convient d' identifier ce à quoi il correspond . Selon Bandura , ce processus permet la transformation de la représentation symbolique en son action effective . Si le processus de rétention explicité précédemment impliquait la transformation des comportements observés en code symbolique , le processus de production , à l' inverse , concerne la transformation du code en comportements effectifs . Comme nous avons déjà pu le constater dans les études précédentes , l' individu doit posséder des capacités physiques et cognitives suffisantes pour produire le comportement à imiter . Ensuite , il doit être capable d' organiser ses actions en fonction de ce qu' il a mémorisé tel que défini par Bandura ( 1986 ) , il convient d' identifier ce à quoi il correspond . Selon Bandura , ce processus permet la transformation de la représentation symbolique en son action effective . Si le processus de rétention explicité précédemment impliquait la transformation des comportements observés en code symbolique , le processus de production , à l' inverse , concerne la transformation du code en comportements effectifs . Comme nous avons déjà pu le constater dans les études précédentes , l' individu doit posséder des capacités physiques et cognitives suffisantes pour produire le comportement à imiter . Ensuite , il doit être capable d' organiser ses actions en fonction de ce qu' il a mémorisé et de les corriger si nécessaire . C' est à partir de cette production que la performance est évaluée en regard du comportement observé . L' individu reproduit le comportement observé en ré-activant la représentation qu' il en a construit et en contrôlant son propre comportement à partir de cette représentation . Ainsi , la représentation sert de guide à la production en proposant un standard de comparaison . Le comportement est en constante comparaison avec la représentation , et l' objectif de l' individu est d' obtenir une correspondance la plus parfaite possible entre cette représentation et son comportement . L' important ici est de noter que la même trace mnésique est utilisée pour stocker , produire et évaluer le comportement . La plupart des études sur le processus de production se sont intéressées au mécanisme de détection et de correction des erreurs ainsi qu' aux facteurs permettant d' en affecter l' efficacité . En comparaison , peu d' études ont envisagé spécifiquement la transformation de la représentation en comportement effectif au cours de l' apprentissage par observation ( Carroll & Bandura , 1987 ) . Ce point sera développé dans le cadre particulier de l' acquisition des habiletés motrices ( cf. paragraphe 2.3.2 . , p . 69 ) . de les corriger si nécessaire . C' est à partir de cette production que la performance est évaluée en regard du comportement observé . L' individu reproduit le comportement observé en ré-activant la représentation qu' il en a construit et en contrôlant son propre comportement à partir de cette représentation . Ainsi , la représentation sert de guide à la production en proposant un standard de comparaison . Le comportement est en constante comparaison avec la représentation , et l' objectif de l' individu est d' obtenir une correspondance la plus parfaite possible entre cette représentation et son comportement . L' important ici est de noter que la même trace mnésique est utilisée pour stocker , produire et évaluer le comportement . La plupart des études sur le processus de production se sont intéressées au mécanisme de détection et de correction des erreurs ainsi qu' aux facteurs permettant d' en affecter l' efficacité . En comparaison , peu d' études ont envisagé spécifiquement la transformation de la représentation en comportement effectif au cours de l' apprentissage par observation ( Carroll & Bandura , 1987 ) . Ce point sera développé dans le cadre particulier de l' acquisition des habiletés motrices ( cf. paragraphe 2.3.2 . , p . 69 ) . Parmi les facteurs influençant la détection et la correction des erreurs , le guidage visuel semble l' un des plus important . Qu' il soit fourni par la concomitance de la production du comportement par le modèle ou par la possibilité de s' auto observer , le guidage visuel propose une référence de comparaison incontestée ( Carroll Weeks & Hall , 1998 ) . Différentes études ont montré que donner à l' individu la possibilité de se voir en action lui permettait d' améliorer significativement sa performance ( Carroll & Bandura , 1982 , 1985 , 1987 ; Erbaugh , 1985 pour une illustration chez les enfants ) . Pour mettre en évidence l' influence de la concomitance de production du comportement entre le sujet observateur et le modèle , Carroll et Bandura ( 1987 ) ont comparé deux procédures d' apprentissage d' un mouvement de bras . La première procédure impliquait une phase d' observation suivie d' une phase de production réalisée en même temps que le modèle émettait le comportement . La seconde proposait une phase d' observation puis une phase de production sans concomitance de production par le modèle . Les résultats indiquaient que le bénéfice obtenu par la production simultanée n' intervenait pas lors des premiers essais de production mais seulement après une quantité suffisante d' observations . Cela indique que la comparaison entre le comportement reproduit et celui réalisé en même temps par le modèle n' est efficace que si les sujets ont déjà une représentation adéquate du comportement observé . De plus , le guidage visuel n' était utilisable à bon escient qu' à partir du moment où les sujets avaient construit une représentation fiable du comportement observé . Dans une autre étude , Carroll et Bandura ( 1982 ) ont étudié l' influence du guidage visuel en proposant à leurs participants d' observer une séquence de mouvement de bras puis de la reproduire . Pour le groupe de sujets autorisés à visionner leurs performances après chaque essai de production , la correspondance entre mouvement produit et mouvement observé était supérieure à celle obtenue pour des sujets n' ayant pas eu cette possibilité . Cependant , les résultats indiquaient que le guidage visuel n' était pas efficace lorsqu' il était donné pendant les premiers essais de production , mais qu' il facilitait pourtant l' apprentissage des essais ultérieurs . Cela proviendrait du fait que le sujet serait en mesure de détecter au cours du visionnage de sa performance des éléments incohérents et serait capable de les corriger aux essais suivants . Toutefois , cela ne prendrait place qu' à partir du moment où l' individu serait en mesure de produire avec un minimum d' efficacité la séquence motrice puisqu' il serait alors capable d' en identifier les incohérences . Il semble qu' observer un modèle agir en même temps que soi permette de comparer sa propre exécution à celle du modèle et ainsi évaluer la qualité de la production pour l' améliorer . De plus , se voir exécuter un comportement permettrait d' en détecter les incohérences par rapport à celui mémorisé , mais cette vision de soi ne serait efficace que si elle intervient en fin d' apprentissage ( donc si elle se fonde sur une représentation déjà cohérente du comportement mémorisé ) . Pour résumer cette partie , l' apprentissage par observation intervient dès lors qu' un individu bénéficie du comportement émis par autrui sans en faire l' expérience directe . Cela lui permet d' intégrer de nouvelles valeurs , normes et comportements , ou encore d' inhiber ceux qui ne sont pas adéquats . Les quatre processus sous-jacents à cet apprentissage , permettent à l' individu d' utiliser l' observation d' un comportement pour en extraire et mémoriser les informations . Une fois que la structure cognitive élaborée est suffisamment cohérente , il l' utilise pour produire des comportements équivalents pour atteindre des buts précis ou obtenir des récompenses obtenues par autrui dans les mêmes circonstances . 2.3 . Apprentissage par observation des habiletés motrices Nombre d' études sur l' apprentissage par observation ont pris pour application l' acquisition d' habiletés motrices . Ce type d' acquisition offre un panel d' observables important et les expérimentations peuvent être facilement mises en place . Afin de mieux cerner les processus spécifiques de rétention et de production que nous modéliserons ultérieurement , nous exposerons différents aspects de leur étude dans le cadre de l' acquisition des habiletés motrices . Le principe de ces études repose sur une méthodologie simple , consistant à faire observer aux sujets une séquence comportementale , puis leur proposer de reproduire ce même comportement . En exposant le principe des études , nous percevons clairement que faire observer une séquence induit la focalisation attentionnelle , et que demander aux participants de reproduire la séquence n' implique aucune autre motivation que celle de répondre à la demande expérimentale . Ce sont certes deux processus qui interviennent en situation sociale , cependant , ils ne feront pas l' objet de la présentation suivante qui se concentre sur des tâches réalisées en laboratoire . Avant d' entrer dans le détail des processus de rétention et de production , il convient de clarifier certains points , notamment en terme de langage et d' objet d' étude . Qu' est ce qu' une séquence comportementale ? Nous considérerons qu' une séquence comportementale correspond à une suite d' actions élémentaires dont la chronologie est spécifique à la séquence . Une séquence comportementale fait donc appel aux notions d' organisation spatiale et temporelle des actions ( Rizolatti , 2001 ) . Apprentissage par observation d' habileté motrice et apprentissage moteur . L' apprentissage moteur est un vaste champ d' étude dont les résultats ont été peu mis en relation avec l' apprentissage par observation de comportement moteur . Les théories les plus influentes de ce domaine sont la théorie de la boucle fermée ( Adams , 1971 , 1987 ) et la théorie du schéma moteur ( Schmidt , 1975 ) . Elles s' intéressent à l' apprentissage et au contrôle des réponses motrices . Brièvement , la théorie de la boucle fermée postule que l' apprenant mémorise deux types de traces : la trace mnésique et la trace perceptuelle . La trace mnésique est à l' origine des réponses motrices , c' est elle qui génère l' amorce de réponse . La trace perceptuelle sert de référence pour la correction des réponses par comparaison au L' apprentissage moteur est un vaste champ d' étude dont les résultats ont été peu mis en relation avec l' apprentissage par observation de comportement moteur . Les théories les plus influentes de ce domaine sont la théorie de la boucle fermée ( Adams , 1971 , 1987 ) et la théorie du schéma moteur ( Schmidt , 1975 ) . Elles s' intéressent à l' apprentissage et au contrôle des réponses motrices . Brièvement , la théorie de la boucle fermée postule que l' apprenant mémorise deux types de traces : la trace mnésique et la trace perceptuelle . La trace mnésique est à l' origine des réponses motrices , c' est elle qui génère l' amorce de réponse . La trace perceptuelle sert |