Conditionnement instrumental en psychologie

Le conditionnement instrumental est un autre terme pour le conditionnement opérant, un processus d'apprentissage décrit pour la première fois par B. F. Skinner. Dans le conditionnement instrumental, le renforcement ou la punition sont utilisés pour augmenter ou réduire la probabilité qu'un comportement se reproduise à l'avenir.

Exemples

Par exemple, si une élève est récompensée par des éloges à chaque fois qu'elle lève la main en classe, elle aura plus de chance de la lever à l'avenir..

Si elle est également réprimandée lorsqu'elle parle à son tour, elle risque moins d'interrompre la classe. Dans ces exemples, l'enseignant utilise le renforcement pour renforcer le comportement de main levée et la punition pour affaiblir le comportement de discussion.

Le conditionnement instrumental est également souvent utilisé dans l’entraînement des animaux. Par exemple, entraîner un chien à serrer la main impliquerait d'offrir une récompense à chaque fois que le comportement souhaité se produit.

L'histoire

Psychologue E.L. Thorndike a été l’un des premiers à observer l’impact du renforcement dans des expériences de casse-tête avec des chats. Au cours de ces expériences, Thorndike a observé un processus d’apprentissage qu’il a qualifié d’apprentissage «essai et erreur»..

Les expériences ont consisté à placer un chat affamé dans une boîte à casse-tête et, pour se libérer, le chat devait trouver un moyen de s'échapper. Thorndike a ensuite noté combien de temps il avait fallu aux chats pour se libérer à chaque essai expérimental. Initialement, les chats se livraient à des méthodes d'évacuation inefficaces, grattant et creusant sur les côtés ou sur le dessus de la boîte. Finalement, des essais et des erreurs amèneraient les chats à pousser ou à tirer avec succès la sortie de secours. Après chaque essai successif, les chats adoptaient de moins en moins les comportements d'évasion inefficaces et réagissaient plus rapidement avec les actions d'évacuation correctes..

Thorndike a qualifié ses observations de loi d’effet. La force d'une réponse augmente lorsqu'elle est immédiatement suivie d'un "satisfier" (renforçateur). D'autre part, les actions qui sont suivies d'effets désagréables risquent davantage d'être affaiblies.

Dans les expériences de Thorndike sur la boîte à casse-tête, il était plus satisfaisant d’échapper à la boîte. Chaque fois que les chats ont réussi à s'échapper de la boîte, le comportement qui a immédiatement précédé l'évasion a été renforcé et renforcé.

Les travaux de Thorndike ont eu un impact considérable sur les recherches ultérieures de B.F. Skinner sur le conditionnement opérant. Skinner a même créé sa propre version des boîtes à puzzle de Thorndike, qu'il a qualifiée de chambre opérant, également appelée boîte à Skinner..

Comment ça marche

Skinner a identifié deux types de comportements clés. Le premier type concerne les comportements des répondants. Ce sont simplement des actions qui se produisent par réflexe sans aucun apprentissage. Si vous touchez quelque chose de chaud, vous retirerez immédiatement votre main en réponse. Le conditionnement classique met l'accent sur les comportements de ces répondants.

Dans les expériences classiques de Pavlov avec des chiens, le comportement du répondant était saliver pour la présentation d'aliments. Cependant, en formant une association entre le son d’une cloche et la présentation de nourriture, Pavlov a été en mesure d’entraîner des chiens à la salive simplement.

Skinner s'est rendu compte que, même si le conditionnement classique pouvait expliquer comment les comportements des répondants pouvaient conduire à l'apprentissage, il ne pouvait pas prendre en compte tous les types d'apprentissage. Au lieu de cela, il a suggéré que c’était les conséquences des actions volontaires qui conduisaient au plus grand nombre d’apprentissage.

Le deuxième type de comportement est ce que Skinner a appelé des comportements opérants. Il a défini ces comportements comme tout comportement volontaire agissant sur l'environnement pour créer une réponse. Ce sont les comportements volontaires qui sont sous notre contrôle conscient. Ce sont aussi des actions qui peuvent être apprises. Les conséquences de nos actions jouent un rôle important dans le processus d'apprentissage.

Renforcement et Punition

Skinner a identifié deux aspects clés du processus de conditionnement opérant. Le renforcement sert à augmenter le comportement tandis que la punition sert à diminuer le comportement.

Il existe également deux types de renforcement et deux types de punition. Le renforcement positif consiste à présenter un résultat favorable, par exemple donner à un enfant une gâterie après le nettoyage de sa chambre.

Le renforcement négatif implique la suppression d'un stimulus désagréable, comme dire à un enfant que si elle mange toutes ses pommes de terre, elle n'aura pas à manger son brocoli. Puisque l'enfant considère le brocoli comme une conséquence désagréable et que la consommation des pommes de terre entraîne l'élimination de cette conséquence indésirable, la consommation des pommes de terre est alors renforcée négativement..

Une punition positive consiste à appliquer un événement désagréable après un comportement. La fessée, par exemple, est un exemple courant de punition positive. Ce type de punition est souvent appelé punition par application. Une conséquence négative est directement appliquée pour réduire le comportement indésirable.

La punition négative consiste à enlever quelque chose d'agréable après qu'un comportement se soit produit. Par exemple, si un enfant ne nettoie pas sa chambre, ses parents peuvent lui dire qu’elle ne peut pas aller au centre commercial avec ses amis. Supprimer l'activité souhaitable agit comme un punisseur négatif sur le comportement précédent.