Qu'est-ce que le conditionnement opérant et comment fonctionne-t-il?
Le conditionnement opérant (parfois appelé conditionnement instrumental) est une méthode d'apprentissage qui consiste à récompenser et à punir le comportement. Grâce au conditionnement opérant, une association est faite entre un comportement et une conséquence pour ce comportement.
Par exemple, lorsqu'un rat de laboratoire appuie sur un bouton bleu, il reçoit un aliment en guise de récompense, mais lorsqu'il appuie sur le bouton rouge, il reçoit un léger choc électrique. En conséquence, il apprend à appuyer sur le bouton bleu mais évite le bouton rouge.
Mais le conditionnement opérant n'est pas simplement quelque chose qui se produit dans des contextes expérimentaux lors de la formation d'animaux de laboratoire; il joue également un rôle important dans l'apprentissage quotidien. Le renforcement et la punition ont lieu presque tous les jours dans des environnements naturels ainsi que dans des environnements plus structurés tels que la classe ou des séances de thérapie.
Examinons de plus près comment le conditionnement opérant a été découvert, son impact sur la psychologie et comment il est utilisé pour modifier des comportements anciens et en enseigner de nouveaux..
Histoire du conditionnement opérant
Le comportementaliste B.F. Skinner a inventé le conditionnement opérant, c'est pourquoi vous pouvez parfois l'entendre parler de conditionnement skinnerien. En tant que comportementaliste, Skinner estimait qu'il n'était pas vraiment nécessaire d'examiner les pensées et les motivations internes pour expliquer le comportement. Au lieu de cela, a-t-il suggéré, nous devrions nous concentrer uniquement sur les causes externes et observables du comportement humain..
Au cours de la première partie du XXe siècle, le behaviorisme était devenu une force majeure de la psychologie. Les idées de John B. Watson ont dominé cette école de pensée dès le début. Watson se concentra sur les principes du conditionnement classique, suggérant jadis de pouvoir emmener n'importe qui, indépendamment de son origine, et de le former à ce qu'il choisisse.
Là où les premiers comportementalistes avaient concentré leurs intérêts sur l’apprentissage associatif, Skinner était plus intéressé par la façon dont le conséquences des actions des gens ont influencé leur comportement.
Skinner a utilisé le terme opérant faire référence à tout "comportement actif qui agit sur l'environnement pour avoir des conséquences". En d'autres termes, la théorie de Skinner explique comment nous acquérons la gamme de comportements appris que nous affichons chaque jour..
Sa théorie était fortement influencée par les travaux du psychologue Edward Thorndike, qui avait proposé ce qu'il appelait la loi de l'effet. Selon ce principe, les actions suivies de résultats souhaitables ont plus de chances d'être répétées, tandis que celles suivies de résultats indésirables ont moins de chances d'être répétées..
Le conditionnement opérant repose sur une prémisse assez simple: les actions qui sont suivies d'un renforcement seront renforcées et auront plus de chances de se reproduire à l'avenir. Si vous racontez une histoire amusante en classe et que tout le monde rit, vous aurez probablement plus de chances de raconter cette histoire à l'avenir. Si vous levez la main pour poser une question et que votre enseignant loue votre comportement poli, vous aurez plus de chances de lever la main la prochaine fois que vous aurez une question ou un commentaire. Parce que le comportement a été suivi d'un renforcement, ou d'un résultat souhaitable, les actions précédentes sont renforcées.
Inversement, les actions entraînant des sanctions ou des conséquences indésirables seront affaiblies et auront moins de chances de se reproduire à l'avenir. Si vous racontez la même histoire dans une autre classe mais que personne ne rit, cette fois, vous aurez moins de chances de la répéter à l'avenir. Si vous criez une réponse en classe et que votre professeur vous gronde, vous risquez alors moins d'interrompre la classe..
Types de comportements
Skinner a distingué deux types de comportement
- Comportements des répondants sont ceux qui se produisent automatiquement et par réflexe, tels que de retirer votre main d’un poêle chaud ou de vous branler la jambe lorsque le médecin vous tape sur le genou. Vous n'avez pas à apprendre ces comportements, ils se produisent simplement automatiquement et involontairement.
- Comportements opérants, d'autre part, sont ceux sous notre contrôle conscient. Certaines peuvent se produire spontanément et d’autres à dessein, mais ce sont les conséquences de ces actions qui influent sur le fait qu’elles se reproduisent ou non à l’avenir. Nos actions sur l'environnement et les conséquences de cette action constituent une part importante du processus d'apprentissage..
Bien que le conditionnement classique puisse expliquer les comportements des répondants, Skinner s'est rendu compte qu'il ne pouvait pas prendre en compte beaucoup d'apprentissage. Skinner a plutôt suggéré que le conditionnement opérant avait une importance beaucoup plus grande.
Skinner a inventé différents appareils au cours de son enfance et il a mis ces compétences à profit pendant ses études sur le conditionnement opérant..
Il a créé un dispositif connu sous le nom de chambre de conditionnement opérant, le plus souvent appelé aujourd'hui boîte à Skinner. La chambre était essentiellement une boîte pouvant contenir un petit animal tel qu'un rat ou un pigeon. La boîte contenait également une barre ou une clé sur laquelle l'animal pouvait appuyer pour recevoir une récompense..
Pour suivre les réponses, Skinner a également mis au point un appareil appelé enregistreur cumulatif. Le dispositif a enregistré les réponses sous forme de mouvement ascendant d’une ligne afin que les taux de réponse puissent être lus en regardant la pente de la ligne..
Composants du conditionnement opérant
Il existe plusieurs concepts clés dans le conditionnement opérant.
Renforcement dans le conditionnement opérant
Le renforcement est tout événement qui renforce ou augmente le comportement qui en résulte. Il existe deux types de renforçateurs:
- Renforçateurs positifs sont des événements ou des résultats favorables présentés après le comportement. Dans les situations qui reflètent un renforcement positif, une réponse ou un comportement est renforcé par l'ajout de quelque chose, tel que des éloges ou une récompense directe. Par exemple, si vous faites du bon travail et que votre responsable vous donne un bonus.
- Renforçateurs négatifs impliquent la suppression d'événements ou de résultats défavorables après l'affichage d'un comportement. Dans ces situations, la réponse est renforcée par la suppression de quelque chose considéré comme désagréable. Par exemple, si votre enfant commence à crier au milieu de l'épicerie, mais s'arrête une fois que vous lui donnez une friandise, vous aurez plus de chances de lui donner une friandise la prochaine fois qu'il commencera à crier. Votre action a conduit à la suppression de la condition désagréable (l'enfant hurle), renforçant négativement votre comportement.
Dans ces deux cas de renforcement, le comportement augmente.
Renforcement du comportement de conditionnementPunition dans le conditionnement opérant
La punition est la présentation d'un événement indésirable ou d'un résultat qui entraîne une diminution du comportement qui en résulte. Il existe deux types de punition:
- Punition positive, parfois appelé punition par application, présente un événement ou une issue défavorable afin d'affaiblir la réponse qu'il entraîne. La fessée pour mauvaise conduite est un exemple de sanction par application.
- Punition négative, également appelé punition par élimination, se produit lorsqu'un événement ou un résultat favorable est supprimé après un comportement. Enlever un jeu vidéo à un enfant à la suite d'une mauvaise conduite est un exemple de punition négative.
Dans les deux cas de punition, le comportement diminue.
La punition et son influence sur le comportementHoraires de renfort
Le renforcement n'est pas nécessairement un processus simple et plusieurs facteurs peuvent influer sur la rapidité et la qualité de l'apprentissage des nouvelles choses. Skinner a trouvé que quand et à quelle fréquence les comportements renforcés ont joué un rôle dans la rapidité et la force de l'acquisition. En d'autres termes, le moment et la fréquence de renforcement ont influencé la façon dont les nouveaux comportements ont été appris et comment les comportements anciens ont été modifiés.
Skinner a identifié plusieurs programmes de renforcement ayant un impact sur le processus de conditionnement opérant:
- Renforcement continu implique la livraison d'un renforcement chaque fois qu'une réponse se produit. L'apprentissage a tendance à se dérouler assez rapidement, mais le taux de réponse est assez faible. L'extinction se produit également très rapidement une fois le renforcement arrêté.
- Horaires fixes sont un type de renforcement partiel. Les réponses ne sont renforcées qu'après un nombre spécifique de réponses. Cela conduit généralement à un taux de réponse assez stable.
- Horaires à intervalles fixes sont une autre forme de renforcement partiel. Le renforcement ne se produit qu’après un certain intervalle de temps. Les taux de réponse restent relativement stables et commencent à augmenter à mesure que le temps de renforcement approche, mais ralentissent immédiatement après la livraison du renforcement..
- Horaires variables sont également un type de renforcement partiel qui implique un renforcement du comportement après un nombre varié de réponses. Cela conduit à un taux de réponse élevé et à des taux d'extinction lents.
- Horaires à intervalles variables sont la forme finale du renforcement partiel décrit par Skinner. Ce programme implique la fourniture d'un renforcement après un laps de temps variable. Cela tend également à conduire à un taux de réponse rapide et à un taux d'extinction lent.
Exemples de conditionnement opérant
Nous pouvons trouver des exemples de conditionnement opérant au travail tout autour de nous. Prenons le cas d'enfants qui terminent leurs devoirs pour gagner une récompense d'un parent ou d'un enseignant, ou d'employés qui terminent leurs projets pour recevoir des éloges ou des promotions.
Quelques exemples supplémentaires de conditionnement opérant en action:
- Si votre enfant s’agit d’une sortie de magasinage, vous pourriez lui donner le plaisir de le faire taire. Parce que vous avez renforcé de manière positive le comportement répréhensible, il sera probablement plus susceptible d'agir à l'avenir afin de recevoir une autre friandise..
- Après avoir joué dans une pièce de théâtre communautaire, vous recevez des applaudissements du public. Cela agit comme un renforcement positif vous incitant à essayer plus de rôles de performance.
- Vous formez votre chien à chercher en lui offrant des éloges et une tape sur la tête chaque fois qu'il effectue le comportement correctement.
- Un professeur dit aux étudiants que s'ils ont une présence parfaite tout au long du semestre, ils n'ont pas à passer l'examen complet final. En supprimant un stimulus désagréable (le test final), les élèves sont renforcés pour assister régulièrement aux cours..
- Si vous ne parvenez pas à remettre un projet à temps, votre patron se fâche et dénonce votre performance devant vos collègues. Cela agit comme un punisseur positif, ce qui réduit les chances que vos projets soient terminés tard dans l'avenir..
- Une adolescente ne nettoie pas sa chambre comme on lui a demandé. Ses parents lui prennent son téléphone pour le reste de la journée. Ceci est un exemple de punition négative dans laquelle un stimulus positif est enlevé.
Dans certains de ces exemples, la promesse ou la possibilité de récompenses entraîne une augmentation du comportement, mais un conditionnement opérant peut également être utilisé pour réduire un comportement. L'élimination d'un résultat souhaité ou d'une application de résultat négatif peut être utilisée pour réduire ou prévenir les comportements indésirables. Par exemple, un enfant peut être averti qu'il perdra ses privilèges de récréation s'il parle à son tour en classe. Ce potentiel de punition peut entraîner une diminution des comportements perturbateurs.
Un mot de Verywell
Bien que le behaviorisme ait peut-être perdu une grande partie de sa domination au début du XXe siècle, le conditionnement opérant reste un outil important et souvent utilisé dans le processus d'apprentissage et de modification du comportement. Parfois, les conséquences naturelles entraînent des changements dans notre comportement. Dans d'autres cas, les récompenses et les punitions peuvent être consciemment distribuées afin de créer un changement.
Le conditionnement opérant est une chose que vous pouvez reconnaître immédiatement dans votre propre vie, que ce soit dans votre approche pour enseigner le bon comportement à vos enfants ou pour apprendre au chien de famille à cesser de mâcher ses pantoufles préférées. La chose importante à retenir est que, quel que soit l'apprentissage, cela peut parfois prendre du temps. Déterminez le type de renforcement ou de punition qui convient le mieux à votre situation particulière et évaluez le type de programme de renforcement susceptible de produire les meilleurs résultats..