Les premières personnes à avoir utiliser le conditionnement opérant en dehors d’études de laboratoire étaient deux étudiants de
Skinner, Keller et Marion Breland dans les années 1940. Ils travaillaient alors sur des chiens. Ce n’est qu’au début des années 1950 que Keller Breland a mis en place cette méthode sur les mammifères marins. En effet les dresseurs animaliers devaient trouver une méthode pour apprendre aux dauphins à effectuer des numéros sans contraintes. Le sifflet à ultrasons a d’abord été utilisé puis le clicker training fit son entrée et se développa de plus en plus dans les pays anglo-saxons.
Karen Pryor fut celle par qui la méthode du clicker training se généralisa à plusieurs espèces animales (chevaux, chiens, poules, oiseaux,…). Certains zoos travaillent avec la méthode du clicker training sur leurs animaux sauvages notamment pour leur apprendre à être manipulés.
Cette technique fut mise au point en utilisant deux
conditionnements : opérant et répondant.
Le conditionnement opérant fut développé par
Thorndike puis par Skinner au milieu du 20ème siècle. Il repose sur deux éléments : le
renforcement et la
punition.
Le renforcement est la conséquence d’un comportement qui rend plus probable que le comportement soit reproduit de nouveau.
La punition est la conséquence d’un comportement qui rend moins probable que le comportement soit reproduit de nouveau.
Un renforcement ou une punition peuvent être :
- positif : ajout d’un stimulus agissant sur l’organisme
- négatif : retrait d’un stimulus agissant sur l’organisme
On a donc 4 combinaisons possibles :
- le renforcement positif : la fréquence d’un comportement augmente suite à l’ajout d’un stimulus appétitif. Ex : ajout d’une récompense, d’une caresse,…
- le renforcement négatif : la fréquence d’un comportement augmente suite au retrait d’un stimulus aversif. Ex : retrait d’une douleur, d’une obligation,…
- la punition positive : la fréquence d’un comportement diminue suite à l’ajout d’un stimulus aversif. Ex : ajout d’une douleur, d’une obligation,…
- la punition négative : la fréquence d’un comportement diminue suite au retrait d’un stimulus appétitif. Ex : retrait de quelque chose d’agréable.
Il existe deux types de renforçateurs :
- Le renforcement primaire est tout ce que l’animal veut, ce qui répond à ces besoins essentiels.
- Le renforcement secondaire se fait par apprentissage. Dans ce cas, le bruit qu’émet le clicker est un renforcement secondaire et est associé à quelque chose d’agréable pour l’animal.
Le conditionnement répondant fut initié par
Pavlov au début du 20ème siècle. Il développa la théorie des réflexes conditionnés.
Pour qu’il y ait conditionnement répondant, il faut associer un stimulus inconditionnel (SI) à un stimulus neutre (SN). Le SN ne déclenche pas au début de réaction. Le SI déclenche une réponse réflexe sans apprentissage qui est appelée la réponse inconditionnelle (RI). En répétant de façon fréquente l’association entre le SN et le SI, le SN devient le stimulus conditionnel (SC) et provoque une réponse similaire à la RI qui sera une réponse conditionnelle (RC).
On peut illustrer tout ça avec l’expérience de Pavlov : en présentant de la viande (SI) à un chien, il remarquait que ce dernier salivait (RI). Pavlov ajouta alors le SN, le son d’une cloche, avant de lui présenter la viande et il constata que peu de temps après, le chien salivait au son de la cloche (RC). Le son de la cloche était passé de stimulus neutre à un stimulus conditionnel.
Pour que l'apprentissage soit réussi, il faut bien sûr que la
motivation du chien soit suffisante. Il faut donc s'assure que les récompenses utilisées soit motivantes.