Don’t shoot the dog! – partie 2

16518872722_7e0cbfadf8_k

Savez-vous qu’il existe 8 méthodes pour se débarrasser d’un comportement ? Qu’il s’agisse du comportement d’un animal, d’un proche, ou de votre propre comportement. Ces méthodes sont détaillées, avec de nombreux exemples, dans le quatrième chapitre de « Don’t shoot the dog« . On verra aussi dans les deux chapitres suivants les usages variés du renforcement positif dans la vraie vie (comprendre : pour autre chose que changer son animal de compagnie en vedette de cirque), ainsi que les implications variées de son utilisation : effets secondaires sur le long terme, impact sur la mémoire, sur la vitesse d’acquisition des connaissances, sur le développement de la créativité, etc.

Cet article résume la deuxième moitié du livre « Don’t shoot the dog », de Karen Pryor. Pour lire la première partie du résumé de « Don’t shoot the dog », c’est par ici.

4 – Désapprendre : utiliser le renforcement pour se débarrasser d’un comportement qui vous déplaît

Il existe 8 méthodes pour se débarrasser d’un comportement, dont découlent de multiples variations. Quatre d’entre elles sont « négatives » et les quatre autres autres utilisent le renforcement positif. Ce chapitre détaille leur explication et fournit de nombreux exemples. Je vous en retranscris ici les grandes lignes.

Méthode 1 : Tirer sur l’animal
La méthode 1 consiste à éliminer le comportement en éliminant (de façon permanente ou temporaire) le sujet responsable du comportement.
Cette méthode fonctionne toujours : vous ne vous retrouvez plus jamais en présence du comportement. Cette méthode existe sous quantités de variations plus ou moins radicales. Par exemple, retirer les cordes vocales à un chien pour éviter qu’il aboie, divorcer de son épouse, virer son employé flemmard, renvoyer son enfant bruyant dans sa chambre, enfermer les malfaiteurs en prison, cesser de jouer au tennis parce que l’on arrive pas à corriger son service, sont des variations de la méthode 1.

Ne tirez pas sur le chien, il y a d’autres solutions

Cette méthode a sa place, elle peut s’avérer utile dans certaines circonstances, et n’est pas nécessairement cruelle. Cependant, cette méthode n’enseigne rien au sujet.

Méthode 2 : La punition
La méthode préférée de l’être humain : gronder l’enfant, crier sur son colocataire, taper sur son chien, casser sa raquette de tennis, critiquer et harceler son employé.

Avec la punition, le comportement est stoppé, mais le sujet n’apprend rien non plus.

L’une des raisons pour lesquelles la punition ne fonctionne pas bien, c’est qu’elle arrive généralement beaucoup trop tard après le « crime » – et le sujet ne connecte pas la punition avec son méfait. Parfois, la punition devient même un renforcement pour le sujet, qui a généré une forme d’attention de la part du punisseur. Une autre raison est que la punition est souvent appliquée comme une vengeance, et le punisseur se préoccupe d’agir pour sa satisfaction personnelle et non pour que le comportement change.

Méthode 3 : Le renforcement négatif

Le renforcement négatif consiste à appliquer, lorsque le comportement que l’on souhaite éradiquer survient, quelque chose que le sujet veut éviter, et retirer ce quelque chose lorsque le comportement disparaît. Par exemple, mettre du cellophane côté collant en haut sur la table sur laquelle le chat a l’habitude de grimper (contre votre gré) ; arrêter la voiture lorsque les enfants sont trop bruyants, et ne reprendre la route que lorsque les bruits cessent ; éblouir le chien avec de la lumière lorsqu’il aboie et éteindre la lumière lorsqu’il cesse d’aboyer.

La puissance de l’élément aversif ne peut être jugé que par celui qui le reçoit. Ce que l’entraîneur imagine comme doux peut-être vu comme extrêmement sévère par le sujet.

Les bébés apprennent généralement mieux avec le renforcement positif et sont déconcertés ou effrayés par la punition ou le renforcement négatif. Les entraîneurs de canidés utilisant des méthodes conventionnelles (basées sur le renforcement négatif et la punition) recommandent de ne pas utiliser d’entraînement formel sur un chien de moins de six mois.

Méthode 4 : Laisser le comportement s’éteindre de lui-même

Prenez un rat entraîné à utiliser un levier pour obtenir de la nourriture. Éteignez le distributeur. Le rat va d’abord utiliser le levier avec insistance, puis finalement abandonner : le comportement s’est « éteint ».

Ce qu’on appelle « extinction » est un terme qui fait référence à l’extinction d’un comportement, comportement qui cesse de lui-même à cause de l’absence de renforcement.

Les comportements qui ne produisent aucun résultat (que ceux-ci soient positifs ou négatifs) vont probablement s’éteindre. Si le comportement a été renforcé par de l’attention, l’ignorer peut fonctionner.

La méthode 4 s’applique très bien dans les rapports humains pour faire cesser les grincheux ou les persécuteurs : si ces comportements ne produisent pas de résultat, ils s’éteignent. Si l’enfant ou l’époux grincheux est ignoré (alors qu’il est récompensé par de l’attention lorsqu’il est sage ou de bonne humeur), les plaintes cessent. Quant aux persécuteurs, leur sauter à la gorge ou se mettre en colère est généralement un comportement renforçant : les ignorer complètement et garder son calme fait cesser le comportement, même chez les jeunes enfants.

La méthode 4 n’est pas utile pour se débarrasser des comportements bien intégrés et auto-renforcés.

Faisons l’analogie avec la flamme d’une bougie : lorsqu’il n’y a plus rien à brûler, celle-ci s’éteint d’elle-même.

Méthode 5 : Entraîner un comportement incompatible

Ici commence la description des « bonnes fées » : les méthodes positives pour se débarrasser des comportements non-souhaités.

Une méthode élégante est d’entraîner le sujet à exécuter un comportement physiquement incompatible avec celui dont vous ne voulez pas. Si votre chien a l’habitude de mendier lorsque toute la famille est à table, vous pouvez l’entraîner à rester couché à la porte durant le dîner.

Cette méthode est efficace pour attaquer un problème tel que la correction d’un mauvais mouvement dans une pratique sportive ou artistique. Les muscles apprennent lentement mais bien, et une fois qu’un mouvement est intégré, il s’avère souvent très difficile à corriger. En reprenant un tout nouveau mouvement depuis le début, en décomposant phase par phase lentement, ou en répétant seulement une phase, il est possible d’apprendre un mouvement complètement différent. Une fois les muscles habitués, on assemble le tout et on augmente la vitesse.

D’autres exemples de méthode 5 : si un colocataire laisse ses vêtements sales traîner, acheter un panier à linge et renforcer son utilisation. Si les enfants sont trop bruyants dans la voiture, leur faire chanter des chansons ou jouer à des jeux.

Méthode 6 : Entraîner l’animal à exécuter le comportement sur commande (Et ensuite, ne jamais donner la commande)

Voilà une méthode singulière, qui peut fonctionner dans certaines circonstances alors que rien d’autre n’est efficace.

La méthode a permis de résoudre le problème d’un jeune chiot qui, une fois dehors, pleurait à la porte au lieu d’aller faire ses besoins. La solution a consisté à accrocher à la poignée extérieure un disque de carton noir d’un côté, blanc de l’autre : côté noir, le chiot n’était jamais autorisé à rentrer. Côté blanc, le chien pouvait rentrer.

Le chiot a appris rapidement à différencier les deux panneaux et abandonna ses gémissements lorsque le panneau était côté noir. Lorsque sa propriétaire jugeait qu’il avait passé assez de temps à l’extérieur, elle entrouvrait la porte, retournait le panneau, puis refermait en attendant que le chien réclame de rentrer (ce qui ne manquait pas d’arriver vite).

Méthode 7 : Renforcement l’absence de comportement (n’importe quoi qui ne soit pas le comportement)

Une technique utile lorsque vous n’avez pas de préférence sur le comportement alternatif à adopter pour le sujet, que vous souhaitez juste qu’un comportement cesse. Il s’agit alors de renforcer n’importe quoi qui soit autre chose que le comportement.

Cette technique a porté ses fruits avec de jeunes loups qu’un psychologue invitait dans sa maison pour les sociabiliser : le seul passe-temps chez un jeune loup qui n’implique pas de détruire quelque chose, dans une maison, c’est de rester allongé sur le canapé. Le psychologue et sa femme se retrouvèrent bientôt à passer leurs soirées à regarder les informations avec trois loups de plus en plus grands sagement installés sur leur canapé.

Crédit photo : Kate Brady

L’auteur a également résolu en deux mois 20 ans de conflits téléphoniques avec sa mère grâce une combinaison de méthode 4 (ignorer les plaintes et remarques désagréables dont on ne veut pas pour les laisser s’éteindre) et 7 (renforcer tout ce qui n’est pas une plainte : parler du beau temps, demander des nouvelles des enfants).

Méthode 8 : Changer la motivation

La méthode la plus douce et la plus efficace. La personne qui a suffisamment à manger ne vole pas de pain.

La méthode 8 implique d’être capable d’estimer précisément la motivation de l’autre, et nous sommes généralement totalement incompétents à ce jeu. Nous sautons à des conclusions faciles : « cet enfant est idiot », « Mon boss me hait ». Nous sommes parfois même incapables de comprendre nos propres motivations.

Ainsi, les enfants qui hurlent et réclament dans le supermarché ont parfois réellement faim, et prendre la précaution de leur donner un repas ou un goûter avant d’aller faire les courses peut épargner bien des oreilles et des angoisses.

Souvent, la motivation d’un comportement problématique est à chercher dans des causes basiques : faim, fatigue, peur, maladie, solitude. S’il est possible d’éliminer cette cause, et donc d’éliminer ou de changer la motivation, le problème est résolu.

Par exemple : votre chat grimpe toujours sur la table de la cuisine contre votre gré ? Si c’est pour voler de la nourriture : trouver un autre endroit pour la stocker. Sinon, les chats aiment être en hauteur pour avoir une vue d’ensemble. Installez-lui un piédestal plus haut que la table et qui lui offre une bonne vue sur la cuisine.

Votre service au tennis est mauvais ? Cessez de vouloir battre le monde entier au tennis, jouez pour le plaisir.

Cette partie du livre traite également de la privation de nourriture (non nécessaire et pourtant fréquente) dans le monde du conditionnement ; de la combinaison astucieuse de plusieurs méthodes pour traiter des problèmes complexes qui sont très enracinées et dont les causes sont multiples, comme grignoter ses ongles, fumer, arriver sans cesse en retard.

5 – Le renforcement dans le monde réel

Dans ce chapitre, sont présentés de multiples exemples de cas variés de renforcement positif dans la « vraie vie ».

Renforcement positif dans le sport

Vivant à New York à une période de sa vie, Karen Pryor s’est mis, en partie mue par sa curiosité d’entraîneur, à prendre des cours dans des disciplines variées : squash, navigation, ski, skate, danse. Elle y a découvert avec surprise que tous les coachs (sauf un) utilisaient des techniques issues du renforcement positif pour faire progresser leurs élèves. Un seul recourait encore à l’intimidation et à la ridiculisation pour obtenir quelque chose. Tous les autres sans exception s’appuyaient sur des renforcements positifs « appliqués » au bon moment, et souvent sur des procédures ingénieuses de shaping.

S’intéresser au renforcement positif, c’est aussi s’offrir les moyens de progresser dans des activités variés, ou de faire progresser ses élèves. Crédit photo : Jean-Marie Muggianu

Renforcement positif dans le monde du travail

Les programmes visant à réduire les coûts et accélérer le travail – qui tentent de forcer les travailleurs à faire un job moins pire – sont loin d’être aussi efficace que ceux qui aident à mieux réaliser le travail et récompense ensuite le travail réalisé.

Les renforcements de manager d’âge moyen peuvent consister en tâches plus intéressantes à leur niveau actuel, plutôt qu’une promotion ; d’être récompensés pour avoir effectué le travail plutôt que pour passer du temps au bureau….

Le renforcement dans le monde animal

Pour Karen, en tant qu’éthologue, la meilleure partie de l’entraînement au renforcement positif, c’est qu’il ouvre une fenêtre sur la pensée animale.

Sans rien connaître d’une espèce au préalable, on peut tirer plus d’enseignements sur ses caractéristiques comportementales en quelques séances d’entraînement qu’en plusieurs jours d’observation au contact de ses propres congénères. Faire participer un animal sauvage à une procédure simple de shaping peut donner un aperçu du tempérament de son espèce, de la façon dont elle aborde les challenges dans son milieu naturel.

On peut tirer davantage d’enseignements sur les caractéristiques comportementales d’un animal en quelques séances d’entraînement qu’en plusieurs jours d’observation au contact de ses propres congénères. Crédit photo : Diana Robinson

Renforcement au sein de la société

Le comportement n’est pas qu’un produit des conditionnements et apprentissages que l’on pourrait corriger sur chaque individu avec des renforcements appropriés. Un comportement est le produit d’une « soupe » de facteurs variés : les individus réagiront différemment en fonction non seulement de leurs motivations et de leurs humeurs (qui varient), mais aussi de conditions externes (avoir chaud ou froid, trop mangé ou faim engendrera des réactions différentes). En d’autres termes, les techniques de renforcement pour modifier les comportements n’ont rien de magique, elles ont leurs limites.

Ceci étant établi, il est intéressant de voir que des caractéristiques considérées habituellement comme innées, comme la créativité, peuvent être développées par le renforcement positif. Karen Pryor relate ainsi des expériences menées avec un chat et des dauphins, renforcés chaque fois qu’ils proposaient quelque chose de nouveau, qui ont évolué en animaux inventifs et plein d’esprit.

Autre corollaire important de l’entraînement par renforcement positif : celui-ci engendre une affection mutuelle chez le sujet et son formateur. Pour Karen Pryor, l’entraînement régulier tend à changer les participants en renforcements généralisés l’un pour l’autre. Ils deviennent réciproquement une source d’intérêt, d’excitation, de nouveautés et de récompenses. Ils s’attachent mutuellement, et il ne s’agit pas d’une dépendance mais plutôt d’une relation de compagnons de guerre. Karen est également convaincue du profond effet du renforcement positif au niveau des relations entre être humains, cimente les liens familiaux et amicaux, développe du courage chez les enfants et leur enseigne à imaginer à leurs tours des renforcements inventifs. Attention cependant : utiliser le renforcement positif à bon escient ne signifie pas – comme certains sont parfois amener à penser – qu’il faut dire oui à tout.

6 – Clicker training : une nouvelle technologie

Le Clicker training est en vogue

Pour l’auteur, ce qui a vraiment lancé le clicker training, c’est une table ronde en 1992 entre scientifiques et formateurs. Quelques jours plus tard, Karen donnait un séminaire « Don’t shoot the dog » pour éducateurs de chiens ; et bientôt s’ensuivirent d’autres séminaires, des livres, vidéos, ainsi que de grandes discussions sur la toile.

De nombreuses personnes s’appropriaient le clicker et développaient des applications variées : on a vu des personnes développer des méthodes pour éduquer des chiens domestiques à exécuter des tours amusants, pour enseigner aux chiens de patrouille un travail qu’ils exécutaient avec plaisir, pour aider les personnes en fauteuils roulants à éduquer eux-mêmes leurs chiens d’assistance.

C’est à cette époque aussi qu’Alexandra Kurland développe des applicatons de clicker training pour éduquer les chevaux à exécuter toutes sortes de tâches, et pour la rééducation d’individus agressifs et dangereux.

Les effets secondaires du Clicker training sur le long terme

Est-ce que les qualités généralement attribués aux dauphins (intelligents, joueurs, curieux, amicaux) sont des caractéristiques innées de cette espèce ou sont dues à la façon dont on les éduque ? Avec cet engouement pour le clicker training, on s’aperçoit maintenant que ces mêmes qualités se développent naturellement chez toutes sortes d’espèces (y compris les humains !) via une éducation sur le long terme au renforcement positif.

Mémorisation longue durée

Un autre effet secondaire de l’éducation au clicker est qu’un comportement appris n’est pas oublié. Là encore, ce que Karen a eu l’occasion d’observer chez les dauphins pendant 15 ans est vrai pour toutes sortes d’espèces et d’individus.

Apprentissage accéléré

Un autre aspect remarquable du renforcement positif : un éducateur compétent est capable d’obtenir en quelques jours un comportement qui nécessite des mois voire des années avec les méthodes conventionnelles.

Se débarrasser du Clicker

Une des objections classiques – et compréhensible – est de ne pas vouloir être coincé à « clicker » et donner des bonbons à tout bout de champ durant toute la vie du sujet. Il s’agit d’une idée reçue : une fois qu’un comportement est intégré, ni clicker ni bonbon ne sont nécessaires.

Clicker training et créativité

Le sens de l’expérimentation et de l’initiative découlent de l’éducation au clicker… Aussi bien chez le formateur que chez le sujet. Celui qui apprend à base de conditionnement renforcé est engagé dans une sorte de jeu : trouver le comportement qui fera « clicker » le formateur. Il est facile d’observer que, pratiqué avec un enfant, celui-ci a envie d’apprendre, et même de réfléchir. Pourquoi pas chez un animal ?

Pour aller plus loin

Pour se procurer le livre « Don’t shoot the dog! Le nouvel art de l’éducation »

Don’t shoot the dog! Le nouvel art de l’éducation (sur Amazon)


2 réponses à “Don’t shoot the dog! – partie 2”

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *