Trainen mét voedselbeloning of juist niet?

Irene Smeets
26 nov 2022
7 minuten om te lezen

Bijgewerkt op: 27 nov 2022

In het beleren van onze geviervoetigde vrienden houden we ons allemaal (als het goed is) bezig met hoe paarden leren en wat daarin de meest effectieve manier is. Tenslotte wil je iets van je paard en dan is het op zijn zachts gezegd verstandig om je te verdiepen in hoe dat leren bij paarden eigenlijk gaat. Dat wiel hoeven we gelukkig niet zelf meer uit te vinden omdat er inmiddels behoorlijk wat wetenschappelijk onderzoek naar verricht is. Om te weten of we dat leren met een voedselbeloning moeten doen (R+) of juist door druk te geven en los te laten (R-) is een goed begrip van de leerprincipes vereist. Er zijn twee gangbare leerprincipes die echt van belang zijn te begrijpen wil je je paard uiteindelijk iets aanleren. Dat is klassieke en operante conditionering.

Bij operante conditionering gaat het over een handeling die door je paard geassocieerd wordt met iets leuks of iets onaangenaams. Het gaat er dus om dat gedrag de neiging heeft zich te herhalen als er een positieve consequentie aan zit en de neiging heeft zich niet te herhalen als er een negatieve consequentie aan vast zit (Wet van effect, Thorndyke)

Klassieke conditionering gaat over het toedienen van 2 prikkels, waardoor deze met elkaar in verband gebracht worden. Best bekend is het verhaal van conditionering volgens Pavlov, waarbij een hond begint te kwijlen na het horen van een bel. Deze dinerbel klonk steeds als de hond gevoerd werd. Voor een hond betekent zo'n bel natuurlijk helemaal niks; toch knoopte hij onherroepelijk het geluid van de bel aan het krijgen van eten en zonder dat hij daar over na hoefde te denken en er bovendien niks aan kon doen, begon het proces van kwijlen. Deze ontdekking van Pavlov werd de peiler onder de associatieve leertheorie, oftewel klassieke conditionering.

Skinner, ontwikkelde een schema bij operante conditionering die de Reinforcers (bekrachtigers dus) en Punishers (Straf) in beeld brengt. R+: Een prettige prikkel wordt toegediend. In ons geval krijgt het paard bijvoorbeeld een voedselbeloning bij gewenst gedrag. De kans is dan groot dat hij dat gedrag gaat herhalen omdat hij nogmaals een beloning wil. R-: Hierbij wordt een onaangename prikkel weggehaald op het moment dat het paard gewenst gedrag vertoond. Dus we geven bijvoorbeeld een drijvende hulp het paard versnelt, en de onaangename prikkel van druk geven laten we los. De kans is groot dat het paard de onaangename prikkel wil vermijden en daardoor het gewenste gedrag sneller en vaker gaat vertonen. P- en P+ zijn de punishers, dus straf. Daarmee kun je hooguit gedrag afleren, maar een bepaald gedrag aanleren is een heel ander verhaal. Voor dit verhaal is het daarom minder van belang.

(R+ werken met clicker en voedselbeloning).

De meest gebruikelijke manier om met een voedselbeloning te werken is clickertraining. Of dat operante of klassieke conditionering is en hoe je goede clickertraining naar mijn mening moet doen, laten we voor het gemak ook even buiten beschouwing. Wat wél in dit kader nog van belang is, is dat in feite alle leren emotie is. Het baanbrekende werk van Jaak Panksepp "affectieve neuroscience" spreekt over 7 basisemoties. 4 Belonende zoek, zorg, spel en lust, en 3 bestraffende paniek/verdriet, angst en woede. Deze 7 basisemoties noemt hij "de Tools of life", oftewel het gereedschap om te kunnen leven. De onderliggende systemen in de hersenen zijn genetisch bepaald en hebben zich ontwikkeld om direct te reageren op "life-challenging" omstandigheden. De reacties op basis van deze emoties zijn dus niet geconditioneerd. Deze basisemoties, hoewel genetisch grotendeels bepaald, blijven zich gedurende het leven ontwikkelen. De invloed van erfelijkheid en ervaringen is niet bij alle basisemoties hetzelfde, maar we stellen die op ongeveer 50/50.

Gaan we nu weer terug naar de leerprincipes dan zien we dat de basisemoties die aangesproken worden bij R+, Zoek, zorg en spel zijn en bij R-, Woede, Paniek/angst en Zoek. Ik realiseer me ten volle dat we door deze materie te proberen in zo'n notendop te stoppen, er bepaald geen recht aan gedaan wordt, maar in het kader van het verhaal wel of geen voedselbeloning, hoeven we er niet heel uitgebreid op in te gaan om toch een beeld te krijgen van welk wetenschappelijk onderzoek er inmiddels is en hoe we dat kunnen gebruiken bij onze training.

(R+ doormiddel van harmonie).

De conclusie is snel te maken dat we, uiteraard mits goed toegepast, met leren met R+ in de juiste basisemotie zitten om een paard met plezier iets aan te leren. In "mits goed toegepast", zit het addertje onder het gras. Het goed toepassen van de clickermethode is nog zo simpel niet. Indien je niet echt goed geleerd krijgt hoe je deze methode toepast, levert het frustratie en stress op. Je paard kan zichzelf behoorlijk onder druk zetten voor een voedselbeloning, hij kan gefrustreerd raken en boos worden of het opgeven.

De clickermethode wordt van oudsher toegepast bij dolfijnen, walvissen etc. want ja zeg nu zelf hoe ga je die met een andere methode snel iets leren als ze steeds als ze iets niet leuk vinden, niet snappen en/of gefrustreerd raken, gewoon wegzwemmen. Sterker nog de clickermethode is door een zoöloge uitgevonden en heeft daarna zijn intrede langzaam maar zeker door heel het trainerslandschap gemaakt. Hondentrainers hebben de clickermethode al heel lang omarmd. Waarom blijven wij als paardentrainers dan toch zo achter? Er is zoveel bewijs voor snel leren, zoveel bewijs voor meer plezier. R+ is overigens elke methode die positief bekrachtigd, dus ook bijvoorbeeld Freedom based training in welk geval je enkel beloond met harmonie. Maar deze methode is niet een methode die razendsnel werkt. Je kunt ook, aaien, scratchen etc. Ook dit is R+ en werkt, maar voedsel is een door de meeste paarden onder de meeste omstandigheden hetgeen als de grootste beloning wordt gezien. Vandaar dat de clickermethode ook met een voedselbeloning werkt en snel werkt.

Laten we R- eens wat meer onder de loep nemen. De hele traditionele paardenwereld en een groot deel uit de horsemanshipwereld gebruikt R- als een geaccepteerde methode om een paard iets te leren. Je geeft druk, je paard doet wat je wilt en je laat de druk los. Simpel gezegd is het de druk die je paard motiveert om iets te doen en de release léért je paard om het te doen. Deze methode behoeft wat minder uitleg omdat nagenoeg iedereen hem gebruikt zou je denken. Echter als we denken dat clickertraining niet goed toegepast frustratie opwekt, dan is R- niet goed toegepast al helemaal een concept om je paard hopeloos gefrustreerd, boos of bang te maken. Wat we inmiddels ook wel weten is dat leren enkel kan indien je paard zich comfortabel of licht oncomfortabel voelt. Zodra hij daadwerkelijk angst krijgt, valt er weinig te leren en zul je elke dag opnieuw hetzelfde moeten herhalen. Bij het leerprincipe van druk geven en een release geven wordt bijzonder vaak over het hoofd gezien in welke basisemotie het paard zit en dát is naar mijn idee de hele crux in dit verhaal.

Teveel druk geven en het doorzetten van die druk om ervoor te zorgen dat je paard doet wat je wilt levert bange of boze paarden op en zodra je paard bang is leert hij niet, maar doet hooguit wat je zegt. Hij vlucht weg voor de druk, weet wel in zijn bangheid nog wel dat er iets is wat hij moest doen en werkt een riedeltje mogelijkheden af tot de druk weg is. Het leereffect is nagenoeg nul en de training is voor je paard een onaangename exercitie geworden.

De release niet of op het verkeerde moment geven zorgt ervoor dat je paard niet meer weet wat je bedoeld en als je dan de druk toch gaat opvoeren zal je paard willen wegvluchten. Als hij dat niet kan vanwege een toegediende pijnprikkel in de mond via het bit bijvoorbeeld, dan vlucht hij na verloop van tijd enkel nog in zijn hoofd en een shutdown of learned helpless paard is gecreëerd.

Bij positieve bekrachtiging zit je paard vrij snel in de goede basisemotie en zolang je het maar goed doet, heb je blije paarden die vrijheid van keuze hebben en die keuze valt verrassend vaak uit in ons voordeel.

In tegenstelling tot R+ roept R- een negatief gevoel op omdat het je paard snel in de verkeerde basisemotie brengt. Maar...Goed toegepast brengt het je paard in de basisemotie Zoek! De kunst is van R- geen dwang te maken, keuzes te bieden en je paard in zijn hoofd aan het zoeken naar een oplossing te houden. En dat zoeken naar een oplossing gebeurd alleen als je paard zich comfortabel of licht oncomfortabel voelt.

(Negatieve bekrachtiging juist toegepast)

Heel het wezen van een paard is gericht op overleven. Als prooidier is hij tenslotte op de wereld gekomen met een grote kans om opgegeten te worden. Rust en veiligheid vinden en zien te behouden zijn sleutelwoorden in het leven van een paard. En alhoewel alle leerprincipes natuurlijk in het leven van een paard voorbij komen, denk ik dat R- in het leven van een paard een leerprincipe is waar hij bijzonder goed mee uit de voeten kan. Op de juiste manier toegepast is R- een leerprincipe dat naar mijn mening heel goed bij paarden past.

R+ of R-, het antwoord ligt naar mijn mening in goed horsemanship. Goed horsemanship betekent dat je zorgt dat jijzelf in balans bent. Je weet dat alles wat je paard doet in meer of mindere mate te maken heeft met diegene die voor zijn neus staat. Dat je eigen emoties, laat staan je ego, geen plaats hebben in het trainen van je paard. Dat je continue werkt aan je eigen ontwikkeling om in het hier en nu te zijn met een "peacefull mind". Dat je in elke porie van je lijf weet dat je paard in feite altijd gelijk heeft. Dat als je paard iets doet wat je eigenlijk niet wilt, je niet bij je paard moet zoeken maar bij jezelf wat je zou moeten veranderen. Goed horsemanship betekent dat mét of zonder voedsel trainen iets is wat een keus is, afhankelijk van jou als trainer, soms van je paard en soms afhankelijk van de situatie. Ik denk wel dat het verkrijgen van een blij paard heel wat gemakkelijker gaat met R+ dan met R- maar het is beide mogelijk. Wij zouden ons allemaal moeten concentreren op echt goede training en goed horsemanship wat begint en eindigt bij je paard het gevoel te geven dat hij gezien, gehoord én begrepen wordt, nog voor we iets van hem gaan vragen. Met R+ of R-, mits echt goed toegepast zal het mij eerlijk gezegd niet heel veel uitmaken.

Trainen mét voedselbeloning of juist niet?

Recente blogposts

Opmerkingen