Puhutaanko oppimisen nelikentästä?
Ei, niin ajattelinkin. Ei ainakaan siitä. Mutta puhun silti. Ihan vähän siitä nelikentästä, ja sitten tämänhetkisestä käsityksestäni sen hyödyllisyydestä.
Oppimisen nelikenttä lyhyesti:
Negatiivinen = miinus, jotain vähenee tai häviää
Positiivinen = plussa, jotain lisääntyy
Vahviste = lisää sitä edeltänyttä käyttäytymistä
Rankaisu (heikenne) = vähentää sitä edeltänyttä käyttäytymistä
Negatiivinen vahviste = jotain epämiellyttävää vältetään, käyttäytyminen lisääntyy (hevosmaailmassa ”paineen poisto”)
Positiivinen rankaisu = jotain epämiellyttävää lisääntyy, käyttäytyminen vähenee
Positiivinen vahviste = jotain miellyttävää saavutetaan, käyttäytyminen lisääntyy (”palkinto”, ”palkkio”)
Negatiivinen rankaisu = jotain miellyttävää menetetään, käyttäytyminen vähenee
Siinäpä se. Käytössä on vielä harhaanjohtavammat lyhenteet, sillä englanniksi R tarkoittaa reinforcement, vahvistetta, ja P tarkoittaa punishment, rankaisua.
P+ = positiivinen rankaisu.
R+ = positiivinen vahviste.
P- = negatiivinen rankaisu.
R- = negatiivinen vahviste.
Älä huoli, minäkin joudun niitä jatkuvasti korjaamaan teksteistäni kun yritän kirjoittaa nopeasti.
Miksi käytössä on sekä sana ”rankaisu” että sana ”heikenne”? Ne tarkoittavat täsmälleen samaa asiaa eli jotain, joka saa aikaan käyttäytymisen vähenemisen. Syy on se, että käyttäytymistiede ja eläintenkoulutuskäytäntö eivät käytä tästä samaa termiä. Se suomalainen eläintenkouluttaja, joka puhuu heikenteistä, on käynyt joko Tampereen yliopiston puolen vuoden käyttäytymisanalyysikoulutuksen tai muuten ollut sen käyneiden opissa. Näin yleistäen…
Kummassakin sanassa on ongelmansa. Rankaisu kuulostaa suureelliseltä ja jälkikäteen käytetyltä, tyyliin ajoit liian lujaa ja sait sakot. Heikenne taas kuulostaa valkopesulta, ihan hei vaan heikennän käyttäytymistä, kun nyin naruriimusta tai mätkin raipalla.
Käytän itse nyt toistaiseksi termiä rankaisu, pitäen mielessä että se voi olla todella pieni, ärsyttävä asia (se kärpänen iholla) ja jotta se toimisi käyttäytymistä vähentävänä sen on tultava nopeammin kuin ne sakot postissa.
Nelikenttä 2.0
Kymmeniä vuosia sitten eläintenkoulutuspuolella (lähinnä koirankoulutus, joka on uusien koulutuskäytäntöjen edelläkävijä Suomessa) nelikenttä oli the juttu. Tunteista ei saanut puhua, koska tunteita ei pystytty tieteellisesti todistamaan. Mitataan käyttäytymistä. Lisääntyykö se vai väheneekö se vai pysyykö se ennallaan?
Tämä on oikein hyvä perusta eläinten kouluttamiselle, mutta se ei ole mitään muuta kuin tämä: perusta. Aloita sen opettelmisesta, sillä ellet tiedä, miksi vaikkapa hevonen käyttäytyy kuten se tekee, mitä se välttää tai haluaa saavuttaa, et tule onnistumaan käyttäytymisen muuttamisessakaan. Ainakaan mitenkään järkevässä ajassa.
Mutta kun olemme kouluttamassa käytännössä, täytyy sen nelikentän lisäksi olla aika monta muuta asiaa hallussa. Kuten esimerkiksi tietämys hevosen käyttäytymisestä ja fysiikasta, ympäristön vaikutuksesta (ympäristössäkin on koko ajan vahvisteita ja rankaisuja, jotka eivät aina ole ihmisen määriteltävissä) ja hevosen tunteista. Niin, niistä tunteista.
Tunteita ei vieläkään eläimillä pystytä kovinkaan hyvin mittaamaan. Eläimen käyttäytyminen kertoo toki sen tunteista. Sen, mitä tiedämme tällä hetkellä on, että todennäköisesti palkinnon saavuttaminen (positiivinen vahviste, palkinto, R+) saa aikaan ilon tunneta, paineen välttäminen (negatiivinen vahviste, R-) taas helpotuksen tunnetta. Kaksi hyvin erilaista asiaa, meillä ihmisilläkin.
Tärkeää on, että hevonen saisi kokea myös sitä iloa. Ei vain helpotusta. Olen kyllä itse miettinyt, että helpotuksen tunne voisi olla oikein oiva esimerkiksi trailerissa oloon. Se ei silti tarkoita että edelleenkään pitäisin hevosystävällisenä, että hevosta säikytellään trailerin ulkopuolella jotta se oppisi, että trailerissa saa olla rauhassa. Sitä se ei ole.
Rankaisujenkin mukana kulkee tunteita. Positiivinen rankaisu aiheuttaa ahdistusta tai pelkoa, negatiivinen rankaisu surua. (Tämä on vielä suhteellisen uutta ajatusta, lisää voi lukea esimerkiksi googlaamalla Mendl Integrative framework animal emotion and mood.)
Kun aloitin eläinten kouluttamisen opettelun, oli naksutinkoulutuspiireissä välillä vallalla (koirapuolella siis) käsitys siitä, että ruoka on ainoa vahviste ja toistomäärien kannattaa olla aivan mielettömiä. Siis kymmeniä tai satoja per kriteeri. Klikkilistalla jaettiin sumeilematta koiran nälässäpito-ohjeita, jotta voitaisiin palkita sitä koiraa ruualla, jos se ei koulutustilanteessa luontaisesti syönyt. Kyllä, oli silloinkin järkeviä tapoja olemassa, mutta tämä sellaisena blast from the past -anekdoottina.
Mikä nelikenttä 2.0? Sitä, että mielestäni (tällä hetkellä, todennäköisesti taas kymmenen vuoden päästä jotain vähän muuta) mekaanista kouluttamisopettelua tärkeämmäksi ainakin hevosten kanssa muodostuu se, että kouluttaja aidosti osaa muokata koulutusta sen hevosyksilön mukaiseksi. Se, mikä on yhdelle hevoselle hyvä vahviste, ei ole sitä välttämättä lainkaan toiselle. Se, miten paljon kouluttaja pystyy ennakoimaan ja järjestämään asiat niin, että hevonen oppii lähinnä vain niitä asioita, joita ihminen haluaa, on onnistuneen kouluttamisen pääosassa.
Tämänhetkinen kouluttajien kuuma peruna tuntuu olevan se, onko negatiivisen vahvisteen (paineen poisto) käyttö eettisesti hyväksyttävää. Ei siksi, että paineen poistamisessa olisi mitään eettisesti hankalaa vaan siksi, että jotta paineen poistuminen toimisi käyttäytymisen vahvisteena, sen paineen pitää tuntua jonkun verran epämiellyttävältä. Muuten sen poistuminen ei muuta eläimen käyttäytymistä vaan käyttäytyminen pysyy ennallaan. Ja ihminen on se, joka aiheuttaa paineen. Sen positiivisen rankaisun.
Olen lukenut väitteitä, jonka mukaan negatiivista vahvistetta edeltävä paine ei välttämättä olisi rankaisu lainkaan. Eli negatiivista vahvistetta voisi käyttää ilman, että eläin kokee sitä ennen rankaisua. Itse en tähän usko. Jos käytetään pelkkää painetta ja paineen poistoa koulutuksessa, kuten valtaosassa hevosten kouluttamista edelleen tehdään, hevosen täytyy jossain vaiheessa oppia, että jollei se tee koulutetusti, paine lisääntyy. Muuten, olettaen että paine on alussa pieni, hevonen todennäköisesti jossain vaiheessa tottuu siihen eikä sen poistuminen enää toimi vahvisteena.
Vaikka muokkaisi liikettä aivan painonsiirrosta alkaen järjestelmällisesti kohti suurempaa, monen vaatimustason noston kautta, tästä tottumisesta ei pääse mihinkään. Jossakin vaiheessa tulee todennäköisesti tilanne, jossa hevonen ei nostakaan laukkaa siitä aivan pienimmästä vihjeestä. Silloin paine todennäköisesti lisääntyy, kunnes hevonen nostaa sen laukan. Toinen vaihtoehto on lopettaa pyyntö ja viedä hevonen eläinlääkärille, mikä on toki vaihtoehto sekin, eikä usein huono. Mutta voi myös olla, että oli kuuma päivä tai paarma puri, tai hevosen huomio oli ympäristössä eikä se tuntenut sitä kevyintä vihjettä.
Eli pelkän negatiivisen vahvisteen mukana kulkee se positiivinen rankaisu, tai opittu tieto sen mahdollisuudesta eli paineen lisääntymisestä.
Jos taas, kuten hevospuolellakin yhä useammin, käytetään sekä negatiivista että positiivista vahvistetta, asia ei olekaan enää niin yksinkertainen. Itsehän, vaikka olen kouluttajana päätynyt siihen, että on eettisesti ihan ok aiheuttaa hevoselle ohimenevää epämukavuutta, käytän lähes kaikessa sekä R+ että R-. Miksi? Koska se antaa minulle mahdollisuuden ”vaihtaa” paineen lisääntymisen kunnes se on aidosti P+ siihen, että hevonen aktiivisesti tavoittelee palkintoa ja haluaa itse oivaltaa, mitä kosketus tarkoittaa. Silloin väitän, että paineen poisto ei monelle hevoselle olekaan mikään negatiivinen vahviste lainkaan eikä sen aloittaminen mikään positiivinen rankaisu, vaan paineen aloittaminen on opittu vihje ja paineen poistuminen on ehdollinen vahviste joka tarkoittaa, että palkinto on tulossa. Tai seuraava liike, joka useammin sitten vähän valmiimman hevosen kanssa on se juttu.
Lopuksi se tärkein: Katso hevosta. Mikä on sille vahviste? Mikä on sille rankaisu? Oppiiko se nopeasti? Jollei opi, miksei? Hevosella on aina vastaus. Hevonen on se, joka tietää. Me voimme vain tehdä valistuneita arvauksia ja oppia.

Mikä vahvistaa pikku orivarsan kaula kaarella kootussa käynnissä liikkumista?