Oppimisnörtteilykirjoitus

Puhutaanko oppimisen nelikentästä?

Ei, niin ajattelinkin. Ei ainakaan siitä. Mutta puhun silti. Ihan vähän siitä nelikentästä, ja sitten tämänhetkisestä käsityksestäni sen hyödyllisyydestä.

Oppimisen nelikenttä lyhyesti:

Negatiivinen = miinus, jotain vähenee tai häviää
Positiivinen = plussa, jotain lisääntyy

Vahviste = lisää sitä edeltänyttä käyttäytymistä
Rankaisu (heikenne) = vähentää sitä edeltänyttä käyttäytymistä

Negatiivinen vahviste = jotain epämiellyttävää vältetään, käyttäytyminen lisääntyy (hevosmaailmassa ”paineen poisto”)
Positiivinen rankaisu = jotain epämiellyttävää lisääntyy, käyttäytyminen vähenee

Positiivinen vahviste = jotain miellyttävää saavutetaan, käyttäytyminen lisääntyy (”palkinto”, ”palkkio”)
Negatiivinen rankaisu = jotain miellyttävää menetetään, käyttäytyminen vähenee

Siinäpä se. Käytössä on vielä harhaanjohtavammat lyhenteet, sillä englanniksi R tarkoittaa reinforcement, vahvistetta, ja P tarkoittaa punishment, rankaisua.

P+ = positiivinen rankaisu.

R+ = positiivinen vahviste.

P- = negatiivinen rankaisu.

R- = negatiivinen vahviste.


Älä huoli, minäkin joudun niitä jatkuvasti korjaamaan teksteistäni kun yritän kirjoittaa nopeasti.

Miksi käytössä on sekä sana ”rankaisu” että sana ”heikenne”? Ne tarkoittavat täsmälleen samaa asiaa eli jotain, joka saa aikaan käyttäytymisen vähenemisen. Syy on se, että käyttäytymistiede ja eläintenkoulutuskäytäntö eivät käytä tästä samaa termiä. Se suomalainen eläintenkouluttaja, joka puhuu heikenteistä, on käynyt joko Tampereen yliopiston puolen vuoden käyttäytymisanalyysikoulutuksen tai muuten ollut sen käyneiden opissa. Näin yleistäen…

Kummassakin sanassa on ongelmansa. Rankaisu kuulostaa suureelliseltä ja jälkikäteen käytetyltä, tyyliin ajoit liian lujaa ja sait sakot. Heikenne taas kuulostaa valkopesulta, ihan hei vaan heikennän käyttäytymistä, kun nyin naruriimusta tai mätkin raipalla.


Käytän itse nyt toistaiseksi termiä rankaisu, pitäen mielessä että se voi olla todella pieni, ärsyttävä asia (se kärpänen iholla) ja jotta se toimisi käyttäytymistä vähentävänä sen on tultava nopeammin kuin ne sakot postissa.

Nelikenttä 2.0

Kymmeniä vuosia sitten eläintenkoulutuspuolella (lähinnä koirankoulutus, joka on uusien koulutuskäytäntöjen edelläkävijä Suomessa) nelikenttä oli the juttu. Tunteista ei saanut puhua, koska tunteita ei pystytty tieteellisesti todistamaan. Mitataan käyttäytymistä. Lisääntyykö se vai väheneekö se vai pysyykö se ennallaan?
Tämä on oikein hyvä perusta eläinten kouluttamiselle, mutta se ei ole mitään muuta kuin tämä: perusta. Aloita sen opettelmisesta, sillä ellet tiedä, miksi vaikkapa hevonen käyttäytyy kuten se tekee, mitä se välttää tai haluaa saavuttaa, et tule onnistumaan käyttäytymisen muuttamisessakaan. Ainakaan mitenkään järkevässä ajassa.
Mutta kun olemme kouluttamassa käytännössä, täytyy sen nelikentän lisäksi olla aika monta muuta asiaa hallussa. Kuten esimerkiksi tietämys hevosen käyttäytymisestä ja fysiikasta, ympäristön vaikutuksesta (ympäristössäkin on koko ajan vahvisteita ja rankaisuja, jotka eivät aina ole ihmisen määriteltävissä) ja hevosen tunteista. Niin, niistä tunteista.

Tunteita ei vieläkään eläimillä pystytä kovinkaan hyvin mittaamaan. Eläimen käyttäytyminen kertoo toki sen tunteista. Sen, mitä tiedämme tällä hetkellä on, että todennäköisesti palkinnon saavuttaminen (positiivinen vahviste, palkinto, R+) saa aikaan ilon tunneta, paineen välttäminen (negatiivinen vahviste, R-) taas helpotuksen tunnetta. Kaksi hyvin erilaista asiaa, meillä ihmisilläkin.
Tärkeää on, että hevonen saisi kokea myös sitä iloa. Ei vain helpotusta. Olen kyllä itse miettinyt, että helpotuksen tunne voisi olla oikein oiva esimerkiksi trailerissa oloon. Se ei silti tarkoita että edelleenkään pitäisin hevosystävällisenä, että hevosta säikytellään trailerin ulkopuolella jotta se oppisi, että trailerissa saa olla rauhassa. Sitä se ei ole.

Rankaisujenkin mukana kulkee tunteita. Positiivinen rankaisu aiheuttaa ahdistusta tai pelkoa, negatiivinen rankaisu surua. (Tämä on vielä suhteellisen uutta ajatusta, lisää voi lukea esimerkiksi googlaamalla Mendl Integrative framework animal emotion and mood.)


Kun aloitin eläinten kouluttamisen opettelun, oli naksutinkoulutuspiireissä välillä vallalla (koirapuolella siis) käsitys siitä, että ruoka on ainoa vahviste ja toistomäärien kannattaa olla aivan mielettömiä. Siis kymmeniä tai satoja per kriteeri. Klikkilistalla jaettiin sumeilematta koiran nälässäpito-ohjeita, jotta voitaisiin palkita sitä koiraa ruualla, jos se ei koulutustilanteessa luontaisesti syönyt. Kyllä, oli silloinkin järkeviä tapoja olemassa, mutta tämä sellaisena blast from the past -anekdoottina.

Mikä nelikenttä 2.0? Sitä, että mielestäni (tällä hetkellä, todennäköisesti taas kymmenen vuoden päästä jotain vähän muuta) mekaanista kouluttamisopettelua tärkeämmäksi ainakin hevosten kanssa muodostuu se, että kouluttaja aidosti osaa muokata koulutusta sen hevosyksilön mukaiseksi. Se, mikä on yhdelle hevoselle hyvä vahviste, ei ole sitä välttämättä lainkaan toiselle. Se, miten paljon kouluttaja pystyy ennakoimaan ja järjestämään asiat niin, että hevonen oppii lähinnä vain niitä asioita, joita ihminen haluaa, on onnistuneen kouluttamisen pääosassa.

Tämänhetkinen kouluttajien kuuma peruna tuntuu olevan se, onko negatiivisen vahvisteen (paineen poisto) käyttö eettisesti hyväksyttävää. Ei siksi, että paineen poistamisessa olisi mitään eettisesti hankalaa vaan siksi, että jotta paineen poistuminen toimisi käyttäytymisen vahvisteena, sen paineen pitää tuntua jonkun verran epämiellyttävältä. Muuten sen poistuminen ei muuta eläimen käyttäytymistä vaan käyttäytyminen pysyy ennallaan. Ja ihminen on se, joka aiheuttaa paineen. Sen positiivisen rankaisun.


Olen lukenut väitteitä, jonka mukaan negatiivista vahvistetta edeltävä paine ei välttämättä olisi rankaisu lainkaan. Eli negatiivista vahvistetta voisi käyttää ilman, että eläin kokee sitä ennen rankaisua. Itse en tähän usko. Jos käytetään pelkkää painetta ja paineen poistoa koulutuksessa, kuten valtaosassa hevosten kouluttamista edelleen tehdään, hevosen täytyy jossain vaiheessa oppia, että jollei se tee koulutetusti, paine lisääntyy. Muuten, olettaen että paine on alussa pieni, hevonen todennäköisesti jossain vaiheessa tottuu siihen eikä sen poistuminen enää toimi vahvisteena.

Vaikka muokkaisi liikettä aivan painonsiirrosta alkaen järjestelmällisesti kohti suurempaa, monen vaatimustason noston kautta, tästä tottumisesta ei pääse mihinkään. Jossakin vaiheessa tulee todennäköisesti tilanne, jossa hevonen ei nostakaan laukkaa siitä aivan pienimmästä vihjeestä. Silloin paine todennäköisesti lisääntyy, kunnes hevonen nostaa sen laukan. Toinen vaihtoehto on lopettaa pyyntö ja viedä hevonen eläinlääkärille, mikä on toki vaihtoehto sekin, eikä usein huono. Mutta voi myös olla, että oli kuuma päivä tai paarma puri, tai hevosen huomio oli ympäristössä eikä se tuntenut sitä kevyintä vihjettä.
Eli pelkän negatiivisen vahvisteen mukana kulkee se positiivinen rankaisu, tai opittu tieto sen mahdollisuudesta eli paineen lisääntymisestä.

Jos taas, kuten hevospuolellakin yhä useammin, käytetään sekä negatiivista että positiivista vahvistetta, asia ei olekaan enää niin yksinkertainen. Itsehän, vaikka olen kouluttajana päätynyt siihen, että on eettisesti ihan ok aiheuttaa hevoselle ohimenevää epämukavuutta, käytän lähes kaikessa sekä R+ että R-. Miksi? Koska se antaa minulle mahdollisuuden ”vaihtaa” paineen lisääntymisen kunnes se on aidosti P+ siihen, että hevonen aktiivisesti tavoittelee palkintoa ja haluaa itse oivaltaa, mitä kosketus tarkoittaa. Silloin väitän, että paineen poisto ei monelle hevoselle olekaan mikään negatiivinen vahviste lainkaan eikä sen aloittaminen mikään positiivinen rankaisu, vaan paineen aloittaminen on opittu vihje ja paineen poistuminen on ehdollinen vahviste joka tarkoittaa, että palkinto on tulossa. Tai seuraava liike, joka useammin sitten vähän valmiimman hevosen kanssa on se juttu.

Lopuksi se tärkein: Katso hevosta. Mikä on sille vahviste? Mikä on sille rankaisu? Oppiiko se nopeasti? Jollei opi, miksei? Hevosella on aina vastaus. Hevonen on se, joka tietää. Me voimme vain tehdä valistuneita arvauksia ja oppia.

Mikä vahvistaa pikku orivarsan kaula kaarella kootussa käynnissä liikkumista?

Juhannustarjous Toimiva hevonen -kirjasta

Juhannuksen kunniaksi kirja alennuksessa verkkokaupassamme [linkki] 16.-30.6.2021! Normaalihinta 32,90, alennettu hinta 24,67 e sisältäen postituksen kotiin asti.

Kirja ilmestyi vuoden 2020 huhtikuussa ja sai kiittävät arvostelut ja palautteet heti. Kirjassa kerrotaan hevosen eleistä, ilmeistä ja käyttäytymisestä, pelon ja kivun tunnistamisesta, hevosen oppimisesta ja kouluttamisesta. Käytännön koulutusohjeissa löytyy vinkkejä niin yksinolon, pistämisen, lastauksen kuin rohkeammin uusiin asioihin suhtautumiseen.

Mitä tarkoittaa väärän käyttäytymisen huomiotta jättäminen?

Aina välillä tulee vastaan väite, jonka mukaan palkitsemiseen perustuva koulutus ei toimi hevosilla. Tai vaikka toimisikin, niin eihän se tositilanteessa toimi. Koska jos hevosen väärää käyttäytymistä jätetään huomiotta, se on vaarallista. Siinä tositilanteessa.

Näin toki olisikin, ja huoli olisi aiheellinen, jos tämä olisi aidosti jonkinlainen positiivisen vahvistamisen eli palkitsemisen perustuvan koulutusjärjestelmän periaate ja käytäntö. Voi toki olla, että jossain joku näin tekeekin, eli vaaratilanteessa ei tee mitään keskeyttääkseen hevosen vaarallisen käyttäytymisen, mutta aika harva aidosti kouluttamiseen perehtynyt henkilö tekee näin. Ainakin ne, jotka tunnen, käyttävät hevosillaan kyllä niissä tositilanteissa ihan varusteita, joilla se mahdollinen väärä käyttäytyminen voidaan tarvittaessa estää. Vaaratilanteen keskeyttäminen ja kouluttaminen itsessään on kuitenkin kaksi eri asiaa.

Keinotekoinen vastakkainasettelu ja olkiukot

Tämä kirjoitus sai alkunsa erinomaisesta FB-päivityksestä, jonka luin eilen. Ruotsalaislehti Göteborgsposten on tutkinut koirapäiväkotia/koirakoulua, jossa koiria paiskotaan purkeilla, niitä selätetään, niille rakennetaan houkutusratoja, jotta koiraa päästään rankaisemaan. Kritisoidut toimijat ovat kirjoittaneet vastineen, jossa omia tapoja yritetään perustella sillä, että on olemassa koulutuskunta, jossa ei koiraa pysäytetä jos se esimerkiksi puree vaan heilutetaan lihapullaa koiran edessä. Eli rakennetaan paikkansa pitämätön olkiukko, jota voidaan sitten näyttävästi polttaa. Keinotekoinen vastakkainasettelu kahden asian välillä, vaikka vaihtoehtoja on aina monia.

Samaa olen ollut havaitsevinani hevospuolella, kun palkitsemiseen perustuvat koulutusmenetelmät ovat yleistyneet. Itsehän yleensä käytän vähän kumpaakin, palkintoja ja paineen poistoa, hevosten kanssa, mutta kyllähän se palkitseminen on hevosillakin aivan oiva tapa kouluttaa. Toimii. Jopa ihan pelkästään käytettynä, jos kouluttaja osaa asiansa.

Kouluttamisen ja lopputuloksen ero

Se, mitä lähes jokainen kouluttamiseen perehtynyt ihminen tietää on, että kouluttaminen ei tapahdu niissä tositilanteissa vaan kotona. Hevoselle opetetaan kaikki sen tarvitsemat taidot asteittain, vaatimustasoa pienissä askeleissa nostaen, ja vasta kun taito on riittävän valmis sitä lähdetään järjestelmällisesti yleistämään vaativimpiin tilanteisiin. Kunnes ollaan niissä tositilanteissa ja hevosella sekä ihmisellä on molemmilla vankka arsenaali erilaisia taitoja, jonka avulla selviävät yleensä siitäkin.

Koulutuksen alussa on toki erittäin tärkeää, että ympäristön saa järjestettyä sellaiseksi, ettei kenenkään turvallisuus vaaraannu. Vaikka voi tuntua naurettavalta aloittamalla talutuskoulutus hevosen tarhassa tai karsinassa tekemällä 1000 toistoa paineeseen myötäämisestä eri suuntiin, se on kuitenkin kannattavaa. Kun tulee se tositilanne, jokainen aiempi toisto nopeuttaa hevosen oikeaa reaktiota. Oikea reaktio tulee ns. selkäytimessä eli latenssiaika lyhenee. Lisäksi paineen voimistuminen ei aiheuta hevosessa pelkoa tai jännittymistä.

Se väärän käyttäytymisen huomiotta jättäminen

Jos käytössä on vain paineen poisto käyttäytymisen vahvisteena on oltava todella tarkka, ettei paine poistu väärään aikaan. Jos käytössä on palkinto, ajoituksen on oltava aivan yhtä tarkka, jotta koulutus etenisi tehokkaasti. Jotta hevonen voi oppia nopeasti, on sen uskallettava liikkua. Jos ihminen sekä palkitsee oikeasta asiasta että rankaisee väärästä, hevonen uskaltaa vähemmän.

Kun hevosta järjestelmällisesti koulutetaan, eikä vain viedä erilaisiin tilanteisiin katsoen, miten siinä käy, alkukoulutuksen sujuvuus ei yleensä kärsi lainkaan siitä, ettei hevosen vääriin tekoihin puututa mitenkään. Kas, kun niistä ei palkitse, ne jäävät useimmiten itsestään pois. Jos paine pysyy ennallaan, kun hevonen tekee muuta ja loppuu, kun hevonen tekee oikein, hevosen käyttäytyminen muuttuu toistojen myötä kohti oikeaa. Jos hevonen ei saa ruokapalkintoa, kun se menee maapuomin ohi vaan vasta, kun se astuu sen yli, tämä lisääntyy.

Verrattuna siihen, että rangaistaan hevosta väärästä käyttäytymisestä ja kyllä, se naruriimun kiristyminen on myös rankaisu, voi olla, että tarvitaan toistoja jonkun verran enemmän, jotta hevonen varmasti osaa. Hyvät toistot opettavat hevostakin. Siitä tulee yleensä myös koko ajan turvallisempi ja toimivampi.

”Mutta se turvallisuus!” Kyllä, turvallisuus on ensisijainen asia. Eli jos hevosen ”väärä” – lainausmerkit siksi, että hevonen tuskin ymmärtää meidän ihmisten määrittelyjä ”oikea” ja ”väärä” – käyttäytyminen aiheuttaa mahdollisen vaaratilanteen, sitä voi ja pitää ilman muuta keskeyttää. Sitten ihmisen vastuulla on palata suunnittelupöydälle ja miettiä, miksi vaaratilanne syntyi ja millä tavalla toimitaan ettei vastaavaa tapahtuisi enää.

Oikeastihan kaikki koulukunnat voisivat oppia paljon toisiltaan. Ei pelkkä paine+paineen poisto ole koulutusmenetelmänä välttämättä mikään hyvinvointiongelma hevoselle. Se riippuu täysin siitä, millainen toteutus on. Ei palkitsemalla kouluttaminen ole koulutusmenetelmänä välttämättä mikään turvallisuusriski. Se riippuu täysin siitä, millainen toteutus on.

Kuvassa orivarsa oppii liikkumaan vihjeestä.