Virheetön oppiminen vaatii suunnittelua

Teksti: Liisa Tikka

Virheetön oppiminen ei ole Suomessa erityisen käytetty termi. Menetelmänä se on ehkä tutumpi: pyrkimys siihen, että eläin onnistuu sataprosenttisesti harjoituksissa. Englanniksi aiheesta on mukavia sanontoja: ”Set your dog for success!” ja ”Clear the path to the reinforcement.” Vapaasti suomennettuna: ”Mahdollista koirasi menestys!” ja ”Raivaa polku palkkiolle.”

Jokainen, joka on joskus leikkinyt koiraa sheippaustreeneissä, tietää, miltä turhautuminen tuntuu: kun ei ymmärrä yhtään, mitä pitäisi tehdä, tai yrittää aktiivisesti ja luulee tietävänsä oikean käytöksen, mutta huomaakin sen vääräksi.

 

Alussa oli kyyhkynen

 

Virheetöntä oppimista tutkittiin jo 1960-luvulla. Herbert Terrace opetti kyyhkysille värierottelua. Kokeilun tarkoituksena oli löytää keino vähentää operanttia oppimista häiritsevää tunneoppimista, joka seurasi virheen aiheuttamasta turhautumisesta. Terrace jakoi linnut kahteen ryhmään. Toisen ryhmän linnuille järjestettiin oppimisympäristö, joka mahdollisti oikean käytöksen tarjoamisen heti alusta alkaen. Toisen ryhmän kyyhkyjen annettiin oppia yrityksen ja erehdyksen kautta. Virheettömän oppimisen ryhmän linnut tekivät keskimäärin 25 väärää toistoa koko harjoittelun aikana. Toisen ryhmän eläimet tarjosivat väärää käytöstä 2000–5000 kertaa!

 

Virheettömän oppimisen hyödyt ovat vääjäämättömät sekä ihmisillä että eläimillä. Vähäinen virheiden määrä johtaa luonnollisesti siihen, että harjoitukseen käytetty aika on oikean taidon kehittämistä ja oppimista, ei väärän käytöksen toistamista. Tämä myös johtaa siihen, että oppiminen on nopeaa. Oppija – tai opettaja! - ei myöskään tunne juurikaan stressiä, turhautumista tai aggressiota. Sen sijaan koulutettava eläin saa runsaasti palkkioita lyhyessä ajassa, mikä varmasti lisää sen halua harjoitella jatkossakin. Kun rankaisua ei tarvitse käyttää, ei eläin voi yhdistää ikävää asiaa koulutettavaan käytökseen, tilanteeseen tai kouluttajaan. Näin ei-toivottua tunne-ehdollistumista ei synny.

 

Mitä enemmän eläin onnistuu ja kokee menestystä, sitä enemmän sen itseluottamus kasvaa. Sitkeys ja peräänantamattomuus ovat toivottuja ominaisuuksia sekä koulutettavassa että kouluttajassa, mutta molemmilla osapuolilla näiden kehittyminen vaatii juurikin itseluottamusta ja aiempia onnistumisia. Käänteisesti on nähtävissä, että koira, jonka virheet merkataan esimerkiksi kiellolla, ei enää pian halua edes yrittää koko tehtävää. Sen into oppia sammuu, koska se pelkää virheiden tekemistä ja sen itseluottamus heikkenee. Tällainen koira myös yleensä tarvitsee paljon ohjaajan apua toiminnassaan.

 

 

Virheetön oppimisympäristö

 

Se, miten virheettömään oppimiseen pääsee, riippuu paljolti koulutettavasta koirasta, käytöksestä ja myös kouluttajasta. Muistan taannoisen keskusteluni erään tuttuni kanssa. Hän on mielestäni häikäisevän hyvä kouluttaja ja menestynyt myös lajiharrastuksessa todella korkealla kansainvälisellä tasolla. Hän kysyi minulta, miten olen erään käytöksen kouluttanut. ”Kosketuskepillä”, vastasin. Hän puisteli päätään ja sanoi, että hänestä kosketuskepin tai muiden kohteiden käyttö on vaikeaa. Kysyin häneltä sitten vastakysymyksenä, miten hän on itse tämän saman käytöksen kouluttanut. ”Sheippaamalla”, vastasi hän. Puistelin päätäni. Sheippaaminen vasta vaikeaa onkin!

 

Alkuvaiheen koulutusta tehdessä kannattaa usein rajoittaa ympäristöä ja mahdollistaa oikean käytöksen oppiminen. Keinoja tähän ovat esimerkiksi

- houkuttelu,

- kohteet (esim. kosketuskeppi, tassukohde),

- fyysinen rajaaminen (esim. pentuaitauksen käyttäminen, erilaiset seinät, aidanpätkät jne.),

- korokkeet sekä

- ohjaajan tuottamat avut (fyysiset eleet, suulliset kommentit).

 

Näitä voidaan käyttää useitakin samanaikaisesti, jotta haluttu käytös saadaan aikaan ja vahvistumaan. Kuitenkin apuvälineistä tulee päästä melko nopeasti eroon, sillä muuten ne muuttuvat vihjeeksi käytöksestä. Tällöin eläin ei enää tarjoa kyseistä käytöstä ilman näiden välineiden läsnäoloa.

 

Yhtenä virheiden minimoimisen keinona voidaan myös käyttää huolellista palkkion suunnan hyödyntämistä. Jotta koira saadaan esimerkiksi oikeaan asentoon uutta toistoa varten, on hyvä palkita se tavalla, joka edesauttaa tätä. Näin turha liikkuminen jää pois, ja virheiden määrä vähenee jo senkin myötä.

 

Virheistä oppiminen

 

Eläimet ja ihmiset oppivat myös virheistään. Kun koira harjoituksessa ei kuule naksutusta toimintansa seurauksena, sen tulisi päätyä tarjoamaan jotain muuta käytöstä – tai suorittaa sama käytös nopeammin, tehokkaammin ja paremmin. Pieni turhautuminen yleensä parantaa suoritusta: eläin ”käärii hihat” ja keskittyy seuraavan kerran ehkä hieman paremmin, yrittää enemmän. Virheen pitäisi innostaa koiraa löytämään oikea ratkaisu arvoitukseen!

 

Virheistä voi myös oppia niin, että väärää käytöstä ei tule toistaneeksi enää ollenkaan. Usein tällaisiin virheisiin liittyy koiran kokema säikähdys tai muu epämiellyttävä tunnetila, jolloin kyseessä on itse asiassa positiivinen rankaisu. Yksi omassa työssäni tyypillinen esimerkki tästä on se, että ihminen ohjaa koiransa liian lähelle rally-tokon kylttitelinettä tai kartiota. Koira törmää esineeseen ja säikähtää. Tämän jälkeen se ei enää mene liian lähelle kyseisiä esineitä – ei mene yleensä enää lainkaan lähelle. Koira saattaa kerrasta oppia, että esimerkiksi tietty liike, vaikkapa ohjaajan eteen istumaan tuleminen, on vaarallinen, jos lähettyvillä on kylttitelineitä.

 

Eläin ei tee virheitä

 

Onko ylipäätään oikein puhua siitä, että eläin tekee virheen? Eläimet toimivat aiempien kokemustensa pohjalta. Kaikki käytökset ovat jossain tilanteessa hyödyllisiä ja tarpeellisia. Monia niistä ohjaaja on itse vahvistanut lukemattomia kertoja. Meidän ihmisten tehtävä on saada eläin tarjoamaan ja tekemään niitä tehtäviä, jotka ovat meille sillä kertaa tarpeellisia.

 

Pelkkä virheestä huomauttaminen kiellolla tai ehdollistetulla ei palkkiota -signaalilla (No Reward Marker, NRM) turhauttaa eläintä. Näen itseni sieluni silmin jälleen jonkun koiraleirin sheippausleikissä. Olen yrittänyt lukuisia kertoja ymmärtää, mitä kouluttaja haluaa, enkä ole siinä onnistunut. Tarjoan sitkeästi käytöstä, joka tuotti viimeisen saamani vahvisteen. Kouluttaja sanoo: ”Ei se ole toi käytös.” Päädyn huutamaan: ”No kai mä sen nyt tiedän! Hemmetti en keksi enää mitään muutakaan!” NRM:n ei pitäisi tuoda koulutukseen mitään, mitä pelkkä naksauksen puuttuminen ei toisi.

 

Entäpä jäähy? Time out? Tauko? Time-out on urheilussa käytetty konsepti, jossa esimerkiksi peli keskeytetään siksi aikaa, että joukkue voi pitää keskinäisen neuvottelun ja vaikkapa muuttaa pelistrategiaansa paremman lopputuloksen takaamiseksi. Se on aivan eri asia kuin esimerkiksi jäähy, joka on seurausta sääntöjen rikkomisesta – eli rankaisu. Koulutustuokion keskeyttäminen tilanteen uudelleen arvioimiseksi voi olla järkevää. Tällöin voi esimerkiksi paneutua hetkeksi miettimään koulutussuunnitelmaa: olenko toiminut sen mukaisesti ja jos olen, pitääkö suunnitelmaa sittenkin muuttaa. Pelkkä harjoittelun keskeyttäminen voi kuitenkin olla eläimen mielestä ikävää ja toimia siten rankaisuna.

 

Koiran eristäminen rankaisuna on harvoin toimiva ratkaisu rankaisun ajoituksen hankaluuden vuoksi. Rangaistavan käytöksen ja esim. toiseen huoneeseen sulkemisen välillä tapahtuu niin monta asiaa, ettei rankaisu luultavasti kohdistu haluttuun käytökseen. Ylipäätään tällaisen pidemmän eristämisen tai huomiotta jättämisen käyttö ei ole millään tavalla perusteltua tai hyödyllistä. Huomiotta jättämistä voi halutessaan käyttää itse koulutustilanteessa vaikkapa vain kääntäen itsensä pois eläimestä muutamaksi sekunniksi. On kuitenkin syytä muistaa, että lähes kaikki kouluttaessa tapahtuvat virheet johtuvat ohjaajasta. Tämän vuoksi kannattaa miettiä, miksi eläintä pitäisi rankaista ihmisen virheistä.

 

Joskus tauko voi myös olla tarpeen ohjaajan mielentilan tasoittamiseksi. Tuttu lause ”älä ota eläimen käytöstä henkilökohtaisesti” on joskus helpommin sanottu kuin tehty. Olipa syy keskeytykselle mikä tahansa, on hyvä havainnoida kriittisesti, kuinka usein tarvetta tällaiselle tulee. Jos ylimääräisiä taukoja joutuu ottamaan jatkuvasti, lienee syytä miettiä, missä on vika.

 

LRS eli vähiten palkitseva tapahtumaketju

 

Jo vuosikymmeniä sitten suurien merinisäkkäiden kanssa työskennellessä Sea World kehitti konseptin, jonka avulla pyrittiin estämään mahdollisesti vaarallisten eläinten turhautuminen koulutuksessa. Menetelmän tarkoituksena oli antaa eläimelle mahdollisuus saada palkkio, vaikka varsinainen toisto olisikin mennyt pieleen. Käytännössä eläin tarjoaa virheen jälkeen jotain tuttua ja rauhallista käytöstä, ja se palkitaan siitä. Tämän jälkeen palataan taas harjoittelemaan alkuperäistä käytöstä. Kouluttajan käytös pysyy koko ajan samana: jos kouluttaja katsoi eläintä sen tehdessä virheen, jatkaa hän eläimen katsomista myös sen jälkeen. Ympäristössä ei pitäisi tapahtua muutosta prosessin aikana.

 

Käytös, jota eläin tarjoaa, voi vaihdella eläimen ja myös harjoiteltavan asian mukaan. Englanniksi siitä käytetään termiä CAB eli Calm Attentative Behavior, rauhallinen ja keskittynyt käytös. Se voisi olla esimerkiksi koiran kohdalla se, että koira pysähtyy ja katsoo ohjaajaansa.

 

Kaavio:

Vihje – väärä käytös (virhe) – muutaman sekunnin tauko – tauko toimii vihjeenä eläimelle tarjota uutta käytöstä – eläin tarjoaa uuden käytöksen – palkitseminen, uusi vihje tai em. vihjeen toistaminen

 

LRS eli Least Reinforcing Scenario (vähiten palkitseva skenaario/tapahtumaketju) mahdollistaa harjoittelun jatkumisen keskeytyksettömästi, vaikkakin treenaamisen rytmi saattaa hieman häiriintyä. Eläin pysyy kuitenkin keskittyneenä työskentelyyn, ja sen kokemus positiivisesta vahvistamisesta lisääntyy.

 

Jos eläin toistaa väärän käytöksen, on syytä pysähtyä analysoimaan, miksi näin käy. Virhe on ohjaajan vastuulla. Esimerkiksi vihjesanaa ei kannata toistaa, jos eläin ei ensimmäisellä kerralla tehnyt käytöstä. Sen sijaan tulisi miettiä, miksi näin kävi. Jos syy on selvillä, voidaan vihje toistaa, mikäli tilanteen aiheuttanut häiriö tms. on nyt poissa. Tällainen tilanne voisi olla esimerkiksi se, että harjoitustilaan tulee samalla hetkellä toinen koirakko, kun ohjaaja sanoo vihjeen. Koira kääntyy katsomaan uutta koiraa eikä huomioi vihjettä.

 

LRS toimii vain tilanteissa, joissa koulutuksessa on tietynlainen rytmi. Jos käytöksessä on jo kestoa, ei menetelmää voi hyödyntää. Vastaavasti metodi ei ole mahdollinen, jos koiran ja ohjaajan välillä on pitkä etäisyys.

 

Muita vaihtoehtoja

 

Uudelleenohjaamisesta puhutaan silloin, kun ohjaaja pyytää koiralta jotain vaihtoehtoista käytöstä sen sijaan, että koira tarjoaisi sitä itse (LRS:ssä olennaista on nimenomaan se, että eläin tarjoaa itse virheen jälkeen rauhallista käytöstä). Esimerkiksi käsikosketus on käytös, jolla on helppo ”nollata” virhe ja antaa eläimelle mahdollisuus saavuttaa palkkio. Tällainen sekä estää eläintä turhautumasta että antaa ohjaajalle pienen hetken aikaa miettiä seuraavaa siirtoaan.

 

Oletuskäytökseksi sanotaan toimintaa, jossa koira poimii ympäristön vihjeistä ja oppimishistoriaansa nojautuen tarjoamansa käytöksen. Näitä käytöksiä voi olla useita tilanteesta riippuen. Katsekontaktin tarjoaminen istumisella tai ilman on esimerkiksi yksi yleinen oletuskäytös. Oletuskäytös voi olla myös vaikkapa perusasentoon hakeutuminen tai maahanmeno. Koira tarjoaa usein tällaisia oletuskäytöksiä silloin, kun se ei saa palkkiota virheen vuoksi tai ei muuten ymmärrä, mitä siltä halutaan. Oletuskäytös voi ilmetä myös, jos harjoittelussa on jotain muuta ongelmaa, kuten jos koulutustuokio on liian pitkä.

 

Joskus koirat myös kehittävät omia tapojaan reagoida virheisiin. Yhdellä omista koiristani on jo pentuiällä muodostunut hyvin vahva pedillemeno-käytös. Sillä on oma taukopeittonsa treeni- ja kisapaikoilla, ja se hakeutuu pedille niin suurella vimmalla, etten tahdo ehtiä heittää peittoa edes maahan ennen kuin se on sen päällä. Tämä koira on myös aina ollut vähän ns. hitaasti lämpenevä, eli se suhtautuu uusiin asioihin hieman varautuneesti. Kun aloin opettaa sille hyppyesteitä ja putkea tokoa ja rally-tokoa varten, se koki harjoittelun jotenkin painostavana ja äänesti jaloillaan. Heti, jos se alkoi turhautua tai jännittyä, se meni pedilleen makaamaan. Tuntui, kuin se olisi sanonut: ”Tulet sitten hakemaan mut, kun tiedät oikeasti, miten tuo kannattaa tehdä.”