Keston lisääminen – tunteella vai tieteellä?

Tätä artikkelia varten kävin läpi hyllystäni löytyviä koirankoulutusoppaita niin suomeksi kuin englanniksikin. Etsin kirjoista hakusanaa “kesto” tai “keston lisääminen” sekä luin kappaleita, joissa puhuttiin kestoa vaativien käytösten, kuten paikallaolon tai seuraamisen, kouluttamisesta. Suurimmassa osassa kirjoista ei keston lisäämisestä ollut mitään erityistä mainintaa. Joissain kohdissa puhuttiin keston lisäämisestä ylimalkaisesti, mutta ei annettu mitään selkeää ohjetta, kuinka tämä tehdään. Täydellinen riman alitus löytyi yhdestä kirjasta, jossa todettiin, että keston lisääminen edellyttää kriteeristä tinkimistä – käytännössä siis sitä, että jos lisäät seuraamisen pituutta, joudut hyväksymään, että koira välillä pudottaa katsekontaktin. Mitä ihmettä?

 

Keston lisäämisellä tarkoitetaan sitä, että koira tekee haluttua asiaa pidempään ennen kuin se palkitaan (tai vapautetaan). Kestoa tarvitaan monenlaisiin arkielämän käytöksiin kuten myös erilaisiin koirien harrastuslajien osa-alueisiin tai työtehtäviin: katsekontaktiin, hihna löysällä kulkemiseen, yksin olemiseen, autossa odottamiseen, eteenpäin juoksemiseen (esim. pk-lajien eteenlähetys, tokon ruutu), haistelemiseen ja etsimiseen jne.

 

Milloin aletaan lisätä kestoa?

Yleensä kestoa voi alkaa lisätä, kun koira osaa käytöksen perusteet. Alkuvaiheessa kestoa lisätään käytännössä palkitsemalla koiraa koko ajan antaen vahvisteita toisensa jälkeen. Paikallaolon harjoittelussa koira pysyy halutussa asennossa, ja sitä palkitaan useita kertoja peräkkäin. Aluksi palkkiot ojennetaan melko ripeää, “normaalia” tahtia. Pian aletaan hidastaa käden liikettä niin, että yhden palkkion toimittaminen koiralle kestääkin kauemmin kuin aiemmin. Tämän jälkeen palkkioiden toimittamisen väliin aletaan jättää pieni “tyhjä” hetki ja tätä hetkeä aletaan venyttää vähitellen.

Seuraamisen alkeisopetuksessa koira palkitaan esimerkiksi jokaisesta askeleesta, tai vaihtoehtoisesti koiralle voi esimerkiksi naksuttaa tarjotusta kontaktista (esim. koira istuu perusasennossa ohjaajan vierellä) ja lähteä liikkumaan siksi aikaa, kun käsi kaivaa namia taskusta. Naksutus on lupaus palkkiosta, ja se yleensä parantaa koiran suoritusta: koira alkaa odottaa namia ja tuijottaa ohjaajaa intensiivisemmin. Tällöin liikkumisen aikana saadaan jo erinomainen katsekontakti, ja oikeaan paikkaan toimitettu palkkio viimeistelee harjoituksen.

Joissain arkielämään liittyvissä käytöksissä ohjaaja voi omalla toiminnallaan, kuten kehumisella ja koiran suullisella kannustamisella, pitää käytöstä yllä pidempään ja sitä kautta lisätä käytöksen kestoa. Tällöin kuitenkin kehumisesta tulee luultavasti käytöstä ylläpitävä ärsyke, jolloin koira ei luultavasti pysty samaan suoritukseen hiljaa olevan ohjaajan kanssa.

 

Muista ympäristön merkitys

Monesti uusiakin käytöksiä harjoitellaan paikoissa, joissa on häiriötä. Lenkkimaasto, koulutuskenttä, treenihalli tai vaikkapa oma kotikin voivat olla paikkoja, joissa häiriön määrä voi vaihdella melkoisesti esimerkiksi vuorokaudenajan, läsnä olevien henkilöiden tai jonkun muun asian suhteen. Keston harjoittelun kannalta on olennaista tunnistaa koiralle mahdolliset häiriöt ja sopeuttaa harjoituksen kriteeri näiden mukaan. Joskus häiriö voi myös olla hyödyksi: koiralle voi olla helpompaa pysyä paikallaolossa, jos ympäristössä tapahtuu asioita, joita se voi katseellaan seurata. Tyhjässä treenihallissa ei ole mitään, mihin mielenkiintonsa voisi suunnata, joten tällöin tehtäväänsä huonosti motivoitunut koira saattaa lopettaa leikin kesken.

Nyrkkisääntönä on hyvä pitää, että opetettavan käytöksen tulisi olla ainakin jossain määrin yleistetty, ennen kuin kestoa aletaan lisätä. Käytännössä tämä siis tarkoittaa, että seuraamisen tai paikallaolon alkeisharjoittelua on tehty useissa eri ympäristöissä ennen keston lisäämistä. Yleistämisen siivellä käytös on muuttunut jo vahvemmaksi, sillä sen vahvistehistoria on toistojen myötä jo vähintäänkin kohtuullinen. Tämä puolestaan tarkoittaa, että käytös kestää myös satunnaista palkitsemista, eikä sammu niin helposti.

 

Nuorallatanssia

Keston lisääminen on uhkapeliä. Lisää kestoa käytökseen saadaan ainoastaan venyttämällä palkkioiden välistä aikaa eli laskemalla vahvistetiheyttä. Jos käytös on vielä heikko ja kriteeri keston lisäämiseen liian korkea, ei tehtävä enää motivoikaan koiraa. Koira lopettaa suorituksensa kesken. Käytös alkaa sammua, koska sitä ei enää vahvistetakaan entiseen malliin. Jos käytös on jo riittävän vahva, saa vahvisteen viivyttäminen aikaan koirassa luovuttamisen sijaan halun yrittää vielä enemmän saadakseen palkkionsa.

En ymmärrä, mistä jutun alussa mainitussa koirakirjassa puhuttiin, kun siinä väitettiin, että keston lisääminen yleensä tarkoittaa myös käytöksen laadun heikkenemistä! Tämähän tarkoittaisi, että esimerkiksi koko seuraaminen olisi jatkossa mitä sattuu, jos kerran jo keston lisäämisvaiheessa koiran annetaan vilkuilla sinne tänne... Jos koiran kontakti seuratessa putoaa, tarkoittaa se juurikin mainitsemaani sammumista – koira lopettaa leikin kesken. Tällöin vika on ohjaajan eikä koiran: ohjaaja on yrittänyt lisätä kestoa liikaa tai yrittänyt ylipäätään lisätä kestoa vielä heikkoon käytökseen.

Toki on olemassa tilanteita, joissa virheet on vain hyväksyttävä osaksi harjoitusta. Tällaisia hetkiä voivat olla esimerkiksi kisamaisen suorittamisen harjoitukset, joissa tehdään esimerkiksi kokonainen rally-toko-rata tai vaikkapa kaikki tokon alokasluokan liikkeet peräjälkeen ilman palkkiota. Vaikka liikkeitä olisi harjoiteltu erikseen ja esimerkiksi 2–4 liikkeen sarjoina, voi kisamaisessa treenissä silti tulla virheitä. Tällöin virheet jätetään huomioimatta ja jatketaan suorittamista – aivan kuten kisoissakin tehtäisiin! Osa kisamaista harjoittelua on myös oppia elämään virheiden kanssa, vaikkei se toki toivottavaa olisikaan. Paras treeni on tietysti sellainen, jossa kaikki menee täysin nappiin!

 

Vahvisteaikataulut

Keston lisääminen sujuu yleensä kätevimmin jonkinlaisen vahvisteaikataulun avulla. Suurin osa koiria kouluttavista ihmisistä toimii luultavasti ns. mutulla eli “musta tuntuu” -menetelmän avulla. Tämän toiminnan ongelma on, että me ihmiset olemme yleensä taipuvaisia rytmeihin. Kuvittelemme vahvistavamme vaihtelevasti, epäsäännöllisesti, kun tosiasiassa palkitsemmekin koiran joka neljäs askel tai aina kuuden sekunnin jälkeen... Koirat puolestaan oppivat tämän nopeasti, eivätkä vähän ajan jälkeen maltakaan edes yrittää pidempään kuin tähän jo tavaksi muodostuneeseen hetkeen saakka!

Epäsäännöllistä palkitsemista pidetään yleisesti tehokkaimpana tapana ylläpitää käytöksiä, koska vahvisteen saamisen ajankohtaan liittyvä epävarmuus pitää koiran aktiivisena ja yritteliäänä. Tämä siis, jos käytös on riittävän vahva ennen kuin tähän menetelmään siirrytään! Alkeisopetus tehdään aina jatkuvalla vahvistamisella (jokainen oikea toiminto palkitaan).

Kestoa voi lisätä myös kiinteällä vahvisteaikataululla niin, että koira palkitaan esimerkiksi joka neljäs tai viides askel tai sekunti. Tämän avulla keston kasvattaminen on yleensä helppoa, mutta riskinä voi olla, että palkitsemisen jälkeen seuraavat toistot ovat heikompia, sillä koira tietää, että uutta vahvistetta ei ole vähään aikaan tulossa.

Vaihtelevien vahvisteaikataulujen perusidea on, että kestoa kasvatetaan vähitellen ja koko ajan, mutta kuitenkin välillä koiraa palkitaan myös hyvin lyhyistäkin suorituksista. Näiden helppojen onnistumisten avulla koira jaksaa motivoitua paremmin myös pidempikestoisiin suorituksiin.

 

Vahvisteaikatauluista puhuttaessa nousee yleensä aina esille Morgan Spectorin legendaarinen Clicker Training for Obedience -kirja. Käytännössä tämä kirja lieneekin ainoa, jossa aiheesta on kattavasti tietoa. Tästä syystä itsekin lainaan tähän artikkeliin Spectorin periaatteita. Jojo-efektiksi kuvaamansa vaihteluväli on Spectorin mukaan periaatteessa plusmiinus 50 prosenttia suhteessa keskiarvoon. Käytännön esimerkkinä hän käyttää paikallaoloa, jonka koira osaa suorittaa hyvin viiden sekunnin ajan. Viisi sekuntia on nyt siis laskelman keskiarvo. 50 prosentin lisääminen tai vähentäminen antaa meille palkitsemisen väleiksi kaksi ja seitsemän sekuntia. Sitä, missä järjestyksessä ja millä tavalla näitä lukuja hyödynnetään, ei ole kerrottuna kirjassa. Spector kuitenkin mainitsee, että hän palkitsisi matalinta ja korkeinta sekuntimäärää molempia vähintään kolmesti ja välillä myös yllätyksellisesti heti yhden sekunnin jälkeen. Tämän pohjalta voisin siis muodostaa esimerkiksi tällaisen aikataulun:

2, 5, 1, 6, 2, 7, 3, 4, 7, 5, 3, 1, 2, 7, 6, 4.

 

Seuraavaksi Spector siirtyisi aikatauluun, jonka keskiarvo on seitsemän sekuntia, eli vaihteluväli olisi kolmen ja 10 sekunnin välillä.

Vahvisteaikatauluja voi myös käyttää sellaisissakin tehtävissä, jotka eivät itsessään vaadi kestoa. Tällöin voidaan vaihdella yksittäisen (valmiin) käytöksen palkitsemista aikataulun mukaisesti ja sen avulla esimerkiksi rakentaa kisakestävyyttä. Tässä tulee kuitenkin olla huolellinen, ettei käytöksen laatu muutu matkan varrella!

 

Spectorin periaatteet

Morgan Spector alleviivaa joitakin asioita vahvisteaikataulujen käyttöön liittyen. Yksi näistä on juurikin jo aiemmin mainittu “iloinen yllätys”, eli vahviste tulee jo hyvinkin lyhyen suorituksen jälkeen. Tämän yllätyksen tarkoitus on muistuttaa koiralle, että treeni ei pelkästään vaikeudu koko ajan, vaan joskus palkkion saakin yllättävän helposti! Lisäksi Spector suosittelee päättämään harjoituksen jonkin lyhyemmän toiston jälkeen, jotta koira on varmasti onnistunut ja hyvällä tuulella treenin lopuksi.

Jos koira tekee virheen vahvisteaikataulua noudatettaessa, on hyvä hieman analysoida tilannetta. Jos virheen syy löytyy esimerkiksi koiran väsymisestä, vatsan täyttymisestä, yllättävästä häiriöstä kesken harjoituksen tai muusta vastaavasta, voi seuraavan kerran aloittaa harjoittelun samaa aikataulua noudattamalla. Jos taas mitään erityisempää syytä virheelle ei ole havaittavissa, voi olla hyvä ajatus palata reilusti taaksepäin ja vahvistaa käytöstä hetken jokaisen toiston tai esim. jokaisen askeleen jälkeen. Spector itse neuvoo paikallaolon harjoittelussa tapahtuvasta virheestä näin: “Seuraavalla toistolla vähennä etäisyyttäsi koiraan puolella ja tee lyhyempi toisto. Itse yleensä juurikin puolitan välimatkan, käännyn koiraan päin, lasken mielessäni sanoen “one banana” ja palaan koiran luo palkiten sen. Tämän jälkeen voit palata alkuperäiseen aikatauluun.”

Nyrkkisääntönä Spector sanoo, että yhden aikataulun läpiharjoitteluun menee keskimäärin noin viikko.

 

Tarvitaanko naksutinta?

Naksutin on täsmätyökalu, jota käytetään esimerkiksi uutta käytöstä opetettaessa tai vanhaa paranneltaessa. Tämän ajattelun valossa keston lisääminen ei ole tilanne, jossa ehdollista vahvistetta välttämättä tarvittaisiin. Siitä voi joissain tilanteissa olla jopa haittaa.

Useimmat koirat on opetettu, tai koirat ovat oppineet, että naksutus päättää harjoituksen. Ne keskeyttävät toimintansa naksutuksen kuullessaan ja usein myös palaavat ohjaajansa luokse. Esimerkiksi paikallaolon harjoittelussa tällainen olisi hyvinkin ei-toivottua! Paras tulos harjoituksessa saadaan, kun palkkio toimitetaan koiralle vielä silloin, kun koira suorittaa sitä tehtäväänsä, mihin se on jätettykin (esim. makaa paikallaan). Paikallaolossa naksutinta parempi ehdollinen vahviste voisi olla kehuminen. Luultavasti koira myös oppii nopeasti, että ohjaajan paikalle saapuminen toimii ehdollisena vahvisteena, koska se ennakoi tulevaa palkkiota.

Keston lisäämisessä voidaan myös toimia niin, että toimintaa ei keskeytetä palkitsemisen ajaksi. Esimerkiksi paikallaolossa koira makaa paikallaan vaikkapa useamman minuutin ajan, mutta ohjaaja tai apuohjaaja käy sen luona palkitsemassa sen jonkin vahvisteaikataulun mukaisesti.

Seuraamisessa tilanne on hieman toinen. Koira saattaa muuttaa asentoaan ohjaajan alkaessa hapuilla taskustaan palkkiota, mikä johtaa helposti väärän asian palkitsemiseen. Tällöin olisikin hyvä käyttää naksutinta merkitsemään vielä täydellinen suoritus ja tämän jälkeen alkaa kaivella palkkiota – optimi toki olisi, että koira olisi myös palkitsemisen hetkellä oikeassa paikassa ja tekemässä oikeaa asiaa.

 

 

Seuraaminen vaihtelevalla vahvisteaikataululla

Morgan Spector käyttää kirjassaan Clicker Training for Obedience vahvisteaikatauluja, joissa vaihteluväli on 50 prosenttia keskiarvon ylä- ja alapuolella. Kuitenkin hän kertoo, että tämä periaate vaikuttaa olevan useimmille koirille liian vaikea sen jälkeen, kun on päästy yli 10 askeleen. Tämän vuoksi hän käyttää välivaiheita niin, että keskiarvot askeleiden määrissä ovat alkuun 5, 7, 10, 12 ja 15 askelta. Tämän jälkeen keskiarvot nousevat aina viidellä askeleella kerrallaan.

Esim.

Taso 1 (ka. 5 askelta): 5, 2, 6, 3, 7, 3, 5, 1, 7, 4, 3, 5, 1 (yht. 52 askelta)

Taso 3 (ka. 10 askelta): 10, 5, 8, 4, 12, 6, 10, 3, 7, 10, 5, 12, 1, 10, 3 (yht. 106 askelta)