Palkkio, vahviste, rangaistus, heikenne

Teksti: Liisa Tikka

Mistä eläin pitää, ja mitä se haluaa välttää?

Koiraharrastajien keskustelut ovat usein kimurantteja jo senkin takia, että yhteistä kieltä eri harrastajien välillä ei ole. Termistöä käytetään melko villisti ja soveltaen, mikä helposti johtaa siihen, että toinen puhuu aidasta ja toinen seipäästä. Vielä hankalammaksi tilanteet tekee se, että meillä ihmisillä on oletuksemme siitä, mistä koira pitää ja mistä ei. Joskus nämä oletukset ovat aivan vääriä. Tai oletus on tavallaan oikea, sillä eläin pitää tietyssä tilanteessa tästä asiasta, mutta toisessa oletettu palkkio muuttuukin yhdentekeväksi. Monimutkaista, eikö olekin?

 

Käytöksen seuraukset ohjaavat koiran käytöstä. Vahvisteet lisäävät käytöksen todennäköisyyttä, rankaisut vähentävät eli heikentävät sitä.

 

Operantti neliö

 

R+ eli positiivinen vahvistaminen

Kun eläin saa jotain, mistä se pitää, muuttuu tätä mukavaa asiaa edeltävä käytös entistä todennäköisemmäksi. Jos istumista seuraa makkara, alkaa koira istua yhä useammin makkaran toivossa. Mikäli siis makkara on jotain, mitä koira tavoittelee.

 

P- eli negatiivinen rankaisu

Negatiivisessa rankaisussa eläin menettää mahdollisuuden johonkin mieluisaan asiaan käytöksensä seurauksena. Esimerkiksi ihmistä tervehtiessään koira nousee takatassuilleen henkilöä vasten, jolloin tämä ihminen kääntyy pois koirasta. Tällöin hyppäämisen seurauksena koira menetti mahdollisuuden vuorovaikutukseen ihmisen kanssa.

 

R- eli negatiivinen vahvistaminen

Koiran ympäristössä on jotain, minkä se kokee epämiellyttävänä. Koiran reaktion seurauksena tämä epämiellyttävä asia poistuu. Esimerkiksi omistaja haluaa leikata koiran kynnet ja lähestyy koiraa kynsisakset kädessään. Koira pakenee sängyn alle, jonne omistaja ei yllä. Pakenemisen seurauksena kynsienleikkuuta ei tapahdu.

 

P+ eli positiivinen rankaisu

Positiivinen rankaisu tarkoittaa, että koiran käytöksen seurauksena se kokee jotakin epämiellyttävää. Koira voi vaikkapa yrittää ottaa toiselta koiralta luun, minkä seurauksena tulee tappelu, jonka tämä luuta tavoitellut koira häviää. Uhkarohkea käytös on johtanut ikäviin seurauksiin.

 

 

R on lyhenne englannin sanasta reinforcement eli vahvistaminen, P taas sanasta punishment eli rankaisu. Positiivinen ei tarkoita tässä yhteydessä miellyttävää, vaan matemaattista lisäämistä. Negatiivinen tarkoittaa vastaavasti vähentämistä, poistamista. Vaikka koulutuksellisesti ajattelemme yleensä meidän ihmisten toimia koiraan kohdistuen, ovat vahvisteet ja rankaisut läsnä koiran elämässä jo pelkästään ympäristön kautta. Myös kaikki villieläimet oppivat operantin oppimisen kautta, vaikka ihmistä ei olisi mailla halmeillakaan.

 

Teoriassa tämä neliö on melko selkeä. Vahvisteet ja rankaisut esiintyvät pareina, koska vahvisteen tai rankaisun täytyy olla olemassa, jotta sen voi lisätä tai poistaa. Tämä tarkoittaa, että pelkästään sen ilmestyminen vaikuttaa itsessään jo koiran käytökseen. Esimerkki: koira ei kävele lenkillä, vaan pysähtelee ja jää istumaan. Omistaja ottaa koiran istahtaessa namin esille ja alkaa houkutella koiraa. Kun koira lähtee liikkeelle namin nähdessään, se palkitaan liikkumisesta. Vahvisteen antaminen tapahtuu ihan oikein: namin saamista edeltää liikkuminen, joten liikkumisen pitäisi siis vahvistua. Ongelmana on kuitenkin se, että vahviste itse asiassa ilmestyy esille jo ei-toivotun käytöksen esiintyessä, eli nami otetaan näkyville silloin, kun koira istuu. Käytännössä myös tämä hetki vahvistuu, joten tässä ollaankin saamassa aikaan käytösketjua: koira istuu, jotta se voi lähteä liikkeelle saadakseen palkkion.


 

Perustarpeet, ja vähän muutkin

Kun mietitään, mitä koira haluaa ja mitä se pyrkii välttämään, päästään nopeasti perustarpeiden äärelle. Nykyaikaisessa palkitsemiseen perustuvassa koulutuksessa pidetään epäeettisenä menettelytapaa, että koiraa ”kiristetään” perustarpeilla. Käytännössä tämä tarkoittaa, että koiralle ei esimerkiksi anneta ruokaa useampaan päivään, jotta se on motivoituneempi ottamaan ruokapalkkioita vastaan. Koira, joka työskentelee saadakseen ruokaa henkensä pitimiksi, ei välttämättä koe ruokaa positiivisena vahvisteena. Ruokapalkkio voikin toimia negatiivisena vahvisteena, eli ikävä tunne, nälkä, vähenee vahvisteen saamisen myötä. Vaikka kouluttamisen prosessi olisi molemmissa tapauksissa samanlainen, on koiran oppimistilanteeseen liittämä tunnetila hyvinkin erilainen.

Yhtenä perustarpeiden riistämisen muotona voidaan myös pitää ns. jääkautta, jossa koiralta viedään mahdollisuus vuorovaikutukseen perheen ihmisten kanssa.

Fysiologisia perustarpeita ovat hengissä säilymisen fyysiset edellytykset, kuten ruoka ja juoma. Lisäksi perustarpeiksi voidaan ajatella tarve suojautua vaaroilta ja tuntea turvallisuutta sekä tarve yhteenkuuluvuuteen ja sosiaaliseen kanssakäymiseen. Sosiaalista kanssakäymistä käytetään ruuan lisäksi palkkiona: koirien yhteydessä puhutaan edelleen ”miellyttämisenhalusta”, jolla kuvataan yksilön halua tehdä jokseenkin pyyteettömästi yhteistyötä omistajansa kanssa. Miellyttämisenhalu on jossain määrin rotuun liittyvä ominaisuus: koirarodut, jotka on kehitetty toimimaan tiiviissä yhteistyössä ohjaajan kanssa, koetaan miellyttämisenhaluisempina kuin rodut, joiden käyttötarkoitus on itsenäinen toiminta. Luonnollisesti myös yksilöissä on suurta vaihtelua rotujen sisälläkin. Harrastusmaailmassa niin sanottua sosiaalista palkkaa opetetaan ja rakennetaan koulutuksen avulla, jolloin se ei ole niinkään sisäsyntyinen ominaisuus, vaan opittu käytösketju.

Näiden lisäksi koiralla on myös tarve toteuttaa niin sanottuja luontaisia käyttäytymispiirteitään, kuten tarve erilaisiin metsästykseen liittyviin käytöksiin, tarkkailuun ja vartiointiin, lisääntymiseen yms. Näistä etenkin ensin mainittuja on helppo hyödyntää palkkioina, koska jo pelkästään vaikkapa pallon tai frisbeen perässä juokseminen on koiralle metsästyskäyttäytymistä. Leikissä usein yhdistyvät sekä lajityypillinen käytös että myös yhteistyö ja sosiaalinen kanssakäyminen ohjaajan kanssa. Koiran leikki eri laumanjäsenten kanssa on usein erilaista ja vastaa luultavasti erilaisiin tarpeisiin. Vinkki, että esim. koirien keskinäistä leikkiä rajoitettaisiin voimakkaasti, jotta koira leikkisi paremmin ohjaajansa kanssa yhdessä, voi johtaa hyvinvointiongelmiin.


 

Pavlov, väsymätön seuralainen

Vaikka kouluttaessa ajattelemme useimmiten operanttia neliötä, emme voi unohtaa klassisen ehdollistumisen osuutta. Kuten sanotaan, Pavlov istuu aina olkapäälläsi. Klassinen ja operantti ehdollistuminen ovat molemmat aina läsnä. Siinä, missä operantin ehdollistumisen isä B. F. Skinner on melko mukava matkakumppani, saattaa venäläisprofessori Ivan Pavlov tuntua usein varsinaiselta kiusankappaleelta.

Pavlovin erikoisalaa ovat voimakkaat tunnereaktiot: Se, että koira oppii nopeasti tunnistamaan uimalaan tai agilityhallille vievän tien ja alkaa kiljua autossa. Se, että koira muistaa edelliskerran lämmönmittausepisodin eläinlääkärillä ja kieltäytyy liikkumasta vastaanoton oven suuntaan. Se, että koira innostuu kaikista punatakkisista naisista, jotka se näkee lenkillä, koska äidilläsi on punainen ulkoilutakki. Tunne voi olla valtaisaa iloa ja riemua tai suurta pelkoa ja ahdistusta. Tällaisen tunnetilan ottaessa vallan on koiraa hyvin vaikea kouluttaa. Se ei juurikaan ota vastaan informaatiota, vaan tuntuu vajonneen täysin omiin fiiliksiinsä. Tällöin tuskin mikään tarjottu palkkiokaan toimii.

Voimakkaissa tunnereaktioissa paras palkkio on yleensä toiminnallinen, eli koiran päästäminen uimaan, lupa tervehtiä lähestyvää henkilöä jne. toimii huomattavasti paremmin tilanteeseen täysin liittymättömän lelu- tai namipalkkion sijaan. Tällöin käytössä on ns. Premackin periaate: vahvan käytöksen suorittaminen vahvistaa sitä edeltävää heikkoa käytöstä. “Jos istahdat hetkeksi, pääset juoksemaan koiranpuiston portista sisään.”


 

Mikä on mikäkin?

Teoriassa on helppoa määritellä, miten vahvisteet ja rankaisut eroavat toisistaan. Toinen on porkkana ja toinen keppi. Toinen on makkara ja toinen räminäpurkki. Mutta miten sitten käytännössä, onko se ihan niin yksinkertaista?

Itse koen, että on hankalaa määritellä, mikä asia on milloinkin koiran mielestä parempi palkkio kuin toinen. Jos esimerkiksi jokin tekeminen on koiran mielestä erityisen hauskaa, ylittää se helposti tarjolla olevan omistajalta tulevan palkkion (kuten makupalan). Yksi esimerkki tällaisesta on vapaana oleminen. Koira juoksentelee koirakaveriensa kanssa vaikkapa koirapuistossa, kunnes tulee aika lähteä kotiin. Omistaja joutuu kutsumaan koiraansa useita kertoja. Kun koira lopulta tulee, se saa makupalan. Samalla koira kytketään ja lähdetään pois puistosta.

Oliko luoksetulosta annettu makupala koiran mielestä vahviste? Oliko annettu makupala koiralle mukavampi asia kuin se, että se olisi saanut jatkaa vapaana juoksemista?

Koira ei reagoinut pariin ensimmäiseen luoksetulokutsuun. Tähän voi olla useita syitä, mutta todennäköisin syy lienee se, että vapaana oleminen oli koiran mielestä paljon hauskempaa kuin se palkkio, minkä se odotti saavansa luoksetulosta. Koirakavereiden kanssa leikkiminen oli siis motivoivampaa kuin omistajan luo juokseminen. Koira oli myös luultavasti jo ehtinyt oppia, että luoksetuloon liittyy namipalkkion lisäksi myös koiran kannalta todella ikävä asia eli hauskuuden loppuminen. Koiran kytkeminen ja koirapuistosta pois lähteminen olivat koiran kannalta positiivinen rankaisu. Tällöin koira voi myös oppia, että makupalan saaminen tarkoittaa, että kohta joutuu kytketyksi. Nami ennakoi ikävää asiaa.

Jos taas koira olisi kutsuttu luokse ja päästetty takaisin leikkimään, olisi makupala vastaavasti voinut toimia ennakoivana vihjeenä superpalkkiosta eli takaisin vapaaksi päästämisestä.

Entäpä jos koira ei viihtyisikään koirapuistossa? Jos koira pelkäisi toisia koiria eikä tahtoisi olla niiden lähellä? Tällöin luoksetulovihjeeseen reagoiminen johtaisi ikävästä tilanteesta poispääsemiseen, eli tapahtuisi negatiivista vahvistusta. “Kun tulen omistajan luokse, hän vie minut pois, turvaan.“

 

Onko kehuminen palkkio?

Yksi usein koirakoulussa kuulluista kysymyksistä on, että riittääkö koiran kehuminen palkkioksi. Ainoa oikea vastaus kysymykseen lienee, että kysy koiralta. Ainoastaan eläin voi itse kertoa, minkä se kokee vahvisteeksi ja minkä rankaisuksi. Ja jälleen, riippuu tilanteesta. Seuraavissa esimerkeissä on hyvä muistaa myös Pavlovin osuus: koira voi olla jo ehdollistunut siihen, että tilanne on esimerkiksi pelottava, ahdistava tai turhauttava.

Koira haukkuu kotona yksin ollessaan. Omistajan tullessa kotiin haukkuminen loppuu. Yksinolon loppuessa koira myös tuntee helpotusta, ahdistuneisuus ja/tai pelko häviää. Tällöin pelkkä ihmisen saapuminen toimii vahvisteena, koira ei tarvitse mitään erillistä herkkupalaa tai palloleikkiä tullakseen paremmalle tuulelle. Samalla koira voi oppia, että haukkuminen johtaa omistajan saapumiseen, eli sitä kannattaa tehdä jatkossakin.

Koira on treenihallilla kytkettynä seinään ja haukkuu. Omistaja suunnittelee kauempana harjoituksia muiden koiranohjaajien kanssa tai kantaa esteitä kentälle. Omistaja saapuu koiran luokse sen haukkuessa, mutta haukkuminen ei lakkaakaan kuten kotona aiemmin. Siinä, missä kotona yksinolotilanteessa koira kaipasi seuraa, tavoittelee se koulutustilanteessa haukkumalla jotakin muuta. Haukkuminen voi olla turhautumista siitä, että koira ei pääse toisten paikalla olevien koirien luo, tai vaikkapa siitä, että koira on turhautunut joutuessaan odottamaan treenejään. Se tietää, että hallilla pääsee tekemään kivoja juttuja ja saa myös palkkioita, joten sillä on kiire aloittaa harjoitukset.

Koira haukkuu häkissä treenihallilla. Haukkuminen häiritsee muiden työskentelyä, joten omistaja menee häkin luo ja toruu, komentaa koiraa. Koira hiljenee. Omistaja ajattelee siis käyttävänsä positiivista rankaisua: jotain ikävää (toruminen) seuraa koiran käytöksen (haukkuminen) seurauksena. Jos haukkuminen loppuu, on suunnitelma toiminut. Usein käy kuitenkin päinvastoin: haukkuminen alkaa pian uudelleen. Tällöin voi olla, että omistajan paikalle saapuminen ja koiran kieltäminen ovatkin toimineet itse asiassa positiivisena vahvisteena: “Kun haukun, saan huomiota ja omistaja saapuu.”

Koira ääntelee häkissä ollessaan, vaikka näkee omistajan koko ajan. Omistaja palkitsee koiraa aina, kun se on hiljaa. Hiljaa oleminen ei kuitenkaan lisäänny, vaan koiraa ääntelee yhä enemmän. Namipalkkiot eivät siis koiran mielestä ole palkkioita. Koira haluaa ulos häkistä, ja vain se toimii tässä tilanteessa vahvisteena. Herkut ovat jotakuinkin yhdentekeviä, vaikka koira ne söisikin.

 

 

Odotukset ja pettymykset

Jos koiraa on koulutettu jo jonkin verran, on sille syntynyt käsitys siitä, miten koulutusprosessi etenee. Sillä on oppimishistoriaa siitä, minkälaiset käytökset tuottavat minkäkinlaisia vahvisteita (ja rangaistuksia). Sillä on odotuksia ja ehkä jopa edellytyksiä palkkioiden suhteen.

Useita toistoja on palkittu namipalkkiolla. Viimeisen toiston kohdalla ohjaaja huomaakin, ettei taskussa olekaan enää yhtään namia. Hän yrittää namin ojentamisen sijaan rapsuttaa tai silittää koiraa palkkioksi. Koira odottaa jälleen saavansa namin ojentuvasta kädestä ja suorastaan kavahtaa, kun käsi koskeekin. Koiralla oli odotus saada nami, ja silitysyritys saattoi toimia positiivisena rankaisuna. Vastaavaa pettymystä voi nähdä, jos koira on tottunut saamaan harjoituksesta palkkioksi lelun tai leikin ja sille tarjotaankin ruokapalkkiota.

Jos taas koiraa ei ole juurikaan koulutettu, ei sillä välttämättä ole oletusta, että ohjaajalla olisi hallussaan mitään koiraa kiinnostavaa. Tällaisen koiran kanssa voi joutua aloittamaan ensin siitä, että koira oppii, mitä palkkiot ovat. Tuntuu hullulta ajatukselta opettaa koiraa syömään nameja, mutta käytännössä tämä on ihan mahdollista ja tarpeellista. Myös leikki ihmisen kanssa, lelulla tai ilman, voi olla asia, jota täytyy erikseen harjoitella.

Kaavamainen harjoittelu luo koiralle helpommin odotuksia palkkiosta – ihan samalla tavalla kuin koira alkaa ennakoida muitakin asioita harjoittelussa, jos sitä tehdään aina hyvin samankaltaisesti. Kaavamaisuus luo rutiineja, ja ne herkistävät koiran erilaisille odotuksille. Odotuksen myötä kehittyy myös helposti voimakkaita tunteita, kuten kiihtymystä ja innostusta. Nämä taas alkavat helposti johtaa ongelmiin harjoittelussa, mm. ääntelyyn. Tilannetta pyritään usein korjaamaan vaihtamalla palkkio “huonompaan”, koska ohjaajan oletus on, että “liian hyvä” palkkio on syynä käytökseen.

Mitä enemmän erilaisia palkitsemistapoja ja palkkioita koirakolla on käytössään, sitä ketterämmin koira yleensä pystyy vaihtamaan palkkiosta toiseen. Sen kanssa voi tehdä vaikkapa sarjan tehtäviä namipalkkiolla ja sitten palkita se vauhdikkaalla leikillä viimeisen toiston jälkeen. Tällainen treenaaminen kuitenkin vaatii harjoittelua, jotta erilaiset vahvisteet tulevat koiralle tutuksi eikä sille synny rutiininomaisia odotuksia siitä, miten tilanteessa aina toimitaan. Koira, jolla on hyvä itseluottamus ja pitkä historia yhdessä ohjaajansa kanssa toimimisesta, kestää satunnaiset kolhut koulutuksessa paremmin kuin koira, jonka kanssa vasta aloitellaan yhteistyön tekemistä.

Voi olla myös, ettei palkkiolla ole arvoa, jos koulutus on muuten koiran mielestä epäreilua tai hämmentävää. Huomasin tämän omien koirieni smartDOG-testeissä. Vanhin koirani osallistui oppimisnopeustestiin, jossa koira opetetaan ensin siihen, että palkkio on aina toisessa kahdesta kulhosta. Yhtäkkiä tilanne käännetäänkin päinvastaiseksi: nami löytyykin kulhosta, jossa sitä ei ollut ikinä aiemmin, ja “oikea” kulho onkin tyhjä! Oma koirani söi ensimmäisellä käänteisen oppimisen testillä palkkionamin – ja lähti sitten pois. Se näytti todella siltä, että sen maailma oli hetkellisesti romahtanut eikä se ymmärtänyt enää mitään. “Kiitos, mutta kiitos ei”, se tuntui sanovan. “En halua olla osallisena tällaisessa hulluudessa.”

 

 

Anna koiran valita

Yksi tapa estää pettymysten syntyä on kysyä koiralta itseltään, minkä palkkion se haluaa. Sen voi tehdä esim. opettamalla koiralle palkkioita tarkoittavat symbolit ja kysyä ennen treenin alkua, kumpaa (tai mitä) vahvistetta nyt käytetään. Itse tällä hetkellä yleensä näytän koiralle esim. mukana olevat treenilelut. Jos se tarttuu johonkin leluun, käytetään sitä palkkiona. Jos se ei ota lelua, tarkoittaa se, että ruokapalkkio on sillä hetkellä kiinnostavampi. Toki jotkut koirat voivat muuttaa mieltään palkkiosta myös toistojen välissä, ja se aiheuttaakin ohjaajalle huomattavasti enemmän päänvaivaa. Monet koirat arvottavat myös eri leluja eri tavoin: esimerkiksi pallo voi olla erittäin paljon parempi palkkio kuin vetolelu. Kaikki koirat eivät välttämättä ymmärrä valitsemisen konseptia ja voivat turhautua vaihtoehdoista.

Pieni yllätyksellisyys voi kuitenkin toimia joidenkin koirien kohdalla oikein hyvin. Esimerkiksi ruokapalkkioiden sekoittaminen “lauantaipussiksi” niin, että tarjolla on satunnaisotannalla erilaisia herkkupaloja, voi lisätä koiran kiinnostusta.

Omilla koirillani siihen, kumpi kiinnostaa enemmän, ruoka vai lelu, liittyviä syitä ovat mm. kellonaika (monta tuntia edellisestä ateriasta, onko jo nälkä) ja hormonaalinen tila. Leikkaamattomalla nartulla etenkin valeraskauden aikaan ruokahalu lisääntyy, jolloin ruoka on lelupalkkaa parempi, vaikka normaalisti asia on toisin päin.

 

Palkkion suunta

Kun harjoitellessa pyritään tekemään siedättämistä tai vastaehdollistamista, on hyvä huomioida myös negatiivisen vahvistamisen voima. Kokeilimme tätä eräässä harjoitustilanteessa oman koirani kanssa, joka ei pidä vedestä (esim. sade, peseminen). Avustaja lorautti vettä kannusta ämpäriin. Tämä toimi koiralle eräänlaisena “suihkusimulaattorina”, eli oli asia, jota eläin halusi välttää. Teimme koiran kanssa käsikosketusta sopivan välimatkan päässä ämpäristä. Koira oli vapaana, joten se pystyi helposti halutessaan poistumaan tilanteesta ja ottamaan vielä enemmän välimatkaa, jos olisi kokenut sen tarpeelliseksi.

Kokeilimme kahta versiota: käsikosketus kauempana ämpäristä ja palkkion heitto ämpäriin päin sekä käsikosketus lähempänä ämpäriä ja palkkion heitto poispäin ämpäristä.

Jälkimmäinen versio toimi huomattavasti paremmin. Se, että koira sai namipalkkion lisäksi liikkua epämiellyttävästä asiasta poispäin, oli selkeästi huomattavasti voimallisempi vahviste. Tämä siitä huolimatta, että tilanne oli koiralle miellyttävä, sen elekielessä ei ollut mitään välttelemiseen liittyvää ja sen kohdetyöskentely oli koko harjoituksen aikana sujuvaa. Tämä on ilmiö, jota kannattaa hyödyntää kaikissa tilanteissa, joissa koira joutuu altistumaan epämiellyttävälle asialle, kuten vaikkapa vieraan koiran lähestymiselle. Sen lisäksi, että koiraa palkitaan esim. ruualla, kannattaa se yhdistää tilanteesta poistumiseen.