Begrebsdefinitioner fra indlæringspsykologien
Skrevet af: Nanna Lise Vester, www.hundelivet.dk

De indlæringspsykologiske principper, som kort vil blive beskrevet i det følgende, gælder både for mennesker og dyr. Det er ikke meningen at denne gennemgang skal give en dybdegående forståelse for, hvordan vi kan anvende de forskellige træningsmetoder. Gennemgangen skal ses som et supplement til anden læsning om indlæringspsykologi, og den kan bruges til at slå efter, hvad de forskellige begreber betyder og dækker over.

Fælles for alle træningsmetoder er at de enten bygger på positiv eller negativ forstærkning og positiv eller negativ straf eller en sammenblanding af disse. I redningshundetræningen bestræber vi os på at anvende positiv forstærkning og negativ straf. Negativ forstærkning og positiv straf er derimod de begreber, man normalt forbinder med traditionel hundetræning. Hvad disse begreber betyder, kan du læse om i det følgende.

Jeg vil starte med at præcisere, hvad vi skal forstå ved henholdsvis forstærkninger og straf. Som nævnt ovenfor inddeles disse i positiv og negativ. Positiv betyder ikke at princippet er god/sjov/attraktiv/bedre eller andre ting vi normalt forbinder med ordet positiv. Positiv i denne sammenhæng betyder udelukkende at tilføre eller at opnå. Ligeledes betyder negativ ikke noget dårligt/umoralsk/ondt/uønskelig m.m.. Negativ i denne sammenhæng betyder udelukkende at fjerne eller at undgå. Det er nemmere at huske hvad de forskellige ting betyder, hvis man husker på denne måde at bruge negativ og positiv. (Hvad man mener om træningsmetoderne er en anden sag!)

Negative og positive forstærkninger er noget, der er med til at øge sandsynligheden for, at en adfærd vil gentage sig (lær dette udenad!). Det er meget nyttigt indlæringsmæssigt, da vi i hundetræningen hele tiden arbejder på at etablere en bestemt adfærd hos hunden fx. gå fri ved fod eller halse af figuranter. Ved brug af enten positive eller negative forstærkninger kan man altså påvirke adfærden hos hunden og øge sandsynligheden for, at den adfærd man arbejder på at få frem, også vil blive gentaget fremover.

Straf (i modsætning til forstærkninger) reducerer sandsynligheden for at en adfærd vil gentage sig. Straf kan man derfor fx anvende når man vil aflære en bestemt adfærd, det kunne være at hunden gør af postbudet, eller med andre ord forsøge at få en bestemt adfærd hos hunden til at aftage.

(De centrale begreber fra indlæringspsykologien er i det følgende skrevet med blå skrift. Eksempler på anvendelse af indlæringsprincipperne står i kursiv.)

Forstærkning
Fælles for positiv og negativ forstærkning er at forstærkningerne medfører, at den adfærd man forstærker vil gentage sig oftere.

Dvs. når man tilfører hunden en forstærker i forbindelse med en bestemt adfærd, øges sandsynligheden for at denne adfærd vil gentage sig.

Straf
Fælles for både positiv og negativ straf er at den adfærd man straffer vil optræde sjældnere.

Dvs. straf der følger en bestemt adfærd, vil medføre at sandsynligheden for denne adfærd reduceres.

Positiv forstærkning
Positiv forstærkning er altså lige som negativ forstærkning noget, der bevirker at den adfærd, der bliver forstærket vil forekomme hyppigere.

Positiv forstærkning vil sige, at man giver hunden noget den gerne vil opnå, når den udviser den adfærd, man vil have den til. Dette bevirker så, at hunden oftere vil gentage denne adfærd (for at opnå belønningen). Eller med andre ord: Når hunden gør det, vi gerne vil have den til, giver vi den det, den gerne vil opnå, dette forstærker adfærden.

En positiv forstærkning er altid noget hunden gerne vil opnå. Hvis hunden er meget glad for bolde, men overhovedet ikke glad for godbidder, ja så kan bolden bruges som positiv forstærkning men godbidderne dur ikke. Hvis hunden får bolden, hver gang den gør det rigtige, vil den af sig selv oftere gentage den adfærd, der udløste bolden, ganske enkelt for at opnå belønningen igen.

En positiv forstærkning kan være alt fra godbidder, leg med legetøj til ros, klap, gåture, leg med andre hunde samt anden social kontakt etc. Blot det er noget, der er attraktivt for hunden.

Ex. Hunden får en godbid (en positiv forstærkning) hver gang den sidder korrekt på plads. Det medfører at hunden oftere vil sidde korrekt på plads (sandsynligheden for at adfærden gentager sig øges). Hunden bliver positivt forstærket for adfærden at "sidde på plads".

Hvalpen skal lære at sidde. Hver gang hvalpen af sig selv sætter sig ned, giver hundeføreren den en godbid. Dvs. hundeføreren positivt forstærker hvalpens adfærd (at den sætter sig). Hvalpen vil da efter kort tid sætte sig oftere og oftere for at opnå godbidden.

Et par regler for brug af forstærkning
  • TIMING: Man opnår en mere effektiv forstærkning, hvis man har en god timing, dvs. at man forstærker adfærden i samme øjeblik, den finder sted. Det er den adfærd, der bliver forstærket, som man øger sandsynligheden for vil gentage sig. Vær derfor nøje med at belønne i absolut samme øjeblik, som hunden gør det, du vil have den til. Husk! Alt hvad hunden gerne vil have, kan fungerer som en forstærker. Giver du godbidder til hunden når den piber, vil den pibe oftere. Nusser du hunden når den tier stille, vil den tie stille oftere osv.
  • KRITERIE: Vær nøje med at sætte enkle mål for træningen. Bestem på forhånd, hvad dine kriterier for træningen skal være. Med andre ord find ud af, hvad du kræver at hunden skal gøre for at opnå forstærkning. Sæt kun et kriterie ad gangen. Hunden kan ikke forbedre to ting på én gang. Inddel så hellere træningen i momenter og træn delene vær for sig.
  • KVALITETEN AF FORSTÆRKEREN: Forstærkeren skal være effektiv. Brug en belønningsform, som hunden virkelig sætter pris på. Jo bedre du er til at belønne, jo bedre. arbejder hunden.
  • VARIABEL FORSTÆRKNING: Når hunden har lært en ny adfærd opretholdes den bedst ved at anvende variabel forstærkning.

Negativ forstærkning
Negativ forstærkning øger som sagt også sandsynligheden for at den adfærd, som bliver forstærket, vil blive gentaget oftere. Men fremgangsmåden er en anden.

Negativ forstærkning er, når man fjerner et ubehag fra hunden, idet hunden gør det, man vil have den til. Det at ubehaget ophører, når hunden gør det rigtige, får den til at gøre det rigtige oftere (for at undgå ubehaget!) Eller med andre ord: Når hunden gør, det vi gerne vil have den til, ophører ubehaget, hvilket får hunden til at gentage, den adfærd der fik ubehaget til at holde op.

En negativ forstærkning skal altid være noget ubehageligt for hunden. Hvis hunden ikke synes, det er ubehageligt at blive skældt ud men der i mod meget ubehageligt at blive nappet i øret, ja så er nappet i øret en negativ forstærker for hunden, men skæld ud er det ikke. Negative forstærkninger kan være alt fra verbal skæld ud, til fysisk afstraffelse, fravær af social kontakt m.m.

Ex. Indlæring af linieføring med negativ forstærkning. Rykket i linen ophører (= et ubehag fjernes) når hunden går pænt. Det medfører at sandsynligheden for at hunden fremover vil gå pænt øges. Når man lærer sin hund at gå pænt ved hjælp af et kvæler halsbånd, anvender man negativ forstærkning. Grunden til at hunden går pænt på plads er, at den har fundet ud af, at det er det eneste sted, den kan gå uden den oplever et ubehag.

Negativ straf
Straf er i modsætning til forstærkninger noget, der reducerer chancen for, at den adfærd der straffes vil gentage sig. Når man straffer en bestemt adfærd hos hunden, reducerer man sandsynligheden for at hunden vil udføre denne adfærd igen. Adfærden vil altså aftage mere og mere.

Husk at negativ i denne sammenhæng betyder at fjerne noget. Negativ straf er når en eftertragtet stimulus (en positiv forstærker) fjernes efter en bestemt adfærd har fundet sted. Effekten er at sandsynligheden for at adfærden vil gentage sig reduceres.

Ex. Hunden halser ikke af figuranten. Denne adfærd vil vi ikke forstærke, da vi ikke vil øge sandsynligheden for at hunden heller ikke halser i fremtiden. Vi undlader derfor at belønne hunden, når den ikke halser, dvs. vi anvender negativ straf (fjerner belønningen). Det vil reducere chancen for, at hunden ikke halser af figuranten i fremtiden.

Hunden lægger sig ikke på dæk kommandoen. Hunden får ikke sin bold, dvs. at den positive forstærker / eftertragtede stimulus fjernes, hunden lægger sig næste gang for at få sin bold.

Hunden går for langt fremme i fri ved fod, hunden får ingen belønning, hunden vil prøve andre muligheder fx. gå lige ved siden af føreren for at opnå en belønning.

Positiv straf
Husk at positiv i denne sammenhæng betyder at tilføre noget. Positiv straf er når en adfærd fører til en aversiv stimulus (et ubehag). Effekten er som ved negativ straf, at den adfærd, der bliver straffet, efterhånden vil aftage (sandsynligheden for at den gentages reduceres).

Ex. Hunden hopper op, hunden får skæld ud (positiv straf), hundens lyst til at hoppe op reduceres. Hunden gør i bilen, hunden får et sprøjt vand (positiv straf), hundens lyst til at gø i bilen reduceres. Hunden går for langt fremme i fri ved fod, hunden får et ryk i linen (positiv straf), hundens lyst til at gå foran føreren reduceres.

Selvom straf også beviseligt har en effektiv indlæringseffekt, kan brug af positiv straf indebære etiske problemer såvel som andre uønskelige konsekvenser.

Nogle ulemper ved at bruge positiv straf:
  • Brug af positiv straf kan medføre ubehag og følelsesmæssige reaktioner, som kan forstyrre indlæringsprocessen.
  • Positiv straf kan ud over at reducere hyppigheden af en bestemt adfærd også samtidig, reducerer hyppigheden af ønsket adfærd.
  • Positiv straf (ubehag) kan udløse aggressiv adfærd.
    (Kilde: Frode Svartdal og Magne Arve Flaten "Læringspsykologi" Gyldendal Norsk Forlag AS 2002)

Opsummering
Nedenstående skema opsummerer kort positiv/negativ forstærkning samt positiv/negativ straf

Tilføre

Fjerne

Resultat

Velbehag / gode
(Positiv forstærkning)

Ubehag
(Negativ forstærkning)

Øger sandsynligheden for gentagelse

Ubehag
(Positiv straf)

Velbehag / gode
(Negativ straf)

Reducerer sandsynligheden for gentagelse

Klassisk betingning
Defineret af russeren Ivan Pavlov (1849 -1936)
Passiv eller ufrivillig indlæring. Hunden forbinder en betinget stimulus med en ubetinget stimulus. Den betingede stimulus fremkalder en betinget reaktion hos hunden.

Ex: Hunden savler (ubetinget reaktion) når den får mad (ubetinget stimulus). Inden maden serveres bliver der ringet med en klokke. Hunden forbinder nu klokken (betinget stimulus) med maden (ubetinget stimulus) og savler (betinget reaktion).

Eller med andre ord. Klassisk betingning finder sted, hver gang en bestemt påvirkning eller et signal (betinget stimulus) udløser en bestemt reaktion hos hunden (betinget reaktion). Den indlærte reaktion kan være både lyst og ulyst betonet. Man kan også sige, at hunden forbinder noget, der ikke umiddelbart har mening for den (en betinget stimulus) med noget, der har mening for den (en ubetinget stimulus), hvilket så udløser en reaktion hos hunden (betinget reaktion). Hunden lærer at forbinde den betingede stimulus med den ubetingede gennem gentagelser.

Ex: Det at hundeføreren tager sine bilnøgler frem (betinget stimulus) forbindes af hunden med at hundeføreren går sin vej (ubetinget stimulus), hvilket får hunden til at pibe (betinget reaktion). Dette er en reaktion, der er forbundet med ulyst for hunden.

Hunden hører lyden af et låg, der tages af en dåse (betinget stimulus), dette forbindes af hunden med at den vil få mad (ubetinget stimulus). Redningshundeførerens uniform er ligeledes ofte en betinget stimulus i det hunden forbinder uniformen med, at der skal ske noget sjovt / træning (ubetinget stimulus), hvilket får hunden til, at hoppe og danse af glæde (betinget reaktion). Dette er en lyst betonet reaktion.

Hvis man mange gange ringer med klokken uden at serverer mad, så ophører den forøgede spytproduktion. Man siger at den betingede reaktion udslukkes. Man er således nødt til med mellemrum at ringe og derefter serverer mad for at opretholde den betingede reaktion. Disse efterfølgende vedligeholdelsesøvelser er forstærkninger.

Selv om man anvendte klokker som ringer lidt forskelligt, kan man stadig fremkalde den samme reaktion ved hunden. Dette kaldes generalisering dvs. at reaktionen spreder sig til stimuli som minder mere eller mindre om det oprindelige. Det er modsat også muligt at træne hunden til kun at reagere på én bestemt klokke. Hvis man ringer med andre klokker uden at give mad bagefter, lærer hunden at skelne én bestemt klokke, som den der efterfølges af mad. Dette kaldes skelne evne eller diskrimination.

Oprerant indlæring
Operant indlæring fokuserer på, hvordan adfærd ændres som følge af de konsekvenser adfærden har (en konsekvens i hundetræningen kan fx være en godbid eller skæld ud). Vi kender også udmærket dette fra os selv, konsekvenserne af vores handlinger har betydning for om vi gentager disse handlinger.

Operant adfærd defineres således: Adfærd hos dyr og mennesker, hvor konsekvenserne af denne adfærd påvirker sandsynligheden for at adfærden senere vil blive gentaget.

Udtrykket operant kommer af operere = handle/virke. Dvs. at hunden under denne indlæringsform er aktiv. Her er tale om indlæring, hvor der anvendes positiv eller negativ forstærkning samt positiv eller negativ straf.

Ex. Hunden springer op af døren, døren går op, på den anden side ligger et kødben. Hunden er nu blevet positivt forstærket i at springe op af døren, hvilket medfører at hunden prøver igen. Får hunden fortsat noget ud af at springe op af døren vil den fortsætte med denne handling og efter nogen tids øvelse blot trykke på håndtaget så døren går op. Hunden har aktivt afprøvet forskellige handlinger som har ført til et for hunden attraktivt resultat. Hvis hunden der i mod bliver skældt ud når den hopper op vil den tendensen til at hoppe op af døren aftage. Hunden er blevet negativt forstærke for sin adfærd.

Shaping
Shaping betyder direkte oversat "formning" Shaping betyder, at en adfærd formes gennem momentopdelt træning, hvor hvert moment indlæres hver for sig og til sidst sættes sammen i en kæde til den færdige adfærd. Ved shaping anvender man positiv forstærkning, i det man giver hunden en positiv forstærkning for hvert skridt i den rigtige retning. Desuden anvendes negativ straf, i det man undlader, at belønne uønsket adfærd.

Ex. Hunden skal lære at give hals på kommando. Adfærden "halsgivning" formes ved at belønne hvert skridt i retningen af en endelig halsgivning fx. 8 bjæf. Det gøres ved først at belønne et enkelt lille piv, dernæst et lidt højere piv, så en regulær halsgivning, dernæst to bjæf osv. Indtil man til sidst kan vente med at belønne efter 8 bjæf.

Hunden skal lære at apportere en genstand. Øvelsen opdeles i momenter:
1) Sidde på plads
2) På kommandoen "apport" løbe ud til genstanden.
3) Samle genstanden op
4) Holde fast om genstanden
5) Løbe tilbage til hundeføreren
6) Sidde med genstanden i munden
7) Slippe genstanden på kommandoen "slip"
Hvert enkelt moment indlæres hver for sig. Når hunden kan alle momenterne kobles de sammen til den færdige adfærdskæde: apporteringsøvelsen. (Se evt.
artiklen om indlæring af apportering vha klikker)

Klikkertræning
(Beskrevet af den amerikanske biolog og tidligere delfintræner Karen Pryor).
Klikkertræning er en forkortelse for praktisk brug af operant indlæring baseret på positiv forstærkning med systematisk brug af en betinget forstærker.

Eller sagt med andre ord: Klikkertræning bygger på principperne for shaping samt klassik betingning og operant indlæring. I tillæg hertil anvendes en "klikker", der når man trykker på den afgiver en dobbelt klik lyd "klik-klik". Denne lyd lærer hunden, gennem klassisk betingning, at forbinde med en belønning. Klik lyden anvendes til at signalere til hunden præcist, hvornår den udfører den ønskede adfærd. (Man kan også bare anvende ordet dygtig, men dets betydnings skal indlæres på samme måde som klik lyden). Kliklyden følges altid op med en belønning. Klikkeren anvendes for at opnå en bedre belønningstiming og dermed en hurtigere indlæring. I tillæg hertil gør man brug af variabel forstærkning.