
Begrebsdefinitioner
fra indlæringspsykologien
Skrevet af: Nanna
Lise Vester, www.hundelivet.dk
De indlæringspsykologiske
principper, som kort vil blive beskrevet i det
følgende, gælder både for mennesker og
dyr. Det er ikke meningen at denne gennemgang skal give en
dybdegående forståelse for, hvordan vi kan
anvende de forskellige træningsmetoder. Gennemgangen
skal ses som et supplement til anden læsning om
indlæringspsykologi, og den kan bruges til at
slå efter, hvad de forskellige begreber betyder og
dækker over.
Fælles for alle
træningsmetoder er at de enten bygger på positiv
eller negativ forstærkning og positiv eller negativ
straf eller en sammenblanding af disse. I
redningshundetræningen bestræber vi os på
at anvende positiv forstærkning og negativ straf.
Negativ forstærkning og positiv straf er derimod de
begreber, man normalt forbinder med traditionel
hundetræning. Hvad disse begreber betyder, kan du
læse om i det følgende.
Jeg vil starte med at præcisere,
hvad vi skal forstå ved henholdsvis
forstærkninger og straf. Som nævnt ovenfor
inddeles disse i positiv og negativ. Positiv betyder ikke at
princippet er god/sjov/attraktiv/bedre eller andre ting vi
normalt forbinder med ordet positiv. Positiv i denne
sammenhæng betyder udelukkende at
tilføre eller at opnå. Ligeledes
betyder negativ ikke noget
dårligt/umoralsk/ondt/uønskelig m.m.. Negativ i
denne sammenhæng betyder udelukkende at
fjerne eller at undgå. Det er nemmere at
huske hvad de forskellige ting betyder, hvis man husker
på denne måde at bruge negativ og positiv. (Hvad
man mener om træningsmetoderne er en anden
sag!)
Negative og positive
forstærkninger er noget, der er med til at øge
sandsynligheden for, at en adfærd vil gentage sig
(lær dette udenad!). Det er meget nyttigt
indlæringsmæssigt, da vi i hundetræningen
hele tiden arbejder på at etablere en bestemt
adfærd hos hunden fx. gå fri ved fod eller halse
af figuranter. Ved brug af enten positive eller negative
forstærkninger kan man altså påvirke
adfærden hos hunden og øge sandsynligheden for,
at den adfærd man arbejder på at få frem,
også vil blive gentaget fremover.
Straf (i modsætning til
forstærkninger) reducerer sandsynligheden for at en
adfærd vil gentage sig. Straf kan man derfor fx
anvende når man vil aflære en bestemt
adfærd, det kunne være at hunden gør af
postbudet, eller med andre ord forsøge at få en
bestemt adfærd hos hunden til at aftage.
(De centrale begreber fra
indlæringspsykologien er i det følgende skrevet
med blå skrift. Eksempler på anvendelse af
indlæringsprincipperne står i
kursiv.)
Forstærkning
Fælles for positiv og negativ forstærkning
er at forstærkningerne medfører, at den
adfærd man forstærker vil gentage sig
oftere.
Dvs. når man tilfører
hunden en forstærker i forbindelse med en bestemt
adfærd, øges sandsynligheden for at denne
adfærd vil gentage sig.
Straf
Fælles for både positiv og negativ straf er
at den adfærd man straffer vil optræde
sjældnere.
Dvs. straf der følger en
bestemt adfærd, vil medføre at sandsynligheden
for denne adfærd reduceres.
Positiv
forstærkning
Positiv forstærkning er altså lige som
negativ forstærkning noget, der bevirker at den
adfærd, der bliver forstærket vil forekomme
hyppigere.
Positiv forstærkning vil sige,
at man giver hunden noget den gerne vil opnå,
når den udviser den adfærd, man vil have den
til. Dette bevirker så, at hunden oftere vil gentage
denne adfærd (for at opnå belønningen).
Eller med andre ord: Når hunden gør det, vi
gerne vil have den til, giver vi den det, den gerne vil
opnå, dette forstærker
adfærden.
En positiv forstærkning er
altid noget hunden gerne vil opnå. Hvis hunden er
meget glad for bolde, men overhovedet ikke glad for
godbidder, ja så kan bolden bruges som positiv
forstærkning men godbidderne dur ikke. Hvis hunden
får bolden, hver gang den gør det rigtige, vil
den af sig selv oftere gentage den adfærd, der
udløste bolden, ganske enkelt for at opnå
belønningen igen.
En positiv forstærkning kan
være alt fra godbidder, leg med legetøj til
ros, klap, gåture, leg med andre hunde samt anden
social kontakt etc. Blot det er noget, der er attraktivt for
hunden.
Ex. Hunden får en godbid (en
positiv forstærkning) hver gang den sidder korrekt
på plads. Det medfører at hunden oftere vil
sidde korrekt på plads (sandsynligheden for at
adfærden gentager sig øges). Hunden bliver
positivt forstærket for adfærden at "sidde
på plads".
Hvalpen skal lære at sidde.
Hver gang hvalpen af sig selv sætter sig ned, giver
hundeføreren den en godbid. Dvs. hundeføreren
positivt forstærker hvalpens adfærd (at den
sætter sig). Hvalpen vil da efter kort tid sætte
sig oftere og oftere for at opnå
godbidden.
Et
par regler for brug af forstærkning
- TIMING:
Man opnår en mere effektiv forstærkning, hvis
man har en god timing, dvs. at man forstærker
adfærden i samme øjeblik, den finder sted.
Det er den adfærd, der bliver forstærket, som
man øger sandsynligheden for vil gentage sig.
Vær derfor nøje med at belønne i
absolut samme øjeblik, som hunden gør det,
du vil have den til. Husk! Alt hvad hunden gerne vil
have, kan fungerer som en forstærker. Giver du
godbidder til hunden når den piber, vil den pibe
oftere. Nusser du hunden når den tier stille, vil
den tie stille oftere osv.
- KRITERIE:
Vær nøje med at sætte enkle mål
for træningen. Bestem på forhånd, hvad
dine kriterier for træningen skal være. Med
andre ord find ud af, hvad du kræver at hunden skal
gøre for at opnå forstærkning.
Sæt kun et kriterie ad gangen. Hunden kan ikke
forbedre to ting på én gang. Inddel så
hellere træningen i momenter og træn delene
vær for sig.
- KVALITETEN AF
FORSTÆRKEREN:
Forstærkeren skal være effektiv. Brug en
belønningsform, som hunden virkelig sætter
pris på. Jo bedre du er til at belønne, jo
bedre. arbejder hunden.
- VARIABEL
FORSTÆRKNING: Når
hunden har lært en ny adfærd opretholdes den
bedst ved at anvende variabel forstærkning.
Negativ
forstærkning
Negativ forstærkning
øger som sagt også sandsynligheden for at den
adfærd, som bliver forstærket, vil blive
gentaget oftere. Men fremgangsmåden er en
anden.
Negativ forstærkning er,
når man fjerner et ubehag fra hunden, idet hunden
gør det, man vil have den til. Det at ubehaget
ophører, når hunden gør det rigtige,
får den til at gøre det rigtige oftere (for at
undgå ubehaget!) Eller med andre ord: Når hunden
gør, det vi gerne vil have den til, ophører
ubehaget, hvilket får hunden til at gentage, den
adfærd der fik ubehaget til at holde op.
En negativ forstærkning skal
altid være noget ubehageligt for hunden. Hvis hunden
ikke synes, det er ubehageligt at blive skældt ud men
der i mod meget ubehageligt at blive nappet i øret,
ja så er nappet i øret en negativ
forstærker for hunden, men skæld ud er det ikke.
Negative forstærkninger kan være alt fra verbal
skæld ud, til fysisk afstraffelse, fravær af
social kontakt m.m.
Ex. Indlæring af
linieføring med negativ forstærkning. Rykket i
linen ophører (= et ubehag fjernes) når hunden
går pænt. Det medfører at sandsynligheden
for at hunden fremover vil gå pænt øges.
Når man lærer sin hund at gå pænt
ved hjælp af et kvæler halsbånd, anvender
man negativ forstærkning. Grunden til at hunden
går pænt på plads er, at den har fundet ud
af, at det er det eneste sted, den kan gå uden den
oplever et ubehag.
Negativ
straf
Straf er i modsætning til forstærkninger
noget, der reducerer chancen for, at den adfærd der
straffes vil gentage sig. Når man straffer en bestemt
adfærd hos hunden, reducerer man sandsynligheden for
at hunden vil udføre denne adfærd igen.
Adfærden vil altså aftage mere og
mere.
Husk at negativ i denne
sammenhæng betyder at fjerne noget. Negativ straf er
når en eftertragtet stimulus (en positiv
forstærker) fjernes efter en bestemt adfærd har
fundet sted. Effekten er at sandsynligheden for at
adfærden vil gentage sig reduceres.
Ex. Hunden halser ikke af
figuranten. Denne adfærd vil vi ikke forstærke,
da vi ikke vil øge sandsynligheden for at hunden
heller ikke halser i fremtiden. Vi undlader derfor at
belønne hunden, når den ikke halser, dvs. vi
anvender negativ straf (fjerner belønningen). Det vil
reducere chancen for, at hunden ikke halser af figuranten i
fremtiden.
Hunden lægger sig ikke
på dæk kommandoen. Hunden får ikke sin
bold, dvs. at den positive forstærker / eftertragtede
stimulus fjernes, hunden lægger sig næste gang
for at få sin bold.
Hunden går for langt fremme i
fri ved fod, hunden får ingen belønning, hunden
vil prøve andre muligheder fx. gå lige ved
siden af føreren for at opnå en
belønning.
Positiv
straf
Husk at positiv i denne
sammenhæng betyder at tilføre noget. Positiv
straf er når en adfærd fører til en
aversiv stimulus (et ubehag). Effekten er som ved negativ
straf, at den adfærd, der bliver straffet,
efterhånden vil aftage (sandsynligheden for at den
gentages reduceres).
Ex. Hunden hopper op, hunden
får skæld ud (positiv straf), hundens lyst til
at hoppe op reduceres. Hunden gør i bilen, hunden
får et sprøjt vand (positiv straf), hundens
lyst til at gø i bilen reduceres. Hunden går
for langt fremme i fri ved fod, hunden får et ryk i
linen (positiv straf), hundens lyst til at gå foran
føreren reduceres.
Selvom straf også beviseligt har
en effektiv indlæringseffekt, kan brug af positiv
straf indebære etiske problemer såvel som andre
uønskelige konsekvenser.
Nogle
ulemper ved at bruge positiv straf:
- Brug af positiv straf kan
medføre ubehag og følelsesmæssige
reaktioner, som kan forstyrre
indlæringsprocessen.
- Positiv straf kan ud over at
reducere hyppigheden af en bestemt adfærd
også samtidig, reducerer hyppigheden af
ønsket adfærd.
- Positiv straf (ubehag) kan
udløse aggressiv adfærd.
(Kilde: Frode Svartdal og Magne Arve Flaten
"Læringspsykologi" Gyldendal Norsk Forlag AS
2002)
Opsummering
Nedenstående skema
opsummerer kort positiv/negativ forstærkning samt
positiv/negativ straf
|
Tilføre
|
Fjerne
|
Resultat
|
|
Velbehag / gode
(Positiv forstærkning)
|
Ubehag
(Negativ forstærkning)
|
Øger
sandsynligheden for gentagelse
|
|
Ubehag
(Positiv straf)
|
Velbehag / gode
(Negativ straf)
|
Reducerer sandsynligheden
for gentagelse
|
Klassisk
betingning
Defineret af russeren Ivan
Pavlov (1849 -1936)
Passiv eller ufrivillig indlæring. Hunden forbinder en
betinget stimulus med en ubetinget stimulus. Den betingede
stimulus fremkalder en betinget reaktion hos
hunden.
Ex: Hunden savler (ubetinget
reaktion) når den får mad (ubetinget stimulus).
Inden maden serveres bliver der ringet med en klokke. Hunden
forbinder nu klokken (betinget stimulus) med maden
(ubetinget stimulus) og savler (betinget
reaktion).
Eller med andre ord. Klassisk
betingning finder sted, hver gang en bestemt
påvirkning eller et signal (betinget stimulus)
udløser en bestemt reaktion hos hunden (betinget
reaktion). Den indlærte reaktion kan være
både lyst og ulyst betonet. Man kan også sige,
at hunden forbinder noget, der ikke umiddelbart har mening
for den (en betinget stimulus) med noget, der har mening for
den (en ubetinget stimulus), hvilket så udløser
en reaktion hos hunden (betinget reaktion). Hunden
lærer at forbinde den betingede stimulus med den
ubetingede gennem gentagelser.
Ex: Det at hundeføreren
tager sine bilnøgler frem (betinget stimulus)
forbindes af hunden med at hundeføreren går sin
vej (ubetinget stimulus), hvilket får hunden til at
pibe (betinget reaktion). Dette er en reaktion, der er
forbundet med ulyst for hunden.
Hunden hører lyden af et
låg, der tages af en dåse (betinget stimulus),
dette forbindes af hunden med at den vil få mad
(ubetinget stimulus). Redningshundeførerens uniform
er ligeledes ofte en betinget stimulus i det hunden
forbinder uniformen med, at der skal ske noget sjovt /
træning (ubetinget stimulus), hvilket får hunden
til, at hoppe og danse af glæde (betinget reaktion).
Dette er en lyst betonet reaktion.
Hvis man mange gange ringer med
klokken uden at serverer mad, så ophører den
forøgede spytproduktion. Man siger at den betingede
reaktion udslukkes. Man er således nødt til med
mellemrum at ringe og derefter serverer mad for at
opretholde den betingede reaktion. Disse
efterfølgende vedligeholdelsesøvelser er
forstærkninger.
Selv om man anvendte klokker som
ringer lidt forskelligt, kan man stadig fremkalde den samme
reaktion ved hunden. Dette kaldes generalisering dvs. at
reaktionen spreder sig til stimuli som minder mere eller
mindre om det oprindelige. Det er modsat også muligt
at træne hunden til kun at reagere på én
bestemt klokke. Hvis man ringer med andre klokker uden at
give mad bagefter, lærer hunden at skelne én
bestemt klokke, som den der efterfølges af mad. Dette
kaldes skelne evne eller diskrimination.
Oprerant
indlæring
Operant indlæring
fokuserer på, hvordan adfærd ændres som
følge af de konsekvenser adfærden har (en
konsekvens i hundetræningen kan fx være en
godbid eller skæld ud). Vi kender også
udmærket dette fra os selv, konsekvenserne af vores
handlinger har betydning for om vi gentager disse
handlinger.
Operant adfærd defineres
således: Adfærd hos dyr og mennesker, hvor
konsekvenserne af denne adfærd påvirker
sandsynligheden for at adfærden senere vil blive
gentaget.
Udtrykket operant kommer af operere =
handle/virke. Dvs. at hunden under denne
indlæringsform er aktiv. Her er tale om
indlæring, hvor der anvendes positiv eller negativ
forstærkning samt positiv eller negativ
straf.
Ex. Hunden springer op af
døren, døren går op, på den anden
side ligger et kødben. Hunden er nu blevet positivt
forstærket i at springe op af døren, hvilket
medfører at hunden prøver igen. Får
hunden fortsat noget ud af at springe op af døren vil
den fortsætte med denne handling og efter nogen tids
øvelse blot trykke på håndtaget så
døren går op. Hunden har aktivt afprøvet
forskellige handlinger som har ført til et for hunden
attraktivt resultat. Hvis hunden der i mod bliver
skældt ud når den hopper op vil den tendensen
til at hoppe op af døren aftage. Hunden er blevet
negativt forstærke for sin
adfærd.
Shaping
Shaping betyder direkte
oversat "formning" Shaping betyder, at en adfærd
formes gennem momentopdelt træning, hvor hvert moment
indlæres hver for sig og til sidst sættes sammen
i en kæde til den færdige adfærd. Ved
shaping anvender man positiv forstærkning, i det man
giver hunden en positiv forstærkning for hvert skridt
i den rigtige retning. Desuden anvendes negativ straf, i det
man undlader, at belønne uønsket
adfærd.
Ex. Hunden skal lære at give
hals på kommando. Adfærden "halsgivning" formes
ved at belønne hvert skridt i retningen af en endelig
halsgivning fx. 8 bjæf. Det gøres ved
først at belønne et enkelt lille piv,
dernæst et lidt højere piv, så en
regulær halsgivning, dernæst to bjæf osv.
Indtil man til sidst kan vente med at belønne efter 8
bjæf.
Hunden skal lære at apportere
en genstand. Øvelsen opdeles i momenter:
1) Sidde på plads
2) På kommandoen "apport" løbe ud til
genstanden.
3) Samle genstanden op
4) Holde fast om genstanden
5) Løbe tilbage til hundeføreren
6) Sidde med genstanden i munden
7) Slippe genstanden på kommandoen "slip"
Hvert enkelt moment indlæres hver for sig. Når
hunden kan alle momenterne kobles de sammen til den
færdige adfærdskæde:
apporteringsøvelsen. (Se evt. artiklen
om indlæring af apportering vha
klikker)
Klikkertræning
(Beskrevet af den amerikanske
biolog og tidligere delfintræner Karen Pryor).
Klikkertræning er en forkortelse for praktisk brug af
operant indlæring baseret på positiv
forstærkning med systematisk brug af en betinget
forstærker.
Eller sagt med andre ord:
Klikkertræning bygger på principperne for
shaping samt klassik betingning og operant indlæring.
I tillæg hertil anvendes en "klikker", der når
man trykker på den afgiver en dobbelt klik lyd
"klik-klik". Denne lyd lærer hunden, gennem klassisk
betingning, at forbinde med en belønning. Klik lyden
anvendes til at signalere til hunden præcist,
hvornår den udfører den ønskede
adfærd. (Man kan også bare anvende ordet dygtig,
men dets betydnings skal indlæres på samme
måde som klik lyden). Kliklyden følges altid op
med en belønning. Klikkeren anvendes for at
opnå en bedre belønningstiming og dermed en
hurtigere indlæring. I tillæg hertil gør
man brug af variabel forstærkning.
|