,

Die Sache mit dem Lernen

Die Zeiten, in denen Facebook ein Platz für Diskussionen sind, sind bekanntermaßen lange vorbei. Deswegen habe ich mir auch abgewöhnt, auf eine bestimmte Art von Kommentaren einzugehen. Was offensichtlich immer noch aktuell ist, sind Diskussionen über die richtige Art von Hundetraining, insbesondere wenn es darum geht, ob selbiges „positiv verstärkend“ oder „aversiv“ vonstattengeht.

Keine Ahnung, was mich geritten hat, aber vor ein paar Tagen sah ich mich genötigt, ein paar Zeilen dazu zu schreiben. Insbesondere geht es mir um den Begriff „Gewalt“. Hierzu habe ich mich der Definition der WHO bedient, die da lautet:

„Der absichtliche Gebrauch von angedrohtem oder tatsächlichem körperlichem Zwang oder physischer Macht gegen die eigene oder eine andere Person, gegen eine Gruppe oder Gemeinschaft, der entweder konkret oder mit hoher Wahrscheinlichkeit zu Verletzungen, Tod, psychischen Schäden, Fehlentwicklung oder Deprivation führt.“

Wenn man sich das mal genau durchliest, sollte hoffentlich klar sein, dass Gewalt im Hundetraining nichts verloren hat.

Der Fluch des Behaviorismus

Gleichzeitig habe ich darauf aufmerksam gemacht, dass es keine Kausalität zwischen den Begriffen „Gewalt“ und „Strafe“ gibt. Sprich, eine Strafe (genauer „Bestrafung“ (engl. Punishment) ist in der behavioristischen Lerntheorie ein Instrument, das eine Verhaltenswahrscheinlichkeit verringert. Das Ganze geht zurück auf Edward Lee Thorndike (1889), der die drei Gesetzmäßigkeiten des Lernens formuliert hat.

B.F. Skinner, einer der bedeutendsten Psychologen des 20. Jahrhunderts, hat später im Rahmen seiner Forschung in Harvard das Kontingenzschema beschrieben, also dass ein Verhalten positiv bzw. negativ belohnt und bestraft werden kann. Und diese Begriffe sind heute so etwas wie die Instanz, die in der Hundewelt über gut und böse entscheidet.

Eine Hundeschule, die „nach neuesten wissenschaftlichen Erkenntnissen ausschließlich positiv verstärkend“ trainiert, bezieht sich auf eine mindestens 110 Jahre alte Lerntheorie (Watson nutzte 1913 erstmalig in einem Artikel den Begriff „Behaviorismus“).

So einfach, wie Skinner das Kontingenzschema beschrieben hat, verhält es sich mit dem Lernen nicht und das wussten die Behavioristen selbst.

Watson selber prägte den Begriff „Blackbox“, d.h. Verhalten wird auf Stimulus und Reaktion reduziert. Psychische und physiologische Vorgänge wurden bewusst nicht berücksichtigt, um Ergebnisse messbar zu halten.

Das Blackbox-Modell hat sehr früh Kritik hervorgerufen und rief Forschende auf den Plan, die sich genauer mit dem auseinandergesetzt haben, was physiologisch und psychisch im Individuum vorgeht.

Alles Konditionierung, oder was?

Die Gestaltpsychologie (Wertheimer (1925), Köhler (1947) und Koffka (1950)) betonte, dass Wahrnehmung als ganzheitlicher Prozess erfolgt. Ein bekanntes Beispiel dafür ist Gestaltwahrnehmung: Ein Hund kann einen Menschen als Ganzes erkennen, auch wenn er ihn nicht vollständig sieht.

Diese Sichtweise beeinflusste später den Kognitivismus, der sich ab den 1950er Jahren als zweite große Lerntheorie neben dem Behaviorismus entwickelte.

Hier wird Lernen als aktiver Prozess der Informationsverarbeitung im Gehirn beschrieben. Im Mittelpunkt stehen dabei mentale Prozesse wie Wahrnehmung, Denken, Erinnern und Problemlösen, durch die neues Wissen aufgenommen, verarbeitet und mit vorhandenem Wissen verknüpft wird. Die Blackbox wird also mit Leben gefüllt.
(Gagné 1992)

Dass Tiere über kognitive Fähigkeiten verfügen ist breit erforscht, u.a. am MPI in Leipzig oder an der Universität Budapest wurde/wird auch an Hunden geforscht.

Konstruktivismus

Jean Piaget (1896-1980) war Entwicklungspsychologe und gilt als Wegbereiter der konstruktivistischen Lerntheorie. Diese besagt – grob zusammengefasst – dass sich Lernende im Lernprozess eine individuelle Repräsentation der Welt schaffen.

„Wenn z. B. eine Lehrperson Lernenden etwas erklärt, speichern Lernende die Informationen nicht einfach ab, sondern konstruieren sich anhand der aufgenommenen Informationen ihr persönliches, individuelles Abbild der Realität – abhängig von ihrem Vorwissen, ihren Einstellungen und der aktuellen Lernsituation.“
(Christian-Albrecht-Universität, Kiel)

Demzufolge ist Lernen kein passives Speichern, sondern ein aktives Konstruieren von Wissen.

Auf den Hund bezogen bedeutet das, dass er sich nicht nur mit dem Reiz kognitiv auseinandersetzt, um ein Problem bzw. eine Aufgabe zu lösen, sondern der Reiz als solches und der Kontext, in dem er stattfindet, individuell je nach Vorerfahrung erlebt wird.

Was Belohnung ist und was Strafe, bestimmt also immer der Empfänger.

Wie der Hund auf etwas reagiert, hängt unmittelbar damit zusammen, wie er es wahrnimmt und welche Vorerfahrungen dem zugrunde liegen.

Was der Mensch in der Trainingssituation erreicht hat (oder nicht), lässt sich abschließend nur am Folgeverhalten beurteilen und nicht in der ausführenden Handlung.

Wenn wir uns Problemhundetraining (nicht Welpengruppe, nicht Beschäftigung, sondern ein Hund, der ein unerwünschtes Verhalten zeigt!) philosophieübergreifend in der Praxis anschauen, stellen wir schnell fest, wie limitiert das Ganze eigentlich ist.

Positiv verstärkendes Hundetraining

Auf der einen Seite das sogenannte „positiv verstärkende“ Hundetraining, wobei sich das verstärkend auf „belohnend“ bezieht. Wenn wir uns die verschiedenen praktischen Vorgehensweisen („Klick for Blick“, „Angstpendeln“, „Intermediäre Brücke“ etcpp.) anschauen, landen wir in den allermeisten Fällen im Bereich der Gegenkonditionierung, genauer in der systematischen Desensibilisierung nach Joseph Wolpe.

Grundlage bildet die sogenannte reziproke Hemmung. Hierbei handelt es sich um die Hemmung eines Spinalreflexes durch einen anderen Reflex im Millisekundenbereich. (Sherrington 1906).

Joseph Wolpe übertrug diese Wirkweise 1954 in Experimenten mit Katzen auf komplexe Verhaltensweisen. Hieraus leitete er die systematische Desensibilisierung ab, die auf der reziproken Hemmung fußt.

Er präsentierte den Katzen gleichzeitig einen angstauslösenden Reiz und einen von ihm erkannten Antagonisten. Ein solcher Antagonist könnte beim Hund zum Beispiel Futter oder Entspannung sein, da wären wir dann ganz nah am aktuellen Hundetraining.

Wolpes Ergebnisse blieben nicht unwidersprochen. Margraf (2000) stellte in seinen Untersuchungen die reziproke Hemmung als alleiniges Wirkprinzip der systematischen Desensibilisierung in Frage. Unter anderem konnte er aufzeigen, dass ein Angstabbau auch ohne vorherige Entspannung möglich ist.

Abgesehen von der Kritik an Wolpe setzt Desensibilisierung zu allererst voraus, dass der Hund auf den auslösenden Reiz sensibel reagiert.

Früher hatten deshalb alle Hunde Angst. Seitdem sich herumgesprochen hat, dass ein Hund bei einer Angstreaktion das stoffwechselbedingte Verhalten einstellt und dem entsprechend kein Futter nimmt, lautet die moderne Diagnose dann häufig, dass der Hund Stress hat oder – noch moderner – reaktiv sei.

Das ist grob irreführend. Natürlich hat der Hund beim auslösenden Reiz eine Stressreaktion, das bedeutet aber längst nicht, dass er sensibel ist und Hilfe braucht. Wenn die „reaktive Reaktion“ die ist, dass der Hund proaktiv zum Auslöser will, also Distanz verringern möchte, gibt es schlicht und ergreifend nichts, was man gegenkonditionierten könnte.

Ein genauerer Blick auf die Techniken zeigt, dass Verhalten in der Regel habituiert wird. Der Hund wird also an den Auslöser gewöhnt und zeigt das unerwünschte Verhalten in der Folge abgeschwächt, was dann bis zu einer gewissen Reizlage (meist Entfernung) funktioniert.

Alternativ wird ein Verhalten einkonditioniert („Schau“), was gut funktioniert, vorausgesetzt, der Hund entscheidet sich unter Abwägung von Prioritäten für die Belohnung und gegen den Auslöser.

Straffrei?

Ein straffreies Hundetraining, wie es in diversen Hundetrainingsgruppen propagiert wird, gibt es nicht. Auch das Vorenthalten eines Reizes („Ignorieren“) kann individuell als sehr unangenehm wahrgenommen werden. Selbst im Normalfall als angenehm wahrgenommene Reize (Futter) können situativ als störend empfunden werden. Dazu zähle ich insbesondere auch „Streicheln“ und „gut zureden“. Manche Hunde kann man hervorragend belohnen, indem man einfach mal schweigt. Und wenn der Hund in die Leine rennt, weil auf der anderen Straßenseite ein Artgenosse ist, wird er das sehr wohl als Strafe wahrnehmen und nicht als lebensrettende Maßnahme.

Aversives Hundetraining

Auf der „dunklen Seite der Macht“ sieht es nicht viel anders aus, wenn man sich anschaut, was an Techniken verkauft wird.

Viele der Hunde, die ich kennenlerne, haben gar nicht gelernt, was der Mensch eigentlich von ihm will.

In der Regel wird etwas einkonditioniert, das als „Aversivreiz“ fungieren soll. Aversivreiz deshalb, weil die natürlich Reaktion auf eine Verhaltensunterbrechung die bedingte Aversion wäre. Das können neben allen möglichen Hilfsmitteln auch körper(sprach)liche Einwirkungen sein.

Im Falle eines Leinenpöblers wäre das also, dass der Hund seinem Gegenüber in der Wiederholungssituation ausweicht.

Für viele Hundemenschen ist die Aversion mit das Schlimmste, was einem Hund widerfahren kann, in der Lernpsychologie bzeichnet die bedingte Aversion eine normale Reaktion auf eine enttäuschende oder abschreckende Erfahrung.

Das Ziel einer Verhaltensunterbrechung ist allerdings nicht, dass der Hund eine Aversion zeigt, sondern dass der Hund eine bedingte Hemmung zeigt. Weil dieser Begriff auf Social Media gerne mal putzig interpretiert wird, hier eine gute Definition:

„Eine bedingte Hemmung ist das Unterdrücken einer angeborenen oder erworbenen Endhandlung.“

Ein allzu typisches Beispiel: Ein Hund pöbelt an der Leine. Die Hundeschule hat ein Allheilmittel parat, nämlich eine Rappeldose. Der Mensch wird angewiesen, das Hilfsmittel bei „Feindsichtung“ einzusetzen: Erfolg! Der Hund unterlässt das unerwünschte Verhalten.

Die Hundeschule insistiert, dass die Unterbrechung dem „KIT-Prinzip“ folgen muss – nämlich jedes Mal, unmittelbar und in einer angemessenen Intensität. Da der Mensch nichts falsch machen möchte, macht er sich bereit. Timing ist bekanntlich alles, das Hilfsmittel ist immer einsatzbereit und der Mensch erreicht schließlich, dass der Hund der Rappeldose ausweicht. Ist diese nicht zur Hand, pöbelt er weiter, als wenn nie etwas gewesen wäre.

Damit der Hund in diesem Beispiel überhaupt lernen könnte, sich zurückzunehmen, müsste er die Gelegenheit bekommen, sich mit dem Reiz auseinanderzusetzen und eine gewünschte Reaktion zu zeigen. Wenn eine Verhaltensunterbrechung erfolgt, weiss der Hund nur, was er nicht tun soll. Nur wenn er das erwünschte Verhalten zeigt und dieses extrinsisch belohnt wird oder intrinsisch belohnend wirkt, kann er lernen, was der Mensch von ihm will.

Dieser Vorgang, auch Vermeidungslernen genannt, passt nicht ins Kontingenzschema von Skinner, da es hier um kognitive Vorgänge geht.

Darüber hinaus gewöhnen sich Hunde an wie auch immer geartete Einflussnahmen. Diese Form der Habituation, in der ein Verstärker an Qualität verliert, nennt sich Depressionseffekt und trifft auf Bestrafungen ebenso zu wie auf Belohnungsprinzipien.

Hunde sind keine Opfer

Damit komme ich zu einem Punkt, der mich in den letzten Tagen einigermaßen ratlos zurückgelassen hat. Weiter oben habe ich über kognitive Fähigkeiten geschrieben. Hunde verfügen über die Fähigkeit der Perspektiveinnahme, wissen, wann sie im Blickpunkt stehen und können unsere Emotionen erkennen.

Marc Bekoff (2002) argumentierte, dass soziale Caniden einen Sinn für Fairness besitzen müssen, da sie ohne einen solchen ihr Sozialspiel nicht auf die Weise ausüben könnten, wie sie es tun.

Wir wissen, dass Hunde komplexes Problemlöseverhalten an den Tag legen, dass sie extrem anpassungsfähig sind und dass sie über hohe soziale Fähigkeiten verfügen. Wir können seit Jahren Anpassungen in ihrem Verhalten beobachten, z.B. Social Grin oder auch eine Zunahme von für den Menschen identifizierbare Vocalisationen.

Täglich sehe ich Hunde, die den Trainingskontext in der Sekunde erkennen, in dem sie aus dem Auto steigen. Nahezu alle Menschen können berichten, dass sich ihr Hund je nach Bezugsperson und Kontext anders verhält. Ständig erzählen mir Menschen, dass ihr Hund neue Ideen entwickelt hat, um Ziele zu erreichen.

Aber ausgerechnet, wenn sie Probleme machen, wird ihnen die Fähigkeit abgesprochen, eigene Entscheidungen zu treffen. Immer wieder höre ich, dass Menschen ihrem Hund helfen wollen. Dass sie ihm erklären möchten, dass sie Dinge für ihn regeln können. Kurz, dass Hunde unfähig sind, von alleine auf blöde Ideen zu kommen.

 

Weiterlesen:

Edelmann, W. (2000). Lernpsychologie (6. Aufl.). Beltz.
Lefrançois, G. R. (2015). Psychologie des Lernens (4. Aufl.). Springer.
Bekoff, M. (2001). Social play behaviour: cooperation, fairness, trust, and the evolution of morality. Journal of Consciousness Studies, 8(2), 81–90.
Bekoff, M. (2002). Minding Animals: Awareness, Emotions, and Heart. Oxford University Press.
Gagné, R. M., Briggs, L. J., & Wager, W. W. (1992). Psychology of Learning for Instruction (4./5. Aufl.). Harcourt Brace Jovanovich.
Hare, B., Call, J., & Tomasello, M. (1998). Communication of food location between human and dog (Canis familiaris). Evolution of Communication, 2(1), 137–159.
Kaminski, J., Call, J., & Tomasello, M. (2004). Body orientation and face orientation: Two factors controlling apes’ begging behavior from humans. Journal of Comparative Psychology, 118(1), 55–62.
Koffka, K. (1935). Principles of Gestalt Psychology. Harcourt, Brace & World.
Köhler, W. (1947). Gestalt Psychology (2. Aufl.). Liveright.
Margraf, J. (2000). Lehrbuch der Verhaltenstherapie (Bd. 1). Springer.
Miklósi, Á. (2015). Dog Behaviour, Evolution, and Cognition (2. Aufl.). Oxford University Press.
Neisser, U. (1967). Cognitive Psychology. Appleton-Century-Crofts.
Piaget, J. (1952). The Origins of Intelligence in Children. International Universities Press.
Sherrington, C. S. (1906). The Integrative Action of the Nervous System. Yale University Press.
Skinner, B. F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century.
Skinner, B. F. (1953). Science and Human Behavior. Macmillan.
Thorndike, E. L. (1911). Animal Intelligence. Macmillan.
Thompson, R. F., & Spencer, W. A. (1966). Habituation: A model phenomenon for the study of neuronal substrates of behavior. Psychological Review, 73(1), 16–43.
Watson, J. B. (1913). Psychology as the Behaviorist Views It. Psychological Review, 20(2), 158–177.
Wertheimer, M. (1945). Productive Thinking. Harper & Brothers.
Wolpe, J. (1958). Psychotherapy by Reciprocal Inhibition. Stanford University Press