Operante Konditionierung – Die Portion gesunder Egoismus

Operante Konditionierung – Die Portion gesunder Egoismus

Edward Lee Thorndike – Ein wichtiger Vorreiter

In meinem Artikel “Klassische Konditionierung – Die Macht der Vorhersage” haben wir uns dem Pawlowschen Hund und der Klassischen Konditionierung gewidmet.

1904 erhielt Pawlow für seine Forschung über Verdauungsdrüsen, bei der er auch die Klassische Konditionierung entdeckte, den Nobelpreis. Im selben Jahr wurde einer der bedeutendsten, aber auch kontrovers diskutiertesten Forscher von Lernprozessen geboren: Burrhus Frederic Skinner.

Ehe wir uns um Skinner und die Operante Konditionierung kümmern, wollen wir einen wichtigen Vorreiter jedoch nicht überspringen. Edward Lee Thorndike forschte als Erster an Lernprozessen, welche nicht alleine auf die Klassische Konditionierung zurückzuführen waren. Dreizehn Jahre (1898- 1911) widmete er seine Forschung diesen Prozessen, insbesondere dem Lernen über „Versuch und Irrtum“. Er entwickelte einen Versuchskäfig (die sogenannte Problem- oder Rätselbox) und schloss Katzen darin mit verschiedenen Mechanismen ein. Die Katze versuchte auf verschiedene Arten aus dem Käfig zu entkommen bis sie mehr oder weniger zufällig den Käfig öffnete. Je mehr Versuchsdurchgänge die Katze erlebte, desto zügiger konnte sie den Käfig öffnen. Kam sie aus dem Käfig, wurde sie zudem gefüttert um ihre Verhaltensweise zu „kräftigen“ (Thorndike 1911). Aus seiner Forschung entstand unter anderem das „Gesetz des Effektes“ (law of effect).

Laut dem Gesetz des Effektes wird Verhalten, welches Bedürfnisbefriedigung zur Folge hat, in Zukunft wahrscheinlich häufiger gezeigt. Verhalten, welches zu Frustration geführt hat, wird jedoch wahrscheinlich seltener. Ein wichtiger Grundstein für die operanten Lernvorgänge war entdeckt. Damit wurden erstmalig nicht ausschließlich Reize im Vorfeld eines Verhaltens, sondern auch Reize nach einem Verhalten betrachtet.

Operante Konditionierung – Die Portion gesunder Egoismus

Konditionierungstypen

Skinner griff genau diesen Grundstein auf und forschte systematisch weiter. Grundsätzlich unterschied Skinner in zwei verschiedene Konditionierungstypen. Bei beiden handelt es sich um assoziative Lernformen. Also Lernformen bei denen mehrere Ereignisse miteinander verbunden werden.

Zum einem der „Konditionierung Typ S“ („S“ für Stimulus/Reiz). Hierbei dreht es sich um die altbekannte Klassische Konditionierung bei welcher ein unbedeutender mit einem bedeutenden Reiz verknüpft wird. Zum anderem der „Konditionierung Typ R“ („R“ für Reaktion). Beim Reaktionslernen werden gezeigte Verhaltensweisen mit darauf folgenden Reizen verknüpft. Die auf das Verhalten folgende Reize nennt man Konsequenzen. Verhalten wird, je nach seiner Konsequenz, in Zukunft eher häufiger oder seltener gezeigt. Erstmalig wird damit unter die Lupe genommen, dass Verhalten in Erwartung einer Folge gezeigt wird und Einfluss auf die Umwelt hat.

Begrifflichkeiten der vier Konsequenzen

Jede Konsequenz die das Auftreten des Verhaltens wahrscheinlicher macht, wird als „Verstärker“ bezeichnet. Konsequenzen, welche die Wahrscheinlichkeit verringern als „Strafe“. Innerhalb seiner Forschung entdeckte Skinner, dass jedoch nicht nur das Hinzufügen von Konsequenzen Verhalten beeinflusst, sondern auch das Wegnehmen. Wurden angenehme Konsequenzen entfernt, wurde das Verhalten in Zukunft seltener gezeigt, bei der Entfernung von unangenehmen häufiger.

So entstanden die Begrifflichkeiten der vier Konsequenzen: positive Verstärkung, negative Verstärkung, positive Strafe und negative Strafe.

Positive Verstärkung bedeutet, dass der Situation etwas bedürfnisbefriedigendes hinzugefügt wird. Das Verhalten wird stärker, häufiger, länger oder bleibt zumindest erhalten. Dies ist die Basis für ein bedürfnisbefriedigendes und belohnungsorientiertes Training.
Bei der negativen Verstärkung wird Verhalten mehr, weil es dazu führt, dass Unangenehmes entfernt wird und die Situation sich bessert. Im Umkehrschluss bedeutet dies natürlich, dass das Unangenehme zunächst anwesend und als unangenehm wahrgenommen sein muss.
Negative Strafe hingegen funktioniert darüber, dass Angenehmes nach dem Verhalten verschwindet. Die Situation verschlechtert sich für das Individuum. Das Verhalten wird in Zukunft seltener gezeigt um die Verschlechterung zu vermeiden.
Positive Strafe sagt aus, dass etwas Unangenehmes der Situation hinzugefügt wird, auch hier wird das Verhalten schwächer um dem Unangenehmen zu entgehen.
Operante Konditionierung – Die Portion gesunder Egoismus

Fassen wir zusammen

Klassische und Operante Konditionierung sind assoziative Lernformen, die immer und überall stattfinden solange das Individuum lebt. Jedes Individuum lernt immer. Lernprozesse sind nicht entstanden um Hunde zu erziehen, sondern dienen uralten und bedeutenderen Funktionen: Der Anpassung an die Umwelt um zu Überleben.

Klassische Konditionierung ermöglicht dem Individuum die Möglichkeit Vorboten wichtiger Reize zu erkennen. Operante Konditionierung lässt ein Individuum sein Verhalten so anpassen, dass ihm maximale Verstärkung und minimale Strafe widerfährt. Das Streben nach Verstärkung ist ein ganz normaler und biologisch sinnvoller Prozess. Er sichert dem Individuum die bestmöglichen Ressourcen um für sich zu sorgen und sich erfolgreich fortzupflanzen. Dies ist gesunder und biologisch sinnvoller Egoismus.

Oft begegne ich Menschen, die sich damit schwer tun, dass Lernen auf Konditionierung basieren soll. Sie äußern Bedenken, dass es ja dann keine individuelle Note mehr hat, sie vermissen die Bindung, die Individualität und Persönlichkeiten. Näher betrachtet, brauchen wir diese Sorge nicht haben, denn Emotionen und Persönlichkeit spielen eine große Rolle. In den vorangegangenen Zeilen haben wir erfahren, dass es um Bedürfnisbefriedigung, Angenehmes, Unangenehmes und Ressourcen geht. Hier liegt der Schlüssel. Die Bewertung von Reizen und Konsequenzen wird von jedem Individuum vorgenommen. Aktuelle physiologische Bedürfnisse, wie das Stillen von Hunger und Durst, das Abstellen von Schmerz, Hitze, Kälte oder zum Beispiel der Drang nach körperlicher Nähe, Sicherheit, Spiel oder Jagd tragen zur Bildung von Bedürfnissen bei. Wie groß diese ausgeprägt sind, hängt zudem unter anderem mit den genetischen Anlagen, der Persönlichkeit, den gemachten Erfahrungen, der aktuellen Umwelt, sowie dem aktuellen Befinden und der emotionalen Bewertung ab.

Operante Konditionierung – Die Portion gesunder Egoismus

Was bedeutet dieses Wissen für unser Zusammenleben mit unseren Hunden?

Es bedeutet, dass wir das Individuum mit dem wir leben oder arbeiten wollen gut beobachten und kennen sollten. Lernen findet immer statt, man kann es aber nicht beobachten. Erkennen kann man lediglich Verhaltensveränderungen und daraus mögliche Rückschlüsse ziehen. Nun sind wir selten distanzierte Betrachter. Unser persönlicher Blickwinkel beeinflusst Rückschlüsse.

Ein Tagebuch kann Abhilfe schaffen und Sachlichkeit ermöglichen. Da Operante Konditionierung Verhalten in seiner Zeit, Form und Häufigkeit verändert, kann man auf diese Weise aktuelle Begebenheiten ermitteln und Veränderungen rasch feststellen.

Eine weitere Beobachtungsübung besteht darin, dass wir herausfinden was für unsere Hunde von Bedeutung ist, was Verhalten verstärkt und was es schwächt. Der Schwierigkeitsgrad wird hier noch durch den Fluss von Verhalten und Bedürfnissen heraufgesetzt. Nicht in jeder Situation haben die von uns beobachteten Möglichkeiten die gleiche Bedeutung. Eine gute Mensch-Hund-Beziehung lebt auch davon, den anderen in Situationen lesen zu können und seine Bedürfnisse möglichst treffend zu erkennen.

Die Möglichkeiten bei der Arbeit über bedürfnisbefriedigende Belohnungen sind nahezu unbegrenzt, wenn man seinen vierbeinigen Partner gut kennt und es können weit mehr Verstärker eingesetzt werden als Futter oder Lob.

Eine Tücke bei den assoziativen Lernformen ist für uns, dass wir nicht im Vorfeld erkennen können, welche Verknüpfungen gemacht werden. Erst im Nachhinein können wir die Verhaltensänderung feststellen. Dies gilt für die Klassische, wie die Operante Konditionierung.

Skinner hatte, um eindeutige Ergebnisse zu erhalten eine Box („operant conditioning chamber“) erfunden. Heute ist diese besser bekannt als die „Skinner-Box“. In dieser Box konnten Tiere einzelnen Reizen ausgesetzt und mit gezielten Konsequenzen konfrontiert werden. Dabei wurden die Verhaltensänderungen protokolliert. Diese geringe Reizdichte und Kontrolle ist in unserer Umwelt nicht möglich. Nicht nur wir haben unserem Tier viel zu bieten, auch die Umwelt bietet Reize die Verhalten verstärken oder schwächen. Davon entziehen sich einige sogar unserer Wahrnehmung, wie z.B. Gerüche. Diese Tücke macht sich nicht nur im Erhalt und Aufbau von Verhalten, also der Verstärkung, bemerkbar, sondern auch im Abbau. Wird in einer Situation gestraft, so können alle anwesenden Reize via Klassischer Konditionierung mit der Strafe verknüpft werden und das vorangegangene Verhalten geschwächt werden. Strafen sind dabei mit negativen Empfindungen verknüpft, z.B. mit Angst und Frustration.

Operante Konditionierung – Die Portion gesunder Egoismus

Fallbeispiel einer Kundin

Zur Veranschaulichung gucken wir uns dieses Fallbeispiel einer Kundin an. Ihr Hund war im Freilauf versehentlich auf eine Kuhwiese gelaufen, sie pfiff ihn zurück. Der Hund machte sich sofort auf den Weg zu ihr, rannte dabei jedoch in den unter Strom stehenden Zaun und bekam einen Schlag.

In den darauffolgenden Wochen wollte der Hund die Strecke nicht mehr laufen. Sollte er sich seiner Besitzerin nähern, so machte der Hund einen weiten Bogen und näherte sich langsam von hinten oder der Seite. Nutzte sie die Pfeife zuckte der Hund zusammen, senkte die Rute, bekam große Augen und blieb an Ort und Stelle stehen. Die Nähe von Kühen sorgte für die gleichen Verhaltensreaktionen. Einige Tage später reichte es aus, dass die Kundin zur Pfeife griff um ebenfalls die deutliche Angstreaktion zu zeigen. Der Stromschlag war vom Hund mittels Klassischer Konditionierung mit dem Pfiff und den Kühen verknüpft worden. Das Verhalten auf seine Bezugsperson zuzulaufen war gestraft worden. Die Klassische Konditionierung hatte begonnen Kreise zu ziehen und bereits der Griff zur Pfeife war als Vorbote für den Pfiff erkannt.

Nicht immer sind Verbindungen so deutlich sichtbar wie in diesem Fall. Oft ist es auch einfach ein stagnierendes Training, welches uns darauf aufmerksam macht, dass etwas mit den Konsequenzen nicht zu unserem Ziel passt. Solange beispielsweise unerwünschtes Verhalten weiterhin verstärkt wird, wird es nicht weniger und unser Training kommt nicht gut voran. Die Kunst ist es, einem unerwünschten Verhalten Verstärkungsmöglichkeiten zu entziehen und parallel alternativen Verhaltensweisen ausreichend Verstärkung zukommen zu lassen. So haben wir die gute Möglichkeiten an Verhalten zu arbeiten ohne die unerwünschten Nebenwirkungen von Strafe aufkommen zu lassen.

Operante Konditionierung – Die Portion gesunder Egoismus

Postive/ negative Verstärkung/ Strafe

Durch Wiederholungen kann das Tier herausfiltern, welches Verhalten in welcher Situation zu Belohnungen führt. Es kann Stück für Stück alle notwendigen Faktoren assoziieren. Bestimmte Werkzeuge, wie z.B. das Markersignal, helfen uns die Wahrscheinlichkeit der von uns gewünschten Assoziation zu erhöhen. Sie wirken als Brücke zwischen dem Verhalten und der Konsequenz. Über das Markersignal haben wir eine punktgenaue Möglichkeit dem Tier mitzuteilen, dass das aktuelle Verhalten eine Belohnung von uns bedeutet. Im Gegensatz zur Strafe ist positive Verstärkung mit freudigen Emotionen verknüpft und kann unbedenklich eingesetzt werden, ob sie zielführend ist, hängt von der Umsetzung und den äußeren Faktoren ab. Auch negative Verstärkung kann effektiv im Training eingesetzt werden. Auf Grund der schwierigen Ausgangssituation für das Tier, in der es durch sein Verhalten Erleichterung erfährt, sollte sie jedoch sehr bedacht und dosiert eingesetzt werden. Auch das Ausbleiben einer erwarteten Strafe kann als negative Verstärkung eingeordnet werden. Da der Verhaltensaufbau logischerweise nur durch Verstärkung geschehen kann, ist dies der Grund, weshalb häufig gestrafte Hunde bestimmte Verhaltensweise schnell lernen und zeigen.

Alle Konsequenzen kommen im Leben eines Individuums vor. Positive Verstärkung sorgt für freudige Emotionen und Bedürfnisbefriedigung, negative Verstärkung für Erleichterung, negative Strafe für Frustration und positive Strafe in der Regel zu Angst. Auf Grund der möglichen Fehlverknüpfungen in Kombinationen mit Angst sind die potentiellen Nebenwirkungen von positiver Strafe besonders hoch. Fehlverknüpfungen der positiven Verstärkung hingegen haben als Nebenwirkung keine Angst zur Folge. Die Fehlverknüpfungen von positiver Verstärkung lassen sich in der Regel durch ein strukturiertes Training schnell beseitigen. Schnelligkeit ist ein weiteres Thema im Training. Häufig wird behauptet, dass Training an unerwünschtem Verhalten über Strafe schneller und effektiver sei. Hierzu gibt es bisher jedoch keine aussagekräftigen Studien. Da ein Hund nicht nichts tun kann, muss im Falle der Arbeit über Strafe ebenfalls ein Alternativverhalten aufgebaut werden. Hunde lernen schnell wie sie Strafe entgehen können, ob sie dadurch erwünschte Verhalten zeigen oder sich einfach auf andere Art der Strafe entziehen z.B. indem sie sich dem vermeintlichen Auslöser für Strafe nicht mehr nähern, das liegt nicht in unserer Macht.

Operante Konditionierung – Die Portion gesunder Egoismus

Mein Fazit

Für mich ist das Fazit daher eindeutig: Ich bevorzuge das Training über positive Verstärkung. Ein systematisches und strukturiertes Training, angepasst an die Umwelt in der Hund und Halter leben und welches den Spaß und die Bedürfnisse aller berücksichtigt.

Training über negative Verstärkung hat ebenfalls seine Daseinsberechtigung. Der Einsatz wird jedoch genau abgemessen. Meine Hunde werden auch durchaus mit negativer Strafe konfrontiert, auch wenn diese nicht auf dem Trainingsplan steht. Bei uns heisst es zum Beispiel: „Wer bellt geht rein“. Der Freilauf im Garten ist schnell beendet, wenn einer am Zaun Randale macht. Allerdings weiß ich dann auch, dass ich eine Lerngelegenheit verpasst habe, um meinen Hunden über positive Verstärkung ein für mich angenehmeres Verhalten beizubringen.

Positive Strafe habe ich bei keinem meiner Tiere bisher bewusst angewendet. Ich hoffe, dass meine Tiere dies bestätigen würden und die gleiche Bewertung haben – mein Trainingstagebuch behauptet es zumindest.

In diesem Sinne wünsche ich viel Spaß beim Konditionieren, Beobachten und Protokollieren zum Aufbau einer soliden Mensch – Hund – Beziehung!

Du bist interessiert an weiteren wertvollen Inhalten rund um deinen Hund? Dann abonniere hier gern meinen Newsletter und bestelle dir regelmäßige Infos direkt in dein Postfach.

Meine besten Tipps, Tricks und Ideen direkt in Dein Postfach.

Trage dich hier zu meinem Newsletter ein und erhalte ungefähr wöchentlich E-Mails mit Anregungen, Angeboten und wertvollen Inhalten als Dankeschön. Details zum Newsletterversand findest du in der Datenschutzerklärung.

Jetzt teilen:

Weitere interessante Themen

#03 Warum du Stress nicht ignorieren solltest

#03 Warum du Stress nicht ignorieren solltest

Stress und der Umgang damit scheint die Hundewelt zu spalten. Auf der einen Seite hören wir „Setz dem Hund bloß keinen Stress aus, das ist schädlich“. Und auf der Anderen: „Stress gehört nunmal zum Leben, da muss er durch“.

mehr lesen