Istota szkolenia pozytywnego

Czyli dlaczego pozytywne wzmocnienie nie wyklucza ukarania.

Istota szkolenia pozytywnego
Photo by Andrés Gómez / Unsplash

Victoria Stilwell przekornie napisała pewnego dnia, że (i dlaczego) nie jest stricte pozytywną trenerką oraz że nigdy taką nie była ¯\_(ツ)_/¯

Żargonowy zwrot "szkolenie pozytywne" pojawił się wraz z potrzebą wskazania na metodę polegającą na współczesnej wiedzy naukowej z zakresu behawioryzmu, gdzie nagroda ma być motywacją dla testowanego/szkolonego/wychowywanego zwierzęcia – metodę przeciwstawną tradycyjnie stosowanym rozwiązaniom, bazującym na karceniu za niewłaściwe zachowanie jako priorytecie.

Według Pameli Dennison, (od której czerpałam wiedzę rozpoczynając swą praktykę trenerską) pozytywny proces treningowy winien opierać się na dokładnie przemyślanym posługiwaniu nagrodami w celu nakłonienia psa (lub innego szkolonego zwierzęcia) do zachowania zgodnego z oczekiwaniami. Taki styl trenowania wymaga konsekwencji i sztywnych założeń:

  • Nagradzane zachowanie z założenia powinno się powtórzyć.
  • Nienagradzane zachowanie powinno zanikać (wygasać).
  • Wyuczone (intuicyjnie powtarzane) zachowanie powinno być utrwalane (generalizowane) poprzez niejednostajne nagradzanie (za losowym razem i/lub z różną intensywnością/ilością/mocą form wzmacniania).

Szkolenie 'pozytywne', w kontekście podręcznikowym, polega na manipulowaniu nagrodą – zastępuje nią "tradycyjne" taktyki oparte na poczuciu awersji i/lub nacisku fizycznych bądź psychicznym.

Przykładowo:
P+ skarcenie psa za to, że skacze na powitanie
P- ignorowanie skaczącego psa, dopóki nie zaprezentuje innego zachowania
R+ pogłaskanie psa wtedy, kiedy nie skacze
R- wyprowadzenie psa do innego pomieszczenia, izolacja dopóki się nie uspokoi

Warto zauważyć, jak mocno współpracują ze sobą R+ i P- (komplet metod 'pozytywnych') na podanym przykładzie.

Engram, esej o psie
Engram to ślad pamięciowy, utworzony przeżyciem z udziałem zmysłów.Jaki typ śladów pamięciowych cechuje psa wchodzącego na plac treningowy, na którym był przedtem skarcony? Które efekty namiastki wspomnień mogą dać o sobie znać?Rozważmy hipotetyczną sytuację..

Z behawioralnego punktu widzenia szkolenie 'pozytywne' oparto na wiedzy o warunkowaniu [1] i na jej praktycznym zastosowaniu, dzięki czemu zwierzę uczy się i zapamiętuje – bierze czynny udział (poczucie sprawczości), zamiast być wyłącznie posłuszne (rygor szkoleniowy).

Sens warunkowania trafnie ujął prof. Clyve Wynne, naukowiec od lat studiujący etologię kognitywną zwierząt (w tym psy i wilki).

Umiejętność dostrzegania związków przyczynowo - skutkowych w otaczającym nas świecie jest prostym, lecz czasem niezwykle ważnym mechanizmem, którym zwierzęta kierują się w życiu. […] Taka forma uczenia się nosi nazwę uczenia skojarzeniowego i jest to jeden z najlepiej zbadanych obszarów w psychologii zwierząt.

Reasumując:

  • Uzasadnione historycznie szkolenie tradycyjne opiera się na tzw. „karze pozytywnej“ celem wygaszenia niechcianego zachowania, opcjonalnie na wzmacnianiu poprzez uniknięcie przykrości przez zwierzę.

Z reguły będzie to zarządzanie dyskomfortem; nieprzyjemnym poczuciem strachu, stresu, frustracji, w skrajności bólem (bodziec awersyjny, presja, sygnał dezaprobaty, narzędzia "korekcyjne").

  • Postępowe współczesne szkolenie korzysta ze wzmocnienia 'pozytywnego' opartego na nagradzaniu pożądanych zachowań, gdzie wyeliminowaniu niechcianych służy ignorowanie oferowanego zachowania lub zaniechanie nagrody, a konsekwencji modyfikacja zachowania na właściwe.

Tu decyduje szansa wyboru; uruchamia w zwierzęciu kreatywne myślenie, motywuje do świadomego wyboru reakcji / zachowania (motywator, sygnał nagrody, pochwała).

Na przekór mitom:

'Pozytywne' metody – tj. oparte na wzmacnianiu nagradzaniem – NIE SĄ pozbawione jakiejkolwiek presji, połączone z bezkarnością, nieobecnością dowolnego mechanizmu asertywnego. Wycofanie nagrody albo zignorowanie oferowanego zachowania – tak samo dyscyplinują zwierzę (stres, frustracja), lecz zostawiają furtkę na szukanie alternatyw (presja bez strachu, opcja rezygnacji), wykluczone w ramach standardowej 'korekty' zachowania przez skarcenie. Odtąd zwierzę ma wpływ na rezultat wykonanego zadania.

1) Korzystaj z pozytywnego wzmocnienia (opcjonalnie z negatywnego wygaszania, skoro już o nim wiesz).
2) Unikaj zastraszania, karcenia albo innych fizycznych korekt pozostających w relacji z elementami strachu.
3) Zasięgnij teorii celem rozwiania wątpliwości dotyczących pojęcia "dominacji".
4) Uszanuj psi punkt widzenia w trakcie sesji treningowej.

— tyle Victoria Stilwell. I ja. 🐾

Etyka, elektryczność, obroże
O zbieżnościach i kontrastach, aspektach moralnych i naukowych. O obrożach i ogrodzeniach elektrycznych.

[1] W praktyce mówimy o warunkowaniu mieszanym.
– Warunkowanie klasyczne zostało odkryte przypadkowo, przez rosyjskiego fizjologa Pawłowa, będącego wówczas w toku innych badań. Jest procesem nauki polegającym na tworzeniu bezpośrednich asocjacji pomiędzy dwoma bodźcami/zdarzeniami albo pomiędzy bodźcem/zdarzeniem a towarzyszącymi mu emocjami. Mogą to być zarówno odruchy warunkowe (wyuczone), jak i bezwarunkowe (fizjologiczne, wrodzone).
Warunkowanie instrumentalne angażuje świadomość (pamięć, procesy myślowe, struktura mózgowa). Polega na intencjonalnym tworzeniu związków pomiędzy bodźcem/zachowaniem a reakcją na bodziec/konsekwencją zachowania.

Źródła:
"Szkolenie pozytywne psów dla żółtodziobów" Pamela Dennison
"Tajemnice umysłów zwierząt" Clyve Wynne

Why I’m Not (and never have been) a Purely Positive Dog Trainer