Una cosa che ho notato spesso nella mia carriera di istruttore cinofilo è una certa tendenza alla fissità nel premiare i cani sia da parte dei proprietari che degli istruttori più giovani. Cosa intendo quando parlo di fissità? Intendo la tendenza a rinforzare il cane durante il lavoro sempre nello stesso modo utilizzando sempre lo stesso cibo (pensate che non riesco più a mangiare la pizza con i würstel a causa delle centinaia di proprietari che si sono presentati al campo con i würstel come premio per i cani) o lo stesso gioco indipendentemente dal lavoro che il cane sta facendo e dalla quantità di energia, fisica e mentale, necessaria per eseguire l’esercizio.
sverige-ed.comLa scienza ci viene in aiuto descrivendo i cosiddetti piani di rinforzo. Prima di tutto, cosa significa premiare il cane? L’atto di premiare il cane è definito in gergo tecnico come “rinforzo positivo”. Un rinforzo è qualcosa che aumenta o mantiene la frequenza di un comportamento, un rinforzo positivo consiste nell’aggiungere una conseguenza gradita (come cibo o gioco) al comportamento del cane per aumentare la probabilità che quel comportamento venga mostrato più frequentemente in futuro. Quando chiedi al tuo cane di ‘sedersi’ e lui si siede, il rinforzo positivo è il biscotto che gli dai come premio per essersi seduto.
slovenska-lekaren.comTorniamo ai piani di rinforzo: in quanti modi diamo la ricompensa ai nostri amici a quattro zampe?
I parametri del rinforzo sono la forza, la quantità e la durata. È necessario regolare uno o più parametri del rinforzo a seconda del comportamento da rinforzare. Per esempio, non appena si aumenta lo sforzo richiesto per completare una risposta, sarà probabilmente necessario aumentare la forza del rinforzo. Anche il piano di rinforzo contribuisce a questo. Un piano di rinforzo, o schema, è la regola che descrive o specifica quali risposte saranno seguite da un rinforzo e quali no. I piani di rinforzo sono tempi e relazioni numeriche tra una risposta e un rinforzo. Ogni risposta rinforzata è associata ad uno schema di qualche tipo.
Ai confini degli schemi di rinforzo abbiamo uno schema di rinforzo continuo da un lato e l’estinzione dall’altro. Nello schema di rinforzo continuo tutte le risposte specifiche sono rinforzate. Il rinforzo viene dato ogni volta che la risposta si verifica. All’estremo opposto abbiamo il piano di estinzione che in realtà rappresenta uno schema di non-rinforzo in cui nessuna ripetizione del comportamento viene rinforzata.
Tra questi due schemi di base ci sono miriadi di piani di rinforzo intermittenti. Il rinforzo intermittente significa che alcune risposte sono rinforzate, altre no. Alcune sono semplici, altre complesse e alcune sono composte.
Il rinforzo continuo è generalmente usato per stabilire o rinforzare i comportamenti. Il rinforzo intermittente è generalmente usato per mantenere comportamenti già costruiti.
Nei modelli basati sulla frequenza, il rinforzo è fornito dopo un certo numero di risposte. Negli schemi basati sull’intervallo, il rinforzo viene rilasciato per la prima risposta dopo una certa quantità di tempo dal precedente rinforzo.
Nei pattern fissi il numero di risposte o il tempo rimangono gli stessi. Nei pattern variabili il numero di risposte o la quantità di tempo sono casuali ma ruotano intorno a un certo valore.
Vediamo alcuni esempi:
- Una moneta viene messa nel salvadanaio ogni cinque piatti lavati da Marco. FREQUENZA FISSA
- Una moneta viene messa nel salvadanaio ogni cinque piatti lavati da Marco. Poi ogni dopo tre piatti, poi dopo sei. FREQUENZA VARIABILE
- Laura loda il suo cane perché sta giù. Torna dopo cinque minuti e loda il suo cane non appena lo vede a terra. INTERVALLO FISSO
- Laura loda il suo cane perché sta a terra. Torna dopo cinque minuti e loda il suo cane non appena lo vede a terra. Poi torna dopo tre minuti. Poi dopo quattro INTERVALLO VARIABILE.
Il tempo, il numero e la contingenza contribuiscono a rendere prevedibili i modelli di comportamento. Nei piani fissi, le risposte tendono a fermarsi dopo il rinforzo o ad esplodere. Negli schemi variabili, le risposte diventano stabili e non ci sono pause tra le risposte.
Gli schemi basati sulla frequenza producono frequenze di risposta più alte degli schemi basati sugli intervalli. Negli schemi a FREQUENZA FISSA, noti anche come tutto/nulla, una pausa di risposta si verifica immediatamente dopo un rinforzo, seguita da un’esplosione di risposta. Le pause tendono a diventare sempre più lunghe.
Nei pattern a FREQUENZA VARIABILE, si ottiene un comportamento di risposta stabile e ad alta frequenza. Un modello a INTERVALLO FISSO si traduce in una pausa nella risposta immediatamente dopo il rinforzo, seguita da un graduale aumento della frequenza di risposta che raggiunge un picco vicino al rinforzo. Un modello a INTERVALLO VARIABILE produce risposte stabili con una risposta a frequenza bassa/moderata.
Pensate al gioco d’azzardo: le persone sviluppano dipendenze perché non sanno mai cosa li aspetta in quella scommessa. Potrebbe essere una grande vincita, una discreta vincita o una perdita. Inoltre, un fattore chiave nello sviluppo della dipendenza è anche l’attesa: le slot machine, pur avendo già il risultato pronto quando viene inserita la moneta, creano una suspense di musica e luci che creano un “effetto magico” che attrae il giocatore.
Con il cane è nostro dovere ricreare questa situazione di “slot machine“: in questo modo avremo partner entusiasti e sempre pronti a lavorare.
Tuttavia, vorrei concludere questo breve articolo con un suggerimento: utilizzare la variabilità del rinforzo inteso come variabilità di tipologia. A volte la palla, altre volte la salsiccia, altre volte una carezza, altre volte un biscotto e così via. Vi consiglio di non rinforzare solo alcune risposte corrette del cane e ignorare le altre perché questo può portare alla frustrazione.
E ricordate… il rinforzo è un processo, non un istante. Gioca con il cane, divertiti con lui senza sentirti a disagio. Lui non ti giudica.