强化对提高行为反应的频率具有十分重要的作用。但是要想运用它进行行为训练,就必须在训练的过程中让目标行为至少出现过几次。
相反,当狗狗达不到目标行为或者无法直接出现某个行为,则该行为的出现频率就无法被增加、强化。
因此,遇到这种情况,就需要操作条件强化原则使目标行为或某个行为出现并强化,即行为塑造。
什么是行为塑造?
行为塑造是在斯金纳博士操作条件作用的理论上演化而来,
是用来塑造狗狗无法直接作出目标行为的手段,使狗狗的目标行为不断接近,而最终做出这种目标行为的逐步强化过程。
行为塑造又称连续逼近法,是对目标行为的一系列连续动作的趋近和不断强化,最终使狗狗做出目标行为并稳定下来。
行为塑造在狗狗的训练中应用很多,
如飞盘狗狗的训练过程:
让狗狗对玩具(球、绳结)感兴趣→学会追逐玩具→学会衔取玩具换回→培养狗狗玩飞盘→近距离接飞盘→远距离接飞盘。
这一系列过程中,形成了一连串的动作。
同时训犬师对狗狗接飞盘过程中的每一阶段的进步,都应感到开心并及时给予鼓励,这个过程就是强化,这是一个循序渐进的,逐步强化的过程。
行为塑造的特点
关联的阶段性
行为塑造一般用于比较复杂的行为。一个复杂的行为只靠一个步骤是很难到达目标行为的。
因此在行为塑造的过程中,常把最终的目标行为分解成一个个相互联系的阶段性的目标行为。
如狗狗学装死的过程可以细化为以下阶段性的目标行为:
狗狗来到我身边→在我身边坐下→在我身边卧下→在我身边侧躺→在我身边完全躺下→在我身边躺下并能保持一段时间→到最后人离开了狗狗依旧躺着保持不动。
在阶段性的目标行为中,第一阶段目标行为也是初始行为,是一种最简单的行为训练阶段,是狗狗很容易就能获得的行为。
人离开了狗狗依旧躺着保持不动是最终的目标行为,
因此最后一个阶段的目标行为也叫终点目标行为,是塑造结果最终要达到的目标行为。
逐步渐进性
行为塑造过程中每一阶段的目标行为都是相互联系的,是一种连续的趋近行为,只有在前一行为完成的基础上,才能进入下一个目标行为,这样就形成了一系列的逐步的推进的过程。
如训练狗狗捡回球:
将狗狗带到一个安静的房间,在房间里某个地方放一个球。
这个训练塑造过程的步骤就是:
狗狗看向球的方向→移动接近球→触碰到球→嘴巴碰球→嘴巴叼起球→球在嘴巴里保持不掉→叼着球往回走→将球吐在人的手上。
狗狗只有看向球的方向后才有可能去接近球,
在有了接近球的行为动作后,才有可能去触碰球,以此类推,最终逐步到达终点目标行为。
行为塑造的过程,实际上就是从最简单,最易被狗狗获得的动作开始,一步一步地朝着最终的目标行为行进的过程。
兼用强化与消退策略
在行为塑造过程中,每个阶段的趋近目标行为实际上都是一种新行为。
狗狗每到达一个预定的阶段性目标,训练师都要给予强化。
当强化到一定程度的时候,训练师就会停止强化,这往往会导致行为的消失,实际上这一过程就是行为消退的过程。
当然,停止强化的主要目的是为了进入下一阶段性目标行为。
如当狗狗第一次主动去触碰飞盘时,主人会非常开心的抱紧狗狗,和他拔河以及给予食物,
这实际上就是对狗狗的一种强化,得到强化信息的狗狗会继续表现出类似的行为。
最初几次,训犬师会继续给予及时的回应来强化。
当训犬师觉得不在需要在对单纯的触碰飞盘进行强化时,如果狗狗还继续出现只是触碰飞盘,训犬师就不要回应了,
因为如果在继续强化下去,狗狗只会做出那种单纯的触碰飞盘行为,不再会发生叼起飞盘或带着飞盘回到主人身边行为。
同样的,当狗狗做出几次单纯触碰飞盘都得到不训犬师的回应时,狗狗就会失去继续做出这种触碰行为的兴趣。
有时训犬师要用一些方法教会狗狗学会叼起飞盘行为。
比如模仿学习,在学习狗狗面前强化其他狗狗叼起飞盘的行为。有些狗狗会试图学习其他狗狗如何叼起飞盘,想得到训犬师的积极回应。
在狗狗叼起飞盘,训犬师要及时给予积极回应。此时,这个过程就是对狗狗出现叼飞盘新行为的强化。