强化程序是指强化物(即奖励或惩罚)出现的时机和频率。根据不同的分类标准,强化程序可以分为以下几种类型:
连续强化程序
定义:在每一次适当反应之后都给予强化。
例子:例如,对于一个有不准时上课习惯的学生,每次他准时上课,教师都会表扬他这种行为。
间断强化程序
定义:并不是对每一次理想行为都给予强化,但强化的次数应足以保证行为能够重复出现。
分类:
时间间隔间断强化:根据不同的时间间隔进行强化,例如上班族不是每次工作都领薪水,而是每月另一次薪水。
频率间隔间断强化:根据不同频率间隔进行强化,例如每完成100个零件加工,给一次薪水提成。
固定比例强化
定义:根据学习者作出适当反应的固定次数来安排强化。
例子:例如,每完成5次正确回答,给予一次奖励。
可变比率强化
定义:根据学习者作出适当反应的次数在一段时间内的平均值来安排强化,但具体每次强化的时间间隔不固定。
例子:例如,教师在课堂中随机提问学生,学生回答正确后获得奖励,但具体提问的时间间隔不固定。
固定间隔强化
定义:按照固定的时间间隔对操作性反应进行强化。
例子:例如,每隔5分钟或10分钟就给予一次强化。
变化间隔强化
定义:只规定一个平均时距,但每次强化之间的具体时间间隔不固定。
例子:例如,教师说一节课会提问三次,但具体提问时间不确定。
这些强化程序各有其特点和应用场景,选择合适的强化程序对于塑造和保持某种行为至关重要。