■ 学習 013 強化スケジュール ■
▼ 1. 部分強化(partial reinforcement)
反応が時々しか強化されない(無強化の時も)。例えば、釣竿をおろしても時々しか、魚はかからない。
▼ 2. 連続強化(continuous reinforcement)
反応か毎回強化される。
▼ 3. 部分強化消去効果(partial reinforcement extinction effect)
部分強化で訓練された行動は、連続強化で訓練された行動よりも消去しにくい。
強化と無強化の組み合わせを強化スケジュールという。基本的な強化スケジュールは、次の2要因の組み合わせによる。
A. 間隔か比率(回数)か?
ある強化から次の強化までの間隔を反応回数(ratio)に基づくか、時間間隔(interval)に基づくか
B. 規則的か不規則か?
ある強化から次の強化までの間隔を規則的(fixed)にするか、不規則(variable)に行うか
まとめると、次の各2要因で2×2のマトリックスが出来上がる
A= 時間間隔(I)・回数比率(R)
B= 規則固定(F)・不規則変動(V)
↓
1. 固定間隔強化スケジュール(FI)
2. 変動間隔強化スケジュール(VI)
3. 固定比率強化スケジュール(FR)
4. 変動比率強化スケジュール(VR)
▼ 4-1. 部分強化消去効果(partial reinforcement extinction effect)
▼ 1. 固定間隔(FI)スケジュール
一定時間経過後の最初の反応に対して、強化が与えられるスケジュール。例えば、ラットがレバーをおいてエサをあげたら3分間は与えない。3分たってレバーを押したら、エサをあげて3分間は与えない。
※累積反応曲線の特徴は、強化あたりほぼ一定数の反応をすること(=スキャロップ現象)
例えば、時間が決まっている仕事で、終わりの時間近くになると時計をみる
▼ 2. 変動間隔強化(VI)スケジュール
設定した時間間隔が経過してからの最初の反応に対して、強化を与えるが、時間間隔の設定は毎回様々に変化する。但し、それらの平均値は一定となるように定められる。例えば、釣り、話し中の多いTel、郵便受けを除くなど。
※累積記録の特徴は、スキャロップのような反応休止ではなく、常にほぼ一定の自発頻度で反応する。消去抵抗は高い。
▼ 3. 固定比率強化(FR)スケジュール
10回レバーを押したらエサを出すというように、一定の反応回数ごとに強化が与えられるスケジュール。例えば、出来高払いの仕事。
※累積記録の特徴は、強化後一定時間の反応休止が生じる。
▼ 4. 変動比率強化(VR)スケジュール
反応回数に基づいて強化が与えられるが、その回数は毎回様々に変化する。但し、それらの平均値は一定となるように定める。例えば、スロットやパチンコなどがこれにあたる。
※累積記録の特徴は、反応率が非常に高くなり消去に移っても、なかなか反応がなくてはならない。反応休止はない。
※比率強化スケジュールでは、反応が大変速い(burst)傾向がある。これは早く反応すればするほど、速く報酬が得られるからである。
最近のコメント