オペラント条件づけ、または道具的条件づけと呼ばれる学習について説明します。
用語:
オペラント条件づけとは、Skinner,B.F(スキナー)が発見した「自発的な行動」に対する条件づけです。
自発的、もしくは道具を使った反応(行動)に対して、強化刺激(餌など)を与えて、その行動の生起確率を増加させます。
オペラント条件づけは、道具的条件づけともいわれ、刺激でなく、行動に対する学習を説明しようとするものです。
オペラント条件づけでは、自発的に生じた行動を「オペラント行動」といい、これに弁別刺激と強化刺激を随伴させ、反応の頻度や内容を変容させる条件づけを行います。
弁別刺激とは、行動の手がかりとなる刺激であり、「弁別刺激を受けたときにオペラント行動をすること」について強化が行われます。随伴(ずいはん)とは、ある物事に伴って起こることです
オペラント条件づけでは、オペラント行動の頻度が高くなることを「強化」といい、その強化刺激(ここでは餌がでること)を「強化子」といいます。
※ オペラント行動の対象としては、中枢神経系が関与する随意反応(意志によって動かすことのできる反応)のみとなる。
オペラント条件づけの実験で用いられていたのが「スキナー箱」(ねずみ用とハト用がある)です。
スキナー箱の実験では、ブザーが鳴ったときに偶然ねずみがレバーを押すと餌が出てくるようにしておき、ブザー(弁別刺激)が鳴ったときにねずみがレバーを押す行動(オペラント行動)を測定します。
スキナー箱の実験のように「弁別刺激(ブザー)」-「反応(レバーを押す)」-「反応結果(餌が得る)」の3つの項からなる連鎖のことを「三項随伴性」と呼びます。
行動分析学では、この三項随伴性に基づいた分析を「ABC分析」と呼びます。
オペラント条件づけにおいて、「強化」は行動の自発頻度が増える変化を意味します。
「弱化」または「罰」は、行動の自発頻度が減る変化を意味します。
また、自発行動の結果に伴う刺激は、「好子(こうし)」と「嫌子(けんし)」と呼ばれます。
刺激である好子・嫌子が出現する事は「正」、消失する事は「負」で表され、正と負の強化・弱化(罰)の関係は下表のようになります。
刺激 | 好子(快刺激) | 嫌子(不快刺激) |
---|---|---|
刺激出現:正 | 正の強化 お菓子がもらえるので(快刺激出現)、宿題する頻度が増加(強化) | 正の弱化/正の罰 叱られるので(不快刺激出現)、走り回る頻度が減少(弱化/罰) |
刺激消失:負 | 負の弱化/負の罰 お菓子が無くなるので(快刺激消失)、遅くまで遊んでくる頻度が減少(弱化/罰) | 負の強化 叱られないように(不快刺激消失)、言う事を聞く頻度が増加(強化) |
「報酬」とは、条件づけにおいて、「正の強化」に対する刺激(好子)のことです。上記例では「お菓子」にあたります。
一方、「負の強化」に対する刺激のことを「負の強化刺激」と呼びます。上記例では「叱られる事」にあたります。
オペラント条件づけの方法に関する用語を説明します。
強化スケジュールとは、オペラント行動に対して、どのように強化子を提示するかということを指します。
毎回強化することを「連続強化」、時々強化することを「間欠(間歇)強化」または「部分強化」といいます。間欠強化の方が消去されにくいとされます。
スモールステップとは、Skinner,B.F が提唱した手法で、行動を細分化して強化するやり方をいいます。
シェイピングとは、習得が望まれる行動をスモールステップに分けて、容易なものから近い行動を取った時、その行動を強化することで、行動形成を促し、逆に離れた行動を取った時は強化を与えません。
「オペラント水準」とは、行動変容以前の自発的行動であるオペラント行動の出現頻度のことです。
漸次接近法とは、オペラント水準の高い類似の反応から順次強化していく方法をいいます。
道具的条件づけとは、Thorndike,E.L.(ソーンダイク)が研究行った条件づけです。厳密には、オペラント条件づけと道具的条件づけは異なります。
道具的条件づけの研究では「離散オペラント手続き」と呼ばれ、試行を単位として、「特定の行動」によって強化子を得られるような問題箱が用いられます。「猫の問題箱」が有名です。
一方、「自由(フリー)オペラント手続き」は、自由な行動ができ、自発的な行動に対して強化子を与える手続きです。スキナーの研究が該当し、この手続きによる学習をオペラント条件づけと呼ばれます。
「特定の行動」と「自由な行動」が両者の条件づけの違いです。
<補足> 通常、オペラント行動は機能的に定義され個々の運動の差異を考慮しません。そうした個々の物理的性質は反応トポグラフィとして記述されます。
(詳細:▼ 反応トポグラフィ)