この記事のタイトルでもある「正の強化 負の強化 正の罰 負の罰」という検索ワードで、当ブログに飛んで来られる方が多いようです。
これまでにも何度か解説したような覚えがあるのですが、きちんと解説していなかったような覚えもあるので、ちゃんと解説してみます。
あと、思い切り間違った解釈を書いているサイトもあるので、その誤解を解くことも目的の一つ。


■随伴性

この「正の強化 負の強化 正の罰 負の罰」というのは、行動随伴性の基本の4種類です。※1

「行動随伴性」というのは、ものすごく簡単に言うと…

  きっかけ → 行 動 → 結 果

この3要素の一連の流れのことを言います。
ちなみに、この随伴性のことを「三項随伴性」と呼びます。

  チャイムが鳴る → 吠える → 叱られる

こういう感じですね。

また、近年では「随伴性ダイアグラム」という概念も出てきています。
上の「チャイムが鳴って吠える」の流れを、随伴性ダイアグラムで記述すると↓のようになります。

  叱られていない → 吠える → 叱られる

こうして見比べると、ちょっと書いている内容が違うことが分かって頂けると思います。

とりあえず、この「随伴性」という概念をまずはおさえておいてください。
これが分かっていないと、後々こんがらがります。


※1
近年では、一部の行動分析家から「阻止の随伴性」という概念が提唱されていることもあり、「基本の4種類」と書きました。
「阻止の随伴性」も含めると合計で8種類になりますが、ここでは割愛します。


■強化と罰

行動分析では、「行動が増えた状態」のことを「強化」と呼びます。
そして、「行動が減った状態」のことを「罰」と呼びます。※2

ここで注意したいのは、どちらも「行動が増えたか、減ったかを確認してから、強化なのか罰なのかが決まる」ということです。
時々「褒める=強化」「叱る=罰」という風に解説しているサイトや本を見かけますが、それは完全に間違いなのでご注意を。
仮に褒めていたとしても、行動が減っているのならそれは「罰の随伴性」になりますし、叱っていたとしても、行動が増えているのならそれは「強化の随伴性」になります。


  叱られていない → 吠える → 叱られている

  このような流れでも「吠える」という行動が減っていないのであれば、
  それは「強化の随伴性」ということになる


こんがらがる人は、まずここでこんがらがります。
「叱ってるのに、罰じゃない?褒めてるのに、強化じゃない?え?何?どういうこと?」という風に。
なので、一旦「強化」とか「罰」という言葉のイメージを脇に置いてください。
そして、「行動が増えたら強化。行動が減ったら罰」と、覚えてください。

   「行動が増えた=強化」
   「行動が減った=罰」


ここまではいいですか?

※2
近年では、「罰」という言葉は誤解を招きやすいとのことから、「弱化」という言葉を使う人も増えてきています。


■正と負

次にこんがらがるのが、この「正」と「負」です。
これもまた、「褒める=正」「叱る=負」と覚えている人や、解説しているサイトや本がありますが、違います
この「正」と「負」の見極めは、先ほど出てきた「随伴性ダイアグラム」を使うと、ものすごく簡単になります。

たとえば、↓のような流れがあるとします。

  叱られていない → 吠える → 叱られている

この時見るのは、「行動の前後の刺激・出来事」です。
↑の流れでは、「行動の前には無かった『叱られる』という出来事が、行動の後に出現している」という形になっていますね。
このように「行動の前には無かったものが、行動の後に出てくる流れ」を、「正」と呼びます。
ということは、「負」はその反対の流れになりますので…

  遊んでもらっている → 甘噛みする → 遊んでもらっていない

このように「行動の前に有ったものが、行動の後でなくなる流れ」を、「負」と呼びます。
まとめると、こうなります。
  
  正:行動の前に無かったものが、行動の後に出現している

  負:行動の前に有ったものが、行動の後に消失している



■あとは組み合わせるだけ

「強化と罰」「正と負」を、順番に見てきました。
あとは、これらを組み合わせるだけです。

 正の強化
  →行動の前に無かったものが、行動の後に出現していて、
   その行動が増加・維持されるような流れ

  例:褒められていない → 座る → 褒められている
 
    …今後「座る」という行動が増えたら「強化」
     「褒められる」という出来事が行動の後に出現しているので「正」
     よってこれは、「正の強化」となる


 負の強化
  →行動の前に有ったものが、行動の後に消失していて、
   その行動が増加・維持されるような流れ

  例:叱られている → お腹を見せる → 叱られていない
 
    …今後「お腹を見せる」という行動が増えたら「強化」
     「叱られている」という出来事が行動の後に消失しているので「負」
     よってこれは、「負の強化」となる


 正の罰
  →行動の前に無かったものが、行動の後に出現していて、
   その行動が減少するような流れ

  例:叱られていない → 吠える → 叱られている
 
    …今後「吠える」という行動が減ったら「罰」
     「叱られている」という出来事が行動の後に出現しているので「正」
     よってこれは、「正の罰」となる


 負の罰
  →行動の前に有ったものが、行動の後に消失していて、
   その行動が減少するような流れ

  例:遊んでもらっている → 噛む → 遊んでもらっていない
 
    …今後「噛む」という行動が減ったら「罰」
     「遊んでもらっている」という出来事が行動の後に消失しているので「負」
     よってこれは、「負の罰」となる


■多く見られる勘違い

すでに書いていますが、もう一度改めて。

「褒めたら強化」「叱ったら罰」というのは、間違いです。
「強化」「罰」が決まるのは、あくまでも「行動の増減」によってです。
なので、褒めているか叱っているかは関係ありません。
あくまでも「行動が増えたら強化」で、「行動が減ったら罰」です。

また「正=褒める」「負=叱る」も間違いです。
「行動の後で、叱る」ということをしたのなら、それは「行動の後で、叱られるという出来事が出現」という流れですから、「正」の流れになります。
あくまでも「行動の後で出現は正」「行動の後で消失は負」です。


■陽性強化と陰性強化

これは、ここ数年「犬のしつけ業界」でのみ、流通している用語です(獣医さんの世界でも流通しているかもしれない)。
一般に言われている「陽性強化」と「陰性強化」のイメージは、↓のような感じでしょうか。

   陽性強化:褒めてしつけるやり方
   陰性強化:叱ってしつけるやり方

しかしこれは、行動分析の定義から言えば、全然間違っています
そもそも、「陽性強化」と「陰性強化」という言葉は、「正の強化」と「負の強化」を、別の言葉で言い換えたものになります。
行動分析はアメリカで興った学問なので、元々の言葉は英語でした。
それぞれを英語で書くと、↓のようになります。

  正の強化=Positive Reinforcement
  負の強化=Negative Reinforcement

日本の行動分析家は、それぞれを「正の強化」「負の強化」と訳したのに対し、どこかの誰かが「陽性強化」「陰性強化」と訳したものが、何故か日本の「犬のしつけ業界」で流通し、そしてその後↑のような「褒める=陽性強化」「叱る=陰性強化」というイメージがついてしまったと。※3

さて、具体的に間違っていることについて書きます。
「陽性強化トレーニング」とやらを行う時、「ジェントルリーダー」という道具が使われることが多いです。
この「ジェントルリーダー」は、犬が飼い主さんを引っ張ると、構造的に犬のマズル(鼻)部分が締め付けられることになります。
そして、これまた構造的に、犬が引っ張ると首ががくんと曲がるので、それ以上犬は引っ張らなくなったりします。
で、飼い主さんの元へ戻ってきたりします。
この流れを書いてみましょう。
(以下「締め付けられている」のは、マズル部分を指します)


  締め付けられている → 戻る → 締め付けられていない


この流れ、もしも今後「戻る」という行動が増えたら、それは「強化」になります。
そして、行動の前にあった「締め付けられている」という出来事が、行動の後で消失していますので「負」です。
ということは、これは「負の強化」になります。
更に言い換えれば、これは「陰性強化」です。

「陽性強化トレーニング(または陽性強化法)」という言葉を好んで使う人は、何故か「陰性強化」という言葉を嫌うことが多いようです。
「わんちゃんに負担をかけるような陰性強化は行いません」みたいな。
でも、そういう人達がもしもジェントルリーダーを使っていたり、あるいは「犬が引っ張ったら立ち止まり、戻ってきたら褒めてあげましょう」という対応を取っていたりする場合、その流れは紛れもなく「負の強化」、つまり「陰性強化」です。※4

僕は個人的に、この「陽性」だの「陰性」だのというカテゴリ分け無意味だと思います。
↑にも書いたように「陽性強化」の人だって、「陰性強化」は普通に使いますから。


※3
今年の行動分析学会終了後、某教授とお話をしたんですが、この「陽性強化と陰性強化と訳した人」について、すんごく納得できる話を教えてもらいました。
曰く、「多分、陽性・陰性と訳したのは、お医者さんだろう」とのこと。
日本の心理学では「positive」「negative」という言葉は、それぞれ「正」「負」と訳すのが通常です。
なので、そこから外れた訳し方である「陽性」「陰性」という言葉を使うのは、考えにくいわけです。
しかし、医学の世界では「positive」を「陽性」、「negative」を「陰性」と訳すんですね。
となると、お医者さん、もしくは医学の領域にいる人が「陽性」「陰性」と訳した可能性はかなり高いように思えます。
また、この「陽性強化」「陰性強化」という言葉が言われるようになった経緯を考えたら、非常に納得できる話です。
(陽性強化という言葉を好んで使うのは、JAHA:日本動物病院福祉協会 公認のインストラクターに多い)


※4
「褒める」という対応をするので、最終的には「正の強化=陽性強化」の流れに辿りつきますが、犬が「戻る」という行動を選択した瞬間は、「負の強化=陰性強化」です。
「何を細かいことを」と思うかもしれませんが、専門用語というのは元来そういうものです。
しっかりと定義されている専門用語を使うのですから、この程度のことは理解した上で使うべきですし、理解出来ないんなら最初から使うべきじゃない。
思い切り間違った解釈でもって説明されることがほとんどですから、「陽性強化」とか「陰性強化」とかを、あまりにも強調して使っている人は「ちゃんと分かってない」と考えていいと思います(というか、ちゃんと分かってたらまず使わないと思う)。


■ちゃぶ台を引っ繰り返すようですが…

さて、ここまで色々と書いてきましたが、実際の臨床場面で「現在起こっている行動が、正の強化なのか、負の強化なのか?」ということを、一生懸命考えるか?というと、実はそうではありません。
ていうか、あんまり考えません(最初にちょこっとだけ考えます)。
何故ならば、起こっている行動がたった一つの随伴性で成立していることはまずないからです。
ほとんどの場合、いくつかの随伴性が絡みあって、一つの行動を形成しています。
つまり「この行動の随伴性は何か?」ということを突き詰めて考えようとしても、最終的には「うーん、いくつか可能性があるし、ぶっちゃけこれ以上は確かめようがないぞ」というところに辿りつきます。
なので、実際の臨床場面では「問題となっている行動の随伴性の策定」よりも、「適切な行動をどうやって学習させて、その場面で出来るようにしていくか?」を重視します。
つまり、「正しい行動を、いかに教えるか?」が、一番大事なわけですね。

そして、この「正しい行動を、いかに教えるか?」というところでは、「正の強化」を一番重視します。
本人(本犬?)が、出来るだけ楽しく、ストレスなく行えるように「正の強化で、維持・拡大できるような流れ」を、考えてあげるわけです。
で、僕が大学でやってるのは、まさにこの「正の強化で、維持・拡大できるような」方法を、オリジナルで考えつくことです。
それも、わんこだけでなく、飼い主さんも含めて。
だから、「わんこも、そして飼い主さんも」というわけ。



「正の強化」「負の強化」「正の罰」「負の罰」の区別、そして「随伴性」お分かり頂けましたでしょうか?