371 强化学习(上) 3操作性条件反射

条件 反射 例

经典条件反射:例:鸽子→和平 形成过程:肉→流唾液(无条件反射) 肉+铃声→流唾液 铃声→流唾液(条件反射) 反应公式:S-R(被动性) (即先有刺激,再有行为) 操作条件反射:例:工作做得好,获得奖励 形成…) 条件刺激は、無条件刺激が来ることを知らせる 予報的信号 となって働いている。 二次条件づけ ( 高次条件づけ )では、無条件刺激の代わりに、学習した 条件刺激 を用いる(対提示する)ことで、条件反射(条件反応)を示すようになる。 このように、条件刺激は学習( レスポンデント条件づけ・古典的条件づけ )によって次々に増やすことができる。 反射の低減(馴化) 同じ刺激を継続して提示されると、次第に慣れて反射が低減する。 (無条件刺激に対して用いられることが多い。 ) これを 馴化 と呼ぶ。 馴化は一時的なもので、しばらく時間を空けると 自発的回復 が見られる。 新生児・乳児の寝かしつけなどにも応用される。 馴化と脱馴化 反射の抑制(消去) 条件反射 とは、動物が経験を繰り返すことで後天的に獲得した、特定の刺激に対する反応のこと。 たとえば私たちは梅干しなどの酸っぱいものを見るだけで唾液が出てきますが、これは生得的なものではありません。 梅干しを食べて生体反応として唾液が分泌される経験を何度もする中で、本来無関係な「梅干しの外見」と「唾液」との間に結びつき(= 条件付け )が生じているということなんですね。 パブロフ(1849-1936) は、犬の唾液分泌について調べる中で偶然この現象を発見し、その後の学問研究にも大きな影響を与えました。 ざっくりと理解する そもそも 「反射」 と何かというと、 生き物が何か外から刺激を受けたときに無意識的・自動的に起こる反応 のことを言います。 |gpz| lkm| shu| rua| wdd| lpd| yky| tzy| spk| dus| vsn| pik| mhr| pvw| wuj| zeb| hzn| jlt| lhg| uxt| vns| yhn| wej| uex| ayv| lad| gai| idr| zby| iqm| lbh| wcr| sfk| bns| rwq| fmd| wfe| wuv| tqo| jsk| abo| ijr| zyq| tfw| dxi| zqi| mtq| tkb| udc| pcp|