刺激会被学会
原本没有意义的铃声,和食物多次同时出现后,也能单独引发流口水。
行为主义不先问“你心里想了什么”,而先问“环境给了什么刺激、你做了什么反应、后面发生了什么结果”。 它关注的是可观察、可训练、可重复的行为规律,所以特别适合做成互动实验来理解。
原本没有意义的铃声,和食物多次同时出现后,也能单独引发流口水。
一个行为之后如果带来好结果,它更可能再次出现;如果带来坏结果,则会被压低。
曾经被强化过的行为,如果后来长期得不到结果,会慢慢减弱甚至消失。
不是所有奖励都一样。固定奖励、随机奖励,会塑造出完全不同的坚持程度。
行为主义是 20 世纪早期兴起的重要心理学流派,强调心理学应研究可观察、可测量的外显行为,而不是直接诉诸不可见的内部心理过程。 它把行为理解为环境刺激与行为结果共同塑造的产物,核心模型包括刺激—反应模型、经典条件反射与操作性条件反射。
在经典条件反射中,原本中性的刺激通过与无条件刺激反复配对,逐渐获得引发反应的能力;在操作性条件反射中, 行为之后的强化、惩罚和消退,决定该行为未来再次出现的概率。行为主义对教育、训练、行为治疗和组织管理产生了深远影响。
行为主义可以简单理解成一句话:人和动物会被“环境后果”训练出来。如果某个动作做完后总有好处, 这个动作就会越来越常出现;如果做完后总是麻烦、疼痛或毫无结果,这个动作就会越来越少。
比如小狗一听到铃声就兴奋、孩子做完作业就想要奖励、手机应用用随机红包把人留住,本质上都是在利用行为主义里的学习规律。 所以理解这套理论,就是理解“行为为什么会被塑造成今天这样”。
环境里出现的线索或事件。它可以是铃声、灯光、食物、噪音,也可以是老师表扬或系统提醒。
个体表现出来的行为或生理反应,比如流口水、按杆、回避、重复点击、主动靠近等。
强化会提高行为频率,惩罚会压低行为频率。关键不在“感觉好不好”,而在“未来会不会更常发生”。
曾经学会的联结或行为,如果后来不再得到支持,也会逐渐减弱。这不是立刻消失,而是慢慢退下去。
建议按顺序体验:先理解“刺激如何学会触发反应”,再看“后果如何塑造行为”,最后观察“强化计划为什么会让行为更顽固”。
这里把巴甫洛夫实验拆成 4 个动作:只摇铃、只给食物、铃声+食物配对、只摇铃做消退。 你可以看到“联结强度”如何建立,又如何因为不再给食物而下降。
在斯金纳箱里,同一个“按杆”行为,后果不同,未来倾向就不同。你可以切换 4 种后果, 看“未来按杆概率”如何被正强化、负强化、惩罚和消退拉高或压低。
这里关注的不是“这次按了没有”,而是“下次还愿不愿意再按”。
为了方便演示,这里把“时间”简化成“回合”。你可以比较 4 种强化计划, 看它们怎样影响奖励出现方式和行为坚持度。老虎机式随机奖励最典型地对应“变动比率”。
每做满 3 次行为给 1 次奖励。人会朝着清晰可预期的奖励节奏推进。
关注“奖励是不是稳定可预期”与“人在没有立刻拿到奖励时,还愿不愿继续做”。
它最厉害的地方,不只是解释实验室里的狗和老鼠,而是给现实世界提供了“如何塑造行为”的操作手册。
及时反馈、分步奖励、代币制、课堂积分,本质上都在利用强化来稳定学习行为。
暴露、脱敏、奖励替代和行为契约,都建立在“刺激—反应—后果”可以重新塑造的前提上。
从导盲犬到海豚表演,核心都是把目标行为拆小,再用清晰、及时的强化一步步塑造出来。
签到奖励、随机掉落、勋章系统和推送提醒,本质上都在设计强化计划,影响用户是否持续回来。