Behaviorism Lab

行为主义

行为主义不先问“你心里想了什么”,而先问“环境给了什么刺激、你做了什么反应、后面发生了什么结果”。 它关注的是可观察、可训练、可重复的行为规律,所以特别适合做成互动实验来理解。

刺激会被学会

原本没有意义的铃声,和食物多次同时出现后,也能单独引发流口水。

后果会改变频率

一个行为之后如果带来好结果,它更可能再次出现;如果带来坏结果,则会被压低。

没有后果也会消退

曾经被强化过的行为,如果后来长期得不到结果,会慢慢减弱甚至消失。

强化方式也很关键

不是所有奖励都一样。固定奖励、随机奖励,会塑造出完全不同的坚持程度。

标准介绍

行为主义是 20 世纪早期兴起的重要心理学流派,强调心理学应研究可观察、可测量的外显行为,而不是直接诉诸不可见的内部心理过程。 它把行为理解为环境刺激与行为结果共同塑造的产物,核心模型包括刺激—反应模型、经典条件反射与操作性条件反射。

在经典条件反射中,原本中性的刺激通过与无条件刺激反复配对,逐渐获得引发反应的能力;在操作性条件反射中, 行为之后的强化、惩罚和消退,决定该行为未来再次出现的概率。行为主义对教育、训练、行为治疗和组织管理产生了深远影响。

通俗介绍

行为主义可以简单理解成一句话:人和动物会被“环境后果”训练出来。如果某个动作做完后总有好处, 这个动作就会越来越常出现;如果做完后总是麻烦、疼痛或毫无结果,这个动作就会越来越少。

比如小狗一听到铃声就兴奋、孩子做完作业就想要奖励、手机应用用随机红包把人留住,本质上都是在利用行为主义里的学习规律。 所以理解这套理论,就是理解“行为为什么会被塑造成今天这样”。

先把这 4 个关键词看明白

刺激

环境里出现的线索或事件。它可以是铃声、灯光、食物、噪音,也可以是老师表扬或系统提醒。

反应

个体表现出来的行为或生理反应,比如流口水、按杆、回避、重复点击、主动靠近等。

强化与惩罚

强化会提高行为频率,惩罚会压低行为频率。关键不在“感觉好不好”,而在“未来会不会更常发生”。

消退

曾经学会的联结或行为,如果后来不再得到支持,也会逐渐减弱。这不是立刻消失,而是慢慢退下去。

交互实验室

建议按顺序体验:先理解“刺激如何学会触发反应”,再看“后果如何塑造行为”,最后观察“强化计划为什么会让行为更顽固”。

实验 1

经典条件反射:铃声怎么从“无意义”变成“有反应”

Classical Conditioning

这里把巴甫洛夫实验拆成 4 个动作:只摇铃、只给食物、铃声+食物配对、只摇铃做消退。 你可以看到“联结强度”如何建立,又如何因为不再给食物而下降。

配对次数 0 铃声和食物同时出现的次数
联结强度 0%
铃声单独反应 0%
基线期 铃声只是普通声音,不会引发明显唾液反应。
获得期 铃声和食物反复配对,联结逐渐建立。
消退期 只响铃不再给食物,旧反应开始减弱。
先尝试 3 到 5 次“铃声 + 食物配对”,再点“只摇铃测试”,你就能明显看到铃声开始单独引发反应。
实验 2

操作性条件反射:行为之后的结果,会改写下一次出现的概率

Operant Conditioning

在斯金纳箱里,同一个“按杆”行为,后果不同,未来倾向就不同。你可以切换 4 种后果, 看“未来按杆概率”如何被正强化、负强化、惩罚和消退拉高或压低。

未来按杆概率 35%
试验次数 0 你已经让“按杆”发生了多少次
当前后果 正强化 行为后出现食物,未来频率会上升。

这里关注的不是“这次按了没有”,而是“下次还愿不愿意再按”。

先保持“正强化”,连续试几次;再切到“惩罚”或“消退”,你会看到未来按杆概率明显往下掉。
实验 3

强化计划:为什么随机奖励更容易让行为停不下来

Schedules of Reinforcement

为了方便演示,这里把“时间”简化成“回合”。你可以比较 4 种强化计划, 看它们怎样影响奖励出现方式和行为坚持度。老虎机式随机奖励最典型地对应“变动比率”。

固定比率 FR-3

每做满 3 次行为给 1 次奖励。人会朝着清晰可预期的奖励节奏推进。

累计行为次数 0 用户已经做了多少次目标行为
累计奖励次数 0 这套计划目前发出了多少次奖励
坚持度 50%

关注“奖励是不是稳定可预期”与“人在没有立刻拿到奖励时,还愿不愿继续做”。

试着先用固定比率点几次,再切到变动比率。你通常会发现:奖励变得不可预测时,坚持度反而更难掉下来。

行为主义为什么到今天还很有用

它最厉害的地方,不只是解释实验室里的狗和老鼠,而是给现实世界提供了“如何塑造行为”的操作手册。

教育训练

及时反馈、分步奖励、代币制、课堂积分,本质上都在利用强化来稳定学习行为。

行为治疗

暴露、脱敏、奖励替代和行为契约,都建立在“刺激—反应—后果”可以重新塑造的前提上。

动物训练

从导盲犬到海豚表演,核心都是把目标行为拆小,再用清晰、及时的强化一步步塑造出来。

产品与平台设计

签到奖励、随机掉落、勋章系统和推送提醒,本质上都在设计强化计划,影响用户是否持续回来。

如果你只记住 5 句话

  • 行为主义优先研究“看得见的行为”。 它先问行为怎么形成、怎么改变,而不是先猜内部想法。
  • 经典条件反射解释刺激如何获得意义。 原本中性的信号,只要和重要刺激反复配对,就能单独触发反应。
  • 操作性条件反射解释后果如何塑造行为。 奖励提高频率,惩罚压低频率,消退则让旧行为慢慢减弱。
  • 强化不是只有“给奖励”。 去掉厌恶刺激也是强化,因为它同样会提高未来发生概率。
  • 奖励出现的方式,会决定行为有多顽固。 越是不确定、越是偶尔中奖式的强化,越容易让人停不下来。