Behaviorism Lab

行为主义

行为主义不先问“你心里想了什么”，而先问“环境给了什么刺激、你做了什么反应、后面发生了什么结果”。它关注的是可观察、可训练、可重复的行为规律，所以特别适合做成互动实验来理解。

刺激会被学会

原本没有意义的铃声，和食物多次同时出现后，也能单独引发流口水。

后果会改变频率

一个行为之后如果带来好结果，它更可能再次出现；如果带来坏结果，则会被压低。

没有后果也会消退

曾经被强化过的行为，如果后来长期得不到结果，会慢慢减弱甚至消失。

强化方式也很关键

不是所有奖励都一样。固定奖励、随机奖励，会塑造出完全不同的坚持程度。

标准介绍

行为主义是 20 世纪早期兴起的重要心理学流派，强调心理学应研究可观察、可测量的外显行为，而不是直接诉诸不可见的内部心理过程。它把行为理解为环境刺激与行为结果共同塑造的产物，核心模型包括刺激—反应模型、经典条件反射与操作性条件反射。

在经典条件反射中，原本中性的刺激通过与无条件刺激反复配对，逐渐获得引发反应的能力；在操作性条件反射中，行为之后的强化、惩罚和消退，决定该行为未来再次出现的概率。行为主义对教育、训练、行为治疗和组织管理产生了深远影响。

通俗介绍

行为主义可以简单理解成一句话：人和动物会被“环境后果”训练出来。如果某个动作做完后总有好处，这个动作就会越来越常出现；如果做完后总是麻烦、疼痛或毫无结果，这个动作就会越来越少。

比如小狗一听到铃声就兴奋、孩子做完作业就想要奖励、手机应用用随机红包把人留住，本质上都是在利用行为主义里的学习规律。所以理解这套理论，就是理解“行为为什么会被塑造成今天这样”。

先把这 4 个关键词看明白

刺激

环境里出现的线索或事件。它可以是铃声、灯光、食物、噪音，也可以是老师表扬或系统提醒。

反应

个体表现出来的行为或生理反应，比如流口水、按杆、回避、重复点击、主动靠近等。

强化与惩罚

强化会提高行为频率，惩罚会压低行为频率。关键不在“感觉好不好”，而在“未来会不会更常发生”。

消退

曾经学会的联结或行为，如果后来不再得到支持，也会逐渐减弱。这不是立刻消失，而是慢慢退下去。

交互实验室

建议按顺序体验：先理解“刺激如何学会触发反应”，再看“后果如何塑造行为”，最后观察“强化计划为什么会让行为更顽固”。

实验 1

经典条件反射：铃声怎么从“无意义”变成“有反应”

Classical Conditioning

这里把巴甫洛夫实验拆成 4 个动作：只摇铃、只给食物、铃声+食物配对、只摇铃做消退。你可以看到“联结强度”如何建立，又如何因为不再给食物而下降。

配对次数 0 铃声和食物同时出现的次数

联结强度 0%

铃声单独反应 0%

基线期 铃声只是普通声音，不会引发明显唾液反应。

获得期 铃声和食物反复配对，联结逐渐建立。

消退期 只响铃不再给食物，旧反应开始减弱。

动作控制

先尝试 3 到 5 次“铃声 + 食物配对”，再点“只摇铃测试”，你就能明显看到铃声开始单独引发反应。

实验 2

操作性条件反射：行为之后的结果，会改写下一次出现的概率

Operant Conditioning

在斯金纳箱里，同一个“按杆”行为，后果不同，未来倾向就不同。你可以切换 4 种后果，看“未来按杆概率”如何被正强化、负强化、惩罚和消退拉高或压低。

未来按杆概率 35%

试验次数 0 你已经让“按杆”发生了多少次

当前后果正强化行为后出现食物，未来频率会上升。

试一轮

这里关注的不是“这次按了没有”，而是“下次还愿不愿意再按”。

先保持“正强化”，连续试几次；再切到“惩罚”或“消退”，你会看到未来按杆概率明显往下掉。

实验 3

强化计划：为什么随机奖励更容易让行为停不下来

Schedules of Reinforcement

为了方便演示，这里把“时间”简化成“回合”。你可以比较 4 种强化计划，看它们怎样影响奖励出现方式和行为坚持度。老虎机式随机奖励最典型地对应“变动比率”。

固定比率 FR-3

每做满 3 次行为给 1 次奖励。人会朝着清晰可预期的奖励节奏推进。

累计行为次数 0 用户已经做了多少次目标行为

累计奖励次数 0 这套计划目前发出了多少次奖励

坚持度 50%

回合操作

关注“奖励是不是稳定可预期”与“人在没有立刻拿到奖励时，还愿不愿继续做”。

试着先用固定比率点几次，再切到变动比率。你通常会发现：奖励变得不可预测时，坚持度反而更难掉下来。

行为主义为什么到今天还很有用

它最厉害的地方，不只是解释实验室里的狗和老鼠，而是给现实世界提供了“如何塑造行为”的操作手册。

教育训练

及时反馈、分步奖励、代币制、课堂积分，本质上都在利用强化来稳定学习行为。

行为治疗

暴露、脱敏、奖励替代和行为契约，都建立在“刺激—反应—后果”可以重新塑造的前提上。

动物训练

从导盲犬到海豚表演，核心都是把目标行为拆小，再用清晰、及时的强化一步步塑造出来。

产品与平台设计

签到奖励、随机掉落、勋章系统和推送提醒，本质上都在设计强化计划，影响用户是否持续回来。

如果你只记住 5 句话

行为主义优先研究“看得见的行为”。 它先问行为怎么形成、怎么改变，而不是先猜内部想法。
经典条件反射解释刺激如何获得意义。 原本中性的信号，只要和重要刺激反复配对，就能单独触发反应。
操作性条件反射解释后果如何塑造行为。 奖励提高频率，惩罚压低频率，消退则让旧行为慢慢减弱。
强化不是只有“给奖励”。 去掉厌恶刺激也是强化，因为它同样会提高未来发生概率。
奖励出现的方式，会决定行为有多顽固。 越是不确定、越是偶尔中奖式的强化，越容易让人停不下来。