由冯·诺依曼和纳什等人发展的数学理论,研究理性决策者之间的策略互动。纳什均衡是博弈论的核心概念。
📖 标准介绍
博弈论(Game Theory)是研究理性决策者在策略互动情境中如何做出最优决策的数学理论,由约翰·冯·诺依曼(John von Neumann)和奥斯卡·摩根斯特恩(Oskar Morgenstern)于1944年奠基,约翰·纳什(John Nash)在1950年代做出了突破性贡献。
核心概念:
- 纳什均衡(Nash Equilibrium):每个参与者的策略都是对其他参与者策略的最优反应,任何一方单方面改变策略都不会获得更好的收益
- 占优策略(Dominant Strategy):无论对手如何选择,某策略总是能带来最优结果
- 帕累托最优(Pareto Optimality):不可能在不损害任何一方的情况下改善另一方的处境
- 零和博弈与非零和博弈:前者一方所得等于另一方所失,后者可以实现双赢或双输
- 完全信息与不完全信息博弈:参与者对博弈结构和收益的了解程度
博弈论广泛应用于经济学(市场竞争、拍卖设计)、政治学(投票、国际关系)、生物学(进化博弈)、计算机科学(算法设计、人工智能)等领域,为理解竞争、合作、谈判、冲突等现象提供了严谨的分析框架。
💬 通俗介绍
博弈论研究的是"你知道我知道你知道"的问题——当你的决策会影响别人,别人的决策也会影响你时,该怎么做出最聪明的选择?
🔍 经典例子:囚徒困境
两个罪犯被分开审讯:
• 都不招供 → 各判1年(证据不足)
• 一个招供,一个不招 → 招供的释放,不招的判10年
• 都招供 → 各判5年
理性分析:无论对方怎么选,招供总是更好(对方不招我招就释放,对方招我也招只判5年而不是10年)。结果两人都招供,各判5年——明明都不招只判1年更好!这就是个人理性导致集体不理性。
🌟 生活中的博弈论
- 价格战:两家超市都想降价吸引顾客,但如果都降价,利润都减少,不如都保持原价
- 公共资源:大家都想多用公共资源(如过度捕鱼),但如果都这样做,资源枯竭,大家都受损
- 考试作弊:如果大家都不作弊,凭实力竞争;但如果别人作弊你不作弊,你就吃亏了
- 交通拥堵:每个人都想走最快的路,结果大家都选同一条路,反而更堵
核心启示:在互动决策中,你不能只考虑自己的最优选择,还要预测对方会怎么想、怎么做,然后做出最优反应。有时候,个人最优≠集体最优,这就需要制度设计、信任建立或重复博弈来解决。
选择经典博弈场景
囚徒困境(Prisoner's Dilemma)
两个囚徒被分开审讯,可以选择合作(沉默)或背叛(坦白)。
📊 博弈分析
互动模拟器
🔑 关键概念详解
🎯 纳什均衡
在纳什均衡点,任何一方单方面改变策略都不会获得更好的收益。这是博弈的稳定状态。
例子:在囚徒困境中,(背叛,背叛)是纳什均衡——虽然不是最好的结果,但没人愿意单独改变策略。
🤝 帕累托最优
在帕累托最优状态下,不可能在不损害任何一方的情况下改善另一方的处境。
例子:囚徒困境中(合作,合作)是帕累托最优——任何改变都会让至少一方变差。但它不是纳什均衡!
⚖️ 占优策略
无论对方选择什么策略,某一策略总是能带来最好的收益,这就是占优策略。
例子:在囚徒困境中,"背叛"是占优策略——无论对方合作还是背叛,背叛总是更好。
💡 如何理解收益矩阵?
收益矩阵(Payoff Matrix)是博弈论的核心工具,它清晰地展示了不同策略组合下各方的收益:
- 行代表玩家1的策略,列代表玩家2的策略
- 每个格子里有两个数字:红色是玩家1的收益,蓝色是玩家2的收益
- 找纳什均衡的方法:对每个格子,检查任何一方单独改变策略是否能获得更高收益。如果都不能,就是纳什均衡
- 绿色高亮的格子表示纳什均衡点——博弈的稳定结果
💡 小技巧:点击下方的不同博弈场景按钮,观察不同博弈的收益矩阵和纳什均衡位置,体会不同博弈的特点!