在已知 $$Y=y$$ 的条件下,$$X$$ 的概率表现
设 $$(X, Y)$$ 的联合密度函数为 $$f(x, y)$$,$$Y$$ 的边缘密度函数为 $$f_Y(y)$$。
$$f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$$
注:仅在 $$f_Y(y) > 0$$ 时有定义
物理意义: 当我们固定 $$Y = y_0$$ 时,条件分布描述了在联合分布曲面上沿 $$y=y_0$$ 直线切下的“剖面”,并经缩放使该剖面面积为 1。
通俗介绍: 条件分布其实就是“缩小范围后的新概率”。条件分布就是告诉你,在某个特定条件下,事情发生的可能性会如何变化。
应用:
精准推荐:在已知用户历史行为和画像(条件)下,预测其点击或购买某商品的概率,是电商和内容平台的核心引擎。
风险评估:在给定借款人收入、负债、历史信用(条件)下,计算其贷款违约的概率,是金融信贷审批的基础。
医疗诊断:在已知患者症状、年龄、检测指标(条件)下,推断其患某种疾病的概率,辅助医生进行鉴别诊断。
机器预测:在给定历史数据和当前状态(条件)下,预测设备未来发生故障的概率,是实现预测性维护的关键。
自然语言处理:在已知上文(条件)下,预测下一个最可能出现的词或句,是驱动语言模型、机器翻译和智能聊天的基本原理。
若 $$(X, Y) \sim N(\mu_x, \mu_y, \sigma_x^2, \sigma_y^2, \rho)$$,则已知 $$Y=y$$ 时:
观察:条件均值随 $$y$$ 线性变化,而条件方差减小。
0.00
0.00