Temperature
温度越低,分布越尖锐;温度越高,分布越平,低概率项更有机会被采到。
当前温度
1.00
同一个模型,推理参数不同,回答风格就会明显变化。原因不在“模型忽然换了脑子”,而在于最后一步选择下一个 token 的策略不同。温度会改变分布尖锐程度,Top-k 和 Top-p 会裁剪候选集合,Greedy 则直接拿最高概率项。
先选一个场景,再切换解码策略,最后拖动参数。你会直接看到候选 token 的保留范围、概率分布和采样结果是如何变化的。
下面的条形图展示的是当前策略真正参与采样的分布。被裁掉的项会变成 0。
这一组卡片把当前场景分别放到 Greedy、Temperature、Top-k、Top-p 下,帮助你快速建立“稳定性”和“多样性”的对照感。