博弈论：导论 - haoxin.dev

博弈论简介#

以下三方面是所有参与者的共同知识：

博弈既可用策略型表述，又可用扩展型表述。由于策略型表述会遗漏博弈中的部分信息，不同的扩展型表述的博弈可能具有相同的策略型表述。

博弈的策略应该是参与者选择的完备计划。也就是说，参与者要指出他在每个信息集上选择的具体行动，这样的策略称为纯策略。如果参与者在纯策略集合上以一定的概率分布随机选择，则称为混合策略。

如果参与者在每个信息集的行动集上以某种概率分布随机选择行动，则称为行为策略。

对比：

混合策略和行为策略称作随机策略。

为了将混合策略转化为行为策略，我们遍历参与者混合策略中的每个纯策略，算出经过的路径上每个信息集的概率，再将这些概率相加，就得到了行为策略。

给定一个行为策略，我们如果让每个纯策略被选择的概率等于参与人在各个信息集选择相应行动的概率之乘积，由此得到一个混合策略，并称其为原行为策略的混合表示。

这个转换很平凡，仅仅是将假设每个信息集上的选择相互独立，做一个笛卡尔积，计算出相应纯策略对应的概率。

NOTE

说明：行为策略与混合策略在此具有完美回忆（perfect recall），因此二者是实现等价的，上述两步给出的就是一对互相对应的表示法。

库恩定理：对于具有完美回忆的博弈，如果两个混合策略行为上等价（具有相同的行为表示）那么他们是收益等价的。