天才一秒记住【热天中文网】地址:https://www.rtzw.net
受到瓦尔德研究影响的沙万奇并没有直接使用最大最小准则,而是提出了最小机会损失准则。
针对统计决策的两大策略,应该如何进行选择?
下面,我将从沙万奇的书中,选择对瓦尔德与沙万奇思维方式进行比较的实例,以明确两者之间的差异。
请大家一起思考一下下面的实例。
现在,让我们对是否投资某个生意做出判断。
在投资生意的情况下,如果是好天气,可以赚10万日元的利润。
但是,如果遇到恶劣天气,则要亏损10万日元(利润为-10万日元)。
如果不投资任何生意,无论是遇到好天气还是恶劣天气,利润都是0。
在统计决策中,人们将这一博弈视为“自然与人之间的零和博弈”
。
也就是说,人选择的行为包括“投资”
“不投资”
两种,自然选择的行为包括“好天气”
“恶劣天气”
两种。
在这种情况下,人的利润如表4-1所示,自然的利润与人的利润相反。
表4-1 人的利润表
这种零和博弈思维的奇妙之处在于将自然想象为人,设想“自然也会采取行动,尽可能增加自己的收益”
。
也就是说,这是将自然视为与人博弈的玩家,想象它会想方设法阻碍人的行动。
在大多数人看来,自然是没有生命的,对它而言根本就谈不上收益或受损,这是非常合理的想法。
不过,由于缺乏足够的证据证明,可以说认为自然没有生命的观点也没有跳出主观判断的范畴。
如果将统计决策定性为人们积极主动创造针对某种博弈的有效策略的工具,对于利用数学框架思考问题是非常有利的。
这种思考方式运用了博弈理论的成果,是非常难得的。
因此,我希望大家姑且将这一过程理解为思维实验,将统计决策想象成“自然与人之间的博弈”
。
未来,随着研究的进一步深入,这一分析方法会逐渐被完善,最终必将被更为合理的方法论取代。
我们就不再需要想象自然的损益了。
科学就是在重复这种思维实验的过程中,不断取得发展进步的。
从瓦尔德的逻辑思维出发,在零和博弈中,人们应该依据最大最小准则选择行动方式,具体原因如下:
当人们采取概率组合的方式决策时,假设“投资”
的概率为p,那么“不投资”
的概率就是(1-p)。
在这种情况下,最严峻的局面就是自然出现“恶劣天气”
的概率为1时(也就是说,一定会出现“恶劣天气”
,根据计算公式,在这种情况下,完全没有可能出现正值)。
此时,人的收益期望值就是(-10万日元)×p,这个值就是保底值。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!