

不少人对于看个世界杯,别墅没了?因为你的算法用错了的相关题,以及泊松分布公式想必大家都很想知道,下面就让小编给大家讲解。
对于2022年卡塔尔世界杯,英国流行病学统计研究员马修佩恩更为看好比利时队[1,2]。要知道,比利时队在世界杯历史上从未打进过决赛。但这家伙绝对不是“胡说八道”。首先,他们有自己的基于数据的概率模型。其次,这个模型曾在2020年欧洲杯的预测中大放异。当时准确预测意大利和英格兰将分别获得冠军。亚军,并正确预测了前八名队中的六支。
图12018年世界杯四分之一决赛比利时击败巴西
图片来源/WikimediaCommons
11月15日,《自然》杂志采访了这位预测大师,并公布了他使用同一模型预测的本届世界杯的结果。各队夺冠的概率如下
团队
获胜概率
1比利时
1388
2巴西
第1351章
3法国
1211
4阿根廷
第1152章
5荷兰
965
6德国
第724章
7西班牙
第637章
8瑞士
第529章
9葡萄牙
第378章
10乌拉圭
第336章
11丹麦
第317章
12英格兰
256
13波兰
233
14克罗地亚
146
15墨西哥
067
那么这些欧洲杯和世界杯的预测是如何得到的呢?简单来说,它来自于每次中掷骰子,但它不是简单的掷骰子,而是泊松概率分布。
当我们扔一个普通的骰子时,我们会得到1到6中的任意一个,并且这6个结果的可能性是相等的,这称为均匀概率分布。至于泊松概率分布,我们考虑这样一种情况假设街上有一家小店,生意不太好。它每天营业10个小时,平均每天有30名顾客。那么平均每小时只有3个。顾客,假设顾客随机来,并且没有“高峰流量”,如果随机选择营业时间的一个小时,来的顾客数量一定是3个吗?显然,情况不一定如此。这一次正好没人来,下一次却一下子来了十几个人。法国数学家泊松给出了如下公式
=3表示平均值,P表示这一小时内k个人来的概率,e是自然常数。在泊松看来,一小时内正好有三个顾客来到这家小店的概率是224,一个人没有来的概率是498。很多人来的概率也是存在的,但是可能性很小。例如,如果有人来了,得到10个人的概率是008。其他人的概率也可以一一计算出来,如下图所示。
事实上,泊松概率分布实际上无处不在,并且许多真实数据与这种分布惊人地相似。其中包括每秒核材料放射性衰变的次数、地震等自然灾害的次数、公共场所排队的人数、机器故障的次数、每年飞机失事的次数、某个地区患病,以及该市各个地区发生犯罪案件。数字,甚至普法战争期间被马踢死的普鲁士士兵的数量等等。
在MatthewPenn的模型中,泊松概率分布用于表示每场比赛中某支队的进数。一场比赛的胜负和比分自然取决于双方的实力和运气,确定性中充满了不确定性。
为了衡量每支队的实力,模型为每支队设定了“进攻力”和“防守脆弱性”指标。前者数值越高,越容易进,后者数值越高,越容易失。防御力越弱。各种网络和桌面的玩家都会熟悉这一点。在更遥远的时代,泡面中呈现的《水浒传》英雄卡牌也标注了每个英雄的攻击力和防御力。显然,第一类队攻击力强,防守脆弱性低,第二类队攻击力弱,防守脆弱性低,或者相反,最差类别的队攻击力弱,防守脆弱性高。
如果A队对阵B队,按照“最合理、最合适”的表现,A队期望的进数是A的攻击力乘以B的防守脆弱性,B队期望的进数是B的。攻击力乘以A的防御弱点。假设A队的攻击力为12,防守脆弱性为01。B队的攻击力为6,防守脆弱性为02。两队的“正常”得分为24:06,大约为2:1。但是圆的,我们只能认为2:1是最有可能的得分,还有各种其他的可能性,所以我们将A队进数的不确定性视为以24为平均值的泊松概率。分布,B队视为以06为均值的泊松概率分布。各种可能得分的概率取决于两个进的概率值的乘积。
当然,最关键的题之一尚未讨论。如何确定每支队的进攻力和防守脆弱性数值?案是根据各队近年来的历史表现不断调整这两个值,使预测的得分概率分布与实际记录的统计分布尽可能一致。这样,当任意两支队在世界杯上交锋时,就可以提前粗略预测各种比分的可能性,并可以模拟整个赛程并最终确定世界杯各队的获胜概率。
泊松概率分布也是光学领域的“常客”,但也是经常带来麻烦的“刺”。概率的不确定性给比赛带来惊喜、悬念和刺激,也给光学成像带来难以忍受的破坏性噪声信号。
一束光可以看作是由许多微小的光子组成的。当一张白纸被均匀照射时,看起来纸上各处的强度都是一致的,但实际上纸上每个位置反射的光子数量都会不同。同样的,光子的数量也对应着明暗的差异。即使在同一位置,不同时间反射的光子数量也会不断波动,都遵循泊松概率分布。
对于相机来说,每次落在传感器上的光子数量分布也存在泊松概率的不确定性,这不可避免地会引入散粒噪声[3]图4左,而且几乎无论相机设计得多么完美,都不能直接消除此噪音。根据泊松概率分布公式,光子数相对于平均数的波动程度会随着平均光子数的平方根的增大而增大,但平均光子数与信号的大小成正比你要接收,所以当光强度变大时,虽然散粒噪声变大,但信噪比也会变大,最终的图像整体会更清晰。
图4荧光显微镜观察到的图像中的散粒噪声(左)和人工智能算法处理后的结果(右)[4]
来源自然生物技术2022:1-11
然而,在许多应用中,增加光子数量或信号光强度是徒劳的。例如,在户外使用自动驾驶汽车的激光雷达时,有时无论如何提高激光雷达的光信号强度,与阳光相比都会“慢”。“一件小事会带来很大的不同。”此时去除噪声的一种方法是在没有任何目标物体作为背景噪声的空白场景中记录一次信号,然后在每次记录时去除这种静态背景噪声。然而,面对阳光这种非常强烈、呈泊松概率分布动态变化的干扰信号,这一招就不起作用了。
在使用X射线的CT医学成像中,为了提高信噪比,增加X射线强度是不可行的,因为过量的X射线剂量对人体有害。即使在可见光的情况下,在一些活细胞显微镜观察中,过亮的光也足以杀死细胞或导致细胞功能障碍[4]。
2022年诺贝尔物理学在量子信息领域再次引起全关注。相关技术之一量子保密通信,理论上可以提供非常强的密钥安全性,但在实践中需要满足的条件是具有每个光源一次仅产生单个光子[5],”一不能多,一不能少。”然而,在实践中,激光脉冲中包含的光子数量通常也呈泊松概率分布。如果设置平均值为01。有很多时候光源不发射光子,也有少数时候发射两个或多个光子。这将使量子通信系统不像理想的那样高效和安全。
然而,解决办法总是比困难多。就像从混沌的进数可能性中寻找冠军队的线索一样,面对难以捉摸的泊松概率分布噪声,研究人员可以利用深度学习人工智能算法,结合拍摄到的图像,将照片中的噪声完美去除并恢复完好无损。图4右。无论是预测比赛比分,还是消除画面噪音,都离不开大数据作为参考。出于同样的目的,随机性的迷雾被一层一层地清除。
关于看个世界杯,别墅没了?因为你的算法用错了和泊松分布公式的题解完毕,记得持续关注本站。
发表评论