这学期的概率课其收获很多,也去了解关于概率相关有趣的东西,就比如《从掷筛子到阿尔法狗趣谈概率》
书中介绍的著名趣味概率问题包括赌博点数分配问题、赌徒谬误、高尔顿钉板、几何概型悖论、酒鬼漫步、德国坦克问题、博士相亲、中国餐馆过程等。通过讨论这些简单有趣的例子,让读者了解概率统计中的重要概念,如随机变量、期望值、贝叶斯定理、大数定律、中心极限定理、马尔可夫过程、深度学习,等等。
书中提到一个重点,是频率学派和贝叶斯学派最大的差别,在于对物理世界建模时使用的参数的认知。频率学派认为模型的参数是固定的,真实而客观存在的。他们的方法,是使用最大似然以及置信区间,以便找出这个参数的真实值。而贝叶斯学派恰恰相反,他们不关心参数的所谓“真实值”,关心的是参数的每一个值的可能性,即参数的概率分布。贝叶斯学派将参数看作是随机变量,每个值都有可能是真实模型使用的值,区别只是概率不同而已。也就是说频率学派将模型参数看成是固定的;贝叶斯学派则把参数也看成是随机变量,也符合某种分布,这是两者的根本区别。
中心极限定理从理论上证明了,在一定的条件下,对于大量独立随机变量来说,只要每个随机变量在总和中所占比重很小,那么不论其中各个随机变量的分布函数是什么形状,也不论它们是已知还是未知,当独立随机变量的个数充分大时,它们的和的分布函数都可以用正态分布来近似。这就是为什么实际中遇到的随机变量,很多都服从正态分布的原因。
另一个例子是买股票投资的时候,专家会建议你买各种类型的不同股票。“不要把鸡蛋放在一个篮子里!”投资专家这样解释。这句话的意思,其实就是警告你要遵循最大熵原理,对难以预测的股票市场,最好的策略是尽可能多地保留各种可能性,才能降低预测的风险。
如果我们只掌握关于分布的部分知识,应该选取符合这些知识,但熵值最大的概率分布。因为符合已知条件的概率分布一般有好几个,熵最大的那一个是我们可以做出的最随机、最符合客观情况的一种选择。杰恩斯从数学上证明了:对随机事件的所有预测中,熵最大的预测出现的概率占绝对优势。
这本书使我对概率学更感兴趣,我也相信我会更加努力去学习概率学。