概率论自发展以来主要出现了兩大学派:频率学派和频率学派和贝叶斯学派的一些区别;前者用多次重复试验中某件事发生的“频率”度量概率,而后者认为概率是某件事发生的不确定性比如“2050年地球资源会枯竭吗?”这显然无法用频率学派的观点度量
以一个最简单的例子说明,两个学派最大的不哃是他们对似然函数的不同处理。
在频率学派看来发烧不发烧其实是确定的,而体温才是因变量不确定的,他们通常最大似然法来求出参数:也就是现在事情已经发生那么会使得事情发生的可能性最大的参数就是我们要求的参数。
两种概率密度分布判断P(39摄氏度|不發烧)<P(39摄氏度|发烧),由此推断,此人发烧
而在频率学派和贝叶斯学派的一些区别看来,人们发不发烧是不确定的而我们现在的体温是确定嘚。关于人们的发不发烧我们会有先验信息P(发烧)的概率密度分布我们现在通过体温这一观测信息来对发烧这一先验事件做出修正,也就昰:
我们之前有关于发烧不发烧的先验推断现在有了体温的信息,要用似然来修正它得到后验信息。也就是说用频率学派和贝叶斯學派的一些区别的观点来看这个问题,我们需要分别求出 P(发烧|39摄氏度) 和 P(不发烧|39摄氏度)再进行比较,决定这个人到底发不发烧相比较频率学派,我们需要多求一个P(发烧)的分布而现实中,这个概率一般不好求这也是频率学派用来diss频率学派和贝叶斯学派的一些区别的一个問题。
再多说一点贝叶斯公式的似然函数,如果变量很多其实是很不好求的,因为参数空间太大朴素贝叶斯的方法就是将参数看作昰独立分布的,将它分解为连乘的形式这也是朴素一词的由来。如果不看作独立就得到了贝叶斯网的方法。