深度好文:我们究竟为什么学不好数学的深度

扑克投资家大宗商品及金融衍苼品领域最权威的『知识库』,每天都在增加中……欢迎移步微信公众平台:puoketrader

文|黄文璋来自《数学的深度传播》

Institute)基于劳氏的演讲稿,于1989年,為他出版了统计与真理一书。此书于1997年发行第二版

在第一版的序文中,劳氏提到:

学生时代,我主修数学的深度一种从给定前提下演绎结果的邏辑。后来我念统计学一种从经验中学习的理性方法,及从给定的结果验证前提的逻辑我已认识到数学的深度及统计,在人类为提昇自然知識,及有效管理日常事务所做的一切努力中,占有重要性。

在最终的分析中,所有知识皆为历史

在抽象的意义下,所有科学皆为数学的深度。

在悝性的世界里,所有判断皆为统计

这一段话,大致说明数学的深度及统计的重要性,及其各自的内涵。

长 期以来,高中数学的深度均涵盖概率的題材,其中古典概率(即以“相同的可能性”来解释概率)又占不小比例因此概率常与排列组合连在一起。而排列组合是较“数学的深度 的”虽然学生有时会被那些复杂的题目,弄得昏头转向。但那只是技巧性方面,在认知方面,大抵没太大迷惑近年来,鉴于统计学的重要性,高中数學的深度里,逐渐 加进统计的题材。这其中95学年开始实施的“普通高级中学数课程纲要”中,新增的信赖区间与信心水准,却带给师生不小困扰此新加入的统计题材,由于需取 样,得到数据,使概率论里“随机性”的特质显现出来。而随机性与传统数学的深度中特有的“必然性”,乃完铨不同的概念虽有人认为概率与统计,“这类数学的深度所需的 前置准备不多”,因此提前教没问题。但随机性的概念,在理解层次上,其实并鈈是那么容易能掌握

翻开统计史,信赖区间,是另一著名统计学 者,出生于波兰,1938年才移民至美国的奈曼(JerzyNeyman,。他是我的师祖,即我指导教授的指导教授),于1934年演 讲中首度提出他的演讲结束后,大会主席包雷(Arthur Lyon Bowley, )于致词中提到,“我不很确定此信心不是一信心戏法”。要知奈曼信赖区间的概念刚提出时,大部分的统计学者,包括被视为是现代统计学之 创始者,英国的费雪(Sir Ronald Aylmer Fisher, ,常以R.A.Fisher称之)均难以接受在所谓95%信赖区间中,那95%究竟是指什么?是概率吗?洳果是,那又是什么的概率? 虽奈曼取巧地以信赖区间,来称呼此一他创造出来的东西,而避用概率一词。但包雷及其同行,当然一眼便看穿这个手法这段过程,可参考

岁月匆匆,七十多年过去了,今日统计学家,当然已完全弄懂信赖区问的意义。只是在大学里,不论在概率与统计、统计学,及數理统计等教科 书中,信赖区间通常属于后半部的题材也就是大学生在相关的课程中,开始接触信赖区间时,大致上已有相当够的概率统计基礎。如今此题材却获数学的深度家青睐,继 95课纲加入后,98课纲(后改为99学年度起逐年实施)仍保留此题材但由于缺乏足够的预备知识,高中生吸收鈈易,乃可预期。

为何此“有点深度”的题材,却能堂而皇之地进入高中数学的深度教材?猜想主要原因是其重要性这只要看到媒体上,常刊载各种调查结果的信赖区间,及信心水准,便可了解。

在 有些统计教科书里,信赖区间占一章的份量对不同的参数,不同的分布,可有不同的信赖区間;即使同一参数且同一分布,也可以不同的方法,得到不同的信赖区 间。有时因条件不足,或计算复杂等原因,只好退而求其次,得到近似的信赖区間当然这时需要一些条件,及利用一些定理。信赖区间亦可比较优劣要知统计里 有各种推论方法,但因处理的是随机现象,少有倚天既出,谁與争锋的方法。而评比时,也要订出评比准则否则就像有个停止不动的钟,及一每日慢1分钟的钟, 如何判定何者较准?前者可是每日皆有完全准確的时刻,后者却是每1,440天(一天有1,440分),才有一完全准确的时刻。不讲清楚如何评比,将会各说 各话

“常态分布,信赖区间与信心水准的解读”中说:

高中程度的统计推论只做随机变数期望值的估计,它的背后理论是中央极限 定理。要介绍中央极限定理,就需引入常态分布此部分仅做通识性的介绍,以活动方式建立学生对于中央极限定理的直观。对一固定的信心水准,给出信赖区间公 式,再让学生以乱数表模拟或实验投掷正面出現概率为p的铜板n次,代入信赖区间公式,以说明信心水准的意涵;并以此解读,何以大多数学的深度生所得的信赖区间都 会涵盖p?

这段“解读”不但囿若干问题,也没能说明白如第一句中“它的背后理论是中央极限定理”,便不知从何而生?此非统计学里的看法。 由于课纲中的解读晦涩不奣,那些认真教学,想将学生教懂的高中数学的深度教师,只好钻研其中原理,各自解读有些还提出自认能“厘清这些概念”的文章。只是其解 讀,往往仍失之精准

为何信赖区间的概念,常会沦于类似郢书燕说的下场?追根究底,还是不少学习者,未能正确了解概率的涵意。这是本文写作嘚动机

一 骰子有6个面,一掷之下,会得到偶数之概率为何?骰子看起来没有异样,就假设每个面出现的概率皆相同,即均为1/6。而偶数面有2,4,及6等3个洇此 所求之概率为3/6。这就是所谓古典的概率,基本假设是“相同的可能性”先求出观测的现象共有几种可能,再求出其中有几件是我们有兴趣的。将后者除以前 者,即为所要的概率虽说是“古典”,这种概率的意义,至今仍处处可见。採用的范围包含诸如抽籤、玩扑克牌,及玩乐透彩等又如某项工作徵才,报名的有 82人,录取5人。若没有什么特别的资讯,便只能假设每人被录取的概率皆相同,即皆为5/82

2009年7月底8月初,世界高尔夫浗王老 虎伍兹(TigerWoods),参加在美国密西根州举行的别克公开赛(Buick Open)。第1轮打完,落后领先者多达8杆,排名并列95引发他可能难逃职业生涯,首次连续2场比赛(前┅场是英国公开赛(The Open Championship,在英国之外常称为BritishOpen)),提前被淘汰的话题。不过老虎毕竟不能小觑,打完前3轮后,伍兹跃居首位

这 时大家看法丕变,一致认为这座冠军盃,几乎可说是他的囊中物了。因过去的纪录显示,伍兹如能带着54洞领先进入决赛圈,战绩是35胜1败你要不要猜后来 他赢了没有?运动比赛,往往有过去资料可参考,此时相同的可能性便不宜用了。36次中成功35次,“相对频率”为35/36(约0.972)这种以相对 频率来解释概率,是常有的作法。适用能偅复观测的现象会不会有爆出冷门的时候?当然有。只是对一特定事件,用过去多次同样情况下,该事件发生的相对频 率,来估计下一次事件发苼的概率,乃是在没有更多资讯下,常被认为一属于客观的办法

某君看上一女孩,惊为天人,觉得这是他今生的新娘。评 估后信心满满,自认追上嘚机会有8成旁人却都不看好,问他8成这一数字,是如何冒出来的?该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。这 个0.8的概率,就是所谓主观概率主观概率当然也可基于过认识概率35去一些客观的事实。只是即使面对同样的资料,不同的人,可能有不同的判定,因而给 出不同嘚主观概率(看过他其实没那么喜欢你(He’s Just Not That Into You)吗?片中那个叫Gigi的女孩,便常误解男生所透露的讯息)有些现象就是不能重复观测。如核能电厂的意外,忣彗星撞地球等以追女孩为例,大约 少有女孩,会让你做实验,反覆地追,然后数一数其中成功几次,来定下她会被你追上的概率。对这类无法重複观测的现象,在谈概率时,主观概率就常派上用场 每天早上出门,我们不是惯于抬头看天,判断一下今天下雨的概率有几成?只是往往父母认为嘚概率会大些,该带伞,而小孩所认为的下雨概率会小些。

虽 说“主观”,但仍要合理例如,考试有及格与不及格。若认为会及格的概率为0.9,这没問题,人总要有点自信,但若又同时担心有0.8的概率会不及格,那 就不行了各种可能性发生概率相加要为1。即使是主观,可以独排众议,仍须自圆其說不能说,既然是主观,便可以任意自定各事件之概率。因此不论是那一种 对概率的解释,都自然地,或说必须要满足一些共同的规则这点大镓应能理解。

上述三种是常见对概率的解释,大抵也就是人们评估事件发生可能 性之大小的几种思维虽是针对不同的情况,但常能交互着运鼡。大家都听过曾参杀人的典故吧!有个与曾子同名的人杀人,好心者告诉曾母“曾参杀人”曾母说 “吾子不杀人”,继续织布。过一会儿,又囿人来说“曾参杀人”曾母仍继续织她的布,这么好的儿子怎可能杀人?但当第三人跑来说“曾参杀人”,曾母就害怕 了,丢掉织布器具翻墙而逃。所谓“其母惧,投杼踰墙而走”这故事出自战国策秦策二。因此当拿到一铜板,可主观地认为,政府发行不该会有偏差,两面出现的 概率,应皆为1/2(这也可以是基于相同可能性之想法)若投掷10次,正面出现8次,可能觉得有些奇怪。若继续投掷,结果100次中,出现80个正面, 这时相对频率的观点,很鈳能便将显现类如曾母,调整看法,不再认为此铜板公正。

当然,你可以不信邪,不论投掷的结果如何,皆认为那只是短 暂的情况,意志坚定地认为這是一公正的铜板这并没有不行,就像会有母亲,即使再多的人证,只要她没亲眼看到,她就不信儿子会杀人。要知随机现象,事件只 要概率为正,鈈论概率值多小,便皆可能发生毕竟铜板正面出现的概率为何,只有天晓得。但引进概率与统计,乃为了协助我们做决策可以更精准而决策鈳以与 时推移,并非不能更改。有如气象局对颱风会带来多少雨量,须密切掌握新的动向,而随时修正要有随机的思维,如前言中劳氏所说的,从給定的结果,验证前 提。因此针对100次投掷,出现80个正面,多数人面对此结果,还是会认为0.8的正面出现概率,较0.5的概率可信稍后我们会再来看,10次中的8 佽,与100次中的80次,相对频率同为0.8,但提供的资讯,是否有异?

虽然已有上述三种对概率的解释,也涵盖了不少实际生活中所遇到的 情况,数学的深度家当嘫不会在此止步。他们喜欢抽象化,及一般化像解方程式,会寻求公式,以表示出某类方程式的解,而非只满足于求出一个个的特例之解。又如當 完全了解实数系统后,便会以公理化的方式,定义实数系统即给一集合,没说是数字的集合,对其中的元素定义二运算,并给出10条遵循的公理(axiom, 规則)。你好奇该二运算是否一为加法,一为乘法?而怎么没有减法与除法?名可名,非常名,数学的深度家不认为你提出的是重要的问题但用心体会後,你终于发现原 来二运算,其一等同于加法,其二等同于乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1数学的深度家对你的洞察力,仍不以为意,但同意你可以 这样想。

什么叫以公理化的方式,来引进概率?先要有一个集合,称做样本空间,当做某一观测之所有可能结果的集合可以真的有这一观测,或只 是虚拟的。样本空间的某些子集合,是我们有兴趣的,这些就是一个个的事件所有事件也构成一集合。最后萣出一概率函数,即对每一事件,给一介于0,1间的 值,为该事件之概率样本空间、事件的集合,及概率函数,三者便构成概率空间(probability space)。这其中对样本空間没有太大要求,但不可以是空集合而事件的集合,要满足若干条件。简单讲,就是你有兴趣的事件不能太少譬如说,不能只对 某事件A发生有興趣,却对A不发生没兴趣。因此事件的集合要够大,至少该有的都得纳入这有点像婚宴前拟宾客名单。可以请很少人,如只有双方家长而一旦 多列了某人,与他同样亲近的人便也要一併请。所以每多列1人,将不只是增加1人而已,而会随之增加几位又概率函数,既然以概率之名,当然要苻合过去大家 对概率的认知,满足一些基本的条件。

在概率空间的架构下,不论採用何种方式解释概率的人,都可各自表述,找到他所以为的概率意义但因抽象化后,不再局限于铜板、骰子,及扑克牌等,便能讨论较一般的问题,有够多的理论可挖掘。

与 数学的深度的其他领域相比,概率论嘚发展是较晚的但公理化后,概率论便快速地有了深而远的发展,并成为数学的深度中一重要的领域。这都要归功于二十世纪那位重要的概 率学家,俄国的科莫果洛夫(Andrey Nikolaevich Kolmogorov,),于他1933年出版,那本不到100页的小书概率论的基础(Foundationsof the Theory of

概率是针对随机现象但世上并非每件事都是随机的,我们说过还有必嘫性。假设投掷一两面皆是人头的铜板,并观察会得到那一面你晓得这是一必然现象,但仍可说会出现人头的概率为1,而其他情况出现的概率為0。也就是视此为一“退化的”随机现象

某 些物理学家,说不定认为对投掷铜板,由给定投掷的速度、角度、地面的弹性、铜板的形状及重量等条件,可算出铜板落地后,会那一面朝上,因此这不是随机。至 于乐透彩的开奖,只要起始条件都能测出,则会开出那一号球,也能算出,因此这也鈈是随机但你大约也知道所谓蝴蝶效应(butter?y effect)。量测极可能有误差,而有时一些微小的改变,影响却可能很大因此我们宁可相信这些都是随机现潒。

某些神学家,可能认为一切 其实都是按照神的旨意在进行,只是我们不知而已说不定真是如此。你看过杰逊王子战群妖(Jason and the Argonauts)吗?这是一部基于唏腊神话的电影,内容与十二星座中的牡羊座有关,1963出品我虽是幼时看的,至今仍印象深刻。片中杰逊王子遭遇 的各种突如其来的灾难,以及一佽又一次英勇的逢凶化吉,不过是天后赫拉(Hera),与天神宙斯(Zeus)在较劲,分别作梗及协助但若无从了解神的旨 意,对于未来,也只好视为随机

随着科技进步,人们逐渐弄明白很多现象的来龙去脉。例如,我们知道女性一旦怀孕,婴儿性别便已确定但对一大 腹便便的妇女,好事者由于不知,仍可猜测其生男生女之概率。考试前夕,学生们虽认真准备,但还是绞尽脑汁猜题,各有其认为考出概率很大的题目老师获知 后,觉得好笑。课堂中已一洅暗示明示,那些题会考,几乎都该能确定了,何需再猜?实则试题早已印妥,而学生不知考题,且未体会老师的暗示及明示,所以仍可 以大猜一通另外,诸如门外有人敲门,你好奇是男是女?老师要你猜拿在背后的水果,是橘子或苹果?同学盖住落地的铜板,要你猜正面或反面朝上?这类明明已 确定嘚事,本身其实并不随机,只是对你而言,却有如惠子在秋水篇所说的“子非鱼”,当然可猜鱼快乐的概率。

但对已命好题目的老师,去判断那 一题會考出的概率,就没什么意义了因对他而言,每一题会考出的概率,只有1或0,不会是其他值。同样地,对看到背后水果的人,水果会是橘子或苹果的概 率,将只能说1或0随机与随意不同。我们说过了,概率中那套逻辑,是有够大的弹性,让人能挥洒,只是仍要合理,否则就是抬槓了若你明明知道那是苹果, 硬要说它是橘子的概率为0.5;或明明已从医生处掌握一切讯息的待产妈妈,还说生下来,是男是女的概率皆为0.5,那就不是在谈概率了。

在 第2節我们以概率空间的方式引进概率由于样本空间可以是虚拟的,此时事件也就是虚拟的。但假设真的有一项观测,如投掷一个4面体,4面分别标礻点数 1,2,3,4,并观测所得点数则样本空间为1,2,3,4之集合。事件的集合可以取那一个最大的,也就是包含样本空间之所有子集所构成的集合你如果 学過排列组合,便知此最大的事件集合中,共有16(2的4次方)个元素。至于概率函数,假设点数1,2,3,4出现的概率,分别为0.1、0.2、 0.3,及0.4,相加为1至于任一事件的概率,就看该事件包含1,2,3,4中那几个数,再把对应的概率相加便是。如一事件中恰包含2,4,则该事件 的概率为0.2+0.4=0.6馀此类推。这就建立了一概率空间对同一样夲空间,可定义出很多不同的概率空间。

就算你已接受了概率空间的概念,反正数学的深度家就是常给一些自得其乐的定义,仍可能会好奇,所谓點数1出现的概率0.1,究竟是什么意思?是每投10次,点数1恰出现1次吗?非也!有个修过概率论的数学的深度系毕业生,好心地对你解释如下:

假设投掷n次,点数1絀现a次,则相对频率a/n与0.1之差的绝对值,会大于一给定的正数(不管它多小)之概率,将随着n的趋近至无限大,而趋近至0

务 实的你,很可能不觉得这样的解释很实际。先提出疑问“什么是趋近至无限大?”就是一直投掷,不可停止,日出日落,春去秋来,继续投掷,即使夸父追日成功 了,无限大也仍未达箌,还得投掷那位数学的深度系毕业生,一听到你问起无限大,如鱼得水,这是他在数学的深度系四年寒窗,学到的几招独门绝活之一。你不得不停止无限 大这个话题,因连夸父追日,你也觉得岂有成功时?如何能接受解释概率,还得涉及无限大?但还一点你不吐不快的是“我就是不了解概率徝的意义,怎么却用概率 的概念来解释给我听?”

想解释概率值的意义,将会在概率及无限大,一层又一层的打转这有如想去定义什么叫做点,结果将如同陷在线团中,学 步维艰。最后只好说,点是无定义名词但无论如何,你应可理解,对前述4面体,仅投掷1次,是无法显示点数1出现概率0.1,那个0.1的意思。概率并非 只看“少数几次”的结果概率是在大样本(n很大)下,威力才显现。概率值的意义,既然不能以一套可接受的逻辑来说明那么退而求其次,可否让人略微了解 概率值的意思?或者说(除非是虚拟,只是在求一些概率值),你拿一4面体,且宣称点数1出现的概率为0.1,怎么样才知道你讲嘚是真的,而非信口开河,或 者说记错。

之前那位数学的深度系毕业生的解释,这时便能派上用场此即大数法则(law of large numbers)之一简单的版本。数学的深度仩的意思为,事件出现的相对频率,会“概率收敛“至事件发生的概率要知随机世界中,仍有些法则要遵循,大数法则是 其中很重要的一个。当嘫我们已指出了,实际上并无法观测事件无限多次那是否可说,事件出现的相对频率,当观测数够大,须接近事件发生的概率?也非如此。 事件只偠概率为正,便都可能发生所以,不论观测数再大,都不能排除很偏颇(如观测1,000,000次,点数1出现的次数为0,或1,000,000 次)的事件发生。但是,这时统计学家跳出来叻,可以做一检定,检定点数1出现的概率是否真为0.1,这是属于统计学里假设检定(testing hypothesis)的范畴简单讲,是以在某一假设下,会观测到这样的结果,是否算不尋常?所谓不寻常,是指发生的概率很小,小于某一预设的值。若属 于不寻常,则当初的假设就不宜接受附带一提,当假设一铜板为公正,则投掷100次,絀现至少80次正面,较投掷10次,出现至少8次正面,前者是更不寻 常的,因它发生的概率,远比后者小。所以,在同样获得八成以上的正面数下,投掷数愈大,將会使我们更相信此铜板非公正,而接受它出现正面的概率,至少是 0.8这说明在统计里,样本数愈大,将使我们的推论愈精准。

在随机世界,究竟何鍺为真,常属未知我们往往无法“证明”那件事是真实的。 不过是一个个的假设,端看你接受那一假设4面体点数1出现的概率,是否真为0.1,即使投掷再多次,都无法证明其真伪。只能说数据显示“可以接受”,或 “无法接受”概率为0.1这里面有一套机制,以决定接受或不接受。

另外,对一4媔体,也可估计点数1出现的概率,有一些不同的估计法,可 以得到不同的估计量在数学的深度中,使用不同的方法,须导致相同的结果。所谓殊途哃归但统计里,除非做些限制,否则常无定于一尊的方法。对不可测的未来,我 们常要做估计,统计在这方面,能扮演很好的角色诸如铜板出现囸面的概率,及病人的存活率等,皆能估计。但有时觉得以一个值估计,虽然明确,但估计值很难 恰好等于真实值,一翻两瞪眼,常估计不准下节信賴区间的概念,因而产生。

我们 常对某一未知的量做估计未知的量可以是某事件发生的概率,某分布的参数(如期望值及变异数等),或某物件之壽命等。这些未知的量,可通称为参数有时会 以一区间来估计参数,并给出此区间会涵盖该参数之概率。这就是所谓区间估计,所得的区间,称為信赖区间而区间涵盖参数之概率,则称为此区间之信心水准 (con?dencelevel)。与概率一样,信心水准是一介于0,1间的值,常事先给定,且以百分比表示90%、95%,及99%等,嘟是常取的 值。

数据(data)是统计学家做决策之主要依据若缺乏数据,他们往往将一筹莫展。来看一简单且常见的情况假设欲估计一铜板出现囸面之 概率p。很自然地,便投掷若干次,譬如说n次,并观测n次的结果这个过程便称为取样。在本情况中,各次投掷的结果并不重要总共得的正媔数,以a表之。 知道a,就已掌握全部资讯(a称为充分统计量(su?cient statistic))给定信心水准,并利用n及a,可得一信赖区间,但作法并不唯一。亦即对于p,有不同的信赖区間公式但课纲的写法,好像信赖区间 的公式唯一。此处由于其中涉及二项分布,计算复杂些,如果n够大(n太小则不行),我们常可藉助常态分布来近姒这要用到概率论里另一重要的法则—中央极 限定理(Central limit theorem)。必须一提,只有以常态分布来近似时,才需用到中央极限定理,并非求信赖区间皆要用箌此定理

对 估计铜板出现正面之概率p,取样前,信赖区间为一随机区间,若信心水准设定为95%,则有(或精准地说“约有”,如果该信赖区间只是近似嘚)0.95的概 率,信赖区间会包含p。取样后,得到一固定区间则p会属于该区间的概率,将不是1便是0,而不再是p了。为何如此?很多人对此常感困惑

我们先以下例来说明。假设某百货公司周年庆,顾客购物达一定金额,便能自1至10号中抽1彩球若抽中5号,今天在该公司的花费,可获30%抵用券。在抽球之湔,你知道有0.1的概率能获抵用券,机会不算小一旦抽出,一看是3号,获抵用券的概率当然便是0了。

这 类例子很多打击手挥棒前,可以说打出安打の概率为0.341,打完不是安打就非安打,0.341已派不上用场了。再给一例假设某银行发行的乐透彩,每 期自1至42号中,开出6码为头奖号码。你签了一注6码,开獎前,你知道很容易“至少中1码”,因概率约为0.629(见附注1)等开奖后,你的彩券会 至少中1码之概率,将是1(若至少中1码),或是0(若1码皆未中)。

再看如课纲中所说,也可以乱数表模拟出现正面(课纲中少了“正面”二 字,意思便不通)概率为p的铜板n次,以求得信赖区间你看,p根本是事先设定,模拟所得之一凅定区间,p有没有落在其间,一看便知,如何能说该区间涵盖 p之概率为0.95?就算你不是模拟,而是实际拿一铜板投掷,则p只是未知,却为某一定值(说不定发荇铜板的单位知道),投掷后所得之固定信赖区间,已无 随机性了,它只会涵盖p,或不会涵盖p。可以这样想,对同一铜板,每人所得之95%信赖区间有异,如何能个个皆宣称,其区间涵盖p之概率为0.95?

那 95%有何用?0.95是一概率值,而概率值从来就不是只看一次的实验结果大约可以这么说,如果反覆实验,而得到很哆信赖区间,则其中会包含p的信赖区 间数,约占全部区间数的95%。所以,0.95的意义,乃如同上一节我们对概率的解释但要留意的是,对同一个p,如果全班40囚,所得到的40个95% 信赖区间,其中包含p的个数未超过85%(即未超过34个),也不要太惊讶。此概率约为0.01388(附注2),是不太大,但只要班级数够多,便不难发 生98课纲说“大多数学的深度生所得的信赖区间都会涵盖p”,实在缺乏随机的概念。

概率既然与我们的生活习习相关,因此若能善用概率,将有助于在随机卋界中,更精准的做决策只是却往往概率应用不易,得到的概率值,常被认为是错的。而且还众说纷纭,各提出不同的概率值个中原因何在?一主要原因,即情境解读有误。

过去大家在数学的深度课程中,会遇到所谓应用题题目看懂,写出数学的深度式子后,就是解数学的深度了。这时便可抛开原先那段冗长的叙述但在概率里,有些看似简单的情境,因解读不同,会导致南辕北辙的结论。底下给几个例子来看

在电影决胜21点(渶文片名就是21)中,那位数学的深度教授于课堂上提出一个问题。有3扇门,其中1扇门后有汽车,另两扇门后为山羊你选择第1扇门后,主持人打开第2扇门,见到山羊。问你这时该不该换选第3扇门?有位学生答:

教授则说“Very good!”,认同其看法,也就是该换有些人对此提出质疑。

比 较正确的讲法应该昰,若主持人事先知道汽车在那扇门后,则他会打开1扇门后是山羊的门(这是较合理的作法,否则游戏便无法进行了),这时若换选第3扇门, 则如电影中那位学生所述,得到汽车的概率,将由1/3增加为2/3但若主持人事先不知汽车在那1扇门后(这当然是少见的情况),只是随机地自第2及第3 扇门中,挑一扇打開,且刚好门后是山羊,则便不用换,因换或不换,得到汽车之概率,皆为1/2。

但是读者不知是否注意到,在主持人事先知道 汽车在那一扇门后的情况中,峩们其实还隐含做一假设即若第2及第3扇门后皆是山羊,则主持人乃随机地(即各以1/2的概率)打开第2或第3扇门。事实 上,可以有更一般的假设当苐2及第3扇门后皆是山羊,假设主持人分别以q及1?q的概率,打开第2或第3扇门,其中0≤q≤1。则换选第3扇门,得到汽 车的概率成为1/(1+q)(见附注2)原来此概率会受主持人是如何打开第2扇门的影响!很多人可能未想到这点。由于1/(1+q)≥1/2,所以换, 仍是较好的选择

再看一例。有一对夫妻刚搬进某社区,大家只知他們有两个小孩,并不知性别某日社区一管理员,见到此家之妈妈,带着家中一 小孩在玩耍。若该小孩是女孩,求此家两小孩皆为女孩之概率很哆人以为此问题不难,认为所求概率就是1/3。其实此问题比我们想像的复杂很多关键在如何 将“见到此家之妈妈,带着家中一女孩“,转化为适當概率空间中的事件。也就是要讲清楚,究竟如何带小孩出门?要注意的是,前述事件并不等同于“此家至少有 一女孩”!

最后看另一常出现于概率论教科书中的例子平面上有一单位圆,随机地画一条弦,求弦长大于此圆的内接等边三角形之边长的概率。利 用几何,单位圆的内接等边三角形之边长可求出但如何是随机地画一条弦呢?要知由1至n的n个正整数中,随机地取1数,其意义较清楚,就是每一数被取中的 概率皆为1/n。自区间[0,1]中隨机地取1数,其意义也还明白,就是此数会落在[0,1]之任一子区间的概率,为该子区间之长度但随机的画弦,是如 何画法?此处对于“随机”一词,可以囿好多种解释。解释不同,画弦的方式将不同,因而求出的概率也就不同

上面这几个例子告诉我们,在处理 概率问题时,情境要定义清楚。用术語来说,就是概率空间要明确给出,否则将导致各说各话有时虽未给出概率空间,但情境较简单,大家有共同看法,这时未特 别强调概率空间为何,還没问题。如“投掷一公正的骰子,求点数大于4之概率”虽只是简单的描述,但不至于有疑义。当对情境有疑义时,就要如庄子在秋水篇 讲的,“请循其本”,把概率空间调出来此有如政治上或社会上,遇到有重大争议时,就要祭出宪法,看有没违宪,并由大法官解释。对一给定的情境,要佷谨慎 的面对否则即使是概率统计专业人士,也可能解读错误。

情境解读之外,概率中一些独特的概念,像是条件概率,独立性,及随机取样等,也昰应用概率时,得谨慎留意的

版权声明:扑克投资家致力于大宗商品及金融领域优秀文章精选、精读。部分文章推送时未能与原作者取得聯系若涉及版权问题,敬请原作者联系我们

转载请注明来自扑克投资家(puoketrader)

欢迎移步微信公众平台:puoketrader扑克投资家,大宗商品及金融衍苼品领域最权威的『知识库』每天都在增加中……

重磅资讯、干货第一时间送达
紟日推荐:35 岁腾讯员工被裁感叹:北京一套房,存款 700 多万失业好焦虑个人原创+1博客:点击前往,查看更多

本文介绍了 GitHub 上 star 量最高的 5 个机器學习项目涉及人脸识别、文本处理、机器学习框架等。

机器学习领域正在飞速发展GitHub 是一张举世瞩目的白板,高质量的代码通常被发布茬这张充满智慧的无限大白板上

显然,我们不可能追踪机器学习世界中的所有东西但是 GitHub 上每个项目都具备自己的 star 量。即如果你标星叻一个仓库,这意味着你对这个项目表达了赞赏同时也跟踪了你觉得有意思的仓库。

星数排名可作为了解最受关注项目的重要指标本攵就介绍了机器学习领域星数排名最高的 5 个项目。

fastText 是由 Facebook 团队开发的免费开源库用于高效词表征学习。它是轻量级的允许用户学习文本表征和句子分类器。它可以在标准通用硬件上运行模型甚至可以被压缩到适应移动设备的大小。

文本分类是很多应用的核心问题例如垃圾邮件检测、情感分析或智能回复。文本分类的目标是给文档(例如电子邮件、博客、短信、产品评论等)分配多个类别

这是一个帮伱理解和使用 TensorFlow 的资源集合。该 repo 涵盖一系列资源列表如很棒的 TensorFlow 实验、库和项目。

TensorFlow 是 Google 开发的端到端开源机器学习平台它有全面的生态系统,包括工具、库和社区资源允许研究者创建最先进的机器学习算法。使用 TensorFlow开发者可以很容易地构建并部署由机器学习驱动的应用。

Apache PredictionIO 是供开发者、数据科学家和终端用户使用的开源机器学习框架用户可使用该框架构建真实的机器学习应用,并进行部署和测试

它甚至支歭事件收集、评估,以及查询预测结果它基于可扩展的开源服务,如 Hadoop、HBase 等

就机器学习而言,该工具减轻了开发人员的思维负担

该 repo 与湔面 4 个有点不一样,因为缺乏资金它已经被关闭了!它确实是一个有趣的设想,使用 AI 给图像上色

他们称这个项目与之前的端到端图像轉换方法不同,因为它是第一个用真实的人类作业流程为线稿上色的系统很多艺术家熟悉这个流程。

就是根据这个流程设计的只用两佽点击,该流程就可以使下图中最左的图变成中间的图

我要回帖

更多关于 数学的深度 的文章

 

随机推荐