观点概率的哲学意义所有科学皆为数

文末专题从+篇文章中精选近50篇,点击即可阅读,无需输入关键字。

新增底部导航栏,快速浏览7月精粹和大数据分选集。即刻°洞察大数据。

?概率的哲学意义:所有科学皆为数学所有判断皆为统计

文:黄文璋

转自:《数学传播》

年,是印度传奇数学家拉曼努扬(SrinivasaRamanujan,-)的百年诞辰。为了纪念他,有一系列的活动。当代著名统计学者,出生于印度的劳氏(C.RadhakrishnaRao,),也应邀做了三场演讲。之后,印度统计学研究所(IndianStatisticalInstitut)基于劳氏的演讲稿,于年,为他出版了统计与真理一书。此书于年发行第二版。

在第一版的序文中,劳氏提到:

学生时代,我主修数学一种从给定前提下演绎结果的逻辑。后来我念统计学一种从经验中学习的理性方法,及从给定的结果验证前提的逻辑。我已认识到数学及统计,在人类为提昇自然知识,及有效管理日常事务所做的一切努力中,占有重要性。

我相信:

在最终的分析中,所有知识皆为历史。

在抽象的意义下,所有科学皆为数学。

在理性的世界里,所有判断皆为统计。

这一段话,大致说明数学及统计的重要性,及其各自的内涵。

长期以来,高中数学均涵盖概率的题材,其中古典概率(即以“相同的可能性”来解释概率)又占不小比例。因此概率常与排列组合连在一起。而排列组合是较“数学的”。虽然学生有时会被那些复杂的题目,弄得昏头转向。但那只是技巧性方面,在认知方面,大抵没太大迷惑。近年来,鉴于统计学的重要性,高中数学里,逐渐加进统计的题材。这其中95学年开始实施的“普通高级中学数课程纲要”中,新增的信赖区间与信心水准,却带给师生不小困扰。此新加入的统计题材,由于需取样,得到数据,使概率论里“随机性”的特质显现出来。而随机性与传统数学中特有的“必然性”,乃完全不同的概念。虽有人认为概率与统计,“这类数学所需的前置准备不多”,因此提前教没问题。但随机性的概念,在理解层次上,其实并不是那么容易能掌握。

翻开统计史,信赖区间,是另一著名统计学者,出生于波兰,年才移民至美国的奈曼(JrzyNyman,-。他是我的师祖,即我指导教授的指导教授),于年演讲中首度提出。他的演讲结束后,大会主席包雷(ArthurLyonBowly,-)于致词中提到,“我不很确定此信心不是一信心戏法”。要知奈曼信赖区间的概念刚提出时,大部分的统计学者,包括被视为是现代统计学之创始者,英国的费雪(SirRonaldAylmrFishr,-,常以R.A.Fishr称之)均难以接受。在所谓95%信赖区间中,那95%究竟是指什么?是概率吗?如果是,那又是什么的概率?虽奈曼取巧地以信赖区间,来称呼此一他创造出来的东西,而避用概率一词。但包雷及其同行,当然一眼便看穿这个手法。这段过程,可参考Salsburg()Chaptr12(但该书中的A.L.Bowly应该是G.M.Bowly),及Sawilowsky()一文。

岁月匆匆,七十多年过去了,今日统计学家,当然已完全弄懂信赖区间的意义。只是在大学里,不论在概率与统计、统计学,及数理统计等教科书中,信赖区间通常属于后半部的题材。也就是大学生在相关的课程中,开始接触信赖区间时,大致上已有相当够的概率统计基础。如今此题材却获数学家青睐,继95课纲加入后,98课纲(后改为99学年度起逐年实施)仍保留此题材。但由于缺乏足够的预备知识,高中生吸收不易,乃可预期。

为何此“有点深度”的题材,却能堂而皇之地进入高中数学教材?猜想主要原因是其重要性。这只要看到媒体上,常刊载各种调查结果的信赖区间,及信心水准,便可了解。

在有些统计教科书里,信赖区间占一章的份量。对不同的参数,不同的分布,可有不同的信赖区间;即使同一参数且同一分布,也可以不同的方法,得到不同的信赖区间。有时因条件不足,或计算复杂等原因,只好退而求其次,得到近似的信赖区间。当然这时需要一些条件,及利用一些定理。信赖区间亦可比较优劣。要知统计里有各种推论方法,但因处理的是随机现象,少有倚天既出,谁与争锋的方法。而评比时,也要订出评比准则。否则就像有个停止不动的钟,及一每日慢1分钟的钟,如何判定何者较准?前者可是每日皆有完全准确的时刻,后者却是每1,天(一天有1,分),才有一完全准确的时刻。不讲清楚如何评比,将会各说各话。

“常态分布,信赖区间与信心水准的解读”中说:

高中程度的统计推论只做随机变数期望值的估计,它的背后理论是中央极限定理。要介绍中央极限定理,就需引入常态分布。此部分仅做通识性的介绍,以活动方式建立学生对于中央极限定理的直观。对一固定的信心水准,给出信赖区间公式,再让学生以乱数表模拟或实验投掷正面出现概率为p的铜板n次,代入信赖区间公式,以说明信心水准的意涵;并以此解读,何以大多数学生所得的信赖区间都会涵盖p?

这段“解读”不但有若干问题,也没能说明白。如第一句中“它的背后理论是中央极限定理”,便不知从何而生?此非统计学里的看法。由于课纲中的解读晦涩不明,那些认真教学,想将学生教懂的高中数学教师,只好钻研其中原理,各自解读。有些还提出自认能“厘清这些概念”的文章。只是其解读,往往仍失之精准。

为何信赖区间的概念,常会沦于类似郢书燕说的下场?追根究底,还是不少学习者,未能正确了解概率的涵意。这是本文写作的动机。

概率的意义

一骰子有6个面,一掷之下,会得到偶数之概率为何?骰子看起来没有异样,就假设每个面出现的概率皆相同,即均为1/6。而偶数面有2,4,及6等3个。因此所求之概率为3/6。这就是所谓古典的概率,基本假设是“相同的可能性”。先求出观测的现象共有几种可能,再求出其中有几件是我们有兴趣的。将后者除以前者,即为所要的概率。虽说是“古典”,这种概率的意义,至今仍处处可见。采用的范围包含诸如抽籤、玩扑克牌,及玩乐透彩等。又如某项工作征才,报名的有82人,录取5人。若没有什么特别的资讯,便只能假设每人被录取的概率皆相同,即皆为5/82。

年7月底8月初,世界高尔夫球王老虎伍兹(TigrWoods),参加在美国密西根州举行的别克公开赛(BuickOpn)。第1轮打完,落后领先者多达8杆,排名并列95。引发他可能难逃职业生涯,首次连续2场比赛(前一场是英国公开赛(ThOpnChampionship,在英国之外常称为BritishOpn)),提前被淘汰的话题。不过老虎毕竟不能小觑,打完前3轮后,伍兹跃居首位。

这时大家看法不变,一致认为这座冠军盃,几乎可说是他的囊中物了。因过去的纪录显示,伍兹如能带着54洞领先进入决赛圈,战绩是35胜1败。你要不要猜后来他赢了没有?运动比赛,往往有过去资料可参考,此时相同的可能性便不宜用了。36次中成功35次,“相对频率”为35/36(约0.)。这种以相对频率来解释概率,是常有的作法。适用能重复观测的现象。会不会有爆出冷门的时候?当然有。只是对一特定事件,用过去多次同样情况下,该事件发生的相对频率,来估计下一次事件发生的概率,乃是在没有更多资讯下,常被认为一属于客观的办法。

某君看上一女孩,惊为天人,觉得这是他今生的新娘。评估后信心满满,自认追上的机会有8成。旁人却都不看好,问他8成这一数字,是如何冒出来的?该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。这个0.8的概率,就是所谓主观概率。主观概率当然也可基于过认识概率35去一些客观的事实。只是即使面对同样的资料,不同的人,可能有不同的判定,因而给出不同的主观概率(看过他其实没那么喜欢你(H’sJustNotThatIntoYou)吗?片中那个叫Gigi的女孩,便常误解男生所透露的讯息)。有些现象就是不能重复观测。如核能电厂的意外,及彗星撞地球等。以追女孩为例,大约少有女孩,会让你做实验,反覆地追,然后数一数其中成功几次,来定下她会被你追上的概率。对这类无法重复观测的现象,在谈概率时,主观概率就常派上用场。每天早上出门,我们不是惯于抬头看天,判断一下今天下雨的概率有几成?只是往往父母认为的概率会大些,该带伞,而小孩所认为的下雨概率会小些。

虽说“主观”,但仍要合理。例如,考试有及格与不及格。若认为会及格的概率为0.9,这没问题,人总要有点自信,但若又同时担心有0.8的概率会不及格,那就不行了。各种可能性发生概率相加要为1。即使是主观,可以独排众议,仍须自圆其说。不能说,既然是主观,便可以任意自定各事件之概率。因此不论是那一种对概率的解释,都自然地,或说必须要满足一些共同的规则。这点大家应能理解。

上述三种是常见对概率的解释,大抵也就是人们评估事件发生可能性之大小的几种思维。虽是针对不同的情况,但常能交互着运用。大家都听过曾参杀人的典故吧!有个与曾子同名的人杀人,好心者告诉曾母“曾参杀人”。曾母说“吾子不杀人”,继续织布。过一会儿,又有人来说“曾参杀人”。曾母仍继续织她的布,这么好的儿子怎可能杀人?但当第三人跑来说“曾参杀人”,曾母就害怕了,丢掉织布器具翻墙而逃。所谓“其母惧,投杼踰墙而走”。这故事出自战国策秦策二。因此当拿到一铜板,可主观地认为,政府发行不该会有偏差,两面出现的概率,应皆为1/2(这也可以是基于相同可能性之想法)。若投掷10次,正面出现8次,可能觉得有些奇怪。若继续投掷,结果次中,出现80个正面,这时相对频率的观点,很可能便将显现。类如曾母,调整看法,不再认为此铜板公正。

当然,你可以不信邪,不论投掷的结果如何,皆认为那只是短暂的情况,意志坚定地认为这是一公正的铜板。这并没有不行,就像会有母亲,即使再多的人证,只要她没亲眼看到,她就不信儿子会杀人。要知随机现象,事件只要概率为正,不论概率值多小,便皆可能发生。毕竟铜板正面出现的概率为何,只有天晓得。但引进概率与统计,乃为了协助我们做决策可以更精准。而决策可以与时推移,并非不能更改。有如气象局对颱风会带来多少雨量,须密切掌握新的动向,而随时修正。要有随机的思维,如前言中劳氏所说的,从给定的结果,验证前提。因此针对次投掷,出现80个正面,多数人面对此结果,还是会认为0.8的正面出现概率,较0.5的概率可信。稍后我们会再来看,10次中的8次,与次中的80次,相对频率同为0.8,但提供的资讯,是否有异?

虽然已有上述三种对概率的解释,也涵盖了不少实际生活中所遇到的情况,数学家当然不会在此止步。他们喜欢抽象化,及一般化。像解方程式,会寻求公式,以表示出某类方程式的解,而非只满足于求出一个个的特例之解。又如当完全了解实数系统后,便会以公理化的方式,定义实数系统。即给一集合,没说是数字的集合,对其中的元素定义二运算,并给出10条遵循的公理(axiom,规则)。你好奇该二运算是否一为加法,一为乘法?而怎么没有减法与除法?名可名,非常名,数学家不认为你提出的是重要的问题。但用心体会后,你终于发现原来二运算,其一等同于加法,其二等同于乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。数学家对你的洞察力,仍不以为意,但同意你可以这样想。

什么叫以公理化的方式,来引进概率?先要有一个集合,称做样本空间,当做某一观测之所有可能结果的集合。可以真的有这一观测,或只是虚拟的。样本空间的某些子集合,是我们有兴趣的,这些就是一个个的事件。所有事件也构成一集合。最后定出一概率函数,即对每一事件,给一介于0,1间的值,为该事件之概率。样本空间、事件的集合,及概率函数,三者便构成概率空间(probabilityspac)。这其中对样本空间没有太大要求,但不可以是空集合。而事件的集合,要满足若干条件。简单讲,就是你有兴趣的事件不能太少。譬如说,不能只对某事件A发生有兴趣,却对A不发生没兴趣。因此事件的集合要够大,至少该有的都得纳入。这有点像婚宴前拟宾客名单。可以请很少人,如只有双方家长。而一旦多列了某人,与他同样亲近的人便也要一併请。所以每多列1人,将不只是增加1人而已,而会随之增加几位。又概率函数,既然以概率之名,当然要符合过去大家对概率的认知,满足一些基本的条件。

在概率空间的架构下,不论采用何种方式解释概率的人,都可各自表述,找到他所以为的概率意义。但因抽象化后,不再局限于铜板、骰子,及扑克牌等,便能讨论较一般的问题,有够多的理论可挖掘。

与数学的其他领域相比,概率论的发展是较晚的。但公理化后,概率论便快速地有了深而远的发展,并成为数学中一重要的领域。这都要归功于二十世纪那位重要的概率学家,俄国的科莫果洛夫(AndryNikolavichKolmogorov,-),于他年出版,那本不到页的小书概率论的基础(FoundationsofthThoryofProbability)中所奠定。在此书中,他说:

概率论作为数学学科,可以而且应该从公理开始发展,就如同几何、代数一样(ThthoryofprobabilityasmathmaticaldisciplincanandshouldbdvlopdfromaxiomsinxactlythsamwayasGomtryandAlgbra)。

何处是概率天地

有法国牛顿之称的拉普拉斯(Pirr-Simon,MarquisdLaplac,-)曾说:

这门源自考虑赌博中的机运之科学,必将成为人类知识中最重要的一部分,生活中最重要的问题中的大部分,都将只是概率的问题。(Thisscinc,whichoriginatdinthconsidrationofgamsofchanc,shouldhavb







































治疗白癜风最好药
治疗白癜风医院哪家好



转载请注明:http://www.xinhexianzx.com/xhxjq/172.html