概率论与数理统计简介

从随机现象来看,在自然界和现实生活中,有些事物是相互联系,不断发展的。在它们的关系和发展中,根据是否具有必然的因果关系,可以分为截然不同的两类:一类是确定性现象。这种现象在一定条件下必然会导致一定的结果。比如在标准大气压下,水加热到100摄氏度,必然会沸腾。事物之间的这种联系是不可避免的。通常,自然科学的各个学科都专门研究和认识这种必然性,寻求这种必然现象的因果关系,把握它们之间的数量规律。另一个是不确定现象。这种现象是在一定条件下的,其结果是不确定的。比如同一个工人在同一台机床上加工几个同类零件,尺寸总会有一点差别。再比如,在同样的条件下,进行小麦品种的人工发芽试验,每个种子的发芽情况不一样,比如强弱、早晚等。为什么在同样的情况下会有这样一个不确定的结果?这是因为当我们说“同等条件”时,我们指的是一些主要条件。除了这些主要条件之外,还会有很多次要条件和人们无法提前把握的偶然因素。正因为如此,在这种现象中,我们无法用必然的因果关系对个别现象的结果提前做出确定的回答。事物之间的这种关系是偶然的,这种现象叫做偶然现象或随机现象。

在自然界,在生产生活中,随机现象非常普遍,也就是说,随机现象大量存在。比如每次体育彩票的中奖号码,同一条生产线上生产的灯泡的寿命,都是随机现象。所以我们说:随机现象是在相同的条件下,对同一现象进行多次相同的实验或调查,得到的结果并不完全相同,无法准确预测下一个结果的现象。随机现象结果的不确定性是由一些次要的、偶然的因素造成的。

从表面上看,随机现象似乎是混乱和无规律的。但实践证明,如果大量类似的随机现象反复出现,其总体情况会表现出一定的规律性。大量相似随机现象的规律性随着我们观察次数的增加越来越明显。比如抛硬币,每次都很难分辨哪一面朝上,但如果硬币反复抛,就会越来越清楚,他们面朝上的次数大致相同。

我们把这种由大量相似的随机现象所呈现的集体规律性称为统计规律性。概率论和数理统计是研究大量相似随机现象的统计规律性的数学学科。概率论产生于17世纪,最初是保险的发展产生的,但赌徒的要求是数学家思考概率论中问题的来源。

早在1654年,一个赌徒梅勒向当时的数学家帕斯卡提出了一个困扰他很久的问题:“两个赌徒约好赌几局。谁先赢M局,谁就赢所有的赌注。但是当他们中的一个赢得A (A

三年后的1657年,荷兰著名天文学家、物理学家、数学家惠更斯试图自己解决这个问题,结果写了一本关于概率游戏计算的书,这是最早的概率论著作。

近几十年来,随着科学技术的蓬勃发展,概率论已广泛应用于国民经济、工农业生产和各个学科。许多新兴的应用数学,如信息论、博弈论、排队论、控制论等,都是建立在概率论基础上的。

概率论和数理统计是随机数的一个分支,是同类紧密联系的学科。但需要指出的是,概率论、数理统计、统计方法都有各自不同的内容。

概率论——以大量相似的随机现象的统计规律为基础,对随机现象的某种结果的可能性作出客观科学的判断,并对这种发生的可能性作出定量的描述;比较这些可能性,研究它们之间的关系,从而形成一套数学理论和方法。

数理统计——是应用概率论研究大量随机现象的规律性;对通过一定数量的科学安排的实验得出的统计方法,给予严格的理论证明;并确定各种方法的适用条件,以及方法、公式、结论的可靠性和局限性。它使我们能够从一组样本中判断一个判断是否能以相当大的概率保证正确,并能控制错误的概率。

统计方法——是将世界上提供的方法应用于各种具体问题,并不注重这些方法的理论基础和数学论证。

需要指出的是,概率统计在研究方法上有其特殊性,与其他数学学科的区别如下:

第一,由于随机现象的统计规律是一种集体规律,必然在大量相似的随机现象中呈现,所以观察、实验、调查是概率统计研究方法的基石。但作为数学的一个分支,它仍然有这个学科的定义、公理和定理。这些定义、公理和定理都是从自然的随机规律中推导出来的,但这些定义、公理和定理都是确定的,不存在随机性。

其次,在概率统计的学习中,使用了“以局部推断整体”的统计推断方法。这是因为它的研究对象——随机现象的范围非常大,不可能也没有必要进行所有的实验和观测。然而,从这部分数据得出的一些结论应该从整个范围来推断。

三、随机现象的随机性是指在实验和调查之前。得到真实结果后,它每次测试只能得到这些不确定结果中的一个。我们在研究这种现象的时候,要注意在实验之前是否能找出它的内在规律。概率论作为数学的一个分支,一般包括随机事件的概率性、统计独立性和更深层次的规律性。

概率是随机事件发生可能性的定量指标。在独立随机事件中,如果一个事件在所有事件中的出现频率在较大范围内明显稳定在一个固定常数附近。可以认为这个事件的概率是这个常数。任何事件的概率值必须介于0和1之间。

有一种随机事件,它有两个特点:一是可能的结果只有有限的几种;第二,每个结果的可能性都是一样的。具有这两个特征的随机现象称为“经典概率”。

客观世界中存在大量的随机现象,随机现象的结果构成随机事件。如果用变量来描述随机现象的结果,则称为随机变量。

随机变量分为有限和无限,一般按变量的取值分为离散型随机变量和非离散型随机变量。所有可能的值都可以按一定的顺序列出。这种随机变量称为离散随机变量。如果可能值充满一个区间,不能按顺序一一列出,这个随机变量称为非离散随机变量。

在离散随机变量的概率分布中,二项分布简单且应用广泛。如果随机变量是连续的,它们都有一条分布曲线。实践和理论证明,存在一种特殊的、常用的分布,其分布曲线是有规律的,这就是正态分布。正态分布曲线取决于这个随机变量的一些表示,其中最重要的是平均值和差异程度。平均值也叫数学期望,差异程度也是标准差。数理统计包括抽样、拟合问题、假设检验、方差分析、相关分析等。抽样检查是通过调查子样本来推断总体情况。取样多少是一个非常重要的问题。因此,抽样检验中就产生了“小样本理论”,这是一种在样本很小时进行分析判断的理论。

曲线拟合问题也叫曲线拟合。有些问题需要根据积累的经验数据来解决,才能理解整个问题。但是根据什么原理找到理论曲线呢?如何比较同一问题中发现的几条不同的曲线?曲线匹配时如何判断它们的误差?.....属于数理统计中拟合直线问题的讨论范围。

假设检验是用数理统计方法对产品进行检验时,先做出一个假设,然后根据抽样结果判断原假设有一定的可靠性。

方差分析,也称偏差分析,是用方差的概念来分析少数实验就能做出的判断。

由于人类实践活动中大量随机现象的存在,概率统计随着现代工业、农业和科学技术的发展而不断发展,从而形成了许多重要的分支。如:随机过程、信息论、极限论、实验设计、多元分析等。