一. 随机误差的正态分布
1. 正态分布
随机误差的规律服从正态分布规律,可用正态分布曲线(高斯分布的正态概率密度函数)表示:
(13)
式中:y—概率密度;m—总体平均值;s—总体标准偏差。
正态分布曲线依赖于m和s两个基本参数,曲线随m和s的不同而不同。为简便起见,使用一个新变数(u)来表达误差分布函数式:
(14)
u的涵义是:偏差值(x-m)以标准偏差为单位来表示。
变换后的函数式为:
(15)
由此绘制的曲线称为“标准正态分布曲线” 。因为标准正态分布曲线横坐标是以s为单位,所以对于不同的测定值m及s,都是适用的。
图1:两组精密度不同的测定值 图2:标准正态分布曲线
的正态分布曲线
“标准正态分布曲线”清楚地反映了随机误差的分布性质:
(1)集中趋势当x=m时(u=0),,y此时最大,说明测定值x集中在m附近,或者说,m是最可信赖值。
(2)对称趋势 曲线以x=m这一直线为对称轴,表明:
正负误差出现的概率相等。大误差出现的概率小,小误差出现的概率大;很大误差出现的概率极小。在无限多次测定时,误差的算术平均值极限为0 。
(3)总概率曲线与横坐标从-µ到+µ在之间所包围的面积代表具有各种大小误差的测定值出现的概率的总和,其值为1(100%)
(16)
用数理统计方法可以证明并求出测定值x出现在不同u区间的概率(不同u值时所占的面积)即x落在m±us区间的概率:
置信区间 置信概率
u=±1.00x=m±1.00s68.3%
u=±1.96x=m±1.96s95.0%
u=±3.00x=m±3.00s99.7%
二. 有限数据随机误差的t分布
在实际测定中,测定次数是有限的,只有和S,此时则用能合理地处理少量实验数据的方法—t分布
1.t分布曲线 (实际测定中,用、S代替m、s)
t分布曲线与标准正态分布曲线相似,纵坐标仍为概率密度,纵坐标则是新的统计量t
(17)
无限次测定,u一定®P就一定;
有限次测定:t一定®P随n(自由度)不同而不同。
不同的n值及概率所对应的t值,已有统计学家计算出来,可由有关表中查出。
2. 平均值的置信区间
应用t分布估计真值范围,考虑的符号时,则可得到如下关系式:
m=x±tP,nS(18)
同样,对于样本平均值也存在类似的关系式:
(19)
此式表示的是在一定概率下,以样本平均值为中心的包括真值在内的取值范围,即平均值的置信区间。称为置信区间界限。
此式表明:平均值与真值的关系,即说明平均值的可靠性。
平均值的置信区间取决于测定的精密度、测定次数和置信水平(概率)。(分析工作中常规定为 95%)
测定精密度越高(S小),测定次数越多(n大),置信区间则越小,即平均值越准确。