山西自考会计专业概率论与数理统计复习资料6

山西自考网 发布时间:2012年06月05日

下面内容公式和符号显示不全,请下载原版word文档 

    [点击下载该文件:第六章 统计量及其抽样分布.doc]

 

第六章 统计量及其抽样分布

内容介绍
  本章是数理统计的基础,主要讨论总体、样本、统计量等及统计量的抽样分布.

  考点分析
   2007年4月 2007年7月 2007年10月
选择题    1题2分   
填空题 2题4分 1题2分 1题2分
计算题         
综合题         
合计 2题4分 2题4分 1题2分
  
  内容讲解
§6.1 引 言
  
  随机变量是通过概率分布来描述随机现象的,但是,概率分布往往是未知的,因此,必须寻求其他的方法来弥补随机变量的不足,这就产生了数理统计的理论和方法。这是本课程的如下的内容。先看如下两个例题。
  例题1. P126
  【例6-1】某公司要采购一批产品,每件产品要么是正品,要么是次品。若设这批产品的次品率为p(一般是未知的),则从该批产品中随机抽取一件,用X表示抽到的次品数,不难看出X服从0-1分布B(1,p)。但分布中的参数p是不知道的。显然,p的大小决定了该批产品的质量,它直接影响采购行为的经济效益,故人们对p提出一些问题,例如:
  “p的大小如何?”
  “p大概落在什么范围内”
  “能否认为p满足设定要求(如p≤5%)?”
  【答疑编号12060101】
  例题2. P126
  【例6-2】彩电的彩色浓度是彩电质量好坏的一个重要指标。20世纪70年代在美国销售的SONY牌彩电有两个产地:美国和日本。两地的工厂是按同一设计方案和相同的生产线生产同一型号SONY彩电,连使用说明书和检验合格的标准也是一样的。
  【答疑编号12060102】
  
§6.2 总体与样本
  
  1.总体和个体
  (1)定义:研究对象的全体称为总体,构成总体的每个成员称为个体.
  (2)解释:① 一般地,总体是研究对象的某个数量指标或可以数量化的指标;
   ② 总体的某个数量指标X的取值在客观上与一定的概率相联系,即服从一定的分布,所以X是一个随机变量;
   ③ 总体的指标选择应该是清楚的.
  例题3. P126
  【例6-3】
  考察某厂的产品质量,将其产品只分为合格品与不合格品,并以0记合格品,以1记不合格品,则
  总体={该厂生产的全部合格品与不合格品}={由0或1组成的一堆数}。若以p表示这堆数中1的比例(不合格率),则总体可由一个二点分布表示:
  
  不同的p反映了总体间的差异。
  【答疑编号12060103】
  例如,两个生产同类产品的工厂的产品总体分布为:
    
  我们可以看到,第一个工厂的产品质量优于第二个工厂。
  2.样本
  (1)定义:从总体中随机抽取n个个体,其指标值为x1, x2,…,xn,则称x1, x2,…,xn为总体的一个样本,n称为样本容量,样本中的个体称为样品.
  (2)解释:① 样本是随机变量. 样本是在总体中随机抽取的,事先并不知道哪个个体可能被抽中,无法预知它们的数值,所以,样本是随机变量,用大写字母X,Y,Z等表示;
   ② 样本观察值. 每一个样本取出后,得到一组数值,称为样本观察值,用小写的字母表示,如x1, x2等.
   ③ 无论是样本还是它的观察值,本书一律用小写字母表示,其实际意义可以从上下文加以区别.
 
  (3)简单随机样本
   有多种抽样方法,用简单随机抽样方法得到的样本称为简单随机样本,简称样本.
 
  本书的样本皆为简单随机样本,满足以下要求:
  (1)随机性:总体中每一个个体都有相同的机会被抽中,意味着每一个样品与总体
  有相同的分布;
  (2)独立性:样品之间是相互独立的,它们的取值互相之间没有影响.
  例题4. P128
  【例6-4】啤酒厂生产的瓶装啤酒规定净含量为640g,由于随机性,事实上不可能使得所有的啤酒净含量均为640g。现从某厂生产的啤酒中随机抽取10瓶测定净含量,得到如下结果。
  641 635 640 637 642 638 645 643 639 640
  这是一个容量为10的样本的观测值,对应的总体为该厂生产的瓶装啤酒的净含量。
  【答疑编号12060104】
  从总体中抽取样本时,为使样本具有代表性,抽样必须是随机抽样。通常可以用随机数表来实现随机抽样。还要求抽样必须是独立的,即每次抽样的结果互不影响。
  (4)样本的分布函数和概率密度
   设总体X的分布函数为F(x),样本x1, x2,…,xn的观察值为x1, x2,…,xn,则样本的联合分布函数为
   F(x1, x2,…,xn)= .
 
   若总体X为连续型随机变量,概率密度为f(x),则样本的联合密度函数为
   f(x1, x2,…,xn)= .
 
   若总体X为离散型随机变量,则样本的(联合)概率函数为
   p(x1, x2,…,xn)= .
 
  例题5. P129
  【例6-5】为估计一物件的重量μ,用一架天平重复测量n次,得样本x1, x2,…,xn。由于是独立重复测量,x1, x2,…,xn是简单随机样本。总体的分布即X1的分布(x1, x2,…,xn分布相同)。由于称量误差是均值(期望)为零的正态变量,所以X1可认为服从正态分布N(μ,σ2)(X1等于物件重量μ加上称量误差)。
  【答疑编号12060105】
 
 
 
 
  例题6. P129
  【例6-6】设某种电灯泡的寿命X服从指数分布E(λ),其概率密度为:
  【答疑编号12060106】
 
  例题7. P129
  【例6-7】考虑电话交换台一小时内的呼唤次数X。求来自这一总体的简单随机样本x1, x2,…,xn的样本分布。
  【答疑编号12060107】
 
  3.样本数据的整理与显示
  【例6-8】为研究某厂工人生产某种产品的能力,随机调查了20位工人某天生产该种产品的数量,数据如下:
  160 196 164 148 170
  175 178 166 181 162
  161 168 166 162 172
  156 170 157 162 154
  表6-2  例6-8的频数频率分布表
组序   分组区间   组中值  频数   频率   累计频率/%
1   (147,157]   152    4    0.20    20
2   (157,167]   162    8    0.40    60
3   (167,177]   172    5    0.25    85
4   (177,187]   182    2    0.10    95
5   (187,197]   192    1    0.05    100
合计                20   1
  
  【答疑编号12060108】
§6.3 统计量及其分布   

  1.统计量与抽样分布
  定义:设x1, x2,…,xn为总体X的样本,若样本函数T=T(x1, x2,…,xn)中不含任何未知参数,则称T为统计量;统计量的分布称为抽样分布.
  2.经验分布函数
  (1)定义:设x1, x2,…,xn为总体X的样本,总体X的分布函数为F(x),若将样本观察值x1, x2,…,xn按由小到大排列为x(1),x(2),…,x(n),则称之为有序样本;用有序样本定义函数
   ,k=1,2,…,n-1,
  则称Fn(x)为经验分布函数.
  显然,Fn(x)是一个非减右连续函数,且满足Fn(-∞)=0,Fn(+∞)=1.
  例9.P132
  【例6-9】某食品厂生产听装饮料。现从生产线上随机抽取5听饮料,称得其净重为(单元:g)
  351 347 355 344 351
  这是一个容量为5的样本,经排序可得有序样本:
  x(1)=344,x(2)=347,x(3)=351,x(4)=351,x(,5)=355,
  其经验分布函数为
  
  
  对于每一固定的x,Fn(x)是样本中事件“xi≤x”发生的频率。当n固定时,Fn(x)是样本的函数,它是一个随机变量,由伯努利大数定律:只要n相当大,Fn(x)依概率收敛于F(x)。这表明,当n相当大时,经验分布函数是总体分布函数F(x)的一个良好的近似。
  3.样本均值及其抽样分布
  (1)样本均值的定义:设x1, x2,…,xn为总体X的样本,其算术平均值称为样本均值,一般记为 ,即 .
  在将样本分为k组的情况下,样本均值的计算公式为
   ,
  其中,k为组数,xi为第i组的组中值,fi为第i组的频数.
  【答疑编号12060201】
  例10.P133
  【例6-10】某单位收集到20名青年人某月的娱乐支出费用数据:
  79  84  84  88 92  93  94 97  98  99
  100 101 101 102 102 10 110 113 118 125
  则该月这20名青年的平均娱乐支出为
  
  将这20个数据分组可得到如下频数频率分布,见表6-3。
  表6-3  例6-10的频数频率分布表
组序   分组区间   组中值  频数   频率/%   
1    (77,87]     82    3     15
2    (87,97]     92    5     25
3    (97,107]    102    7     35
4    (107,117]   112    3     15
5    (117,127]   122    2     10
合计                20    100
  对表6-3的分组样本,
  
  我们看到两种计算结果不同,事实上,由于第二种计算未用到真实的样本观测数据,因而给出的是近似结果。
  【答疑编号12060202】
  (2)样本均值的性质
  ① 若称样本的数据与样本均值的差为偏差,则样本偏差之和为零,即
   .
  证明:
 
  ② 偏差平方和最小,即对任意常数c,函数 ,当 时取得最小值.
  证明:
 
 
  (3)样本均值的抽样分布
  定理:设x1, x2,…,xn为总体X的样本, 为样本均值,
  (1)若X~N(μ,σ2),则 的精确分布为 ;
  证明:
 
 
 
  (2)若总体X的分布未知或不是正态分布,且E(X)= μ,D(X)= σ2,则当样本容量n较大时, 的近似分布为 .
 
  4.样本方差与样本标准差
  (1)定义:设x1, x2,…,xn为总体X的样本,则它关于 的平均偏差平方和
  
  称为样本方差;其算术根 称为样本标准差.
 
  (2)计算公式
  在上面的定义中, 称为样本偏差平方和,它有3个不同的表达式:
   = .
 
  例11.P135
  【例6-11】在例6-10中,我们已经算得 ,其样本方差与样本标准差为
   
  
  【答疑编号12060203】
  (3)样本均值的数学期望和方差, 以及样本方差的期望
  定理:设x1, x2,…,xn为总体X的样本,具有二阶矩,即E(X)= μ,D(X)= σ2, 和s2分别为样本的均值和方差,则 , ,E(s2)=σ2.
 
 
  5.样本矩及其函数
  样本均值和样本方差的一般化为样本矩,这是一类常见的统计量.
  定义:设x1, x2,…,xn为总体X的样本,则称统计量
  
  为样本k阶原点矩;称统计量
  
  为样本k阶中心矩.
  样本均值是样本一阶原点矩,但本书中样本方差s2不是样本k阶中心矩,而用 表示,以示区别.
 
  6.顺序统计量
 
  定义:设总体X的分布函数为F(x),分布密度为f(x),样本为x1, x2,…,xn,则称
  x(1)=min{x1, x2,…,xn}和x(n)=max{x1, x2,…,xn}
  为此样本的极小顺序统计量和极大顺序统计量.
 
  定理:设总体X的分布函数为F(x),分布密度为f(x),样本为x1, x2,…,xn,x(1),x(n)为样本的极小、极大顺序统计量,则x(1)的分布密度为f1(x)=n(1-F(x))n-1f(x),x(n)的分布密度为fn(x)=nFn-1(x)f(x).
  证明:
 
 
 
  7.正态总体的抽样分布
  (1) 分布

  ① 定义:设X1, X2,…,Xn为相互独立且服从同分布N(0,1)的随机变量,则统计量 的分布称为自由度为n的 分布,记为 .
  要求:不必记忆密度函数,但需要记忆密度函数的图象,以便帮助思考.
 
 
  
 
  ② 分布的α分位点:当随机变量 时,对给定的α∈(0,1),称满足
  
  的 为自由度为n的 分布的α分位点.
  求法:反查 分布表.
 
 
  例题.查表求 .
 
   =18.307
  查附录4 的分布表(P200、201、202)
  (2)F分布

  ① 定义:设X1,X2相互独立,且 , ,则称 的分布为自由度为m与n的F分布,记为F~F(m,n), 其中m称为分子自由度,n称为分母自由度.
  要求:不必记忆密度函数,但需要记忆密度函数的图象,以便帮助思考.
 
  ② F分布的α分位点:当随机变量F~F(m,n)时,对给定的α∈(0,1),称满足
  P{F>Fα(m,n)}= α
  的Fα(m,n)为自由度为m与n的F分布的α分位点.
  ③ F分布的α分位点的性质:若F~F(m,n),则1/F~F(n,m).从这个性质可以推出

   .
 
  ④ 求法:当α较小时,分位点Fα(m,n)可直接从附表5中查得,而分位点F1-α(m,n)可通过上式查得.
  【例6-12】若取m=10,n=5,α=0.05,那么从附表5上(m=n1,n=n2)查得
  F0.05(10,5)=4.74
 
  【答疑编号12060301】
  (3)t分布

  ① 定义:设X1,X2相互独立,且X1~N(0,1), ,则称 的分布为自由度为n的t分布,记为t~t(n).
  要求:不必记忆密度函数,但需要记忆密度函数的图象,以便帮助思考.
 
  
  ② t分布的α分位点:当随机变量t~t(n)时,对给定的α∈(0,1),称满足
  P{t>tα(n)}= α
  的tα(n)为自由度为n的t分布的α分位点.
  ③ t分布α分位点的性质:由于t分布的密度函数关于0对称,则有t1-α(n)= -t α(n).
  ④ 求法:同上
  例题. 查表求t0.95(10), t0.05(10).
 
  t0.05(10)=1.8125
  (4)一些重要结论

  定理:设x1, x2,…,xn是来自正态总体N(μ,σ2)样本,其样本均值与方差分别为
   和 ,
  则有
  ① 与s2相互独立;
  ② ;
  ③ .(推论6-1)
 
  推理6-2 设x1, x2,…,xm是来自 的样本,y1, y2,…,yn是来自 的样本,记
   , ,
  其中 , ,则有 ;特别的,若
   ,则 .
 
 
  推理6-3 在推理6-2的条件下,设 ,并记
   ,
  则
   。
 

  本章小结
  
  一、内容
  
  

  二、试题选讲
  1.(420)设总体X~N(0,1),x1, x2,…,xn为来自该总体的样本,则统计量 的抽样分布为________________.
  【答疑编号12060302】
  答案: 
 
  2.(723)设总体X服从正态分布N(μ,σ2),X1, X2,…,Xn为来自该总体的一个样本,令 ,则D(U)=______________.
  【答疑编号12060303】
  答案:1
  解析:
 
  3.(421)设总体X~N(1,σ2),x1,x2,x3,x4为来自该总体的样本, = ,则 =______________.
  【答疑编号12060304】
  答案:1
 
  4.(706)设随机变量X~ ,Y~ ,且X,Y相互独立,则 所服从的分布为( ).
  A. F(2,2) B. F(2,3) C. F(3,2) D. F(3,3)
  【答疑编号12060305】
  答案:B
 
  5.(1024)设总体X~N(μ,σ2),x1,x2,x3,x4为来自该总体的样本,且 ,则 服从自由度为_______的 分布.
  【答疑编号12060306】
  答案:3
  解析:
 
 
  6.(200410)设总体X~N(0,1),X1, X2,…,Xn为来自该总体的样本(n>3),则以下统计量的分布不正确的是( ).
  A.
  B.
  C.
  D.
  【答疑编号12060307】
  答案:B
 
 
 
  7.(200410)已知总体X~N(μ,σ2),其中μ已知,σ2未知,X1,X2,X3为X的一个样本,则不是统计量的是( ).
  A. ( X1+X2+X3)
  B.X1+X2+2μ
  C.max(X1+X2+X3)
  D. (X1+X2+X3)
  【答疑编号12060308】
  答案:D