山西自考会计专业概率论与数理统计复习资料6

山西自考网 发布时间：2012年06月05日

下面内容公式和符号显示不全，请下载原版word文档

第六章　统计量及其抽样分布

内容介绍
　　本章是数理统计的基础，主要讨论总体、样本、统计量等及统计量的抽样分布.

　　考点分析
　　 2007年4月 2007年7月 2007年10月
选择题　　 1题2分　　
填空题 2题4分 1题2分 1题2分
计算题　　　　　　
综合题　　　　　　
合计 2题4分 2题4分 1题2分
　　
　　内容讲解
§6.1　引　言
　　
　　随机变量是通过概率分布来描述随机现象的，但是，概率分布往往是未知的，因此，必须寻求其他的方法来弥补随机变量的不足，这就产生了数理统计的理论和方法。这是本课程的如下的内容。先看如下两个例题。
　　例题1. P126
　　【例6－1】某公司要采购一批产品，每件产品要么是正品，要么是次品。若设这批产品的次品率为p（一般是未知的），则从该批产品中随机抽取一件，用X表示抽到的次品数，不难看出X服从0-1分布B（1,p）。但分布中的参数p是不知道的。显然，p的大小决定了该批产品的质量，它直接影响采购行为的经济效益，故人们对p提出一些问题，例如：
　　“p的大小如何？”
　　“p大概落在什么范围内”
　　“能否认为p满足设定要求（如p≤5%）？”
　　【答疑编号12060101】
　　例题2. P126
　　【例6－2】彩电的彩色浓度是彩电质量好坏的一个重要指标。20世纪70年代在美国销售的SONY牌彩电有两个产地：美国和日本。两地的工厂是按同一设计方案和相同的生产线生产同一型号SONY彩电，连使用说明书和检验合格的标准也是一样的。
　　【答疑编号12060102】
　　
§6.2 总体与样本
　　
　　1.总体和个体
　　（1）定义：研究对象的全体称为总体，构成总体的每个成员称为个体.
　　（2）解释：① 一般地，总体是研究对象的某个数量指标或可以数量化的指标；
　　 ② 总体的某个数量指标X的取值在客观上与一定的概率相联系，即服从一定的分布，所以X是一个随机变量；
　　 ③ 总体的指标选择应该是清楚的.
　　例题3. P126
　　【例6－3】
　　考察某厂的产品质量，将其产品只分为合格品与不合格品，并以0记合格品，以1记不合格品，则
　　总体＝{该厂生产的全部合格品与不合格品}＝{由0或1组成的一堆数}。若以p表示这堆数中1的比例（不合格率），则总体可由一个二点分布表示：
　　
　　不同的p反映了总体间的差异。
　　【答疑编号12060103】
　　例如，两个生产同类产品的工厂的产品总体分布为：
　　　
　　我们可以看到，第一个工厂的产品质量优于第二个工厂。
　　2.样本
　　（1）定义：从总体中随机抽取n个个体，其指标值为x1, x2，…，xn，则称x1, x2，…，xn为总体的一个样本，n称为样本容量，样本中的个体称为样品.
　　（2）解释：① 样本是随机变量. 样本是在总体中随机抽取的，事先并不知道哪个个体可能被抽中，无法预知它们的数值，所以，样本是随机变量，用大写字母X，Y，Z等表示；
　　 ② 样本观察值. 每一个样本取出后，得到一组数值，称为样本观察值，用小写的字母表示，如x1, x2等.
　　 ③ 无论是样本还是它的观察值，本书一律用小写字母表示，其实际意义可以从上下文加以区别.

　　（3）简单随机样本
　　有多种抽样方法，用简单随机抽样方法得到的样本称为简单随机样本，简称样本.

　　本书的样本皆为简单随机样本，满足以下要求：
　　（1）随机性：总体中每一个个体都有相同的机会被抽中，意味着每一个样品与总体
　　有相同的分布；
　　（2）独立性：样品之间是相互独立的，它们的取值互相之间没有影响.
　　例题4. P128
　　【例6－4】啤酒厂生产的瓶装啤酒规定净含量为640g，由于随机性，事实上不可能使得所有的啤酒净含量均为640g。现从某厂生产的啤酒中随机抽取10瓶测定净含量，得到如下结果。
　　641　635　640　637　642　638　645　643　639　640
　　这是一个容量为10的样本的观测值，对应的总体为该厂生产的瓶装啤酒的净含量。
　　【答疑编号12060104】
　　从总体中抽取样本时，为使样本具有代表性，抽样必须是随机抽样。通常可以用随机数表来实现随机抽样。还要求抽样必须是独立的，即每次抽样的结果互不影响。
　　（4）样本的分布函数和概率密度
　　设总体X的分布函数为F（x），样本x1, x2，…，xn的观察值为x1, x2，…，xn，则样本的联合分布函数为
　　 F（x1, x2，…，xn）＝ .

　　若总体X为连续型随机变量，概率密度为f（x），则样本的联合密度函数为
　　 f（x1, x2，…，xn）＝ .

　　若总体X为离散型随机变量，则样本的（联合）概率函数为
　　 p（x1, x2，…，xn）＝ .

　　例题5. P129
　　【例6－5】为估计一物件的重量μ，用一架天平重复测量n次，得样本x1, x2，…，xn。由于是独立重复测量，x1, x2，…，xn是简单随机样本。总体的分布即X1的分布（x1, x2，…，xn分布相同）。由于称量误差是均值（期望）为零的正态变量，所以X1可认为服从正态分布N（μ，σ2）（X1等于物件重量μ加上称量误差）。
　　【答疑编号12060105】

　　例题6. P129
　　【例6－6】设某种电灯泡的寿命X服从指数分布E（λ），其概率密度为：
　　【答疑编号12060106】

　　例题7. P129
　　【例6－7】考虑电话交换台一小时内的呼唤次数X。求来自这一总体的简单随机样本x1, x2，…，xn的样本分布。
　　【答疑编号12060107】

　　3.样本数据的整理与显示
　　【例6－8】为研究某厂工人生产某种产品的能力，随机调查了20位工人某天生产该种产品的数量，数据如下：
　　160　196　164　148　170
　　175　178　166　181　162
　　161　168　166　162　172
　　156　170　157　162　154
　　表6－2　　例6－8的频数频率分布表
组序　　　分组区间　　　组中值　　频数　　　频率　　　累计频率/%
1　　　（147，157]　　　152　　　　4　　　　0.20　　　　20
2　　　（157，167]　　　162　　　　8　　　　0.40　　　　60
3　　　（167，177]　　　172　　　　5　　　　0.25　　　　85
4　　　（177，187]　　　182　　　　2　　　　0.10　　　　95
5　　　（187，197]　　　192　　　　1　　　　0.05　　　　100
合计　　　　　　　　　　　　　　　　20　　　1
　　
　　【答疑编号12060108】
§6.3　统计量及其分布　　

　　1.统计量与抽样分布
　　定义：设x1, x2，…，xn为总体X的样本，若样本函数T=T（x1, x2，…，xn）中不含任何未知参数，则称T为统计量；统计量的分布称为抽样分布.
　　2.经验分布函数
　　（1）定义：设x1, x2，…，xn为总体X的样本，总体X的分布函数为F（x），若将样本观察值x1, x2，…，xn按由小到大排列为x（1），x（2），…，x（n），则称之为有序样本；用有序样本定义函数
　　，k＝1，2，…，n-1，
　　则称Fn（x）为经验分布函数.
　　显然，Fn（x）是一个非减右连续函数，且满足Fn（-∞）=0，Fn（+∞）=1.
　　例9.P132
　　【例6－9】某食品厂生产听装饮料。现从生产线上随机抽取5听饮料，称得其净重为（单元：g）
　　351　347　355　344　351
　　这是一个容量为5的样本，经排序可得有序样本：
　　x（1）＝344，x（2）＝347，x（3）＝351，x（4）＝351，x（,5）＝355，
　　其经验分布函数为
　　
　　
　　对于每一固定的x，Fn（x）是样本中事件“xi≤x”发生的频率。当n固定时，Fn（x）是样本的函数，它是一个随机变量，由伯努利大数定律：只要n相当大，Fn（x）依概率收敛于F（x）。这表明，当n相当大时，经验分布函数是总体分布函数F（x）的一个良好的近似。
　　3.样本均值及其抽样分布
　　（1）样本均值的定义：设x1, x2，…，xn为总体X的样本，其算术平均值称为样本均值，一般记为，即 .
　　在将样本分为k组的情况下，样本均值的计算公式为
　　，
　　其中，k为组数，xi为第i组的组中值，fi为第i组的频数.
　　【答疑编号12060201】
　　例10.P133
　　【例6－10】某单位收集到20名青年人某月的娱乐支出费用数据：
　　79　　84　 84　 88　92　 93　 94　97　 98　 99
　　100　101　101　102　102　10　110　113　118　125
　　则该月这20名青年的平均娱乐支出为
　　
　　将这20个数据分组可得到如下频数频率分布，见表6－3。
　　表6－3　　例6－10的频数频率分布表
组序　　　分组区间　　　组中值　　频数　　　频率/%　　　
1　　　（77，87] 　　　 82 　　　3 　　　 15
2 　　　（87，97] 　　　 92 　　　5 　　　 25
3 　　　（97，107] 　　 102 　　　7 　　　 35
4 　　　（107，117] 　　112 　　　3 　　　 15
5 　　　（117，127] 　　122 　　　2 　　　 10
合计　　　　　　　　　　　　　　　20 　　 100
　　对表6－3的分组样本，
　　
　　我们看到两种计算结果不同，事实上，由于第二种计算未用到真实的样本观测数据，因而给出的是近似结果。
　　【答疑编号12060202】
　　（2）样本均值的性质
　　① 若称样本的数据与样本均值的差为偏差，则样本偏差之和为零，即
　　 .
　　证明：

　　② 偏差平方和最小，即对任意常数c，函数，当时取得最小值.
　　证明：

　　（3）样本均值的抽样分布
　　定理：设x1, x2，…，xn为总体X的样本，为样本均值，
　　（1）若X～N（μ，σ2），则的精确分布为；
　　证明：

　　（2）若总体X的分布未知或不是正态分布，且E（X）= μ，D（X）= σ2，则当样本容量n较大时，的近似分布为 .

　　4.样本方差与样本标准差
　　（1）定义：设x1, x2，…，xn为总体X的样本，则它关于的平均偏差平方和
　　
　　称为样本方差；其算术根称为样本标准差.

　　（2）计算公式
　　在上面的定义中，称为样本偏差平方和，它有3个不同的表达式：
　　＝ .

　　例11.P135
　　【例6－11】在例6－10中，我们已经算得，其样本方差与样本标准差为
　　
　　
　　【答疑编号12060203】
　　（3）样本均值的数学期望和方差, 以及样本方差的期望
　　定理：设x1, x2，…，xn为总体X的样本，具有二阶矩，即E（X）= μ，D（X）= σ2，和s2分别为样本的均值和方差，则，，E（s2）=σ2.

　　5.样本矩及其函数
　　样本均值和样本方差的一般化为样本矩，这是一类常见的统计量.
　　定义：设x1, x2，…，xn为总体X的样本，则称统计量
　　
　　为样本k阶原点矩；称统计量
　　
　　为样本k阶中心矩.
　　样本均值是样本一阶原点矩，但本书中样本方差s2不是样本k阶中心矩，而用表示，以示区别.

　　6.顺序统计量

　　定义：设总体X的分布函数为F（x），分布密度为f（x），样本为x1, x2，…，xn，则称
　　x（1）=min{x1, x2，…，xn}和x（n）=max{x1, x2，…，xn}
　　为此样本的极小顺序统计量和极大顺序统计量.

　　定理：设总体X的分布函数为F（x），分布密度为f（x），样本为x1, x2，…，xn，x（1），x（n）为样本的极小、极大顺序统计量，则x（1）的分布密度为f1（x）=n（1-F（x））n-1f（x），x（n）的分布密度为fn（x）=nFn-1（x）f（x）.
　　证明：

　　7.正态总体的抽样分布
　　（1）分布

　　① 定义：设X1, X2，…，Xn为相互独立且服从同分布N（0,1）的随机变量，则统计量的分布称为自由度为n的分布，记为 .
　　要求：不必记忆密度函数，但需要记忆密度函数的图象，以便帮助思考.

　　

　　② 分布的α分位点：当随机变量时，对给定的α∈（0，1），称满足
　　
　　的为自由度为n的分布的α分位点.
　　求法：反查分布表.

　　例题.查表求 .

　　 =18.307
　　查附录4 的分布表（P200、201、202）
　　（2）F分布

　　① 定义：设X1，X2相互独立，且，，则称的分布为自由度为m与n的F分布，记为F～F（m,n）, 其中m称为分子自由度，n称为分母自由度.
　　要求：不必记忆密度函数，但需要记忆密度函数的图象，以便帮助思考.

　　② F分布的α分位点：当随机变量F～F（m,n）时，对给定的α∈（0，1），称满足
　　P{F>Fα（m,n）}= α
　　的Fα（m,n）为自由度为m与n的F分布的α分位点.
　　③ F分布的α分位点的性质：若F～F（m,n），则1/F～F（n,m）.从这个性质可以推出

　　 .

　　④ 求法：当α较小时，分位点Fα（m,n）可直接从附表5中查得，而分位点F1-α（m,n）可通过上式查得.
　　【例6－12】若取m=10，n=5，α=0.05，那么从附表5上（m=n1,n=n2）查得
　　F0.05（10，5）=4.74

　　【答疑编号12060301】
　　（3）t分布

　　① 定义：设X1，X2相互独立，且X1～N（0,1），，则称的分布为自由度为n的t分布，记为t～t（n）.
　　要求：不必记忆密度函数，但需要记忆密度函数的图象，以便帮助思考.

　　
　　② t分布的α分位点：当随机变量t～t（n）时，对给定的α∈（0，1），称满足
　　P{t>tα（n）}= α
　　的tα（n）为自由度为n的t分布的α分位点.
　　③ t分布α分位点的性质：由于t分布的密度函数关于0对称，则有t1-α（n）= -t α（n）.
　　④ 求法：同上
　　例题. 查表求t0.95（10）, t0.05（10）.

　　t0.05（10）=1.8125
　　（4）一些重要结论

　　定理：设x1, x2，…，xn是来自正态总体N（μ，σ2）样本，其样本均值与方差分别为
　　和，
　　则有
　　① 与s2相互独立；
　　② ；
　　③ .（推论6－1）

　　推理6－2 设x1, x2，…，xm是来自的样本，y1, y2，…，yn是来自的样本，记
　　，，
　　其中，，则有；特别的，若
　　，则 .

　　推理6－3 在推理6－2的条件下，设，并记
　　，
　　则
　　。

　　本章小结
　　
　　一、内容
　　
　　

　　二、试题选讲
　　1.（420）设总体X～N（0，1），x1, x2，…，xn为来自该总体的样本，则统计量的抽样分布为________________.
　　【答疑编号12060302】
　　答案：

　　2.（723）设总体X服从正态分布N（μ，σ2），X1, X2，…，Xn为来自该总体的一个样本，令，则D（U）＝______________.
　　【答疑编号12060303】
　　答案：1
　　解析：

　　3.（421）设总体X～N（1，σ2），x1，x2，x3，x4为来自该总体的样本，＝，则＝______________.
　　【答疑编号12060304】
　　答案：1

　　4.（706）设随机变量X～，Y～，且X，Y相互独立，则所服从的分布为（　）.
　　A. F（2，2）　B. F（2，3）　C. F（3，2）　D. F（3，3）
　　【答疑编号12060305】
　　答案：B

　　5.（1024）设总体X～N（μ，σ2），x1，x2，x3，x4为来自该总体的样本，且，则服从自由度为_______的分布.
　　【答疑编号12060306】
　　答案：3
　　解析：

　　6.（200410）设总体X～N（0，1），X1, X2，…，Xn为来自该总体的样本（n>3），则以下统计量的分布不正确的是（　）.
　　A.
　　B.
　　C.
　　D.
　　【答疑编号12060307】
　　答案：B

　　7.（200410）已知总体X～N（μ，σ2），其中μ已知，σ2未知，X1，X2，X3为X的一个样本，则不是统计量的是（　）.
　　A. （ X1＋X2＋X3）
　　B.X1＋X2＋2μ
　　C.max（X1＋X2＋X3）
　　D. （X1＋X2＋X3）
　　【答疑编号12060308】
　　答案：D

上一篇：第五章　大数定律及中心极限定理

下一篇：第七章　参数估计

山西自考会计专业概率论与数理统计复习资料6

新生指南

新生指南

最新发布