平均数假设测验
也是一种财富-关于元宵节的来历
单个平均数假设测验
§
4.1
假设检验的基本方法
现在我们从一道
例题入手,看看假设检验的基本做法和其中所涉及的一些理论性问题。
例
3.1
某地区
< br>10
年前普查时,
13
岁男孩子
平均身高为
1.51m
,
现抽查
200
个
12.5
岁
到
13.5
岁男孩,身高平均值为
1.
53m
,标准差
0.073m
,问
p>
10
年来该地区男孩身高是否有明显增
长?
分析:
从题目知
10
< br>年前总体均值
μ
1
=1.51m
。现在抽取
200
个个体,得样本均值
X
1
.
p>
53
m
,
样本标准
差
S=0.073m
。
现在总体均值<
/p>
μ
未知。
题目要求判断
< br>μ
>
μ
1
是否成立。
解决方法:
(
1
)先假设
μ
=
μ
1
=1.51m
。
(
2
)样本来自已知总体
可能性有多大
?
(
< br>3
)根据可能性大小判断假设是否正确。
a)
如果这可能性很大,我们只能认为
μ
与
μ
1
差别不大,即
p>
μ
=
μ
1
很可能成立。
b)
若
可能性很小,则说明在假设
μ
=
μ
p>
1
成立的条件下,抽出这样一个样本的事件是一个
< br>小概率事件。小概率事件在一次观察中是不应发生的,但它现在发生了
.
小概率事件事实上发生的合理的解释
就是它本不是小概率事件,是我们把概率算错了。
而算错的原因就是我们在一开始就做了
一个错误的假设
μ
=
μ
1
。换句话说,此时我们应
该认为
μ
>
μ
1
,即男孩身高有明显增长。这就是假设检验的基本思路。
需要明确以下几个问题
1
°假设的建立。零假设:
记为
H
< br>0
,针对要考查的内容提出。本例中可为:
H
0
:
μ
=151
。它
通常为一个数值,或一个区间(例如可能为
H
0
:u
≤
151
)
。
原则为:
a)
通常是问题的反面,
某个
新品种与老品种
没有差异
、新的培养基
无效
、
现在儿童
身高与过去
无差别
(
处理无效
)
p>
、
b)
通过统计检验决定接受或拒绝
H
0
后,可对问题作出明
确回答;
C
)要能根据
H
0
建立统计量的理论分布。
备择假设:
记为
H
A
,是除
H
0
外的一切可能性的集合。这里强调一切可能值是因为检验只能
判断
H
0
是否成立,若不成立则必
须是
H
A
。
H
A
通常是一个区间。例如当
H
0
取为
μ
=151
时,
H
A
应取为
μ
≠
151<
/p>
。当
H
0
取为<
/p>
μ
≥
151
或<
/p>
μ
≤
151
时,
H
A
则应相应取为
μ
<151
或
μ
< br>>151
。
备择假设
原则为:
a)
应包括
除
H
0
外的一切可能性;
b)
如有可能,应缩小备择假设范围以提
高检验精度
。此时若有理由认为
μ
>151
或
p>
μ
<151
不可能出现,也可只取
H
A
为可能出现的
一半
,即
μ
<151
或
μ
>151
,这样可提高检验精度(原因参见单侧与双侧检
验)
。
2
°小概率原理:
小概率事件在一次观察中不应出现。这是一切统
计检验的理论基础。
注意:小概率事件不是不可能事件。观察
次数多了,它迟早会出现。因此
“一次”
这个词是
重要的。
§
3.3
正态总体的假设检验
检验对象
本节开始介绍对正态总体进
行假设检验的具体方法。从正态分布的密度函数
2
可知,正态总
体只有两个参数,这就是期望
μ
和方差
σ
。因此我们的检验主要也是针对这
两个参数进行。
检验类型
:
单样本检验
就是全部样品都抽自一个总体,检
验目的通常是
μ
或
σ
< br>是否等于
某一数值;
双样本检
验
则是有分别抽自不同总体的两个样本,
检验的目的是看这两个
总体的
μ
或
σ
是否相等。
或新品种农作物是否比旧品种产量更高等等,
此时都
应该采用双样本检验的方法。
如果我们需要考虑
三个以上总体
,则应采用第四章介绍的方差分析的方法。
< br>
一、单样本检验步骤
p>
1
°建立假设,包括
H
0
与
H
A
。
一般来说,
H
0
取值有三种可能
:
μ
=
μ
0
,
μ
≤
μ
0
,
或
μ
≥
μ
0
。
这里
μ
0
是一个具体数值。
注意
H
0
的表达式中必须包含等号,因为我们实际上就是
根据这个等号建立理论分布的
。
μ
0<
/p>
数值的确定:
a
)凭经验;
b
)根据某种理论可以计算;
c
)实际问题要求。至于
H
0
中是否
包
含大于或小于号则主要看实际问题的要求。
H
A
也有相
应三种
:
μ
≠
μ
0
,
μ
><
/p>
μ
0
,或
μ
p>
<
μ
0
。
当
H
0
取为
μ
=
μ
0
,
H
A
:
μ
≠
μ
0
(包括
μ
>
μ
0
和
μ
<<
/p>
μ
0
)
,由专业
知识可知
μ
>
μ
0
,或
μ
<
μ
0
中有一种不可能出现时,可选择另一种为
< br>H
A
。此时也相当于单尾检验。注意
H
A
应包括除
H
< br>0
外的一切可能值。在有专业知识可依据的情况下,
应优
先选取单尾检验
,
因为这样可提高
检验
精度。
需要强调的是选择单尾的依据必须来自数据以外的专业知识或实践要求,
而不能
来自数据本身。
2
°选择显著性水平
α
。
α
最常用的数值是
0.05
。
当我们
计算出统计量的观测值出现的概率大于
0.05
时,
我们
称之为“没有显著差异”
,并接受
H
0
;当小于
0.05<
/p>
时,我们称之为“差异显著”
,并拒绝
H
0
。
一般情
况下,此时我们应进一步与
0.01
比较,若算出的概率也小于
0.01
,则称“差异
极显著”
,此时我们拒绝
H
0
就有了更大把握。需要特别强调的是我们一般都取
α
=0.05
,这
只是一种约定俗成,理论上并没有任何特殊意义。
。
3
°选择统计量及其分布。
检验均值一般选择
X
为统计量,各种情况下的<
/p>
统计量理论分布
如下:
总体方差
σ
已知:使用
u
p>
检验,统计量服从正态分布。
2
u
X
0
/
< br>n
~
N
(
0
,
1
)
(3.10)
2
b)
总体方差
σ
未知:应使用
t
检验,统计量服从
t
分布。
t
X
0
S
< br>/
n
~
t(n-1)
(3.11)