练习题答案汇总
-
置信区间
4.17
某大学为了了解学生每天上网的时间,在全校
7500
名学生中采取重复抽样方法随机抽取
36
人,调
查
他们每天上网的时间,得到下面的数据:
3.3
4.4
2.1
4.7
3.1
2.0
1.9
1.4
6.2
5.4
1.2
1.2
5.8
2.6
5.1
2.9
2.3
6.4
4.3
3.5
4.1
1.8
4.2
2.4
5.4
3.5
3.6
0.5
4.5
5.7
0.8
3.6
3.2
2.3
1.5
2.5
求该校大学生平均上网时间的置信区间,置信水平分别是
90%
,
95%
和
99%
。
4.7
已知:
n
36
,当
为
0.1
、
0.05
、
0.01
时,相应的
z<
/p>
0
.
1
2
1
.
645
、
z
0
.
05
2
1
.
96
、
z
0
.
01
根据样本数据计算得
:
x
3
.<
/p>
32
,
s
p>
1
.
61
。
由于
n
36
为大样本,所以平均上网时间的
90%
p>
的置信区间为:
s
1
.
61
x
z
2
<
/p>
3
.
32
p>
1
.
645
p>
3
.
32
0
.
44
,即(
2.88
,
3.
76
)。
n
36
平均上网时间的
95%
的置信区间
为:
s
1
.
61
x
z<
/p>
2
3
.
32
1
.
96
3
.
32
0
.
53
,即(
2.79
,
3.85
)。
n
36
平均
上网时间的
99%
的置信区间为:
<
/p>
s
1
.
61
p>
x
z
2
3
.
32
2
.
58
3
< br>.
32
0
.
69
,即(
2.63
,
4.01
)。
n
36
2<
/p>
2
.
58
p>
。
4.18
某居民小区共有居民
500
户,小区管
理者准备采取一项新的供水设施,想了解居民是否赞成。采取重
复抽样方法随机抽取了<
/p>
50
户,其中有
32
户赞成,
18
户反对。
(
1
)求总体中赞成该项改革的户数比例的置信
区间,置信水平为
95%
。
(
2
)如果小区管理者预计赞成的比例能达到<
/p>
80%
,估计误差不超过
10%
。应抽取多少户进行调查?
4.18
(
1
)已知:
n
50
,
p
32
50
0
.
64
,
0
.
05
,
z
< br>0
.
05
2
1.96
。
< br>总体中赞成该项改革的户数比例的
95%
的置信区间为:
p
z
p>
p
(
1
p
)
2
n
0
.
< br>64
1
.
96
0
.
64
(
1
0
.
64
)
50
2
0
.
64
0
.
13<
/p>
,即(
0.51
,
0.77
)。
(
< br>2
)已知:
0
.
80
,
< br>
0
.
05
,
z
0
.
05
2
1
.96
。
应抽取的样本量为:
n
(
p>
z
2
)
(
1
)
E
< br>2
1
.
96
0
.
80
(
1
0
.
80
)
0<
/p>
.
1
2
2
62
。
1
5.2
一名汽
车销售管理者声称其每个月平均销售的汽车数量至少为
14
辆,
反对组织想通过研究知道这
一数量是否属实。
(
1
)为解决该组织的疑问,建立合适的原假设和备择
假设。
(
2
)当不能拒绝原假设时,该组织会得到什么结论?
(
3
)当可以拒绝原假设时,该组织会得到什么结论
?
5.2
(
1
)该组织想要证实的假设是“每个月平均销售的汽车数量不足
14
辆”,所以提出的假设形式为,
H
0
:
14
,
H
1
:
14
。<
/p>
(
2
)当不能
拒绝原假设时,该组织认为没有充分的理由怀疑汽车销售管理者的说法。
(
3
)当可以拒绝原假设时,该组织有充分的统计证
据断定汽车销售管理者的声明不真实。
5.5
某种纤维原有的平均强力不超过
6g
,
现希望通过改进工艺来提高其平均强力。研究人员测得了
100
个关于新纤维的强力数据,发现其均值为
6.35g
。假定纤维
强力的标准差仍保持为
1.19g
不变,在
5%
的显
著性水平下对该问题进行假设检验。
(
1
)检验的临界值是多
少?拒绝法则是什么?
(
2
)计算检验统计量的值,你的结论是什么?
z
1
.
p>
645
/
n
p>
>1.645
,就拒绝
H
< br>0
。
5.5
< br>(
1
)检验的临界值是
0
.
05
,拒绝法则是:如果
< br>6
.
35
6
z
2
.
94
1
.
645
1
.
19
/
100
(
2
)检验统计量
,所以拒绝原假设,
认为新纤维的平均强力超过了
6
克。
z
x
p>
0
5.8
某印刷厂旧机器每台每周的开工成本服从正态分布
N(100,25
2
)
,
现新安装了一台机器,
p>
观测到它在
9
周里平均每周的开工成本为<
/p>
75
元。假定成本的标准差不变,试问在
α
=0.01
的水平上该厂机器的平均开工
成本是否有所下降?
H
:
100
5.8
建立原假设与备择假设为:
0
,
H
1
:
100
;
75
100
z
3
.
0
25
/
9
检验统计量
<-2.33
,拒绝原假设,认为该厂机器的平均开工成本的确有所下降。<
/p>
5.10
一般来说,如果能够证明某部电视连续剧在播出后的前
13
周中观众的收视率超过了
25%
,就可以认
为它获得了成功。
现针对一部关于农
村生活题材的电视剧抽选了
400
个家庭组成一个样本,
发现前
13
周里
有<
/p>
112
个家庭看过这部电视剧。
(
1
)建立适当的原假设与备择假设。
(
2
)如果允许发
生第一类错误的最大概率为
0.01
,这些信息能否断定这部电
视剧是成功的?
5.10
(
1
)
H
0
:
< br>p
0
.
25
H
1
:
p
0<
/p>
.
25
。
2
如果
n
p
0
和
n
(<
/p>
1
p
0
)
都大于等于
5
。<
/p>
112
z
<
/p>
400
0
.<
/p>
25
1
.
p>
39
0
.
25
p>
(
1
0
.
25
)
400
(
2
)
剧是成功的。
<
z
p>
0
.
01
(
2
.
33
)
,不能拒绝原假设,因此没有充分的理由认为这部电视
6.2
学生在期末考试
之前用于复习的时间和考试分数之间是否有关系?为研究这一问题,
一位研究者抽取
p>
了由
8
名学生构成的一个随机样本,得到的
数据如下:
复习时间(
h
)
20
16
34
23
27
32
18
22
考试分数(分)
64
61
84
70
88
92
72
77
(
1
)绘制复习时间和考试分数的散点图,判断二者之间的
关系形态。
(
2
)计算相关系数,说明两个变量之间的关系强度。
6.2
(
1
)散点图如下:
100
80
考
试
分
数
60
40
20
0
0
10
20
复习时间
30
40
p>
从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。
(
2
)
p>
利用
Excel
的
“CORREL”
函数计算的相关系数为
r
0
.
8621
< br>。
相关系数
r
0
.
8
,
表明复习时间与考试
分数之间有较强的正线性相关关系。
6.6
下面是
7
个地区
2000
年的人均
GDP
和人均消费
水平的统计数据:
地区
人均
GDP
(元)
3
北京
22640
辽宁
11226
4490
上海
34547
11546
江西
4851
2396
河南
5444
2208
贵州
2662
1608
陕西
4549
2035
人均消费水平
(元)
7326
(
1
)人均
GDP
作自变量,人均消费水平作因变量,绘制散点图
,并说明二者之间的关系形态。
(
2
)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。
< br>
(
3
)利用最小二乘法求出估
计的回归方程,并解释回归系数的实际意义。
(
4
)计算判定系数,并解释其意义。
(
5
)检验回归方程线性关系的显著性(
α
=0.05
)
(
6
)如果某地区的人均
GDP
为
5000
元,预测其人均
消费水平。
(
7
)求人均
GDP
为
5000
元时,人均消费水平的
95%
的置信区间和预
测区间。
6.6
(
1
)散点图如下:
14000
12000
人
均
消
费
水
平
10000
8000
6000
4000
2000
0
0
10000
20000
人均GDP
30000
40000
< br>
从散点图可以看出,人均
GDP
与人均消费水平为正的线性相关关系。
(
< br>2
)
利用
Excel
的
“CORREL”
函数计算的相关系数为
r
0
.
998128
。
相关系数接近于
< br>1
,表明人均
GDP
与
人均消费水平之间有非常强的正线性相关关系。
(
3
)由
Excel
输出的回归结果如下表:
回归统计
Multiple R
R Square
Adjusted
Square
标准误差
观测值
方差分析
回归
残差
总计
Intercept
X
Variable 1
R
0.998128
0.996259
0.995511
247.3035
7
df
1
5
6
734.6928
0.308683
SS
MS
F
Significance F
2.91E-07
81444969
81444969
1331.692
305795
61159.01
81750764
P-value
0.003285
2.91E-07
Coefficients
标准误差
t Stat
139.5403
5.265094
0.008459
36.49236
ˆ
0
.
3
08683
ˆ
得到的回归方程为:<
/p>
y
734
.<
/p>
6928
0
.
308683
x
。回归系数
1
表示人均
GDP
每增加
1
元,
人均消费水平平均增加
0.308683
元。
(
4
)判定系数
R
< br>
0
.
996259
。表明在人均消费水平的变差中,有
99.6259%
是由人均
GDP
决定的。
.
4
2