葡萄酒评价数模论文模板
-
福建农林大学
2013
年数学建模竞赛
我们参
赛选择的题号是(从
A/B
中选择一项填写)
< br>:
A
参赛队员
(
打印并签名
)
:
序号
年级专业
11
级信息与计
1
算科学
2
3
李雪营
姓名
联系电话
指导教师或指导教师组负责人
(
打
印并签名
)
:
论文提交日期:
2013
年
08
月
22
日
赛区评阅编号(由赛区组委会评阅
前进行编号)
:
评阅编号(由评阅负责人在评阅前进行编号)
:
评阅记录:
评阅人
评分
备注
题
目
:
葡萄酒的评价
关
键
词:方差检验模型
多元数据的相关性分析
二元线性
回归模型
变异系数法
均值化无差异
摘要
对于问题一,我们将两组评酒员
对酒的评价结果有无显著性差异的问题,转化为两
组评酒员这一因素对酒的评分的影响是
否显著的问题,
若影响不显著则说明两组评酒员
的评分实质上无
显著性差异,若有显著性差异,由于酒的选取是随机的,所以可以用方
差和折线图表来表
示两组评酒员评分的波动性,波动性越小,评分结果越可靠。
对于问题二,首先用主成分分析法选出与评价方面最为相关的理化指标,用变异
系数法计算出每一种理化指标相应的得分,再用均值化无差异法对理化指标进行处理,
得出各种葡萄理化指标的综合评分,再与评酒员的得分做加和运算,将结果求和得到每
一种葡萄质量的评分,重新排序后,用
Excel
做
出葡萄质量评分的曲线图,将位于同一
高度的序号划分为一级,由此得出葡萄的分类级别
。
对于问题三,对酿酒葡
萄与葡萄酒的理化指标的关系这一问题,我们分类讨论,
对于葡萄酒色泽理化指标,
p>
我们查得其实质是与葡萄样品花色苷和单宁两个理化指标有
关的,因
此运用灰色关联分析法分析每一个因素对葡萄酒色泽的影响,并采用优势比较
法,分析出
哪一因素对葡萄酒色泽这一理化指标更有影响。关于葡萄酒样品中除色泽以
外的其它理化
指标,都可以在葡萄样品中找到相应的理化指标与之一一对应,因此算出
葡萄酒样品与酿
酒葡萄样品理化指标之间的相关系数,从而说明它们之间的联系。
对于问题四,由于在问题二中已对酿酒葡萄的理化指标进行了
综合分析并给出了
一个质量分数,所以酿酒葡萄可用问题二中给出的质量分数来分析。对
于葡萄酒的理化
指标的分析,我们采用问题二中提出的综合评分法,基于葡萄酒的理化指
标对其样品给
出一个分数,作为另一个影响葡萄酒质量的因素,从而变成二元线性回归模
型。建立二
元线性回归模型,用
matlab
< br>软件将得到的评酒员对葡萄酒的评分、葡萄样品的评分、
葡萄酒样品评分三者带入
方程中,确定回归系数并进行检验,从而分析出葡萄酒的质量
是否可以用酿酒葡萄与葡萄
酒的理化指标来衡量。
2
一、问题重述
葡萄酒质量的评定一般是让有资质评酒员在对葡萄酒进行品尝后对其分类指标
打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的
质量有直接的关系,
葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡
萄的质量。
(
1
)附件一中给出了两组评酒员共
20
人对某一年份红葡萄酒和白葡萄酒的打分,
取样总共
27
p>
份红葡萄酒和
28
份白葡萄酒,
试分析两组评酒员的评价结果有无显著性差
异,哪一组结果更可信;
(
2
)附件
2
和附件
3
分别给出
了该年份这些葡萄酒的和酿酒葡萄的成分数据,根
据酿酒葡萄的理化指标和葡萄酒的质量
对这些酿酒葡萄进行分级。
(
3
p>
)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(
4
)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量
的影响,并论证能否用葡萄
和葡萄酒的理化指标来评价葡萄酒的质量?
< br>
二、问题分析
p>
本题第一问采用的方法是方差检验的方法,
由于
27
种红葡萄酒样品和
28
种白葡
萄
酒样品是随机选取的,
所以两组评酒员对
27
种红葡萄酒样品和
28
种白葡
萄酒样品的评
分也认为是随机的,并且服从正态分布,要分析他们两组评酒员的评价结果
是否有显著
性差异,就要用到假设检验的方法,构造一个
F
p>
检验的模型,通过分析计算出的
F
A
与
F
0
.
05
(
DF
a
,
DF
e
)
和
F
0
.
< br>01
(
DF
a
< br>,
DF
e
)
关系,来判断两组评酒员的评价结果到底有无显著性差
异,可信度的分析可以采用标
准差来分析,标准差较小,评分的波动较小,结果也就更
可信一些。
由第一问得出评酒员对葡萄酒样品的评分,作为
所酿葡萄酒的质量的指标。葡萄的
理化指标较多,从影响所酿葡萄酒的各个评价方面出发
,选取与之联系最为相关的理化
指标作为葡萄的理化指标的评价方面。采用变异系数法算
出各个指标的权重,再采用均
值化无差异法对原始指标进行标准化,根据标准化的指标数
据和各个指标的权重,计算
出每一种葡萄的理化指标的综合评分,作为葡萄理化指标的评
价指标。以葡萄的理化指
标的综合评分和所酿葡萄酒的评分为基础,进行标准化,采用两
组指标的和作为该种葡
萄的质量的评分,对这些葡萄的评分按从大到小的顺序进行重新排
序,用
Excel
做出排
序号与葡萄的
质量评分的曲线图,将位于同一高度的序号分为一个等级,再根据序号与
葡萄种类的对应
关系,对每一种葡萄进行分级。
第三问的分析酿酒葡萄与葡萄酒的理化指标之间的联系,
采用了灰度关联分析法和<
/p>
数字特征分析法,
通过资料查询我们知道葡萄酒的色泽主要与葡萄
中的花色苷和单宁有
关,
在分析色泽这一指标时我们采用了灰度
关联分析法求出葡萄酒的色泽与葡萄中的花
色苷和单宁的联系系数,对所有数据取平均就
求出相关系数,并通过比较相关系数的大
小找出影响色泽的优势因素。在分析其它指标时
我们采用了数字特征分析法,通过计算
相关系数确定葡萄与葡萄酒的理化指标之间的联系
。
问题四中葡萄酒的质量
可以用在问题一中的评分进行衡量,而酿酒葡萄在问题二
中的求解中也给出了一个评分来
衡量质量的好坏,
因此此题的关键就是对葡萄酒的理化
指标的处
理,由于葡萄的理化指标多而复杂,在进行回归分析的时候,未免太过复杂,
考虑到葡萄
酒理化指标和酿酒葡萄的理化指标之间存在一定相似性,
因此葡萄酒的理化
1
指标也可采用变异系数法进行一个评分,
p>
从而化简成葡萄的质量与这两个评分之间的关
系,对它们进行二元线
性回归分析,并进行检验,从而论证出葡萄的质量可否用酿酒葡
萄和葡萄的理化指标来衡
量。
三、模型假设与符号说明
一、模型假设
< br>(
1
)评酒员对葡萄酒样品的评分是随机的,不含任何自
己的主观意见。
(2)
由于葡
萄的理化指标的评价与所酿葡萄酒的质量对葡萄的质量都有影响,
且无法
判断两者之间的重要性,可假设两者对葡萄的质量的影响程度是相同的。
(
3
)假
设红、白葡萄样品和红、白葡萄酒样品的选取是随机的,且其理化指标数据
是服从正态分
布的。
(
4
)在计算得到相关数据前,假设葡萄酒样品中理化指标含量的来源都是来自于葡
p>
萄样品本身的,不考虑人工添加成分。
二、符号说明
V
i
第
i
个因素的变异系数即标准差系数
Δ
i
p>
第
i
个因素的标准差
x
i
第
i
个因素的平均数
< br>
W
i
第
i
种指标的权重
S
i
p>
(
i=1
、
2
p>
·
·
·
·
·
·
·
26
)
第
i
p>
种葡萄的理化指标所构成的向量
A
由向量
S
1
、
S
2
·
·
p>
·
·
·
·
·
S
26
构造成的矩阵
X
ij
第
i
种葡萄的第
j
种理化因素
B
各个指标的权重构造成的向量
G
i
第
i
种葡萄的综合得分为
·
·
·
·
·
·
27<
/p>
)
第
< br>i
种葡萄对应的葡萄酒的评分与理化指标的评分构
Z
p>
i
(
i=1
、
p>
2
·
成的向量。
Y
ij
第
i
种葡萄的第
j
(
j=1,2
)个指标
SS
T
总的离差平方和
SS
A
组间离差平方和
SS
E
组内的离差平方和
Df
t
总自由度
Df
a
组间自由度
Df
e
组内自由度
i
k
第
k
个样本比较曲
线
x
i
与参考曲线
x
0
的相对差值
r
0
i
第
i
组数据相对第一组数据的相关系数
四、模型的建立和求解
2
问题一:对红葡萄酒的计算
首先对附表一进行数据整理,评酒员
A
对
p>
i
号评酒得分为十项指标与
A
所给分数
乘积的和的加权平均(见附录
1
sheet1
,所有
20
名评酒员对所有酒的打分)
。下面为其
中一个酒样品计算方法
。
表
1
:两
组品酒员对酒样品
12
各项指标打分的加权平均
品红
1
2
3
4
5
6
7
8
9
10
酒员
第一
8.66
9.49
9.26
8.21
9.30
9.14
8.92
9.11
9.83
9.36
组
第二
9.03
8.78
9.74
8.22
8.08
8.91
8.81
9.04
8.72
8.78
组
p>
0
.
114
p>
0
.
05
所以非显著性差异
表
2
:两组
品白酒员对酒样品
12
各项指标打分的加权平均
3
品白酒员
1
2
3
4
5
6
7
8
9
10
第一组
9.60 7.12 10.44 8.03 9.47 9.08
10.04 8.81 9.97 10.10
第二组
6.39 6.15
6.23 6.35 6.19 6.54
6.57
4.94 5.90
6.26
4.1.3
对哪一组数据更可信的分析
虽然用方差检验的方法可以看出两组评酒员的瓶酒结果是无显著性差异的,
作出的
折线图如下图
6
、图
7
所示
4
12.00
10.00
8.00
6.00
4.0
0
2.00
0.00
1
2
3
4
5
6
7
品酒员编号
8
9
10
第一组
第二组
得
分
图
1
两组评酒员对
27
种红葡萄酒评分散点图
图
2
两组评酒员对
28
种白葡萄酒评分散点图
5
12
.00
10.00
8.00
6.00<
/p>
4.00
2.00
0.00
1
2
3
4
< br>5
6
7
品酒员编号
8
9
10
第一组
第二组
得
分
图
3
两组评酒员对
28
种白葡萄酒评分散点图
极小
极大
标准
N
值
值
和
均值
差
方差
峰度
统计
统计
统计
统计
统计
统计
统计
统计
标准
量
量
量
量
量
量
量
量
误
VAR00001
10
7.12
10.44 92.66 9.265
1.038
1.079
.642 1.334
7
87
VAR00002
10
4.94
6.57
61.51 6.150
.4691
.220 5.721
1.334
5
6
第一组得分标准差为
1.03887
方差为
1.079
,第二组标准差
为
0.46916
方差为
0.220
由上图可得出第二组波动较小,我们认为葡萄酒样品是随机抽取的,所以它们的质量也<
/p>
该是随机的,评酒员的评分也是随机的,所以判断哪一组更可信可以利用标准差的大小
p>
来衡量评酒员评分的可信度,
评酒员评分的标准差越小,
则说明他们评分的可靠性越高。
比较可得第一组评红酒员的评分标准差显然
低于第一组评酒员的评分标准差,
故可以认
为第一组评红酒员的
评分更可靠一些。
第二组评白酒员的评分标准差显然低于第一组评
酒员的评分标准差,故可以认为第二组评白酒员的评分更可靠一些。
问题二:葡萄酒分级问题模型建立和求解:
1
:
酿酒葡萄的理化指标的筛选
<
/p>
葡萄的理化指标较多,若对其一一进行研究,必将十分复杂且没有必要,从评酒员
对酒评价的角度出发,选取与之联系最为紧密的葡萄理化指标,不仅可以简化问题,而
且也很合理。如图
8
为为与红葡萄有关的主要理化
指标
表
3
描述统计量
6
图
4
红葡萄相关的主要理化指标
关系
相
关<
/p>
花
色
单宁
醇
总糖
VC
含
酸
<
/p>
出
汁
果
穗
指
苷
量
率
质量
标
评价方面
外观
+
+
香气
口感
平衡
/
整体
+
+
+
+
+
+
+
其中“
+
”
表示该种相关指标是与之对应的评价方面的主要影响指标,空格表示该
指标对这种以评价
方面没有影响。
2.
采用变异数法确定各个指标的权重
由上述分析决定葡萄分级的因素有:花色苷、单宁、醇
、总糖、
VC
含量、酸、出汁
率
、果穗质量共
8
个
。
分析所给的数据可知,各个因数之间存在数量级和量纲的不
同,为了消除各个因数
之间的数量级与量纲不同的影响,
需要用
各项指标的变异系数来衡量各个指标取值的差
异程度。
各项指标的变异系数公式如下:
V<
/p>
i
=
δ
i
/
x
(
i=1
、
2
·
·
·
·
·
·
·
8
)
< br> (1)
式中:
V
i<
/p>
是第
i
个因素的变异系数即标准差系数<
/p>
δ
i
是第
p>
i
个因素的标准差
x
i
是第<
/p>
i
个因素的平均数
各个因数的权重为:
W
i
=
V
i<
/p>
/
V
i
(2)
i
1
i
8
W
i
表示第
i
种指标的权重
根据附表
2
用
EXCEL
计算可得花色苷的平均值为:<
/p>
x
1
=105.37
花色苷的标准差为:
1
=87.9
则花色苷的变异系数为
V
1
=
1
/
x
1
=87.9/105.37=0.8341
用同样的方法可以
得出各个因素的变异系数,各个因素变异系数的和为:
0.8341+ 0.4677+1.019+0.1106+1.024+0.4095+0.1063+0.
6611=4.6323
7
<
/p>
根据公式
(2)
计算花色苷的权重为
p>
:
W
1
=0.8341/4.6323=0.180
用同样的方法可以算出其它因素的权重
,
计算结果如下表
9:
表
4
:变异数法其他因素的权重
花色
单宁
醇
总糖
VC
含
酸
<
/p>
出
汁
果穗质
和<
/p>
苷
量
率
量
平
均
p>
105.
13.88
40.24
204.07
0.115
12.57
67.19
239.89
数
37
7
8
4
5
9
标
准
87.9
6.496
41.01
22.658
0.118
5.145
7.144
185.59
差
5
3
7
4
变
异
0.83
0.467
1.019
0.1106
1.024
0.409
0.106
0.6611
4.632
系数
41
7
5
3
3
权重
0.18
0.101
0.220
0.024
0.221
0.088
0.023
0.144
1
0
3
.各种红葡萄理化指标的综合评价
用
S
i
p>
(
i=1
、
2
p>
·
·
·
·
·
·
·
26
)表示第
i
种葡萄的理
`1QAZWEDC
VF
化指标所构成的向量
S
1
=(105.37,
13.887, 40.248, 204.074, 0.1155, 12.57, 67.199,
239.89)
将
S
1
、
< br>S
2
·
·
·
·
·
·
·
S
26
构造成新的矩阵
A
< br>T
A=[
S
1
,
S
2
,
·
·
·
< br>·
·
S
26
]
=
(
X
ij
)
26*8
T
其中
X
ij
表示第
i
种红葡萄的第
j
种理化因素,为了计算各种葡萄理化指标的综合
评分,首先采用均值化无差异法消除各个指标之间的数量级和量纲之间的差异。
即
'<
/p>
X
ij
X
p>
ij
/
X
j
'
S
1
=(3.872,1.585,0.519
,1.020
,
2.173
,
1.753,1.167,0.763)
<
/p>
'
'
T
得到新的矩阵:
A
'
=[
S
1
'
,
S
2<
/p>
·
·
·
·
·
·
·
S
26
]
=
(
X
ij
’
)
26*8
各个指标的权重构造成权重向
量:
B
=(W
1
,
W
2
·
·
·
·
·
·
p>
·
·
W
8
)
=
(
0.180
,
0.101
,
0.220
,
0.024
,
0.221
,
0.088
,
0.023
,
0.
144
)
T
'
则第
i
种葡萄的综合得分为:
G
i
=
S
1
*
B
G
1
p>
=S
1
’
*B=(
3.872,1.585,0.519,1.020
,
2.17
3
,
1.753,1.167,0.763)*
(
0.180
,
0.101
,
0.220
,
0.024
,
0.221
,
0.088
,
0.023
,
0.144
)
T
=1.731
用同样的方法可以得出其它葡萄理化指标的综合得
分如下表
10
:
8
葡
萄
1
2
8
种类
指
标
1.731
1.048
2.094
0.727
0.883
0.586
0.620
1.880
得分
葡
萄
9
10
11
12
13
14
15
16
种类
指
标
2.130
1.096
0.758
0.493
0.679
1.468
0.673
0.646
得分
葡
萄
17
18
19
20
21
22
23
24
种类
指
标
0.958
0.578
0.838
0.465
0.921
0.659
1.227
0.969
得分
葡
萄
25
26
27
种类
指
标
0.692
1.538
0.666
得分
4
.红葡萄酒的质量的确定
根据第一个问题的分析,两组评酒员的评价结果没有显
著性差异,若此时选择两组
评酒员对某一种酒的评分的平均值作为该种酒的评分,则较为
合理,如下表
11
:
表
6
、红葡萄酒质量的评分
酒种类
1
2
3
4
5
6
7
8
评分
85.85
97.76
94.88
87.94
86.80
86.07
85.66
93.63
酒种类
9
10
11
12
13
14
15
16
评分
93.38
84.04
86.42
77.41
92.57
86.96
80.54
92.82
酒种类
17
18
19
21
22
23
24
25
评分
90.97
83.90
96.62
90.78
93.43
95.25
98.20
90.76
酒种类
26
27
评分
87.25
90.85
5
.每一种红葡萄质量的确定
同样红葡萄酒的评分与红葡萄酒理化指标之间存在数量级的差异,
用平均法来消除
数量级的差异。用向量
Z
i
(
i=1
、
2
·
·
·
·
·
·
·<
/p>
27
)表示第
i
种红葡萄对应的葡萄酒的评分
与理化指标的评分构成的矩阵。
则由上可得
Z
< br>1
=(85.85
,
1.731
)
表
5
:
各种红葡萄理化指标的综合得分
3
4
5
6
7
<
/p>
用向量
Z
1
,<
/p>
Z
2
·
·
·
·
·
·
·
·
Z
27
构成新的矩阵:
C=[
Z
1
,
Z
2
·
·
·
·
·
·
·
p>
·
Z
27
]
T
=(Y
ij
)
p>
26*2
T
其中
Y
ij
表示第
i
种葡萄的第
j
(
j=1,2
)个指标
9
对矩阵
C
进行转化:
Y
ij
= Y
ij
/
Y
< br>j
’
'
’
’
’
T
’
Z
1
=(0.958,1.730)
C
=[
Z
1
,
Z
2
·
·
p>
·
·
·
·
·
Z
27
]
分析材料
,
所酿葡
萄酒的质量和红葡萄的理化指标都可以反映葡萄的质量
,
两个指
标
越好葡萄质量就越好
,
于是采用两组
指标的的和作为该种葡萄的质量评价
即
:G
i
=Y
i1
’
+Y
i2
’
其中
G
i
表示第
i
种红葡萄的质量
评分
G
1
=0.958+1.730=2.688
用同样的方法可以计算出其他红葡萄的质量的评分,如下表
12
:
表
7
:所有酿酒红葡萄的质量评分
葡萄种
1
2
3
4
5
6
7
8
类
评分
2.688
2.138
3.151
1.707
1.851
1.546
1.575
2.923
葡萄种
9
10
11
12
13
14
15
16
类
评分
3.170
2.033
1.721
1.356
1.711
2.437
1.571
1.681
葡萄种
17
18
19
21
22
23
24
25
类
评分
1.972
1.513
1.915
1.933
1.701
2.288
2.064
1.704
葡萄种
26
27
类
评分
2.510
1.679
6
.对红葡萄进行分级
将红葡萄的种类按其评分从大到小进行排序得到如下的表格
13
:
表<
/p>
8
:按红葡萄的质量评分评分从大到小排序
排序号
1
2
3
4
5
6
7
8
葡萄种类
9
3
8
1
26
14
23
2
评分
3.17
3.151
2.92
2.688
2.51
2.437
2.288
2.138
3
排序号
9
10
11
12
13
14
15
16
葡萄种类
24
10
17
21
19
5
11
13
评分
2.064
2.033
1.97
1.933
1.915
1.851
1.721
1.711
2
排序号
17
18
19
20
21
22
23
24
葡萄种类
4
25
22
16
27
7
15
6
评分
1.707
1.704
1.70
1.681
1.679
1.575
1.571
1.546
1
排序号
25
26
葡萄种类
18
12
评分
1.513
1.356
运用
EXCEL
做出排序号与其对应的葡萄评分的曲线图
,
如下图
14:
图
5
:红葡萄
质量评分曲线图
10