数学建模降价折扣券对消费者的影响
萧亚轩个人资料-戴娆歌曲
.
数学建模
.
第四次大作业
姓 名 学 号
刘 维 20116554
林胜军 20116552
王 波 201165
.
降价折扣券对顾客消费行为的影响
【摘要】本文针对
降价折扣券对顾客消费行为影响的研究,通过调查数据以及图表分析,
建立统计回归模型(logit
模型),在MATLAB软件上运用最大似然法估计模型的参数,并作
出logit
回归曲线与散点图以及预测值和置信区间,从而对模型进行分析和预测,更好的
解决问题。
就问题(1)、问题(2)和问题(3),从折扣券折扣比例的变化对使用折扣券人数比例
产生的影响这
方面进行分析讨论,对问题(1),研究结果表明,需建立一个logit回归模型。
对问题(2),由
估计模型方程,得出当折扣比例为9.9973%时,使用折扣券人数比例为25%。
对问题(3),研
究表明,折扣比例每增加5%,使用折扣券人数与不使用折扣券人数的比相
应的增加,也就是随着折扣比
例的增加,使用折扣券人数比例也增加。
本文通过再建立一个probit回归模型和logit模型
进行比较,对该模型进行评价与结
果分析,得出模型的优缺点并对把模型推广和扩展。
【关键词】
降价折扣 logit模型 消费行为 回归分析
.
.
一、模型的假设
1.模型的假设
(1)假设这1000个顾客是相互独立的。
(2)折扣券的折扣比例是固定的。
2.符号说明
x表示折扣券的折扣比例
y表示使用折扣券人数比例 Y表示使用折扣券人数
n
i
表示持折扣券人数 m
i
表示使用折扣券人数
i
表示第i组的使用折扣券人数比例
x
i
表示第i组的折扣比例
(x)表示折扣比例为x时使用折扣券人数比例的概率
0
表示回归模型的常数项
1
表示回归模型的X的系数
二、问题分析
(1)、为
了分析使用折扣券人数的比例与折扣券折扣比例的关系,建立模型。
根据问题中的数据作食用折扣券人数
比例与折扣比例的散点图,粗略地进行判
断。
图1:使用折扣券人数比例与折扣比例的散点图
.
.
由
上图可以看出,使用折扣券人数比例随着折扣券折扣比例的增大而递增,
大致是介于0与1之间的曲线,
分析这条曲线应该建立怎么样的回归方程?
(2)根据估计的回归方程,估计使用折扣券人数比例为2
5%时,折扣券的折
扣比例应该多大?
(3)根据模型的估计方程,分析折扣券的折扣比例每
增加5%,使用折扣人
数比例的变化情况。
三、模型的建立与求解
1.模型建立
由于使用折扣券人数比例比例实际上是折扣比例x时Y的平均值,用期望的
表示为y=E(Y︱
x)使用折扣券人数比例y是折扣比例x的函数,其取值在区间
[0,1]上,如果用普通的方法建立回
归方程,那么很容易求得其线性模型或更接
近的非线性曲线,其回归模型为y=
0<
br>+
1
x+
2
x^2+
3x
3
+
,其中随机误差
服
从均值为0的
正态分布,特别地当
2
=
3
=0时为线性回归模型。然
而在这个问
题中,(1)式回归方程中y的取值不一定在[0,1]中。即使y在该范围内取值,
由于给定x时,误差项
也只能取0,1两个值,显然
不具有正态性,而
且
的
方差依赖于x,具有异方差性,这些都违反了普通回归分析的前提条件。因此,
应建立一种logit回归模型。
该模型为:㏑{
(x)[1
(x)]
}=
0
+
1
x <
br>其中条件期望
(x)
=P(Y|x),方差D(Y|x)=
(x)
(1-
(x)
)
(x)
在[0,1]上取值 ,
logit(
(x)
)取值为(
,
)
2.模型求解
首先由问题重述的表中的数据,用最大似然法估计模型参数,
其模型为: logit(
i
)=ln[
i
(
1-
i
)]=
0
+
1
x
其中
i
= m
i
n
i
利用MATL
AB统计工具箱中的命令glmfit求解,用表(1)中的数据输入并执行
以下程序:
T=[0.05 0.10 0.15 0.20 0.30]';
Chd=[32 51
70 103 148]';
.
.
Total=[200
200 200 200 200]';
Proport=;
[b,dev,stats]=glmfit(T,[Chd
Total],'binomial','logit');
logitFit=glmval(b,T,'logit');
plot(T,Proport,'o',T,logitFit,'r-');
xlabel('T');ylabel('Proportion of CHD')
b,bi=,dev
得到logit模型中的参数
0
,
1
的最大似然估计值与它的标准差(见下表),拟
合偏差为
0.5102,
并得出logit回归曲线与散点图。
曲线与散点图为:
,
图1:对应的曲线与散点图
再利用命令[yhat,dylo,dyh
i]=glmval(b,T,'logit',stats)得到因变量的
预测值及置信度为95﹪的
置信区间,结果如下表:
.
折扣比例
/%
5
10
15
20
30
使用折扣券
比例
0.160
0.255
0.350
0.515
0.740
预测值
0.1622
0.2501
0.3648
0.4972
0.7457
置信区间
[0.1313,0.1987]
[0.2175,0.2858]
[0.3325,0.3984]
[0.4599,0.5345]
[0.6917,0.793]
.
四、模型评价与结果分析 (一)、用另一种广义线性模型probit模型处理这类问题,并与logit模型
比较,得出优
缺点。probit模型的形式为:
(x)
=
(
<
br>0
+
1
x) probit(
(x)
)=
1
(
(x)
)=
0
+
1
x
其中
是正态概率分布函数,它也是S型曲线。
(1)利用MATLAB求解该模型的参数估计值、标准差(见下表)和拟合偏差
0.5527。
(2)、再作出probit模型的预测值和置信区间,与logit模型相互比较(
见下
表)。
表1:Probit模型与logit模型的比较
折扣比
例%
5
10
15
20
30
使用折扣
券人数比
例
0.160
0.255
0.350
0.515
0.740
预测值
(logit)
0.1622
0.2501
0.3648
0.4972
0.7457
预测值
(probit)
0.1589
0.2520
0.3679
0.4973
0.7438
置信区间(logit) 置信区(probit)
[0.1313,0.1987]
[0.2175,0.2858]
[0.3325,0.3984]
[0.4599,0.5345]
[0.6917,0.793]
[0.1267,0.1960]
[0.2194,0.2870]
[0.3365,0.4002]
[0.4613,0.5333]
[0.6900,0.7923]
(3)、作出probit模型的拟合曲线
图2:probit模型的拟合曲线
通过对probit模型与logit模型的预测值及预
测区间的相互比较,还有对
拟合偏差和拟合曲线的比较发现这两个模型不相上下。
.
.
(二)、通过对模型预测与进一步分析,得出probit模型与logit模型的优劣
通过
上述分析可知,logit模型和probit模型都是合适的模型,下面要分析
问题(2)和问题(3
),对于这两个问题的解决,可以用logit模型进行解决,
而probit模型是无法实现的,因此
运用logit模型比较好。
在logit模型中回归系数
1
有很直观的
解释,logit模型与统计中的
odds(发生比或优势)的概念有密切的联系,odds表示为折扣
比例为X时,使用
折扣券人数与不使用折扣券人数的概率比,即odds(x)=
(
x)
(1-
(x)
)
因此logit模型可以表示为odd
s(x)=e
0
1
x
对于问题(2),当使用折扣券人数比例为25%时,即为
(x)
(1-
(x)
)
=e
0
1
x<
br>=13也就是
0
+
1
x =-1.0986,将
0
=-2.1855,
1
=10.8719代入方程,
解得X=9.9973%,因此当折扣比例为9.9973%时,使用折扣券人数比例为25%。
这就说明,当折扣比例高于9.9973%时,使用折扣券人数比例大于25%。
对于问题(3),当折扣比例升高5%时,odds比为
odds(x)/odds(x+5)=
e
0
1
(x5)
e
0
1
x
=e
5
1
于是
1
ln
[odds(x+5) odds(x)] 5,即
1
为自变量增加5个单位时
odds比的对数的15倍。
1
>0时,e
5
1
>1,所以X每增加5个单位,odds比<
br>会相应的增加,即折扣比例每增加5%,使用折扣券人数与不使用折扣券人数的
比相应的增加,也
就是随着折扣比例的增加,使用折扣券人数比例也增加,且对
任意的正整数k,有odds(x+k)=
e
k
1
odds(x)。
.