数学建模竞赛论文格式模板
-
承
诺
书
我们完
全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网
上咨询等)与
队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或
其他
公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文
引用处
和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛章程和
参赛规则,以保证竞赛的公正、公平性。如有
违反竞赛章程和参赛规则的行为,我们将受
到严肃处理。
< br>我们参赛选择的题号是(从
A/B
中选择一项填写):<
/p>
B
p>
我
们的参赛报名号为(报名网站提供的报名号):
< br>
23006025
所属学校(请填写完整的全名):
四川师范大学
参赛队员及联系方式
:
1.
姓名:
饶泉
联系方式:
2.
姓名:
淳黎
联系方式:
3.
姓名:
陈红燕
联系方式:
p>
(以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被
取消评奖资格。)
日期:
短期交通流量预测
摘要
随着
交通基础设置建设和智能运输系统的发展,交通规划和交通诱导已成为交通领
域研究的热
点。对于交通规划和交通诱导来说,准确的交通流量预测是其实现的前提和
关键。本题要
求我们对城市交通路网中交通路段上的交通流量进行短期预测。本文根据
实际情况和问题
提出了不同的模型和算法,再通过对各模型间的比较得出最优预测方
案。过程如下:
p>
首先,我们先进行对数据的处理。由题可知以每
< br>15
分钟来测量交通流量,一共有
3
天的数据。理应有
288
个数据,却只有
< br>276
个,其中有两个负值数据为异常数据。为了
保留数
据的完整性,对于缺失数据和异常数据,我们分别使用插补法和平均值填补法来
做。
p>
方案一:我们使用
eview
软件来进行时间序列的预测,时间序列预测要求数据必须
是平稳的,所以在
此之前,先对数据进行
ADF
检验。通过后才能进行预测,得到
预测后
的表达式和残差,并对残差进行分析估计,最后对模型进行评价。
方案二:
我们使用
metl
ab
软件来实现
BP
神经网络模型的预
测。
BP
神经网络的实质
是用已给出的
数据来推出需要的数据,
并将新预测出的数据重新返回输入中,
得到误差,
一直重复,直到误差到达合理的范围内。在预测之前,我们先得出了误差在合
理范围,
并且看到已给出数据的真实值与预测值得对比。在确保模型是可用的之后,在进
行预测
与预测结果的评价。
方案三:
我们使用
spss
软件来进行回归分析模型的预测。首先,我们
需要先对数
据进行相关性检验,如果数据没有相关性,则回归方程就会没有意义。接下来
,通过对
回归方法的决定性系数检验和方差分析检验,得到最合适方法。之后再进行第四
天的预
测及预测结果的评价。
最后,
我们将对每一个模型进行优缺点评价,
进而对三种预测方法进行
了一个比较,
判断出那个模型是最适合这个题目的。并且对文章中所涉及的模型进行推广
,使其更便
于运用于生活实际中。
关键词:平均值填补
时间序列
ADF
检测
BP
神经网络
多元线性回归
2
1.
问题的重述
随着交通基础设置建设和智能运输系统的发展,交通规划和交通诱导已成为交通领
域
研究的热点。对于交通规划和交通诱导来说,准确的交通流量预测是其实现的前提和
关键
。交通流量预测根据时间跨度可分为长期交通流量预测和短期交通流量预测,长期
交通流
量预测以小时、天、月甚至年为时间单位,是宏观意义上的预测;短期交通流量
预测一般
的时间跨度不超过
15
分钟,是微观意义上的预测。短期交通流
量预测是智能运
输系统的核心内容和实现其智能化功能的基础平台。短期交通流量预测具
有高度非线性
和不确定性等特点,并且同时间相关性较强,研究表明,城市交通路网中交
通路段上某
时刻的交通流量与本路段前几个时段的交通流量有关,并且交通流量具有
p>
24
小时内准周
期的特征。
现有
3
天的交通流量数据(
见附件二),假设从第
1
天
0
时
15
分开始,每隔
1
5
分钟记
录一次该段时间内的交通流量,请预测第
4
天的交通流量。
2.
问题分析
对于问题要求的根据已给的
3
天数据来预测第四天的交通流量
,并预测评价出模型的
优缺点。
首先,题目给出的是三天的数据,以
15
分钟为一个截点,应该有
3x4x24
个数据,但
实际只有
276
个数据
。另外,数据中还出现了负数的情况,而这显然是不符合实际情况
的。所以,我们要对异
常数据和残缺数据进行处理。我们运用插补法和平均值填补法来
处理数据。
对数据进行处理后,我们就需要对第四天的交通流量进行预测。这里我们需
要对短期
的交通流量进行预测。在短期预测中,我们需要以
15
分钟为一个时间段,预测未来的
的交通流量。在这里,我们运用
时间序列预测方法和
最后,我们通
过对每种预测方法结果的分析,来评价各种方法的优缺点。
3.
模型假设
基本假设:
(
1
)
在观察测量的四天里交通没有突发状况,路况正常。
(
2
)
p>
假设灰色预测模型,神经网络预测模型,时间序列预测模型都是最好的。
(
3
)
假设测量数据误差小对结论影响小,甚至没影响。
3
4.
符号说明
i
一天中,以
15
分钟为时间段的时间序
列编号
5.
模型的建立与求解
5.1
对数据进行处理
由题可知以每
15
分钟来测量交通流量,一共有
p>
3
天的数据。理应有
288
个数据,
却只有
276
个,其
中的两个负值数据为异常数据。为了保留数据的完整性,对于缺失数
据和异常数据,我们
分别使用插补法和平均值填补法来做。
Step1
缺失数据的处理
首先对于缺失数据来
说,我们并不知道缺失的数据是随机缺失数据还是非随机缺失
数据,所以我们先将数据点
作图,观察曲线的趋势,折线图一如下:
< br>有图可知,
该数据具有明显的周期性。
对此,
我们选择了插补法进行缺失值的填补,
所谓热卡插补法
(Hot deck imputation)
,即对于一个包含缺失值的对象,在
完整数据
中找到一个与它最相似的对象,然后用这个相似对象的值来进行填补。在这里,
我们用
与缺失值最相似的前两天同一时段的数据的平均值来代替缺失值。用替换掉缺失值
的数
据画折线图得到图二:
4
CHE
320
280
240
200
160
120
80
40<
/p>
0
-40
25
5
0
75
100
125
< br>150
175
200
225
p>
250
275
对于异常数据的处理
我们直接用平均值填充法,用异常数据的前后两个数据的平均值来代替异常数据,得到
完整数据。
5.2
方案一的模型建立于求解
p>
为了保证预测结果的准确性,在进行时间序列预测之前,我们还需要对数据进行平稳
性检验(
ADF
检验)。
所谓平稳性检验,是指为了防止有时数据的高度相关仅仅是因为二者同时随时间有向
上
或向下的变动趋势
,
并没有真正联
系。如果这样,数据中的趋势项
,
周期项等无法消除
,
从而在残差分析中无法准确进行分析
.
。
在这道题中,我们对随着时间变化的交通
流量进行了平稳性检验,首先我们使用的是平
均差分法,检验结果如下表:
5
ADF
检验的
Mackinnon
临界值分别
为
-3.464643
,
-2.876
515
,
-2.574831
,
t
检验统计量
值
-5
.613230
,
prob
值小于
p>
0.05
,从而能拒绝,表明短期交通流量的差分序列存在单位
p>
根,是平稳序列。所以
ADF
检验
,
平稳
,
自相关拖尾<
/p>
,
偏自相关截尾
,
选择
AR
模型
6
时间序列预测模型的分析与求解
<
/p>
参数检验
,
去掉常数
C
我们在进行时间序列预测时,是直接使用的
eviews
软件,软件输出结果如下面
模型检验
:
残差均在虚线内
,
即模型可行
做预测
:
静态图,基本拟合
< br>
7
30
0
200
100
0
-100
Forecast:
CHE1FF
Actual: CHE1
Forecast
sample: 1 288
Adjusted sample: 98
288
Included observations:
191
Root Mean Squared Error
Mean Absolute Error
Mean Abs. Percent Error
Theil Inequality Coefficient
Bias Proportion
Variance Proportion
Covariance Proportion
35.45872
< br>28.00692
205.9829
0.405720<
/p>
0.001334
0.163293
0.
835372
-200
100
125<
/p>
150
175
CHE1FF
200
225
?2
S.E.
250
275
120
8
0
40
0
-40
-80
Forecast: CHE1F
Actual:
CHE1
Forecast sample: 1
288
Adjusted sample: 98
288
Included observations:
191
Root Mean Squared Error
Mean Absolute Error
Mean Abs. Percent Error
Theil Inequality Coefficient
Bias Proportion
Variance Proportion
Covariance Proportion
50.79285
< br>37.56480
102.4475
0.964219<
/p>
0.007655
0.929385
0.
062960
-120
100
125<
/p>
150
175
CHE1F
200
225
?2
S.E.
250
275
时间扩展后的曲线图
(expand 1 384)
,得到第四天中每个时间段的交通流量的预测值,
依旧将它与其它第三天的
数据一起,画出它的折线图,如下:
8
<
/p>
CHE2
320
280
< br>240
200
160
120
p>
80
40
0
50<
/p>
100
150
200
250
300
350
5.3
方案二的模型建立与求解
p>
BP
网络是一种具有
3
层或
3
层以上的阶层型神经网络。
它的特点是各层神经元之间无
反
馈连
接
,
各层内神经元之间无任何连接
,<
/p>
仅相邻层神经元之间有连接。
典型
BP<
/p>
网络是
3
层
前
馈网络
,
即输入层、隐层和输出层
,<
/p>
各层之间实行全连接
,
见图
1
。
< br>BP
网络的主要思想可概括为训练样本集
和已知的输出样
1
2
(
,
,
,
)
k
P
P
P
P
k
=
…,
为样本数
本集
。训练的目的是求网络的模拟输出
,通过
1 2 k T (T ,T , T ) =
…
, 1 2 k A
A A A
=
(
,
,…,
)
减少
A
与
T<
/p>
之间的误差来修改模拟过程的权值,使网络模拟输出值与实际样本值之间的
误
差达到最小值。每一次的权值变化和偏差都与网络
误差的变化成正比
,
并以反相传播
的<
/p>
方式传递到每一层。
BP
网络法由信息的前向传递和误差的正相传播两部分组成
[2]
。
由于
< br>BP
网络神经的定义,在对未来时间进行预测前,系统将会先对已知数据进行预测
,
然后将真实数据与预测数据进行一个对比,并且给出在预测过程中的误差分布,观察这
两个图,可以看到误差水平差不多都在
0.1
< br>左右,较小在合理范围内。而真实值与预测
值得差距也较小,所以认为模型的检验
是通过了的,是可以继续进行预测的。
9
在
BP
算法中,我们采用了最速下降梯度法来修改权值,计算公式如下:
△
Wij(n+1)= h <
/p>
×
Ф
i
×
Oj+a
×△
Wij(n)
< br>(n
为样本数
)
其中为期望输出,为实际输出,为输出节点数
,w(ij)
为第
ij
次网络权值,
a
p>
为学习率。
在实际计算时,我们运用
p>
matlab
编了一段程序,详见附件一。
为了保证预测结果的准确性,我们并没有一次性的预测出所有的数据,而是采用滚
动预测的方式,将先预测出来的结果带入到原始数据中,以此来预测接下来的数据,由
于数据太多,这一次依旧用与前三天的交通流量的汇总数据来画折线图,用折线图来表
示预测的结果,图如下:
5.4
方案三的模型建立与求解
p>
一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归
模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合
实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。
<
/p>
首先建立的回归方程,我们必须要先判断作为自变量的因素与作为因变量的预测对象是
p>
否有关,检验相关程度如何,以及这种相关程度的把握性多大,在这里,我们用相关关
系的大小来判断自变量和因变量的相关的程度。
将自变量时间设为
,
因变量交通流量设为
< br>,
在这里我们运用
R
系数来计算
两者之间的相关
性系数:
表示时间与交通流量的平均数
在
p>
SPASS
软件中我们通过计算得到以下结果:
10