2023年上海世博会影响力的定量评估摘要上海世博会的举办对中国乃至世界的快速开展都产生了深远的影响本文着眼于上海世博会促进旅游业这一侧面,提出并解决三个重要的问题一:上海世博会对上海入境人数的奉献旅游业开展具有趋势性、周期性、随机性,根据这一规律建立入境人数本底趋势模型,使用内插法处理过的2007年7月至2023年3月数据拟合出本底趋势线,进而求出2023年4、5、6、7月的本底值,与实际人数相比得到世博会对入境人数平均奉献率为22.41%二:未来几个月上海入境人数走势利用第一问模型得出08-11月世博会给上海带来544815人的额外入境人数三:世博会给上海带来的直接利益通过对的世博会入园人数进行分析,建立每天入园人数的时间序列分析模型,由于人员的变动性,故采用时间序列分解法求解运用趋势外推法加权拟合出长期趋势直线,综合考虑影响参观人数的随机因素,预测出上海世博会最终入园人数为7010.82万人门票总收入达103.88亿元关键字:本底趋势线 内插法 定量评估 时间序列分析模型 趋势外推法一、问题重述题目背景:2023年上海世博会是首次在中国举办的世界博览会从1851年伦敦的“万国工业博览会〞开始,世博会正日益成为各国人民交流历史文化、展示科技成果、表达合作精神、展望未来开展等的重要舞台。
请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2023年上海世博会的影响力问题提出:上海世博会促进旅游业这一侧面,提出了三个重要的问题问题一:上海世博会期间,上海的入境人数有什么变化,给出相应的数学模型,并计算世博会对入境人数的平均奉献率问题二:未来几个月上海入境人数走势问题三:从互联网获取每天入园参观人数,建立每天的参观人数的预测模型,并预测最终入园人数并估算世博会的门票总收入二、符号约定时间t月入境人数入境人数开展动态趋势项入境人数开展动态周期项过境人数开展动态随机项内插公差值内插修正值内插起始点内插终止点内插起始点入境人数内插终止点入境人数循环指数季节指数入园参观人数随机值平均参观人数长期趋势离差平方和趋势值三、模型假设1、忽略国家政策、军事、节假日等方面对上海入境人数的影响2、将世博会期间的天气情况影响限制在一定波动范围内3、假设世博会每天不限制入园的人数4、与往届世博会趋势相似,世博会结束前出现顶峰期5、忽略世博期间的交通以及住宿情况造成的影响四、问题分析世博会给上海旅游业和经济造成了很深远的影响,我们应该认真的完成这一分析任务一:数据的收集、分析与处理,采取筛选变量原那么选取量纲,并量化。
任务二:对入境人数建立本底趋势模型,拟合出本底趋势线任务三:通过本底趋势模型进行推广,进而分析接下来几个月上海入境人数的变化趋势任务四:对9月10日前〔含〕的世博会入园人数进行分析,建立时间序列分析模型,根据模型估测出最终入园人数以及世博会总收入五、建模前准备为了后面建模与程序设计的方便,在建立此模型前,我们有必要做一些准备工作5.1 变量确实定:选择变量的原那么可供选择的变量很多,但从实际应用的角度出发,应当依据以下原那么进行适当筛选〔1〕可定量性所选择的变量将用于本底趋势模型和时间序列分析模型的求解,必须有确定的定量数值方可通过计算得出定量的结论〔2〕权威性数据的来源应当具备较强的权威性,其计算结果才能够具有说服力〔3〕公开性所选择的数据应当具有公开性,使建模中的结果更具有真实性5.2 数据的收集与处理:根据对题目的理解,我们从世博会官方网站上收集到了每日世博会入园参观人数,从?上海2023-2023年年鉴?和上海市旅游局官方网站中,收集到上海每月的入境人数建立旅游本底趋势线,需要对因突发事件所造成统计数据的异常变化进行订正.统计数据的订正采用了直线内插法,具体方法是:(1)用原始统计数据作出长期变化的统计线;(2)根据目视观察从统计线上找出需进行订正的时间区段,并确定适合直线内插的起始点()和终止点();(3)用内插公式………………………………1订正异常区统计数据.在该公式中,d为进行内插的公差值,其计算公式为:……………………………2根据图形确定内插区段、内插方程和内插修正值如表 1 所示。
表 1 内插区间、内插方程、内插修订值序列名称内插区间公差值修正公式修正值080408050806080709070908入境人数08年0308年08-22950.6553110530160507210484260入境人数09年0609年0929844.3499190529030*客流量单位:人次入境人数处理前后如图1所示图1 内插前后入境人数比照六、模型的建立与求解模型一 入境人数本底趋势模型量化上海世博会对上海入境人数的影响力入境人数本底趋势根本形式入境人数的开展趋势可预报的,而各年增长率的变化却是随机和不可预报的.入境人数开展的本底趋势线可归结成统一方程………………………………3入境人数可分解为趋势项、周期项随机项三个项其中,趋势项选用曲线方程……………………………4来反响,周期项选用三角函数…………………………………5来反响,由于本模型的主要目的在于建立上海入境人数的本底趋势线方程,着重分析其趋势项和周期波动项,这里略去随机波动项计算机程序求解本底趋势方程根据以上分析本底趋势方程可表示为……………………6于是根据附录5中的数据拟合出相应系数:〔程序见附录1〕相关系数:入境人数本底趋势方程:…7为了更直观理解上述本底趋势线提供了一个窗口,更为重将本底线与统计线相比拟,定性的同时也定量的拟合结果。
图2 入境人数内插后趋势及本底趋势图本底线的预测功能,对旅游业的未来开展趋势提供一个直观的估计所以代入年月份得到2023年3月到2023年7的本底值,根据公式……………………………8可以求出上海世博会的奉献率如下表:表 2 入境人数本底值、实际值及奉献率一览年月实际值〔人〕本底值〔人〕奉献率〔%〕10-0369437259851416.0110-046775866379226.2110-0571369961875715.3410-0675660056468733.9810-0774932753324740.52平均奉献率22.41预测根据这一平均值我们可以大胆的假设在以后的几个月中根本满足22.41%率,于是假设求出接下几个月的本底值可以确定其实际值表 3 预测10年的入境人数年月本底值预测值10-0855793368296510-0961436775204610-1064446578888910-11614358752035总计24311232975938从表中可以看出这四个月相当于世博会给上海带来了人的额外入境人数模型二 时间序列分析模型预测世博会每日入园人数时间序列分析模型的根本形式使用matlab软件画出世博会每日入园人数示意图如图3所示图3 世博会每日入园人数图观察图形可知,参观人数与日期之间不存在明显的函数关系。
同时我们发现,参观人数呈现一定的周期性,即每隔假设干个星期,参观人数的变化出现相同的规律,即参观人数具有周期性在剔除星期规律之后,从长期趋势来看,参观人数随时间的变化存性关系根据对图标中数据的观察和资料的查询,于是用时间序列分析模型分析,发现参观人数呈现周期性变化〔特别是在每星期的周六的人数相对最多〕等,我们用时间序列分解法求解时间序列因素包括长期趋势因素T,季节变动因素S,循环变动因素C,不规那么变动因素I;我们用乘法模式进行求解:…………………………………9其中,与有相同量纲,为季节指数,为循环指数,二者皆为比例数,为独立随机变量序列由图像和数据发现,该观测值有明显的长期趋势与季节变动由于季节周期变化,我们引入一个新的符号作为参观人数的平均值,消除了季节因素所造成的影响因为一周中周六的参观人数最大,因此我们定季节周期N=7,所以,求N=7的一次平均序列,……………………………10表示1-7期的这一周平均每天的参观人数,因为是连续7天的平均,所以中消除了季节因素同理有:……………………………11……………………………12将,,记作;由于随机影响总是围绕某一中间值上下波动,所以进过算数平均后,也可认为,随机性的因素也被消除了,而长期趋势和周期波动那么仍存在于移动平均值序列的中。
那么可知可表示如下:………………………………13季节性指数也可以进行如下转化:…………………………14然而当原始序列不呈现水平模式,假设以递增的形式模式时,移动平均值序列与原始序列会出现滞后现象,的值比的值要小,为了消除这种差距,需要移动的位置将向前移动=3期,这样就消除了序列对序列长期趋势的偏离将观察值除以移动平均数得到的比值只包含季节性和随机性如果某个比值>100%,意味着实际值比移动平均数要大下面表格为季节性观察值局部数据以及居中平均值和季节性指数的结果:表 4 世博会期间每日居中平均值、季节性相关数据周号季节序号观察值〔〕一次移动平均值M〔N=7〕剧中平均值〔〕1120.69222313.17414.8615.2097.7658.8915.2458.33612.0214.1684.91714.7715.2014.60101.142120.9815.2415.06139.34214.414.1616.3688.02316.314.6017.7291.98418.0415.0619.0494.73518.0116.3620.8486.43621.5517.7222.2396.94724.0319.0424.28103.23…… 18152.7547.1940.41130.52239.7245.8826.83107.84327.0843.5233.0381.98420.0740.4129.5367.97518.1736.8327.2766.64622.6533.0325.7587.97726.2529.5325.17104.2819136.9327.2725.69143.74229.0825.7556.67109.04323.0525.1726.9985.40423.7125.6928.1284.33525.0156.67624.9026.99734.1328.12根据表4可以了解到包含季节性和随机性的相关数据,从而做出〔〕随时间变化的图像。
图 4 季节性随时间变化的图像将季节性指数根据星期排列出来,如表5所示,即可看出星期性的规律表 5 季节性指数按照星期的统计星期一二三四五六日197.7658.3384.91101.14139.3488.02291.9894.7386.4396.94103.23137.1892.81386.9892.1100.8899.43106.22112.4494.39……1792.7987.4691.64107.37116.69130.52107.841881.9867.9766.6487.97104.28143.74109.041985.484.33合计1737.37 1848.69 1643.54 1719.57 1823.79 2134.33 1727.47 季节指数〔%〕96.52 97.30 91.31 95.53 101.32 118.57 95.97 很明显,跟实际情况相符,周六人数相对较多,而平日里的入园人数相对较少利用MA〔7〕得到的包含了长期趋势和循环变动两局部〔TC〕的数据图如图 5 所示:图 5 居中平均值随时间变化的图像在考虑到5月份的人数变动较大时,本着重今轻远的原那么,我们采用加权拟合直线方程法来求解。
对离差平方和进行加权,然后利用最小二乘法,使离差平方和到达最小,求出加权直线拟合方程由近及远的离差平方和的权重分别为;其中,说明对最近数据赋权值为1,而后由近及远按比例递减综合考虑直线拟合情况,在这里赋=0.97,设加权直线拟合方程为,那么离差平方和:…………………………15对进行求导,令其等于0,并计算:…………………16………………17用MATLAB编程解得:…………………………18即:……………………………19可以推测出其长期的趋势,如以下图所示:图 6参观人数长期趋势随时间的变化根据…………………………………20可求得循环因子如以下图所示:图 7循环指数C随时间变化的图像循环因子的值大于100的说明该季度参观人数高于所有季度的平均值,而小于100那么相反对于循环指数C拟合出随时间变化的图像,然后可以估算出每一天的循环指数C用分解法确定了季节指数、趋势值和循环指数之后,就可以进行预测现在,每一季度的季节指数S,循环因子C,由可得趋势值T,由………………………………21可以对后期的进行预测由于随机性无法直接进行预测,在这里我们假设由于8月低到9月初上海市受台风等恶劣天气影响,直接影响到参观人数的多少。
我们以9月1号的人数假设天气影响的随即因素程度以恢复性上升另外,7、8月份为暑假期,学生参观人数较多,而到九月份后学生参观人数减少;由于节假日〔国庆节等〕、闭幕前时期的人流量会较多在这,我们假设随机性I的值〔假设各个随机性的值相互不影响〕,下表所示:表6 随机性I的规定随机性天气影响节假日影响假期影响闭幕前I〔%〕1.51.21.3从9月11日至10月31日世博会结束的每日入园参观人数见附录7可知,世博会期间,全部入园参观人数到达7010.82万人次这和官方公布的预计7200万人次的数据的相对误差仅2.63%,小于5%的误差,考虑到诸多随机性的影响,此次的预测还是比拟精确可行的然后根据所预测的数据,来预估上海世博会门票收入由于世博期间指定日为17天,平日为167天,给每一种票的使用的人数附加权重,计算出上海世博会平均门票价格为148.1743元于是,上海世博会仅在门票收入上就到达了………………………22七、模型分析与优化7.1 模型分析缺点:模型一:由于忽略了节假日和活动对上海入境人数的影响,而实际上这些因素的影响也是很明显的,所以在拟合的时候很难到达误差极小的拟合模型二:对于天气以及人为等的不确定因素采用综合随机估计、取平均等方法,使得数据某些特殊时间点的预测数据不太符合实际。
平均门票受到诸多因素的影响,这里只考虑权重的附加做出来的平均门票价格是不够准确的优点:模型一:与以往单纯的直线模拟、灰色建模、时间序列模拟相比拟,这种时域组合模式经济意义明确、包含时问序列的信息量丰富,更能精确地反响旅游业开展的动态变化规律模型二:采用赋权拟合直线方程,〔5月份刚开园,人员波动较大〕较合理在时间序列分析模型中采用时间序列分解法进行计算,使星期性因素和长期预测趋势分解开来,更好的拟合出人数,从而更好的预测未来的入院人数的移动有效地防止的星期性因素所造成的误差,是模型更加准确7.2 模型优化模型一:根据实际入境人数的变化趋势图我们发现实际上其周期项并非规格地服从………………………………23所以可以参加时间因素来影响周期变化,即:……………………………24这样就减小了模型在拟合中的误差模型二:由于天气等不确定因素的影响,我们发现,某些特殊天气情况下的预测值与真实入园人数不符,天气的随机性指数只是按照大规模的天气变化确定优化时可以将近两个月来的天气根据往年或者是天气网站上公布的天气情况进行比对,确定每天的随机性指数I,这样可以更加精准的预测每天的入园人数,减少不确定因素所造成的误差。
八、参考文献[1]韩中庚,数学建模方法及其应用,北京:高等教育出版社,2023-6:21-23[2]苟小东 孙根年,上海市入境旅游本底趋势线的建立及其应用,陕西师范大学学报,第28卷第2期,2000-6[3]乔睿,世博影响下的上海入境旅游人数趋势预测,现代商贸工业,2023年第5期[4]戴光全 保继刚,昆明世博会效应的定量估算,地理科学,第27卷第3期,2007-6[5]上海市旅游局〔〕2010-9-10[6]上海市年鉴2007-2023,上海市统计局〔〕,2010-9-10[7]上海世博会官方网站〔〕,2010-9-10[8]谭赟,时间序列分析模型构建于MATLAB实现,科技资讯,2023年26期附录1:上海市入境人数本底趋势方程拟合程序clct=1:32;p=[540696,551259,546671,651110,602067,517414,517640,528780,576064,553110,530160,507210,484260,461311,504473,627675,599271,419753,414747,468685,510617,549291,490005,469343,499190,529030,558876,617274,641675,498374,541019,479208];fun=inline('b(1)+b(2)*t.^4+b(3)*t.^3+b(4)*t.^2+b(5)*t+b(6)*sin(b(7)*t+b(8))','b','t');ba=[608000,-3,30,100,3,570000,0.8,0.9]; [rj,resnorm]=lsqcurvefit(fun,ba,t,rj)d=rj(1)+rj(2)*t.^4+rj(3)*t.^3+rj(4)*t.^2+rj(5)*t+rj(6)*sin(rj(7)*t+rj(8));plot(t,p,t,d,'g--')t=33:37;d=rj(1)+rj(2)*t.^4+rj(3)*t.^3+rj(4)*t.^2+rj(5)*t+rj(6)*sin(rj(7)*t+rj(8))程序调试结果rj = 1.0e+005 * Columns 1 through 5 Columns 6 through 8 0.57862854678067 0.00001048499075 -0.00002762287066d = 1.0e+005 *附录2:%通过最小二乘法得到世博会参观人数的长期趋势方程x=1:133;y=data';c=0.97;k1=0;k2=0;k3=0;p=0;q=0;for i=1:133 k1=k1+c^(133-i); k2=k2+c^(133-i)*x(i); k3=k3+c^(133-i)*(x(i)^2); p=p+c^(133-i)*y(i); q=q+c^(133-i)*y(i)*x(i);enda=(k3*p-k2*q)/(k1*k3-k2^2)b=(k2*p-k1*q)/(k2^2-k1*k3)% a =49.4322% b = -0.1160附录3:%画出参观人数长期趋势随时间的变化x=1:133;y=data';y1=-0.1160*x+49.4322;plot(x,y,'k*',x,y,'k',x,y1,'r.')axis([0 133 0 60])xlabel('时间')ylabel('参观人数')legend('观测值','长期趋势')附录4:%对C值进行拟合x=4:130; c=c*100; A=polyfit(x,c,20) z=polyval(A,x); y0=poly2sym(A) plot(x,c,'k*',x,z,'r') %作出数据点和拟合曲线的图形 axis([4 130 20 160]) pp=polyval(A,time)附录5:上海市入境人数本底趋势模型有关数据附录6:预测9月11号后各天入园人数单位人数〔万人〕附录7:附录8:趋势值T的所有数据。