X11 季节调整技术介绍一、基本知识时间序列:在规则的、连续的时间间隔内,对同一指标进行测量所得到的数 据序列经济时间序列及特点:反映经济现象的时间序列称为经济时间序列经济时 间序列的重要特点包括:趋势、转折点和指标间的一致性趋势是指随着时间的 延续序列的数值是增还是降;转折点是指序列曲线走势在该点由上升(或下降) 变为下降(或上升),或者上升(或下降)的速度比此前更快(或更慢)指标 间的一致性是指不同行业(如制造业、零售业和建筑业)主要指标之间的比例关 系是否合理,或者同一指标月度、季度和年度数据是否协调等时间序列因素分解一个经济时间序列(以后简称时间序列)通常受多种 因素影响,一般地,我们可以把这些因素分解为趋势-循环因素、季节因素、不 规则因素、交易日和移动假日因素等趋势-循环因素反映序列的基本水平,较 平滑,包括长于一年的变动和循环,可能含转折点季节因素反映序列在不同年 份的相同季节(同一月,同一季)所呈现出的周期性变化,它存在的主要原因是 自然因素,另外还有行政或法律规定以及社会/文化/宗教的传统等因素(如固定 假日、假期的时间等)不规则因素在什么时间出现、影响程度和持续时间都不 可预测,存在不规则因素的原因可能是不合季节的天气/自然灾害、罢工、样本 误差和非样本误差等。
其它影响:一是交易日(一段时间内工作日或交易日的天 数);二是移动假日(定期出现的事件,但不一定出现在每年的同一时间)由 于交易日和移动假日影响是长期存在、可预测的、是与日历相关的影响因素,所 以常把它们和季节影响组合在一起考虑在下面的内容中,为了简化文字和书写方便,我们会用到一些符号,此处 略作说明:y =原始序列;t=趋势-循环因素;s=季节因素;1=不规则因素; A =调整后的序列t下标t表示时刻,t=l,2,3,・・・N, N表示数据个数如:Y表示原始序列在t时刻的对应数值t根据前面的介绍,Y可以分解为T,S和I的组合,这种组合通常有两种t t t t乘法模型 Y = S *T *I,A =T *I (各部分之间满足乘法关系)tttttt对任何时刻t满足:EI =1, Vari =0 2(常数),工S =1t t t+i最后的求和式中i从1取到L-1, L为季节周期长度(对于月度数据L=12, 季度数据L=4)加法模型 Y = S +T +1 , A =Y +1 (各部分之间满足加法关系)tttttt对任何时刻t满足:EI=O, VarI=O 2(常数),且工St+i =0, I的取值和L 的意义同上。
利用对数变换,可将乘法模型变为加法模型二、 季节调整: 季节调整就是将季节因素从原序列中除去季节调整通常有现成的程序:主要有X-11或X-12-ARIMA (美国商务部普查局),X-11-ARIMA (加拿大统计局), Decomp,SABL,STAMP,TRAMO/SEATS (西班牙银行)X-12 特性:估计趋势和季节因素,处理野值、趋势和季节估计中许多可选 的过滤,得到判断结果X-11/X-12 的演变过程:+普查局模型I (1955年)一ShiskinX-0,X-1,X-2,X-3 等《XT1 (1965 年)一美国普查局:Shiskin,Young 和 Musgrave+XT1-ARIMA(1980,1988,2000)—加拿大统计局:DagumX-12-ARIMA(1990-????)—美国普查局:Findley,Monsell,Bell,0ttoX-11 模块的主要作用:一是估计趋势和季节因素,二是用自动过滤选择模 式选择季节和趋势过滤(对序列结尾有专门的过滤),三是调整异常值(功能较 强)X-11 方法的基本步骤:第一步,估计趋势;第二步,消除序列中的趋势; 第三步,估计季节因素;重复 1一3 步,然后估计最终的趋势因素和不规则因素。
X-11 和 X-12 用移动平均过滤的方法来平滑数据例如:(1)2X12过滤XXX XXX XXX XX XXX X X X XX XX XX XJan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec Jan(2)重写为季度数据,2X4趋势过滤:1989.3+1989.4+1990.1+1990.2+ 1989.4+1990.1 +1990.2 + 1990.38( 3) 3X 3 过滤1988.1+1989.1+1990.1+1989.1+1990.1+1991.1+ 1990.1 + 1991.1+ 1992.19权重:0.111 0.222 0.333 0.222 0.111(4) 3X5 过滤1988.1+1989.1+1990.1+1991.1+1992.11989.1+1990.1+1991.1+1992.1+1993.11990.1+1991.1+1992.1+1993.1+1994.1权重:0.067 0.133 0.2 0.2 0.2 0.133 0.067X-11 用的过滤:•趋势过滤:(1) 2X12 (或2X4)初步的趋势估计;(2)最终趋势估计的 Handerson 过滤。
•季节过滤(自动):(1) 3X3初步的季节估计;(2)3X3, 3X5或3X9的最终季节估计注意:如果我们指定一个过滤,X-11对每个过程都用这个过滤最终判断的自动季节过滤选择:全程移动季节比率(MSR)被用作选择最终季节过滤;MSR是个信噪比(I/S)季节过滤的选择:MSRW2.5用3X33.5VMSRW5.5用3X5MSR>6.5用3X9如果MSR在灰色区域,X-12从序列结尾去掉一年,然后重新计算MSR;如 果MSR仍然在灰色区域,重复以上做法(最多去掉五年),直至【JMSR不在灰色区 域中;如果上述做法无效,则用 3X 5如何选择季节过滤:多数情况选择3X5;当季节模式迅速变化时,用3X3; 当季节模式不是正在变化或不规则因素影响很大时,用3X9;当极端值影响平 均水平时,多用 3X 5消除极端值的强大功能:(1)估计不规则因 素的标准差;(2)比较标准差,去掉大的不规则 点的影响3)默认设置:不规则点小于标准差 1.5倍时,不被替代;不规则点大于标准差 2.5 倍 时,被完全替代;在1.5 倍和 2.5倍之间时,被部 分替代什么时候值被替代呢?一般来看,替代值来自于最近的 2 个预测点的平 均值,下面2 个最近的点权重为 1;如果在最近的年没有足够的值,用另外的权 重为 1 的点。
例:美国中西部总的房屋开工数:FeixuaiyHeMk Ted HDUTig EUrU-MjDflDj韩彳■ *DBOD.43QJ®.Q3D\ | | | , " , 、 | | | | | |E 冲 硏 y 阿 展 I IM HP? W3 Wl ™ w■ ■■ gq皿d 虫 Futa4 F^jiAwwi s iwul哪些数据是用户和媒体最关注的?序列结尾的数据和那些通过不对称过滤 产生的数据八十年代的研究表明,如果要预测序列数值的趋势,我们可以在序列的结 尾用对称过滤,并减少调整次数如果我们关注序列最开始的点,我们也可以向 前预测dWTH■甲 PtnaracH Repot — F4ffl Inwne *11BF TamOriginal Senes, OutHer— Adjusted Original Series, and TrendOriginal Series and TrendQu#ierly FtWKSiaJ Repcn — Nw hcome Alter TaxwIJ-kd W K■:6000 j 4000: 2O0OS30000 ■{ 36OS>: 26CWj 34OCD ; 22DX« ji SflOOCi: wm; 1GDXI -14DOO ■™2DX« : Ttiena nst 也吋ng 收 M啦Tend. *ejusa何 fcr I9§e ouJiei1)野值点2)暂时变化的野值3)水平移动4)斜线上升如右图。
在美国季度金融报告中,X-12-ARIMA中时间序列模型的应用:(1) 扩展序列,进行预测;(2)检查和 调整异常值,提高预测和季节调整的 结果;( 3)检查和直接估计交易日 移动假日和用户定义的影响因素在X-12-ARIMA中野值的影响类型可以得 到:税后净收入在1992年一季度有一个大的野值,这是由于税收政策的变化我们 可以用回归方法调整原始序列我们注意到调整了野值的序列,趋势轨迹更好回归的其他作用:调整交易日、移动假日(复活节、劳动节、感恩节)、 用户定义的回归因子以复活节为例,W是t月中w的天数,如果复活节在4月3日,我们设复t活节影响 10 天,即 Easter[10] (w=10),则 W /w=8/10, W /w=2/10,所有其3 月 4 月它的月,W/w=O做类似估计时,你也可以自己定义回归量,如斋月,中国新年以乘法模型为例(Y=T*S*I),介绍XII做季节调整的基本步骤如下:第 1 步. 初步估计=24^+存严+存+入+存二+占抵1.1 用居中的 12 次移动平均作为趋势因素的第一次估计因为季节因素尚未剔除,所以采用相对较粗的移动平均重写季度序列:以1990年1季度数据,用2X4趋势过滤为例:1989.3+1989.4+1990.1+1990.2+1989.4+1990.1+1990.2+1990.31.2 原始序列和趋势因素估计的比率是除去序列趋势因素的第一次估计, 称做季度一不规则因素,或SI比率。
1.3 从复杂的运算规则中替换异常值a. 估计季度因素b. 从SI中除去季节因素后,估计不规则因素c. 计算移动标准偏差d. 根据标准偏差函数计算权重e. 根据自身值和同一时期内离它最近的4 个值,调整该异常 值1.4a 一个3X3过滤,5个时间段的移动平均是计算每一点,得到一个初步的 季节因素估计一如) 2 3 2 1忌=-9 + -叽 + § 冏 + § % + § %粗的无偏的季节因素1.4b 将 1.4a 经过定中心,得到Mi)〔血⑴ ]八⑴ ]川1) ] A(l)-^ + -^ + K+-^ + _^1.5 得到初步的季节调整序列:铲=工皤耳小卫黑.2.1 用长度为 2H+1 的 Henderson 过滤来计算趋势, H值由数据决定自动 Henderson 趋势过滤选择:根据信噪比标注 I/C(C 代表趋势)X-12-ARIMA选择标准:当I/C<1.0时,用9次过滤;当1.0WI/C<3.5,用13次过滤;当3.5WI/C时,用23次过滤A' 2.2计算最后的季节一不规则因素比率:2.3 从同样的复杂运算规则中替换异常值爲=话 ^4-36 + 肓冏-24 + 话隅_12 + — SIt1SI壬{ +丄逍2.4a通过3X5季节移动平均算出最后的季节因素2.4b 通过收敛计算最后的无偏季节因素124A(2) a(2)仏+护h+k2.5 第 2 步季节调整后的序列:A込谗)尸爲〔2.6第2步得到的季节调整序列与2.1中Henderson趋势的比率为 不规则因素2.7 根据序列中的变量确定异常值的权重 Wt2.8 根据 2.7,做初步的异常值调整3.1根据数据确定的H计算最后的趋势(Henderson趋势)T 卩):(2)7(3)Tt - 最后的估计分解为:至此,季节调整完毕。