时间序列的预处理
拿到一个观察序列后,首先要对它的平稳性和纯随机性进行检验,这两个重要的检验称为序列的预处理。根据检验的结果可以将序列分为不同的类型,对不同的类型我们采用不同的分析方法。
2.1 平稳性检验
特征统计量:平稳性是某些时间序列具有的一种统计特征。要描述清楚这个特征,我们必须借助如下统计工具:
- 概率分布
- 一个更简单的、更实用的描述时间序列统计特征的方法是研究该序列的低阶矩,特别是均值、方差、自协方差和自相关系数,它们也被称之为特征统计量。
尽管这些特征统计量不能描述随机序列全部的统计性质,但由于它们概率意义明显,易于计算,而且往往能代表随机序列的主要概率特征,所以我们对时间序列进行分析,主要就是通过分析这些特征量的统计特性,推断出随机序列的性质。
1.均值
2.方差
3.自协方差函数(autocovariance function)和自相关系数(autocorrelation coefficients)
通常的协方差函数和自相关系数度量的是两个不同事件彼此之间的相互影响程度,而协方差函数和自相关系数度量的是同一事件在两个不同时期之间的相关程度,形象地讲就是度量自己过去的行为对自己现在的影响。
平稳时间序列的定义
根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列
一、严平稳(strictly stationary)
就是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随着时间的推移而发生变化时,该序列才被认为平稳。随机变量族的统计性质由它们的联合概率分布族决定
严平稳时间序列通过只有理论意义,在实践中更多的是条件比较宽松的平稳时间序列。
二、宽平稳(week stationary)
使用序列额特征统计量来定义一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶平稳(二阶),就能保证序列的主要性质近似稳定。
宽平稳也称为若平稳或二阶平稳(second-order stationary)
显然,严平稳比宽平稳条件严格。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同;而宽平稳只要求序列二阶平稳,对于高于二阶的矩没有任何要求。所以通常情况下,严平稳序列也满足宽平稳条件,而宽平稳序列不能反推平稳成立。
但这不是绝对的,两种情况都有特例。
比如服从可惜柯西分布的严平稳序列就不是宽平稳序列,因为它不存在一、二阶矩,所以无法验证它二阶平稳。严格地讲,只有存在二阶矩的严平稳序列才能保证它一定也是宽平稳序列。
在实际应用中,研究中最多的是宽平稳随机序列,以后见到平稳随机序列,如果不加特殊注明,指的都是宽平稳随机序列。如果序列不满足平稳条件,就称为非平稳序列。
平稳时间序列的统计性质
一、常数均值
二、自相关系数的三个性质:
- 规范性
- 对称性
- 非负性
一个平稳时间序列一定唯一决定了它的自相关函数,但一个相关函数未必唯一对应着一个平稳时间序列。
时间序列分析方法作为数理统计学的一个专业分支,它遵循数数理统计学的基本原理,都是利用样本信息来推测总体信息。
根据数理统计学 常识,显然要分析的随机变量越少越好,而每个变量获得样本信息越多越好。随机变量越少,分析的过程就越简单,而样本容量越大,分析的结果就越可靠。
平稳性的检验
一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。
图检验是一种操作简便,运用广泛的平稳性判别方法,它的缺点是判别结论带有很强的主观色彩。所以最好能用统计检验的方法加以辅助判断。目前最常用的平稳性检验方法是单位根检验(