首页 生活指南 正文内容

关键词:动态线性模型时间序列Bayes预测(李伟华徐宗)

阿立指南 生活指南 2022-09-11 10:09:08 424 0

抽象的:

关键词:

关于作者:

摘要:贝叶斯预测与动态模型是 70 年代发展起来的一套新的时间序列分析方法,其中单变量贝叶斯正态动态线性模型 ( ) 在实际应用中最为常见和重要。在应用中,通常假设观察到的误差方差是一个未知常数,其值由建模开始时的估计给出。一般的做法是通过专家经验给出具体问题,没有统一有效的方法。针对这种情况,本文提出了一种简单易用的观测误差方差值估计方法。同时,通过数值实验证明了新方法的有效性,为该类型的应用带来了便利。

关键词:动态线性模型时间序列贝叶斯预测

作者简介:李卫华、徐宗本、范金成,西安交通大学理学院信息与系统科学研究所,陕西西安

介绍

时序数据是按时间顺序排列、随时间变化、相互关联的数据序列。它广泛存在于工程、经济学等各个领域,如某只股票的日交易量、季度经济总量、某地每月用电量等。随着计算机技术的发展,尤其是著名统计学家 Box He 在 1968 年开发了一套用于随机时间序列的模型识别、参数估计和诊断测试的经典建模方法 [1] 以来,时间序列分析的发展已经很快,在气象、天文、电力、生物、经济金融等各个领域得到了广泛的应用,并日益显示出强大的生命力和重要性,

该过程的贝叶斯预测最早是由英国统计学家 PJ 和 CF 在 1976 年在皇家统计学会因需要预测意外事件而提出的[2]。很少有专家学者从事这方面的研究,并建立了较为完整的理论和应用体系[3-5]。该方法已成功应用于国际汇率预测[6]、网络安全[7]、大坝数据监测[8]等领域,日益展现出广阔的应用前景。

贝叶斯预测是指基于贝叶斯统计原理的预测。它与传统预测的区别在于在统计推断中使用先验分布。尽管像其他预测方法一样需要建模,但贝叶斯预测通常基于以下形式的动态线性模型:

时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf_序列保守性分析

与传统的Box-时间序列分析方法相比,贝叶斯预测有很多优点:一是不需要数据平稳性的假设;其次,它不仅依赖于客观的数据和模型,而且重视专家的经验,这体现在最初的先验信息上。这样,当模型不能反映突发事件时,利用预测者的主观意见和模型的监测机制对模型进行干预和监测,以提高预测的准确性。

尤其是当

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

是一维数据,并且

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

,

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

当都服从正态分布时,公式(1)和公式(2))是一元贝叶斯正态动态线性模型(),是应用中最常见也是最重要的一类模型,其基础理论比较完善[3],应用范围也很广,在应用中,通常假设观测误差方差是一个未知常数,其值是在建模之初通过估计给出的。 ,笔者注意到一般做法是由专家在不同应用问题上的主观经验给出的,并没有统一有效的方法,针对这种情况,笔者利用时序样本信息给出了一个简单而有效的方法。易于使用的估计方法。数值实验说明了作者s 该方法是有效的,为更好地应用该类解决实际问题提供了方便。

一、单变量贝叶斯动态线性模型

(一)贝叶斯预测的基本原理

贝叶斯预测包括许多传统的预测方法,如线性回归、指数平滑和线性时间序列模型,它们是贝叶斯动态模型和预测的特例。与传统的预测方法不同[3],贝叶斯预测不仅利用过去的数据信息,还包括人为因素,人负责预测并提供信息,根据异常管理原则进行预测是贝叶斯的基本原则之一预测。. 它利用客观和主观信息的结合进行预测,因此可以处理异常情况的发生。所谓异常情况或异常情况有两种方式:第一种情况是基于对未来事件的了解,并且可以预见异常事件的发生。比如有信息说今年年底要建新厂,所以用电需求会增加,用电需求增加的问题可以预料,预报员要及早介入模型;第二种情况是意料之外的突然变化当一个事件发生时,针对这种情况使用监控的方法来处理模型。图1(图略,见原文,下同)是贝叶斯预测系统按照异常管理原理运行的示意图。并且电力需求增加的问题是可以预料的,预报员必须及早干预模型;第二种情况是意料之外的突然变化当一个事件发生时,针对这种情况使用监控的方法来处理模型。图1(图略,见原文,下同)是贝叶斯预测系统按照异常管理原理运行的示意图。并且电力需求增加的问题是可以预料的,预报员必须及早干预模型;第二种情况是意料之外的突然变化当一个事件发生时,针对这种情况使用监控的方法来处理模型。图1(图略,见原文,下同)是贝叶斯预测系统按照异常管理原理运行的示意图。

贝叶斯预测的另一个基本原理是建立动态模型,将预测分布视为条件概率分布。预测器基于先验信息。

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

, 找到预测分布

序列保守性分析_时间序列分析:单变量和多变量方法 pdf_时间序列分析单变量和多变量方法 pdf

,并利用贝叶斯公式得到后验信息,不断修改先验信息,从而得到所需的预测值。图2(图略)是贝叶斯预测递归算法的框图,其中N指的是时间序列数据的样本量。

(二)动态线性模型的相关结果

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

定理[3]的一步预测分布、后验分布和k步前向预测分布为:

1.t-1 时刻的后验分布

时间序列分析:单变量和多变量方法 pdf_时间序列分析单变量和多变量方法 pdf_序列保守性分析

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

(三)建模方法

一般来说,商业和经济中遇到的大多数问题都可以通过应用趋势、季节性、回归分量模型及其组合来模拟。在模拟时间序列时,首先考虑趋势和季节性成分。如果只进行回顾性分析(根据当前信息分析过去的信息,例如时间序列平滑),那么这两类组件模型就足以解决问题。可以对趋势和季节性现象进行估计,但仅限于短期预测。当时间序列的未来变化无法通过趋势/季节来描述时,可以添加回归组件模型,使中短期预测更加可靠。使用几种不同的组件模型来模拟时间序列的不同特征,

让多项式趋势、季节和回归分量模型为:

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

二、先验信息的选择

在实际应用中,先估计先验信息的值,它们包括状态向量初始先验均值向量

时间序列分析:单变量和多变量方法 pdf_序列保守性分析_时间序列分析单变量和多变量方法 pdf

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

, 方差矩阵

序列保守性分析_时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf

和状态误差矩阵

时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf_序列保守性分析

, 本节将给出观测误差方差 V 的估计方法。

(一)

时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf_序列保守性分析

,

时间序列分析单变量和多变量方法 pdf_时间序列分析:单变量和多变量方法 pdf_序列保守性分析

估计

关于

时间序列分析:单变量和多变量方法 pdf_序列保守性分析_时间序列分析单变量和多变量方法 pdf

,

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

估计的最佳实践是使用参考分析,这是一种有效的方法,可以在没有进一步信息的情况下从模糊或无信息的初始先验中获得适当的后验,并将此适当的后验用作初始先验。测试时间序列分析:单变量和多变量方法 pdf,递归。这个初始的适当的信息先验信息对于此时的建模特别有益。从参考先验获得适当后验所需的最小观察次数是模型中未知参数的数量。当观测误差的方差已经估计出来时,模型中未知参数的数量等于状态向量的维数。例如,对于线性趋势和季度周期的组合模型,未知参数的个数等于 5,所以模型从时间序列的第六个数据开始递归。下面给出的是观察误差方差为未知常数时参考分析计算的观察误差方差

序列保守性分析_时间序列分析:单变量和多变量方法 pdf_时间序列分析单变量和多变量方法 pdf

,

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

一个步骤:

时间序列分析:单变量和多变量方法 pdf_时间序列分析单变量和多变量方法 pdf_序列保守性分析

(二)观测误差方差V值的估计

时间序列分析:单变量和多变量方法 pdf_序列保守性分析_时间序列分析单变量和多变量方法 pdf

得到观测误差方差值V。如果需要,可以重复这个过程,详细算法流程如图3所示(图略)。

图 3 的令人满意的情况可以认为是时间序列数据的预测在相同的置信水平下具有较小的置信区间。可见,上述方法简单易用。在第三节中,将给出数值实验来证明其有效性。需要注意的是,该方法的隐含条件是时间序列数据的样本量 N 与状态向量的维度 n 之差必须大于 1。

(三)关于状态误差方差矩阵的估计

序列保守性分析_时间序列分析:单变量和多变量方法 pdf_时间序列分析单变量和多变量方法 pdf

三、数值测试

为了说明估计方法的有效性,分析以下产品的季度销售数据。该数据选自参考文献[1],不同之处在于数据单位发生了变化。

产品的季度销售数据

时间序列分析单变量和多变量方法 pdf_序列保守性分析_时间序列分析:单变量和多变量方法 pdf

这里,时间序列数据样本量为48(按列排序),每列代表一年四个季度的数据,共12年。建模基于趋势+季节性模型,假设观察到的误差方差是未知常数,仅使用一个参考分析来对其进行估计。图 4(图略)是时间序列数据的一步前向预测和 90% 置信区间;图5(图略)为时间序列数据一步前向预测的标准误;图 6(图略)表示时间序列数据预测 24 步前瞻和前瞻预测的 98% 置信区间。由于使用了参考分析,因此递归从第六个数据开始。从图4可以看出,单步前向预测准确率较高;在图 5 中时间序列分析:单变量和多变量方法 pdf,等于 30、43 和 45 个点的预测误差较大,超过 90% 置信区间 [-1.645,1.645],这是因为时间序列数据发生了变化在这些点上显着,并且封闭模型没有预测到变化。在这种情况下,需要对模型进行分析。干预,这超出了本文的范围;图 6 显示,前瞻预测的置信区间随着预测步数的增加而增加,说明预测精度在下降,因为所选模型本身适用于时间序列数据的短期预测。这是因为时间序列数据在这些点发生了显着变化,而封闭模型并未预测到这种变化。在这种情况下,需要对模型进行分析。干预,这超出了本文的范围;图 6 显示,前瞻预测的置信区间随着预测步数的增加而增加,说明预测精度在下降,因为所选模型本身适用于时间序列数据的短期预测。这是因为时间序列数据在这些点发生了显着变化,而封闭模型并未预测到这种变化。在这种情况下,需要对模型进行分析。干预,这超出了本文的范围;图 6 显示,前瞻预测的置信区间随着预测步数的增加而增加,说明预测精度在下降,因为所选模型本身适用于时间序列数据的短期预测。

四、结论

作者介绍了公式(3)和公式(4)),理论上很自然,结合参考分析给出了一种简单易用的观测误差方差值估计方法。数值测试结果表明,所使用的方法是有效的,在实际应用中会给一大类问题带来方便。

需要指出的是,本文的数值实验是在封闭模型框架下进行的,可能会影响部分数据点的预测精度,因为贝叶斯的预测精度取决于模型、数据和人的主观判断。在封闭模型中,突发事件发生时预测精度往往较差,需要对模型进行干预和监控以体现贝叶斯预测的优越性,这就需要对数据的来源和背景有深入的了解。明白这一点在实际应用中需要强调。

最后需要说明的是,虽然这个方法是针对一元正态动态线性模型提出的,但是该方法的思想可以用来估计多元正态动态线性模型观测的方差误差矩阵。当然,情况要复杂得多。这将在以后讨论。

参考:

1(US)Box GEP,(UK) G M.Times : and [m].2nd edn.San :-Day,1976.

2(US) West M,(UK) P J. and [M].New York:-,1989,1-99.

3 张晓玲、刘福生、张成金等。贝叶斯动态模型及其预测[M].济南:山东科学技术出版社,1992.

4 刁伯庆,张晓玲,双随机动态模型与预测[J].山东矿业大学学报, 1990, 3(24):46-49.

5West M, P J. and [M].New York:-,1997.

6(US) JM,West M. time :new to rate data[J].The ,1987,36:275-281.

7 钟睒睒、何明德、吴梅。基于分布式入侵检测系统的贝叶斯动态模型研究[J].计算机工程与应用, 2002, 21(167):1-3.

8王书玉、刘国华、刘立军、李富强。大坝监测与分析中的贝叶斯动力学模型[J].水利工程学报, 1998, (7):1-5.

欢迎 发表评论:

文章目录
    搜索