R语言实现金融数据的时间序列分析及建模
一 移动平均
移动平均能消除数据中的季节变动和不规则变动。若序列中存在周期变动,则通常以周期为移动平均项数。移动平均法可以通过数据显示出数据长期趋势的变动规律。
R可用filter()函数做移动平均。用法:filter(data,filter,sides)
1、简单移动平均
简单移动平均就是将n个观测值的平均数作为第(n
1)/2个的拟合值。当n为偶数时,需进行二次移动平均。简单移动平均假设序列长期趋势的斜率不变。
以我国1992到2014年的季度GDP数据为例。
data<-read.csv("gdpq.csv")
tdata<-ts(data,start=1992,freq=4)
m1<-filter(tdata,filter=c(rep(1/4,4)))
plot(tdata,xlab="时间",ylab="gdp")
lines(m1,col="red",cex=1.5)
代码运行结果如上图,红色表示拟合值,黑色表示真实值。
2、二次移动平均
二次移动平均即在一次移动平均的基础上再进行一次移动平均。一般两次移动平均的项数是一致的。二次移动平均假设序列长期趋势的斜率是随时间的变化而变化的。
二次移动平均长期趋势的拟合公式为:at=2M1t−M2t,其中M1t
表示第一次移动平均的拟合值,M2t表示二次移动平均的拟合值。
同样以上述数据为例,进行二次移动平均。代码如下:
plot(tdata,type="l",xlab="时间",ylab="季度GDP")
m2<-filter(m1,filter=c(rep(1/4,4)),sides=1)
lines(2*m1-m2,col="red",cex=2)
代码运行结果如上图所示,红色为二次移动的拟合值。
二 指数平滑
指数平滑的思想与移动平均是一样的,只是随着时间间隔的增加,加权的权重会呈指数衰减。它认为时间间隔越远的数据对当期数据的影响越小。R调用的函数为
HoltWinters(data, alpha=, beta=,
gamma=,seasonal=c(“additive”,”multiple”)…)
1、简单指数平滑
简单指数平滑假设序列中不存在季节变动和系统的趋势变化。模型公式为:
Xt=axt (1−a)Xt−1,0
a为平滑系数,Xt 为拟合值,xt 为真实值。一般指定X0=x1
,并且a越大,平滑程度越弱。R语言中有函数可以通过最小化一步预测误差平方和的方法估计出a。以2010年到2014年消费者新心指数为例,并预测2015年前6个月的值。代码如下:
>
data<-read.csv("consumer_cf.csv")
>
newdata<-ts(data[,2],start=c(2010,1),freq=12)
>
plot(newdata,type="o",cex.axis=1.5,cex.lab=1.5,
>
a<-HoltWinters(newdata,beta=F,gamma=F)
>
b<-HoltWinters(newdata,alpha=0.5,beta=F,gamma=F)
#估计参数a
> b
Holt-Winters exponential smoothing without trend and without
seasonal component.
Call:
HoltWinters(x = newdata, alpha = 0.5, beta = F, gamma = F)
Smoothing parameters:
Coefficients:
a 105.2898
>
pdata<-predict(a,6,prediction.interval = T)
> plot(a,pdata,type="o",xlab="时间",ylab="消费者信心指数")
代码运行结果如上所示。用HoltWinters()函数估计出来的a=0.78,且向后预测值为图中红色部分,黑色为真实值。这种预测方法预测出的值往往不够精确,因为它没有考虑序列中存在的其他变动。
2、Holt_Winters指数平滑
Holt_Winters指数平滑考虑了序列中存在的季节变动,这种方法对存在季节变动的经济数据有较好的拟合效果,可以用来进行向后预测。
加法季节模型:
Xt=a∗(xt−st)
(1−a)(at−1
bt−1
bt=β∗(Xt−Xt−1)
(1−β)bt−1
st=γ∗(xt−Xt)
(1−γ)st−p
其中p为季节变动的周期长度。其他含义同上。以上述的GDP数据为例,用HoltWinters指数平滑法分解GDP的水平,斜率及季节变动水平,并预测未来5年的值。代码如下:
> data<-read.csv("gdpq.csv")
>
tdata<-ts(data,start=1992,freq=4)
>
gdp.hw<-HoltWinters(tdata,seasonal="multi")
> plot(gdp.hw$fitted,type="o",main="分解图")
> plot(gdp.hw,type="o")
>
pdata<-predict(gdp.hw,n.ahead=4*5)
> pdata
2015 149826.6 168126.7 176640.3 192627.9
2016 161252.4 180708.2 189616.2 206523.1
2017 172678.2 193289.7 202592.1 220418.2
2018 184104.1 205871.2 215568.0 234313.4
2019 195529.9 218452.8 228543.8 248208.5
>
ts.plot(tdata,pdata,type="o",lty=1:2,col=c("red","black"))
代码中采用了加法模型。序列的分解图如上图所示。第二个图为模型对数据的拟合图,第三个图的虚线部分为后5年的预测。
相关文章
- 时间序列中的特征选择:在保持性能的同时加快预测速度
- 几行 Python 代码就可以提取数百个时间序列特征
- 从Transformer到扩散模型,一文了解基于序列建模的强化学习方法
- 【Manning新书】Python时间序列预测,手把手教你实战时序建模
- 时间序列 介绍(一)「建议收藏」
- acwing-170. 加成序列(迭代加深)「建议收藏」
- ACM 省赛E题 最长的递增子序列(动态规划+最长递增子序列)--------C语言—菜鸟级
- 使用 Temporal Fusion Transformer 进行时间序列预测
- 平稳时间序列建模
- 时间序列数据建模流程范例
- 【人体运动生成】开源 | 第一个能够从自然语言或音频序列生成人体动作序列的统一驱动引擎UDE,性能SOTA!
- R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列|附代码数据
- R语言用GARCH模型波动率建模和预测、回测风险价值 (VaR)分析股市收益率时间序列|附代码数据
- Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析|附代码数据
- ARMA-GARCH-COPULA模型和金融时间序列案例|附代码数据
- 【数字信号处理】序列傅里叶变换 ( 序列傅里叶变换定义详细分析 | 证明单位复指数序列正交完备性 | 序列存在傅里叶变换的性质 | 序列绝对可和 → 序列傅里叶变换一定存在 )
- 二叉搜索树的后序遍历序列算法详解编程语言
- 编排Redis集群正确位序列技术(redis集群位序列)
- Oracle Lag分析时间序列分析的利器(oracle lag同比)
- Redis自增序列之研究(redis 自增key)