时序数据滑窗转换
# 时序数据滑窗转换
# 1、作用
时序数据滑窗转换(sliding window transformation)用于将时间序列数据转为回归数据,简单地说,就是把一个单序列的数据变为
时序预测的用途非常的广泛,如气象降雨,交通流量,金融,商业公司的销售经营,医学上的药物反应,各类系统的运作负荷,等等方面都可以见到相关的应用场景。
现实应用中的时序场景很多时候都是海量序列,例如影响销量的除了历史销量,还可能有价格,促销,业绩目标,天气等等,而这也是传统时间序列不能实现的,除此之外,传统时间序列模型性能开销大,数据利用率和泛化能力较差,由此时序数据滑窗转换+机器学习是较为主流的时间序列分析方法。
# 2、输入输出描述
输入:一项定量变量。
输出:根据步阶划分的自变量和因变量。
# 3、案例示例
案例:现有一时间序列,尝试步阶=7来划分自变量和因变量。
# 4、案例数据
时序数据滑窗转换案例数据
# 5、案例操作
Step1:在“数据处理”模块新建处理;
Step2:上传文件;
Step3:选择对应数据打开后进行预览,确认无误后点击开始处理;
Step4:选择【时序数据滑窗转换】;
Step5:查看对应的数据数据格式,【时序数据滑窗转换】要求变量为定量变量,且只有一项
Step6:确认步阶参数,即确定以前多少个数据来对未来一个数据建立回归模型;
Step7:点击【开始处理】,完成全部操作。
# 6、输出结果分析
由于销售量是属于日度数据,那么每7天存在一个周期,所以可以设置那个步阶为7。那么Y就是因变量,而它对应的自变量就是前7个数据,分别为X1-X7,空行是因为凑不够前7天的数据作为自变量。当自变量和因变量划分好了之后,可以去建立回归模型。
注意在机器学习进行建模前,一定不能勾选数据填补,否则上面的空行会被填充。
(或者也可以提前对空行数据进行缺失值处理--整行删除操作)
# 7、注意事项
- 时序数据滑窗转换不支持对存在空值的变量进行处理,需要提前处理空值。
# 8、模型理论
在处理时间序列数据时,滑窗转换是一种常见且有效的预处理方法,能够提取数据中的局部模式和特征,有助于后续的分析和建模工作。
其分析步骤大致如下:
假设有一个时间序列数据:
如果设定窗口大小为
- 窗口1:
- 窗口2:
- 以此类推,直到序列末尾
需要注意的是,确定窗口大小和滑动步长时,需要考虑数据的周期性和特征的重要性。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.