SPSSPRO,让数据分析更简单,问卷调查类数据分析不再愁 产品介绍 帮助中心 客户端
微信登录
  • 产品简介

  • 我的数据

  • PRO绘图

  • 数据处理

    • 数据标签
    • 数据编码
    • 异常值处理
    • 无效样本处理
    • 生成变量
    • 样本均衡
    • 缩尾截尾处理
    • 时序数据滑窗转换
      • 1、作用
      • 2、输入输出描述
      • 3、案例示例
      • 4、案例数据
      • 5、案例操作
      • 6、输出结果分析
      • 7、注意事项
      • 8、模型理论
      • 9、参考文献
    • 虚拟变量转换
    • 特征筛选
    • 数据标准化
    • 缺失值处理
    • 数据降维
    • 数据变换
    • 数据降采样
  • 数据分析

时序数据滑窗转换

操作视频
SPSSPRO教程-时序数据滑窗转换

# 时序数据滑窗转换

# 1、作用

时序数据滑窗转换(sliding window transformation)用于将时间序列数据转为回归数据,简单地说,就是把一个单序列的数据变为X→Y的回归数据。如下图所示,步阶为2代表2个X(步阶多少就有多少个X),简单地说,就是用第1,2天的数据预测第3天,用第2,3天的数据预测第4天,以此类推。此种形式的数据进行回归就是时间序列预测问题。

时序预测的用途非常的广泛,如气象降雨,交通流量,金融,商业公司的销售经营,医学上的药物反应,各类系统的运作负荷,等等方面都可以见到相关的应用场景。

现实应用中的时序场景很多时候都是海量序列,例如影响销量的除了历史销量,还可能有价格,促销,业绩目标,天气等等,而这也是传统时间序列不能实现的,除此之外,传统时间序列模型性能开销大,数据利用率和泛化能力较差,由此时序数据滑窗转换+机器学习是较为主流的时间序列分析方法。

# 2、输入输出描述

输入:一项定量变量。
输出:根据步阶划分的自变量和因变量。

# 3、案例示例

案例:现有一时间序列,尝试步阶=7来划分自变量和因变量。

# 4、案例数据

时序数据滑窗转换案例数据

# 5、案例操作


Step1:在“数据处理”模块新建处理;
Step2:上传文件;
Step3:选择对应数据打开后进行预览,确认无误后点击开始处理;

Step4:选择【时序数据滑窗转换】;
Step5:查看对应的数据数据格式,【时序数据滑窗转换】要求变量为定量变量,且只有一项
Step6:确认步阶参数,即确定以前多少个数据来对未来一个数据建立回归模型;
Step7:点击【开始处理】,完成全部操作。

# 6、输出结果分析

由于销售量是属于日度数据,那么每7天存在一个周期,所以可以设置那个步阶为7。那么Y就是因变量,而它对应的自变量就是前7个数据,分别为X1-X7,空行是因为凑不够前7天的数据作为自变量。当自变量和因变量划分好了之后,可以去建立回归模型。


注意在机器学习进行建模前,一定不能勾选数据填补,否则上面的空行会被填充。
(或者也可以提前对空行数据进行缺失值处理--整行删除操作)

# 7、注意事项

  • 时序数据滑窗转换不支持对存在空值的变量进行处理,需要提前处理空值。

# 8、模型理论

在处理时间序列数据时,滑窗转换是一种常见且有效的预处理方法,能够提取数据中的局部模式和特征,有助于后续的分析和建模工作。

其分析步骤大致如下:

假设有一个时间序列数据:x1,x2,x3,...,xn。

如果设定窗口大小为w,滑动步长为s,则可以得到多个子序列:

  • 窗口1:x1,x2,..,xw
  • 窗口2:xs,xs+1,...,xs+w−1
  • 以此类推,直到序列末尾

需要注意的是,确定窗口大小和滑动步长时,需要考虑数据的周期性和特征的重要性。 ​

# 9、参考文献

[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.

建议反馈