数据处理

生成变量

案例数据

包含满意度题项、价格成本、日期和交互变量,用于演示均值、标准化、比率、交互项和日期差。

文件名dataprocess_generate_variable.xlsx
数据用途生成变量案例数据
变量说明sat_1 到 sat_4 可合成满意度均值,price 与 cost 可生成利润率,X 与 W 可生成交互项。

完整案例

1. 背景

研究者需要把多个题项合成为维度得分,并为回归或调节模型生成标准化变量、交互项和派生指标。

2. 理论与公式

生成变量通过列运算得到新字段,常见包括合成得分、标准化、归一化、比率、交互项和日期差。

均值合成

常用于把多个题项合成为维度分数。

Z 标准化

把变量转换为均值 0、标准差 1 的尺度。

归一化

把变量压缩到 0 到 1 区间。

交互项

调节模型中常用中心化后的乘积项。

3. 数据结构

sat_1 到 sat_4 可合成满意度均值,price 与 cost 可生成利润率,X 与 W 可生成交互项。

4. 操作步骤与截图

  1. 上传案例数据
  2. 进入生成变量
  3. 选择需要参与计算的变量
  4. 选择平均值、Z 标准化、相乘、相除或日期相减
  5. 输入新变量名并检查生成结果
生成变量操作界面示意
生成变量操作界面示意

5. 结果表格与核验

表1 生成变量结果示例
新变量来源变量计算方式用途
sat_meansat_1-sat_4平均值满意度维度得分
profit_rateprice、cost(price-cost)/price利润率指标
XW_centeredX、W中心化后相乘调节效应交互项

生成变量后建议用描述统计检查新变量范围和缺失情况。

重点查看新变量是否按预期生成,缺失值是否被正确处理,交互项是否与模型变量方向一致。

6. 辅助截图

当前方法暂无独立截图资源,后续会随 SPSSzero 页面截图补充。

7. 文字分析

通过生成变量,可将原始题项整理为维度分数或模型所需派生变量,为后续信效度、回归和调节分析提供标准化输入。

8. 剖析提醒

生成变量不改变原始字段;交互项通常建议在中心化后相乘,以降低多重共线性。