进阶方法

分层回归分析

案例数据

300 名员工 × 6 列。包含人口学控制变量(年龄 / 工龄 / 学历层次)、两个核心理论变量(工作投入度、组织支持感)以及因变量绩效得分(0-100),用于演示分 3 层进入模型的分层回归(控制层 → 主效应层 → 交互项层)。

文件名hierarchical_regression.xlsx
样本量300 行
变量数6 列(3 控制变量 + 2 主效应 + 1 因变量)
数据用途组织行为研究:在控制人口学变量后,工作投入度与组织支持感是否仍能显著解释员工绩效,以及二者是否存在交互调节。
变量说明年龄(22-60 岁)、工龄(年)、学历层次(1-5 序数)、工作投入度(Likert 1-5)、组织支持感(Likert 1-5)、绩效得分(0-100 连续)。

完整案例

1. 背景

某企业 HR 部门希望搞清楚 "员工绩效到底受哪些因素影响"。常见的误区是:把人口学变量(年龄、工龄、学历)和心理变量(工作投入度、组织支持感)一起塞进回归方程,谁显著就汇报谁。这样做无法区分"基础解释力 vs 增量解释力"。本案例采用分层回归(Hierarchical Regression),按照理论假设分 3 层逐步加入变量并观察 R² 增量:①第 1 层放入人口学控制变量,估计"基础人口学解释力";②第 2 层加入工作投入度与组织支持感主效应,看核心变量是否带来显著的 ΔR²;③第 3 层加入工作投入度 × 组织支持感交互项,检验二者是否存在调节关系。每层用 F 变化检验判断新增变量的统计显著性。

2. 理论与公式

分层回归把多个自变量按理论顺序分组(Block)依次进入 OLS 模型,每加入一组就估计一个嵌套模型,并比较相邻两个模型的 R² 增量是否显著。

嵌套模型

C 为控制变量、X 为主效应、X₁·X₂ 为交互项。

R² 增量

反映新加入这一层变量带来的额外解释力。

F 变化检验

q=本层新增变量数,k=新模型总变量数;F 显著则 ΔR² 显著。

3. 数据结构

每行 1 位员工,6 列变量按理论角色分为 3 层:

层次变量名类型说明
第 1 层(控制变量)年龄连续 22-60员工实际年龄,控制生命周期效应
工龄连续 0-35 年在职年数,控制经验积累
学历层次序数 1-51=高中及以下,5=博士及以上
第 2 层(主效应)工作投入度Likert 1-5在工作中的精力投入与专注度(中心化处理)
组织支持感Likert 1-5感受到的组织资源和情感支持(中心化处理)
第 3 层(交互项)投入 × 支持连续两个中心化主效应的乘积,检验调节作用
因变量 Y绩效得分连续 30-100上一年度综合绩效评分

交互项需要先把主效应变量去均值(中心化)再相乘,避免与原始量纲产生严重多重共线性。

4. 操作步骤

  1. 登录 SPSSzero,进入 工作台 → 上传 hierarchical_regression.xlsx
  2. 左侧方法栏 → 进阶方法 → 点击 分层回归分析
  3. 绩效得分 拖入 因变量 Y
  4. 第 1 层(控制变量):把 年龄工龄学历层次 拖入 Block 1
  5. 第 2 层(主效应):点击 新增层,把 工作投入度组织支持感 拖入 Block 2(系统会自动中心化)
  6. 第 3 层(交互项):再次 新增层,把 工作投入度 × 组织支持感 拖入 Block 3
  7. 点击 开始分析,系统会输出 3 个嵌套模型的系数表、R² 比较表及 F 变化检验

5. 结果表格与结果阅读

结果区按 3 层嵌套结构输出系数对比表和 R² 增量检验表。下面展示 2 张紧凑三线表:

表1 三层模型回归系数对比(N=300,因变量=绩效得分)
层 / 变量模型1 B (SE)模型2 B (SE)模型3 B (SE)
常数项49.589 (7.989)***49.478 (5.228)***48.936 (4.853)***
第 1 层 控制变量
 年龄0.152 (0.318)0.087 (0.208)0.107 (0.193)
 工龄0.142 (0.320)0.105 (0.209)0.063 (0.194)
 学历层次−0.874 (0.581)0.059 (0.382)0.202 (0.355)
第 2 层 主效应
 工作投入度(中心化)7.846 (0.438)***7.604 (0.408)***
 组织支持感(中心化)3.987 (0.373)***4.075 (0.347)***
第 3 层 交互
 投入 × 支持3.303 (0.475)***
0.0720.6080.664
调整 R²0.0620.6020.657
* p<0.05 ** p<0.01 *** p<0.001;表中为非标准化回归系数 B 及标准误 SE

关键观察:①第 1 层人口学变量整体仅解释 7.2% 方差,单个系数均不显著 → 单靠人口学难以预测绩效;②第 2 层加入心理变量后 R² 跃升至 60.8%,工作投入与组织支持均高度显著;③第 3 层交互项显著(B=3.303, p<0.001)→ 工作投入对绩效的影响会随组织支持水平变化。

表2 R² 增量与 F 变化检验
模型进入变量ΔR²F 变化dfp
模型 1年龄、工龄、学历层次0.0727.597(3, 296)<0.001
模型 2+ 工作投入度、组织支持感0.6080.537201.411(2, 294)<0.001
模型 3+ 投入 × 支持0.6640.05648.311(1, 293)<0.001
ΔR² = 当前模型 R² − 上一层模型 R²;F 变化检验本层新增变量是否带来显著的解释力提升

三层增量都显著,但贡献量级差距极大:主效应层带来 53.7 个百分点的解释力跃升(这是核心结论),交互层再补 5.6 个百分点。即"是否进入"和"多大程度上塑造"两个问题层层分明。

7. 文字分析

对员工绩效影响因素的 3 层分层回归综合分析:

  • 第 1 层(控制变量):年龄、工龄、学历层次三个人口学变量整体显著(F=7.60, p<0.001),但 R² 仅 0.072,调整 R² 0.062,且没有任何单个系数显著(所有 p>0.13)—— 说明人口学特征不是绩效的主要预测源,只是研究中需要控制的背景变量;
  • 第 2 层(主效应):加入工作投入度和组织支持感后,R² 从 0.072 飞跃到 0.608(ΔR²=0.537, F变化=201.41, p<0.001)—— 这是本研究最关键的发现,两个心理变量贡献了 53.7 个百分点的额外解释力。其中工作投入度每提升 1 分对应绩效提升 7.85 分,组织支持感每提升 1 分对应绩效提升 3.99 分,工作投入度的边际贡献接近组织支持感的 2 倍
  • 第 3 层(交互项):投入 × 支持交互项显著(B=3.30, p<0.001),ΔR²=0.056(F变化=48.31, p<0.001)—— 表明二者存在显著的正向协同效应:在高组织支持下,工作投入对绩效的提升幅度比低支持下更大("投入×支持"系数为正即"放大"效应);
  • 整体解释力:最终模型解释了 66.4% 的绩效方差(调整 R²=0.657),属于社会科学研究中的强解释力水平。

结论与业务建议:①不要把绩效差异简单归因于年龄/工龄/学历,这些变量解释力很弱;②员工绩效的核心驱动是心理投入和组织支持,且工作投入是更主导的杠杆;③组织支持感不仅有独立主效应,还能放大员工投入的回报 —— 这意味着 HR 应当同时推动"激发员工投入"与"提升组织支持"两条线,二者并非可替代关系而是相互增强;④对管理者而言,重点投资方向依次为:员工敬业度项目 > 组织支持/资源保障 > 人口结构层面的优化。

8. 剖析提醒

分层顺序必须由理论假设决定,控制变量永远在最前、核心变量居中、交互项最后;不要为了让 ΔR² 更"好看"而随意调整进入顺序,那是数据探查(exploratory),不能写成验证性结论。交互项前必须中心化主效应(去均值),否则会产生与主效应高度共线的伪显著结果。