进阶方法

分层回归分析

案例数据

300 名员工 × 6 列。包含人口学控制变量（年龄 / 工龄 / 学历层次）、两个核心理论变量（工作投入度、组织支持感）以及因变量绩效得分（0-100），用于演示分 3 层进入模型的分层回归（控制层 → 主效应层 → 交互项层）。

文件名	hierarchical_regression.xlsx
样本量	300 行
变量数	6 列（3 控制变量 + 2 主效应 + 1 因变量）
数据用途	组织行为研究：在控制人口学变量后，工作投入度与组织支持感是否仍能显著解释员工绩效，以及二者是否存在交互调节。
变量说明	年龄（22-60 岁）、工龄（年）、学历层次（1-5 序数）、工作投入度（Likert 1-5）、组织支持感（Likert 1-5）、绩效得分（0-100 连续）。

完整案例

1. 背景

某企业 HR 部门希望搞清楚 "员工绩效到底受哪些因素影响"。常见的误区是：把人口学变量（年龄、工龄、学历）和心理变量（工作投入度、组织支持感）一起塞进回归方程，谁显著就汇报谁。这样做无法区分"基础解释力 vs 增量解释力"。本案例采用分层回归（Hierarchical Regression），按照理论假设分 3 层逐步加入变量并观察 R² 增量：①第 1 层放入人口学控制变量，估计"基础人口学解释力"；②第 2 层加入工作投入度与组织支持感主效应，看核心变量是否带来显著的 ΔR²；③第 3 层加入工作投入度 × 组织支持感交互项，检验二者是否存在调节关系。每层用 F 变化检验判断新增变量的统计显著性。

2. 理论与公式

分层回归把多个自变量按理论顺序分组（Block）依次进入 OLS 模型，每加入一组就估计一个嵌套模型，并比较相邻两个模型的 R² 增量是否显著。

嵌套模型

C 为控制变量、X 为主效应、X₁·X₂ 为交互项。

R² 增量

反映新加入这一层变量带来的额外解释力。

F 变化检验

q=本层新增变量数，k=新模型总变量数；F 显著则 ΔR² 显著。

3. 数据结构

每行 1 位员工，6 列变量按理论角色分为 3 层：

层次	变量名	类型	说明
第 1 层（控制变量）	年龄	连续 22-60	员工实际年龄，控制生命周期效应
	工龄	连续 0-35 年	在职年数，控制经验积累
	学历层次	序数 1-5	1=高中及以下，5=博士及以上
第 2 层（主效应）	工作投入度	Likert 1-5	在工作中的精力投入与专注度（中心化处理）
第 2 层（主效应）	组织支持感	Likert 1-5	感受到的组织资源和情感支持（中心化处理）
第 3 层（交互项）	投入 × 支持	连续	两个中心化主效应的乘积，检验调节作用
因变量 Y	绩效得分	连续 30-100	上一年度综合绩效评分

交互项需要先把主效应变量去均值（中心化）再相乘，避免与原始量纲产生严重多重共线性。

4. 操作步骤

登录 SPSSzero，进入 工作台 → 上传 hierarchical_regression.xlsx
左侧方法栏 → 进阶方法 → 点击 分层回归分析
把 绩效得分 拖入 因变量 Y
第 1 层（控制变量）：把年龄、工龄、学历层次 拖入 Block 1
第 2 层（主效应）：点击 新增层，把 工作投入度、组织支持感 拖入 Block 2（系统会自动中心化）
第 3 层（交互项）：再次 新增层，把 工作投入度 × 组织支持感 拖入 Block 3
点击 开始分析，系统会输出 3 个嵌套模型的系数表、R² 比较表及 F 变化检验

5. 结果表格与结果阅读

结果区按 3 层嵌套结构输出系数对比表和 R² 增量检验表。下面展示 2 张紧凑三线表：

表1 三层模型回归系数对比（N=300，因变量=绩效得分）

层 / 变量	模型1 B (SE)	模型2 B (SE)	模型3 B (SE)
常数项	49.589 (7.989)***	49.478 (5.228)***	48.936 (4.853)***
第 1 层控制变量
年龄	0.152 (0.318)	0.087 (0.208)	0.107 (0.193)
工龄	0.142 (0.320)	0.105 (0.209)	0.063 (0.194)
学历层次	−0.874 (0.581)	0.059 (0.382)	0.202 (0.355)
第 2 层主效应
工作投入度（中心化）	—	7.846 (0.438)***	7.604 (0.408)***
组织支持感（中心化）	—	3.987 (0.373)***	4.075 (0.347)***
第 3 层交互
投入 × 支持	—	—	3.303 (0.475)***
R²	0.072	0.608	0.664
调整 R²	0.062	0.602	0.657
* p<0.05 p<0.01 * p<0.001；表中为非标准化回归系数 B 及标准误 SE

关键观察：①第 1 层人口学变量整体仅解释 7.2% 方差，单个系数均不显著 → 单靠人口学难以预测绩效；②第 2 层加入心理变量后 R² 跃升至 60.8%，工作投入与组织支持均高度显著；③第 3 层交互项显著（B=3.303, p<0.001）→ 工作投入对绩效的影响会随组织支持水平变化。

表2 R² 增量与 F 变化检验

模型	进入变量	R²	ΔR²	F 变化	df	p
模型 1	年龄、工龄、学历层次	0.072	—	7.597	(3, 296)	<0.001
模型 2	+ 工作投入度、组织支持感	0.608	0.537	201.411	(2, 294)	<0.001
模型 3	+ 投入 × 支持	0.664	0.056	48.311	(1, 293)	<0.001
ΔR² = 当前模型 R² − 上一层模型 R²；F 变化检验本层新增变量是否带来显著的解释力提升

三层增量都显著，但贡献量级差距极大：主效应层带来 53.7 个百分点的解释力跃升（这是核心结论），交互层再补 5.6 个百分点。即"是否进入"和"多大程度上塑造"两个问题层层分明。

7. 文字分析

对员工绩效影响因素的 3 层分层回归综合分析：

第 1 层（控制变量）：年龄、工龄、学历层次三个人口学变量整体显著（F=7.60, p<0.001），但 R² 仅 0.072，调整 R² 0.062，且没有任何单个系数显著（所有 p>0.13）—— 说明人口学特征不是绩效的主要预测源，只是研究中需要控制的背景变量；
第 2 层（主效应）：加入工作投入度和组织支持感后，R² 从 0.072 飞跃到 0.608（ΔR²=0.537, F_变化=201.41, p<0.001）—— 这是本研究最关键的发现，两个心理变量贡献了 53.7 个百分点的额外解释力。其中工作投入度每提升 1 分对应绩效提升 7.85 分，组织支持感每提升 1 分对应绩效提升 3.99 分，工作投入度的边际贡献接近组织支持感的 2 倍；
第 3 层（交互项）：投入 × 支持交互项显著（B=3.30, p<0.001），ΔR²=0.056（F_变化=48.31, p<0.001）—— 表明二者存在显著的正向协同效应：在高组织支持下，工作投入对绩效的提升幅度比低支持下更大（"投入×支持"系数为正即"放大"效应）；
整体解释力：最终模型解释了 66.4% 的绩效方差（调整 R²=0.657），属于社会科学研究中的强解释力水平。

结论与业务建议：①不要把绩效差异简单归因于年龄/工龄/学历，这些变量解释力很弱；②员工绩效的核心驱动是心理投入和组织支持，且工作投入是更主导的杠杆；③组织支持感不仅有独立主效应，还能放大员工投入的回报 —— 这意味着 HR 应当同时推动"激发员工投入"与"提升组织支持"两条线，二者并非可替代关系而是相互增强；④对管理者而言，重点投资方向依次为：员工敬业度项目 > 组织支持/资源保障 > 人口结构层面的优化。

8. 剖析提醒

分层顺序必须由理论假设决定，控制变量永远在最前、核心变量居中、交互项最后；不要为了让 ΔR² 更"好看"而随意调整进入顺序，那是数据探查（exploratory），不能写成验证性结论。交互项前必须中心化主效应（去均值），否则会产生与主效应高度共线的伪显著结果。