进阶方法

多元方差分析MANOVA

案例数据

300 名高中学生，按年级（3 级）× 性别（2 级）6 单元完全平衡分组，每名学生有语文 / 数学 / 英语 3 门相关成绩，演示同时检验多个相关因变量的多元方差分析（MANOVA）。

文件名	manova.xlsx
数据用途	MANOVA 案例数据（2 因子 × 3 个连续因变量）
变量说明	年级 / 性别为分类自变量；语文 / 数学 / 英语为 3 个相关连续因变量（百分制）。

完整案例

1. 背景

某高中教务处复盘 300 名学生的期末成绩，希望同时回答两个交叉问题：①不同年级（高一 / 高二 / 高三）和性别（男 / 女）的学生，在语文 / 数学 / 英语这 3 门相关学科上整体表现是否存在差异；②如果用 3 次独立的单因素 ANOVA（每门一次）会引入 3 重多重检验 问题，且无法识别 3 门成绩作为一个整体能力画像的差异——例如某个组别可能每门单独看都"略低"但合起来差异显著。多元方差分析（MANOVA）正是解决这类问题的方法：把多个连续因变量当作一个向量整体同时检验，①一次性控制 multivariate Type Ⅰ 错误率；②利用因变量之间的相关性（本例语文-英语 r≈0.51）提升统计功效，能识别多次单变量 ANOVA 可能漏掉的整体差异；③显著后再回到单变量 ANOVA + Bonferroni 修正，定位"哪个 DV 在驱动差异"。与双因素方差（v9.58，单 DV + 2 因子）和多因素方差（v9.59，单 DV + 3+ 因子）的本质区别在于：MANOVA 的核心是多个 DV 同时建模，而非更多 IV。本案例 300 行 × 6 单元 × 3 DV 完整演示 Box's M 协方差齐性 → MANOVA 多变量检验 → 单变量后续分析 → Bonferroni 修正的标准流程。

2. 理论与公式

MANOVA 把"每个观测值是一个向量 y=(语文, 数学, 英语)"作为研究对象，比较组间均值向量差异。核心是把单变量 ANOVA 的"方差分解"推广到"协方差矩阵分解"，再用 4 种多变量统计量比较组间矩阵 H 与组内矩阵 E。

矩阵模型

n 个观测、p 个因变量、k 个设计列；Y 一次进入 p 列因变量矩阵。

Wilks' Λ

组内 SSCP 矩阵 E 与总 SSCP 行列式之比，越小越显著（差异越大）。

Pillai's V

组间在总变异中所占比重，对协方差非齐性最稳健，首选汇报。

Hotelling-Lawley

组间相对组内的扩展，小样本可能膨胀。

Roy's Largest Root

最大特征值，只反映最强方向，对违反前提最敏感。

Box's M（前提检验）

各组协方差矩阵是否齐性，p>0.05 表示前提成立（Box's M 较严苛，可参考 Pillai 替代）。

3. 数据结构

300 行 × 5 列宽表：每行 1 名学生，2 列分类自变量 + 3 列连续因变量。年级 3 × 性别 2 = 6 个单元各 50 人，完全平衡设计：

变量名	类型	取值	业务含义
年级	因子 A（分类，3 级）	高一 / 高二 / 高三	学生所在年级，每级 100 人
性别	因子 B（分类，2 级）	男 / 女	学生性别，每级 150 人
语文	因变量 Y₁（连续）	0-100 分	期末语文成绩，N=300，均值 76.77，SD 7.52
数学	因变量 Y₂（连续）	0-100 分	期末数学成绩，N=300，均值 77.83，SD 8.35
英语	因变量 Y₃（连续）	0-100 分	期末英语成绩，N=300，均值 75.39，SD 8.22

3 个 DV 之间存在中等强度相关（组内/池化相关 r(语文,英语)≈0.51，r(语文,数学)≈0.34，r(数学,英语)≈0.36），正是 MANOVA 优于"3 次独立 ANOVA"的结构性理由——相关性提升联合检验功效；同时所有相关均 < 0.9，未出现冗余，3 个 DV 各自携带独立信息。

4. 操作步骤

登录 SPSSzero，进入 工作台 → 上传 manova.xlsx
左侧方法栏 → 进阶方法 → 点击 多元方差分析 MANOVA
把 语文 / 数学 / 英语 全部拖入 因变量 Y（≥ 2 个连续型）
把年级拖入 因素 A（3 个水平），把性别拖入 因素 B（2 个水平）
勾选 Box's M 检验组间协方差矩阵齐性（MANOVA 核心前提），并勾选 Levene 对每个 DV 单独检验单变量方差齐性
勾选 多变量检验：默认输出 Pillai's V / Wilks' Λ / Hotelling-Lawley / Roy's Largest Root 4 项统计
勾选 主效应 + 交互效应 模型，把 A、B、A×B 全部纳入
勾选 后续单变量 ANOVA，并设置 Bonferroni 修正：α=0.05 / 3=0.0167（按 DV 数 p=3 修正）
点击 开始分析；阅读时严格按"前提检验 → 多变量检验 → 单变量后续 → 业务解读"的层级判读，避免直接看单变量结果

5. 结果表格与结果阅读

下面展示 3 张紧凑三线表：表 1 为前提检验（Box's M 协方差齐性 + 3 个 DV 的 Levene 方差齐性），表 2 为 MANOVA 多变量检验主表（3 效应 × 4 统计量），表 3 为后续单变量 ANOVA + Bonferroni 修正。

表1 前提检验：Box's M 协方差齐性 + Levene 单变量方差齐性

检验项	统计量	df	p	判断（α=0.05）
Box's M 协方差齐性（6 单元）	M=19.72，χ²=19.22	30	0.935	p≫0.05，协方差矩阵齐性成立
Levene（语文）	W=0.526	5, 294	0.757	方差齐性成立
Levene（数学）	W=0.633	5, 294	0.675	方差齐性成立
Levene（英语）	W=0.181	5, 294	0.970	方差齐性成立
Box's M 用 χ² 近似（Bartlett 校正），p>0.001 即可接受协方差齐性（该检验对偏离过于敏感）；本例 p=0.935 极宽松通过，多变量检验 4 项统计量可平等汇报。3 个 DV 的 Levene 单变量方差齐性也全部通过，后续单变量 ANOVA 的前提同样满足。

表2 MANOVA 多变量检验主表（3 效应 × 4 统计量，N=300）

效应	统计量	值	F	num df / den df	p
年级（A 主效应）	Pillai's V	0.2187	11.991	6 / 586	<0.001***
	Wilks' Λ	0.7845	12.559	6 / 584	<0.001***
	Hotelling-Lawley	0.2706	13.148	6 / 387.6	<0.001***
	Roy's Largest Root	0.2546	24.866	3 / 293	<0.001***
性别（B 主效应）	Pillai's V	0.1000	10.818	3 / 292	<0.001***
	Wilks' Λ	0.9000	10.818	3 / 292	<0.001***
	Hotelling-Lawley	0.1111	10.818	3 / 292	<0.001***
	Roy's Largest Root	0.1111	10.818	3 / 292	<0.001***
年级 × 性别（交互）	Pillai's V	0.1591	8.442	6 / 586	<0.001***
	Wilks' Λ	0.8426	8.701	6 / 584	<0.001***
	Hotelling-Lawley	0.1847	8.975	6 / 387.6	<0.001***
	Roy's Largest Root	0.1729	16.886	3 / 293	<0.001***
* p<0.05 p<0.01 * p<0.001；3 个效应在 4 种统计量下结论高度一致（典型表现）：A 主效应 Pillai=0.2187（最强）≫ 交互 0.1591 ≫ B 主效应 0.1000，所有 p<0.001。Pillai 抗前提违反最强，正式汇报应优先以 Pillai 为主；Roy 对最大方向最敏感，仅在多变量结构高度集中时才与 Pillai 拉开差距。交互显著说明年级对成绩向量的影响在男女间不同。

表3 后续单变量 ANOVA（按 DV 拆开，Bonferroni 修正 α=0.05/3=0.0167）

DV	效应	SS	df	F	p	偏 η²	Bonferroni
语文	年级	1785.37	2	21.699	<0.001***	0.129	显著
	性别	2657.15	1	64.589	<0.001***	0.180	显著
	年级 × 性别	371.78	2	4.519	0.012*	0.030	显著
数学	年级	1722.88	2	16.493	<0.001***	0.101	显著
	性别	2946.71	1	56.418	<0.001***	0.161	显著
	年级 × 性别	837.99	2	8.022	<0.001***	0.052	显著
英语	年级	2383.99	2	26.650	<0.001***	0.154	显著
	性别	4047.43	1	90.490	<0.001***	0.235	显著
	年级 × 性别	645.83	2	7.220	<0.001***	0.047	显著
残差 df=294；Bonferroni 修正阈值 α=0.0167，3 个效应在 3 个 DV 上的 9 个 p 值均 ≤0.012，全部通过修正。偏 η² 解读：性别 × 英语（0.235，大效应） ≫ 性别 × 语文（0.180）≫ 性别 × 数学（0.161）≫ 年级 × 英语（0.154）；交互效应在 3 个 DV 上效应量较小（0.030-0.052），但与多变量检验 Pillai=0.159 在方向上一致。

7. 文字分析

前提检验全部成立：Box's M χ²=19.22（df=30，p=0.935）远大于阈值，6 个单元的 3×3 协方差矩阵齐性成立；3 个 DV 的 Levene 单变量方差齐性 p 也全部 >0.6。这意味着 4 种多变量统计量结论可平等汇报（无需偏向 Pillai）；后续单变量 ANOVA 也无需采用 Welch 校正。
三个多变量效应均显著：以首选指标 Pillai's V 汇报——年级主效应 V=0.2187（F(6,586)=11.99，p<0.001）> 交互 V=0.1591（F(6,586)=8.44，p<0.001）> 性别主效应 V=0.1000（F(3,292)=10.82，p<0.001）。年级对成绩向量的整体影响最强，性别次之，但年级效应在男女间存在差异（交互显著）。
谁在驱动差异：单变量后续显示英语和语文是性别差异的主要驱动 DV（性别效应 η²=0.235、0.180，均为大效应；女生>男生约 7-8 分），而数学是性别效应反向的主要驱动 DV（η²=0.161，男生>女生约 6 分）。年级主效应在 3 个 DV 上均显著但效应量中等（η² 0.10-0.15）。
交互模式：交互在数学（η²=0.052）和英语（η²=0.047）上最强、在语文（0.030）上较弱。结合边际均值：男生数学优势随年级显著放大（高一男 76.76 vs 女 73.02 差 3.7；高三男 86.25 vs 女 75.26 差 11.0），女生语文/英语优势同样随年级放大（高三女生语文 84.05 vs 男生 75.65 差 8.4）——典型的"年级越高，性别分化越明显"模式。
业务建议：(1) 教学策略应按"年级 × 性别"组合分群，而非单看年级或单看性别；(2) 高三阶段需针对性补强——男生重点补语文/英语，女生重点补数学；(3) 由于 4 种多变量统计量结论一致且前提全部成立，结果可仅汇报 Pillai's V 作为主要结论，符合 APA 第 7 版统计汇报规范。

8. 剖析提醒

vs 多次单变量 ANOVA：对 3 个 DV 各跑一次 ANOVA 等价于做 3 次独立显著性判断，Family-wise α 实际约为 1−(1−0.05)³≈0.143（远超 0.05），且无法捕捉整体能力画像差异。MANOVA 把 3 个 DV 当向量一次性检验，先把 Type Ⅰ 错误率锁定在 0.05，显著后再用 Bonferroni 修正的单变量 ANOVA 定位。
Pillai 抗前提违反最强：当 Box's M 不通过或样本量不均衡时，优先报告 Pillai's V；Wilks 在多数情况与 Pillai 一致；Hotelling-Lawley 在小样本可能膨胀；Roy's Largest Root 只反映最强方向，对违反前提最敏感，不建议作为唯一汇报指标。
Box's M 较严苛：该检验对偏离正态、轻微协方差差异极敏感，常给出过于显著的 p 值，习惯做法是采用 p<0.001 的更严阈值；若 Box's M 仍不通过，应改报 Pillai's V 并加大样本量，而非放弃 MANOVA。
DV 间相关 0.3-0.9 区间最优：相关过低（<0.3）说明 DV 几乎独立，做 MANOVA 与做 3 次 ANOVA 差别不大；相关过高（>0.9）说明 DV 冗余，建议先做 PCA / 因子分析降维再做 MANOVA。本例 3 个 DV 的池化组内相关 0.34-0.51，正好落在理想区间。
不要绕开多变量检验直接看单变量：哪怕 3 个 DV 单变量 ANOVA 都显著，也不能反过来说"MANOVA 必然显著"；正确流程是先做 MANOVA，多变量显著后才展开单变量解读，并对单变量 ANOVA 的 p 值施加 Bonferroni 修正（α=0.05 / DV 数），否则会把多重比较的代价隐性转嫁。