案例数据
300 名高中学生,按年级(3 级)× 性别(2 级)6 单元完全平衡分组,每名学生有语文 / 数学 / 英语 3 门相关成绩,演示同时检验多个相关因变量的多元方差分析(MANOVA)。
| 文件名 | manova.xlsx |
|---|---|
| 数据用途 | MANOVA 案例数据(2 因子 × 3 个连续因变量) |
| 变量说明 | 年级 / 性别 为分类自变量;语文 / 数学 / 英语 为 3 个相关连续因变量(百分制)。 |
完整案例
1. 背景
某高中教务处复盘 300 名学生的期末成绩,希望同时回答两个交叉问题:①不同年级(高一 / 高二 / 高三)和性别(男 / 女)的学生,在语文 / 数学 / 英语这 3 门相关学科上整体表现是否存在差异;②如果用 3 次独立的单因素 ANOVA(每门一次)会引入 3 重多重检验 问题,且无法识别 3 门成绩作为一个整体能力画像的差异——例如某个组别可能每门单独看都"略低"但合起来差异显著。多元方差分析(MANOVA)正是解决这类问题的方法:把多个连续因变量当作一个向量整体同时检验,①一次性控制 multivariate Type Ⅰ 错误率;②利用因变量之间的相关性(本例语文-英语 r≈0.51)提升统计功效,能识别多次单变量 ANOVA 可能漏掉的整体差异;③显著后再回到单变量 ANOVA + Bonferroni 修正,定位"哪个 DV 在驱动差异"。与双因素方差(v9.58,单 DV + 2 因子)和多因素方差(v9.59,单 DV + 3+ 因子)的本质区别在于:MANOVA 的核心是多个 DV 同时建模,而非更多 IV。本案例 300 行 × 6 单元 × 3 DV 完整演示 Box's M 协方差齐性 → MANOVA 多变量检验 → 单变量后续分析 → Bonferroni 修正的标准流程。
2. 理论与公式
MANOVA 把"每个观测值是一个向量 y=(语文, 数学, 英语)"作为研究对象,比较组间均值向量差异。核心是把单变量 ANOVA 的"方差分解"推广到"协方差矩阵分解",再用 4 种多变量统计量比较组间矩阵 H 与组内矩阵 E。
n 个观测、p 个因变量、k 个设计列;Y 一次进入 p 列因变量矩阵。
组内 SSCP 矩阵 E 与总 SSCP 行列式之比,越小越显著(差异越大)。
组间在总变异中所占比重,对协方差非齐性最稳健,首选汇报。
组间相对组内的扩展,小样本可能膨胀。
最大特征值,只反映最强方向,对违反前提最敏感。
各组协方差矩阵是否齐性,p>0.05 表示前提成立(Box's M 较严苛,可参考 Pillai 替代)。
3. 数据结构
300 行 × 5 列宽表:每行 1 名学生,2 列分类自变量 + 3 列连续因变量。年级 3 × 性别 2 = 6 个单元各 50 人,完全平衡设计:
| 变量名 | 类型 | 取值 | 业务含义 |
|---|---|---|---|
| 年级 | 因子 A(分类,3 级) | 高一 / 高二 / 高三 | 学生所在年级,每级 100 人 |
| 性别 | 因子 B(分类,2 级) | 男 / 女 | 学生性别,每级 150 人 |
| 语文 | 因变量 Y₁(连续) | 0-100 分 | 期末语文成绩,N=300,均值 76.77,SD 7.52 |
| 数学 | 因变量 Y₂(连续) | 0-100 分 | 期末数学成绩,N=300,均值 77.83,SD 8.35 |
| 英语 | 因变量 Y₃(连续) | 0-100 分 | 期末英语成绩,N=300,均值 75.39,SD 8.22 |
3 个 DV 之间存在中等强度相关(组内/池化相关 r(语文,英语)≈0.51,r(语文,数学)≈0.34,r(数学,英语)≈0.36),正是 MANOVA 优于"3 次独立 ANOVA"的结构性理由——相关性提升联合检验功效;同时所有相关均 < 0.9,未出现冗余,3 个 DV 各自携带独立信息。
4. 操作步骤
- 登录 SPSSzero,进入 工作台 → 上传
manova.xlsx - 左侧方法栏 → 进阶方法 → 点击 多元方差分析 MANOVA
- 把 语文 / 数学 / 英语 全部拖入 因变量 Y(≥ 2 个连续型)
- 把 年级 拖入 因素 A(3 个水平),把 性别 拖入 因素 B(2 个水平)
- 勾选 Box's M 检验组间协方差矩阵齐性(MANOVA 核心前提),并勾选 Levene 对每个 DV 单独检验单变量方差齐性
- 勾选 多变量检验:默认输出 Pillai's V / Wilks' Λ / Hotelling-Lawley / Roy's Largest Root 4 项统计
- 勾选 主效应 + 交互效应 模型,把 A、B、A×B 全部纳入
- 勾选 后续单变量 ANOVA,并设置 Bonferroni 修正:α=0.05 / 3=0.0167(按 DV 数 p=3 修正)
- 点击 开始分析;阅读时严格按"前提检验 → 多变量检验 → 单变量后续 → 业务解读"的层级判读,避免直接看单变量结果
5. 结果表格与结果阅读
下面展示 3 张紧凑三线表:表 1 为前提检验(Box's M 协方差齐性 + 3 个 DV 的 Levene 方差齐性),表 2 为 MANOVA 多变量检验主表(3 效应 × 4 统计量),表 3 为后续单变量 ANOVA + Bonferroni 修正。
| 检验项 | 统计量 | df | p | 判断(α=0.05) |
|---|---|---|---|---|
| Box's M 协方差齐性(6 单元) | M=19.72,χ²=19.22 | 30 | 0.935 | p≫0.05,协方差矩阵齐性成立 |
| Levene(语文) | W=0.526 | 5, 294 | 0.757 | 方差齐性成立 |
| Levene(数学) | W=0.633 | 5, 294 | 0.675 | 方差齐性成立 |
| Levene(英语) | W=0.181 | 5, 294 | 0.970 | 方差齐性成立 |
| Box's M 用 χ² 近似(Bartlett 校正),p>0.001 即可接受协方差齐性(该检验对偏离过于敏感);本例 p=0.935 极宽松通过,多变量检验 4 项统计量可平等汇报。3 个 DV 的 Levene 单变量方差齐性也全部通过,后续单变量 ANOVA 的前提同样满足。 | ||||
| 效应 | 统计量 | 值 | F | num df / den df | p |
|---|---|---|---|---|---|
| 年级(A 主效应) | Pillai's V | 0.2187 | 11.991 | 6 / 586 | <0.001*** |
| Wilks' Λ | 0.7845 | 12.559 | 6 / 584 | <0.001*** | |
| Hotelling-Lawley | 0.2706 | 13.148 | 6 / 387.6 | <0.001*** | |
| Roy's Largest Root | 0.2546 | 24.866 | 3 / 293 | <0.001*** | |
| 性别(B 主效应) | Pillai's V | 0.1000 | 10.818 | 3 / 292 | <0.001*** |
| Wilks' Λ | 0.9000 | 10.818 | 3 / 292 | <0.001*** | |
| Hotelling-Lawley | 0.1111 | 10.818 | 3 / 292 | <0.001*** | |
| Roy's Largest Root | 0.1111 | 10.818 | 3 / 292 | <0.001*** | |
| 年级 × 性别(交互) | Pillai's V | 0.1591 | 8.442 | 6 / 586 | <0.001*** |
| Wilks' Λ | 0.8426 | 8.701 | 6 / 584 | <0.001*** | |
| Hotelling-Lawley | 0.1847 | 8.975 | 6 / 387.6 | <0.001*** | |
| Roy's Largest Root | 0.1729 | 16.886 | 3 / 293 | <0.001*** | |
| * p<0.05 ** p<0.01 *** p<0.001;3 个效应在 4 种统计量下结论高度一致(典型表现):A 主效应 Pillai=0.2187(最强)≫ 交互 0.1591 ≫ B 主效应 0.1000,所有 p<0.001。Pillai 抗前提违反最强,正式汇报应优先以 Pillai 为主;Roy 对最大方向最敏感,仅在多变量结构高度集中时才与 Pillai 拉开差距。交互显著说明年级对成绩向量的影响在男女间不同。 | |||||
| DV | 效应 | SS | df | F | p | 偏 η² | Bonferroni |
|---|---|---|---|---|---|---|---|
| 语文 | 年级 | 1785.37 | 2 | 21.699 | <0.001*** | 0.129 | 显著 |
| 性别 | 2657.15 | 1 | 64.589 | <0.001*** | 0.180 | 显著 | |
| 年级 × 性别 | 371.78 | 2 | 4.519 | 0.012* | 0.030 | 显著 | |
| 数学 | 年级 | 1722.88 | 2 | 16.493 | <0.001*** | 0.101 | 显著 |
| 性别 | 2946.71 | 1 | 56.418 | <0.001*** | 0.161 | 显著 | |
| 年级 × 性别 | 837.99 | 2 | 8.022 | <0.001*** | 0.052 | 显著 | |
| 英语 | 年级 | 2383.99 | 2 | 26.650 | <0.001*** | 0.154 | 显著 |
| 性别 | 4047.43 | 1 | 90.490 | <0.001*** | 0.235 | 显著 | |
| 年级 × 性别 | 645.83 | 2 | 7.220 | <0.001*** | 0.047 | 显著 | |
| 残差 df=294;Bonferroni 修正阈值 α=0.0167,3 个效应在 3 个 DV 上的 9 个 p 值均 ≤0.012,全部通过修正。偏 η² 解读:性别 × 英语(0.235,大效应) ≫ 性别 × 语文(0.180)≫ 性别 × 数学(0.161)≫ 年级 × 英语(0.154);交互效应在 3 个 DV 上效应量较小(0.030-0.052),但与多变量检验 Pillai=0.159 在方向上一致。 | |||||||
7. 文字分析
- 前提检验全部成立:Box's M χ²=19.22(df=30,p=0.935)远大于阈值,6 个单元的 3×3 协方差矩阵齐性成立;3 个 DV 的 Levene 单变量方差齐性 p 也全部 >0.6。这意味着 4 种多变量统计量结论可平等汇报(无需偏向 Pillai);后续单变量 ANOVA 也无需采用 Welch 校正。
- 三个多变量效应均显著:以首选指标 Pillai's V 汇报——年级主效应 V=0.2187(F(6,586)=11.99,p<0.001)> 交互 V=0.1591(F(6,586)=8.44,p<0.001)> 性别主效应 V=0.1000(F(3,292)=10.82,p<0.001)。年级对成绩向量的整体影响最强,性别次之,但年级效应在男女间存在差异(交互显著)。
- 谁在驱动差异:单变量后续显示英语和语文是性别差异的主要驱动 DV(性别效应 η²=0.235、0.180,均为大效应;女生>男生约 7-8 分),而数学是性别效应反向的主要驱动 DV(η²=0.161,男生>女生约 6 分)。年级主效应在 3 个 DV 上均显著但效应量中等(η² 0.10-0.15)。
- 交互模式:交互在数学(η²=0.052)和英语(η²=0.047)上最强、在语文(0.030)上较弱。结合边际均值:男生数学优势随年级显著放大(高一男 76.76 vs 女 73.02 差 3.7;高三男 86.25 vs 女 75.26 差 11.0),女生语文/英语优势同样随年级放大(高三女生语文 84.05 vs 男生 75.65 差 8.4)——典型的"年级越高,性别分化越明显"模式。
- 业务建议:(1) 教学策略应按"年级 × 性别"组合分群,而非单看年级或单看性别;(2) 高三阶段需针对性补强——男生重点补语文/英语,女生重点补数学;(3) 由于 4 种多变量统计量结论一致且前提全部成立,结果可仅汇报 Pillai's V 作为主要结论,符合 APA 第 7 版统计汇报规范。
8. 剖析提醒
- vs 多次单变量 ANOVA:对 3 个 DV 各跑一次 ANOVA 等价于做 3 次独立显著性判断,Family-wise α 实际约为 1−(1−0.05)³≈0.143(远超 0.05),且无法捕捉整体能力画像差异。MANOVA 把 3 个 DV 当向量一次性检验,先把 Type Ⅰ 错误率锁定在 0.05,显著后再用 Bonferroni 修正的单变量 ANOVA 定位。
- Pillai 抗前提违反最强:当 Box's M 不通过或样本量不均衡时,优先报告 Pillai's V;Wilks 在多数情况与 Pillai 一致;Hotelling-Lawley 在小样本可能膨胀;Roy's Largest Root 只反映最强方向,对违反前提最敏感,不建议作为唯一汇报指标。
- Box's M 较严苛:该检验对偏离正态、轻微协方差差异极敏感,常给出过于显著的 p 值,习惯做法是采用 p<0.001 的更严阈值;若 Box's M 仍不通过,应改报 Pillai's V 并加大样本量,而非放弃 MANOVA。
- DV 间相关 0.3-0.9 区间最优:相关过低(<0.3)说明 DV 几乎独立,做 MANOVA 与做 3 次 ANOVA 差别不大;相关过高(>0.9)说明 DV 冗余,建议先做 PCA / 因子分析降维再做 MANOVA。本例 3 个 DV 的池化组内相关 0.34-0.51,正好落在理想区间。
- 不要绕开多变量检验直接看单变量:哪怕 3 个 DV 单变量 ANOVA 都显著,也不能反过来说"MANOVA 必然显著";正确流程是先做 MANOVA,多变量显著后才展开单变量解读,并对单变量 ANOVA 的 p 值施加 Bonferroni 修正(α=0.05 / DV 数),否则会把多重比较的代价隐性转嫁。