进阶方法

多元方差分析MANOVA

案例数据

300 名高中学生,按年级(3 级)× 性别(2 级)6 单元完全平衡分组,每名学生有语文 / 数学 / 英语 3 门相关成绩,演示同时检验多个相关因变量的多元方差分析(MANOVA)。

文件名manova.xlsx
数据用途MANOVA 案例数据(2 因子 × 3 个连续因变量)
变量说明年级 / 性别 为分类自变量;语文 / 数学 / 英语 为 3 个相关连续因变量(百分制)。

完整案例

1. 背景

某高中教务处复盘 300 名学生的期末成绩,希望同时回答两个交叉问题:①不同年级(高一 / 高二 / 高三)和性别(男 / 女)的学生,在语文 / 数学 / 英语这 3 门相关学科上整体表现是否存在差异;②如果用 3 次独立的单因素 ANOVA(每门一次)会引入 3 重多重检验 问题,且无法识别 3 门成绩作为一个整体能力画像的差异——例如某个组别可能每门单独看都"略低"但合起来差异显著。多元方差分析(MANOVA)正是解决这类问题的方法:把多个连续因变量当作一个向量整体同时检验,①一次性控制 multivariate Type Ⅰ 错误率;②利用因变量之间的相关性(本例语文-英语 r≈0.51)提升统计功效,能识别多次单变量 ANOVA 可能漏掉的整体差异;③显著后再回到单变量 ANOVA + Bonferroni 修正,定位"哪个 DV 在驱动差异"。与双因素方差(v9.58,单 DV + 2 因子)和多因素方差(v9.59,单 DV + 3+ 因子)的本质区别在于:MANOVA 的核心是多个 DV 同时建模,而非更多 IV。本案例 300 行 × 6 单元 × 3 DV 完整演示 Box's M 协方差齐性 → MANOVA 多变量检验 → 单变量后续分析 → Bonferroni 修正的标准流程。

2. 理论与公式

MANOVA 把"每个观测值是一个向量 y=(语文, 数学, 英语)"作为研究对象,比较组间均值向量差异。核心是把单变量 ANOVA 的"方差分解"推广到"协方差矩阵分解",再用 4 种多变量统计量比较组间矩阵 H 与组内矩阵 E。

矩阵模型

n 个观测、p 个因变量、k 个设计列;Y 一次进入 p 列因变量矩阵。

Wilks' Λ

组内 SSCP 矩阵 E 与总 SSCP 行列式之比,越小越显著(差异越大)。

Pillai's V

组间在总变异中所占比重,对协方差非齐性最稳健,首选汇报。

Hotelling-Lawley

组间相对组内的扩展,小样本可能膨胀。

Roy's Largest Root

最大特征值,只反映最强方向,对违反前提最敏感。

Box's M(前提检验)

各组协方差矩阵是否齐性,p>0.05 表示前提成立(Box's M 较严苛,可参考 Pillai 替代)。

3. 数据结构

300 行 × 5 列宽表:每行 1 名学生,2 列分类自变量 + 3 列连续因变量。年级 3 × 性别 2 = 6 个单元各 50 人,完全平衡设计:

变量名类型取值业务含义
年级因子 A(分类,3 级)高一 / 高二 / 高三学生所在年级,每级 100 人
性别因子 B(分类,2 级)男 / 女学生性别,每级 150 人
语文因变量 Y₁(连续)0-100 分期末语文成绩,N=300,均值 76.77,SD 7.52
数学因变量 Y₂(连续)0-100 分期末数学成绩,N=300,均值 77.83,SD 8.35
英语因变量 Y₃(连续)0-100 分期末英语成绩,N=300,均值 75.39,SD 8.22

3 个 DV 之间存在中等强度相关(组内/池化相关 r(语文,英语)≈0.51,r(语文,数学)≈0.34,r(数学,英语)≈0.36),正是 MANOVA 优于"3 次独立 ANOVA"的结构性理由——相关性提升联合检验功效;同时所有相关均 < 0.9,未出现冗余,3 个 DV 各自携带独立信息。

4. 操作步骤

  1. 登录 SPSSzero,进入 工作台 → 上传 manova.xlsx
  2. 左侧方法栏 → 进阶方法 → 点击 多元方差分析 MANOVA
  3. 语文 / 数学 / 英语 全部拖入 因变量 Y(≥ 2 个连续型)
  4. 年级 拖入 因素 A(3 个水平),把 性别 拖入 因素 B(2 个水平)
  5. 勾选 Box's M 检验组间协方差矩阵齐性(MANOVA 核心前提),并勾选 Levene 对每个 DV 单独检验单变量方差齐性
  6. 勾选 多变量检验:默认输出 Pillai's V / Wilks' Λ / Hotelling-Lawley / Roy's Largest Root 4 项统计
  7. 勾选 主效应 + 交互效应 模型,把 A、B、A×B 全部纳入
  8. 勾选 后续单变量 ANOVA,并设置 Bonferroni 修正:α=0.05 / 3=0.0167(按 DV 数 p=3 修正)
  9. 点击 开始分析;阅读时严格按"前提检验 → 多变量检验 → 单变量后续 → 业务解读"的层级判读,避免直接看单变量结果

5. 结果表格与结果阅读

下面展示 3 张紧凑三线表:表 1 为前提检验(Box's M 协方差齐性 + 3 个 DV 的 Levene 方差齐性),表 2 为 MANOVA 多变量检验主表(3 效应 × 4 统计量),表 3 为后续单变量 ANOVA + Bonferroni 修正。

表1 前提检验:Box's M 协方差齐性 + Levene 单变量方差齐性
检验项统计量dfp判断(α=0.05)
Box's M 协方差齐性(6 单元)M=19.72,χ²=19.22300.935p≫0.05,协方差矩阵齐性成立
Levene(语文)W=0.5265, 2940.757方差齐性成立
Levene(数学)W=0.6335, 2940.675方差齐性成立
Levene(英语)W=0.1815, 2940.970方差齐性成立
Box's M 用 χ² 近似(Bartlett 校正),p>0.001 即可接受协方差齐性(该检验对偏离过于敏感);本例 p=0.935 极宽松通过,多变量检验 4 项统计量可平等汇报。3 个 DV 的 Levene 单变量方差齐性也全部通过,后续单变量 ANOVA 的前提同样满足。
表2 MANOVA 多变量检验主表(3 效应 × 4 统计量,N=300)
效应统计量Fnum df / den dfp
年级(A 主效应)Pillai's V0.218711.9916 / 586<0.001***
Wilks' Λ0.784512.5596 / 584<0.001***
Hotelling-Lawley0.270613.1486 / 387.6<0.001***
Roy's Largest Root0.254624.8663 / 293<0.001***
性别(B 主效应)Pillai's V0.100010.8183 / 292<0.001***
Wilks' Λ0.900010.8183 / 292<0.001***
Hotelling-Lawley0.111110.8183 / 292<0.001***
Roy's Largest Root0.111110.8183 / 292<0.001***
年级 × 性别(交互)Pillai's V0.15918.4426 / 586<0.001***
Wilks' Λ0.84268.7016 / 584<0.001***
Hotelling-Lawley0.18478.9756 / 387.6<0.001***
Roy's Largest Root0.172916.8863 / 293<0.001***
* p<0.05 ** p<0.01 *** p<0.001;3 个效应在 4 种统计量下结论高度一致(典型表现):A 主效应 Pillai=0.2187(最强)≫ 交互 0.1591 ≫ B 主效应 0.1000,所有 p<0.001。Pillai 抗前提违反最强,正式汇报应优先以 Pillai 为主;Roy 对最大方向最敏感,仅在多变量结构高度集中时才与 Pillai 拉开差距。交互显著说明年级对成绩向量的影响在男女间不同
表3 后续单变量 ANOVA(按 DV 拆开,Bonferroni 修正 α=0.05/3=0.0167)
DV效应SSdfFp偏 η²Bonferroni
语文年级1785.37221.699<0.001***0.129显著
性别2657.15164.589<0.001***0.180显著
年级 × 性别371.7824.5190.012*0.030显著
数学年级1722.88216.493<0.001***0.101显著
性别2946.71156.418<0.001***0.161显著
年级 × 性别837.9928.022<0.001***0.052显著
英语年级2383.99226.650<0.001***0.154显著
性别4047.43190.490<0.001***0.235显著
年级 × 性别645.8327.220<0.001***0.047显著
残差 df=294;Bonferroni 修正阈值 α=0.0167,3 个效应在 3 个 DV 上的 9 个 p 值均 ≤0.012,全部通过修正。偏 η² 解读:性别 × 英语(0.235,大效应) ≫ 性别 × 语文(0.180)≫ 性别 × 数学(0.161)≫ 年级 × 英语(0.154);交互效应在 3 个 DV 上效应量较小(0.030-0.052),但与多变量检验 Pillai=0.159 在方向上一致。

7. 文字分析

  • 前提检验全部成立:Box's M χ²=19.22(df=30,p=0.935)远大于阈值,6 个单元的 3×3 协方差矩阵齐性成立;3 个 DV 的 Levene 单变量方差齐性 p 也全部 >0.6。这意味着 4 种多变量统计量结论可平等汇报(无需偏向 Pillai);后续单变量 ANOVA 也无需采用 Welch 校正。
  • 三个多变量效应均显著:以首选指标 Pillai's V 汇报——年级主效应 V=0.2187(F(6,586)=11.99,p<0.001)> 交互 V=0.1591(F(6,586)=8.44,p<0.001)> 性别主效应 V=0.1000(F(3,292)=10.82,p<0.001)。年级对成绩向量的整体影响最强,性别次之,但年级效应在男女间存在差异(交互显著)。
  • 谁在驱动差异:单变量后续显示英语和语文是性别差异的主要驱动 DV(性别效应 η²=0.235、0.180,均为大效应;女生>男生约 7-8 分),而数学是性别效应反向的主要驱动 DV(η²=0.161,男生>女生约 6 分)。年级主效应在 3 个 DV 上均显著但效应量中等(η² 0.10-0.15)。
  • 交互模式:交互在数学(η²=0.052)和英语(η²=0.047)上最强、在语文(0.030)上较弱。结合边际均值:男生数学优势随年级显著放大(高一男 76.76 vs 女 73.02 差 3.7;高三男 86.25 vs 女 75.26 差 11.0),女生语文/英语优势同样随年级放大(高三女生语文 84.05 vs 男生 75.65 差 8.4)——典型的"年级越高,性别分化越明显"模式。
  • 业务建议:(1) 教学策略应按"年级 × 性别"组合分群,而非单看年级或单看性别;(2) 高三阶段需针对性补强——男生重点补语文/英语,女生重点补数学;(3) 由于 4 种多变量统计量结论一致且前提全部成立,结果可仅汇报 Pillai's V 作为主要结论,符合 APA 第 7 版统计汇报规范。

8. 剖析提醒

  • vs 多次单变量 ANOVA:对 3 个 DV 各跑一次 ANOVA 等价于做 3 次独立显著性判断,Family-wise α 实际约为 1−(1−0.05)³≈0.143(远超 0.05),且无法捕捉整体能力画像差异。MANOVA 把 3 个 DV 当向量一次性检验,先把 Type Ⅰ 错误率锁定在 0.05,显著后再用 Bonferroni 修正的单变量 ANOVA 定位。
  • Pillai 抗前提违反最强:当 Box's M 不通过或样本量不均衡时,优先报告 Pillai's V;Wilks 在多数情况与 Pillai 一致;Hotelling-Lawley 在小样本可能膨胀;Roy's Largest Root 只反映最强方向,对违反前提最敏感,不建议作为唯一汇报指标
  • Box's M 较严苛:该检验对偏离正态、轻微协方差差异极敏感,常给出过于显著的 p 值,习惯做法是采用 p<0.001 的更严阈值;若 Box's M 仍不通过,应改报 Pillai's V 并加大样本量,而非放弃 MANOVA。
  • DV 间相关 0.3-0.9 区间最优:相关过低(<0.3)说明 DV 几乎独立,做 MANOVA 与做 3 次 ANOVA 差别不大;相关过高(>0.9)说明 DV 冗余,建议先做 PCA / 因子分析降维再做 MANOVA。本例 3 个 DV 的池化组内相关 0.34-0.51,正好落在理想区间
  • 不要绕开多变量检验直接看单变量:哪怕 3 个 DV 单变量 ANOVA 都显著,也不能反过来说"MANOVA 必然显著";正确流程是先做 MANOVA,多变量显著后才展开单变量解读,并对单变量 ANOVA 的 p 值施加 Bonferroni 修正(α=0.05 / DV 数),否则会把多重比较的代价隐性转嫁。