案例数据
300 行 × 11 列:300 位大学生回答一道多选题 "选择手机品牌时考虑哪些因素?"(外观/性能/价格/拍照/续航/品牌/系统/售后 8 个选项,0/1 二元存储),并附 性别 / 月消费水平 两个分组变量,用于演示多重响应频次表 + 与分组变量的交叉分析 + 卡方检验。
| 文件名 | multiple.xlsx |
|---|---|
| 样本量 | 300 行(大学生消费者) |
| 变量数 | 11 列(用户ID + 8 选项 0/1 + 性别 + 月消费水平) |
| 数据用途 | 多选题 × 分组变量交叉,用于群体画像与差异化营销 |
| 分组变量 | 性别(男/女)、月消费水平(低/中/高三档) |
完整案例
1. 背景
多选题在问卷里常用于捕捉"购买动机/影响因素"等多元偏好——比如"选择手机品牌时考虑哪些因素?"。每位被访者可同时勾选多个选项,存储时拆为 8 个 0/1 二元列(多重二分法 multi-dichotomy,区别于多重分类法把名次编码为单列)。多重响应分析 的核心不是"哪个选项最高"那样的简单频次(这一步在 问卷研究 · 多选题分析 已覆盖),而是要把多选行为嵌入到分组变量(性别 / 消费水平 / 年龄段 ...)里做交叉,回答"不同人群的选择结构是否显著不同"——这正是市场细分与差异化策略的统计基础。响应% 用于结构对比,个案% 用于覆盖率,卡方检验则给出每个选项 × 分组是否独立的显著性证据。
2. 理论与公式
选项 j 占全部响应次数的比例(结构占比)。
选项 j 在样本中的覆盖率,合计常超 100%。
对每个选项 × 分组 2×k 列联表做独立性检验。
3. 数据结构
每行 1 位大学生,8 个选项列 用 0/1 编码(多重二分法),后面跟 2 个分组变量。同一行可同时有多个 1(这是多重响应与单选频数的本质区别):
| 列名 | 类型 | 说明 |
|---|---|---|
| 用户ID | 字符串 | S001 ~ S300,匿名编号 |
| 外观 / 性能 / 价格 / 拍照 | 0 / 1 | 前 4 个选项,1=该因素被考虑 |
| 续航 / 品牌 / 系统 / 售后 | 0 / 1 | 后 4 个选项,同样 0/1 二分法存储 |
| 性别 | 男 / 女 | 分组变量 1(2 水平) |
| 月消费水平 | 低 / 中 / 高 | 分组变量 2(3 水平:低<1000、中 1000-2000、高>2000 元) |
8 个选项列 不是 8 个独立变量 而是 1 道题的并列响应;不能直接放进回归或单变量卡方,需用专门的"多重响应集"来组合分析。
4. 操作步骤
- 登录 SPSSzero,进入 工作台 → 上传
multiple.xlsx - 左侧方法栏 → 进阶方法 → 点击 多选题多重响应分析
- 在 多重响应集 字段把 8 个选项列(外观/性能/价格/拍照/续航/品牌/系统/售后)全部拖入,确认 0/1 二分法
- 在 分组变量 字段先放 性别,运行第一次拿 2 水平交叉表;再换 月消费水平 拿 3 水平交叉表
- 勾选 卡方独立性检验(默认对每个选项 × 分组做 χ² 检验)与 响应% / 个案% 双列输出
- 点击 开始分析,结果区会输出频次表 + 性别交叉表 + 消费水平交叉表 + 显著性标记
5. 结果表格与结果阅读
结果分 3 张紧凑三线表:先看整体频次排序,再看性别差异(2 水平),最后看消费水平分层(3 水平)。
| 选项 | 响应数 | 响应% | 个案% | 排序 |
|---|---|---|---|---|
| 价格 | 180 | 15.58% | 60.00% | 1 |
| 外观 | 179 | 15.50% | 59.67% | 2 |
| 性能 | 163 | 14.11% | 54.33% | 3 |
| 续航 | 163 | 14.11% | 54.33% | 3 |
| 拍照 | 148 | 12.81% | 49.33% | 5 |
| 品牌 | 134 | 11.60% | 44.67% | 6 |
| 系统 | 97 | 8.40% | 32.33% | 7 |
| 售后 | 91 | 7.88% | 30.33% | 8 |
| 合计 | 1155 | 100.00% | 385.00% | — |
头部 价格 (60.00%) 与 外观 (59.67%) 几乎并驾齐驱;性能/续航并列第 3(54.33%);系统、售后处于尾部 30% 区间。个案% 合计 385% 大幅超过 100%,说明每位大学生平均关心约 3.85 个因素。
| 选项 | 男% | 女% | 差值 | χ² | p | 显著性 |
|---|---|---|---|---|---|---|
| 外观 | 39.53% | 74.85% | +35.3pp | 38.114 | <0.001 | *** |
| 性能 | 73.64% | 39.77% | −33.9pp | 34.011 | <0.001 | *** |
| 价格 | 57.36% | 61.99% | +4.6pp | 0.655 | 0.418 | n.s. |
| 拍照 | 31.01% | 63.16% | +32.2pp | 30.407 | <0.001 | *** |
| 续航 | 59.69% | 50.29% | −9.4pp | 2.617 | 0.106 | n.s. |
| 品牌 | 43.41% | 45.61% | +2.2pp | 0.144 | 0.704 | n.s. |
| 系统 | 54.26% | 15.79% | −38.5pp | 49.748 | <0.001 | *** |
| 售后 | 25.58% | 33.92% | +8.3pp | 2.418 | 0.120 | n.s. |
| 每行对该选项 0/1 × 性别做 Pearson χ²(无连续校正);* p<.05,** p<.01,*** p<.001,n.s. 不显著 | ||||||
4 项显著差异:女生显著更看重 外观(+35.3pp)/ 拍照(+32.2pp),男生显著更看重 性能(+33.9pp)/ 系统(+38.5pp);价格、续航、品牌、售后 4 项性别差异不显著(p>.05),说明它们是男女共同的基础需求。
| 选项 | 低% | 中% | 高% | χ² | p | 显著性 |
|---|---|---|---|---|---|---|
| 价格 | 82.35% | 62.59% | 30.26% | 46.087 | <0.001 | *** |
| 品牌 | 27.06% | 47.48% | 59.21% | 17.613 | <0.001 | *** |
| 外观 | 50.59% | 58.99% | 71.05% | 7.031 | 0.030 | * |
| 性能 | 50.59% | 49.64% | 67.11% | 6.711 | 0.035 | * |
| 拍照 | 42.35% | 48.20% | 59.21% | 4.695 | 0.096 | n.s. |
| 售后 | 27.06% | 26.62% | 40.79% | 5.271 | 0.072 | n.s. |
| 续航 | 56.47% | 53.96% | 52.63% | 0.253 | 0.881 | n.s. |
| 系统 | 28.24% | 34.53% | 32.89% | 0.971 | 0.616 | n.s. |
| 按 p 升序展示前 4 项;价格 / 品牌 高低反向(消费水平越低越关注价格、越高越关注品牌) | ||||||
最强分层信号是 价格:低消费 82.35% → 高消费 30.26%(净降 52pp,χ²=46.087,p<.001);品牌 反向,27.06% → 59.21%(净升 32pp,χ²=17.613,p<.001);外观、性能在高消费组也显著抬升。续航、系统在三档之间没有显著差异。
7. 文字分析
对 300 位大学生 8 个手机购买考虑因素的多重响应分析综合结论:
- 整体偏好:总响应 1155,平均每人选 3.85 个因素;头部 价格 60.00% / 外观 59.67% / 性能=续航 54.33% 构成"决策铁三角",系统 32.33% / 售后 30.33% 排名末尾。
- 性别画像:女生显著更看 外观 (74.85% vs 39.53%) / 拍照 (63.16% vs 31.01%),男生显著更看 性能 (73.64% vs 39.77%) / 系统 (54.26% vs 15.79%),4 项 χ²>30(p<.001);价格、续航、品牌、售后 4 项性别一致,是男女通用基础需求。
- 消费分层:价格 与 品牌 出现显著反向梯度——低消费组 82.35% 关注价格、仅 27.06% 关注品牌;高消费组 30.26% 关注价格、却 59.21% 关注品牌(χ² 分别为 46.087 / 17.613,p<.001);说明消费层级是"价格敏感↔品牌敏感"的核心切分轴。
- 群体画像:综合 2 个分组维度,女生 + 中高消费 群体最关注外观与拍照、品牌;男生 + 高消费 最关注性能与系统;低消费 群体(无论性别)以价格为绝对核心(82.35% 居所有交叉单元最高)。
- 营销建议:① 主打"颜值+影像"机型应优先面向女生与中高消费群(占样本约 40%);② 性能+系统旗舰应聚焦男生 + 高消费用户;③ 价位敏感的入门机型应突出价格优势锁定低消费组;④ 续航、售后属于"沉默基础项",建议作为通用文案兜底而非差异化卖点。
8. 剖析提醒
① 多选题不能整体当一个变量做卡方:本页采用的做法是"每个选项 0/1 单独 × 分组"做 8 次 2×k 列联表 χ²,得到每个选项的独立显著性;不要把 8 个选项合并成 1 个多类别变量。② SPSS 默认对 2×2 表使用 Yates 连续校正(continuity correction),本页结果遵循经典"无连续校正"的 Pearson χ²,所以与 SPSS 默认 2×2 输出可能相差 ~0.01;当两选项都是 2×2 时 SPSS 还会自动给出 Fisher 精确检验,可作为小样本备选。③ 多次比较问题:本案例对每个分组变量做了 8 次 χ²,整体犯第一类错误的概率会膨胀,严谨写作应做 Bonferroni 校正(阈值 0.05/8≈0.006),按这个更严苛的阈值,性别上 4 项依然显著、消费水平上 2 项依然显著。④ 若想做两组之间响应% 是否相等的检验,SPSS 多重响应 → 比较列比例(z-test for column proportions) 是更直接的等价工具,与本页 2×2 χ² 同源。