问卷研究

组内评分者信度rwg

案例数据

191 行 × 6 列嵌套结构数据,30 个工作团队(每团队 5-8 名成员),4 个团队凝聚力维度(Likert 1-5)。检验各团队成员对自己团队"团队凝聚力"评分是否足够一致,从而判断个体评分能否聚合为团队层面变量。

文件名rwg.xlsx
样本量191 行(30 个团队,平均 6.4 名成员/团队)
变量数6 列(团队ID + 成员ID + 4 个凝聚力维度评分)
数据用途组织行为研究:检验团队成员内部对"团队凝聚力"的感知是否一致,能否将个体评分聚合到团队层面
变量说明团队ID(分组变量)、成员ID(标识列)、团结协作 / 沟通顺畅 / 信任氛围 / 目标一致(4 个 Likert 1-5 评分维度)。

完整案例

1. 背景

某 HR 研究院对一家集团下属 30 个工作团队做"团队凝聚力"调研,每个团队 5-8 名成员对自己团队的 4 个凝聚力维度评分(团结协作 / 沟通顺畅 / 信任氛围 / 目标一致,Likert 1-5)。研究院的下一步是把成员评分聚合到团队层面,与团队绩效、离职率等团队级指标做关联分析。但聚合的前提条件是:同一团队成员对本团队的评分要足够一致——如果一个团队内部分歧巨大(有人打 5 分有人打 1 分),那么把成员评分简单平均成"团队凝聚力"就失去了意义。本案例用 rwg(J) 检验三个关键问题:①每个团队的成员评分是否一致(rwg ≥ 0.70 即达标)?②达标团队占比是否足够支持后续聚合分析?③不达标的团队是否存在某种系统性原因(如新老员工分歧、领导更替)?

2. 理论与公式

rwg(James, Demaree & Wolf, 1984)比较"观测到的组内评分方差"与"如果评分完全随机时的期望方差",差距越大说明组内一致性越高。多维度题项使用 rwg(J) 进一步对 J 个题项加权。

单项 rwg

S_x² 为组内单题项方差,σ_EU² 为均匀分布期望方差,5 点量表 σ_EU² = (5²−1)/12 = 2.0。

多题项 rwg(J)

J 为题项数,对单项 rwg 做 Spearman-Brown 式校正得到更稳定的组级估计值。

判定阈值

James 推荐:>0.70 强一致、0.5-0.7 中等、<0.5 弱一致;强一致才宜聚合到团队层面分析。

3. 数据结构

每行 1 名团队成员的 4 维度评分,全部为 Likert 1-5。团队ID 是关键分组变量,rwg 在此变量下分组计算;4 个评分列共同构成一个潜在构念"团队凝聚力":

变量名角色说明
团队ID分组变量1-30,每个团队 5-8 名成员,rwg 按团队分组计算
成员ID标识列1-191,仅用于追溯个体,不参与计算
团结协作评分项 1"我们团队成员相互配合、共同完成任务"(1-5)
沟通顺畅评分项 2"团队内部信息流转及时、表达清晰"(1-5)
信任氛围评分项 3"我相信团队成员的能力和动机"(1-5)
目标一致评分项 4"团队成员对核心目标的理解高度一致"(1-5)

rwg 的数据结构与一般问卷不同:每行 1 名个体评分,需通过分组变量识别"组"。组内人数不少于 5 名更稳健;4 个题项需测量同一构念才能用 rwg(J)。本数据每团队 5-8 人均符合要求。

4. 操作步骤

  1. 登录 SPSSzero,进入 工作台 → 上传 rwg.xlsx
  2. 左侧方法栏 → 问卷研究 → 点击 组内评分者信度 rwg
  3. 团队ID 拖入 组号变量,把 团结协作 / 沟通顺畅 / 信任氛围 / 目标一致 4 列同时拖入 评分变量(多选)
  4. 设置 量表等级数 = 5(本数据为 Likert 1-5)
  5. 点击 开始分析

5. 结果表格与结果阅读

结果区按 rwg(J) 由高到低分组输出。下面用 2 张紧凑三线表展示(30 行总览节选 + 整体汇总):

表1 各团队 rwg(J) 节选(达标 28 / 边缘 3 / 不达标 2 的代表团队,共 30 组)
团队IDn团结协作沟通顺畅信任氛围目标一致rwg(J)判定
—— 强一致代表(Top 5)——
团队 2160.8501.0000.9171.0000.985强一致 ✓
团队 280.8930.9380.8930.9380.977强一致 ✓
团队 671.0000.8330.9290.8810.976强一致 ✓
团队 1650.9000.9000.9000.8500.969强一致 ✓
团队 2770.8811.0000.7620.8810.967强一致 ✓
—— 边缘达标(rwg 0.70-0.85,需审视)——
团队 2460.2670.5170.5170.5170.769边缘 △
团队 2860.4670.8500.4500.2670.805边缘 △
团队 2580.5090.3660.5800.6520.817边缘 △
—— 不达标(rwg < 0.50,不可聚合)——
团队 1860.0000.0000.0000.0000.000不达标 ✗
团队 950.0000.0000.3500.0000.000不达标 ✗
完整 30 团队结果见在线分析输出;rwg(J) 阈值:>0.70 强一致、0.5-0.7 中等、<0.5 弱一致

关键观察:①绝大多数团队(28/30 = 93.3%)rwg(J) ≥ 0.70 可聚合;②团队 9 与团队 18 单项 rwg 几乎为 0,组内方差接近均匀分布的 σ²EU = 2.0,表明成员对凝聚力评价高度分裂;③团队 24/25/28 虽过 0.70 门槛,但单项 rwg 多在 0.3-0.5 之间,rwg(J) 是 Spearman-Brown 校正抬高的"虚高",使用聚合数据时应单独标注。

表2 整体汇总(30 个团队,4 个题项,量表 1-5)
汇总指标含义与判定
达标团队数28 / 30rwg(J) ≥ 0.70 的团队占 93.3%,整体可聚合
所有团队平均 rwg(J)0.873远高于 0.70 阈值,组内一致性整体良好
不达标团队团队 9、团队 18rwg(J) = 0.000,建议剔除或单独诊断
团结协作 单项 rwg 均值0.7354 维度中略低,提示该维度组内分歧相对最大
沟通顺畅 单项 rwg 均值0.7574 维度中最高,组内对此项感知最一致
信任氛围 单项 rwg 均值0.742中等偏上
目标一致 单项 rwg 均值0.755中等偏上
ICC(1)0.494团队间差异占总方差 49.4%,团队效应明显,支持团队层面建模
ICC(2)0.861团队均值的可靠性高(>0.70 即可),聚合后的均值可信
rwg(J) 反映组内一致性,ICC(1)/(2) 反映组间区分度和组均值可靠性;三者共同支持团队层面聚合分析的合理性

7. 文字分析

对 30 个工作团队"团队凝聚力"4 维度评分的组内一致性 rwg(J) 综合分析:

  • 整体一致性:30 个团队的 rwg(J) 平均为 0.873,远高于 James(1984)推荐的 0.70 强一致阈值,提示集团内"团队凝聚力"在多数团队内部达成了共识;
  • 达标比例:28 / 30 团队(93.3%)rwg(J) ≥ 0.70,符合可聚合标准;2 个团队(团队 9 与团队 18)rwg(J) = 0.000 严重不达标,组内方差几乎与均匀分布的 σ²EU = 2.0 持平,意味着成员对凝聚力的评价从 1 分到 5 分都有;
  • 维度差异:4 个题项的单项 rwg 平均介于 0.735-0.757 之间,"团结协作"维度组内分歧相对最大(0.735),"沟通顺畅"维度组内最一致(0.757),建议后续聚合时对前者保留个体级别变异;
  • 组间区分度:ICC(1) = 0.494 表明团队间差异占总方差的 49.4%,团队效应非常显著,支持将凝聚力作为团队层面变量进入后续建模;ICC(2) = 0.861 表示团队均值的可靠性高,聚合后的"团队凝聚力"可作为稳定的预测变量;
  • 边缘案例:团队 24(rwg = 0.769)、团队 28(rwg = 0.805)、团队 25(rwg = 0.817)虽过门槛,但单项 rwg 多在 0.3-0.5,rwg(J) 通过 Spearman-Brown 校正抬升,使用聚合数据时建议单独标注或剔除。

结论:整体一致性达标(rwg(J) = 0.873,ICC(2) = 0.861),可以将 28 个达标团队的成员评分聚合为团队级"团队凝聚力"变量,进入与团队绩效、流失率等团队级因变量的关联分析。团队 9 与团队 18 应排除聚合并单独诊断——这两个团队的成员对凝聚力评价两极分化,可能存在小派系、领导更替或新老员工分歧等典型组织问题,建议 HR 介入做团队建设干预(如团队工作坊、领导一对一访谈)。建模时也可保留这两个团队作为"非聚合个案"做对比分析。

8. 剖析提醒

rwg 依赖组内样本量量表等级数:组内 < 5 人时 rwg 估计方差大,应谨慎;量表等级数填写错误(如把 7 点量表填成 5 点)会显著改变 σ²EU 进而影响所有结果。rwg(J) 通过 Spearman-Brown 式校正可能"放大"中等一致性,建议同时报告单项 rwg 与 rwg(J) 以避免误判。即使 rwg 达标也不代表"评价正确",仅表示成员之间一致——可能集体高估或低估。