| 文件名 | dataprocess_labels.xlsx |
|---|---|
| 数据用途 | 数据标签案例数据 |
| 变量说明 | data 工作表为样本数据,tags 工作表记录变量、数字和标签三列映射。 |
完整案例
1. 背景
上传后的分类变量以数字编码保存,结果表中直接显示 1、2、3 不便阅读,需要给编码补充含义。
2. 理论与公式
数据标签用于给分类编码补充可读含义。分析时仍使用原数字,展示时按标签映射显示。
标签映射
当编码值等于 k 时,结果展示为对应标签。
分析值不变
设置标签不会改变用于计算的原始数字。
3. 数据结构
data 工作表为样本数据,tags 工作表记录变量、数字和标签三列映射。
4. 操作步骤与截图
- 上传案例数据
- 进入数据标签
- 选择 gender、education、channel 等定类变量
- 填写数字与标签的对应关系
- 回到频数或交叉表查看标签展示

5. 结果表格与核验
| 变量 | 数字 | 标签 | 用途 |
|---|---|---|---|
| gender | 1 | 男 | 频数和交叉表展示 |
| gender | 2 | 女 | 频数和交叉表展示 |
| education | 4 | 本科 | 分组比较展示 |
标签只改变展示,不改变底层数据值。
重点确认标签只影响展示,不改变原始数字编码;带标签的变量在结果表中应显示清晰类别名称。
6. 辅助截图


7. 文字分析
设置数据标签后,分类变量在分析结果中由数字编码转换为可读文本,提高了交叉表、频数表和模型结果的解释性。
8. 剖析提醒
数据标签不等于数据编码。标签只负责显示含义,编码才会改变变量取值。