可视化

SPSS直方图

案例数据

连续变量数据,用于查看频数分布、偏态、峰态和异常区间。

文件名histogram.xlsx
数据用途直方图案例数据
变量说明分析项为连续变量,可按需设置分箱数或叠加正态曲线。

完整案例

1. 背景

研究者希望在正式检验前直观查看变量分布是否接近正态或是否存在极端值。

2. 理论与公式

直方图把连续数据按区间分箱,使用柱形高度表示每个区间的频数或比例。

分箱频数

统计每个区间内的样本数。

频率

将频数转为比例。

组距

组距影响分布形态展示。

3. 数据结构

分析项为连续变量,可按需设置分箱数或叠加正态曲线。

4. 操作截图

  1. 上传案例数据
  2. 选择直方图
  3. 放入连续变量
  4. 按需设置分箱或正态曲线
  5. 点击开始分析
直方图变量设置截图
直方图变量设置截图

5. 结果表格与结果阅读

表1 直方图分箱示例
区间频数比例累计比例
[0, 2)147.00%7.00%
[2, 4)8643.00%50.00%
[4, 6)7236.00%86.00%

分箱结果用于辅助判断变量分布和集中区间。

重点查看峰值位置、分布形态、是否偏斜和尾部是否异常。

6. 辅助截图

直方图结果
直方图结果
正态分布参考图
正态分布参考图

7. 文字分析

直方图显示,变量主要集中在中间区间,整体近似钟形分布,未见严重偏态。

8. 剖析提醒

分箱数会影响视觉效果;样本量较小时不宜仅凭直方图判断正态性。