| 文件名 | histogram.xlsx |
|---|---|
| 数据用途 | 直方图案例数据 |
| 变量说明 | 分析项为连续变量,可按需设置分箱数或叠加正态曲线。 |
完整案例
1. 背景
研究者希望在正式检验前直观查看变量分布是否接近正态或是否存在极端值。
2. 理论与公式
直方图把连续数据按区间分箱,使用柱形高度表示每个区间的频数或比例。
分箱频数
统计每个区间内的样本数。
频率
将频数转为比例。
组距
组距影响分布形态展示。
3. 数据结构
分析项为连续变量,可按需设置分箱数或叠加正态曲线。
4. 操作截图
- 上传案例数据
- 选择直方图
- 放入连续变量
- 按需设置分箱或正态曲线
- 点击开始分析

5. 结果表格与结果阅读
| 区间 | 频数 | 比例 | 累计比例 |
|---|---|---|---|
| [0, 2) | 14 | 7.00% | 7.00% |
| [2, 4) | 86 | 43.00% | 50.00% |
| [4, 6) | 72 | 36.00% | 86.00% |
分箱结果用于辅助判断变量分布和集中区间。
重点查看峰值位置、分布形态、是否偏斜和尾部是否异常。
6. 辅助截图


7. 文字分析
直方图显示,变量主要集中在中间区间,整体近似钟形分布,未见严重偏态。
8. 剖析提醒
分箱数会影响视觉效果;样本量较小时不宜仅凭直方图判断正态性。