方差(variance)，标准差(SD)，变异系数(CV)，CPK

博主： sharkyzh
发布时间：2025 年 11 月 08 日
22 次浏览
3969字数
分类：工业

这些都是统计学和质量管理中至关重要的指标。本文详细解释它们各自的含义、计算方式以及它们之间的区别和联系。

1. 方差 (Variance)

核心概念：衡量“离散程度”的基础。

它是什么？
方差是用来衡量一组数据与其平均值偏离程度的指标。它量化了数据点的分散情况。
如何理解？
- 方差很小： 意味着数据点都非常紧密地聚集在平均值（Mean）周围。
- 方差很大： 意味着数据点非常分散，分布范围很广，距离平均值忽远忽近。
计算方式（概念上）：
1. 算出这组数据的平均值 (μ)。
2. 计算每个数据点到平均值的距离（即 数据点 - μ）。
3. 将这些距离平方（这有两个目的：a. 消除负号；b. 放大远离平均值的点的影响）。
4. 将所有这些“平方距离”加起来，再除以数据点的总个数 (N)，得到平均的“平方距离”。
$$\text{Variance} (\sigma^2) = \frac{\sum (x_i - \mu)^2}{N}$$
(注：在统计抽样中，分母常用 n-1 进行无偏估计，但在描述整组数据时用 N)
主要问题：
方差的单位是原始数据单位的平方。例如，如果您的数据是“厘米 (cm)”，方差的单位就是“平方厘米 (cm²)”。这在实际中非常不直观，很难解释“50 平方厘米的波动”是什么意思。

2. 标准差 (Standard Deviation, SD)

核心概念：最常用、最直观的“波动”指标。

它是什么？
标准差就是方差的平方根。它解决了方差“单位是平方”的问题。
如何理解？
标准差告诉您，数据点“平均”会偏离平均值多远。
- 标准差很小 (如 0.1)： 数据非常稳定，几乎都挤在平均值旁边。
- 标准差很大 (如 20)： 数据波动非常剧烈。
计算方式：
$$\text{Standard Deviation} (\sigma) = \sqrt{\text{Variance}}$$
为什么它如此重要？
1. 单位直观： 它的单位与原始数据完全相同。如果数据是“厘米”，标准差就是“厘米”。您可以说“平均波动范围是 ±5 厘米”。
2. 黄金法则（正态分布）： 在许多工业数据（正态分布）中，标准差有明确的统计意义：
  - 约 68% 的数据在 平均值 ± 1个标准差 范围内。
  - 约 95% 的数据在 平均值 ± 2个标准差 范围内。
  - 约 99.7% 的数据在 平均值 ± 3个标准差 范围内。
    （这就是六西格玛中 "6σ" 的来源基础，即 ±6 个标准差几乎包含了所有数据）。

3. 变异系数 (Coefficient of Variation, CV)

核心概念：衡量“相对波动”的指标。

它是什么？
变异系数是标准差 (SD) 除以平均值 (Mean) 的结果，通常以百分比表示。
如何理解？V.S. 标准差
标准差衡量的是绝对的波动。
变异系数衡量的是相对的波动。
为什么需要它？（关键用途）
CV 的唯一目的，是在不同尺度（不同平均值）或不同单位的数据之间，比较它们的稳定性。
- 举例：
  A 组：测量大象体重。平均值 5000 公斤，标准差 100 公斤。
  B 组：测量老鼠体重。平均值 0.5 公斤，标准差 0.1 公斤。
- 问：哪个过程更“稳定”？
  - 如果只看标准差 (SD)，A (100kg) 远大于 B (0.1kg)，似乎 A 更不稳定。
  - 但我们计算 CV：
    - CV (A) = (100 / 5000) * 100% = 2%
    - CV (B) = (0.1 / 0.5) * 100% = 20%
  - 结论： A 组（大象）的相对波动只有 2%，而 B 组（老鼠）的相对波动高达 20%。因此，A 组（大象体重）的过程实际上远比 B 组（老鼠体重）更稳定！
计算方式：
$$\text{CV} = \left( \frac{\text{Standard Deviation}}{\text{Mean}} \right) \times 100\%$$

4. CPK (Process Capability Index)

核心概念：衡量过程“满足客户要求”的能力。

CPK 是质量管理（QC）中最核心的指标之一。它不再只关心数据自己（像前三者那样），而是引入了“客户的规格要求”。

它是什么？
CPK 衡量的是，在考虑了过程波动 (SD) 和过程偏移 (Mean) 之后，您的生产过程距离“客户规格界限”有多远。
需要哪些信息？
1. 客户要求 (规格):
  - USL (Upper Specification Limit): 规格上限（客户能接受的最大值）。
  - LSL (Lower Specification Limit): 规格下限（客户能接受的最小值）。
2. 你的过程 (统计量):
  - μ (Mean): 你实际生产的平均值。
  - σ (SD): 你实际生产的标准差。
如何理解？（车库比喻）
- 车库宽度 (USL - LSL): 客户允许的范围。
- 你的车宽 (约 6σ): 你过程的自然波动范围 (99.7% 的产品)。
- 你停车的位置 (μ): 你的平均值。
CPK 衡量的是：你的车停好后，车身距离“最近一侧”的车库墙壁，还有多少安全空间。
计算方式：
CPK 分两步计算，然后取最小值（因为它关心最危险的那一侧）：
1. C_pu (上侧能力): $(USL - \mu) / 3\sigma$
  - （看你的均值离“上限”有多远，这个距离能容纳多少个 "3σ"）
2. C_pl (下侧能力): $(\mu - LSL) / 3\sigma$
  - （看你的均值离“下限”有多远，这个距离能容纳多少个 "3σ"）
$$\text{CPK} = \min [ \text{C}_{pu}, \text{C}_{pl} ]$$
CPK 值的含义：
- CPK < 1.0: 能力不足 (车撞墙了)。过程已经生产出了超出规格的不良品。
- CPK = 1.0: 能力刚好 (车贴墙了)。过程的边缘 (±3σ) 刚好碰到规格的边缘。任何波动都会产生不良品，风险极高。
- CPK = 1.33: 能力合格 (有缓冲)。这是许多行业的最低可接受标准。
- CPK > 1.67: 能力优秀。
- CPK = 2.0: 六西格玛水平。意味着过程均值完美居中，且过程波动 (6σ) 仅占规格公差的一半，极其稳定。

总结：四个指标的区别

指标	衡量什么？	单位	它关心“客户规格”吗？
方差 (Variance)	数据的绝对离散程度	原始单位的平方	否
标准差 (SD)	数据的绝对离散程度（直观）	原始单位	否
变异系数 (CV)	数据的相对离散程度（用于比较）	百分比 (无单位)	否
CPK	过程满足规格的能力（考虑了偏移）	数值 (无单位)	是 (核心)

简单来说：

方差和 标准差 告诉你：“你的数据有多么不稳定？”（标准差更直观）
CV 告诉你：“相比于你的平均值，你的数据有多么不稳定？”（用于比较）
CPK 告诉你：“你的不稳定性，会不会导致你撞上客户的底线？”（用于品控）

最后修改：2025 年 11 月 08 日

如果觉得我的文章对你有用，请随意赞赏

方差(variance)，标准差(SD)，变异系数(CV)，CPK

sharkyzh • 2025 年 11 月 08 日

这些都是统计学和质量管理中至关重要的指标。本文详细解释它们各自的含义、计算方式以及它们之间的区别和联系。<hr><h3>1. 方差 (Variance)</h3>核心概念：衡量“离散程度”的基础。<ul><li>它是什么？ 方差是用来衡量一组数据与其平均值偏离程度的指标。它量化了数据点的分散情况。</li><li>如何理解？<ul><li>方差很小： 意味着数据点都非常紧密地聚集在平均值（Mean）周围。</li><li>方差很大： 意味着数据点非常分散，分布范围很广，距离平均值忽远忽近。</li></ul></li><li>计算方式（概念上）：<ol><li>算出这组数据的平均值 (μ)。</li><li>计算每个数据点到平均值的距离（即 <code>数据点 - μ</code>）。</li><li>将这些距离平方（这有两个目的：a. 消除负号；b. 放大远离平均值的点的影响）。</li><li>将所有这些“平方距离”加起来，再除以数据点的总个数 (N)，得到平均的“平方距离”。</li></ol>$$\text{Variance} (\sigma^2) = \frac{\sum (x_i - \mu)^2}{N}$$ (注：在统计抽样中，分母常用 n-1 进行无偏估计，但在描述整组数据时用 N)</li><li>主要问题： 方差的单位是原始数据单位的平方。例如，如果您的数据是“厘米 (cm)”，方差的单位就是“平方厘米 (cm²)”。这在实际中非常不直观，很难解释“50 平方厘米的波动”是什么意思。</li></ul><hr><h3>2. 标准差 (Standard Deviation, SD)</h3>核心概念：最常用、最直观的“波动”指标。<ul><li>它是什么？ 标准差就是方差的平方根。它解决了方差“单位是平方”的问题。</li><li>如何理解？ 标准差告诉您，数据点“平均”会偏离平均值多远。<ul><li>标准差很小 (如 0.1)： 数据非常稳定，几乎都挤在平均值旁边。</li><li>标准差很大 (如 20)： 数据波动非常剧烈。</li></ul></li><li>计算方式： $$\text{Standard Deviation} (\sigma) = \sqrt{\text{Variance}}$$</li><li>为什么它如此重要？<ol><li>单位直观： 它的单位与原始数据完全相同。如果数据是“厘米”，标准差就是“厘米”。您可以说“平均波动范围是 ±5 厘米”。</li><li>黄金法则（正态分布）： 在许多工业数据（正态分布）中，标准差有明确的统计意义：<ul><li>约 68% 的数据在 <code>平均值 ± 1个标准差</code> 范围内。</li><li>约 95% 的数据在 <code>平均值 ± 2个标准差</code> 范围内。</li><li>约 99.7% 的数据在 <code>平均值 ± 3个标准差</code> 范围内。 （这就是六西格玛中 "6σ" 的来源基础，即 ±6 个标准差几乎包含了所有数据）。</li></ul></li></ol></li></ul><hr><h3>3. 变异系数 (Coefficient of Variation, CV)</h3>核心概念：衡量“相对波动”的指标。<ul><li>它是什么？ 变异系数是标准差 (SD) 除以平均值 (Mean) 的结果，通常以百分比表示。</li><li>如何理解？V.S. 标准差 标准差衡量的是绝对的波动。 变异系数衡量的是相对的波动。</li><li>为什么需要它？（关键用途） CV 的唯一目的，是在不同尺度（不同平均值）或不同单位的数据之间，比较它们的稳定性。<ul><li>举例： A 组：测量大象体重。平均值 5000 公斤，标准差 100 公斤。 B 组：测量老鼠体重。平均值 0.5 公斤，标准差 0.1 公斤。</li><li>问：哪个过程更“稳定”？<ul><li>如果只看标准差 (SD)，A (100kg) 远大于 B (0.1kg)，似乎 A 更不稳定。</li><li>但我们计算 CV：<ul><li>CV (A) = (100 / 5000) * 100% = 2%</li><li>CV (B) = (0.1 / 0.5) * 100% = 20%</li></ul></li><li>结论： A 组（大象）的相对波动只有 2%，而 B 组（老鼠）的相对波动高达 20%。因此，A 组（大象体重）的过程实际上远比 B 组（老鼠体重）更稳定！</li></ul></li></ul></li><li>计算方式： $$\text{CV} = \left( \frac{\text{Standard Deviation}}{\text{Mean}} \right) \times 100\%$$</li></ul><hr><h3>4. CPK (Process Capability Index)</h3>核心概念：衡量过程“满足客户要求”的能力。CPK 是质量管理（QC）中最核心的指标之一。它不再只关心数据自己（像前三者那样），而是引入了“客户的规格要求”。<ul><li>它是什么？ CPK 衡量的是，在考虑了过程波动 (SD) 和过程偏移 (Mean) 之后，您的生产过程距离“客户规格界限”有多远。</li><li>需要哪些信息？<ol><li>客户要求 (规格):<ul><li>USL (Upper Specification Limit): 规格上限（客户能接受的最大值）。</li><li>LSL (Lower Specification Limit): 规格下限（客户能接受的最小值）。</li></ul></li><li>你的过程 (统计量):<ul><li>μ (Mean): 你实际生产的平均值。</li><li>σ (SD): 你实际生产的标准差。</li></ul></li></ol></li><li>如何理解？（车库比喻）<ul><li>车库宽度 (USL - LSL): 客户允许的范围。</li><li>你的车宽 (约 6σ): 你过程的自然波动范围 (99.7% 的产品)。</li><li>你停车的位置 (μ): 你的平均值。</li></ul>CPK 衡量的是：你的车停好后，车身距离“最近一侧”的车库墙壁，还有多少安全空间。</li><li>计算方式： CPK 分两步计算，然后取最小值（因为它关心最危险的那一侧）：<ol><li>C_pu (上侧能力): $(USL - \mu) / 3\sigma$<ul><li>（看你的均值离“上限”有多远，这个距离能容纳多少个 "3σ"）</li></ul></li><li>C_pl (下侧能力): $(\mu - LSL) / 3\sigma$<ul><li>（看你的均值离“下限”有多远，这个距离能容纳多少个 "3σ"）</li></ul></li></ol>$$\text{CPK} = \min [ \text{C}_{pu}, \text{C}_{pl} ]$$</li><li>CPK 值的含义：<ul><li>CPK &lt; 1.0: 能力不足 (车撞墙了)。过程已经生产出了超出规格的不良品。</li><li>CPK = 1.0: 能力刚好 (车贴墙了)。过程的边缘 (±3σ) 刚好碰到规格的边缘。任何波动都会产生不良品，风险极高。</li><li>CPK = 1.33: 能力合格 (有缓冲)。这是许多行业的最低可接受标准。</li><li>CPK &gt; 1.67: 能力优秀。</li><li>CPK = 2.0: 六西格玛水平。意味着过程均值完美居中，且过程波动 (6σ) 仅占规格公差的一半，极其稳定。</li></ul></li></ul><hr><h3>总结：四个指标的区别</h3><table><thead><tr><th align="left">指标</th><th align="left">衡量什么？</th><th align="left">单位</th><th align="left">它关心“客户规格”吗？</th></tr></thead><tbody><tr><td align="left">方差 (Variance)</td><td align="left">数据的绝对离散程度</td><td align="left">原始单位的平方</td><td align="left">否</td></tr><tr><td align="left">标准差 (SD)</td><td align="left">数据的绝对离散程度（直观）</td><td align="left">原始单位</td><td align="left">否</td></tr><tr><td align="left">变异系数 (CV)</td><td align="left">数据的相对离散程度（用于比较）</td><td align="left">百分比 (无单位)</td><td align="left">否</td></tr><tr><td align="left">CPK</td><td align="left">过程满足规格的能力（考虑了偏移）</td><td align="left">数值 (无单位)</td><td align="left">是 (核心)</td></tr></tbody></table>简单来说：<ul><li>方差 和 标准差 告诉你：“你的数据有多么不稳定？”（标准差更直观）</li><li>CV 告诉你：“相比于你的平均值，你的数据有多么不稳定？”（用于比较）</li><li>CPK 告诉你：“你的不稳定性，会不会导致你撞上客户的底线？”（用于品控）</li></ul>

方差(variance)，标准差(SD)，变异系数(CV)，CPK

1. 方差 (Variance)

2. 标准差 (Standard Deviation, SD)

3. 变异系数 (Coefficient of Variation, CV)

4. CPK (Process Capability Index)

总结：四个指标的区别

windows查看与关闭nginx命令

CentOS7查看和关闭防火墙

Centos7安装与配置supervisor

Linux新增磁盘、分区、格式化和自动挂载

ngrok配置supervisor进程守护

VisualStudio配合ngrok在本地调试微信

Protobuf 消息值类型等效C#类型

解决Android Studio 控制台编译输出中文乱码

Tauri读取webapi接口

ngrok配置supervisor进程守护

方差(variance)，标准差(SD)，变异系数(CV)，CPK