標題 壓縮

標準差及CV值是什麼?(概念+範例) 1次搞懂!

常常看了標準差及CV值個別的定義後,依然不理解它們各自所代表的意義,但透過範例,這兩者的區別就能夠顯得清楚且容易記得!本篇文章會先個別說明標準差及CV值的概念,搭配範例一起看,就能更明白它們的用法!

一、標準差(Standard Deviation, SD)

概念

  • 標準差是用來衡量一組資料中〝各數值與平均數之間的離散程度〞。
  • 它表示資料〝分散〞或〝穩定〞的程度。
  • 標準差小:資料大多集中在平均值附近。
  • 標準差大:資料分佈較廣,差異較大。

以下有兩組數據:

A組:10, 12, 11, 13, 14
B組:5, 10, 15, 20, 25

我們可以發現,A組的數字比較接近,而B組的數字變化較大。
則可以得知A組的標準差比較小,因為數字比較集中;B組的標準差比較大,因為數字變化較多。

公式

image

SD:樣本標準差
Xi:第 i 個數值
x:平均值
n:資料筆數

例題

第一題

以下為3位學生的考試分數,請說明它們的標準差。

學生分數
A78
B80
C82
解釋

分數平均值 = 80
每個分數與平均值的差異為:-2、0、+2
標準差 = √[( (-2)² + 0² + 2² ) / (3-1)] = √(8/2) = 2 標準差 = 2,表示分數大致都靠近平均值。

第二題

以下為2班的分數資訊,請比較A班與B班哪一班的分數比較分散。

A 班考試:平均 80,標準差 2
B 班考試:平均 80,標準差 10

解釋

表示A 班幾乎都在 78~82 分,B 班分數分散到有蠻多人60分左右,也有蠻多人100分左右
所以綜合來說,A班和B班相比,B班的分數更〝分散〞。

二、變異係數(Coefficient of Variation, CV)

概念

  • 變異係數是〝標準差與平均值的比率〞,也就是〝波動相對於平均值有多大〞,可以用來比較不同資料集的相對變異程度。
  • 它能排除平均值不同所造成的影響(這點搭配範例會比較好理解)。

公式

image 1

SD:標準差
x:平均值

例題

第一題

A和B每天走路的資訊如下,請說明誰的步數比較穩定。
A每天走10000步,浮動在±500步
B每天走1000步,浮動在±500步

解釋

因為他們的浮動都是±500步,表示A和B的標準差相同。
但是因為A和B的平均步數不同,所以若要比較他們散步的步數浮動相對於平均步數有多大,就必須從CV值來判斷。
A的CV值為500/10000=5%
B的CV值為500/1000=50%
表示A的步數穩定(浮動較小),B的步數不穩定(浮動較大)。

第二題

在商品價格會浮動的情況下,以下為2項商品的平均價格、標準差及CV值,請說明哪一項商品的價格浮動較穩定。

商品平均價格標準差CV值
A10220%
B10055%
解釋

雖然B的標準差較大,但 CV 較小,表示商品B價格的相對變動較穩定。

由上述範例可以得知,在平均值不一樣時,光看標準差不好進行比較,所以需要由CV來進行判斷。

第三題

以下為2組人的身高數據,請分別比較2個組別的標準差及CV值。
組別 X:150 cm, 155 cm, 160 cm, 165 cm, 170 cm
組別 Y:140 cm, 160 cm, 180 cm, 200 cm, 220 cm

解釋

1. 標準差
組別 X 的身高比較集中,在150~170 cm,所以標準差會比較小。
組別 Y 的身高跨度較大,在140 ~220 cm,所以標準差會比較大。

2. CV 值
組別 Y 的標準差比較大,但由於組別 Y 的平均身高也較高(180 cm),因此它的 CV 會比較小。
組別 X 的平均身高相對較低(160 cm),但它的標準差較小,所以 CV 相對會比較大。

計算:

  • 組別 X
    平均160
    標準差≈ 7.07
    CV ≈ 4.4%
  • 組別 Y
    平均180
    標準差≈ 30.0
    CV ≈ 16.7%

綜合以上,雖然組別 Y 的標準差比較大,但因為它的平均身高也高,CV值反而沒有組別 X 那麼高。