標準偏差の意味と求め方 - 公式と計算例
標準偏差とは、データの散らばりの度合いを示す値です。標準偏差を求めるには、分散(それぞれの数値と平均値の差の二乗平均)の正の平方根を計算します。
データが平均値の周りに集中していれば標準偏差は小さくなり、逆に平均値からばらついていれば標準偏差は大きくなります。
標準偏差 $s$ は、次の公式で求めることができます。
標準偏差 $s$ を求める公式
\begin{align*} s &= \sqrt{s^2} \\[5pt] &= \sqrt{\frac{1}{n}\sum_{n=1}^n(x_i-\overline{x})^2} \end{align*}
ここで、
$s^2$ は分散
$n$ はデータの総数
$x_i$ は個々の数値
$\overline{x}$ は平均値
を表します。
この式の 2 行目では、平均値と偏差、分散を計算しています。これらを順番に計算することで、標準偏差を簡単に求めることができます。なお、標準偏差は偏差値を計算するときにも使います。
もくじ
標準偏差とは
標準偏差とは、データの散らばりの度合いを表す値です。値の単位はもとのデータと同じになります。例えば、テストの点数から標準偏差を求めた場合、その単位は「点」となります。
データの散らばりが大きいと標準偏差も大きくなり、散らばりが小さいと標準偏差は 0 に近づきます。
例として、次の二つのデータの標準偏差を比べてみましょう。英語と数学の 2 つの試験を A さん、B さん、C さんの三人が受けた結果と平均点、分散、標準偏差を表にまとめました。
これらの標準偏差は、後の標準偏差の求め方の例題で計算します。
英語 | 数学 | |
---|---|---|
A さん | 71 | 77 |
B さん | 80 | 80 |
C さん | 89 | 83 |
平均値(点) | 80 | 80 |
分散(点2) | 54 | 6 |
標準偏差(点) | 7.35 | 2.45 |
英語と数学の平均値はどちらも 80 点で同じですが、英語の標準偏差は 7.35(単位:点)、数学の標準偏差は 2.45(点)となります(標準偏差の求め方の項目を参照)。
標準偏差を計算することで、一般によく用いる平均点だけでは分からないことが明らかになります。
上の例では、英語の標準偏差(7.35 点)の方が数学の標準偏差(2.45 点)より大きくなっています。これは、英語の点数の方が数学の点数より、得点の散らばりが大きいことを意味しています。数直線上にデータを示した下の図を見てみましょう。
英語の得点を見ると、 A さんの 71 点や、C さんの 89 点は平均点(80 点)から 9 点ずつ離れています。一方、数学の点数を見ると A さんが 77 点、C さんが 83 点と、平均点(80 点)から 3 点ずつ離れています。得点の平均点からのばらつきは英語の方が大きいので、英語の標準偏差は数学の標準偏差よりも大きくなっています。
なお、標準偏差は分散の正の平方根なので、標準偏差の大小は分散の大小に対応しています。
この例題はデータ数が少ないですが、データ数が増えた場合も同じように標準偏差を計算でき、データの散らばり具合を意味します。
応用例として、標準偏差は偏差値を求めるときに使います。詳しくは、「偏差値とは何か? - 偏差値の意味と求め方」をご覧ください。
標準偏差とデータ数の関係
データが正規分布に従っている場合、標準偏差を用いてデータがある値の範囲に入る確率を求めることができます。
期待値(平均) μ、標準偏差 σ に従う正規分布を考えましょう。このとき、値の範囲と、そこに入るデータ数の確率は次の表の通りです。
値の範囲(記号) | 値の範囲(意味) | 範囲内にデータが含まれる確率 |
---|---|---|
μ ± σ | 平均値 ± 標準偏差 | 68.3 % |
μ ± 2σ | 平均値 ± 標準偏差 × 2 | 95.4 % |
μ ± 3σ | 平均値 ± 標準偏差 × 3 | 99.7 % |
上の表は標準正規分布表から導き出されます。
例として、テストである点数を取る確率について考えてみましょう。テストの点数が、平均点 μ = 50点、標準偏差 σ = 5点 の正規分布に従うとします。このとき、点数の範囲と、その範囲内に入る確率は次の表の通りです。
値の範囲 | 値の範囲(計算方法) | 範囲内にデータが含まれる確率 |
---|---|---|
45点 ~ 55点 | 平均点 50 点 ± 標準偏差 5 点 | 68.3 % |
40点 ~ 60点 | 平均点 50 点 ± 標準偏差 5 点 × 2 | 95.4 % |
35点 ~ 65点 | 平均点 50 点 ± 標準偏差 5 点 × 3 | 99.7 % |
上の表より、このテストでは、68 % の確率で 45 点 ~ 55 点の間に入り、95 % の確率で 40点 ~ 60 点の間に入ることが分かります。40 点以下または 60 点以上の人は、全体の 4.6 %(= 100 % - 95.4 %)しかいないことも分かります。
標準偏差の求め方
標準偏差を求めるには、分散(それぞれの数値と平均値の差の二乗平均)の正の平方根を計算します。
標準偏差 $s$ は次の式で求めることができます。
標準偏差 $s$ を求める公式
\begin{align*} s &= \sqrt{s^2} \\[5pt] &= \sqrt{\frac{1}{n}\sum_{n=1}^n(x_i-\overline{x})^2} \end{align*}
ここで、
$s^2$ は分散
$n$ はデータの総数
$x_i$ は個々の数値
$\overline{x}$ は平均値
を表します。
複雑に見える式ですが、この式の 2 行目では平均値、偏差、分散の計算をしています。それぞれの内容は比較的簡単な計算ですので、順番に説明していきます。
標準偏差は 4 つのステップで計算します。
それでは、例題を解いて、具体的に標準偏差を求めてみましょう。
次に示す、英語の得点データの標準偏差を求めよ。
点数 | |
---|---|
A さん | 71($=x_1$) |
B さん | 80($=x_2$) |
C さん | 89($=x_3$) |
標準偏差の公式にいきなり代入するのではなく、平均値 → 偏差 → 分散 → 標準偏差 の順番で一つずつ求めていきます。
まずは平均値 $\overline{x}$ を求めます。
\begin{align*} \overline{x} &= \frac{71+80+89}{3} \\[5pt] &= 80 \end{align*}
よって、平均値は 80(点)と求まりました。
2 番目のステップでは偏差を求めます。偏差とは、各数値と平均値との差です。詳しくは「偏差の意味と計算方法」をご覧ください。
例えば、A さんの偏差は
(A さんの得点 $x_1$)-(平均値 $\overline{x}$)=$71-80 = -9$(点)と求まります。
同様に計算すると、B さんの偏差は $0$ 点、C さんの偏差は $9$ 点となります。
平均値と偏差を表に書き加えると、次のようになります。
点数 | 偏差 | |
---|---|---|
A さん | 71($=x_1$) | -9($=x_1-\overline{x}$) |
B さん | 80($=x_2$) | 0($=x_2-\overline{x}$) |
C さん | 89($=x_3$) | 9($=x_3-\overline{x}$) |
平均値 | 80($=\overline{x}$) | ー |
3 番目のステップでは、分散を求めます。分散とは、偏差の二乗平均です。詳しくは「分散の意味と計算方法」をご覧ください。
分散 $s^2$、すなわち三人の偏差 $-9$ 点、$0$ 点、$9$ 点 の二乗平均を計算すると次のようになります。
\begin{align*} s^2 &= \frac{(-9)^2+0^2+9^2}{3} \\[5pt] &= \frac{162}{3} \\[5pt] &= 54 \end{align*}
よって、分散は $54$(単位:点2)と求まりました。
ここまでの計算値を表に加えると次のようになります。
点数 | 偏差 | 偏差の二乗 | |
---|---|---|---|
A さん | 71 | -9 | 81 |
B さん | 80 | 0 | 0 |
C さん | 89 | 9 | 81 |
平均値 | 80 | ー | 54 |
上の表右下の値 54(点2)が分散(偏差の二乗平均)にあたります。
標準偏差 $s$ を求める最後のステップは、分散 $s^2$ の正の平方根を取ることです。
よって、英語の得点の標準偏差 $s$ は次のように求めることができます。
\begin{align*} s &= \sqrt{54} \\[5pt] &= 3\sqrt{6} \\[5pt] &\approx 7.35 \end{align*}
最後の行の記号 $\approx$ は $\fallingdotseq$ と同じ意味で、ほぼ等しいことを意味します。ここでは小数第 2 位までの概数にしました。
よって、英語の得点の標準偏差は 7.35 点 と求まりました。分散の単位は「点数の二乗(点2)」なので、その平方根を取った標準偏差の単位は「点数(点)」となります。これは元の得点データの単位に等しいですね。
標準偏差の求め方を理解していただけたでしょうか?平均値 → 偏差 → 分散 → 標準偏差 というステップを一つずつ踏んでいけば、それほど難しくないですね。
「偏差値とは何か?」のページでは、いま求めた標準偏差の値を使って 3 人の偏差値を求める方法を説明しています。よろしければ、あわせてご覧ください。
もう一問、別の例題を解いてみましょう。
次に示す、数学の得点データの標準偏差を求めよ。
点数 | |
---|---|
A さん | 77($=x_1$) |
B さん | 80($=x_2$) |
C さん | 83($=x_3$) |
このデータの平均値は 80(点)です。3 人の偏差(得点 $x_i$ - 平均点 $\overline{x}$)および偏差の二乗の値、そしてその平均値である分散は、次の表に示した通りです。詳しい計算手順は「偏差の意味と求め方」と「分散の意味と求め方」の例題をご覧ください。
点数 | 偏差 | 偏差の二乗 | |
---|---|---|---|
A さん | 77 | -3 | 9 |
B さん | 80 | 0 | 0 |
C さん | 83 | 3 | 9 |
平均値 | 80 | ー | 6 |
上の表の右下の値 6(単位:点2)が分散 $s^2$(偏差の二乗平均)にあたります。
標準偏差を求めるには、この分散 6(点2)の正の平方根を計算します。よって
\begin{align*} s &= \sqrt{s^2} \\[5pt] &= \sqrt{6} \\[5pt] &\approx 2.45 \end{align*}
よって、数学の得点の標準偏差は 2.45 点と求まりました。
この 2 つの例題で求めた標準偏差の値の比較とその意味の説明は「標準偏差とは」の項目で行っています。