分散の意味と求め方、分散公式の使い方
分散とは、データの散らばりの度合いを表す値です。分散を求めるには、偏差(それぞれの数値と平均値の差)を二乗し、その平均を計算します。なお、分散の正の平方根が標準偏差です。
分散 $s^2$ は次の式で求めることができます。
分散 $s^2$ を求める式
\[ s^2 = \frac{1}{n}\sum_{n=1}^n(x_i-\overline{x})^2 \]
ここで、
$n$ はデータの総数
$x_i$ は個々の数値
$\overline{x}$ は平均値
を表します。
この式と同じように、平均値と偏差を順番に計算することで、分散を簡単に求めることができます。
このページでは、分散の意味と求め方を、例題を用いて分かりやすく説明しています。また、分散を求める別の方法である分散公式の導出と使い方も説明しています。
もくじ
分散とは
分散とは、データの散らばりの度合いを表す値です。データの散らばりが大きいと分散も大きくなり、散らばりが小さいと分散は 0 に近づきます。分散の単位は、もとのデータの単位の 2 乗です。例えば、テストの点数の分散を求めた場合は、その単位は「点2」となります。
例として、次の二つのデータの分散を比べてみましょう。英語と数学の 2 つの試験を A さん、B さん、C さんの三人が受けた結果と平均点、分散を表にまとめました。
これらの分散は、後の分散の求め方の例題で計算します。
英語 | 数学 | |
---|---|---|
A さん | 71 | 77 |
B さん | 80 | 80 |
C さん | 89 | 83 |
平均値(点) | 80 | 80 |
分散(点2) | 54 | 6 |
英語と数学の平均値はどちらも 80 点で同じですが、英語の分散は 54(単位:点2)、数学の分散は 6(点2)となります(分散の求め方の項目を参照)。
分散を計算することで、一般によく用いる平均点だけでは分からないことが明らかになります。
上の例では、英語の分散(54 点2)の方が数学の分散(6 点2)より大きくなっています。これは、英語の点数の方が数学の点数より、得点のばらつきが大きいことを意味しています。数直線上にデータを示した下の図を見てみましょう。
英語の得点を見ると、 A さんの 71 点や、C さんの 89 点は平均点(80 点)から 9 点ずつ離れています。一方、数学の点数を見ると A さんが 77 点、C さんが 83 点と、平均点(80 点)から 3 点ずつ離れています。得点の平均点からのばらつきは英語の方が大きいので、英語の分散は数学の分散よりも大きくなります。
この例題はデータ数が少ないですが、データ数が増えた場合も同じように分散を計算でき、データの散らばり具合を意味します。
なお、分散の正の平方根を取ると、標準偏差になります。分散の単位はもとのデータの 2 乗でしたが、標準偏差の単位はもとのデータと同じであるため、理解がしやすいという特徴があります。また、標準偏差を使うことで偏差値を計算することができます。
分散は 1 変数データの統計量ですが、2 変数データに対しては共分散という統計量があります。共分散については、「共分散の意味と求め方、共分散公式の使い方」のページをご覧ください。
分散の求め方
分散を求めるには、偏差(それぞれの数値と平均値の差)を二乗し、その平均を計算します。計算式で表すと、次のようになります。
分散 $s^2$ を求める式
\[ s^2 = \frac{1}{n}\sum_{n=1}^n(x_i-\overline{x})^2 \]
ここで、
$n$ はデータの総数
$x_i$ は個々の数値
$\overline{x}$ は平均値
を表します。
複雑に見える式ですが、次の 3 つのステップを順番に計算すると、分散を求めることができます。
または、分散公式をつかって計算することもできます。
それでは、例題を解いて、具体的に分散を求めてみましょう。
次に示す、英語の得点データの分散を求めよ。
点数 | |
---|---|
A さん | 71($=x_1$) |
B さん | 80($=x_2$) |
C さん | 89($=x_3$) |
分散を求めるにはまず、偏差を求めます。偏差は、個々の数値($x_i$)から平均値($\overline{x}$)を引くことで求められます。詳しくは「偏差の意味と求め方」をご覧ください。
このデータの平均値($\overline{x}$)は 80 点なので、A さんの偏差は
(A さんの得点 $x_1$)-(平均値 $\overline{x}$)=71 - 80 = -9 と求まります。
同様に計算すると、B さんの偏差は 0、C さんの偏差は 9 となります。
下の表は、これらの計算結果を書き加えたものです。
点数 | 偏差 | |
---|---|---|
A さん | 71($=x_1$) | -9($=x_1-\overline{x}$) |
B さん | 80($=x_2$) | 0($=x_2-\overline{x}$) |
C さん | 89($=x_3$) | 9($=x_3-\overline{x}$) |
平均値 | 80($=\overline{x}$) | ー |
さて、分散($s^2$)を求めるには、それぞれの偏差を二乗して、その平均値を求めます。計算式は次の通りです。
\begin{align*} s^2 &= \frac{(-9)^2+0^2+9^2}{3} \\[5pt] &= \frac{162}{3} \\[5pt] &= 54 \end{align*}
よって、このデータの分散は 54 と求まりました。点数を二乗した値の平均を取っているので、単位は「点数の二乗(点2)」となります。
計算結果をまとめると、次のようになります。
点数 | 偏差 | 偏差の二乗 | |
---|---|---|---|
A さん | 71 | -9 | 81 |
B さん | 80 | 0 | 0 |
C さん | 89 | 9 | 81 |
平均値 | 80 | ー | 54 |
上の表の右下に示した、54(点2)というのが、分散(偏差の二乗平均)になります。
分散の求め方を理解できたでしょうか?もう一問、別の例題を解いてみましょう。
次に示す、数学の得点データの分散を求めよ。
点数 | |
---|---|
A さん | 77($=x_1$) |
B さん | 80($=x_2$) |
C さん | 83($=x_3$) |
このデータの平均値は 80(点)、3 人の偏差(得点 $x_i$ - 平均点 $\overline{x}$)は次の表に示した通りです。詳しい計算手順は「偏差の意味と求め方」の例題をご覧ください。
点数 | 偏差 | |
---|---|---|
A さん | 77($=x_1$) | -3($=x_1-\overline{x}$) |
B さん | 80($=x_2$) | 0($=x_2-\overline{x}$) |
C さん | 83($=x_3$) | 3($=x_3-\overline{x}$) |
平均値 | 80($=\overline{x}$) | ー |
分散 $s^2$ を求めるには、この 3 人の偏差の二乗平均を計算します。
\begin{align*} s^2 &= \frac{(-3)^2+0^2+3^2}{3} \\[5pt] &= \frac{18}{3} \\[5pt] &= 6 \end{align*}
よって、数学の得点の分散は 6(単位:点2)と求まりました。
次の表に、数学の得点の計算結果を整理しました。
点数 | 偏差 | 偏差の二乗 | |
---|---|---|---|
A さん | 77 | -3 | 9 |
B さん | 80 | 0 | 0 |
C さん | 83 | 3 | 9 |
平均値 | 80 | ー | 6 |
表の右下の値 6(点2)が、このデータの分散(偏差の二乗平均)にです。
ここで求めた 2 つの分散の値の比較とその意味の説明は「分散とは」の項目で行っています。
分散公式
分散は定義式のほか、(分散)=(二乗平均)-(平均の二乗)でも求めることができます。これを、分散公式といいます。
分散公式
\[ s^2 = \frac{1}{n}\sum_{i=1}^n{x_i}^2-\overline{x}^2 \]
分散公式は、分散($s^2$)の定義より次のようにして得られます。
\begin{align*} s^2 &= \frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2 \\[5pt] &= \frac{1}{n}\sum_{i=1}^n({x_i}^2-2x_i\overline{x} +\overline{x}^2) \\[5pt] &= \frac{1}{n}\sum_{i=1}^n{x_i}^2-2\overline{x}\underbrace{\frac{1}{n}\sum_{i=1}^nx_i}_{=\overline{x}}+\frac{1}{n}\cdot n\overline{x}^2 \\[5pt] &= \frac{1}{n}\sum_{i=1}^n{x_i}^2-2\overline{x}^2+\overline{x}^2 \\[5pt] &= \frac{1}{n}\sum_{i=1}^n{x_i}^2-\overline{x}^2 \end{align*}
分散公式を使って、最初の例題(英語の得点)の分散を計算してみましょう。
次に示す、英語の得点データの分散を求めよ。
点数 | |
---|---|
A さん | 71($=x_1$) |
B さん | 80($=x_2$) |
C さん | 89($=x_3$) |
平均 | 80($=\overline{x}$) |
分散公式を使うと、偏差を求める過程を経ず、それぞれの得点($x_i$)と平均点($\overline{x}$)から直接分散を求めることができます。
(分散)=(二乗平均)-(平均の二乗)より
\begin{align*} s^2 &= \frac{71^2+80^2+89^2}{3}-80^2 \\[5pt] &= 54 \end{align*}