分散の意味と求め方、分散公式の使い方

分散とは、データの散らばりの度合いを表す値です。分散を求めるには、偏差(それぞれの数値と平均値の差)を二乗し、平均を取ります。なお、分散の正の平方根が標準偏差となります。

分散 $s^2$ は次の式で求めることができます。

分散 $s^2$ を求める式

\[ s^2 = \frac{1}{n}\sum_{n=1}^n(x_i-\overline{x})^2 \]

ここで、
 $n$ はデータの総数
 $x_i$ は個々の数値
 $\overline{x}$ は平均値
を表します。

式だけ見ても分かりにくいですが、平均値と偏差を順番に計算することで、分散は簡単に求めることができます。

このページでは、分散の意味求め方を、例題を用いて分かりやすく説明しています。また、分散公式の導出と使い方も説明しています。


もくじ

  1. 分散とは
  2. 分散の求め方
  3. 分散公式

分散とは

分散とは、データの散らばりの度合いを表す値です。データの散らばりが大きいと分散も大きくなり、散らばりが小さいと分散は 0 に近づきます。

例として、次の二つのデータの分散を比べてみましょう。英語と数学の 2 つの試験を A さん、B さん、C さんの三人が受けた結果と平均点、分散を表にまとめました。

これらの分散は、後の分散の求め方の例題で計算します。

英語と数学の得点データと平均値、分散
 英語数学
A さん7177
B さん8080
C さん8983
平均値(点)8080
分散(点2546

英語と数学の平均値はどちらも 80 点で同じですが、英語の分散は 54(単位:点2)、数学の分散は 6(点2)となります(分散の求め方の項目を参照)。

分散を計算することで、一般によく用いる平均点だけでは分からないことが明らかになります。

上の例では、英語の分散(54 点2)の方が数学の分散(6 点2)より大きくなっています。これは、英語の点数の方が数学の点数より、得点の散らばりが大きいことを意味しています。

英語の得点を見ると、 A さんの 71 点や、C さんの 89 点は平均点(80 点)から 9 点ずつ離れています。一方、数学の点数を見ると A さんが 77 点、C さんが 83 点と、平均点(80 点)から 3 点ずつ離れています。得点を全体的にみて、平均点からの点の離れ具合は英語の方が大きいので、英語の分散は数学の分散よりも大きくなるのです。

このデータの例は、きわめて単純に計算できるようにしていますが、もっとデータ数が増えて複雑になったときも同様に、分散はデータの散らばり具合を意味します。


なお、分散の正の平方根を取ると、標準偏差になります。さらに、標準偏差を使うことで偏差値を計算することができます。

分散の求め方

分散を求めるには、偏差(それぞれの数値と平均値の差)を二乗し、平均を取ります。

分散 $s^2$ は次の式で求めることができます。

分散 $s^2$ を求める式

\[ s^2 = \frac{1}{n}\sum_{n=1}^n(x_i-\overline{x})^2 \]

ここで、
 $n$ はデータの総数
 $x_i$ は個々の数値
 $\overline{x}$ は平均値
を表します。

この式をいきなり見せられてもよくわからないでしょう。そこで、分散を次の 3 つのステップで求めることにします。

分散の求め方

  1. 平均値を求める
  2. 偏差(数値 - 平均値)を求める
  3. 偏差の二乗平均(=分散)を計算する

もしくは、分散公式をつかって計算することもできます。

それでは、例題を解いて、具体的に分散を求めてみましょう。

次に示す、英語の得点データの分散を求めよ。

英語の得点データ
 点数
A さん71($=x_1$)
B さん80($=x_2$)
C さん89($=x_3$)

分散を求めるにはまず、偏差を求めます。偏差は、個々の数値($x_i$)から平均値($\overline{x}$)を引くことで求められます。詳しくは「偏差の意味と求め方」をご覧ください。

このデータの平均値($\overline{x}$)は 80 点なので、A さんの偏差は
(A さんの得点 $x_1$)-(平均値 $\overline{x}$)=$71-80 = -9$ と求まります。

同様に計算すると、B さんの偏差は $0$、C さんの偏差は $9$ となります。

これを表に書き加えると、次のようになります。

英語の得点データと平均値、偏差
 点数偏差
A さん71($=x_1$)-9($=x_1-\overline{x}$)
B さん80($=x_2$)0($=x_2-\overline{x}$)
C さん89($=x_3$)9($=x_3-\overline{x}$)
平均値80($=\overline{x}$)

さて、分散($s^2$)を求めるには、それぞれの偏差を二乗して、その平均値を求めます。よって、分散($s^2$)は次のように計算できます。

\begin{align*} s^2 &= \frac{(-9)^2+0^2+9^2}{3} \\[5pt] &= \frac{162}{3} \\[5pt] &= 54 \end{align*}

よって、このデータの分散は 54 と求まりました。点数を二乗した値の平均を取っているので、単位は「点数の二乗(点2)」となります。

計算結果をまとめると、次のようになります。

英語の得点データと平均値、偏差、偏差の二乗
 点数偏差偏差の二乗
A さん71-981
B さん8000
C さん89981
平均値8054

上の表の右下に示した、54(点2)というのが、分散(偏差の二乗平均)になります。

分散の求め方を理解していただけたでしょうか?もう一問、別の例題を解いてみましょう。

次に示す、数学の得点データの分散を求めよ。

数学の得点データ
 点数
A さん77($=x_1$)
B さん80($=x_2$)
C さん83($=x_3$)

このデータの平均値は 80(点)、3 人の偏差(得点 $x_i$ - 平均点 $\overline{x}$)は次の表に示した通りです。詳しい計算手順は「偏差の意味と求め方」の例題をご覧ください。

数学の得点データと平均値、偏差
 点数偏差
A さん77($=x_1$)-3($=x_1-\overline{x}$)
B さん80($=x_2$)0($=x_2-\overline{x}$)
C さん83($=x_3$)3($=x_3-\overline{x}$)
平均値80($=\overline{x}$)

分散 $s^2$ を求めるには、この 3 人の偏差の二乗平均を計算します。

\begin{align*} s^2 &= \frac{(-3)^2+0^2+3^2}{3} \\[5pt] &= \frac{18}{3} \\[5pt] &= 6 \end{align*}

よって、数学の得点の分散は 6(単位:点2)と求まりました。

次の表に、計算結果を整理しました。

数学の得点データと平均値、偏差、偏差の二乗
 点数偏差偏差の二乗
A さん77-39
B さん8000
C さん8339
平均値806

表の右下の値 6(点2)が、このデータの分散(偏差の二乗平均)にあたります。


ここで求めた 2 つの分散の値の比較とその意味の説明は「分散とは」の項目で行っています。

分散公式

分散は定義式のほか、(分散)=(二乗平均)-(平均の二乗)でも求めることができます。これを、分散公式といいます。

分散公式

\[ s^2 = \frac{1}{n}\sum_{i=1}^n{x_i}^2-\overline{x}^2 \]

分散公式は、分散($s^2$)の定義より次のようにして得られます。

\begin{align*} s^2 &= \frac{1}{n}\sum_{i=1}^n(x_i-\overline{x})^2 \\[5pt] &= \frac{1}{n}\sum_{i=1}^n({x_i}^2-2x_i\overline{x} +\overline{x}^2) \\[5pt] &= \frac{1}{n}\sum_{i=1}^n{x_i}^2-2\overline{x}\underbrace{\frac{1}{n}\sum_{i=1}^nx_i}_{=\overline{x}}+\frac{1}{n}\cdot n\overline{x}^2 \\[5pt] &= \frac{1}{n}\sum_{i=1}^n{x_i}^2-2\overline{x}^2+\overline{x}^2 \\[5pt] &= \frac{1}{n}\sum_{i=1}^n{x_i}^2-\overline{x}^2 \end{align*}

分散公式を使って、最初の例題(英語の得点)の分散を計算してみましょう。

次に示す、英語の得点データの分散を求めよ。

英語の得点データ
 点数
A さん71($=x_1$)
B さん80($=x_2$)
C さん89($=x_3$)
平均80($=\overline{x}$)

分散公式を使うと、偏差を求める過程を経ず、それぞれの得点($x_i$)と平均点($\overline{x}$)から直接分散を求めることができます。

(分散)=(二乗平均)-(平均の二乗)より

\begin{align*} s^2 &= \frac{71^2+80^2+89^2}{3}-80^2 \\[5pt] &= 54 \end{align*}