備忘録 確率分布 平均 中央値 標準偏差


texの勉強も兼ねてます

(1) 確率

各事象が起こった割合。

(2)度数分布表と確率分布表

階級(範囲)と人数との関係を表にしたものは、度数分布表と呼ばれる。

これを棒グラフにしたものを確率分布と呼ぶ。棒グラフの長さの合計は1である。

 (3)平均

算術平均・相加平均

\overline{x} = \frac{x_1 + x_2 + \cdots + x_n}{n}

分布の中心的な傾向を表す指標であり、データの総和をデータ数で割ったものである。

算術平均は、グラフで表した場合ピークが中心から左右に偏っている場合にや山が2つに分かれている場合、すべての事象が一様な確率の場合などでは平均は中心的な傾向は示さない。

(4)中央値

データの分布を二等分にした値であり、データが偶数の場合は中心の2つのデータの算術平均の値をとる。

(5)標準偏差

分散

分布の広がりを表す統計量の一つである。母集団で分散を求める方法と標本で求める方法では異なっている。

標本分散

s^2 = \frac{1}{n} \sum_{i = 1}^n {(x_i - \overline{x})^2}

一般的に分散を求める式。母集団のデータが大体わかっているような場合などで使う。n個のデータxの平均を\overline{x}とすると分散s^2は上記のように表すことができる。

不偏分散

s^2 = \frac{1}{n - 1} \sum_{i = 1}^n {(x_i - \overline{x})^2}

  標本から分散を計算したものを、標本分散と呼ぶが母集団に比べるとこの標本のデータが少ない場合があり、計算した標本分散は実際の母分散よりも小さくなることがある。そのため、標本分散を母分散に比べて等しい値に近づけるために補正したものを不偏分散と呼ぶ。不偏分散は母分散のnをn-1で割ることによって求めることができる。

また、標本分散と不偏分散の記号はSとsと大文字と小文字で区別する場合がある。

標準偏差

分散はどの程度平均値の辺りにばらついているかを示す指標であるが、分散と平均で足し算をしたり、分散と平均で比較をすることはできない。この理由としては、分散は求める際に各データを2乗するためである。標準偏差は分散を平方根にとって求める。そのため、2乗した単位を戻すことにり足し算や比較することが可能になる。

母標準偏差

\sigma = \sqrt{\frac{1}{n}\sum_{i = 1}^n {(x_i - \overline{x})^2}}

  母集団のデータを扱う際に利用する。標本分散の式を平方根を取ればよい。

不偏分散

s^2 = \frac{1}{n - 1} \sum_{i = 1}^n {(x_i - \overline{x})^2}

  標本データを扱う際に利用する。不偏分散の式を平方根で取ればよい


スポンサーリンク

コメントする

メールアドレスが公開されることはありません。

CAPTCHA