5分でわかる!区間推定「母分散」の信頼区間の求め方

データ分析
データ分析
スポンサーリンク

母分散の区間推定を使うと、例えば母集団が100万本のネジだとして、そのネジの長さのバラツキ(分散)を、数本のネジを調べるだけで、推定することができます。そこで今回は、母分散の信頼区間の求め方を、出来るだけ分かりやすくまとめてみました。

例題

母集団100万本のネジから、標本として取り出した、5本のネジの長さは以下の通りです。このとき、信頼係数95%で、母分散の信頼区間を求めてみましょう。

5本のネジの長さの表

母分散の信頼区間を求める式

母分散の信頼区間は、以下の計算式で求められます。

母分散の信頼区間を求める式

見慣れない言葉や記号が出てくるので、すごく難解な式に思えますね(^^;)

でも安心してください。「不偏分散」は、標本として取り出した、5本のネジの長さの分散を計算するだけ、「χ2」は、カイ二乗分布表から簡単に導き出せます。

不偏分散

不偏分散は、以下の手順で求められます。不偏分散は、偏差の二乗の合計を(標本数 - 1)で割るところがポイントです。

不偏分散の計算手順

標本平均

まず、標本として取り出した、5本のネジの長さの平均を計算します。これを「標本平均」と呼びます。

( 31 + 29 + 28 + 35 + 30 ) ÷ 5= 30.6(標本平均)

偏差

続いて、ネジ1本ごとの長さから、標本平均を引いて「偏差」を求めます。

31 - 30.6 =  0.4
29 - 30.6 =  -1.6
28 - 30.6 =  -2.6
35 - 30.6 =  4.4
30 - 30.6 =  -0.6

不偏分散の計算

最後に、偏差の二乗の合計を(標本数 - 1)で割れば、不偏分散が求められます。

0.4 ² = 0.16
-1.6 ² = 2.56
-2.6 ² = 6.76
4.4 ² = 19.36
-0.6 ² = 0.36
合計 29.2

 
29.2 ÷ ( 5 - 1 ) = 7.3(不偏分散)

χ2(カイ2乗)の値

カイ二乗分布表から、χ2 の上側と下側の値を求めます。χ2 の値は、標本(ネジ5本)の「自由度」と「信頼係数」によって、変わってきます。

自由度

また聞きなれない「自由度」という言葉が出てきましたが、「標本数 - 1」 ( n - 1 ) のことを「自由度」と言います。不偏分散の計算でも登場しましたね。今回の標本はネジ5本なので、自由度は「4」になります。

信頼係数95%の上側と下側パーセント点

信頼係数は、これから求める「信頼区間の当たる確率」です。信頼係数95%の、上側と下側のパーセント点は、以下の式で計算します。

上側パーセント点 = ( 1 - 0.95 ) ÷ 2 = 0.025
下側パーセント点 = 1 - ( 1 - 0.95 ) ÷ 2 = 0.975

χ2 の値

下のカイ二乗分布表から、自由度「4」、パーセント点「0.025」の χ2上側の値と、パーセント点「0.975」の χ2下側の値を求めます。

χ2上側 = 11.1433
χ2下側 = 0.4844

カイ二乗分布表

自由度0.9950.9750.0250.005
13.92704E-050.00105.02397.8794
20.01000.05067.377810.5966
30.07170.21589.348412.8382
40.20700.484411.143314.8603
50.41170.831212.832516.7496
60.67571.237314.449418.5476
70.98931.689916.012820.2777
81.34442.179717.534521.9550
91.73492.700419.022823.5894
102.15593.247020.483225.1882
112.60323.815721.920026.7568
123.07384.403823.336728.2995
133.56505.008824.735629.8195
144.07475.628726.118931.3193
154.60096.262127.488432.8013
165.14226.907728.845434.2672
175.69727.564230.191035.7185
186.26488.230731.526437.1565
196.84408.906532.852338.5823
207.43389.590834.169639.9968
218.033710.282935.478941.4011
228.642710.982336.780742.7957
239.260411.688638.075644.1813
249.886212.401239.364145.5585
2510.519713.119740.646546.9279
2611.160213.843941.923248.2899
2711.807614.573443.194549.6449
2812.461315.307944.460850.9934
2913.121116.047145.722352.3356
3013.786716.790846.979253.6720
4020.706524.433059.341766.7660
6035.534540.481783.297791.9517
12083.851691.5726152.2114163.6482
240187.3243198.9839284.8025300.1822

母分散の信頼区間の計算

母分散の信頼区間の計算に必要な値が揃いましたので、少し整理しておきます。

標本数:5
不偏分散:7.3
χ2上側:11.1433
χ2下側 :0.4844

あとは、母分散の信頼区間を求める式「(標本数-1) × 不偏分散 ÷ χ2」に当てはめて、計算するだけです。

( 5 - 1 ) × 7.3 ÷ 11.1433 = 2.62
( 5 - 1 ) × 7.3 ÷ 0.4844 = 60.28

以上で、母集団100万本のネジの長さの分散は、信頼係数(当たる確率)95%で「 2.62 〜 60.28 」 と求められました。

「R」5行で出来る!母分散の信頼区間の求め方

統計解析ソフトの「R」を使えば、簡単に母分散の信頼区間を求められます。答え合わせをするのに便利ですよ(^^)
 

> ネジ = c(31, 29, 28, 35, 30)
> 不偏分散 = var(ネジ)
> 自由度 = length(ネジ) - 1

> (自由度 * 不偏分散) / qchisq(0.975, 自由度)
[1] 2.620412
> (自由度 * 不偏分散) / qchisq(0.025, 自由度)
[1] 60.27845

終わりに

次回は、母比率の区間推定についまとめてみたいと思います。

コメント

タイトルとURLをコピーしました