母分散の区間推定を使うと、例えば母集団が100万本のネジだとして、そのネジの長さのバラツキ(分散)を、数本のネジを調べるだけで、推定することができます。そこで今回は、母分散の信頼区間の求め方を、出来るだけ分かりやすくまとめてみました。
例題
母集団100万本のネジから、標本として取り出した、5本のネジの長さは以下の通りです。このとき、信頼係数95%で、母分散の信頼区間を求めてみましょう。
母分散の信頼区間を求める式
母分散の信頼区間は、以下の計算式で求められます。
見慣れない言葉や記号が出てくるので、すごく難解な式に思えますね(^^;)
でも安心してください。「不偏分散」は、標本として取り出した、5本のネジの長さの分散を計算するだけ、「χ2」は、カイ二乗分布表から簡単に導き出せます。
不偏分散
不偏分散は、以下の手順で求められます。不偏分散は、偏差の二乗の合計を(標本数 - 1)で割るところがポイントです。
標本平均
まず、標本として取り出した、5本のネジの長さの平均を計算します。これを「標本平均」と呼びます。
偏差
続いて、ネジ1本ごとの長さから、標本平均を引いて「偏差」を求めます。
31 - 30.6 | = | 0.4 |
29 - 30.6 | = | -1.6 |
28 - 30.6 | = | -2.6 |
35 - 30.6 | = | 4.4 |
30 - 30.6 | = | -0.6 |
不偏分散の計算
最後に、偏差の二乗の合計を(標本数 - 1)で割れば、不偏分散が求められます。
0.4 ² | = | 0.16 |
-1.6 ² | = | 2.56 |
-2.6 ² | = | 6.76 |
4.4 ² | = | 19.36 |
-0.6 ² | = | 0.36 |
合計 | 29.2 |
29.2 ÷ ( 5 - 1 ) = 7.3(不偏分散)
χ2(カイ2乗)の値
カイ二乗分布表から、χ2 の上側と下側の値を求めます。χ2 の値は、標本(ネジ5本)の「自由度」と「信頼係数」によって、変わってきます。
自由度
また聞きなれない「自由度」という言葉が出てきましたが、「標本数 - 1」 ( n - 1 ) のことを「自由度」と言います。不偏分散の計算でも登場しましたね。今回の標本はネジ5本なので、自由度は「4」になります。
信頼係数95%の上側と下側パーセント点
信頼係数は、これから求める「信頼区間の当たる確率」です。信頼係数95%の、上側と下側のパーセント点は、以下の式で計算します。
下側パーセント点 = 1 - ( 1 - 0.95 ) ÷ 2 = 0.975
χ2 の値
下のカイ二乗分布表から、自由度「4」、パーセント点「0.025」の χ2上側の値と、パーセント点「0.975」の χ2下側の値を求めます。
χ2下側 = 0.4844
カイ二乗分布表
自由度 | 0.995 | 0.975 | 0.025 | 0.005 |
---|---|---|---|---|
1 | 3.92704E-05 | 0.0010 | 5.0239 | 7.8794 |
2 | 0.0100 | 0.0506 | 7.3778 | 10.5966 |
3 | 0.0717 | 0.2158 | 9.3484 | 12.8382 |
4 | 0.2070 | 0.4844 | 11.1433 | 14.8603 |
5 | 0.4117 | 0.8312 | 12.8325 | 16.7496 |
6 | 0.6757 | 1.2373 | 14.4494 | 18.5476 |
7 | 0.9893 | 1.6899 | 16.0128 | 20.2777 |
8 | 1.3444 | 2.1797 | 17.5345 | 21.9550 |
9 | 1.7349 | 2.7004 | 19.0228 | 23.5894 |
10 | 2.1559 | 3.2470 | 20.4832 | 25.1882 |
11 | 2.6032 | 3.8157 | 21.9200 | 26.7568 |
12 | 3.0738 | 4.4038 | 23.3367 | 28.2995 |
13 | 3.5650 | 5.0088 | 24.7356 | 29.8195 |
14 | 4.0747 | 5.6287 | 26.1189 | 31.3193 |
15 | 4.6009 | 6.2621 | 27.4884 | 32.8013 |
16 | 5.1422 | 6.9077 | 28.8454 | 34.2672 |
17 | 5.6972 | 7.5642 | 30.1910 | 35.7185 |
18 | 6.2648 | 8.2307 | 31.5264 | 37.1565 |
19 | 6.8440 | 8.9065 | 32.8523 | 38.5823 |
20 | 7.4338 | 9.5908 | 34.1696 | 39.9968 |
21 | 8.0337 | 10.2829 | 35.4789 | 41.4011 |
22 | 8.6427 | 10.9823 | 36.7807 | 42.7957 |
23 | 9.2604 | 11.6886 | 38.0756 | 44.1813 |
24 | 9.8862 | 12.4012 | 39.3641 | 45.5585 |
25 | 10.5197 | 13.1197 | 40.6465 | 46.9279 |
26 | 11.1602 | 13.8439 | 41.9232 | 48.2899 |
27 | 11.8076 | 14.5734 | 43.1945 | 49.6449 |
28 | 12.4613 | 15.3079 | 44.4608 | 50.9934 |
29 | 13.1211 | 16.0471 | 45.7223 | 52.3356 |
30 | 13.7867 | 16.7908 | 46.9792 | 53.6720 |
40 | 20.7065 | 24.4330 | 59.3417 | 66.7660 |
60 | 35.5345 | 40.4817 | 83.2977 | 91.9517 |
120 | 83.8516 | 91.5726 | 152.2114 | 163.6482 |
240 | 187.3243 | 198.9839 | 284.8025 | 300.1822 |
母分散の信頼区間の計算
母分散の信頼区間の計算に必要な値が揃いましたので、少し整理しておきます。
不偏分散:7.3
χ2上側:11.1433
χ2下側 :0.4844
あとは、母分散の信頼区間を求める式「(標本数-1) × 不偏分散 ÷ χ2」に当てはめて、計算するだけです。
( 5 - 1 ) × 7.3 ÷ 0.4844 = 60.28
以上で、母集団100万本のネジの長さの分散は、信頼係数(当たる確率)95%で「 2.62 〜 60.28 」 と求められました。
「R」5行で出来る!母分散の信頼区間の求め方
統計解析ソフトの「R」を使えば、簡単に母分散の信頼区間を求められます。答え合わせをするのに便利ですよ(^^)
> ネジ = c(31, 29, 28, 35, 30) > 不偏分散 = var(ネジ) > 自由度 = length(ネジ) - 1 > (自由度 * 不偏分散) / qchisq(0.975, 自由度) [1] 2.620412 > (自由度 * 不偏分散) / qchisq(0.025, 自由度) [1] 60.27845
終わりに
次回は、母比率の区間推定についまとめてみたいと思います。
コメント