区間推定は、標本の統計量を元に、母集団の平均などを、幅(区間)を持たせて推定する統計学の手法です。この推定した幅を「信頼区間」と言います。例えば、100万本のネジの長さの平均のように、母集団が大きい場合でも、区間推定を使えば、すべてのネジの長さを測らなくても、平均を推定することが出来ます。そこで今回は、母平均(母集団の平均)の信頼区間の求め方を、出来るだけ分かりやすくまとめてみました。
例題
とあるネジ工場で働くワン太郎は、上司から「型番Aのネジの長さの平均を調べておいて、急ぎだから今日中ね!」と頼まれました。しかし、型番Aのネジは100万本以上あり、しかも遠方の倉庫に保管されているため、ワン太郎の手元には、型番Aのネジが「10本」しかありません。(以下、型番Aのネジを単純に「ネジ」と表記します)
またいつもの無茶振りだよ、、困ったなあと、ワン太郎は思いながら、とりあえずネジ10本の長さを測って、平均を計算しました。
ただ、この平均を、100万本以上あるネジすべての長さの平均(これを「母平均」と呼びます)として報告するのは、いくらなんでも無理があります。そこで、先輩のニャン子さんに相談してみると「母平均の「信頼区間」を求めて報告するのがいいわよ」と教えてもらいました。
イラストby:ワン太郎とニャン子さん「イラスト工房」、ネジ「素材ライブラリー.com」
信頼区間を求める式
母平均の「信頼区間」は、以下の計算式で求められます。
区間推定では、母集団と標本を区別して考える必要があるため、標本平均、標本標準偏差と表記していますが、ワン太郎の手元にあるネジ10本(標本)の平均や標準偏差のことを、そう呼んでいるだけです。
そして「標本の大きさ」は、ワン太郎の手元にあるネジの本数、すなわち「10」になります。これをよく「n=10」と書くことがあります。
ただ、なかなか理解しづらいところなので、今回の母集団と標本について、少し整理しておきます。
さらによく分からないのが「t」ですが、この t の値は「t分布表」という便利な表から、簡単に導き出せます。
それではまず、少し計算が大変な、標本標準偏差を求めてみましょう。
標本標準偏差
標本標準偏差は、以下の手順で求めます。分散ではなく、不偏分散の平方根(ルート)を、標本標準偏差とするのが特徴です。
標本平均
すでにワン太郎も計算していますが、ワン太郎の手元にある、ネジ10本(標本)の長さの平均を計算し、これを「標本平均」と呼びます。
偏差
続いて、ネジ1本ごとの長さから、標本平均を引いて「偏差」を求めます。
31 - 30.4 | = | 0.6 |
29 - 30.4 | = | -1.4 |
28 - 30.4 | = | -2.4 |
35 - 30.4 | = | 4.6 |
30 - 30.4 | = | -0.4 |
30 - 30.4 | = | -0.4 |
32 - 30.4 | = | 1.6 |
27 - 30.4 | = | -3.4 |
33 - 30.4 | = | 2.6 |
29 - 30.4 | = | -1.4 |
不偏分散
「不偏」と言われると、なにか難しそうですが、普通の分散は、偏差の二乗の合計を「標本の大きさ」で割るのに対して、不偏分散は、「標本の大きさ - 1」で割るだけのことです。統計学の教科書ではこれをよく ( n - 1 ) と表記していますね。
0.6 ² | = | 0.36 |
-1.4 ² | = | 1.96 |
-2.4 ² | = | 5.76 |
4.6 ² | = | 21.16 |
-0.4 ² | = | 0.16 |
-0.4 ² | = | 0.16 |
1.6 ² | = | 2.56 |
-3.4 ² | = | 11.56 |
2.6 ² | = | 6.76 |
-1.4 ² | = | 1.96 |
合計 | 52.4 |
52.4 ÷ ( 10 - 1 ) = 5.822(不偏分散)
標本標準偏差
最後に不偏分散の平方根(ルート)を計算して、これを標本標準偏差とします。
t の値
続いて、t分布表から t の値を求めます。t の値は、標本の「自由度」と、信頼区間の「信頼係数」によって、変わってきます。
自由度
また聞きなれない「自由度」という言葉が出てきましたが、「標本の大きさ - 1」 ( n - 1 ) のことを「自由度」と言います。不偏分散の計算にも登場しましたね。今回の標本の大きさは n=10 (ネジ10本)なので 10 - 1 = 9 自由度は「9」になります。
信頼係数
信頼係数は、これから求める「信頼区間の当たる確率」です。信頼係数は「95%」を使うことにします。
t の値
下の t分布表から、自由度「9」、信頼係数は「95%」に対応する t の値を求めます。
長くなりましたが、以上で信頼区間の計算の下準備完了です。
t分布表
自由度 | 信頼係数:95% | 信頼係数:99% |
---|---|---|
1 | 12.706 | 63.657 |
2 | 4.303 | 9.925 |
3 | 3.182 | 5.841 |
4 | 2.776 | 4.604 |
5 | 2.571 | 4.032 |
6 | 2.447 | 3.707 |
7 | 2.365 | 3.499 |
8 | 2.306 | 3.355 |
9 | 2.262 | 3.250 |
10 | 2.228 | 3.169 |
11 | 2.201 | 3.106 |
12 | 2.179 | 3.055 |
13 | 2.160 | 3.012 |
14 | 2.145 | 2.977 |
15 | 2.131 | 2.947 |
16 | 2.120 | 2.921 |
17 | 2.110 | 2.898 |
18 | 2.101 | 2.878 |
19 | 2.093 | 2.861 |
20 | 2.086 | 2.845 |
21 | 2.080 | 2.831 |
22 | 2.074 | 2.819 |
23 | 2.069 | 2.807 |
24 | 2.064 | 2.797 |
25 | 2.060 | 2.787 |
26 | 2.056 | 2.779 |
27 | 2.052 | 2.771 |
28 | 2.048 | 2.763 |
29 | 2.045 | 2.756 |
30 | 2.042 | 2.750 |
40 | 2.021 | 2.704 |
60 | 2.000 | 2.660 |
120 | 1.980 | 2.617 |
240 | 1.970 | 2.596 |
正規分布 | 1.960 | 2.576 |
余談ですが、自由度(標本の大きさ-1)が大きくなると、t の値が、正規分布の値とほとんど変わらなくなります。これが「自由度が十分に大きい場合は、正規分布を使ってよい」と言われている理由です。
信頼区間の計算
ここまでで、信頼区間の計算に必要な値が揃いましたので、少し整理しておきます。
t(信頼係数95%):2.262
標本標準偏差:2.413
標本の大きさ:10
あとは、信頼区間を求める式「標本平均 ± t × 標本標準偏差 ÷ √標本の大きさ」に当てはめて、計算するだけです。
30.4 + 2.262 × 2.413 ÷ √10 = 32.126
自由度(標本の大きさ-1)がよく出てくるので、信頼区間の計算でも「標本の大きさ-1」としそうになりますが、(私だけでしょうか)信頼区間の計算ではそのまま「標本の大きさ」、すなわちワン太郎の手元にあるネジの本数「10」を使います。
以上で、母平均「100万本以上あるネジすべての長さの平均」の信頼区間は、
信頼係数(当たる確率)95%で「 28.674mm 〜 32.126mm 」 と求められました。
「R」2行で出来る!「信頼区間」の求め方
統計解析ソフトの「R」を使えば、わずか2行のコマンドを入力するだけで、信頼区間を求められます。「95 percent confidence interval」の下に表示されているのが、信頼係数95%の信頼区間です。
> ネジ = c(31, 29, 28, 35, 30, 30, 32, 27, 33, 29) > t.test(ネジ) One Sample t-test data: ネジ t = 39.841, df = 9, p-value = 1.967e-11 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 28.6739 32.1261 sample estimates: mean of x 30.4
終わりに
この記事の信頼区間の説明は、かなりざっくりしたものです(^^;) 詳しくは統計学の書籍などをご参照ください。私が読んだ書籍の中では「まずはこの一冊から 意味がわかる統計学 (BERET SCIENCE)」がオススメです。書籍名通り、区間推定や信頼区間の意味が、とても分かりやすく書かれています。初学者向けの本ですが、不偏分散や自由度のことがしっかり解説されているのも特徴かと思います。
コメント
ありがとうございます!
様々なサイトを見てきた中で、あぱーブログ様の解説が圧倒的にわかりやすかったです。
>ふぐさん
こちらこそ、お褒めのコメントありがとうございます!
すごいです!!
習った同じ統計とは思えない程分かりやすかったです笑
これ程、説明一つで理解度が変わるとは…!!
なんとも、悲しいというか、嬉しいというか…
苦手な人にとってはもう、本当にありがたい限りです…!!
…説明上手になりたいなあ。
>ラー油さん
お褒めのコメントありがとうございます!
この記事がお役にたったようで良かったです。
QC検定2級を受けることになり、勉強を進めているアラフォーです。テキストを購入して勉強しているのですが、統計学の計算問題がなかなか理解出来ず、頭に入ってこない状態でした。
「自由度」について調べようと検索した結果、たまたまここに辿りついたのですが、記事のひとつひとつがわかりやすく、とても参考になりました。ノートを開き1時間程メモを取りました。糸口が掴めたように思います。ありがとうございました!
>小笠原さん
コメントありがとうございます。この記事がお役にたてて嬉しいです。
QC検定2級の勉強がんばってください!
あぱーブログ様。わかりやすく親しみやすい、とてもよいブログだと思います。コメント欄に丁寧に返答されており好感がもてます。今後も頑張ってください。応援いたします。
コメント欄の村田様。貴殿の「標本平均X(Bar)の標本分布は、正規分布N(μ,σ2/n) 」という部分は、「n個の(今回は10個の)標本平均X(Bar)の分布は平均μ分散(σ2/n)の正規分布となる」ということです。ここで分散(σ2/n)は、σの二乗を標本数n(今回は10)で割ったものです。たとえば10個の標本抽出を1万回行ったとしたら、その度数分布グラフはμを中心とした正規分布で、分散は1/nつまり10分の1になるということと思います。(つまり幅が狭まるということ)。蛇足につき失礼しました。
>ななしのナイスミドルさん
お褒めのコメントありがとうございます。
今後も頑張ります!
標本から実際の値を求める必要に迫られ勉強を始めました。
検索で上位に当たった事で、信頼されているサイトだと考え
興味深く読ませていただきました。
ところで
本サイトでは、10本の釘の長さをベースに数値を求めていますが
ここに記載された方式に疑問を呈しましたので投稿させていただきます。
貴殿が別のサイトでも触れています「統計学入門」のP201で、
標本平均X(Bar)の標本分布は、正規分布N(μ,σ2/n) とあるが、
これはn個の平均のデータをn 個求めている場合、
すなわちn2 のデータが必要になるのでは?
すなわち、10個のデータを10個:すなわち100個のデータがあったら
それを10個ずつに分解して数値化するのではないでしょうか?
本サイトでは10個のサンプルだけで求めています。
別の視点で考えます。
標準分布で考えた場合、
例えば95%の確立を得るには、分布表から見て2.8σが必要になります。
これは今回の釘の例では
30.4+2.413*2.8=37.156 のような大きな数値になります。
貴殿の数値では、32.126という非常に信頼性がある数値になります。
さすがにこれはちょっと違うのでは?と思います。
当方の思い違いもあるかもしれませんが、
どうか、確認いただけますと助かります。
>村田さん
ご指摘ありがとうございます。
頂いた2点の疑問について確認いたしました。
>これはn個の平均のデータをn 個求めている場合、
>すなわちn2 のデータが必要になるのでは?
上記につきましては、n=10(ワン太郎の手元にあるネジの本数)
で間違いはないのですが、
これを「標本の大きさ」と表記すべきところを
「標本数」と表記しておりました。申し訳ございません。
記事を修正させていただきました。
>30.4+2.413*2.8=37.156 のような大きな数値になります。
こちらにつきましては、統計学入門およびいくつかの書籍で確認しましたが
記事の内容に間違えはないようです。