5分でわかる!区間推定「母比率」の信頼区間の求め方

データ分析
データ分析
スポンサーリンク

選挙速報で開票率が低いのに、当選確実が出ている事を不思議に感じたことはないでしょうか?各報道機関がどういった仕組みで当選確実を出しているのかは、明らかにされていませんが、母比率の区間推定が使われていると言われています。また、母比率の区間推定は、日本全体のTVの視聴率や、内閣支持率なども推定できるので、統計学の中でも実用性が高い手法です。そこで今回は、母比率の信頼区間の求め方をまとめてみました。

例題

有効投票数10万票の選挙で、開票率1%(1,000票開票)時点の、A候補者の得票率は60%でした。このとき、信頼係数95%で、母比率の信頼区間を求めてみましょう。

母比率の信頼区間を求める式

母比率の信頼区間は、以下の計算式で求められます。

標本比率 ± z × √ { 標本比率 × ( 1 - 標本比率 ) ÷ 標本の数 }

母平均母分散の区間推定と比べると、計算が簡単に思えますね。今回は標本の数が1,000票と十分に大きいので、「z」の値は正規分布表から導き出せます。

z の値

下の正規分布表から、信頼係数95%の z の値を求めます。

z(信頼係数95%)= 1.96

正規分布表

信頼係数:90%信頼係数:95%信頼係数:99%
z の値1.641.962.58

母比率の信頼区間の計算

母比率の信頼区間の計算に必要な値を整理しておきます。

標本比率:0.6(60%)
z:1.96
標本の数:1000

あとは、母比率の信頼区間を求める式「標本比率 ± z × √{標本比率 × ( 1 - 標本比率 ) ÷ 標本の数}」に当てはめて、計算するだけです。

0.6 - 1.96 × √{0.6 × ( 1 - 0.6 ) ÷ 1000} = 0.569 = 56.9%
0.6 + 1.96 × √{0.6 × ( 1 - 0.6 ) ÷ 1000} = 0.630 = 63.0%

以上で、母集団10万票すべてを開票した時のA候補者の得票率は、信頼係数95%で「 56.9% 〜 63.0% 」 と求められました。

この結果よりA候補者の得票率は、最低でも56.9%と過半数を超えているので、当選確実であると推測できます。

「R」1行で出来る!母比率の信頼区間の求め方

統計解析ソフトの「R」を使って、母比率の信頼区間を求めるには、二項検定の「binom.test」関数を使います。今回の例題の場合は「binom.test(<得票数>, <標本の数>)」の形式で指定します。
 

> binom.test(600, 1000)

	Exact binomial test

data:  600 and 1000
number of successes = 600, number of trials = 1000, p-value = 2.728e-10
alternative hypothesis: true probability of success is not equal to 0.5
95 percent confidence interval:
 0.5688784 0.6305310
sample estimates:
probability of success 
                   0.6

「95 percent confidence interval」の下に表示されているのが、信頼係数95%の母比率の信頼区間です。

終わりに

次回は、回帰係数の区間推定についまとめてみたいと思います。

コメント

  1. 小嶋和弘 より:

    例題 有効投票数10万票の選挙で、開票率1%(1,000票開票)時点の、A候補者の得票率は60%・・・。95%信頼係数の母比率の信頼区間を求めるときに計算式でn=1000を採用する理由が分かりません。サンプル数は10万でないのは何故ですか?
    類似する例題の殆どが同様の回答となっています。
    教えて下さい。

タイトルとURLをコピーしました