選挙速報で開票率が低いのに、当選確実が出ている事を不思議に感じたことはないでしょうか?各報道機関がどういった仕組みで当選確実を出しているのかは、明らかにされていませんが、母比率の区間推定が使われていると言われています。また、母比率の区間推定は、日本全体のTVの視聴率や、内閣支持率なども推定できるので、統計学の中でも実用性が高い手法です。そこで今回は、母比率の信頼区間の求め方をまとめてみました。
例題
有効投票数10万票の選挙で、開票率1%(1,000票開票)時点の、A候補者の得票率は60%でした。このとき、信頼係数95%で、母比率の信頼区間を求めてみましょう。
母比率の信頼区間を求める式
母比率の信頼区間は、以下の計算式で求められます。
母平均や母分散の区間推定と比べると、計算が簡単に思えますね。今回は標本の数が1,000票と十分に大きいので、「z」の値は正規分布表から導き出せます。
z の値
下の正規分布表から、信頼係数95%の z の値を求めます。
正規分布表
信頼係数:90% | 信頼係数:95% | 信頼係数:99% | |
---|---|---|---|
z の値 | 1.64 | 1.96 | 2.58 |
母比率の信頼区間の計算
母比率の信頼区間の計算に必要な値を整理しておきます。
z:1.96
標本の数:1000
あとは、母比率の信頼区間を求める式「標本比率 ± z × √{標本比率 × ( 1 - 標本比率 ) ÷ 標本の数}」に当てはめて、計算するだけです。
0.6 + 1.96 × √{0.6 × ( 1 - 0.6 ) ÷ 1000} = 0.630 = 63.0%
以上で、母集団10万票すべてを開票した時のA候補者の得票率は、信頼係数95%で「 56.9% 〜 63.0% 」 と求められました。
この結果よりA候補者の得票率は、最低でも56.9%と過半数を超えているので、当選確実であると推測できます。
「R」1行で出来る!母比率の信頼区間の求め方
統計解析ソフトの「R」を使って、母比率の信頼区間を求めるには、二項検定の「binom.test」関数を使います。今回の例題の場合は「binom.test(<得票数>, <標本の数>)」の形式で指定します。
> binom.test(600, 1000) Exact binomial test data: 600 and 1000 number of successes = 600, number of trials = 1000, p-value = 2.728e-10 alternative hypothesis: true probability of success is not equal to 0.5 95 percent confidence interval: 0.5688784 0.6305310 sample estimates: probability of success 0.6
「95 percent confidence interval」の下に表示されているのが、信頼係数95%の母比率の信頼区間です。
終わりに
次回は、回帰係数の区間推定についまとめてみたいと思います。
コメント
例題 有効投票数10万票の選挙で、開票率1%(1,000票開票)時点の、A候補者の得票率は60%・・・。95%信頼係数の母比率の信頼区間を求めるときに計算式でn=1000を採用する理由が分かりません。サンプル数は10万でないのは何故ですか?
類似する例題の殆どが同様の回答となっています。
教えて下さい。
>小嶋和弘さん
コメントありがとうございます。
有効投票数10万票が「母数」
開票率1%(1,000票開票)が「標本の大きさ」(サンプル数)になりますので、
n=1000 を採用します。
もしよければ「5分で分かる!「母集団」と「標本」の意味」の記事をご参照ください。