「母集団」と「標本」は、推測統計の推定や検定を行うのにあたって、とても重要な考え方です。母集団は調べたいデータ全体、標本はそこからランダムに取り出したものというだけの意味なのですが、これをしっかり理解しておく必要があります。また、推測統計では母集団の平均と、標本の平均などを区別しなければならないのが、ややこしいところです。そこで今回は、母集団と標本についてまとめてみました。
「母集団」と「標本」の意味
冒頭にも書きましたが、母集団は調べたいデータ全体、標本はそこからランダムに取り出したものです。母集団は自分が調べたいデータなので、「1箱のリンゴの重さの平均」のように小さいものでも、「世界中の蝶の大きさの平均」のように大きく全ての数が分からないものでも、自由に定義して構いません。
ただ、母集団が小さい場合は全件調査ができるため、推測統計の出番がなく、そもそも母集団を定義する必要がありません。一般的に母集団は、非常に大きいものを定義します。以下は、よく目にする母集団と標本の例です。
母集団 | 標本 | |
---|---|---|
選挙 | 全有効票数 | 出口調査で調べた票数 |
視聴率 | 全世帯の視聴率 | 調査世帯の視聴率 |
アンケート | 全小学生の好きな食べ物 | アンケートを受けた小学生の好きな食べ物 |
母集団と標本を区別する
普段の生活で、「蝶の大きさの平均」と言われれば、平均は当然1つと考えますが、推測統計を使って「世界中の蝶の大きさの平均」を推測する立場になると、「世界中の蝶の大きさの平均(母集団)」を「母平均」、「捕まえた蝶の大きさの平均(標本)」を「標本平均」のように区別する必要があります。
これから推測統計を学びたいという方は、母集団と標本での用語や数学記号の違いを、しっかり理解しておくことをオススメします。
終わりに
標本から母集団を推測する推測統計(推定・検定)は、統計理論の中心であり頂点であるとも言われています。次回は、推測統計の第一歩、区間推定についてまとめてみたいと思います。
コメント