R

データ分析

5分でわかる!「回帰係数」の求め方(回帰直線の傾き)

統計学の回帰分析を使うと、身長と体重のような2つのデータから、回帰直線「体重 = 身長 × 回帰係数 + 切片」(上のグラフの赤線のことです)を求め、身長から体重を予測することができます。例えば、気温からビールの売れ行きを予測したり、天気から来客数を予測したりと、仕事にも活用できそうですね。そこで今回は、回帰分析の一番のキモ「回帰係数」(「回帰直線の傾き」ともいいます)の求め方をわかりやすくまとめ...
データ分析

統計的仮説検定で HTTP/2 と HTTP/1.1 の表示速度を検証

統計的仮説検定は、標本の統計量を元に、母集団に関する仮説を検証するための統計学の手法です。例えば、「日本人の平均身長は170cmである」という仮説を、無作為抽出した100名の身長から検証することができます。そこで今回は、仮説検定を使って、HTTP/2 と HTTP/1.1 の表示速度に、はたして違いはあるのか?を検証してみました。
データ分析

5分でわかる!区間推定「母比率」の信頼区間の求め方

選挙速報で開票率が低いのに、当選確実が出ている事を不思議に感じたことはないでしょうか?各報道機関がどういった仕組みで当選確実を出しているのかは、明らかにされていませんが、母比率の区間推定が使われていると言われています。また、母比率の区間推定は、日本全体のTVの視聴率や、内閣支持率なども推定できるので、統計学の中でも実用性が高い手法です。そこで今回は、母比率の信頼区間の求め方をまとめてみました。
データ分析

5分でわかる!区間推定「母分散」の信頼区間の求め方

母分散の区間推定を使うと、例えば母集団が100万本のネジだとして、そのネジの長さのバラツキ(分散)を、数本のネジを調べるだけで、推定することができます。そこで今回は、母分散の信頼区間の求め方を、出来るだけ分かりやすくまとめてみました。
データ分析

5分で分かる!区間推定「信頼区間」の求め方

区間推定は、標本の統計量を元に、母集団の平均などを、幅(区間)を持たせて推定する統計学の手法です。この推定した幅を「信頼区間」と言います。例えば、100万本のネジの長さの平均のように、母集団が大きい場合でも、区間推定を使えば、すべてのネジの長さを測らなくても、平均を推定することが出来ます。そこで今回は、母平均(母集団の平均)の信頼区間の求め方を、出来るだけ分かりやすくまとめてみました。