データ分析」カテゴリーアーカイブ

5分で分かる!確率統計「nCr」の計算方法

2016年1月24日  カテゴリー:データ分析  タグ: ,

数学の確率の問題で出てくる nCr は、組み合わせの数(Combination)を表す記号です。高校の数学で学ぶはずなのですが、学生時代あまり勉強熱心ではなかった私には、例えば 4C2 = 6 となるのがよく理解できませんでした。統計学では当たり前のようにこの nCr 記号が出てきますので、とても困ります。そこで今回は、nCr の意味と計算方法をまとめてみました。

▷続きを読む

dimple.js 積上げ棒グラフの作り方

2015年10月8日  カテゴリー:プログラム データ分析  タグ: , ,

dimple(ディンプル)は、さまざまなグラフを簡単に作成できる JavaScript ライブラリです。データ可視化ライブラリの定番 D3.js と合わせて使います。D3.js は柔軟性が高く、複雑なデータを可視化することが得意ですが、グラフの描画処理を自分で作成する必要があります。描画処理のコードを書くのは、なかなか大変ですが、この dimple ライブラリを使えば、複雑なグラフを、わずか数行のコードで作成することができます。

クラフ描画ライブラリを色々調べてみましたが、少し込み入ったグラフを作成するには、この dimple が、一番自由度が高く使いやすいと思います(しかもBSDライセンスなので商用利用も可能)そこで今回は、複雑なグラフの一例として dimple を使った積上げ棒グラフの作り方をご紹介したいと思います。

▷続きを読む

5分で分かる!「標準偏差」の使い方

2015年9月30日  カテゴリー:データ分析  タグ: ,

標準偏差は、データの「ばらつき」を表す値です。データ分析をする上で、とても重要な値なのですが、私のように統計学に馴染みがない人にとって、この標準偏差は、大変とっつきにくい存在ではないでしょうか? そこで今回は、標準偏差の意味や使い所を、できるだけ分かりやすくまとめてみました。

▷続きを読む

TWKEY について

2015年7月12日  カテゴリー:データ分析  タグ:

TWKEY(ツイッキー)は、ある検索ワードで Twitter ツイートを検索して、ツイートに含まれる単語の出現回数をランキング表示する、簡易的なテキストマイニングツールです。もしかしたら、この TWKEY を使って「ビールとおむつ」のような、関連するキーワードを見つけられるかもしれませんよ。

▷続きを読む

PHP 政府統計 API の使い方メモ(e-Stat)

2015年7月2日  カテゴリー:プログラム データ分析 PHP  タグ: , ,

政府統計の総合窓口(e-Stat)の API 機能 では、各府省が公表する統計データを、APIを使って簡単に取得することができます。以前は各府省ごとに、統計データを公開していましたが、近年この、政府統計の総合窓口サイトの1つにまとめられ、昨年からは API 機能の提供も開始されました。

政府統計 API の使い方はいたって簡単なのですが、統計データの種類、量ともに膨大なため、データ取得までの流れが、他のWEBサービス系のAPIとは少し異なります。そこで今回は、政府統計 API の使い方をご紹介します。

▷続きを読む

5分で分かる!相関係数の求め方

2015年6月25日  カテゴリー:データ分析  タグ:

相関係数は、体重と身長など、2つの値の関係の強さを示す数値です。相関係数を使えば「Aの商品を買っている人は、Bの商品を買うことが多い」のような傾向を、見つける事が出来るかもしれません。統計学を使ったデータ分析で、まず初めに使ってみたくなるのが、この「相関係数」ではないでしょうか? そこで今回は、相関係数の求め方を、出来るだけ分かりやすくまとめてみました。

▷続きを読む