tommy(BIとか書きます)

BIとか、最近ハマってる勉強ネタとか書きます

BIを学んだら、次のステージへ行こう!

DWH構築が完了して、BI使ってデータ・ドリブンに仕事できるようになってきた。

自社データも広告データもガンガン使える。望み通りの環境はセットアップ完了!

 

さてさて、30代になったしデータ・ドリブンのあれこれだけではなくて、経営戦略を考えられるようになりたいな~と思い始めたマーケター30代です。

 

人生100年時代「学び直し」が必要だと聞きますが、何をどうした良いやら?

 

ここ数年の動きとしては大学主催のアントレプレナーシップに通ってみたり、

セミナーに偉人の講義を聞きに行ってみたり、

会社帰りに勉強会行ってみたり、主催してみたり、

色々やっているけれど、もう一段上から戦略考えられるようになりたいな、と。

 

最近、コツコツ通勤時間やお風呂で学びだして、良かったのでご紹介します。

 

ビジネスを学べる動画サービス | グロービス学び放題 ¥1,485円 (年契約の場合)

mba,MBA,グロービス学び放題,グロービス,globis hodai,globiz

mba,MBA,グロービス学び放題,グロービス,globis hodai,globiz

デザインシンキング

本1冊くらいの値段で、

こんな系統の動画が見放題なんですよ、びっくり(笑)。

 

GAFAの潮流やKKDを説明できるようになりたい人には「ビジネスでのデータ活用

イノベーション創出には欠かせない「デザインシンキング

マーケターなら、今さら聞けない「マーケティングの基本

誰かに伝えたいときに欠かせない知識「プレゼンの極意」 などなど。

 

 

グロービス学び放題を運営する”グロービス”はビジネススクールを運営してる会社だそうです。

 

この動画のカテゴリーからすると「ビジネススクール」の名前の通り、経営に必要な知識を網羅して学べるようです。

 

働きながら通学するのはハードルが高いけど、動画で学ぶなら気軽。

 

現場の知識があってデータドリブンに働ければ、先々大丈夫かなと思っていたけれど、どんどんコードレス化が進んでるから、人ならではの価値である戦略立案をロジカルに計画して、人を巻き込んでスケールする力は、これからの時代必要ですね。

 

ビジネスを学べる動画サービス | グロービス学び放題

hodai.globis.co.jp

Python3でのヒストグラムの描き方

〜〜〜 前置き 〜〜〜

初めて見るデータはまずヒストグラムを描いて分布を確認することが多いので、

Python3での、ヒストグラムの描き方についてまとめてみました(^^)
以下、青文字Pythonのコードです。
コードはipython notebook(Jupyter)で実行してください。
※ipython notebookがない方は事前にインストールしてください。
 
〜〜〜 本 編 〜〜〜 
まずはPythonの描画library"Seaborn"をインストールします。
pipが使える方は、pip install seabornでインストール実行できます。
その他、詳細はこちら(http://seaborn.pydata.org/installing.html)。
"ipython notebook"を起動します。
 
//正規分布に従う乱数を生成するための関数をインポートします。
from numpy.random import randn
 
//描画するためのlibrary(matplotlib, seaborn)をインポートします。
import matplotlib.pyplot as plt
import seaborn as sns
 
//ヒストグラムの画像を埋め込む事ができるcmdも書きます。
%matplotlib inline
 
//dataset1として、100個正規分布に従う乱数を生成します。
dataset1 = randn(100)
 
//この100個の分布からヒストグラムを表示するには、
 pltからhistを引数にしてヒストグラムを描きます。
plt.hist(dataset1)

f:id:okawachi-hitomi:20161228222313p:plain

 //ヒストグラムはデフォルトだとbin(棒)の区切りが10個になります。
 この中にデータが入ってるか(頻度)が縦軸です。
 正確な数字を知りたければbinの座標が返ってきてるのでこれを見ます。
 
//2つ目のデータセットを作ります。
dataset2 = randn(80)
 
 //色をピンクにしてみます(笑)
plt.hist(dataset2, color='pink') 

f:id:okawachi-hitomi:20161228222306p:plain

//全体を積分したときに1になるように縦軸を標準化するには、
"normed"を使って、plt.hist(dataset1, normed=True)と書きます。
 
//dataset1とdataset2を標準化します。
plt.hist(dataset1, normed=True, alpha=0.5 ,bins=20)
plt.hist(dataset2, normed=True, alpha=0.5, bins=20, color='pink')

f:id:okawachi-hitomi:20161228222711p:plain

//標準化することで、
 どちらのbinが多い少ない、という議論ができるようになりました。
 
//data1とdata2に10000の乱数をふります。
data1 = randn(10000)
data2 = randn(10000)
 
//2つのデータのヒストグラムを同時に描きます
 (=ジョイントディストリビューション
sns.jointplot(data1, data2)

f:id:okawachi-hitomi:20161228224526p:plain

 

//真ん中は散布図(スキャッタープロット)が描かれ、上と右にヒストグラムが描かれます。
これだと分かりにくいので、分布をヘックス(六角形)にして、
二次元の色の濃さでデータの分布密度がわかるようにします。
sns.jointplot(data1, data2,kind='hex')

f:id:okawachi-hitomi:20161228222201p:plain

どこに、どのくらいのデータがあるのか可視化できましたね^^
ヒストグラムの描き方はここまでです。
おつかれさまでした!
 
データドリブンを学んだら、次のステージへ行こう!

Tableau基本操作(第3回)

Tableau初心者向けの基本操作ガイドです。

第2回第1回と同じサンプルデータを使って、データの可視化をしました。

第3回は第2回と同じサンプルデータを使って、時系列データの作成をします。

★完成イメージ★

f:id:okawachi-hitomi:20160812134721p:plain

1. 新規ワークシートの作成

画面下のグラフのマークを押すと新規ワークシートが開きます。

f:id:okawachi-hitomi:20160812115413p:plain

↓ こんな感じ

f:id:okawachi-hitomi:20160812115429p:plain

 2. 時系列データの作成

①「オーダー日」を列に、「売上」を行にドラッグ&ドロップします。

日付は時系列データなので自動的に「折れ線グラフ」になりました。

f:id:okawachi-hitomi:20160812120606p:plain

★グラフの種類は「マーク」にあるグラフの種類にも変更できます。

例)棒グラフ

f:id:okawachi-hitomi:20160812122718p:plain

 ②折れ線グラフに戻り、列に入っている「年(オーダー日)」の「+マーク」をクリックします。

f:id:okawachi-hitomi:20160812123747p:plain

③「+マーク」をクリックすると、「四半期(オーダー日)」→「月(オーダー日)」→「日(オーダー日)」と詳細なデータにできます。

f:id:okawachi-hitomi:20160812123806p:plain

④日付け単位で表示しているので1つの画面には収まっていませんが、スライダーで動かせば全期間のデータを閲覧できます。

f:id:okawachi-hitomi:20160812124238p:plain

⑤1つの画面に表示したいときは「ビュー全体」にします。

f:id:okawachi-hitomi:20160812123819p:plain

 ⑥「年」「月」だけで表示したいときは、「四半期」「日」を列の外にドラッグ&ドロップします。

f:id:okawachi-hitomi:20160812125103p:plain

↓ こんな感じになります。

f:id:okawachi-hitomi:20160812125121p:plain

 ⑦「月」を「年」の前にもっていくと、「年毎の傾向」がだせます。

f:id:okawachi-hitomi:20160812131841p:plain

 ⑧「年」を色にドラッグ&ドロップすると「年」がマークのピルに入ります。年別の折れ線グラフをだせます。

f:id:okawachi-hitomi:20160812182251p:plain

⑨「年」を行にドラッグ&ドロップすると、年別に折れ線グラフがだせます。

f:id:okawachi-hitomi:20160812133355p:plain

★完成まであと少しです!

⑩「売上」の表示単位を変えたいときは、「売上」の上で右クリックして「書式設定」をクリックします。

f:id:okawachi-hitomi:20160812134419p:plain

↓ 「数値」をクリックして、「通貨(標準)」を選択すると、売上金額の単位が「¥(円)」になりました。

f:id:okawachi-hitomi:20160812134450p:plain

↓ 同じ画面で「フォント」をクリックして、文字の大きさを「10px」にして「太字」を選択するとこうなります。

f:id:okawachi-hitomi:20160812134705p:plain

★完成です!

f:id:okawachi-hitomi:20160812134721p:plain

※補足※

メジャーにある「売上」を変更すると、他のシートで分析する時にも売上は通貨で表示されるようになります。

f:id:okawachi-hitomi:20160813170548p:plain

f:id:okawachi-hitomi:20160813171017p:plain

 

次回は地図データの作成です♪

 

★関連記事

データドリブンを学んだら、次のステージへ行こう!

hitomitarou.hatenablog.com

【第1回】Tableau基本操作「ダウンロードから分析画面にたどり着くまで」

【第2回】Tableau基本操作「サンプルデータを使ったデータの可視化」

【第1回】Pythonでのヒストグラムの描き方

hitomitarou.hatenablog.com

 

Tableau基本操作(第2回)

Tableau初心者向けの基本操作ガイドです。

第1回はダウンロードから分析画面にたどり着くまでのところででした。

第2回は第1回と同じサンプルデータを使って、データの可視化をします。

 ★完成イメージ★

f:id:okawachi-hitomi:20160811184107p:plain

1. 取り込んだデータについての説明

シートの左側に「フィールド名」が表示されます。

「メジャー」は量的変数(*1)で、「ディメンション」は質的変数(*2)です。

*1量的変数:数や量で測れる変数のこと

→売上、年齢など

*2質的変数:数や量では測れない変数のこと

→性別、職業など

f:id:okawachi-hitomi:20160811173413p:plain

2. データの可視化

①「売上」を「行」にもって行きます。

f:id:okawachi-hitomi:20160811175026p:plain

②「カテゴリ」を「列」にドラッグ&ドロップします。

f:id:okawachi-hitomi:20160811175034p:plain

③「サブカテゴリ」を「カテゴリ」の隣にドラッグ&ドロップします。

f:id:okawachi-hitomi:20160811175105p:plain

④並び順の変更(ソート)

「売上」の近くにカーソルを持っていくとマークがでるのでクリック!

昇順、降順にソートできます。

f:id:okawachi-hitomi:20160811175359p:plain

降順に並べ替えができました。

f:id:okawachi-hitomi:20160811175620p:plain

⑤「利益」を「色」にドラッグ&ドロップします。利益が多い=緑、利益が低い=赤で表示されます。

f:id:okawachi-hitomi:20160811181248p:plain

⑥「売上」を「ラベル」にドラッグ&ドロップします。

f:id:okawachi-hitomi:20160811181257p:plain

⑦「文房具」から「ラベル」までは売上が少ないのでグループ化します。

「shiftキー」を押しながら「文房具」から「ラベル」までをクリックします。

クリップマークが出るので、おします。

f:id:okawachi-hitomi:20160811181500p:plain

こんな感じにグループ化されます。

f:id:okawachi-hitomi:20160811181508p:plain

⑧グループ化された項目の名前を「その他」に変えたいときは、項目名を右クリックして「別名の編集」から「その他」に変更します。

f:id:okawachi-hitomi:20160811182456p:plain

f:id:okawachi-hitomi:20160811182511p:plain

f:id:okawachi-hitomi:20160811182522p:plain

⑨縦と横を入れ替え(スワップ)るときは画面上のマークをクリックします。

f:id:okawachi-hitomi:20160811182815p:plain

↓ 並べ替えました

f:id:okawachi-hitomi:20160811183235p:plain

⑩「地域」を列にドラッグ&ドロップします。

f:id:okawachi-hitomi:20160811183528p:plain

⑪四国~北海道をグループ化します。

f:id:okawachi-hitomi:20160811183619p:plain

★こんな感じになりました。完成まであと少しです!

f:id:okawachi-hitomi:20160811183711p:plain

⑫「ビュー全体」を選択肢します。

f:id:okawachi-hitomi:20160812100120p:plain

⑬シート名をダブルクリックすると編集できます、シート名を「カテゴリ」に変更します。

f:id:okawachi-hitomi:20160811183928p:plain

★完成です!

f:id:okawachi-hitomi:20160811184137p:plain

次回は時系列データの作成です♪

 

★関連記事

データドリブンを学んだら、次のステージへ行こう!

hitomitarou.hatenablog.com

【第1回】Tableau基本操作「ダウンロードから分析画面にたどり着くまで」

【第3回】Tableau基本操作「サンプルデータを使った時系列データの作成」

【第1回】Pythonでのヒストグラムの描き方

hitomitarou.hatenablog.com

Tableau基本操作(第1回)

Tableau初心者向けの基本操作ガイドです。

第1回はダウンロードから分析画面にたどり着くまでのところです。

 

1. Tableauをダウンロード

ダウンロードをクリックするとデスクトップにアイコンができます。

f:id:okawachi-hitomi:20160811162950p:plain 

2. 分析用データを選択する

サンプルデータを使った作業を行います、下記のエクセルをデスクトップアイコンにドラッグ&ドロップしてください。

★サンプルデータ(xls)の保管場所

C:\Users\(ユーザ名)\Documents\マイ Tableau リポジトリ\データ ソース\9.3\ja_JP-Japan

→サンプル - スーパーストア.xls

 

サンプル-スーパーストアは、「注文」「返品」「関係者」の、3つのシートがあります。

「注文」をドラッグ&ドロップします。すると、画面下部にあるフィールドに「注文」の項目名が表示されます。

f:id:okawachi-hitomi:20160811165123p:plain

画面下にあるオレンジ色になっている「シート1」をクリックします。

シート1に移ると、こんな画面です。

f:id:okawachi-hitomi:20160811164546p:plain

 サンプルデータを使った分析の準備ができました、第2回では売上を可視化してみましょう♪

 

★関連記事

データドリブンを学んだら、次のステージへ行こう!

hitomitarou.hatenablog.com

【第2回】Tableau基本操作「サンプルデータを使ったデータの可視化」

【第3回】Tableau基本操作「サンプルデータを使った時系列データの作成」

【第1回】Pythonでのヒストグラムの描き方

hitomitarou.hatenablog.com