焦点

でっかいことに焦点を

【データサイエンティスト040】エクセルピボットテーブルのTips。

あぁ、かれこれ40回目に到達。

データサイエンティストを切り口にこつこつやり始めてもはや40日目や。。

サービスを作ろうと思いつつ未だ案の状態でお勉強ちぅ。

まぁ、あせりつつ、ぼちぼちやっていこう。

 

ということでお勉強は進める一方、自分が学んできたことを書き下してきてくれている人の実りになるようなものを出したいな、ということで進めているこの1週間強か。

 

ここ数日はピボットテーブルについてまとめ始めました。

前回はデータの構造とピボットテーブルを使った場合のアウトプットグラフの例について。

kohei327.hatenablog.com

 

使ったことが無い人はアウトプットのレベルがぴんとこないかもしれない。簡単に説明しておくと、今回は2017年1月1日~2018年12月31日までに1万件の売り上げが発生したと仮定したデータを乱数で作成し、それをグラフ化しました。データの項目は商品(4種類)と担当者(4人)、単価と売上額としました。1万件のデータは日割りで出しているのでそれを4半期ごとにまとめて推移をプロットしたり、担当者ごと1年間の売り上げを内訳含めて比較したり。ピボットテーブル使える人なら「あぁ、そういうことね」レベル(簡単なレベル)ですが、使えない人からすると「あーうー」ってなるかな、と思う。

基本的な使い方はググってもらうか本を買ってもらうとして。

まぁこういった内容は1冊くらい本があっても損はしないどころか必ず得すると思う。日々の仕事が速くなり、余った時間で検討することができ(堕落しそうな人は瞑想から?)、その分アウトプットの質が上がって、いまどき流行りの働き方改革に繋がったりするんちゃうかな。とか言ってみたりして。

このブログではやってみて困ったことをまずはいくつか列記してみる

 

あれ?データが合計でなく「データの個数」になっちゃう、、、

  • はい、理由は欠測値です(生データに項目はあるけど数字が無いセルが存在すること)。ピボットさんは、データの全項目に数字が入っていたら「合計」にして、そうじゃなかったら(=欠測値があったら)「データの個数」で表示するらしい。
  • それを「合計」にするには、いくつか手法あるけど、最も早い(と思われる)のは、「データの個数」を表示しているいずれかのセルにカーソルを合わせ、右クリックボタン(キーボードのどこかにあるはず!)を押してすかさず「M」→「S!」と押せば目にも留まらぬ速さで「合計」が表示されます。これは知る限り一番スムーズ。

 

いくつか、といったけどこの一番大きい項目以外はいまいちかな、、、明日までもう少しひねり出してみる。

 

ということで、ここまでブログを読んでくださったアナタ。

まだもしピボットさんを使ったことがなれば、一旦使ってみてやってくださいな!