【データサイエンティスト039】エクセルピボットテーブルのデータ形式
データサイエンティストを切り口にぼちぼちやっているブログ。
サービスを出そうと思いつつ今は基礎固めというかなんと言うか逃げというかまぁお勉強中。
UdemyさんとTableauさんにお世話になっております。
勉強がひと段落するまでは今手持ちの情報で参考になるかな?という内容をぼちぼち書いていこうとやってます。
昨日からはピボットテーブル。使いこなしている人は使いこなしている、使ってない人は機能さえ知らない、という。
余談ですが、ピボットテーブルとゴールシーク、ソルバーを使えればエクセルだいぶ活用できてるかな、と。
もっと別のソフトでさくさくできている人は当然それでいいとして、エクセルしか武器が無い人はその3つをちょっと深めてみると色々検討に使えるかと。
閑話休題、ピボットテーブルについて。
今日はデータの形についてお話します。
ピボットテーブルを使うならこの形じゃないとうまく読み込んでくれません。
そもそも使えなくなっちゃう。
逆にこの形式でデータをまとめる癖をつけておくとエクセルを超えて次の言語やソフト使うときにかなりすんなりいけるはず。
データ100個以内くらいなら自己流の表でもいけるでしょうがそれを超えてくると
- 元データは今回説明する形で保存
- 分析は別の表とグラフで行う
という方式にするとアウトプットの質は上がり必要な時間は減らせることうけあいです。
うけあいって誓約(うけい)からきてたりするのかしら。しないのかしら。
ということでそのデータの形。
どーん!
項目を横に、データを縦に。
以上!
今回は営業っぽいデータを創作したけれど、理系の測定データも同じく項目を横に時間を縦にして継続的に追加していくのがおすすめ(というか知る限りみんなそうしてるからいまさらですみません)。
こういう風なデータがあれば、ピボットテーブルを活用すれば15分くらいで下記のグラフまでは作れちゃいます。
ちなみに上のデータは乱数で1万行作ったので、手でぽちぽちやるとしたらどうするかな、、、VLOOKUPで出すかフィルタで各要素抽出してやるかいっそのことマクロで何とかしようとするか、、、
いずれにせよデータ数が多くなると上記のような分析をエクセルでやるには(前提条件だらけですが)今のところピボットテーブルさんが妥当な選択だと思います。
ということで今日のまとめ。
- 項目を横に、データは縦に!
普段のデータからやっていきましょうー!
明日はピボットテーブルの地味で便利な使い方、についていきましょうか。
基本的な使い方はいくらでも本やサイトがあるので割愛する方向で考えてますー。