データ分析が上手くいかない原因 その③
データ分析が上手く行かない場合、要因として4つの切り口があります。
というシリーズ、今回は3回目。
前回の2.が山でした。
1.何のためにやるかが曖昧
2.データが不十分で分析のしようがない
3.データは充分にあるが分析自体が上手くない
4.分析はちゃんとできているものの、そのレポート(資料作成and/or口頭での報告)が上手くない
今回は3.の説明をします。
いわゆる「データ分析が上手くいかない」という時は、ここで引っかかっていることをイメージされているかと思います。
実際は、1,2,4の場合が多いので要注意です。まずは、それらを解決した上で、3の課題に取り組むことをオススメします。
さて、3の課題がなぜ発生するかというと、「目の付け所」が甘いことが理由です。
「目の付け所」が何かというと、「何と何を比較するか」が曖昧。
具体的には、まず、2つのものを比較すること。できる限り2次元に落とす。どうしてもの場合でも、3次元まで。ソフトバンクさんの決算報告書がイメージですね。あれはさすがに極端ですが。人間がぱっと分かるのは2次元。頑張って3次元。一気にいっぱい比較しようとして、つっかえている場合が多いです。
次に、2つのものを比較しても、なかなか1.で定義したいい結果が出ない場合。その場合の着眼点は「何と何を比較するべきか」ということを深堀りすること。似ているものを比較しても、大抵は、意味がないので、「意味のある差」をどうやってあぶり出すか。
じゃあどうやって何と何を比較するか、ということを明確にするか。間違いなく、下記ステップがオススメです。
1. 白い紙を筆記用具を用意する
2.「+」を10個記載する
3.横軸、縦軸の組み合わせを10個考える
多くの場合、3つか4つくらいで思いつかなくなる。ただ、充分にデータがあれば、10個くらいの比較候補は思いつくはず。思いつくまで頭を捻ってみる。
ということでまとめると、「データは充分にあるが分析自体が上手くない」場合は、上記を参考に、「目の付け所」をブラッシュアップしてみて下さい!
データ分析が上手くいかない原因 その②
データ分析が上手く行かない場合、要因として4つの切り口があります。
1.何のためにやるかが曖昧
2.データが不十分で分析のしようがない
3.データは充分にあるが分析自体が上手くない
4.分析はちゃんとできているものの、そのレポート(資料作成and/or口頭での報告)が上手くない
今回は2.の説明をします。
現場で相談を受けて一番多いのはこのパターンですね。。
不十分には複数の角度があり、それを大きく分けると
① 量が足りない
② 質が足りない
になります。
量が足りないについては、
①-1 種類が足りない
①-2 種類の中の数が足りない
と分解できます。
例えるなら、家庭においてどのような料理が作られているか調べるというお題があった場合に、①-1は、1人暮らしの家庭ばかりを調べてしまっているパターン。全体像を捉えようと思ったら、性別、世帯数、所得、地域、職業など、できる限り幅広く抑えたほうがより全体像に近いデータが得られますね。
①-2は、幅広くしているけど、1つの種類ごとのデータが少なすぎるパターン。何が課題かというと、上記の例で続ければ、もし測定データがたまたま変な家庭だったり、普通の家庭でも測定ミス(ヒアリング結果の転記ミスなど)があった場合、そこに引きずられてしまい、全体の判断を誤る危険性がある点。種類ごとに、3つ以上(2つだと、どちらがおかしいか判断つきづらい)の点は確保した方が望ましい。ただし、機械学習のように大量にデータを取る場合は、種類さえ確保していれば、1つの種類内のデータは1点でも全体像に影響を与えないことも多いので、頭の片隅においておくと良いかもしれません。
質が足りないについては、
②-1 測定データが絡み合ってしまっている(独立性が無い)
②-2 偏りが大きい
②-3 ばらつきが大きい
②-4 正規分布に従わない
②-5 データの抜けが多すぎる
と分解できます。
ちょっと細かくなっているので、やらねばならぬことという軸でいえば、できる限りちらして測定するという点に集約されます。
ということで、これらを満たすように実験計画を「実験の前に」組むことが理想です。
というか、それをやっておかないと、結局データ不足で再実験になったら被害は甚大、最悪、開発期間2倍、コスト2倍にもなりえます。
それを対応するために色々と対応もあるのですが、まずは、できるだけ幅広い視点で実験計画を組んでみて、それからデータを取得し、その上でデータ分析に進みましょう!
データ分析が上手くいかない原因 その①
データ分析が上手く行かない場合、要因として4つの切り口があります。
1.何のためにやるかが曖昧
2.データが不十分で分析のしようがない
3.データは充分にあるが分析自体が上手くない
4.分析はちゃんとできているものの、そのレポート(資料作成and/or口頭での報告)が上手くない
今回は1.の説明をします。
よくありますよね 「これやっといてー」と指示を受けて、「ハイ!」と答えてしまう場合。 そしてそれから始まる地獄、、、。
なんとなくデータ分析して、と依頼を受けて、なんとなく手を出した人が発生した時に、生まれでてくる罠。
それが、
1.何のためにやるかが曖昧 です。
原因としては、ちゃんとデータ分析の目的を言語化できていないこと。
A4用紙の裏でも、iPadでもいいので、白紙にペンで検討することがおすすめします。
具体的には下記3点について、最低、それぞれ3つずつ記載します。
1-1.何のためにやるのか(未来、あるべき姿)
1-2.何を背景にしてやるのか(過去)
1-3.どういう手段でやるのか(現在)
このように時系列で、やるべきことを言語化することで、データ分析自体が捗ることはもちろん、気持ちとして乗ってきます。
ということでまとめ。 データ分析が上手く行かない理由の1番めは、「何のためにやるかが曖昧」。 その理由を打破するための手法は、「何のため」を未来(あるべき姿)、過去(背景)、現在(手段)の3軸で言語化してみる。
遠回りなようで、結局早くなるので、「分析」についてやみくもに手を動かす前に、一度試してみて下さい。
今回も読んで頂きありがとうございました^^
データ分析のお悩み解決
データ分析について、最大の悩みを解決しましょう!
悩み:データ分析しようとしてもなぜか上手く行かない。
あるあるですよね。 これについて悩んでいる方は、ぜひ一度、読んでみて下さい。
この原因には4つの切り口があります。
1.何のためにやるかが曖昧
2.データが不十分で分析のしようがない
3.データは充分にあるが分析自体が上手くない
4.分析はちゃんとできているものの、そのレポート(資料作成and/or口頭での報告)が上手くない
人によってどこでつまづきやすいかは異なります。 さらに、同じ人でも、テーマが変わるとつまづくところが変わります。
よって、データ分析が上手く行かないときは、上記に対する下記の4つのチェックポイントを確認してみる必要があります。
1.何のためにやるかが言語化できている
2.データが充分にある
3.分析が上手にできている(What's newの内容を抽出した)
4.資料はわかりやすくできており、説明原稿も完成している。第三者に聞いてもらって問題ないことを確認sした。
それぞれをもう少し具体的にご説明します。
と思いましたが、本日は良い時間なのでここまで。
続きは、また明日!
パワークエリとパワーピボット
今後、パワークエリとパワーピボット、DAXについて整理し、わかりやすく説明していきます。
そもそもパワークエリとパワーピボット、DAXとは、エクセルの最新機能を活用したデータ分析の効率化手法。
海外ではモダンエクセルという総称で数年前から流行り始めた。 一方、少なくとも私の周りでは、話題になったことがない。知名度が低い。むしろ知名度ゼロ?
データ分析界隈の人はもちろん、普段エクセルのSUM関数地獄やピボットテーブル地獄にいる人は、知らないのがもったいない、使っていないのがもったいないくらいのスーパー機能です。
最初は、ちょっととっつくにくいところがあります。さすがマイクロソフトさんなのか。 一度使い始めると絶対に戻れない凄さがあります。
大きく3点にまとめると
1.データの前処理をVBA無しに自動化できる。
(複数ある表の自動統合、コードと名称の連携など(今まではVLOOKUPでコツコツやってた案件))。
2.ダッシュボード化がかなりのレベルで自動化できる。ダッシュボードとは、グラフや表といったデータ分析結果を都度最新データで表示すること。
(今まではデータがアップデートされるたびに人手でダッシュボード下)
3.VBAに比べてリバースエンジニアリングしやすい。つまり、他の人でもどのような処理をしているかが追いやすい。
(今まではVBAは他人が実質、触れない。作成者も1年以上経ったら他人レベルまで記憶が失われることもザラ)
となります。
最初はちょっと大変ですが、その先の桁違いの効率化を目指して頑張っていきましょう^^
自分にはなかった、日本語力。
これまで、会社に入って10年以上、日本語を使って仕事をしてきた。 少なくともそう思っていた。
最近、少しずつ日本語の勉強をし始めてみた。 自分の文章を振り返ると、恥ずかしさで耐えられないレベルの低クオリティであることに直面した。
気付いた課題としては大きく3つ。
1.そもそも何が言いたいのかわからない。
2.長い。無駄な情報や言い訳が多い。
3.流れが悪い。
ちゃんとした指導を頂くこともなく、自分で見本から学ぶ気もなく、何もしてこなかった結果。
逆に、これからちゃんとやれば、まだまだ伸びるはず。
結局、情報を得るのも発信するのも日本語。
今後はしっかり使って、失敗して、学習してブラッシュアップしていこう。
ポイントとしては
1.1文1意
2.リズム感
3.自分にしか書けない内容をわかりやすく書く(@中嶋聡さん)
データ分析界隈を中心に、実際に発信しながら、日本語力を意識して磨いていきます。
ここまで読んで頂き、ありがとうございました!
淡々とコピーライティング
考えや取り組みを整理するためにこのブログを活用する。
結局いっぱい書くしか無いなぁと。 データ分析を専門に色々とやっているけど、もう一本軸を創ろうということで個人でも使えるようにコピーライティングかなぁ。 あんまり深堀りしても仕方ないけど、結局、言語を極めるというのはいい人生のために避けて通れない。 この考え自身がコピーライターの仕事にハマっているのだけれど。
実際に良いものを持っていても伝わらないことはよくあるし、 それが本当に良いものかどうかという観点が受け取り手のことに刺さっているかという点によって変わる。 そういう意味で、下記の本を見てみたら、さすが芯に刺さっていた。
日々書きながら、考えを深めていくこととします。