焦点

でっかいことに焦点を

【データサイエンティスト034】Rとは

データサイエンティストでサービスを出そうと日々(つっても17年の2月から)ちまちまやっているなう。

2月中にサービスを、と意気込んでたけどレベル的にどうしようもないので、UdemyというC2C教育サービス(いろいろあって面白いよ!)とTableauというBIツール(Business Intelligenceツール:蓄積された大量データを収集して分析するためのツール)を導入して経験を積んでいるなう。お勉強ともいいますね。

 

その合間にこのブログではこのキーワードで来てくれた人に少しでも実りがある記事を書こうと画策しています。

 

今日からR(あーる)についてちょっと知るところを書いてみようと。つっても業務でビシバシ!というレベルではなくまぁぼちぼち使ってみてエクセルよりは綺麗に出せるかな、という段階なので悪しからず。

まずRのメリットデメリットからいこうか。

まずメリット。なぜRを入れるのか。それを一言で言うと「エクセルでは難しい高度な統計分析が無料でできる」ということになりますかね。エクセルでできることもいろいろあるけどやっぱりわかりにくいし使いにくい。自分で数式作って分散分析とかしてもいいししたことあるけどデバッグが大変。一方有料ソフトならいくつかいいのはあって、癖はあるけどStatWORKSがやりたいことは大抵できる万能さを兼ね備えている。でも金額が高い。そこでR。世界で開発されているので様々な統計処理が含まれており、インストールや使用は完全無料。結構大量なデータもサクサク処理してくれてプロットも綺麗にしてくれる。

一方デメリット。なぜRが広まりきらないのか。一言でいうと、多分、「とっつきにくい」からかな。そこそこパソコンというかプログラミング経験がないと何から何までわからんかなー、と。インストールから挫折しちゃう例もなくはないと思う。なんとかインストールしてもデータの入出力が難解やし実際どうなっているのか理解が難しい。RStudioという使いやすくするソフトがあってそれを入れるとだいぶ仲良くなれそうな外観を見せてくる。でもまだまだ無骨。仲良くなってくるとそんな無骨さも可愛く感じられる(??)。そして結局離れられないExcel

 

ということでまとめると「統計処理を無料でやりたいならR!」ということで。日本語でもたくさん情報はあるし、英語ならなおさら。

 

興味を持った方はRStudioとセットでぜひ一度トライしてみてくださいませ。

明日からはRとは何、そしてどうやって使うのか、と少しずつ深めていこうかと思います。