最近データ分析を勉強していて、統計の基礎(統計検定でいうとおそらく3級程度?)の内容を勉強しました。色々本を読んだので、まとめておきます。「統計学の基礎を全くのゼロから学びたい!」という方の参考になれば幸いです。
対象:「文系*1」ビジネス分野の社会人
目的:データ分析に必要な統計学の基本を理解する
統計入門書
完全独習統計学入門
これは、中学までの数学知識で統計学の概念をしっかり教えてくれるので、よかったです!数式も出てきません。数学全然できないけど、統計学を学びたい!という人にぴったりの一冊です。
この世で一番おもしろい統計学
これは帯にマンガで読む統計学とあったのと、役者が山形浩生だったので購入しました。
実際にはマンガというか、カトゥーンですね。非常にアメリカっぽい絵柄のイラストと、文体もまたアメリカっぽいので、好き嫌いが分かれると思います。数式ゼロで概念の説明に特化しているので、数学が苦手な人にはおすすめです。
内容はかなりしっかりした統計学入門です。文字数も少ないので、はじめサクッと読んで、動画や別の本で改めて勉強し、戻ってきたあとに再読するとよりよくわかると思います。
訳者はこの本を読んだ後、統計ソフトを触ることを勧めており、難しい計算の仕方などは徹底して省いている点などは、自分のニーズとあいました。←計算嫌い。
マンガでわかる統計学
こちらも「マンガ」なのですが、ストーリー漫画ではなく、イラストや図解を使いながら、統計について解説しています。 これは横書きでフォントいじりも多く、読みやすいです。文体もカジュアル。また、初心者が引っかかりやすいような箇所をピンポイントで「ここ気をつけてねー」という感じで教えてくれるので、そこが助かりました。「なんでn-1なの?」とか「σってどうやって書くの?」とかそういうところ。統計自体の説明については、他の本で概要を掴んだ後に読んだので、普通に理解できました。また±や、英語の用語もちょこちょこ混じってます。
マンガでわかる統計学
こちらの「マンガでわかる統計学」シリーズは、統計学、回帰分析編と因子分析編の計三冊を購入しました(それぞれ以下にレビューを書きました)。マンガでわかる!ということで非常に期待していたのですが、全てに共通しているのは「全くの初心者にはおすすめしません」という点です。
その理由は、このシリーズは、概念のやさしい説明が薄く、数式の計算を入れてくるうえに、数式の説明も薄いからです。数式の整理の手順などは比較的丁寧に出てくるのですが、そんな、計算の仕方を知りたいわけじゃないのでは?と思ってしまいます。計算の仕方が知りたい人もいると思いますが、「マンガでわかる」的な本を手に取る人は、もっとざっくりした概念を踏まえた上で、計算をしていきたいのでは?と感じました。少なくともわたしはそうでした。
また、このシリーズは、はじめの方に数学的な基礎知識を駆け足で紹介しています。回帰分析(regression)編は、自然対数関数、微分(differential calculus)、ベクトル(vector)、行列(matrix)などについて、因子分析編では主に行列について触れています。
しかし、そもそも微分や行列をちゃんと理解していない文系人間にとって、このマンガでの駆け足説明はわからなさすぎます。回帰分析や因子分析の本題に入る前に、力尽きます。こんなテキトーな説明をして次に進むくらいなら、思い切ってここは省いて、数学的な説明ではなく、概念の説明に特化した本にするか、または「初心者向けのマンガ本」という体裁をやめて微積を理解していることを前提とした人向けの本にした方がよいのでは?と感じました。
このシリーズのもう一つの特徴は、ほぼすべて日本語で書かれていて、用語や数式なども日本語です。nとかμとかσとか全然出てきません。数式はガッチリ出てくるんですがね……。また、用語も、本によっては、かっこ内に用語の英訳が書いてあったりするのですが、そういうのが全然ないです。標準偏差(standard deviation)とか。英語の資料や論文を読みたい方にとっては不便なのではないでしょうか?
そんな場合は、統計用語の日英対照表などを使ってください
マンガでわかる統計学[回帰分析編]
これも、初見時は、はじめの微分の計算方法のところで挫折しかけました。手で計算するために、微分が必要なのはわかるけどさ……(汗)そこがわからなかったので検索していて「ヨビノリたくみ」の動画を発見しました。
マンガでわかる統計学[因子分析編]
アンケート調査のサンプル抽出の仕方や設問の作り方なども解説されていて、参考になります。また因子分析の基本的な概念についても理解できるようになっています。
ただ、上で書いたとおり、計算の仕方にフォーカスしてあり、ソフトウェアを使った実務の分析の仕方には触れていません。そのため、正直この本を読んだことで実務で因子分析ができるイメージが湧きませんでした。
その割に、「主因子法+バリマックス法」と「最尤法+プロマックス法」みたいな話に著者の意見が長々と入ってくるので、よくわかりませんでした。
(その後ネット検索などして、ソフトウェアの設定で抽出法や回転法を選ぶことができることがわかりましたが、なんとなく初心者向けの「マンガでわかる」本の内容としては癖が強すぎるような気がした)
あとは、この「マンガでわかる」シリーズは、他のものにもありがちなのですが、マンガのストーリーが全部男女の恋愛ベースになっている点とか、男が女に教える展開であるところとか、ジェンダー的に見て突っ込みどころが多いです。ま、先生役については、回帰分析編と因子分析編では女子→女子になっていましたが。統計学を学ぶモチベーションが恋愛ってんなわけあるかい!あとは、五十嵐さんって結婚してたはずなのに、因子分析編では妹と同居しているの?とかルイは昔熱をあげていたはずの五十嵐さんとの再会で心が揺れなさすぎでは?とかストーリー面での突っ込みどころも多くありました。
個人的には[回帰分析編]でのみうとりさ先輩は百合展開にしてほしかった。
絶対りさ先輩女の子好きですよね。女の子というか、みうが好き。
↑みうに詳しい先輩。みう帳てwww
そして風間さんはそれを知っている。そうじゃなきゃあの風間さんのりさ推しとか意味分かんないですよね!
でも、最後はみうの気持ちを尊重してりさ先輩身を引いたのかな…と。ノルンの皆がどうなっていくか知りたいので、シリーズ全部買っちゃいそうです。
動画
ヨビノリ
予備校のノリで学ぶ「大学の数学・物理」(略称:ヨビノリ)は教育系YouTuberです。解説が非常にわかりやすいです!おすすめ!予備校講師をされていただけあって、ガチでわかりやすい!ファッションもっぽい!(塾講師ってカラーシャツ率高いよね)数学以外にも物理学の動画も出されています。
確率・統計については以下のページにまとまっています。 確率統計学|予備校のノリで学ぶ「大学の数学・物理」
ヨビノリ動画で、あえて一点だけ物足りない点を言うとすれば、本当に「大人数に対しての予備校講義形式」っぽくて、途中で「ビデオを止めて、考えてみて〜」というようなインタラクティブさがない点ですかね。ここらへんは、次に紹介するカーン・アカデミーの動画と比較すると印象的です。
ヨビノリは書籍もありますね。興味ある方ぜひどうぞ!
カーン・アカデミー(英語版)
Khan Academy | Free Online Courses, Lessons & Practice
カーン・アカデミーは教育系NPOです。数学だけでなく様々なトピックの動画講義が配信されていますが、この統計コースが非常にわかりやすかったです。
今回「書籍」の紹介エントリですが、実は一番お世話になったのはこのカーン・アカデミーかもしれません。特に統計と確率のコースを担当しているジェフ。マジで、ありがとう〜!
カーン・アカデミー公式サイトは、小テストやゲーム要素を取り入れてあり、理解度を確認しながら進められるのもよいです。カーン・アカデミーには、日本語版もありますが、英語版の方が内容が充実しているので、英語がOKな方はこちらを是非利用してみてください。こんなに素晴らしいコンテンツが無料でよいのだろうか?
わたしは非常にお世話になったので、お礼のつもりで課金しました。また今後翻訳などで貢献したいです。
書籍おまけ
その他、「統計学」そのものの本ではありませんが、数学やデータ分析関連の書籍を紹介します。
ビックデータの衝撃
もはや、「今更ビッグデータ?」っていう人も多いと思いますが、そもそもビッグデータって何?とという初心者から「以前から弊社ではBIを使ってデータを活用した経営をしていますが何か?」という人まで、ビジネスサイド向けにわかりやすくビッグデータを説明してくれている。ハドゥープやNoSQLなどの技術やや統計・機械学習のキーワードに触れながらも、技術的な話ではなく、あくまでビッグデータの持つビジネスインパクトにフォーカスして書かれている。
日本で書かれた本なので、欧米の事例紹介だけでなく、日本国内企業の事例が普段な点や、プライバシー、データマーケットプレース、そしてデータサイエンティストという新しい職業の誕生や求められるスキルなどビッグデータ周りの様々なトピックを網羅している点も魅力。データとか全然わからないけど、事業で関わることになった人におすすめ。
ヤバい統計学
ヤバいXX学の何番煎じなんだろ?という感じですねw
数学的な話ではなく「統計的思考」が身につくエピソード集です。ビジネス書ではなく、ディズニーランドや、交通渋滞、保険、O-157、クレジットカード、大学入試、宝くじ、ドーピング検査、テロ対策など、非常に身近なトピックから一般向けにデータ分析を語っています。
文系のための数学教室
一番上で紹介した『完全独習統計学入門』がわかりやすかったので、同じ筆者(小島 寛之)によるこの本を手にとってみました。
縦書きの新書でありながら「数学書」です。
上で紹介したヨビノリやカーン・アカデミーはそもそも中高生向けなので、ガチでそういう中高数学を正面からやるアプローチ。そのため大人がやろうとすると挫折する可能性は高いのだが、この本は、わざわざ「今更中学や高校の数学をやり直したくない!」という人向けに、数学のエッセンスを解説してくれている。
「この本は、表面的には文系向けのネタを並べてある。人口統計の棒グラフとか、論理的な話し方とか、株価、市場経済、民主主義、神学、哲学等々である。しかし、その料理の食材として、現代数学の初歩を仕込んであるのだ。列挙すればルベーダ積分、数理論理とゲーデルの定理、トポロジー、距離空間と関数解析、選好理論、確率積分とブラック=ショールズ公式等々の比較的新しい理論である」
『完全独習統計学入門』と比べると概念的な話がやや増えていているのと、それぞれの概念についてさらっと触れる程度なので、面白いっぽい感じはするのだが、わたしはちょっと肩透かしな印象を受けた。
その数学が戦略を決める
データ分析がリアルで意思決定にもたらす影響について述べた本。雰囲気としては『ヤバい統計学』のボリュームをがっつり増やした印象。訳者はまたまた山形浩生。
著者のイアン・エアーズはMITで計量経済学を学んだあとイェールの法学部と経営学部で教えている。『ヤバい経済学』の著者の一人であるスティーヴン・レヴィットと一緒にプロジェクトをしたこともあるようで、そのエピソードが序章に書かれています。
本編は、ネトフリのおすすめアルゴリズム、マッチングサイト、エビデンスに基づく医療、など様々な企業と政策立案の場面で行われているデータ分析(特に回帰分析と無作為抽出)の重要性とそのトレンドについて。統計や数学の基本的概念についてもしっかり触れられている充実の一冊です。
上の他にも『数学ガール』とか買ったけどまぁ読めていない本があるのと、まだもう少し統計の、勉強を続ける予定なので、随時追加していきます!
オススメ本あれば教えてください!
*1:厳密にいうと文系って何?とわからなくなりますが←英語にも文系を表す言葉って難しい。ここでは、学校で、STEMを専攻していない人程度の意味で捉えておきます