【ベイズ統計】独学で始める人に向けて勉強方法を紹介します

スポンサーリンク

こんにちは。1年半ほど前から独学でベイズ統計を研究開発で活用しています。専門は電池研究で、そもそも統計学や数学、プログラミングは苦手でした。そんな私がベイズ統計を勉強し、半年足らずで仕事に使えるようになった勉強方法を紹介します。ご参考になれば幸いです。

①ベイズ統計を勉強するモチベーション

そもそも、私がなぜベイズ統計の勉強を始めたかというと、

  • 理由1:研究開発で解析したいデータはサンプル数が少ない場合が多く、流行りのディープラーニングなどは使いにくい。
  • 理由2:サンプル数は少ないが、背景知識や理論などはいくつかあり、それらをモデルにとりこみたい。
  • 理由3:似たような傾向を示す別のデータ系列が手元にある場合がある。
      (例)製品群Aで材料変更したときのデータは少ないが、当該の製品群Bで材料変更したデータもあり、それらは似たような傾向になるはず、というドメイン知識を持っている。など。
  • 理由4:検定と推定からなる伝統的な統計手法と比べ、モデルの記述〜予測の手続きがシンプルで、とっつきやすい。
  • 理由5:ネットや書籍で実装例の情報が集めやすい。(例えばStanという確率的プログラミング言語)

私はこのような理由から、ベイズ推定をデータ分析ツールとして勉強することにしました。理由1、2、3はニューラルネットワークなどの機械学習モデルと比べた時のメリットです。ベイズ推定を用いると比較的少数のデータで、柔軟なモデルを自分で作れることから、研究開発過程におけるデータ分析では非常に強力な武器になります。理由4、5は伝統的な統計手法と比べたときのメリットです。

ちなみに特に独学で身に着けようとすると、理由5の情報の集めやすさが一番重要な気がします。

②実際に仕事で使うまでの勉強過程【3ステップ】

ここからは、「とりあえず本を買ってみたが難しくて挫折した」、「勉強したいが何から手を付けて良いかわからない」という方に向けて、私の実際の勉強過程を3ステップで紹介します。

下記のステップは、必ず1つずつ順番にすべきというわけではなく、例えば動画で勉強しながら書籍も読み進めるなどでも、もちろんOKです。

【ステップ1】 まずは導入として/動画学習

まず初めに取り組んだのは動画学習です。これには二つ理由があります。

  • 初心者向けのコンテンツが多い
  • とっつきにくい内容でも、何度も聞き流しをすることでだんだん慣れてくる

慣れることと、覚える/理解するは別ですが、専門外の知識を身につけようと思うなら、まずは慣れることから始めた方がいいです。気合を入れていきなり覚えようもしても丸暗記になってしまうと全く実践的ではないです。私が利用したのはYoutubeとUdemyです。ちなみにUdemyは有料の動画学習コンテンツですが、よく大幅値引きしているので、そのタイミングを狙ったほうが良いです。

【ステップ2】1、2冊は読んでから始めたい/専門書

これは書くほどでもないかもしれませんが、仕事で活かそうとするならネットやセミナーだけでなく、最低でも1、2冊は書籍で勉強した方がいいです。よほど変な本を選ばない限り体系立てて書かれているはずなので、ベイズ統計の全体像を掴むことができるはずです。何より、人に説明する時に書籍を一つも引用できないのは辛いですし、相手に信用されません。

ちなみに私は、ベイズ統計の全体像を掴むのには緑本、Stanによるプログラム実装にはアヒル本を買いました。どちらも有名な本なのでググってみてください。買って損はないと思います。

【ステップ3】 独り立ちを目指して/グーグル検索

動画や書籍などで勉強し理解が進んだころには、実際にコードを書いてデータ解析を実践し始めていると思います。ここで実際にコードを書き始めると、初歩的なデータ操作の仕方で躓いたり、モデルを書いてみたがエラーで動かないといった障害にぶつかると思います。このような場合に、人に聞いてもいいですが、グーグルで検索するほうが早くて確実だったりします。同じようなところで詰まった人が知恵袋などに質問していたり、ブログで解決方法を紹介していることが多いです。

また、さまざまな実データに対するモデルの適用例を調べてみると非常に参考になります。ベイズ統計は、データに合わせて自分でモデルを作れるため、自分のデータにどのようなモデルが使えるのか、参考になるものを探しながら勉強すると良いでしょう。

グーグル検索を使ってある程度の問題を自力で解決できるようになれば、もうデータ分析を仕事で使えるレベルに到達したと思って良いです。私たちがすべきは、データ分析を仕事に取り入れることであり、すらすらと、かっこよくコードを書くことではないからです。何より上達を目指す上で、いつまでも勉強中のまま、実際の課題に向き合わないのは良くないです。

ベイズ統計を研究開発で活用できる人はまだまだ少ないため、使えるようになれば皆さんの強力な武器になってくれるはずです。一緒に頑張っていきましょう。
今回は以上です!

タイトルとURLをコピーしました