まずは蝋の翼から。

学んだことを書きながら確認・整理するためのメモブログ。こういうことなのかな?といったことをふわっと書いたりしていますが、理解が浅いゆえに的はずれなことも多々あると思うのでツッコミ歓迎

どうやって学習をしていくか。何を学習すればいいか。

怪文書シリーズ第3弾。学びについて最近考えていることをつらつらと。頭整理用のメモなのでよみづらいです。

どうやって学習するか

最近、弊社は採用の強化をおこなっていて先輩の強いDSの人が採用面接によく駆り出されている。

面接の際に先輩は「xxx(面接者が最近学んだと言っていた手法)という手法のポイントはなにですか」という質問をよくするらしい。ポイントという言葉をもう少し具体化した「xxxはどういうときに使いますか」「xxxは他の類似手法と比べて何が優れているか」という質問の場合もある。

この質問の意図としては、どれだけ頭を使って各手法を使っているかを判断するためのようだ。つまり、「なんかよくわからんが(あるいはなんとなくアルゴリズム自体は知っているが)ランダムフォレストというモデルの性能が高いらしいからなんでもランダムフォレスト使えばええやん」みたいな使い方をしていないかをあぶり出すため。そして、これができている人はおそろしく低いとのこと。

(本論ではないので括弧書きをするが、これはミクロにはモデルの使い方の問題ではあるがマクロには、「そもそも目の前の事象についてちゃんと考えて取り組んでいるのか」というデータ分析への取り組み方にも繋がるように思える。)

考えてみると、このような問いかけをしながら学ぶのが一番要領がいいし、実際に使う際にちゃんと考えて使うことができる。逆に、これを考えずに学ぶことはただ目で字を追っているだけで使い物になる学習ではない。

自分を振り返ってみると、そのものの学習時はあまりそういうことは意識していない。類似手法を見かけたときに、「前の手法と似ているがどう使い分けするんだ?」は考える。つまり、学習の仕方としては△で、「類似手法を見かけたときに」改めて学びだすので無駄が多い。また、見かけなかった場合は手持ちの学習した内容は使い物にならない状態。

もちろん「類似手法を見かけ」ないと、比較的な考え方(AとBは何が違うか)はできないが、少なくともデータ分析系の手法は「xxxという仮定の上で使う(⇔その仮定が成り立たない場合は使えない)」という前提が存在する。つまり、この仮定がその手法のポイントであり、類似手法との違いとなる。

要するに、何が言いたいかというと「学習する際は、その手法のポイントは何かを意識しないと学習をしても使い物にならない」。

何を学習するか

論文を読もう

学習ソースについて

学習をしていて思うのは、そこらへんのブログはノイズが多い。上述を踏まえて書くと、「なんかやってみた、というだけで仮定などが書いてない」ものが非常に多い。

つまり、ブログ情報だけで学習するのは難しい(もちろんちゃんと書いているサイトも多いけれど)。

そうなると、何で学習したらいいかというと一番良いのは論文。原論文は、当たり前だが今までの手法との違いやメリットが書いているし、原論文じゃなくても「何故他の手法ではなくその手法なのか」書いている。

知識の広げ方1

「他にどういう手法があるか」ということも、前述の理由から論文に書いている。

知識の広げ方2

「xxしたいけどどういう手法があるだろう」ということは論文ですぐ調べられるし、その論文の参照などで過去論文などもすぐわかる。

要するに論文読め

つまり、何が言いたいかというと論文読めると世界が広がるし、逆に読めないといつまでもゴミのまま。もちろん銀の弾丸ではないけれど読めると色々と効率がよいのは間違いない。

そのため、論文を読めるようになろう。

数式読め

特に論文でそうだが、数式にはすべてが書いている。つまり数式を読めば大体のことがわかる。つまり数式を読めるようになろう。

さすがに今回は雑文すぎた。