00:05
こんにちは、ながおかのプログラミングチャンネルです。
先日ライブで質問いただいたんですが、
機械学習のプロジェクトを始めるのはどうしたらいいですかという話でした。
機械学習のプロジェクトの始め方は、いろいろなパターンがあると思うんですが、
今回は、例えば社内で自社サービスがあって、それに適用する機械学習のプロジェクトを始めるときの方法であったり、
考え方をちょっとお話ししていけたらなと思います。
このような場合に、まず機械学習というのはすごく今話題にもなっていますし、
ディープラーニングとかいろいろ話題なバズワード的に流行っているのもあるので、
すぐ取り入れたくなるというのはあると思うんですが、その前に大事なことがあって、
それはまずデータがちゃんと集められているかということ。
その集められたデータを分析して、その分析から出た知見をサービスに反映して改善できるかというところですね。
なので、データを収集・分析・フィードバック・改善というこの3つの流れ、
収集・分析・改善というこの3つのサイクルがうまくスムーズにまず流れるようにしていくというところが大切になります。
結構最初のデータの収集のところと改善のところができていないということが結構多いので、
そもそもデータがうまく取れていなかったりとか、そのデータのクレンジングだったり、
分析がちゃんとできるようにした処理をするというところですごく時間がかかるということも多いです。
その2つ、最初と最後の収集と改善のところをまずしっかり抑える。
次にではそれが抑えられたら分析に移っていくんですが、
分析のところではこれは結構いきなり機械学習をする必要がないということも結構あって、
最初は本当に当たり前のような分析をしても十分効果が出るということはあります。
例えばビジネスマッチングアプリを作るというようなときに、
どういう人を候補として出すといいのかというふうに考えたときに、
普通に考えて地域が近い人であったり、大学が同じような人を出すとちょっと相性がいいんじゃないかなと思ったりすると思うんですが、
そういうことをするだけでもだいぶ数字が変わったりするので、
分析のところでも最初は当たり前の仮説のところを確認するというような分析をしたりとか、
本当に簡単な線形分析などをしてみるだけでも十分に効果が出ると思います。
それをしっかりした上でさらに複雑なパラメータが多いような分析をしていきたいというふうになったときに初めて、
03:05
機械学習であったり、もっと言えばディープラーニングなどを使うといいのかなと思います。
というところで、最初のデータの収集・分析・改善というサイクルをまずうまく回せるようにして、
その後分析も簡単な分析からだんだんと複雑な方にしていくといいのではないかなと思います。
ということで、レターやコメント、いいねなどぜひお願いします。
あと、ハッシュタグながプロで感想などもいただけると嬉しいです。ありがとうございました。