リクルートテクノロジーズ 新人研修特別版(データ分析編)
大杉 直也
婚活データマイニングガチ勢の大杉です。
今年のエンジニア採用の新人研修では、リクルート自然言語処理ハッカソンを参考に、実際のサービスのデータを分析する特別研修を3日間行いました。
データを分析をするというスキル自体は、現状把握のための強力な手法であるため、どの職種でも必要になります。
エンジニアとして採用された新人たちがデータを分析を専門にしなくても、実際のサービスを開発・運用していく中で正確な現状把握は非常に重要になるという思いから、本研修を実施しました。「正しいものを正しく作る」のがエンジニアの仕事であるため、新人たちが、何が「正しいもの」なのかを自ら考えられるエンジニアになるための一助になれば幸いです。
実際に、婚活領域でデータ活用基盤を作り、組織全体でのデータ活用を推進している横山さんの解説から研修はスタート。
当日のスライドはこちら。
その後、テーマ別にチームをわけて、新人2~4人の5チームでデータ分析に取り組みました。
テーマには、継続利用率をあげる施策の提案や、レコメンド改善などの日々のサービス改善の他に、迷惑行為の検知のほか、用途を限らないデータからの知識発見などエンジニアとしての仕事に限定することのないテーマを用いました。
分析には、Google Big Query 上にデータを蓄積したもの(実際に日々のサービス改善にも利用しています)を用いました。
コーディングに抵抗のない参加者が多かったので、Big Query へはブラウザ UI のほか、Python 3 + Pandas on Jupyter notebook でアクセスして、分析してもらいました。
コードでグラフを生成する経験が少ない人が多く、可視化にこだわる人もいました。(わかる…)
また、実際のサービスを利用しているので、「この仕様どうなってるんだろう?」「これ本当かよ?」をサービスにアクセスして利用者になった気持ちで確認できたのも良かったです。
以下、参加者の声です(原文ママ)
時間が足りないコメントが多々ありましたが、現場配属後にチャンスはいくらでもあるので大丈夫です!!
今後も、データ分析やってみよう!布教活動を続けていく予定です。
リクルートテクノロジーズでは、データ分析に限らず、多芸なエンジニア仲間を募集中です。