第2回リクルート自然言語処理ハッカソン報告
大杉 直也
リクルートテクノロジーズの大杉です。
以前、公募をした「第2回リクルート自然言語処理ハッカソン」が、盛況のまま終了しましたので、その報告です。
今回のハッカソンでは、ポンパレモールの商品データやレビューデータを利用して、参加者一人一人がテーマ設定から結果プレゼンまでを5日間かけて行いました。分析の目的から自分で考えるため、かなり自由度の高いハッカソンでした。
ハッカソン最終日には参加者10名全員が1人1人、社員の前でプレゼンを行い、自身の成果を発表しました。
結果
以下の3人が表彰されました。
【最優秀賞】前田 若菜(奈良先端科学技術大学院大学)
「ニッチな検索ワードに対する関連キーワードの改善」
【優秀賞(ビジネス)】山本 眞大(慶應義塾大学)
「クリック率を向上させる6つの要因を用いた商品名改善手法の提案」
【優秀賞(テクノロジー)】小西 創(神戸大学)
「ユーザーの声を届けよう!!!」
総評
取り組んだ分析の目的(サービスの課題が何か)、に最終アウトプットの質が大きく依存していました。「どのような課題が」「どのような状態になればいいのか」の2点が明確な参加者の方が分析もしやすそうでした。今回のハッカソンで用いられた方法は、tf-idf, 予測モデルベースのデータマイニング, 形態素解析, word2vecといった広く使われるようになった利用しやすい手法がメインでした。これらの手法だけでも、かなりのことができるようになったためだと考えられます。
今回のハッカソンを通じて、自然言語処理の技術はビジネスの場面での需要は依然高いままであることが確認できました。リクルートテクノロジーズでは高い専門性を活かして、サービスの課題を解決していける仲間を募集中です!