目次
リクルートのデータ推進室長 野村が自ら聞き手となり、現場の最前線で試行錯誤を続けるスペシャリストたちの「手の内」を紐解く連載企画がスタートします。
第1回のゲストは、入社11年目のシニアデータサイエンティスト、羽鳥冬星です。とにかく数学とモデリングが好きで、自宅にGPU稼働用サーバーを構築してしまうほどの技術愛を持つ彼は、いかにしてビジネスの荒波を乗り越えてきたのか。そして、今後描く展望はどのようなものなのか。
売上予測からLLMまで、時代やフェーズは変わっても技術への好奇心が尽きない二人の、熱い対話をお届けします。

〈プロフィール〉
羽鳥 冬星
シニアデータサイエンティストであり、Kaggle Master。2015年、リクルートホールディングスへ新卒入社。以降はリクルートグループのデータサイエンティストとして、複数領域のレコメンドモデルの構築に取り組む。
野村 眞平
データ推進室 室長。ベンチャー企業で経験を積んだ後、リクルートへ。入社後は住まい事業領域で集客最適化やレコメンドシステムの構築、マーケティング分析などを担当。以降はリクルートグループにおける複数の事業会社/機能会社におけるデータ組織を統括し、ユニット長や執行役員を歴任。2021年のリクルート統合後は、データ推進室VP(Vice President)を経て2025年より現職。
文学部から「数学」の道へ。迷走の末に走った電流
野村: 羽鳥くんは2015年入社だから、もう11年目になるんだよね。最初からモデリング一筋だったけど、学部生時代は法学部だったとか、意外と遠回りしてるんだっけ?
羽鳥: はい、かなり迷走してました(笑)。法学部でゼミ選考に落ちて、文学部に移ったんですけど、ある夏の暑い日に「なんかこれじゃないな」と気づいて辞めちゃって。
野村: 辞めて、また受験勉強を?
羽鳥: はい、今考えたら本当に何やってんだ?という迷走ぶりです。ただその後に入り直した政治経済学部で「点列の収束」の概念に出会い、電流が走ったような感覚を得て、「これに人生をかけてみよう」と。以降は就活や学部の授業もそっちのけで、数学に没頭しました。ただその後も順調ではなくて、数学科の院に進んだもののここでも初日に「自分のやりたいことと少し違うかも」と直感してすぐ離れてしまい、当時は周囲の皆さんに多大なご迷惑をお掛けしました…。
野村: 初日で退学っていうのは、今となっては笑い話だけど当時は大変だったよね。
羽鳥: 結局、別の院で数理統計をゴリゴリやる2年間を経て、リクルートに入りました。
野村: 思い返すと、1年目からずっとモデルのことばかり考えていたよね。
羽鳥: 24時間365日、担当していたサービスの売上予測のことばかり考えていて、同期に会うたびにその話をしてたんで、相当鬱陶しい人間だったと思います(笑)。
野村: 当時は状態空間モデルが主流だったけど、羽鳥くんは早い段階から別の手法を試していたよね。
羽鳥: そうですね。当時の状態空間モデルは、職人芸的に特徴量を作り込む必要があり、良くも悪くも属人性の強いモデルでした。そんな中、出始めたばかりのXGBoost(木のモデル)を使ってみたのが今の原点です。特徴量の標準化すら不要なXGBoostは、手軽に色々な特徴量を試行錯誤することが容易で、そこが当時の僕にはかなり衝撃的だったんです。その時の「試行錯誤が精度に直結する楽しさ」が、今の自分のベースになっている気がします。

Kaggleでの挫折と、モネの絵も頭に入らなかったあの日
野村: 羽鳥くんといえばKaggle(※)だけど、始めた頃はどんな感じだったの?
羽鳥: 元々は、業務で培った知見も活かせるし、Kaggleから知見も持ってこられるといいな…なんて思ったのが始めたきっかけですね。でも初参加のコンペで、最後にとんでもなく順位が入れ替わる「シェイク」を経験して、銀メダル圏内から一気に奈落の底に落とされました。その時は出勤前に駅で結果を見て、しばらく立ち上がれなくなりました。
野村: 初参加でいきなりその経験をするのは厳しい(笑)。
羽鳥: あまりの動揺にそのまま上司に連絡し、率直に伝えて休みをとりました。そのまま逆方向の電車に乗って、上野の美術館に逃げ込んだのを覚えています。ただ当時はあまりのショックに、モネの絵を目の前にしても、全く内容が頭に入ってきませんでしたね(笑)。
野村: でもそれから諦めずに続けて、結局Masterにもなった。ちなみに初回の悔しさが、自宅にサーバーを組む原動力になったの?
羽鳥: そうとも言えるかもしれません。350WのGPUを2枚刺した自作サーバーを足元に置いてるんですけど、冬でも暖房がいらないくらいあったかい。夏は冷房をガンガンにしないといけませんが、その環境でGPUを回している時が一番面白いですね。最近はLLMのおかげで、英語のディスカッションを読んだりする苦手な作業を任せられるようになったので、よりモデリングの本質に集中できて楽しいです。
(※)Kaggle:世界中のデータサイエンティストが予測モデルの精度を競い合う世界最大級のプラットフォーム。企業が提供する課題に対し、参加者が最適なアルゴリズムを提案するコンテスト形式のイベントが日々開催されている。

「Kaggleやってるんじゃないんだから」と言われて気づいたこと
野村: 羽鳥くんがあるマッチング領域に来て少し経った頃、当時の事業リーダーから「Kaggleやってるんじゃないんだから」って言われたことあったよね。
羽鳥: ありましたね(笑)。あの時は正直、戸惑いもありました。リクルートのリーダー陣の中には事業への想いが強く、価値の出し方に対してとてもストレートに議論をする人もいますから。あの言葉も、しばらくは自分の中で反芻していました。
野村: ビジネスの本質的な価値に真っ向から向き合う文化だからこその言葉だったよね。あの言葉をどう消化したの?
羽鳥: 最終的には自分なりに腑に落ちました。要は、単に与えられたスコアを上げることだけが目的ではなくて、本当の意味でユーザー体験を良くして、真に良いものを作れって言いたかったんだろうな、と。
野村: スコアの先にある「価値」に目を向けろ、ということだよね。
羽鳥: そうですね。たとえば、研究機関などでの学術的な探求も奥深いものだと思っています。一方で、ビジネスの現場で高い期待値に応えようと試行錯誤しながら、それを技術でねじ伏せてユーザーへの価値に変えていくプロセスには事業会社ならではの喜びがあります。
その分プレッシャーとか大変なこともありますが(笑)、その緊張感があるからこそ、この仕事は面白いんだと思います。
7,000個の特徴量をLLMで作る「プリミティブな喜び」
野村: 最近はLLMをプロダクトに組み込む案件で成果を出しているよね。
羽鳥: はい。実はさっき、そのLLMを組み込んだモデルのA/Bテストの結果が出たんですが……プレッシャーがやばすぎて、もし数字が落ちてたら今日このまま中央線に乗って、大月あたりまで逃げようかと思ってました(笑)。
野村: (笑)。今日の対談が無事に迎えられてよかった。中央線、大月まで行っちゃわなくて(笑)。具体的にはどんなモデルを組んだの?
羽鳥: あるマッチングサービスにおいて、対象となるデータのテキスト情報をLLMで直接「埋め込み(Embedding)」にして学習させています。以前はテキストから「タグ」を抽出してそれを特徴量に……とやっていましたが、今はLLMで直接ベクター化して学習を行っています。
野村: マッチングって、単純な購入ボタンとは違って、もっと構造が複雑だもんね。
羽鳥: そうなんです。最初の接触から、複数のプロセス、最終的な成約までという非常に深いファネルがあります。リードタイムも長いですし、各ステップで意思決定者が変わる。この複雑な構造に対して、どこにどんなモデルを置くかで結果が激変する。その難しさが面白いんです。
野村: 開発のスピードも、LLMで劇的に変わったって言ってたよね。
羽鳥: はい。LLMのコーディングエージェントを使って、マッチング用の特徴量を一気に7,000個作りました。人手なら3、4ヶ月かかる作業ですが、1/3の工数で終わりました。これにより、これまで工数とのトレードオフで「さすがにそこまでは検証しきれない」と断念していたようなアプローチが、相当やりやすくなっています。
野村: 1,000万レコード・7,000個以上のデータを回して、重要度の高い2,000個程度を厳選して本番モデルにするみたいなプロセスも、以前とは規模感が違うよね。
羽鳥: そうですね。良くも悪くも、最近は自分の手でコードを書かなくなっていて(笑)、まさに「時代が変わった」という感覚を強く持っています。組み合わせ爆発を恐れずにやってみて、そこから本質を抜き出すというような以前では絶対に断念していた試行錯誤に時間を割けるようになり、プリミティブな喜びを感じています。

なぜ10年以上、リクルートという環境に居続けるのか
野村: そういえば羽鳥くんはもう10年以上リクルートにいるわけだけど、この業界は流動性も高い中で、残り続けているのはどうして?学生時代の話を聞く限り、なんか違うなと思ったらすぐに別の場所に行っちゃいそうだけど…。
羽鳥: 一番は「技術を直接ビジネスにぶつけられる距離感」ですね。大規模な実データを扱いながら、自分の作ったモデルがどう事業を動かすのかをダイレクトに体感できる。このサイクルをこれだけの規模感で回せる環境は、なかなか他にないと思っています。加えて、評価のシステムや基準に納得しているという要素も大きいです。
野村: 確かにリクルートは「成果に対する報酬」が明確だし、マネジメントを目指す人だけでなく、羽鳥くんのように技術を突き詰めたいプレイヤーも正当に評価される仕組みを大事にしているよね。
羽鳥: そうですね。また今の組織は、自主的に勉強して、みんなでコンペに出るような刺激的なメンバーばかりです。そういう技術が好きな仲間と、同じ熱量で難題に取り組める環境が、自分には合っているんだと思います。
「GPUを使い倒したい」——リクルート版基盤モデルの構想
羽鳥: あとは、計算環境に恵まれていることも大きいです。A100などの強力なインスタンスを、実験のために日常的に回すことができる。
野村: 「エンジニアの知的好奇心を満たす最高の環境(GPUクラスター)があることが、組織の活力に直結する」って力説してるよね。実際に最近も、水冷サーバーをオンプレで導入したり、環境整備には投資している。
羽鳥: 水冷サーバー、本当に楽しみです。次にやりたいのは、リクルートが持つ膨大なテキストデータを使って、独自の基盤モデルをプリトレーニングすることです。ドメイン知識を詰め込んだモデルが一個あれば、あらゆる場面で転用できるはず。
野村: それは面白いね。数年前なら「時代が早すぎる」と言われたかもしれないけど、今なら現実味がある。
羽鳥: もちろんビジネス成果に繋げることが前提ですが、技術者としては、まずはGPUクラスターを100%の稼働率で数日間フル稼働させ、データの持つポテンシャルを極限まで引き出したい。正直、利用先よりもまずは「会社のGPUを限界まで使い倒したい」という欲求が強いです(笑)。その結果、誰も見たことがないようなモデルを社会に実装してみたいですね。
野村: 利用先考えないと、マネージャーの立場の僕は怒られるけど(笑)。でも、基盤モデルの社会実装はやってみたいよね。
共に「非連続な進化」を楽しみたい方へ
リクルートのデータ組織には、羽鳥のように「技術そのものが好き」で、それをどうビジネスで形にするかを純粋に楽しんでいるメンバーが集まっています。
私たちは、単に業務をこなすのではなく、圧倒的なリソースを背景に「技術で何を変えられるか」という挑戦を共に楽しめる方を探しています。
「より大規模な環境で、より高度な技術を使い、これまでにない成果を出してみたい」。そんな、技術への飽くなき探求心を抱える方の挑戦を、私たちは全力で歓迎します。