Apache Sparkコミッタがやってくる!

2016年1月4日に「Recruit Technologies Open Lab #2:テーマ Spark」を開催致します.Recruit Technologies Open Lab はリクルートグループのサービス開発やインフラの運用を手がけるリクルートテクノロジーズが主催する技術勉強会です。今回のテーマは Apache Spark です。

今回は Apache Spark PMC メンバーであり,機械学習コンポーネント MLlib の開発責任者である Xiangrui Meng さんに講演をしていただけます! Spark の中でも特に機械学習ライブラリ MLlib にフォーカスします。 また databricks 社から T シャツなどのご支援を頂ける予定ですので、Xiangrui Meng さんの発表時にご質問されていただいた方に先着でプレゼントします。


  • 【日にち】
    • 2016年1月4日
  • 【会場】
    • グラントウキョウサウスタワー 41F
  • 【参加費】
    • 無料
  • 【イベント募集ページ】
  • 【対象】
    • 分散処理に興味のあるソフトウェアエンジニア
    • 機械学習に興味のあるデータサイエンティスト
    • 人材紹介もしくは転職や就職の斡旋・勧誘を目的としたご参加はご遠慮ください


時間 タイトル 発表者
18:00 受付開始&ソーシャライジング
19:00 本編開始
19:05 Scalable Bisecting K-means 石川有
19:30 Spark MLlib: Past, Present, and Future Xiangrui Meng さん
20:30 ソーシャライジング
21:30 クローズ



Xiangrui Meng is an Apache Spark PMC member and a software engineer at Databricks. His main interests center around developing and implementing scalable algorithms for scientific applications. He has been actively involved in the development and maintenance of Spark MLlib since he joined Databricks. Before Databricks, he worked as an applied research engineer at LinkedIn, where he was the main developer of an offline machine learning framework in Hadoop MapReduce. His Ph.D. work at Stanford is on randomized algorithms for large-scale linear regression problems.


Apache Spark provides primitives for in-memory cluster computing,which is well suited for large-scale machine learning purposes. MLlib is a standard component in Spark providing machine learning primitives, initially created and contributed to Spark by UC Berkeley. With 50+ companies and 200+ individual developers contributing to MLlib, it is one of the most active open source projects for machine learning. MLlib’s goal is to make practical machine learning scalable and easy, and the community has devoted lot of time and effort towards this goal. In this talk, we present a brief history of MLlib, summarize new features in Spark 1.6 (along with other components), and discuss the roadmap. We will show the expansion of MLlib’s feature set, the evolution of MLlib’s pipeline API, the elevation of MLlib’s performance, as well as the integration with other Spark components. We will also provide entry points for users and developers to get started
with Spark MLlib.


  • 受付は18時00分から開始予定としております。
  • 会場への入場にはセキュリティカードが必要です。グラントウキョウサウスタワーの1Fエスカレーター横に本イベント用の受付を設置します。2Fのリクルートグループの受付ではなく、1Fですのでご注意ください。イベント受付でセキュリティカードを受け取ってから2Fゲートより入場してください。
  • セキュリティカードは勉強会終了後にスタッフが回収します。持ち帰らないようにお願いします。万一持ち帰ってしまった場合、裏面に書かれている連絡先へ連絡してくださいますようお願いします。