「機械学習:技術的負債の高利子クレジットカード」のまとめ
石川有
アドバンスドテクノロジーラボの石川有です.
株式会社リクルートテクノロジーズ Advent Calendar 2014 – Qiita
の 12/16 分でエントリーを書きます.
大規模データを扱った機械学習用ライブラリがオープンソースで利用できる便利な時代ですが,まだまだ真の意味でエンジニアリングと機械学習研究の融合は果たせていないと思います.
従来のソフトウェアエンジニアリングではソースコードに対する知見が提案され実用されていますが,いざ機械学習システムの開発・運用に適応してみると「それだけ」では足りないということを実感します.
その開発と運用のしづらさは何によるものなのか,それを回避するためのアンチパターンはなんなのかなどのヒントを,Google の D. Sculley らが
Machine Learning: The High Interest Credit Card of Technical Debt
で示してくれました.
今回のエントリーでは,これから機械学習システムを実運用する上でどういうことを考慮する必要があるかを示してくれた論文をまとめました.