自動要約APIを作ったので公開します
大杉 直也
リクルートテクノロジーズの大杉です。
広島市立大学修士2回生の飯沼さんと一緒に、自然言語要約ツールを作りましたので、リクルートテクノロジーズのgithubアカウントにて公開します。このapiでは、入力した文章から、指定したパラメータ(行数など)に応じて、重要だと思われる文の抽出ができます。例えば、当ブログ当記事の直前のこの記事を3行で要約すると、以下のようになります。
1. “リクルートテクノロジーズでは、ここ最近、UXデザインの専門家とビッグデータの専門家が、協力してリクルートグループ内の各事業に入り、プロジェクトを推進していく事例が多くなっています。”,
2. “UXデザインでは、定性的なリサーチと定量的なアクセスログ解析を組み合わせて、ユーザ行動を可視化することは以前からやってきました。”,
3. “「成功体験とは何か」を定義して、きちんとデザインできるかが、UXデザインの大きな目的になるわけです。”
元の文章が2,000文字近いので、さすがに3行は乱暴すぎましたが、「だいたいの内容」は推定できる感じになりました。
このAPIの利用方法やアルゴリズムの詳細はリンク先をご参照ください。コードを共有するので、サーバーは自前でお願いします。githubへのリンク
弊社では、この要約apiを用いることで、社内業務の改善や既存サービスの改善の可能性を検証しています。
暫定的ですが、それらの検証の結果、実際の業務改善に自動要約apiの有効性が示せました。その結果をNLP若手の会 2015にて発表しました。
リクルートテクノロジーズでは、自然言語処理技術をはじめ、様々な技術のビジネス応用・業務効率改善に取り組んでおります。先端技術の開拓・応用に興味お持ちの方、大歓迎です。