こんにちは、研究員の三宅です。インターネットでは @monochromegane として活動しています。2017/05/25-26で開催された、第37回インターネットと運用技術研究会で、類似画像による関連商品検索システムについて研究発表してきました。論文(研究会予稿)とスライドを以下に公開します(論文画像をクリックするとPDFで読むことが出来ます)。
論文(研究会予稿)
スライド
研究の概要は以下の通りです。
BtoCのECサイトで取り扱う商品の種類の増加に伴い,ECサイト利用者の通常の行動では全ての商品を見て回ることは困難であるため,多くのECサイトでは効率的に商品を閲覧できるよう関連性のある商品を動線上に表示している.購買履歴等の情報が蓄積されないと関連商品を選定できない問題を解決するため,商品の持つ様々なメタデータを利用する手法や,視覚的な訴求力の強い商品画像を元にした,畳み込みニューラルネットワークを始めとした深層学習による精度の高い関連商品の選定手法が提案されている.しかし,適切な粒度のメタデータの整備に手間を要する問題や,深層学習のための大量の訓練データセットと計算時間が必要となる問題から,これらが導入への大きな障壁となっている.本報告では,画像分類用の学術ベンチマークであり,ECサイト商品画像特性と類似するImageNetにおいて高い成績を出したInception-v3モデルを学習済みネットワークとして採用し,一般物体の特徴を強く表現する識別層に近い手前のプーリング層までから得られる特徴量をもとに近似最近傍探索により類似度を比較することで,特徴抽出器の学習と購買履歴を必要としない類似画像による関連商品検索システムを提案する.ECサイトにこの類似画像による関連商品検索システムを導入し,画像のクリック率を商品カテゴリごとに計測することで類似画像による関連商品の有効性を検証した.
弊社では商品数が増加するECサイトにおいて、どのように興味のある商品を効率的に閲覧していただくかが課題となっていました。協調フィルタリングや商品属性情報の細分化では、商品の登録が頻繁に行われるサイトに追従できなかったり、利用者側の入力負担が増えるという課題がありました。また、機械学習によってこれらを解決するためには多くの学習リソースが必要になってしまいます。ペパボ研究所ではこれらを解決するため、視覚的な訴求力の高い商品画像に対して、ECサイトの商品画像特性と類似するデータで学習済みのネットワークを特徴量抽出機として利用し、類似画像による関連商品を検索するシステムを提案しました。
本手法によって、関連商品の選定において購買履歴に依存せず、関連性を指定するための追加の属性情報を登録する必要がなくなりました。また、商品画像特性との類似性があれば学習済みネットワークを別タスクに転移して利用でき、利用者が興味を持つ関連商品を選定できることが検証できました。なお、現在は、類似度を比較する近似近傍探索にはannoyと呼ばれるライブラリをmrubyでラップするため開発したmruby-annoyとngx_mrubyによる近似近傍探索APIサーバーを利用していますが、商品画像の変化にリアルタイムに追従できるような構成を検討、実装中です。
初めての論文と発表を終えて
今回の執筆した論文(研究会予稿)は自分にとって初めての論文となりました。論文執筆にあたり研究所に方々に様々な助言をもらいながら、論文として、手法の新規性、有効性、信頼性をどのように主張するかについて深く考える機会となりました。 これまでの自身のエンジニアとしての課題解決への取り組みは解決することがゴールでしたが、今回の論文執筆を経て、取り組みを手法に昇華する過程で理論をしっかり抽象化、一般化することで、次に繋げるという研究開発の一端を経験できたと思います。今後もより高度に事業を差別化できる研究開発を続けていけるよう精進していきます。
【PR】パートナー積極採用中!
ペパボ研究所では、新しいパートナーを求めています。詳細については、当研究所のトップページをご覧ください。