ペパボ研究所 研究員/プリンシパルエンジニアの三宅(@monochromegane)です。 2021年12月17日、18日に開催された、ARG 第17回Webインテリジェンスとインタラクション研究会 (WI2)で、「仮想的な探索を用いて文脈や時間の経過による番狂わせにも迅速に追従する多腕バンディット手法」の発表を行い、優秀研究賞をいただきました。論文と発表資料と共に内容を紹介します。
発表概要
適応的なシステムの実現には、利用者とシステムのコミュニケーションが不可欠ですが、このコミュニケーションにもコストが発生します。 私は、このコストの最小化を多腕バンディット問題と見なすことで、機会損失を抑えた適応的なシステムの実現する研究に取り組んでいます。 本研究報告では、この多腕バンディット問題を多様かつ継続的に変化する実環境においても適用可能とするための問題設定と解法ならびに評価指標を検討しています。 具体的には、番狂わせと称した、評価の低い候補が有用性が向上する状況において迅速かつ効率的に追従する手法を提案します。 提案手法では、線形カルマンフィルタと欠損値処理を用いた仮想的な探索によってこの問題の解決を図りました。 また、方策の判断基準と真の有用性からなる混同行列から求めた新たな指標によって定量的に追従性を比較しました。 評価では、機会損失の低減の観点において従来の最先端の方策と遜色のない性能であること、提案指標において従来の方策に比べて改善することが確認できました。
受賞
本研究報告に対して、優秀研究賞をいただきました。ありがとうございます!
論文
発表資料
発表を終えて
WI2研究会は、初めての参加でしたが、発表後の質疑応答が活発に行われる印象を受けました。 自身の発表に関しても有意義なフィードバックをたくさんいただき、非常に充実した時間となりました。 今回の受賞は、試行錯誤の末、区切りが分からなくなっていたところを相談に乗ってくれた指導教官の峯先生や所長(@kentaro)をはじめとする研究所の皆さんのおかげだと思います。 いつも支えていただき誠にありがとうございます。
【PR】パートナー積極採用中!
ペパボ研究所では、新しいパートナーを求めています。詳細については、当研究所のトップページをご覧ください。