ペパボ研究所 研究員/プリンシパルエンジニアの三宅(@monochromegane)です。 2022年9月15日、16日に開催された、SMASH22 Summer Symposiumで、「迅速な学習機構を用いて逐次適応性を損なうことなく非線形性を扱う文脈付き多腕バンディット手法」の発表を行い、優秀賞と奨励賞をいただきました。論文と発表資料と共に内容を紹介します。
発表概要
適応的なシステムの実現には、利用者とシステムのコミュニケーションが不可欠ですが、このコミュニケーションにもコストが...
この記事をもっと読む