GMOペパボ株式会社 デザイン戦略チーム データサイエンティストの財津(@zaimy) です。データ分析基盤の構築やデータ分析、機械学習モデルの開発、ペパボ研究所での研究・研究事務・研究広報をやっています。
この度、ペパボ研究所とココン技術研究室による共同研究の成果についてプレスリリースを発表したので、研究の概要と共にお伝えします。
ココン技術研究室との共同研究の概要
ペパボ研究所では、AI(機械学習)と高速なログ検索を用いたセキュリティオーケストレーションの研究開発に取り組むココン技術研究室と、2018年10月より なめらかなセキュリティ[1]を実現するための新技術を創造する という共通のミッションのもと共同研究を行っています。セキュリティ・ログ分析/解析・AI(機械学習)の3つのワーキンググループに分かれており、各グループの研究対象は次の通りです。
ワーキンググループ | 研究対象 |
---|---|
セキュリティ | 電子証明書の利活用、TLS1.3対応、TLS/SSLの安全性と機会損失、Webセキュリティ、高機能暗号応用 |
ログ分析/解析 | 超高速なログ処理基盤、高速な制御フィードバック、テレメトリによる次世代監視、ログ分析による異常検知 |
AI(機械学習) | 機械学習技術、予測的資源スケジューリング、不正利用検出・利用者行動予測、自然言語処理・画像解析、推薦システムへの高度化 |
共同研究の成果
研究開始から約半年の2019年3月11日現在、開発中のものも含めて、主に以下の成果を挙げています。以降では、それぞれの成果について関連する論文やオープンソースソフトウェアを紹介します。
- セキュリティワーキンググループ: Webアプリケーションのデータベースに発行される不正クエリの検知手法
- ログ分析/解析ワーキンググループ: サーバを横断したログの高速な検索技術
- AI(機械学習)ワーキンググループ: 予測的反応的資源スケジューリングのための状態変化の早いシステム基盤技術
セキュリティワーキンググループ: Webアプリケーションのデータベースに発行される不正クエリの検知手法
研究概要と成果
Webアプリケーションのデータベースに発行される不正クエリを検知することを目的として、「Webアプリケーション開発における自動テストを用いたSQLクエリのホワイトリスト自動作成手法」と「作成したホワイトリストを用いた不正クエリの検知手法」を研究しています。
tcpdpのクエリロギング機構とsqdのホワイトリスト作成および不正クエリ検知機構を利用した、「Webアプリケーションの実装に依存せずクエリの変更に容易な追従が可能」かつ「Webアプリケーションの本番稼働時にホワイトリストを作成する手法と比較して本番稼働直後から不正クエリを検知可能」なアーキテクチャを成果としており、実サービスへの適用へ向けて継続して研究開発を行っています。
関連論文
ログ分析/解析ワーキンググループ: サーバを横断したログの高速な検索技術
研究概要と成果
エッジデバイスとしてサーバを捉えた場合、ログを一箇所へ収集せず処理した方がリアルタイム性の実現とセキュリティの担保が可能となります。それに加え、ログデータの取得やストリーミング処理が実現でき、かつ横断的なログ検索が可能となる基盤を実現する研究を行っています。
サーバでの分散処理を実現するために、大規模分散システムにおいてHayabusa2のリクエスト処理機構とThe Platinum Searcherの高速処理性能を組み合わせることで、複数のサーバに存在するログをEdgeであるサーバ自身でリアルタイムに検索し、結果をクライアントで集約するアーキテクチャを設計開発中です。また、大規模分散システムの構築や中規模分散システムの運用において横断的なログ検索を可能にするHarvestの開発も進行しています。
関連論文
- 阿部博, 島慶一, 宮本大輔, 関谷勇司, 石原知洋, 岡田和也, 中村遼, 松浦知史, 篠田陽一, 時間軸検索に最適化したスケールアウト可能な高速ログ検索エンジンの実現と評価, 情報処理学会論文誌, 60巻3号, mar 2019.
AI(機械学習)ワーキンググループ: 予測的反応的資源スケジューリングのための状態変化の早いシステム基盤技術
研究概要と成果
サービスの異常検知では、システムの状態変化や利用者行動の特徴を精緻に捉え、即時に対処する仕組みが求められます。そこでこれらへの応用を目的として「予測的・反応的な資源スケジューリングに関する手法」並びにこれを実現するシステム基盤を研究開発しています。
本研究では、システムの状態変化や利用者行動の特徴を捉えるために、機械学習や深層学習を用いた予測的な資源計画や、Kaburayaによる反応的な資源制御に関する研究開発を行っています。また、これらの機械学習や深層学習で得た出力をリアルタイムでシステムに適用するために、システム基盤に反応的かつ状態変化の素早い性質が必要となることから、CRIUを利用したHTTPリクエスト単位でコンテナを再配置できる低コストで高速なスケジューリング手法の研究開発も進めており、2019年3月に開催される第44回情報処理学会インターネットと運用技術研究会で発表予定です。
関連論文
- 三宅悠介, 松本亮介, 力武健次, 栗林健太郎, アクセス頻度予測に基づく仮想サーバの計画的オートスケーリング, FIT 2018 第17回情報科学技術フォーラム, CL-002, Sep 2018.
最後に
この記事では、ペパボ研究所とココン技術研究室による共同研究の成果について、研究の概要と共にお伝えしました。両研究所は、ユーザーに役立つ技術の追求と新たな価値の創造を目指し、引き続き研究を進めてまいります。
なお、本共同研究の取り組みや成果を研究員が報告するイベント「ペパコンナイト」を、2019年5月に開催予定です。詳細は決まり次第お知らせいたしますので、ぜひご参加ください。
脚注
[1] システムの利用や運用におけるさまざまな障壁(ゴツゴツ)を取り除き、個々人に合わせた(パーソナライズした)セキュリティを必要な時に必要最小限の機能として提供することで、利便性を損なわず、かつプライバシー情報も守りながらセキュリティを実現する仕組み。
【PR】パートナー積極採用中!
ペパボ研究所では、新しいパートナーを求めています。詳細については、当研究所のトップページをご覧ください。