論文読んだメモ: Cost-sensitive Learning for Utility Optimization in Online Advertising Auctions (2017 AdKDD)

KDD 2017 のワークショップ、2017 AdKDD & TargetAd の論文がいくつか事前に公開されていたので、読んだメモを残しておきます。

今回読んだのは Criteo 社の Cost-sensitive Learning for Utility Optimization in Online Advertising Auctions です (勘違い・読み間違いなどあるかもしれませんがご容赦ください)。

概要Permalink

CTR / CVR 予測を用いた広告配信の費用的なパフォーマンスを改善する話
- 予測精度を改善する話 ではない
予測モデルの精度は log loss で評価する一方で、広告配信のパフォーマンスは (経済学でいうところの)「効用 (Utility)」で評価していて、この評価メトリクスの観点でギャップが存在している
- この 「効用」が良くなるように予測モデルを学習したい、というのがこの論文の狙いとなる

広告配信における「効用」を損失関数にして学習できればそれに越したことはないが、これは非凸らしく、難しい
代わりに、Weighted log loss を提案している
- WNLL=∑Ni=1vilog(1+exp(−yiw⋅xi))+λ2||w||2
  - 入札価格 vi で重み付けしただけっぽい
    - 単に入札価格を乗じるだけでは、その値が大きな場合に過学習を引き起こす要因になりうるので、実際には上限値を設けたりもしくはのように調整することも論文中で言及している
正則化パラメータ λ は次のように設定する

オフラインでの評価方法
- Modeling Delayed Feedback in Display Advertising の評価で利用したデータセットと同じものを利用する
  - 同データセットには入札価格や CPA の情報がないので、入札価格はキャンペーンによらず一律 $1 とし、また CPA はキャンペーンごとの実績 CVR (post-click CR) の逆数とする
- 通常の log loss (NLL) と weighted log loss (WNLL) とを、MSEW, Utility のメトリクスで比較する
オフラインの評価結果
- Table3:
  - 重みはとする
  - (1) 全キャンペーンの結果、(2) CPA が高いキャンペーン (CPA > 10 なので、post-click CR が < 10%) に絞った結果、また (3) CPA が高くて sales 件数 (すなわちコンバージョン数、かな？) が低いキャンペーンに絞った結果ごとに、NLL と WNLL それぞれの MSEW, Utility を比較している
  - いずれも改善しており、特に改善幅は (3) > (2) > (1) となっている
    - CPA が高くてコンバージョンが少ないキャンペーンにおいて、良い結果が期待できる手法と考えられそう
オンライン
- ROI 的に +2% の lift が得られた