ここではMarketing Mix Modelingの理論について解説します。
Marketing Mix Modelingとは
マーケティング業界では昨今、広告効果を測定するためにMarketing Mix Modeling(以下、MMM)が持て囃されています。なぜなら、広告戦略は相乗効果を狙って同時に複数メディアを通して行われるのが普通である一方で、どのメディアが良かったのかといった分析も求められるからです。相乗効果と言っておいて個別の効果を見たいなどというのはナンセンスに聞こえますが、現場というのはそういうものです。
MMMとは何かというと、言ってしまえば「非線形変換を行なった変数で、広告効果全体の線形回帰を行うモデル」というだけです。マーケティング業界の方なら、広告効果は広告出稿のタイミングで最大になってそこから指数関数的に落ちていく、とか、コンバージョンが深い指標なら広告出稿から少し遅れてピークをつけてから落ちていく、と言ったことがイメージできるかと思います。なので、いくつかの出稿量変数を指数関数やある種の釣鐘型関数などによりそれぞれ非線形変換を行うことで、後は重回帰を行うだけのモデルです。実装においては、非線形なモデルなので解析的な最適化は難しいため、MCMCでフィッティングを行います。
データサイエンティスト達には、「MMMとは」というのはこれで伝わる話だと思っているので、個人的にはなぜMMMがバズワード的に語られているのか疑問だったりします。とはいえ、これで終わるのだと面白くないので、以下では数式を見ながらあれこれ考えたいと思います。
非線形変換について
幾何減衰
あるN人の集団に対してある時点t=0で広告接触があった時、広告接触の記憶は単位時間経過で一定の割合aで忘れられ、記憶がある集団うちは一定の割合aは行動を起こしてから忘れる、みたいなことを考えます。
すると、時刻tで記憶が残っている人は(1-a)^t * N人で、その中のbの割合の人が行動するので、行動を起こす人の数は b *(1-a)^t * Nみたいな形になります。
(1-a)^t * Nというのが非線形変換で、bをかけるというところが線形回帰というわけです。
複数のクリエイティブやチャネルでの出向があるとすると、行動を起こす人は単純に和になると考えます。
b0 *(1-a0)^t * N0 + b1 *(1-a1)^t * N1
遅延型
遅延型は遅れたところ(時刻d)にピークがくる、そして指数関数的に減衰するということで、天下り的にe^{a * (t – d) ^2}と言ったような非線形変換を当てはめます。
注意点
上記がモデリングの中身ですが、広告に複数回接触した人は考慮していません。MMMは集計値でモデリングするので個別の人がどうとかいうのはナンセンスなんですが、無理やり解釈しようとすると、あるユーザーは合計3回の広告接触がありある時点ではで1.5回分の接触の記憶が残っている。そうした人がその時点でM人いたら1.5M * b人が行動を起こすとなりますが、一人一回しか行動しないとすると実際にはもっと少なくなりそうです。なので、仮定次第でいかようにもなりそうですが、ここでは複数回接触ではなく広告接触数の増加は1回だけ接触した人が増加したものだと考えておきます。