“相談相手”が人からAIに変わるとき読者の皆さんがまず始めにデータ分析の相談をするのは誰でしょう?社内の詳しそうな理系エンジニアや会社に出入りしている戦略コンサルタント、業務委託しているデータアナリストやデータサイエンティストの場合もあるでしょう。しかし、今では、とりあえず生成AIに聞いてみよう、実際にデータを読み込ませて分析してみよう、というケースも増えてきているのではないでしょうか。データの整形や集計はもちろん、変数選択、関数形の検討、さらには施策の示唆まで。かつては複数人でホワイトボードを囲んで議論しながら進めていた作業を、今では生成AIと1対1で完結できるようになってきています。会話に対応するだけでなく、分析の前提や文脈、数理モデルの特徴まで理解したうえで返答してくるAI。そうなると、ふと疑問が湧いてきます。「この分析、本当に人間がやるべきなのか? AIに任せられるのでは?」この記事では、マーケティング領域における代表的な分析であるMMM(Marketing Mix Modeling)を題材に、生成AIがどこまで人間の分析プロセスを代替できるのかを検証していきます。特に注目するのは、広告予算の最適配分、すなわち「CMにいくら、デジタル広告にいくら投下すれば、費用を最小化しつつ売上を最大化できるか」という、実務上きわめて関心の高い問いです。本稿では、マーケティング分析のコンサルタントである著者が実際に生成AIと交わした具体的なやり取りを交えながら、「分析者の思考はどこまでAIに置き換えられるのか?」を探っていきます。その過程を通じて、マーケティング分析への生成AIの今後の活かし方を考えるヒントになれば幸いです。“見えない”広告効果をMMMで可視化するMMMは、見えにくい広告効果を可視化するために、統計モデルや機械学習などの予測モデリングを活用する分析アプローチです。たとえば、デジタル広告では「誰が・いつ・どの広告に接触して購入したのか」というデータが取得できるため、CPA(顧客獲得単価)などの費用対効果を直接算出することが容易な一方、テレビCMや屋外広告などのマス広告では広告接触の推定はできても、「接触者のうち誰がいつ購買に至ったか」までは把握できません。MMMは、こうした可視化しやすい広告と、しにくい広告を同じ土俵で評価するための方法論です。 “どのタイミングでどんな広告をどれくらい投下したら売上全体はどれくらい跳ねたのか”、の過去情報から各広告の売上貢献効果を分解し、売上全体を予測する数式を導出します。そして、この数式を基に「CMに5千万円、デジタル広告に3千万円追加で投下したら、売上はどれだけ伸びるのか」や「売上を前年比110%にするためには、各広告にどれくらい投下すべきか」といった、様々な広告投下シナリオを基に売上変動をシミュレートすることによって、広告予算の投資計画を支援します。広告効果は、誰がどう分析するかで変わってしまう!?MMMという言葉が定着する以前から、著者は広告主、データ分析会社、コンサルタントなど複数の立場で20年近くこの分析に携わってきました。その経験から言えるのは、同じデータを使っても、分析する人や立場によって、広告の売上効果は“ある”とも“ない”とも結論づけられてしまう、ということです。いったい、なぜそんなことが起こるのでしょうか。その一部をご紹介すると、上図(【広告効果を左右する着目ポイント】)にあるように、どんな要因で売上を紐解くのかという「モデル設計」のフェーズ、広告費と売上の関係性をどんな数式で表現するのかという「モデリング」のフェーズ各々に広告の売上影響を左右する原因が隠されています。「モデル設計」のフェーズでは、広告施策以外の外部要因(価格や気温)を含め、どの変数を用いて売上を予測するのかを決める、変数選択の問題があります。そして、「モデリング」のフェーズでは、広告効果の減頓度合いを表現する費用対効果の関数形や広告効果を次の期にどれくらい繰り越すのかを考える残存効果、分析者の仮説を事前情報としてどのように取り込むのかを表す数学的な制約条件やハイパーパラメータなど推定値の事前設定において、必ずしもすべてがデータ主導で決められているわけではなく、分析者の仮説や恣意が反映されることで効果があったりなかったりしてしまいます。同じデータで、ここまで違う――広告効果をめぐる“3つの結論”著者が飲料メーカーに勤務していた頃、全く同じ分析データを、大手広告代理店、データ分析会社、そして社内の内製化部隊という3つの組織で分析してもらう機会がありました。分析結果は驚くほど異なり、代理店では広告の売上貢献度は10%、分析会社では効果なし、内製化部隊では3%という結論でした。なお、各社の分析スキルに大きな差はありません。では、広告ビジネスと利害関係のないデータ分析会社の結果こそ“正しい”と言えるのでしょうか?実際に、各社のアプローチを詳細に確認していくと、「変数選択」や「モデリング」など、前提の置き方の違いが結果に大きな影響を与えていたことが明らかになりました。分析結果を左右する“事前仮説”の重み詳細に立ち入るにはマーケティング・サイエンスの専門知識が必要なため、ここでは概要のみにとどめますが、各社のモデルには明確な仮説の違いがありました。たとえば、広告代理店のMMMでは、広告効果が2年間継続するという長期の残存効果の仮説が組み込まれており、かつ、費用対効果の関数形が実際の分析データだけから導かれたものではなく、彼ら独自の数式が用いられていました。一方、データ分析会社のモデルには、「広告は売上に正の効果を持つ」という前提がなく、非負制約(広告係数が負にならないようにするモデル上の制約条件)が設定されていませんでした。その結果、広告によるプラスとマイナスの影響が相殺され、最終的に「効果なし」という結論に至ったと考えられます。実際、広告が繁忙期に集中していれば、売上に対して自然と正の係数になります。しかし、たとえば、閑散期にブランディング目的で広告を打った場合、売上が上がらなければ結果的に負の係数が出てしまうこともあります。では、”広告を打てば打つほど売上が下がる”というデータだけから導かれた解をそのまま信じるべきでしょうか?このように、広告代理店のモデルでは、データ以上に仮説(関数形と残存効果)が結果に強く反映されていたのに対し、データ分析会社のモデルでは、違和感のある負の関係性に対し、仮説による補正がなされなかった、という構図が浮き彫りになりました。ちなみに、内製化部隊の分析では、1商品のデータだけだと掴みにくい費用対効果の関数形は、複数の自社類似商品の曲線も参考にしながら構築し、残存効果は長くても半年、非負制約もきちんと入れるということで、事前仮説にもデータにも傾斜しすぎることなくバランスを取ったアプローチを採用しました。ただ、本論からはやや脱線しますが、プロジェクト関係者の数値に対する納得感という観点では、内製化部隊が妥当なアプローチを取ったから、その結果に満場一致で納得、めでたし、めでたし、とはいかないのがMMMの難しさでもあります。全体予算を効率化していきたい事業推進としての立場、できるだけ予算を削らずに担当商品の売り伸ばしを目指したいマーケターの立場など、立場によって“理想とする数値“が異なる以上、各々のステークホルダーに丁寧に説明し、伴走していかないと、分析した結果が次の広告プランニングに結びつかず、絵に描いた餅に終わることも少なくありません。“分析の答え”は、データだけでは決まらない話を本論に戻しますと、では、なぜ、分析結果がここまで変わってしまうのでしょうか?その最大の要因は、データそのものに不確実性や不完全性があることに起因します。実務で扱うデータでは、傾向が明確に見えるほどの長期データを取得できるのは、ロングセラー商品など一部に限られます。また、成熟市場ではシェア争いが激しく、競合商品の広告投下が自社商品の売上に影響を与えるものの、取得できる競合データはTVCMの視聴データであるGRPなどごく一部に限られるのが現状です。こうした“見えない部分の多さ”によって、分析の中に事前仮説を織り込む余地が生まれます。そしてその仮説の設定には、広告実務への理解や経験が反映される一方で、分析者の立場や意図による“恣意”が入り込む余地もまた存在します。仮に、ここに利害相反が絡むと、無茶な設定は避けつつも、事実に反しない“ギリギリのライン”を攻めるようなことも可能になります。たとえば、効果があるように見せる、あるいは逆にないように見せる、といったチューニングです。こうしたチューニングが行われても、クライアント側にデータ分析の詳細な知識やスキルがなければ、その“さじ加減”には気づけません。そして実際にMMMを発注するのは、データサイエンティストではなく、集客担当者やブランドマネージャーであることがほとんどです。さて、ここから本題に入っていきます。人間による分析でも、立場や仮説、そしてデータの限界によって結論が大きく変わってしまうMMMにおいて、生成AIは、いったい何をどこまで考慮して結論を導き出せるのでしょうか?その答えは、プロンプト次第、つまり、生成AIへの指示や質問の仕方にすべてがかかっている、というのは一般的によく言われていることですが、今回のケースでもそのことがよく当てはまります。ここからは、実際に筆者が生成AIと交わしたやり取りを紹介していきます。やり取りの中には、専門用語がそのまま登場する部分もありますが、リアリティを重視して原文通りに掲載しています。用語の意味にこだわるよりも、AIとのやり取りの雰囲気や展開を感じ取っていただき、生成AIがどこまで“人間の分析者”の代わりになり得るのかを読みながら探っていただければと思います。設計の出発点で、効果は変わる 変数選択という静かな分岐点最初に取り上げるのは、「モデル設計」における変数選択の話です。私が携わっていた飲料業界では、売上を左右する最大の要因は、何よりも“気温”でした。夏の繁忙期に向けて各種の広告施策が展開される一方で、気温の上昇が売上を大きく押し上げる傾向があります。では、この“気温”をモデルに組み込まなかった場合、何が起こるでしょうか?たとえば、気温が高くなる時期に広告を集中投下すれば、広告出稿と売上のタイミングが一致するため、「広告が売上を押し上げた」と見えてしまうかもしれません。しかし実際には、売上の増加は気温の影響が大きいのです。また、広告施策と連動して、スーパーやコンビニの店頭施策やキャンペーンが同時に実施されることも多いため、それらをモデルに含めなければ、本来は複数の要因の結果である売上増加が、すべて、その時に実施していた広告のおかげだと過大評価されてしまう恐れがあります。配荷状況や値下げなど、他にも売上に影響する要因は多々あります。こうした要因の何をどこまでモデルに取り入れるかによって、広告効果の見え方は大きく変わるのです。このように、一見すると広告と売上が強く相関しているように見えても、実際には別の要因によってたまたま同じタイミングで連動しているだけというケースがあります。これを「疑似相関(spurious correlation)」と呼びます。疑似相関とは、本来は関係のない2つの変数の間に、他の要因によって偶然に相関が現れてしまう現象のことです。では、こうした複雑な背景を踏まえて、生成AIは変数選択をどう判断してくれるのでしょうか?ここからは、OpenAI社のChatGPT-4oを使って行った実際のやり取りをご紹介していきます。生成AIとのやり取りは非常にスムーズで、特に変数選択における重要な論点の一つである多重共線性についても、具体的な解決策とともに言及してくれています。多重共線性とは、説明変数同士の相関が高過ぎることによって、それぞれの変数が目的変数(たとえば売上)に与える影響を正しく推定できなくなる現象です。この状態で構築されたモデルを使っても、広告の効果を正しく評価できないため、精度の高い予算配分が困難になります。さらに問題なのは、誤った前提に基づいたモデルによって、逆に売上を落とすような予算配分が導かれてしまう可能性すらあるという点です。こうしたリスクを見逃さず、モデルの前提条件に注意を払うことが、AIとの連携においても極めて重要だといえるでしょう。数式は中立か? モデリングに忍び込む仮説の影次は、「モデリング」の工程に焦点を当てていきます。広告効果をモデルに落とし込む際には、たとえば費用対効果の関数形の形状や、広告効果がどの程度の期間残るのか(残存効果)、そして、事前の仮説をどのようにパラメータ設定へ反映させるか(ハイパーパラメータ)といった要素が影響します。本稿では、紙幅の関係から、この中でも特に実務での判断が分かれやすい「費用対効果の関数形」について、生成AIとのやり取りを紹介していきます。✅ よく使われる広告効果の非線形関数関数数式例特徴・用途対数関数log(1 + β × 広告費)初期効果大、逓減効果あり。小さな投資でも一定の効果、飽和感ありS字型関数(例:ロジスティック)1 / (1 + exp(-α × (広告費 - θ)))閾値効果:一定以上の出稿で効果が出始め、頭打ちがある累積関数累積広告費の移動平均や指数加重平均蓄積的な効果(例:ブランディングや遅行効果)を考慮できる平方根関数sqrt(広告費)対数と似た逓減性を持つが、低予算領域の滑らかな効果に対応分数関数広告費 / (1 + γ × 広告費)出稿量が多くなるほど効果の伸びが鈍化する(飽和の明示)スプライン補間(B-splineなど)データに応じて区間ごとに関数形を調整非パラメトリック。柔軟性はあるが解釈性が下がるこのやり取りの内容は、日々データ分析者と交わしている議論と比べても遜色なく、会話にストレスを感じることはまったくありませんでした。なお、MMMのモデルにおいては、状態空間モデルを採用するケースが多く見られます。その理由は、時系列的な要因(季節性やトレンド)と広告投下などの要因を同時にモデル化でき、分析者の仮説も柔軟に取り込みやすいためです。AIも示していた通り、状態空間モデルは広告の影響を説明する力と、将来を予測する力のバランスに優れているアプローチと言えます。また、費用対効果の関数形についても、対数関数からスプライン補完まで、多様な関数形の提案が示されました。では、引き続き生成AIとのやり取りを見ていきましょう。“それっぽい”非線形性の正体上記のやり取りは、費用対効果の関数形をあらかじめ決めてしまうのではなく、まずは、広告費と売上の関係にどのような非線形性があるのかを、線形を仮定している重回帰分析を非線形に拡張した加法モデルを使って確認するというものです。この手法では、他の変数の影響をコントロールしたうえで、広告費単体の寄与の形状を視覚的に把握することができます。言い換えれば、「それっぽい関数形」をデータから探るための前段階といえるでしょう。実務ではよく、広告を多く投下すれば売上が直線的(=線形)に増えるわけではなく、ある程度の投下以降は効果が鈍化していく(=逓減する)と議論されます。しかし、「どの時点でその鈍化が始まるのか(=閾値)」をデータから正確に判断するのは困難です。なぜなら、広告費を2倍、3倍、あるいは10倍に増やしたような実績が十分にない限り、その領域の曲線はデータに基づいて描けないからです。このような背景から、分析者はデータに完全に依拠することができず、ある程度の“それっぽさ”をもった関数形を仮定として設定する必要性が生じます。つまり、仮説とデータの折衷で関数形が定められ、その設定にはどうしても恣意的な判断が入り込む余地が生まれます。前述の広告代理店が、分析データだけではなく独自の数式を使って費用対効果を定義していたのは、このような構造的事情に起因しています。たとえば、効果の鈍化があまり起こらないような仮説を組み込んだ数式を採用すれば、一定の範囲で「効果がある」という結論を導くことも可能になります。無茶な設定ではなく、あくまで“嘘ではないギリギリのライン”を攻めることで、広告効果の有無を調整できてしまう。これは、客観的であるはずのデータ分析の中に仮説や恣意性が入り込む具体的な一例といえるでしょう。生成AIは“万能”か、“相棒”か -その現在地と使いこなしの勘所-これまでのやり取りをご覧いただいて、すでに感じ取られた方もいるかもしれませんが、現時点では生成AIにすべてを任せて“よしなに”分析してもらえる時代には、まだ到達していません。適切なアウトプットを引き出すには、指示する側にも一定の専門知識や事業仮説が求められるのが実情です。とはいえ、生成AIはすでに優秀なデータサイエンティストと同等、あるいはそれ以上の知識量と情報集約力を備えており、強力な“分析パートナー”となりつつあります。さらに、指示の意図や重視点を学習したAIエージェントが登場すれば、個々の分析スタイルに合わせてパーソナライズされた支援を提供してくれる日も近いと感じています。数か月単位で進化を遂げている現在のスピードを考えれば、それは決して遠い未来ではありません。一方で、よく話題に上がる「ハルシネーション(=AIが事実と異なる情報を生成する現象)」についても無視はできません。実際にデータを読み込ませて分析させた際、相関係数の誤計算や、MMMの予測精度を表す決定係数の適用ミス(学習用・検証用データの取り違え)といった事象が何度か発生しました。ただ、これは人間の分析者でも起こりうるミスです。重要なのは、どこで何が間違ったのかをロジカルに突き詰めて検証できるかどうか、そして、それに基づくミスの再発防止であり、その点ではAIとのやり取りも人との対話と大きく変わりません。そして、AIの出力に違和感を持てるかどうかは、「センス」ではなく事前準備の有無に大きく左右されます。AIにいきなりデータを丸投げせず、あらかじめデータの傾向を把握し、結論の方向性を想定しておくことで、ハルシネーションにも早期に気づきやすくなるはずです。マーケティング分析では、MMMに限らず、データの不確実性や不完全性を仮説によって補う場面が少なくありません。データだけに過度な期待を抱くのではなく、実務から得られる経験的知見(仮説)とデータをどのように融合させるかが分析の肝になります。もちろん、その仮説が恣意的に過ぎれば、分析結果も同様に歪んでしまうという点も、最後に付け加えておきます。株式会社 R SQUARED 代表取締役情報経営イノベーション専門職大学 客員教授吉永 恵一