Stack de Mesure

Un dispositif de mesure valide n'est pas un meilleur modèle d'attribution, c'est une triangulation de méthodes complémentaires, lue par horizon de décision et tenue comme une thèse à charge de preuve convergente, pas comme un verdict.

Trois instruments de mesure différents convergent leurs faisceaux vers un même point lumineux.
Mesurer, c'est trianguler

Quand une scale-up veut savoir ce que sa publicité produit vraiment, le réflexe est de chercher le bon modèle d’attribution : un MTA plus « déterministe », des fenêtres de conversion mieux réglées. La thèse de cette page est qu’aucun modèle ne peut répondre seul. Un dispositif de mesure valide n’est pas un meilleur modèle, c’est une triangulation de méthodes complémentaires.

L’idée vient des praticiens de la mesure post-iOS (Eric Seufert, Gabriele Franco), d’agences spécialisées (Growth Dynamics, The Marketing Architects) et de directeurs media (Dan Taylor chez Google, Samir Moda chez ITV) qui ont tous fait le même deuil : celui du tracking individuel déterministe. Elle prolonge un constat plus ancien de Les Binet et Sarah Carter sur l’absence de « monnaie commune » entre canaux.

Ce n’est pas une loi établie sur de grands échantillons : c’est un corpus de retours de praticiens et de cas, convergent mais pas expérimental, dont la force est l’accord entre des sources qui ne se citent pas. Les chiffres cités (environ un tiers de perte d’efficience post-privacy, 2 à 15 fois de sur-attribution sans groupe contrôle) viennent de simulations et de cas isolés : à lire comme des ordres de grandeur.

Cette page traite de l’architecture du dispositif : quelles méthodes, lues à quel horizon, avec quelle discipline d’hypothèse. Elle ne détaille pas chaque méthode (l’incrémentalité, le media mix modeling et les geo-tests ont leurs propres pages), ni le diagnostic du biais d’attribution qui la précède.

L’essentiel en 4 points

  • Aucun outil ne voit le tableau entier : l’attribution lit le bottom-funnel, le MMM et l’incrémentalité peinent sur le long-tail. On combine et on exige l’accord d’au moins deux méthodes avant toute réallocation majeure.
  • On lit par horizon de décision : l’attribution plateforme pour la journée, l’incrémentalité pour le mois, le MMM pour le trimestre.
  • On traite chaque mesure comme une thèse à charge de preuve convergente, pas comme un verdict : la question n’est pas « qui a raison ? » mais « quelle confiance combinée, et quelle preuve la hausserait ? ».
  • L’hygiène de tracking passe avant tout débat de modèle : sans déduplication pixel/serveur, on compte les mêmes achats deux fois.

Un meilleur modèle d’attribution ne suffit pas

Le dashboard ad-centric ment structurellement, et le réflexe est de chercher un meilleur modèle pour le corriger. C’est une impasse. Comme l’avance Eric Seufert, les MTA modernes (Northbeam, Triple Whale, Rockerbox) sont « pseudo-deterministic cuz they’re not actually working with deterministic information » : ils reposent sur des identifiants probabilistes, et aucun outil seul ne tranche l’attribution post-iOS. Ce qu’il faut, c’est « a basket of tools, an ensemble of tools, and the ability to interpret the output. »

Growth Dynamics pose le principe sans détour : « No single method can see the whole picture. » L’attribution voit le bottom-funnel ; le MMM et l’incrémentalité peinent sur le long-tail. La conséquence n’est pas de choisir le « bon » outil mais de les combiner et d’exiger l’accord d’au moins deux méthodes avant toute réallocation majeure. Le dispositif, pas le modèle, est l’unité de mesure.

Lire par horizon de décision

Le piège central est d’utiliser un seul niveau de mesure pour répondre à trois questions qui n’ont pas le même horizon. Dan Taylor, vingt ans chez Google, le résume : « attribution helps your hands-on keyboard today, incrementality helps your media planner tomorrow, and MMM help your CMO in two months. »

  • La décision du jour (quelle créa, quelle enchère) : l’attribution plateforme suffit comme signal réactif. On ne la jette pas, on la cantonne à son horizon.
  • L’arbitrage mensuel (allocation entre canaux) : l’incrémentalité prime. Ce canal crée-t-il de la demande nette ou capte-t-il l’existante ?
  • La décision trimestrielle (split brand/activation, budget total) : le media mix modeling et la contribution margin au P&L.

Entre les deux, une boussole hebdomadaire : l’indexation. L’attribution absolue étant biaisée, Jared Brody (EVP de Resident) pilote par indices relatifs à l’historique de chaque canal (1,0 = allocation optimale), ce qui neutralise saisonnalité, mix produit et fenêtres divergentes. « In theory you want everything to converge to a one. » Un canal qui décroche durablement (indice sous 0,7 sur trois semaines) déclenche un test d’incrémentalité, pas une coupe réflexe.

Le toolkit, par ce qu’il isole

Le dispositif assemble des méthodes selon ce que chacune isole :

  • Geo-experiments (couper une zone, la comparer à une zone jumelle) : le gold standard top-funnel, traité dans Expérimentation Contrôlée .
  • Ghost ads / PSA carve-out : exclure 10 à 15 % de l’audience retargeting et leur servir une publicité d’intérêt général donne la baseline organique à soustraire. The Marketing Architects rappellent que sans groupe contrôle, les résultats sont 2 à 15 fois trop favorables : un lift sans contrôle est non interprétable.
  • MMM : économétrie en séries temporelles, calibrée par geo-experiment.
  • Segmentation buyers / non-buyers avant d’interpréter un lift : si le gain ne vient que des acheteurs existants, c’est le Rosser Reeves Effect, pas de l’incrémental.
  • Surveys post-achat et signaux mid-funnel : Growth Dynamics note que si 30 % des nouveaux clients déclarent avoir découvert la marque via TikTok, un podcast ou un ami, « that’s powerful directional evidence » là où le revenue a du retard. True Classic l’opérationnalise sans pixel ni MMM : ROAS par pilier de contenu = (% de mention du pilier × revenue) ÷ spend du pilier.

Mesurer comme un scientifique, pas comme un avocat

Le dispositif vaut ce que vaut la discipline d’hypothèse qui le pilote. Comme l’écrit Liam Moroney, se dire « data-driven » ne rend pas une démarche scientifique : « having lots of data does not make one scientific ». L’anti-pattern est celui de l’avocat : on part de la métrique finale imposée par la direction et on ajuste les hypothèses pour qu’elles la « prouvent ». La méthode inverse se pose avant le lancement : que se passerait-il logiquement, vu ce qu’on comprend, si cette campagne marchait ? C’est cette réponse qui dérive les indicateurs à surveiller. Gini Dietrich le formule côté objectifs : « if you don’t set objectives ahead of time and work to achieve them, that’s cheating. »

Le marketing reste, dit Moroney, « one of the soft sciences » où l’expérience reproductible est hors d’atteinte : mais l’imperfection de la mesure rend l’hypothèse plus nécessaire, pas moins. Et la finalité reste le résultat, pas l’activité. Compter impressions, clics et followers répond à « qu’avons-nous fait ? » ; mesurer pipeline influencé et vitesse de décision répond à la seule question qui compte pour un dirigeant, « qu’est-ce que ça a fait pour le business ? ».

La mesure comme thèse, pas comme verdict

Le problème des MMM en 2026 n’est pas la précision technique mais l’adoption (72 % de non-adoption, selon une étude HBR citée par Gabriele Franco). Sa solution : « We solved by treating any measurement as a THESIS. The more convergent evidence we have, the stronger is our thesis on that channel measurement. » Le dispositif déplace la conversation entre direction financière et marketing de « qui a raison ? » vers « quelle confiance combinée, et quelle preuve la hausserait ? ».

D’où un principe organisationnel : laisser les régies optimiser comme elles veulent (et leur donner toute la data), mais évaluer via un dispositif externe couvrant tous les canaux uniformément. « Independent validation is 100 % key. They’re still biased towards their own platform. » Corollaire : un canal sous-acheté parce qu’il est sous-mesuré (YouTube, podcasts, OOH) est un avantage concurrentiel pour qui investit dans la mesure capable d’en révéler la vraie incrémentalité.

Le cross-canal n’est pas négociable. Samir Moda (ITV) observe que Meta, Google et Amazon achètent désormais contre des business results, mais chacun optimise en silo : « Everything started to be seen in silo. » Plus les plateformes revendiquent de l’outcome-based, plus le double-counting s’aggrave. Madison and Wall le documente à l’échelle du marché : le même dollar publicitaire apparaît dans les revenus de plusieurs acteurs du stack (DSP, retail media, plateforme) à mesure que les offres bundlent media, data et tech. La croissance pub reportée est surestimée par construction.

Le contre-feu, déjà énoncé par Binet et Carter : ramener chaque canal à une monnaie commune (un coût par impression corrigé d’exposition) avant tout débat de mix, car « in the absence of a ‘common currency’, there’s no way to assess relative performance, other than through sheer volume of data. » Et avant même cela, vérifier que les canaux fonctionnent comme un système : « You cannot put a gauge on a system that is not running as a system. » Si owned, earned, shared et paid ne se nourrissent pas, on cherche à mesurer l’effet combiné de choses qui n’ont jamais été combinées.

Si ta scale-up plafonne aujourd’hui

1. L’hygiène avant le modèle.

Avant tout débat sur l’incrémentalité ou le MMM, vérifie la déduplication entre ton pixel et ton tracking serveur (un event_id partagé). Comme le rappelle Jon Loomer, « Meta needs to know they are the same event, and that’s not an easy thing. » Sans cette base, un même achat est compté deux fois : 10 à 30 % de conversions doublonnées sont possibles. C’est ton premier audit (Meta Ads pour le paramétrage natif).

2. Construis le dispositif par étages.

  • Aujourd’hui : attribution plateforme + indexation hebdomadaire (le modèle Resident).
  • Au mois : geo-experiment ou ghost ads avant tout reweight significatif.
  • Au trimestre : MMM externe + contribution margin, présentés comme une thèse à preuve convergente, jamais comme un verdict.
  • En continu : surveys post-achat, lues comme une distribution dans le temps, pas comme des réponses individuelles.

3. La direction structurelle, pas une rustine.

Les frameworks de privacy (ATT, ITP, Privacy Sandbox, RGPD) remplacent le tracking individuel par des buckets probabilistes : The Marketing Architects estiment, par simulation, environ un tiers de perte d’efficience, concentrée sur la haute précision. Le « precision theater » s’effondre en premier ; les méthodes qui ne dépendent pas de la précision individuelle (geo-tests, MMM, calcul de portée globale) gagnent en valeur relative. La mesure gagne en honnêteté ce qu’elle perd en précision. La triangulation n’est pas un pansement, c’est où tout va.


Pour aller plus loin

  • Attribution - le diagnostic du biais que ce dispositif vient résoudre : pourquoi le dashboard ad-centric ment par construction.
  • Incrémentalité - la méthode reine de l’arbitrage mensuel : ce canal crée-t-il de la demande nette ou capte-t-il l’existante ?
  • Rosser Reeves Effect - le biais de causalité inverse à isoler par segmentation avant d’interpréter le moindre lift.

Sources


ℹ️ À propos de cette page

Reaching Kibo explore les vrais moteurs de la croissance des scale-ups B2C - et comment les mettre en pratique. Cette page appartient à Basecamp, le playbook du projet.

Elle est rédigée par IA, d’après le cadre et la direction que je donne. Une erreur, un désaccord, une source à ajouter ? Écris-moi : romain@reachingkibo.com.