Marketing Metrics

Test Holdout

Q: Toutes les plateformes publicitaires supportent-elles les tests holdout natifs ?

Non. Meta Ads (Facebook, Instagram) propose une fonctionnalité de « holdout » ou « groupe de contrôle de la campagne » nativement dans son gestionnaire de publicités. Google Ads propose des « expériences de campagne » qui permettent un split test partiel. LinkedIn Ads ne propose pas de holdout natif — la mise en place requiert une segmentation manuelle de l'audience ou l'utilisation d'un outil tiers. Pour les plateformes sans support natif, le test géo-lift est souvent l'alternative la plus praticable.

20 juin 2026 9 min de lecture

Un test holdout retient les publicités auprès d'un sous-ensemble aléatoire d'utilisateurs — typiquement 10 à 20 % — pour mesurer le taux de conversion en l'absence de toute exposition publicitaire. Ce groupe de non-exposés devient le groupe contrôle qui permet de calculer le lift incrémental réel. Sans holdout, on mesure une corrélation entre publicité et conversion — pas une causalité.

En bref

Le test holdout retient les publicités auprès d'un groupe aléatoire d'utilisateurs (10 à 20 %) pour mesurer le taux de conversion sans publicité — produisant le groupe contrôle nécessaire pour calculer l'incrémentalité réelle. Sans ce groupe de non-exposés, les outils d'attribution mesurent une corrélation, pas une causalité, et surestiment systématiquement l'impact des campagnes.

Définition complète

Un test holdout est une expérience contrôlée dans laquelle une portion aléatoire de l'audience cible — le groupe holdout ou groupe contrôle — est exclue des diffusions publicitaires pendant toute la durée du test. Le reste de l'audience, le groupe exposé, continue de voir les campagnes normalement. À la fin du test, les taux de conversion des deux groupes sont comparés : la différence représente le lift incrémental — la part de conversions directement causée par les publicités et qui n'aurait pas eu lieu en leur absence.

Le test holdout répond à la question fondamentale que les outils d'attribution marketing ne peuvent pas résoudre : est-ce que cet utilisateur aurait converti même sans voir la publicité ? Tous les outils d'attribution natifs des plateformes — Google Ads, Meta Ads, LinkedIn Ads — attribuent les conversions aux publicités exposées sans disposer d'un groupe contrôle. Résultat : ils mesurent une corrélation (les utilisateurs exposés convertissent plus) sans pouvoir établir si la publicité en est la cause. Le test holdout établit la causalité en produisant un groupe de non-exposés comparable. Selon les études sectorielles, le biais moyen d'attribution en SaaS B2B est de 2 à 4 fois : le ROAS rapporté par les plateformes surestime l'impact réel d'un facteur 2 à 4.

Le test holdout se distingue du test géo-lift par le mécanisme de séparation des groupes. Dans un holdout, la séparation est individuelle et aléatoire — indépendamment de la localisation géographique. Dans un test géo-lift, la séparation est géographique — les campagnes sont retenues dans des régions entières. Les deux méthodes produisent des mesures d'incrémentalité comparables, mais le holdout est plus précis (la randomisation individuelle élimine les biais géographiques) tandis que le test géo-lift est plus facile à implémenter sur des plateformes sans support de holdout natif.

Comment le calculer

Le calcul du lift incrémental via un test holdout compare les taux de conversion entre le groupe exposé et le groupe contrôle sur la même période.

Lift incrémental = (Taux de conversion groupe exposé − Taux de conversion groupe holdout) / Taux de conversion groupe holdout × 100

Exemple : groupe exposé à 3,8 % de conversion, groupe holdout à 2,4 % → Lift = (3,8 − 2,4) / 2,4 × 100 = 58,3 %. Cela signifie que 58,3 % des conversions du groupe exposé sont attribuables aux campagnes.

La traduction en revenu incrémental suit : Revenu incrémental = Lift incrémental (%) × Conversions totales groupe exposé × Valeur moyenne par conversion. Ce revenu incrémental, divisé par les dépenses publicitaires sur la période, produit le ROAS incrémental — la mesure la plus honnête du retour publicitaire réel.

Pour que le calcul soit valide, deux conditions doivent être réunies. D'une part, la randomisation doit être véritablement aléatoire — les utilisateurs du groupe holdout ne doivent pas différer systématiquement du groupe exposé sur des variables qui influencent la conversion (intention d'achat, historique d'engagement, segment d'audience). D'autre part, le groupe holdout doit être maintenu strictement exclu pendant toute la durée du test — tout "leakage" (un utilisateur holdout qui reçoit accidentellement une publicité) biaise les résultats à la baisse du lift mesuré.

Exemple concret

Une scale-up SaaS B2B française de gestion financière pour PME utilise Meta Ads (Facebook et Instagram) pour des campagnes de lead generation ciblant les directeurs financiers de PME de 20 à 200 salariés. La plateforme rapporte un ROAS de 8,5 sur le dernier trimestre. L'équipe marketing souhaite mesurer l'impact réel avant de décider d'augmenter les budgets.

Elle configure un test holdout via le gestionnaire de publicités Meta en excluant 15 % de l'audience cible des diffusions pendant 5 semaines. À la fin du test : le groupe exposé (85 % de l'audience) affiche un taux de conversion lead-to-demo de 4,1 % sur 12 400 utilisateurs, soit 509 leads. Le groupe holdout (15 % de l'audience) affiche un taux de conversion de 2,7 % sur 2 190 utilisateurs, soit 59 leads. Le lift incrémental est de (4,1 − 2,7) / 2,7 × 100 = 51,9 %. Cela signifie que 51,9 % des conversions du groupe exposé sont attribuables aux campagnes — les 48,1 % restants auraient converti de toute façon, via d'autres canaux ou l'intention organique. Le ROAS incrémental réel est de 8,5 × 0,519 = 4,4 — contre un ROAS rapporté de 8,5. La surestimation de la plateforme est d'un facteur 1,9.

Cette information est directement actionnelle : avec un ROAS incrémental de 4,4 et un coût d'acquisition client (CAC) cible, l'équipe peut décider si une augmentation des budgets Meta est justifiée — ou si ces euros seraient plus efficacement alloués à des canaux dont l'incrémentalité est plus élevée, comme LinkedIn Ads ciblant directement les ICP ou les événements sectoriels. Sans le test holdout, la décision aurait été prise sur un ROAS de 8,5 qui surestimait l'impact réel de 93 %.

Analyse approfondie

Le test holdout est la méthode d'incrémentalité la plus précise disponible pour les équipes marketing, précisément parce qu'il repose sur une randomisation individuelle — et non sur des proxies géographiques ou des modèles statistiques rétrospectifs. Sa précision est directement liée à la qualité de la randomisation : si la plateforme publicitaire randomise véritablement l'exclusion, les deux groupes sont statistiquement équivalents sur toutes les variables observables et non observables qui influencent la conversion. C'est la condition que ni le test géo-lift (séparation imparfaite) ni le marketing mix modeling (modèle rétrospectif) ne peuvent garantir avec la même rigueur.

La question du coût d'opportunité du holdout est fréquemment soulevée : si l'on exclut 15 % de l'audience des publicités, on renonce à des conversions pendant la durée du test. Ce coût d'opportunité est réel, mais il doit être mis en perspective. Si les campagnes ont un ROAS incrémental réel de 4,4 (et non 8,5 comme rapporté), l'optimisation budgétaire permise par la connaissance de ce chiffre — réallocation vers des canaux plus efficaces, désactivation de segments à faible incrémentalité — dépasse largement le coût du test sur 4 à 6 semaines. La question n'est pas « combien coûte le test ? » mais « combien coûte de prendre des décisions budgétaires sur un ROAS surestimé d'un facteur 2 ? »

La segmentation du lift holdout par audience est l'étape suivante après le calcul global. Un lift incrémental de 52 % au niveau agrégé peut cacher un lift de 85 % sur les audiences de prospection froide (utilisateurs qui n'ont jamais interagi avec la marque) et un lift de 15 % sur les audiences de retargeting (utilisateurs ayant déjà visité le site ou cliqué sur un contenu). Cette segmentation est décisive pour l'allocation budgétaire : les audiences de prospection froide ont typiquement un lift incrémental plus élevé car les utilisateurs ciblés ne seraient pas venus sans la publicité. Les audiences de retargeting ont souvent un lift plus faible car une partie des conversions résulte de l'intention organique accumulée par le prospect avant le reciblage.

Dans le contexte SaaS B2B, la durée minimale du test holdout est plus longue qu'en B2C. Un test holdout Meta en e-commerce peut produire des résultats fiables en 2 semaines sur des audiences de 50 000+ utilisateurs. En SaaS B2B ciblant des ETI françaises, les audiences sont plus restreintes (10 000 à 50 000 utilisateurs cibles sur LinkedIn ou Meta), les cycles de décision plus longs (4 à 12 semaines entre le premier contact publicitaire et la demande de démo), et les volumes de conversion plus faibles. Pour atteindre la puissance statistique nécessaire — généralement 80 à 90 % de confiance — un test holdout SaaS B2B bien dimensionné dure 4 à 6 semaines avec un groupe holdout d'au moins 15 %. En dessous de ces seuils, les intervalles de confiance sont trop larges pour justifier une décision budgétaire.

La cadence recommandée pour les tests holdout en SaaS B2B est trimestrielle sur les canaux principaux. Tester trop souvent multiplie les coûts d'opportunité sans produire de signal supplémentaire — l'incrémentalité d'un canal ne change pas de semaine en semaine. Tester trop rarement expose l'équipe à des décisions budgétaires basées sur des données d'incrémentalité obsolètes — une plateforme dont le lift était de 60 % il y a 12 mois peut avoir vu son incrémentalité chuter à 25 % suite à une saturation d'audience ou un changement algorithmique. Intégrer les résultats des tests holdout dans l'operating dashboard comme facteur de correction du ROAS rapporté permet d'appliquer les enseignements entre les cycles de test.

Erreurs fréquentes

✗
Utiliser un groupe holdout trop petit. Un groupe holdout inférieur à 10 % de l'audience produit des volumes de conversion trop faibles pour atteindre la significativité statistique, surtout en SaaS B2B où les taux de conversion sont bas (1 à 5 %). Les résultats sont alors non interprétables : l'intervalle de confiance est trop large pour distinguer un lift réel de la variance naturelle. La taille minimale recommandée est 10 à 15 % pour des audiences supérieures à 20 000 utilisateurs, et 20 % pour des audiences plus petites.
✗
Contaminer le groupe holdout avec d'autres campagnes. Si le groupe holdout est exclu de la campagne testée mais reste exposé à d'autres campagnes de la même marque — retargeting email, campagnes sur d'autres plateformes, prospection téléphonique — le groupe contrôle n'est pas « propre ». Le taux de conversion du groupe holdout inclut l'effet de ces autres campagnes, ce qui biaise le lift mesuré à la baisse. Un test holdout rigoureux nécessite d'exclure le groupe contrôle de toutes les formes de contact marketing pendant la durée du test.
✗
Confondre le lift holdout avec le ROAS de plateforme sans correction. Le ROAS rapporté par Meta, Google ou LinkedIn après un test holdout inclut les conversions de l'ensemble de l'audience exposée — y compris celles qui auraient eu lieu sans la publicité. Le ROAS incrémental, calculé depuis les résultats du holdout, est le seul chiffre pertinent pour décider d'augmenter ou de réduire les budgets. Utiliser le ROAS de plateforme pour des décisions budgétaires revient à payer pour des conversions qui ne sont pas causées par les campagnes.

Comment Fairview suit cet indicateur

Fairview importe les données de test holdout depuis vos plateformes publicitaires — Meta Ads en priorité, qui propose le support holdout le plus complet — et les croise avec votre CRM pour calculer le lift incrémental net par campagne, par canal et par segment d'audience. Il produit un ROAS incrémental comparable au ROAS rapporté par la plateforme en affichant l'écart entre les deux métriques côte à côte. Si le ROAS incrémental est inférieur de plus de 40 % au ROAS plateforme sur un canal donné, Fairview génère une alerte avec une recommandation d'action concrète : réduction des budgets sur les segments à faible incrémentalité, réallocation vers les canaux dont le lift est documenté, ou planification d'un nouveau test sur un canal non testé. Le tableau de bord d'attribution affiche l'incrémentalité mesurée comme facteur de correction permanent — sans extraction manuelle ni tableur intermédiaire.

Voir comment Fairview mesure l'incrémentalité →

Questions fréquentes

Quelle taille de groupe holdout utiliser pour un test d'incrémentalité ?

La taille standard du groupe holdout est de 10 à 20 % de l'audience cible. Un groupe trop petit (sous 5 %) manque de puissance statistique. Un groupe trop grand (au-dessus de 30 %) augmente le coût d'opportunité du test. Pour le SaaS B2B avec des volumes de conversion faibles, un holdout à 20 % sur 4 à 6 semaines est généralement le bon équilibre.

Toutes les plateformes publicitaires supportent-elles les tests holdout natifs ?

Non. Meta Ads propose un groupe de contrôle de campagne nativement. Google Ads propose des expériences de campagne partielles. LinkedIn Ads ne propose pas de holdout natif — la mise en place requiert une segmentation manuelle ou un outil tiers. Pour les plateformes sans support natif, le test géo-lift est souvent l'alternative la plus praticable.

Quelle est la différence entre un test holdout et un test A/B publicitaire ?

Un test A/B publicitaire compare deux variantes de publicité entre deux groupes exposés — les deux groupes voient une publicité. Un test holdout compare un groupe exposé à un groupe qui ne voit aucune publicité. Le test A/B mesure la performance relative entre variantes ; le test holdout mesure l'incrémentalité absolue des campagnes versus l'absence de campagne.

Comment Fairview intègre-t-il les résultats des tests holdout dans le reporting ?

Fairview importe les données de holdout depuis vos plateformes et les croise avec votre CRM pour calculer le lift incrémental net par campagne et par segment d'audience. Il produit un ROAS incrémental comparable au ROAS rapporté par la plateforme, en affichant l'écart entre les deux, et génère une alerte si la surestimation dépasse 40 %.

Découvrez-le dans Fairview

Mesurez le lift incrémental réel de vos campagnes.

Démo en direct de 25 minutes. ROAS incrémental, lift holdout et attribution comparés automatiquement à partir de vos données réelles.

Réserver une démo Voir les tarifs

Connaissez le chiffre. Prenez la décision.

Réserver une démo Voir les tarifs