tips voor a/b testen

Tips voor a/b testen in Google Ads: 10 bewezen strategieën

Lennard Steeman2 juni 202612 min lezen

TL;DR:

Effectief A/B-testen in Google Ads vereist het testen van één variabele per experiment, met een vooraf berekende sample size en minimaal twee weken looptijd.

Een statistische significantie van 95% moet worden bereikt voordat een winnaar wordt vastgesteld, en elk experiment moet goed worden gedocumenteerd in een gestructureerd testlog.

A/B testen is de methode waarbij je twee varianten van een advertentie, landingspagina of campagne-instelling tegelijk test om te meten welke variant beter presteert op een vooraf gekozen KPI. Voor e-commerce marketeers die werken met Google Ads is dit geen optionele techniek. Het is de meest directe manier om conversieratio's te verhogen zonder extra mediabudget uit te geven. Tools zoals Google Ads Experiments, Optimizely en VWO maken het mogelijk om gecontroleerde tests op te zetten, maar de kwaliteit van je resultaten staat of valt met de discipline waarmee je de tips voor a/b testen toepast. Dit artikel geeft je een resultaatgerichte a/b testing gids met tien concrete stappen.

1. Test altijd één variabele per experiment

Goede A/B tests beginnen met één meetbare wijziging per experiment. Zodra je meerdere elementen tegelijk aanpast, weet je niet welke verandering het verschil heeft gemaakt. Dit klinkt voor de hand liggend, maar in de praktijk zien we bij Ecomtrada regelmatig accounts waar een nieuwe advertentietekst, een andere CTA én een gewijzigde URL tegelijk worden getest.

Elementen die je per test kunt isoleren zijn onder andere:

De koptekst van een responsieve zoekadvertentie
De call-to-action in de beschrijvingsregel
De prijs of aanbieding in de advertentietekst
Een afbeelding of productvideo in een Performance Max asset group
Trust-signals zoals reviews of garanties

Elke test heeft één primaire variabele. Alle andere elementen blijven identiek aan de controlevariant.

Pro-tip: Formuleer je hypothese altijd in de structuur "Als wij X veranderen, verwachten we dat Y met Z% stijgt." Dit dwingt je om vooraf na te denken over wat je meet en waarom, en voorkomt dat je achteraf een verklaring zoekt bij de data.

Detailfoto van een laptop waarop verschillende versies van Google Ads worden vergeleken.

2. Formuleer een scherpe, meetbare hypothese

Een hypothese is geen wens. Het is een gefalsificeerbare voorspelling gebaseerd op observaties uit je data. Kijk je in Google Analytics 4 dat de klikratio op een productpagina laag is terwijl het verkeer hoog is? Dan is een hypothese als "Als we de CTA veranderen van 'Bekijk product' naar 'Bestel vandaag, morgen in huis', stijgt de doorklikratio met minimaal 10%" concreet genoeg om te testen.

Kies één primaire metric vooraf en wijk daar niet van af tijdens de test. Secundaire metrics zoals gemiddelde orderwaarde of bouncepercentage geven aanvullend inzicht, maar zijn niet de basis voor je beslissing over de winnaar. Wie achteraf de metric kiest die het beste resultaat toont, bedrijft p-hacking. Dat leidt tot foutieve conclusies en verspild budget.

De optimale keuze van de primary KPI ligt zo dicht mogelijk bij de wijziging in de funnel. Test je een advertentietekst? Meet dan de klikratio, niet de uiteindelijke omzet. Hoe verder downstream je metric ligt, hoe meer verkeer en tijd je nodig hebt voor betrouwbare resultaten.

3. Bereken je sample size voordat je start

Veel marketeers starten een test en wachten af. Dat is de verkeerde volgorde. Bereken eerst hoeveel bezoekers of klikken je per variant nodig hebt, en plan daarna de startdatum op basis van je verwachte verkeersvolume.

De berekening is gebaseerd op vier parameters: je baseline conversieratio, de minimale uplift die je wilt detecteren, een power van 80% en een alfa van 5%. Voor een baseline van 5% en een gewenste uplift van 1 procentpunt heb je circa 7.415 bezoekers per variant nodig. Dat betekent bij 500 bezoekers per dag per variant een minimale looptijd van vijftien dagen, nog los van de weekcyclus-eis.

Parameter	Aanbevolen waarde	Toelichting
Statistische power	80%	Kans dat je een echt effect detecteert
Significantieniveau (alfa)	5%	Maximale kans op een vals positief resultaat
Minimale looptijd	2 tot 4 weken	Vangt weekcycli en gedragsvariaties op
Bezoekers per variant	Afhankelijk van baseline	Bereken vooraf via een sample size calculator

Wie de sample size niet vooraf berekent, test eigenlijk niet. Hij gokt met zijn campagnebudget.

4. Laat tests lang genoeg lopen

Tests dienen minimaal twee tot vier weken te lopen, soms langer bij lager verkeer, zodat wekelijkse cycli en seizoensinvloeden worden meegenomen. Dit is een van de meest genegeerde tips voor optimalisatie in de praktijk. Een test die maandag start en vrijdag wordt gestopt, heeft geen maandag-tot-maandag cyclus doorlopen. Koopgedrag verschilt per dag van de week, zeker in e-commerce.

Bij campagnes met weinig verkeer, zoals niche B2B-producten of specifieke long-tail zoekwoorden, kan de looptijd oplopen tot zes tot acht weken. Dat is geen probleem zolang je de test niet tussentijds aanpast. Elke wijziging tijdens een lopende test maakt de resultaten onbruikbaar.

Google Ads Experiments toont het confidence level in real-time in het dashboard. Google Ads gebruikt 95% betrouwbaarheid als norm. Resultaten onder deze waarde zijn statistisch onbetrouwbaar en vragen om een verlengde testperiode, niet om een beslissing.

5. Stop niet te vroeg met je test

Te vroeg stoppen met een test verhoogt de kans op foutieve winnaarselecties. Dit fenomeen heet "peeking" en is een van de meest voorkomende fouten bij advertenties testen. Je ziet na drie dagen dat variant B 20% beter converteert en je stopt de test. Maar die 20% is statistisch ruis, geen bewijs.

De grootste valkuil is niet welke variant wint, maar het stopmoment en de keuze van de metriek. Analytische discipline voorkomt foute beslissingen die je campagnebudget maanden kunnen kosten. Sequential testing tools, beschikbaar in Optimizely en VWO, kunnen helpen om tussentijds te checken zonder de foutmarge te vergroten. Maar de standaard aanpak blijft: wacht op het vooraf bepaalde eindpunt.

Stel een vaste einddatum in voordat je de test start. Schrijf die datum op in je testlog. Bekijk de resultaten pas op die datum.

6. Gebruik een 50/50 traffic split als standaard

Een traffic split van 50/50 levert in Google Ads de snelste en meest betrouwbare testresultaten. Beide varianten krijgen evenveel kansen, waardoor je sneller de benodigde sample size bereikt. Cookie-based splits zorgen dat gebruikers consistent dezelfde variant zien gedurende de hele testperiode. Dit voorkomt contaminatie van de resultaten.

Een 70/30 of 80/20 split is zinvol bij risicovollere wijzigingen, zoals een volledig nieuwe landingspagina of een drastische prijswijziging. In dat geval bescherm je het grootste deel van je verkeer tegen een mogelijk slechtere variant. Het nadeel is dat je langer moet wachten voor de variant met minder verkeer de benodigde sample size bereikt.

Kies de split op basis van het risico van de wijziging, niet op basis van voorkeur. Bij twijfel: gebruik 50/50.

7. Voer een A/A test uit als sanity check

A/A tests zijn nuttig om tracking, traffic allocation en event-firing te verifiëren voorafgaand aan een live A/B test. Bij een A/A test stuur je twee identieke varianten naar je publiek. Het resultaat moet statistisch gelijk zijn. Als dat niet zo is, wijst dat op technische problemen in je testopzet.

Gebruik een pre-launch checklist inclusief A/A testen en event-validatie om na te gaan of je testopzet technisch foutloos is. Controleer of conversietracking correct vuurt, of de traffic split werkt zoals ingesteld, en of er geen overlap is met andere actieve tests. Dit kost je een week, maar bespaart je weken aan onbruikbare testdata.

Pro-tip: Voer in Google Ads Experiments altijd eerst een A/A test uit op een nieuwe campagnestructuur voordat je een inhoudelijke variant test. Dit is de snelste manier om trackingfouten te ontdekken zonder dat het je testresultaten vervuilt.

8. Documenteer elke test in een gestructureerd testlog

A/B testen werkt het beste als een strikt cyclisch proces: observatie, hypothese, data planning, uitvoering, analyse en resultaatdeling. Zonder documentatie herhaal je dezelfde tests, vergeet je wat je al hebt geleerd, en kun je geen patronen herkennen over meerdere experimenten heen.

Een testlog bevat minimaal: de hypothese, de primaire metric, de startdatum, de geplande einddatum, de traffic split, het resultaat en de beslissing die je hebt genomen. Tools zoals Google Sheets, Notion of Confluence werken prima voor dit doel. Het gaat niet om de tool, maar om de discipline om elk experiment vast te leggen.

Bij Ecomtrada werken we met een gestandaardiseerd testlog voor alle Google Ads Experiments. Dat maakt het mogelijk om na zes maanden terug te kijken en te zien welke typen wijzigingen structureel effect hebben gehad in een specifieke productcategorie of campagnetype.

9. Vermijd gelijktijdige tests die elkaar beïnvloeden

Meerdere tests tegelijk draaien op dezelfde campagne of hetzelfde publiek leidt tot contaminatie. Als je tegelijk een advertentietekst test en een biedstrategie wijzigt, weet je niet welke factor de uitkomst heeft bepaald. Dit is een van de meest voorkomende fouten bij het opzetten van een advertenties testen stappenplan.

Goede planning voor Google Ads tests omvat ook het gedrag van biedalgoritmes en conversievolume, om versnelling in de leerfase van campagnes te respecteren. Een campagne die net uit de leerfase komt, reageert anders op een split test dan een stabiele campagne met drie maanden aan conversiedata. Plan tests daarom altijd in stabiele periodes, niet direct na grote campagnewijzigingen of budgetaanpassingen.

Gebruik een testkalender om overzicht te houden over welke tests actief zijn, op welke campagnes, en wanneer ze eindigen. Zo voorkom je overlap en zorg je dat elke test zijn eigen schone datapunt oplevert.

10. Analyseer resultaten op segmentniveau

Een gemiddeld testresultaat verbergt vaak het meest interessante inzicht. Variant B wint misschien op totaalniveau, maar verliest bij mobiele gebruikers of bij bezoekers die via Google Shopping binnenkomen. Segmentatie van testresultaten geeft je die nuance.

Analyseer je resultaten altijd op apparaat, tijdstip, doelgroepsegment en verkeersbron. In Google Ads Experiments kun je de resultaten uitsplitsen per netwerk. In Google Analytics 4 kun je segmenten toepassen op de conversierapportage. Gebruik die mogelijkheden. Een winnaar die alleen wint bij desktopgebruikers is een andere beslissing dan een winnaar die op alle apparaten beter presteert.

Bekijk ook de conversieoptimalisatie checklist van Ecomtrada voor een gestructureerde aanpak van KPI-selectie en meetpunten bij Google Ads campagnes. Segmentatie is geen extra stap. Het is de stap die bepaalt of je de juiste beslissing neemt.

Belangrijkste inzichten

Effectief a/b testen in Google Ads vereist één variabele per test, een vooraf berekende sample size, een vaste looptijd van minimaal twee weken, en statistische significantie van 95% voordat je een winnaar aanwijst.

Punt	Details
Één variabele per test	Test nooit meerdere elementen tegelijk; je kunt anders geen oorzaak-gevolgrelatie vaststellen.
Sample size vooraf berekenen	Gebruik baseline conversie en gewenste uplift om de benodigde steekproefgrootte te bepalen.
Minimale looptijd van twee weken	Kortere tests missen weekcycli en leiden tot onbetrouwbare conclusies.
95% significantie als norm	Google Ads Experiments gebruikt dit als standaard; resultaten eronder zijn onbruikbaar.
Documenteer elk experiment	Een testlog maakt patronen zichtbaar en voorkomt herhaling van mislukte tests.

Mijn kijk op testdiscipline in e-commerce

Ik zie bij e-commerce ondernemers een terugkerend patroon: ze starten enthousiast met testen, zien na een week een veelbelovend resultaat, stoppen de test, implementeren de winnaar, en zijn teleurgesteld als de omzet niet stijgt. Dat is geen pech. Dat is de voorspelbare uitkomst van een test die nooit de kans heeft gekregen om betrouwbaar te worden.

Wat ik in de praktijk heb geleerd, is dat de technische kant van A/B testen relatief eenvoudig is. Google Ads Experiments is goed gebouwd. Optimizely werkt. VWO werkt. Het probleem zit niet in de tools. Het zit in de ongeduldigheid waarmee marketeers omgaan met onzekerheid. Een test die na tien dagen nog geen winnaar toont, voelt als verspilde tijd. Maar het is juist het bewijs dat je de test serieus neemt.

De accounts die ik heb gezien met de sterkste testcultuur, zijn ook de accounts met de hoogste conversiegroei op jaarbasis. Niet omdat ze meer testen, maar omdat ze beter testen. Ze documenteren, ze wachten, ze segmenteren, en ze leren van elke test, ook van de inconclusieve. Dat is de enige manier om a/b test strategieën om te zetten in structurele omzetgroei.

Behandel elke test als een investering met een looptijd. Je zou ook geen aandeel verkopen na één dag omdat de koers nog niet gestegen is.

— Lennard

Laat Ecomtrada je Google Ads tests optimaliseren

Ecomtrada is gespecialiseerd in Google Ads voor e-commerce en helpt webshops om met gestructureerde A/B tests meer conversie uit hun campagnes te halen. Van hypothesevorming tot segmentanalyse: we begeleiden het volledige testproces binnen Google Ads Experiments en Performance Max. Wil je weten hoe je meer conversie haalt uit je huidige campagnes? Vraag een gratis audit aan en ontdek welke tests voor jouw account het meeste potentieel hebben. Geen langetermijncontracten, wel meetbare resultaten.

FAQ

Wat is de minimale looptijd voor een betrouwbare A/B test?

Een A/B test moet minimaal twee tot vier weken lopen om weekcycli en gedragsvariaties op te vangen. Bij lager verkeer kan dit oplopen tot zes tot acht weken.

Hoeveel variabelen mag je tegelijk testen?

Altijd één variabele per test. Meerdere variabelen tegelijk testen maakt het onmogelijk om te bepalen welke wijziging het resultaat heeft veroorzaakt.

Wat betekent 95% statistische significantie?

Dit betekent dat er slechts 5% kans is dat het gemeten verschil op toeval berust. Google Ads Experiments gebruikt dit als standaardnorm voordat een resultaat als betrouwbaar wordt beschouwd.

Wat is een A/A test en waarom is die nuttig?

Een A/A test stuurt twee identieke varianten naar je publiek om te controleren of tracking en traffic allocation correct werken. Onverklaarbare verschillen wijzen op technische fouten in de testopzet.

Hoe kies je de juiste primaire metric voor een A/B test?

Kies een metric die zo dicht mogelijk bij de geteste wijziging in de funnel ligt. Test je een advertentietekst, dan is de klikratio de juiste primaire metric, niet de uiteindelijke omzet.

Aanbeveling

Bekijk alle artikelen