Causal inference, of causale gevolgtrekking in het Nederlands, is een onderdeel van de statistiek dat zich focust op de gevolgen van onze acties. Ook binnen SEO kunnen bepaalde acties grote gevolgen hebben. Het is daarom belangrijk om de relaties tussen acties en hun gevolg ook in onze eigen data zo goed mogelijk te herkennen. Daarvoor ontwikkelde Google CausalImpact, een tool die je helpt voorspellen wat de gevolgen van een specifieke actie kunnen zijn.
Kay Brodersen, expert in het veld van statistiek, geeft een grondige uitleg hoe je CauselImpact daarvoor kan gebruiken in de onderstaande video. Wij vatten de video even voor je samen.
Wat is Causal inference?
Causal inference focust zich op de gevolgen van onze acties. Het kijkt niet naar de gevolgen na afloop van een actie, maar probeert op voorhand, door kansberekening, te bepalen wat de gevolgen van elke actie zouden kunnen zijn.
Hiervoor bestaat er maar één standaardmethode: het gerandomiseerd experiment. Dit experiment levert het meest betrouwbare en valide resultaat van een schatting van de gevolgen van een actie.
In verschillende situaties is het echter onmogelijk om een gerandomiseerd experiment uit te voeren, omdat het bijvoorbeeld te duur of te moeilijk is, niet ethisch is, of onvoldoende voorbereid is.
Neem bijvoorbeeld het aantal ‘kliks’ binnen een bepaalde tijdsperiode. Dit patroon zal zeer onregelmatig verlopen. De ene week heb je misschien veel kliks, de week daarop weer weinig. Causal inference helpt je in te schatten welk gevolg het uitvoeren van een bepaalde actie zou kunnen hebben op je ‘kliks’, zonder die actie daadwerkelijk uit te voeren. Daarvoor kunnen we bijvoorbeeld vergelijken wat er met je ‘kliks’ gebeurd is, en wat er mee zou kunnen gebeuren.
Hoe probleem met causal inference
Het onderzoek naar causal inference begint steeds met de actie die we willen uitvoeren, zoals het lanceren van een nieuwe ad campagne.
Om de gevolgen van die actie te bepalen kunnen we twee dingen doen. Eerst en vooral kunnen we de actie uitvoeren en het resultaat ervan direct met onze eigen ogen zien. Als tweede kunnen we de actie net niet uitvoeren en proberen het mogelijke resultaat te voorspellen. Het causale effect van de actie is dan het verschil tussen de twee mogelijke resultaten.
Omdat we een actie niet tegelijk wel en niet kunnen uitvoeren, stoten we op een probleem. We kunnen het verschil tussen de twee resultaten niet zien, en zullen dan ook nooit weten wat het causale effect net is.
Hiervoor bestaan twee oplossingen. We kunnen een experiment uitvoeren, waarin we de mogelijke gevolgen bekijken, zowel met als zonder de actie. Of we kunnen een aantal methodes van de waarnemingsanalyse gebruiken om de gevolgen in te schatten wanneer een experiment niet mogelijk is.
Wat is CausalImpact?
CausalImpact is een R package ontwikkeld door Google om met deze causal inference aan de slag te gaan. Het maakt daarvoor gebruik van zogeheten Bayesian structural time-series modellen. Praktisch ziet dit als volgt eruit.
De dataset heeft 100 waarnemingen (y) en één enkele voorspellende tijdreeks (x1). In de praktijk zouden we normaal gezien een handvol of meer van deze voorspellende factoren hebben. De CausalImpact helpt ons automatisch te bepalen welke van die factoren belangrijk is voor onze data.
In de uitvoergrafiek van bovenstaande code kan je zien dat de zwarte, ononderbroken lijn de werkelijk geobserveerde gegevens in de tijd weergeeft. De rode stippellijn voorspelt het gevolg. Daarnaast kan je zien dat ze allebei ongeveer gelijk lopen in de periode voor de actie (grijze verticale lijn). Na de actie, op tijdspunt 70, beginnen de lijnen uit elkaar te lopen. Op basis daarvan kunnen we natuurlijk allerlei ideeën uitdenken over wat er exact gebeurd zou zijn indien de actie niet had plaatsgevonden. Maar het is vooral belangrijk om die ideeën te kunnen aantonen met de juiste data.
Daarom moeten we een causale analyse uitvoeren van de gegevens zowel voor als na de actie.
CausalImpact grafieken
Laat de tool zijn werk doen en we krijgen de volgende drie grafieken te zien.
- De eerste grafiek toont de tijdreeks met onze schatting van wat er zou gebeuren bij de actie. We zien dat het resultaat iets lager ligt dan wanneer de actie daadwerkelijk is uitgevoerd.
- De tweede grafiek toont het verschil tussen het werkelijke gevolg en ons verwachte gevolg.
- De derde grafiek telt alle causale effecten binnen de tijdsduur bij elkaar, waardoor we een cumulatief causaal effect krijgen van ongeveer 300.
Wil je meer weten over CauselImpact? Bekijk dan onderstaand filmpje!
Hoe goed doet jou website het op vlak van SEO? We contacteren je terug binnen 24u.