Naar inhoud springen

Correlatie

Uit Wikipedia, de vrije encyclopedie
Voor andere betekenissen dan in de statistiek zie Correlatie (geologie) en Stichting Korrelatie
Correlatievoorbeelden

Correlatie is de statistische samenhang tussen twee grootheden. Dit kunnen twee reeksen metingen zijn, of mogelijke waarden van twee toevalsvariabelen zijn. De sterkte van deze samenhang wordt uitgedrukt in een correlatiecoëfficiënt. Als er sprake is van lineaire correlatie, wordt de sterkte van de samenhang meestal uitgedrukt in Pearsons product-momentcorrelatiecoëfficiënt. Als er geen lineaire correlatie wordt verwacht, wordt wel gebruik gemaakt van Spearmans rho of Kendalls tau. Correlatie is geen bewijs van causaliteit, al kan het daar wel een aanwijzing voor zijn.

Correlatiemaat

[bewerken | brontekst bewerken]

De mate van correlatie tussen twee variabelen wordt uitgedrukt in de correlatiecoëfficiënt. De waarde daarvan kan variëren tussen −1 en +1. Daarbij betekent 0: geen lineaire samenhang, +1: een perfecte positieve lineaire samenhang en −1: een perfecte negatieve lineaire samenhang. Hoe verder de correlatiecoëfficiënt verwijderd is van 0, hoe sterker de correlatie.

Praktische betekenis

[bewerken | brontekst bewerken]

Praktische betekenis in het algemeen

[bewerken | brontekst bewerken]

Correlaties kunnen in de praktijk gebruikt worden om verbanden aan te wijzen en voorspellingen te doen. Voorbeelden daarvan zijn de correlatie tussen de uitslagen in twee opeenvolgende jaren van de CITO-toets in het lager onderwijs, en de correlatie tussen de prijs en de vraag in de economie. Als bekend is dat dergelijke variabelen gecorreleerd zijn, kan de ene variabele gebruikt worden om de andere te voorspellen. Zo is het voor een elektriciteitsbedrijf handig te weten hoeveel energie er op een dag gebruikt wordt, wat voorspeld kan worden als de correlatie tussen temperatuur en het energieverbruik van huishoudens bekend is.

Een bepaalde mate van statistische correlatie hoeft echter niet altijd te betekenen dat er inderdaad een oorzakelijk verband tussen de twee variabelen is. Als geen aanleiding bestaat om een correlatie te vermoeden (zoals tussen de kleur van de ogen en criminaliteit) betekent de correlatie waarschijnlijk niets. Als men correlaties toetst tussen honderden eigenschappen, zal een op de twintig onderzochte relaties statistisch significant zijn (wanneer men toetst op 5%-niveau), terwijl de betreffende samenhang in de populatie waaruit de steekproef is getrokken, niet bestaat.

Een (significante) correlatie suggereert ook geen oorzakelijk verband. Als er een correlatie wordt gevonden tussen verhoogde agressiviteit bij kinderen en het aantal uren dat ze naar tv kijken is daarmee niet bewezen dat kinderen agressief worden van het televisiekijken. Net zo goed is het mogelijk dat kinderen die in aanleg meer neigen tot agressiviteit ook vaker televisiekijken als vrijetijdsbesteding kiezen, of dat een derde variabele (bijvoorbeeld sociaal milieu) verantwoordelijk is voor de samenhang tussen televisie kijken en agressiviteit. Er is in dit geval dus slechts sprake van een statistisch verband, en niet van een oorzakelijk verband. Een duidelijk voorbeeld is de correlatie tussen de afstand tussen de Aarde en de komeet van Halley en de benzineprijs. Deze correlatie is zeer sterk, en het is duidelijk dat er geen oorzakelijk verband is. In de statistiek mag een sterke correlatie nooit een reden zijn om te beginnen speculeren over een oorzakelijk verband.

Bekende voorbeelden van zulke "nonsenscorrelaties" zijn: de sterke, positieve correlatie tussen de grootte van de schade bij een brand en het aantal ingezette brandweerlieden, en de positieve correlatie tussen het aantal gesignaleerde ooievaars in Nederland en het geboortecijfer.

Praktische betekenis in het recht

[bewerken | brontekst bewerken]

Binnen het civiele recht vormt dit een groot discussiepunt, omdat causaal verband met name in het aansprakelijkheidsrecht een rol speelt.

  • Men kan hierbij denken aan de correlatie (en wellicht causaal verband) tussen roken en longkanker, tussen asbest en longkanker, tussen loodhoudende verf en loodvergiftiging bij kinderen, tussen zoutlozingen van Franse kalimijnen in de Rijn en schade bij Nederlandse tuinders, kernproeven en kankercijfers, productaansprakelijkheid, etc.
  • In het Nederlands recht kan een bestuurder in faillissement aansprakelijk worden gesteld voor onbehoorlijke taakvervulling die een belangrijke oorzaak van het faillissement is. Dat veronderstelt causaal verband en correlatie tussen de taakvervulling van de bestuurder en de jaarcijfers: de bestuurder maakte fouten, bracht daarmee de onderneming verlies toe, tot deze niet langer levensvatbaar was. Dit is echter vrijwel onmogelijk vast te stellen en bovendien zijn er vaak ook andere oorzaken van het faillissement.

Binnen het staatsrecht kan men denken aan correlatie en eventueel causaal verband tussen bestuurswisselingen en de economie. Wanneer verkiezingen aankomen is het denkbaar dat investeerders met hun investeringen wachten tot er een nieuwe regering is duidelijk geformuleerd beleid is. De staatsinrichting kan hierbij een rol spelen, bijvoorbeeld of men een twee- of meerpartijenstelsel heeft, en de macht van het staatshoofd. Een typisch voorbeeld is de Amerikaanse presidentiële cyclus.

Binnen strafrecht en criminalistiek spelen correlatie en causaliteit een rol bij strafbaarstelling en strafmaat.

  • Een zeer bekend voorbeeld is de correlatie (en al dan niet causaal verband) tussen strafmaat of zelfs het handhaven van de doodstraf, en criminaliteitscijfers. Voorstanders zien dit wel en wijzen op afschrikkend (preventief) effect van zware straffen, tegenstanders zien dit niet zo.
  • Een ander bekend voorbeeld is de relatie tussen kinderporno en hands-on misbruik van kinderen: zet kinderporno aan tot misbruik of zouden misbruikers dit hoe dan ook hebben gedaan? Of raakten ze door dat misbruik geïnteresseerd in kinderporno in plaats van andersom? Of geeft dit preferentiële daders nou juist ontlading waardoor ze geen hands-on misbruik plegen? Hierbij komt nog een ander probleem kijken, namelijk het feit dat de datapopulatie relatief klein is, veel misbruik en kinderporno nog onder de radar blijft, en het feit dat vooral gelegenheidsdaders betrapt worden en waarschijnlijk oververtegenwoordigd zijn in de beschikbare statistieken ten opzichte van preferentiële daders. De correlatie kan hierdoor niet of nauwelijks worden aangetoond, causaal verband al helemaal niet. Dit speelt een rol in de discussie rondom strafbaarheidstelling van virtuele kinderporno, waarvoor dus geen kinderen misbruikt zijn.

Verder spelen correlatie en causaliteit een grote rol in de rechtseconomie in de vraag in hoeverre bepaalde rechtsregels invloed hebben op economische cijfers.