10/04/2020
Forestil dig en varm sommerdag. Solen bager, og du nyder en lækker, kølig is. Intet kan vel være mere uskyldigt, ikke sandt? Men hvad nu hvis jeg fortalte dig, at der er en statistisk sammenhæng mellem salget af is og antallet af voldsforbrydelser? Ja, du læste rigtigt. Når isvaresalget stiger, stiger voldsforbrydelserne også, og når salget falder, falder kriminaliteten tilsvarende. Lyder det absurd? Det er det også. Men dette fascinerende eksempel er en perfekt illustration af et af de mest fundamentale, men ofte misforståede, principper inden for statistik og forskning: at korrelation ikke nødvendigvis betyder kausalitet. I denne artikel vil vi dykke ned i, hvad disse begreber egentlig indebærer, hvorfor de er så vigtige at skelne imellem, og hvordan en simpel kugle is kan lære os en værdifuld lektion om at forstå verden omkring os.

- Hvad er en Sammenhæng?
- Korrelation: Mere end blot en Sammenhæng
- Kausalitet: Årsag og Virkning
- Den Særlige Sag om Is og Voldsforbrydelser
- Andre Forvirrende Korrelationer
- Hvorfor Betyder Dette Noget for Dig?
- Hvornår Kan Korrelation Pege Mod Kausalitet?
- Ofte Stillede Spørgsmål
- Konklusion: En Verden Fuld af Nuancer
Hvad er en Sammenhæng?
For at forstå kompleksiteten af is og voldsforbrydelser, lad os starte med de grundlæggende byggesten. Først og fremmest har vi begrebet 'association' eller 'sammenhæng'. En association er til stede, når der er en afhængighed mellem to variabler. Med andre ord, hvis værdien af den ene variabel giver information om værdien af den anden, så er de forbundet. Hvis de to variabler er helt uafhængige af hinanden, er der ingen association. Tænk på det som to møntkast. Udfaldet af det første kast (plat eller krone) påvirker på ingen måde udfaldet af det andet kast. De er uafhængige. Men forestil dig nu, at du trækker to kort fra et standardspil med 52 kort uden at lægge det første kort tilbage. Sandsynligheden for at trække et specifikt kort i andet træk afhænger af, hvilket kort du trak i første træk. Hvis du trak spar es i første træk, er sandsynligheden for at trække det igen i andet træk nul. Hvis du ikke trak det, er sandsynligheden 1/51. Her er der en klar afhængighed, en association. At forstå denne grundlæggende form for forbindelse er første skridt mod at navigere i statistikkens verden.
Korrelation: Mere end blot en Sammenhæng
Mens 'association' er et bredt begreb, er 'korrelation' en mere specifik type af sammenhæng, som vi ofte støder på i daglig tale og i medierne. En korrelation foreligger, når der er en tendens til, at to variabler enten stiger eller falder sammen (positiv korrelation) eller bevæger sig i modsatte retninger (negativ korrelation). For eksempel er der en positiv korrelation mellem studerendes standardiserede testresultater og deres gennemsnitlige karakterer (GPA) på universitetet. Højere testresultater er typisk forbundet med højere GPA, og omvendt. De bevæger sig i samme retning. Det er vigtigt at huske, at selvom alle korrelationer er associationer, er ikke alle associationer korrelationer. En korrelation indikerer en retningsbestemt tendens.
I forskning udtrykkes korrelationer ofte ved hjælp af korrelationskoefficienter, som er numeriske indikatorer for disse relationer. Disse koefficienter spænder typisk fra -1 til 1 og angiver korrelationens retning og styrke. En positiv koefficient (tæt på 1) indikerer en stærk positiv korrelation, mens en negativ koefficient (tæt på -1) indikerer en stærk negativ korrelation. En koefficient på 0 indikerer ingen lineær sammenhæng. Pearson's korrelationskoefficient, ofte blot kaldet 'r', er den mest almindelige. En høj 'r'-værdi kan være yderst imponerende, men den alene fortæller os ikke hele historien. Netop her ligger faldgruben, som fører os til vores næste vigtige punkt.
Kausalitet: Årsag og Virkning
Den hellige gral inden for videnskabelig forståelse er kausalitet, også kendt som årsagssammenhæng. En kausal sammenhæng er til stede, når én variabel (årsagen) bidrager til frembringelsen af en anden variabel (virkningen). For at et forhold kan betragtes som kausalt, skal årsagen mindst delvist være ansvarlig for virkningen, og virkningen skal mindst delvist være afhængig af årsagen. Variabler, der er kausalt relaterede, vil altid være korrelerede, men det omvendte er, som vi allerede har antydet, ikke sandt.
Ud over en korrelation er der yderligere to vigtige kendetegn ved kausale relationer:
- Tidsmæssig sekvens: Årsagen skal komme før virkningen. Dette lyder indlysende, men er afgørende for at fastslå kausalitet.
- Mekanismer: Der er ofte identificerbare mekanismer eller processer, der forbinder årsag og virkning. Hvorfor fører X til Y? Hvad er den underliggende proces?
Så mens kausale sammenhænge ligner associationer ved at have en afhængighed, og ligner korrelationer ved ofte at udvise en klar tendens, er de 'specielle', fordi ændringer i én variabel faktisk producerer tilsvarende ændringer i en anden variabel. Dette er den store forskel, og den er altafgørende, når vi taler om is og voldsforbrydelser.
Den Særlige Sag om Is og Voldsforbrydelser
Nu tilbage til vores indledende dilemma: forårsager is voldsforbrydelser? På baggrund af en stærk korrelation kunne man fristes til at tro det. Men som vi nu ved, er en korrelation alene ikke nok. Lad os overveje en mere plausibel forklaring. Voldsforbrydelser har en tendens til at stige om sommeren. Hvorfor? En række faktorer spiller ind: længere dage, flere mennesker udendørs, varmere vejr der kan føre til øget irritation og social interaktion, der potentielt kan eskalere. Hvad stiger også markant om sommeren? Netop, salget af is!
Isvaresalg stiger, fordi vejret er varmt, og folk søger afkøling. Voldsforbrydelser stiger af en række komplekse årsager, der er relateret til årstiden. Det er altså ikke isen, der får folk til at blive voldelige. I stedet er både isvaresalg og voldsforbrydelser forbundet med en tredje variabel, nemlig årstiden eller mere specifikt sommeren. Sommeren er den fælles årsag, der driver begge trends opad. Dette er et klassisk eksempel på en fælles årsag, hvor en skjult eller overset variabel driver sammenhængen mellem to andre variabler, som ellers ikke er kausalt forbundet. Det er en af de mest almindelige faldgruber, når man tolker statistiske data.
Andre Forvirrende Korrelationer
Eksemplet med is og voldsforbrydelser er blot ét af mange. Verden er fuld af bemærkelsesværdige, men vildledende korrelationer. Vidste du for eksempel, at skilsmissefrekvensen i Oregon (USA) er positivt korreleret med forbruget af sødmælk per indbygger? Over en tiårig periode var korrelationen en forbløffende r = 0.90! Hvis du ville redde dit ægteskab, skulle du så holde op med at drikke mælk? Selvfølgelig ikke. Der er ingen logisk kausal sammenhæng her. Begge trends (faldende mælkeforbrug og faldende skilsmisser) er drevet af helt forskellige, uafhængige årsager. Dette er et eksempel på en spuriøs korrelation, hvor to variabler er korrelerede udelukkende ved en tilfældighed eller via meget komplekse, indirekte og meningsløse forbindelser.
Her er et par andre absurde, men virkelige, korrelationer fra USA:
- Mængden af penge brugt på kæledyr er positivt korreleret med utilsigtede forgiftninger fra alkohol (r = 0.87).
- Salg af nye biler er positivt korreleret med oksekødsforbrug (r = 0.94).
- Antallet af ph.d.-grader tildelt kvinder inden for ethvert felt er positivt korreleret med den samlede omsætning for amerikanske skisportssteder (r = 0.94).
Skal vi ud fra disse stærke korrelationer antage, at det at bruge penge på din kat øger din risiko for alkoholforgiftning? Eller at flere kvindelige ph.d.'er er en gave til skiindustrien? Nej, selvfølgelig ikke. Disse er alle eksempler på spuriøse korrelationer. Hvis du leder længe nok og analyserer tilstrækkeligt mange variabler, vil du uundgåeligt finde tilfældige korrelationer, der ikke har nogen meningsfuld forbindelse. Det er afgørende at huske på, at en statistisk sammenhæng ikke i sig selv er bevis for årsag og virkning.
Hvorfor Betyder Dette Noget for Dig?
At forstå forskellen mellem korrelation og kausalitet er ikke blot en akademisk øvelse; det er en essentiel færdighed i vores moderne informationssamfund. Medier og politikere præsenterer ofte forskningsresultater på en forenklet måde, der kan vildlede offentligheden. Ved at have et kritisk øje kan du blive en bedre forbruger af information og træffe mere informerede beslutninger.
Overvej for eksempel en udbredt undersøgelse om sammenhængen mellem familiemåltider og risikoadfærd hos teenagere. Forskere fandt, at en højere frekvens af familiemåltider var korreleret med nedsat risikoadfærd (f.eks. stofmisbrug, kriminalitet) hos unge. Nyhedsmedier, og desværre også nogle fagfolk, tolkede dette hurtigt som, at det at spise sammen som familie reducerer risikoadfærd. Forældre jublede! En simpel løsning!
Men dataene i denne undersøgelse var udelukkende korrelationelle. En mere sandsynlig forklaring er, at familier, der spiser sammen regelmæssigt, ofte er tættere, mere forbundne og har mere positive relationer generelt. Og tættere familier har en tendens til at have bedre tilpassede børn. Den 'tæthed' eller 'forbindelse' er den tredje variabel, der driver både hyppigere familiemåltider og reduceret risikoadfærd. Da forskerne statistisk kontrollerede for familiebånd, svandt sammenhængen mellem måltider og risikoadfærd ind. Millioner af forældre har måske fejlagtigt tvunget sig selv og deres børn til regelmæssige måltider, baseret på en misforstået kausalitet. Denne historie understreger, hvor vigtigt det er at gennemskue den reelle dynamik bag de tal, vi præsenteres for.
Hvornår Kan Korrelation Pege Mod Kausalitet?
Nu sidder du måske og er forvirret. Først har jeg fortalt dig, at man ikke skal antage en kausal sammenhæng baseret på korrelation alene. Nu skal vi dog nuancere det lidt. Selvom korrelation ikke implikerer kausalitet, er alle kausalt forbundne variabler korrelerede. Dette betyder, at stærke, konsistente korrelationer faktisk kan give bevis for en sandsynlig kausal sammenhæng, især når direkte eksperimentelle studier er uetiske eller umulige at udføre.
Tag for eksempel forholdet mellem rygning og lungekræft. En enorm mængde korrelationsforskning har gentagne gange vist, at rygere er langt mere tilbøjelige til at udvikle lungekræft end ikke-rygere. Hvorfor har vi ikke et 'bevis' for en direkte kausal sammenhæng fra et kontrolleret forsøg? Fordi et sådant forsøg ville kræve, at forskere tvang folk til at ryge for at se, om de udviklede kræft, hvilket naturligvis er dybt uetisk. Men det betyder ikke, at vi skal ignorere de korrelationelle beviser. I dette tilfælde er korrelationen mellem rygning og kræft fundet i et utal af studier, og forskere har omhyggeligt elimineret alternative forklaringer. Selvom vi måske ikke har et enkelt 'rygende pistol'-bevis fra et eksperiment, antyder den massive mængde overbevisende korrelationsbeviser stærkt, at rygning forårsager kræft. Så ja, korrelation er ikke kausalitet, men stærke korrelationelle beviser, understøttet af logik og udelukkelse af alternative forklaringer, kan absolut etablere en sandsynlig kausal forbindelse.
| Type | Kendetegn | Eksempel | Implikerer Kausalitet? |
|---|---|---|---|
| Association | Afhængighed mellem variabler; viden om én giver information om en anden. | Korttrækning uden tilbagelægning; udfaldet af det første træk påvirker det andet. | Nej |
| Korrelation | Specifik type association med en stigende eller faldende tendens (positiv/negativ). | Isvaresalg og voldsforbrydelser; højere testresultater og højere GPA. | Nej (medmindre yderligere beviser foreligger) |
| Kausalitet | Én variabel forårsager en ændring i en anden; årsag kommer før virkning; identificerbare mekanismer. | Rygning forårsager lungekræft. | Ja |
Ofte Stillede Spørgsmål
For at opsummere og yderligere afklare de vigtigste punkter, lad os besvare nogle ofte stillede spørgsmål:
Spørgsmål: Betyder en stærk korrelation, at der er en kausal sammenhæng?
Svar: Nej, absolut ikke. En stærk korrelation indikerer blot, at to variabler bevæger sig sammen på en forudsigelig måde. Som eksemplerne med is og skilsmisser viser, kan dette skyldes en tredje variabel, tilfældighed, eller endda omvendt kausalitet, hvor virkningen forårsager årsagen.
Spørgsmål: Hvad er en 'tredje variabel'?
Svar: En tredje variabel (også kaldet en confounding variabel) er en skjult eller overset faktor, der påvirker to andre variabler, hvilket får dem til at virke korrelerede, selvom de ikke har en direkte kausal forbindelse. I tilfældet med is og voldsforbrydelser er 'sommer' den tredje variabel.
Spørgsmål: Hvordan kan jeg vide, om et fund er kausalt eller blot korrelationelt?
Svar: Vær kritisk! Spørg dig selv: Er der en logisk mekanisme, der forbinder årsag og virkning? Kommer årsagen før virkningen? Er der alternative forklaringer (f.eks. en tredje variabel)? Den mest pålidelige måde at fastslå kausalitet på er gennem kontrollerede eksperimenter, hvor alle andre faktorer holdes konstante, undtagen den, der undersøges. Hvis et studie er 'korrelationelt', betyder det, at det blot observerer sammenhænge og ikke manipulerer variabler.
Spørgsmål: Kan korrelationsforskning overhovedet være nyttig?
Svar: Ja, absolut! Korrelationsforskning er ofte det første skridt i at identificere potentielle sammenhænge, der er værd at undersøge nærmere. Den kan også give stærke beviser for kausalitet, når eksperimenter er uacceptable (som med rygning og kræft), hvis mange uafhængige studier viser den samme korrelation, og alternative forklaringer er blevet udelukket systematisk. Den er uundværlig til at forstå komplekse fænomener, hvor eksperimenter er umulige.
Konklusion: En Verden Fuld af Nuancer
I en verden, der ofte søger simple svar, er det let at falde i fælden med at forveksle korrelation med kausalitet. Men som vi har set, er virkeligheden langt mere nuanceret. Den tilsyneladende absurde sammenhæng mellem isvaresalg og voldsforbrydelser er en kraftfuld påmindelse om denne vigtige skelnen. Din kærlighed til is er ikke et tegn på en skjult voldelig tendens; den er blot et udtryk for en fælles præference, der topper om sommeren.
At blive en kyndig forbruger af information handler om at stille de rigtige spørgsmål: Hvad er beviset? Hvordan blev forskningen udført? Tillader den anvendte forskningsmetode, at man drager en kausal konklusion? Hvis et studie er korrelationelt, kan vi så antage en kausal sammenhæng? Nej. Betyder det, at en kausal sammenhæng ikke eksisterer? Heller ikke. Det betyder blot, at den korrelation, vi observerer, kun er én af mange mulige forklaringer på forholdet. Yderligere forskning, der går dybere end blot at identificere sammenhænge, er ofte nødvendig for at forstå 'hvorfor' og 'hvordan' to ting er forbundet. Så næste gang du ser en fascinerende statistik, husk isen – og nyd den uden skyldfølelse!
Hvis du vil læse andre artikler, der ligner Is, Voldsforbrydelse og Misforståelser, kan du besøge kategorien Iskrem.
