Vad säger oss — egentligen — statistiska regressioner?

30 Sep, 2018 at 20:16 | Posted in Statistics & Econometrics | Comments Off on Vad säger oss — egentligen — statistiska regressioner?

En grupp ‘högpresterande’ elever — Ada, Beda, och Cissi — söker in till en friskola. Ada och Beda blir antagna och börjar på den. Cissi blir också antagen, men väljer att gå på en kommunal skola. En annan grupp ‘lågpresterande’ elever — bestående av Dora och Eva — söker och blir både antagna till en friskola, men Eva väljer att gå på en kommunal skola.

drunkOm vi nu tittar på hur de presterar på ett kunskapsprov får vi följande resulatat: Ada — 22, Beda — 20, Cissi — 22, Dora — 12, Eva — 6. I den första gruppen får vi en provresultatskillnad mellan de elever som går på friskola och eleven som går i kommunal skola på -1 ((22+20)/2 – 22). I den andra gruppen blir provresultatskillnaden mellan eleven som väljer att gå på friskola och eleven som väljer gå i kommunal skola 6 (12-6). Den genomsnittliga provresultatskillnaden för grupperna tagna tillsammans är 2.5 ((-1+6)/2). Om man kör en vanlig OLS regression på datan — Skattade Provresultat = α + ß*Skolform + ζ*Grupptillhörighet — så får vi α = 8, ß = 2 och ζ = 12.

Kruxet med regressionsparameterskattningen är att det viktade genomsnittsvärdet — 2 — egentligen inte säger speciellt mycket om de gruppspecifika effekterna, där vi i den ena gruppen har en negativ ‘effekt’ av att gå i friskola och i den andra en positiv ‘effekt.’ Återigen har vi ett exempel där verklighetens heterogenitet riskerar ‘maskeras’ när man använder traditionell regressionsanalys för att skatta kausala ‘effekter.’

Blog at WordPress.com.
Entries and Comments feeds.