Simpsons paradox – om nödvändigheten av modeller

I en debatt på ekonomistas hävdade Tino Sanandaji att hela ökningen av barnfattigdomen kunde förklaras av en ökad andel invandrare. Hans argument byggde på Simpsons paradox: barnfattigdomen har fallit både inom gruppen invandrare och gruppen svenskar, men den ökade andelen invandrare gör att den aggregerade siffran ändå ökar. Således kan inte barnfattigdomen skyllas på ekonomisk politik utan enbart på invandringspolitiken.

Det är självklart bra att studera om förändringar bara är kompositionsförändringar, men jag tror inte att den data som anförs räcker som stöd. Tinos kommentar tvingar en att tänka djupare kring frågan, varpå man förstår att det inte är helt enkelt vilka korrektioner man ska göra.

Simpsons paradox är att förekomsten av A ökar i populationen trots att den minskar i alla subpopulationer. Exemplet ovan gör det tydligt hur det kan ske: de relativa storlekarna på subpopulationerna kan förändras.

Frågan är: ska vi korrigera för mängden invandrare? Inte nödvändigtvis. Vi skulle göra det om invandrare hade en stark kausal effekt på fattigdom. Dvs, om att vara invandrare orsakar en viss risk för fattigdom som är rimligt invariant över tiden. Då ska vi i bedömningen av effekten av andra riskfaktorers (såsom ekonomisk poltik) korrigera för kompositionsförändringar i befolkningen.

Problemet är att invandring inte främst är en kausal faktor till fattigdom. Istället orsaken till invandrares högre fattigdomstal rimligtvis att det i invandrarpopulationen finns en större prevalens av ett antal riskfaktorer, men fördelningen av riskfaktorer inom invandrarpopulationen behöver inte vara konstant över tid.

Låt mig illustrera det här med ett exempel.

Under de senaste tio åren har vi haft lönetillväxt, sänkta skatter, och försämrade socialförsäkringar. Detta skapar två motstridiga effekter på fattigdom. Vissa med en stor proportion löneinkomster har lämnat fattigdom, medan andra med en liten proportion löneinkomster har gått in i fattigdom.

Påståendet att barnfattigdomen enbart ökar på grund av en ökad proportion invandrare och inte politiken skulle i det här ramverket betyda ”om inga nya människor hade invandrat och infödda och invandrades befolkningsökning var lika så hade antalet människor som lämnat fattigdom varit högre än antalet  som blivit fattiga”.

Man märker här att detta påstående inte utesluter att en annan politik skulle kunna lett till ännu lägre fattigdom (eller mindre ökning i det nuvarande fallet), så det är inte ett jättestarkt påstående.

Men stämmer ens det begränsade påståendet? Jag hävdar att jämförelsen av fattigdomsandelarna bland invandrade och infödda över tid inte ger tillräckligt med information för att uttala sig om påståendet.Anledningen är att vi måste veta hur kompositionen av invandrargruppen har förändrats över tid. Betrakta följande numeriska exempel. Vi har tre grupper: infödda (I) , flyktinginvandrare (FI) och arbetskraftsinvandrare (AI). I början av perioden ser det ut som följer med fattigdomen

I : 100/1000 : 10%
FI : 50/100 : 50%
AI : 1/10: 10%

Total fattigdom: 151/1110 = 13.6%

Den förda politiken kombinerat med tillväxt har en nettopositiv effekt på I och AI (som är identiska i arbetsmarknadsmöjligheter), och en nettonegativ effekt på FI. I slutet av perioden ser det ut som följer:

I : 80/1000 : 8%
FI : 100/100 : 100%
AI : :16/200 8%

Total fattigdom: 214/1400=15.08%

Så fattigdomen ökar. Folk debatterar bekymrat den ökade fattigdomen. Vi kan nu tillämpa Tinos argument på vårt exempel. Han säger att det inte alls är så att politiken ökar fattigdomen. Allt beror på att proportionen invandrare har ökat. Till sitt stöd noterar han att att proportionen fattiga infödda minskat från 10% till 8%. Andelen fattiga invandrare har gått från 51/110=46.36% till 116/300=38.67%. Både andelen fattiga svenskar och fattiga invandrare har minskat, och således går allt att ”förklara” med en ökad andel invandrare.

Men när vi kollat under luckan på maskinen förstår vi att ingenting alls förklaras med proportionen invandrare. Sanningen är att politiken hade vinnare och förlorare, och förlorarna var koncentrerade till flyktinginvandrarna. Nettoeffekten var ökad fattigdom. Däremot minskade fattigdomen bland invandrare då kompositionen av den gruppen förändrades och den ökade fattigdomen bland flyktinginvandrarna doldes av den ökade proportionen arbetskraftsinvandrare. I Tinos förklaring skulle det implicit vara arbetskraftsinvandringen som ökat fattigdomen, men vi ser att den istället har haft effekten att minska fattigdomen.

Kan detta vara ett problem? Jag vet faktiskt inte vilket håll kompositionsförändringarna går i befolkningen. Visserligen har det invandrat många från Somalia vilket är ett land med bristande skolsystem och dylikt. Samtidigt vet vi att alltmedan tiden går så ökar antalet år alla nuvarande invandrare har varit i Sverige, vilket går att se som ett skifte från FI till AI gruppen. Det enda jag vet är att man inte har löst problemet genom att bara peka på att både invandrare och svenskar här lägre fattigdomsprevalens.

Vad är då lärdomen? Att förklaringsstyrka enbart bör appliceras på kausala variabler, och att disaggregering ner på invandrar/infödd-nivå inte identifierar effekten av invandring. Vill vi se huruvida barnfattigdomen har ökat på grund av invandringspolitiken kan vi inte korrigera för mängden invandrare, utan vi ska korrigera efter de riskfaktorer som finns i befolkningen och som beror på invandringspolitiken.
Eller snare: När man jobbar med Simpsons paradox

1. Tänk på vilken modell du har i bakhuvudet

2. Gör många numeriska exempel. Använd alltid papper och penna.

3. Var försiktig

Vi är helt enkelt väldigt dåliga i att förstå hur kausala effekter aggregeras till proportioner, vilket borde leda oss alla till försiktighet i debatter när vi pratar om dem.

p.s.

Jag rekommenderar boken  Causality av Judea Pearl, där det 6:e kapitel mycket förtjänstfullt går igenom Simpsons paradox från ett kausalt perspektiv, och diskuterar när man ska korrigera och när man inte ska göra det.

2 Responses to Simpsons paradox – om nödvändigheten av modeller

  1. Tino says:

    Jag uppskattar att du är analytisk och tar tid för seriös diskussion. Jag känner redan till regeln du beskskriver, men vi skiljer oss i flera underliggande antaganden:

    1. Att ta in invandrare är ett policyval. Även i ditt exempel styrs effekten i första hand av invandrings-policyn (inklusive tidigare års policy), inte ekonomisk policy, för utan invandring skulle den ekonomiska politiken haft noll effekt, då det bara påverkar flyktingar. Den förklaring du för fram (reform som försämrat för endast flyktingar) är en interaktionseffekt med värde noll utan den förklaring jag för fram (invandringspolitik). Mitt argument är att valet att ta emot många invandrare vilket av media/akademiker/politiker påstås vara bra för Sveriges ekonomi tvärtom orsakat högre barnfattigdom. Det har du inte motbevisat kausalt.

    2. Även med ditt räkneexempel kan den dominerande tesen bakom ökad barnfattigdom i Sverige fört fram av Socialdemokraterna, det vill säga *generella* försämringar av välfärden, avfärdas. ¾ av barn i Sverige är fortfarande etniska svenskar, och borde således påverkas av en generell försämring av välfärden.

    3. Det som återstår är i din tes är att *givet* att vi antar att antal invandrare i Sverige inte är en politisk val samt *givet* att anta existensen av en ekonomisk reform som endast påverkat flyktingar så kan barnfattigdomen fortfarande förklaras med din antagna ekonomiska policy. Men även en sådan isolerad ökning uppfattas annorlunda av väljare än generellt ökning av barnfattigdom. Invandrare har ju valt att flytta till Sverige, och har hursomhelst lägre fattigdom än sitt hemland.

    4. Din tes bygger vidare på att vi inte kan veta underliggande fördelning (varför kan vi inte det?) samt att det faktisk existerar en reform som endast ökat flyktingars fattigdom. Men jag diskuterar empirisk barnfattigdomen i Sverige idag och dess koppling till invandringspolitiken. I verkligheten existerar helt enkelt inte någon sådan reform som du *antagit*, det vill säga en som rejält ökar flyktingars fattigdom men ingen annans, vilket gör det ointressant för mig att lägga en massa tid på det.

  2. Pingback: Hanif och sysselsättningen | Vi Har Räknat På Det Här | viharraknatpadethar.se

Leave a comment