Har statistik inga fördomar?

2017-01-17

I papperstidningen använde Dagens Nyheters ledarredaktion 17 januari 2017 rubriken "Statistik är ingen fördom". På nätet blev rubriken istället "Rätt att granska brottslingars nationalitet". Den konkreta frågan som diskuteras är huruvida Brottsförebyggande rådet (Brå) bör samla in statistik om brottslingars ursprungsland eller inte. Principfrågan handlar om vilken statistik som skall anses relevant när en viss samhällsfråga diskuteras. Kan själva valet av statistik styra vilka slutsatser som dras politiskt?

Dagens Nyheters ledare skriver:

Själva sakfrågan då: Är det rätt eller fel att låta Brå göra analyser där gärningsmäns födelseland är en av de faktorer som tas med? Naturligtvis är det rätt. Statistik är sällan fördomsfull. Vill vi begränsa kriminaliteten är en början att samla in så mycket fakta som möjligt om brotten, och dit hör vilken bakgrund den har som begår dem.

Notera att ordet "sällan" används. Det kan alltså trots allt finnas fall då det är fördomsfullt? "Så mycket fakta som möjligt" samlas in, tycker DN. Nja, knappast. Det finns en gräns för hur mycket fakta man orkar samla in. Det finns fakta som man skulle kunna samla, men som ingen skulle betrakta som relevant. Till exempel hur många fåglar som fanns i närheten av brottsplatsen. Eller färgen på husen intill. Bara för att ta ett par ytterst triviala exempel.

När man som forskare skall nalkas en viss fråga så måste man ha något slags hypotes eller idé om vad som är viktigt eller inte för det vetenskapliga problem man vill granska. Det är egentligen ganska självklart. Om vi vill förstå bakgrunden till brottslighet i samhället så är det inte många som tror det vore en bra idé att titta på om skostorlek spelar roll. Det beror på att vi redan har vissa idéer om vilka faktorer som är intressanta och skostorlek är inte en av dom.

Men betyder inte detta att forskare kan välja och vraka bland fakta och bevisa exakt vad tusan som helst? Nej, inte om man vill behålla den intellektuella hedern.

För det första måste man ha en rimlig hypotes. Det är där idén om statistik för skostorlek och brottsbenägenhet faller: det finns ingen rimlig hypotes. En hypotes kan komma från så kallat sunt förnuft, med vilket man ofta menar gammal forskning som numera anses självklar. Den kan också komma från en oväntad observation. Vem vet, fängelseförvaltningen kanske har upptäckt att ovanligt många skor i större storlekar måste köpas in?

För det andra måste forskaren fundera på att identifiera fakta eller typer av statistik som är oberoende av varandra, men som kan utgöra en slags rimlighetskontroll gentemot varandra. Om man nu skulle samla in skostorlek, då kanske man bör relatera detta till kön hos brottslingen, eftersom vi på rimliga grunder kan anta att skostorlek korrelerar med kön.

För det tredje måste forskare se sanningen i vitögat. Ibland ger inte statistiken det svar man trodde. Favorithypotesen tålde inte fakta. Om man samlat in fakta om skostorlek och brottslighet, och det faktiskt visar sig inte finnas något statistiskt signifikant samband, ja, då måste hypotesen ges upp.

Det finns en fundamental aspekt av varje resonemang om statistik och samband, och det är att forskaren och forskarsamhället kritiskt måste granska huruvida de statistiska samband man ser i själva verket kan ha andra orsaker än de man antar. Här ligger en av de farligaste fällorna för forskare. Ibland ser man mycket tydliga samband som tycks bevisa ens tes. Men det kan visa sig att korrelationen hade helt andra anledningar. Sådant kan vara genuint svårt att reda ut. Om invandrare förekommer oftare i brottssammanhang, beror det på att de är mer benägna att begå brott, eller beror det på att de oftare bor i brottsdrabbade områden? Vad är orsak och vad är verkan? Det är ofta svårt nog att reda ut i naturvetenskap, och i ännu högre grad i samhällsvetenskap.

I fallet om invandring och brott så måste man till exempel helt uppenbart fundera på sådana saker som hur fördelningen mellan invandrare och infödda ser ut vad gäller socialklass, inkomst, trångboddhet, skolgång, åldersfördelning, språkkunskaper, familjeförhållanden, och en massa andra faktorer. Ta åldersfördelning till exempel. Om man bara räknar antalet begångna brott i en grupp (invandrare) och jämför med en annan (infödda) så begår man ett rejält fel om man inte tar hänsyn till skillnaden i andelen unga personer i dessa grupper. Vi vet att unga är mer brottsliga än äldre. Om då andelen unga är större bland invandrare än hos infödda, så borde rimligen andelen brottslingar bland invandrare vara större, utan att det i sig säger något alls om huruvida invandring har med brottslighet att göra. För den slutsatsen krävs mer.

Allt detta är självklart vetenskapliga frågor som måste stötas och blötas. Det som absolut inte är självklart är att politiker skall ha åsikter om vilken statistik som skall samlas in. Jag finner det märkligt, och oroväckande, att politiker alltså har sådan makt över Brå att de ska ha åsikter om detta. Det är inte demokratisk politik. Det är antivetenskaplig klåfingrighet.

Samtidigt ligger det ett stort ansvar på Brå och andra forskare. Det uppdrag som de har givits på demokratiskt väg är att utröna vilka faktorer som är betydelsefulla för brott och brottsförebyggande. Då ska Brå göra just detta. Om det finns rimliga skäl att tro att invandring genom utanförskap, diskriminering, eller andra mekanismer, påverkar brottsbenägenhet, då har Brå och andra forskare helt enkelt en vetenskaplig skyldighet att ha koll på det. Forskare ska helt enkelt inte bry sig om huruvida en viss analys eller statistik "gynnar" Sverigedemokraterna eller några andra.

Statistik är nödvändig, men då sådan som forskare finner det fruktbart att samla in. Och tolka sedan statistiken med ett kritiskt öga. Finns det dolda samband som vi inte ännu förstått? Är den statistik vi har missvisande? Bör andra uppgifter samlas in?

Svaret på frågan om statistik har fördomar är: Ja, valet av vilken statistik man samlar in bygger i viss mening på fördomar, och måste så göra. Det finns inget som heter "samla in all data". Men i analysen av vad statistiken säger måste man kritiskt granska om den faktiskt stödjer de hypoteser man har. Finns det andra bättre sätt att förklara de samband man ser?

Fördomar har vi alla. Det gäller att kritiskt granska dom utifrån de fakta vi har eller kan skaffa.