Sider med ekstra påfyll

fredag 2. april 2021

Aldersfordeling- og mengde i Norges fylker (i et mosaikk-diagram)

Klikk for å se (hakket) større.

Når vi sammenligner forskjellige grupper, steder eller hva det måtte være statistisk, så er det gjerne en av to ting vi snakker om. Bor det flere eldre i et fylke som Nordland enn i Oslo, eller er det en større andel eldre i Nordland enn i Oslo.

Jeg er glad i andeler, som er en form for relativ verdi. Andelen eldre er stor eller liten i forhold til (relativt til) den totale befolkningen i fylket. Antall eldre er ett, absolutt tall. Det tallet forandres ikke noe av hvor stor resten av befolkningen er.

Hvorfor babler jeg om dette? Jo, fordi man stort sett må velge å vise enten relative eller absolutte verdier når man lager en graf om noe.

Med såkalte mosaikk-diagram kan man imidlertid vise begge deler!

Mosaikk-diagram, er ikke så ulike stablete søylediagram som summerer til 100 prosent. I slike søylediagram er vi vant til at høyden på søylene og søylebitene angir en verdi. I et mosaikk-diagram kan i tillegg bredden på søylene bety noe.

I tilfellet mitt kan det være litt forvirrende å snakke om bredde og høyde, for jeg har lagt diagrammet mitt på siden, så du skal slippe å snu på hodet for å lese fylkesnavnene. I mitt tilfelle viser bredden på søylebiten hvor stor andel den aldersgruppen utgjør av befolkningen i hvert fylke. I Oslo er søylebiten for voksne (20-64 år) bredere enn i Trøndelag fordi en større andel av befolkningen i Oslo (66,3 %) er voksne enn i Trøndelag (59 %). 

I tillegg viser høyden på søylene hvor  mange som bor i hvert fylke, uavhengig av aldersfordelingen. Høydeforskjellen mellom søylene til Viken og Vestland viser for eksempel at dobbelt så mange bor i Viken som i Vestland. Dette gjør at arealet på senior-rektangelen angir hvor mange eldre som bor i hvert fylke.

Vi kan for eksempel se nå at hvis du møter på 100 tilfeldige mennesker på i Innlandet, så er det mer sannsynlig at du møter på en over 65 år enn hvis du møter på 100 tilfeldige mennesker i Oslo. Rett og slett fordi en større andel av befolkningen i Nordland er 65 år og eldre enn i Oslo.

Men, vi kan også se at  det bor flere eldre mennesker i Viken enn i Nordland, selv om prosentandelen er lavere, rett og slett fordi det bor mye mer folk i Viken i utgangspunktet. Generelt, legg merke til hvor mye høyere Viken er enn alle andre fylker ...

Et par siste ting om valg i denne grafen. Jeg valgte at andelen eldre skulle stå i sentrum. Derfor rangerte jeg alle fylkene etter andelen eldre. I tillegg ga jeg denne aldersgruppen en mye sterkere farge enn de andre aldersgruppene. Gulaktige farger er ekstremt effektive til å fremheve noe fordi de kan være både lyse og sterke (mette/saturated) samtidig. Samtidig knotet jeg en del med fargehjulet til Adobe for å finne dempede farger som samtidig fungerer bra med denne gulfargen. Jeg valgte også å ikke angi verdier for hvor mange som faktisk bor i de forskjellige regionene, rett og slett fordi jeg ikke vil oversvømme grafen med altfor mange detaljer.

Når det gjelder arbeidsgangen, så lagde jeg først grafen i statistikkprogrammet R, hvor jeg også lastet ned statistikken fra SSB. Koden kan du se under. Deretter eksporterte jeg en svg-fil til Inkscape – som er et veldig habilt gratisalternativ til Adobe Illustrator – og gjorde en god del estetisk finpuss der. Svg-fil er viktig, for det betyr at alle enkeltelementene i grafen er redigerbare vektorer og kan flyttes og endres på i Inkscape. Jeg kunne nok tatt meg av mye mer av den estetiske finpussen i R, men var litt gøy å bare knote i Inkscape. Lenge siden jeg har gjort den type grafisk arbeid.