Briefly in English. Analysis on Finnish crimes and sentences done with Power BI.
Päätin juhlistaa saavuttamaani ”Microsoft certified: Power BI Data Analyst Associate” -sertifikaattia rakentamalla pitkästä aikaa uuden Power BI analyysin pohjautuen avoimeen dataan. Päätin tällä kertaa perehtyä Tilastokeskuksen sivuilta saamiini ”Viranomaisen tietoon tulleet rikokset” ja ”Vankeustuomiot” aineistoihin vuosilta 2015-2020, joita vielä täydensin kuntakohtaisilla asukasluvuilla.
Itse interaktiivinen raportti artikkelin lopussa. Alla esimerkki sivu.
Tavoitteena oli hyödyntää joitakin uusia ominaisuuksia, joita opin valmistautuessani sertifikaattitestiin. Alla analysoin sekä itse aineistoa että joitakin hyödyntämiäni Power BI ominaisuuksia.
Analyysi koostuu seitsemästä eri sivusta. Aluksi käyn läpi viranomaisen tietoon tulleita rikoksia neljän sivun verran ja lopuksi käräjäoikeuden tuomioita kolmen sivun verran.
Jouduin itse tekemään rikosnimikkeiden ryhmittelyn DAX-funktion avulla ylempiin luokkiin luettavuuden parantamiseksi vaikka itse ryhmittely löytyykin Tilastokeskuksen sivuilta. Käytin tähän näppärää SWITCH-funktiota ja IN-operaatiota. Ohessa lyhyt esimerkki:
Rikosryhmä = SWITCH(TRUE(), 'Rikokset kunnittain'[Rikosnimike] In {"Virkamiehen (väkivaltainen) vastustaminen 16:1-2", "Haitanteko virkamiehelle 16:2", "Perätön lausuma tuomioistuimessa 15:1, 3-4", "Perätön lausuma viranomaismenettelyssä 15:2", "Väärän henkilötiedon antaminen 16:5", "Muut rikokset oikeudenkäyttöä, viranomaisia ja yleistä järjestystä vastaan 15:5-11,16:4,6-17,17:1-22,34a"}, "Rikokset oikeudenkäyttöä, viranomaisia ja yleistä järjestystä vastaan",
'Rikokset kunnittain'[Rikosnimike] In {"Liikenneturvallisuuden vaarantaminen, liikennepako tieliikenteessä 23:1,11", "Törkeä liikenneturvallisuuden vaarantaminen 23:2", "Rattijuopumus 23:3", "Törkeä rattijuopumus 23:4", "Vesi-, ilma- tai junaliikennejuopumus 23:5-7", "Kulkuneuvon luovuttaminen juopuneelle 23:8", "Liikennejuopumus moottorittomalla ajoneuvolla 23:9", "Kulkuneuvon kuljettaminen oikeudetta 23:10"}, "Liikennerikokset", "Muut")
Rikokset yht. -sivu: Ensimmäiselle sivulla laitoin vain kaksi graafia – ”Line and stacked column chart” sekä ”Donut chart”. ”Muita lakeja ja asetuksia vastaan tehdyt rikokset” on ollut selkeästi suurin ryhmä (43 %) läpi vuosien, mutta 2020 näiden rikosten määrä on romahtanut. Tähän ryhmään kuuluu liikennerikkomukset eli koronavirus ja liikkumisen väheneminen selittää hyvin tätä muutosta. Itse asiassa koko rikosnimike kuuluu ”Liikennerikkomus, tieliikenteen sosiaalilainsäädännön rikkominen, ajoneuvorikkomus TLL 103, 105a”. Olisi mielenkiintoista tietää milloin syyllistyy tieliikenteen sosiaalilainsäädännön rikkomiseen?
”Muut rikoslakirikokset” ovat melkein tuplaantuneet tarkasteluajanjaksolla ja ”Omaisuusrikokset” ovat tasaisen laskun jälkeen kääntyneet 2020 selkeään nousuun. ”Henkeen ja terveyteen kohdistuneet rikokset” on pysynyt samansuuruisena.
Rikokset puu -sivu: Tällä sivulla käytin erittäin havainnollista ”Decomposition tree” graafia. Tätä varten minun piti ensin rakentaa hierarkia Power BI:ssa. Ensin valitsin luomani ”Rikosryhmä” attribuutin ja hiiren oikealla ”Create hierarchy”. Tämän jälkeen valitsin ”Rikosnimike” attribuutin, jonka liitin kyseiseen hierarkiaan. Klikkaamalla ylempää ryhmää, graafi avaa kyseisen ryhmän rikosnimikkeet ja niiden määrät. Oikeassa yläkulmassa on vuosikohtainen ”Slicer”-graaffi, jonka avulla voi tarkastella yksittäisiä tai useampia vuosia kerralla.
Toinen sivun graaffeista on ”Stacked area chart”. Siinä käytetään vuosia x-akselilla, joten slicerin vaikutus piti poistaa tältä graafilta. Se onnistui valitsemalla slicerin, Format > Edit interactions ja poistamalla halutusta graafista vaikutuksen. Tästä graafista on poistettu liikennerikokset, jotta muiden rikosten kehitys näkyisi selkeämmin.
Puu graafia tarkastelemalla näemme, että Omaisuusrikoksien suurimmat nimikkeet ovat Näpistys ja Varkaus. Varkaudet kasvoivat 2019-2020 60 790 -> 68 457. Muut rikoslakirikokset -ryhmän 2015-2020 välillä selittää erityisesti Yksityisyyden, rauhan ja kunnian loukkaaminen -nimikkeen kasvu – 9 342 -> 31 204 (234 %). Toinen isosti kasvanut nimike on Huumausaineen käyttörikokset – 15 181 -> 23 778 (57 %).
Selvitetyt-sivu: Sivulla tarkatellaan ensin ”Pie chart” muodossa kaikkia rikosnimikkeitä pl. liikennerikkeet ja rikokset 2015-2020. Näpistys on kaikkein yleisin nimike (18,6 %), Varkaus seuraavana (18,5 %) ja kolmantena Vahingonteko (9,7 %).
Seuraavassa piirakkakuvassa on selvitettyjen rikosten osuudet. Eniten selvitettyjä rikoksia liittyy Näpistyksiin (19,9 %), seuraavana Huumausaineen käyttörikos (10,1 %) ja kolmantena Petos (9,8 %).
Kolmannessa, pylväsdiagrammissa, tarkastellaan eri rikoksien selvitysprosentteja. Rakensin selvitysprosentin lisäämällä mittarin (measure) tietomalliin ja mittariin DAX:lla rakennetun laskentakaavan. Ehkä yksittäisenä huomiona luvuista nostan esiin varkauksien pienen selvitysprosentin (14,6 %). Murhista selvitetään 89,7 % ja tapoista selvitetään 80,8 %.
Kunta-sivu: Kunta sivulle keräsin kuntakohtaista tietoa. Laskin jokaiselle kunnalle rikossuhdeluvun DAX-kaavalla, jossa suhteutin rikosten määrän asukaslukuun. Tästäkin poistin liikennerikokset. Karttaa ei saanut toimimaan pelkällä kunnan nimellä. Minun piti lisätä yksi sarake, johon kunnan arvon lisättiin ”Finland” eli esim. ”Helsinki, Finland”. Tämä onnistui helposti ”Column From Examples” toiminnon avulla.
Helsinki näyttäisi olevan kaikkien (ja jokaisen) rikosten osalta selkeä johtotähti, jos tätä termiä voi tässä yhteydessä käyttää. Perässä tulevat Vantaa, Tampere, Espoo, Turku ja Oulu eli yleisesti ottaen suuret kaupungit. Karttaa zoomaamalla voi tarkatella lähemmin tiettyjä Suomen osia.
Oikean puoleisesta valikosta voi valita yksittäisiä tai useita (ctrl-näppäimen avulla) rikosnimikkeitä tarkasteluun. Esimerkiksi valitsemalla Murha ja Tappo, suurten kaupunkien seuraan nousevat Sastamala, Kotka ja Kuopio.
Tälle sivulle lisäsin myös näppärän uudehkon ”Play Axis” graafin vasempaan yläkulmaan, jonka avulla voi tarkastella muiden graaffien muutoksia esim. vuoden mukaan painamalla Play-näppäintä. Lukujen vaihtumisnopeuteen pystyy vaikuttamaan. Jos tarkastelussa kymmeniä vuosia, kannattaa vauhdin olla nopea, mutta minun tapauksessa vauhti on aika hidas. Esityksen voi laittaa myös Pauselle, jos silmiin osuu jotain mielenkiintoista. Play toimii paremmin, kun valitsee vain yhden tai pari rikosnimikettä.
Tuomiot yht -sivu: Seuraavaksi siirrytäänkin käräjäoikeuden tuomioihin. Ensimmäisellä sivulla tarkastelen kaikkia vankeustuomioita ml. ehdolliset, yhdyskuntapalvelut ja valvontatuomiot. Muilla sivuilla tarkastelen pääasiassa ehdottomaan tuomioon johtaneita rikoksia. Pylväs diagrammin alapuolle kokeilin ”Smart narrative”-graafin toimivuutta. Power BI itse tekee huomioita datan pohjalta. Huomiot ovat englanniksi, mutta nuo voisi itse kääntää Suomeksi.
Tuomiot puu -sivu: Tällä sivulla tarkastelen sekä ehdolliseen että ehdottomaan rangaistukseen johtaneita rikoksia puurakenteen avulla. Huomaa vasemman yläkulman vuosivalikko. Vuonna 2020 selkeästi eniten ehdollisia tuomioita annetaan Liikennerikoksista ja syynä useimmiten Törkeä rattijuopumus. Ehdottomien tuomioiden osalta Omaisuusrikoksia melkein yhtä paljon kuin Liikennerikoksia. Kuitenkin yksittäinen yleisin nimike oli Huumausainerikokset (737). Koko 2015-2020 väliä tarkasteltaessa yleisimmäksi rikoksesti nousee niukasta Varkaus.
Tuomiot viipaleet -sivu: Tälle sivulle lisäsin monia slicereita/filttereitä, jotta käyttäjät voisivat omatoimisesti tarkastella tietoja mahdollisimman monipuolisesti. Vuosi ja ikäryhmät ovat tavallissia slicereita. Lisäksi halusin kokeilla Power BI:n bookmark ja button toiminnallisuutta. Loin ensin omat kirjanmerkit eri itse määrittelemilleni vankeusaikakategorioille. Tämän jälkeen liitin jokaisen näistä kirjanmerkeistä omaan nappiin, jotka sijoitin raportin yläosaan. Graafeina käytin vaakapylväsdiagrammia sekä puukarttaa eli Treemap:ia.
Oikein näppärä toiminnallisuus muuten, mutta toimii vähän huonosti silloin, kun sivulla on muitakin slicereita/filttereitä. Kirjanmerkki nimittäin tallentaa myöskin nuo slicerien valinnat eli nappia painaessa palataan aina valintoihin vuosi 2020 ja kaikki ikäluokat.
Tarkastelin kovimpia tuomioita tarkemmin vuonna 2020. Vankeus 3-6 v. kategoriassa yleisin ryhmä on ”Henkeen ja terveyteen kohdistuneet rikokset”, jonka yleisin nimike on ”Tappo, murha, surma” (80 kpl / 22,7 %). Yleisin yksittäinen nimike on kuitenkin ”Huumausainerikokset” (99 kpl / 28,1 %). ”Ryöstö, kiristys” oli kolmanneksi yleisin nimike (52 kpl / 14,8 %). Vankeus Yli 6v. kategoriassa yleisin nimike ”Tappo, murha, surma” (55 kpl / 44,8 %), toiseksi yleisin ”Huumausainerikokset” (50 kpl / 43,1 %).
Sitten tutkin alle 30 vuotiaiden tekemiä rikoksia. Yleisin kategoria on Omaisuusrikokset, mutta yleisimmät nimikkeet ovat ”Huumausainerikos” (15,6 %), ”Varkaus” (11,2 %) ja ”Rattijuopumus” (9,4 %). Jakauma aika samanlainen kuin koko aineistossa. Sama koskee myös kovempien tuomioiden kategorioita.
Tarkasteltaessa vielä kaikkia kuutta vuotta yhdessä tulokset aika samansuuntaisia kuin 2020, mutta Huumausainerikokset nousevat yleisimmäksi nimikkeeksi 46,6 %:n osuudella tarkasteltaessa yli 6 v. tuomioissa.
Loppuun vielä oma yhteiskunnallinen / poliittinen kannanottoni. Huumausainerikokset erottuvat selkeästi sekä tehtyjen rikosten että vankeustuomioiden osalta. Tästä voi periaatteessa tehdä kaksi täysin vastakkaista johtopäätelmää – huumausaineiden vastaiseen taisteluun on laitettava lisää resursseja tai että sota huumeita vastaan on hävitty. Itse kallistun jälkimmäiselle kannalle ja jotain muuta olisi keksittävä.
Richard Nixon julisti 51 vuotta sitten, että huumeet ovat ”Yhteiskunnan vihollinen numero yksi”. Jos se ei ollut sitä silloin, niin nyt ainakin rikos ja vankeustilastojen perusteella siitä ainakin on tehty totta. Tätä sotaan käydään meidän omia kansalaisia vastaan. Resursseja heitetään hirveästi hukkaan sekä valvontaan, oikeuskäsittelyihin, vankiloihin (yksi vankila vrk maksaa yli 200 € yhteiskunnalle) että syrjäyttämällä ihmisiä. 50 vuotta huumeiden kieltolain julistamisen jälkeen huumausaineen käyttörikokset ovat kasvaneet 57 % viimeisen kuuden vuoden aikana. Pois lukien liikennerikokset, huumausaineen käyttörikokset vastaavat 10 % (!) kaikista viranomaisten selvittämistä rikoksista. Huumausainerikokset ovat yleisin nimike vankeustuomion saanneiden joukossa vuonna 2020. Myös pisimpien vankeustuomioiden kategorioissa (3-6 v. sekä yli 6 v.) huumausainerikokset ovat yleisin nimike.
Alkoholin kieltolakia kokeiltiin ja se ei toiminut. Päädyttiin kontrolloituun myyntiin. Jotain samaa pitäisi kehittää huumeiden osalta. Vielä muistutus, huume-sana tarkoittaa laitonta päihdettä eikä mitään muuta. Eli laki määrittelee mikä on huume ja mikä päihde eikä esim. jokin kemiallinen koostumus (vrt. englanniksi drugs (lääkkeet) ja illegal drugs (huumeet)). Näitä laittomia päihteitä on hyvin monenlaisia ja niitä on vähän tyhmä kategorisoida yhden sanan alle.
Olisi mukava kuulla teidänkin huomioita datasta sekä mahdollisia johtopäätöksiä kommenteissa.