R tilastollisen laskenta sovelluksen käyttö Liigan tuloksien ennustamiseen

R logoLiiga

Seuraavaksi päätin syventää R tilastollisen laskentasovelluksen osaamistani. R:ää voi hyödyntää lukemattomilla eri tavoilla tilastollisen aineiston tutkimiseen sekä myöskin ennustamiseen. R soveltuu erinomaisesti käytettäväksi yhdessä PowerBI:n kanssa datojen visualisointiin sekä paremman ymmärryksen tavoitteluun.

R:n toiminnallisuus on jo nyt vahvasti integroitu PowerBI:n sisään, mutta valitettavasti nuo visualisoinnit eivät toimi julkisesti jaettavilla PowerBI pohjilla. Näin päätinkin tehdä jotain enemmän koodauspohjaista kuin visualisointipohjaista, koska graaffeja ei pysty kuitenkaan jakamaan kuin staattisina kuvina. Jatka lukemista “R tilastollisen laskenta sovelluksen käyttö Liigan tuloksien ennustamiseen”

Uudet moottoripyörät 2017

Latasin Trafin huikean yli viiden miljoonan rivin Ajoneuvodata-aineiston. Valitsin analyysin pohjaksi uusien moottoripyörien rekisteröinnit 2017. Klikkaa ohesta analyysiin: Uudet mpt 2017. Asiaan liittyi myös henkilökohtainen kiinnostus, koska tuli hankittua uusi BMW RnineT Scrambler pyörä kesällä. Halusin tietää monta niitä on oikeastaan myyty. Ei montaa eli 5 kpl kesäkuun loppuun mennessä. Yksi Helsinkiin, kolme Vantaalle. Omani ei ole vielä noissa luvuissa mukana. Eli jos näet ko. pyörän jossain päin pk-seudulla ja tankissa numero 7, niin se olen minä :). P.S. Päivitetty 1-9 2017 luvuilla. Seuraava päivitys 1-6 2018 luvuilla, koska talvella niin moni pyörä poissa rekisteristä.

AWS Glue – tiedon integrointia pilvessä

AWS Glue

 

Alustus

Latasin Tilastokeskuksen sivuilta massiivisen ajoneuvodata-aineiston, joka zipattuna oli 250 MB:tä ja purettuna 850 MB:n csv-tiedosto. Ajattelin, että tässähän voisi olla hyvä aineisto AWS Gluen testaamiseen, kun ei koko aineistoa viitsi lukea PowerBI:n sisään.

AWS Glue:han on Amazon Web Servicen kehittämä pilvipohjainen ETL eli tiedon integroinnin sovellus. Näytti ainakin hienolta noin tasan vuosi sitten, kun osallistuin Las Vegasissa AWS re:Invent tapahtumaan, jossa se julkaistiin. Yleiseen jakeluun (GA) se tuli nyt elokuussa 2017.

Jatka lukemista “AWS Glue – tiedon integrointia pilvessä”