Azure Machine Learning retrain, running R scripts with Power BI and some DAX

This time I decided to write my blog in English, because this is a little bit deep s**t. I’m not describing how I created my machine learning project for predicting ice hockey results, because I have written about that in previous blogs, but I’m describing how I semi-automated the retraining process, which has to be done after every round.

First I needed those results and statistics from played games. I have described that process over here. In my training data I duplicate every game – one row for home team and one row for away team.

Jatka lukemista “Azure Machine Learning retrain, running R scripts with Power BI and some DAX”

Liigan vedonlyöntikertoimia Azure Machine Learning:in avulla

Nyt olen testaillut eri vedonlyöntimalleja marraskuusta lähtien ja uskallan julkaista jotain tuloksia. Itse asiassa pyöritin kolmea eri mallia – Dixon & Coyles -mallia (tämä on ilmeisen suosittu malli ainakin fudisvedonlyönnissä), joka pohjautui tehtyihin maaleihin, neuroverkkomallia, joka pohjatui laskennallisiin maaleihin (ottaa huomioon maalien, laukauksien ja aloituksien määrän) sekä neuroverkkomallia, joka perustui puhtaasti voitto/tasapeli/tappio tietoon eli edellisten pelien maalimäärää ei huomioitu. Lisäksi hetken aikaa pyöritin edellisten pelien tehtyihin maalimääriin pohjautuvaa neuroverkkomallia, mutta tuo laskennallisiin maaleihin pohjautuva malli vaikutti paremmalta.

Jatka lukemista “Liigan vedonlyöntikertoimia Azure Machine Learning:in avulla”

Uudet autot 1-9 2017

Uudet autot

Päätin paketoida aikaisemmat analyysini uusiin kuoriin eli hyödynsin Trafin dataa uusien autojen erilaiseen analysointiin sekä joulukuun myyntimäärien ennustamiseen. Tällä kertaa en kuvaa teknistä suoritusta ollenkaan, koska samat asiat on kuvattu jo aiemmissa blogeissa.

Itse analyysiin pääset klikkaamalla tästä. Eli jos kiinnostaa miten markkinat jakautuvat hybridien tai ruumisautojen osalta, niin nyt saat vastauksen näihin askarruttaviin kysymyksiin! Jatka lukemista “Uudet autot 1-9 2017”

Koneoppimista Azure Machine Learningin avulla

Päätin kokeilla miten Microsoft Azure Machine Learning (ML) palvelu toimii pilvessä. Ja hyvinhän se toimi! Valitsin dataksi jo aikaisemmin hyödyntämäni Helsingin pyöräilijämäärät -aineiston, joka kattoi 1.1.2014-31.3.2017 välisen ajan. Päätin ennustaa Baanan pyöräilijämääriä päivämäärä ja tuntitasolla. Houkuttelevaa olisi ollut lisätä säätietoja ennustamiseen, mutta en tässä yhteydessä jaksanut sitä urakkaa tehdä, vaikka data sinällään olisi saatavilla ja olisi ehdottomasti parantanut ennustemallin luotettavuutta.

score 1

Jatka lukemista “Koneoppimista Azure Machine Learningin avulla”

Power BI – tietolähdevirheiden käsittely Power Queryssa (M kieli)

Päätin jatkojalostaa Liiga-dataani aloitusdatalla, koska erään blogin mukaan aloituksien määrällä on positiivinen korrelaatio maalimääriin. Käytin taas web scraping menetelmää tietojen hankintaan, mutta sitten iski ongelma. Aloitustiedot eivät olleet aina samassa taulukossa. Nollapelien osalta taulukoita oli nettisivulla vähemmän. Jatka lukemista “Power BI – tietolähdevirheiden käsittely Power Queryssa (M kieli)”

Analyysi Liigan kauden 2017-18 laukauksien ja maalien suhteesta

Liiga etusivu

Tällä kertaa ajattelin analysoida vähän tarkemmin jääkiekkoliigan maalien ja laukauksien suhdetta, koska joka tapauksessa tarvitsin noita laukaustilastoja ennustavan analytiikkamallin kehittämiseen. Analyysiin käyttämäni datan poimintaa kuvailin jo edellisessä blogissani.  Jatka lukemista “Analyysi Liigan kauden 2017-18 laukauksien ja maalien suhteesta”

Web scraping with Power BI

Based on my last blog I got an idea to investigate could I automate extraction of data from similar web sites with Power BI. I doing this blog in English, because it’s a little bit more technical.

As a starter I decided to automate extraction of Liiga results done in previous blog when I realized it’s possible. Earlier I copied data from web site to Excel, from where I downloaded data into Power BI. Then I realized I could do direct extraction from web site with Power BI.

From Power BI you can find Web Source.websource

Jatka lukemista “Web scraping with Power BI”

R tilastollisen laskenta sovelluksen käyttö Liigan tuloksien ennustamiseen

R logoLiiga

Seuraavaksi päätin syventää R tilastollisen laskentasovelluksen osaamistani. R:ää voi hyödyntää lukemattomilla eri tavoilla tilastollisen aineiston tutkimiseen sekä myöskin ennustamiseen. R soveltuu erinomaisesti käytettäväksi yhdessä PowerBI:n kanssa datojen visualisointiin sekä paremman ymmärryksen tavoitteluun.

R:n toiminnallisuus on jo nyt vahvasti integroitu PowerBI:n sisään, mutta valitettavasti nuo visualisoinnit eivät toimi julkisesti jaettavilla PowerBI pohjilla. Näin päätinkin tehdä jotain enemmän koodauspohjaista kuin visualisointipohjaista, koska graaffeja ei pysty kuitenkaan jakamaan kuin staattisina kuvina. Jatka lukemista “R tilastollisen laskenta sovelluksen käyttö Liigan tuloksien ennustamiseen”