Forecasting Finnish stock market using machine learning methods
Pysyvä osoite
Kuvaus
Tutkielmassa tarkastellaan Helsingin pörssin osakeindeksin OMXH25 ennustettavuutta koneoppimismalleilla. Useimmat koneoppimismallit on kehitetty vuosikymmeniä sitten, mutta viime vuosikymmenten jatkuva kehitys tietokoneiden laskentatehossa on mahdollistanut näiden mallien laajemman hyödynnettävyyden. Tutkielmassa käytetyt koneoppimismallit ovat k-nearest neighbors, random forest classifier, gradient boosting classifier, support vector machine ja artificial neural network.
Tutkielmassa ennustetaan OMXH25 osakeindeksin seuraavan päivän hinnan kehitystä. Päivittäiset hinnan kehitykset on jaettu kolmeen luokkaan, jossa alimmassa luokassa ovat suurimmat negatiiviset muutokset, ylimmässä luokassa ovat suurimmat positiiviset muutokset ja keskimmäisessä luokassa ovat mediaanin ympärillä olevat hinnan kehitykset. Luokkajaottelun myötä ennustamme seuraavan päivän hinnan kehityksen luokkaa, hinnan tarkan arvon sijasta.
Tutkielmassa kerättiin 8014 päivittäistä havaintoa vuodesta 1991 vuoteen 2022. Muuttujiaovat eri maiden pörssien hinnat, raaka-aine markkinoiden hinnat, korkotaso sekä Helsingin pörssin hinnasta laskettuja teknisiä indikaattoreita. Havainnot jaettiin kahteen joukkoon, joista toista käytettiin koneoppimismallien harjoittamiseen ja toista koneoppimismallien testaukseen. Lisäksi mallien ennusteiden avulla luodaan kaupankäyntistrategia ja strategiaan perustuva simulaatio, jonka avulla voidaan mitata mallien kykyä ennustaa osakemarkkinoiden kehitystä.
Kaikki tutkielmassa käytetyt koneoppimismallit pystyivät ennustamaan Helsingin pörssin OMXH25 osakeindeksin seuraavan päivän tuottoja. Koneoppimismallien ennusteiden perusteella luotu kaupankäyntistrategia tuotti paremmin kuin jatkuvaan markkinoilla oloon perustuva vertailuindeksi. Parhaiten tuottava koneoppimismalli oli gradient boosting classifier.