Sellun hinnan ennustaminen koneoppimisen avulla
Rintamäki, Tatu Markku Santeri (2022-06-07)
Rintamäki, Tatu Markku Santeri
07.06.2022
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe2022060743649
https://urn.fi/URN:NBN:fi-fe2022060743649
Tiivistelmä
Perinteisesti metsäteollisuudessa paperitehtaat ovat saaneet käyttämänsä sellun vieressä sijaitsevalta sellutehtaalta. Metsäteollisuudessa logististen kustannusten luoma taloudellinen nyrkkisääntö on, että metsävarannon tulee olla lähellä sellutehdasta, ja toisaalta taas paperi-tehtaan lähellä käyttäjää. Erityisesti 2000 luvulla paperin kysyntä on kasvanut kehittyvissä maissa (kuten Kiina), joissa taloudellisesti käytettävissä oleva metsävaranto on huonoa tai olematonta. Tämän vuoksi sellu on muuttunut vuosikymmenten kuluessa itsenäiseksi raaka-aineeksi, jolla käydään kauppaa yhtiöiden välillä. Viime vuosina on lisäksi tuotu markkinoille futuureja, joiden avulla sijoittaja tai yhtiö voi yrittää hyötyä taloudellisesti. Nämä tekijät ovat lisänneet motivaatiota sellun hinnan tulevaisuuden ennustamiselle.
Tietokoneiden kasvanut laskentateho, ja uudet algoritmit mahdollistavat kotitietokoneella tehtävän laskentatoimituksia, joihin ennen tarvittiin supertietokoneita. Kun puhutaan ennus-tamisesta, tekoäly ja koneoppivat algoritmit ovat olleet kuuma puheenaihe vuosia. Tässä työssä selvitettiin, miten koneoppivat mallit toimivat, niiden arviointikriteerejä ja mahdolli-nen hyöty regressioanalyysiin nähden ennustettaessa sellun markkinahintaa. Työssä käytetyt koneoppivat mallit perustuivat kolmeen eri menetelmään: päätöspuuhun, satunnaismetsään ja gradientti tehostamiseen. Mallien suoriutumista arvioidessa käytettiin ensisijaisesti ope-tus-, validointi- ja testivirhettä. Tämän ohella vertailtiin muuttujien merkityksellisyyttä eri menetelmissä.
Tutkimustuloksina saatiin, että koneoppivilla algoritmeilla on mahdollista ennustaa sellun hintaa, kuten regressioanalyysillä. Tässä tutkimuksessa menetelmistä satunnaismetsällä saa-tiin parhaat tulokset, mutta toisaalta tulosten ollessa lähellä toisiaan ja testiryhmän pieni, on yksiselitteistä voittajaa mahdoton julistaa. Toisaalta tämän tutkimuksen perusteella ei voida hylätä mitään käytetyistä menetelmistä jatkon kannalta. Tätä tutkimusta voidaan jatkaa tule-vaisuudessa usealla eri tavalla, esimerkiksi etsimällä parempia selittäviä muuttujia, optimoi-malla hyperparametreja, käyttämällä monimutkaisempia algoritmeja (neuroverkot), tai yleis-tää tutkimus koneoppimisen mahdollisuuksiin lyhyissä aikasarjoissa.
Tietokoneiden kasvanut laskentateho, ja uudet algoritmit mahdollistavat kotitietokoneella tehtävän laskentatoimituksia, joihin ennen tarvittiin supertietokoneita. Kun puhutaan ennus-tamisesta, tekoäly ja koneoppivat algoritmit ovat olleet kuuma puheenaihe vuosia. Tässä työssä selvitettiin, miten koneoppivat mallit toimivat, niiden arviointikriteerejä ja mahdolli-nen hyöty regressioanalyysiin nähden ennustettaessa sellun markkinahintaa. Työssä käytetyt koneoppivat mallit perustuivat kolmeen eri menetelmään: päätöspuuhun, satunnaismetsään ja gradientti tehostamiseen. Mallien suoriutumista arvioidessa käytettiin ensisijaisesti ope-tus-, validointi- ja testivirhettä. Tämän ohella vertailtiin muuttujien merkityksellisyyttä eri menetelmissä.
Tutkimustuloksina saatiin, että koneoppivilla algoritmeilla on mahdollista ennustaa sellun hintaa, kuten regressioanalyysillä. Tässä tutkimuksessa menetelmistä satunnaismetsällä saa-tiin parhaat tulokset, mutta toisaalta tulosten ollessa lähellä toisiaan ja testiryhmän pieni, on yksiselitteistä voittajaa mahdoton julistaa. Toisaalta tämän tutkimuksen perusteella ei voida hylätä mitään käytetyistä menetelmistä jatkon kannalta. Tätä tutkimusta voidaan jatkaa tule-vaisuudessa usealla eri tavalla, esimerkiksi etsimällä parempia selittäviä muuttujia, optimoi-malla hyperparametreja, käyttämällä monimutkaisempia algoritmeja (neuroverkot), tai yleis-tää tutkimus koneoppimisen mahdollisuuksiin lyhyissä aikasarjoissa.