Vertaileva tutkimus konkurssin ennustamismenetelmistä
Lindström, Joni (2016)
Kuvaus
Opinnäytetyö kokotekstinä PDF-muodossa.
Tiivistelmä
Konkurssi on prosessina raskas ja se aiheuttaa mittavia menetyksiä yrityksen kaikille sidosryhmille. Konkurssin ennustaminen on ollut akateemisesti suosittu tutkimussaihe 1960-luvulta lähtien. Ensimmäiset tutkimukset olivat yksinkertaisia yhden tai useamman tunnusluvun analyyseja. Myöhemmin myös monimutkaisempia tilastollisia menetelmiä on otettu käyttöön. Tästä huolimatta ei ole löydetty laajasti hyväksyttyä mallia, jonka ennustamiskyky olisi parempi kuin perinteiset monen muuttujan menetelmät.
Tutkimuksen tarkoituksena on selvittää, voidaanko eri ennustamismallien välillä löytää tilastollisesti merkitseviä eroja. Aineistona ovat kaikki vuosina 2009 – 2014 konkurssiin asetetut suomalaisyrityksiä. Tutkimuksessa on verrattu seitsemän eri mallin ennustamiskykyä kahdella eri ennustamiskyvyn arvioinnilla. Vertailu on suoritettu t-testillä. Peruste tutkimukselle on algoritmien parantuminen sekä tietokoneiden laskentatehon nopeutuminen. On mahdollista, että 1960-luvun rajoitteisiin pohjautuneet ennustamismenetelmät eivät enää nykyisin ole kaikista luotettavimpia.
Mallien välillä löytyi absoluuttisia eroja, jotka olivat monesti tilastollisesti merkitseviä. Parhaiten menestyivät uudet koneoppimista hyväksikäyttävät menetelmät sekä neuroverkot ja osittain päätöspuut. Perinteiset erotteluanalyysit ja regressioanalyysit menestyivät kautta linja heikommin. Tämä antaa viitteitä siitä, että uusien menetelmien käyttöönotto voisi olla perusteltua. Lisätutkimuksille on tarvetta, jotta voidaan varmistua, etteivät tulokset johdu monimutkaisempien menetelmien ylisovittamisesta käytössä olleeseen aineistoon.
Tutkimuksen tarkoituksena on selvittää, voidaanko eri ennustamismallien välillä löytää tilastollisesti merkitseviä eroja. Aineistona ovat kaikki vuosina 2009 – 2014 konkurssiin asetetut suomalaisyrityksiä. Tutkimuksessa on verrattu seitsemän eri mallin ennustamiskykyä kahdella eri ennustamiskyvyn arvioinnilla. Vertailu on suoritettu t-testillä. Peruste tutkimukselle on algoritmien parantuminen sekä tietokoneiden laskentatehon nopeutuminen. On mahdollista, että 1960-luvun rajoitteisiin pohjautuneet ennustamismenetelmät eivät enää nykyisin ole kaikista luotettavimpia.
Mallien välillä löytyi absoluuttisia eroja, jotka olivat monesti tilastollisesti merkitseviä. Parhaiten menestyivät uudet koneoppimista hyväksikäyttävät menetelmät sekä neuroverkot ja osittain päätöspuut. Perinteiset erotteluanalyysit ja regressioanalyysit menestyivät kautta linja heikommin. Tämä antaa viitteitä siitä, että uusien menetelmien käyttöönotto voisi olla perusteltua. Lisätutkimuksille on tarvetta, jotta voidaan varmistua, etteivät tulokset johdu monimutkaisempien menetelmien ylisovittamisesta käytössä olleeseen aineistoon.