Simuloitu ihminen koneoppimismallin koulutuksessa : aktiivisen oppimisen ja koneopettamisen käyttökelpoisuus satunnaismetsämallissa
| dc.contributor.author | Hasa, Lauri | |
| dc.contributor.faculty | fi=Tekniikan ja innovaatiojohtamisen yksikkö|en=School of Technology and Innovations| | |
| dc.contributor.organization | fi=Vaasan yliopisto|en=University of Vaasa| | |
| dc.date.accessioned | 2026-06-18T08:00:29Z | |
| dc.date.issued | 2026-06-04 | |
| dc.description.abstract | Koneoppimisen yleistymisen myötä tarve koneoppimisen kehittämiselle on kasvanut. Yksi mahdollinen tapa kehittää koneoppimismallien tehokkuutta ja lisätä ymmärrystä on lisätä ihminen joka tuntee relevantin aihealueen mukaan mallin kehitykseen. Ihmisen osallistumista voidaan tarkastella eri tasoilla, riippuen siitä, kuka johtaa oppimisprosessia. Tutkielma on kontrolloitu koe, jossa ihmisen osallistumista koneoppimismallin toimintaan simuloidaan, ja siten tarkastellaan ihmisen käyttökelpoisuutta verrattaessa optimoituun koneoppimismalliin. Koneoppimismalli jota tutkielmassa käytetään on satunnaismetsä, sillä se saavuttaa hyvän suorituskyvyn, mutta se on myös tulkittava malli. Tutkielmassa suoritettu simulaatio osoittaa, että myös niissä tilanteissa kun ihminen tekee virheitä, vertautuu koneopettaminen silti hyvin optimoituun malliin. Simuloidussa koneopetustilanteessa, missä opettajan tarkkuus oli 80% ja 60%, saavutetaan samankaltainen suorituskyky erittäin nopeasti. Kuitenkin optimoitu malli saavuttaa suorituskyvyn, johon enemmistö muista tavoista eivät aivan yletä. Sen takia on tarkoituksenmukaista tarkastella opetustehokkuutta hyödyntäen normalisoitua aluetta oppimiskäyrän alapuolella (Area Under the Learning Curve, AULC). Epävarmuuteen perustuvalla näytteenvalinnalla koulutettu aktiivisen oppimisen malli hyödyntää vain noin 18% harjoitusdatasta, mutta saavuttaa kuitenkin yhtä hyvän F1-makrokeskiarvon. Koneopettamisen lopullinen F1-makrokeskiarvo jää hyvin vähän optimoidun mallin arvosta vajaaksi, mutta ero on satunnaisvaihtelun rajoissa, käytännössä F1-makrokeskiarvot ovat saman tasoisia. Tutkielman tulokset osoittavat aktiivisen oppimisen eli datan luokittelun olevan tällä aineistolla hyvin tehokas menetelmä, saavuttaen optimoitua mallia vastaavan suorituskyvyn käyttämällä vain pientä osaa harjoitusdatasta. Tutkielma tarjoaa näyttöä siitä, että koneopettaminen on vikasietoinen menetelmä silloin kun virheet ovat vähämerkityksellisiä piirteitä, eivätkä suoranaisesti haitallisia. Tätä tutkittiin pakottamalla simuloidulle opettajalle virheitä, eli simulaatioissa tarkkuudet oli 100%, 80% ja 60%. Kun tarkkuus oli pienempi, virheet valittiin vähämerkityksellisten piirteiden joukosta satunnaisesti. Piirteiden informatiivisuus oli mahdollista laskea, sillä satunnaismetsä mallina mahdollistaa sen. Koneopetussimulaatiossa mallit saavuttivat melkein optimoidun mallin suorituskyvyn jo muutamalla piirteellä. Täyden tarkkuuden opettaja saavutti sen nopeimmin, vain kahdella piirteellä. | |
| dc.description.notification | fi=Opinnäytetyö kokotekstinä PDF-muodossa.|en=Thesis fulltext in PDF format.|sv=Lärdomsprov tillgängligt som fulltext i PDF-format| | |
| dc.format.extent | 59 | |
| dc.identifier.uri | https://osuva.uwasa.fi/handle/11111/21007 | |
| dc.identifier.urn | URN:NBN:fi-fe2026060363248 | |
| dc.language.iso | fin | |
| dc.rights | CC BY-NC 4.0 | |
| dc.subject.degreeprogramme | fi=Tietojärjestelmätieteen maisteriohjelma|en=Master’s Programme in Information Systems| | |
| dc.subject.discipline | fi=Tietojärjestelmätiede|en=Information Systems| | |
| dc.subject.yso | koneoppiminen | |
| dc.title | Simuloitu ihminen koneoppimismallin koulutuksessa : aktiivisen oppimisen ja koneopettamisen käyttökelpoisuus satunnaismetsämallissa | |
| dc.type.ontasot | fi=Pro gradu -tutkielma|en=Master's thesis|sv=Pro gradu -avhandling| |
Tiedostot
1 - 1 / 1
