Simuloitu ihminen koneoppimismallin koulutuksessa : aktiivisen oppimisen ja koneopettamisen käyttökelpoisuus satunnaismetsämallissa

Hasa, Lauri

Simuloitu ihminen koneoppimismallin koulutuksessa : aktiivisen oppimisen ja koneopettamisen käyttökelpoisuus satunnaismetsämallissa

dc.contributor.author	Hasa, Lauri
dc.contributor.faculty	fi=Tekniikan ja innovaatiojohtamisen yksikkö\|en=School of Technology and Innovations\|
dc.contributor.organization	fi=Vaasan yliopisto\|en=University of Vaasa\|
dc.date.accessioned	2026-06-18T08:00:29Z
dc.date.issued	2026-06-04
dc.description.abstract	Koneoppimisen yleistymisen myötä tarve koneoppimisen kehittämiselle on kasvanut. Yksi mahdollinen tapa kehittää koneoppimismallien tehokkuutta ja lisätä ymmärrystä on lisätä ihminen joka tuntee relevantin aihealueen mukaan mallin kehitykseen. Ihmisen osallistumista voidaan tarkastella eri tasoilla, riippuen siitä, kuka johtaa oppimisprosessia. Tutkielma on kontrolloitu koe, jossa ihmisen osallistumista koneoppimismallin toimintaan simuloidaan, ja siten tarkastellaan ihmisen käyttökelpoisuutta verrattaessa optimoituun koneoppimismalliin. Koneoppimismalli jota tutkielmassa käytetään on satunnaismetsä, sillä se saavuttaa hyvän suorituskyvyn, mutta se on myös tulkittava malli. Tutkielmassa suoritettu simulaatio osoittaa, että myös niissä tilanteissa kun ihminen tekee virheitä, vertautuu koneopettaminen silti hyvin optimoituun malliin. Simuloidussa koneopetustilanteessa, missä opettajan tarkkuus oli 80% ja 60%, saavutetaan samankaltainen suorituskyky erittäin nopeasti. Kuitenkin optimoitu malli saavuttaa suorituskyvyn, johon enemmistö muista tavoista eivät aivan yletä. Sen takia on tarkoituksenmukaista tarkastella opetustehokkuutta hyödyntäen normalisoitua aluetta oppimiskäyrän alapuolella (Area Under the Learning Curve, AULC). Epävarmuuteen perustuvalla näytteenvalinnalla koulutettu aktiivisen oppimisen malli hyödyntää vain noin 18% harjoitusdatasta, mutta saavuttaa kuitenkin yhtä hyvän F1-makrokeskiarvon. Koneopettamisen lopullinen F1-makrokeskiarvo jää hyvin vähän optimoidun mallin arvosta vajaaksi, mutta ero on satunnaisvaihtelun rajoissa, käytännössä F1-makrokeskiarvot ovat saman tasoisia. Tutkielman tulokset osoittavat aktiivisen oppimisen eli datan luokittelun olevan tällä aineistolla hyvin tehokas menetelmä, saavuttaen optimoitua mallia vastaavan suorituskyvyn käyttämällä vain pientä osaa harjoitusdatasta. Tutkielma tarjoaa näyttöä siitä, että koneopettaminen on vikasietoinen menetelmä silloin kun virheet ovat vähämerkityksellisiä piirteitä, eivätkä suoranaisesti haitallisia. Tätä tutkittiin pakottamalla simuloidulle opettajalle virheitä, eli simulaatioissa tarkkuudet oli 100%, 80% ja 60%. Kun tarkkuus oli pienempi, virheet valittiin vähämerkityksellisten piirteiden joukosta satunnaisesti. Piirteiden informatiivisuus oli mahdollista laskea, sillä satunnaismetsä mallina mahdollistaa sen. Koneopetussimulaatiossa mallit saavuttivat melkein optimoidun mallin suorituskyvyn jo muutamalla piirteellä. Täyden tarkkuuden opettaja saavutti sen nopeimmin, vain kahdella piirteellä.
dc.description.notification	fi=Opinnäytetyö kokotekstinä PDF-muodossa.\|en=Thesis fulltext in PDF format.\|sv=Lärdomsprov tillgängligt som fulltext i PDF-format\|
dc.format.extent	59
dc.identifier.uri	https://osuva.uwasa.fi/handle/11111/21007
dc.identifier.urn	URN:NBN:fi-fe2026060363248
dc.language.iso	fin
dc.rights	CC BY-NC 4.0
dc.subject.degreeprogramme	fi=Tietojärjestelmätieteen maisteriohjelma\|en=Master’s Programme in Information Systems\|
dc.subject.discipline	fi=Tietojärjestelmätiede\|en=Information Systems\|
dc.subject.yso	koneoppiminen
dc.title	Simuloitu ihminen koneoppimismallin koulutuksessa : aktiivisen oppimisen ja koneopettamisen käyttökelpoisuus satunnaismetsämallissa
dc.type.ontasot	fi=Pro gradu -tutkielma\|en=Master's thesis\|sv=Pro gradu -avhandling\|

Tiedostot

Näytetään 1 - 1 / 1

Name:: Uwasa_2026_Hasa_Lauri.pdf
Size:: 1.45 MB
Format:: Adobe Portable Document Format

Lataa

Kokoelmat

Pro gradu -tutkielmat ja diplomityöt