Tekoäly poikkeavuuksien havaitsemisessa pilvi- ja tietokantaympäristöissä : Aikakausikatsaus koneoppimisen menetelmistä, aineistoista ja käyttöönoton haasteista

dc.contributor.authorKivimäki, Jonathan
dc.contributor.facultyfi=Tekniikan ja innovaatiojohtamisen yksikkö|en=School of Technology and Innovations|
dc.date.accessioned2025-10-09T07:40:28Z
dc.date.issued2025-10-08
dc.description.abstractTutkielma tarkastelee tekoälypohjaista poikkeamien havaitsemista pilvi- ja tietokantaympä-ristöissä. Lähtökohtana on, että järjestelmien dynaamisuus, monivuokraus, heterogeeniset datalähteet ja salattu liikenne kaventavat sääntö- ja allekirjoituspohjaisten ratkaisujen katta-vuutta. Tavoitteena on jäsentää keskeiset lähestymistavat, aineistot ja mittarit sekä arvioida mallien tuotantokelpoisuutta. Tutkimus toteutetaan systemaattisena kirjallisuuskatsauksena vuosilta 2017–2025. Aineisto koostuu vertaisarvioiduista katsauksista ja soveltavista tutkimuksista, jotka käsittelevät pilvi-alustojen verkko- ja lokivirtoja, tietokantakyselyiden poikkeamia sekä tunkeutumisen havait-semista. Menetelmällinen tarkastelu kattaa ohjatut ja ohjaamattomat mallit, syväoppimisen sekä niiden yhdistelmät. Arvioinnissa painotetaan epätasapainoisiin luokkajakaumiin sopivia mittareita, kuten havaitsemisherkkyys, väärien hälytysten osuus ja F1-lukua sekä operatiivisia vaatimuksia, kuten viivettä ja läpivirtauksen kestävyyttä, kustannuksia, selitettävyys ja tieto-suoja. Katsauksen mukaan ohjattu oppiminen toimii hyvin tunnettujen hyökkäysten havaitsemises-sa, jos opetusdata kuvaa kohdeympäristön nykyistä liikennettä. Nollapäivä-hyökkäykset ja nopeasti muuntuvat ilmiöt puoltavat ohjaamatonta anomaliantunnistusta ja syväoppimista, mutta ne lisäävät tulkittavuus- ja hälytyshaasteita. Hybridit, joissa yhdistetään allekirjoitus- ja sääntöpohjainen tunnistus sekä koneoppimis- ja syväoppimispohjainen anomaliantunnistus, tasapainottavat havaitsemisherkkyyttä ja hälytyskuormaa. Tietokantatasolla tehokkaaksi osoittautuu kyselykäyttäytymisen profilointi; eheyden ja luottamuksellisuuden vuoksi matala väärien negatiivisten taso on kriittinen. Aineistoriippuvuus rajoittaa yleistettävyyttä, joten arviointi tulisi yhdistää julkisista dataseteistä saatuihin tuloksiin organisaatiokohtaisella tai realistisesti synteettisellä datalla. Tuotantokelpoisuus edellyttää selitettävyyttä ja tietosuojan varmistamista. Johtopäätöksenä suositellaan kerroksellista arkkitehtuuria, epätasapainoisiin luokkiin sopivia mittareita ja käyttöönottoa hallituissa dataputkissa. Jatkotutkimus tulee suunnata mallien siirrettävyyteen ja ympäristön ajallisten muutosten hallintaan. Erityisesti tietokantaympäristöissä jatkotutkimus tulisi kohdistaa kyselyprofiilien ja pääsykuvioiden muutosten havaitsemiseen sekä mallien siirrettävyyteen eri sovellusten välillä, vertaillen tu-loksia sekä vakiintuneisiin aineistoihin että organisaatiokohtaisiin lokivirtoihin.
dc.format.contentfi=kokoteksti|en=fulltext|
dc.format.extent34
dc.identifier.urihttps://osuva.uwasa.fi/handle/11111/19080
dc.identifier.urnURN:NBN:fi-fe20251008100535
dc.language.isofin
dc.rightsCC BY-NC-SA 4.0
dc.subject.degreeprogrammefi=Kestävän energian ja älykkään teknologian kandidaattiohjelma (TkK)|en=Bachelor Programme in Sustainable Energy and Smart Technology|
dc.subject.disciplinefi=Automaatio- ja tietotekniikka|en=Automation and Computer Science|
dc.subject.ysokyberturvallisuus
dc.subject.ysokoneoppiminen
dc.subject.ysosyväoppiminen
dc.subject.ysoanomaliat
dc.subject.ysotunnistaminen
dc.subject.ysoverkkohyökkäykset
dc.subject.ysotietokannat
dc.subject.ysopilvipalvelut
dc.titleTekoäly poikkeavuuksien havaitsemisessa pilvi- ja tietokantaympäristöissä : Aikakausikatsaus koneoppimisen menetelmistä, aineistoista ja käyttöönoton haasteista
dc.type.ontasotfi=Kandidaatintutkielma|en=Bachelor's thesis|sv=Kandidatarbete|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
Uwasa_2025_Kivimaki_Jonathan.pdf
Size:
853.78 KB
Format:
Adobe Portable Document Format