Matilda Ulvinen Big datan ja ennustavan analytiikan vaikutukset organisaation suorituskykyyn Vaasa 2023 Laskentatoimen ja rahoituksen akateeminen yksikkö Laskentatoimen ja rahoituksen pro gradu -tutkielma Laskentatoimen ja tilintarkas- tuksen maisteriohjelma 2 VAASAN YLIOPISTO Laskentatoimen ja rahoituksen akateeminen yksikkö Tekijä: Matilda Ulvinen Tutkielman nimi: Big datan ja ennustavan analytiikan vaikutukset organisaation suo- rituskykyyn Tutkinto: Kauppatieteiden maisteri Oppiaine: Laskentatoimi ja tilintarkastus Työn ohjaaja: Mika Ylinen Valmistumisvuosi: 2023 Sivumäärä: 108 TIIVISTELMÄ: Big datan ja ennustavan analytiikan potentiaali on tunnistettu eri liiketoimintaympäristöissä, kun saatavilla olevien datamassojen hyödyntämismahdollisuudet ovat yleistyneet. Organisaa- tiot ovat kiinnostuneita hyödyntämään edistyneempiä data-analytiikkaratkaisuja luodakseen li- säarvoa sekä kilpailuetua. Data-analytiikan hyödyntäminen ei automaattisesti paranna organi- saation suorituskykyä, vaan se vaatii oikeanlaisia taitoja ja osaamista, minkä takia inhimillinen pääoma koetaan merkittäväksi tekijäksi data-analytiikkakyvykkyyksien rakentamisessa. Tutkiel- man tavoitteena on selvittää minkälaisia vaikutuksia data-analytiikan ja etenkin ennustavan ana- lytiikan hyödyntämisellä on organisaation suorituskykyyn. Tutkimuksessa selvitetään data-ana- lytiikan ja ennustavan analytiikan roolia organisaatioissa sekä kartoitetaan niiden avulla saavu- tettuja hyötyjä. Data-analytiikkaa tarkastellaan myös inhimillisen pääoman näkökulmasta, pai- nottaen teknisiä taitoja sekä johtamistaitoja. Tutkielman teoriaosuuden ensimmäisessä osassa käsitellään big datan ja ennustavan analytiikan piirteitä sekä määritelmiä. Näiden lisäksi syvennytään data-analytiikan muihin edistyneisiin muotoihin sekä tekniikoihin. Toisessa osassa käsitellään inhimillistä pääomaa organisaation re- surssina sekä tarkastellaan teknisiä taitoja ja johtamistaitoja data-analytiikan näkökulmasta. Vii- meisessä osassa keskitytään data-analytiikan ja suorituskyvyn väliseen yhteyteen sekä tarkastel- laan data-analytiikan hyödyntämistä liiketoiminnan näkökulmasta. Tutkielman empiirinen osuus toteutettiin puolistrukturoiduilla teemahaastatteluilla. Tutkimuk- sen kohderyhmäksi valikoitui suomalaisia organisaatioita, jotka ovat edelläkävijöitä data-analy- tiikan hyödyntämisessä. Haastateltaviksi valittiin henkilöitä, jotka toimivat organisaation johto- asemassa data- ja analytiikkatehtävissä. Haastatteluita pidettiin yhteensä seitsemän kappaletta. Tutkimuksen aineiston analysointi perustuu tyypillisiin ladullisen tutkimuksen menetelmiin, tee- moitteluun ja tyypittelyyn. Tutkielman tulokset osoittavat, että data-analytiikan ja ennustavan analytiikan rooli nähdään tärkeänä sekä kasvavana tekijänä organisaatioissa. Ennustava analytiikka koetaan merkittävänä tekijänä kilpailukyvyn ylläpitämisessä sekä liiketoimintaympäristön muutoksessa. Inhimillisen pääoman merkitys data-analytiikan hyödyntämisessä koetaan tärkeäksi etenkin muutosjohta- misen ja muuntautumiskyvyn näkökulmista. Olennaisina tekijöinä pidetään teknisten taitojen jatkuvaa kehitystarvetta sekä ylimmän johdon merkitystä data-analytiikan hyödyntämisessä. Data-analytiikan avulla saavutetut hyödyt nähtiin pääosin hinnoittelun optimoinnissa, kustan- nussäästöissä sekä myynnin kasvussa. Koetut hyödyt ovat linjassa sen kanssa, kuinka merkittä- vässä roolissa data-analytiikka on organisaatioissa. AVAINSANAT: big data, data-analytiikka, ennustava analytiikka, inhimillinen pääoma, suori- tuskyky 3 Sisällys 1 Johdanto 6 1.1 Tutkielman tavoitteet ja lähestymistapa 7 1.2 Tutkielman rajaukset 8 1.3 Tutkielman rakenne 9 2 Data-analytiikka 11 2.1 Ennustava analytiikka 13 2.2 Big data 14 2.2.1 Big data-analytiikka 17 2.2.2 Big data ja ennustava analytiikka 19 3 Inhimillinen pääoma data-analytiikan hyödyntämisessä 21 3.1 Inhimillinen pääoma organisaation resurssina 21 3.2 Data-analytiikka inhimillisen pääoman näkökulmasta 23 3.2.1 Johtamistaidot 27 3.2.2 Tekniset taidot 28 4 Data-analytiikan vaikutukset organisaation suorituskykyyn 30 4.1 Data-analytiikan hyödyntäminen liiketoiminnassa 33 4.2 Data-analytiikan haasteet 34 4.3 Data-analytiikka tulevaisuudessa 36 5 Tutkimusmenetelmät ja aineisto 38 5.1 Tutkimusmenetelmä 38 5.2 Aineistonkeruumenetelmä 39 5.3 Tutkittava kohderyhmä ja tiedonkeruun toteutus 41 5.4 Aineiston analysointi 43 5.5 Tutkimuksen luotettavuus 45 6 Tutkimuksen tulokset 48 6.1 Big datan ja ennustavan analytiikan rooli organisaatioissa 48 6.1.1 Big data ja datan lähteet 49 6.1.2 Datan arvo 51 4 6.1.3 Data-analytiikan rooli 53 6.1.4 Ennustavan analytiikan rooli 56 6.2 Data-analytiikan ja ennustavan analytiikan hyödyntäminen 58 6.2.1 Data-analytiikan ja ennustavan analytiikan käyttökohteet 58 6.2.2 Data- ja analytiikkaratkaisut 63 6.3 Inhimillinen pääoma data-analytiikan näkökulmasta 64 6.3.1 Inhimillinen pääoma organisaation resurssina 65 6.3.2 Tekniset taidot data-analytiikan hyödyntämisessä 67 6.3.3 Data-analytiikan johtaminen 70 6.4 Data-analytiikan hyödyt, haasteet ja mahdollisuudet 73 6.4.1 Data-analytiikan havaitut hyödyt 73 6.4.2 Haasteet data-analytiikan hyödyntämisessä 78 6.4.3 Data-analytiikka tulevaisuudessa 81 6.5 Yhteenveto tutkimuksen tuloksista 84 7 Johtopäätökset 91 7.1 Yhteenveto tutkielmasta 91 7.2 Tutkielman luotettavuus 96 7.3 Jatkotutkimusehdotukset 96 Lähteet 98 Liitteet 107 Liite 1. Haastattelurunko 107 5 Kuviot Kuvio 1. Analytiikkaprosessi (Davenport ja muut, 2010). 12 Kuvio 2. Big datan "neljä V:tä" (Ernst & Young, 2014). 16 Kuvio 3. Aineeton pääoma (Pike ja muut, 2005). 22 Taulukot Taulukko 1. Haastateltavien taustatiedot. 43 Taulukko 2. Datan arvo ja data-analytiikan rooli. 85 Taulukko 3. Data-analytiikan hyödyt ja haasteet. 86 Taulukko 4. Inhimillisen pääoman merkitys data-analytiikan hyödyntämisessä. 88 Lyhenteet BDA Big Data Analytics BDPA Big Data Predictive Analytics DCV Dynamic Capability View ETL Extract, Transform and Load IoT Internet of Things IIoT Industrial Internet of Things RBV Resource Based View 6 1 Johdanto Data-analytiikan sekä big datan merkitys nykypäivän liiketoimintaympäristössä ja erity- sesti laskentatoimen kentässä on kasvanut merkittävästi. Big datan ja ennustavan analy- tiikan hyötyjä on tutkittu kirjallisuudessa vielä suhteellisen vähän, mutta data-analytiikka ja sen kehittyneemmät muodot ovat tutkimusalueena erittäin ajankohtainen ja laajaa kiinnostusta herättänyt aihe (Gupta & George, 2016; Wamba ja muut, 2017). Tutkijoiden mukaan big datalla ja data-analytiikalla on merkittävä vaikutus organisaatioiden toimin- taan sekä laskentatoimen tehtäviin etenkin tulevaisuudessa (Davenport, 2006; Fosso Wamba ja muut, 2015; Ranta ja muut, 2021). Big data nähdään seuraavana johtamisen ja tiedon vallankumouksena, suurena innovaationa, joka nostaa yritysarvoa ja ratkaisee liiketoimintahaasteita (Davenport ja muut, 2012; Gobble, 2013; McAfee ja muut, 2012). Akterin ja muiden (2016) mukaan ennustava analytiikka yhdistettynä big datan tuomiin resursseihin voi johtaa korkeampaan tai jopa ylivoimaiseen organisaation suorituskykyyn. Nykyinen liiketoimintaympäristö muuttuu jatkuvasti teknologian ja big datan tuomien mahdollisuuksien ansiosta, mikä johtaa ihmisen tietoon pohjautuvan näkökulman muut- tumisen kohti datalähtöisempää näkökulmaa (Berndtsson ja muut, 2018). Gartnerin (2012) tutkimuksen mukaan jo ”73 % organisaatiosta on sijoittanut tai aikoo sijoittaa big dataan seuraavan kahden vuoden aikana”. Uudemman Gartnerin (2021) tutkimuksen mukaan 70 % organisaatioista tulee hyödyntämään big dataa vuoteen 2025 mennessä. Kirjallisuudessa on kuitenkin painotettu lähinnä big data-analytiikan potentiaalisia hyö- tyjä ilman, että on otettu huomioon, miten organisaatiot pystyvät luomaan kyvykkyyksiä big datan hyödyntämiseksi (Mikalef ja muut, 2018). Tämän takia on oleellista tutkia min- kälaisia vaikutuksia big datalla ja data-analytiikan eri muodoilla on laskentatoimeen sekä liiketoimintaan käytännön tasolla, sillä organisaatioiden prosessit ja päätöksenteko ovat nykypäivänä entistä vahvemmin kytköksissä data-analytiikkaan sekä sen kehittyneeseen muotoon, ennustavaan analytiikkaan (Ding ja muut, 2020). Big datan ja ennustavan analytiikan hyödyntämisessä ei ole kysymys pelkästään uuden teknologian hankkimisesta vaan siitä, miten sitä hyödynnetään. Gupta ja George (2016) 7 painottavat ihmisten henkilökohtaisia taitoja kuten johtamistaitoja ja tietoteknistä osaa- mista. Ihmisten taidoissa on kyse vaikeasti jäljiteltävistä ja ainutlaatuisista taidoista, joi- den avulla organisaatio pystyy erottumaan muista kilpailijoista (McAfee ja muut, 2012). Useimmat teknologiset ratkaisut ovat kuitenkin yleisesti käytettävissä, joten ne ovat hel- posti jäljiteltävissä. Tutkijoiden mukaan syy siihen, miksi big datasta ja ennustavasta ana- lytiikasta ei saada vielä tarpeeksi hyötyä on se, että organisaatiot eivät painota tarpeeksi ihmisten taitoja teknologian hyödyntämisessä vaan luottavat liikaa pelkästään itse tek- nologiaan (Dubey ja muut, 2019; Gupta ja muut, 2020). Kirjallisuudessa on tunnistettu big datan ja data-analytiikan vaikutukset organisaation suorituskykyyn, mutta monissa keskeisimmissä tutkimuksissa aihetta käsitellään kvanti- tatiivisesta näkökulmasta, jolloin organisaatio- ja toimialakohtaiset näkemykset eivät nouse esille. Vaikka kirjallisuudessa on havaittu erilaisia hyötyjä data-analytiikan hyödyn- tämisestä eri toimialoilla, käsitys suomalaisten organisaatioiden data-analytiikan ja en- nustavan analytiikan hyödyntämisestä sekä etenkin niiden avulla saavutetuista hyödyistä on vielä suhteellisen vähäistä. Tässä tutkielmassa aihetta käsitellään myös inhimillisen pääoman näkökulmasta, jotta voidaan kasvattaa ymmärrystä sen yhteydestä organisaa- tioiden suorituskykyyn ja toimialakohtaisiin eroihin. Tutkielman aihe on ajankohtainen, kun ottaa huomioon data-analytiikan merkityksen kasvun yhtenä merkittävimpänä kil- pailukyvyn tekijänä liiketoimintaympäristössä. 1.1 Tutkielman tavoitteet ja lähestymistapa Tämän tutkimuksen tavoitteena on selvittää miten big dataa, data-analytiikka sekä sen edistynyttä muotoa ennustavaa analytiikkaa hyödynnetään kohdeorganisaatioissa ja minkälaisia vaikutuksia niillä on organisaatio toimintaan ja suorituskykyyn. Tavoitteena on selvittää havaittuja hyötyjä sekä sitä, mihin toimintoihin organisaatiot käyttävät data- analytiikkaa liiketoiminnassaan. Tämän lisäksi tutkielma pyrkii selvittämään organisaa- tioiden näkemystä inhimillisen pääoman merkityksestä data-analytiikan hyödyntämi- sessä. Aihetta tutkitaan seuraavien tutkimuskysymyksien avulla: 8 1. Minkälainen rooli big datalla ja ennustavalla analytiikalla on organisaatioissa? 2. Miten inhimillinen pääoma nähdään data-analytiikan hyödyntämisessä? 3. Mitä hyötyjä organisaatiot ovat saavuttaneet data-analytiikan ja ennustavan ana- lytiikan avulla? Tutkielma on laadullinen haastattelututkimus, jonka tavoitteena on kartoittaa big datan ja ennustavan analytiikan hyödyntämistä sekä niiden vaikutuksia suomalaisissa organi- saatioissa. Tutkimuksen haastateltaviksi on valittu organisaatioita, jotka ovat edelläkävi- jöitä ennustavan analytiikan hyödyntämisessä Suomessa. Tavoitteena on selvittää min- kälaisia hyötyjä organisaatoissa on havaittu, ja miten data-analytiikka on vaikuttanut nii- den organisaatioiden suorituskykyyn, jotka hyödyntävät data-analytiikkaa systemaatti- sesti toiminnassaan. 1.2 Tutkielman rajaukset Tutkielma käsittelee big datan ja ennustavan analytiikan hyödyntämistä sekä organisaa- tion suorituskyvyn välistä yhteyttä organisaatiotasolla. Tutkielman tarkoitus on käsitellä aihetta liiketoiminnan näkökulmasta, koska perimmäisenä tavoitteena on selvittää min- kälaisia vaikutuksia big datalla ja ennustavalla analytiikalla on organisaation suoritusky- kyyn ja minkälaisia hyötyjä organisaatiot ovat havainneet data-analytiikalla olevan. Data- analytiikan näkökulmasta tutkimus on rajattu käsittelemään tarkemmin ennustavaa ana- lytiikkaa, sillä tutkimuksessa halutaan tutkia suomalaisten organisaatioiden valmiuksia hyödyntää ennustavaa analytiikkaa. Ennustavalla analytiikalla on erityinen asema data- analytiikan kentässä, sillä se keskittyy tulevaisuuteen ja uuden tiedon luomiseen. Siihen liittyvä analytiikka on lähes poikkeuksetta yhteydessä big dataan ja sen tuomiin mahdol- lisuuksiin. 9 Tutkielmassa käsitellään big data ja data-analytiikkaa inhimillisen pääoman näkökul- masta. Inhimillistä pääomaa käsitellään yhtenä organisaation avainresurssina sekä mer- kittävänä tekijänä big dataan ja data-analytiikkaan liittyvien kyvykkyysien rakentami- sessa. Inhimillisen pääoman osalta tutkielmassa keskityttiin johtamistaitoihin sekä tek- nisiin taitoihin, koska niiden merkitys big dataan liittyvissä ja ennustavan analytiikan kal- taisissa vaativissa ja uudenlaisissa tekniikoissa on merkittävä. Tutkielman perimmäisenä tavoitteena on keskittyä data-analytiikan havaittuihin hyötyihin sekä siihen mikä vaikutus sillä on organisaatioiden suorituskykyyn. Tutkielma sivuaa myös data-analytiikkaan ja etenkin ennustavaan analytiikkaan liittyviä tulevaisuuden mahdollisuuksia sekä mahdol- lisia haasteita, niin nykyhetkessä kuin tukevaisuudessa. Haastateltavien osalta tutkielmaan valitaan suomalaisia organisaatioita, jotka ovat edel- läkävijöitä big datan sekä data-analytiikan edistyneiden muotojen kuten ennustavan analytiikan hyödyntämisessä. Rajaamalla haastateltavat edistyksellisyyden perusteella mahdollistaa mahdollisimman laadukkaan aineiston, sillä data-analytiikan kehittyneitä muotoja hyödynnetään Suomessa vielä suhteellisen vähän. Koska tutkielma aineiston kerääminen toteutetaan haastattelemalla, tavoitteena on kerätä mahdollisimman laajaa ja monipuolista tietoa jokaisesta haastateltavasta organisaatiosta. Tutkielmassa ei rajata haastateltavia toimialan mukaan, sillä se automaattisesti vaikuttaisi aineiston laatuun sekä laajuuteen. 1.3 Tutkielman rakenne Tutkielmassa on seitsemän lukua, jotka on jaettu johdantoon, teoriaan sekä empiiriseen osuuteen. Teoria luku kaksi käsittelee big dataa ja data-analytiikkaa sekä tarkemmin en- nustavaa analytiikkaa. Kolmannessa luvussa keskitytään inhimilliseen pääomaan organi- saation resurssina sekä tarkastellaan sen suhdetta data-analytiikkaan. Neljännessä lu- vussa tarkastellaan organisaation suorituskykyä, data-analytiikan havaittuja hyötyjä, haasteita sekä tulevaisuutta. Viidennessä luvussa esitellään tutkimusmenetelmät, jonka jälkeen siirrytään tutkielman empiiriseen osuuteen. Tutkimuksen tulokset käsitellään 10 neljän eri teeman mukaan tutkielman kuudennessa luvussa. Viimeisessä, seitsemän- nessä, luvussa käydään läpi johtopäätökset sekä arvioidaan tutkielman rajoitteita ja an- netaan jatkotutkimusehdotuksia. 11 2 Data-analytiikka Data-analytiikan merkitys liiketoiminnassa on nykypäivänä suuri. Tutkijat ovat kutsuneet sitä jopa liiketoiminnan uudeksi vallankumoukseksi (Davenport ja muut, 2012; McAfee ja muut, 2012). Toisaalta tutkijat ovat myös esittäneet näkemyksiä siitä, ettei data-ana- lytiikan tuomia mahdollisuuksia kyetä hyödyntämään vielä organisaatioissa läheskään parhaalla mahdollisella tavalla. Data-analytiikan tarkoituksena on kerätä datasta tietoa, joka tuottaa lisäarvoa organisaatiolle. Data-analytiikka eroaa liiketoimintatiedon hallin- nasta (business intelligence) siten, että data-analytiikan ideana on tuottaa uutta tietoa eikä pelkästään hyödyntää olemassa olevaa tietoa (Maisel & Cokins, 2015). Data-analy- tiikan avulla pyritään yksinkertaistamaan suuria määriä dataa, minkä avulla vahvistetaan datasta saatavaa lisäarvoa. Liiketoiminnassa data-analytiikan keskeinen tarkoitus on tukea päätöksentekoa ja tämän kautta luoda lisäarvoa yritykselle (Lindgreen ja muut, 2012). Haasteena on kuitenkin se, miten data-analytiikkaa saadaan hyödynnettyä niin, että se tuottaa lisäarvoa (Vidgen ja muut, 2017). Organisaation tulee omata data-analytiikkaan liittyviä kyvykkyyksiä, jotta sillä on mahdollisuus luoda lisäarvoa datasta. Organisaation kyvykkyydet muodostuvat eri tekijöistä, kuten ihmisistä, teknologiasta ja prosesseista. Kokonaisuutena voidaan pu- hua organisaation resursseista. Kyvykkyyksien avulla on mahdollista luoda etua kilpaili- joihin nähden (Gupta ja muut, 2020). Lisäarvo nähdään kilpailuedun lähteenä, minkä ta- kia organisaatiot ovat valmiita investoimaan data-analytiikkaan ja käyttämään resursseja siihen (Lindgreen ja muut, 2012). Data-analytiikkaa voidaan kuvata eri näkökulmista, jolloin ne auttavat hahmottamaan data-analytiikkaa kokonaisuutena. Kirjallisuudessa data-analytiikka nähdään sekä työka- luna että prosessina osana liiketoimintaa (Kunc & O’Brien, 2019). Davenport ja muut (2010) esittävät artikkelissaan data-analytiikkaprosessin, jota kuvataan neljän eri kohdan avulla. Taulukossa 1 esitetty prosessi on tarkoitettu jatkuvaksi, jolloin uusien tavoitteiden ilmaantuessa prosessi voidaan aloittaa aina alusta. Prosessi kehittyy sen mukaan, min- kälaisia tavoitteita organisaatio määrittelee. 12 Kuvio 1. Analytiikkaprosessi (Davenport ja muut, 2010). Analytiikkaprosessin lisäksi data-analytiikkaa voidaan kuvata työkaluna. Ensimmäisessä näkökulmassa Mortenson ja muut (2015) esittelevät, että data-analytiikka koostuu kol- mesta eri tieteenalasta. Teknologialla, kvantitatiivisilla menetelmillä ja päätöksenteko- prosessilla on kaikilla oma rooli prosessissa. Teknologia sisältää tietojenkäsittelyyn vaa- dittavia työkaluja, kuten laitteistoja ja ohjelmistoja. Kvantitatiivisilla menetelmillä tarkoi- tetaan erilaisia tietojen analysointimenetelmiä kuten, tilastotiedettä, koneoppimista ja operatiivista tutkimusta. Päätöksentekoprosessi koostuu työkaluista ja teorioista, jotka tukevat päätöksentekoa. Apuna voidaan käyttää käyttäytymistiedettä, tiedon visualisoin- tia sekä ongelmien jäsentämismenetelmiä. Toisessa näkökulmassa Davenport ja muut (2007) jakaa data-analytiikan työkalut kol- meen eri kategoriaan käyttötarkoituksen mukaan. Ne ovat kuvaileva analytiikka, ennus- tava analytiikka ja preskriptiivinen analytiikka. Kuvailevalla analytiikalla pyritään etsi- mään datasta trendejä ja toistuvia malleja, joita kuvataan taulukoiden, kaavioiden ja tun- nuslukujen avulla (Kunc & O’Brien, 2019). Tarkoituksena on luokitella ja yhdistellä dataa erilaisten tekniikoiden avulla hyödylliseksi tiedoksi. Ennustava analytiikka keskittyy tule- vaisuuteen ja sen ennustamiseen. Sen avulla pyritään löytämään piilossa olevia malleja, joiden avulla voidaan ennustaa käyttäytymismalleja sekä tunnistaa trendejä. Preskriptii- vinen eli ohjaileva analytiikka pyrkii löytämään parhaita skenaarioita sekä vaihtoehtoja tavoitteiden saavuttamiseksi. Työkaluina käytetään optimointia ja simulaatiota sekä eri- laisia ennustavaan analytiikkaan liittyviä matemaattisia ja tilastotieteeseen pohjautuvia 1. Mitä halutaan saavuttaa? Tavoitteiden asettaminen ja määrittäminen. 2. Datan kerääminen ja integrointi. 3. Datan analysointi. Tilastollisen analysoinnin sekä ennustavien mallien avulla. 4. Teoista oppiminen, tehtyjen toimenpiteiden arviointi. 13 tekniikoita. Tarkoituksena on ennustaa tulevaisuutta ennalta määriteltyjen tekijöiden pe- rusteella (Kunc & O’Brien, 2019). 2.1 Ennustava analytiikka Ennustavan analytiikan tarkoituksena on kerätä dataa olemassa olevista data-aineistoista ja luoda niiden avulla ennusteita sekä malleja tulevaisuudesta (Lawless, 2014). Ennusta- vassa analytiikassa käytetään historiallista dataa sekä reaaliaikaista dataa, jonka avulla pystytään luomaan parempia ja tarkempia ennusteita. Lawless (2014) painottaa tutki- muksessaan, että ennustavan analytiikan tarkoitus ei ole kertoa mitä tulevaisuudessa ta- pahtuu vaan ennustaa mitä saattaa tapahtua. Ennusteissa on tärkeää ottaa huomioon luotettavuusaste sekä erilaiset riskit ja skenaariot. Ennustavan analytiikan tavoitteena on ennen kaikkea parantaa tarkkuutta ja vähentää epävarmuutta, sillä epätarkkuutta sekä epävarmuutta esiintyy aina ennustamisessa. Eckerson (2007) kuvailee ennustavaa ana- lytiikkaa liiketoimintatiedon hallintaan (business intelligence) liittyvien teknologisten rat- kaisujen kokonaisuudeksi. Liiketoimintatiedon hallinnalla puolestaan tarkoitetaan työka- luja, teknologisia ratkaisuja ja prosesseja, joiden avulla datasta saadaan tietoa liiketoi- minnan tueksi. Ennustava analytiikka hyödyntää useampia tekniikoita, joiden avulla datasta voidaan saada mahdollisimman paljon irti (Lawless, 2014). Muutamia tärkeimpiä tekniikoita ovat tilastotiede, koneoppiminen, päätöspuu sekä simulointi. Näiden tekniikoiden avulla da- taa pystytään hyödyntämään ja tutkimaan entistä tehokkaammin verrattuna perinteisiin menetelmiin. Ennustavassa analytiikassa käytetään silti edelleen perinteisiä tilastotie- teen tekniikoita kuten, lineaarista- ja logistista regressiomallia. Ennustamisessa kysymyk- set liittyvät yleensä vallitsevan tilanteen herkkyysanalyysiin eli ”mitä jos” tyyppisiin ky- symyksiin, joiden tarkoituksena on arvioida mahdollisen tuloksen epävarmuutta (Kunc & O’Brien, 2019). Uudemmat tekniikat ovat kuitenkin mahdollistaneet monimutkaisem- pien tekniikoiden, isompien datamassojen käsittelyn sekä laajempien ennustusmallien hyödyntämisen. 14 Kehittyneisiin ennustavan analytiikan tekniikkoihin kuuluu muun muassa simulointi sekä ennustava mallintaminen (Lustig ja muut, 2015). Simulaatiossa järjestelmästä luodaan malli, jonka avulla testataan useita erilaisia skenaarioita. Näiden skenaarioiden pohjalta tehdään ennusteita sekä arvioita järjestelmästä ja sen käyttäytymisestä. Simulointi vaatii pitkälle kehitettyjä algoritmeja sekä matemaattisia tekniikoita, jotta järjestelmän käyt- täytymisestä saadaan mahdollisimman tarkkaa tietoa. Ennustavan mallintamisen tarkoi- tuksena on analysoida dataa, niin että siitä voidaan luoda hypoteeseja tai vahvistaa jo olemassa olevia hypoteeseja. Hypoteesien datapisteet koostuvat attribuuteista, joiden välisiä yhteyksiä analysoidaan mallintamisessa. Mallintaminen on erityisen hyödyllistä liiketoiminnassa, silloin kun osa attribuuteista on organisaation päätettävissä (Lustig ja muut, 2015). Liiketoiminnassa ennustavan analytiikan kaltaista kehittynyttä analytiikkaa käytetään moneen eri tarkoitukseen. Ensisijaisena tarkoituksen on kuitenkin saada parempi käsitys asiakkaista, tuotteista sekä yhteistyökumppaneista (Lawless, 2014). Ennustavaa analy- tiikkaa voidaan hyödyntää organisaation eri alueilla kuten, asiakashallinnassa, toimitus- ketjun hallinnassa sekä toiminnanohjauksessa (Gunasekaran ja muut, 2017). Ennustavan analytiikkaa on mahdollista hyödyntää organisaatioissa, joilla on mahdollisuus hankkia tarvittavia resursseja ja hyödyntää niitä. Tämä vaatii kehittynyttä teknologiaa sekä oike- anlaisia taitoja ja osaamista (Gupta ja muut, 2020). 2.2 Big data Big data on laajaa kiinnostusta herättänyt aihe niin kirjallisuudessa kuin liiketoimintaym- päristössäkin. Sen määritelmä on kuitenkin vielä moninainen eikä sille ole olemassa tark- kaa yleisesti hyväksyttyä määritelmää (Davenport ja muut, 2012). Tutkijat kuvailevat big dataa niin isona tietomassana, jota ei voida tallentaa relaatiotietokantaan eikä sitä voida perinteisten ohjelmistojen avulla analysoida tai käsitellä (Jacobs, 2009; Manyika ja muut, 2011). Monet kuitenkin uskovat, että big datan avulla organisaatiot pystyvät kehittämään 15 uusia kyvykkyyksiä ja luomaan lisäarvoa. Haasteena on kuitenkin datan runsaan määrän sekä jatkuvan lisääntymisen lisäksi datan jäsentelemättömyys, sillä big dataa ei pystytä analysoimaan perinteisiä menetelmiä käyttäen (Davenport ja muut, 2012). Yksi käytetyimmistä ja tunnetuimmista määritelmistä on kuitenkin johtavan kansainväli- sen tutkimus- ja konsultointiyrityksen Gartnerin määritelmä big datasta. Gartner (2012) määrittelee big datan suureksi määräksi monipuolisia nopeasti kerättäviä tietovaroja. Big data vaatii innovatiivisia sekä kustannustehokkaita tietojenkäsittelytyökaluja, jotka mah- dollistavat datan hyödyntämisen ja paremman päätöksentekoprosessin. Määritelmää voidaan kuvata myös ”kolmen V:n” avulla, jotka tulevat englanninkielisistä sanoista vo- lume, velocity ja variety. Gartner (2012) sekä McAfee ja muut (2012) ovat määritelleet nämä kolme ulottuvuutta seuraavasti. Volyymilla tarkoitetaan datan suurta määrää, joka vie erityisen paljon tilaa tai koostuu suuresta määrästä tietueita. Nopeudella tarkoite- taan datan nopeaa keräämistä ja tiheää tiedon tuottamista, mutta samalla myös sen no- peaa vanhentumista. Laajuudella viitataan datan useisiin eri lähteisiin ja muotoihin sekä moniulotteisiin tietokenttiin. Myöhemmin tutkijat ovat kuvanneet big dataa myös ”neljän V:n” ja jopa ”viiden V:n” mallina. Nämä mallit antavat laajemman kuvan big datan ominaisuuksista ja auttaa hah- mottamaan sen eri ulottuvuuksia. Osa tutkijoista näkee neljännen ulottuvuuden ole- van ”value” eli datan arvo, jolla tarkoitetaan taloudellisen arvon tuottamista datasta (Forrester, 2012; Fosso Wamba ja muut, 2015). Kun taas Ernst & Young (2014) määritte- lee big datan ”neljän V:n” mallina, jossa neljänneksi ulottuvuudeksi on valittu laatu eli ”veracity”. Määritelmä on kuvattu kuviossa 2. Laadulla tarkoitetaan datan luotetta- vuutta ja sitä, kuinka hyvin dataa voidaan hyödyntää ja millaisessa muodossa se on (Ga- mage, 2016). White (2012) puolestaan määrittelee big datan ”viiden V:n” avulla, jossa on otettu huomioon sekä laatu että arvo. Big datasta löytyy useampia eri määritelmiä, jotka painottavat käsitteen eri näkökulmia (Fosso Wamba ja muut, 2015). Osa tutkijoista painottaa datan lähteisiin liittyviä näkökohtia, kun taas toiset keskittyvät enemmän itse 16 big datan käsittelyyn, analysointiin ja säilömiseen (Davenport ja muut, 2012; Jacobs, 2009). Kuvio 2. Big datan "neljä V:tä" (Ernst & Young, 2014). Big data koostuu useista eri tietolähteistä. CGMA (Chartered Global Management Ac- countants) määrittelee big datan kolmen eri tason avulla, jotka perustuvat organisaation käytettävissä olevaan dataan (Gamage, 2016). Ensimmäinen taso koostuu taloudellisesta datasta, joka sisältää taloudellisia mittareita sekä tunnuslukuja. Toinen taso sisältää edel- lisen tason lisäksi myös organisaation muun datan, johon kuuluu operatiiviseen toimin- taan sekä myyntiin liittyvä data. Näiden lisäksi on olemassa vielä uudenlaista, ulkoista sekä sisäistä dataa, josta suurin osa on ei-rakenteellista dataa. Ei-rakenteellisesta datasta on mahdollista saada hyödyllistä dataa irti oikeanlaisilla työkaluilla. Mitä enemmän da- taa on saatavilla, sitä suurempi analysointitarpeen taso on ja mitä suurempi määrä dataa on, sitä monimutkaisempaa ja sekavampaa se on. Big dataa voidaan myös tarkastella laajemmin sen lähteiden kautta. Dataa saadaan lu- kuisista eri lähteistä kuten satelliiteista, erilaisista sensoreista, järjestelmistä ja puheli- mista (Fosso Wamba ja muut, 2015). Nykyään merkittäviä lähteitä ovat myös jatkuvasti kasvava sosiaalisen median sisältö ja erilaiset videomateriaalit sekä internetin tuottama 17 data klikkimääristä (clickstream). IoT:n (Internet of Things) merkitys datan jatkuvassa li- sääntymisessä on suuri (Ahmed ja muut, 2017). Nykyään on olemassa lukuisia internet- tiin yhdistettyjä laitteita, jotka tuottavat dataa jatkuvasti. IoT on luonut monia mahdolli- suuksia liiketoiminnan näkökulmasta, sillä oikeanlaisen datan hallinnan ja analysoinnin avulla IoT:n luomasta suuresta määrästä dataa voi saada paljon hyötyä irti liiketoiminnan tueksi. IoT:n merkitys big datan näkökulmasta on suuri ja sen merkitys kasvaa jatkuvasti, kun internettiin liitettyjen laitteiden määrä kasvaa. Big datan ominaisuuksien ja sen lähteiden lisäksi on erityisen tärkeää ottaa huomioon datan hyödyntäminen. Organisaatioiden ongelma nykyään ei ole enää datan hankkimi- nen tai säilöminen vaan se, miten sitä voidaan hyödyntää parhaalla mahdollisella tavalla (Gupta & George, 2016). Datan hyödyntämiseksi organisaatiolla pitää olla oikeanlaisia resursseja ja niitä pitää osata hyödyntää oikealla tavalla. Markus (2015) kiteyttää big da- tan perimmäisen merkityksen seuraavan lauseen avulla: ”big datan potentiaali ei mää- rity big datan ominaisuuksien mukaan, vaan sen mukaan mitä kyseiset ominaisuudet an- tavat”. Eli olennaisinta on se minkälaista tietoa big datasta voidaan saada ja minkälaisia vaikutuksia sillä on organisaation toimintaan. 2.2.1 Big data-analytiikka Big data-analytiikka (big data analytics eli BDA) nähdään liiketoiminnassa merkittävänä tekijänä sen strategisen ja operatiivisen potentiaalin takia (Wamba ja muut, 2017). Mo- net organisaatiot ovat ryhtyneet tekemään merkittäviä investointeja ja kehitysprosesseja liittyen teknologisiin ratkaisuihin, taitoihin, tekniikkoihin ja infrastruktuuriin saadakseen tukea päätöksentekoprosessiin (Ciampi ja muut, 2018). Suurempien, monipuolisimpien sekä nopeammin tuotettujen tietomassojen kerääminen ja analysointi on askel kohti da- talähtöisempää liiketoimintaa, mihin moni organisaatio pyrkii. Kwon ja muut (2014) kui- tenkin painottavat, että datalähtöinen liiketoiminta vaatii paljon muutakin kuin BDA:ta. Organisaation on myös kyettävä muuntamaan data hyödylliseksi ja toimivaksi tiedoksi, 18 josta on apua liiketoiminnassa. Se on kuitenkin mahdollista oikeanlaisten resurssien, ky- vykkyyksien ja prosessien avulla (Gupta ja muut, 2020). Big data-analytiikka eroaa data-analytiikasta siten, että sen avulla voidaan käsitellä pal- jon suurempia sekä monimuotoisempia tietomassoja. Sen etuja on se, että sitä voidaan hyödyntää monilla eri toimialoilla, kun taas data-analytiikkaa on kyetty hyödyntämään enemmän vain tietyillä toimialoilla, kuten IT-alalla ja terveydenhuollon alalla (Wamba ja muut, 2017). BDA:ta voidaan hyödyntää laaja-alaisemmin niin teollisuudessa toimitus- ketjujen ja valmistuksen apuna kuin kuluttajakäyttäytymisen analysoinnissa sekä mark- kinoinnissa. BDA mahdollistaa useammille organisaatioille datan hyödyntämisen, sillä se mahdollistaa isompien ja monimutkaisempien datamassojen käsittelyn ja analysoinnin. Nykyään lähes kaikilla organisaatiolla on teoriassa mahdollisuus päästä käsiksi big dataan sekä hankkia työkaluja sen hyödyntämiseksi (Akter ja muut, 2016). Käytännössä big da- tan hyödyntäminen vaatii datan ja työkalujen lisäksi paljon muitakin resursseja, kuten oikeanlaista osaamista ja taitoja sekä rahallista panostusta näihin resursseihin. BDA nähdään merkittävänä erottava tekijänä suorituskykyisten ja heikosti menestyvien organisaatioiden välillä (Chen ja muut, 2012; Wamba ja muut, 2017). Useat tutkijat ovat tunnistaneet positiivisen yhteyden BDA:n ja organisaation suorituskyvyn välillä (Mishra ja muut, 2019; Gupta & George, 2016). Oikealla tavalla hyödynnettynä organisaatio voi saada merkittävää etua kilpailijoihin nähden BDA:n avulla. BDA on jo nyt merkittävä osa monen organisaation päätöksentekoprosessia ja samalla myös osa strategian suunnitte- lua sekä toteutusta (Wamba ja muut, 2017). Pricewaterhousen (PwC) ja Iron Mountainin tekemän tutkimuksen mukaan 23 % ei koe saavansa mitään hyötyä BDA:sta ja 43 % or- ganisaatioista kokee saavansa vain vähän hyötyä (White, 2015). BDA:sta koetut hyödyt on tunnistettu kirjallisuudessa, mutta liiketoimintaympäristössä potentiaalisen hyödyn valjastaminen on vielä työn alla. BDA:n mahdollisuuksien ymmärtäminen on siis vielä alkuvaiheessa, joten on vaikea määritellä mitä kaikkea BDA:n hyödyntäminen vaatii or- ganisaatiolta (Gupta ja George, 2016). 19 2.2.2 Big data ja ennustava analytiikka Big datan ja ennustavan analytiikan englanninkielinen käsite big data predictive analytics (BDPA) kuvaa big datan ja ennustavan analytiikan yhdistelmää. Aihe on erittäin ajankoh- tainen ja huomiota herättänyt tutkimusaihe, vaikka tutkimukset BDPA:n käsitteellistä- miseksi ovat vielä hyvin rajatut (Dubey ja muut, 2019). BDPA:n potentiaalin on kuitenkin tunnistanut moni tutkija ja sen vaikutuksia on tutkittu liittyen muun muassa organisaa- tion suorituskykyyn, toimitusketjun hallintaan sekä lääketieteeseen. Big datan ja ennustavan analytiikan perimmäinen tarkoitus on, että se tarjoaa tekniikan sellaisen tiedon käsittelemiseksi, joka on luonteeltaan laajaa, vaihtelevaa ja nopeaa (Zhi- Hua ja muut, 2014). BDPA:n avulla voidaan purkaa ja analysoida vaikeasti käsiteltäviä laajamittaisia datamassoja, jotka auttavat organisaatiota liiketoimintapäätöksissä (Gupta ja muut, 2020). Ennustava analytiikka liittyy yleensä big dataan ja siitä saataviin hyötyihin, sillä ennustava analytiikka käyttää tilastotiedettä apuna tulevien tapahtumien ennusta- miseen. Oletuksena on, että aiemmin tapahtuneella on vaikutus tulevaisuudessa tapah- tuviin asioihin. Tällainen analytiikka vaatii yleensä big dataa, jotta ennustaminen on mah- dollista ja tarpeeksi tarkkaa. BDPA:ssa käytettyjä yleisimpiä tekniikoita ovat muun mu- assa regressiomallinnus, päätöspuu, neuroverkot, Bayesiläinen tilastotiede ja tiedon- louhinta (Oztekin, 2017). BDPA:ta käsitellään yleisesti organisaation kyvykkyytenä, joka perustuu strategisiin re- sursseihin (Wamba ja muut, 2017). Kyvykkyydet kehittyvät siinä liiketoimintaympäris- tössä missä organisaatio toimii ja oikealla tavalla hyödynnettynä kyvykkyyksistä voi tulla kilpailuedun lähteitä. Kirjallisuudessa BDPA nähdään ennen kaikkea kyvykkyytenä, jolla organisaation on mahdollista saavuttaa ylivoimainen suorituskyky (Akter ja muut, 2016). BDPA:han liitetään vahvasti ihmisten erilaiset taidot, kuten tietotekniset taidot ja johta- mistaidot. Näiden taitojen avulla organisaation on mahdollistaa rakentaa BDPA kyvyk- kyyksiä (Dubey ja muut, 2019). Tutkijoiden mukaan nämä taidot ovat välttämättömiä 20 BDPA:n vaatimassa kriittisessä käsittelyssä, kun vaatimuksena on järjestelmäarkkiteh- tuurin sekä data-analytiikan hallinta (Chen ja muut, 2012; Duan & Xiong, 2015). BDPA:lla on hyvät ominaisuudet muuntautua muuttuviin olosuhteisiin ja kehittyä tilan- teiden mukaan (Lawless, 2014). Waller ja Fawcett (2013) painottaa artikkelissaan, että big data ja ennustava analytiikka ovat vahvasti kytköksissä datalähtöiseen ajattelutapaan, jossa tärkeänä osana on eteenpäin suuntautuva ajattelu. Monet organisaatiot pyrkivät omaksumaan datalähtöiseen ajattelutapaan perustuvan strategian tarkoituksena hank- kia kilpailuetua big datan ja analytiikan avulla (Berndtsson ja muut, 2018). Useat tutkijat ovat tunnistaneet BDPA:n hyödyt, mutta niiden toteuttaminen liiketoiminnassa on haaste, sillä se vaatii resursseja ja kehittyneitä taitoja, joita organisaatiolla ei luultavasti ole valmiina. McAfeen ja muiden (2012) mukaan johtamiseen liittyvät ongelmat ovat suurempia kuin teknologiset haasteet BDPA-projekteissa. Tämän takia datalähtöinen ajattelutapa on ratkaiseva tekijä BDPA:n hyödyntämisessä. 21 3 Inhimillinen pääoma data-analytiikan hyödyntämisessä Big datan ja ennustavan analytiikan hyödyntämisessä olennaisessa osassa on inhimilli- nen pääoma, sillä pelkällä datalla tai analytiikan työkaluilla ei ole itsestään arvoa. Datan käsittelemisessä sekä analytiikan työkalujen hyödyntämisessä tarvitaan oikeanlaisia joh- tamistaitoja sekä teknisiä taitoja, jotta niistä voidaan saada arvoa organisaatiolle. Tässä luvussa käsitellään inhimillistä pääomaa sekä organisaation resurssina että data-analytii- kan avainresurssina. Inhimillinen pääoma voidaan nähdä kehittyneen analytiikan avain- tekijänä organisaatioissa. 3.1 Inhimillinen pääoma organisaation resurssina Aineeton tai henkinen pääoma (intellectual capital) on organisaation keskeinen resurssi, jolla viitataan ei-fyysisiin, henkisiin ominaisuuksiin, resursseihin ja kyvykkyyksiin. Ainee- ton pääoma voidaan jakaa eri alakäsitteisiin monella eri tapaa, mutta yleisimmin tunne- tun määritelmän mukaan aineeton pääoma jaetaan suhdepääomaan (relational capital), rakennepääomaan (organizational capital) ja inhimilliseen pääomaan (human capital) kuvion 3. mukaisesti (Pike ja muut, 2005; Roos ja muut, 2001). Suhdepääoma koostuu organisaation rakentamista suhteista eri sidosryhmien kanssa. Näillä tarkoitetaan suh- teita asiakkaisiin, toimittajiin sekä muihin organisaation toiminnan kannalta merkittäviin sidosryhmiin. Sopimussuhteet sekä strategiset kumppanuudet ovat osa organisaation suhdepääomaa niin kuin myös liiketoimintaympäristö, jossa organisaatio toimii. Raken- nepääomalla tarkoitetaan organisaation kulttuuria, rakennetta ja prosesseja. Sillä viita- taan organisaation sisäisiin ominaisuuksiin ja resursseihin, kuten strategiaan, brändiin ja arvoihin. Inhimillinen pääoma koostuu ihmisten taidoista, tiedosta sekä kokemuksesta. Liiketoimintaympäristössä painottuvat muun muassa johtamistaidot, verkostoituminen sekä jatkuva oppiminen. 22 Kuvio 3. Aineeton pääoma (Pike ja muut, 2005). Perinteisesti organisaation avainresursseina on pidetty aineellista tai fyysistä pääomaa (physical capital), johon kuuluu muun muassa laitteet, koneet ja rakennukset. Tämän li- säksi organisaation pääoma voidaan jakaa vielä rahalliseen pääomaan (monetary capi- tal). Viimeisten vuosikymmenien aikana aineettoman pääoman arvo organisaation re- surssina on tunnistettu vahvemmin ja se nähdäänkin monesti organisaation avainresurs- sina (Pike ja muut, 2005). Teecen ja muiden (1997) mukaan organisaation on kuitenkin kyettävä itse tunnistamaan omat avainresurssit, jotka luovat arvoa organisaatioille. Pike ja muut (2005) painottavat, että yksittäisillä resursseilla ei itsestään ole arvoa organisaa- tiolle, vaan kestävään arvonluontiprosessiin kuuluu myös resurssien dynaaminen vuoro- vaikutus, jolla tarkoitetaan eri resurssien yhdistämisestä syntyvää arvoa. Tällä tarkoite- taan aineettoman, aineellisen ja rahallisen pääoman yhteisvaikutusta, sillä arvonluonti- prosessi on usein riippuvainen eri resursseista, kuten teknologista ja teknisistä taidosta sekä rahallisesta panostuksesta näihin molempiin. Teecen ja muiden (1997) mukaan kestävä arvonluontiprosessi on edellytys kestävälle kil- pailuedulle, jolla taas on suora vaikutus suorituskykyyn eri organisaatioiden välillä. Re- surssiperusteisen näkökulman (RBV) tavoitteena on selittää samalla toimialalla toimivien organisaatioiden eroavaisuuksia suorituskyvyssä. Sen mukaan organisaation jatkuva 23 kasvu perustuu sen sisäisiin ominaisuuksiin eli resursseihin, joiden avulla luodaan kilpai- luetua muihin toimijoihin nähden. Teece ja muut (1997) esittävät, että kestävä kilpai- luetu syntyy resursseista ja niiden pohjalta rakennetuista kyvykkyyksistä, jotka ovat vai- keasti jäljiteltäviä, korvaamattomia sekä synergistisiä. Inhimillistä pääomaa voidaankin luonnehtia vaikeasti jäljiteltäväksi, sillä se perustuu yksittäisten ihmisten taitoihin, tie- toon ja kokemukseen, jota ei voida suoraan kopioida muualle. Roos ja muut (2001) pai- nottavat inhimillisen pääoman merkitystä organisaation kyvyssä muuttaa ja yhdistellä resursseja. Inhimillistä pääomaa ei nähdä vain yksittäisten ihmisten taitoina ja tietona, vaan kykynä muuntaa ja yhdistellä resursseja arvon luomiseksi. Dynaamisten kyvykkyyksien teoria (dynamic capability view eli DCV) vie resurssiperäisen näkökulman astetta pidemmälle, ottaen huomioon dynaamisempia elementtejä (Teece ja muut, 1997). Teorian mukaan organisaatiolla on mahdollisuus rakentaa ja yhdistellä kyvykkyyksiä ylläpitääkseen kilpailuetua dynaamisessa ympäristössä. Tällöin pääpaino siirtyy kykyyn muuttaa sekä muuntaa olemassa olevia kyvykkyyksiä ja resursseja ympä- ristön muutoksien mukaan. Teoriaa voidaan pitää relevanttina inhimillisen pääoman sekä data-analytiikan näkökulmasta, sillä useiden eri tutkimuksien mukaan dynaamiset kyvykkyydet ovat yhteydessä organisaation suorituskykyyn, niin big dataan kuin data- analytiikkaan liittyvissä tutkimuksissa (Dubey ja muut, 2019; Schilke, 2014; Gupta ja muut, 2020; Wamba ja muut, 2017). Seuraavissa kappaleissa käsitellään inhimillistä pää- omaa tarkemmin data-analytiikan näkökulmasta ja syvennytään inhimillisen pääoman resursseihin, jotka ovat olennaisia data-analytiikan ja erityisesti BDPA:n näkökulmasta. 3.2 Data-analytiikka inhimillisen pääoman näkökulmasta Gupta ja George (2016) sekä Korherr & Kanbach (2021) näkevät inhimillisen pääoman organisaation kriittisimpänä aineettomana resurssina etenkin big datan ja data-analytii- kan näkökulmasta. Molemmissa tutkimuksissa johtamistaidot sekä ihmisten tekniset tai- dot tunnistetaan merkittävimpinä resursseina BDA:n kyvykkyyksien rakentamisessa, sillä 24 ne ovat vaikeasti jäljiteltäviä sekä olennaisessa osassa teknologisten ratkaisujen hyödyn- tämisessä. Gupta ja George (2016) esittävät myös, että datalähtöinen organisaatiokult- tuuri ja intensiivinen organisaation oppiminen ovat tärkeässä roolissa BDA:n hyödyntä- misessä. He tunnistavat kuitenkin teknisten taitojen yleistymisen ajan myötä, mikä saat- taa vaikuttaa organisaatioiden kykyyn luoda merkittävää kilpailuetua tulevaisuudessa. Toisaalta inhimillisen pääoman hyödyntämisessä ei ole kyse pelkästään yksittäisistä re- sursseista, vaan niiden välisistä synergioista ja yhdisteltävyydestä (Pike ja muut, 2005). Inhimillistä pääomaa voidaan pitää kriittisimpänä tekijänä big datan ja data-analytiikan hyödyntämisessä, sillä nykyään uusimmat analytiikkaratkaisut ovat lähes kaikkien orga- nisaatioiden saatavilla sekä datan kerääminen ja säilytys helpottunut merkittävästi (Gupta & George, 2016). Organisaatiolla on kuitenkin mahdollisuus erottua muista kil- pailijoista, joilla on samanlaiset teknologiset valmiudet. Rakentamalla vaikeasti jäljiteltä- viä kyvykkyyksiä organisaation sisäisten sekä ulkoisten resurssien avulla, organisaatiolla on mahdollisuus luoda kilpailuetua muihin toimijoihin nähden (Teece ja muut, 1997). Gupta ja muut (2020) väittävät, että ilman inhimillistä pääomaa ja ihmisten taitoja data- analytiikasta ei itsestään ole hyötyä. Ihmisten taidot nähdään merkittävässä roolissa ylei- sesti teknologia hyödyntämisessä, sillä teknologiset ratkaisut eivät tuo itsestään arvoa organisaatiolle. Tästä näkökulmasta ihmisten taitoja voidaan pitää ainutlaatuisina, koska ilman niitä organisaatio ei kykene täysin hyödyntämään hankkimiaan teknologisia resurs- seja ja luomaan arvoa niistä. Korherr & Kanbach (2021) painottavat organisaation resurs- sien ja kyvykkyyksien jatkuvaa kehittämistä ja laajentamista kilpailuedun säilyttämiseksi ja jatkuvan arvonluontiprosessin takaamiseksi. Teece ja muut (1997) painottavat, että big datan ja data-analytiikan kehittyminen kyvyk- kyydeksi vaatii organisaation kykyä muuntaa resursseja kyvykkyyksiksi, sillä kyvykkyyksiä ei ole mahdollista hankkia vaan organisaation pitää rakentaa ne itse. Gupta ja muut (2020) esittävät, että kyvykkyyksien kehittyminen dynaamisiksi vaatii datalähtöisen kult- tuurin kehittämistä ja vaalimista sekä organisaation prosessien uusimista. Data-analytiik- kaan ja big dataan liittyvien kyvykkyyksien kehittäminen ja ylläpitäminen vaatii jatkuvaa 25 teknologian ja järjestelmien päivittämistä, jotta organisaatio pystyy ylläpitämään suori- tuskykyään. Arunachalam ja muut (2018) tuovat esille ongelmakohtia, jotka liittyvät eri- tyisesti organisaatioiden todelliseen kykyyn hyödyntää BDA:ta toiminnassaan. He näke- vät suurimmiksi haasteiksi organisaation riittämättömät resurssit, teknisten taitojen puutteen sekä saavutettujen hyötyjen näkyminen suorituskyvyssä. Osa tutkijoista on myös ottanut esille päätöksentekoon liittyvät haasteet, sillä liiketoiminnassa päätöksen- teko saattaa olla osittain kytköksissä johtajien omaan intuitioon, joka saattaa usein olla ristiriidassa dataan perustuvan tiedon kanssa (McAfee ja muut, 2012). BDPA kyvykkyyksien rakentamisen kannalta organisaation oppimisella on merkittävä rooli, sillä Teecen ja muiden (1997) mukaan se on tärkeä kilpailuedun lähde. Dynaami- sessa ympäristössä organisaation oppimisen rooli korostuu, sillä muuttuvat olosuhteet vaativat organisaation kykyä oppia ympäristöstään jatkuvasti. Oppivalla organisaatiolla tarkoitetaan jatkuvaa prosessia, jossa organisaatio tallentaa, tutkii, jakaa ja soveltaa tie- toa (Grant, 1991). Uusien teknologisten ratkaisujen myötä tieto vanhenee, joten jatkuva oppiminen on tärkeää. Prosessien jatkuva kehitys on välttämätöntä etenkin nykypäivänä, kun tietoa tuotetaan jatkuvasti suuria määriä. Organisaatio voi pysyä kilpailukykyisenä pitkällä aikavälillä, jos se kykenee jatkuvaan oppimiseen (Gupta & George, 2016). Jatkuva oppiminen on kriittinen osa BDPA kyvykkyyden luomista ja ylläpitämistä, koska se perus- tuu jatkuvaan tiedon luomiseen ja analysoimiseen. Gupta ja George (2016) väittävät, että oppivalla organisaatiolla on taito soveltaa tietämystään entistä paremmin big datasta saadusta tiedosta. Organisaation oppimisen lisäksi organisaatiokulttuurilla on suuri mer- kitys BDPA kyvykkyyden rakentamisessa sekä kehittämisessä, sillä se vaatii datalähtöistä kulttuuria (McAfee ja muut, 2012). Organisaatiokulttuuri käsitteenä on monimutkainen ja laaja. Sillä viitataan organisaation yhteisiin oletuksiin, arvoihin ja uskomuksiin, jotka näkyvät sen toiminnassa, käytännöissä ja tavoitteissa (Khazanchi ja muut, 2007). Se nähdään kestävän suorituskyvyn lähteenä. Organisaatiokulttuuria voidaan kuvata liimana, joka pitää organisaation yhdessä. Toiset taas näkevät, että organisaatiokulttuuri kattaa organisaation kaikki osa-alueet (Gupta & 26 George, 2016). LaValle ja muut (2011) osoittavat artikkelissaan, että big dataan liittyvien projektien ongelmat johtuvat ennemminkin organisaatiokulttuurin epäkohdista kuin tek- niikan puutteesta tai datan ominaisuuksista. Big datasta saatujen todellisten hyötyjen koetaan olevan suhteellisen pieniä verrattuna siihen kohdistettujen investointien mää- rään. McAfeen ja muiden (2012) mukaan tämä johtuu siitä, että organisaatioissa luote- taan liikaa johtajien aikaisempaan kokemukseen tärkeitä päätöksiä tehtäessä. Organisaa- tioissa, jossa päätöksien tekemiseen vaikuttaa vahvasti henkilön nimike tai arvo organi- saatiossa, ei todennäköisesti saada tarpeeksi hyötyä big datasta. Tämän takia on erittäin kriittistä, että organisaatio vaalii datalähtöistä organisaatiokulttuuria, jotta big datasta saatava potentiaali voidaan hyödyntää täysin. Monesti päätöksiä tehdään organisaation monella eri tasolla, joten datalähtöisen kulttuurin merkitys korostuu, jotta kaikilla työn- tekijöillä on yhtäläinen mahdollisuus tehdä hyviä ja laadukkaita dataan perustuvia pää- töksiä. Tässä tutkielmassa keskitytään inhimillisen pääoman resursseista johtamistaitoihin sekä ihmisten teknisiin taitoihin. Osa tutkijoista käyttää näistä nimeä henkilöstöresurssit, jotka muodostuvat seuraavista tekijöistä: työntekijöiden kokemus ja tieto, ongelmanrat- kaisukyky, johtajuusominaisuudet, liiketoimintakyky sekä suhde muihin työntekijöihin (Gupta & George, 2016). Useat tutkijat ovat pyrkineet todistamaan johtamistaitojen ja teknisten taitojen kriittisyyden big datan ja data-analytiikan kehittyneiden muotojen hyödyntämisessä sekä niihin liittyvien kyvykkyyksien luomisessa ja kehittämisessä (Dubey ja muut, 2019; Gupta ja muut, 2020). Tekniset taidot koostuvat lähinnä tietotai- dosta, jolla tarkoitetaan kykyä käyttää uutta teknologiaa, jonka avulla saadaan poimittua haluttua tietoa datamassoista. Johtamistaidot ovat monen vuoden kehityksen tulos. Niitä ovat muun muassa ihmissuhdetaidot, liiketoimintaymmärrys sekä datan potentiaa- lin ymmärrys ja sen hyödyntäminen. Näiden taitojen avulla organisaatiolla on mahdolli- suus kehittää BDPA-valmiuksia, organisaation oppimista sekä tietoon perustuvaa päätök- sentekokulttuuria (Dubey ja muut, 2019). 27 3.2.1 Johtamistaidot Inhimillisen pääoman kasvu ja kehitys riippuu pääosin organisaation tietokulttuurista, jota voidaan vaalia erityisten johtamistaitojen avulla. Guptan ja Georgen (2016) mukaan johtamistaidot kehittyvät ajan myötä ja niitä voidaan kehittää organisaatiossa oikeanlai- sen oppimisympäristön avulla. Kyseessä on ainutlaatuinen resurssi, jonka voi hankkia, mutta ei jäljitellä (Gupta ja muut, 2020). Organisaatiot investoivat inhimilliseen pää- omaan hyödyntääkseen ihmisten taitoja ja älykkyyttä kehittääkseen organisaation osaa- mista. Johtamistaidot ovat hyvin yrityskohtaisia ja ne kehittyvät ajan myötä tietyn ympä- ristön vaikutteista. Organisaatiolla ja sen yksilöillä on suuri vaikutus niiden kehitykseen, koska johtamistaidot kehittyvät samassa organisaatiossa työskentelevien yksilöiden vä- listen ihmissuhteiden kautta (Bharadwaj, 2000). Näitä taitoja voidaan pitää itsestään sel- vinä normeina, joiden kautta johtajat tekevät päätöksiä jokapäiväisessä työelämässä. Johtamistaidot käsittävät laajasti erilaisia toimintoja kuten, resurssien kohdentamisen ja hallinnan sekä toiminnan seuraamisen (Wang, 2018). Yhtenä tärkeimpänä on kuitenkin strategisten päätöksien tukeminen sekä päätöksenteko. Guptan ja muiden (2020) mu- kaan organisaatiot, joiden johtajat ovat kilpailukykyisiä tekemään päätöksiä, omaavat vahvimmat mahdollisuudet kehittää kasvuympäristöään. Kilpailukykyisyyden uskotaan vaikuttavan organisaation suorituskykyyn toimia sekä vakaissa että dynaamisissa olosuh- teissa ja johtaa organisaation kannalta optimaalisiin päätöksiin. Johtamistaidoilla on tär- keä rooli kyvykkyyksien luomisessa, sillä johtajilla tulee olla kyky havaita ja tunnistaa tarve uudelleen konfiguroida organisaation sisäisiä sekä ulkoisia tavoitteita ja prosesseja muuttuvien olosuhteiden mukaan (Teece ja muut, 1997). Tämä vaatii jatkuvaa markki- noiden ja liiketoimintaympäristön tarkkailua sekä niiden peilaamista oman organisaation toimintaan. Johtamistaidot ovat myös tärkeässä osassa teknologian hyödyntämisessä, sillä ilman oi- keanlaisia kyvykkyyksiä organisaatiolla ei ole mahdollisuutta hyödyntää teknologian si- sältämää täyttä potentiaalia (Gupta ja muut, 2020). Big datan ja ennustavan analytiikan tuomista hyödyistä ei ole organisaatiolle hyötyä, jos sen johtajat eivät kykene tekemään 28 strategisia päätöksiä tai poimimaan organisaation kannalta oleellista tietoa sen pohjalta (Gupta & George, 2016). On myös erittäin tärkeää, että johtajat tietävät tarkasti, miten ja mihin he käyttävät analytiikasta talteen otettuja tietoja. Tämä vaatii laajaa liiketoimin- taymmärrystä sekä muiden yksiköiden toiminnan tietämystä ja asiakkaiden sekä yhteis- työkumppaneiden tarpeiden huomioimista. On tärkeää osata tiedostaa eri osapuolien nykyiset tarpeet sekä ennustaa myös niiden tulevaisuuden tarpeet. Dynaamisien kyvyk- kyyksien näkökulmasta johtajan kyky ennakoida ja ennustaa markkinakäyttäytymistä on olennaista (Dubey ja muut, 2019). 3.2.2 Tekniset taidot Tekniset taidot ovat big datan ja data-analytiikan kannalta toinen oleellinen inhimillisen pääoman ulottuvuus. Teknisillä taidoilla viitataan usein jonkun tietyn tekniikan asiantun- temukseen sekä sen toimintojen tuntemukseen (Gupta ja muut, 2020). Edistyneen ana- lytiikan kontekstissa teknisillä taidoilla viitataan tietotaitoon, joka tarkoittaa kykyä käyt- tää erilaista sekä uutta teknologiaa sekä kykyä hyödyntää erilaisia algoritmeja datamas- san käsittelyssä. Se vaatii erityisesti kykyä omaksua uutta teknologiaa mahdollisimman nopeasti ja ketterästi (Gupta & George, 2016). Organisaatio voi vahingoittaa itseään, jos se ei hanki ja ylläpidä teknisiä taitoja (Gupta ja muut, 2016). Tämä taas voi heikentää organisaation suorituskykyä sekä johtaa toiminnan heikkoon koordinointiin. Edistynee- seen analytiikkaan liittyvät tekniset taidot ovat vielä suhteellisen harvinaisia, joten niitä omaavilla organisaatioilla on mahdollisuus saada niiden avulla etua verrattuna kilpaili- joihin. Ajan myötä taitojen jakautuminen organisaatioiden välillä tasoittuu, kun harvinai- set tekniset taidot yleistyvät. Monet tietojärjestelmien hankinnoista epäonnistuvat se takia, että organisaatio investoi liian vähän teknisten taitojen hankkimiseen ja investoi huomattavan määrän resursseja teknologisen infrastruktuurin kehittämiseen sekä tietojärjestelmien hankintaan, jolloin taidot eivät kohtaa tekniikan kanssa (Dwivedi ja muut, 2015). Organisaatioiden teknisten 29 taitojen tulisi pystyä sopeutumaan tekniikan kehitykseen. Organisaatioissa usein anne- taan suurempi merkitys teknologialle kuin työntekijöiden teknisille taidoille. Tämän takia organisaation tulisi tarjota työntekijöilleen vastuusta ja työtehtävästä riippumatta val- miudet analyyttiseen ajatteluun sekä sen kehittämiseen (Gupta ja muut, 2020). Tällä ta- valla organisaatio voi vaalia datalähtöistä organisaatiokulttuuria. Teknisten taitojen kehi- tys pitäisi olla jatkuvaa ja niitä pitäisi muokata teknologian kehittymisen myötä, sillä vain silloin organisaatiolla on mahdollisuus saavuttaa kilpailuetua ja hyödyntää taitoja pitkällä aikavälillä (Dubey ja muut, 2019). Data-analytiikan näkökulmasta hyödyllisiä teknisiä taitoja ovat muun muassa koneoppi- minen, tekoäly, tilastollisesti kuvaavan analyysin tekeminen, tiedon kerääminen ja puh- distaminen sekä ohjelmointikielien ymmärtäminen (Gupta & George, 2016). Muita tai- toja kuten tietokantataitoja, järjestelmän suunnittelua ja analysointia sekä ohjelmointi ei pidetä nykypäivänä harvinaisina taitoina, joten Gupta ja George (2016) uskovat, että ajan myötä myös edistyneeseen analytiikkaan liittyvät taidot tulevat yleisiksi eikä niiden avulla pysty enää saavuttamaan merkittävää kilpailuetua. Bharadwaj (2000) painottaa artikkelissaan, että uusien työntekijöiden kohdalla on tärkeää tutustuttaa heidät organi- saatiolle ominaisiin menetelmiin sen lisäksi, että heidät koulutetaan organisaation tieto- järjestelmiin. Tämän avulla organisaatio pystyy hyödyntämään työntekijöiden teknisisä taitoja parhaalla mahdollisella tavalla. 30 4 Data-analytiikan vaikutukset organisaation suorituskykyyn Data-analytiikan perimmäinen tarkoitus organisaation näkökulmasta on tuottaa sellaista tietoa, joka auttaa organisaatiota parantamaan suorituskykyään (Wamba ja muut, 2017; Gupta ja muut, 2020). Data-analytiikan avulla organisaatiolla on mahdollisuus tuottaa lisäarvoa sekä luoda kilpailuetua. Edistyneemmän analytiikan, kuten ennustavan analy- tiikan hyödyntäminen mahdollistaa entistä monipuolisemman tiedon tuottamisen sekä uuden näkökulman organisaation analytiikkaprosessiin. Kirjallisuudessa big datan ja en- nustavan analytiikan (BDPA) huomattava vaikutus organisaation liiketoimintaan on tun- nistettu ja BDPA on nostanut suosiotaan tutkijoiden keskuudessa viime vuosina (Gupta ja muut, 2020). Aihealueesta ei kuitenkaan vielä löydy merkittäviä määriä kirjallisuutta eikä sen vaikutuksista käytännön liiketoimintaan ole vielä tutkittu laajasti. Akterin ja mui- den (2016) mukaan BDPA:sta voi kuitenkin kehittyä organisaation ylivoimaisen suoritus- kyvyn lähde. Vidgren ja muut (2017) painottavat kuitenkin big datan ja ennustavan ana- lytiikan haasteita, sillä niiden hyödyntäminen vaatii organisaatiolta paljon resurssien sekä arvonluontiprosessin näkökulmasta. Big datan ja ennustavan analytiikan vaikutuksia organisaation suorituskykyyn on tutkittu eri näkökulmista useampien tutkijoiden toimesta (Dubey ja muut, 2019; Fosso Wamba ja muut, 2018). Gupta ja muut (2020) tuovat kuitenkin uuden näkökulman aiheeseen. He tutkivat aihetta näkökulmasta, jossa painotetaan inhimillistä pääomaa eli johtamistaitoja ja teknisiä taitoja samalla, kun organisaation teknologiaperusta muunnetaan sen ydinkil- pailukyvyksi. Hyvin hiotut ja kehittyneet johtamistaidot auttavat organisaatiota rationaa- listen päätöksien tekemisessä, kun taas kehittyneiden teknisten taitojen merkitys koros- tuu BDPA:n käytössä ja implementoinnissa. Yhdessä nämä taidot edistävät ja ohjaavat liiketoimintaprosessia niin, että organisaatiolla on mahdollisuus saavuttaa odottamatto- mia ja ainutlaatuisia tuloksia liiketoiminnassa. Tutkimuksessa on kuitenkin tutkittu vain organisaatioita, jotka omaavat jo valmiiksi teknillisiä valmiuksia, joten tutkimuksen tu- loksia ei voida yleistää. 31 Davenportin ja muiden (2012) mukaan niillä organisaatiolla, jotka kykenevät tunnista- maan big dataa kuvaavan tiedon ja maailman jatkuvan muutoksen sekä reagoimaan sii- hen nopeasti ja älykkäästi, on mahdollisuudet saavuttaa etua liiketoiminnassa. Big datan ennalta arvaamattoman luonteen takia on erittäin tärkeää, että organisaatio kykenee muuntautumaan ja muokkaamaan strategiaansa resurssikokoelmansa avulla jatkuvasti muuttuvassa liiketoimintaympäristössä (Akter ja muut, 2016). Data-analytiikkaa voidaan tarkastella samojen näkökulmien kautta, mikä tarkoittaa sitä, että organisaation tulee kyetä toimimaan muuttuvissa olosuhteissa saavuttaakseen paremman suorituskyvyn data-analytiikan avulla. Mishra ja muut (2019) tutkivat suorituskykyä erityisesti BDPA:n näkökulmasta ja painottavat, että BDPA diffuusiolla on positiivinen vaikutus organisaa- tion suorituskykyyn, koska se antaa organisaatiolle mahdollisuuden analysoida ja hallita strategiaa datalähtöisestä näkökulmasta. Big datan ja ennustavan analytiikan merkitystä liiketoimintaan voidaan pitää merkittävänä, sillä nykyään sitä voidaan käyttää samalla alalla toimivien toimijoiden erottavana tekijänä niiden suorituskyvyn suhteen. Organisaation suorituskyky big datan aikakaudella ei johdu pelkästään datan määrästä tai laadusta, vaan tärkeänä tekijänä toimii organisaation inhimillinen pääoma eli ihmiset ja niiden kyvyt (de Camargo Fiorini ja muut, 2018). Big data ja ennustava analytiikka ei poista ihmisten oivalluksien ja johtamistaitojen merkitystä suorituskyvyn luomisessa. McAfee ja muut (2012) painottavat ylimmän johdon merkitystä strategian luomisessa ja tavoitteiden asettamisessa. Ylimmän johdon tehtäviin kuuluu asettaa selkeät tavoitteet, määritellä menestyksen näkökulma ja esittää oikeita kysymyksiä organisaation toimin- nan parantamiseksi. Johtamistaidot korostuvat etenkin edistyneen analytiikan hyödyn- tämisessä, sillä ennustavan analytiikka vaatii kehittyneitä taitoja, jotta siitä saadaan mak- simaalinen hyöty irti. Mishra ja muut (2019) painottavat big datan ja ennustavan analy- tiikan roolia maksimaalisen hyödyn saavuttamisessa, sillä ne tarjoavat samanaikaisesti suuren määrän dataa ja erilaisia tekniikoita, joiden avulla voidaan luoda entistä tarkem- pia ennusteita ja malleja tulevaisuudesta. Kirjallisuudessa tuodaan esille monesti tekno- 32 logian ja datan laadun merkitys big dataan liittyvissä projekteissa, sillä datasta ei ole hyö- tyä organisaatiolle, jos se ei ole laadukasta (Arunachalam ja muut, 2018; Ji-fan Ren ja muut, 2017). Tutkiessa big datan ja ennustavan analytiikan vaikutuksia organisaation suorituskykyyn on oleellista tarkastella aihetta kontingenssiteorian näkökulmasta, sillä se painottaa ym- päristön dynaamisuutta sekä organisaation kykyä muokata itseään. Kontingenssiteoria on organisaatioteoria, jonka mukaan organisaatiot ovat avoimia järjestelmiä, jotka ovat jatkuvasti vuorovaikutuksessa ympäristönsä kanssa ja kykenevät sopeutumaan erilaisiin ympäristöpaineisiin (de Camargo Fiorini ja muut, 2018). Teoria keskittyy erityisesti ym- päristössä esiintyviin epävarmuuksiin, joihin organisaation pitää sopeutua ylläpitääkseen strategista valmiutta sekä suorituskykyä. Data-analytiikkaa voidaan tutkia kontingenssi- teorian näkökulmasta teknisenä tekijänä, sillä big datan lisääntyessä sekä uusien tekno- logisten ratkaisujen kehittyessä organisaatioiden pitää pystyä sopeutumaan muuttuviin olosuhteisiin. Kontingenssiteorian mukaan ylivoimainen organisaation suorituskyky on kiinni sisäisten ja ulkoisten tekijöiden oikeanlaisesta kohdentamisesta (Jeble ja muut, 2018). Myös Chenhall (2003) painottaa organisatorista kontekstia, jolla viitataan organi- saatioiden yksilöllisten tekijöiden vaikutukseen muuttuvissa olosuhteissa. Organisaation suorituskyvyn tärkeimpiä tekijöitä ovat Henrin (2006) mukaan organisaa- tion oppiminen, innovatiivisuus, markkinaorientaatio sekä yrittäjyys, joiden avulla orga- nisaation on mahdollista rakentaa ainutlaatuisia resursseja ja kykyjä kilpailuedun luo- miseksi. Kilpailuetu puolestaan vahvistaa organisaation suorituskykyä ja näin ollen luo eroa kilpailijoihin. Näitä neljää tekijää pidetään organisaation muutoksen ja strategisen uudistamisen avaintekijöinä, sillä niiden avulla on mahdollista muokata resursseja uu- siksi kyvykkyyksiksi ja arvonluontistrategioiksi. Kirjallisuudesta löytyy useampia aikai- sempia tutkimuksia, jotka tukevat näiden neljän tekijän positiivista vaikutusta organisaa- tion suorituskykyyn (Hult & Ketchen, 2001; Naman & Slevin, 1993; Narver & Slater, 1990). 33 Organisaation oppimista sekä markkinaorientaatiota pidetään tärkeinä osina kilpai- luedun luomista ja sitä kautta myös organisaation suorituskyvyn parantamista (Henri, 2006). Oppivalla organisaatiolla, joka kykenee oppimaan asiakkaista, kilpailijoista ja liike- toimintaympäristöstä on paremmat edellytykset havaita markkinatrendejä ja reagoida markkinoilla tapahtuviin muutoksiin ja tapahtumiin (Day, 1994). Markkinaorientaatiolla viitataan asiakkaiden tarpeiden tunnistamiseen ja sen prosessien pitkän aikavälin kehi- tykseen (Narver & Slater, 1999). Oppivalla organisaatiolla on myös yhteys organisaation innovatiivisuuteen, joka tarkoittaa organisaation kykyä muuntaa tietämys uusiksi tuot- teiksi ja prosesseiksi kilpailuedun parantamiseksi (Hurley & Hult, 1998). Innovatiivisuus ja innovaatiojohtaminen ovat ratkaisevia tekijöitä markkinoilla menestymisen näkökul- masta ja ne nähdään tärkeimpinä osina liiketoimintastrategiaa. Innovaatiojohtamisella tarkoitetaan tavoitteellista työtä uusien innovaatioiden löytämiseksi ja toteuttamiseksi (Viitala & Jylhä, 2019, s. 116). 4.1 Data-analytiikan hyödyntäminen liiketoiminnassa Data-analytiikkaa voidaan hyödyntää monilla eri toimialoilla. Datan keräämisen ja saata- vuuden takia erityisesti edistyneemmän analytiikan hyödyntäminen on keskittynyt lä- hinnä isompiin organisaatioihin tietyillä toimialoilla. Tyypillisiä toimialoja ovat muun mu- assa teollisuus, terveydenhuolto, logistiikka, vähittäiskauppa, pankki- ja vakuutussektori sekä lentoliikenne (M. Attaran & S. Attaran, 2018). Organisaatioiden sisällä data-analy- tiikkaa voidaan hyödyntää monissa eri toiminnoissa, joista yleisempiä on henkilöstöhal- linto, tuotanto, toimitusketjujen hallinta, talous, hankintaprosessit sekä markkinointi ja asiakashallinta. Organisaatiolla on mahdollisuus hyödyntää data-analytiikka laajasti eri toiminnoissa ja näin ollen vahvistaa datalähtöisen organisaation rakentamista ja kehittä- mistä. Organisaation päätöksentekoprosessi on merkittävä tekijä sen suorituskyvyssä, sillä or- ganisaatioiden toimintaa ohjataan päätöksien kautta (Maisel & Cokins, 2015). Data-ana- 34 lytiikan tarkoituksena on tuottaa tietoa, jota organisaatio voi käyttää päätöksenteon tu- kena. Optimaalisessa tapauksessa organisaation päätöksentekoprosessi perustuu data- analytiikan tuottamaan tietoon. Tämä edellyttää, että organisaatio on omaksunut data- analytiikan osaksi strategiaa ja on valmis kehittämään sekä ylläpitämään data-analytiik- kaan liittyviä kyvykkyyksiä (Davenport, 2006). Monissa organisaatioissa päätöksenteko pohjautuu edelleen johtajien intuitioon ja aikaisempaan kokemukseen, mikä nostaa pää- töksentekoon liittyviä riskejä. Davenport (2006) kuitenkin huomauttaa, että päätöksen- teossa ei tulisi kuitenkaan täysin unohtaa ihmisten vaistoja ja aikaisempaa kokemusta, vaan niiden tulisi toimia data-analytiikan tuottaman tiedon tukena. Dataan perustuvalla päätöksenteolla on Brynjolfsonin ja muiden (2011) mukaan positii- vinen vaikutus suorituskykyyn. Tutkimuksessa nostetaan esille dataan perustuvan pää- töksenteon yhteys organisaation kannattavuuteen, markkina-arvoon sekä korkeampaan tuottavuuteen. Data-analytiikka itsessään ei kuitenkaan takaa onnistunutta päätöksen- tekoa, vaan se vaatii taustalle datalähtöisen organisaation, toimivat analytiikkaprosessit sekä datalähtöistä johtamista (Berndtsson ja muut, 2018). Gupta ja George (2016) pai- nottavat johtajien kykyä poimia datasta tietoa ja tehdä organisaatiota tukevia päätöksiä niiden pohjalta. Johtajilla tulisi olla käsitys, miten ja missä data-analytiikan tuottamaa dataa voidaan soveltaa. Silloin dataan perustuvasta päätöksenteosta on hyötyä, kun joh- tajilla on ymmärrys, miten yhdistellä ja hyödyntää eri lähteistä saatua tietoa. 4.2 Data-analytiikan haasteet Data-analytiikan hyödyntämiseen liittyy monia eri haasteita, vaikka monilla organisaa- tiolla on nykyään valmiudet hyödyntää sitä tehokkaasti liiketoiminnassa. Data-analytii- kan haasteita voidaan tarkastella sekä teknisestä että organisaation näkökulmasta. Vid- gren ja muut (2017) tuovat esille organisaatioiden keskeisimmän haasteen, eli miten data-analytiikkaa hyödynnetään liiketoiminnassa niin, että organisaatio saa siitä arvoa. Data-analytiikan käyttöönottoa ei voida käsitellä pelkästään teknisenä projektina, vaan 35 kyse on laaja-alaisemmasta liiketoimintamuutoksesta. Tekniset tekijät nähdään enem- mänkin liiketoimintamuutoksen mahdollistajana sekä analytiikkaprosessien perustana. Tutkimus painottaa analytiikka- ja datastrategian luomista datalähtöisen organisaation rakentamisessa. Vidgren ja muut (2017) painottavat, että data-analytiikkaa on haasteel- lista hyödyntää, jos organisaatiolla ei ole suunniteltua strategiaa sen hyödyntämiseksi. Strategian lisäksi oikeanlaisten ihmisten löytäminen organisaatioon voi olla haasteellista. Pelkästään data-analytiikan hyödyntäminen vaatii ihmisiä, joilla on kehittyneitä teknisiä taitoja, mutta myös datalähtöisen organisaation rakentaminen vaatii oikeanlaisia ihmisiä, joilla on valmiuksia luoda muutosta. Arunachalam ja muut (2018) tutkivat analytiikkaa liittyviä haasteita big data-analytiikan näkökulmasta. Tutkimus jakaa haasteet teknisiin sekä organisatorisiin haasteisiin, sa- manlailla kuin Vidgren ja muut (2018). Molemmat tutkimukset tuovat esille samoja or- ganisatorisia haasteita, mutta Arunachalam ja muut (2018) painottavat niiden lisäksi da- taan liittyviä haasteita. Tutkimuksen mukaan datan laatu ja skaalautuvuus aiheuttavat suuria haasteita data-analytiikan hyödyntämisessä, sillä data-analytiikkaa hyödyntävän organisaation tulisi pystyä luottamaan dataan ja perustamaan päätöksentekoprosessin sen pohjalle. Datan skaalautuvuus ongelmalla viitataan datan säilytykseen sekä datan suureen volyymiin. Big data sisältää väistämättä organisaatiolle tarpeetonta dataa, joka kuormittaa tehokasta datan keräämistä sekä säilytystä. Datan määrän ja laadun lisäksi merkittävimpiä ongelmia on edistyneiden tekniikoiden ja menetelmien puute. Suuria da- tamassoja on mahdotonta hyödyntää tehokkaasti ilman laadukkaita tekniikoita ja mene- telmiä. Organisatoristen haasteiden näkökulmasta Arunachalam ja muut (2018) painottavat puutteellisia resursseja, joilla viitataan sekä IT resursseihin sekä henkilöresursseihin, ku- ten datalähtöiseen johtamiseen sekä datalähtöisen organisaation rakentamiseen. Haas- teeksi tunnistetaan myös oikeanlaisten taitojen puute etenkin edistyneemmän analytii- kan hyödyntämisessä, mikä vaatii pitkälle kehittyneitä teknisiä taitoja. Ennustavan ana- lytiikan kehittäminen, testaaminen sekä mukauttaminen organisaation tavoitteisiin vie 36 paljon aikaa, mikä kuluttaa resursseja, jotka ovat kalliita organisaatiolle (Arunachalam ja muut, 2018). Tämän vuoksi voi olla haasteellista hyödyntää data-analytiikkaa kannatta- vasti. Datalähtöisen organisaation rakentaminen, analytiikkatyökalujen hankkiminen sekä menetelmien kehittäminen vaatii organisaatiolta isoja investointeja, mikä ei välttä- mättä ole mahdollista kuin osalle organisaatioista. Data-analytiikkaan ja etenkin big datan hyödyntämiseen liittyy aina tietoturvalliset haas- teet (Arunachalam ja muut, 2018). Big dataan liittyy useita turvallisuuteen ja yksityisyy- teen liittyviä haasteita, jotka tulevat ilmi etenkin kuluttajatietojen käsittelyssä. Turvalli- suutta ja yksityisyyttä käsittelevät lait voivat vaikuttaa organisaation tiedonhallintaan ja vaikeuttaa tehokasta datan keräämistä sekä säilyttämistä. Kansainvälisissä organisaa- tioissa haasteet voivat olla entistä monimutkaisempia eri maiden lainsäädännön takia. Tämän takia organisaatioiden tiedonhallintaprosessien tulisi olla tehokkaita sekä suun- niteltu vastamaan sekä organisaation tarpeita että voimassa olevia lakeja. Zi-Hua ja muut (2014) käsittelevät tietoturvaa ja henkilödataa datan keräämisen näkökulmasta. He haastavat ajatukset keskitetysti kerätystä datasta, joka pääasiassa palvelee organisaa- tioita ja samalla vaarantaa yksityisten ihmisten yksityisyyden sekä turvallisuuden. Henki- lödataa on kerätty vuosikausia vähitellen keskitettyjen pilvipalvelujen kautta, mikä on synnyttänyt keskustelua datan keräämiseen liittyvistä eettisistä ongelmista. Organisaa- tiot joutuvat kohtaamaan datan keräämiseen ja säilyttämiseen liittyviä haasteita entistä enemmän, kun yksityisyyteen ja tietoturvallisiin kysymyksiin aletaan kiinnittämään enemmän huomiota. 4.3 Data-analytiikka tulevaisuudessa Data-analytiikka kehittyy jatkuvasti ja uusia menetelmiä kehitellään jatkuvasti. Daven- port (2018) näkee tekoälyn (AI) seuraavana merkittävänä tekijänä analytiikan kehityk- sessä. Tekoäly hyödyntää pitkälti samoja tekniikoita sekä dataa, mitä edistyneen analy- tiikan eri muodot hyödyntävät, joten tekoälyä voidaan pitää luonnollisena jatkumona or- ganisaation analytiikkaprosessissa. Davenport (2018) näkee, että organisaatioilla on 37 mahdollisuus hyödyntää valmiita analytiikkaan liittyviä resursseja ja kyvykkyyksiä teko- älyn hyödyntämisessä, mikä auttaa organisaatiota tekoälyn käyttöönotossa. Kone- ja sy- väoppimista sekä ohjelmistorobotiikkaa hyödynnetään osittain edistyneen analytiikan, kuten ennustavan analytiikan hyödyntämisessä, mikä antaa valmiudet myös tekoälyn hyödyntämiseen. Organisaatiotasolla data-analytiikan hyödyntäminen keskittyy lähinnä toimialoille, jossa datan kerääminen on tehokasta sekä datan saatavuus on korkea (M. Attaran & S. Attaran, 2018). Edistyneempää analytiikkaa, kuten ennustavaa analytiikkaa hyödynnetään nyky- ään lähinnä suurissa organisaatioissa, joilla on resursseja sekä valmiuksia kehittää analy- tiikkaprosesseja. M. Attaran ja S. Attaran (2018) tuovat esille, että teknisten taitojen yleistyessä sekä kehittyneempien tekniikoiden ja menetelmien kehittyessä myös pie- nemmillä organisaatioilla eri toimialoilla on mahdollisuus hyödyntää data-analytiikkaa liiketoiminnassaan. Teknisten taitojen sekä johtamistaitojen kehittyessä, organisaatioi- den kyvyt kehittää uusia menetelmiä sekä valmiudet hankkia uutta teknologiaa parantu- vat jatkuvasti. Jatkuva kehitys auttaa uusia organisaatioita kehittämään omia data-ana- lytiikka valmiuksia sekä tasoittaa organisaatioiden välisiä eroja. Useat tutkimukset ovat todistaneet datalähtöiseen organisaatiokulttuurin sekä inhimilli- sen pääoman olevan merkittävimpiä tekijöitä big datan ja data-analytiikan vaikutuksessa organisaation suorituskykyyn (Akter ja muut, 2016; Gupta & George, 2016; Mikalef ja muut, 2019; Fosso Wamba ja muut, 2020). Johtamistaidot ja tekniset taidot nähdään kriittisinä tekijöinä, sillä sijoittamalla pelkästään teknologisiin ratkaisuihin ei tuota arvoa organisaatiolle. Tulevaisuudessa datalähtöisen kulttuurin sekä yksittäisten henkilöiden taidot korostuvat organisaatioiden analytiikkaprosessien kehittämisessä, kun teknologia ja erilaiset edistyneet analytiikkaratkaisut kehittyvät sekä yleistyvät yhä useampien or- ganisaatioiden saataville. 38 5 Tutkimusmenetelmät ja aineisto Tässä luvussa käsitellään tutkielman tutkimusmenetelmää, tutkittavan kohderyhmän ra- jausta sekä esitellään aineistonkeruumenetelmät ja haastateltavat. Luvussa käydään myös läpi aineiston analysointiin liittyviä menetelmiä sekä tuodaan esille tutkimuksen luotettavuuteen liittyviä seikkoja. 5.1 Tutkimusmenetelmä Tutkielman päätavoitteena on selvittää minkälaisia vaikutuksia big datalla ja ennustavalla analytiikalla on organisaation suorituskykyyn ja minkälaisia hyötyjä organisaatioissa on havaittu. Tutkimuskysymyksiin haetaan vastauksia laadullisen tutkimuksen avulla, sillä tavoitteena on saada kokonaisvaltaista tietoa sekä syvällisempää ymmärrystä organisaa- tioiden data-analytiikkakyvykkyyksistä. Tyypillisesti laadullisen tutkimuksen tavoitteena on ymmärtää tutkittavaa ilmiötä tutkimuksen kohteen näkökulmasta sekä tuottaa laadu- kasta, yksityiskohtaista ja kokonaisvaltaista tietoa tutkittavasta ilmiöstä (Puusa ja muut, 2020). Laadullisessa tutkimuksessa tutkimuksen kohteen ajatukset, kokemukset, tunteet ja niiden merkitykset ovat keskiössä. Tässä tutkielmassa tutkimuksen kohteena esiintyy organisaatiot ja niitä edustavat henkilöt. Laadullisen tutkimuksen ominaispiirteinä voidaan pitää hypoteesittomuutta sekä aineis- ton keräämisen harkinnanvaraista otantaa (Eskola & Suoranta, 1998). Laadullisessa tut- kimuksessa tavoitteet asetetaan usein tutkimuskysymyksien muodossa, joiden avulla py- ritään saamaan erilaisia näkökulmia tutkittavasta ilmiöstä verrattuna hypoteesien aset- tamiseen (Puusa ja muut, 2020). Tämän tutkielman tavoitteena on kasvattaa ymmärrystä tutkittavasta ilmiöstä sekä data-analytiikan vaikutuksista organisaation toimintaan eikä niinkään tehdä yleistyksiä kyseisestä ilmiöstä. Laadullisessa tutkimuksessa pyritään kes- kittymään pieneen määrään tapauksia, jolloin otannassa painottuu määrän sijasta laatu (Eskola & Suoranta, 1998). Harkinnanvaraisen otannan tarkoituksena on analysoinnin perusteellisuus, mikä on mahdollista vain tarpeeksi pienellä määrällä tapauksia. 39 Tutkielman tavoitteena on saada kokonaisvaltaista tietoa organisaatioiden data-analy- tiikka valmiuksista sekä saavutetuista hyödyistä, minkä takia laadullinen tutkimus sopii tutkielman tutkimusmenetelmäksi. Tutkielma toteutetaan vertailevana tapaustutkimuk- sena, jonka tavoitteena on tunnistaa eri tapauksien välisiä yhtäläisyyksiä ja eroavaisuuk- sia (Puusa ja muut, 2020). Tapaustutkimuksessa on tyypillistä, että kerättyä aineistoa on suuri määrä jokaista tapausta kohden, jolloin ilmiötä on mahdollista tarkastella syvälli- sesti. Kvantitatiivisella menetelmällä tutkittavasta ilmiöstä ei olisi mahdollista saada yhtä syvällistä ja merkityksellistä tietoa. Myös tutkittavan ilmiön uutuusarvon vuoksi ilmiöstä ei olisi mahdollista saada tarpeeksi kattavaa aineistoa määrälliseen tutkimukseen. Vertailevaa tapaustutkimusta voidaan pitää empiirisenä tutkimuksena, jossa tutkittavaa ilmiötä tarkastellaan sen luonnollisessa ympäristössä (Eskola & Suoranta, 1998). Tarkoi- tuksena ei ole tehdä yleistäviä päätelmiä vaan vertailla eri tapauksia keskenään ja analy- soida niitä omassa ympäristössään. Tässä tutkielmassa halutaan tutkia organisaatioiden data-analytiikka valmiuksia ja data-analytiikasta saavutettuja hyötyjä niiden todellisessa ympäristössä ja kasvattaa ymmärrystä tämänhetkisestä tilanteesta, niistä organisaa- tioista, jotka ovat edelläkävijöitä edistyneen analytiikan hyödyntämisessä. Kasvattamalla ymmärrystä edelläkävijöiden data-analytiikan tilasta on muilla organisaatioilla mahdolli- suus oppia sen hetkisistä johtavista data-analytiikan hyödyntämiskäytännöistä (Mer- chant ja Otley, 2020). 5.2 Aineistonkeruumenetelmä Tutkielman aineistonkeruumenetelmänä käytettiin puolistrukturoitua haastattelua, joka antaa mahdollisuuden vastaajalle vastata kysymyksiin täysin omin sanoin (Eskola & Suo- ranta, 1998). Puolistrukturoidussa haastattelussa teemat sekä kysymykset on päätetty etukäteen, mutta se antaa mahdollisuuden esittää tarkentavia kysymyksiä haastatelta- valle annettujen vastauksien perusteella. Puolistrukturoitu haastattelu mahdollistaa sy- vällisemmän sekä yksityiskohtaisemman tiedon saamisen eri organisaatioista niiden 40 oman toimintaympäristön näkökulmasta. Samalla puolistrukturoidun haastattelun etuna on se, että ennalta määriteltyjen kysymyksien avulla saadaan kaikilta haastatelluilta sa- moihin aiheisiin vastaukset, jolloin vastauksien vertailtavuus on helpompaa (Puusa ja muut, 2020). Sarajärvi ja Tuomi (2018) kuvailevat haastattelua menetelmänä joustavaksi, minkä tavoit- teena on saada mahdollisimman paljon tietoa halutusta ilmiöstä. Joustavuudella tarkoi- tetaan haastattelun aikana tapahtuvaa keskustelua, kuten tarkentavia kysymyksiä ja vää- rinymmärryksien korjausta. Haastattelun etuihin kuuluu se, että haastateltavaksi voi- daan valita henkilöitä, joilla on kokemusta tutkittavasta ilmiöstä (Puusa ja muut, 2020). Haastattelulla saadaan yleensä laajempia ja yksityiskohtaisempia vastauksia, eli run- saampaa aineistoa, verrattuna posti- ja internetkyselyihin, minkä takia tutkielman aineis- tonkeruumenetelmäksi valikoitui haastattelu (Sarajärvi & Tuomi, 2018). Puusa ja muut (2020) korostavat haastattelun subjektiivisuutta, joka mahdollistaa tulkintojen, havain- tojen sekä päätelmien tekemisen haastattelutilanteessa. Näihin kuuluu muun muassa eleet ja ilmeet. Haastattelumenetelmä asettaa myös rajoitteita aineiston keruulle (Puusa ja muut, 2020). Haastattelut perustuvat aina tutkittavan kohteen tulkintaan, eikä absoluuttiseen todelli- suuteen, mikä saattaa vaikuttaa aineiston luotettavuuteen. Haastatteluissa voi tapahtua tulkintavirheitä niin haastateltavan kuin haastattelijan puolesta. Haastattelu antaa tutki- jalle mahdollisuuden päästä syvemmin ymmärtämään haastateltavan kokemuksia ja kä- sityksiä, sillä jokainen tutkimuksen kohde on erilainen ja ainutkertainen. Tässä tutkiel- massa tavoitteena on kerätä aineistoa erilaisten organisaatioiden havainnoista ja koke- muksista syvällisemmin, mikä tukee haastattelumenetelmän valintaa. 41 5.3 Tutkittava kohderyhmä ja tiedonkeruun toteutus Tutkittavan kohderyhmän rajaamiseen vaikuttivat tutkimusmenetelmän sekä aineiston- keruumenetelmän valinta. Tutkielmassa tutkittava kohderyhmä rajattiin suomalaisiin or- ganisaatioihin, jotka ovat edelläkävijöitä edistyneen analytiikan hyödyntämisessä. Ta- voitteena oli kerätä aineistoa, joka edustaa data-analytiikan näkökulmasta kehittyneim- pien organisaatioiden data-analytiikka valmiuksia ja data-analytiikasta saavutettuja hyö- tyjä. Tutkielman aiheen uutuusarvon sekä suhteellisen matalan edistyneen analytiikan hyödyntämisasteen takia kohderyhmää ei haluttu rajata minkään toimialan mukaan, sillä se olisi hankaloittanut aineiston keräämistä merkittävästi. Merchantin ja Otleyn (2020) mukaan liiketoiminnan kannalta hyödyllisimpinä tutkimuksina pidetään niitä, jotka tuo- vat esille edelläkävijöiden käytäntöjä tutkittavasta aiheesta ja esimerkkejä ylivoimaisen suorituskyvyn luomisesta. Tämän takia haastateltaviksi valikoitui suomalaisia yksityisiä sekä julkisia suuryrityksiä ja -organisaatioita, joissa hyödynnetään edistynyttä analytiik- kaa merkittävästi. Suurien organisaatioiden edistyneen analytiikan valmiudet ja kyvykkyydet ovat yleensä kehittyneemmällä tasolla verrattuna pieniin ja keskisuuriin organisaatioihin (M. Attaran & S. Attaran, 2018). Suurilla organisaatioilla on todennäköisemmin paremmat valmiudet kehittää data-analytiikka kyvykkyyksiä sekä investoida niihin. Mishra ja muut (2019) pai- nottavat teknillisten valmiuksien sekä henkilöstöresurssien vaikutusta organisaation ky- kyyn omaksua ja hyödyntää data-analytiikkaa ja etenkin ennustavaa analytiikkaa paran- taakseen organisaation suorituskykyä. Ottaen huomioon edistyneeseen analytiikkaan liittyvät korkeat teknilliset vaatimukset voidaan olettaa, että suurilla organisaatioilla on lähtökohtaisesti paremmat valmiudet rakentaa sellaisia valmiuksia, joista tässä tutkiel- massa halutaan kerätä tietoa. Haastateltaviksi valikoitui suurien suomalaisten organisaatioiden data-, AI- ja analytiik- kajohtajia sekä henkilöitä, jotka ovat vastuussa edistyneeseen analytiikkaan liittyvistä ratkaisuista. Haastateltavien henkilöiden kokemus data- ja analytiikka-alalta vaihteli kol- mesta vuodesta yli 20 vuoteen. Suurin osa haastateltavista oli toiminut data-analytiikan 42 parissa 10–20 vuotta. Haastateltaviksi valittiin henkilöitä, jotka toimivat myös esimies- asemassa tai tiiminvetäjän roolissa, sillä tutkielmassa käsitellään myös inhimillisen pää- oman vaikutusta data-analytiikan hyödyntämisessä, kuten johtamistaitoja. Haastatelta- vaksi pyrittiin valikoimaan sellaisia henkilöitä, joilla on mahdollisimman kokonaisvaltai- nen käsitys organisaation data-analytiikan hyödyntämisestä. Haastateltavat organisaatiot olivat energia-, media-, vakuutus-, finanssi- ja teollisuustoi- mialoilta sekä suunnittelu- ja konsultointialoilta. Yhteensä haastatteluita tehtiin seitse- mään eri organisaatioon, jotka edustavat kuutta eri toimialaa. Tutkimukseen osallistu- vien haastelevien määrään vaikutti laadullisen tutkimuksen perusperiaatteet, joiden mu- kaan laadullisessa tutkimuksessa tärkeää on kuvata ja ymmärtää tutkittavaa ilmiötä eikä tehdä tilastollisia yleistyksiä (Sarajärvi & Tuomi, 2018). Tutkielman tekemiseen liittyy aina aikataulullisia rajoitteita, jotka vaikuttavat sekä aineiston hankintaan, että aineiston analysointiin käytettävään aikaan. Haastelevien määrään vaikutti osittain sääntö aineis- ton koon määrittämisestä eli saturaatio, jonka mukaan aineistoa on silloin riittävästi, kun uudet tapaukset eivät tuota enää lisäarvoa (Eskola & Suoranta, 1998). Edellä mainittujen seikkojen myötä tultiin lopputulokseen, että seitsemän haastattelua on sopiva määrä tutkielman toteuttamiseen. Haastattelut toteutettiin puolistrukturoiduilla haastatteluilla. Haastattelurunko (liite 1.) toimitettiin haastateltaville etukäteen sähköpostitse, jotta heillä oli mahdollisuus tutus- tua kysymyksiin etukäteen ja valmistautua haastatteluun. Haastattelurunko koostui nel- jästä eri osa-alueesta, jotka olivat yleiset tiedot, tiedon kerääminen, data-analytiikan ja ennustavan analytiikan hyödyntäminen, inhimillinen pääoma sekä hyödyt ja haasteet. Haastattelurunko oli sama kaikille haastateltaville, mutta tarkentavat, haastattelurungon ulkopuoliset, kysymykset vaihtelivat haastateltavien vastauksien perusteella. Haastatte- lukysymykset suunniteltiin ennalta määriteltyjen teemojen perusteella ja ne pohjautuvat aikaisempaan tieteelliseen tutkimukseen (Akter ja muut, 2016; Wamba ja muut, 2017; Gupta ja muut, 2020). Kysymyksien laadinnassa pyrittiin käyttämään muotoja mitä, mi- ten, millä ja minkälainen, jotka ohjaavat vastaajaa kuvailemaan haluttua asiaa laajemmin. 43 Jokaisen pääkysymyksen alle laadittiin myös tarkentavia kysymyksiä, jotta voitiin varmis- tua, että haastatteluista saadaan irti sellaista tietoa, mikä antaa vastauksia tutkielman tutkimuskysymyksiin. Haastattelut toteutettiin joulukuun 2022 sekä huhti- ja toukokuun 2023 aikana etänä Zoom-sovelluksen välityksellä. Haastattelujen kesto vaihteli noin 40 minuutin ja 1 tunti 20 minuutin välillä. Haastatteluita tehtiin yhteensä seitsemän kappaletta, yksi haastat- telu per organisaatio. Haastatteluiden lisäksi tutkielmassa hyödynnettiin organisaatioi- den nettisivuja, taloudellisia tietoja sekä haastateltavien henkilöiden LinkedIn-profiileja. Aineiston keruusta tehty yhteenveto on esitetty taulukossa 1, josta käy ilmi haastatelta- vien työnimike, haastattelun kesto sekä toimiala. Taulukko 1. Haastateltavien taustatiedot. Toimiala Työnimike Haastattelun kesto Media Datajohtaja 1 h 9 min Insinööritoimisto Digitalisaatiojohtaja 45 min Teollisuus Tuoteomistaja, analytiikka 1 h 18 min Energia Data- ja analytiikkajohtaja 38 min Finanssi Data- ja tekoälyjohtaja 57 min Vakuutus Analytiikkajohtaja 58 min Energia Data- ja tekoälyjohtaja 52 min 5.4 Aineiston analysointi Aineiston analysointi koostuu erilaisista vaiheista, joista osa menee limittäin aineiston keruun kanssa (Puusa ja muut, 2020). Analysointia tapahtuu jo aineiston keruussa, kun tutkija tulkitsee ja tekee havaintoja haastattelun perusteella. Laadullisen aineiston ana- lyysin tavoitteena on selkeyttää kerättyä aineistoa ja sitä kautta tuottaa uutta tietoa tut- kittavasta ilmiöstä (Eskola & Suoranta, 1998). Puusan ja muiden (2020) mukaan analyysin 44 tarkoitus on tuottaa perusteltu tulkinta kerätystä aineistosta sekä tehdä johtopäätöksiä. Analyysivaihe pitää sisällään aineiston eri osien analysointia eli erittelyä, tiivistämistä ja luokittelua sekä synteesien laatimista eli kokonaiskuvan laatimista. Näiden lisäksi merkit- tävässä roolissa on tutkijan oma tulkinta, sillä tutkielma ei saisi jäädä pelkästään aineis- ton kuvaukseksi. Aineiston analysoinnin lähestymistavaksi valittiin teemoittelu sekä tyypittely, joiden avulla pyritään löytämään samankaltaisuuksia sekä erilaisuuksia aineistosta (Puusa ja muut, 2020). Teemoittelun tarkoituksena on luokitella havaintoja niiden samankaltaisuu- den perusteella ja löytää aineistosta yhteneviä piirteitä yhdistelemällä löydettyjä saman- kaltaisuuksia. Teemoittelussa teemat voivat olla ennakkoon hahmoteltuja tai ne voivat syntyä aineiston keruu- tai analysointivaiheessa. Juhila (2021) painottaa, että haastatte- lun teemat eivät tarkoita samaa kuin teemoittelussa syntyvät teemat. Tutkijan tulee olla avoin aineiston analysointivaiheessa, jotta aineisto pysyy analyysin keskiössä eikä tutki- jan ennakkokäsitykset. Tyypittelyssä pyritään ryhmittelemään aineistoa, joko samankal- taisuuksien tai erilaisuuksien mukaan (Sarajärvi & Tuomi, 2018). Tässä tutkielmassa kes- kitytään myös erilaisuuksien ja poikkeavuuksien analysointiin. Erilaisuuksien analysointi on yhtä tärkeää kuin samankaltaisuuksien, sillä se auttaa jäsentelemään samankaltai- suuksia ja tuo näin rikkaampaa sisältöä analyysiin (Puusa ja muut, 2020). Haastatteluista kerätty aineisto käsiteltiin asianmukaisesti haastatteluiden jälkeen. Nau- hoitetut haastattelut litteroitiin ja jokainen vastaus eriteltiin siihen liittyvän kysymyksen alle selkeyttämään analyysivaihetta. Litteroinnissa poistettiin yksittäisten sanojen toistot sekä muut merkityksettömät täytesanat helpottamaan lukemista sekä analysointia. Nau- hoitettua haastattelumateriaalia syntyi yhteensä 6 tuntia ja 37 minuuttia ja litteroitua aineistoa yhteensä 70 sivua. Analysointi aloitettiin käymällä läpi koko aineisto haastattelu kerrallaan, jotta kaikki haas- tattelut muistuivat mieleen ja saatiin alustava kokonaiskuva aineistosta. Aineisto jaettiin 45 haastattelussa esitettyjen kysymyksien mukaan, niin, että kaikkien haastateltavien vas- tauksia pystyttiin analysoimaan yhdessä. Luokittelun avulla pyrittiin löytämään saman- kaltaisuuksia, jonka jälkeen lähdettiin hahmottelemaan teemoja. Teemoittelussa otettiin huomioon haastattelussa asetetut teemat, mutta pyrittiin myös löytämään uusia näkö- kulmia haastatteluista. Aineistosta etsittiin myös erilaisuuksia, joiden avulla pystytään vertailemaan eri organisaatioita data-analytiikan näkökulmasta. Teemoittelun avulla py- rittiin etsimään vastauksia tutkimuskysymyksiin sekä tekemään tulkintoja tutkittavasta ilmiöstä. 5.5 Tutkimuksen luotettavuus Tutkimuksen luotettavuutta arvioidaan yleensä validiteetin ja reliabiliteetin näkökul- mista (Puusa ja muut, 2020; Sarajärvi & Tuomi, 2018). Laadullisessa tutkimuksessa vali- diteetilla tarkoitetaan tutkittavan ilmiön eheyttä eli tutkitaanko tutkielmassa sitä ilmiötä mitä on tarkoitus tutkia. Reliabiliteetilla viitataan tuloksien toistettavuuteen eli siihen, tuottaako tutkimus samanlaisia tuloksia riippumatta tutkimusmenetelmästä tai -kerrasta. Laadullisessa tutkimuksessa on kuitenkin mahdotonta saada täysin samanlaisia tuloksia, sillä tutkimuksen aineisto perustuu haastateltavien subjektiiviseen käsitykseen tutkitta- vasta ilmiöstä. Puusa ja muut (2020) painottavat, että laadullisen tutkimuksen luotettavuutta tulee kä- sitellä laajemmin, kuin pelkästään validiteetin ja reliabiliteetin näkökulmista. Tutkimus- tuloksia arvioitaessa tulisi pohtia tutkimuksen siirrettävyyttä eli olisiko mahdollista saada samanlaisia tutkimustuloksia eri tutkimusympäristössä. Siirrettävyyden lisäksi laadullista tutkimusta voidaan arvioida myös uskottavuuden ja vahvistuvuuden näkökulmista (Es- kola & Suoranta, 1998). Tutkimuksen uskottavuutta voidaan arvioida kuinka hyvin tutki- jan tulkinnat vastaavat tutkittavien käsityksiä. Tutkijan on kyettävä tulkitsemaan aineis- toa niin, että tulkinnat ovat linjassa haastateltavien vastauksien kanssa. Tutkimuksen luo- tettavuutta parantaa myös se, että tutkijan tekemät tulkinnat ovat linjassa aikaisemmin 46 tehdyn tutkimuksen kanssa, jolloin vahvistuvuus paranee. Tutkielmassa on pyritty käyt- tämään riittävästi aikaa aineiston tutustumiseen ja haastattelujen läpikäymiseen, jotta tulkinnat olisivat mahdollisimman luotettavia. Aineiston riittävyys sekä analyysin kattavuus tulee ottaa huomioon tutkimuksen luotet- tavuuden arvioinnissa (Eskola & Suoranta, 1998). Aineiston riittävyyttä voidaan tarkas- tella saturaation näkökulmasta, jota pohdittiin jo aineistonkeruuvaiheessa. Aineiston ko- koa laadullisessa tutkimuksessa voi olla vaikea määritellä etukäteen, jolloin on järkevää tarkastella aineiston kokoa saturaation näkökulmasta. Analyysin kattavuudella tarkoite- taan tutkijan kykyä tehdä monipuolisia ja kokonaisvaltaisia tulkintoja, joille löytyy katta- vasti perusteluja aineistosta (Eskola & Suoranta, 1998). Yksittäisten poimintojen perus- teella tehdyt tulkinnat eivät tue tutkimuksen luotettavuutta. Tutkielman luotettavuus huomiotiin koko tutkimusprosessin ajan perehtymällä kohdeil- miöön huolellisesti ja valitsemalla tutkielmalle sopivat metodit. Puusa ja muut (2020) painottavat luotettavuuden arvioimista tutkimusprosessin jokaisessa vaiheessa. Luotet- tavuuteen kiinnitettiin huomiota myös aineistonkeruuvaiheessa, jossa haastattelut olivat suuressa roolissa. Haastateltaville kerrottiin tutkielmasta ja sen tavoitteista mahdollisim- man kattavasti sekä annettiin mahdollisuus tutustua haastattelukysymyksiin etukäteen. Näin voitiin varmistua siitä, että aineisto on mahdollisimman laadukasta. Tutkielmassa haluttiin edistää luotettavuutta anonymiteetillä, josta kerrottiin haastateltaville jo haas- tattelukutsun yhteydessä. Anonymiteetin tarkoitus on suojata haastateltavaa, kun kyse on arkaluontoisesta aiheesta (Eskola & Suoranta, 1998). Anonymiteettisuojan avulla on todennäköisempää saada haastateltavia tutkielmaan sekä kerätä laadukkaampaa ja yk- sityiskohtaisempaa aineistoa kohdeorganisaatioista. Tämän tutkielman menetelmäosiossa kerrotaan yksityiskohtaisesti tutkimusmenetel- miin sekä aineiston keruuseen liittyvistä valinnoista ja seikoista. Tutkielmassa on myös kuvattu aineiston analysointiprosessia sekä seikkoja, joilla on pystytty vahvistamaan tut- 47 kimuksen luotettavuutta jo ennen aineiston keruuta. Laadullisessa tutkimuksessa oleel- lista on, että tutkimusaineisto ja analyysimenetelmät ovat linjassa käytetyn teorian ja aineiston kanssa (Puusa ja muut, 2020). 48 6 Tutkimuksen tulokset Tässä luvussa esitellään tutkimuksen tulokset, jotka perustuvat haastatteluaineiston pohjalta tehtyyn analyysiin. Tuloksia peilataan saman aihepiirin aikaisempiin tutkimus- tuloksiin. Tulokset esitellään omissa alaluvuissaan mukaillen haastattelurungon teemoja. Ensimmäisessä alaluvussa käsitellään tiedon keräämiseen ja big dataan liittyviä teemoja sekä data-analytiikan ja ennustavan analytiikan roolia organisaatioissa. Toisessa alalu- vussa käydään läpi data-analytiikan hyödyntämistä sekä erilaisten analytiikkaratkaisui- den käyttötapauksia. Kolmannessa alaluvussa analysoidaan inhimillistä pääomaa data- analytiikan hyödyntämisessä, jonka jälkeen käsitellään organisaatioiden kokemia hyötyjä data-analytiikan hyödyntämisestä sekä käydään läpi data-analytiikkaan liittyviä haasteita ja tulevaisuuden mahdollisuuksia. Tutkimuksen tuloksissa etsitään vastauksia seuraaviin tutkimuskysymyksiin: 1. Minkälainen rooli big datalla ja ennustavalla analytiikalla on organisaatioissa? 2. Miten inhimillinen pääoma nähdään data-analytiikan hyödyntämisessä? 3. Mitä hyötyjä organisaatiot ovat saavuttaneet data-analytiikan ja ennustavan ana- lytiikan avulla? Tutkimuksen tuloksien esittelyssä haastateltavien suoriin lainauksiin viitataan lyhentein H1-H7. 6.1 Big datan ja ennustavan analytiikan rooli organisaatioissa Ensimmäiseksi kartoitettiin big datan ja ennustavan analytiikan roolia organisaatioissa. Tavoitteena oli selvittää mitä big data tarkoittaa kohdeorganisaatioissa ja minkälaista da- taa organisaatiot keräävät. Tämän lisäksi kartoitettiin organisaatioiden data-analytiikka valmiuksia kokonaisuudessaan, sillä tavoitteena oli selvittää minkälainen rooli ennusta- valla analytiikalla on organisaatioiden analytiikkakokonaisuudessa, ja millä tasolla ennus- tavaa analytiikkaa hyödynnetään suomalaisissa organisaatioissa, jotka ovat edelläkävi- jöitä edistyneen analytiikan hyödyntämisessä. On oleellista selvittää organisaatioiden 49 data-analytiikka valmiuksia sekä datan keräämiseen liittyviä seikkoja, jotta voidaan ana- lysoida tutkielman muita teemoja ja näkökulmia sekä vertailla eri organisaatioiden koke- mia hyötyjä ja haasteita. Pelkät tekniset analytiikkaratkaisut ja data eivät tuota hyötyä organisaatiolle, mutta ne ovat edellytys data-analytiikka kyvykkyyksien rakentamiselle (Gupta & George, 2016; Gupta ja muut, 2020). 6.1.1 Big data ja datan lähteet Haastateltavilta kysyttiin mitä big data tarkoittaa organisaatiossa ja mistä lähteistä dataa kerätään. Haastatteluista kävi ilmi, että suurin osa organisaatioista ei käytä big data -ter- miä toiminnassaan, eikä heillä ole tarvetta eritellä kerättyä dataa big dataksi. Organisaa- tioissa puhutaan yleisesti datasta, vaikka se olisikin luonteeltaan big datan kaltaista suurta, strukturoimatonta dataa. Organisaatioissa tunnistetaan mitkä niiden keräämästä datasta on big dataa, mutta organisaatioilla ei ole tarvetta määritellä sitä tarkemmin. Davenport ja muut (2012) tunnistavat termin määrittelemättömyyden ja ongelmat, jotka johtuvat big datan moninaisista ominaisuuksista ja ulottuvuuksista. Eräs haastateltava kiteytti käsityksen big datasta seuraavasti: ” -- terminä se ei tarkoita varsinaisesti mitään, että ehkä se viittaa vain siihen, että silloin puhutaan isoista tietomassoista.” (H4) Organisaatiot keräävät suuria määriä dataa erilaisista lähteistä. Haastatteluissa pyydet- tiin erittelemään sisäisen ja ulkoisen datan lähteitä. Kaikissa organisaatioissa hyödynne- tään selkeästi enemmän sisäistä kuin ulkoista dataa, vaikka ulkoisen datan merkitys osassa organisaatioista on myös merkittävä. Datan lähteet vaihtelevat suuresti organi- saation toimialan mukaan, vaikka kaikista organisaatioista löytyy myös samanlaisia datan lähteitä, kuten HR-, talous- ja asiakasdataa. Organisaatiot, joiden liiketoiminta perustuu fyysisten hyödykkeiden tuottamiseen tai aineellisen pääoman hyödyntämiseen, tuotta- vat suuria määriä dataa suoraan tuotantoon liittyvistä koneista, laitteista ja tehtaista. Muissa organisaatioissa, joiden liiketoiminta perustuu erilaisten palveluiden tarjontaan tai digitaalisen sisällön tuotantoon, merkittävimpinä datoina pidettiin transaktio-, tilaus-, 50 laskutus- ja myyntidataa sekä jatkuvasti internetissä syntyvää dataa klikkimääristä (clickstream). Osa organisaatioista kerää dataa klikkimääristä, joka on luonteeltaan tyypillisesti struk- turoimatonta ja määritellään big dataksi sen nopeuden ja volyymin vuoksi (Fosso Wamba ja muut, 2015). Samoissa organisaatioissa asiakas- sekä myyntidataa pidettiin tärkeim- pinä datan lähteinä, sillä niitä hyödynnetään yhdessä profiloimaan ja ymmärtämään asiakasta paremmin. Palveluita tarjoavat ja digitaalista sisältöä luovat organisaatiot ke- räävät dataa asiakkaiden toiminnasta eri alustoilta ja painottivat haastatteluissa asiakas- datan arvoa. Myös IoT data, eli internettiin yhdistettyjen laitteiden data, on yksi big datan lähteistä, jonka määrä kasvaa jatkuvasti uusien laitteiden ja sensoreiden myötä (Ahmed ja muut, 2017). Organisaatiot, joiden liiketoiminta keskittyy tuotantoon tai teollisuuteen keräävät suuria määriä IoT dataa, josta teollisuudessa käytetään myös termiä IIoT (Industrial In- ternet of Things). Dataa kerätään tuotannon laitteista ja koneista, jotka tuottavat jatku- vasti aikasarja- ja mittausdataa sekä erilaista dataa laitteiden suorituskyvystä. Perintei- semmissä organisaatioissa, joiden liiketoiminta painottuu tuotantoon, suurin osa sisäi- sestä datasta kertyy tuotannon sadoista eri järjestelmistä. Ulkoinen data koostuu lähteistä, jotka ovat muiden toimijoiden tuottamaa dataa asioista joihin organisaatiolla ei suoraan ole vaikutusta (Kwon ja muut, 2014). Kaikki kohdeorga- nisaatiot keräävät sisäisen datan lisäksi ulkoista dataa, jonka merkitys organisaatioille on selkeästi pienempi. Ulkoista dataa kerätään erilaisista avoimista sekä maksullisista läh- teistä. Avoimista lähteistä hyödynnetään muun muassa säädataa, tilastokeskuksen dataa, karttatietoja sekä maankäyttöön ja kiinteistöihin liittyvää dataa. Maksullisiin lähteisiin sisältyy markkinadataa, toimittajadataa sekä paikkatietodataa. Haastateltavat listasivat useita erilaisia ulkoisia lähteitä, sillä niiden tarve määräytyy pitkälti toimialan mukaan. Optimaalisessa tilanteessa ulkoinen data tukee organisaation sisäistä dataa ja luo sitä kautta lisäarvoa (Kwon ja muut, 2014). 51 6.1.2 Datan arvo Haasteltavilta kysyttiin millainen arvo datalla on, koska haluttiin selvittää minkälainen rooli datalla on organisaatioissa ja kuinka tärkeänä haastateltavat kokevat sen. Datan arvo luokitellaan yhdeksi big datan ulottuvuuksista ja sillä viitataan yleensä taloudellisen arvon tuottamiseen datasta (Fosso Wamba ja muut, 2015). Tutkielman tavoitteena on selvittää minkälaisia hyötyjä organisaatiot ovat havainneet data-analytiikan hyödyntämi- sestä, minkä takia on oleellista selvittää miten organisaatiot näkevät kerätyn datan arvon. Haastateltavien näkemykset datan arvosta olivat pääosin samansuuntaisia, vaikka haas- tateltavien näkemykset arvon syntymisestä vaihtelivat hieman. Suurin osa haastatelta- vista pitivät dataa tärkeänä ja sen arvoa suurena. Haastateltava 2 sanoi, että se on tärkein asia mitä heillä on organisaationa. Data nähtiin myös arvoa merkittävämpänä tekijänä, jopa organisaation liiketoiminnan perustana: ”-- ilman dataa meillä ei olisi liiketoi