VAASAN YLIOPISTO TEKNIIKAN JA INNOVAATIOJOHTAMISEN YKSIKKÖ TIETOJÄRJESTELMÄTIEDE Sinikka Sysky FENOMENOGRAFINEN TUTKIMUS ALGORITMIEN ETIIKASTA Tietojärjestelmätieteen pro gradu -tutkielma Teknisen viestinnän maisterikoulutusohjelma VAASA 2019 2 SISÄLLYSLUETTELO sivu 1. JOHDANTO 6 1.1 Tutkimuksen tarkoitus ja tavoite 7 1.2 Tutkimusaineisto ja -menetelmä 7 2. ALGORITMIT 10 2.1 Mitä ovat algoritmit 10 2.2 Algoritmien eettiset ohjeet 12 3. INFORMAATIOTEKNOLOGIAN FILOSOFIA 14 3.1 Yleisiä IT-filosofian näkökulmia 14 3.2 Tietokone-etiikan historia 16 3.3 Yleistä tietokone-etiikasta 18 3.4 Tietokone-etiikkaan liitettyjä eettisiä näkökulmia 19 3.5 Floridin informaatioetiikka 20 4. ETIIKKA 22 4.1 Etiikan käsitteestä 22 4.2 Analyyttinen etiikka 23 4.3 Normatiivinen etiikka 25 4.4 Tutkimusetiikka soveltavan etiikan esimerkkinä 26 4.5 Deskriptiivinen etiikka 27 5. FENOMENOGRAFINEN TUTKIMUS 29 5.1 Fenomenografia tutkimusmenetelmänä 29 5.2 Fenomenografinen tutkimusprosessi 30 5.3 Aineiston hankinta ja analyysi 31 5.4 Fenomenografisen tutkimuksen reliabiliteetti ja validiteetti 33 6. ANALYYSI JA TULOKSET 34 6.1 Algoritminen ympäristö 34 6.1.1 Perusominaisuudet 34 3 6.1.2 Toiminta 35 6.1.3 Vaikutukset 39 6.1.4 Tunteminen 40 6.2 Algoritmit ja etiikka 42 6.2.1 Kontrolli 42 6.2.2 Sokaiseva pimeys 44 6.2.3 Digitaalinen identiteetti 46 6.2.4 Algoritminen toiminta 49 6.2.5 Eettinen toiminta 50 6.3 Synteesi 52 6.3.1 Yhdistävät tekijät ”Algoritminen ympäristö” -kategoriassa 52 6.3.2 Yhdistävät tekijät ”Algoritmit ja etiikka” -kategoriassa 54 6.3.3 Yhteenveto 58 7. DISKUSSIO 60 7.1 Merkittävimmät tutkimustulokset 60 7.2 Tutkimuksen tarkoitus ja tavoitteet 61 7.3 Tulosten merkitys ja jatkotutkimusaiheet 62 7.4 Tämän tutkimuksen reliabiliteetti ja validiteetti 63 LÄHDELUETTELO 65 4 VAASAN YLIOPISTO Tekniikan ja innovaatiojohtamisen yksikkö Tekijä: Sinikka Sysky Tutkielman nimi: Fenomenografinen tutkimus algoritmien etiikasta Ohjaajan nimi: Tero Vartiainen Tutkinto: Kauppatieteiden maisteri Ohjelma: Teknisen viestinnän maisterikoulutusohjelma Pääaine: Tietojärjestelmätiede Opintojen aloitusvuosi: 2017 Tutkielman valmistumisvuosi: 2019 Sivumäärä: 71 TIIVISTELMÄ: Elämme algoritmista aikaa. Algoritmien vaikutus ulottuu kaikkialle yhteiskunnassa. Al- goritmit ohjaavat uutissyötteitä ja sosiaalisessa mediassa olevia henkilökohtaisesti koh- dennettuja mainoksia ja postauksia, päättävät kuka pääsee työhaastatteluun tai saa lainaa, tarkastavat veroilmoituksia, ja paljon muuta. Keskustelu algoritmien vaikutuksesta on le- vinnyt laajalle parina viime vuonna. Tässä tutkimuksessa kartoitettiin neljästätoista tutki- musdokumentista tutkijoiden käsityksiä ja tutkimustuloksia algoritmien eettisyydestä vuosina 2016–2018. Tehdyllä aikarajauksella saatiin ajankohtainen kokonaiskuva. Teoreettisessa viitekehyksessä kerrottiin mitä algoritmit ovat, kuinka informaatiotekno- logian filosofian kenttä näyttäytyi sen erityisenä painopisteenä tietokone-etiikka sekä mi- ten etiikka yleisesti taustoitti eettisiä kysymyksiä. Fenomenografisessa analyysissä pu- reuduttiin tutkijoiden käsityksiin algoritmien etiikasta, etsittiin käsityksistä merkityssisäl- töjä ja tulkittiin ne. Näin muodostettua ensimmäistä kategoriaa luokiteltiin ja työstettiin edelleen, jotta aikaan saatiin toinen kategoria. Tutkimusaineiston kanssa tapahtuvan jat- kuvan dialogin pohjalta saaduista tuloksista muodostettiin lopulta yhteinen tulosavaruus, joka tässä tapauksessa oli synteesi. Tutkimuksen mukaan algoritmien merkittävimmät huolenaiheet liittyivät algoritmiseen päätöksentekoon ja sen aiheuttamiin vaihteleviin vaikutuksiin. Eettiset vaikutukset olivat tulleet esille nimenomaan tutkijakunnan taholta. Suurin ongelma oli yhteydessä siihen, että algoritmien arvolatausta ei tunnustettu. Tämän työn tutkimusaineistosta nousi vahva viesti kattavan algoritmien etiikan muodostamisesta. Erilaisia jatkotutkimusaiheita tutki- musmateriaalissa esitettiin runsaasti. Aineistossa esiintyi tarve monimuotoisemmalle ja poikkitieteelliselle tutkimukselle. Tutkimusaineistosta ilmeni myös, että erilaiset tutki- musryhmät olivat kehittäneet omia ratkaisuja joihinkin rajattuihin algoritmisiin ongel- miin. Kaikki tämä tietämys tulisi saada saman kokonaismallin alle. Algoritmien eettiset periaatteet saattavat ehkäistä ongelmatilanteita ja lisätä luottamusta digitaalisessa toimin- taympäristössä. AVAINSANAT: algoritmi, algoritmiikka, etiikka, fenomenografia 5 UNIVERSITY OF VAASA School of Technology and Innovations Author: Sinikka Sysky Topic of the Master’s Thesis: Phenomenographic study of the ethics of al- gorithms Instructor: Tero Vartiainen Degree: Master of Science in Economics and Busi- ness Administration Degree Programme: Degree Programme in Technical Commu- nication Major: Information Systems Year of Entering the University: 2017 Year of Completing the Master’s Thesis: 2019 Pages: 71 ABSTRACT: We are living in an algorithmic era. The effect of algorithms extends throughout society. Algorithms guide news feeds and personally targeted ads and postings on social media, decide who can get a job interview or get a loan, check tax returns, and more. The discus- sion about the effect of algorithms has been widespread in the past couple of years. In this study, researchers' perceptions and research results on the ethics of algorithms in 2016– 2018 are surveyed. The time constraint made gives the current overall picture. The theoretical framework explained what algorithms are, how the field of information technology philosophy appears as its particular focus on computer ethics, and how ethics generally deal with ethical issues. Phenomenographic analysis focused on the scientists' perceptions of the ethics of algorithms, searching for and understanding conceptual con- tent. The first category thus formed were categorized and further processed to provide second category. The results obtained from the ongoing dialogue with the research mate- rial eventually was formed a common space, which in this case was a synthesis. According to the study, the most important concerns of algorithms were related to algo- rithmic decision-making and its varying effects. Ethical effects had come to light from the research community. The biggest problem was that the value-laden algorithm was not recognized. The research material of this work raised a strong message about the devel- opment of the ethics of algorithms. A variety of further research topics were presented in the research material. There was a need for more diverse and cross-disciplinary research. The research material also revealed that different research groups have developed their own solutions to some limited algorithmic problems. All this knowledge should be re- ceivable under the same overall model. The ethical principles of algorithms might prevent problems and could increase confidence in the digital environment. KEYWORDS: algorithm, algorithmics, ethics, phenomenography 6 1. JOHDANTO Algoritmeja itsessään on tutkittu paljon. Niistä on tehty runsaasti pro graduja ja väitös- kirjoja sekä muuta tieteellistä tutkimusta. Algoritmien etiikkaan kohdistuva tutkimus on jäänyt vähemmälle. Viimeisen muutaman vuoden aikana algoritmien etiikka on herättä- nyt kasvavaa kiinnostusta tutkijoiden parissa niin meillä kuin muualla. Mittelstadt, Allo, Taddeo, Wachter ja Floridi (2016) ovat kartoittaneet laajasti käytävää algoritmien etiikka- keskustelua ja esittävät yhteenvetona algoritmien eettisen kartan nykyisistä ongelma-alu- eista. Heidän mukaansa algoritmien eettiset ongelmat koskevat keskeneräisyyttä, lä- pinäkymättömyyttä, harhaanjohtavuutta, syrjiviä tuloksia, muuttuvia vaikutuksia ja jäljit- tämättömyyttä eli ns. mustia laatikoita. He esittävät useita lisätutkimusaiheita. Toisenlaista näkökulmaa edustavat Kraemer, van Overveld ja Peterson (2011), jotka ovat tutkineet magneettikuvauksessa käytettävää lääketieteellistä kuvausalgoritmia ja sen an- tamia vääriä positiivisia ja vääriä negatiivisia tuloksia. Tutkijat kysyvät, kenen on vastuu, jos väärän negatiivisen tuloksen saanut potilas onkin vakavasti sairas ja jää hoidotta vää- rän tuloksen takia. Toisaalta väärän positiivisen tuloksen saanut voi pahimmassa tapauk- sessa menettää elämänhalunsa kokonaan, sen lisäksi, että häntä hoidetaan kalliisti ja tur- haan. Tutkijat peräävät algoritmeihin läpinäkyvyyttä ja tunnistettavuutta sekä eettisten päätösten jättämistä käyttäjille, ei algoritmille. Algoritmien eettiset näkökohdat näyttäytyvät erilaisina eri alojen ammattilaisille. Ohjel- moija ei mieti syvällisiä moraalisia kysymyksiä keskittyessään ratkaisemaan algoritmista probleemaa. Yhteiskuntatieteilijää sen sijaan kiinnostaa kovasti, mitkä ovat esimerkiksi algoritmien päätöksenteon vaikutukset yksilöihin ja laajemmin yhteiskuntaan. Jo edellä olevista tutkimuksista nähdään, että algoritmeihin liittyvät eettiset kysymykset ovat mo- niuloitteisia, ja harvoin vain yhden ammattiryhmän ratkaistavissa. Laajemmassa mitta- kaavassa ollaan vasta heräilemässä informaatioteknologian ja lisääntyvän digitaalisuuden tuomiin eettisiin kysymyksiin. 7 1.1 Tutkimuksen tarkoitus ja tavoite Tutkimuksen tarkoituksena on kartoittaa tutkijoiden käsityksiä ja tutkimustuloksia algo- ritmien eettisyydestä vuosina 2016–2018 ja näin muodostaa ajankohtainen kokonaiskuva. Mitään yhtenäistä, muotoon puristettua algoritmien etiikkaa ei ole olemassa, jota voitai- siin helposti kääntelemällä tarkastella eri puolilta. Kirjallisuudessa algoritmien etiikka esiintyy usein vastakohtanaan, puutteen tai ongelman kautta. Näistä puutteista ja ongel- makohdista nousevat esiin ne eettiset kysymykset, joita algoritmien parissa on. Työn tavoitteena on tehdä näkyväksi algoritmeihin liitettyjä eettisiä ongelmia. Tästä syystä informaatiotutkimuksen filosofiaa selvitetään keskeisin osin ennen taustoittavaa etiikan osuutta. Merkittävän osan informaatioteknologian filosofian tarkastelusta muo- dostaa laaja tietokone-etiikan osuus. Tietokone-etiikka muodostaa tämän tutkimuksen selkärangan, jonka päälle muu rakentuu. Etiikan luku antaa laajempaa perspektiiviä ja suhteuttaa tarkastelua. Vuorovaikutteisen ja aineistolähtöisen tutkimusmenetelmän ansi- osta voidaan tavoittaa uutta tietämystä tutkimusaiheesta. On oletettavaa, että algoritmien tutkimuskentästä löytyy useita jatkotutkimusaiheita. 1.2 Tutkimusaineisto ja -menetelmä Tutkimuskysymys mitä on tutkittu algoritmien etiikasta syntyi ensimmäisessä tapaami- sessa ohjaajan kanssa. Toisin sanoen tutkimuskysymys oli jo olemassa ennen teoreettista perehtymistä informaatioteknologian filosofiaan ja etiikkaan. Materiaali on kerätty syys- marraskuussa 2018. Joitakin yksittäisiä teoriatäydennyksiä on haettu vielä joulukuussa 2018. Olen hyödyntänyt haun alkuvaiheessa Google Scholaria. Olen käyttänyt hyödyk- seni kirjallisuusluetteloita sekä tieteellisistä artikkeleista että kirjoista. Teoreettisen viite- kehyksen aineisto koostuu tietokannoista haetuista tieteellisistä artikkeleista, joistakin in- ternet-lähteistä ja e-kirjoista sekä painetuista kirjoista, jotka on lainattu kirjastoista. Tie- tokannoista on haettu tutkimusmateriaalia pääasiassa hakusanoilla ”ethics” ”algorithm” sekä ”algorithmic”. Materiaalia on haettu, kunnes tietty saturaatio on saavutettu, toisin sanoen samat artikkelit ovat alkaneet ilmestyä yhä uudestaan eikä relevanttia uutta 8 aineistoa ole ilmestynyt. Tutkimusaineiston mukaanottokriteereitä oli kolme: 1) Aineisto on relevantti tutkimuskysymyksen kannalta 2) Aineistossa käsitelty eettinen kysymys kat- taa jonkin algoritmin etiikan kysymyksen esim. läpinäkyvyys 3) Aineisto ajoittuu vuosille 2016–2018. Viimeisen mukaanottokriteerin perustelu on se, että keskeisin aineisto kertyi näille vuosille, ja tekemällä rajauksen näihin vuosiin oli mahdollista saada ajankohtainen käsitys siitä, mitä algoritmien etiikasta ajatellaan. Varsinainen tutkimusmateriaali koostuu tieteellisistä tietokannoista haetuista 9 tutkijan tai tutkijaryhmän artikkelista, kolmen tutkijan kirjoittamasta kahdesta Datafied Society- kirjan artikkelista, (Uricchio: Data, Culture and the Ambivalence of Algorithms sekä Paßmann & Boersma: Unknowing Algorithms. On Transparency of Unopenable Black Boxes 2017) ja kolmesta kirjasta (mediatutkija ja Kööpenhaminan yliopiston viestinnän ja informaatioteknologian apulaisprofessori Bucher: If…Then.Algoritmic Power and Po- litics 2018, Michiganin yliopiston Amerikan kulttuurin ja digitaalisten opintojen apulais- professori Cheney-Lippold: We Are Data 2017 sekä matemaatikko O’Neil: Weapons of Math Destruction 2016). Taulukko1. Tietokannoista valitut 9 artikkelia. Kirjoittaja Vuosi Artikkeli Ananny, Mike 2016 Toward an Ethics of Algorithms: Con- vening, Observation, Probability, and Timeliness. Crawford, Kate 2016 Can an Algorithm be Agonistic? Ten Scenes from Life in Calculated Publics. Danaher, J., Hogan, M. J., Noone, C., Kennedy, R., Behan, A., De Paor, A., Felzmann, H., Haklay, M., Khoo, S-M., Morison, J., Murphy, M. H., O’Brol- chain, N., Schafer, B. & Shankar, K. 2017 Algorithmic governance: Developing a research agenda through the power of collective intelligence. Dourish, Paul 2016 Algorithms and their others: Algorithmic culture in context Kitchin, Rob 2017 Thinking critically about and researching algorithms Martin, Kirsten 2018 Ethical Implications and Accountability of Algorithms Mittelstadt, B.D., Allo, P., Taddeo, M., Wachter, S. & Floridi, L. 2016 The ethics of algorithms: Mapping the debate 9 Zarsky, Tal 2016 The Trouble with Algorithmic Deci- sions: An Analytic Road Map to Exam- ine Efficiency and Fairness in Automated and Opaque Decision Making Ziewitz, Malte 2016 Governing Algorithms: Myth, Mess, and Methods Tutkimusaineiston analyysissä pureudutaan tutkijoiden käsityksiin ja tutkimustuloksiin algoritmien etiikasta, etsitään käsityksistä merkityssisältöjä ja tulkitaan ne. Erilaisten kä- sitysten taustalla olevat filosofiset tai eettiset käsitykset muovaavat väistämättä niitä mer- kityssisältöjä, joita voidaan havaita. Näin muodostettua ensimmäistä kategoriaa luokitel- laan ja työstetään edelleen, jotta aikaan saadaan toinen kategoria. Tutkimusaineiston kanssa tapahtuvan jatkuvan dialogin pohjalta saaduista tuloksista muodostetaan lopulta yhteinen tulosavaruus, joka tässä tapauksessa on synteesi. 10 2. ALGORITMIT Seuraavassa selvitetään algoritmeista joitakin perusasioita menemättä kuitenkaan syvem- min ohjelmointiin. Tarkoitus on esitellä algoritmit yleisluonteisesti. Tämän jälkeen ote- taan tarkasteltavaksi algoritmien yleiset eettiset ohjeet, jotka julkaistiin Yhdysvalloissa vuonna 2017. Ohjeistuksen tarkoituksena on luoda yhteiset toimintatavat algoritmien eet- tisten ongelmien vähentämiseksi. 2.1 Mitä ovat algoritmit Algoritmi on saanut nimensä persialaiselta matemaatikolta Abu Abdallah Muhammad ibn Musa Al-Khwarizmilta, joka eli noin 1200 vuotta sitten (Rapaport 2016: 233). Jo antiikin babylonialaisten tiedetään käyttäneen algoritmeja (Rapaport 2016: 233). Halavan (2016: 1) mukaan algoritmien tutkimus on alkanut 1930-luvulla, jolloin kehitettiin ”laskettavuu- den teoria, algoritmisesti ratkeamattomat probleemat” ja ”Turingin koneet”. Turingin kone on teoreettinen malli, jolla voidaan simuloida tietokonetta. 1950-luvulla tutkimus kehittyi algoritmien suunnittelun ja analysoinnin suhteen. Tällöin suunniteltiin monet tär- keät algoritmit. Tultaessa 1970-luvulle kompleksisuusteoria oli päässyt tutkimuksen kes- kiöön. Muun muassa mahdottomat probleemat ja todennäköisyysalgoritmit ovat komp- leksisuusteorian antia. Algoritmi voidaan määritellä eri tavoin. Sen voidaan sanoa olevan matemaattinen kon- struktio, toimintaohje tai resepti, jonka avulla saavutetaan tietty tavoite tiettyjen sääntöjen mukaan (Rapaport 2016: 234–236, 697; Hill 2016: 38, 47–49; Bucher 2018: 19). Algo- ritmi on siis menettelytapa, jolla jokin probleema ratkaistaan (Halava 2016: 4). Seuraa- vassa esimerkissä lasketaan kahden positiivisen kokonaisluvun tulo erilaisilla kertolas- kualgoritmeilla. Viimeiseen kertolaskualgoritmiin on liitetty kuvaus. 11 a) klassinen kertolaskualgoritmi 1 2 3 4 5 6 1 5 4 9 2 5 5 3 5 b) arabialainen kertolaskualgoritmi: Sivujen pituudet = kerrottavien lukujen pituudet. Kerrottavat luvut tulevat laatikoiden sivuille ja laatikkoon laitetaan tulot. Nuolet osoittavat lukusuunnan. Lukujen tulo tulee vasemmalle sivulle ja alasivulle, jonne lasketaan diagonaalien summat. 1 2 3 0 0 1 4 8 2 4 0 1 1 5 5 0 5 5 5 3 5 c) venäläinen kertolaskualgoritmi: Toista kerrottavista luvuista puolitetaan pyöristämällä alaspäin ja toista tuplataan, kunnes puolitettava luku on yksi. Laskemalla yhteen tuplatut luvut, joiden puoli- tettu luku on pariton, saadaan tulo. venäläisen kertolaskualgoritmin kuvaus on seuraava: SYÖTE: kokonaisluvut a, b > 0 TULOSTE: tulo ab 12 x ← 0 while a > 0 do if “a on pariton” then x← x+b a← [ ], b ← 2b return x Kuva 1. Esimerkki erilaisista matemaattisista kertolaskualgoritmeista Halavaa (2016: 3, 10–11) mukaillen. Sama algoritminen probleema voidaan ratkaista monella tavalla. Oleellista on algoritmin vaatima tila (eli kuinka paljon algoritmi vie tietokoneen muistia) sekä aika (eli kuinka nopeasti algoritmi ratkaisee ongelman) (Laaksonen 2009). Erilaisiin tarpeisiin on ole- massa erilaisia algoritmeja. Algoritmit ovat riippumattomia sekä ohjelmistokielestä että laitteistosta, mikä on niiden suuri etu. (Cormen, Leiserson, Rivest & Stein 2009.) Koska algoritminen probleema tulee voida ratkaista kaikenlaisilla syötteillä, ohessa lis- tana yleisempiä toistorakenteita Halavan (2016: 11) mukaan. for i = 1 to n do . . . repeat . . .until while . . . do . . . if . . . then (. . . else . . .) return quit 2.2 Algoritmien eettiset ohjeet Amerikkalainen Association for Computing Machinery US Public Policy Council loi vuonna 2017 algoritmien eettiset ohjeet. ACM:n (2017) mukaan algoritmien läpinäky- mättömyyden syyt ovat teknisiä, taloudellisia ja sosiaalisia. Eettisen ohjeistuksen tarkoi- tuksena on luoda yhteiset pelisäännöt algoritmien läpinäkyvyyden ja vastuullisuuden li- säämiseksi. Eettiset periaatteet ovat lyhentäen ja hieman muunnellen seuraavat: 1. Tietoisuus: Tulee olla tietoinen suunnitteluun, toteutukseen ja käyttöön liittyvistä harhoista ja vahingoista. a 2 13 2. Käyttöoikeudet ja oikeussuojakeinot: Viranomaisten on kannustettava sellaisten mekanismien käyttöönottoa, jotka mahdollistavat tehtyjen päätösten oikaisun. 3. Vastuullisuus: Instituutiot on pidettävä vastuullisina niiden käyttämien algoritmien tekemistä päätöksistä. 4. Selitys: Instituutioita, jotka käyttävät algoritmista päätöksentekoa, kannustetaan tuottamaan selvityksiä sekä algoritmin noudattamista menettelyistä että tehdyistä päätöksistä. 5. Tietojen alkuperä: Kehittäjien tulee dokumentoida kuinka aineisto kerätään sekä arvioida tiedonkeruuprosessin aiheuttamia vääristymiä. Tietojen julkinen tarkas- telu tarjoaa mahdollisuuden korjata aineistosta johtuvia virheitä. Rajoitettu pääsy tietojen tarkasteluun voi olla perusteltua järjestelmän hyväksikäytön estämiseksi. 6. Tarkastettavuus: Kaikki aineisto on tallennettava siten, että ne voidaan tarkastaa, jos epäillään vahinkoa. 7. Validointi ja testaus: Instituutioiden tulee käyttää luotettavia menetelmiä mallien validoimiseksi, ja menetelmät ja tulokset tulee dokumentoida. Tämän lisäksi tulee suorittaa rutiininomaisesti testejä, jotta voidaan arvioida ja selvittää, aiheuttaako malli syrjivää haittaa. Testien tulosten tulee olla julkisia. (Association for Com- puting Machinery US Public Policy Council 2017.) 14 3. INFORMAATIOTEKNOLOGIAN FILOSOFIA Informaatioteknologiaan liittyy useita filosofisia näkökulmia. Tästä syystä tässä tutki- muksessa tarkastellaan ensin informaatioteknologian filosofiaa ja sen osa-aluetta tieto- kone-etiikkaa, ja vasta sen jälkeen keskitytään taustoittamaan etiikkaa. Seuraavassa on ensin käsitelty tärkeimpiä filosofisia suuntauksia sekä niiden tarkastelemia kysymyksiä. Sitten on katsaus tietokone-etiikan historiaan, joka pohjustaa varsinaista tietokone-etiikan käsittelyä. Tämän jälkeen kartoitetaan tietokone-etiikkaan liitettyjä normatiivisen etiikan näkökulmia. Lopuksi on lyhyt katsaus Floridin informaatioetiikkaan. 3.1 Yleisiä IT-filosofian näkökulmia Rapaport (2016: 36) määrittelee filosofian ”henkilökohtaiseksi totuuden etsinnäksi millä tahansa kentällä järkevällä tavalla”. Filosofia tarkoittaa kirjaimellisesti ”rakastaa vii- sautta” (kr. fileoo rakastaa; sophia viisaus) (Perseus Digital Library 2018). Filosofian päähaaroiksi Rapaport (2016: 46–48) katsoo metafysiikan, epistemologian, logiikan, etii- kan, estetiikan, filosofian historian, kielen filosofian, matematiikan filosofian, mielen fi- losofian, tieteen filosofian ja tuntemattoman filosofian haaran, josta emme nyt tiedä, mutta joka varmasti vielä löytyy. Tietokone-etiikka on soveltavaa etiikkaa ja eräs filoso- fian alalaji. Hassan, Mingers ja Stahl (2018: 265–269) pitävät informaatioteknologian filosofian tär- keimpinä filosofisina suuntauksina metafysiikkaa, epistemologiaa, rationalismia ja arvo- teoriaa. Heidän mukaansa esimerkiksi ontologia – oppi olevaisesta – ja mielen filosofia ovat metafysiikkaan kuuluvia, samoin kuin tieteen filosofia ja logiikka rationalismiin ja estetiikka sekä etiikka arvoteoriaan kuuluvia. Informaatioteknologian kohdalla metafyy- sisenä kysymyksenä voidaan tarkastella esimerkiksi teknologian sosiaalista ja teknolo- gista suhdetta tai kysyä onko informaatiota olemassa ja mikä on sen luonne. Epistemolo- ginen kysymys voi tutkia mikä on totuus tai miten hankimme tietämystä informaatiotek- nologiasta. Rationalistinen kysymys ottaa selvää mikä on hyvä teoria tai mikä on 15 järkevää. Arvoteoreettinen kysymys paneutuu esimerkiksi siihen, kuinka meidän tulee käyttäytyä. (Hassan ym. 2018: 265.) Sana metafysiikka tarkoitti alun perin Aristoteleen kirjojen kokoelmaa, ja se tapahtui noin sata vuotta Aristoteleen kuoleman jälkeen (Sullivan ja van Inwagen 2014) (kr. meta jäl- keen; fysis luonto) (Perseus Digital Library 2018). Metafysiikalla tarkoitettiin alussa eri asioita kuin myöhemmin. Alkuvaiheen pohdinnoissa esiintyivät kysymykset olemisesta sellaisenaan, asioiden perimmäinen syy ja ”se, mikä ei muutu” (Sullivan ja van Inwagen 2014). Ajan kuluessa metafysiikan kysymykset laajenivat mm. mielen ja ruumiin suhtee- seen, aikaan, avaruuteen, Jumalan olemassaoloon, aineen ongelmaan, syy-seuraussuhtee- seen ja kosmologiaan (Sullivan ja van Inwagen 2014). René Descartesia pidetään filoso- fina, joka on luonut pohjan luonnontieteiden kehittymiselle (Hassan, Mingers ja Stahl 2018: 265). Hän oli rationalisti, joka alkoi järjestelmällisesti kysyä mikä / mitä on – ky- symyksiä, joita useat eri tieteenalojen pioneerit ovat sittemmin kysyneet (Hassan ym. 2018: 266). Epistemologia tutkii filosofisin menetelmin tietoa ja sen ulottuvuuksia. Klassinen tiedon määritelmä on ”tieto on perusteltu tosi uskomus”. Epistemologia kysyy mitä tarkoitetaan tiedon oikeuttamisella ja ”mikä tekee uskomuksesta perustellun”. Uskomuksen oikeutta- minen voi tapahtua kahdella tavalla: sisäisesti tai ulkoisesti. Sisäisesti oikeuttaminen ta- pahtuu mielen sisällä. Ulkoisesti uskomuksen oikeuttaminen tapahtuu luotettavien pro- sessien syntymisestä. Näin tapahtuu esimerkiksi eläimillä ja pikkulapsilla. Luotettavia uskomusten lähteitä ovat havainnot, introspektio, muisti, syy ja todistus. (Steup 2005.) Rationalismin mukaan tietoa saadaan ennen kaikkea järjen avulla päättelemällä. Markie (2017) esittää kolme teesiä: intuitio/päättely, luontainen tietämys ja luontainen mielle. Intuitio/päättely -teesin mukaan voimme tunnistaa joitakin väitteitä intuition avulla, mutta parempiin tuloksiin päästään päättelemällä. Luontainen tietämys -teesin mukaan ennen kokemusta syntynyt tietämys on osa rationaalista luontoa. Luontainen mielle -teesi lähtee siitä, että kokemus laukaisee ymmärtämisprosessin. 16 Arvoteoria on moraalifilosofian alue, joka tutkii arvoja (Schröder 2016). Hassan, Mingers ja Stahl (2018: 269) käsittävät arvoteorian laajempana käsitteenä, joka kattaa mm. etii- kan ja estetiikan. Perinteisiä arvoteoreettisia kysymyksiä ovat hyvän ja hyvyyden ympä- rille rakentuneet kysymyksenasettelut: mitkä asiat ovat hyviä ja miten hyvyys näyttäytyy ja käsitetään (Schröder 2016). Arvotavoitteet voivat olla yksilöllisiä valintoja tai toisaalta objektiivisia tiloja, jolloin voidaan saavuttaa yksimielisyys arvoista. Arvoteoria tarkaste- lee luontaista arvoa ja välinearvoa. Esimerkiksi rahalla on välinearvo, koska sillä saadaan muita hyviä asioita kuten ruokaa kaappiin. (Schröder 2016.) 3.2 Tietokone-etiikan historia Rakkaalla lapsella on monta nimeä. Näin on myös tietokone-etiikan laita. Kirjallisuudessa näkee puhuttavan dataetiikasta, informaatioteknologian etiikasta, tietokone-etiikasta ja tietojärjestelmien etiikasta. Kaikilla näillä yleensä tarkoitetaan tietokoneiden ja informaa- tioteknologian mukanaan tuomien moraalisten kysymysten etiikkaa. Kuitenkin Bynum (2015) näkee asian hieman toisin. Hänen mielestään tietokone-etiikasta puhuttaessa on viitattu normatiivisen etiikan suuntauksiin tietokoneiden yhteydessä, ammattietiikkaan ja internetin yhteydessä internetetiikkaan ja kybernetiikkaan. Myös ilmaisua informaatio- etiikka tapaa, mutta tämä on niin ikään jalostuneempi muoto tietokone-etiikasta ja esiin- tyy Luciano Floridin tutkimuksissa (kts. 3.5 Floridin informaatioetiikka). T.W. Bynum (2001: 109–110) valottaa tieteenalan synnyn alkuhämärää. Ensimmäiset askeleet otettiin 1940-luvulla, kun sotateollisuuden tutkija Norbert Wiener keksi uuden tieteenalan, jonka nimesi kybernetiikaksi (”cybernetics”). Hän yhdisti kybernetiikan idean tietokoneisiin ja näin ennusti tulevaa tietokone-etiikkaa. Seuraava merkittävä askel otettiin puolivälissä 1960-lukua, kun Donn Parker alkoi tutkia tietokoneiden epäeettistä ja laitonta käyttöä. 1960-luvun loppupuolella Joseph Weizenbaum loi tietokoneohjelman ELIZA, joka oli jäljitelmä psykoterapeutista. Ihmisten reaktiot järkyttivät Weizenbaumia, ja hän kirjoitti eettisistä huolistaan kirjan Computer Power and Human Reason. Termin tietokone-etiikka keksi yliopisto-opettaja Walter Maner, joka opettaessaan lääketieteen etiikkaa 1970-luvun puolivälissä huomasi, että tietokoneilla ja lääketieteen etiikalla oli 17 yhtymäkohtia. Tietokone-etiikka kuvasi niitä eettisiä ongelmia, joita tietokoneteknologia synnytti. Vuosikymmenen loppuun mennessä tietokone-etiikka oli terminä vakiinnutta- nut paikkansa. Bynumin (2015) mukaan vuosi 1985 oli tietokone-etiikalle keskeinen. Silloin ilmestyivät sekä Deborah Johnsonin ensimmäinen painos kirjasta Computer Ethics että Metaphilo- sophy- lehden numero, jossa oli James Mooren artikkeli. Vuonna 1995 Krystyna Górniak- Kocikowska teki ennusteen, jonka mukaan tietokone-etiikka laajenisi globaaliksi etii- kaksi. Ennustus tunnetaan nimellä ”Górniakin hypoteesi”. Eettiset kysymykset ovat kulkeneet tietokoneiden rinnalla niin kauan kuin teknologiaa on ollut olemassa. Ensimmäiset keskustelut tekoälystä ja sen ihmisyyttä muuttavasta voi- masta käytiin toisen maailman sodan jälkeen (Johnson 2001: viii). Pelättiin, että päätök- senteko siirtyy ihmisiltä tietokoneille (Johnson 2001: viii). Vielä vuonna 1979 James H. Moor oli sitä mieltä, että tekoäly ei tule saavuttamaan ihmisen älykkyyttä: ...there is enough evidence from artificial intelligence research to be suspicious of dogmatic claims that computers will never be able to accomplish certain feats of intelligence; yet, today there is not nearly enough evidence to support the conclu- sion that computers will someday match or exceed human intellectual ability in general or human decision-making ability in particular. (Moor, James H. 1979: 222.) 1970-luvun loppupuolella käytiin ensimmäisiä keskusteluja yksityisyyden suojasta. Yh- dysvalloissa alettiin rakentaa suuria tietokantoja, joihin alettiin kerätä ihmisten henkilö- kohtaisia tietoja. Siihen asti tietokoneita oli käytetty lähinnä suurta laskentatehoa vaati- viin projekteihin kuten asekehitykseen ja avaruusohjelmaan. (Johnson 2001: ix.) 1980-lukua leimasi henkilökohtaisten mikrotietokoneiden tulo. Eettinen keskustelu pyöri ohjelmistojen ympärillä. 80-luvulla tutustuttiin myös internettiin ja saatiin ensimmäiset hakkerit. Videopeliteollisuus sai alkunsa. (Johnson 2001: ix.) 1990-luku oli internetin. Internetin käyttö alkoi monipuolistua. Internet nähtiin demokra- tian välineenä. Graafiset selaimet ja hakukoneiden tulo lisäsivät käyttäjien määrää. 18 Eettisessä kentässä yksityisyyden suoja, omistusoikeudet ja demokratian kysymykset oli- vat ajankohtaisia (Johnson 2001: ix–x). 3.3 Yleistä tietokone-etiikasta Tietokoneiden ja informaatioteknologian nopea kehitys ovat avanneet valtavia mahdolli- suuksia niin yksilön kuin yhteiskunnan tasolla. Toimintaympäristön muutokset ovat laa- joja ja syvälle käyviä. Mooren (1985: 266) mukaan eettiset kysymykset nousevat toimin- tatavan tyhjiöstä, koska emme tiedä miten teknologiaa tulisi käyttää. Näyttää siltä, että toimintatavan tyhjiö on usein myös käsitteellinen tyhjiö (Moor 1985: 266). Tietokone- etiikan keskiössä on kysymys, miten määritellä mitä meidän pitää tehdä ja mitä toiminta- tapojemme tulisi olla (Moor 1985: 266; Johnson 2001: 6). Bynumin (2015) mukaan Mooren vaikutuksesta tietokone-etiikkaan tulivat tärkeät ihmisen ydinarvojen käsitteet kuten yksityisyys ja turvallisuus. Mooren (1985: 275) mukaan tulisi päättää, missä asi- oissa voidaan luottaa tietotekniikkaan ja missä asioissa ei. Johnson lähtee tietokone-etiikassa siitä, että kaikki uusi teknologia tulisi arvioida eetti- sesti jokaisessa sen kehitysvaiheessa (2001: 7). Tulee tietää mikä arvioinnin kohteena oleva teknologia on, toisin sanoen millaisia ominaisuuksia sillä on, koska muutoin ei voida määrittää yksityiskohtia tai sääntöjä sen käyttämiseen (Johnson 2001: 9). Tietotek- niikkaa käytetään yhteydessä muihin ihmisiin eli sen luontainen konteksti on sosiaalinen (Johnson 2001: 12). Sosiaalinen viitekehys muokkaa tietotekniikan kehitystä ja tämä ta- pahtuu läpi leikaten kaikkialla (Johnson 2001: 12). Etiikka liittyy aina ihmiseen, sillä ihminen on rationaalinen olento, joka kykenee ajattelemaan tekonsa syitä ja seurauksia (Johnson 2001: 17). Johnsonin (2001: 17–21) mukaan tietotekniikka tuo tähän uuden ulottuvuuden, sillä nyt etiikka välineellistyy: Tekoja tehdään välineen avulla. Samalla etäisyys toisesta ihmisestä kasvaa ja tekojen seuraukset voivat jäädä näkymättömiin. Toi- minta voi näyttäytyä arvoneutraalina, kunnes se kytkeytyy moraalikysymykseen. Johnso- nin (2001: 205) mukaan mikään ihmistekoinen teknologia ei kuitenkaan voi olla ar- voneutraalia. Teknologialla pyritään saavuttamaan aina jotakin: myös tehokkuus ja käyt- täjäystävällisyys ovat arvoja. 19 Johnson (2001: 128) toteaa, että ”yksityisyyden hinta on noussut erittäin korkeaksi”. Yk- sityisyyttä uhkaavat tiedonkeruu eri tietokantoihin, kerättävän tiedon laadun muuttumi- nen, tiedon jakelun ja vaihdon laajuus, virheellisen tiedon skaalautuvuus ja kerätyn tiedon pitkäaikaisvaikutukset (Johnson 2001: 117). Meistä halutaan tietoja, koska uskotaan, että mitä enemmän tietoja, sitä helpompaa on päätöksenteko ja palvelu parempaa (Johnson 2001: 118). Masonin (2017: 1) mukaan yksityisyyttä uhkaavat erityisesti tietoteknolo- gian kasvu ja lisääntynyt tiedon arvo päätöksenteossa. Mitä enemmän menetämme tieto- jen hallintaa itseltämme jollekin muulle taholle, sitä vähemmän meillä on yksityisyyttä ja autonomiaa. Yksityisyyden ohella tietokone-etiikassa askarruttaa näkymättömyys. Moor (1985: 272– 274) pitää suurena eettisenä huolenaiheena tietokoneiden toimintojen näkymättömyyttä. Hän jakaa näkymättömyyden kolmeen aspektiin. Ensimmäinen on näkymättömien ope- raatioiden tarkoituksellinen epäeettinen käyttö, joka kohdistuu omaisuuteen, yksityisyy- teen tai valvontaan. Toinen aspekti on tietokoneohjelmiin upotetut näkymättömät arvot. Tällöin ohjelma ei toimi oletetusti, vaan kyseessä voivat olla ominaisuudet tai virheet. Kolmas aspekti on monimutkainen laskenta. Tietokoneiden laskentateho kasvaa jatku- vasti ja supertietokoneissa saavutetaan niin monimutkainen ja valtava teho, ettei ihminen enää pysty monitoroimaan saati ymmärtämään sitä. Tietokone-etiikka käsitetään joskus pelkäksi ammattietiikaksi. Tällöin etiikalla ymmär- retään koostettuja eettisiä ammattiohjeita kuten ACM Code of Ethics and Professional Conduct (Association for Computing Machinery 2018) tai Software Engineering Code of Ethics (IEEE Computer Society 1999). Ammattilaisen eettiseen toimintaan vaikuttavat monet muutkin seikat kuten lainsäädäntö, sopimukset, hyvät käytännöt, yrityksen käytän- nöt, henkilökohtaiset arvot ja uskomukset sekä yhteisön arvot (Bynum 2004: 63–64). 3.4 Tietokone-etiikkaan liitettyjä eettisiä näkökulmia 20 Tietokone-etiikkaan yhdistetään yleensä normatiivisen etiikan suuntauksia. Normatiivi- sen etiikan tärkeimmät suuntaukset ovat seurausetiikka, velvollisuusetiikka, ja hyve- etiikka (kts. 4.3 Normatiivinen etiikka). Utilitarismi on seurausetiikan suuntaus, jonka tavoitteena on toiminta, joka tuottaa suurimman hyödyn mahdollisimman suurelle jou- kolle ihmisiä (Pietarinen 2015). Utilitarismi siis tarkastelee toiminnan seurausta hyöty vs. haitta – akselilla. Käytännön esimerkki voisi olla vaikka kalliin hoidon saatavuus: Anne- taanko kyseistä hoitoa kaikille tarvitseville potilaille hoitoontulojärjestyksessä vai ovatko ensisijalla yhteiskunnallisesti tuottavat yksilöt? Velvollisuusetiikka keskittyy toimintaan eikä ota huomioon tekojen seurauksia. Velvolli- suusetiikka tunnustaa jokaisen ihmisarvon ja puolustaa jokaisen henkilön oikeuksia. Ih- misen tekoja ei kuitenkaan voida tarkastella erillisinä ilman teoista tulevia seurauksia, joten mikä viime kädessä määrää sen, mikä on moraalisesti oikein? Jos moraalilaki sanoo ”puhu aina totta” ja henkilö voisi valehtelemalla pelastaa useiden ihmisten hengen, niin velvollisuusetiikan mukaan henkilön tulisi puhua totta ja antaa niiden ihmisten kuolla, jotka olisi voinut valehtelemalla pelastaa. (Pietarinen 2015.) Hyve-etiikka esittää kysymyksen moraalisesta luonteesta ja pyrkii saavuttamaan korkeim- man hyvän, eudaimonian. Hyveet ovat ominaisuuksia, jotka rakentavat luonnetta ja aut- tavat saavuttamaan hyvän elämän. Esimerkkejä hyveistä ovat oikeudenmukaisuus, roh- keus, rehellisyys. Hyve-eettinen kysymys on esimerkiksi: Millaisia meidän tulisi IT-am- mattilaisina olla, jotta toimisimme aina moraalisesti oikein erilaisissa tilanteissa? (John- son 2001: 51; Pietarinen 2015.) 3.5 Floridin informaatioetiikka Floridi (1999: 37–42) kritisoi sitä, että tietokone-etiikassa ei ole kunnollista filosofista perustaa eikä se ole kiinnostunut tekojen moraalisista arvoista, vaan ensisijaisesti olemi- sesta. Floridin mukaan monelle tietokone-etiikka on lähes ammattietiikan synonyymi. Vastauksena tähän Floridi on luonut informaatioetiikan, jonka eettinen kysymys on ”mikä on hyvää informaatioyksikölle ja infosfäärille yleisesti”. 21 Floridi (2010: 85–87) esittelee yksinkertaistetun RPT-mallin, jossa informaatio näyttäy- tyy infosfäärissä sisällä olevana resurssina (resource), tuotteena (product) tai päämääränä (target). Resurssinäkökulmasta tarkasteltuna tietoa tarvitaan paljon eettiseen päätöksen- tekoon. Moraaliaiheita ovat mm. digitaalinen jakaminen, tietoähky, luotettavuus, toden- mukaisuus, saavutettavuus ja täsmällisyys. Tuotenäkökulmasta ihminen ei ole pelkästään kuluttaja vaan myös tiedon tuottaja. Keskiössä olevia aiheita ovat mm. vastuullisuus, luotettavuus, tahaton väärä tieto sekä viestinnän käytännölliset säännöt. Informaatio pää- määränä, missä yksilön moraaliset arvioinnit ja toiminnot vaikuttavat informaatioympä- ristöön, moraaliaiheina nousevat mm. yksityisyys, luottamuksellisuus, turvallisuus, hak- kerointi, vandalismi, avoin lähdekoodi, ilmaisunvapaus ja sisällön suodattaminen ja kont- rollointi. Koska jokainen elollinen ja eloton olemassa oleva tai ollut tai tulevaisuudessa oleva (Flo- ridi 2010: 90) kokonaisuus tulkitaan informaalisena objektina, jolla on vähintään mini- maalinen moraalinen arvo, informaatioetiikka voi mennä perinteisten eettisten teorioiden ulkopuolelle, ja jokainen informaalinen objekti voidaan tulkita tekijäksi, jolla on edelleen vaikutusta muihin tekijöihin. Itsenäisissä objekteissa on tarkoituksenmukaiset tietoraken- teet, jotka muodostavat objektin tilan, identiteetin ja ominaisuudet. Tämä muodostaa ko- konaisen universumin, infosfäärin. (Bynum 2015.) Infosfääri on jakaantunut neljään luokkaan, joihin kaikki tieto-ominaisuudet on jaettu. Luokat ovat modaalinen, humanistinen, illuministinen ja konstruktionistinen. Jokainen informaalinen objekti voi vahingoittua ja tätä vahingoittumista Floridi kuvaa entropiaksi. Informaatioetiikka sisältää neljä moraalisääntöä, jotka pyrkivät rajoittamaan tai estämään entropian tapahtumista sekä lisäämään, laajentamaan ja rikastamaan informaation mää- rää, laatua ja monimuotoisuutta. Metaeettisesti informaatioetiikka on liikkunut antro- posentrisestä (ihmiskeskeisestä) näkökulmasta biosentriseen ja edelleen ontosentriseen (olemassaolokeskeiseen). Floridin mukaan objektiorientoitunut ontosentrinen näkökulma sopii paremmin tietoyhteiskuntaan ja tarjoaa mm. robottikäyttäytymiseen oivallisen eet- tisen teorian. (Floridi 1999: 46–56.) 22 4. ETIIKKA Etiikka voidaan jakaa analyyttiseen, normatiiviseen, soveltavaan ja deskriptiiviseen etiik- kaan. Suurelle yleisölle normatiivinen etiikka ja sen kysymykset (kuten kuinka meidän tulisi elää ja millainen on hyvä ihminen) lienevät tutuimpia soveltavan etiikan (esim. lää- ketieteen etiikka) ohella. Analyyttinen ja normatiivinen etiikka ovat teoreettista etiikkaa. Deskriptiivistä etiikkaa esiintyy lähinnä empiirisissä tieteissä ja sen pyrkimyksenä on ku- vata neutraalisti ihmisten arvovalintoja. 4.1 Etiikan käsitteestä Arkipäiväisessä kielenkäytössä etiikka ja moraali esiintyvät usein toistensa synonyy- meina. Sanan moraali katsotaan yleensä juontuvan latinan sanasta mos (mon. mores), joka tarkoittaa tapaa, tottumusta, käytäntöä (Perseus Digital Library: 2018). Kuitenkin myös koineekreikka tuntee vastaavaa tarkoittavan sanan mor (mon. mores) (Mäkinen 2016: 11; Perseus Digital Library: 2018). Sana etiikka tulee koineekreikan sanasta ethos, jolla on tarkoitettu paitsi vakiintuneita tapoja ja luonnetta (Perseus Digital Library: 2018), myös omien tekojen seurausten pohtimista ja pohdinnan päätöstä, onko teko eettisesti oikein vai väärin (Mäkinen 2016: 11). Kielitoimiston sanakirjan (2018) mukaan etiikka tarkoittaa ”hyvää ja pahaa sekä ihmisen moraalista toimintaa tutkiva tieteenhaara, siveysoppi; eettiset normit, moraalisäännöt, moraali”. Sana moraali tarkoittaa ” 1. yhteisössä vallitsevat eettiset käsitykset, arvostuk- set ja käyttäytymissäännöt, etiikka. 2. henkinen ryhti, henkinen kestokyky 3. eettinen si- sältö, opetus, ohje.” (Kielitoimiston sanakirja 2018). Tässä yhteydessä etiikalla tarkoitetaan tieteenhaaraa, jonka tutkimuskohteena on moraali. Filosofiassa moraali on ”empiirinen ilmiö, josta voidaan tehdä havaintoja” (Pietarinen ja Poutanen 1998: 12). Arkipäivän moraalikeskustelu on niin sanottua ”ensimmäisen tason moraalidiskurssia” (Pietarinen ja Poutanen 1998: 12). Etiikan tutkimus on ”toisen tason moraalidiskurssia”, mikä tarkoittaa ensimmäisen tason moraalidiskurssin tutkimusta 23 (Pietarinen ja Poutanen 1998: 13). Teoreettinen etiikka voidaan jakaa analyyttiseen ja normatiiviseen etiikkaan. 4.2 Analyyttinen etiikka Analyyttinen etiikka tai metaetiikka tutkii yleisesti moraalin luonnetta ja käsityksiä. Ole- mukseltaan analyyttinen etiikka on käsiteanalyysia (Pietarinen ja Poutanen 1998: 13). Se ei ota kantaa moraalikeskusteluun eikä siltä saada neuvoja tai ohjeita. Fieser (2018) pai- nottaa: ”Kuitenkin kaksi asiaa ovat merkittäviä: (1) metafyysiset kysymykset, jotka kos- kevat sitä, onko moraali riippumaton ihmisistä ja (2) psykologiset kysymykset, jotka liit- tyvät moraalisten tuomioiden ja käyttäytymisen taustalla olevaan henkiseen perustaan.” Analyyttisen etiikan tärkeimmät suuntaukset ovat intuitionismi, emotivismi, preskripti- vismi, eettinen relativismi, eettinen realismi ja eettinen konsensualismi (Pietarinen ja Pou- tanen 1998). Tunnettu intuitionismin edustaja on G.E.Moore ja hänen teoksensa Principia Ethica. Hä- nen kiinnostuksen kohteenaan oli moraalinen hyvä itsessään. Hän pohti, milloin joku ih- minen tai teko on hyvä ja mistä se voidaan tietää, ja tuli siihen tulokseen, ettei teon hy- vyydestä voida tehdä havaintoja. Mooren mukaan hyvyys voidaan oppia ”tuntemaan mo- raalisen intuition avulla”. (Pietarinen ja Poutanen 1998: 15, 30.) 1920-luvulla Euroopassa syntyi filosofinen suuntaus nimeltä looginen positivismi. Suun- taukseen liittyi kiinteästi ajatus kielen kuvateoriasta. Toteamuksella oli sisältö vain sil- loin, kun se luonnehti vallitsevaa asiantilaa. Teoria joutui ongelmiin pohtiessaan moraali- ilmaisujen luonnetta, sillä ne eivät olleet totuuksia eikä niitä pystytty todistamaan. Mo- raali-ilmaisut eivät kuvanneet mitään. Tästä kehittyi edelleen emotivismi, joka keskittyi pohtimaan moraali-ilmausten merkityssisältöjä. (Pietarinen ja Poutanen 1998: 49–54.) Preskriptivismin mukaan ”moraali ohjaa ihmisen toimintaa” (Pietarinen 2015). Tunnetuin suuntauksen edustaja on Richard M. Hare. Hänen mukaansa ”moraaliväitteen preskriptii- visyys... tarkoittaa sitä, että väitteen esittäjä joutuu itse toimimaan väitteen edellyttämällä 24 tavalla” (Pietarinen ja Poutanen 1998: 75). Moraalissa nähdään kaksi tasoa, intuitiivinen ja kriittinen taso. Intuitiivisella tasolla ratkaisut syntyvät liikoja pohtimatta kasvatuksen ohjaamina (Pietarinen ja Poutanen 1998: 77). Kriittisellä tasolla ratkaisuja pohditaan ja testataan (Pietarinen ja Poutanen 1998: 79). Pietarisen ja Poutasen (1998: 100) mukaan eettisessä relativismissa ”ei ole ehdottomia moraalistandardeja”. Eettinen relativismi on kiinnostunut moraali-ilmaisujen pätevyyden perusteluista, ei väitteiden oikeellisuudesta. Millään yleispätevällä menetelmällä ei voida ratkaista moraalisesti oikeaa toimintaa. Eettisen relativismin teorioita ovat sosiaalisiin ta- poihin perustuva konventionalismi sekä perustaviin moraaliarvostelmiin keskittyvä käsit- teellinen relativismi (Pietarinen ja Poutanen 1998: 106, 123). Kielellisen merkityksen teoria, eli niin sanottu totuusehtoinen semantiikka, on eettisen realismin keskiössä (Pietarinen ja Poutanen 1998: 129). Eettisen realismin mukaan tietoa moraalisista tosiasioista ja ominaisuuksista saadaan intuition ja havaintojen avulla (Pie- tarinen ja Poutanen 1998: 146–147). ”Moraaliset tosiasiat ovat moraaliväitteen totuuseh- toja” (tosi/epätosi) (Pietarinen ja Poutanen 1998: 134–135). Moraaliset ominaisuudet käyvät ilmi henkilön käytöksestä (Pietarinen 2015). Kuitenkaan eettinen realismi ei sel- vitä moraalisten ominaisuuksien luonnetta tai alkuperää (Fisher 2011: 5). Eettisen realis- min teorioita ovat intuitionistinen ja naturalistinen realismi (Pietarinen ja Poutanen 1998: 138). Eettinen konsensualismi uskoo, että moraaliväitteiden pätevyyden kriteeri on yksimieli- syys (Pietarinen ja Poutanen 1998: 153). Tunnetun konsensusteoreetikon Jürgen Haber- masin mukaan viestintä on erilaisia puheakteja. Jotta ihmiset ymmärtäisivät toistensa pu- heakteja, tarvitaan kielellistä toimintaa. Keskustelu voi olla teoreettista tai käytännöllistä. Tosiasiat kuuluvat teoreettiseen diskurssiin. Moraalikysymykset ovat käytännöllisen pu- heaktin aluetta. Habermasin diskurssin malli on vapaa kaikista esteistä ja häiriöistä, ja keskustelun osapuolten tavoitteena on saavuttaa yksimielisyys moraaliväitteestä tai nor- mista. (Pietarinen 2015.) 25 4.3 Normatiivinen etiikka Normatiivinen etiikka pohtii millaista on hyvä elämä tai millainen ihmisen tulisi olla (Ok- sanen, Launis ja Sajama 2010: 8). Kultainen sääntö on klassinen esimerkki normatiivi- sesta etiikasta: Kohtele toista ihmistä niin kuin haluaisit itseäsi kohdeltavan (Fieser 2018). Normatiivisen etiikan tunnettuja suuntauksia ovat velvollisuusetiikka, seu- rausetiikka ja hyve-etiikka eli virtuismi. Velvollisuusetiikassa toiminnan arvon määrää toiminnan sisäinen luonne (Pietarinen 2015). Velvollisuusetiikka keskittyy itse toimintaan eikä ota huomioon tekojen seurauk- sia. On olemassa neljä keskeistä velvollisuusetiikan suuntausta. Saksalainen filosofi Sa- muel Pufendorf jakoi velvollisuudet kolmeen luokkaan: velvollisuudet Jumalaa, itseä ja muita ihmisiä kohtaan (Fieser 2018). Toinen velvollisuusetiikan suuntaus on oikeusteo- ria, jota kutsutaan myös oikeuksien ja velvollisuuksien korrelaatioksi (Fieser 2018). Kol- mas velvollisuusetiikan suuntaus on Immanuel Kantin kategorinen imperatiivi. Hänen mukaansa ihmisellä on autonominen tahto, joka luo ohjeita moraalia varten (Pietarinen 2015). ”Moraalilaki esittää ehdottoman vaatimuksen”, jonka mukaan on toimittava (Pie- tarinen 2015). Neljäs velvollisuusetiikan teoria on W.D. Rossin yleiset prima facie -vel- vollisuudet, joita ovat luotettavuus, hyvitys, kiitollisuus, oikeudenmukaisuus, hyvänteke- väisyys, itsensä parantaminen ja vahingoittamattomuus (Fieser 2018). Seurausetiikka keskittyy ”hyötyjen ja haittojen määrittelemistä ja mittaamista koskeviin kysymyksiin” (Pietarinen 2015). Seurausetiikka voidaan määritellä siten, että ”toiminta on moraalisesti oikein, jos tämän toiminnan seurauksista on enemmän hyötyä kuin hait- taa” (Fieser 2018). Tunnettu seurausetiikan suuntaus on utilitarismi. Utilitarismi pyrkii hyödyn maksimointiin. Periaate on, että ”jokaisen tulisi toimia niin, että saavutettaisiin mahdollisimman suuri hyöty mahdollisimman monelle” (Johnson 2001: 36). Hyöty voi olla yleistä hyvää, hyvinvointia, mielihyvää tai arvoja (Pietarinen 2015). Fieserin (2018) mukaan Jeremy Bentham on kehittänyt kokonaisen utilitarismin järjestelmän, josta eri- tyisesti ”kaksi suuntausta ansaitsee tulla mainituksi”: tekoutilitarismi ja hedonistinen uti- litarismi. Tekoutilitarismi tarkoittaa, että jokaisessa tilanteessa on erikseen arvioitava, 26 toimitaanko moraalisesti oikein vai väärin ja miten saavutetaan moraalisesti paras tulos. Hedonistinen utilitarismi taas tarkastelee tekoja nautinnon ja kivun perustan kautta. Hyve-etiikka tarkastelee ”millaisia luonteenominaisuuksia ja kykyjä moraalisella toimi- jalla tulee olla, jotta hän osaisi menetellä eettisesti hyvin tai oikein” (Pietarinen ja Pouta- nen 1998: 164). Luonnetta kehitetään hyveitä harjoittamalla. Aristoteleen mukaan mo- raaliteoria kertoo ihmiselle, mikä hänen päämääränsä eli teloksensa on (Pietarinen ja Pou- tanen 1998: 164). Korkein hyvä, eudaimonia, voidaan saavuttaa hyveitä harjoittamalla ja suotuisilla ulkoisilla tekijöillä (Pietarinen 2015). 4.4 Tutkimusetiikka soveltavan etiikan esimerkkinä Soveltava etiikka on etiikan haara, joka käsittelee erityisiä kysymyksiä. Käsiteltävän asian tulee täyttää kaksi ehtoa. Sen on oltava ristiriitainen, toisin sanoen mielipiteitä on oltava puolesta ja vastaan. Lisäksi asian on oltava selkeästi moraalinen asia. (Fieser 2018.) Etiikan teorioita on sovellettu eri elämänaloilla (Pietarinen 2015). Näitä ovat esimerkiksi lääkintäetiikka, ympäristöetiikka, tutkimusetiikka ja tietokone-etiikka. Koska tietokone- etiikka muodostaa teoreettisen tutkimuskehyksen selkärangan ja on käsitelty omana ko- konaisuutenaan, tässä katsaus tutkimusetiikan alaan. Mäkisen (2006: 10) mukaan tutkimusetiikan ”määrittely riippuu siitä, mihin toiminnan osa-alueeseen keskitytään”. Vaihtoehtoja ovat toimijat (tutkijat, tutkittavat), yhteisöt (yli- opisto, tiedeyhteisö), toimet (esim. raportointi) tai taustayhteisöt kuten liike-elämä ja vi- ranomaiset. Tutkimusetiikassa käsitellään tutkimuksen päämäärään liittyvää moraalia ja keinoja tuon päämäärän saavuttamiseksi sekä ”pohditaan miten tämä moraali joko voi- daan ylläpitää tai miten se pitäisi ylläpitää” (Mäkinen 2006: 10). Mäkinen (2006: 15) toteaa, että tutkimusetiikkaa käsitellään joko tutkijoiden ammattietiikkana tai moraalin teoriana. Lääketiede on stimuloinut tutkimusetiikan kehittymistä. Tutkimusetiikan 27 näkökulmasta tärkein dokumentti on Nürnbergin koodi vuodelta 1947, jossa on kansain- välisesti määritelty tutkimusetiikan periaatteet (Mäkinen 2006: 18). Itä-Suomen avoin yliopisto (2018) esittää sivuillaan tieteelle seuraavia tuntomerkkejä: perusteltavuus, julkisuus ja intersubjektiivisuus, kriittisyys, itsensä korjaavuus, autono- misuus sekä edistyvyys. Mäkinen (2006: 29–33) avaa keskeisiä tieteen ominaisuuksia seuraavasti. Objektiivisuus merkitsee tutkijan neutraalisuutta ja epäpersoonallista toi- mintaa. Kriittisyys on tutkijan asenne, kaikkea tulee epäillä, kunnes toisin todistetaan. Autonomia on perinteisesti liitetty sekä tieteeseen että tiedeyhteisöihin. Ulkopuoliset ta- hot uhkaavat tieteen autonomiaa ja tutkimusta. Ne voivat vaikuttaa siihen, mitä ja miten tutkitaan. Edistyvyys tarkoittaa, että tiede korjaa omia aikaisempia virheitään ja jalostuu paremmaksi. Tieteen tulee olla myös julkista ja avointa kaikille sekä kirjoitettu ymmär- rettävällä kielellä (Itä-Suomen avoin yliopisto 2018). Tutkimusetiikassa risteävät sekä yhteiskunnan että tieteen intressit. Mäkinen (2006: 153) toteaa: ”Tiede ja yhteiskunta käyvät…tasapainoleikkiä: tieteen autonomisuus pitää tur- vata, mutta tieteen tulokset vaikuttavat yhteiskunnan ja tavallisten ihmisten elämään, ja poliitikot edustavat heitä”. 4.5 Deskriptiivinen etiikka Deskriptiivinen eli kuvaileva etiikka pyrkii selittämään ja kuvaamaan moraalin ilmiöitä. Deskriptiivinen etiikka ei tee moraalisuosituksia, vaan havainnoi puolueettomasti. Se hy- väksyy jopa toisilleen vastakkaiset näkemykset. Empiiriset tieteet, kuten psykologia ja yhteiskuntatieteet, suosivat deskriptiivistä etiikkaa. (Oksanen, Launis ja Sajama 2010: 7– 11). Esimerkkinä deskriptiivisen etiikan edustajasta voidaan mainita sosiologi Émile Durk- heim, jonka kiinnostuksen kohteena olivat yhteiskunnalliset ilmiöt. Hän pyrki tutkimaan niitä selittävästi. Moraali oli Durkheimille ennen kaikkea kokoelma sääntöjä, joita voitiin luonnehtia ja ryhmitellä. Deskriptiiviseen etiikkaan kuuluvana pidetään myös 28 evolutiivista etiikkaa ja sen edustajaa Charles Darwinia. Hänen mukaansa ihmisen erottaa eläimestä moraaliaisti tai omatunto. (Oksanen, Launis ja Sajama 2010: 10.) 29 5. FENOMENOGRAFINEN TUTKIMUS Fenomenografinen tutkimus on laadullista tutkimusta. Kettunen ja Tynjälä (2018: 1) to- teavat, että laadullisella tutkimuksella on mahdollista saavuttaa laajempi horisontti tutkit- tavaan asiaan: Methodological literature suggests that qualitative research may also reveal broader perspectives on the phenomenon under investigation. Laadullinen tutkimus pyrkii ymmärtämään elämän ilmiöitä monipuolisesti tarkastellen. Silloin, kun halutaan saada ilmiöstä hyvä kuvaus tai tavoittaa syvällistä näkemystä, laa- dullinen tutkimus on paikallaan. Kun ilmiö on ymmärretty, voidaan tämän perusteella kehitellä teorioita ja olettamuksia ilmiön toiminnasta. (Kananen 2015: 70–71.) 5.1 Fenomenografia tutkimusmenetelmänä Fenomenografialla sanana tarkoitetaan yleensä ilmiön kuvaamista (kr. fainomenon ilmiö, verbi fainoo, inf. fainesthai loistaa, ilmestyä, tulla näkyiin; verbi grafoo raapustaa, kir- joittaa, kaivertaa, piirtää) (Perseus Digital Library 2018). Fenomenografia on empiirinen laadullinen tutkimusmenetelmä, ja se tutkii niitä käsityksiä, joita tutkimuskohteella on tutkittavasta ilmiöstä (Ahonen 1995: 116; Huusko ja Paloniemi 2006: 163). Fenomeno- grafian mukaan rationaaliselle ihmiselle ”maailma on sekä todellinen että koettu” (Huusko ja Paloniemi 2006: 164). Ahosen (1995: 116–117) mukaan fenomenografialle tärkeitä termejä ovat ilmiö, käsite ja käsitys. Ilmiö ja käsitys ovat saman kolikon kaksi puolta. Ilmiöllä tarkoitetaan ihmisen kokemuksia, joista muodostetaan käsityksiä. Käsitys on kuva ilmiöstä, joka on rakennettu kokemuksista. Käsite on dynaaminen konstruktio, jossa uusi tieto jäsentyy vanhan päälle. Todellisuutta jäsennetään yksilön oman tulkinnan kautta (Häkkinen 1996: 24). Fenomenografiassa pyritään tekemään käsityksiä ymmärrettäviksi merkitysten tulkinnan ja luokitellun kautta. Luokittelu perustuu ennalta omaksuttuun teoriaan. Oleellista on 30 löytää laadullisesti erilaisia merkityksiä aineistosta sekä luoda kuvaavia ja relevantteja kategorioita (Ahonen 1995: 127). Varsinainen teorianmuodostus tapahtuu vuorovaiku- tuksessa tutkimusaineiston pohjalta (Ahonen: 1995: 123). Fenomenografinen tutkimus syntyi 1970-luvulla Göteborgissa, kun Ference Marton tutki opiskelijoiden käsityksiä oppimisesta. Kuitenkin vasta 1980-luvun alussa Marton piti tut- kimustaan fenomenografiana. Ihmistieteet, ennen kaikkea kasvatustiede ja oppimisen tut- kiminen, ovat suosineet fenomenografista tutkimusta. Viime vuosina on jonkin verran muilla tieteenaloilla käytetty tutkimusmetodina fenomenografiaa, erityisesti tutkittaessa tiedonmuodostusta. (Ahonen 1995: 115; Huusko ja Paloniemi 2006: 163.) Tutkimustavassa on kaksi tiedon tasoa (Häkkinen 1996: 30). Ensimmäinen taso on niin sanottu ensimmäisen asteen näkökulma, joka tarkastelee asioita niin kuin ne ovat. Toisen asteen näkökulma on kiinnostunut tarkastelemaan sitä, miten edellinen käsitetään. Esi- merkiksi jos ensimmäisen asteen näkökulman havainto on, että algoritmeihin liittyy eet- tisiä ongelmia, niin toisen asteen näkökulma kysyy, millaisena havaitut eettiset ongelmat käsitetään. Fenomenografinen analyysi tapahtuu toisen asteen näkökulmasta (Häkkinen 1996: 32, 39). 5.2 Fenomenografinen tutkimusprosessi Tutkimusprosessin ensimmäisessä vaiheessa tutkija kartuttaa teoreettista tietämystään ai- heesta, jota aikoo tutkia. Tämä on tarpeellista, jotta kykenee esittämään oikeita kysymyk- siä ja tunnistamaan eri merkityksiä aineistosta. Teoreettisten lähtökohtien perusteella teh- dään tutkimuksen kysymysten asettelu. Tämän jälkeen hankitaan aineisto. Fenomenogra- fiassa tavallisin aineistonhankintamentelmä on haastattelu. Kuitenkin aineiston voi hank- kia millä tahansa menetelmällä. (Ahonen 1995: 132–134.) Tämän jälkeen on vuorossa aineiston analyysi. Analyysin vaiheiden lukumäärä vaihtelee hieman tutkimuksesta riippuen, mutta yleensä niitä on neljä. Nämä ovat merkityskoko- naisuuksien etsiminen käsityksistä, ensimmäisten kategorioiden luominen ja vertailu, 31 toisten, ylempien kategorioiden muodostaminen ja viimeisenä vaiheena kokoavan ku- vauskategoriajärjestelmän laatiminen (Huusko ja Paloniemi 2006: 167; Kettunen ja Tyn- jälä 2018: 5–6). Kun aineisto on tulkittu ja luokiteltu, tuloksena on kokoava teoria ja kuvausavaruus. Viimeisessä tutkimisprosessin vaiheessa raportoidaan tutkimus. 5.3 Aineiston hankinta ja analyysi Fenomenografiassa tavallisin aineistonhankintamentelmä on haastattelu. Silti aineiston voi hankkia millä tahansa menetelmällä. Aineisto voi olla esimerkiksi havainnointia, piir- roksia tai dokumentteja (Huusko ja Paloniemi 2006: 164). Fenomenografisen tutkimuk- sen aineiston koko on yleensä melko pieni, noin 10–30 haastateltavaa tai dokumenttia (Kettunen ja Tynjälä 2018: 3). Laatu on tärkeämpää kuin määrä. Tutkijan tulee tuntea aineisto hyvin, sillä hän on vuorovaikutuksessa sen kanssa kaikissa vaiheissa (Ahonen 1995: 125). Aineiston analysointi alkaa perehtymisellä tutkimusmateriaaliin. Kun käsitykset ovat sel- villä, aletaan etsiä merkityssisältöjä. Tässä vaiheessa selvitetään myös, millaisina algorit- mien eettiset ongelmat käsitetään ja miten ne näyttäytyvät. Merkityssisällöt järjestellään ja tulkitaan. Merkityssuhteen tulkinnassa huomioidaan ympäröivä konteksti. Näistä muo- dostuvat ensimmäisen vaiheen kategoriat. Ahosen (2005: 143) mukaan: Vain ilmaisusta, joka on ajatuksellinen kokonaisuus, voi perustellusti tulkita jonkin merkityksen. …tutkija määrittelee lukemalla ilmaisut ja tarkkailemalla, miten laa- jalle niiden ajatusyhteydet tekstissä ulottuvat…Tulkintayksikköjä ei siis voi määri- tellä ulkoisin perustein etukäteen. Seuraavassa vaiheessa tulkintoja luokitellaan etsien samankaltaisuuksia ja poikkeavuuk- sia. Tämän jälkeen muodostetaan toiset kategoriat. Lopuksi rakennetaan kokoava tu- losavaruus. Tämän työn tutkimusmateriaali on kerätty syys-marraskuussa 2018. Joitakin täydentäviä lähteitä on haettu vielä joulukuussa 2018. Tiedonhaun alkuvaiheessa hyödynsin Google 32 Scholaria. Olen käyttänyt hyödykseni kirjallisuusluetteloita sekä tieteellisistä artikke- leista että kirjoista. Teoreettisen viitekehyksen aineisto koostuu tietokannoista haetuista tieteellisistä artikkeleista, joistakin internet-lähteistä ja e-kirjoista sekä painetuista kir- joista, jotka on lainattu kirjastoista. Tietokannoista on haettu tutkimusmateriaalia pääasi- assa hakusanoilla ”ethics” ”algorithm” sekä ”algorithmic”. Materiaalia on haettu, kunnes tietty saturaatio on saavutettu, toisin sanoen samat artikkelit ovat alkaneet ilmestyä yhä uudestaan eikä relevanttia uutta aineistoa ole ilmestynyt. Perehdyin aluksi etiikkaan, informaatioteknologian filosofiaan ja erityisesti sen osa-alu- eeseen tietokone-etiikkaan sekä algoritmeja käsittelevään tutkimuskirjallisuuteen. Tämän jälkeen aloin lukea tutkimusaineistoa läpi ensin saadakseni käsityksen aineistosta. Tämän vaiheen jälkeen orientoiduin tutkimusaineistooni uudestaan nyt tehden miellekarttoja ja etsien käsityksiä. Jatkoin edelleen työstämällä teemoja omaan miellekarttaansa, joka toimi yleisenä analyysikehikkona. Keräsin tähän kehikkoon käsityksiä ja tutkimustulok- sia. Samaan aikaan tein miellekartat myös filosofisista ja eettisistä suuntauksista sekä vai- kuttajista, jotka nousivat kustakin dokumentista sekä keräsin omaan miellekarttaansa esiin nousseita jatkotutkimusaiheita ja kysymyksiä. Varsinaisessa analyysin kirjoitusvai- heessa kävin jatkuvaa dialogia tutkimusmateriaalin kanssa. Ensimmäinen kategoria sijoittuu algoritmiseen ympäristöön, jossa ontologia, epistemo- logia ja normatiivisen etiikan kysymykset käyvät dialogia algoritmisen kokonaisuuden kanssa. Käytin apuna tutkimusaineistosta kerättyä tutkimuskysymyslistaa, jonka tarkas- telulinssi on ollut eettinen. Käytännössä tämä on tarkoittanut sitä, että on arvioitu jokaisen tutkimuskysymyksen filosofinen tai eettinen luokka, jota tämä kysymys on edustanut. Tarkastelun perusteella loin kategorisen algoritmisen ympäristön. Algoritmiseen ympä- ristöön kerättiin mahdollisimman kattavia käsityksiä ja tuloksia, joista työstettiin algorit- miset merkityssisällöt. Algoritmit ja etiikka on algoritmisen ympäristön ylempi kategoria. Merkityssisällöt työstettiin uudelleen yhdistellen ja muodostaen viisi uutta luokkaa. Tar- kastelulinssi pysyi eettisenä. Luokkien nimet kuvaavat keskeisintä sisältöä. Seuraavassa vaiheessa molemmat kategoriat yhdistettiin samaan kokoavaan kuvaukseen, johon liitet- tiin kaikkien luokkien läpi taustalla olevat yhdistävät tekijät. Nämä ovat algoritminen 33 päätöksenteko, vastuullisuuden vaatimus ja algoritmeja on tutkittava enemmän. Näin saa- tiin muodostettua lopullinen tulosavaruus. 5.4 Fenomenografisen tutkimuksen reliabiliteetti ja validiteetti Ahosen (2005: 129) mukaan aineiston validiteetti toteutuu, kun materiaali on aitoa (täs- mää tutkijan oletukseen samasta aiheesta) ja tarkoituksenmukaista eikä ylitulkintaa mer- kityssisältöjen tulkinnassa ole tapahtunut. Samoin luotujen kategorioiden tulee olla re- levantteja. Aineiston ja kategorioiden validiteetti on tiivistetty seuraavaan taulukkoon. Taulukko 2. Tutkimuksen luotettavuuskriteerit Ahosen mukaan (2005: 130). AINEISTO KATEGORIAT AITOUS koskeeko aineisto tutkijan ja tutkittavien kannalta samaa asiaa vastaavatko kategoriat tutkittavien tarkoittamia merkityksiä RELEVANSSI onko aineisto relevanttia tutkimuksen teorian kannalta ovatko kategoriat relevantteja tutkimuksen teorian kannalta Häkkinen (1996: 44–45) arvioi tutkimuksen luotettavuutta Larssonin (1993) viiden kri- teerin mukaan. Nämä ovat pragmaattinen kriteeri, diskurssikriteeri, heuristinen arvo, konsistenssi ja empiirinen ankkurointi. Pragmaattinen kriteeri saavutetaan tutkimustulos- ten käytännön merkityksen kautta. Diskurssikriteerin mukaan ”tutkimus on laadullisesti hyvä, jos sen todetaan tuottaneen tuloksia, joista kukaan ei ole löytänyt heikkouksia” (Häkkinen 1996: 44). Heuristinen arvo kertoo kuinka hyvin vakuutetaan vastaanottaja näkemään jokin aspekti toisin. Konsistenssi tarkoittaa kategorioiden sisäisen logiikan pä- tevyyttä. Empiirinen ankkurointi tarkoittaa tutkimusprosessin kuvauksen avaamista ja ai- neistoesimerkkejä lukijalle. 34 6. ANALYYSI JA TULOKSET Alkaessani työstää tutkimusmateriaalia, aloin tutkia siinä ilmeneviä käsityksiä. Tein jo- kaisesta dokumentista oman miellekartan, johon kokosin esiin tulevia asioita, niin käsi- tyksiä kuin tutkimustuloksiakin. Jatkoin edelleen työstämällä teemoja omaan miellekart- taansa, joka toimi yleisenä analyysikehikkona. Keräsin tähän kehikkoon käsityksiä ja tut- kimustuloksia. Samaan aikaan tein miellekartat myös filosofisista ja eettisistä suuntauk- sista sekä vaikuttajista, jotka nousivat kustakin dokumentista sekä keräsin omaan mielle- karttaansa esiin nousseita jatkotutkimusaiheita ja kysymyksiä. Varsinaisessa analyysin kirjoitusvaiheessa kävin jatkuvaa dialogia tutkimusmateriaalin kanssa. 6.1 Algoritminen ympäristö Ensimmäinen kategoria sijoittuu algoritmiseen ympäristöön, jossa ontologia, epistemolo- gia ja normatiivisen etiikan kysymykset käyvät dialogia algoritmisen kokonaisuuden kanssa. Pohtiessani ensimmäistä kategoriaa, käytin apuna tutkimusaineistosta kerättyä tutkimuskysymyslistaa, jonka tarkastelulinssi on ollut eettinen. Käytännössä tämä on tar- koittanut sitä, että on arvioitu jokaisen tutkimuskysymyksen filosofinen tai eettinen luokka, jota tämä kysymys on edustanut. Tarkastelun perusteella loin kategorisen algorit- misen ympäristön. Tähän algoritmiseen ympäristöön on kerätty mahdollisimman kattavia käsityksiä ja tuloksia, joista on edelleen työstetty eettisen linssin läpi algoritmiset merki- tyssisällöt. Luokkien nimet ilmentävät niitä kiteytyneitä kokonaisuuksia, joita tutkimus- aineistosta on löydetty. Jokaisen kappaleen alussa on esitetty oleellinen käsitys kursivoi- tuna lauseena, jonka jälkeen muu kappale avaa käsitystä. Kappaleen viimeinen lause ker- too algoritmisen merkityssisällön. 6.1.1 Perusominaisuudet Ontologia on oppi olevaisesta eli se tarkastelee olemassaolon kysymyksiä. Algoritmisessa ympäristössä tutkimusmateriaalista nousevia ontologisia kysymyksiä ovat muun muassa 35 mikä on algoritmi sekä millaisia ominaisuuksia algoritmilla on. Näiden kysymysten avulla kartoitetaan algoritmin perusolemusta ja algoritmiin itseensä liittyviä ominaisuuk- sia. Algoritmi on monimuotoinen. Algoritmi on sekä ohjelmointikieli- että alustariippumaton (Bucher 2018: 22). Algoritmi voidaan määritellä toimintaohjeeksi, reseptiksi tai mene- telmäksi (Rapaport 2016: 234–236, 697; Hill 2016: 38, 47–49; Bucher 2018: 19), mutta sitä voidaan tarkastella useista näkökulmista. Tarkastelulinssi voi olla tekninen, mate- maattinen, poliittinen, kulttuurinen, taloudellinen, kontekstuaalinen, filosofinen jne. (Kit- chin 2017: 16; Bucher 2018: 19–40). Kun lisäksi erilaisia algoritmeja voidaan käyttää hyvin monenlaisiin tarkoituksiin (Cormen, Leiserson, Rivest & Stein 2009), voidaan al- goritmin sanoa olevan monipuolinen eli merkityssisällöksi havaitaan monipuolisuus. Algoritmit ovat sosioteknisiä eikä niitä voida irrottaa kontekstista, jossa niitä kehitetään ja otetaan käyttöön (Ananny 2016: 98; Crawford 2016: 81, 89; Dourish 2016: 2–3; Ziewitz 2016: 10; Kitchin 2017: 18, 20; Uricchio 2017: 127; Bucher 2018: 126, 152). Sosioteknisyys tarkoittaa, että algoritmit ovat vuorovaikutuksessa ihmisten ja tekniikan kanssa eikä näitä puolia voida erottaa vaan asiaa on tarkasteltava kokonaisuutena. Algo- ritmit ovat siis kontekstiriippuvaisia. Algoritmiset merkityssisällöt ovat sosioteknisyys ja kontekstiriippuvuus. Algoritmit ovat arvoladattuja (Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 1; Bucher 2018: 23; Martin 2018: 1). Arvolataus tarkoittaa, että algoritmi kytkeytyy mo- raaliin eli sillä on kosketus ihmistoimintaan (Johnson 2001: 17–21). Mikään teknologia ei voi olla arvoneutraalia, sillä teknologialla pyritään aina johonkin, ja nämä asetetut ta- voitteet ovat itsessään arvoja, kuten esimerkiksi tehokkuus (Johnson 2001: 205). Koska algoritmit ovat sekä sosioteknisiä että arvoladattuja, tästä väistämättä seuraa, että niillä on eettisiä vaikutuksia (Dourish 2016: 7; Mittelstadt 2016; O’Neil 2016; Bucher 2018: 120; Martin 2018: 1). Merkityssisältö on siis eettinen vaikutuksellisuus. 6.1.2 Toiminta 36 Algoritmisessa ympäristössä toiminnan osalta esiintyy ontologinen kysymys millä tavalla algoritmi on olemassa (Tedre 2011: 65). Algoritmi näyttäytyy aktiivisena toimijana. Toi- mintaan liittyvät filosofiset ja eettiset kysymykset nivoutuvat suurelta osin epistemologi- siin ja normatiivisen etiikan kysymyksen asetteluihin. Miten ja kuinka algoritmit toimi- vat? Millaisia eettisiä ongelmia esiintyy? Algoritminen voima perustuu pääsääntöisesti neljään toimintoon. Nämä ovat priori- sointi, luokittelu, yhdistäminen ja suodatus (Ananny 2016: 97, 103; O’Neil 2016: 70; Kitchin 2017: 18; Uricchio 2017: 130; Bucher 2018: 34). Data on muokattava algo- ritmille luettavaksi ennen kuin sitä voi prosessoida (Bucher 2018: 5). Pelkkä luettavaksi saatettu data ei ole hyödyllistä, vaan sitä on käyttötarkoitusten mukaan priorisoitava, luo- kiteltava, yhdistettävä, suodatettava ja niin edelleen. Algoritmisina merkityssisältöinä voidaan havaita tiedonkeruu ja tiedon hallinta. Algoritmit eivät aina käyttäydy ennustettavasti (Crawford 2016: 80; Kitchin 2017: 19, 21, 25). Algoritmit ovat osa suurempaa kokonaisuutta. Algoritmit voivat toimia odotta- mattomasti, niillä voi olla sivuvaikutuksia tai toiminnalla voi olla arvaamattomia seurauk- sia (Kitchin 2017: 19). Merkityssisältönä voidaan tunnistaa ennustamattomuus. Algoritmit tekevät puolueellisia päätöksiä (Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 7, Kitchin 2016: 19; O’Neil 2016; Zarsky 2016: 123, 128; Martin 2018: 4). Mittelstadt ym. (2016: 7) mukaan puolueellisuus voi syntyä sosiaalisista asenteista, tek- nisistä rajoitteista, virheistä tai suunnittelupäätöksistä. Myös käyttökontekstissa olevat ulottuvuudet, kuten esimerkiksi järjestelmämuutos tai käyttäjä, saattavat aiheuttaa puolu- eellisuutta. Algoritminen merkityssisältö on puolueellisuus. Algoritmit toimivat portinvartijoina (Uricchio 2017: 131; Bucher 2018: 7). Portinvarti- jana toiminen tarkoittaa, että algoritmi tekee valintoja ja päätöksiä ilman, että käyttäjä voi millään lailla osallistua kyseisten valintojen ja päätösten tekemiseen. Näin tapahtuu esi- merkiksi silloin, kun algoritmi suodattaa ja valitsee käyttäjän nähtäväksi tietyt uutissyöt- teet tai päättää keiden käyttäjien viestit näkyvät. Prosessi on tavallisesti käyttäjälle täysin läpinäkymätön eli ei ole mitään mahdollisuutta saada selville millä perusteilla päätöksiä 37 tehdään (Mittelstadt ym. 2016: 3; Uricchio 2017: 131). Merkityssisällöksi voidaan tun- nistaa läpinäkymättömyys. Koneoppivat automaattiset tai puoliautomaattiset ”algoritmit eivät ainoastaan muutu ta- pahtumassa, vaan niillä on kyky muuttaa tapahtumaa” (Bucher 2018: 28). ”Algoritmit muuttuvat ja kehittyvät käyttöönotossa” (Dourish 2016: 8). Bucherin (2018: 24) mukaan koneoppivia algoritmeja on kolmenlaisia: ohjattuja, ohjaamattomia ja puoliohjattuja. Oh- jatussa algoritmissa harjoitusdatasta tiedetään haluttu tulos. Ohjaamaton algoritmi ei si- sällä dataa halutusta tuloksesta. Puoliohjattu algoritmi oppii vuorovaikutuksessa sisään syötetyn mallin ja ympäristönsä kanssa. Algoritminen merkityssisältö on algoritminen päätöksenteko. Mustat laatikot ovat haasteellisia (Kitchin 2016: 20; Paβmann & Boersma 2017: 139– 142; Bucher 2018: 41–65). Musta laatikko tarkoittaa prosessia tai objektia, jonka toimin- taa ei tunneta (Bucher 2018: 43). Tämä saattaa aiheuttaa monia ongelmia. Ongelmat voi- vat olla niin teknisiä kuin sosiaalisiakin. Mustien laatikoiden ongelma liittyy usein algo- ritmiseen päätöksentekoon (Dourish 2016: 7; Danaher ym. 2017: 3). Yritykset suojaavat liikesalaisuuksiaan luomalla läpinäkymättömiä prosesseja. Usein yritykset eivät tiedä it- sekään miten algoritmi toimii prosessissa. Joskus tietojärjestelmät ovat niin monimutkai- sia, että niihin muodostuu mustia laatikoita. Algoritmisena merkityssisältönä voidaan tun- nistaa tuntemattomuus. Kaikesta datasta, jota tuotamme internetissä, muodostuu henkilökohtainen digitaalinen identiteetti (Cheney-Lippold 2017: 26–31, 58–60), jolla ei ole mitään tekemistä sen kanssa, keitä oikeasti olemme. Digitaalinen identiteetti on eräänlainen palapeli. Sen yh- tenä osana ovat ne tiedot, jotka vapaaehtoisesti annamme esimerkiksi sosiaalisessa medi- assa ja muilla alustoilla. Yleinen nettikäyttäytymisemme muodostaa toisen palan. Se muodostuu siitä tiedosta, joka syntyy kun vierailemme eri sivustoilla. Kolmas pala on metadata, data datasta. Esimerkiksi yhdestä puhelinsoitosta tiedetään soittajan ja vastaan- ottajan puhelinnumerot, kellonaika ja päivä, puhelun kesto sekä soittajan ja vastaanotta- jan maantieteellinen sijainti (Cheney-Lippold 2017: 188). Algoritminen merkityssisältö on digitaalinen identiteetti. 38 Kerätyn datan perusteella muodostetaan datamalleja (O’Neil 2016: 25–27; Cheney-Lip- pold 2017: 47, 51, 55–56, 121–123, 155–156) ja erilaisia käyttäytymiskuvioita (O’Neil 2016: 171–172; Cheney-Lippold 2017: 43–44), joita hyödynnetään monin eri tavoin mm. Googlen markkinoinnissa ja rikosten ennaltaehkäisyssä (Ananny 2016: 100–101; O’Neil 2016: 84–87; Cheney-Lippold 2017: 22; Martin 2018: 4). Hyvän esimerkin tästä antaa Edward Snowden Brian Williamsin haastattelussa 28.5.2014 (Williams 2014). Jää- kiekko-ottelun tulosten haun perusteella Googlen hakukoneella voidaan päätellä henkilön tottumuksista ja käyttäjäprofiilista seuraavanlainen yleinen elämän malli: milloin henkilö käy kyseisillä sivuilla, onko henkilö kotona vai matkoilla, milloin hän herää ja menee nukkumaan, mitä muita datalaitteita on ympärillä ja keiden, onko henkilö mukana laitto- massa toiminnassa, kenen seurassa henkilö on ja tekeekö henkilö jotain, mitä ei pitäisi tehdä. O’Neil (2016: 120–121) havainnollistaa mallia toisella esimerkillä. Kyseessä on yritys, joka profiloi työnhakijakandidaatteja asiakkailleen. Yritys väittää mm. pystyvänsä ennustamaan, milloin yrityksen tähtityöntekijä on aikeissa vaihtaa työpaikkaa. Yrityksen malli perustuu työntekijän sosiaalisen pääoman laadun määrittelyyn. Ohjelmoija, joka viettää paljon työajan jälkeistä aikaa ratkoen ohjelmointipulmia toisten ohjelmoijien kanssa, arvioidaan intohimon, sitoutumisen, taitojen ja sosiaalisen pääoman perusteella laadukkaammaksi työntekijäksi. Jos lisäksi ohjelmoijan kontaktit ovat erityisen merki- tyksellisiä, hänen sosiaalinen pisteytyksensä ”ampuu katosta läpi.” Algoritmisiksi merki- tyssisällöiksi voidaan tunnistaa datamallit ja datan tulkinta. Yksityisyydestä tulossa harvojen etuoikeus (O’Neil 2016: 170; Cheney-Lippold 2017: 207–208). Facebookin perustaja Mark Zuckerberg kertoi The Guardian -lehdessä vuonna 2010, että ”yksityisyys ei ole enää sosiaalinen normi” (Johnson 2010). Edellisenä vuonna 2009 Googlen johtaja Eric Schmidt totesi CNBC:lle antamassa haastattelussaan: If you have something that you don't want anyone to know, maybe you shouldn't be doing it in the first place (Esguerra 2009). Cheney-Lippold (2017: 208) toteaa, että somejättien johtajien mielestä ”yksityisyys on kuollut”, koska se häiritsee liiketoimintaa. Sittemmin erilaisten kohujen jälkeen Faceboo- kin perustaja on joutunut hieman pyörtämään puheitaan ja parantamaan Facebookin 39 yksityisyyskäytäntöjä. Myös Google on joutunut parantamaan omia toimintatapojaan. Edellä kerrotun perusteella algoritminen merkityssisältö on yksityisyys. 6.1.3 Vaikutukset Algoritmeilla on kiistatta eettisiä vaikutuksia. Nämä kysymyksenasettelut kuuluvat sekä epistemologian että normatiivisen etiikan alaan. Miten algoritmien vaikutuksista voidaan saada tietoa? Millaisia seurauksia algoritmien toiminnalla ja algoritmisella päätöksente- olla on? Vastuukysymykset ovat normatiivisen etiikan kysymyksiä. Kuka vastaa eettisistä vaikutuksista? Mitä pitäisi tehdä? Millainen algoritmin tulisi olla? Algoritminen valta muokkaa todellisuutta (Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 5; O’Neil 2016: 28–31; Kitchin 2017: 18; Bucher 2018: 73, 114, 153–156). Algoritmit muovaavat käsitystämme todellisuudesta. Esimerkiksi somekupla on tilanne, jossa algoritmi syöttää jatkuvasti saman aihepiirin sisältöä käyttäjälle. Koska vastakkaista informaatiota ei tule, sama sisältö jää ikään kuin kaikumaan (Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 9; Uricchio 2017: 131) ja täyttää koko tilan. Tästä on seurauk- sena näkemyksen puolueellisuus. Bucher (2018: 53) toteaa Facebookin käyttäjän roolista ja algoritmin yhteydestä: Furthermore, it helps to know how central a role users have in shaping algorithmic outcomes…Users matter because it is their data, their clicking behaviour, prefer- ences, network relations and communicative actions that provide the data for algo- rithms to act on. Edellä sanotun perusteella algoritminen merkityssisältö on puolueellisuus. Automaattinen päätöksenteko luo eettisiä ongelmia ihmisten ja algoritmien välillä (Mit- telstadt ym. 2016: 11; Zarsky 2016; O’Neil 2016: 153; Danaher, Hogan, Noone, Ken- nedy, Behan, De Paor, Felzmann, Haklay, Khoo, Morison, Murphy, O’Brolchain, Schafer & Shankar 2017: 3–4). Mittelstadtin ym. (2016: 11) mukaan inhimillisille päätöksente- kijöille on haastavaa määritellä toiminnan eettiset periaatteet. Jos inhimillinen ja algorit- minen päätöksentekijä toimivat yhdessä, on ehdottomasti kuvattava milloin ja kuinka in- himillinen väliintulo on välttämätöntä. Danaherin ym. (2017: 4) mukaan algoritmiseen 40 päätöksentekoon liittyy epätarkkuutta, tehottomuutta ja arvaamattomia seurauksia. Myös Zarsky (2016: 121) toteaa, että epätarkkuudet voivat haitata prosessia ja että analyysi voi tehdä virheitä ennustaessaan ihmisen käyttäytymistä. Läpinäkymättömyys pahentaa epä- oikeudenmukaisuutta (Zarsky 2016: 125). Algoritmisena merkityssisältönä voidaan ha- vaita ennustamattomuus. Algoritmien eettisistä vaikutuksista ei olla tietoisia (Danaher, Hogan, Noone, Kennedy, Behan, De Paor, Felzmann, Haklay, Khoo, Morison, Murphy, O’Brolchain, Schafer & Shankar 2017: 13; Kitchin 2017: 21). Sekä Danaher ym. (2017: 13) että Martin (2018: 2) esittävät, että yrityksillä ja järjestelmäsuunnittelijoilla ei ole riittävää ymmärrystä al- goritmien eettisistä vaikutuksista. Kuvitelma neutraalista algoritmista elää sitkeästi. Toi- sin sanoen uskotaan, että algoritmilla ei ole eettisiä vaikutuksia, johon pitäisi reagoida. Danaher ym. (2017: 13) kannattavat aiheesta lisätutkimusta kaikille sidosryhmille. Al- goritminen merkityssisältö on tietämättömyys. Yritykset ovat vastuussa kehittämistään algoritmeista, sillä suunnittelupäätöksillä on suuri merkitys (Bucher 2018: 154; Martin 2018: 10). Martinin (2018: 2, 9–10) mukaan yritykset välttelevät vastuutaan eivätkä myönnä, että tekevät moraalisia valintoja kehittä- essään algoritmeja ja myydessään niitä eteenpäin. Martin (2018: 10) huomauttaa, että mikäli yritys ei halua kantaa omaa vastuutaan, sen ei pitäisi olla liiketoiminnassa mukana ollenkaan. Sekä Bucher (2018: 154) että Martin (2018: 9) esittävät, että suunnittelijat ja päätöksentekijät ovat paljon haltijoita: heillä on valta päättää, mitä algoritmi tekee, mutta myös kyky ja mahdollisuus korjata virheet ja epäoikeudenmukaisuudet. Algoritminen merkityssisältö on vastuullisuus. 6.1.4 Tunteminen Algoritmin tuntemiseen liittyvät kysymykset ovat epistemologisia, tietoon liittyviä. Mitä algoritmista voidaan tietää? Miten algoritmeja voidaan parhaiten tutkia? 41 Algoritmin olemusta ei ymmärretä riittävästi (Ziewitz 2016). Kuten aiemmin on todettu, algoritmi voidaan määritellä lukuisilla tavoilla, mutta tyhjentävää esitystä siitä, mikä al- goritmi lopulta on, ei voida antaa. Ziewitzin (2016: 11) mukaan: Rather, the goal should be to keep our inquiries generative enough to invite us to revisit some of our own assumptions and beliefs of what an algorithm actually is. (Kursivointi Ziewitzin.) Edellä sanotun perusteella merkityssisältö on ymmärtämättömyys. Algoritmeja tulee tutkia enemmän (Ananny 2016: 109; Dourish 2016: 8–9; Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 11–13; Danaher ym. 2017: 15; Kitchin 2017: 27; Uricchio 2017: 137; Bucher 2018: 147, 155; Martin 2018: 13). Mittelstadt ym. (2016: 12) näkevät algoritmin vaikutusten moniuloitteisuuden tärkeimpänä syynä siihen, että ratkaisujen on tultava laajasta tietämyskentästä. Uricchio (2017: 137) painottaa al- goritmin käyttöönoton ja toiminnan laajempaa tuntemista. Eräs huomiota vaativa huolen- aihe on humaanin ja ei-humaanin toimijoiden roolit algoritmisessa päätöksenteossa (Mit- telstadt ym. 2016: 11; Martin 2018: 13). Algoritminen merkityssisältö on tutkimatto- muus. Algoritmeja tulisi tutkia poikkitieteellisesti (Danaher, Hogan, Noone, Kennedy, Behan, De Paor, Felzmann, Haklay, Khoo, Morison, Murphy, O’Brolchain, Schafer & Shankar 2017: 14; Kitchin 2017: 26–27). Kitchin (2017: 27) näkee arvokkaana erilaiset tutki- musmetodit ja niiden tuottaman tietämyksen. Danaher ym. (2017: 14) toteavat, että on olemassa selkeä tarve rakentaa poikkitieteellistä yhteistyötä. Eri tieteiden väliset kom- munikaatio-ongelmat rajoittavat syvällisen ymmärryksen kokoamista algoritmeista. Tut- kijat ehdottavat monitieteellisten verkostojen luomista, jotta tietoa ja tutkimustuloksia voidaan jouhevasti jakaa. Algoritminen merkityssisältö on poikkitieteellisyys. 42 Kuva 2. Algoritminen ympäristö eettisen linssin läpi tarkasteltuna. 6.2 Algoritmit ja etiikka Algoritmit ja etiikka on algoritmisen ympäristön ylempi kategoria. Algoritmisen ympä- ristön merkityssisällöt on työstetty uudelleen yhdistellen ja muodostaen viisi uutta luok- kaa. Tarkastelulinssi on yhä eettinen. Luokkien nimet kuvaavat keskeisintä sisältöä. Kur- sivoituja algoritmisia merkityssisältöjä avataan kussakin kappaleessa. Joissakin tapauk- sissa on ollut tarpeellista selvittää merkityssisältöä muutaman kappaleen verran. Kappa- leen alussa oleva kursivoitu merkityssisältö kertoo milloin siirrytään uuden aiheen käsit- telyyn. 6.2.1 Kontrolli Algoritminen hallinta, tiedon hallinta ja algoritminen päätöksenteko ovat kaikki sidok- sissa algoritmien toimintaan. Kaikissa kolmessa kulkee algoritmisen sääntelyn punainen 43 lanka, jonka vuoksi luokka on saanut nimen ”Kontrolli”. Mitä tämä kontrolli on ja miten se ilmenee, sitä avataan seuraavassa. Algoritmien toimintaa käsitellään luokassa ”Algo- ritminen toiminta”, joten tässä ei puututa algoritmisen päätöksenteon algoritmisiin vaiku- tuksiin kuin yhden esimerkin verran. Sen tarkoitus on havainnoida päätöksenteon haas- teita. Cheney-Lippoldin (2017: 99) mukaan algoritminen säätely edustaa ”kontrollia, jota on vaikea havaita tai kontrollia, joka on etäistä ja harvoin koettua”. Tämä valta ilmenee avoi- men ympäristön kautta hyvin hienovaraisella mukauttamisella. Valtaan liittyy datafikaa- tio, joka tarkoittaa arvon luomista datalle (Cheney-Lippold 2017: 107). Toisin sanoen, ihmisen toiminta muuttuu tai muutetaan laskettavaksi dataksi, jolla on kaupallista arvoa. (Cheney-Lippold 2017: 101.) Googlen entisen operatiivisen johtajan Douglas Merrillin kuolemattomiin lausuntoihin kuuluu: ”All data is credit data” (O’Neil 2016: 158). Näin näyttää olevan. Eräs tuttavani valitti hiljattain, että kun puhuu kaverinsa kanssa puhelimessa vaikka säästä, niin on kohta säämainoksia Facebook täynnä. En ole Facebookissa, mutta aloitin eräässä WhatsApp- ryhmässä (WhatsApp on Facebookin omistama) keskustelun nivelrikosta ja niin alkoi älypuhelimeen ilmestyä nivelrikkolääkemainoksia. Facebookin omistama algoritmi siis kerää, yhdistää ja käyttää tietoa myös sieltä, minne käyttäjä ei ole antanut suostumusta. Tiedon hallinta algoritmisessa mielessä ymmärrettynä on sidoksissa algoritmin toimin- taan. Kun algoritmi lajittelee tietoa, priorisoi, luokittelee, suodattaa, yhdistää – kaikessa on kyse siitä, että algoritmi hallitsee ja käyttää tietoa ilman loppukäyttäjän suostumusta ja väliintuloa. Prosessi on tavallisesti läpinäkymätön eli prosessista ei saa tietoa. Tiedon hallinta on osa normaalia algoritmista säätelyä ja algoritmista päätöksentekoa. Algoritmisella hallinnalla on tänä päivänä paremmat toimintamahdollisuudet kuin kos- kaan aiemmin. Teknologia on läsnä kaikkialla, nopeus ja skaalautuvuus ovat kasvaneet, ja prosessit ja datan käsittely ovat tehokkaampia kuin ennen. Tiedon kerääminen, tiedon käsittely, käyttäminen, palautteenanto ja oppiminen ovat ne toiminnot, jotka luotaavat 44 algoritmista hallintaa. (Danaher, Hogan, Noone, Kennedy, Behan, De Paor, Felzmann, Haklay, Khoo, Morison, Murphy, O’Brolchain, Schafer & Shankar 2017: 2–3.) Päätöksenteossa algoritmien toiminta voidaan järjestää kahdella tavalla, joko top-down tai bottom-up. Top-down -mallissa ohjelmoija tai ohjelmointitiimi määrittelee algo- ritmille säännöt. Bottom-up -mallissa koneoppivalle algoritmille luodaan oppimissääntö ja se oppii harjoitusdatan avulla (Dourish 2016: 7; Danaher ym. 2017: 3). Bucherin (2018: 24) mukaan koneoppivia algoritmeja on kolmenlaisia: ohjattuja, ohjaamattomia ja puoliohjattuja. Ohjatussa algoritmissa harjoitusdatasta tiedetään haluttu tulos. Ohjaa- maton algoritmi ei sisällä dataa halutusta tuloksesta vaan oppii itsenäisesti. Puoliohjattu algoritmi oppii vuorovaikutuksessa sisään syötetyn mallin ja ympäristönsä kanssa. Kone- oppivat algoritmit ovat itseohjautuvia autokraatteja (Crawford 2016: 82; Uricchio 2017: 127). Danaherin ym. (2017: 4) mukaan algoritmiseen päätöksentekoon liittyy epätarkkuutta, tehottomuutta ja arvaamattomuutta. Algoritmisen päätöksenteon ja sen aiheuttaman vai- kutuksen välillä voi olla aukko, jolla on vakavat seuraukset (Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 2, 11). Äärimmäisessä tapauksessa kyseessä voi olla ihmishen- gen menetys (Crawford 2016: 83–85). Cheney-Lippold (2017: 203–204) kertoo tapauk- sesta, jossa amerikkalainen mies soitti hätäkeskukseen ja algoritmi esti operaattoria lä- hettämästä ambulanssia. Hätätapauksiin operaattorin avuksi oli laadittu kysymyslista. Ambulanssin lähettäminen oli sidoksissa kyseiseen listaan ja ”väärät vastaukset” olivat este ambulanssin lähettämiselle. Kyseisessä tapauksessa mies löytyi kotinsa lattialta ma- kaamasta kahden päivän kuluttua ja kuoli pian sairaalaan tuonnin jälkeen. Algoritmi toimi oikein eli teki sitä, mitä se oli suunniteltukin tekemään, mutta esti samalla inhimillisen puuttumisen päätöksentekoon. Mittelstadt ym. (2016: 11) painottavat, että eräs proble- matiikka algoritmisessa päätöksenteossa on humaanin ja ei-humaanin päätöksentekijän roolit. Tilanteet, joissa toimii sekä humaani että ei-humaani päätöksentekijä, ja joissa eh- dottomasti tarvitaan humaanin päätöksentekijän puuttuminen, tulee kuvata riittävän huo- lellisesti etukäteen. 6.2.2 Sokaiseva pimeys 45 Sokaiseva pimeys käsittää niitä algoritmisia ulottuvuuksia, joiden läheisyydessä pimeys tuntuu vain sakenevan. Algoritmiin itseensä liittyy asioita, joiden vuoksi sitä on vaikea selittää tai ymmärtää. Algoritmiseen päätöksentekoon liittyy kiinteästi läpinäkymättö- myys. Mustat laatikot ovat suuri tuntematon ja usein tutkimaton alue. Algoritmien tutki- mattomuuteen liittyy omia erityiskysymyksiään. Ymmärtämättömyyden ongelma liittyy algoritmin kohdalla sen perusolemukseen. Se on ontologinen ja epistemologinen kysymys. Algoritmia ei ymmärretä, koska ei ole olemassa kaikille tutkijoille yhteistä kehystä. Määritelmiä on yhtä monta kuin tutkijoitakin. Algo- ritmin toimintaan liittyy myös asioita, joita ei ymmärretä eikä osata selittää. O’Neil (2016: 173) antaa esimerkiksi käyttäytymisdataa operoivat älykkäät järjestelmät, jotka automaat- tisesti määrittelevät kuinka data tulkitaan. Läpinäkymättömyys ilmenee useimmiten algoritmisessa päätöksenteossa. Läpinäkymät- tömyys tarkoittaa siis tilannetta, jossa ei tiedetä millä perusteella päätökset tehdään tai miten algoritmi toimii. Martin (2018: 13) huomauttaa, että läpinäkymättömyys on eri- laista eri konteksteissa. Kitchinin (2017: 20) mukaan järjestelmään upotetut algoritmit ovat läpinäkymättömiä. Ne esiintyvät usein monimutkaisissa kokoonpanoissa. Mit- telstadtin, Allon, Taddeon, Wachterin & Floridin (2016: 6) mukaan ”läpinäkyvyyden peruskomponentit ovat saavutettavuus ja informaation ymmärrettävyys.” Päätöksenteko on huonosti läpinäkyvää, koska yritykset käyttävät patentoituja algoritmeja liiketaloudel- lisista syistä (Dourish 2016: 6; Mittelstadt ym. 2016: 6; Kitchin 2017: 20; Bucher 2018: 41). Läpinäkyvyyttä halutaan, koska algoritmeja on vaikea valvoa, seurata tai korjata (Mittelstadt ym. 2016: 6). Zarskyn (2016: 122) mukaan läpinäkyvät prosessit ovat tar- kempia ja tehokkaampia, mutta eivät ongelmattomia. Läpinäkyvyyden kustannukset voi- vat kohota korkeiksi eivätkä läpinäkyvät prosessit vaikuta vahvistavan sosiaalista hyvin- vointia (Mittelstadt ym. 2016: 7; Zarsky 2016: 122). Tuntemattomuus liittyy ennen kaikkea niin sanottuihin mustiin laatikoihin. Musta laa- tikko tarkoittaa prosessia tai objektia, jonka ”sisäistä toimintaa ei tunneta” (Bucher 2018: 43). Tavallisesti mustat laatikot aiheuttavat ongelmia (Bucher 2018: 45). Tutkijoiden 46 suhtautuminen mustiin laatikoihin on kahtalaista. Toiset pyrkivät avaamaan niitä, toiset etsivät muita ratkaisuja pyrkiessään tuntemaan tuntemattoman. Eräs ratkaisu mustien laatikoiden tuntemiseen on käänteinen suunnittelu. Jokaisessa mus- tassa laatikossa on kaksi kohtaa, joista voidaan saada tietoa: syöttö ja ulostulo (Kitchin 2017: 24; Bucher 2018: 41–65). Havainnoimalla toimintaa ja tapahtumia voidaan tehdä päätelmiä toimintalogiikasta. Tässä on kyseessä tarkastelukulman muutos. Ei yritetä käydä käsiksi suoraan tuntemattomaan, vaan tarkkaillaan sitä, mistä voidaan saada tietoa. Mahdollista on myös tarkkailla esimerkiksi online foorumilla, miten käyttäjät ymmärtä- vät ja kokevat algoritmin muuttuneen. Sosiaalisen median algoritmit muuttuvat koko ajan (Ananny 2016: 107). (Kitchin 2017: 23–24; Paβmann & Boersma 2017: 142–145; Bucher 2018: 59–61.) Toinen mahdollisuus tarkastella mustia laatikoita on koodin tutkiminen. Tämä tapahtuu joko tutkimalla pseudokoodia tai lähdekoodia. Pseudokoodi tarkoittaa jäljelle jätettyä al- goritmin perusrakennetta, josta on muu koodi puhdistettu pois. Koodin tutkimisessa koodi pitää ensin purkaa. Käytännössä koodin tutkiminen on vaikeaa ja edellyttää sekä ohjel- moijan että tutkijan taitoja. (Kitchin 2017: 22.) Tutkimattomuus liittyy paitsi mustiin laatikoihin, niin algoritmiin. Edellä tarkasteltiin kahta tapaa tutkia mustia laatikoita, joten tässä keskitytään algoritmeihin. Algoritmien tutkimus on ollut hyvin toimintakeskeistä. Kitchinin (2017: 16) mukaan algoritmien tut- kimus on ollut lähinnä kolmenlaista. Ensimmäisessä joukossa ovat yksityiskohtaiset ta- paustutkimukset tai tutkimukset algoritmien luokista, joissa on tutkittu algoritmien luon- netta yleisesti. Toisena joukkona ovat jonkin tietyn osa-alueen käyttöön liittyvät yksityis- kohtaiset tarkastelut, kuten esimerkiksi journalismi. Kolmannen joukon muodostavat yleisemmät, arvioivat tarkastelut algoritmin luonteesta ja toimivuudesta. Huomattavasti laajemmalle ja monipuolisemmalle algoritmitutkimukselle näyttää olevan tilausta. 6.2.3 Digitaalinen identiteetti 47 Digitaalinen identiteetti on tietokoneistettu malli ja tulkinta siitä kootusta datasta, jota meistä on saatu kerättyä sekä vapaaehtoisesti luovuttamalla että luvatta. Näin saatuja da- tamalleja ja käyttäytymiskuvioita hyödynnetään monin tavoin. Seuraavassa avataan da- tamallien ja tulkinnan muodostumista sekä paneudutaan yksityisyyden ja tietosuojan mer- kitykseen digitaalisen identiteetin yhteydessä. Tiedonkeruu on kaiken internetissä kerättävän hyödylliseksi muokatun datan perusta. Koska etukäteen ei voi tietää, mikä data osoittautuu hyödylliseksi, vallalla on ideologia ”mitä enemmän sen parempi” (Johnson 2001: 118; O’Neil 2016: 89). Tällainen varmuu- den vuoksi toimiminen aiheuttaa tarpeettomien tietojen kirjaamista. Tiedonkeruussa on- gelmana on myös se, ettei ole varmuutta kuka tietoja tosiasiallisesti käyttää ja mihin tar- koitukseen. Datamallit perustuvat kerättyyn dataan. Malleja käytetään yleensä osoittamaan käyttäjän identiteetti (Cheney-Lippold 2017: 47). Uutta dataa verrataan olemassa olevaan dataan. Tällä tavoin muodostuu algoritminen konstruktio, jota voidaan hyödyntää kulloinkin tar- koituksenmukaisella tavalla. Cheney-Lippold (2017: 66) huomauttaa, että ”datamallit ei- vät ole totuus, vaan konstruktioita, algoritmisesti tuotettuja totuuksia.” Cheney-Lippold (2017: 43–44) esittää erään käytökseen perustavan datamallin ja sen tulkinnan. Bill ja Ted asuvat samassa osoitteessa. Bill vuokraa kuorma-auton ja Ted ostaa ammoniumnitraattia, jota käytetään paitsi perunoiden kasvatuksessa myös kotitekoisten pommien tekemiseen. Jostakin syystä kaksikko vierailee tarkkailtavana olevassa koh- teessa. Käyttäytymiskuvion perusteella (sama osoite, kuorma-auton vuokraus, ammo- niumnitraatin osto ja vierailu ”kohteessa”) voidaan Bill ja Ted luokitella silmälläpidettä- viksi terroristeiksi. Datan tulkintaa voidaan siis tehdä esimerkiksi siten, että kun tietyt tunnusmerkit henkilön käyttäytymisessä täyttyvät, hänet kategorisoidaan johonkin ryhmään kuuluvaksi. Edellä oleva ”Bill ja Ted” -esimerkki voisi todellisuudessa selittyä siten, että he ovat veljeksiä, jotka ovat päättäneet ryhtyä perunankasvatukseen, jota varten tarvitaan kuorma-auto. Vierailu ”kohteessa” voisi olla pelkkä paikallisten perunankasvattajien yhdistyksen 48 järjestämä yhdistystapahtuma historiallisesti merkittävälle paikalle. Perunankasvattajien yhdistykseen Bill ja Ted ovat vasta liittyneet, joten tietoja ei ole saatavilla. Toinen esimerkki on yhdysvaltalainen COMPAS uusintarikollisuuden riskipisteytysjär- jestelmä. COMPAS todettiin hyvin kalibroiduksi järjestelmäksi, koska sen antama pro- senttiluku vastasi todellista tilannetta. Kuitenkin tuloksissa ilmeni ongelmia. Järjestelmä antoi kaksi kertaa enemmän vääriä positiivisia tuloksia mustaihoisille rikollisille ja kaksi kertaa enemmän vääriä negatiivisia tuloksia valkoihoisille rikollisille. Järjestelmä toimi oikein, mutta antoi eriarvoistavia, vääriä tuloksia. COMPAS kykeni ennustamaan 20 % uusintarikoksista eli suurin osa tapauksista jäi järjestelmän ulottumattomiin (Martin 2018: 4). (O’Neil 2016: 224; Martin 2018: 4.) Yksityisyys ja tietosuoja kulkevat käsi kädessä, toista ei ole ilman toista. Digitaalinen ke- hitys haastaa yksityisyyden. Danaher, Hogan, Noone, Kennedy, Behan, De Paor, Felz- mann, Haklay, Khoo, Morison, Murphy, O’Brolchain, Schafer & Shankar (2017: 13) ovat huolissaan riittämättömästä yksityisyyden suojasta, sillä se on murenemassa. Che- ney-Lippold (2017: 219) kertoo esimerkin huomiota herättävästä yksityisyysloukkauk- sesta. Kyseessä on Facebookissa operoinut Gaydar -algoritmi. Algoritmi päätteli henki- löiden ystävyyssuhteiden perusteella ketkä ovat todennäköisesti homoseksuaaleja. Läh- töoletuksena oli tavallista suurempi yhteys samaa sukupuolta oleviin henkilöihin. Gaydar käytti hyväkseen metadataa, jonka avulla se ryhmitteli henkilöt homoseksuaaleihin ja he- teroseksuaaleihin. Konepohjainen analytiikka seuloo aina vain suurempia massoja dataa. Entistä tärkeäm- pään osaan on nousemassa oikeus omaan dataan. Käyttäjä ei voi tälläkään hetkellä olla täysin varma siitä, mitä hänen lataamilleen omille tiedoilleen tapahtuu internetissä. Omaa dataa voi kuitenkin jollakin tasolla hallita erilaisilla alustoilla. Horisontissa siintävät silti mustat pilvet. Internetin vapauden idea on jo kääntynyt markkinajättien leikkikentäksi, jossa vain voitot ratkaisevat. Yksittäisen ihmisen mahdollisuus hallita omia tietoja käy vaikeammaksi. Tämä siitä huolimatta, että Euroopassa on jo voimassa uusi tietosuojalaki. Globaalissa mittakaavassa on paljon työtä jäljellä. Maailmassa on useita valtioita, joilla 49 on suuri intressi kontrolloida kansalaisiaan. Tulevaisuudessa koettanee päivä, jolloin jou- dumme maksamaan omasta datastamme (Cheney-Lippold 2017: 256). 6.2.4 Algoritminen toiminta Algoritmin monimutkaisuuden taustalla ovat algoritmin perusominaisuudet (kts. 6.1.1 Pe- rusominaisuudet). Monimutkaisen algoritmista tekee kuitenkin sen muuntuvuus eri ko- koonpanoissa ja ympäristöissä. Kun tähän lisätään eri algoritmien erilaiset tavoitteet, jotka voivat olla ristiriitaisia keskenään (Crawford 2016; Bucher 2018) ja se seikka, että samaa algoritmia voidaan käyttää eri tavoin eri tilanteissa (Dourish 2016: 4; Kitchin 2017: 21), näyttäytyy algoritmi erittäin muuntautumiskykyisenä ja laajana objektina. Pi- tää myös muistaa, että kaikella teknologialla on taustamotiivinsa. Algoritmeihin liitetyt oletukset tai odotukset (Bucher 2018: 23; Martin 2018: 6) eivät välttämättä pidä paik- kaansa. Tästä aiheutuu virheitä tai vaikutuksia, joita on vaikeaa tai mahdotonta enna- koida. Ennustamattomuus on dynaamisten algoritmien toiminnan luonnollinen seuraus. Teori- assa suunniteltu käyttö ja algoritmin käytännön toiminta voivat suuresti poiketa toisistaan (Kitchin 2017: 25). Ennustamattomuutta aiheuttavat paitsi virheet ja sivuvaikutukset, myös käytetyillä teknologioilla voi olla yllättäviä seurauksia (Ananny 2016: 108; Kitchin 2017: 25). Zarsky (2016: 120) toteaa, että organisaatioiden automaattiset järjestelmät olettavat ihmisen käyttäytymisen olevan sekä johdonmukaista että ennustettavissa. Koska algoritmi ei pysty ennustamaan ihmisen käyttäytymisen ennustamattomuutta, sen on pe- rustettava arvionsa olemassa olevaan dataan. Tästä syystä esimerkiksi Netflixin suositte- lija-algoritmi suosittelee lisää samanlaista sisältöä (Bucher 2018: 2). Puolueellisuus liittyy algoritmiseen toimintaan. ”Algoritmit tekevät väistämättä puolu- eellisia päätöksiä” (Mittelstadt, Allo, Taddeo, Wachter & Floridi 2016: 7). Mittelstadt ym. (2016: 7–8) mukaan puolueellisuus voi syntyä monella tapaa. Se voi olla tahaton seuraus tai tarkoituksella suunniteltu. Se voi olla peräisin sosiaalisista käytännöistä tai asenteesta, teknisistä rajoitteista tai virheistä, suunnittelusta tai käyttäjästä. Eriarvoisuutta 50 ja suoranaista syrjintää voidaan estää mm. reiluun tietoon perustavalla tiedonlouhinnalla, päätösten kohtuullistamisella ja algoritmeille asetettavilla kriteereillä. Zarsky (2016: 127) toteaa, että ”algoritmien sisältämä läpinäkymättömyys luo selviä on- gelmia, jotka liittyvät oikeudenmukaisuuteen”. Toisiinsa yhteydessä olevat tietojärjestel- mät lisäävät syrjintää samojen ihmisten kohdalla (Zarsky 2016: 128). Tämä tapahtuu tietojen skaalautumisen vuoksi. O’Neil tunnistaa saman ongelman (2016: 28–31). 6.2.5 Eettinen toiminta Tietämättömyys algoritmien aiheuttamista eettisistä vaikutuksista on laaja-alaista. Martin (2018: 3) toteaa, että yrityksissä halutaan uskoa ja toivoa algoritmien olevan arvoneut- raaleja, joilla ei ole eettisiä vaikutuksia tai on niitä vain hyvin vähän. Tällöin ei asiaan tarvitse ottaa kantaa eikä eettisiä vastuukysymyksiä ole. Danaher, Hogan, Noone, Ken- nedy, Behan, De Paor, Felzmann, Haklay, Khoo, Morison, Murphy, O’Brolchain, Schafer & Shankar (2017: 13) laajentaisivat keskustelua eettisten vaikutusten tietämättömyydestä kaikkiin sidosryhmiin, niin yleisöön kuin päättäjiin. Heidän mukaansa asiaa tulisi tutkia monipuolisesti erilaisin tutkimusmenetelmin (Danaher ym. 2017: 18). Vastuullisuus on entist