Teemu Hietikko Puhesynteesi huoltovideolla arki- ja ammattikäyttäjien arvioimana Vaasa 2019 Markkinoinnin ja viestinnän yksikkö Digitaalinen media Viestinnän monialainen maisteriohjelma 2 VAASAN YLIOPISTO Markkinoinnin ja viestinnän yksikkö Tekijä: Teemu Hietikko Tutkielman nimi: Puhesynteesi huoltovideolla arki- ja ammattikäyttäjien arvioimana Tutkinto: Filosofian maisteri Oppiaine: Viestinnän monialainen maisteriohjelma Työn ohjaaja: Merja Koskela Valmistumisvuosi: 2019 Sivumäärä: 114 TIIVISTELMÄ: Tämän tutkielman tavoite on selvittää, miten ammattikäyttäjät ja arkikäyttäjät kokevat pu- hesynteesin käytön Oras Groupin termostaattihanan huoltoa ohjeistavalla videolla sekä arvioida tulosten perusteella puhesynteesin mahdollista käyttöönottoa ohjevideoissa tulevaisuudessa. Puhesynteesin keskeisinä arviointikriteereinä tutkielmassa toimivat luonnollisuus ja ymmärret- tävyys. Nämä jaetaan alakäsitteisiin, joiden avulla puhesynteesin kokemista voidaan tarkastella yksityiskohtaisemmin. Vastauksia puhesynteesin käytöstä ohjevideolla saadaan kyselytutkimuk- sella, johon vastaavat ammatti- ja arkikäyttäjät. Puhesynteesin tutkimuksessa ohjevideoiden kautta esiin nousevat kuuntelukokemuksen rooli, informatiivisuus, audiovisuaalisuus sekä onnistuneen viestinnän kriteerit informaation välityk- sessä. Tutkielmassa tarkastellaan puhesynteesin roolia informaation onnistuneena välittäjänä. Määrittäjinä onnistuneelle viestinnälle toimivat kyselytutkimukseen vastanneiden henkilöiden kokemukset puhesynteesistä. Tutkielman päämenetelmänä käytetään kvantitatiivista kyselytutkimusta, jonka vastauksista las- ketaan Mean Opinion Score (MOS). Huomioon otetaan myös vastaajien taustamuuttujat: ikä, sukupuoli ja englannin kielen taito, sekä itse puhesynteesin muuttujat: mies- ja naisääni. Näiden keskiarvoista suoritetaan lopuksi varianssianalyysi, jonka avulla tarkastellaan yhtäläisyyksiä ja eroavaisuuksia. Kyselytutkimukseen vastasi yhteensä 146 henkilöä, 77 ammattikäyttäjien kyselyyn ja 69 arki- käyttäjien kyselyyn. Ammattikäyttäjät antoivat puhesynteesistä positiivisemman arvion kuin ar- kikäyttäjät. Puhesynteesin ymmärrettävyys oli hyvällä ja luonnollisuus hyväksyttävällä tasolla. Vanhimmat ikäluokat arvioivat puhesynteesin paremmaksi kuin nuoremmat, ja naiset antoivat puhesynteesistä paremman arvion kuin miehet. Englannin kielen taito oli tärkeä tekijä puhesyn- teesin arvioinnissa. Huonon englannin taidon omaavat vastaajat arvioivat puhesynteesin hei- kommaksi kuin hyvän englannin kielen omanneet vastaajat. Myös puhesynteesin äänellä oli merkittävä vaikutus puhesynteesin kokemisessa. Miesääni miellettiin vastaajien mukaan nais- ääntä parempana, niin kuuntelukokemuksena kuin informaation välittäjänäkin. Puhesynteesi sai hyvän arvion ammattikäyttäjien ja hyväksyttävän arvion arkikäyttäjien tulok- sissa. Arkikäyttäjien arvion perusteella puhesynteesissä on vielä kehittämisen varaa ihmispu- heen kaltaisuudessa sekä oikeaoppisessa puheessa ja puheen rytmittämisessä. Ammattikäyttä- jät kokivat erityisesti puhesynteesin informatiivisuuden, kuuntelukokemuksen ja kuuntelun helppouden hyvänä. Puhesynteesin käyttöönotto ohjevideoissa on kyselyn tulosten perusteella mahdollista. AVAINSANAT: puhesynteesi, kyselytutkimus, informaation välitys, ohjevideot, audiovisuaali- suus, tekninen viestintä 3 Sisällys 1 Johdanto 7 1.1 Tutkimuksen tavoite 8 1.2 Tutkimusaineisto 10 1.3 Tutkimusmenetelmät 12 1.3.1 Kyselytutkimus 13 1.3.2 Mean opinion score (MOS) 17 2 Informaation välitystä onnistuneella viestinnällä 20 2.1 Viestintämallit 21 2.1.1 Shannonin ja Weaverin tiedonsiirron malli ja sen kritiikki 22 2.1.2 Semioottinen viestintämalli 24 2.2 Onnistuneen viestinnän mittarit 25 3 Tekniset käyttöohjeet ja ohjevideot 28 3.1 Teknisestä ohjeesta tekniseksi ohjevideoksi 28 3.1.1 Audiovisuaalisuus 29 3.1.2 Kuuntelukokemuksen rooli informaation välityksessä 30 3.2 Huolto- ja käyttöohjeet Oras Group Oy:ssä 31 3.3 Tekniset ohjevideot ja niiden kohderyhmät Oras Group Oy:ssä 33 4 Puhesynteesin käyttö ja arviointi 35 4.1 Puhesynteesijärjestelmät 35 4.2 Puhesynteesin käyttötavat 38 4.3 Puhesynteesi teknisissä ohjevideoissa Oras Group Oy:ssä 40 4.4 Puhesynteesin arvioinnin kriteerit 42 4.4.1 Luonnollisuus puhesynteesin kriteerinä 43 4.4.2 Ymmärrettävyys puhesynteesin kriteerinä 44 5 Kyselytutkimuksen tulokset 45 5.1 Ammattikäyttäjien MOS-tulokset 48 5.1.1 Miesääni ammattikäyttäjien arvioimana 60 5.1.2 Naisääni ammattikäyttäjien arvioimana 63 4 5.2 Arkikäyttäjien MOS-tulokset 66 5.2.1 Miesääni arkikäyttäjien arvioimana 78 5.2.2 Naisääni arkikäyttäjien arvioimana 82 5.3 Varianssianalyysin tulokset 85 5.3.1 Luonnollisuuden ja ymmärrettävyyden alakäsitteet 87 5.3.2 Mies- ja naisäänen vaikutus tuloksiin 90 6 Pohdinta 99 Lähteet 102 Liitteet 108 Liite 1. Kyselylomake : Arkikäyttäjät 108 Liite 2. Kyselylomake: Ammattikäyttäjät 113 Kuvat Kuva 1. Esimerkki hanan huolto-ohjeesta (Oras Ltd. 2019). 32 Kuva 2. Kuvankaappaus ohjevideosta (Oras Ltd. 2019). 33 Kuviot Kuvio 1. Kyselytutkimuksen prosessit 14 Kuvio 2. Muuttujat kyselytutkimuksessa 16 Kuvio 3. Kyselytutkimuksen käsitteet 18 Kuvio 4. Shannonin ja Weaverin viestinnän malli 23 Kuvio 5. Esimerkki MOS-asteikosta käytännössä 37 Kuvio 6. Kyselytutkimuksen käsitteet 42 Kuvio 7. Arkikäyttäjien englannin kielen taito 46 Kuvio 8. Ammattikäyttäjien englannin kielen taito 47 Kuvio 9. Ammattikäyttäjien englannin kielen taito ikäluokkien mukaan 49 5 Kuvio 10. Ammattikäyttäjien MOS-tulokset 49 Kuvio 11. Arkikäyttäjien englannin kielen taito ikäluokkien mukaan 67 Kuvio 12. Arkikäyttäjien MOS-tulokset 68 Taulukot Taulukko 1. Kyselyyn vastanneet 45 Taulukko 2. MOS-tulokset 47 Taulukko 3. Ammattikäyttäjien muuttujien MOS-tulokset 50 Taulukko 4. Ammattikäyttäjät: Muuttujat miesvastaajien osalta 51 Taulukko 5. Ammattikäyttäjät: Muuttujat naisvastaajien osalta 52 Taulukko 6. Ammattikäyttäjien luonnollisuuden alakäsitteet 53 Taulukko 7. Ammattikäyttäjien luonnollisuuden alakäsitteet: Miesvastaajat 54 Taulukko 8. Ammattikäyttäjien luonnollisuuden alakäsitteet: Naisvastaajat 55 Taulukko 9. Ammattikäyttäjien ymmärrettävyyden alakäsitteet 56 Taulukko 10. Ammattikäyttäjien ymmärrettävyyden alakäsitteet: Miesvastaajat 58 Taulukko 11. Ammattikäyttäjien ymmärrettävyyden alakäsitteet: Naisvastaajat 59 Taulukko 12. Puhesynteesi miesäänellä: ammattikäyttäjien kokonaisarvot 60 Taulukko 13. Miesääni: ammattikäyttäjien luonnollisuuden alakäsitteet 61 Taulukko 14. Miesääni: ammattikäyttäjien ymmärrettävyyden alakäsitteet 62 Taulukko 15. Puhesynteesi naisäänellä: ammattikäyttäjien kokonaisarviot 63 Taulukko 16. Naisääni: ammattikäyttäjien luonnollisuuden alakäsitteet 64 Taulukko 17. Naisääni: ammattikäyttäjien ymmärrettävyyden alakäsitteet 65 Taulukko 18. Arkikäyttäjien muuttujien MOS-tulokset 69 6 Taulukko 19. Arkikäyttäjät: Muuttujat miesvastaajien osalta 70 Taulukko 20. Arkikäyttäjät: Muuttujat naisvastaajien osalta 71 Taulukko 21. Arkikäyttäjät: luonnollisuuden alakäsitteet 72 Taulukko 22. Arkikäyttäjien luonnollisuuden alakäsitteet: Miesvastaajat 73 Taulukko 23. Arkikäyttäjien luonnollisuuden alakäsitteet: Naisvastaajat 74 Taulukko 24. Arkikäyttäjät: ymmärrettävyyden alakäsitteet 75 Taulukko 25. Arkikäyttäjien ymmärrettävyyden alakäsitteet: Miesvastaajat 76 Taulukko 26. Arkikäyttäjien ymmärrettävyyden alakäsitteet: Naisvastaajat 77 Taulukko 27. Puhesynteesi miesäänellä: arkikäyttäjien kokonaisarviot 78 Taulukko 28. Miesääni: arkikäyttäjien luonnollisuuden alakäsitteet 79 Taulukko 29. Miesääni: arkikäyttäjien ymmärrettävyyden alakäsitteet 81 Taulukko 30. Puhesynteesi naisäänellä: arkikäyttäjien kokonaisarviot 82 Taulukko 31. Naisääni: arkikäyttäjien luonnollisuuden alakäsitteet 83 Taulukko 32. Naisääni: arkikäyttäjien ymmärrettävyyden alakäsitteet 84 Taulukko 33. Varianssianalyysi: kokonaistulokset 85 Taulukko 34. Varianssianalyysi: luonnollisuuden alakäsitteet 87 Taulukko 35. Varianssianalyysi: ymmärrettävyyden alakäsitteet 89 Taulukko 36. Varianssianalyysi: miesäänen kokonaistulokset 91 Taulukko 37. Varianssianalyysi: naisäänen kokonaistulokset 92 Taulukko 38. Varianssianalyysi: miesäänen luonnollisuuden alakäsitteet 93 Taulukko 39. Varianssianalyysi: naisäänen luonnollisuuden alakäsitteet 94 Taulukko 40. Varianssianalyysi: miesäänen ymmärrettävyyden alakäsitteet 95 Taulukko 41. Varianssianalyysi: naisäänen ymmärrettävyyden alakäsitteet 96 7 1 Johdanto Keinotekoisesta puheesta, eli tarkemmin puhesynteesistä, on tullut viime vuosien aikana vakiintunut ilmiö maailmalla. Sitä kuullaan yleisökuulutuksissa julkisissa kulkuneuvoissa, auton GPS-navigointi äänenä, vieraan kielen kääntämisen puheavustajana sekä monessa muussa harrastustoiminnassa sekä kasvavassa määrin ammattimaisessa toiminnassa. (Mehler & Romary 2012: 189) Esimerkiksi monen yrityksen asiakaspalvelun on syrjäyttä- mässä puhesynteesiä avuksi käyttävä järjestelmä perinteisen puhelinvaihteen ja vastaan- oton sijaan (Tung 2018). Puhesynteesin käyttömahdollisuudet ovat myös laajentuneet, ja esimerkiksi puhesyn- teesin käyttö puhelinvaihteessa herättää kysymyksiä puhesynteesin ja kuulijan välisestä yhteydestä. Puhesynteesin vastaanotto on tärkeää onnistuneen viestinnän kannalta, mutta se nostaa esiin myös mielenkiintoisen kysymyksen siitä, miten kuulija tarkalleen kokee puhesynteesin käytön ja kärsiikö informaation välitys puhesynteesin vuoksi. Työskentelen hanoja valmistavassa Oras Group Oy:ssä teknisen viestinnän asiantuntijana, ja työni kautta valikoitui myös tutkielman aihe. Tuotan ohjevideoita osana työtäni ja pu- hesynteesin käyttö nousi esiin keskustellessamme keinoista optimoida ohjevideoiden tuotantoa. Tästä heräsi ajatus siitä, että puhesynteesin käyttöä ohjevideolla testattaisiin kohderyhmillä ja heidän kokemuksiaan arvioitaisiin tilastollisesti. Puhesynteesin tuottaminen on tällä hetkellä kustannustehokasta, ja se on myös helpom- paa kuin ammattipuhujan palkkaaminen. Äänen optimointi ja muokkaaminen onnistuu huomattavasti helpommin puhesynteesillä, ja mahdollisia virheitä korjaavat hintavat uu- delleen nauhoitukset ammattipuhujan tekemänä jäävät myös kokonaan pois puhesyn- teesillä. Näiden huomioiden kautta heräsi kiinnostus lähteä tutkimaan puhesynteesin käyttöä ohjevideoilla tarkemmin. Puhesynteesi on myös monipuolisen käyttönsä vuoksi hyödyllinen väline moderneille yhtiöille, joissa tuotetaan monenlaista mediasisältöä sekä videoita ja äänitteitä sisältäviä e-koulutusalustoja. Puhesynteesi on myös hyvin vä- litöntä tuottaa ja näin ollen mahdolliset korjaukset videon puheeseen saadaan tehtyä 8 välittömästi ja asiakkaille saadaan päivitettyä tietoa tuotteen asentamisesta tai huolta- misesta nopeammin. Puhesynteesi, joka tunnetaan myös nimellä tekstistä-puheeksi (engl. text-to-speech, TTS) on ihmispuheen kaltaisen puheen tuottamista keinotekoisin tavoin. Tekstistä-puheeksi voidaan tarkentaa tarkoittavan kirjoitetusta tekstistä puhutuksi puheeksi tuotettua ääntä. (Taylor 2007: 25) Yleisin mielikuva, joka ihmiselle tulee mieleen puhesynteesistä, on koo- misen oloinen robottiääni, joka on kaikkea muuta kuin uskottavan tai ihmismäisen kuu- loinen. Nykytilanne puhesynteesissä on kuitenkin toinen. Puhesynteesi on kehittynyt mekaanisesti luoduista tai alkeellisesti tietokoneella luoduista, muun muassa Stephen Hawkingin kuuluisaksi tekemistä, äänikoneiden päivistä. Näillä äänikoneilla luotu puhe oli hyvin karua ja vaikkakin se oli ymmärrettävää, puheen luonnollisuus oli kaukana ih- mispuheesta. Äänikoneiden käyttäminen oli myös hidasta ja hankalaa. (Medeiros 2015) Puhesynteesin perinteiset ja vakiintuneet arvioinnin määritteet ovat olleet luonnollisuus ja ymmärrettävyys. Toisin sanoen sen samankaltaisuus ihmispuheen kanssa sekä sen ää- nenlaadun selkeys ja kieliopillisuus. (Le Maguer 2018: 10-12, 25-26) Puhesynteesin aiempi tutkimus on keskittynyt näihin kahteen, mutta enemmän keinotekoisen puheen tuotannon ja siihen liittyvien teknisten ominaisuuksien ja aidolta kuulostavan puheen luonnin näkökulmasta, kun taas tutkimus siitä, miten ihmiset vastaanottavat puhesyn- teesiä ja mitä tunteita tai ajatuksia heille siitä syntyy, on jäänyt vähemmälle huomiolle. (Chung, Wang, Hsu, Zhang & Skerry-Ryan 2018: 1-5) Tässä tutkielmassa keskitytään käyt- täjän näkökulmaan ja nimenomaan siihen, miten arkikäyttäjä tai alan ammattilainen vas- taanottaa puhesynteesin. 1.1 Tutkimuksen tavoite Tämän tutkielman tavoitteena on selvittää, miten ammattikäyttäjät ja arkikäyttäjät koke- vat puhesynteesin käytön Oras Groupin termostaattihanan huoltoa ohjeistavalla videolla, 9 sekä arvioida tulosten perusteella puhesynteesin mahdollista käyttöönottoa ohjevide- oissa tulevaisuudessa. Tutkielmalla haen vastausta kysymyksiin: 1. Miten puhesynteesin luonnollisuus ja ymmärrettävyys koetaan teknisessä ohjevide- ossa? 2. Onko ammattilaisen ja arkikäyttäjän kokemuksissa puhesynteesistä eroja? 3. Miten muuttujat kuten puhesynteesin mies- ja naisääni tai vastaajien ikä, sukupuoli tai englannin kielen osaaminen vaikuttavat puhesynteesin kokemiseen? Oras Group Oy:n tekniset ohjevideot on suunnattu niin ammattikäyttäjälle kuin arkikäyt- täjällekin, ja tästä syystä on tärkeää tutkia, miten nämä kaksi ryhmää vastaanottavat sa- man teknisen materiaalin ja onko puhesynteesin vastaanotossa eroa näillä ryhmillä. Am- mattikäyttäjien ryhmä on saanut vähintään yleisen koulutuksen hanan asentamisesta ja huollosta työn aloittamisen yhteydessä ja on näin ollen lähtökohtaisesti valmiimpi vas- taanottamaan ohjevideon tietoa. Arkikäyttäjien ryhmä tuntee hanat pelkästään loppu- käyttäjän näkökulmasta, ilman kokemusta hanojen asentamisesta tai huollosta. Tekninen dokumentti, esimerkiksi käyttöohje tai ohjevideo, on väline, jolla välitetään lu- kijalle tietoa mahdollisimman yksiselitteisesti ja jonka avulla lukijan on tarkoitus suorit- taa konkreettisia toimintoja (Mehler & Romary 2012:40). Näitä toimintoja voivat olla eri- näisten tuotteiden asennus, huolto tai käyttöönotto. Tutkielmassa keskitytään esittä- mään hanan huoltotoiminto teknisen dokumentaation avulla ja tarkemmin käyttöohjeen ja siitä tuotetun ohjevideon keinoin. Puhesynteesin arviointikriteereinä toimivat aiemmin mainitut luonnollisuus ja ymmär- rettävyys. Luonnollisuuden ja ymmärrettävyyden mittarit haarautuvat alakäsitteisiin, joilla haetaan yksityiskohtaisempaa tarkennusta mittareille. Käsitteet ja alakäsitteet ava- taan tarkemmin tutkielman luvuissa 1.3.1 ja 1.3.2. 10 Käsitteiden avulla arvioin arkikäyttäjien sekä ammattikäyttäjien kokemusta puhesyntee- sistä ja siitä, miten se toimii heidän mielestään huoltovideolla. Kyselytutkimuksella saa- daan arkikäyttäjän ja ammattikäyttäjän puhesynteesin vastaanoton tulos. Näitä vertail- laan keskenään ja niistä selvitetään puhesynteesin toimivuus teknisessä huoltovideossa kummassakin ryhmässä. Vertailulla saadaan selville myös, vaikuttaako alan tuntemus pu- hesynteesin kokemiseen ja siihen, mitä tuntemuksia se herättää verrattuna toiseen ryh- mään, jolla ei ole kokemusta alasta muuten kuin kuluttajana. 1.2 Tutkimusaineisto Tutkimusaineisto on kerätty kyselyllä, johon ovat vastanneet sekä ammatti- että arkikäyt- täjät. Kysely suoritettiin kahdessa samaan aikaan avoinna olevassa kyselyssä. Toisessa kyselyyn vastasivat Oras Group-yhtiön työntekijät, eli alan ammattilaiset, ja toiseen vas- tasivat ns. arkikäyttäjät eli tavalliset kuluttajat, joilla ei ole kokemusta hanojen huollosta tai hanojen asennuksesta. Arkikäyttäjäryhmän kyselyyn lisättiin kyselyn alkuun kyllä/ei- kysymys, jolla vastaajat selventävät, omaavatko he kokemusta hanojen asentamisesta tai huollosta. Vain vastaajat, jotka vastasivat ”ei kokemusta” sisällytettiin tutkielmaan. Kyse- lyyn vastataan viisiportaisen asteikon mukaan huonoimmasta (1) parhaimpaan (5). Arkikäyttäjien ryhmää ja heidän vastauksiaan nimitetään tilastollisen tutkimuksen teori- oita mukaillen näytteeksi. Koska en ole ollut yhteydessä vastaajiin ennakolta, enkä voi myöskään tietää yksittäisten vastaajien henkilöllisyyttä, ei tässä tapauksessa voida puhua otoksesta vaan nimenomaan näytteestä. Tilastollisten teorioiden mukaan tämä on oleel- lista mainita kyselyn ryhmistä puhuttaessa. (Valli 2015: 49) Alan ammattilaisten ryhmästä ja heidän tuloksistaan puhuttaessa käytetään nimitystä harkinnanvarainen näyte. Tämä siitä syystä, että ryhmä on valikoitu etukäteen ja ky- seessä on ryhmä, jonka etuja kyselyllä haetaan ja ryhmä, jonka tarpeita täyttävä kysely on. Kyselyssä esillä oleva tuote on myös entuudestaan tuttu Oras Groupin henkilöstölle, joten ryhmä on tästäkin syystä ennakolta harkinnanvarainen. (Vehkalahti 2014: 46) 11 Kysely toteutettiin kyselynetti.fi-sivustolla arkikäyttäjille, kun taas ammattikäyttäjien ky- sely toteutettiin yhtiön sisäisen palvelimen sekä kyselypohjan kautta. Arkikäyttäjien ryh- män kysely jaettiin omien Facebook- sekä Instagram-tilien kautta vastattavaksi. Ammat- tikäyttäjien kysely jaettiin Oras Groupin intranetin sekä sisäisen sähköpostin kautta koko organisaation vastattavaksi. Kyselynetti.fi palvelu oli käytössä kyselyn ensimmäisen version esitestausta suorittaes- sani keväällä 2019, ja se osoittautui päteväksi alustaksi niin kyselyn luonnin kannalta kuin kyselyn toteutuksen ja siitä saatujen tulosten tilastoinnissakin. Palvelu täyttää siis verk- kokyselyn tärkeimpiä vaatimuksia (Valli 2015: 47). Yrityksen sisäistä kyselypohjaa ja alus- taa oli myös helppo käyttää kyselyn luomiseen ja toteutukseen. Alusta tuottaa saman datan kuin kyselynetti.fi-alusta, joten eroavaisuuksia ei ole datan tilastoinnissa. Molem- mat palvelut tuottavat raakadatan kyselyn vastauksista, mutta keskiarvon laskemisen suoritan kuitenkin itse. Tietosuoja on myös tärkeä tekijä kyselylomaketta tehtäessä ja kerättäessä tietoja ihmi- siltä, vaikkakin tässä kyselyssä ei kysytä henkilötietoja muuten kuin iän ja sukupuolen osalta. Kyselyn saatekirjeessä on kuitenkin maininta, että tiedot kerätään tutkielmaa var- ten ja osallistumalla kyselyyn osallistuja hyväksyy tiedon käyttämisen tutkielman aineis- tona. Tämä on hyvän kyselylomakkeen käytäntö ja vastaajien yksityisyys, eli anonymi- teetti saadaan näin turvattua. Saatekirje on muutenkin hyvin tärkeä osa kyselytutki- musta, koska sillä saadaan parhaimmassa tapauksessa motivoitua osallistuja vastaa- maan kyselyyn, tai vaihtoehtoisesti lannistettua hänet olemaan vastaamatta kyselyyn. Saatekirjeessä tulee myös olla selvästi esillä kyselyn tavoite, tutkimuksen tausta ja ohjeet kyselyn tekemiseen. (Tähtinen, Laakkonen & Broberg 2011: 24-25) Kysely koostuu 12 kysymyksestä, joita edeltää englanninkielinen videonäyte teknisestä ohjevideosta, jossa kuvataan Oras Esteta Wellfit-termostaattihanan vaihtimen kahvan asennon tunnistimen vaihto. Kuten ylläolevasta virkkeestä käy ilmi kyseessä on tekninen 12 ja erikoiskieltä sisältävä video. Tämä on tietoinen valinta, koska tämä kuvastaa tyypillistä teknistä ohjevideota. Jos olisin valinnut helpommin ymmärrettävän videonäytteen ja huolto-operaation, olisi se antanut mielestäni väärän kuvan teknisistä ohjevideoista, ja se olisi ollut liian yleistajuinen selvittääkseen arkikäyttäjän ja ammattikäyttäjän eroja ai- neistosta. Videonäytteitä on yhteensä kaksi, joissa ainoana erona on, että toisessa videossa on miesääni ja toisessa naisääni. Videonäyte on 1 minuutti 30 sekuntia pitkä ja siinä käydään sanallisesti ja kuvallisesti läpi yllä mainittu huolto-operaatio. Videonäyte vaihtui aina lop- puun suoritetun vastauksen jälkeen, joten molemmille videonäytteille saatiin näin sama määrä vastaajia. Vastaukset identifioitiin myös sen mukaan, minkä version videosta ky- selyn tekijä katsoi. Tämän lisäksi vastaajilta kysytään kyselyn aluksi ikä, sukupuoli sekä heitä pyydetään arvioimaan englannin kielen osaamistaan. Näitä muuttujia ja niiden eroja tutkitaan vastausten eroavaisuuksien kautta aineistossa. Näitä käytetään myös apuna aineiston analyysissä ja tulkinnassa siitä, onko eroavaisuuksia eri sukupuolten, ikä- luokkien tai englannin kielen taidon välillä puhesynteesin kokemisessa. 1.3 Tutkimusmenetelmät Tutkielman menetelmänä toimii kvantitatiivinen kyselytutkimus, jonka vastauksista las- ketaan Mean Opinion Score (MOS), eli keskiarvoinen tulos luonnollisuuden ja ymmärret- tävyyden käsitteille ja kaikille muuttujille: vastaajien ikä, sukupuoli ja englannin kielen taito sekä lisäksi puhesynteesin muuttujat: miesääni ja naisääni. Näistä keskiarvoista suoritetaan varianssianalyysi eri muuttujien välillä ja muuttujien tuloksista pyritään löy- tämän yhtäläisyyksiä ja eroavaisuuksia (ks. Heikkilä 2014: 210). Kyselyn pohjana toimii siis mittausasteikon ja strukturoitujen vastausvaihtoehtojen puo- lesta Mean Opinion Score (MOS) -metodi. MOS-metodi on otettu alun perin käyttöön puheluissa käytetyn äänenlaadun arvioimiseen (International Telecommunication Union 1994: 85). Alun perin puheluiden puheen äänenlaadun ja selkeyden arvioimiseen luotu 13 kysely ja arvoasteikko on myöhemmin otettu käyttöön käyttäjän kokemuksia arvioivaan tutkimukseen ja tätä tutkielmaa silmällä pitäen myös puhesynteesin ja sen puheen laa- dun arvostelun metodiksi. (Streijl, Winkler, & Hands 2016: 213) Kyseessä on perusperiaatteiltaan kyselylomake, jossa jokaisessa kysymyksessä on viisi eri vastausvaihtoehtoa. Kysymysten vastausten arvot lasketaan yhteen, nämä jaetaan osal- listujamäärällä, ja näin ollen saadaan keskiarvo, josta tulee MOS-asteikko 1-5, jossa 1 on huonoin ja 5 paras. (Viswanathan & Viswanathan 2005: 56) MOS käydään kokonaisuu- tena läpi tarkemmin alaluvussa 1.3.2. Teoreettiseen viitekehykseen liittyvät vahvasti vertailevan tutkimuksen teoriat tilastolli- sesta tutkimuksesta. Käytän tutkielmassa varianssianalyysiä, jolla analysoidaan yhden tai useamman muuttujan vaikutusta vasteeseen, eli tässä tutkielmassa MOS-metodilla saa- tuun keskiarvoon. (Ks. Tähtinen ym. 2011: 102) Muuttujina on ylimmällä tasolla kaksi käyttäjäryhmää: ammattikäyttäjä ja arkikäyttäjä. Seuraavan tason muuttujia ovat käyttä- järyhmien sisäiset muuttujat sukupuoli ja ikä sekä englannin kielen taitotaso, jotka tilas- toidaan myös. Teoreettisena pohjana toimivat luonnollisuuden ja ymmärrettävyyden kä- sitteiden tarkentamisessa onnistuneen viestinnän periaatteet, informaation välitys, au- diovisuaalinen viestintä, kuuntelukokemus sekä tekninen viestintä. 1.3.1 Kyselytutkimus Kyselytutkimuksen toteuttamisen prosessit on tiivistetty Kuviossa 1. 14 Kuvio 1. Kyselytutkimuksen prosessit Prosessit kulkevat käytännössä tutkimusongelman kohdentamisesta teorian avulla, ky- selyn luontiin, sen esitestaukseen ja toteutukseen (Vilkka 2007: 79). Testaaminen on jo suoritettu keväällä 2019, jolloin loin alustavan version kyselystä. Testin pohjalta muoka- tulle kyselylle suoritettiin lisäksi esitestaus, johon osallistui kaksi kollegaani Oras Group Oy:ssä. Tämän avulla pyrittiin löytämään mahdollisia virheitä teknisellä tai ulkoasullisella puolella sekä myös löytämään korjausehdotuksia kysymyksiin tai vastauksiin. Kysymysten sekä kysymystyyppien laadintaa pohjustivat tutkimuskysymykset ja arvioin- tiin käytetyt käsitteet. Tärkein seikka kysymyksiä laatiessa olikin, että jokainen kysymys palvelee jotain haetuista käsitteistä, joita tutkitaan. Tärkeää kyselyn kysymysten luon- nissa on myös luonnollisesti se, että kysymykset ovat toimivia ja että niihin on helppo vastata. Tähän vaikuttavat paljon vastausvaihtoehdot ja niiden selkeys. (Heikkilä 2014: 54-55) Kysymysten luonti pohjautui tilastollisessa tutkimuksessa käytettävään hyvän kysymyk- sen käsitteeseen. Tähän kuuluu ymmärrettävyys (osallistuja ymmärtää kysymyksen), tieto asiasta (osallistuja omaa tiedon vastaukseen), vastaushalukkuus (on halukas vas- taamaan) ja yksiselitteisyys (kysymykset ovat yksiselitteisiä). (Kananen 2014: 142) Hyvän kysymyksen on siis oltava kieliasultaan moitteeton ja siinä on kysyttävä selkeästi ja tarkasti vain yhtä asiaa. Hyvän kysymyksen on myös mahdollistettava tuloksen saanti 15 halutulla tavalla, eli toisin sanoen kyselyyn osallistujan on pystyttävä vastaamaan kysy- mykseen. Kysymys ei saa myöskään olla liian pitkä tai liian vaikeasti ymmärrettävä, vaan sen on oltava mahdollisimman yksiselitteinen. (Heikkilä 2014: 54-55) Hyvän kysymyksen piirteitä on myös selkeä kysymystyyppi, suoraviivaiset vastausvaihto- ehdot sekä toimiva mittausasteikko. Onnistuneeseen kyselyyn kuuluu kuitenkin monia muitakin tekijöitä kuin vain nämä yllämainitut tekijät. Näitä ovat muun muassa vastaajan mielenkiinto kyselyä kohtaan, fyysinen mahdollisuus vastata kyselyyn, saatekirjeen/ky- selyn ohjeistuksen riittävyys sekä muut inhimilliset tekijät, jotka voivat vaikuttaa kyselyn tekoon. (Vilkka 2007: 63-70) Kysymystyypit voidaan jakaa karkeasti kolmeen isoon ryhmään: monivalintakysymykset, avoimet kysymykset sekä sekamuotoiset kysymykset. Tutkielmassani keskityn ensimmäi- seen. Monivalintakysymykset ja niiden vastausvaihtoehdot ovat strukturoidut sekä en- nalta määrätyt, niiden kysymysmuoto on myös vakioitu. (Vilkka 2007: 62) Tämä noudat- taa kyselytutkimuksen laadinnan perusteorioita ja on hyvin suoraviivainen ja tehokas tapa kerätä dataa. Hyvien kysymysten luonti on ehkä tärkein seikka kyselylomaketta laadittaessa, mutta hy- vät kysymykset voidaan tehdä tarpeettomiksi huonoilla tai riittämättömillä vastausvaih- toehdoilla. Tutkielmassani käytän jo aiemmin mainittua MOS-asteikkoa, joka on verrat- tavissa tilastollisessa tutkimuksessa yleisesti käytettävään Likertin skaalaan. Likert-asteik- koiset kysymykset täyttävät vuorostaan välimatka-asteikon kriteerit, joka on myös vakiin- tunut mitta-asteikko tilastollisessa tutkimuksessa. Välimatka-asteikossa voidaan määri- tellä muuttujien eroavaisuus toisistaan. Muuttujien arvojen järjestys on myös ennalta määrätty ja yksi sen suositeltavista testausmenetelmistä on myös MOS-metodissa käy- tettävä keskiarvon laskeminen. (Tähtinen ym. 2011: 26) Vastausvaihtoehdot ja mittausasteikko noudattivat tutkielmassani siis MOS-asteikkoa ja menetelmää. MOS-asteikko on viiden strukturoidun vastausvaihtoehdon kysely, jossa 16 asteikko on useimmiten muotoiltu ääripäästä ääripäähän esim.: bad, poor, fair, good, excellent (Viswanathan & Viswanathan 2005: 63). Käytän tässä tutkielmassa kyseisestä asteikosta suomennosta erittäin huono, huono, kelvollinen, hyvä, erinomainen. Tulokset lasketaan laskemalla keskiarvo osallistujien vastauksien arvoista. Kun MOS-keskiarvot on laskettu kaikista kyselyn pääkäsitteistä ja muuttujista, suorite- taan näille sovellettu varianssianalyysi, jolla vertaillaan eri keskiarvoja toisiinsa. Varians- sianalyysillä tutkitaan nimenomaan keskiarvojen välisiä eroja eikä varianssien välisiä eroja kuten nimestä voisi päätellä (Heikkilä 2014: 210). Käytän tutkielmassani yksisuun- taista varianssianalyysiä, eli jaan muuttujat yksittäisiin ryhmiin ja vertaan näitä keske- nään. Käyttäjäryhmien lisäksi muuttujia ovat osallistujien ikä, sukupuoli sekä englannin kielen taitotaso. Puhesynteesin muuttujia ovat miesääni ja naisääni. Muuttujat kuvattu kuviossa 2. Kuvio 2. Muuttujat kyselytutkimuksessa Jokaiselle muuttujalle lasketaan MOS-tulos kaikista vastauksista sekä erikseen oma arvo ymmärrettävyydelle, luonnollisuudelle sekä näiden alakäsitteille. Suoritan varianssiana- lyysin yllämainittujen muuttujien keskiarvojen (MOS-tulos) välillä. 17 Tärkeäksi osaksi varianssianalyysissä nousee tilastojen tarkka listaaminen ja tulosten tarkka raportoiminen. Tuloksia raportoitaessa varianssianalyysissä on tarpeellista esittää vain oleellisimmat tiedot. Käytän omassa tutkielmassani ja raportoinnissani keskiarvojen vertailua, ryhmäkokojen ilmoitusta sekä tietoa siitä onko eroavaisuus ollut merkittävä. (ks. Heikkilä 2014: 212) 1.3.2 Mean opinion score (MOS) Puhesynteesin alalla vakiintuneeksi tutkimusmenetelmäksi on muodostunut MOS-kyse- lytutkimus, eli Mean opinion score -tutkimus, jolla pyritään löytämään keskiarvo halu- tuista laatukriteereistä. MOS-metodi on otettu alun perin käyttöön puheluissa käytetyn äänenlaadun arvioimiseen (International Telecommunication Union 1994: 85). MOS on sittemmin otettu puhesynteesin arviointimetodiksi ja laadun määrittelemisen konsep- tiksi. MOS-kyselyn voi suorittaa subjektiivisen tai objektiivisen metodin avulla. Tässä tutkiel- massa käytetään käyttäjälähtöisempää subjektiivisen testin metodia, koska tällä meto- dilla tarkastellaan enemmän puhesynteesin vastaanottajan kokemusta. Objektiivisessa testissä huomio kohdistuu puhesynteesin teknisisiin ominaisuuksiin ja laatuun. (Streijl, Winkler, & Hands 2016: 213) Kyselyni ei ole täysin perinteinen MOS-kysely vaan metodi toimii pohjana, jota sovellan omaan tutkimukseeni. Kriteerit, joilla tutkin kyselyn tuloksia ovat perinteiset 18 luonnollisuus ja ymmärrettävyys, jotka haarautuvat alakäsitteisiin Kuvion 3 osoittamalla tavalla. Kuvio 3. Kyselytutkimuksen käsitteet Jokainen ymmärrettävyyden ja luonnollisuuden alakäsite sisältää kaksi kysymystä kyse- lylomakkeessa. Näin syntyy 12 kysymyksen kyselylomake. Jokaiselle käsitteelle saadaan näin myös laskettua oma yksilöity tulos. Kuvion 2 mukaan tulokset yhdistellään kolmesta alakäsitteestä ja näin ollen saadaan ensin ymmärrettävyyden ja luonnollisuuden tulokset ja nämä yhteen laskettuna MOS-kokonaisarvo. Luonnollisuuden ja ymmärrettävyyden käsitteitä ja niiden alakäsitteitä tarkennetaan luvussa 4.4. Omassa tutkielmassani käytän mitta-asteikkona: erittäin huono, huono, kelvollinen, hyvä, erinomainen-skaalaa. Mittausasteikosta löytyy variaatioita mm. 7- ja 9-osaisia asteikkoja, mutta koin osuvammaksi yksinkertaisimman ja selkeimmän viiden asteikon metodin. Isomman asteikon mittauksissa on luonnollisesti tarkemmat ja hienojakoisemmat mää- ritteet, mutta viisiasteikkoinen järjestelmä oli käytössä jo aiemmin suoritetussa esites- tauksessa ja se toimi tarpeellisesti, joten en kokenut hyödylliseksi lähteä muuttamaan sitä tähän kyselyyn. 19 Kaikista esitetyistä käsitteistä lasketaan mittausasteikon mukaisesti keskiarvo jakamalla yhteenlaskettu vastausten MOS-arvo (1-5) vastaajien määrällä, alla olevan kaavan mu- kaisesti. (1) (De 2016: 1119) Laskettu keskiarvo kysymyksistä tilastoidaan taulukoilla ja kuvioilla, joista käyvät ilmi jo- kaisen käsitteen MOS-arvo. Mitä suurempi arvo, sitä laadukkaampana on kyseistä kritee- riä pidetty. Kyselyn tuloksista ja listatuista tilastoista tehdään yksittäiset analyysit sekä vertaileva varianssianalyysi, ja tästä tehdään johtopäätökset ja pohdinta puhesynteesin kokemisesta ohjevideolla. 20 2 Informaation välitystä onnistuneella viestinnällä Yksi viestinnän tärkeimmistä, ellei tärkein, tehtävä on välittää informaatiota eteenpäin (Akilandeswari 2015: 44). Onnistunut ja tarkka informaation välittäminen on myös tek- nisen viestinnän ja näin myös oman työtehtäväni ohjevideoitten tekijänä, tärkein osa. Teknisen viestinnän kehitys ja itsenäistyminen on ollut sen lähihistoriassa jopa tarpeet- toman hidasta, ja tähän hitauteen suurimpana syynä oli teknisen viestinnän käsitteen määrittämisen vaikeus itse alan harjoittajien ja ammattilaisten toimesta. Käsitteen mää- rittämisen vaikeus hankaloitti vuorostaan alan rajaamista selkeästi omaksi tieteenalak- seen. (Hundleby & Allen 2010: 7-8) Teknistä viestintää on alana ja käsitteenä kasvanut tästä epäselvyyden ajasta ja Suomel- lakin on nykyään oma Teknisen viestinnän yhdistys (STVY) määrittelee teknisen viestin- nän näin: Sekä laitteiden että ohjelmistojen tehokas ja turvallinen käyttö edellyttää, että pys- tymme tutustumaan niin niiden uusiin kuin vanhoihinkin toimintoihin vaikkapa käyttöohjeen avulla. Tällaisen käyttäjille tarkoitetun informaation suunnittele- minen ja tuottaminen on ala nimeltään tekninen viestintä, ja alan asiantuntija on nimeltään tekninen viestijä. Käyttöohjeiden suunnittelu ja toteuttaminen on vain yksi osa teknistä viestintää. (STVY 2019) Tekninen viestintä ja sen ammattilaisia on ollut vaikea kuvata juuri siksi, että tekninen viestijä voi toimia hyvin monella eri alalla, ja teknistä viestintää käytetään nykypäivänä oikeastaan joka alalla jossain muodossa. Tekninen viestintä on myös viime vuosina kasvanut tärkeäksi osaksi modernien organi- saatioiden viestintää. Kuvaavinta tästä on se, että monella yrityksellä on nykyään täysin oma jaoksensa tekniselle viestinnälle, ja toimintoja ei sisällytetä esimerkiksi markkinoin- tiin tai viestintään, vaan se on kasvavissa määrin täysin oma ja itsenäinen jaoksensa 21 organisaation sisällä. Oras Group Oy:ssä tekninen viestintä tuli omaksi itsenäiseksi jaok- sekseen vuonna 2015. Oras Groupissa teknisen viestinnän jaoksen ensisijainen tehtävä on välittää teknistä tie- toa eteenpäin niin sisäisesti organisaation sisällä, kuin ulkoisestikin asiakkaille, alihank- kijoille sekä yhteistyökumppaneille. Teknistä tietoa välitetään pääasiallisesti käyttöohjei- den sekä ohjevideoiden kautta. Näistä tarkemmin luvussa 3. Alustoja ja välineitä on monia viestinnässä, mutta tässä tutkielmassa keskityn audiovisu- aalisen viestinnän elementteihin ohjevideoissa sekä teknisen viestinnän ominaisuuksiin käyttöohjeissa. Audiovisuaalinen ja tekninen viestintä pohjautuvat kuitenkin viestinnän perustaviin viestintämalleihin, jotka käydään läpi alaluvuissa. 2.1 Viestintämallit Teknisellä viestinnällä välitetään teknistä informaatiota ja tämän vuoksi informaation vä- litys ja itse viestinnän aspekti voi vaikuttaa hyvin yksinkertaiselta ja suoraviivaiselta pro- sessilta. Viestintä on kuitenkin harvoin, jos koskaan, vain näin yksinkertainen informaa- tion siirto lähettäjältä vastaanottajalle. Tutkielman kannalta onkin tärkeää käydä läpi eri viestintämallit ja niiden perusperiaatteet. Viestintämallien ajatuksena on kuvata, miten siirretään informaatiota henkilöltä toiselle. Informaatio taas muuttuu tiedoksi, kun vastaanottaja tulkitsee saamansa informaation ja antaa sille merkityksen. Viestinnässä eri mallit tarjoavat tiedonsiirtoon kehyksen, jossa voidaan tarkastella kommunikaatioprosessin ongelmia. Hyvä malli onkin siis sellainen, joka selventää ja yksinkertaistaa kommunikaation rakennetta. Mallit, jotka perustuvat Shannonin ja Weaverin viestintämalliin ovat kaikista yleisimmin käytettyjä teknisessä viestinnässä. (Al-Fedaghi 2012) Nämä Shannonin ja Weaverin viestintämalliin perustuvat mallit ovat melko lineaarisia, kulkien lähettäjästä koodaimen kautta vastaanottajaan. 22 Viestintämalleja voidaan lähestyä myös semiotiikan sekä transaktionaalisuuden kautta. Näistä semiotiikka keskittyy merkkien ja merkitysten rooliin viestinnässä, kun taas transaktionaalisuus keskittyy vuorovaikutukseen. Lineaarisessa mallissa vuorovaikutus usein jää vain lähettäjän ja vastaanottajan väliseksi toiminnaksi. Vuorovaikutus voidaan kuitenkin nähdä myös joissakin viestintämalleissa useamman henkilön ja eri toimijoiden välisenä toimintana, joka vaikuttaa keskeisellä tasolla viestinnän kulkuun. (Van Ruler 2018: 370) 2.1.1 Shannonin ja Weaverin tiedonsiirron malli ja sen kritiikki Shannonin ja Weaverin viestintämalli kehitettiin vuonna 1948, jolloin se mainittiin en- simmäisen kerran artikkelissa ”A Mathematical Theory of Communication”, joka julkais- tiin Bell System Technical Journal -lehdessä. Mallin laativat Claude Shannon ja Warren Weaver. Heidän laatimansa malli on yksi viestinnän tärkeimpiä malleja, jota on kutsuttu esimerkiksi viestinnän matemaattiseksi teoriaksi ja kaikkien muiden mallien äidiksi. (JMC Study Hub 2019) Tämä viestinnän malli ei ole suoraan lineaarinen, vaan siinä on monta tekijää, jotka muo- dostavat yhteisen kokonaisuuden informaation siirrosta. Shannonin ja Weaverin mallin mukaan viestinnän prosessissa on viisi tärkeää tekijää. Näitä ovat: 1. lähettäjä (informaation lähde), 2. koodain (lähetin), 3. häiriötekijät (häly), 4. koodin purkaja (vastaanottaja), sekä 5. vastaanottaja (vastaanotin). Näitä havainnollistetaan tar- kemmin Kuviossa 4. 23 Kuvio 4. Shannonin ja Weaverin viestinnän malli Shannonin ja Weaverin mallissa informaation lähettäjä valitsee, minkä tiedon se päättää viestinnässä lähettää eteenpäin. Tämä viesti kulkee koodaimen, eli lähettimen läpi. Tämä voi olla esimerkiksi jokin kone, joka muuttaa viestin muodon signaaleiksi, kuten puheli- men äänen aalloiksi, jotka kulkevat puhelimen kuulokkeen läpi. Häiriötekijät, joita voi- daan kutsua myös hälyksi, ovat kaikki se mikä tuottaa epämiellyttävää ääntä ja häiriötä viestintään. Tätä voivat olla esimerkiksi muut ihmiset ja ympäristö, jotka voivat muuttaa kulkevan viestin todellista tarkoitusta. (JMC Study Hub 2019) Kun viesti saapuu signaaleina vastaanottajalle, se muuttuu taas koodaimessa, eli vas- taanottimessa, ymmärrettävään muotoon. Esimerkiksi puhe kuuluu puheena ja teksti- viesti näkyy selvänä tekstinä eikä koodikirjoituksena. Kun viesti on ymmärrettävänä pe- rillä, saavuttaa se lopulta vastaanottajan. Hyvänä esimerkkinä näistä viidestä tekijästä ovat ihmispuheen eri vaiheet. Aivot toimivat lähettäjänä, suu koodaimena, vastaanotta- jan huono kuulo häiriötekijänä, vastaanottajan aivot koodaimen vastaanottajana ja toi- nen henkilö itse vastaanottajana. (JMC Study Hub 2019) Informaation lähettäjä Koodain/Viestin purku signaaleiksi Häiriötekijät/ Häly Koodain/Signaalien purku viestiksi Informaation vastaanottaja 24 Vaikka edellä mainittu viestintämalli on yleisin malli viestinnän saralla ja sen pohjalta ovat melkein kaikki muut mallit saaneet alkunsa, on Shannonin ja Weaverin viestintä- malli saanut myös kritiikkiä. Vaikka Shannonin ja Weaverin malli on inspiroinut tietolii- kenteen viestintää, on se alun perin suunniteltu verbaalista kommunikaatiota varten (Al- Fedaghi 2012: 12). Mallin kritiikkinä mainitaan muun muassa palautteen puuttuminen sekä mallin soveltumattomuus massakommunikaatioon. Vastaanottajalla on myös pas- siivinen rooli tässä mallissa, kun taas lähettäjä toimii tärkeimpänä tekijänä. (JMC Study Hub 2019). Al-Fedaghi (2012) mainitsee mallin olevan enemmän informaation kulun malli kuin itse viestinnän malli. Viestintä ei oikeasti ole niin suoraa kuin mitä viestintä- malli antaa ymmärtää, vaan enemmänkin epäsuoraa. Shannon ja Weaver itse mainitsevat kolme tasoa, joissa voi esiintyä ongelmia viestinnän aikana. Näitä ovat tekniset ongelmat, semanttiset ongelmat ja tehokkuuteen liittyvät on- gelmat. Tekniset ongelmat ovat näistä helpoimmin selvitettävissä, ja näitä ongelmia var- ten malli on alun perin kehitetty. Semanttiset ongelmat viestinnässä on helppo löytää, mutta hankalampi selvittää. Näihin liittyvät esimerkiksi ongelmat sanojen ymmärtämi- sessä ja kulttuurillisissa eroissa, jotka voivat vaikuttaa viestinnän ymmärrettävyyteen. Te- hokkuuteen liittyvät ongelmat taas keskittyvät siihen, miten viestintämallin kautta vies- tintä voidaan ymmärtää manipulaationa, sillä vastaanottajan rooli on hyvin passiivinen ja viestin sisällöstä vastaa nimenomaan lähettäjä. (Fiske 1990: 7) Semanttisiin ongelmiin liittyy vahvasti myös se, ettei semanttisia järjestelmiä ole määri- telty yhtä tarkkaan kuin teknisiin ongelmiin liittyviä signaaleja. Tämä tekee informaation mittaamisesta semanttisella tasolla hankalampaa, sillä merkitystä ei ole yhtä helppo mi- tata kuin teknistä, numeraalista tietoa. (Fiske 1990: 9) 2.1.2 Semioottinen viestintämalli Viestinnän merkitystä voidaan mallintaa ja tutkia monilla eri käsitteillä. Näitä voivat olla esimerkiksi merkki, merkitys, ja symbolit. Mallit, jotka perustuvat näihin, eroavat 25 erityisesti Shannonin ja Weaverin viestintämallista siinä, että ne eivät ole viestinnässä lineaarisia. Ne keskittyvät enemmänkin analysoimaan suhteita, jotka auttavat viestin merkityksen välittämisessä. (Fiske 1990: 39) Semioottinen malli on yksi näistä viestinnän malleista. Semioottisessa mallissa on kolme pääaluetta. Näitä ovat 1. Merkki itsessään. Merkit ovat ihmisten kehittämiä, ja niihin lii- tetyt merkitykset ovat ihmisten laatimia. 2. Järjestelmät joihin merkit on järjestetty. Tällä tarkoitetaan jotakin koodia tai järjestelmää, joka on luotu jotakin laajempaa kokonai- suutta varten. Esimerkiksi liikennemerkit luovat tällaisen järjestelmän. 3. Kulttuuri, jossa nämä järjestelmät toimivat. Kulttuurissa valloilla olevat normit ja käytännöt. (Fiske 1990: 40). Semiotiikka keskittyy pääasiassa tekstiin, toisin kuin lineaariset viestintämallit tekevät. Toinen suuri ero on vastaanottajan asema, joka semiotiikassa on paljon aktiivisempi kuin Shannonin ja Weaverin viestintämalliin perustuvissa malleissa. Semiotiikassa myös suo- sitaan termiä ”lukija”, ”vastaanottajan” sijaan. Tämä viittaa suurempaan aktiviteetin määrään kuin pelkkä vastaanottaminen. Lukeminen on myös kulttuurillista toimintaa, ja esimerkiksi samaa valokuvaa voidaan lukea usealla eri tavalla. (Fiske 1990: 40) Semiotiikassa viestintä nähdään merkityksen tuottamisena viesteissä, kun taas Shanno- nin ja Weaverin viestintämallissa se nähdään mainitun koodaimen tuottamana. Merkitys ei ole koskaan yksiselitteinen käsite viesteissä, vaan se on aktiivista tulkintaa. Viestittely ei ole semiotiikassa vain viestin välittämistä pisteestä A pisteeseen B, vaan se on enem- mänkin keskustelua ja neuvottelua, jossa kuljetaan koko ajan henkilöiden ja viestien vä- lillä. (Fiske 1990: 46) 2.2 Onnistuneen viestinnän mittarit Onnistunut viestintä ja informaation välitys on hyvin moniulotteinen prosessi ja siinä on monta muuttujaa, jotka pitää ottaa huomioon, kuten aiemmista alaluvuista kävi ilmi. 26 Kyse ei ole pelkästä informaation välittämisestä erinäisten medioitten tai alustojen kautta vastaanottajille. Teknisen viestinnän informaation välitys on ymmärrettävän ja vastaanottajan tarpeita ja käyttäytymistä mukailevan tiedon luomista. Tällaisen viestin- nän kannalta on otettava huomioon eri näkökulmia. Esimerkkeinä näistä on tiedon käy- tettävyys, tiedon ulkomuoto, vastaanottajan kognitiiviset ja psykologiset ominaisuudet, tietokone-ihminen-kommunikaation kysymykset sekä muita muuttujia kontekstin mu- kaan. (Albers 2012: 13) Tiedon vastaanottaminen on hyvin subjektiivista, ja jokainen henkilö vastaanottaa tietoa oman filtterinsä kautta. Tärkeimmäksi piirteeksi nouseekin aiemmin mainittu välitettä- vän informaation ulkomuodon ja sisällön mahdollisimman virheetön tila. Onnistuneen viestinnän ja tiedonvälityksen voidaan sanoa sisältävän seuraavat piirteet: 1. Selkeä ajatus siitä mitä tietoa välität ja miten 2. Tiedon virheettömyys ja soveliaisuus 3. Tiedon tiivis esittäminen 4. Tiedon täysi valmius ja aukottomuus 5. Palaute tiedon vastaanottavalta osapuolelta Viestijällä on oltava selkeä ajatus siitä mikä hänen tavoitteensa on informaation välittä- misellä ja myös siitä, miten hän tavoitteeseen haluaa päästä. Mitä parempi ymmärrys ja ajatus välitettävästä tiedosta ja tavasta lähettää sitä eteenpäin, sitä tehokkaammin sen onnistuu viestimään muille. (Akilandeswari 2015: 44) Tiedon virheettömyys on tärkeää oikeakielisyyden, tiedon oikeellisuuden sekä myös oi- kean alustan valinnan kautta. Informaatio ja sen välitystapa on oltava soveliasta kulttuu- rillisesti sekä sosiaalisesti ja huomioon on otettava myös, että ajankohta ja väline, jolla informaatiota välitetään, on sovelias. On varmistettava myös, että välitettävä informaa- tio on soveliasta sitä vastaanottavalle kohderyhmälle. (Akilandeswari 2015: 44) Tehokkaassa teknisessä viestinnässä informaation täytyy sisältää tarkka ja oikea sisältö oikeassa kontekstissa, mutta ei muuta. Sen on myös oltava järjestetty loogisesti ja sen on 27 siirryttävä mahdollisimman nopeasti sen tarkoitteeseen. Informaation on oltava tiiviy- den lisäksi myös täysin aukotonta. Sen on sisällettävä kaikki se informaatio, mitä vastaan- ottaja haluaa tietää. Tiivistämistä ei voida tehdä sillä hinnalla, että informaation aukot- tomuus ja oikeellisuus kärsii. (Akilandeswari 2015: 45) Tämä on erityisen tärkeää ohjevi- deoissa ja manuaaleissa. Jokainen prosessi on kuvattava aukottomasti ja oikein, jos näin ei ole ja yksikin kohta on puutteellinen, on koko ohjevideo väärä koska pahimmassa ta- pauksessa tämä johtaa osan hajoamiseen tai muuhun vahinkoon. Palaute välitetystä informaatiosta on keskeinen käsite tämän tutkielman kannalta ja tär- keä ominaisuus onnistuneessa viestinnässä. Tutkielman kyselyn perimmäinen tarkoitus on saada palautetta ohjevideon viestinnästä puhesynteesiä käytettäessä. Palaute on myös hieman irrallinen käsite muista listatuista piirteistä, koska se ei ole suoranaisesti onnistuneen viestinnän piirre vaan enemmänkin toimenpide, jolla varmistetaan, että viestintä on ollut onnistunutta. Informaatio voi muuttaa radikaalistikin ulkomuotoa siitä hetkestä, kun se lähetetään, siihen hetkeen, kun se vastaanotetaan. Sosiaalipsykologit ovat laskeneet, että tässä on keskimäärin 40-60% muutos viestin tarkoitteessa lähettä- jältä vastaanottajalle. Tästä syystä on kriittisen tärkeää saada palautetta välittämästäsi tiedosta ja nimenomaan siitä, miten se on vastaanotettu. (Akilandeswari 2015: 45) Esimerkkinä tästä, että jos olisimme sisällyttäneet puhesynteesin ohjevideoihin ilman minkäänlaista palautetta kohderyhmiltä, jotka ohjevideoita käyttää, emme olisi välttä- mättä koskaan tienneet, josko puhesynteesi esimerkiksi haittaisi tiedon vastaanotta- mista häiritsevän paljon. Tekemällä kyselytutkimuksen ja saamalla palautteen kohderyh- miltä saamme vastauksen näihin kysymyksiin. 28 3 Tekniset käyttöohjeet ja ohjevideot Tekniset manuaalit ja kasvavissa määrin myös ohjevideot, ovat tuttu käsite käytännössä kaikille ihmisille, jotka ovat ostaneet jonkin uuden tuotteen. Olipa tämä tuote Ikean huo- nekalu, polkupyörä tai jopa valmisateria, kaikki nämä sisältävät jonkinasteisen asennus, huolto tai käyttöohjeen. Huonekalun kokoamisohje, polkupyörän huolto-ohje tai val- misaterian lämmitys ohjeet ovat kaikki omalla tavallaan teknistä viestintää sekä käyttö- ohjeita, joilla ohjeistetaan tuotteen käyttämisessä. Käyttöhje on näin ollen jopa pakolli- nen osa tuotetta. (Pöyhönen & Tiusanen 1991: 7) Yleisin mielikuva, joka ihmisille tulee tuotteen mukana tulevista ohjeista, on valitettavan usein välinpitämätön tai jopa negatiivinen. Tämä johtuu pitkälti siitä, että manuaaleihin ja teknisiin ohjeisiin ei ole panostettu ja niitä ei ole koettu ensisijaisen tärkeänä uuden tuotteen lanseerauksessa ja toimituksessa (Maijala, Nordlund & Virolainen 1987: 5). Tek- nisen viestinnän vakinaistettua asemansa, tämä on pikkuhiljaa muuttumassa. Yritykset kokevat nykyään ensisijaisen tärkeäksi panostaa laadukkaaseen asennusohjeeseen, koska tämä kulkee käsi kädessä tuotteen ja tätä kautta yhtiön imagon kanssa. Esimerkkinä käyttöohjeen laadun merkityksestä voi käyttää halvalla tuotettua ja halvalla hinnalla ostettua tuotetta, jossa on hyvin pelkistetty ja usein vajavainen ohje mukana. Jos tämä samantasoinen ohje tulisi vaikka Applen, Samsungin tai muun vastaavan ison yrityksen uuden puhelimen mukana, laskisi tuotteen ja yhtiön imago käyttäjän silmissä, vaikka tuote olisikin laadultaan hyvä. Tähän totuuteen ollaan herätty jo monessa yhti- össä ja tätä kautta myös tekninen viestintä on noussut tärkeämmäksi osaksi monen yh- tiön hierarkiassa. 3.1 Teknisestä ohjeesta tekniseksi ohjevideoksi Teknisissä ohjevideoissa esitetään tarkalleen se tieto, joka on esitettynä teknisissä oh- jeissa. Ohjevideot noudattavat myös samoja yksiselitteisyyden ja aukottoman 29 ohjeistuksen tekemisen periaatteita kuten käyttöohjeetkin. Videoissa etuna on tekstin ja äänen käyttö havainnollistavina keinoina. Käyttöohjeissa pääpaino on mahdollisimman yksiselitteisissä kuvissa ja symboleissa. Videoissa pyritään näyttämään nämä asennuskuvat ja symbolit elävänä kuvana säilyt- täen kuitenkin mahdollisimman hyvin yksiselitteisyyden myös videokuvassa. Äänen käyttö ja toimenpiteen avaaminen puheella edistävät kuitenkin videon informaation si- säistämistä sekä lisäävät videolle myös arvoa miellyttävämmän kuuntelukokemuksen kautta. Tähän luonnollisesti vaikuttaa se, miten vastaanottaja kokee kuulemansa äänen. 3.1.1 Audiovisuaalisuus Audiovisuaalisuus liitetään usein elokuviin, televisioon ja digitaaliseen mediaan, mutta sen tarkka määritelmä on Mikko Lehtosen (2007) mukaan enemmän ruumiillinen ja ais- tillinen kokemus. Termi audiovisuaalisuus itsessään koostuu sanoista audio ja visuaali- suus. Audiolla viitataan nimenomaan muotoon ”minä kuulen”, eli toimintaan, jossa kuu- lija itse on toimijana. Visuaalisuus taas viittaa katseeseen, eli siihen mihin kuulija katsoo, eli visualisoi (Lehtonen 2007: 30). Audiovisuaalisuudessa yhdistyvät eri aistit, kuuleminen ja näkeminen, ja se onkin tämän vuoksi ruumiillista toimintaa. Näkijän ja nähdyn suhde ei kuitenkaan kaikessa audiovisu- aalisuudessa ole välttämättä samanlainen kuin kuulijan ja kuullun suhde. Näkeminen edellyttää aina samaa tilaa, ellei kyseessä ole jokin digitaalisen median väylä. Kuulemi- nen taas onnistuu esimerkiksi viereisestä huoneesta asti. (Lehtonen 2007: 30) Kuulemista aistina ei usein pidetä yhtä autenttisena kuin näkemistä. Tästä hyvä esimerkki on tunnettu sanonta ”näin sen omin silmin”. Visuaalisuuteen liittyy siis vahvoja läsnäolon mielikuvia, joissa näkijä on ollut itse paikalla. Kuulemista taas voidaan usein vähätellä huhupuheeksi tai väärin muistetuksi tiedoksi. (Lehtonen 2007: 31) 30 Yhdessä kuuleminen ja näkeminen, eli audiovisuaalisuus, viittaa Lehtosen mukaan en- nen kaikkea välitettyyn kuvaan ja ääneen. Hän tuo ilmi sen, miten audiovisuaalisuutta usein tarkastellaan nimenomaan digitaalisen median valossa. Lehtosen mukaan harvoin taas on esillä se, että audiovisuaalisuus liittyy vahvasti ihmisen ruumiillisuuteen ja aisti- mellisuuteen. (Lehtonen 2007: 31) Tästä audiovisuaalisuuden merkityksen ymmärtämisestä huolimatta audiovisuaalisuus liitetään hyvin vahvasti elokuviin, televisioon ja muuhun videomateriaaliin. Audiovisuaa- lista mediaa pidetään joustavana välineenä, jonka avulla on helppo levittää tarvittavaa sanomaa kuulemisen ja näkemisen aistien kautta. (Aaltonen 2018: 17) Audiovisuaalisuus digitaalisen median väylänä poikkeaa Lehtosen aikaisemmin kuvaamasta läsnäolosta eniten ehkä siinä, että digitaalisen median audiovisuaalinen tuote, esimerkiksi ohjevideo, on tarkkaan suunniteltu jotakin tarvetta varten, käsikirjoitettu, sekä tuotettu helposti le- vitettävään muotoon. Läsnäoloon liittyvä audiovisuaalinen media saattaa taas olla spon- taani hetki, eikä sitä pystytä uudelleen toistamaan. 3.1.2 Kuuntelukokemuksen rooli informaation välityksessä Audiota ja näin myös audiovisuaalisuutta voidaan mitata eri tavoin informaation välityk- sen yhteydessä. Yksi näistä mittareista on kuuntelukokemus engl. overall listening expe- rience, jonka perusteella voidaan mitata kuuntelijan kiinnostusta kuunneltavaa audiota kohtaan. Kuuntelukokemuksen käsitteen avulla voidaan yhdistää useita eri kuunteluun liittyviä tekijöitä, jotka saattaisivat vaikuttaa kuuntelijan arviointiin, mielentilaan ja jäl- jentämisen, eli muistamisen, mahdollisuutta. (Walton & Evans 2018) Kuuntelukokemus on audion laadun arvioimisen keino, jonka Schoeffler ja Herre määrit- televät käytettävän kuvaamaan nautittavuutta tiettyä audiota kuunnellessa. Tähän arvi- ointiin otetaan mukaan kaikki mahdolliset tekijät, joilla voidaan parantaa kuuntelijan nauttimista audion kuuntelussa. Näitä ovat esimerkiksi erilaiset aistilliset-, kognitiiviset-, sekä psykologiset seikat. (Schoeffler & Herre 2014) 31 Kuuntelukokemusta (Overall listening experience) verrataan, ja siitä jopa puhutaan usein kokemuksen laatuna (Quality of experience) kun on kyse audion arvioinnista. Toisaalta näissä kahdessa kokemuksessa yhdistyvät teoreettisesti orientointuneet mallit, joissa pääpaino on kognitiivisella ja psykologisella näkökulmalla. Jotkut mallit ovat kuitenkin hyvin käytännönläheisiä, ja ne keskittyvät usein empiiriseen dataan audion kuuntelusta. On tärkeää huomioida mitä tahansa audiota arvioitaessa, että kuuntelijan omat mielty- mykset ja luonne vaikuttavat kuuntelukokemukseen aina jonkin verran. (Schoeffler & Herre 2014) Audiossa ja audiovisuaalisuudessa kuuntelukokemuksen mittaaminen on aina riippuvai- nen siitä, että arviointiin saadaan kuulijoita (Walton & Evans 2018). Audiovisuaalisuu- dessa mukana taas on myös visuaalisuus, joka tukee mukana olevaa audiota. Kun jotakin palvelua tai järjestelmää suunnitellaan, voidaan kuuntelukokemusta käyttää kohderyh- män tarkentamisessa ja suunnittelussa. (Walton & Evans 2018) Näin ollen myös audiovi- suaalisuuden kanavia kuten ohjevideoita suunniteltaessa ja tehdessä, arvioimalla ja mit- taamalla kuuntelukokemusta voidaan koko videon laatua parantaa. 3.2 Huolto- ja käyttöohjeet Oras Group Oy:ssä Huolto- ja käyttöohjeet ovat Oras Group Oy:ssä isossa roolissa. Syy tähän on tuotekate- goria sekä LVI-alan luonne, jossa käytännössä aina asennetaan tai huolletaan jotain. Tästä syystä erityisesti on tärkeää, että ohjeistus materiaali on riittävää ja selkeää. Yhtiö on panostanut huolto-ohjeiden päivittämiseen viime vuodet ja tämän päivityksen tulok- sia nähdään nykyisissä ohjeissa (ks. Kuva 1). 32 Kuva 1. Esimerkki hanan huolto-ohjeesta (Oras Ltd. 2019). Kuten kuva 1 osoittaa Oraksen ohjeissa on tekstiä pelkästään otsikoissa ja käytössä on tekstin sijaan universaaleja symboleita ja havainnollistavia kuvia. Tekstittömyys on kus- tannustehokasta, koska sillä vältetään käännöskustannukset. Lisäksi se on myös suoravii- vaisempaa ja välittömämpää kommunikaatiota kuin pelkkä teksti. Huolto-ohjeiden ja käyttöohjeiden on aina oltava mahdollisimman yksiselitteisesti ym- märrettäviä, mutta LVI-alalla tämä korostuu erityisesti, koska väärinkäytettynä hanatuot- teissa on itsensä tai muiden vahingoittamisen riski. Tästä esimerkkinä sairaalassa käyte- tyt hygieniahuuhtelun sisältävät hanatuotteet, joissa huuhteluveden lämpötila voi ylittää 33 75 astetta. Kyseinen tuote on asennettava täysin oikealla tavalla, ja sitä on myös käytet- tävä oikealla tavalla. Tämä varmistetaan luomalla aukoton ja yksiselitteinen ohjeistus niin käytön, asennuksen kuin huollonkin kannalta. Luonnollisesti on aina olemassa riski ih- misten tekemiin virheisiin, mutta tätäkin riskiä alennetaan sillä, että ohjeistus on mah- dollisimman helposti ymmärrettävä ja että väärinkäsityksille ei ole mahdollisuutta. 3.3 Tekniset ohjevideot ja niiden kohderyhmät Oras Group Oy:ssä Vastaan ohjevideoiden luonnista Oras Groupissa ja työhöni kuuluu tietokoneella tehdyt animoinnit sekä perinteiset ”hands-on”-kuvaukset asennuksista tai muista tuotteisiin liit- tyvistä toimenpiteistä. Tärkeää videoiden luonnissa on se, että videon sisältö on täysin käyttöohjetta vastaava. Toisin sanoen videolla havainnollistetaan käytännön tasolla se mitä käyttöohjeessa ohjeistetaan. Videoilla näytetään myös asioita, joita käyttöohjeissa ei esitetä tai esitetään käyttöohjeessa hyvin yleisesti. Näitä ovat esimerkiksi elektronisen hanan tai suihkun erilaiset toiminnot, päivitettyjen tai kokonaan uusien varaosien toi- minta sekä erinäiset huoltotoimenpiteet. Kuva 2. Kuvankaappaus ohjevideosta (Oras Ltd. 2019). Ohjevideoiden kohderyhmät voidaan karkeasti jakaa ammattikäyttäjiin: putkimiehet, huoltomiehet, myynti, koulutus, asiakaspalvelu jne. Tämä käyttäjäryhmä edustaa 34 ammattikäyttäjiksi luokiteltavaa ryhmää. Toinen kohderyhmä on arkikäyttäjät eli hanan omistajat ja loppukäyttäjät. Tästä ryhmästä karsitaan yllä olevat ammattikäyttäjät; arki- käyttäjien ryhmään kuuluvat siis ne henkilöt, joilla ei ole alan koulutusta tai muuta koke- musta hanojen huoltoon tai asennukseen liittyvistä toimenpiteistä. Ohjevideot ovat kui- tenkin suunnattu molemmille ryhmille. Videoilla tapahtuva toimenpide voi vaihdella hyvin paljon vaikeustasoltaan, joten tästä syystä on erittäin tärkeää pitää mielessä käyttäjäryhmien välisen kokemustason ero. Vi- deon, kuten ohjeen, on oltava virheetön, yksiselitteinen ja helppo seurata. Karkeasti sa- nottuna kuitenkin huoltoon ja käyttöön liittyvät videot ovat enemmän arkiryhmän käy- tössä, kun taas asennusvideot ovat enemmän ammattiryhmän käytössä. Tähän vaikuttaa esimerkiksi kerrostaloasumisen yleisyys Suomessa, joissa hanojen omatoiminen asenta- minen ei ole suotavaa. 35 4 Puhesynteesin käyttö ja arviointi Puhesynteesi, joka tunnetaan myös nimellä tekstistä-puheeksi (engl. text-to-speech, TTS) on ihmispuheen kaltaisen puheen tuottamista keinotekoisin tavoin. Tekstistä-puheeksi voidaan tarkentaa tarkoittavan kaikkea tekstistä puhutuksi puheeksi tuotettua ääntä. Taylor (2007: 25) tiivistää puhesynteesin (ja TTS:n) tutkimuksen näin: This field of study is known both as speech synthesis, that is the “synthetic” (com- puter) generation of speech, and text-to-speech or TTS; the process of converting written text into speech. Puhesynteesi on alana siinä mielessä mielenkiintoinen, että suurin osa ihmisistä tietää keinotekoisen robottiäänen käsitteen, mutta välttämättä he eivät tiedä tarkalleen, mistä on kyse. Ihmiset ovat varmasti myös tulleet kontaktiin puhesynteesin kanssa jossain vai- heessa elämäänsä, esimerkiksi viihdemedian tai sci-fi-elokuvien yms. kautta. Puhesyn- teesin luonti ja sen mekaniikka eivät myöskään välttämättä ole vielä yleistietoa ihmisten keskuudessa. 4.1 Puhesynteesijärjestelmät Teknisesti puhesynteesin tuottamiseen on nykypäivänä monia eri tapoja. Puhesynteesin historian voi kuvata alkaneen vuonna 1779 Pietarissa, Venäjällä. Professori Christian Kat- zenstein halusi kuvata viiden eri ”pitkän” vokaalin eroa, joten hän päätti luoda koneen, joka tuottaa keinotekoisesti nämä viisi vokaalia (a,e,i,o,u). Tämä kone käytti akustisia re- sonaattoreita, jotka aktivoitiin ruokojen värinällä. (Flanagan 1972: 205) Kehitys on jatkunut näistä mekaanisista ääntä tuottavista laitteista, elektronisiin laittei- siin, josta kehitys siirtyi tietokoneellistumisen myötä järjestelmiin ja ohjelmistoihin. Ny- kyiset käytetyimmät metodit puhesynteesissä ovat artikulatorinen synteesi, Hidden Mar- kov Method (HMM)-pohjainen synteesi, formanttisynteesi ja konkatenaatiosynteesi (Siddhi, Verghese & Bhavik 2017: 26-30). 36 Näistä eniten käytössä on 1990-luvulla esiin nousseeseen Hidden Markov-metodiin pe- rustuvat ns. parametriset puhesynteesijärjestelmät. Tässä metodissa teksti ja siitä tuo- tettu puhesynteesi luodaan käyttämällä hyväksi stokastisesti luotuja akustisia malleja. Toisin sanoen tekstistä luotu puhesynteesin ääni on sattumanvaraista tiettyjen paramet- rien sisällä. Puhesynteesi luodaan hierarkisella mallilla, jossa käydään taso tasolta läpi lähdetekstistä otetut parametrit. Näitä parametrejä ovat kielen ominaisuudet: prosodia, fonetiikka sekä kieliopillisuus. Näistä parametreistä valitaan hierarkisessa mallissa toden- näköisimmät akustiset ominaisuudet ja nämä lähetetään ääniaallon syntetisaattorimo- duuliin, josta lopulta tuotetaan puhesynteesin puhe. Tällä mallilla tuotettu puhe on kui- tenkin hyvin satunnaista olomuodoltaan ja tasoltaan häilyvää. Suurin ongelma tässä mal- lissa on tuotetun puhesynteesin äänen luonnollisuuden puute verrattuna ihmispuhee- seen. (Deng & Yu 2014: 286-287). Uusin ja nopeasti suosiota saava metodi puhesynteesin alalla on kuitenkin ns. Deep lear- ning ja sitä käyttävät järjestelmät. Tällä metodilla on kohdennettu vanhan parametrisen mallin ongelmakohtia akustisessa mallinnuksessa ja äänen luonnollisuudessa. Deep lear- ning-puhesynteesin metodissa järjestelmä ”oppii” tarjolla olevasta datasta akustisen kar- toituksen ihmispuheelle ja parametreille, jonka avulla se lähtee työstämään annettua tekstipohjaista syöttöä puheeksi. (Deng & Yu 2014: 286-288) Deep learning juontaa Deep Neural Network (DNN)-tutkimussuunnasta, joka pyrkii mal- lintamaan biologisia neuraaliverkostoja. Deep learning käsitteenä tarkoittaa koneoppi- mista monilla eri tasoilla yhtäaikaisesti ja apuna käytetään keinotekoisia neuraaliverkos- toja (Deng & Yu 2012: 5). Aikaisempaa tutkimusta puhesynteesien tuottamiseen käytetyistä malleista on tehty muun muassa puhesynteesin tämän hetkisen kehityksen kärkeä edustavan Googlen Deep Mind-projektin puhesynteesiä luovasta järjestelmästä. Kyselytutkimuksessa ver- tailtiin Deep learning-konseptilla luotua puhesynteesiä perinteisiin tapoihin (konka- tenaatio, HMM) käyttäen verrokkina ihmispuhetta. Kuvion 5 mukaisesti Deep learning- 37 konseptilla tuotettu puhesynteesi todettiin perinteisiä puhesynteesejä laadukkaam- maksi MOS-asteikkoa (1-5) hyväksikäyttäen. (Wavenet: A Generative Model for Raw Au- dio 2016) Kuvio 5. Esimerkki MOS-asteikosta käytännössä Kuvio osoittaa miten Deep Learning-konseptien avulla luotu WaveNet sai huomattavasti paremman MOS-arvon (4.55 ja 4.21) verrattuna perinteisiin konkatenaatio- ja paramet- risiin puhesynteesi ääniin. Tutkielmassa käytetään Deep learning-konseptia käyttävää Amazonin Polly järjestelmää. Amazon Polly valittiin kyselyn ohjevideossa käytettäväksi puhesynteesiksi taustatyön tu- loksena. Taustatyönä tutkin puhesynteesijärjestelmien markkinatilannetta ja puhesyn- teesijärjestelmien kyvykkyyttä ja suosiota. Amazon Polly osoittautui yhdeksi suosituim- mista ja laadukkaimmista järjestelmistä tällä hetkellä, joten oletuksena oli, että se antaisi parhaan yleiskuvan nykyisestä puhesynteesin tasosta. Amazon Pollyn verkkosivut koros- tavat myös Pollyn käytön monipuolisuutta niin henkilökohtaisessa, mutta erityisesti 38 ammattimaisessa käytössä, mikä oli tärkeä tekijä valintaa tehdessä. (Amazon Web Servi- ces 2019) Amazon Pollyn käyttö ei tunnu rajoittuvan myöskään mihinkään tiettyyn alaan, vaan sen käyttö on varsin laajaa. Sitä käytetään muun muassa Duolingo-sivustolla ja-palvelussa vieraan kielen opetukseen, kodin turvajärjestelmien äänenä Y-Cam-turvajärjestelmäyh- tiössä sekä Intian ensimmäisessä henkilökohtaisen avustajan sovelluksessa Haptikissa. Ohjevideoita eniten vastaava palvelu on ehkä kuitenkin GoAnimate-palvelu, joka on do- it-yourself-sivusto animoitujen videoiden luomiseen. Kyseinen sivusto käyttää Amazon Pollya hyödykseen äänenluomiseen videoille ja palvelua käytetäänkin paljon juuri am- mattimaisten videoiden luomiseen. GoAnimate:n perustaja Alvin Hung korostaakin lai- nauksessaan Amazon Pollyn sivuilla puhesynteesijärjestelmän äänenluonnin nopeutta ja kustannustehokkuutta eritoten verrattuna aidon ihmisäänen nauhoittamiseen. (Amazon Web Services 2019) Yllä mainittu kustannustehokkuus ja puhesynteesin puheen laatu olivatkin tärkeitä teki- jöitä puhesynteesi-järjestelmää valittaessa. Amazon Polly osoittautui alustavien testien ja tutkielmassa käytettyjen videoiden luonnissa hyvin tehokkaaksi ja laadukkaaksi järjes- telmäksi, joten valinta oli lopulta helppo tehdä. 4.2 Puhesynteesin käyttötavat Puhesynteesin käytön voi luokitella nykypäivänä hyvin yleiseksi. Sen yleisimmät käyttö- kohteet ovat paikkoja tai palveluita, joita ihmiset käyttävät melkein joka päivä, joten sen läsnäolosta on tullut monella tapaa jopa huomaamatonta. Esimerkkejä on kerrosten kuu- lutukset hisseissä, auton navigaattorin ääni ja erinäiset käyttöliittymät (Siri, Alexa, Google Assistant). Puhesynteesi on levinnyt kuitenkin näistä yleisimmistä tavoista laa- jalle alueelle niin ammatillisessa kuin harrastekäytössäkin. 39 Ehkä suurin yksittäinen hyöty, joka puhesynteesillä on saatu aikaan, on erinäisistä aisti- vammoista kärsivien ihmisten elämän helpottaminen. Sokeille ihmisille on olemassa jo vakiona selaimissa, niin tietokoneella kuin matkapuhelimellakin ohjelmia, jotka lukevat ääneen verkkosivuja sekä muita medioita. Tietokoneen käyttöjärjestelmän ohjaami- nen ”kommunikoimalla” sen kanssa puhesynteesin ja puheen tunnistuksen yhdistävällä ohjelmalla on myös kätevämpää kuin esimerkiksi sokeille tarkoitetun pistekirjoitusta si- sältävän näppäimistön käyttö. Samalla tapaa kuurot ja mykät hyötyvät puhesynteesiä luovista järjestelmistä, joiden avulla he voivat kommunikoida helpommin esimerkiksi sel- laisten ihmisten kanssa, jotka eivät osaa viittomakieltä. Molemmissa näissä tapauksissa nousee tärkeäksi puhesynteesin äänen laatu. Tutkielmassa pääroolissa olevien ymmär- rettävyyden ja luonnollisuuden on oltava tarpeeksi hyvällä tasolla, jotta edellä mainittuja avustavia ohjelmia ja järjestelmiä voidaan käyttää. (Hande 2014: 8061-8062) E-oppimisalustat ovat myös hyvin yleinen käyttökohde puhesynteesille. Kielten oppimi- nen e-alustojen kautta on helpottunut huomattavasti, ja esimerkiksi ääntämisen tarkis- taminen onnistuu helpommin puhesynteesin ja puheen tunnistuksen avulla. E-oppi- misalustojen perusperiaate on ollut opintojen helpottaminen ja niiden välitön saavutta- minen. Näille alustoille voi mennä koska tahansa ajasta ja paikasta riippumatta, ilman että opetuksen taso laskee. (Ren & Miao 2008: 432-433) Puhesynteesi vaikuttaa tähän, koska paikalla on aina ”opettaja”, joka ohjeistaa ja pohjustaa puheellaan luentoja sekä tehtäviä harjoituksia. Asiakaspalvelualat ovat ottaneet laajenevissa määrin käyttöönsä puhesynteesin tekno- logioita. Esimerkiksi monessa suomalaisessa teleoperaattorissa asiakaspalveluun soitet- taessa vastaa puhesynteesin ääni. Monet julkisen paikan käyttöliittymät sisältävät myös usein puhesynteesiä. Tästä yksi esimerkki on Taiwanissa kansallisessa teknologisessa yli- opistossa toteutettu palvelurobotille tehty ”meet and greet”-käyttöliittymä, joka yhdis- tää puhesynteesin sekä puhetunnistuksen. Robotti vastaanottaa yliopistolle tulijat pu- hesynteesillä, ja tietyt avainsanat kuultuaan vastaa tulijalle sopivalla tavalla. Robotin ja ylipistolle tulijoiden välisestä kommunikoinnista tehdyssä tutkimuksessa koettiin 40 tärkeimmäksi seikaksi robotin ihmismäisyys, mikä oli suoraan yhteydessä sen äänen luonnollisuuteen ja ymmärrettävyyteen. Tutkimuksessa suoritettiin kysely robotin käyt- täjillä ja tässä tapauksessa luonnollisuus ja ymmärrettävyys oli hyvällä tasolla, eli puhe- synteesi oli onnistunut tehtävässään. Mielenkiintoista tutkimuksen tuloksissa oli se, että ihmiset, jotka kommunikoivat pidempään robotin kanssa antoivat korkeamman arvosa- nan puhesynteesille. (Huang & Lu 2014: 150-155) Tämä herättää kysymyksiä puhesynteesin kokemisesta ja siitä, miten suuri vaikutus sillä on miten ja millä välineellä puhesynteesiä vastaanotetaan. Tässä tapauksessa kyseessä oli fyysinen robotti ihmismäisellä kasvolla, jonka kanssa kommunikoida. Tutkielman ta- pauksessa kyse on pelkästään ohjevideon äänestä, jolla ei ole fyysistä representaatiota. 4.3 Puhesynteesi teknisissä ohjevideoissa Oras Group Oy:ssä Puhesynteesin käyttöä teknisissä ohjevideoissa on kartoitettu Oraksella taloudelliselta ja tekniseltä kannalta. Tämän tutkielman avulla selvitetään sitä, miten käyttäjät vastaanot- tavat puhesynteesin. Kartoitusta on jo tehty kustannusten sekä teknisten mahdollisuuksien osalta. Puhesyn- teesin kustannustehokkuus on yhtiön kannalta selvästi suurin etu sen mahdollisessa käyttöönotossa. Puhesynteesin käyttö ammattimaisesti on hyvin edullista, varsinkin jos vertaa voice-overien tilaamisen kustannuksia alihankkijalta, verrattuna puheen luomi- seen Amazon Pollyllä. Amazon Pollyn hintataso vaihtelee ilmaisesta tasosta, johon kuu- luu 5 miljoonaa kirjoitusmerkkiä kuukaudessa ensimmäisen vuoden ajan, maksulli- seen ”Pay-as-you-go”-malliin, jossa 1 miljoona kirjoitusmerkkiä maksaa keskimäärin 4 dollaria. Hinta määräytyy käytön mukaan, joten hinta on hyvin alhainen per kirjoitus- merkki. Alihankkijalta hankittuna kirjoitusmerkkiä kohden hinta nousee Amazon Pollyyn verrattuna, hyvin korkeaksi. (Amazon Web Services 2019) 41 Esimerkkinä Amazon Pollyn Prices-sivulla annetaan Mark Twainin 224 sivuinen klassikko Huckleberry Finnin seikkailut-teos, jonka konvertoiminen puhesynteesin puheeksi mak- saisi 2.40 dollaria. Teos sisältää 600 000 kirjoitusmerkkiä 224 sivussa ja käyttäen tätä pohjana, Oraksen keskiverto ohjevideo sisältää noin 1-2 sivun verran puhetta ja noin 2000-7000 kirjoitusmerkkiä per video. Kustannukset ovat näin per video 0.01-0.05 sentin välissä. Uudet projektit toki sisältävät useita videoita, mutta jopa yliarvioiden lasketulla 10 uuden videon projektijulkaisulla kustannukset nousevat maksimissaan puolen dolla- rin luokkaan. (ks. Amazon Web Services 2019) Teknisten mahdollisuuksien kartoitus tarkoitti käytännössä oikeiden ratkaisujen löytä- mistä puhesynteesin sisällyttämiselle ohjevideoihin. Tämä kattoi äänitiedostojen luomi- sen vaikeustason, äänityypin sekä äänen muokkaamisen vaihtoehdot, äänitiedostojen sisällyttämisen ohjevideoihin tekniseltä kannalta, sekä muita yleisen tason kysymyksiä kuten tiedostokoko ja tiedostotyypit. Tekniset kysymykset osoittautuvat helposti ratkais- taviksi, ja Amazon Pollyn käyttöjärjestelmä sekä ohjeistus on hyvin selkeää erityisesti ää- nen optimoinnin ja äänityypin kannalta. Kielivaihtoehtoja löytyy 28, mikä on myös iso etu kansainvälisessä yhtiössä. Keskiverto tiedostokoko on 0,5-1,5 mbit, mikä on hyvin kompakti koko tallentamisen ja säilyttämisen kannalta. Tuettuja tiedostomuotoja Ama- zon Pollyssä on: MP3, Vorbis sekä raaka PCM audio. Näistä MP3 on yleisin ja universaa- listi käytetyin ja tätä käytämme myös Oras Groupissa. (ks. Amazon Web Services 2019) Tekniseltä ja taloudelliselta kannalta puhesynteesin käyttöönotto on näin ollen yhtiön kannalta hyödyllistä. Puhesynteesin käytettävyys, sen välittömyys sekä käyttämisen help- pous ovat myös tärkeitä piirteitä puhesynteesin mahdollisessa käyttöönotossa. Tärkein aspekti on kuitenkin se, miten alalla olevat ihmiset ja tuotteiden kuluttajat ottavat pu- hesynteesin vastaan. 42 4.4 Puhesynteesin arvioinnin kriteerit Puhesynteesin arviointiin on vakiintunut MOS-skaala, kuten aiemmin tutkielmassa mai- nittiin. Tämän skaalan avulla tutkitaan kahta selkeästi puhesynteesissä vakiintunutta kri- teeriä eli luonnollisuutta ja ymmärrettävyyttä. (Le Maguer 2018: 10-12, 25-26) Puhesynteesin aiempi tutkimus on keskittynyt näihin kahteen, mutta enemmän keinote- koisen puheen tuotannon ja siihen liittyvien teknisten ominaisuuksien ja aidolta kuulos- tavan puheen luonnin näkökulmasta, kun taas tutkimus siitä, miten ihmiset vastaanotta- vat puhesynteesiä ja mitä tunteita tai ajatuksia heille siitä syntyy, on jäänyt vähemmälle huomiolle. (Chung, Wang, Hsu, Zhang, Skerry-Ryan 2018: 1-5) Tutkittaessa ymmärrettä- vyyden ja luonnollisuuden näkökulmasta sitä, miten ihmiset vastaanottavat puhesyntee- siä, on tärkeää jakaa nämä kaksi pääkäsitettä pienempiin ja tarkempiin alakäsitteisiin. Käsitteet ja alakäsitteet on kuvattu kuviossa 6. Kuvio 6. Kyselytutkimuksen käsitteet Kuviossa 6 on esitelty ymmärrettävyyden ja luonnollisuuden kaikki alakäsitteet. Esittelen seuraavissa alaluvuissa tarkemmin kaikki alakäsitteet ja sen, miten näitä arvioidaan ky- selyssä. 43 4.4.1 Luonnollisuus puhesynteesin kriteerinä Luonnollisuuden käsitteen määrittelyyn käytän tässä tutkielmassa Viswanathanin mää- ritystä, jossa luokitellaan luonnollisuutta ihmispuheen kaltaisuuden, kuuntelemisen helppouden sekä kuuntelun mukavuuden ja äänen soljuvuuden avulla. Yhdistän kuunte- lun mukavuuden sekä äänen soljuvuuden tässä tutkielmassa kuuntelukokemuksen käsit- teen alle. Nämä kaikki, kuten koko tutkielmakin, on tehty ihmisen näkökulmasta, koska siinä selvitetään mitä tunteita puhesynteesi herättää ja miten osallistujat vastaanottavat puhesynteesin. Luonnollisuuden käsite on pohja mittaamiselle yhdessä ymmärrettävyy- den kanssa. (Viswanathan 2005: 63) Luonnollisuutta tarkennetaan kuuntelukokemuksen, ihmispuheen samankaltaisuuden sekä kuuntelemisen helppouden kautta. Kuuntelukokemus tarkoittaa puhesynteesin kuuntelemisen kokemuksen miellyttävyyttä. Ihmispuheen samankaltaisuus kattaa alleen miten samanlaisena puhesynteesi mielletään ihmispuheeseen verrattuna. Kuuntelemi- sen helppoudella haetaan tässä tapauksessa puhesynteesin puheen rytmitystä sekä sointuvuutta ja sitä kautta sen kuuntelemiseen vaadittavaa ponnistelua. (Viswanathan 2005: 63) Luonnollisuuden alakäsitteitä on mitattu kyselyssä kahdella kysymyksellä. Jokaisella ala- käsitteellä on kaksi kysymystä luokiteltuna, ja näiden kahden kysymysten vastauksien tu- loksista lasketaan jokaiselle käsitteelle keskiarvo. Tällä keskiarvolla mitataan, miten ala- käsite on koettu kyselyn vastaajien toimesta. Liitteessä 1 ja 2 on esitetty kyselylomakkeet kokonaisuutena, sieltä voi tarkistaa alakäsitteille omistetut kysymykset. Kuuntelukoke- musta on mitattu kysymyksillä 1 ja 6, ihmispuheen kaltaisuutta on arvioitu kysymyksillä 4 sekä 8 ja kuuntelemisen helppoutta on identifioitu kysymyksillä 3 ja 10. Yhdessä näiden kolmen alakäsitteen kysymysten tulokset luovat luonnollisuuden pääkäsitteen tuloksen. 44 4.4.2 Ymmärrettävyys puhesynteesin kriteerinä Ymmärrettävyyttä tarkennetaan informatiivisuuden, oikeakielisyyden sekä kuuntelun helppouden avulla. On tärkeää huomata samankaltaisuudet luonnollisuuden alakäsittei- den kanssa. Kuuntelun helppous/kuuntelemisen helppous on yhtäläinen käsite molem- missa. Näissä erona toimii se, että luonnollisuudessa käsitellään kuuntelun helppoutta itse puheen rytmityksen ja miellyttävyyden kautta. Ymmärrettävyydessä kyse on enem- mänkin mahdollisista kieliopillisista tai rakenteellisista virheistä, joita puheessa tulee ja jotka saattavat vaikeuttaa kuuntelua. (Viswanathan 2005: 63) Tarkentaen ymmärrettävyydessä kyse on sanojen ja lauseiden erottumisesta, joita mita- taan kuuntelun vaatimalla ponnistelulla (kuuntelun helppous), esitetyn informaation vastaanottamisen vaikeudella (informatiivisuus), sanojen oikealla painotuksella ja ääntä- misellä sekä kielen virheettömyydellä (oikeakielisyys). (Viswanathan 2005: 63) Tiivistäen ymmärrettävyyden käsite tarkoittaa sitä, miten selkeästi ääni rekisteröityy kuulijalle. Oikeakielisyyteen vaikuttaa luonnollisesti puhesynteesijärjestelmään syötettävän tekstin kieliopillinen virheettömyys ja puheen optimaalinen kalibrointi. Olen käyttänyt Amazon Polly ohjesivuston protokollaa audion säätämiseen, ja kieliopillisuus on tarkistettu jo al- kuperäisen Oras Groupin huoltovideon käsikirjoitusta tehdessä, joten tällä tapaa mah- dolliset virheet tulivat suoraan puhesynteesijärjestelmästä ja sen luomasta puheesta. Ymmärrettävyyden alakäsitteitä on myös mitattu kahdella kysymyksellä. Jokaisella alakä- sitteellä on kaksi omaa kysymystä kyselylomakkeessa ja näiden kysymysten vastausten perusteella lasketaan alakäsitteen keskiarvollinen tulos. Puhesynteesin kuuntelun help- poutta on arvioitu kysymyksillä 9 ja 11, puhesynteesin informatiivisuutta on mitattu ky- symyksillä 5 sekä 7 ja oikeakielisyyttä on arvioitu kysymyksillä 2 ja 12 (ks. Liite 1). Ymmär- rettävyyden pääkäsitteen tulos lasketaan näiden kolmen alakäsitteen yhteenlasketuista tuloksista. 45 5 Kyselytutkimuksen tulokset Tutkielman tavoite on mitata ammatti- ja arkikäyttäjien kokemusta puhesynteesin käy- töstä teknisellä ohjevideolla ja näiden kokemuksien tulosten perusteella miettiä pu- hesynteesin käyttöönottoa vakituisesti Oras Group Oy:n ohjevideoissa. Kokemusten mit- taamiseen käytettiin kyselytutkimusta, jossa kyselyyn vastaajat arvioivat kokemuksiaan puhesynteesistä luonnollisuuden sekä ymmärrettävyyden pääkäsitteiden sekä näitä tar- kentavien alakäsitteiden avulla. Kyselyssä vastaajat katsoivat ensin puhesynteesiä sisäl- tävän ohjevideon, jonka jälkeen he vastasivat kysymyksiin ohjevideolla esiintyneestä pu- hesynteesistä. Kyselyn tuloksista laskettiin pääkäsitteille sekä jokaiselle alakäsitteelle ja muuttujalle laskettiin keskiarvollinen tulos. Muuttujia kyselyssä ovat ohjevideolla käyte- tyn puhesynteesin mies- tai naisääni sekä vastaajien ikä, sukupuoli ja englannin kielen taito. Käsitteiden ja muuttujien tulokset listataan ylös taulukoihin kategorioiden mukaan ja näistä tuloksista suoritetaan lopussa varianssianalyysi. Ammatti- ja arkikäyttäjille järjestettiin molemmille omat kyselyt, jotka olivat auki 30.9- 8.10.2019 välisenä ajanjaksona. Kyselyihin vastasi yhteensä 146 ihmistä, joista 69 vastasi arkikäyttäjien kyselyyn ja 77 osallistui ammattikäyttäjien kyselyyn. Taulukossa 1 on esi- tetty molemmat vastaajaryhmät tarkemmin. Taulukko 1. Kyselyyn vastanneet Arkikäyttäjä Ammattikäyttäjä Sukupuoli Sukupuoli Miehiä 42 Naisia 27 Miehiä 44 Naisia 33 Ikä Ikä Alle 35v 35-55v Yli 55v Alle 35v 35-55v Yli 55v M 23 N 12 M 12 N 10 M 7 N 5 M 10 N 8 M 28 N 22 M 6 N 3 46 Yhteensä 35 Yhteensä 22 Yhteensä 12 Yhteensä 18 Yhteensä 50 Yhteensä 9 69 osallistujaa 77 osallistujaa Kyselyyn saatiin monipuolinen otanta ihmisistä iän puolesta ja se sisälsi myös hyvän ta- sapainon miesten ja naisten vastauksia. Valtaosa ammattikäyttäjistä sijoittui 35-55-vuo- tiaisiin, mikä on vallitseva ikäluokka myös Oras Groupin työntekijöissä, joten tästä syystä kyseinen ikäluokka on näin suuri. Arkikäyttäjäryhmä oli tasaisemmin jakautunut ja alle 35-vuotiaita oli eniten. Vastaajia pyydettiin arvioimaan englannin kielen taito ennen kyselyyn vastaamista, ja ku- vioissa 7 ja 8 on tarkennettu englannin kielen taidon jakaumaa. Taulukoissa on kuvattu englannin kielen taidot lukumäärien mukaan. Kuvio 7. Arkikäyttäjien englannin kielen taito 11 35 15 6 2 0 10 20 30 40 Arkikäyttäjät Englannin kielen taito 47 Kuvio 8. Ammattikäyttäjien englannin kielen taito Englannin kielen osaaminen on hyvällä tasolla kyselyn vastaajilla, kiitettävän ollessa sel- västi valituin kielen taso. Merkittävää on huomata myös, että molempien kyselyjen vas- taajista vain 2 luokitteli englannin kielen osaamisensa huonoksi. Jaottelen analyysissäni tästä eteenpäin tyydyttävästä-huonoon valinneet heikompana englannin kielen osaami- sen kategoriana ja hyvän englannin kielen osaamisen kategoriaan kuuluvat kaikki kiitet- tävän ja erinomaisen valinneet vastaajat. Taulukko 2. MOS-tulokset Taulukossa 2 on listattu arkikäyttäjien ja ammattikäyttäjien MOS-kokonaisarvo sekä luon- nollisuuden ja ymmärrettävyyden arviointikriteerien tulos. Taulukko antaa yleiskuvan ky- selyjen tuloksista, ja siitä käy ilmi alustava ero kahden käyttäjäryhmän välillä. Luvussa 4.1 esitetty Kuvio 5 toimi pohjana MOS-tulosten vertaamiselle. Kuviossa 5 Deep learning- 8 47 21 1 0 0 10 20 30 40 50 Ammattikäyttäjät Englannin kielen taito MOS- kokonaisarvo Luonnollisuus Ymmärrettävyys Arkikäyttäjä 3.76 3.69 3.82 Ammattikäyttäjä 3.94 3.85 4.04 3.5 3.6 3.7 3.8 3.9 4 4.1 MOS-tulokset Arkikäyttäjä Ammattikäyttäjä 48 konseptilla toteutettu puhesynteesi sai kyselyssä englannin kielestä MOS-tuloksen 4.21. Perinteisellä parametrisellä järjestelmällä tuotettu puhesynteesi sai kuvion 5. kyselyssä englanninkielestä MOS-tuloksen 3.67. Asetan hyväksyttävän rajan tälle 3.67-4.21 välille MOS-tuloksissa. Tulokset, jotka asettuvat tälle välille luokitellaan hyväksyttävinä tulok- sina. Alle 3.67 MOS-tulokset luokitellaan puutteellisiksi tuloksiksi ja yli 4.21 MOS-tulok- set ovat erinomaisia tuloksia. Tulokset käydään tarkemmin läpi alaluvuissa käyttäjäryh- mien, alakäsitteiden ja muuttujien kautta. 5.1 Ammattikäyttäjien MOS-tulokset Ammattikäyttäjien kyselyyn vastasi yhteensä 77 ihmistä ja vastaajina toimi Oras Groupin henkilöstö, eli alan ammattilaiset. Kuviossa 9 on jaoteltu kaikki ammattikäyttäjäryhmän kyselyyn vastanneet henkilöt ikäluokan, sukupuolen ja valitun englannin kielen osaami- sen mukaan. Erinomainen Kiitettävä Tyydyttävä Välttävä Huono Mies 4 6 Nainen 3 5 4 63 5 0 5 10 Alle 35-vuotiaat Mies Nainen Erinomainen Kiitettävä Tyydyttävä Välttävä Huono Mies 17 11 Nainen 1 15 6 17 11 1 15 6 0 10 20 35-55-vuotiaat Mies Nainen 49 Kuvio 9. Ammattikäyttäjien englannin kielen taito ikäluokkien mukaan Englannin kielen osaaminen jakautui yhteydessä ikäluokan mukaan. Alle 35-vuotiaat ar- vioivat englannin kielen tasonsa parhaimmaksi, 35-55-vuotiaat arvioivat itsensä toiseksi parhaimpana ja yli 55-vuotiaat heikoimpana. Oras Group on kansainvälinen yritys, joka panostaa työntekijöidensä englannin kielen kehittämiseen, ja tämä vaikutti alhaiseen määrään välttävän tai huonon englannin kielen tason valinneita vastaajia. Kuvio 10. Ammattikäyttäjien MOS-tulokset Kuviossa 10 on listattuna ammattikäyttäjien koko kyselyn MOS-tulos sekä luonnollisuu- den ja ymmärrettävyyden pääkriteereiden MOS-tulokset. Ammattikäyttäjien tulokset asettuvat aiemmin esitetyn hyväksyttävän MOS-tuloksen (3.67-4.21) välille. Luonnolli- suuden ja ymmärrettävyyden kriteereiden tuloksissa on havaittava ero (3.85 ja 4.04) ja seuraavaksi käsittelenkin nämä kaksi pääkriteeriä tarkemmin alakäsitteiden ja muuttu- jien MOS-tulosten avulla. Erinomainen Kiitettävä Tyydyttävä Välttävä Huono Mies 3 2 1 Nainen 1 2 3 2 11 2 0 2 4 Yli 55-vuotiaat Mies Nainen 50 Taulukko 3. Ammattikäyttäjien muuttujien MOS-tulokset Taulukossa 3 on esitetty ammattikäyttäjien kyselyyn osallistuneilta henkilöiltä kysytyt tiedot, eli tutkielmassa käytettävät muuttujat. Kokonaisarvot ovat hyvin tasaisia eri muuttujien välillä, mutta selkein ero on kuitenkin ikäluokissa. Vanhemmat ikäluokat ar- vostelivat puhesynteesin paremmaksi molemmilla pääkriteereillä sekä myös MOS-koko- naistuloksissa. Huomattavin ero tulee vanhimman ja nuorimman ikäluokan välillä. Van- hin ikäluokka arvosteli puhesynteesin selvästi positiivisemmin kuin nuorin ikäluokka. Nuorimman ikäluokan alin tulos 3.69 luonnollisuudelle ylittää niukasti hyväksytyn MOS- tuloksen rajan (3.67). Nuorin ikäluokka on myös arvioinut kriittisimmin pääkriteerit ver- rattuna kahteen muuhun ikäluokkaan. Kaikki käsitteet muuttujissa pysyivät kuitenkin hy- väksytyn MOS-tuloksen rajoissa ja tulokset eivät alita puutteellisen tuloksen rajaa, toi- saalta ne eivät myöskään ylitä erinomaisen tuloksen rajaa (4.21). Englannin kielen taso näyttää vaikuttavan jonkin verran puhesynteesin vastaanottoon. Hyvän englannin kielen tason omaavat henkilöt arvioivat puhesynteesin hieman parem- maksi kuin huonon englannin kielen tason omaavat. Ero ei ole kuitenkaan huomattava, ja näin ollen ammattikäyttäjien osalta englannin kielen tasolla näyttäisi olevan vain pieni 3.40 3.50 3.60 3.70 3.80 3.90 4.00 4.10 4.20 Miehet Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli MOS 3.91 3.99 3.82 3.96 4.10 3.97 3.88 Luonnollisuus 3.79 3.93 3.69 3.84 4.06 3.86 3.83 Ymmärrettävyys 4.03 4.05 3.96 4.04 4.15 4.08 3.92 Kokonaisarvot MOS Luonnollisuus Ymmärrettävyys 51 vaikutus puhesynteesin vastaanottoon kokonaistulosten kannalta. Miesten ja naisten vä- liset tulokset ovat myös samantasoisia, suurin ero myös sukupuolten välillä on luonnol- lisuudessa. Naiset arvioivat puhesynteesin luonnollisemmaksi kuin miehet ja naiset ar- vioivat myös kokonaisuutena puhesynteesin hieman paremmaksi kuin miehet. Alla ole- vissa alaluvuissa käydään läpi tarkemmin miesten ja naisten vastaukset ikäluokkien ja englannin kielen tason mukaan. Taulukko 4. Ammattikäyttäjät: Muuttujat miesvastaajien osalta Taulukossa 4 on jaettu miesten vastaukset ikäluokan ja englannin kielen tason mukaan. Miesten muuttujat noudattavat samaa kaavaa kuin aiemmin listatut tulokset. Suurimmat erot tulevat ikäluokkien välillä, mutta miesten tuloksissa nämä erot ovat huomattavasti suuremmat. Alle 35-vuotiaat miehet arvostelivat puhesynteesin puutteelliseksi luonnol- lisuuden kategoriassa, ja ero yli 55-vuotiaiden tulokseen luonnollisuudessa on huomat- tava. Englannin kielen tasossa on myös ero hyvän englannin kielen omaavien tuloksessa 3.20 3.40 3.60 3.80 4.00 4.20 Miehet Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Miehet Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli MOS 3.91 3.74 3.93 4.10 3.89 3.95 Luonnollisuus 3.79 3.53 3.76 4.06 3.73 3.92 Ymmärrettävyys 4.03 3.95 4.03 4.14 4.04 3.99 Miesten muuttujat MOS Luonnollisuus Ymmärrettävyys 52 luonnollisuudesta verrattuna huonon englannin kielen taidon omaaviin. Hyvän englan- nin kielen taidon omaavat arvostelivat luonnollisuuden heikompana kuin huonon kieli- taidon omaavat henkilöt. Kaikki miesten tulokset yhtä lukuun ottamatta sijoittuvat hy- väksytyn MOS-tuloksen välille. Taulukko 5. Ammattikäyttäjät: Muuttujat naisvastaajien osalta Naisten muuttujien tulokset ovat kuvattu taulukossa 5 ja niissä merkittävin ero on eng- lannin kielen tason suhteen. Paremman englannin kielen tason omaavat arvostelivat kai- killa kategorioilla puhesynteesin paremmaksi kuin heikomman tason omaavat naisten tuloksissa. Miesten tuloksissa hyvän englannin kielen omaavat vastaajat arvostelivat pel- kästään ymmärrettävyyden paremmin kuin huonon englannin kielen taidon omaavat vastaajat. Ikäluokissa on samaa eroavaisuutta tuloksissa kuin miehissä vanhimmasta nuorimpaan ikäluokkaan, pienemmällä marginaalilla. 3.40 3.60 3.80 4.00 4.20 Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Naiset Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli MOS 3.99 3.93 4.00 4.11 4.07 3.75 Luonnollisuus 3.93 3.88 3.94 4.06 4.01 3.69 Ymmärrettävyys 4.05 3.98 4.06 4.17 4.13 3.81 Naisten muuttujat MOS Luonnollisuus Ymmärrettävyys 53 Taulukko 6. Ammattikäyttäjien luonnollisuuden alakäsitteet Taulukossa 6 on ensin näytetty luonnollisuuden ja sen alakäsitteiden MOS-kokonaisarvo, jonka jälkeen alakäsitteille on laskettu muuttuja kohtaisesti MOS-tulos. Alakäsitteet si- joittuvat kaikki hyväksytyn MOS-arvon välille. Ihmispuheen kaltaisuus on kuitenkin lä- hellä alarajaa ja näin ollen myös heikoimmaksi arvosteltu piirre. Kuuntelemisen helppous on myös saanut hiukan paremman tuloksen 3.76, vaikka sekin sijoittuu lähelle 3.40 3.60 3.80 4.00 4.20 L U O N N O L L I S U U S K U U N T E L U K O K E M U S K U U N T E L E M I S E N H E L P P O U S I H M I S P U H E E N K A L T A I S U U S 3.85 4.08 3.76 3.71 LuonnollisuusKuuntelukokemusKuuntelemisenhelppous Ihmispuheen kaltaisuus MOS 3.854.083.763.71 LUONNOLLISUUDEN ALAKÄSITTEET 3.00 3.20 3.40 3.60 3.80 4.00 4.20 4.40 Miehet Naiset Alle 35v 35-55v Yli 55v Hyvä Engl. kieli Huono Engl. Kieli Kuuntelukokemus 4.00 4.20 3.92 4.11 4.28 4.09 4.07 Kuuntelemisen helppous 3.69 3.85 3.61 3.79 3.89 3.76 3.75 Ihmispuheen kaltaisuus 3.67 3.76 3.53 3.72 4.00 3.72 3.68 MUUTTUJAT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus 54 puutteellisen arvostelun rajaa. Kuuntelukokemus oli selvästi parhaimmaksi arvioitu ala- käsite, ja tämän perusteella vaikuttaisi, että ihmispuheen kaltaisuuden heikohko arviointi ei vaikuttanut kuitenkaan kuuntelukokemukseen kokonaisuutena. Muuttujista kriittisimmin alakäsitteet ovat arvioineet alle 35-vuotiaat, mikä noudattaa aiempien tulosten linjaa. Kuuntelemisen helppous sekä ihmispuheen kaltaisuus on mo- lemmat arvioitu puutteellisiksi (3.61, 3.53) alle 35-vuotiaiden ryhmässä. Vanhemmat ikä- luokat ovat arvioineet kauttaaltaan alakäsitteet parempina. Englanninkielen taidon ta- solla ei tulosten valossa näytä olleen vaikutusta arviointiin. Naiset ovat arvioineet myös käsitteet hieman miehiä paremmaksi. Taulukko 7. Ammattikäyttäjien luonnollisuuden alakäsitteet: Miesvastaajat Taulukossa 7 on tarkennettu miesten muuttujia ja taulukko korostaa aiempia havaintoja siitä, että alle 35-vuotiaat ovat kriittisempiä arvioissaan. Nuorin ikäluokka on arvioinut 3.00 3.30 3.60 3.90 4.20 4.50 Miehet Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Miehet Alle 35v 35-55v Yli 55v Hyväengl. kieli Huono engl. Kieli Ihmispuheen kaltaisuus 3.67 3.35 3.70 4.08 3.62 3.79 Kuuntelemisen helppous 3.69 3.45 3.75 3.83 3.62 3.86 Kuuntelukokemus 4.00 3.80 4.02 4.25 3.95 4.11 MIESTEN MUUTTUJAT Ihmispuheen kaltaisuus Kuuntelemisen helppous Kuuntelukokemus 55 ihmispuheen kaltaisuuden sekä kuuntelemisen helppouden selvästi puutteellisen rajan puolelle. Näiden lisäksi myös hyvän englanninkielen taidon omaavat henkilöt ovat arvi- oineet ihmispuheen kaltaisuuden sekä kuuntelemisen helppouden puutteellisen arvioin- nin puolelle. Vanhemman ikäluokan vastaajat ovat kuitenkin arvioineet kyseiset kaksi alakäsitettä selvästi paremmaksi myös pelkästään miesten arvioinneissa. Kokonaisar- viona kaikki kolme alakäsitettä ovat kuitenkin hyväksytyn MOS-tuloksen asteikolla, kuun- telukokemuksen ollessa parhaimmaksi arvosteltu alakäsite myös miesvastaajien toi- mesta. Taulukko 8. Ammattikäyttäjien luonnollisuuden alakäsitteet: Naisvastaajat Naispuolisten vastaajien taustamuuttujat on eritelty taulukossa 8. Suurin ero on huonon englannin kielen taidon omaavien vastaajien arvioinnissa ihmispuheen kaltaisuudesta sekä kuuntelemisen helppoudesta. Molemmat käsitteet luokitellaan puutteelliseksi kuuntelemisen helppouden ollessa 3.56 ja ihmispuheen kaltaisuuden 3.50. Englannin kielen taso vaikuttaa kauttaaltaan myös eniten arviointiin. Hyvän englannin kielen omaa- vat henkilöt ovat arvioineet kaikki kolme alakäsitettä selvästi heikomman englannin 3.00 3.30 3.60 3.90 4.20 4.50 Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Naiset Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli Ihmispuheen kaltaisuus 3.76 3.75 3.75 3.83 3.84 3.50 Kuuntelemisen helppous 3.85 3.81 3.84 4.00 3.94 3.56 Kuuntelukokemus 4.20 4.06 4.23 4.33 4.26 4.00 NAISTEN MUUTTUJAT Ihmispuheen kaltaisuus Kuuntelemisen helppous Kuuntelukokemus 56 kielen taidon omaavia paremmaksi. Naisten tuloksissa on vanhimman ja nuorimman ikä- luokan välillä eroavaisuutta, ja tämä noudattaa aiempaa linjaa siitä, että nuorin ikäluokka arvioi puhesynteesiä kriittisemmin, kun taas vanhin ikäluokka antaa hyvän arvioinnin. 35-55-vuotiaat- ja yli 55-vuotiaat ikäluokan naiset arvioivat myös ensimmäiset erinomai- set tulokset kuuntelukokemukselle 4.23 ja 4.33. Hyvän englanninkielen taidon omaavat naisvastaajat arvioivat myös kuuntelukokemuksen erinomaisena (4.26). Luonnollisuus ja sen alakäsite olivat pääpiirteiltään arvosteltu hyväksyttävinä tuloksina, mutta tarkemmin arvioituina ne sisälsivät myös puutteellisen, mutta myös erinomaisen tuloksen saaneita arviointeja. Seuraavassa luvussa käyn läpi tarkemmin toisen pääkritee- rin ymmärrettävyys ja sen alakäsitteet. Taulukko 9. Ammattikäyttäjien ymmärrettävyyden alakäsitteet 3.85 3.90 3.95 4.00 4.05 4.10 4.15 4.20 Y M M Ä R R E T T Ä V Y Y S O I K E A K I E L I S Y Y S I N F O R M A T I I V I S U U S K U U N T E L U N H E L P P O U S 4.04 3.97 4.05 4.16 YmmärrettävyysOikeakielisyysInformatiivisuusKuuntelun helppous MOS 4.043.974.054.16 YMMÄRRETTÄVYYDEN ALAKÄSITTEET 57 Ymmärrettävyyden alakäsitteet on esitetty taulukossa 9. MOS-kokonaisarviot ovat sel- västi hyväksyttävän arvioinnin puolella ja kuuntelun helppous on saanut parhaimman arvioinnin 4.16. Muuttujien arvioinnit ovat myös selvästi hyväksyttävien sekä erinomai- sen välisellä tasolla. Erinomaisen arvioinnin on saanut kuuntelun helppous yli 55-vuoti- aiden vastaajien arvioinnissa, kaikki muut arvot ovat selvästi hyväksyttävän arvioinnin sisällä. Arvioinnit ovat myös tasapainoiset verrattuna aiempiin taulukoihin, suurin ero on englannin kielen taidon omaavien välillä. Huonon taidon omaavat vastaajat ovat arvos- telleet kaikki kolme alakäsitettä huonommin kuin hyvän taidon omaavat vastaajat. Iso yksittäinen ero on myös erinomaisen 4.39 arvioinnin yli 55-vuotiailta saaneen kuuntelun helppouden käsitteessä, verrattuna nuorimman alle 35-vuotiaiden ikäluokan arviointiin 4.03. Ikäluokkien välillä on näin ollen havaittavissa sama jako kuin luonnollisuuden ja sen alakäsitteiden arvioinnissa. 3.50 3.60 3.70 3.80 3.90 4.00 4.10 4.20 4.30 4.40 Miehet Naiset Alle 35v 35-55v Yli 55v Hyvä Engl. kieli Huono Engl. Kieli Oikeakielisyys 3.98 3.95 3.94 3.97 4.00 4.03 3.82 Informatiivisuus 4.08 4.02 3.92 4.00 4.06 4.04 3.86 Kuuntelun helppous 4.14 4.18 4.03 4.16 4.39 4.18 4.09 MUUTTUJAT Oikeakielisyys Informatiivisuus Kuuntelun helppous 58 Taulukko 10. Ammattikäyttäjien ymmärrettävyyden alakäsitteet: Miesvastaajat Miesvastaajien taustamuuttujat ymmärrettävyyden alakäsitteet on kuvattu yllä olevassa taulukossa 10. Tulokset tässä ryhmässä ovat varsin tasapainoiset ja isoja eroja ei juuri- kaan ole. Yksi selkeä ero ja poikkeama kuitenkin löytyy: yli 55-vuotiaiden arviointi kuun- telun helppoudesta, joka on saanut erinomaisen 4.42 arvioinnin. Tämä poikkeaa itses- sään suuren MOS-tuloksensa vuoksi, mutta se erottuu myös muiden ikäluokkien kuun- telun helppouden arvioinnista (4.00 ja 4.13). Tämä kuitenkin noudattaa havaittua pu- naista lankaa siitä, että vanhin ikäluokka on arvioinut puhesynteesin varsin positiivisella tavalla. Miesten ymmärrettävyyden sekä sen alakäsitteiden arvioinnit ovat kauttaaltaan myös positiivisia, ja ne eivät sisällä ainoatakaan puutteellisen arvioinnin saanutta tulosta. 3.60 3.80 4.00 4.20 4.40 4.60 Miehet Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Miehet Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli Kuuntelun helppous 4.14 4.00 4.13 4.42 4.17 4.07 Informatiivisuus 4.08 3.90 4.00 3.92 3.97 3.96 Oikeakielisyys 3.98 3.95 3.96 4.08 4.00 3.93 MIESTEN MUUTTUJAT Kuuntelun helppous Informatiivisuus Oikeakielisyys 59 Taulukko 11. Ammattikäyttäjien ymmärrettävyyden alakäsitteet: Naisvastaajat Naisten vastaavat tulokset on listattu taulukossa 11. Tulokset mukailevat miesten tulok- sia siinä, että ovat korkeita, mutta muutama poikkeus löytyy myös. Englannin kielen tai- don tuloksissa on selvä ero informatiivisuuden ja oikeakielisyyden piirteissä. Huonon englannin kielen taidon omaavat vastaajat ovat arvioineet oikeakielisyyden puutteel- liseksi (3.63), ja informatiivisuus on myös saanut alhaisen arvion (3.69). Hyvän englannin kielen taidon omaavat ovat arvioineet informatiivisuuden 4.12 ja oikeakielisyyden 4.06. Ero on näin ollen huomattava. Kuuntelun helppous on kuitenkin saanut molemmilta eng- lannin kielen taidon ryhmiltä arviokseen korkeat 4.20 sekä 4.13 arviot. Tämän lisäksi myös ikäluokkien välillä on sama jatkumo kaikissa alakäsitteissä, arvioiden kulkiessa ikä- luokkien mukaan nuorimmasta vanhimpaan, eli alhaisesta korkeampaan arvioon. Yli 55- vuotiaiden ryhmä on arvioinut erinomaisena kuuntelun helppouden (4.33) sekä infor- matiivisuuden (4.33), mikä kuvastaa hyvin vanhempien ikäluokkien erittäin positiivisia arvioita. 3.20 3.40 3.60 3.80 4.00 4.20 4.40 Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Naiset Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli Kuuntelun helppous 4.18 4.06 4.20 4.33 4.20 4.13 Informatiivisuus 4.02 3.94 4.00 4.33 4.12 3.69 Oikeakielisyys 3.95 3.94 3.98 3.83 4.06 3.63 NAISTEN MUUTTUJAT Kuuntelun helppous Informatiivisuus Oikeakielisyys 60 5.1.1 Miesääni ammattikäyttäjien arvioimana Puhesynteesi esitettiin kahdella eri videolla kyselyn vastaajille. Yhdessä videossa oli nais- ääni ja toisessa miesääni, puhesynteesin äänenä. Käyn läpi tässä luvussa miesäänellä tehdyn videon katsoneiden tulokset. Tutkielmassa tästä eteenpäin tulevista miesäänen ja naisäänen tuloksista on karsittu pois aiemmin esitetyt sukupuolen sisäiset muuttujat, tilastollisesti vastaajamäärä putoaisi nollaan tai muutamaan osallistujaan tietyissä muut- tujaryhmissä, joten näistä ei näin ollen saataisi tarpeellista tutkittavaa tietoa. Seuraa- vaksi esittelen puhesynteesin miesäänellä nähneen videon vastaajien tulokset pääkritee- reiden kokonaisarvoiltaan sekä pääkriteereiden alakäsitteiden tulosten avulla. Taulukko 12. Puhesynteesi miesäänellä: ammattikäyttäjien kokonaisarvot Taulukossa 12 on esitetty MOS-kokonaisarvo sekä luonnollisuuden ja ymmärrettävyyden tulokset. Kuten taulukosta käy ilmi kokonaisarvot ovat hyvät kaikista pääkriteereistä. Ym- märrettävyyden käsite on arvioitu parhaiten 4.13 tuloksella ja luonnollisuuden käsite on alhaisin 3.97 tuloksella. Tulokset ovat näin ollen selvästi positiiviset kokonaisarvioiden kannalta puhesynteesin miesäänen arvioinnissa. 3.50 3.60 3.70 3.80 3.90 4.00 4.10 4.20 4.30 MOS- kokon aisarv o Miehe t Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli MOS 4.05 4.03 4.06 3.80 4.10 4.17 4.08 3.95 Luonnollisuus 3.97 3.96 3.98 3.79 3.99 4.13 3.99 3.91 Ymmärrettävyys 4.13 4.11 4.14 3.81 4.20 4.21 4.17 4.00 MIESÄÄNI MOS Luonnollisuus Ymmärrettävyys 61 Naisten ja miesten arviot ovat hyvin samantasoisia kaikissa kolmessa kriteerissä, selvim- mät muutokset ovatkin ikäluokan ja englannin kielen taidon tason kategorioissa. Vanhin ikäluokka on arvioinut puhesynteesin miesäänisen videon parhaiten joka kriteerillä, kun taas nuorin ikäluokka on antanut alhaisimman arvion jokaisessa kolmessa kriteerissä. 35- 55-vuotiaiden ryhmä asettuu näiden kahden ryhmän väliin arvioinnissaan. Iällä näyttää näin ollen olevan selvä vaikutus puhesynteesin vastaanottamiseen ja näyttäisi, että van- hemmat ikäluokat mieluummin vastaanottavat puhesynteesin miesäänellä. Englannin- kielen taidon tasolla on myös vaikutusta puhesynteesin vastaanotossa. Ero on pienempi kuin ikäluokissa, mutta tulosten valossa hyvän englanninkielen taidon omaavat arvioivat paremmin puhesynteesin. Taulukko 13. Miesääni: ammattikäyttäjien luonnollisuuden alakäsitteet Luonnollisuuden alakäsitteet on esitelty taulukossa 13. Kuuntelukokemus on arvioitu korkeimmalla tuloksella 4.18, mutta alhaisimpaan ihmispuheen kaltaisuuden tulokseen 3.76 on merkittävä pudotus kuuntelukokemuksen tuloksesta. Ihmispuheen kaltaisuus on myös arvioitu kahteen kertaan puutteellisena. Alle 35-vuotiaat arvioivat ihmispuheen kaltaisuuden 3.57 ja huonon englannin kielen taidon omaavat 3.61 eli puutteelliseksi 3.00 3.20 3.40 3.60 3.80 4.00 4.20 4.40 MOS Miehe t Naiset Alle 35v 35- 55v Yli 55v Hyvä Engl. kieli Huon o Engl. Kieli Kuuntelukokemus 4.18 4.15 4.21 4.00 4.20 4.38 4.21 4.11 Kuuntelemisen helppous 3.96 3.94 3.98 3.79 4.00 4.00 3.95 4.00 Ihmispuheen kaltaisuus 3.76 3.79 3.74 3.57 3.78 4.00 3.81 3.61 Luonnollisuuden alakäsitteet Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus 62 merkittävinä tuloksina. Ikäluokkien välillä on sama eroavaisuus kuin taulukossa 16, eli nuoret arvioivat puhesynteesiä kriittisemmin kuin vanhemmat ikäluokat. Yli 55-vuotiaat arvioivat kuuntelukokemuksen selvästi erinomaisen rajan ylittävällä tuloksella 4.38, kun nuorin ikäluokka antoi samalle alakäsitteelle arvion 4.00. Taulukko 14. Miesääni: ammattikäyttäjien ymmärrettävyyden alakäsitteet Ymmärrettävyyden alakäsitteet on käyty läpi taulukossa 14. MOS-kokonaisarviot ovat kaikissa kolmessa käsitteessä hyvällä tasolla. Oikeakielisyys on alhaisin 3.99 tuloksella, mutta korkein tulos kuuntelun helppoudessa ylittää erinomaisen tuloksen rajan (4.28). Erinomaisen raja ylitetään myös kuuntelun helppoudessa naisten arvioimana 4.29, 35- 55-vuotiaiden arvioimana 4.35, yli 55-vuotiaiden tuloksessa 4.50 sekä hyvän, että huo- non englannin kielen omaavien vastaajien 4.29 ja 4.22. Erinomaisen raja ylitetään myös yli 55-vuotiaiden arviossa informatiivisuudesta 4.25 tuloksella. Informatiivisuutta ja kuuntelun helppoutta pidetään hyvänä. Oikeakielisyys jää jonkin verran jälkeen tulok- sissa, mutta myös sen tulokset ovat positiiviset. Alhaisimmat tulokset ovat alle 35-vuoti- aiden arvioissa kaikista kolmesta alakäsitteestä sekä huonon englannin kielen omaavien vastaajien arviossa oikeakielisyydestä. Ymmärrettävyyden alakäsitteiden tulokset olivat 3.00 3.20 3.40 3.60 3.80 4.00 4.20 4.40 4.60 MOS Miehe t Naiset Alle 35v 35- 55v Yli 55v Hyvä Engl. kieli Huon o Engl. Kieli Oikeakielisyys 3.99 3.94 4.02 3.79 4.06 3.88 4.07 3.72 Informatiivisuus 4.12 4.12 4.12 3.79 4.19 4.25 4.14 4.06 Kuuntelun helppous 4.28 4.26 4.29 3.86 4.35 4.50 4.29 4.22 Ymmärrettävyyden alakäsitteet Oikeakielisyys Informatiivisuus Kuuntelun helppous 63 kuitenkin varsin korkealla tasolla kokonaisuutena, niin kuin oli valtaosa miesäänen pu- hesynteesin katsoneiden vastaajien tuloksista. Varsinkin kokonaisarviot ylsivät korkeisiin lukemiin ja näin ollen puhesynteesin miesäänen vastaanotto oli positiivinen. 5.1.2 Naisääni ammattikäyttäjien arvioimana Tässä luvussa käydään läpi tarkemmin puhesynteesin naisäänellä tehdyn videon arvioin- nin tulokset. Taulukko 15. Puhesynteesi naisäänellä: ammattikäyttäjien kokonaisarviot Kokonaisarviot ovat kaikki hyväksyttävän tuloksen rajoissa, ymmärrettävyyden ollessa jälleen parhaimmaksi arvioitu kriteeri. Kokonaisarviot jäävät kuitenkin alhaisemmaksi kuin miesäänen tulokset ja muuttujista löytyy myös enemmän eroavaisuuksia kuin mies- äänen muuttujien tuloksissa. Sukupuolten vertailussa nähdään, että miehet mieltävät naisäänen ymmärrettävämpänä, kun taas naisvastaajat arvioivat naisäänen enemmän luonnollisena kuin miesvastaajat. 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00 4.10 MOS- kokon aisarv o Miehe t Naiset Alle 35v 35-55v Yli 55v Hyvä Engl. kieli Huono Engl. Kieli MOS 3.84 3.83 3.88 3.84 3.80 4.05 3.85 3.83 Luonnollisuus 3.74 3.68 3.86 3.62 3.73 4.00 3.71 3.78 Ymmärrettävyys 3.95 3.98 3.89 4.06 3.86 4.10 3.99 3.87 NAISÄÄNI MOS Luonnollisuus Ymmärrettävyys 64 Ikäluokissa vanhimmat ikäluokat arvioivat puhesynteesin paremmaksi kuin nuoremmat ikäluokat. Poikkeuksena tähän ymmärrettävyyden arviointi, jonka alle 35-vuotiaat ovat arvioineet lähes yhtä korkeana kuin vanhin yli 55-vuotiaiden ryhmä. Alle 35-vuotiaat ovat arvioineet luonnollisuuden kuitenkin vain tuloksella 3.62, joka on alle puutteellisen tu- loksen rajan. Englannin kielen taidon tasossa on ymmärrettävyyden kannalta selvin ero. Paremman taidon omaavat arvioivat puhesynteesin naisäänen ymmärrettävämmäksi. Puhesynteesin naisäänen tulokset ovat kokonaisuutena hyväksyttävällä tasolla, mutta tulokset ovat kuitenkin hyväksyttävän tuloksen alarajalla. Taulukko 16. Naisääni: ammattikäyttäjien luonnollisuuden alakäsitteet Luonnollisuuden alakäsitteiden tulokset jäivät selvästi alhaisiksi, kuten taulukosta 16 käy ilmi. Puutteellisen tuloksen saaneita arvioita on lukuisa määrä. Kuuntelemisen helppou- den alakäsitteessä, kaikki ryhmät ovat arvioineet kuuntelemisen helppouden puutteel- liseksi, ainoina poikkeuksina huonon englannin kielen taidon omaavat (3.89) ja yli 55- vuotiaat vastaajat (3.80). Ihmispuheen kaltaisuus on saanut myös hyvin alhaiset tulokset. Kolme muuttujaa yltää hyväksyttävään tulokseen, ja nämä ovat naisvastaajat (3.79), yli 55-vuotiaat (4.00) ja huonon englannin kielen taidon omaavat (3.89). Loput ryhmät ovat arvioineet ihmispuheen kaltaisuuden puutteellisena. Kuuntelukokemus sai 3.00 3.20 3.40 3.60 3.80 4.00 4.20 4.40 MOS Miehe t Naiset Alle 35v 35- 55v Yli 55v Hyvä engl. kieli Huon o engl. Kieli Kuuntelukokemus 3.99 3.91 4.17 3.86 4.00 4.20 4.15 4.24 Kuuntelemisen helppous 3.56 3.54 3.63 3.50 3.54 3.80 3.56 3.84 Ihmispuheen kaltaisuus 3.65 3.59 3.79 3.50 3.65 4.00 3.62 3.89 Luonnollisuuden alakäsitteet Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus 65 kokonaisuutena positiiviset arviot ja kaikki sen tulokset ylittävät hyväksytyn tuloksen ra- jan. Huonon englannin kielen taidon omaavat vastaajat arvostelivat puhesynteesin nais- äänen myös erinomaisella 4.24 tuloksella. Huomioitava havainto luonnollisuuden alakä- sitteiden tuloksissa on myös se, että huonon englannin kielen omaavat vastaajat ovat mieltäneet naisäänen luonnollisempana kaikissa kolmessa alakäsitteessä, kuin hyvän englannin kielen taidon omaavat. Puhesynteesin naisäänen luonnollisuuden alakäsitteiden tuloksia tarkasteltaessa suu- rimpana huomiona nousi puutteellisen tuloksen saaneiden arvioiden määrä. Kaksi kol- mesta alakäsitteestä sai myös kokonaistuloksestaan puutteellisen tuloksen, joten vaikka luonnollisuuden pääkäsite on hyväksyttävä (3.74), on huomioitava se fakta, että kuunte- lemisen helppous ja ihmispuheen kaltaisuus ei ollut tarvittavalla tasolla puhesynteesin naisäänen vastaanotossa. Taulukko 17. Naisääni: ammattikäyttäjien ymmärrettävyyden alakäsitteet Puhesynteesin naisäänen ymmärrettävyyden arvioinnit on listattu taulukossa 17. Koko- naisarviot yltävät kaikki kolme hyväksyttävän tuloksen rajoihin, ja erityisesti kuuntelun 3.00 3.20 3.40 3.60 3.80 4.00 4.20 4.40 MOS Miehe t Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Oikeakielisyys 3.95 4.00 3.83 4.05 3.87 4.10 3.98 3.88 Informatiivisuus 3.86 3.87 3.83 4.00 3.78 3.90 3.92 3.73 Kuuntelun helppous 4.04 4.06 4.00 4.14 3.93 4.30 4.06 4.00 Ymmärrettävyyden alakäsitteet Oikeakielisyys Informatiivisuus Kuuntelun helppous 66 helppous on saanut positiivisen vastaanoton, sisältäen vain yhden alle 4 menevän tulok- sen 3.93 ja yhden erinomaisen tuloksen 4.30 yli 55-vuotiaiden arvioimana. Ymmärrettä- vyyden alakäsitteiden tulokset eivät myöskään sisällä ainoatakaan puutteellisena arvioi- tua tulosta, joten kokonaisuutena ymmärrettävyys on ollut puhesynteesin naisäänessä hyvä. Aiemmin esille nousseesta alle 35-vuotiaiden kriittisestä arvioinnista ei ole havain- toa ymmärrettävyyden alakäsitteissä. Alle 35-vuotiaat arvioivat kaikki kolme alakäsitettä 4 ylittävinä tuloksina. Englannin kielen taidon muuttujien eroavaisuus on käänteinen tau- lukossa 20 tehtyyn havaintoon siitä, että huonon englannin kielen tason valinneet vas- taajat arvioivat puhesynteesin naisäänen luonnollisempana. Ymmärrettävyyden tulok- sissa, hyvän englannin kielen omaavat vastaajat ovat arvioineet naisäänen ymmärrettä- vämpänä kuin huonon englannin kielen taidon vastaajat. 5.2 Arkikäyttäjien MOS-tulokset Arkikäyttäjien kyselyyn vastasi yhteensä 69 ihmistä ja vastaajina toimivat hanojen asen- tamiseen ja huoltamiseen kouluttamattomat henkilöt, eli hanojen arkikäyttäjät. Taulu- kossa 16 on jaoteltu kaikki arkikäyttäjäryhmän kyselyyn vastanneet henkilöt ikäluokan, sukupuolen ja valitun englannin kielen osaamisen mukaan. Erinomainen Kiitettävä Tyydyttävä Välttävä Huono Mies 4 18 1 Nainen 5 3 4 4 18 1 5 3 4 0 5 10 15 20 Alle 35-vuotiaat Mies Nainen 67 Kuvio 11. Arkikäyttäjien englannin kielen taito ikäluokkien mukaan Kuviossa 11 on esitelty tarkennettu ikäjakauma englannin kielen taidon tason mukaan. Arkikäyttäjien englannin kielen taso jakautui tasaisemmin kuin ammattikäyttäjien vas- taavat. Valtaosa vastaajista sijoittuu hyvän englanninkielen taidon tason ryhmään eli erinomaisen tai kiitettävän valinneisiin vastaajiin, mutta huonon tai välttävän valinneita vastaajia on kuitenkin huomattavasti enemmän kuin ammattikäyttäjissä. Arkikäyttäjissä välttävän valinneita oli 6 ja huonon valinneita 2, kun taas ammattikäyttäjissä oli vain yksi välttävän valinnut vastaaja. Erinomainen Kiitettävä Tyydyttävä Välttävä Huono Mies 7 4 1 Nainen 2 6 1 1 7 4 1 2 6 1 1 0 2 4 6 8 35-55-vuotiaat Mies Nainen Erinomainen Kiitettävä Tyydyttävä Välttävä Huono Mies 1 3 3 Nainen 3 1 1 1 3 33 1 1 0 1 2 3 4 Yli 55-vuotiaat Mies Nainen 68 Kuvio 12. Arkikäyttäjien MOS-tulokset Kuviossa 12 on listattuna arkikäyttäjien koko kyselyn MOS-tulos sekä luonnollisuuden ja ymmärrettävyyden MOS-tulokset. Arkikäyttäjien tulokset saavuttavat hyväksytyn MOS- tuloksen, mutta tulokset ovat selvästi lähempänä 3.67 alarajaa kuin ammattikäyttäjän tulokset. Ymmärrettävyyden ja luonnollisuuden kriteereiden välillä on myös eroavaisuus, ymmärrettävyyden ollessa hieman korkeammin arvioitu. Käyn läpi seuraavaksi ymmär- rettävyyden ja luonnollisuuden kriteereitä sekä niiden alakäsitteitä, muuttujineen. 69 Taulukko 18. Arkikäyttäjien muuttujien MOS-tulokset Taulukossa 18 on listattu arkikäyttäjien MOS-tulokset, jokaisen muuttujan mukaan. Arki- käyttäjien tulokset ovat alemmalla tasolla kuin aiemmin esitetyt ammattikäyttäjien tu- lokset. Tulokset ovat kauttaaltaan alemmalla tasolla, ja tuloksista löytyy kolme puutteel- lista MOS-tulosta. Arkikäyttäjät, jotka ovat valinneet huonon englanninkielen tason ovat arvioineet puhesynteesin kokonaisuutena puutteelliseksi (3.66). Myös luonnollisuus on arvioitu puutteellisena (3.61). MOS-kokonaistulos on juuri puutteellisen rajan (3.67) ala- puolella, mutta luonnollisuus on jo jonkin verran tämän rajan alapuolella. Luonnollisuus on saanut heikoimmat arvioinnit kaikissa arvioinneissa, ja myös alle 35-vuotiaat ovat ar- vioineet sen puutteelliseksi (3.64). Sukupuolten tulosten välillä ei näyttäisi juurikaan ole- van eroa. Ikäluokissa tosin löytyy vaihtelevuutta. MOS-kokonaistuloksen arvioinnissa 35- 55-vuotiaiden ikäluokka on arvioinut puhesynteesin parhaimmaksi, nuorin alle 35-vuoti- aiden ryhmä toiseksi parhaimmaksi ja heikoimman arvioinnin MOS-tulokselle ovat anta- neet vanhin yli 55-vuotiaiden ikäluokka. Luonnollisuudessa parhaimman arvioinnin ovat antaneet 35-55-vuotiaat sekä vanhin ikäluokka, nuorimman ikäluokan arvostellessa luonnollisuuden heikoimmaksi. Ymmärrettävyyden arvioinnissa tämä järjestys on jälleen 3.45 3.50 3.55 3.60 3.65 3.70 3.75 3.80 3.85 3.90 MOS- kokon aisarv o Miehe t Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli MOS 3.76 3.73 3.79 3.74 3.83 3.70 3.80 3.66 Luonnollisuus 3.69 3.68 3.71 3.64 3.77 3.74 3.72 3.61 Ymmärrettävyys 3.82 3.79 3.88 3.83 3.89 3.67 3.88 3.70 Kokonaisarvot MOS Luonnollisuus Ymmärrettävyys 70 vaihtunut, eli vanhin ikäluokka on arvostellut ymmärrettävyyden kriittisimmin ja nuo- remmat ikäluokat ovat antaneet parhaimmat arvioinnit. Eri ikäluokkien tuloksissa ei näin ollen näyttäisi olevan samaa yhtenäisyyttä kuin ammattikäyttäjien tuloksissa, vaan tulok- set näyttävät olevan hyvin vaihtelevia. Käyn seuraavaksi läpi tarkemmin nämä ikäluokat sekä englannin kielen taidon sukupuolien mukaan. Taulukko 19. Arkikäyttäjät: Muuttujat miesvastaajien osalta Taulukossa 19 on kuvattu arkikäyttäjien miesten tekemien arviointien ovat muuten tasa- painoisia, lukuun ottamatta kahta vastaajaryhmää: yli 55-vuotiaat sekä huonon englan- nin kielen taidon omaavat vastaajat. Molemmat ryhmät ovat arvioineet puhesynteesin selkeästi puutteelliseksi kaikilla kolmella arvioinnilla. Heikoimmaksi on arvioitu ymmär- rettävyys (3.43) yli 55-vuotiaiden tuloksissa. Tulokset ovat kuitenkin suhteessa toisiinsa, kuten kuviossa 11 kävi ilmi, suurin osa huonon englannin kielen tason valinneista vastaa- jista oli yli 55-vuotiaita, joten tässä mielessä on loogista, että nämä kaksi tulosta ovat samantasoisia. 3.00 3.20 3.40 3.60 3.80 4.00 Miehet Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Miehet Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli Ymmärrettävyys 3.79 3.84 3.90 3.43 3.91 3.50 Luonnollisuus 3.68 3.67 3.74 3.60 3.74 3.51 MOS 3.73 3.76 3.82 3.51 3.83 3.51 Miesten muuttujat Ymmärrettävyys Luonnollisuus MOS 71 Taulukko 20. Arkikäyttäjät: Muuttujat naisvastaajien osalta Taulukossa 20 on listattu naisten tekemien arviointien muuttujien tulokset. Tulokset ovat kokonaisvaltaisesti korkeammat kuin miehillä, ja naisten tuloksissa on vain yksi puutteel- lisen arvioinnin saanut tulos. Alle 35-vuotiaat ovat arvioineet puhesynteesin luonnolli- suuden puutteellisena (3.58) kun taas kaikki muut tulokset yltävät hyväksytyn MOS-tu- loksen välille. Ikäluokkien välinen arviointi noudattaa enemmän ammattikäyttäjien tu- loksissa esiintynyttä mallia, jossa nuorin ikäluokka arvioi puhesynteesin kriittisimmin ja vanhemmat ikäluokat positiivisimmin. Naisten tuloksissa on myös vanhin ikäluokka arvi- oinut pääkriteerit ja kokonaisarvon parhaimmaksi ja nuorempiin ikäluokkiin mentäessä arvio laskee. Englannin kielessä on myös eroa hyvän englanninkielen ja huonon englan- ninkielen taitoisten ryhmien välillä. Huonon englanninkielen taidon omaavat arvostelivat puhesynteesin hieman hyvän englanninkielen taidon ryhmää paremmaksi. Järjestys on näin ollen käänteinen miesten ryhmään, jossa huonon englanninkielen taidon ryhmä ar- vioi puhesynteesin heikompana. 3.20 3.40 3.60 3.80 4.00 Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Naiset Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli Ymmärrettävyys 3.88 3.82 3.87 4.00 3.83 3.92 Luonnollisuus 3.71 3.58 3.80 3.93 3.68 3.71 MOS 3.79 3.70 3.83 3.97 3.76 3.82 Naisten muuttujat Ymmärrettävyys Luonnollisuus MOS 72 Taulukko 21. Arkikäyttäjät: luonnollisuuden alakäsitteet Luonnollisuuden alakäsitteet on kuvattu taulukossa ensin kokonaisarvojen kautta ja tar- kemmin jokaisen muuttujan tulosten kautta. Kokonaisarvojen tulokset osoittavat, että kuuntelukokemus oli ainoa hyväksyttävään rajaan päässyt alakäsite. Kuuntelemisen helppous (3.58) ja ihmispuheen kaltaisuus (3.61) ovat molemmat puutteellisen tuloksen asteikolla. Kuuntelukokemuksen positiivinen arviointi osoittaa kuitenkin sen, että esi- merkiksi puhesynteesin äänen ihmismäisyys, tai sen puute, ei ole vaikuttanut puhesyn- teesin kuuntelukokemukseen kokonaisuutena. Alakäsitteiden muuttujat mukailevat 3.4 3.5 3.6 3.7 3.8 3.9 L U O N N O L L I S U U S K U U N T E L U K O K E M U S K U U N T E L E M I S E N H E L P P O U S I H M I S P U H E E N K A L T A I S U U S 3.69 3.88 3.58 3.61 LuonnollisuusKuuntelukokemusKuuntelemisenhelppous Ihmispuheen kaltaisuus MOS 3.693.883.583.61 ARKIKÄYTTÄJÄT 3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00 4.10 Miehe t Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Kuuntelukokemus 3.87 3.89 3.87 3.89 4.04 3.90 3.78 Kuuntelemisen helppous 3.55 3.63 3.54 3.64 3.58 3.60 3.54 Ihmispuheen kaltaisuus 3.62 3.61 3.51 3.77 3.58 3.66 3.50 MUUTTUJAT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus 73 kokonaisarviointien tuloksia. Kuuntelukokemuksen arvioinnit ovat kaikki hyväksyttävien tulosten rajoissa, kun taas kuuntelemisen helppouden ja ihmispuheen kaltaisuuden ala- käsitteiden tulokset ovat kaikki, 35-55-vuotiaiden arviota ihmispuheen kaltaisuudesta lu- kuun ottamatta vain puutteellisia tuloksia. Vaihtelevuus on muutoin hyvin pientä eri muuttujien välillä, englannin kielen taito on näistä selkein eroavaisuus. Hyvän englannin- kielen omaavat vastaajat arvioivat luonnollisuuden alakäsitteet paremmaksi kuin huo- non englanninkielen taidon omaavat vastaajat. Merkittävin havainto arkikäyttäjien luon- nollisuuden ja sen alakäsitteiden arvioinnista on kuitenkin kuuntelemisen helppouden ja ihmispuheen kaltaisuuden alhainen arviointi jokaisessa muuttujaryhmässä. Luonnolli- suuden pääkäsite on pysynyt hyväksyttävissä rajoissa, mutta on tärkeää huomioida, että kaksi kolmesta alakäsitteestä on kuitenkin puutteellisen arvioinnin puolella. Taulukko 22. Miesten muuttujat: arkikäyttäjien luonnollisuuden alakäsitteet Miesten tekemien arviointien muuttujat luonnollisuuden alakäsitteissä kuvastavat hyvin kokonaisarvoissa listattuja havaintoja taulukossa 22. Kuuntelukokemus on ainoa 2.80 3.00 3.20 3.40 3.60 3.80 4.00 Miehet Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Miehet Alle 35v 35-55v Yli 55v Hyväengl. kieli Huono engl. Kieli Ihmispuheen kaltaisuus 3.62 3.57 3.75 3.57 3.67 3.50 Kuuntelemisen helppous 3.55 3.59 3.63 3.29 3.63 3.33 Kuuntelukokemus 3.87 3.87 3.83 3.93 3.93 3.71 MIESTEN MUUTTUJAT Ihmispuheen kaltaisuus Kuuntelemisen helppous Kuuntelukokemus 74 kokonaan hyväksyttävien arvioiden puolella oleva alakäsite, ja muut kaksi alakäsitettä on myös miesten arvioimina puutteellisen arvioinnin puolella. Selkein havainto alhaisesta arvioinnista on huonon englannin kielen tason valinneilla vastaajilla ja yli 55-vuotiailla vastaajilla, jotka molemmat arvioivat kuuntelemisen helppouden selvästi puutteellisena (3.33 ja 3.29). Huono englannin kielen taito näyttää vaikuttaneen puhesynteesin vas- taanottoon negatiivisesti miesten arvioinneissa, ja erityisesti tämä korostui kuuntelemi- sen helppoudessa, tai tässä tapauksessa sen vaikeudessa. Taulukko 23. Naisten muuttujat: arkikäyttäjien luonnollisuuden alakäsitteet Naisten tekemät arvioinnit luonnollisuuden alakäsitteistä muuttujineen on kuvattu tau- lukossa 23. Tulokset noudattavat samaa kaavaa kokonaistulosten osalta. Kuuntelukoke- mus on saanut positiiviset tulokset, kun taas kuuntelemisen helppous ja ihmispuheen kaltaisuus on alhaisella tasolla arvioinneiltaan. Tämä korostui eritoten alle 35-vuotiaiden arvioinneissa, 3.42 ihmispuheen kaltaisuudelle sekä 3.46 arviolle kuuntelemisen help- poudelle. Englannin kielen taidolla ei näytä olleen selkeää ja johdonmukaista vaikutusta vaan tulokset vaihtelevat jokaisessa alakäsitteessä. 0.00 1.00 2.00 3.00 4.00 5.00 Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Naiset Alle 35v 35-55v Yli 55v Hyvä engl.kieli Huono engl. Kieli Ihmispuheen kaltaisuus 3.61 3.42 3.80 3.60 3.66 3.50 Kuuntelemisen helppous 3.63 3.46 3.65 4.00 3.53 3.77 Kuuntelukokemus 3.89 3.88 3.95 4.20 3.84 3.86 NAISTEN MUUTTUJAT Ihmispuheen kaltaisuus Kuuntelemisen helppous Kuuntelukokemus 75 Taulukko 24. Arkikäyttäjät: ymmärrettävyyden alakäsitteet Arkikäyttäjien ymmärrettävyyden ja sen alakäsitteiden arviointien tulokset on listattu taulukkoon 24. Ymmärrettävyys ja sen alakäsitteet sijoittuvat kaikki hyväksyttävän tulok- sen rajalle ja näin ollen puhesynteesin ymmärrettävyys on koettu positiivisemmin kuin puhesynteesin luonnollisuus. Kuuntelun helppous arvioitu alakäsitteistä parhaimmaksi ja oikeakielisyys on saanut heikoimman arvostelun. 3.5 3.6 3.7 3.8 3.9 4 Y M M Ä R R E T T Ä V Y Y S O I K E A K I E L I S Y Y S I N F O R M A T I I V I S U U S K U U N T E L U N H E L P P O U S 3.82 3.70 3.85 3.93 YmmärrettävyysOikeakielisyysInformatiivisuusKuuntelunhelppous MOS 3.823.703.853.93 ARKIKÄYTTÄJÄT 2.90 3.10 3.30 3.50 3.70 3.90 4.10 Miehet Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Oikeakielisyys 3.58 3.87 3.71 3.82 3.42 3.77 3.52 Informatiivisuus 3.85 3.85 3.91 3.86 3.58 3.92 3.70 Kuuntelun helppous 3.94 3.91 3.87 3.98 4.00 3.95 3.89 MUUTTUJAT Oikeakielisyys Informatiivisuus Kuuntelun helppous 76 Muuttujien tuloksissa on havaittavissa muutama poikkeus. Yli 55-vuotiaat ovat arvioi- neet oikeakielisyyden ja informatiivisuuden selvästi muita ikäluokkia alhaisemmaksi ja molemmat näistä alittavat puutteellisen arvion rajan (3.42 ja 3.58). Huono englanninkie- len taito on myös vaikuttanut oikeakielisyyden arviointiin (3.52). Miehet ovat arvioineet oikeakielisyyden naisia heikommaksi ja miesten arviointi sijoittuu myös puutteellisen ar- vion puolelle (3.58). Seuraavaksi käyn läpi miesten ja naisten arvioinnit ja muuttujat erik- seen, josta voi nähdä tarkemmin miten iso ero sukupuolten välisessä arvostelussa on ollut. Taulukko 25. Arkikäyttäjien ymmärrettävyyden alakäsitteet: Miesvastaajat Miesten tekemien arviointien tuloksista käy ilmi taulukossa 25, että kriittisimmät ryhmät ovat olleet yli 55-vuotiaat ja huonon englanninkielen tason omaavat vastaajat kaikissa kolmessa alakäsitteessä. Alle 35-vuotiaat ovat myös arvioineet oikeakielisyyden puut- teelliseksi (3.63). Muutoin tulokset ovat kaikki hyväksyttävien tulosten puolella. Ikä ja englanninkielen taidon taso ovat näin ollen olleet tärkeimmät vaikuttavat tekijät 0.00 1.00 2.00 3.00 4.00 5.00 Miehet Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli MiehetAlle 35v35-55vYli 55vHyvä engl.kieli Huono engl. Kieli Oikeakielisyys 3.583.633.713.213.683.33 Informatiivisuus 3.853.913.963.433.973.54 Kuuntelun helppous 3.943.984.043.644.073.63 MIESTEN MUUTTUJAT Oikeakielisyys Informatiivisuus Kuuntelun helppous 77 oikeakielisyyden ja informatiivisuuden arvioinnissa. Huonolla englanninkielen tasolla ja vanhemmalla ikäluokalla todettiin jo aiemmin olevan yhteys, joten on johdonmukaista, että puhesynteesin ymmärtäminen on kärsinyt, jos englannin kielen ymmärtäminen it- sessään on heikommalla tasolla. Taulukko 26. Arkikäyttäjien ymmärrettävyyden alakäsitteet: Naisvastaajat Naisten tekemät arvioinnit puhesynteesin ymmärrettävyydestä ja sen alakäsitteistä ovat kaikki hyväksyttävien tulosten rajoissa, kuten taulukosta 26 voi havaita. Englannin kielen tasolla tai iällä ei näytä olleen täysin samoja vaikutuksia kuin miesten tekemissä arvioin- neissa. Molempien ryhmien arviot ovat hyvin vaihtelevat. Esimerkiksi huonon englan- ninkielen taidon omaavat ovat arvostelleen kuuntelun helppouden huomattavasti hyvän englannin kielen omaavia paremmaksi. Oikeakielisyyden arvioinnissa tämä on taas päin- vastoin, ja informatiivisuuden arvioinnit ovat puolestaan melkein identtisiä. Ikä jäljittelee näitä samoja piirteitä. Vanhin ikäluokka arvioi kuuntelun helppouden erinomaisena (4.50) ja oikeakielisyyden heikoimpana (3.70), joten selkeää johdonmukaisuutta ei ikäluokista myöskään löydy. Oikeakielisyys ja yli 55-vuotiaiden ryhmä ovat kuitenkin myös naisten 0.00 1.00 2.00 3.00 4.00 5.00 Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli NaisetAlle 35v35-55vYli 55vHyvä engl.kieli Huono engl. Kieli Oikeakielisyys 3.873.883.953.703.943.73 Informatiivisuus 3.853.923.753.803.843.86 Kuuntelun helppous 3.913.673.904.503.724.18 NAISTEN MUUTTUJAT Oikeakielisyys Informatiivisuus Kuuntelun helppous 78 vastaajissa alhaisimmat arviot antaneet ryhmät, vaikkakin tulokset eivät ole niin alhaiset kuin miesten tulokset. 5.2.1 Miesääni arkikäyttäjien arvioimana Arkikäyttäjät arvioivat ammattikäyttäjien tapaan kahta eri puhesynteesin ääntä: miehen ääntä sekä naisen ääntä. Arkikäyttäjät jaoteltiin kahteen ryhmään sen perusteella minkä sukupuolen äänellä tehdyn videon he katsoivat. Tässä luvussa esitellään arkikäyttäjien puhesynteesin miesäänellä katsoneiden ryhmän tulokset. Taulukko 27. Puhesynteesi miesäänellä: arkikäyttäjien kokonaisarviot Taulukossa 27 on listattu puhesynteesin miesäänen arvioinnin tulokset. MOS-kokonais- arvot ovat kaikilta kolmelta kriteeriltä hyväksyttävällä tasolla. Ymmärrettävyyden arvi- ointi parhaimpana on johdonmukainen aiempiin tuloksiin verrattuna. Naiset arvioivat myös puhesynteesin hieman paremmaksi kuin miehet, mikä on myös johdonmukaista aiempien arkikäyttäjien tulosten valossa. Alle 35-vuotiaat ovat olleet kriittisimmät arvi- oinneissaan, ja 35-55-vuotiaiden ikäluokka on arvioinut puhesynteesin miesäänen 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00 MOS- kokona isarvo Miehet Naiset Alle 35v 35-55v Yli 55v Hyvä Engl. kieli Huono Engl. Kieli MOS 3.81 3.79 3.85 3.73 3.92 3.74 3.84 3.76 Luonnollisuus 3.73 3.70 3.77 3.59 3.86 3.71 3.73 3.72 Ymmärrettävyys 3.90 3.87 3.94 3.87 3.99 3.76 3.95 3.81 MIESÄÄNI MOS Luonnollisuus Ymmärrettävyys 79 parhaimmaksi. Alle 35-vuotiaiden ryhmän arvioinneista löytyy myös ainut puutteellisen arvioinnin tulos (3.59), puhesynteesin miesäänen luonnollisuudesta. Englannin kielen taito vaikuttaa myös hieman puhesynteesin vastaanottoon, hyvän englannin kielen omaavat arvioivat miesäänen kaikilla kriteereillä hieman paremmaksi kuin huonon eng- lannin kielen omaavat vastaajat. Arkikäyttäjien tulokset puhesynteesin miesäänestä ovat hyvin tasapainoiset, lukuun ot- tamatta yhtä puutteellisen tuloksen saanutta tulosta. Kaikki tulokset pysyvät myös alle 4, joten tulokset ovat riittävällä tasolla ilman selkeitä kohokohtia tai eroavaisuuksia. Taulukko 28. Miesääni: arkikäyttäjien luonnollisuuden alakäsitteet Luonnollisuuden alakäsitteet on arvioitu taulukossa 28. Kuuntelemisen helppous on saa- nut alhaisimmat tulokset, ja sen MOS-kokonaistulos 3.56 alittaa puutteellisen tuloksen rajan. Ihmispuheen kaltaisuus on saanut myös alhaisen tuloksen 3.69, mutta on vielä hyväksyttävien tulosten rajalla. Kuuntelukokemus on myös tässä ryhmässä arvioitu par- haimpana, ja tämä mukailee analyysin aiempia tuloksia. 3.00 3.20 3.40 3.60 3.80 4.00 4.20 MOS Miehe t Naiset Alle 35v 35- 55v Yli 55v Hyvä Engl. kieli Huon o Engl. Kieli Kuuntelukokemus 3.93 3.86 4.04 3.81 3.96 4.07 3.91 3.96 Kuuntelemisen helppous 3.56 3.52 3.62 3.35 3.75 3.57 3.55 3.58 Ihmispuheen kaltaisuus 3.69 3.71 3.65 3.62 3.86 3.50 3.73 3.63 Luonnollisuuden alakäsitteet Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus 80 Kuuntelemisen helppous on selvästi heikoiten arvioitu alakäsite, ja se sisältääkin vain yh- den hyväksyttävän tuloksen 3.75, jonka ovat antaneet 35-55-vuotiaiden vastaajien ryhmä. Kaikki muut tulokset ovat puutteellisen tuloksen puolella ja erityisesti alle 35- vuotiaat ovat arvioineet puhesynteesin miesäänen kuuntelun helppoutta hyvin alhai- sena 3.35 tuloksella. Alle 35-vuotiaat ovat tosin myös kriittisimmät arvioijat tässäkin ryh- mässä, mutta kuuntelun helppouden 3.35 tulos on samalla myös kyselyn alhaisimpia tu- loksia. Ihmispuheen kaltaisuus on myös saanut neljä puutteellisen tuloksen arviota. Naiset 3.65, alle 35-vuotiaat 3.62, yli 55-vuotiaat 3.50 sekä huonon englannin kielen taidon vastaajat 3.63. Ihmispuheen kaltaisuus ylittää kuitenkin kokonaisarvioltaan juuri ja juuri hyväksyt- tävän tuloksen rajan, joten ihmispuheen kaltaisuus on kuitenkin riittävällä tasolla. Kuuntelemisen helppouden alhainen tulos ja kuuntelukokemuksen korkea tulos on ha- vainto, joka on noussut esiin monesti analyysissä. Kuuntelukokemus on mielletty hyvänä, mutta kuuntelemisen helppous on monesti saanut alhaisen tai jopa puutteellisen tulok- sen. Ihmispuheen kaltaisuus on myös saanut vaihtelevia tuloksia, mutta on tärkeää ha- vaita, että ihmispuheen kaltaisuuden heikompi taso ja kuuntelemisen vaikeus eivät ole kuitenkaan vaikuttaneet negatiivisesti itse kuuntelukokemukseen ja sen arviointiin. 81 Taulukko 29. Miesääni: arkikäyttäjien ymmärrettävyyden alakäsitteet Ymmärrettävyyden alakäsitteet ovat hyväksyttävällä tasolla MOS-tuloksiltaan, kuten tau- lukosta 29 käy ilmi. Oikeakielisyys on ainut alakäsite, joka on saanut alhaisempia tuloksia arvioinnista. Alle 35-vuotiaat ovat arvioineet puhesynteesin miesäänen oikeakielisyyden puutteellisena 3.65 tuloksella, kuten ovat myös yli 55-vuotiaat 3.50 tuloksella ja huonon englannin kielen taidon omaavat vastaajat 3.58 tuloksella. Hyvän englannin kielen taidon omaavat ovat kuitenkin arvioineet oikeakielisyyden hyväksyttävänä 3.80 tuloksella, joten englannin kielen osaamisella näyttäisi tässä tapauksessa olevan merkitystä. Informatiivi- suus on hyvällä tasolla. Ainoa poikkeama on yli 55-vuotiaiden muihin informatiivisuuden tuloksiin verrattuna alhainen tulos (3.71). Yli 55-vuotiaat ovat olleet myös kriittisin ar- vioija-ryhmä puhesynteesin miesäänen ymmärrettävyyden osalta. Ymmärrettävyyden tulokset ovat kuitenkin hyväksyttävät ja vaikkakin muutama puut- teellinen tulos löytyi muuttujista, on MOS-kokonaistulos kaikilta kolmelta alakäsitteeltä hyväksyttävällä tasolla. Arkikäyttäjät ovat arvioineet puhesynteesin miesäänen ymmär- rettävyyden hyväksyttävästi. 3.00 3.20 3.40 3.60 3.80 4.00 4.20 MOS Miehe t Naiset Alle 35v 35-55v Yli 55v Hyvä Engl. kieli Huono Engl. Kieli Oikeakielisyys 3.72 3.67 3.81 3.65 3.89 3.50 3.80 3.58 Informatiivisuus 3.93 3.95 3.88 3.96 4.00 3.71 4.00 3.79 Kuuntelun helppous 4.04 4.00 4.12 4.00 4.07 4.07 4.05 4.04 Ymmärrettävyyden alakäsitteet Oikeakielisyys Informatiivisuus Kuuntelun helppous 82 5.2.2 Naisääni arkikäyttäjien arvioimana Tässä luvussa esitellään puhesynteesin naisäänen arviointi arkikäyttäjien tekemänä MOS-tuloksen sekä luonnollisuuden ja ymmärrettävyyden kriteereiden ja näitä tarken- tavien alakäsitteiden kautta. Taulukko 30. Puhesynteesi naisäänellä: arkikäyttäjien kokonaisarviot Arkikäyttäjät ovat arvioineet puhesynteesin naisäänen MOS-kokonaistuloksen ja ymmär- rettävyyden alhaisella tuloksella, mutta kuitenkin hyväksyttävän tuloksen rajoissa. Luon- nollisuus on tuloksella 3.65 puutteellinen. Luonnollisuus on arvioitu hyväksyttäväksi vain yli 55-vuotiaiden ryhmässä tuloksella 3.77 sekä hyvän englannin kielen omaavien arvi- ossa 3.72. Muut muuttujaryhmät ovat arvioineet luonnollisuuden puutteelliseksi. Ym- märrettävyys on saanut myös kaksi puutteellista tulosta. Yli 55-vuotiaat ovat arvioineet ymmärrettävyyden puutteelliseksi tuloksella 3.53, ja huonon englannin kielen taidon omaavat tuloksella 3.61. MOS-kokonaistulos on saanut kolmelta eri muuttujaryhmältä puutteellisen tuloksen. 35-55-vuotiaiden MOS-kokonaistulos on puutteellinen 3.66, yli 3.35 3.40 3.45 3.50 3.55 3.60 3.65 3.70 3.75 3.80 3.85 MOS- kokona isarvo Miehet Naiset Alle 35v 35-55v Yli 55v Hyvä engl. kieli Huono engl. Kieli MOS 3.70 3.68 3.73 3.73 3.66 3.65 3.77 3.56 Luonnollisuus 3.65 3.66 3.64 3.64 3.60 3.77 3.72 3.52 Ymmärrettävyys 3.75 3.71 3.82 3.82 3.71 3.53 3.82 3.61 NAISÄÄNI MOS Luonnollisuus Ymmärrettävyys 83 55-vuotiaiden tulos on 3.65, ja myös huonon englannin kielen omaavat vastaajat ovat arvioineet MOS-kokonaistuloksen puutteelliseksi tuloksella 3.56. Kokonaistulokset ovat näin ollen riittävän ja huonon tuloksen välimaastossa. Puhesyn- teesin naisääni sai myös ammattikäyttäjien tekemässä arviossa taulukossa 13 alhaiset arvioinnit, ja arkikäyttäjien tulos näyttäisi noudattavan tätä samaa kaavaa. Arkikäyttäjien arviot ovat kuitenkin kriittisemmät, ja tätä korostaa yhden pääkriteerin arviointi puut- teelliseksi. Taulukko 31. Naisääni: arkikäyttäjien luonnollisuuden alakäsitteet Luonnollisuuden alakäsitteet on esitetty taulukossa 31. Kuuntelukokemus on hyväksyt- tävällä tasolla MOS-tulokseltaan sekä kaikkien muuttujien arvioissa. Aiempien analyy- sien tapaan kuuntelemisen helppoutta ja ihmispuheen kaltaisuutta on pidetty selvästi kuuntelukokemusta heikompana. Ihmispuheen kaltaisuus sisältää vain yhden hyväksyt- tävän tuloksen yli 55-vuotiaiden arvioinnissa (3.70). Kuuntelemisen helppous ei ole saa- nut ainuttakaan hyväksyttävän tason tulosta, mutta se on kuitenkin MOS-kokonaistulok- seltaan paremmaksi arvioitu kuin ihmispuheen kaltaisuus. Tämä johtuu huonon 3.00 3.10 3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00 MOS Miehe t Naiset Alle 35v 35- 55v Yli 55v Hyvä engl. kieli Huon o engl. Kieli Kuuntelukokemus 3.83 3.88 3.75 3.82 3.75 4.00 3.90 3.68 Kuuntelemisen helppous 3.60 3.57 3.64 3.66 3.44 3.60 3.65 3.50 Ihmispuheen kaltaisuus 3.53 3.52 3.54 3.45 3.63 3.70 3.60 3.36 Luonnollisuuden alakäsitteet Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus 84 englannin kielen omaavien erittäin alhaisesta arvioinnista puhesynteesin naisäänen ih- mispuheen kaltaisuudesta, tuloksella 3.36. Alle 35-vuotiaat ovat myös arvioineet ihmis- puheen kaltaisuuden hyvin alhaiseksi tuloksella 3.45. Yksi tärkeä havainto, joka pitää nos- taa esiin on myös kuuntelukokemuksen hieman alhaisempi tulos verrattuna esimerkiksi aiempaan taulukkoon 28 puhesynteesin miesäänen luonnollisuuden alakäsitteistä. Kuuntelukokemus on myös lähempänä puutteellisen tuloksen rajaa naisäänen arvioissa kuin muissa aiemmissa tuloksissa. Kuuntelukokemuksen korkeat arviot ovat aiemmissa tuloksissa nostaneet luonnollisuuden hyväksytylle rajalle, mutta naisäänen tuloksissa myös kuuntelukokemuksen alhaiset tulokset laskevat luonnollisuuden puutteelliseksi. Taulukko 32. Naisääni: arkikäyttäjien ymmärrettävyyden alakäsitteet Ymmärrettävyyden alakäsitteet on kuvattu taulukossa 32. Kaikki kolme alakäsitettä ovat MOS-kokonaistulokseltaan hyväksytyllä tasolla, tosin oikeakielisyys on juuri 3.67 hyväk- sytyn rajan tuloksessa. Kuuntelun helppous on parhaimmaksi arvioitu alakäsite ja sen tuloksissa ei ole ainuttakaan puutteellista tulosta. Informatiivisuus ja oikeakielisyys sisäl- tävät molemmat 3 puutteellista tulosta. Yli 55-vuotiaat ovat arvioineet informatiivisuu- den 3.40 ja oikeakielisyyden 3.30. Huonon englannin kielen omaavat vastaajat ovat 3.00 3.10 3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00 MOS Miehe t Naiset Alle 35v 35- 55v Yli 55v Hyvä engl. kieli Huono engl. Kieli Oikeakielisyys 3.67 3.50 3.93 3.75 3.69 3.30 3.75 3.50 Informatiivisuus 3.77 3.74 3.82 3.91 3.63 3.40 3.85 3.59 Kuuntelun helppous 3.81 3.88 3.71 3.80 3.81 3.90 3.85 3.73 Ymmärrettävyyden alakäsitteet Oikeakielisyys Informatiivisuus Kuuntelun helppous 85 arvioineet informatiivisuuden 3.59 ja oikeakielisyyden 3.50. Eroavaisuus tulee viimei- sissä puutteellisissa tuloksissa, miesvastaajien arvioidessa oikeakielisyyden 3.50 ja 35- 55-vuotiaiden arvioidessa informatiivisuuden 3.63 tuloksella puutteelliseksi. Muut tulok- set ovat tasaisesti hyväksytyn tuloksen alarajan tuntumassa, ja korkeita yli 4 tuloksen ylittäviä arvioita ei ole lainkaan. Puhesynteesin naisäänen ymmärrettävyys on kuitenkin arvioitu hyväksyttäväksi, koska se ei sisällä kokonaistuloksiltaan puutteellisia tuloksia. Naisäänen tulokset ovat matalat verrattuna luvun 5.2.1 miesäänen tuloksiin ymmärret- tävyydessä, ja ne ovat myös koko tutkielman ymmärrettävyyden tuloksiin verrattaessa matalat. 5.3 Varianssianalyysin tulokset Varianssianalyysissä vertailen tutkimuskysymysten mukaan ammattikäyttäjien ja arki- käyttäjien, puhesynteesin mies- ja naisäänen sekä kaikkien näiden sisäisten muuttujien eroavaisuuksia. Aloitan vertailun ammattikäyttäjien ja arkikäyttäjien tuloksista, jonka jäl- keen siirryn nais- ja miesäänien vertailuun. Taulukko 33. Varianssianalyysi: kokonaistulokset AMMATTIKÄYTTÄJÄT MOS Luonnollisuus Ymmärrettävyys Kokonaistulos 3.94 3.85 4.04 Miehet 3.91 3.79 4.03 Naiset 3.99 3.93 4.05 Alle 35v 3.82 3.69 3.96 35-55v 3.96 3.84 4.04 Yli 55v 4.10 4.06 4.15 Hyvä engl. kieli 3.97 3.86 4.08 Huono engl. kieli 3.88 3.83 3.92 ARKIKÄYTTÄJÄT MOS Luonnollisuus Ymmärrettävyys Kokonaistulos 3.76 3.69 3.82 Miehet 3.73 3.68 3.79 Naiset 3.79 3.71 3.88 Alle 35v 3.74 3.64 3.83 35-55v 3.83 3.77 3.89 Yli 55v 3.70 3.74 3.67 Hyvä engl. kieli 3.80 3.72 3.88 Huono engl. Kieli 3.66 3.61 3.70 86 Ammattikäyttäjien ja arkikäyttäjien tulokset muuttujineen on listattu taulukkoon 33. Sel- kein ja suoraviivaisin ero ammattikäyttäjien ja arkikäyttäjien välillä oli se, että ammatti- käyttäjät arvioivat puhesynteesin paremmaksi kuin arkikäyttäjät. Toisin sanoen ammat- tikäyttäjät kokivat puhesynteesin parempana kuin arkikäyttäjät. Tähän suurimpana syynä on kokonaistulosten kannalta se, että ammattikäyttäjät ovat koulutettuja videolla esitet- tyihin huoltotoimenpiteisiin ja heillä on näin parempi tietämys videolla esiintyvistä ter- meistä ja toimenpiteistä. Ero on noin 0.20 pisteen luokkaa kokonaistuloksissa, mitä voi- daan pitää jo merkittävänä erona. Kokonaistulosten välillä ei ole myöskään paljon vaih- telua vaan MOS, luonnollisuus ja ymmärrettävyys ovat kaikki tässä 0.20 vaihteluvälillä. Ammattikäyttäjien kaikki tulokset yltävät myös hyväksytyn tuloksen alarajan 3.67 ylä- puolelle, kun taas arkikäyttäjillä on kolme tämän rajan alittavaa puutteellista tulosta. Huono englannin kielen taito on vaikuttanut eniten arkikäyttäjillä ja MOS sekä luonnolli- suus ovat molemmat puutteellisen tuloksen puolella (3.66 ja 3.61). Kolmas puutteellinen tulos on alle 35-vuotiaiden arkikäyttäjien arvio puhesynteesin luonnollisuudesta. Kaikki muut tulokset yltävät kuitenkin hyväksytyn rajaan, joten arkikäyttäjien tuloksia voidaan pitää kokonaisuutena hyväksyttävinä, vaikkakin niissä on selvästi varaa parantaa. On tärkeää huomata, että myös ammattikäyttäjillä nämä kaksi muuttujaryhmää: alle 35- vuotiaat ja huonon englannin kielen taitoiset ovat antaneet alhaisimmat arviot kaikista ammattikäyttäjien tuloksista. Näin voidaan päätellä, että englannin kielen taidolla oli merkitystä puhesynteesin vastaanotossa ja sen puute on vaikeuttanut puhesynteesin vastaanottoa. Samoin on huomattava, että nuorin ikäluokka on kokenut puhesynteesin heikoiten niin ammattikäyttäjissä kuin arkikäyttäjissäkin. Arkikäyttäjissä vanhin ikäluokka on kokenut puhesynteesin huonommin kuin muut, kun taas ammattikäyttäjissä vanhin yli 55-vuotiaiden ryhmä on arvioinut puhesynteesin parhaimpana. Iässä on näin ollen selvää hajontaa, ja ainoastaan ammattikäyttäjissä näyttäisi olevan selvä johdonmukai- suus puhesynteesin kokemisessa. Nuorin ikäluokka arvioi puhesynteesin huonoimpana ja vanhin ikäluokka parhaimpana. 87 Miesten ja naisten tuloksissa on myös selvä johdonmukaisuus molemmissa ryhmissä. Naiset arvioivat puhesynteesin paremmaksi kuin miehet. Ero on vaihteleva ja suurin eroavaisuus on ammattikäyttäjien luonnollisuuden tuloksessa, jossa miehet ja naiset eroavat arvioissaan 0.14 pisteen verran. Luonnollisuuden ja ymmärrettävyyden välillä on myös selvästi havaittava ero molemmissa ryhmissä. Ymmärrettävyys on arvioitu parem- maksi jokaisessa muuttujaryhmässä, lukuun ottamatta yli 55-vuotiaita arkikäyttäjiä, jotka arvioivat puhesynteesin luonnollisuuden hiukan puhesynteesin ymmärrettävyyttä paremmaksi. Tarkastelen seuraavaksi tarkemmin luonnollisuuden ja ymmärrettävyyden alakäsitteitä molempien ryhmien tulosten kautta. 5.3.1 Luonnollisuuden ja ymmärrettävyyden alakäsitteet Luonnollisuutta mitattiin kuuntelukokemuksen, kuuntelemisen helppouden ja ihmispu- heen kaltaisuuden avulla. Taulukossa 34 on listattu nämä alakäsitteet ja niiden tulokset. Taulukko 34. Varianssianalyysi: luonnollisuuden alakäsitteet AMMATTIKÄYTTÄJÄT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus Kokonaistulos 4.08 3.76 3.71 Miehet 4.00 3.69 3.67 Naiset 4.20 3.85 3.76 Alle 35v 3.92 3.61 3.53 35-55v 4.11 3.79 3.72 Yli 55v 4.28 3.89 4.00 Hyvä engl. kieli 4.09 3.76 3.72 Huono engl. kieli 4.07 3.75 3.68 ARKIKÄYTTÄJÄT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus Kokonaistulos 3.88 3.58 3.61 Miehet 3.87 3.55 3.62 Naiset 3.89 3.63 3.61 Alle 35v 3.87 3.54 3.51 35-55v 3.89 3.64 3.77 Yli 55v 4.04 3.58 3.58 Hyvä engl. kieli 3.90 3.60 3.66 Huono engl. kieli 3.78 3.54 3.50 88 Tulokset mukailevat aiemmin esitettyjä kokonaistuloksia taulukossa 33, kaikki tulokset paitsi yksi on arvioitu paremmiksi ammattikäyttäjien ryhmässä. Ainoastaan arkikäyttä- jien 35-55-vuotiaiden ryhmä on arvioinut ihmispuheen kaltaisuuden paremmaksi kuin ammattikäyttäjien vastaava ryhmä. Tämä on kuitenkin ”poikkeus, joka vahvistaa sään- nön”. Samat johdonmukaisuudet jatkuvat myös tässä taulukossa kuin aiemmassa taulukossa 33. Naiset arvioivat puhesynteesin paremmaksi kuin miehet, ammattikäyttäjien arviointi noudattaa ikäluokkien järjestystä ja arkikäyttäjien vanhin ja nuorin ikäluokka arvioi pu- hesynteesi heikoimmaksi. Ainoa poikkeus tähän on arkikäyttäjien yli 55-vuotiaiden arvio kuuntelukokemuksesta (4.04), mikä on myös korkein tulos kaikista arkikäyttäjien tulok- sista. Englannin kielen taidon tasolla on myös vaikutusta puhesynteesin vastaanotossa, erito- ten arkikäyttäjien puolella. Ammattikäyttäjien puolella ero on minimaalinen. Selvin eroa- vaisuus, joka luonnollisuuden alakäsitteissä nousee esiin, on kuitenkin kuuntelemisen helppouden ja ihmispuheen kaltaisuuden matalat arviot. Nämä kaksi alakäsitettä on ar- vioitu heikommaksi, erityisesti kun sitä vertaa kuuntelukokemuksen tuloksiin. Nämä kaksi heikommaksi arvioitua alakäsitettä sisältävät runsaasti puutteellisen tuloksen rajan alittavia arvioita, jotka on jo 5.2 luvussa nostettu esiin. Ryhmät, joissa nämä alhaiset tu- lokset korostuvat ovat miehet, alle 35-vuotiaat ja huonon englannin kielen omaavat vas- taajat, molemmissa käyttäjäryhmissä. Sanojen ja lauseiden ymmärtäminen on luonnol- lisesti vaikeampaa tälle ryhmälle, ja näin ollen kuunteleminen vaikeutuu ja myös ihmis- puheen kaltaisuus voi olla vaikeasti arvioitavissa, jos englannin kieli on huono. Alle 35- vuotiaiden alhaiset tulokset ovat vaikeammin perusteltavissa, tämä vaatisi tarkempaa tutkimusta vastaajaryhmistä ja mahdollisia jatkohaastatteluja, jonka avulla päästäisiin tarkemmin perille, miksi nuoremman ikäluokan suhtautuminen on kriittisempää. 89 Taulukko 35. Varianssianalyysi: ymmärrettävyyden alakäsitteet AMMATTIKÄYTTÄJÄT Oikeakielisyys Informatiivisuus Kuuntelun helppous Kokonaistulos 3.97 3.99 4.16 Miehet 3.98 4.08 4.14 Naiset 3.95 4.02 4.18 Alle 35v 3.94 3.92 4.03 35-55v 3.97 4.00 4.16 Yli 55v 4.00 4.06 4.39 Hyvä engl. kieli 4.03 4.04 4.18 Huono engl. kieli 3.82 3.86 4.09 ARKIKÄYTTÄJÄT Oikeakielisyys Informatiivisuus Kuuntelun helppous Kokonaistulos 3.70 3.85 3.93 Miehet 3.58 3.85 3.94 Naiset 3.87 3.85 3.91 Alle 35v 3.71 3.91 3.87 35-55v 3.82 3.86 3.98 Yli 55v 3.42 3.58 4.00 Hyvä engl. kieli 3.77 3.92 3.95 Huono engl. kieli 3.52 3.70 3.89 Ymmärrettävyyden alakäsitteet on avattu varianssianalyysin kautta taulukossa 35. Sama punainen lanka kulkee ymmärrettävyydenkin alakäsitteiden tuloksissa, mutta muutamia eroavaisuuksia löytyy myös. Ammattikäyttäjät ovat arvioineet kokonaistulokset parem- min kuin arkikäyttäjät, arkikäyttäjien arviot ovat kuitenkin ymmärrettävyyden alakäsit- teissä korkeammat kuin luonnollisuuden alakäsitteissä. Miehet ovat arvioineet oikeakie- lisyyden ja informatiivisuuden ammattikäyttäjien puolella paremmaksi kuin naiset ja ar- kikäyttäjien osalta kuuntelun helppous on saanut paremman arvion miehiltä kuin naisilta. Kuuntelun helppous on saanut korkeimmat arviot molemmissa käyttäjäryhmissä, ja in- formaation välitys ja oikeakielisyys on myös ollut onnistunutta molemmissa ryhmissä. Ainoana poikkeuksena tähän on yli 55-vuotiaiden arkikäyttäjien ryhmä, joka on antanut selvästi poikkeavan ja alhaisen 3.58 tuloksen informatiivisuudelle ja oikeakielisyydelle. Tämä on yhteyksissä huonoon englannin kielen taitoon. Arkikäyttäjissä huonon englan- nin kielen valinneet vastaajat ovat arvioineet myös toiseksi heikoimmaksi 90 informatiivisuuden (3.70) sekä oikeakielisyyden (3.52). Kuviossa 11 kävin läpi arkikäyttä- jien englannin kielen taitoja ikäluokan mukaan ja kuten taulukossa kävi ilmi, vanhimmalla ikäluokalla on eniten myös huonon englannin kielen valinneita vastaajia, joten tämä on todennäköisin syy alhaiselle tulokselle arkikäyttäjillä. Huono englannin kielen taso on vaikuttanut myös ammattikäyttäjien tuloksiin oikeakielisyydestä sekä informatiivisuu- desta, ja nämä kaksi ovatkin heikoiten arvioidut käsitteet ammattikäyttäjien tuloksissa. Huonolla englannin kielen taidolla on näin ollen selvä vaikutus välitettävän informaation vastaanottamiseen, oli kyseessä ihmispuhe tai puhesynteesi. Kokonaisuutena puhesynteesin ymmärrettävyys on hyvällä tasolla ja se on saanut pa- remmat arviot kuin luonnollisuus. Ymmärrettävyyden arviot olivat myös enemmän tasa- painossa tuloksien perusteella, se ei sisältänyt isoja pudotuksia tuloksissa muuttujaryh- mien sisällä, lukuun ottamatta englannin kielen taidon tason aiheuttamaa pudotusta tu- loksissa. Mielenkiintoista olisikin, jos kyselyn olisi pystynyt toteuttamaan yhtä laaduk- kaalla suomen kieltä luovalla puhesynteesijärjestelmällä, miten esimerkiksi oikeakieli- syys olisi arvioitu. 5.3.2 Mies- ja naisäänen vaikutus tuloksiin Puhesynteesistä esitettiin kaksi versiota ammatti- ja arkikäyttäjille. Nämä versiot olivat puhesynteesin miesäänellä ja naisäänellä luodut puheet ohjevideolle. Käyn tässä luvussa läpi eroavaisuuksia ammatti- ja arkikäyttäjien tuloksissa, mutta koska nämä käytiin jo aiemmassa luvussa läpi, keskityn tarkemmin eroavaisuuksiin miesäänen ja naisäänen versioiden tulosten välillä. 91 Taulukko 36. Varianssianalyysi: miesäänen kokonaistulokset AMMTTIKÄYTTÄJÄT MOS Luonnollisuus Ymmärrettävyys Kokonaistulos 4.05 3.97 4.13 Miehet 4.03 3.96 4.11 Naiset 4.06 3.98 4.14 Alle 35v 3.80 3.79 3.81 35-55v 4.10 3.99 4.20 Yli 55v 4.17 4.13 4.21 Hyvä engl. kieli 4.08 3.99 4.17 Huono engl. kieli 3.95 3.91 4.00 ARKIKÄYTTÄJÄT MOS Luonnollisuus Ymmärrettävyys Kokonaistulos 3.81 3.73 3.90 Miehet 3.79 3.70 3.87 Naiset 3.85 3.77 3.94 Alle 35v 3.73 3.59 3.87 35-55v 3.92 3.86 3.99 Yli 55v 3.74 3.71 3.76 Hyvä engl. kieli 3.84 3.73 3.95 Huono engl. Kieli 3.76 3.72 3.81 Puhesynteesin miesäänen arviointien tulokset on listattu taulukossa 36. Tulokset ovat yhtä lukuun ottamatta kaikki hyväksyttävällä tasolla, ja ainoa puutteellinen tulos on arki- käyttäjien alle 35-vuotiaiden arvio luonnollisuudesta 3.59. Kokonaistulokset mukailevat aiempien lukujen tuloksia, eli arkikäyttäjien ryhmien arviointi on noin 0.20 pistettä alhai- sempi kuin ammattikäyttäjien. Samankaltaisuuksia löytyy myös muista tuloksista. Eng- lannin kielen taso vaikuttaa arviointiin, naisten tulokset ovat hieman parempia kuin miesten, ja ikäluokkien arviot ovat vaihtelevia arkikäyttäjissä, ja ammattikäyttäjissä ne ovat johdonmukaisia nuoresta vanhempaan ikäluokkaan mentäessä. Selkeä havainto miesäänen kokonaistuloksista ovat niiden korkeat arvot. Miesääni on ko- ettu paremmaksi tulosten mukaan molemmissa käyttäjäryhmissä ja tätä korostaa vain yksi puutteellinen tulos koko taulukossa. Käyn seuraavaksi läpi naisäänen vastaavat tu- lokset ja suoritan samalla vertailun puhesynteesin miesäänen tuloksiin. 92 Taulukko 37. Varianssianalyysi: naisäänen kokonaistulokset AMMATTIKÄYTTÄJÄT MOS Luonnollisuus Ymmärrettävyys Kokonaistulos 3.84 3.74 3.95 Miehet 3.83 3.68 3.98 Naiset 3.88 3.86 3.89 Alle 35v 3.84 3.62 4.06 35-55v 3.80 3.73 3.86 Yli 55v 4.05 4.00 4.10 Hyvä engl. kieli 3.85 3.71 3.99 Huono engl. kieli 3.83 3.78 3.87 ARKIKÄYTTÄJÄT MOS Luonnollisuus Ymmärrettävyys Kokonaistulos 3.70 3.65 3.75 Miehet 3.68 3.66 3.71 Naiset 3.73 3.64 3.82 Alle 35v 3.73 3.64 3.82 35-55v 3.66 3.60 3.71 Yli 55v 3.65 3.77 3.53 Hyvä engl. kieli 3.77 3.72 3.82 Huono engl. Kieli 3.56 3.52 3.61 Taulukossa 37 on listattu puhesynteesin naisäänen arvioinnin tulokset. Puhesynteesin naisäänen tuloksiin pätee hyvin pitkälti samat eroavaisuudet arkikäyttäjien ja ammatti- käyttäjien välillä kuin miesäänen tuloksissa. Suurin ero tuleekin, kun vertailee miesäänen ja naisäänen arvioinnin tuloksia, ja näissä eroavaisuuksia on paljon. Kokonaisuutena naisäänen tulokset ovat selvästi alhaisemmat kuin miesäänen tulokset. Tämä korostuu erityisesti ammattikäyttäjien MOS-kokonaistuloksessa, joka on 0.21 pistettä alhaisempi naisäänen kuin miesäänen arvioinneissa. Puutteellisten tulosten määrä on myös monin- kertainen naisäänen tuloksissa verrattuna miesäänen yhteen puutteelliseen tulokseen. Esimerkkinä tästä ovat arkikäyttäjien arviot luonnollisuudesta, jossa on pelkästään kaksi hyväksyttää tulosta, kun taas kaikki muut ovat puutteellisia tuloksiltaan naisäänen arvi- oissa. Poikkeus tähän tulee alle 35-vuotiaiden vastaajien tuloksissa. Arkikäyttäjien 35- vuotiaat ovat arvioineet luonnollisuuden paremmaksi naisäänen tuloksissa kuin miesää- nen vastaavissa. Alle 35-vuotiaat ammattikäyttäjät ovat arvioineet myös ymmärrettävyy- den sekä MOS-kokonaistuloksen paremmaksi naisäänen ryhmässä kuin miesäänen ryh- mässä. Mielenkiintoista on ollut huomata, että poikkeavat arviot ovat löytyneet 93 useimmiten juuri tästä alle 35-vuotiaiden ryhmästä. Alle 35-vuotiaat ovat kuitenkin ai- noa ryhmä, jossa tulokset ovat osittain paremmat naisäänen arvioinnin tuloksissa kuin miesäänen tuloksissa. Tärkein huomio ja eroavaisuus onkin miesäänen arvioinnin tulos- ten paremmuus verrattuna naisäänen tuloksiin. Puhesynteesi miesäänellä on selvästi pa- remmaksi arvioitu molemmissa käyttäjäryhmissä ja lähes kaikissa kategorioissa. Käyn seuraavaksi läpi tarkemmin näitä eroavaisuuksia luonnollisuuden ja ymmärrettä- vyyden alakäsitteiden kautta. Taulukko 38. Varianssianalyysi: miesäänen luonnollisuuden alakäsitteet AMMATTIKÄYTTÄJÄT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus Kokonaistulos 4.18 3.96 3.76 Miehet 4.15 3.94 3.79 Naiset 4.21 3.98 3.74 Alle 35v 4.00 3.79 3.57 35-55v 4.20 4.00 3.78 Yli 55v 4.38 4.00 4.00 Hyvä engl. kieli 4.21 3.95 3.81 Huono engl. kieli 4.11 4.00 3.61 ARKIKÄYTTÄJÄT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus Kokonaistulos 3.93 3.56 3.69 Miehet 3.86 3.52 3.71 Naiset 4.04 3.62 3.65 Alle 35v 3.81 3.35 3.62 35-55v 3.96 3.75 3.86 Yli 55v 4.07 3.57 3.50 Hyvä engl. kieli 3.91 3.55 3.73 Huono engl. kieli 3.96 3.58 3.63 Luonnollisuuden alakäsitteitä puhesynteesin miesäänen tuloksissa on avattu Taulukossa 38. Ammattikäyttäjien tulokset ovat pääosin hyvällä tasolla, ja mukana on vain kaksi puutteellista tulosta ihmispuheen kaltaisuudesta, jotka tulevat huonon englannin kielen omaavilta vastaajilta sekä alle 35-vuotiaiden vastaajaryhmältä. Arkikäyttäjissä 94 puutteellisia tuloksia on lukuisa määrä. Nämä keskittyvät kuuntelemisen helppouden sekä ihmispuheen kaltaisuuden alakäsitteisiin. Erityisesti kuuntelemisen helppous on saanut alhaisia arvioita, varsinkin verrattuna ammattikäyttäjien arvioihin vastaavista ala- käsitteistä. Mielenkiintoinen havainto on kuuntelemisen helppouden alakäsitteessä ja englannin kielen tason vastaajissa. Huonon englannin kielen valinneet ovat arvioineet kuuntelemi- sen helppouden paremmaksi kuin hyvän englannin valinneet vastaajat. Kuuntelemisen helppous keskittyykin enemmän puhesynteesin sävyyn ja miellyttävyyteen, eikä niinkään kieliopillisiin seikkoihin kuten ymmärrettävyyden kuuntelun helppous, joten tässä mie- lessä eroavaisuus on looginen. Taulukko 39. Varianssianalyysi: naisäänen luonnollisuuden alakäsitteet AMMATTIKÄYTTÄJÄT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus Kokonaistulos 3.99 3.56 3.65 Miehet 3.91 3.54 3.59 Naiset 4.17 3.63 3.79 Alle 35v 3.86 3.50 3.50 35-55v 4.00 3.54 3.65 Yli 55v 4.20 3.80 4.00 Hyvä engl. kieli 4.15 3.56 3.62 Huono engl. kieli 4.24 3.84 3.89 ARKIKÄYTTÄJÄT Kuuntelukokemus Kuuntelemisen helppous Ihmispuheen kaltaisuus Kokonaistulos 3.83 3.60 3.53 Miehet 3.88 3.57 3.52 Naiset 3.75 3.64 3.54 Alle 35v 3.82 3.66 3.45 35-55v 3.75 3.44 3.63 Yli 55v 4.00 3.60 3.70 Hyvä engl. kieli 3.90 3.65 3.60 Huono engl. kieli 3.68 3.50 3.36 95 Puhesynteesin naisäänen arvioinnin tulokset on listattu taulukossa 39. Tärkein huomio naisäänen arvioinnin luonnollisuuden alakäsitteissä on arvioiden matala taso. Ammatti- käyttäjienkin arviot on mielletty puutteellisina kuuntelukokemusta lukuun ottamatta, tämä toistuu myös arkikäyttäjissä. Mielenkiintoinen huomio on myös, että kuuntelemi- sen helppous on korkeampi naisäänen arvioinnin tuloksissa verrattuna miesäänen arvi- oinnin tuloksiin, muut arvot ovat laskeneet ja jotkin hyvinkin paljon kuten ammattikäyt- täjien arvio kuuntelemisen helppoudesta, joka on pudonnut 0.40 pistettä verrattuna miesäänen arvioinnin tuloksiin. Kuuntelemisen helppous on pudonnut myös kaikissa muuttujaryhmissä, mutta pienin pudotus on tullut huonon englannin kielen omaavien vastaajien tuloksissa. Ihmispuheen kaltaisuus on parempi huonon englannin kielen omaavien vastaajien arvioissa naisäänestä verrattuna miesäänen vastaaviin arviointiin. Englannin kielen taito ei ole, kuten aiemmin totesin, yhtä tärkeä puheen luonnollisuutta arvioitaessa, joten tämä on varmasti ainakin osasyynä tähän. Tärkein huomio kuitenkin on edelleen se, että puhesynteesin miesääni mielletään näin- kin paljon parempana kuin puhesynteesin naisääni. Tämä on ollut johdonmukainen teema kaikissa tähänastisissa tuloksissa. Esittelen seuraavaksi vielä ymmärrettävyyden alakäsitteet mies- ja naisäänen tuloksien osalta. Taulukko 40. Varianssianalyysi: miesäänen ymmärrettävyyden alakäsitteet AMMATTIKÄYTTÄJÄT Oikeakielisyys Informatiivisuus Kuuntelun helppous Kokonaistulos 3.99 4.12 4.28 Miehet 3.94 4.12 4.26 Naiset 4.02 4.12 4.29 Alle 35v 3.79 3.79 3.86 35-55v 4.06 4.19 4.35 Yli 55v 3.88 4.25 4.50 Hyvä engl. kieli 4.07 4.14 4.29 Huono engl. kieli 3.72 4.06 4.22 ARKIKÄYTTÄJÄT Oikeakielisyys Informatiivisuus Kuuntelun helppous Kokonaistulos 3.72 3.93 4.04 Miehet 3.67 3.95 4.00 Naiset 3.81 3.88 4.12 Alle 35v 3.65 3.96 4.00 35-55v 3.89 4.00 4.07 96 Yli 55v 3.50 3.71 4.07 Hyvä engl. kieli 3.80 4.00 4.05 Huono engl. kieli 3.58 3.79 4.04 Miesäänen ymmärrettävyyden arvioinnin tulokset on listattu taulukossa 40. Ammatti- käyttäjien osalta tulokset ovat hyvät ja kuuntelun helppous on saanut erinomaiset tulok- set kaikilta paitsi alle 35-vuotiaiden muuttujaryhmältä, joka on arvioinut kaikki alakäsit- teet alhaisimmin kaikista muista ammattikäyttäjien muuttujaryhmistä. Arkikäyttäjien alle 35-vuotiaat ovat tosin arvioineet informatiivisuuden ja kuuntelun helppouden sel- västi ammattikäyttäjien alle 35-vuotiaiden ryhmää paremmiksi. Tässä korostuu myös alle 35-vuotiaiden arvostelun vaihtelevuus ja erikoisuus, joka nousee esiin tässäkin taulu- kossa. Arkikäyttäjien arvioinnin tulokset ovat alhaisemmat kuin ammattikäyttäjien, mutta arki- käyttäjien tulokset ovat kuitenkin hyväksyttävällä tasolla. Arkikäyttäjien tuloksista löytyy vain kolme puutteellista tulosta ja nämä ovat alle 35-vuotiaiden, huonon englannin tai- don omaavien ja yli 55-vuotiaiden arviot oikeakielisyydestä. Oikeakielisyys on myös ala- käsitteistä heikoimmaksi arvioitu molemmissa käyttäjäryhmissä. Puhesynteesin miesää- nen arvioinnin tulokset ovat myös ymmärrettävyyden kannalta varsin positiiviset. Seu- raavaksi vertaan naisäänen tuloksia ymmärrettävyydestä miesäänen arvioinnin tuloksiin. Taulukko 41. Varianssianalyysi: naisäänen ymmärrettävyyden alakäsitteet AMMATTIKÄYTTÄJÄT Oikeakielisyys Informatiivisuus Kuuntelun helppous Kokonaistulos 3.95 3.86 4.04 Miehet 4.00 3.87 4.06 Naiset 3.83 3.83 4.00 Alle 35v 4.05 4.00 4.14 35-55v 3.87 3.78 3.93 Yli 55v 4.10 3.90 4.30 Hyvä engl. kieli 3.98 3.92 4.06 Huono engl. kieli 3.88 3.73 4.00 ARKIKÄYTTÄJÄT Oikeakielisyys Informatiivisuus Kuuntelun helppous Kokonaistulos 3.67 3.77 3.81 Miehet 3.50 3.74 3.88 Naiset 3.93 3.82 3.71 Alle 35v 3.75 3.91 3.80 97 35-55v 3.69 3.63 3.81 Yli 55v 3.30 3.40 3.90 Hyvä engl. kieli 3.75 3.85 3.85 Huono engl. kieli 3.50 3.59 3.73 Puhesynteesin naisäänen arvioinnin tulokset ymmärrettävyyden alakäsitteistä on listattu Taulukkoon 41. Ammattikäyttäjien ja arkikäyttäjien tulokset eroavat siinä, että ammatti- käyttäjien tulokset ovat selvästi korkeammat oikeakielisyydessä ja kuuntelun helppou- dessa ja jokseenkin korkeammat informatiivisuudessa. Selkein yksittäinen eroavaisuus muuttujaryhmistä löytyy arkikäyttäjien yli 55-vuotiaden oikeakielisyyden tuloksesta 3.30 verrattuna ammattikäyttäjien vastaavan ryhmän vastaavaan tulokseen 4.10. Päinvastai- nen ja hieman pienempi eroavaisuus on naisten arvioinneissa oikeakielisyydestä. Arki- käyttäjien naisten tulos on jonkin verran korkeampi kuin ammattikäyttäjien vastaava tu- los. Englannin kielen merkitys korostuu molemmissa käyttäjäryhmissä, hyvän englannin kielen omaavat vastaajat ovat arvioineet kaikki kolme ymmärrettävyyden alakäsitettä huonon englannin kielen taidon omaavia korkeammin. Tässä on yksi selkeä ja jatkuva eroavaisuus luonnollisuuden ja ymmärrettävyyden alakäsitteiden tuloksissa. Miesäänen arvioinnin tuloksiin verrattuna naisäänen tulokset ovat matalammalla tasolla merkittävästi informatiivisuuden ja kuuntelun helppouden alakäsitteissä ja jonkin verran myös oikeakielisyyden alakäsitteen tuloksissa, molemmissa käyttäjäryhmissä. Oikeakie- lisyyden heikompi arviointi miesäänen tuloksista johtuu alle 35-vuotiaiden ja yli 55-vuo- tiaiden ammattikäyttäjien naisäänen arvioista, jotka he arvioivat paremmaksi kuin am- mattikäyttäjien vastaavat arviot. Ammattikäyttäjien alle 35-vuotiaiden ryhmä arvioi myös naisäänen informatiivisuuden sekä kuuntelun helppouden selvästi paremmin kuin vastaava arkikäyttäjien ryhmä. Nämä ovat myös selvästi poikkeavat tulokset verrattuna muihin muuttujaryhmiin, joissa aiemmin esitettyjä muuttujaryhmiä lukuun ottamatta kaikissa tulos on ollut heikompi verrattaessa miesäänen tuloksia naisäänen tuloksiin. Ymmärrettävyyden tulokset todistivat sen, että puhesynteesin miesääni sai selvästi nais- ääntä paremmat arviot ammatti- ja arkikäyttäjien toimesta. Tämä nousi esiin, jokaisessa taulukossa ja vertailussa, muutamia yksittäisiä poikkeuksia lukuun ottamatta. 98 Puhesynteesin miesääni todettiin kokonaistuloksiltaan ja erityisesti informatiivisuudessa ja kuuntelemisen helppoudessa naisääntä paremmaksi. Esittelen seuraavassa luvussa analyysin tulosten pohjalta tehdyt pohdinnat ja johtopäätökset tuleville askelille. 99 6 Pohdinta Tutkielman tavoitteena oli mitata ammatti- ja arkikäyttäjien kokemuksia puhesynteesistä teknisellä ohjevideolla. Näitä kokemuksia mitattiin luonnollisuuden ja ymmärrettävyy- den pääkäsitteillä sekä näitä tarkentavilla alakäsitteillä. Tavoitteena oli löytää vastauksia myös siihen, mitä eroavaisuuksia ammatti- ja arkikäyttäjien tulosten välillä oli ja siihen, miten muuttujat kuten ikä, sukupuoli, englannin kielen taito tai puhesynteesin mies- tai naisääni vaikuttivat puhesynteesin kokemiseen. Kokemusten perusteella pyrittiin saa- maan selville, onko puhesynteesin käyttöönotto ohjevideoille mahdollista. Tavoitteeseen pyrittiin pääsemään kyselytutkimuksen avulla, jolla ammatti- ja arkikäyt- täjien ryhmät arvioivat puhesynteesiä. Kyselyssä vastaajia pyydettiin katsomaan pu- hesynteesiä sisältävä ohjevideo mies- tai naisäänellä, jonka jälkeen heitä pyydettiin arvi- oimaan kokemuksensa puhesynteesistä kahdentoista kysymyksen avulla. Näistä tulok- sista laskettiin keskiarvollinen tulos kaikille muuttujille, luonnollisuuden ja ymmärrettä- vyyden pää- ja alakäsitteille sekä erikseen puhesynteesin mies- ja naisäänelle. Tulokset listattiin kuvioilla ja taulukoilla ja niistä suoritettiin varianssianalyysi, jolla pyrittiin löytä- mään samankaltaisuuksia ja eroavaisuuksia muuttujien ja käsitteiden välillä. Puhesynteesin luonnollisuus ja ymmärrettävyys koettiin pääosin positiivisesti. Ymmär- rettävyys oli selkeästi paremmaksi koettu näistä kahdesta, ja se sai erinomaisia tuloksia informatiivisuudesta sekä kuuntelun helppoudesta. Puhesynteesin luonnollisuus koettiin hyväksyttävänä, mutta sen tuloksissa oli selvästi enemmän vaihtelua ja kritiikkiä. Erityi- sesti puhesynteesin ihmispuheen kaltaisuus ja oikeakielisyys saivat heikompia arvioita. Ammattikäyttäjät arvioivat puhesynteesin kokonaisvaltaisesti paremmaksi kuin arkikäyt- täjät. Erityisesti informatiivisuus, kuuntelukokemuksen ja kuuntelemisen helppouden kä- sitteet oli arvioitu paremmaksi ammattikäyttäjien arvioinneissa. Tähän suurimpana syynä on ammattikäyttäjien alan ja sen termistön tuntemus, mikä helpottaa huomatta- vasti informaation vastaanottoa ja kuuntelemista. Muita selkeitä ja johdonmukaisia eroja ei löytynyt ammattikäyttäjien ja arkikäyttäjien väliltä. 100 Naiset arvioivat puhesynteesin paremmaksi kuin miehet molemmissa käyttäjäryhmissä. Ammattikäyttäjissä myös vanhemmat ikäluokat kokivat puhesynteesin parempana kuin nuorin ikäluokka. Ammattikäyttäjissä nuorin ikäluokka oli kriittisin arvioinneissaan. To- dennäköinen syy tähän kriittisyyteen on nuorten kattava mediakokemus. Alle 35-vuoti- aiden ikäluokka on ollut kosketuksessa median ja internetin kanssa käytännössä koko elämänsä ajan ja näin heille on kehittynyt parempi, ja kriittisempi medialukutaito. Arki- käyttäjissä ikäluokkien tulokset olivat hyvin vaihtelevat, ja johdonmukaista yhtäläisyyttä ei löytynyt tuloksista. Englannin kielen taito vaikutti ymmärrettävyyteen huomattavasti molemmissa käyttäjä- ryhmissä. Hyvä englannin kielen taito helpotti ymmärtämistä, kun taas huono englannin kielen taito vaikeutti sitä. Puhesynteesin luonnollisuudessa englannin kielen taidolla ei ollut vastaavanlaista merkitystä. Nuorin ikäluokka arvioi englannin kielen taitonsa par- haimmaksi ja vanhin ikäluokka heikoimmaksi. Puhesynteesin äänellä oli merkittävä ero mies- ja naisäänen välillä. Puhesynteesin mies- ääni koettiin parempana valtaosissa muuttujia sekä luonnollisuuden että ymmärrettä- vyyden käsitteissä. Miesääni todettiin erityisesti informaation välitykseltään paremmaksi, kuuntelukokemus oli myös mieluisampi vastaajien mielestä ja sitä oli molempien käyttä- järyhmien vastausten perusteella myös helpompi kuunnella. Aiemman Deep learning-puhesynteesijärjestelmän tutkimuksen perusteella (ks. Wave- net: A Generative Model for Raw Audio 2016) ammattikäyttäjien tulokset ovat hyvällä tasolla, mutta arkikäyttäjien tulokset jäävät selvästi aiemman tutkimuksen tulosten pe- rään. Tutkielman tulosten perusteella voidaan sanoa, että ammattikäyttäjille puhesyn- teesin miesääni on varteenotettava vaihtoehto. Arkikäyttäjille puhesynteesi vaikuttaa olevan vielä vaikeasti lähestyttävä. Tämän tutkielman perusteella suosittelen puhesynteesin käyttöönottoa teknisiin ohjevi- deoihin ammattikäyttäjille. Arkikäyttäjille suunnattu käyttöönotto on mahdollista, mutta 101 tarkentava laadullinen jatkotutkimus siitä, miksi sen vastaanotto on vaikeampaa, olisi ai- heellinen ennen käyttöönottoa. Jatkotutkimuksessa voisi keskittyä siihen, mitä tunteita ja ajatuksia puhesynteesi tarkalleen herättää vastaanottajassa eri konteksteissa. Vaikut- taako esimerkiksi alusta tai väline, jossa puhesynteesiä käytetään sen vastaanottamiseen. Jatkotutkimus voitaisiin suorittaa haastatteluilla, joilla saataisiin tarkempaa tietoa vas- taanottajien tuntemuksista ja ajatuksista puhesynteesin käytöstä. Tutkimukseni tai vas- taavanlaisen tutkimuksen suorittaminen suomenkielisellä puhesynteesillä, on myös yksi varteenotettava jatkotutkimuskohde. 102 Lähteet Aaltonen, J. (2018). Käsikirjoittajan työkalut. Audiovisuaalisen käsikirjoituksen tekijän opas. Tampere: Suomen Yliopistopaino Oy. Akilandeswari, V., Dinesh Kumar A., Philomin Freeda A., & Niranchan Kumar S. (2015). Elements of Effective Communication. New Media and Mass Communication, 37, 44-45. Albers, M. J. (2012). Human-information Interaction and Technical Communication: Concepts and Frameworks. Pennsylvania: Hershey, PA: IGI-Global. Al-Fedaghi, S. (2012). A Conceptual Foundation for the Shannon-Weaver Model of Communication. International Journal of Soft Computing, 7 (1), 12-19. DOI: 10.3923/ijscomp.2012.12.19 Amazon Web Services (2019). Amazon Polly – Turn text into lifelike speech using deep learning. Noudettu 2019-04-25 osoitteesta https://aws.amazon.com/polly/ Baccarani, C. & Bonfanti, A. (2015). Effective public speaking: a conceptual framework in the corporate-communication field. Corporate Communications: An International Journal, 20 (3), 375-390. https://doi.org/10.1108/CCIJ-04-2014-0025 Bacon, H. (2000). Audiovisuaalisen kerronnan teoria. Tampere: Tammer-Paino. Bhavik, D., Siddhi D. & Verghese, J. M. (2017). Survey on Methods of Text to Speech Syn thesis. International Journal of Computer Applications, 165 (6), 26-30. DOI:10.5120/ijca2017913891 Bunnell, H. T., Jreige, C. & Patel, R. (2009). VocaliD: Personalizing text-to-speech synthesis 103 for individuals with severe speech impairment. ASSETS'09 - Proceedings of the 11th International ACM SIGACCESS. Esitetty Conference on Computers and Acces- sibility. Pittsburgh: ACM New York, 259-260. DOI: 10.1145/1639642.1639704 Chung, Y., Wang, Y., Hsu, W., Zhang, Y. & Skerry, R. (2018). Semi-Supervised Training for Improving Data Efficiency in End-to-End Speech Synthesis. Cornell University: arXiv preprint arXiv:1808.10128, 1-5. DOI: https://arxiv.org/pdf/1808.10128.pdf Evans, M. & Walton, T. (2018). The role of human influence factors on overall listening experience. Quality and User Experience 3(1). https://doi.org/10.1007/s41233- 017-0015-4 De, P. R. (2016). The arithmetic mean - Geometric mean - Harmonic mean: Inequalities and a spectrum of applications. Resonance, 21 (12), 1119-1133. https://doi.org/10.1007/s12045-016-0423-4 Deng, L. & Yu, D. (2012). Deep Learning: Methods and Applications. Now Publishers, 7(3- 4). http://dx.doi.org/10.1561/2000000039 Deng, L. & Dong, Y. (2014). Deep Learning: Methods and Applications. Foundations and Trends in Signal Processing, 7(3-4). DOI: 10.1561/2000000039 Dieleman, S., Van den Oord, A., Graves, A., Senior, A., Zen, H., Simonyan, K., Karukguaclu, K., Kalchbrenner, N. & Vinyals, Oriol (2016). Wavenet: A Generative Model for Raw Audio. London: Google DeepMind. DOI: https://arxiv.org/pdf/1609.03499.pdf Fiske, J. (1990). Introduction to Communication Studies. Studies in Culture and Commu nication. (2nd edition). London: Routledge. Flanagan, J. (1972). Speech Synthesis. Teoksessa Flanagan, J. (Toim.), Speech Analysis, 104 Synthesis, and Perception. Kommunikation und Kybernetik in Einzeldarstellugen, 3, (204-276). Berlin-Heidelberg-New York: Springer-Verlag. https://doi.org/10.1007/978-3-662-01562-9_6 Hande, S. S. (2014). A Review on Speech Synthesis an Artificial Voice Production. Inter national Journal of Advanced Research in Electrical, Electroni http://www.ijar- eeie.com/upload/2014/march/25_AReview.pdfcs and Instrumentation Engineer- ing, 3 (3), 2278-8875. Heikkilä, T. (2014). Tilastollinen tutkimus. Helsinki: Edita Publishing Oy. Herre, J. & Schoeffler, M. (2014). Towards a Listener Model for Predicting the Overall Listening Experience. Proceedings of the 9th Audio Mostly: A Conference on Inter- action With Sound, 11. DOI: 10.1145/2636879.2636892 Huang, G. & Lu, Y. (2014). Application of DSP Speech Synthesis System on Service Robots. Institute of Electrical and Electronics Engineer. Esitetty CACS International Auto- matic Control Conference (CACS 2014). Taiwan. Hundleby, M. & Allen, J. (2010). Assessment in Technical and Professional Communica tion. Teoksessa Baywood's Technical Communications Series. Routledge: Baywood Publishing Company, Inc. International Telecommunication Union (1994). ITU-T Recommendation P.85: A method for subjective performance assessment of the quality of speech voice output de- vices. Switzerland: International Telecommunication Union. https://www.itu.int/rec/T-REC-P.85-199406-I/en JMC Study Hub (2019). Shannon and Weaver Model of Communication. JMC Study Hub: 105 Hub of Journalism and Mass Communication. Noudettu 2019-04-04 https://jmc- studyhub.com/shannon-and-weaver-model-of-communication-mass-communi- cation/ Kananen, J. (2014). Verkkotutkimus opinnäytetyönä. Laadullisen ja määrällisen verkko tutkimuksen opas. Jyväskylä: Juvenes Print. Le Maguer, S. (2018). Speech syntesis evaluation. Germany: Saarland university. Noudettu 2019-10-22 http://www.coli.uni-saarland.de/~slemaguer/teaching/2017-2018/tts_evalua- tion/tts_evaluation.pdf Lehtonen, M. (2007). Ruumis, kieli ja toiminta - Ajatuksia audiovisuaalisten tekstien mul- timodaalisuudesta. Teoksessa Oittinen, Riitta & Tuominen, Tiina (Toim.) Olennai- sen äärellä. Johdatus audiovisuaaliseen kääntämiseen. Tampere: Tampereen yli- opistopaino Oy. Mada, S. & Saftoiu, R. (2012). Professional Communication across Languages and Cul tures. Dialogue Studies, 17 (2012). https://doi.org/10.1075/ds.17 Maijala, P., Nordlund, K. & Virolainen, K. (1987). Kodinkoneiden käyttöohjeet ja varoitus merkinnät. Helsinki: Elinkeinohallitus. Medeiros, J. (2018). Wired UK: How Intel Gave Stephen Hawking a voice. Noudettu 2019-10-10 https://www.wired.com/2015/01/intel-gave-stephen-hawking-voice/ Mehler, A., Romary, L. & Gibbon, D. (2012). Handbook of Technical Communication. France: De Gruyter Mouton. https://hal.inria.fr/hal-00786386 Mouton. 106 Oras Ltd. (2019). Noudettu 2019-06-25 Saatavilla: https://www.oras.fi Pöyhönen, M. & Tiusanen, A. (1991). Käyttöohje on osa tuotetta. Käyttöohjeen laa tijan opas. Helsinki: Pohjola-yhtiöt. Rui, R. & Zhenjiang, M. (2008). Emotional speech synthesis and its application to perva sive E-learning. Esitetty Ubi-Media Computing, 2008 First IEEE International Con- ference bi-Media Computing. DOI: http://dx.doi.org/10.1109/UMEDIA.2008.4570930 Schnurr, S. (2013). Exploring Professional Communication: Language in Action. Milton Park Abingdon, Oxon; New York: Routledge. Streijl, R. C., Winkler, S. & Hands, D. S. (2016). Mean opinion score (MOS) revisited: meth ods and applications, limitations and alternatives. Multimedia Systems, 22 (2), 213-227. DOI:10.1007/s00530-014-0446-1 Suomen teknisen viestinnän yhdistys (2019). Mitä on tekninen viestintä? Noudettu 2019-09-20 https://www.stvy.fi/tekninen-viestinta/ Taylor, P. (2009). Text-to-speech-synthesis. Cambridge: Cambridge University Press. Tung, L. (2018). Google's human-sounding AI to answer calls at contact centers. ZD Net. Noudettu 2019-10-05 https://www.zdnet.com/article/googles-human-soun- ding-ai-to-answer-calls-at-contact-centers/ Tähtinen, J., Laakkonen, E. & Broberg, M. (2011). Tilastollisen aineiston käsittelyn ja tul kinnan perusteita. Teoksessa Turun yliopiston kasvatustieteiden tiedekunnan jul- kaisuja C:20. Turku: Painosalama Oy. 107 Valli, R. (2015). Johdatus tilastolliseen tutkimukseen. Jyväskylä: PS-kustannus. Vilkka, H. (2007). Tutki ja mittaa. Määrällisen tutkimuksen perusteet. Helsinki: Kustannusosakeyhtiö Tammi. Viswanathan, M. & Viswanathan, M. (2005). Measuring speech quality for text-to-speech systems: development and assessment of a modified mean opinion score (MOS) scale. Computer Speech & Language, 19 (1), 55-38. DOI: 10.1016/j.csl.2003.12.001 Vehkalahti, K. (2014). Kyselytutkimuksen mittarit ja menetelmät. Helsinki: Finn Lectura Ab. 108 Liitteet Liite 1. Kyselylomake : Arkikäyttäjät Sukupuoli * Mies Nainen Ikä * __vuotta Englannin kielen taito * Huono Välttävä Tyydyttävä Kiitettävä Erinomainen Onko sinulla aiempaa kokemusta hanojen asentamisesta tai huoltamisesta? * kyllä » jatka sivulle päätä kysely ei Katso video äänen kanssa ja vastaa alla oleviin kysymyksiin puhesynteesistä. 1. Miten luokittelisit puhesynteesin äänen miellyttävyyden? * Erittäin huono 109 Huono Kelvollinen Hyvä Erinomainen 2. Minkä arvoasteikon valitsisit puhesynteesin kieliopillisuudesta? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 3. Miten arvioisit puhesynteesin kuuntelun helppoutta? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 4. Miten arvioisit puhesynteesin äänen sointuvuutta ihmispuheeseen verrattuna? * Erittäin huono Huono 110 Kelvollinen Hyvä Erinomainen 5. Minkä arvosanan antaisit puhesynteesin äänen ohjeistavuudelle? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 6. Miten arvioisit puhesynteesin kuuntelukokemuksena? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 7. Minkä arvosanan antaisit puhesynteesin äänen informatiivisuudelle? * Erittäin huono Huono Kelvollinen Hyvä 111 Erinomainen 8. Miten arvioisit puhesynteesin äänen ihmispuheeseen verrattuna? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 9. Minkä arvosanan antaisit puhesynteesin ja huoltovideon yhteensopivuudelle? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 10. Miten arvioisit puhesynteesin puheen rytmityksen? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 112 11. Miten arvioit puhesynteesin äänenlaatua ja sen selkeyttä? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 12. Arvioi puhesynteesin puhumisen lauserakennetta ja oikeiden sanojen painotusta? * Erittäin huono Huono Kelvollinen Hyvä Erinomainen 113 Liite 2. Kyselylomake: Ammattikäyttäjät Täytä alla olevat tiedot. 1. Sukupuoli Mies Nainen 2. Ikä Enter your answer 3. Englannin kielen taito Huono Välttävä Tyydyttävä Kiitettävä Erinomainen Katso video äänen kanssa ja vastaa alla oleviin kysymyksiin puhesynteesistä. 4. Miten luokittelisit puhesynteesin äänen miellyttävyyden? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 5. Minkä arvoasteikon valitsisit puhesynteesin kieliopillisuudesta? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 6. Miten arvioisit puhesynteesin kuuntelun helppoutta? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 7. Miten arvioisit puhesynteesin äänen sointuvuutta ihmispuheeseen verrattuna? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 8. Minkä arvosanan antaisit puhesynteesin äänen ohjeistavuudelle? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 9. Miten arvioisit puhesynteesin kuuntelukokemuksena? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 10. Minkä arvosanan antaisit puhesynteesin äänen informatiivisuudelle? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 114 11. Miten arvioisit puhesynteesin äänen ihmispuheeseen verrattuna? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 12. Minkä arvosanan antaisit puhesynteesin ja huoltovideon yhteensopivuudelle? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 13. Miten arvioisit puhesynteesin puheen rytmityksen? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 14. Miten arvioit puhesynteesin äänenlaatua ja sen selkeyttä? Erittäin huono Huono Kelvollinen Hyvä Erinomainen 15. Arvioi puhesynteesin puhumisen lauserakennetta ja oikeiden sanojen painotusta? Erittäin huono Huono Kelvollinen Hyvä Erinomainen