Quality of Machine Translations by Google Translate, Microsoft Bing Translator and iTranslate4

dc.contributor.authorLinna, Matti
dc.contributor.facultyfi=Filosofinen tiedekunta|en=Faculty of Philosophy|
dc.contributor.organizationVaasan yliopisto
dc.date.accessioned2013-03-01
dc.date.accessioned2018-04-30T13:43:33Z
dc.date.accessioned2025-06-25T15:16:33Z
dc.date.available2013-04-09
dc.date.available2018-04-30T13:43:33Z
dc.date.issued2013
dc.description.abstractTässä tutkimuksessa on tavoitteena vertailla kolmen konekääntimen tekemien käännösten laatua. Mukaan tutkimukseen valittiin konekääntimet Google Translate, Microsoft Bing ja iTranslate4. Tutkimuksen ensisijaisena tarkoituksena on selvittää, mikä valituista järjestelmistä toimii parhaiten käännettäessä suomen kielestä englannin kielelle. Tutkimuksen alussa asetettiin oletushypoteesiksi, että iTranslate4-konekäännin tulisi tekemään muita konekääntimiä vähemmän virheitä, etunaan suomalainen kehitystausta. Tutkimuksen toisena tarkoituksena oli selvittää, mikä tutkimusmateriaalin kolmesta tekstityypistä on haastavin vertailun konekääntimille. Oletuksena oli, että mitä pidempi teksti, sitä suurempi virheprosentti ja täten ajankohtaisten tapahtumien tekstit osoittautuisivat haastavimmiksi, koska ne olivat pisimpiä valituista teksteistä. Englannin kielelle käännettävä suomenkielinen tutkimusmateriaali otettiin Vaasan yliopiston internet-sivuilta, joilta tutkimukseen valittiin sosiologian ja venäjän kielen opintojen esittelytekstit. Materiaalina käytettiin tämän lisäksi kahta uutisartikkelia, jotka valittiin Pohjalaisen ja Uusisuomen internet-sivuilta, sekä kahta ajankohtaisten tapahtumien kuvausta, joista toinen otettiin koripallojoukkue Vaasan Salaman ja toinen harrastuskerho Waasa Snowmobilen internet-sivustoilta. Käännösten laadun arviointi perustuu Maarit Koposen vuonna 2010 laatimaan virheanalyysiin, jossa käännöksistä etsittiin käsitevirheitä, lajitellen virheet neljään eri kategoriaan: poisjätetyt-, lisätyt-, väärin käännetyt-, sekä kääntämättömät käsitevirheet. Tässä vertailussa vähiten kaikkia neljän eri tyypin käsitevirhettä yhteensä tehnyt konekäännin todettiin vertailun parhaaksi konekääntimeksi ja kaikkien virhetyyppien merkitystä pidettiin yhtä suurena. Tutkimustulokset osoittavat, että suomalaisen Sunda Systems Oy:n sääntöihin perustuvaa tekniikkaa (RBMT) käyttävä iTranslate4-konekäännin teki vähemmän virheitä kuin statistiseen (SMT) konekäännökseen perustuva Google Translate, joka puolestaan suoriutui paremmin kuin vertailun viimeiseksi jäänyt statistinen Microsoft Bing Translator -konekäännin. Tekstityypeistä vaikeimmin käännettäviksi osoittautuivat uutisartikkelit, joiden käännökset sisälsivät prosentuaalisesti eniten käsitevirheitä. Pidempien tekstien todettiin yleensä vaikuttavan käännösten laatuun negatiivisesti, vaikkeivät vertailun pisimmät tekstit osoittautuneetkaan aina haastavimmiksi.
dc.description.notificationfi=Opinnäytetyö kokotekstinä PDF-muodossa.|en=Thesis fulltext in PDF format.|sv=Lärdomsprov tillgängligt som fulltext i PDF-format|
dc.format.bitstreamtrue
dc.format.extent73
dc.identifier.olddbid2819
dc.identifier.oldhandle10024/2771
dc.identifier.urihttps://osuva.uwasa.fi/handle/11111/6054
dc.language.isoeng
dc.rightsCC BY-NC-ND 4.0
dc.source.identifierhttps://osuva.uwasa.fi/handle/10024/2771
dc.subjectmachine translation
dc.subjectmachine translation quality evaluation
dc.subjecterror analysis
dc.subject.studyfi=Englannin kieli|en=English language|
dc.titleQuality of Machine Translations by Google Translate, Microsoft Bing Translator and iTranslate4
dc.type.ontasotfi=Pro gradu - tutkielma |en=Master's thesis|sv=Pro gradu -avhandling|

Tiedostot

Näytetään 1 - 1 / 1
Ladataan...
Name:
osuva_5221.pdf
Size:
730.52 KB
Format:
Adobe Portable Document Format