Investigating Financial Drivers of ESG Scores : An Interpretable Machine Learning Approach
Pysyvä osoite
Kuvaus
Growing interest in sustainable finance has increased the demand for transparent and reproducible assessments of corporate sustainability. The study has been grounded in the idea that ESG ratings reflect both sustainability-related practices and potentially the economic capacity to disclose and implement them. This thesis examined the extent to which financial information explains variation in ESG ratings. The objective has been to assess how far ESG out-comes are predictable from firm-level characteristics, to identify the financial factors most consistently associated with them and to analyse the underlying structure of these relationships.
The empirical analysis was based on data from firms included in the STOXX Europe 600 index for the period 2014–2023, obtained from the London Stock Exchange Group database. The dataset contained firm-level annual observations, and the dependent variables consisted of the overall ESG score and its environmental, social, and governance pillars. The independent variables comprised profitability, leverage, liquidity, efficiency, and valuation ratios, together with firm size, industry, and year identifiers.
Methods combined supervised machine learning with model-agnostic interpretability. Model evaluation relied on standard regression metrics, and explainable artificial intelligence methods.
The results indicated that firm-level financial characteristics explain a substantial portion of cross-sectional variation in ESG assessments. Nonlinear models outperformed linear alternatives, demonstrating that relationships between financial and sustainability indicators are complex and potentially interactive. The analysis highlighted firm size, operational efficiency, and capital structure as key predictors of higher ESG scores, whereas high profitability margins and liquidity were not systematically associated with higher assessed sustainability.
The findings suggested that financial structure had influence over the measured sustainability, implying that ESG scores can partly reflect underlying economic fundamentals in addition to non-financial performance. The study showed that interpretable machine learning offered a practical framework for understanding these linkages, but also that financial data alone could not fully account for the multidimensional nature of sustainability. Future research was encouraged to integrate non-financial and textual data, apply longitudinal designs, and examine regulatory developments to better capture the dynamic relationship between corporate finance and sustainability outcomes.
Kestävän rahoituksen kasvava merkitys on lisännyt tarvetta läpinäkyville ja toistettaville yritysvastuuta kuvaaville arviointitavoille. Tutkimus on perustunut oletukseen, että ESG-arvosanat heijastavat sekä vastuullisuuskäytäntöjä, sekä mahdollisesti niiden raportointiin ja toimeenpanoon tarvittavaa taloudellista kapasiteettia. Tutkimuksen tavoitteena on ollut arvioida, kuinka pitkälle ESG-tuloksia voidaan ennustaa yritystason taloudellisista tunnusluvuista, tunnistaa mitkä taloudelliset mittarit linkittyvät näihin vahvimmin, ja analysoida näiden suhteiden rakenteellista luonnetta.
Empiirinen analyysi koostui STOXX Europe 600 -indeksin yrityksistä vuosilta 2014–2023 koottuun aineistoon, joka on peräisin London Stock Exchange Groupin tietokannasta. Aineisto koostui yritystason havainnoista vuosittain; riippuvina muuttujina olivat yritysten vastuullisuuspisteytykset, ja selittävinä muuttujina olivat kannattavuutta, velkaantuneisuutta, maksuvalmiutta, tehokkuutta ja arvostustasoa kuvaavat suhdeluvut, sekä yrityksen koko, toimialaluokitus ja vuositunniste.
Menetelmissä yhdistettiin ohjattua koneoppimista malliriippumattomaan tulkittavuuteen. Mallien arviointi perustui standardoituihin regressiometriikoihin ja tuloksia selitettäviin tekoälymenetelmiin.
Tulokset osoittivat, että yritystason taloudelliset ominaisuudet selittävät merkittävän osan ESG-arviointien poikkileikkausvaihtelusta. Epälineaaristen mallien todettiin suoriutuvan lineaarisia vaihtoehtoja paremmin, osoittaen, että taloudellisten ja kestävyysindikaattorien väliset suhteet olivat monimutkaisia ja mahdollisesti vuorovaikutteisia. Analyysi korosti yrityksen kokoa, toiminnan tehokkuutta ja pääomarakennetta ESG-pisteiden keskeisinä ennustajina, kun taas korkeat kannattavuusmarginaalit ja likviditeetti eivät olleet systemaattisesti yhteydessä korkeampaan arvioituun vastuullisuustasoon.
Tulokset osoittivat, että rahoitusrakenne vaikutti mitattuun vastuullisuuteen, mikä viittasi siihen, että ESG-pisteet heijastivat osittain taustalla olevia talouden perustekijöitä ei-taloudellisen informaation lisäksi. Tutkimus osoitti, että tulkittava koneoppiminen tarjosi käytännöllisen viitekehyksen näiden yhteyksien ymmärtämiseen, mutta pelkkä taloudellinen informaatio ei riitä selittämään kestävyyden luonnetta. Jatkotutkimuksiksi suositeltiin ei-taloudellisen ja tekstimuotoisen aineiston integrointia, pitkittäisasetelmien hyödyntämistä sekä sääntelykehitysten tarkastelua, jotta yritysrahoituksen ja kestävyystulosten dynaamista suhdetta voidaan kuvata täsmällisemmin.
