Predicting a Stock Market Correction : Evidence from the S&P 500 Index
Keskinen, Elias Aleksanteri (2024-01-12)
Keskinen, Elias Aleksanteri
12.01.2024
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi-fe202401122611
https://urn.fi/URN:NBN:fi-fe202401122611
Tiivistelmä
Tämän gradun keskeisenä pyrkimyksenä on syventää ymmärrystä siitä, miten julkisesti saatavilla oleva informaatio vaikuttaa osakemarkkinoiden hinnoitteluun. Tutkimus pyrkii paljastamaan mahdollisia epätehokkuuksia informaation hinnoittelussa sekä tarkastelemaan huolellisesti eri muuttujien käyttäytymistä epävakaissa markkinaolosuhteissa. Uuden informaation omaksumisen nopeus liittyy olennaisesti moniin talouden osa-alueisiin, vaikuttaen akateemiseen tutkimukseen, yritysten strategioihin, kaupankäyntipäätöksiin ja markkinoiden sääntelykehyksiin.
Tämä tutkimus käyttää logistista regressiomallia, jonka tavoitteena on ennustaa tulevia markkinakorjausliikkeitä S&P 500-indeksimarkkinassa. Tutkimusaineisto kattaa päivittäisen ajanjakson tammikuusta 2019 lokakuuhun 2022. Aineiston riippumattomia muuttujina toimii erilaisia laajasti tutkittuja talouden sekä optiomarkkinoiden tunnuslukuja tai mittareita. Tutkimuksessa käytetään kolmea eri mallia, joissa binaarinen riippumaton muuttuja osoittaa markkinoiden korjausliikkeen, kun markkinoiden arvonlasku ylittää joko 3 %, 4 % tai 5 %.
Nämä mallit osoittavat merkittävää ennustuskykyä tuleville negatiivisille osaketuotoille, ennustaen negatiiviset tuotot oikein erinomaisella menestyksellä. Mallit hylkäävät tilastollisesti merkittävästi nollahypoteesin "muuttujilla aikaan t ei ole vaikutusta laskun todennäköisyyteen aikaan t+1". Tilastollisesti merkittävimmät muuttujat ovat Bond-Stock Earnings Yield Differential, Volatility smirk sekä Open Interest Difference.
Tutkimuksessa käytetyn kolmen mallin osalta TED Spread, Bid-Offer Spread, Term Spread, Baltic Dry Index ja S&P GSCI Commodity Index -muuttujat eivät osoita johdonmukaista tilastollista merkitsevyyttä. Näin ollen niiden kykyyn indikoida markkinoiden tulevaa arvostustason muutosta tulisi suhtautua kriittisesti. Lopuksi tutkimuksessa testataan mallin kykyä suoriutua oikeissa markkinaolosuhteissa, datalla, jota malli ei ole ennen kohdannut. Menestynein malli onnistui tarkasteluajanjaksolla ennustamaan oikein merkittävän määrän markkinan korjausliikkeistä. Täten, malli ennakoi markkinan suuntaa paremmin kuin sattumanvarainen arvaus. Tämä todistaa, että markkinoilla on yhä epätehokkuuksia, erityisesti sen suhteen, että informaatio hinnoitellaan ensin optiomarkkinoilla ja viiveellä osakemarkkinoilla. The fundamental pursuit of this thesis is to understand how publicly available information is incorporated into asset prices. The objective is to identify potential inefficiencies within this process and the markets themselves while also meticulously examining how different variables behave in turbulent market conditions. The pace of information absorption impacts all aspects of the financial landscape, influencing academic research, corporate strategies, trading decisions, and regulatory frameworks.
This study utilizes a logistic regression model to forecast imminent market correction movements in the S&P 500 index using a daily dataset that spans from January 2019 to October 2022. A selection of well-researched financial, macroeconomic and option metric indicators serve as independent variables. The research establishes three distinct models, each with a binary dependent variable that designates the occurrence of a crash when market drawdown exceeds either 3%, 4%, or 5%.
These models demonstrate a substantial predictive power for future negative equity returns, predicting negative instances correctly over 77% of the time with in-sample data while statistically significantly rejecting the null hypothesis "predictors at time t have no effect on the likelihood of a crash at time t+1". The significant predictive power is displayed by the Bond-Stock Earnings Yield Differential, Volatility Smirk and Open Interest Difference predictors.
Across the three models, the TED Spread, Bid-Offer Spread, Term Spread, Baltic Dry Index, and S&P GSCI Commodity Index predictors fail to demonstrate consistent statistical significance. Thus, their short-term predictive capabilities should be approached with caution. The out-of-sample test is conducted to affirm the study’s robustness, utilizing a training/testing split of 85/15. The best-performing model, which applied a 3% threshold as a binary dependent variable, successfully identified crash observations with 59% precision, thus providing a notable information edge over a random guess. Such findings provide evidence of existing market inefficiencies and the lead-lag relationship between option and equity markets.
Tämä tutkimus käyttää logistista regressiomallia, jonka tavoitteena on ennustaa tulevia markkinakorjausliikkeitä S&P 500-indeksimarkkinassa. Tutkimusaineisto kattaa päivittäisen ajanjakson tammikuusta 2019 lokakuuhun 2022. Aineiston riippumattomia muuttujina toimii erilaisia laajasti tutkittuja talouden sekä optiomarkkinoiden tunnuslukuja tai mittareita. Tutkimuksessa käytetään kolmea eri mallia, joissa binaarinen riippumaton muuttuja osoittaa markkinoiden korjausliikkeen, kun markkinoiden arvonlasku ylittää joko 3 %, 4 % tai 5 %.
Nämä mallit osoittavat merkittävää ennustuskykyä tuleville negatiivisille osaketuotoille, ennustaen negatiiviset tuotot oikein erinomaisella menestyksellä. Mallit hylkäävät tilastollisesti merkittävästi nollahypoteesin "muuttujilla aikaan t ei ole vaikutusta laskun todennäköisyyteen aikaan t+1". Tilastollisesti merkittävimmät muuttujat ovat Bond-Stock Earnings Yield Differential, Volatility smirk sekä Open Interest Difference.
Tutkimuksessa käytetyn kolmen mallin osalta TED Spread, Bid-Offer Spread, Term Spread, Baltic Dry Index ja S&P GSCI Commodity Index -muuttujat eivät osoita johdonmukaista tilastollista merkitsevyyttä. Näin ollen niiden kykyyn indikoida markkinoiden tulevaa arvostustason muutosta tulisi suhtautua kriittisesti. Lopuksi tutkimuksessa testataan mallin kykyä suoriutua oikeissa markkinaolosuhteissa, datalla, jota malli ei ole ennen kohdannut. Menestynein malli onnistui tarkasteluajanjaksolla ennustamaan oikein merkittävän määrän markkinan korjausliikkeistä. Täten, malli ennakoi markkinan suuntaa paremmin kuin sattumanvarainen arvaus. Tämä todistaa, että markkinoilla on yhä epätehokkuuksia, erityisesti sen suhteen, että informaatio hinnoitellaan ensin optiomarkkinoilla ja viiveellä osakemarkkinoilla.
This study utilizes a logistic regression model to forecast imminent market correction movements in the S&P 500 index using a daily dataset that spans from January 2019 to October 2022. A selection of well-researched financial, macroeconomic and option metric indicators serve as independent variables. The research establishes three distinct models, each with a binary dependent variable that designates the occurrence of a crash when market drawdown exceeds either 3%, 4%, or 5%.
These models demonstrate a substantial predictive power for future negative equity returns, predicting negative instances correctly over 77% of the time with in-sample data while statistically significantly rejecting the null hypothesis "predictors at time t have no effect on the likelihood of a crash at time t+1". The significant predictive power is displayed by the Bond-Stock Earnings Yield Differential, Volatility Smirk and Open Interest Difference predictors.
Across the three models, the TED Spread, Bid-Offer Spread, Term Spread, Baltic Dry Index, and S&P GSCI Commodity Index predictors fail to demonstrate consistent statistical significance. Thus, their short-term predictive capabilities should be approached with caution. The out-of-sample test is conducted to affirm the study’s robustness, utilizing a training/testing split of 85/15. The best-performing model, which applied a 3% threshold as a binary dependent variable, successfully identified crash observations with 59% precision, thus providing a notable information edge over a random guess. Such findings provide evidence of existing market inefficiencies and the lead-lag relationship between option and equity markets.