본문 바로가기

주식, 시장가설 이론, NFT 전망

뉴스가 주식시장에 영향을 미치는지에 관한 연구 모델

뉴스가 주식시장에 영향을 미치는지에 관한 연구 모델

뉴스가 주식시장에 영향을 미치는지에 관한 연구 모델
뉴스가 주식시장에 영향을 미치는지에 관한 연구 모델

뉴스라는 것이 우리가 기본적으로 정말 새로운 정보인 것입니다. 정보가 뉴스 형태로 시장에 오르면 그 시장에 공유되고 있는 정보가 주가에 반영되는데, 실제로 실증분석을 할 수 있다는 거죠. 그래서 뉴스를 텍스트 마이닝을 해서 이 Sentiment에 대해서 weighting mechanism이 있는 것입니다. 그러니까 너무 많은 정보가 있는데 이 많은 정보가 다 주가에 영향을 미치지는 않은 거죠. 그러면 어떤 정보가 이 주가에 영향을 주는 핵심 정보인지 그것을 selection 하고 extraction 하는 것이 필요하다는 것이죠. 그래서 그 뉴스를 분석해서 찾는 과정에 아주 복잡한 알고리즘이 활용되고 있습니다. 그래서 다층 레이어도 도입이 되고 이런 것들을 해봤더니 하여튼 어느 정도는 주가 예측력의 향상에 도움이 된다는 것이 밝혀지고 있는 거예요. 핵심 알고리즘 기술 중에 한 가지는 방대한 뉴스로부터 핵심 feature를 추출하는 방법입니다. 그래서 여러 가지 알고리즘이 지금 아카데미아나 practitioner들이 제공을 하고 있는데, 그중에 보면 Multi-filters neural network가 있고요. 그다음에 Hybrid attention network도 있고요. 이건 뭔가 하면 attention mechanism + natural language processing을 합해서 핵심 정보를 추출하는 방법입니다. 이러한 것들이 지금 현재 발전하고 있습니다.

독립성분분석

또 하나의 방법은 독립성분분석이라는 것이 있는데, 이것은 independent component analysis입니다. ICA라고 하는데 독립성분 분석은 뭔가 하면 효과적으로 feature를 추출하는 방법인데, 이것은 기존에 재무이론에서 시도되지 않았던 방법입니다. 재무이론의 주가수익률 pricing이 요인 모형이라고 했죠? factor analysis. factor analysis는 principle component analysis하고 관련이 있죠. 그런데 ICA는 물론 이 factor 이론과 관련이 있지만 조금 더 advanced 된, 한 단계 더 진일보된 방법론입니다. 그런데 이 방법론을 통해서 주가 예측에 활용을 해봤더니 성과가 아주 뛰어나다는 것이죠. 그런데 이론적으로 복잡하다는 단점이 있긴 합니다. 그렇다고 그렇게 복잡한 건 아닙니다. 그래서 독립성분은 뭔가 하면 independent component인데, 관찰 데이터의 hidden information입니다. 관찰되지 않는 정보인데요. 이 선형 ICA는 관찰 데이터가 독립성분의 선형 결합으로 생성이 된다고 가정을 하는 거고요. 비선형 ICA는 관찰 데이터가 IC, 독립성분의 비선형 결합으로 생성된다고 가정을 하는 거죠. 그래서 독립성분의 Source나 mixing procedure에 관한 사전 지식을 요구하지는 않습니다. 그래서 이 독립성분 분석이 어떻게 활용되는가 하면, 먼저 주가 데이터에 대해서 ICA를 실시를 합니다. 그러면 독립성분이 추출이 되겠죠. 그래서 이것이 핵심 성분, 독립 성분이 되는 거고 나머지는 노이즈가 되는 것입니다. 그러면 이 독립성분을 가지고, Support Vector Machine이나 다른 걸 가지고 다시 결합을 하게 됩니다. 물론 결합을 하는 과정에서 선형으로 결합할 수도 있고 비선형으로 결합할 수도 있겠죠. 그래서 이 새로운 균형 주가를 복원하게 됩니다. 주가 수익률을 복원하게 되는 거죠. 그럼 우리는 이렇게 이 IC들로 선형 결합이든 비선형 결합이든 이 결합된 주가수익률이 균형이라고 보는 것이죠. 그랬을 때 독립성분분석으로 재결합된 이 균형 수익률과 시장수익률의 괴리를 활용하면 주가수익률을 늘릴 수 있다는 것이죠. 그런데 이것이 지금 시장에서는 봤더니 다른 접근법에 비해서도 상당히 괜찮은, 성과가 좋은 방법으로 알려져 있습니다.

방법론들과 기계학습

이러한 많은 방법론들이 기계학습 기반 또는 데이터 기반으로 stock return pricing이 되고 있는 거죠. 이 분야는 정말 기계학습 분야에서 되고 있기 때문에 기존의 재무 분야와는 정말 신선한 방법이라고 할 수 있고, 지금 많은 성과를 내고 있고, 실제로 마켓에서 많이 활용되고 있는 상황입니다. 그래서 finance 분야와 기계학습 분야에서 stock return에 대한 프라이싱이나 prediction이 많이 진행되고 있는데, 이러한 advanced pricing theory나 알고리즘이 시장 효율성에 어떤 영향을 미칠까요? 물론 우리가 스마트한 투자자라면 또는 위험을 회피하는 합리적인 투자자라면, 내가 투자를 하기 위해서 엄청난 노력을 합니다. 정보를 많이 분석한다는 것이죠. 그런데 투자를 할 때 나는 초과수익에는 당연히 관심이 있는 거죠. 내가 투자를 할 때 더 많은 수익률을, 주어진 위험에 대해서 더 많은 수익률을 원하는 거죠. 그래서 이러한 알고리즘을 발견하게 되고 활용하려고 합니다. 그래서 실제로는 추가수익률을 누릴 수가 있다는 거죠. 단기적으로 조건 하에서. 어떤 전제조건인가 하면 시장에 반영되지 않는 이 가격이론이나 정보나 기술이라는 전제조건이 필요한 거죠. 그런데 시장 효율성과 관련해서 놀라운 게 뭔가 하면, 이러한 추가 수익이 지속 가능하지 않다는 것입니다. 장기적이지는 않다는 것이죠. 왜냐하면 많은 투자자들이, 많은 합리적인 투자자들이, 많은 스마트한 투자자들이 이 초과수익을 누리기 위해서 엄청난 경쟁과 노력을 하고 있기 때문에 누가 이런 방법으로 추가 수익을 누렸다면 나도 시도해보고 싶고 다른 사람도 시도하면서 초기에 누렸던 초과수익이 점점 줄어들면서 초과수익이 없어져 시장수익률 정도만 누리게 되는 것이죠. 그래서 이 시장 효율성이 참 재미있는 것이 이러한 초과수익을 추구하는 많은 투자자들에 의해서 오히려 더 빨리 달성이 된다는 것입니다. 그래서 finance 이론이든 시장 효율성이든 우리가 No arbitrage 가정을 다시 한번 리마인드 해볼 필요가 있습니다. 실제로 Arbitrage chance가 있다. 또는 추가 수익 찬스가 있다. 그러면 실제로 arbitrage profit이나 추가 수익을 사람들이 누리게 되는 거죠. 그러면 경쟁이 심화된다는 거죠. 그 사람이 추가 수익을 누렸다면 나도 누릴 가능성이 있게 되고, 내가 노력하면 누릴 수 있는 가능성이 높아진다는 것이고, 많은 경쟁이 이루어지기 때문에 실제로 누린다는 거죠. 그러면 Arbitrage profit이나 추가 수익이 다시 없어집니다. 그래서 이 Arbitrage profit이나 초과수익이 없어지는 그 상태가 finance에서는 균형이라 얘기를 하는 것이죠. 그 상태가 바로 시장의 효율성이 달성되는 지점입니다. 그래서 시장의 효율성이 이러한 과정을 통해서 오히려 더 신속하게 달성이 된다는 걸 알 수가 있습니다.