인공지능(AI), 특히 대규모 언어 모델(LLM)을 활용한 금융 시장 분석과 전통적인 재무제표 기반의 투자 분석이라는 두 가지 큰 흐름을 다루고 있습니다.
LLM을 활용한 금융 시장 예측
LLM을 사용하여 뉴스 기사 같은 비정형 데이터를 분석하고 주식 및 암호화폐 가격 변동을 예측하려는 시도가 활발히 이루어지고 있습니다.
주식 예측: 카카오뱅크 기술 블로그에 따르면, ChatGPT로 뉴스 헤드라인의 감성(긍정/부정)을 분석한 결과, 다음 날의 주가 수익률 예측에 유의미한 영향을 미쳤습니다. 특히 GPT-4와 같은 최신 모델은 기존 감성 분석 도구나 초기 언어 모델보다 뛰어난 성과를 보였습니다.
암호화폐 예측: 주식과 달리 암호화폐 시장에서는 국내 뉴스 감성이 단기 수익률에 영향을 주었지만, 가격 상승이 긍정적 뉴스를 유발하는 반대 방향의 인과관계가 관찰되었습니다. 이는 전통 자산 시장과는 다른 특징입니다.
다양한 접근법: 여러 연구에서 뉴스 요약, 재무 데이터, 감성 분석 등 다양한 데이터를 LLM에 결합하여 예측 정확도를 높이려는 시도가 이루어지고 있습니다. 연구에 따르면 단기(1~3개월) 예측에는 뉴스 요약이, 중기(3~12개월) 예측에는 재무제표와 감성 데이터 결합이 효과적이었습니다. 장기 예측에서는 여전히 인간 애널리스트가 우위를 보였습니다.
고도화된 프레임워크: 최근에는 TradingAgents와 같이 여러 전문 역할을 맡은 AI 에이전트(애널리스트, 트레이더 등)가 협력하여 투자 결정을 내리는 다중 에이전트 시스템도 개발되고 있습니다.
전통적 재무 분석의 중요성
AI 기술의 발전에도 불구하고, 투자의 기본은 기업의 재무 상태를 이해하는 것임을 강조합니다.
핵심 지표: 사경인 회계사의 저서 요약에 따르면, 투자자는 재무제표를 반드시 이해해야 합니다. 특히 자기자본이익률(ROE)을 추정하여 기업의 가치를 평가하고, S-RIM 같은 가치 평가 모델을 통해 적정 주가를 산정하는 것이 중요합니다.
기본 원칙: 주가를 예측하기보다는 기업의 비즈니스 모델과 실적을 바탕으로 '싸게 사서 비싸게 파는' 원칙을 지켜야 합니다. 이를 위해 할인율, 감가상각비 등 기본적인 회계 개념에 대한 이해가 필수적입니다.
카카오뱅크 기술기획팀 William이 2025년 5월 16일에 작성한 글로, ChatGPT를 이용한 주식시장 예측 연구 논문을 소개하고 있습니다. 핵심 내용은 다음과 같습니다.
주제: ChatGPT로 신문기사를 분석하여 주식시장에서 높은 투자 수익을 얻을 수 있는지에 대한 연구 소개.
주식시장과 자산가격결정이론: 주식시장의 역사와 자산가격결정이론의 발전 과정을 간략하게 설명하고, AI를 이용한 자산가격 예측 연구의 최근 동향을 언급합니다.
ChatGPT를 이용한 주식시장예측 연구:
ChatGPT를 이용하여 뉴스 헤드라인의 긍정적, 부정적, 중립적 감성을 분류하고, 이 분류 결과가 다음날 주식 수익률에 미치는 영향을 분석한 Lopez-Lira와 Tang의 연구를 소개합니다.
분석 데이터, 분석 방법(프롬프트 작성 및 회귀분석), 실증 분석 방법 설계를 설명합니다.
ChatGPT 3.5와 4.0을 이용한 롱-숏 투자 전략의 결과를 보여주고, 회귀분석 결과를 통해 최신 LLM의 예측 성능을 검증합니다.
기존 통계 기반 감성 분석 기법과 기본적인 언어 모델의 예측 성능을 비교합니다.
결론:
ChatGPT의 뉴스 헤드라인 평가는 다음날 주식 수익률 예측에 유의미하며, 기존 감성 분석 기법보다 우수합니다.
기본적인 LLM은 주식 수익률을 예측할 수 없습니다.
가장 진보된 모델인 ChatGPT 4를 기반으로 한 롱-숏 투자전략은 다른 언어 모델 대비 가장 높은 샤프 비율을 보여줍니다.
마무리:
LLM을 활용한 투자 전략 설계의 가능성을 제시하고, 차후 카카오뱅크의 ChatGPT를 이용한 암호화폐 가격 예측 연구를 소개할 예정임을 언급합니다.
프롬프트
Forget all your previous instructions. Pretend you are a financial expert.
You are a financial expert with stock recommendation experience.
Answer “YES” if good news, “NO” if bad news, or “UNKNOWN” if uncertain in the first line.
Then elaborate with one short and concise sentence on the next line.
Is this headline good or bad for the stock price of [company name] in the [term] term? Headline: [headline]
이전의 모든 지침은 잊어버리세요. 자신이 금융 전문가라고 생각하세요.
당신은 주식 추천 경험이 있는 금융 전문가입니다.
헤드라인 내용이 좋은 뉴스이면 "예"라고 답하고 나쁜 뉴스이면 "아니오", 불확실하면 "알 수 없음"이라고 답하세요.
그리고, 다음 줄에 짧고 간결한 한 문장으로 자세히 설명하세요.
이 헤드라인이 [기간] 동안 [회사명]의 주가에 좋은가요, 나쁜가요? 헤드라인: [헤드라인]
각 도메인의 고유한 특성은 수집되는 데이터의 형태, 패턴, 성격에 영향을 준다. 사용자는 특정 도메인의 상품을 이용하면서 다양한 행동을 보이는데, 이 과정에서 사용자의 행동은 데이터로 기록되며, 분석가에게 중요한 정보를 제공한다. 데이터 분석가는 수집된 사용자 행동 데이터를 가지고 다양한 기술과 도구를 활용하여 새로운 정보를 얻거나 앞으로의 행동 패턴을 예측할 수 있다.
쇼핑 데이터는 사용자가 언제 어떤 상품을 결제했고 최근에는 어떤 상품에 관심 있는지를 담고 있다. 분석가는 결제 주기와 결제 수단 등을 기반으로 사용자의 결제 행동 패턴을 이해하려고 할 것이다.
광고 데이터는 콘텐츠별 노출수, 클릭률, 구매전환율에 따른 트래픽을 비교할 수 있다. 또한 콘텐츠별 반응률, 노출 순서, 사용 관심사 및 세그먼트에 대해서도 분석할 수 있다.
금융 도메인의 거래 내역 데이터는 사용자가 가지고 있는 금융 수단을 바탕으로 거래 형태와 규모를 분석하고, 시계열의 관점에서 거래 내역의 변화를 파악하는 데 중점을 둘 것이다.
Significant progress has been made in automated problem-solving using societies of agents powered by large language models (LLMs). In finance, efforts have largely focused on single-agent systems handling specific tasks or multi-agent frameworks independently gathering data. However, multi-agent systems' potential to replicate real-world trading firms' collaborative dynamics remains underexplored. TradingAgents proposes a novel stock trading framework inspired by trading firms, featuring LLM-powered agents in specialized roles such as fundamental analysts, sentiment analysts, technical analysts, and traders with varied risk profiles. The framework includes Bull and Bear researcher agents assessing market conditions, a risk management team monitoring exposure, and traders synthesizing insights from debates and historical data to make informed decisions. By simulating a dynamic, collaborative trading environment, this framework aims to improve trading performance. Detailed architecture and extensive experiments reveal its superiority over baseline models, with notable improvements in cumulative returns, Sharpe ratio, and maximum drawdown, highlighting the potential of multi-agent LLM frameworks in financial trading. TradingAgents is available at this https URL.
AI in Investment Analysis: LLMs for Equity Stock Ratings
이 연구 결과는 LLM(Large Language Models)을 활용한 주식 수익률 예측 실험을 통해, 다양한 데이터 소스와 방식이 예측 정확도에 어떤 영향을 미치는지를 분석하고 있습니다. 아래는 주요 실험 비교 요약입니다: (ChatGPT 요약)
✅ 5.1 전통적 애널리스트 vs. Vanilla LLM
Vanilla LLM은 기본적인 재무 데이터만 사용함에도 불구하고 애널리스트보다 더 정확한 예측(MAE 1.447)을 보임.
하지만 표준편차는 더 높아 예측 일관성은 낮음.
분석가들은 매도 의견을 5% 미만만 제공, 이는 편향된 결과를 초래.
18개월 예측에서는 애널리스트가 더 우세, Vanilla LLM은 예측 기간이 길수록 오차 증가.
✅ 5.2 뉴스 요약 vs. 뉴스 감성 분석
뉴스 요약 기반 모델: MAE 1.491 (표준편차 0.738)
뉴스 감성 분석 기반 모델: MAE 1.496 (표준편차 0.752)
Vanilla LLM보다 성능 저하. 요약 또는 감성 분석 모두 큰 차이를 만들지는 않음.
단, 뉴스 요약은 단기 예측(1개월)에 가장 강력 → 최신 뉴스 요약이 기업 성과를 반영하기 때문.
✅ 재무제표 vs. 재무제표 + 감성
재무제표 + 감성 모델: MAE 1.417 → 가장 정확한 예측
재무제표 모델: MAE 1.421 → 더 낮은 표준편차로 예측 일관성은 우수
3, 6, 12개월 중기 예측에 가장 뛰어남
18개월 이상 장기 예측에서는 오히려 성능 저하 (감성 정보가 오히려 혼선 유발 가능성)
✅ 요약
단기(1~3개월): 뉴스 요약 기반 모델이 최고
중기(3~12개월): 재무제표 및 감성 결합 모델이 우세
장기(18개월 이상): 인간 애널리스트가 여전히 더 나은 성과
감성 분석만으로는 뉴스 요약보다 효과 크지 않음
LLM은 단기 예측에 강점, 시간이 길어질수록 성능 하락
모델
Return MAE
특징
Analyst
1.570
장기 예측에 강함
Vanilla (기본 재무정보)
1.447
애널리스트보다 정확
News Summary
1.491
단기 예측(1개월)에 효과
News Sentiment
1.496
요약과 유사한 성능
Fundamentals
1.421
중기 예측에서 안정적
Fundamentals + Sentiment
1.417
전반적으로 최고 성능
🔍 출처 정리
이 내용은 LLM 기반 금융 예측에 관한 실제 논문 또는 연구 보고서에서 발췌한 것으로 보이며, 주요 키워드로는 다음과 같은 논문/자료를 검색해볼 수 있습니다:
"Can large language models beat analysts?"
"Financial Forecasting with LLMs using Fundamentals and News"
"News sentiment vs. news summaries in LLM-based financial predictions"