投資家別属性の研究 - 大量保有報告書と自然言語処理による投資家行動分析
EDINETに開示される大量保有報告書を自然言語処理によりデータベース化し、投資家種別ごとの活動特性の分析、およびアクティビストファンドの詳細な投資行動の調査・分析を行う研究です。
大量保有報告書には、5%以上の株式を保有する投資家の保有比率、保有目的、共同保有者などの情報が記載されています。これらのデータを体系的に収集・分析することで、市場参加者の行動パターンや投資スタイルを定量的に把握することが可能となります。
研究の重点領域
- 投資家種別分析: 証券会社、資産運用会社、信託銀行、アクティビスト等、種別ごとの投資行動の特徴付け
- アクティビスト研究: 個別アクティビストの投資戦略、保有銘柄特性、株主提案傾向の詳細分析
- 自然言語処理: 保有目的等のテキストデータから投資意図を自動分類
- マルチエージェントシミュレーション: 異なる投資家視点からの開示書類分析と質問生成
データベース構成
本研究では、研究室で構築した以下のデータベースを構築・活用しています。
| データベース |
概要 |
主な内容 |
| Activist_Action_DB |
大量保有報告書DB |
EDINETからの報告書を自然言語処理し構造化 |
| Activist_Details_DB |
アクティビスト詳細DB |
特定アクティビストの活動情報を詳細にデータベース化 |
| tairyou_hoyu.db |
統合分析DB |
投資家属性・グループ・時系列データを統合管理 |
データ構造
| カテゴリ |
内容 |
データ期間 |
| 報告書データ |
単独・共同報告、保有比率、変動情報 |
2007年~現在 |
| 投資家属性 |
種別、地域、投資スタイル、アクティビストフラグ |
継続更新 |
| 保有目的 |
純投資、重要提案行為、経営参加等 |
2007年~現在 |
| グループ情報 |
共同報告者グループ、ファンドファミリー |
継続更新 |
投資家種別分類体系
組織種別
| 種別コード |
種別名 |
説明 |
| SECURITIES |
証券会社 |
国内外の証券会社(自己勘定・マーケットメイク) |
| ASSET_MANAGER |
資産運用会社 |
投資信託、投資顧問会社 |
| TRUST_BANK |
信託銀行 |
年金等の受託運用 |
| ACTIVIST |
アクティビスト |
株主提案を行うアクティビストファンド |
| HEDGE_FUND |
ヘッジファンド |
多様な戦略を用いるヘッジファンド |
| PE_VC |
PE/VC |
プライベートエクイティ、ベンチャーキャピタル |
| INDIVIDUAL |
個人株主 |
個人投資家、創業者等 |
投資スタイル
| スタイル |
説明 |
主な投資家 |
| PASSIVE |
インデックス連動型運用 |
信託銀行、大手運用会社 |
| ACTIVE |
銘柄選別型アクティブ運用 |
運用会社、投資顧問 |
| ACTIVIST |
経営関与型投資 |
アクティビストファンド |
| VALUE |
割安株投資 |
バリュー投資家 |
| QUANT |
クオンツ運用 |
クオンツファンド |
アクティビスト分析システム
分析モジュール
| モジュール |
分析内容 |
出力 |
| ポートフォリオ分析 |
投資先構成、業種分散、集中度 |
保有銘柄一覧、統計 |
| 時系列分析 |
保有比率の推移、買増・売却パターン |
変動履歴、傾向 |
| 保有目的分析 |
テキストマイニングによる意図分類 |
純投資/重要提案行為等 |
| ファクター分析 |
保有銘柄の株式特性分析 |
バリュー/グロース傾向等 |
主要アクティビスト分析例
本研究で分析対象としている主要アクティビストの一例:
| アクティビスト |
地域 |
投資先数 |
平均保有比率 |
特徴 |
| オアシス・マネジメント |
海外 |
- |
- |
重要提案行為を積極的に実施 |
| エフィッシモ・キャピタル |
海外 |
- |
- |
長期保有型アクティビスト |
| シティインデックスイレブンス |
国内 |
- |
- |
超集中投資(最大58%) |
| ダルトン・インベストメンツ |
海外 |
- |
- |
バリュー投資型 |
| シルチェスター |
海外 |
- |
- |
長期パッシブ型アクティビスト |
投資家プロファイル構造
各投資家について、以下の階層的プロファイルを構築:
投資家プロファイル
├── ベータプロファイル(種別共通特性)
│ ├── 投資家種別の一般的な行動パターン
│ ├── 保有目的の傾向
│ └── 投資スタイルの特徴
│
└── アルファプロファイル(個社固有特性)
├── 投資先ポートフォリオ
├── 保有比率分布(集中度)
├── 買増・売却パターン
├── 株式ファクター選好
└── 特異な投資行動
ナレッジベース構造
各エージェントは以下のナレッジを参照して分析を行います:
エージェント/
├── config.yaml # エージェント設定
├── personality.md # 投資家視点・思考様式
├── beta_profile.md # 種別共通の行動特性
└── knowledge/
├── alpha_profiles/ # 個別投資家の詳細プロファイル
├── analysis_reports/ # 投資家分析レポート
├── financial_data/ # ポートフォリオ特性データ
└── past_emails/ # 過去の株主提案・対話事例
技術的特徴
自然言語処理
| 処理内容 |
技術 |
目的 |
| 保有目的分類 |
テキスト分類 |
純投資/重要提案行為等の自動判定 |
| 投資家名寄せ |
類似度計算 |
表記揺れの統一、グループ化 |
| 株主提案分析 |
情報抽出 |
提案内容のカテゴリ分類 |
データベース設計
| 特徴 |
内容 |
| 正規化設計 |
投資家・報告書・保有明細の適切な分離 |
| グループ管理 |
共同報告者グループの明示的管理 |
| 時系列対応 |
保有比率の推移を追跡可能なビュー |
| 分析ビュー |
種別サマリー、アクティビスト活動等の事前計算 |
LLM統合
| 機能 |
説明 |
| ナレッジ参照 |
投資家プロファイルをコンテキストとして活用 |
| 視点模倣 |
各投資家種別の思考様式を再現 |
| 質問生成 |
開示書類に対する視点別質問の自動生成 |
今後の研究方向性
- アクティビスト活動の予測モデル構築
- 株主提案の成功要因分析
- 投資家間の協調行動の検出
- ESG関連の保有目的分析
- リアルタイム報告書モニタリング
- 海外アクティビストデータベースとの統合
株式市場における投資家行動の理解は、IR戦略の立案、株主構成の分析、コーポレートガバナンスの検討において重要な示唆を与えます。本研究では、大量保有報告書という公開情報を最大限に活用し、投資家種別ごとの行動パターンを定量的に把握することで、企業と投資家の建設的な対話に貢献することを目指しています。