AIに投資戦略を考えてもらった結果、使うAIで成績がぜんぜん違った話

コラム・読み物
スポンサーリンク

この記事は、東京大学・大阪公立大学・松尾研究所による学術研究(2026年、人工知能学会金融情報学研究会)をもとに、個人投資家の視点でわかりやすく解説したものです。数値・実験条件は論文に準拠していますが、一部の解釈はなおの独自考察を含みます。

2026/193人工知能学会第二種研究会資料

最近、「ChatGPTに投資のアイデアを聞いてみた」「AIで株の分析をしてみた」という話をよく聞くようになりました。
試してみたことがある方もいるんじゃないかと思います。

そんな中、東京大学の研究チームが面白い実験をしました。
「AIに株の投資戦略を自動で改善させたら、どのAIが一番うまくいくのか」を、実際のデータで検証したんです。

結果が、なかなか興味深いものでした。
今日はその内容を、投資歴30年以上の目線でかみ砕いてお届けします。

スポンサーリンク

どんな実験だったのか

実験のざっくりした流れはこうです。

📋 実験の設計
  • 対象:TOPIX500(金融セクター除く)の日次データ、2014〜2022年
  • 使用AI:GPT・Gemini・Claudeの計8モデル
  • やること:AIが株の投資戦略(Pythonコード)を作り、バックテスト結果を見てAI自身が改善を繰り返す
  • 比較軸:「どんな情報を渡すか」「グラフも見せるか」「どのAIを使うか」

要するに、AIが自分でPDCAを回して投資戦略を磨いていく、そのプロセスを観察した研究です。
人間がチェックするのではなく、完全に自動でフィードバックをかけていくのが特徴的でした。

衝撃の結果①:プロンプトの工夫はほぼ意味がなかった

多くの人が「AIには詳しい情報をたくさん渡すほど良い結果が出る」と思っているんじゃないかと思います。
わたしも最初はそう思っていました。

ところが実験では、渡す情報を増やしたり(シャープレシオだけ→IC・ファクターエクスポージャーなども追加)、グラフを一緒に見せたりしても、戦略のパフォーマンス改善への効果はほぼなかったという結論が出ました。

⚠️ 具体的な数字
  • 情報を基本のみ→詳細に増やした場合の改善幅の変化:平均 −1.30%(むしろ悪化)
  • 基本情報のみ→グラフも追加した場合:平均 ±0.00%(変化なし)

※P&Lの年率改善幅の変化。論文表4・表5より。

「プロンプト芸」と呼ばれる、AIへの指示の工夫が投資界隈でも流行り始めていますが、
少なくともこの実験では、何を渡すかよりも「誰(どのAI)に渡すか」のほうがはるかに重要だということがわかりました。

📖 あわせて読みたい

AIだけでなく、個人投資家が構造的に不利な理由をもっと深掘りしたい方はこちら。

財務省とGPIFが『個人投資家の老後』を人質にしている件 →

衝撃の結果②:AIによって成績がこれだけ違った

では何が結果を左右したかというと、使うAIモデルそのものでした。
年率換算の改善幅(初期戦略との比較)を並べると、こうなります。

📊 モデル別・平均P&L年率改善幅(全9条件の平均)
AIモデル 平均改善幅 評価
Claude Sonnet 4.5 +14.12% 🏆 断トツ1位
Claude Opus 4.5 +12.69% 🥈 安定して強い
Claude Haiku 4.5 +8.27% 🥉 軽量モデルながら健闘
Gemini 3 Pro Preview +7.35% やや不安定
Gemini 3 Flash Preview +7.27% ばらつきあり
GPT-5 mini +4.75% 条件次第で大きくブレる
GPT-5 −0.29% ほぼ改善できず
GPT-5 nano −3.06% ⚠️ 戦略を悪化させた

※論文表3より。モデル名は論文記載のまま(2025年時点の最新情報要確認)。

Claudeシリーズが上位を独占し、GPT-5 nanoに至っては初期戦略よりも悪い結果になってしまっています。
「最新のGPTを使えば間違いない」という感覚は、少なくともこの実験では通用しませんでした。

なぜここまで差がついたのか

研究チームの考察によると、AIによる改善スタイルの違いが原因とのことです。

🧠 各AIの「改善スタイル」
  • Claude:既存の戦略の構造を保ちながら、局所的な修正を積み上げていく。安定して少しずつ改善できる。
  • Gemini:戦略を大きく組み替える傾向が強い。うまくいけば大きく化けるが、外れると大幅に悪化する。
  • GPT:既存のロジックをほとんど変えない保守的なスタイル。変化が少ないため改善も限定的。

投資で言えば、Claudeは「小さな改善を積み上げる長期投資家」、Geminiは「大勝負をかけるトレーダー」、GPTは「何も変えない硬直した投資家」のようなイメージです。
限られた試行回数の中では、Claudeのスタイルが最も安定して機能した、ということですね。

なおの独自考察:「道具」より「使い手」より「道具選び」

📝 30年投資家の視点から

この研究を読んで最初に思ったのは、「これは人間の投資と全く同じ構造だな」ということでした。

どれだけ優秀な情報(決算書、チャート、アナリストレポート)を持っていても、
それを解釈する「頭(モデル)」が硬直していたら、情報は活かせない。

30年の経験で何度も見てきた光景です。情報収集に熱心なのに成績が上がらない個人投資家の多くは、
情報量が足りないのではなく、情報の解釈と更新のやり方に問題があることが多い。

AIも同じ。プロンプトをこねくり回す前に、まず「どのAIを使うか」を真剣に考えることが先決です。

楽観シナリオ:Claude系のAIがさらに進化すれば、個人投資家が機関投資家並みのPDCAを回せる時代が来るかもしれない。
注意シナリオ:一方で、AIが優秀になればなるほど、同じツールを使う人が増えて「AIが見つけるアルファ」はすぐ消える。道具に頼りすぎる人ほど、次の波に飲まれやすい。

個人投資家として、どう受け取ればいいか

⚠️ この研究の限界も知っておこう
  • 対象はプロ向けのロング/ショート戦略(個人がすぐ再現できるものではない)
  • バックテスト期間は2014〜2022年。コロナ後の相場は含むが直近の高金利・AI相場は対象外
  • 試行回数が少なく、論文自体も統計的確実性に留保をつけている
  • GPT-5やGemini 3など一部モデルの詳細は最新情報要確認
✅ それでも使える3つの示唆
  1. 投資分析でAIを使うなら、まずClaude系を試してみる価値がある(少なくともこの研究では最強だった)
  2. プロンプトの工夫に時間をかけすぎない。基本的な情報を整理して渡せば十分という結果が出ている
  3. AIに「答え」を求めるのではなく、「整理と仮説出し」に使うのが現実的。最終判断は30年の肌感覚に勝るものはない

AIは確かに強力なツールになってきました。
でも、どのAIを選ぶかという「道具選び」の目利き力が、これからの個人投資家にも問われる時代になってきた、ということかもしれませんね。

── 読んで「なるほど」で終わるな ──

「AIが強い」と知っても、仕組みを知らなければカモのまま。このシリーズを読めば、市場の本質が見えてくる。

── まだ読み足りないなら ──

カテゴリから読み解く個人投資家が負ける構造

読み込み中...
読み込み中...
読み込み中...
タイトルとURLをコピーしました