この記事は、東京大学・大阪公立大学・松尾研究所による学術研究(2026年、人工知能学会金融情報学研究会)をもとに、個人投資家の視点でわかりやすく解説したものです。数値・実験条件は論文に準拠していますが、一部の解釈はなおの独自考察を含みます。
2026/193人工知能学会第二種研究会資料
最近、「ChatGPTに投資のアイデアを聞いてみた」「AIで株の分析をしてみた」という話をよく聞くようになりました。
試してみたことがある方もいるんじゃないかと思います。
そんな中、東京大学の研究チームが面白い実験をしました。
「AIに株の投資戦略を自動で改善させたら、どのAIが一番うまくいくのか」を、実際のデータで検証したんです。
結果が、なかなか興味深いものでした。
今日はその内容を、投資歴30年以上の目線でかみ砕いてお届けします。
どんな実験だったのか
実験のざっくりした流れはこうです。
- 対象:TOPIX500(金融セクター除く)の日次データ、2014〜2022年
- 使用AI:GPT・Gemini・Claudeの計8モデル
- やること:AIが株の投資戦略(Pythonコード)を作り、バックテスト結果を見てAI自身が改善を繰り返す
- 比較軸:「どんな情報を渡すか」「グラフも見せるか」「どのAIを使うか」
要するに、AIが自分でPDCAを回して投資戦略を磨いていく、そのプロセスを観察した研究です。
人間がチェックするのではなく、完全に自動でフィードバックをかけていくのが特徴的でした。
衝撃の結果①:プロンプトの工夫はほぼ意味がなかった
多くの人が「AIには詳しい情報をたくさん渡すほど良い結果が出る」と思っているんじゃないかと思います。
わたしも最初はそう思っていました。
ところが実験では、渡す情報を増やしたり(シャープレシオだけ→IC・ファクターエクスポージャーなども追加)、グラフを一緒に見せたりしても、戦略のパフォーマンス改善への効果はほぼなかったという結論が出ました。
- 情報を基本のみ→詳細に増やした場合の改善幅の変化:平均 −1.30%(むしろ悪化)
- 基本情報のみ→グラフも追加した場合:平均 ±0.00%(変化なし)
※P&Lの年率改善幅の変化。論文表4・表5より。
「プロンプト芸」と呼ばれる、AIへの指示の工夫が投資界隈でも流行り始めていますが、
少なくともこの実験では、何を渡すかよりも「誰(どのAI)に渡すか」のほうがはるかに重要だということがわかりました。
衝撃の結果②:AIによって成績がこれだけ違った
では何が結果を左右したかというと、使うAIモデルそのものでした。
年率換算の改善幅(初期戦略との比較)を並べると、こうなります。
| AIモデル | 平均改善幅 | 評価 |
|---|---|---|
| Claude Sonnet 4.5 | +14.12% | 🏆 断トツ1位 |
| Claude Opus 4.5 | +12.69% | 🥈 安定して強い |
| Claude Haiku 4.5 | +8.27% | 🥉 軽量モデルながら健闘 |
| Gemini 3 Pro Preview | +7.35% | やや不安定 |
| Gemini 3 Flash Preview | +7.27% | ばらつきあり |
| GPT-5 mini | +4.75% | 条件次第で大きくブレる |
| GPT-5 | −0.29% | ほぼ改善できず |
| GPT-5 nano | −3.06% | ⚠️ 戦略を悪化させた |
※論文表3より。モデル名は論文記載のまま(2025年時点の最新情報要確認)。
Claudeシリーズが上位を独占し、GPT-5 nanoに至っては初期戦略よりも悪い結果になってしまっています。
「最新のGPTを使えば間違いない」という感覚は、少なくともこの実験では通用しませんでした。
なぜここまで差がついたのか
研究チームの考察によると、AIによる改善スタイルの違いが原因とのことです。
- Claude:既存の戦略の構造を保ちながら、局所的な修正を積み上げていく。安定して少しずつ改善できる。
- Gemini:戦略を大きく組み替える傾向が強い。うまくいけば大きく化けるが、外れると大幅に悪化する。
- GPT:既存のロジックをほとんど変えない保守的なスタイル。変化が少ないため改善も限定的。
投資で言えば、Claudeは「小さな改善を積み上げる長期投資家」、Geminiは「大勝負をかけるトレーダー」、GPTは「何も変えない硬直した投資家」のようなイメージです。
限られた試行回数の中では、Claudeのスタイルが最も安定して機能した、ということですね。
なおの独自考察:「道具」より「使い手」より「道具選び」
📝 30年投資家の視点から
この研究を読んで最初に思ったのは、「これは人間の投資と全く同じ構造だな」ということでした。
どれだけ優秀な情報(決算書、チャート、アナリストレポート)を持っていても、
それを解釈する「頭(モデル)」が硬直していたら、情報は活かせない。
30年の経験で何度も見てきた光景です。情報収集に熱心なのに成績が上がらない個人投資家の多くは、
情報量が足りないのではなく、情報の解釈と更新のやり方に問題があることが多い。
AIも同じ。プロンプトをこねくり回す前に、まず「どのAIを使うか」を真剣に考えることが先決です。
楽観シナリオ:Claude系のAIがさらに進化すれば、個人投資家が機関投資家並みのPDCAを回せる時代が来るかもしれない。
注意シナリオ:一方で、AIが優秀になればなるほど、同じツールを使う人が増えて「AIが見つけるアルファ」はすぐ消える。道具に頼りすぎる人ほど、次の波に飲まれやすい。
個人投資家として、どう受け取ればいいか
- 対象はプロ向けのロング/ショート戦略(個人がすぐ再現できるものではない)
- バックテスト期間は2014〜2022年。コロナ後の相場は含むが直近の高金利・AI相場は対象外
- 試行回数が少なく、論文自体も統計的確実性に留保をつけている
- GPT-5やGemini 3など一部モデルの詳細は最新情報要確認
- 投資分析でAIを使うなら、まずClaude系を試してみる価値がある(少なくともこの研究では最強だった)
- プロンプトの工夫に時間をかけすぎない。基本的な情報を整理して渡せば十分という結果が出ている
- AIに「答え」を求めるのではなく、「整理と仮説出し」に使うのが現実的。最終判断は30年の肌感覚に勝るものはない
AIは確かに強力なツールになってきました。
でも、どのAIを選ぶかという「道具選び」の目利き力が、これからの個人投資家にも問われる時代になってきた、ということかもしれませんね。
── 読んで「なるほど」で終わるな ──
「AIが強い」と知っても、仕組みを知らなければカモのまま。このシリーズを読めば、市場の本質が見えてくる。
