混合レーティングモデルに基づくサッカー勝敗予測の統合的分析

スポーツくじ分析

― mini toto A組を対象とした多変量確率モデルの構築 ―

1. 序論

サッカーの勝敗予測は、Elo レーティング、xG(期待得点)、SPI(Soccer Power Index)など多様なモデルが提案されてきた。しかし、これらは単一指標に依存する傾向が強く、短期的フォーム、戦術相性、リーグ戦力差、波乱要因などの複合的要素を統合的に扱う枠組みは十分に確立されていない。

本研究では、mini toto(5試合予想)を対象に、複数の独立変数を偏差値化し統合する「混合レーティングモデル」を構築し、勝敗確率の推定および波乱発生の構造的要因を分析する。


2. モデル構造

混合レーティングは、以下の7要素から構成される多変量スコアリングモデルである。

  • 直近フォーム指数
  • 攻撃力指数
  • 守備安定指数
  • ホーム補正
  • 対戦相性
  • リーグ戦力差
  • 波乱期待値(エントロピー)

各要素は偏差値化され、重み付き線形結合により総合レーティング R を算出する。

2.1 総合レーティングの基本式

R = Σ (w_i * Z_i)

Z_i:各要素の偏差値
w_i:要素の重み(0〜1)
Σ w_i = 1


3. 各要素の理論的定義

3.1 直近フォーム指数

短期的パフォーマンスを指数減衰モデルで表す。

F = Σ (α^k * P_k)

P_k:k試合前のパフォーマンス(勝点・得失点・xG差)
α:時間減衰係数(0.7〜0.9)


3.2 攻撃力指数

得点期待値の多変量モデル。

A = β1 * xG + β2 * SP + β3 * PV

xG:期待得点
SP:セットプレー効率
PV:ボール前進速度


3.3 守備安定指数

失点回避能力を逆数モデルで表現。

D = γ1 * (1/xGA) + γ2 * Save + γ3 * Block

xGA:被期待失点
Save:GKセーブ率
Block:ブロック率


3.4 ホーム補正

H = h_league + h_team

リーグ固有のホーム係数
チーム固有のスタジアム係数


3.5 対戦相性

M = f(style_match) + f(history)

スタイル相性(ポゼッション vs カウンター)
過去対戦成績


3.6 リーグ戦力差

L = Elo_league + Value_gap

平均Elo差
選手市場価値差


3.7 波乱期待値(エントロピー)

U = – Σ (p_i * log p_i)

p_i:1・0・2 の事前確率
値が大きいほど「荒れやすい試合」


4. 勝敗確率モデル

混合レーティング差 ΔR をロジスティック関数に通すことで勝敗確率を推定する。

P(1) = σ(ΔR + H)
P(2) = σ(-ΔR)
P(0) = 1 – P(1) – P(2)

波乱指数 U により確率分布の広がりを補正する。


5. mini toto A組への適用

5.1 試合別レーティング差

試合 ΔR 波乱指数 最頻値 千葉 vs 柏 -12 高 2 鹿島 vs 東京V +18 低 1 福岡 vs 名古屋 -2 高 0 岡山 vs 京都 -8 中 2 G大阪 vs 長崎 +15 低 1


6. 結果

最も確率密度が高い組合せは以下となる。

2 – 1 – 0 – 2 – 1

高波乱試合(①③)は 0・2 の揺れ幅が大きく、低波乱試合(②⑤)は 1 が安定し、中波乱(④)は 2 が中心となる。


7. 考察

混合レーティングモデルは、短期フォーム・戦術相性・リーグ差・波乱要因を統合的に扱える点が強みである。特に波乱指数 U は、守備型同士の試合、ダービー、フォーム差が小さい試合で高くなり、引分や番狂わせの確率を適切に増幅する。

これは従来の Elo や xG モデルでは捉えにくい領域であり、mini toto のような少点数予想において有効性が高い。


8. 結論

本研究で構築した混合レーティングモデルは、複数の独立要素を統合し、勝敗確率と波乱発生の構造を説明する多変量確率モデルとして有効である。

mini toto A組への適用では、2 – 1 – 0 – 2 – 1 が最適解として導出された。


9. 今後の課題

  • 重み w_i の機械学習による最適化
  • 波乱指数 U の非線形モデル化
  • xG データの高精度化
  • ベイズ更新によるリアルタイム予測

コメント

タイトルとURLをコピーしました