以前、重回帰分析という手法でイン逃げが成功するかどうかを予測したことがある。
しかし、結局、モデルの予測通りに買ったとして、回収率はぴったり75%に落ち着いた。
ならば、重回帰分析以外の手法を使ってみたらどうなるだろうか?
というわけで、今回は決定木(decision tree)という手法を使って、イン逃げが成功するかどうかを予測してみたい。
決定木とは?
決定木とは、機械学習の手法の一種で、YES・NO形式の質問に答えて行くと、最終的にどう決断すれば良いかを教えてくれる手法だ。
具体的な例で言うと、下図のようなフローチャートを作ってくれる。
判断の基準に使うデータと、何が正解なのかを教えてやると、最も正解率が高くなるような条件分岐を考えてくれる。
計算方法はややこしいので省略(というか、自分でも完全に把握してない。興味がある方は調べてみてください)
ただ、使い方は簡単だ。YES・NO形式の質問に答えて行き、最終的にたどり着いたところの行動を取れば良い。
全国勝率モデル
レースに参加する選手の全国勝率を判断の基準として、決まり手が「逃げ」かどうかを予測するモデルを作成した。
結果は下図のようになった。
X[0]が1号艇、X[1]が2号艇、X[2]が3号艇、X[5]が6号艇の全国勝率を意味する。
左側に向いた矢印がYES、右側に向いた矢印がNOだ。
条件分岐は1号艇の勝率が5.40以下であれば左側の2段目の条件へ、5.40を超える場合は右側の2段目の条件へ進む。
4段目のvalueと書いてあるのが、逃げなかった件数と逃げた件数だ。こちらの数が多い方である、と予測する。逃げた件数が多ければ、逃げと予測。逃げなかった件数が多ければ逃げないと予測する。
シミュレーション結果
では、モデルができたところで、回収率と的中率をシミュレーションしてみよう。
逃げると予測した場合、1号艇を頭とした二連単の流しを買い、逃げないと予測した場合は何も買わない。(以前、重回帰分析を行った時と同じ条件)
結果は、的中率57.9%、回収率74.98%となった。
なんと、またもや控除率ぴったりの75%だ。
重回帰分析と全くと言って良いほど同じ結果である。
全国勝率のみをベースにしたモデルは控除率ぴったりに落ち着く定めなのだろうか?
考察
重回帰分析と決定木。
手法を変えてはみたものの、結果は驚くほど同じようなものになった。やはり、予想に使うデータ(全国勝率)が同じならば、同じような結果に落ち着くのかもしれない。
この他にも波の高さや体重などのデータも加えて、幾つか決定木モデルを作成してみたのだが、結果は変わらなかった。
選手勝率の影響が大きすぎて、計算の途中で誤差として無視されてしまった。
やはり、卍氏のように、お得指数のようなものを使うしかないのだろうか。
集計対象期間:2013年2月1日〜2016年2月29日
レース件数:160534レース ※不成立含む