前回の記事で、イン逃げ率を重回帰分析してみた。
せっかく予測モデルを作ったのだから、今回はそのモデルを使って、的中率や回収率をシミュレーションしてみたいと思う。
軽く復習しておくと、前回は、重回帰分析により、出走表に載っている選手の全国勝率を元データとして、実際にイン逃げが成功したか失敗したかをベースに学習し、確率を計算するための計算式を得た。
今回は、その計算式の精度を確かめてみようというのが趣旨だ。
今回のモデルに関して
重回帰分析の計算結果は大体、0.0〜1.0の間で出る。(外れ値があるので、超える場合もある)
1に近いほどインが逃げる確率が高く、0に近いほどインが逃げる確率が低くなる。
計算結果が0.5だったとすると、大体50%の確率で逃げが成功すると考えていいだろう。
確率計算のベースにしているのが全国勝率だけなので、その他諸々の条件は完全に無視している。実際には他にインが逃げるか逃げないかには、他にも影響を及ぼす要因があるだろう。
ただ、選手の全国勝率という要因がどれくらい重要かは見えてくるのではないだろうか。
正解率の評価
過去3年間に行われた全レースに対して重回帰分析のモデルを当てはめ、結果が0.5を超えるレースはインが逃げる、0.5以下の場合は逃げないとした。
すると、正解率は64.63%だった。
正解率は、(逃げると予測して実際に逃げた件数 + 逃げないと予測して実際に逃げなかった件数) ÷ 全件数とする。
要は、モデルの予測が当たった割合だ。
細かい数値は下記の表の通りになった。
モデルの予測 | 実際の結果 | 割合 |
---|---|---|
逃げると予測 | 逃げた | 60.61 |
逃げると予測 | 逃げなかった | 39.38 |
------------------ | ------------------ | ------------------ |
逃げないと予測 | 逃げた | 32.9 |
逃げないと予測 | 逃げなかった | 67.09 |
ひどくはないけど、決して良くもない感じだ。
逃げる確率が高いもののみ買ったら?
上記の結果は、全レースを計算式に当てはめ、インが逃げるかどうかを予想したものだ。
しかし、0.5付近を含むということは、逃げるかどうか微妙なラインを含むということだ。
別に、全てのレースを買う必要はない。
どっちに転ぶかわからないようなレースを捨て、逃げる確率が高いと予測された場合のみを買って勝てるなら何も問題はない。
モデル上、70%以上の確率で逃げると予測されたもののみを選び、実際に逃げた割合を計算した。
72.32%。
まあ、大体理論値通りの的中率だ。
まあまあだけど、おそらくは配当も低くなるだろう。
今回のモデルは、インに入る選手の全国勝率によって大部分が決まる。
インに強い選手が入れば舟券が売れることが予想される。
果たして、実用になるのだろうか?
的中率が高いのか低いのかは、回収率も合わせて考えなければ結論が出ない。
回収率の評価
というわけで、モデルの予測を元に、舟券を買った場合のシミュレーションをしてみよう。
インが逃げると予想した場合、インを頭にして二連単の総流しを買うものとする。つまり、インが1号艇の場合、1−2、1−3、1−4、1−5、1−6の5通りの舟券を買う。
当然、インが逃げないと予測したレースでは何も買わない。
対象レースは過去3年間に行われた全レース。
結果。
モデルで予測した通りに舟券を買った場合、回収率は75.12%だった。
なんと、払い戻し率とぴったり同じだ。
的中率は60.61%。
では、モデルでの予測確率が高いもののみを買ってみたらどうなるか?
モデルの予測確率が50%以上の場合のみ買う、60%以上の場合のみ買う、というのをシミュレーションしてみた。
ついでに、予測確率が40%以上だったら買う場合も出した。
結果は下の通り。
予測確率 | 回収率 | 的中率 |
---|---|---|
0.4 | 74.77 | 54.81 |
0.5 | 75.12 | 60.61 |
0.6 | 75.04 | 66.86 |
0.7 | 76.33 | 72.32 |
0.8 | 78.31 | 80.22 |
※90%以上のレースは100件に満たないので除外
確かに、モデルで逃げる確率が高いと評価されたレースのみを買った場合、的中率が高くなっているのがお分かり頂けると思う。
しかし、回収率はほとんど上がっていない。
80%以上逃げるとモデルが予測した場合の的中率は80.22%。
ほぼ理論値通りだ。
しかし、回収率は78.31%。
若干高くなっているものの、あまり変わっていない。
考察
的中率が上がるのに、回収率が変わらない。
やはり、モデルでイン逃げの確率が高いと予測したレースは、配当金も安くなっているということだ。
この比例っぷりを見ると、多くの人の買い方と一致しているのではないかと思える。
多くの人は、全国勝率をメインに予想をしているのだろう。
しかし、選手の全国勝率のみというお手軽なモデルな割に、イン逃げ率を結構正確に予測できるものだ。
全国勝率という要素は、かなり有用であると言えるだろう。
集計期間:2012年8月1日〜2015年8月30日
レース件数:162505レース ※不成立含む