競馬統計で遊ぶ.1
今回は興味があった競馬の統計量を実際に手を動かして計算するために、pythonでコードを書きはじめた、という記事です。今回実装した機能は以下の2つです。
- netkeiba.comからレース結果をスクレイピングする(csv形式で保存)
- csvから1着,2着,3着,それ以外の4通りになる確率を馬番、人気の組ごとに計算する
コードを書く際には以下の記事が参考になりました。
Pythonで競馬サイトWebスクレイピング - Qiita
競馬のデータ分析をプログラミング(スクレイピング)でやってみたお話 | ハイパー猫背
様々な解析をしたいところですが、csvのままだと処理が面倒なので、まずはSQLでデータベースを作る予定です。
今後考慮したい要素として、上から順にやっていく予定です。
- レース情報(芝/ダート、コース形、距離、馬場、天候 )
- 騎手と馬の組
- 各馬レース結果の時系列評価
- 馬の血統
- その他
最後までお読みいただきありがとうございました。