2020年11月9日(月)にオンラインで開催されたデータサイエンティスト協会 第7回 シンポジウムのパネルディスカッションをご覧になられた皆さま、誠にありがとうございました。
事前にテーマの打ち合わせはあったのですが、シンポジウム自体も初のオンライン開催ということなども重なり、色々想定通りに進行せず、予定以上に事業寄りの議論ばかりになってしまいました。Twitterでも「もっと技術寄りの話しが聞きたかった」などの感想が多く投稿され、このためにチケットを購入された皆さまには深くお詫び申し上げます。
質疑応答の時間もほとんど取ることができなかったので、取り急ぎ、頂いた質問に回答したいと思います。
税金はどんな感じになっちゃうのでしょうか。https://www.sankeibiz.jp/workstyle/news/201104/cpd2011041921001-n1.htm
[大元] 詳細は言えませんが、税金については税理士、弁護士としっかり連携をとって適切に処理しております。
AIの予想が強力になるにつれて大衆がAIの予想に乗っていくことになり、オッズで不利を背負うことになりそうですが、どのようにお考えですか?
[貫井] カスタマー向けの予想提供サービスによる影響が自社の馬券運用に致命的な影響があることが確認された場合は、その予想の公開を続けるべきか検討する必要があると思いますが、現状のところ提供している予想は前日までのデータのみを使用している点、買い目の内容が諸々の制約上限られた点数のみとなっている点から、その影響は無視できる程度だと考えています。
機械学習の予測だとどうしても負けが込むことがあると思います。 負けが続いている際のメンタルコントロールのこつや工夫などあればぜひお聞きしたいです。
[貫井] 負けた悔しさを開発のモチベーションにしています。
[大元] 自分たちが完璧にメンタルコントロール出来てるとは到底思いませんが、
- 人間は損失を非常に嫌う性質があるので、負け額より勝ち額を意識するようにする
例)資金が3億あるときに5千万負けた!より、これまでに2億5千万も勝ってる☺️と考える - 失ってもいい資金を運用する
- 人生終わるわけじゃないし、たかが金だと割り切る
などを気を付けています。
「投資とは自分を知ること」だと偉い人が言ってました。厳しく辛いことも多々ありますが、運用しながら人間的にも成長できたらいいなと思っていますし、自分のメンタルをコントロールできるようにならなければ、馬券運用に勝利はないと思います。
パドックの話が出ましたが、特徴量にパドックでの馬の状態などを入れているのでしょうか?
[貫井] 入れていません。画像解析技術を使ってパドックの馬の状態の特徴量を抽出することは現在世の中にある技術で可能だとは思いますが、費用対効果が悪いと考えています。
[大元] 入れていません。レース映像解析は取り組んでいます1。
競馬・競艇どちらにおいても、データを分析していく段階で “これまで常識と思われていた考え” が覆ったようなケースがあるかと思います。そのような情報を馬主、ボートレーサーなどの方々に提供されたことはございますか?また今後提供していく予定はありますでしょうか?
[大元] 予測モデルを精査すれば新しい知見が得られる可能性はありますが、現状、何か把握してるものは特にございません。ですので、そのような情報を馬主や競馬主催者に提供したことはございませんし、その予定も今のところ無いです。
こちらの講演動画などは後ほど共有されたりしますでしょうか??
[大元] チケット購入者はアーカイブが期間限定で視聴できるそうです。詳細は主催のデータサイエンティスト協会へお問い合わせください。
予想確度について質問です!「10%的中すると予測した券」において、“的中した馬券・舟券"と"外れた馬券・舟券"のオッズの分布は異なりますか?「的中した馬券はオッズが低い位置に偏っている」「外れた馬券はオッズが高い位置に偏っている」など
[貫井] 現在、我々が利用してるモデルでは以下の図が示すように、同確率と推定された馬券のオッズ分布は的中・不的中に依る偏りは見られません。
競馬やボートレースだと、税金など予測精度以外にも考えないといけない面倒な要素がいろいろあると思います。機械学習のお金に関する活用先として、株式市場などと比べてギャンブルの有利な点、面白い点などあればぜひお聞かせ頂ければ。
[貫井]
- 競馬は1回の投資が短期で完結し、中央競馬だけでも年間数千レース開催されるので、PDCAのサイクルを効率的に回すができ、また複利効果の恩恵が大きい
- 競馬は結果が決まる過程がレース映像としてリアルタイムで視覚的に確認できるので面白い
事業観点も興味深いですが、是非とも技術観点に寄った議論を聞きたいです。
[大元] 後日、改めて回答する機会を設けたいと思います。続報をお待ちください。
予測モデルの評価など技術的な観点についてもお聞きしたいです。
[大元] 後日、改めて回答する機会を設けたいと思います。続報をお待ちください。
どのくらいのスパンでモデルの更新等をおこなっていますか
[貫井] 利用してるモデルによって異なりますが、3ヶ月〜1年単位の更新頻度です。ただし、新しい特徴量やアイディアが思い浮かんだ時には、不定期で新規モデルの実験を行い、入れ替えを検討しています。
以上となります。
今回のパネルディスカッションでは時間が足りず議論できなかったことがたくさんあります。そこで、近々、今回のパネリスト+αで生配信を予定しています。詳細が決まり次第、改めて発表しますので、続報をお待ちいただけますと幸いです。