特開2022-98507 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 杉村紀夫の特許一覧

特開2022-98507データ構造

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022098507

(43)【公開日】2022-07-04

(54)【発明の名称】データ構造

(51)【国際特許分類】

G06Q 50/34 20120101AFI20220627BHJP

【ＦＩ】

G06Q50/34

【審査請求】未請求

【請求項の数】3

【出願形態】ＯＬ

(21)【出願番号】P 2020211903

(22)【出願日】2020-12-22

(71)【出願人】

【識別番号】718000680

【氏名又は名称】杉村紀夫

(72)【発明者】

【氏名】杉村紀夫

【テーマコード（参考）】

5L049

【Ｆターム（参考）】

5L049CC54

(57)【要約】

【課題】
競走馬の将来の成績の序列予測に用いることにより、ＰＯＧにおいてゲーム参加者が候補馬をより効率的に選択できるように支援するデータ構造を提供する。
【解決手段】
競走馬の父、母父、性別、調教師、馬主、生産者、取引価格、母の競走成績、誕生月日、誕生時の母年齢から選択される少なくとも３つ以上のファクターを含むデータ構造であって、各データが上記ファクターごとで括られる過去世代の競走馬の成績に基づく数値データからなり、各データの重み係数に基づく演算をコンピュータに行わせることにより各競走馬を相対比較しうるスコア値を出力するようにしたものである。
【選択図】図１

【特許請求の範囲】

【請求項1】

競走馬の父、母父、性別、調教師、馬主、生産者、取引価格、母の競走成績、誕生月日、誕生時の母年齢から選択される少なくとも３つ以上のファクターを含むデータ構造であって、各データが前記ファクターごとで括られる過去世代の競走馬の成績に基づく数値データからなり、各データの重み係数に基づく演算をコンピュータに行わせることにより各競走馬を相対比較しうるスコア値を出力することを特徴とする、競走馬の成績予測に用いられるデータ構造。

【請求項2】

請求項１に記載のデータ構造において、成績予測を行おうとする対象世代より過去世代の競走馬の前記データ構造を学習用データとして用いて、前記各データを説明変数とし、前記過去世代の競走馬の成績を表す情報を目的変数としてコンピュータに学習させることにより前記重み係数を得ることを特徴とする、データ構造。

【請求項3】

請求項２に記載のデータ構造において、前記重み係数を決定する方法として、過去世代のｍ頭の競走馬を賞金の大きい順に並べた１番目からｉ（但しｉ＝１，２，３，・・・，ｎ（ｎ≦ｍ））番目の馬までの賞金合計と、前記スコア値の大きい順に並べた１番目からｉ番目の馬までの賞金合計との差の、ｉ＝１番目からｎ番目までの積算値が最小となるように、前記重み係数が決定されることを特徴とする、データ構造。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、競走馬の成績予測に用いられるデータ構造に関する。

【背景技術】

【0002】

ＰＯＧ（ＰａｐｅｒＯｗｎｅｒＧａｍｅ）とは、参加者が現実の競走馬を仮想馬主として選択し、選択した競走馬の競走成績により得られる賞金を換算したポイントを競うゲームの一種である。ゲームの参加者は実際の馬主になるのではなく、「紙上での馬主」になることから、ＰａｐｅｒＯｗｎｅｒと云われる。競馬雑誌やインターネット媒体が主催するＰＯＧでは、多いもので数万人が参加する大規模なものもあり、獲得ポイント上位入賞者に賞品が授与されるなど、広く普及している。中央競馬を対象とする一般的なＰＯＧのルールとしては、２歳新馬戦開始から翌年の東京優駿施工日の最終競走までの１年間を期間とし、未出走の新馬から１０頭前後を選択、ポイントは１着から５着までの本賞金を１万分の１程度に換算、選択馬の獲得したポイントの合計により勝敗を決めるものが多い。

【0003】

毎年４月から６月にかけて、選択候補となる２歳馬の情報を掲載した書籍、いわゆるＰＯＧ本が出版される。例えば、「ＰＯＧの達人」光文社、「天才のＰＯＧ青本」メディアボーイ、「競馬王のＰＯＧ本」ガイドワークス、「丸ごとＰＯＧ」サンケイスポーツなどがある。また、当該時期には多くの競馬雑誌、競馬専門紙、例えば、「優駿」中央競馬ピーアール・センター、「サラブレ」ＫＡＤＯＫＡＷＡなど、においてＰＯＧの特集記事が組まれる。

【0004】

ＰＯＧにおいて、将来、本賞金を多く獲得する可能性の高い２歳馬をいかに上手く選択できるかは、書籍、雑誌の情報の他、インターネットなどの大量の情報を効率よく取捨し、重要な情報を選別する技術に依るところが大きい。しかし、各種メディアから提供される２歳馬についての情報は、牧場、厩舎関係者、馬主らによるコメントと、記者、評論家らによる主観的な評価が主だったもので、客観性に乏しい。

【0005】

競馬王編集部編「負けないＰＯＧ入門」白夜書房出版２００９年には、競走馬の父、母、母父、性別、調教師、馬主、生産者、誕生月日、取引価格、募集価格といった客観的なデータを分析することにより、候補馬を絞り込む方法が記載されている。著書において、競走馬の父、性別、調教師、馬主、生産者、誕生月日といった各ファクターを比較するのに、１走あたり賞金という指標を用いている。

【0006】

１走あたり賞金とは、例えば調教師というファクターでデータを整理する場合、各調教師の厩舎に所属していた過去何世代かの競走馬のＰＯＧ期間中の本賞金合計をＰＯＧ期間中の総出走回数で除した値である。例えば、２００９年にデビューする２歳馬を評価する場合、過去５世代の１走あたり賞金を計算するなら、２００２年生まれの馬の２００４年の２歳戦から２００５年東京優駿までの３歳戦、２００３年生まれの馬の２００５年の２歳戦から２００６年東京優駿までの３歳戦、２００４年生まれの馬の２００６年の２歳戦から２００７年東京優駿までの３歳戦、２００５年生まれの馬の２００７年の２歳戦から２００８年東京優駿までの３歳戦、２００６年生まれの馬の２００８年の２歳戦から２００９年東京優駿までの３歳戦を対象にする。

【0007】

各ファクターの１走あたり賞金は、ＪＲＡシステムサービス株式会社が提供するＪＲＡ公式データを使った競馬情報サービスＪＲＡ－ＶＡＮＤａｔａＬａｂ．（登録商標）からインターネット経由でコンピュータにデータを取り込み、対応するアプリケーションプログラム、例えば「ＴＡＲＧＥＴｆｒｏｎｔｉｅｒＪＶ」を使用することで得ることができる。

【0008】

著者は、各ファクターのうち特に競走馬の父、生産者、調教師の３つを重視し、１走あたり賞金の低いファクターがひとつでもあれば指名候補から外すことで絞り込む方法を推奨している。

【先行技術文献】

【非特許文献】

【0009】

【非特許文献1】競馬王編集部編「負けないＰＯＧ入門」白夜書房出版２００９年

【発明の概要】

【発明が解決しようとする課題】

【0010】

ＰＯＧで本賞金を多く獲得する可能性の高い素質馬を選択するためには、前準備として、何らかの客観的な指標を用いて候補馬を絞り込む、あるいは候補馬を順位付けできれば効率的である。

【0011】

例えば、競走馬の父、母父、性別、調教師、馬主、生産者、取引価格、母の競走成績、誕生月日、誕生時の母年齢といったファクターで過去何世代かの成績を比較し、全馬に序列をつければ効率よく候補馬を選択できる。

【0012】

しかしながら、日本国内で血統登録される競走馬は年間約７，０００頭、そのうち中央競馬でデビューする競走馬だけでも年間約４，０００頭おり、１頭１頭の各ファクターを詳細に、且つ総合的に比較するには膨大な時間が掛かる問題があった。

【0013】

また、１頭の競走馬が有する複数のファクターのうち、どのファクターを重視して各馬を比較するかは、既存の方法ではゲーム参加者の判断によるため、１走あたり賞金といった客観的なデータを使用したとしても、競走馬の将来の成績の序列を精度よく予測することは難しかった。

【0014】

本発明が解決しようとする課題は、ＰＯＧにおいて、ゲーム参加者の経験やセンスに頼らず一定の予測結果を得ることができ、競走馬の将来の成績の序列予測に用いることにより、ゲーム参加者が候補馬をより効率的に選択できるように支援するデータ構造を提供することにある。

【課題を解決するための手段】

【0015】

本発明による競走馬の成績予測に用いられるデータ構造は、競走馬の父、母父、性別、調教師、馬主、生産者、取引価格、母の競走成績、誕生月日、誕生時の母年齢から選択される少なくとも３つ以上のファクターを含むデータ構造であって、各データが前記ファクターごとで括られる過去世代の競走馬の成績に基づく数値データからなり、各データの重み係数に基づく演算をコンピュータに行わせることにより各競走馬を相対比較しうるスコア値を出力することを特徴とする。

【0016】

また、本発明に係る前記データ構造は、成績予測を行おうとする対象世代より過去世代の競走馬の前記データ構造を学習用データとして用いて、前記各データを説明変数とし、前記過去世代の競走馬の成績を表す情報を目的変数としてコンピュータに学習させることにより前記重み係数を得ることを特徴とする。

【0017】

また、本発明に係る前記データ構造は、前記重み係数を決定する方法として、過去世代のｍ頭の競走馬を賞金の大きい順に並べた１番目からｉ（但しｉ＝１，２，３，・・・，ｎ（ｎ≦ｍ））番目の馬までの賞金合計と、前記スコア値の大きい順に並べた１番目からｉ番目の馬までの賞金合計との差の、ｉ＝１番目からｎ番目までの積算値が最小となるように、前記重み係数が決定されることを特徴とする。

【発明の効果】

【0018】

本発明によれば、ＰＯＧにおいてゲーム参加者の経験やセンスに頼らず一定の予測結果を得ることができる、競走馬の成績の序列予測に用いられるデータ構造を提供することができる。結果、ユーザーは客観的な指標を用いて、ＰＯＧで本賞金を多く獲得する可能性の高い素質馬を効率的に選択することが期待できる。

【図面の簡単な説明】

【0019】

【図1】データ構造により機能されるコンピュータＡの機能構成を示すブロック図である。

【図2】データ構造の作成に用いるコンピュータＢの機能構成を示すブロック図である。

【図3】データ構造の一例としてデータ構造（２０１７）を一部抜粋したものである。

【図4】図２に示したコンピュータによる１走あたり賞金算出処理の処理手順と処理内容の一例を示すフロー図である。

【図5】図２に示したコンピュータによる学習用データ作成処理の処理手順と処理内容の一例を示すフロー図である。

【図6】図２に示したコンピュータによる学習用データ取得処理および重み係数の算出の処理手順と処理内容の一例を示すフロー図である。

【図7】図２に示したコンピュータによる予測用データ作成処理の処理手順と処理内容の一例を示すフロー図である。

【図8】図２に示したコンピュータによる成績予測モデルであるデータ構造の作成手順と処理内容の一例を示すフロー図である。

【図9】図２に示したコンピュータによって取得される実績データＤ１の一例、実績データＤ１（２００７－２０１６）を示す図である。

【図10】図２に示したコンピュータによって算出される１走あたり賞金データセットＤ２の一例、１走あたり賞金データセットＤ２（２００７－２０１６）を示す図である。

【図11】図２に示したコンピュータによって作成される学習用データＤ３の一例、学習用データＤ３（２０１２）を示す図である。

【図12】図２に示したコンピュータによって取得される予測用データＤ４の一例、予測用データＤ４（２０１７）を示す図である。

【図13】図２に示したコンピュータによって作成されるスコア算出用データＤ５の一例、スコア算出用データＤ５（２０１７）を示す図である。

【図14】図1に示したコンピュータによるデータ構造のプロフィルデータ補足の処理手順と処理内容の一例を示すフロー図である。

【図15】データ構造（２０１７）によるスコア値の分布を示すヒストグラムおよびスコア値の各区間における本賞金１００位内発生率、本賞金２００位内発生率を示すグラフである。

【発明を実施するための形態】

【0020】

本発明に係るデータ構造は、データ構造を取り込んだコンピュータに演算を行わせ、スコア値を出力させる。本発明のデータ構造は、コンピュータに直接指令するプログラムではないが、データ要素間の相互関係と組み込まれた演算式により、コンピュータの処理を規定し、他のプログラムとの組み合わせでコンピュータを機能させるものである。

【0021】

まず、本発明の実施形態に係るデータ構造が機能させるコンピュータＡの構成について説明する。図１は、データ構造により機能されるコンピュータＡの機能構成を示す概略ブロック図である。コンピュータＡは、入出力インタフェースユニット１０と、制御ユニット２０と、記憶ユニット３０とを備えている。

【0022】

入出力インタフェースユニット１０は、インタフェースと、入力デバイスと、ディスプレイ装置（いずれも図示せず）から構成される。インタフェースは、有線または無線の通信ネットワークを介して外部データベースとの間で情報の送受信を行う。また、入力デバイスは、ユーザーによって入力された種々のデータを制御ユニット２０に入力するための、キーボードやマウス等を含む装置である。また、ディスプレイ装置は、制御ユニット２０から出力された表示データをユーザーに提示する、例えば液晶ディスプレイなどの表示デバイスである。

【0023】

制御ユニット２０は、ハードウェアプロセッサであるＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）と、プログラムメモリである主記憶装置（いずれも図示せず）から構成される。

【0024】

記憶ユニット３０は、補助記憶装置（図示せず）から構成される。補助記憶装置は、記憶媒体として例えばＨＤＤ（ＨａｒｄＤｉｓｃＤｒｉｖｅ）またはＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の随時書き込みおよび読み出しが可能な不揮発メモリを使用したものの他、光磁気ディスク、ＣＤ－ＲＯＭ、ＤＶＤ―ＲＯＭ等を使用したものも含む。

【0025】

本発明の実施形態に係るデータ構造は、補助記憶装置に記憶されていてもよい。ＣＰＵは、データ構造を補助記憶装置から読み出して主記憶装置に展開し、データ構造により規定された所定の処理を実施する。

【0026】

また、本発明の実施形態に係るデータ構造が通信回線によってコンピュータＡに配信される場合、インタフェースを介して配信を受けたコンピュータＡのＣＰＵがデータ構造を主記憶装置に展開し、所定の処理を実行してもよい。

【0027】

コンピュータＡは、機能的には、制御ユニット２０に補足用データ取得部２１と、データ構造補足部２２と、スコア算出部２３と、出力制御部２４とを、記憶ユニット３０にデータ構造格納部３１を備えて構成される。記憶ユニット３０は、ファクターデータ記憶部３２を備えていてもよい。

【0028】

データ構造格納部３１は、成績予測を行おうとする対象世代の競走馬の成績予測モデルであるデータ構造を記憶する。データ構造格納部３１に記憶されているデータ構造は、本賞金が上位となる競走馬の発生しやすさを表すスコア値を算出するのに最低限必要な、成績予測を行おうとする対象世代の競走馬に関するプロフィル情報と、各ファクターに対応する数値データと、スコア値算出に用いられる重み係数と、スコア値算出式とを備えている。

【0029】

ファクターデータ記憶部３２は、ファクターごとで括られる過去世代の競走馬の成績に基づく数値データ、例えば１走あたり賞金データ等を記憶する。

【0030】

補足用データ取得部２１は、入出力インタフェースユニット１０を介してインターネット経由で、外部データベース、例えば競馬情報サービスＪＲＡ－ＶＡＮデータラボから、成績予測を行おうとする対象世代の競走馬に関するプロフィルを補足するためのデータを取得する。もしくは、記憶ユニット３０を介して磁気ディスクや光ディスクなどのコンピュータ読み取り可能な記録媒体から、同質のデータを読み取ってもよい。

【0031】

データ構造補足部２２は、記憶ユニット３０のデータ構造格納部３１に記憶されているデータ構造を読み出し、補足用データ取得部２１によって取得されたデータをデータ構造と結合し、プロフィルを補足する処理を行う。あるいは、データ構造補足部２２は、ユーザーによるキーボードやマウスなどの入力デバイスの手動操作により、データ構造のプロフィル情報が補正もしくは補足される際にも機能する他、スコア値を算出するのに使用する重み係数が直接入力される際にも機能する。また、データ構造補足部２２は、記憶ユニット３０のファクターデータ記憶部３２に記憶されている数値データを読み出し、上記手順により補足されたプロフィルに該当する数値データを抽出し、データ構造に取り込む処理を行う。

【0032】

スコア算出部２３は、データ構造の各データの重み係数に基づく演算を行うことにより、本賞金が上位となる競走馬の発生しやすさを表すスコア値を算出する。また、スコア算出部２３は、算出したスコア値をデータ構造に取り込む処理を行う。

【0033】

出力制御部２４は、スコア算出部２３で算出されたスコア値に基づいて出力用のデータを作成し、入出力インタフェースユニット１０を介して表示デバイスや外部端末に出力する処理を行う。例えば、出力制御部２４は、指名候補馬に対してスコア値上位順に優先度付けを行った優先度リストを出力データとして作成することができる。

【0034】

以下、各ファクターに対応する数値データとして、１走あたり賞金データを用いる実施形態を例に説明するが、これだけに限定されない。本発明の要旨を逸脱しない範囲で、競走馬の成績に基づく種々の数値データを用いることができる。

【0035】

本発明の実施形態に係る、データ構造の作成に用いるコンピュータＢについて説明する。図２は、コンピュータＢの概略ブロック図およびシステム構成図の例である。コンピュータＢは、ハードウェアとして、入出力インタフェースユニット１０と、制御ユニット２０と、記憶ユニット３０とを備えている。

【0036】

各ユニットの詳細構成は、データ構造が機能させるコンピュータＡの構成と同様である。データ構造の作成に用いるコンピュータＢは、データ構造が機能させるコンピュータＡと同一であっても構わないし、別のコンピュータであっても構わない。

【0037】

記憶ユニット３０は、本実施形態を実現するために必要な記憶領域として、実績データ記憶部３０１と、１走あたり賞金データ記憶部３０２と、学習用データ記憶部３０３と、学習済みデータ記憶部３０４と、スコア算出用データ記憶部３０５と、データ構造格納部３０６とを備えている。

【0038】

実績データ記憶部３０１は、既にＰＯＧ期間の終了した過去の競走馬に関するプロフィル情報と、例えば期間中の出走回数と獲得した本賞金など成績を表す情報とを関連づけた、実績データＤ１を記憶する。

【0039】

１走あたり賞金データ記憶部３０２は、実績データＤ１に基づいて算出される、各ファクターの区分されたグループごとの１走あたり賞金情報を含む、１走あたり賞金データセットＤ２を記憶する。

【0040】

学習用データ記憶部３０３は、実績データＤ１から抽出された過去の競走馬のプロフィル情報と、１走あたり賞金データセットＤ２から抽出された各ファクターに対応する１走あたり賞金情報を含む、学習用データＤ３を記憶する。

【0041】

学習済みデータ記憶部３０４は、学習用データＤ３を使用して予測モデルを生成した結果算出された重み係数Ｗ、および予測モデルと同じスコア値算出式を記憶する。

【0042】

スコア算出用データ記憶部３０５は、成績予測を行おうとする対象世代の競走馬の予測モデルを作成するのに使用する、スコア算出用データＤ５を記憶する。

【0043】

データ構造格納部３０６は、成績予測を行おうとする対象世代の競走馬の成績予測モデルであるデータ構造を記憶する。

【0044】

制御ユニット２０は、本実施形態における処理機能を実行するために、実績データ取得部２０１と、１走あたり賞金算出部２０２と、学習用データ作成部２０３と、学習用データ取得部２０４と、学習部２０５と、予測用データ取得部２０６と、スコア算出用データ作成部２０７と、データ構造作成部２０８と、スコア算出部２０９とを備えている。これらの各部における処理機能はいずれもプログラムメモリに格納されたプログラムを上記ハードウェアプロセッサに実行させることによって実現される。なお、これらの処理機能は、プログラムメモリに格納されたプログラムを用いて実現されるものではなく、ネットワークを通して提供されるプログラムを用いて実現されてもよい。

【0045】

実績データ取得部２０１は、入出力インタフェースユニット１０を介して、入力デバイスや外部データベースなどから、既にＰＯＧ期間の終了した過去の競走馬に関するプロフィル情報と、例えば期間中の出走回数と期間中に獲得した本賞金など成績を表す情報とを取得し、それらを関連づけた実績データＤ１を作成し、実績データ記憶部３０１に格納する。

【0046】

１走あたり賞金算出部２０２は、記憶ユニット３０の実績データ記憶部３０１に記憶された実績データＤ１を読み出し、それぞれのファクターのグループごとに１走あたり賞金を表すデータセットＤ２を生成する処理を実行する。１走あたり賞金算出部２０２は、取得した過去の全データから上記１走あたり賞金を算出してもよいし、任意の数世代のデータから上記１走あたり賞金を算出してもよい。ファクターごとに、１走あたり賞金の算出に用いるデータの世代数が違っていてもよい。

【0047】

学習用データ作成部２０３は、記憶ユニット３０の実績データ記憶部３０１に記憶された実績データＤ１および１走あたり賞金データ記憶部３０２に記憶されている１走あたり賞金データセットＤ２を読み出し、競走馬の成績を予測するための予測モデルを生成するために用いられる、学習用データＤ３を作成する処理を行う。学習用データＤ３には、成績予測を行おうとする対象世代より過去世代の競走馬の実績データＤ１が用いられる。また、学習用データＤ３には、上記実績データＤ１が対象とする世代よりさらに１世代以上過去の世代の実績データを用いて算出された１走あたり賞金データセットＤ２が、実績データＤ１と組み合わせられ用いられる。学習用データ作成部２０３は、作成した学習用データＤ３を学習用データ記憶部３０３に格納する。

【0048】

学習用データ取得部２０４は、記憶ユニット３０の学習用データ記憶部３０３に記憶されているデータを読み出し、競走馬の成績を予測するための予測モデルを生成するために用いられる、複数の学習用データＤ３を結合した１つの学習用データＤ３を生成する処理を行う。

【0049】

学習部２０５は、学習用データＤ３を用いて統計分析する処理を実行する。例えば、学習部２０５は、上記学習用データＤ３中の１走あたり賞金を説明変数とし、さらに、当該データセットに含まれる過去世代の競走馬の成績を表す情報である本賞金を目的変数として、上記目的変数が上位の競走馬の発生しやすさを表すスコア値を上記説明変数から算出するための、各ファクターに対応する重み係数を最適化する処理を実行する。得られた重み係数Ｗは、学習済みデータ記憶部３０４にて記憶される。また、得られた重み係数Ｗは、予測モデルに取り込むことで予測処理に用いることができる。また、重み係数Ｗを最適化する処理に用いたのと同じスコア値算出式が、学習済みデータ記憶部３０４にて記憶される。

【0050】

予測用データ取得部２０６は、入出力インタフェースユニット１０を介して、入力デバイスや外部データベースなどから、成績予測を行おうとする対象世代の競走馬に関するプロフィル情報を表すデータを取得し、予測用データＤ４を作成する。予測用データ取得部２０６は、上記予測用データＤ４に対応する成績予測を行おうとする対象世代より、１世代以上過去の世代の実績データを用いて算出された１走あたり賞金データ記憶部３０２に記憶された１走あたり賞金データセットＤ２を読み出す。

【0051】

スコア算出用データ作成部２０７は、予測用データ取得部２０６が作成した予測用データＤ４と１走あたり賞金データセットＤ２とを用いて、競走馬の成績を予測するための予測モデルを生成するための、スコア算出用データＤ５を作成する処理を行う。スコア算出用データ作成部２０７は、作成したスコア算出用データＤ５をスコア算出用データ記憶部３０５に格納する。

【0052】

データ構造作成部２０８は、スコア算出用データ記憶部３０５に記憶されたスコア算出用データＤ５に、学習済みデータ記憶部３０４に記憶された重み係数Ｗと、スコア値算出式を組み込むことで、予測モデルであるデータ構造を生成する。

【0053】

スコア算出部２０９は、データ構造の各データの重み係数に基づく演算を行うことにより、本賞金が上位となる競走馬の発生しやすさを表すスコア値を算出する。また、スコア算出部２０９は、算出したスコア値をデータ構造に取り込む処理を行う。スコア算出部２０９は、作成したデータ構造をデータ構造格納部３０６に格納する。

【0054】

本発明の実施形態に係るデータ構造について説明する。データ構造は、例えばＭｉｃｒｏｓｏｆｔ社のＥＸＣＥＬ（登録商標）等の表計算ソフトを使用することにより作成される。

【0055】

図３にデータ構造の一例を示す。１つの行に１頭の競走馬の馬名、誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格といった、いわゆるプロフィルが表される。本発明のデータ構造は、こうしたプロフィルを表すファクターを少なくとも３つ以上含む。

【0056】

これらのうち馬名、調教師、馬主といった情報は、未出走馬では未定である場合も多く、空欄であっても構わない。たとえ馬名が未定であっても、１頭の母馬がその年に出産する馬は通常１頭であるので、母名でもって競走馬を特定することができる。

【0057】

また、取引価格も市場取引された場合を除き公にならない場合が多いので、空欄であっても構わない。

【0058】

データ構造を構成する各データは、これらプロフィルを表す各ファクターに対応する数値データである。各データは図３のように、ファクターの直近に併記しておくのが好ましい。

【0059】

また、データ構造は、各データの重み係数に基づく演算の結果であるスコア値を含んでいてもよい。演算は任意に定めた式もしくは関数の組み合わせによるものであり、スコア値の大小を比べることにより、各競走馬を相対比較することを目的とするものである。

【0060】

次に、本発明の実施形態に係るプロフィルを表す各ファクターについて説明する。各データは、ファクターごとで括られる過去世代の競走馬の成績に基づく数値データからなる。以下、個々のファクターと対応する数値データの算出方法について説明する。

【0061】

競走馬の父とは、すなわち種牡馬を意味するファクターである。競走馬の父で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、同じ種牡馬を父とする産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0062】

競走馬の父で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、３～１０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。逆に世代数が多すぎると、過去の成績が強く反映され、近年の産駒成績が不振であっても過大評価となる傾向がある。

【0063】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の父で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、種牡馬Ａを父とする産駒全体の総本賞金が１０億円で総出走回数が１０００回であれば、数値データは１００万円となる。

【0064】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。所定の総出走回数に満たない場合、競走馬の父ファクターの数値データをなしとしても構わない。所定の総出走回数として、好ましくは３０走から１００走以上を境とする。成績の序列予測を行おうとする対象世代が競走馬デビューする初めての世代となる新種牡馬の場合も、過去世代が存在しないため、数値データなしとする。

【0065】

競走馬の母父とは、競走馬の母方の祖父に当たる種牡馬を意味するファクターである。競走馬の母父で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、同じ種牡馬を母方の祖父とする産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0066】

競走馬の母父で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。しかし、母馬は国内生産されるのみならず諸外国から輸入される場合もあるため、競走馬の父に比べて競走馬の母父は多様であり数が多い。そのため、世代あたりの同一の母父を持つ競走馬の総出走回数は、同一の父を持つ競走馬の総出走回数に比べると少ない傾向にある。よって、数値データを算出するのに、競走馬の父がファクターの場合よりも多くの過去世代の成績データを用いるのが好ましい。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、５～２０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。逆に世代数が多すぎると、過去の成績が強く反映され、近年の産駒成績が不振であっても過大評価となる傾向がある。

【0067】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の母父で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、種牡馬Ｂを母父とする産駒全体の総本賞金が１０億円で総出走回数が１０００回であれば、数値データは１００万円となる。

【0068】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。所定の総出走回数に満たない場合、競走馬の母父ファクターの数値データをなしとしても構わない。所定の総出走回数として、好ましくは３０走から２００走以上を境とする。成績の序列予測を行おうとする対象世代が競走馬デビューする初めての世代となる母父の場合も、過去世代が存在しないため、数値データなしとする。

【0069】

競走馬の性別をファクターとして数値データを計算してもよい。競走馬の性別は牡馬、牝馬、セン馬の３種類あるが、デビュー前の２歳のうちに牡馬がセン馬となることは稀であるため、牡馬とセン馬を一括りのファクターとして扱っても構わない。

【0070】

競走馬の性別で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、牡馬・セン馬で括る群と牝馬で括る群の産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0071】

競走馬の性別で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、５～２０世代の競走馬の成績データを用いる。

【0072】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の性別で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、牡馬・セン馬の産駒全体の総本賞金が１０００億円で総出走回数が１０万回であれば、数値データは１００万円となる。

【0073】

もしくは性別と他のファクターとを組み合わせて数値データを求めてもよい。例えば、種牡馬によっては産駒の成績に、性別により偏りがあることが知られている。そこで、競走馬の父を同じくする牡馬・セン馬、もしくは競走馬の父を同じくする牝馬で括り、それぞれに分けて数値データを計算してもよい。この場合、牡馬・セン馬、牝馬とで分ける以外は、競走馬の父がファクターの場合と同様に、数値データを計算する。

【0074】

競走馬の調教師とは、すなわち競走馬が所属する厩舎を意味するファクターである。競走馬の調教師で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、同じ厩舎に所属した産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0075】

競走馬の調教師で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、３～１０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。逆に世代数が多すぎると、過去の成績が強く反映され、近年の成績が不振であっても過大評価となる傾向がある。

【0076】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の調教師で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、調教師Ｃの管理する産駒全体の総本賞金が１０億円で総出走回数が１０００回であれば、数値データは１００万円となる。

【0077】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。所定の総出走回数に満たない場合、競走馬の調教師ファクターの数値データをなしとしても構わない。所定の総出走回数として、好ましくは３０走から１００走以上を境とする。成績の序列予測を行おうとする対象世代が競走馬デビューする初めての世代となる新人調教師の場合、過去世代が存在しないため、数値データなしとなる。また、デビュー前の２歳馬は、調教師が決まっていないか決まっていても未公表の場合も多い。このように調教師が未定である場合も、数値データなしとして構わない。

【0078】

競走馬の馬主をファクターとして数値データを計算してもよい。競走馬の馬主で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、同じ馬主が所有した産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0079】

競走馬の馬主で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、３～１０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。逆に世代数が多すぎると、過去の成績が強く反映され、近年の成績が不振であっても過大評価となる傾向がある。

【0080】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の馬主で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、馬主Ｄの所有する産駒全体の総本賞金が１０億円で総出走回数が１０００回であれば、数値データは１００万円となる。

【0081】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。所定の総出走回数に満たない場合、競走馬の馬主ファクターの数値データをなしとしても構わない。所定の総出走回数として、好ましくは３０走から１００走以上を境とする。成績の序列予測を行おうとする対象世代が競走馬デビューする初めての世代となる新参馬主の場合、過去世代が存在しないため、数値データなしとなる。デビュー前の２歳馬は、馬主が決まっていないか決まっていても未公表の場合も多い。このように馬主が未定である場合も、数値データなしとして構わない。

【0082】

競走馬の生産者とは、すなわち競走馬の生産牧場を意味するファクターである。競走馬の生産者で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、同じ牧場で生産された産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0083】

競走馬の生産者で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、３～１０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。逆に世代数が多すぎると、過去の成績が強く反映され、近年の成績が不振であっても過大評価となる傾向がある。

【0084】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の生産者で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、生産者Ｅの生産した産駒全体の総本賞金が１０億円で総出走回数が１０００回であれば、数値データは１００万円となる。

【0085】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。所定の総出走回数に満たない場合、競走馬の生産者ファクターの数値データをなしとしても構わない。所定の総出走回数として、好ましくは３０走から１００走以上を境とする。成績の序列予測を行おうとする対象世代が競走馬デビューする初めての世代となる新参生産者の場合、過去世代が存在しないため、数値データなしとなる。

【0086】

競走馬の取引価格をファクターとして数値データを計算してもよい。ＪＲＡ－ＶＡＮが提供するデータには、日本国内で開催されている競走馬取引市場の取引価格データが含まれており、競走馬の取引価格を参照することができる。競走馬の取引価格をいくつかの価格帯に区分して、競走馬の価格帯で括られる過去世代の競走馬の成績に基づく数値データを算出する。価格帯の例として、１００万円未満、１００万～５００万円未満、５００万～１０００万円未満、１０００万～２０００万円未満、２０００万～３０００万円未満、３０００万～５０００万円未満、５０００万～７０００万円未満、７０００万～１億円未満、１億円以上のように分割する。

【0087】

競走馬の価格帯で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、同じ価格帯の産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0088】

競走馬の価格帯で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、５～２０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。逆に世代数が多すぎると、競走馬の取引価格は経済情勢に影響されるため、取引価格と成績との相関が近年のデータと過去のデータとの間で乖離が大きくなり不具合が生じる。

【0089】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の価格帯で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、取引価格１０００万～２０００万円の産駒全体の総本賞金が１００億円で総出走回数が１万回であれば、数値データは１００万円となる。

【0090】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。総出走回数が１００走に満たない取引価格帯が発生するような区分は避ける。

【0091】

競走馬の母の競走成績をファクターとして数値データを計算してもよい。競走馬の母の競走成績をいくつかの成績グループに区分して、競走馬の母の競走成績グループで括られる過去世代の競走馬の成績に基づく数値データを算出する。競走成績グループで区分する方法として、例えばＰＯＧ期間中の合計本賞金額や１走あたり賞金で区分する方法がある。

【0092】

競走馬の母の競走成績グループで括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、母が同じ成績グループに属していた産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0093】

競走馬の母の競走成績で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、５～２０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。

【0094】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の母の競走成績グループで括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、ＰＯＧ期間中の合計本賞金額が５００万～１０００万円の競走馬の母の産駒全体の総本賞金が１００億円で総出走回数が１万回であれば、数値データは１００万円となる。

【0095】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。総出走回数が１００走に満たない競走馬の母の競走成績グループが発生するような区分は避ける。競走馬の母が海外から輸入されたなどの事情で、国内での競走成績がない場合は、数値データなしとして構わない。

【0096】

競走馬の誕生月日をファクターとして数値データを計算してもよい。誕生月日をいくつかの期間に区分して、同じ誕生期間で括られる過去世代の競走馬の成績に基づく数値データを算出する。最も簡単な方法としては、誕生月で区分する方法がある。誕生期間で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、誕生月日を区分して同じ期間に属していた産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0097】

誕生期間で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、５～２０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。

【0098】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、誕生期間で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、４月生まれの産駒全体の総本賞金が１００億円で総出走回数が１万回であれば、数値データは１００万円となる。

【0099】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。総出走回数が１００走に満たない誕生期間が発生するような区分は避ける。７月から１２月生まれの競走馬は、例えば南半球での生産馬が該当するが日本で競走馬登録される頭数は比較的少なく、個々の誕生月で区分すると総出走回数が１００走に満たない場合も生じる。総出走回数が少ない区分が発生するのを避けるため、例えば７月から１２月生まれの競走馬を一つの群として構わない。

【0100】

競走馬の出産時の母の年齢をファクターとして数値データを計算してもよい。競走馬の出産時の母の年齢で括られる過去世代の競走馬の成績に基づく数値データを算出する。競走馬の誕生時の母年齢で括られる過去世代の競走馬とは、２歳世代から過去の世代にあたる３歳以上の世代の、出産時の母の年齢が同じであった産駒群を表す。ここでいう世代とは、同一年に誕生した競走馬を１世代とする。

【0101】

競走馬の誕生時の母年齢で括られる過去世代の競走馬の成績に基づく数値データを算出するのに、十分な世代数の成績データを用いる。好ましい世代数としては、成績の序列予測を行おうとする未出走世代に対して直近の１世代前を含む、５～２０世代の競走馬の成績データを用いる。世代数が少なすぎると信頼性に足る十分な量のデータが得られない。

【0102】

数値データの形式として１走あたり賞金に限定されないが、例えば数値データとして１走あたり賞金を計算するには、競走馬の誕生時の母年齢で括られる過去の所定の世代の競走馬のＰＯＧ期間中の総本賞金合計を、ＰＯＧ期間中の総出走回数で除することで求められる。例えば、競走馬の誕生時の母年齢が１０歳の産駒全体の総本賞金が１００億円で総出走回数が１万回であれば、数値データは１００万円となる。

【0103】

数値データを求める際、総出走回数があまりにも少ないと、個々の賞金データからの計算結果が不安定となり、信頼性に足りる数値データが得られない。誕生時の母年齢が２０歳以上である競走馬は比較的少なく、個々の母年齢で区分すると総出走回数が１００走に満たない場合も生じる。総出走回数が少ない区分が発生するのを避けるため、例えば誕生時の母年齢が２０歳以上の産駒を一つの群として構わない。

【0104】

次に、本発明の実施形態に係る、演算に用いる各データの重み係数について説明する。コンピュータに、ファクターごとの数値データに対して重み係数に基づく演算を行わせることにより各競走馬を相対比較できるスコア値を出力させる。

【0105】

演算方法として、例えば各ファクターの数値データの加重平均を計算する方法がある。ｆ個のファクターの数値データｘ１,ｘ２,・・・,ｘｆに対して、それぞれの重み係数をｗ１,ｗ２,・・・,ｗｆとすると、演算方法は式１で表される。
式１・・・（ｗ１ｘ１＋ｗ２ｘ２＋・・・＋ｗｆｘｆ）／（ｗ１＋ｗ２＋・・・ｗｆ）

【0106】

演算方法として、例えば各ファクターの数値データの加重調和平均を計算する方法がある。ｆ個のファクターの数値データｘ１,ｘ２,・・・,ｘｆに対して、それぞれの重み係数をｗ１,ｗ２,・・・,ｗｆとすると、演算方法は式２で表される。
式２・・・（ｗ１＋ｗ２＋・・・＋ｗｆ）／（ｗ１／ｘ１＋ｗ２／ｘ２＋・・・ｗｆ／ｘｆ）

【0107】

加重平均、加重調和平均といった重み付き平均値を採用する場合、重み係数が大きいファクターほど重要度が高く、演算結果のスコア値が大きいほど成績の予測序列結果が上位であり、成績上位の競走馬が発生する確率が高いことを意味する。

【0108】

重み係数は、ＰＯＧ期間中の成績が既に確定している過去の世代について、成績の序列を予測した結果が最良に近い結果になるように、最適化した数値を用いる。

【0109】

重み係数の最適化の方法として、過去世代のｍ頭の競走馬を本賞金の大きい順に並べた１番目からｉ（但しｉ＝１，２，３，・・・，ｎ（ｎ≦ｍ））番目の馬までの賞金合計と、各データの重み係数に基づくスコア値の大きい順に並べた１番目からｉ番目の馬までの賞金合計との差の、ｉ＝１からｎまでの積算値が最小となるように、各データの重み係数が決められる。

【0110】

本賞金の大きい順に並べたｋ番目の馬の賞金をａ_ｋで表すとすると、１番目からｉ番目の馬までの賞金合計は式Ａで表現される。

【0111】

一方、各データの重み係数に基づく演算結果のスコア値の大きい順に並べたｋ番目の馬の賞金をｂ_ｋで表すとすると、１番目からｉ番目の馬までの賞金合計は式Ｂで表現される。

【0112】

本賞金の大きい順に並べた１番目からｉ番目の馬までの賞金合計と、各データの重み係数に基づく演算結果のスコア値の大きい順に並べた１番目からｉ番目の馬までの賞金合計との差は、（式Ａ－式Ｂ）となる。

【0113】

よって、本賞金の大きい順に並べた１番目からｉ番目の馬までの賞金合計と、各データの重み係数に基づく演算結果のスコア値の大きい順に並べた１番目からｉ番目の馬までの賞金合計との差の、ｉ＝１からｎまでの積算値は式Ｃで表現される。

【0114】

ここで、過去世代のｍ頭の競走馬を本賞金の大きい順に並べることは、成績の予測序列結果が最良となった並べ順を意味する。すなわち式Ａで表される並びの１番目からｉ番目の馬までの賞金合計はｉ！通りあるすべての並び順の中で最大となる。

【0115】

過去の世代の成績の予測序列結果が最良に近いほど、式Ｂで表される各データの重み係数に基づく演算結果のスコア値の大きい順に並べた１番目からｉ番目の馬までの賞金合計は大きくなるが、式Ａで表される実際に本賞金の大きい順に並べた１番目からｉ番目の馬までの賞金合計を超えることはない。

【0116】

例えば、各ファクターの重み係数を段階的に仮定し、式Ｃで表される積算値を計算し、比較するプログラムをコンピュータに実行させることで、積算値が最小となる最適な重み係数を求めことができる。

【0117】

この場合、重み係数ｗ１,ｗ２,・・・,ｗｆとしては、1から１０の自然数や０．１から１．０の少数などを採用することができる。例えば、１から１０の数値を重み係数の候補として計算する場合、ｆ個の重み係数（ｗ１,ｗ２,・・・,ｗｆ）を（１,１,・・・,１）から（１０,１０,・・・１０）まで段階的に変え、１０^ｆ通りの式Ｃで表される積算値を計算させる。計算結果が最小となる組み合わせを、各ファクターの重み係数として採用する。

【0118】

過去世代のｍ頭の競走馬の選択方法としては、成績の序列予測を行おうとする世代に対して直近の１世代前を含む、５～２０世代の競走馬を選択するのが好ましい。世代の全頭を選択してもよいし、データが大きくなりすぎないように各世代の成績上位数百頭を抽出して選択してもよい。

【0119】

こうして得られる重み係数を取り入れたデータ構造を用いることにより、未出走世代の成績の序列予測を行うのに便利な、一定の予測結果が得られる。

【実施例0120】

次に、２０１７年産駒のデータ構造を作成する処理手順を実施例として説明する。重み係数を算出するために、過去５世代分にあたる２０１２年～２０１６年産駒の学習用データを使用した。各ファクターの数値データとして１走あたり賞金を計算するために、当該世代より過去１０世代分にあたる実績データを使用した。すなわち、２０１７年産駒のデータ構造の１走あたり賞金は２００７年～２０１６年産駒の実績データ、２０１２年産駒の学習用データの１走あたり賞金は２００２年～２０１１年産駒の実績データ、２０１３年産駒の学習用データの１走あたり賞金は２００３年～２０１２年産駒の実績データ、２０１４年産駒の学習用データの１走あたり賞金は２００４年～２０１３年産駒の実績データ、２０１５年産駒の学習用データの１走あたり賞金は２００５年～２０１４年産駒の実績データ、２０１６年産駒の学習用データの１走あたり賞金は２００６年～２０１５年産駒の実績データをそれぞれ使用した。

【0121】

（１）１走あたり賞金の算出
図４は、図２に示した制御ユニット２０による、２０１７年産駒のスコア算出用データ作成に使用する１走あたり賞金算出の処理手順と処理内容の一例を示すフロー図である。

【0122】

ステップＳ１０１において、制御ユニット２０は、実績データ取得部２０１の制御の下、入出力インタフェースユニット１０を介して、入力デバイスまたは外部データベース等から、２００７年～２０１６年産駒のプロフィルデータおよび成績データを取得し、実績データＤ１（２００７）～Ｄ１（２０１６）として、実績データ記憶部３０１に記憶させる。

【0123】

次いで、ステップＳ１０２において、実績データ取得部２０１は、実績データＤ１（２００７）～Ｄ１（２０１６）をひとまとめにし、実績データＤ１（２００７～２０１６）を作成し、実績データ記憶部３０１に記憶させる。図９は、作成される実績データＤ１の一例を示す。実績データＤ１には、競走馬の馬名と、競走馬の成績を表す情報として一定の期間中に獲得した本賞金と、前記期間中の出走回数とが少なくとも含まれる。実績データＤ１にはさらに、競走馬のプロフィルを表すファクターとして誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格などが含まれる。

【0124】

ステップＳ１０３において、制御ユニット２０は、１走あたり賞金算出部２０２の制御の下、実績データＤ１（２００７～２０１６）を実績データ記憶部３０１から読み出し、実績データＤ１（２００７～２０１６）のファクターのカラムを参照し、実績データＤ１（２００７～２０１６）のファクターのグループごとに本賞金データと出走回数データを抽出する処理を行う。複数のファクターに対して、プロフィルの特徴により区分されるグループごとに処理を行う。

【0125】

続いて、ステップＳ１０４において、ファクターのグループごとに抽出されたデータに基づき、１走あたり賞金を算出する。１走あたり賞金の算出は、当該グループの本賞金合計を当該グループの出走回数の合計で除することで算出される。

【0126】

ステップＳ１０５において、１走あたり賞金算出部２０２は、算出された１走あたり賞金をファクターのグループに対して結合し、これを１走あたり賞金データｄ２（２００７～２０１６）とする。１走あたり賞金データｄ２は、ファクターごとに複数作成される。図１０は、ファクターに対しての一部のグループの１走あたり賞金データｄ２の例を示す。１走あたり賞金データには、区分されたグループを示す表記と当該グループの１走あたり賞金が含まれる。

【0127】

ステップＳ１０６において、１走あたり賞金算出部２０２は、ファクターごとに作成された複数の１走あたり賞金データｄ２（２００７～２０１６）をひとまとめにし、１走あたり賞金データセットＤ２（２００７～２０１６）を作成する。具体的には、誕生月日、競走馬の父、誕生時の母年齢、競走馬の母父、生産者、調教師、馬主、取引価格などファクターごとに別々のファイルからなる１走あたり賞金データｄ２（２００７～２０１６）を、１つのファイルにまとめる。例えばデータセットＤ２は、データセットＤ２の作成にＥＸＣＥＬ（登録商標）を使用する場合、ファクターごとのデータｄ２を保持するシートを複数有する１つのブックの形態を取ることが好ましい。

【0128】

ステップＳ１０７において、作成された１走あたり賞金データセットＤ２（２００７～２０１６）は、１走あたり賞金データ記憶部３０２に格納される。

【0129】

２０１２年産駒の学習用データ作成に使用する１走あたり賞金データセットＤ２（２００２～２０１１）、２０１３年産駒の学習用データ作成に使用する１走あたり賞金データセットＤ２（２００３～２０１２）、２０１４年産駒の学習用データ作成に使用する１走あたり賞金データセットＤ２（２００４～２０１３）、２０１５年産駒の学習用データ作成に使用する１走あたり賞金データセットＤ２（２００５～２０１４）、２０１６年産駒の学習用データ作成に使用する１走あたり賞金データセットＤ２（２００６～２０１５）も、２０１７年産駒のスコア算出用データ作成に使用する１走あたり賞金データセットＤ２（２００７～２０１６）と同様の処理手順で作成し、１走あたり賞金データ記憶部３０２に格納する。

【0130】

（２）予測モデルの生成
（２－１）学習用データの作成
図５は、図２に示した制御ユニット２０による２０１７年産駒のデータ構造に使用する重み係数を算出するための、学習用データの一部となる２０１２年産駒の学習用データ作成処理の処理手順と処理内容の一例を示すフロー図である。

【0131】

ステップＳ２０１において、制御ユニット２０は、学習用データ作成部２０３の制御の下、実績データ記憶部３０１に記憶された実績データＤ１（２０１２）を読み出す。

【0132】

ステップＳ２０２において、学習用データ作成部２０３は、１走あたり賞金データ記憶部３０２に記憶された１走あたり賞金データセットＤ２（２００２～２０１１）を読み出す。ステップＳ２０２は、ステップＳ２０１の後に実行されても、ステップＳ２０１と同時並行して実行されても、またはステップＳ２０１の前に実行されてもよい。

【0133】

ステップＳ２０３において、学習用データ作成部２０３は、実績データＤ１（２０１２）の各ファクターを参照し、それらの条件に該当する１走あたり賞金データを１走あたり賞金データセットＤ２（２００２～２０１１）から抽出し、結合して、学習用データＤ３（２０１２）を作成する。具体的には、学習用データ作成部２０３は、実績データＤ１（２０１２）から、誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格などを参照し、それらの条件に対応する１走あたり賞金データを１走あたり賞金データセットＤ２（２００２～２０１１）から抽出し、実績データＤ１（２０１２）に結合して、学習用データＤ３（２０１２）を作成する。

【0134】

図１１は、学習用データＤ３の一例を示す。学習用データＤ３には、例えば、実績データＤ１から抽出された、馬名、本賞金、誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格などと、１走あたり賞金データセットＤ２から抽出された、各ファクターに対応する１走あたり賞金が含まれる。

【0135】

ステップＳ２０４において、制御ユニット２０は、作成された学習用データＤ３（２０１２）を学習用データ記憶部３０３に格納する。

【0136】

２０１３～２０１６年産駒の学習用データＤ３（２０１３）、Ｄ３（２０１４）、Ｄ３（２０１５）、Ｄ３（２０１６）も、２０１２年産駒の学習用データＤ３（２０１２）と同様の処理手順で作成する。ただし、学習用データＤ３（２０１３）の作成には実績データＤ１（２０１３）および１走あたり賞金データセットＤ２（２００３～２０１２）を、学習用データＤ３（２０１４）の作成には実績データＤ１（２０１４）および１走あたり賞金データセットＤ２（２００４～２０１３）を、学習用データＤ３（２０１５）の作成には実績データＤ１（２０１５）および１走あたり賞金データセットＤ２（２００５～２０１４）を、学習用データＤ３（２０１６）の作成には実績データＤ１（２０１６）および１走あたり賞金データセットＤ２（２００６～２０１５）を使用する。

【0137】

（２－２）重み係数の最適化
図６は、図２に示した制御ユニット２０による２０１７年産駒のデータ構造に使用する重み係数を算出するための学習用データ取得処理および重み係数の最適化の処理手順と処理内容の一例を示すフロー図である。

【0138】

ステップＳ３０１ａにおいて、制御ユニット２０は、学習用データ取得部２０４の制御の下、学習用データＤ３（２０１２）を学習用データ記憶部３０３から読み出す。

【0139】

同様に、ステップＳ３０１ｂ～ステップＳ３０１ｅにおいて、学習用データ取得部２０４は、学習用データ記憶部３０３に記憶された学習用データＤ３（２０１３）～学習用データＤ３（２０１６）を読み出す。ステップＳ３０１ａ～ステップＳ３０１ｅは、順次実行されてもよいし、同時並行して実行されてもよい。

【0140】

ステップＳ３０２において、学習用データ取得部２０４は、学習用データＤ３（２０１２）～学習用データＤ３（２０１６）を結合して、学習用データＤ３（２０１２～２０１６）とする。

【0141】

ステップＳ３０３において、学習用データ取得部２０４は、任意に定められた計算式もしくは関数の組み合わせからなるスコア値算出式と仮の重み係数Ｗを、学習用データＤ３（２０１２～２０１６）に組み込む。この時点で、学習用データＤ３（２０１２～２０１６）は、プロフィル情報と、数値データとしての１走あたり賞金データと、重み係数と、スコア値算出式を備えており、データ構造の要件を満たす。学習用データＤ３（２０１２～２０１６）は、仮の重み係数に基づいてスコア値算出式に基づき算出された、仮のスコア値を備えていてもよい。

【0142】

ステップＳ３０４において、学習部２０５は、学習用データ取得部２０４から学習用データＤ３（２０１２～２０１６）を取得し、統計分析する処理を実行することで予測モデルを生成する。本実施形態では、学習部２０５は、学習用データＤ３（２０１２～２０１６）における本賞金を目的変数とし、各ファクターの１走あたり賞金を説明変数とした学習を行い、成績が上位の競走馬の発生しやすさを表すスコア値を算出するための重み係数Ｗを最適化する。

【0143】

ステップＳ３０５において、学習部２０５は、算出された最終的な重み係数Ｗを学習済みデータ記憶部３０４に格納する。また、学習部２０５は、重み係数Ｗ算出に用いた予測モデルと同じスコア値算出式を、学習済みデータ記憶部３０４に記憶する。

【0144】

（３）データ構造の作成
（３－１）予測用データの取得
図７は、図２に示した制御ユニット２０による２０１７年産駒の予測用データ作成処理の処理手順と処理内容の一例を示すフロー図である。

【0145】

ステップＳ４０１において、制御ユニット２０は、予測用データ取得部２０６の制御の下、入出力インタフェースユニット１０を介して、入力デバイスまたは外部データベース等から２０１７年産駒のプロフィルデータを取得し、予測用データＤ４（２０１７）を作成する。図１２は、予測用データＤ４の一例を示す。例えば、予測用データＤ４には、競走馬の馬名、もしくは馬名未定の場合には競走馬のアイデンティティを表す母名と誕生年を組み合わせた情報などが少なくとも含まれる。予測用データＤ４にはさらに、競走馬のプロフィルを表すファクターとして誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格などが含まれる。

【0146】

ステップＳ４０２において、予測用データ取得部２０６は、１走あたり賞金データ記憶部３０２に記憶された１走あたり賞金データセットＤ２（２００７～２０１６）を読み出す。ステップＳ４０２は、ステップＳ４０１の後に実行されても、ステップＳ４０１と同時並行して実行されても、またはステップＳ４０１の前に実行されてもよい。

【0147】

（３－２）スコア算出用データの作成
図７のステップＳ４０３において、制御ユニット２０は、スコア算出用データ作成部２０７の制御の下、予測用データ取得部２０６にて生成された予測用データＤ４（２０１７）の各ファクターを参照し、それらの条件に該当する1走あたり賞金データを１走あたり賞金データセットＤ２（２００７～２０１６）から抽出し、結合して、スコア算出用データＤ５（２０１７）を作成する。具体的には、スコア算出用データ作成部２０７は、予測用データＤ４（２０１７）から、誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格などを参照し、それらの条件に対応する１走あたり賞金データを１走あたり賞金データセットＤ２（２００７～２０１６）から抽出し、予測用データＤ４（２０１７）に結合して、スコア算出用データＤ５（２０１７）を作成する。

【0148】

図１３は、スコア算出用データＤ５の一例を示す。スコア算出用データＤ５には、例えば、予測用データＤ４から抽出された、馬名、もしくは母名と誕生年を組み合わせた情報、誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格などと、１走あたり賞金データセットＤ２から抽出された、各ファクターに対応する１走あたり賞金が含まれる。

【0149】

ステップＳ４０４において、制御ユニット２０は、作成されたスコア算出用データＤ５（２０１７）をスコア算出用データ記憶部３０５に格納する。

【0150】

（３－３）重み係数とスコア算出式の組み込み
図８は、図２に示した制御ユニット２０による２０１７年産駒の成績予測モデルであるデータ構造の作成手順と処理内容の一例を示すフロー図である。

【0151】

ステップＳ５０１において、制御ユニット２０は、データ構造作成部２０８の制御の下、スコア算出用データＤ５（２０１７）をスコア算出用データ記憶部３０５から読み出す。

【0152】

次いで、ステップＳ５０２において、データ構造作成部２０８は、学習済データ記憶部３０４に格納された重み係数Ｗ、及びスコア値算出式を取得する。

【0153】

ステップＳ５０３において、データ構造作成部２０８は、スコア算出用データＤ５に、重み係数Ｗ、及びスコア値算出式を組み込むことで、２０１７年産駒の成績予測モデルであるデータ構造（２０１７）を生成する。

【0154】

次いで、ステップＳ５０４において、スコア算出部２０９がデータ構造（２０１７）の各ファクターの１走あたり賞金を変数として、スコア算出式に基づく演算を行うことで、スコア値を算出してもよい。

【0155】

最後に、ステップＳ５０５において、制御ユニット２０は、作成されたデータ構造（２０１７）をデータ構造格納部３０６に格納する。

【0156】

以上の処理手順によりデータ構造を作成するが、インターネット経由のデータの読み込み、情報の抽出、加工、予測モデルの作成、データ構造の構築、式もしくは関数の組み合わせのデータ構造への組み込みといった一連の処理は、全てもしくは一部を、アプリケーションプログラムが自動的に実施してもよい。

【0157】

あるいは、上記一連の処理の全てもしくは一部は、アプリケーションプログラムのユーザーによる操作によって実施されてもよい。

【0158】

次に、上記一連の処理により作成されたデータ構造（２０１７）を使用して、２０１７年産駒の成績予測を行う処理手順を実施例として説明する。

【0159】

（１）プロフィルデータの補足
図１４は、図１に示した制御ユニット２０による２０１７年産駒のデータ構造のプロフィルデータ補足の処理手順と処理内容の一例を示すフロー図である。

【0160】

ステップＳ１００１において、制御ユニット２０は、補足用データ取得部２１の制御の下、入出力インタフェースユニット１０を介して、外部データベース等から、２０１７年産駒の補足用データＤ４＋（２０１７）を取得する。もしくは、記憶ユニット３０を介して磁気ディスクや光ディスクなどから、上記補足用データＤ４＋（２０１７）を取得してもよい。Ｄ４＋は、予測用データＤ４と同様に、競走馬の馬名もしくは母名と誕生年を組み合わせた情報の他、競走馬のプロフィルを表すファクターとして誕生月日、性別、父名、母名、誕生時の母年齢、母父名、生産者、調教師、馬主、取引価格など取得時点での最新の情報が含まれる。

【0161】

ステップＳ１００２において、制御ユニット２０は、データ構造補足部２２の制御の下、データ構造格納部３１からデータ構造（２０１７）を読み出す。ステップＳ１００２は、ステップＳ１００１の後に実行されても、ステップＳ１００１と同時並行して実行されても、またはステップＳ１００１の前に実行されてもよい。

【0162】

次いで、ステップＳ１００３において、データ構造補足部２２は、データ構造（２０１７）および補足用データ取得部２１が取得した補足用データＤ４＋（２０１７）の各ファクターを参照し、データ構造において不足しているプロフィルがあれば、補足用データと結合することで補足する。具体的には、データ構造作成時に未定であった馬名、調教師、馬主、取引価格などの情報が補足される。また、データ構造作成時より後に輸入された海外生産馬など、データ構造作成時に未登録であった産駒の情報も補足される。

【0163】

ステップＳ１００４において、データ構造補足部２２は、ファクターデータ記憶部３２に記憶された１走あたり賞金データセットＤ２（２００７～２０１６）を読み出す。

【0164】

ステップＳ１００５において、データ構造補足部２２は、上記で補足したプロフィルに該当するファクターの１走あたり賞金データを１走あたり賞金データセットＤ２（２００７～２０１６）から抽出し、データ構造（２０１７）に取り込む。
（２）スコア値の算出

【0165】

ステップＳ１００６において、スコア算出部２３がデータ構造（２０１７）の各ファクターの１走あたり賞金を変数として、スコア算出式に基づく演算を行うことで、スコア値を算出する。演算の結果として得られたスコア値は、スコア算出部２３により、データ構造に取り込まれる。

【0166】

ステップＳ１００７において、出力制御部２４は、入出力インタフェースユニット１０を介して、スコア値を出力する。スコア値は、図３のように、各競走馬のプロフィルを表す行の先頭付近に出力されるのが、比較するのに容易となるため好ましい。また、出力制御部２４は、スコア値に基づいてデータの並び替えを実施してもよい。任意に定めた式もしくは関数の内容によるが、例えばスコア値が大きいほど予想序列順位が高い場合、スコア値の大きい順に並べ替えるのが候補馬の選択に効率的であり好ましい。

【0167】

以上の処理手順によりデータ構造（２０１７）を使用して２０１７年産駒の成績予測を行うが、インターネット経由のデータの読み込み、データの補足、情報の抽出、演算といった一連の処理は、全てもしくは一部を、アプリケーションプログラムが自動的に実施してもよい。

【0168】

ステップＳ１００３において、データ構造補足部２２は、補足用データＤ４＋（２０１７）を参照してデータ構造を補足する代わりに、ユーザーによるキーボードやマウスなどの入出力インタフェースユニット１０の手動操作にて入力されたデータを用いて、プロフィル情報の補正もしくは補足を行ってもよい。

【0169】

データ構造中のスコア算出に用いる各データの重み係数は、ユーザーにより任意のタイミングで、入出力インタフェースユニット１０の手動操作にて変更されてもよい。

【0170】

上記のようにユーザーの手動操作を起点にして、プロフィルデータの補正もしくは補足、重み係数の変更が行われた場合、スコア算出部２３により演算が行われスコア値が算出される。次いで、出力制御部２４により、更新されたスコア値が出力される。演算の動作、およびスコア値の更新は、各データおよび重み係数が更新される度に、アプリケーションプログラムにより自動的に行われるのが好ましい。

【0171】

（検証）
実施形態により算出されるスコア値の有用性を評価するために、２０１７年産駒の２０１９年６月から２０２０年５月までの成績データを取得して作成した実績データＤ１（２０１７）を用いて検証を行った。具体的には、実績データＤ１（２０１７）から各競争馬が期間中に獲得した本賞金を抽出して、データ構造（２０１７）と結合し、スコア値の評価を行った。

【0172】

図１５は、データ構造（２０１７）における競走馬のスコア値の分布を示すヒストグラムおよびスコア値の各区間における本賞金１００位内発生率、本賞金２００位内発生率を示すグラフである。

【0173】

ヒストグラムにおいて区間の間隔はスコア値で２０毎とし、区間の最小の境界値よりも大きく、最大の境界値以下のスコア値に該当する競走馬をカウントし、各区間の頭数とした。例えば、データ構造（２０１７）において、スコア値が１６０より大きく、１８０以下であった１６０－１８０区間に該当する競走馬は７４頭であった。

【0174】

本賞金１００位内発生率は、上記本賞金順に並べた上位１００位以内、２０１７年産駒においては２４９０万円以上の本賞金を獲得した競走馬の各区間の頭数を、上記でカウントした各区間の全体頭数で除した値である。例えば、データ構造（２０１７）において、１６０－１８０区間における本賞金１００位以内の競走馬は１３頭であったので、本賞金１００位内発生率は１７．６％と計算された。

【0175】

本賞金２００位内発生率は、本賞金順に並べた上位２００位以内、２０１７年産駒においては１７１０万円以上の本賞金を獲得した競走馬の各区間の頭数を、上記でカウントした各区間の全体頭数で除した値である。例えば、データ構造（２０１７）において、１６０－１８０区間における本賞金２００位以内の競走馬は１７頭であったので、本賞金２００位内発生率は２３．０％と計算された。

【0176】

例えば、データ構造（２０１７）において、スコア値が１６０より大きい競走馬９７頭から、本賞金上位１００位以内が１７頭、本賞金上位２００位以内が２３頭出ており、それぞれ本賞金１００位内発生率は１７．５％、本賞金２００位内発生率は２３．７％であった。デビュー前のスコア値上位の競走馬から候補馬を検討することにより、ＰＯＧで本賞金を多く獲得する競走馬を効率よく選択することが期待できる結果が示された。

【符号の説明】

【0177】

１・・・コンピュータＡ
２・・・コンピュータＢ
１０・・・入出力インタフェースユニット
２０・・・制御ユニット
２１・・・補足用データ取得部
２２・・・データ構造補足部
２３・・・スコア算出部
２４・・・出力制御部
３０・・・記憶ユニット
３１・・・データ構造格納部
３２・・・ファクターデータ記憶部
２０１・・・実績データ取得部
２０２・・・１走あたり賞金算出部
２０３・・・学習用データ作成部
２０４・・・学習用データ取得部
２０５・・・学習部
２０６・・・予測用データ取得部
２０７・・・スコア算出用データ作成部
２０８・・・データ構造作成部
２０９・・・スコア算出部
３０１・・・実績データ記憶部
３０２・・・１走あたり賞金データ記憶部
３０３・・・学習用データ記憶部
３０４・・・学習済みデータ記憶部
３０５・・・スコア算出用データ記憶部
３０６・・・データ構造格納部
birth・・・誕生月日をファクターとする１走あたり賞金を示すカラム
sire・・・競走馬の父をファクターとする１走あたり賞金を示すカラム
broodmare・・・誕生時の母年齢をファクターとする１走あたり賞金を示すカラム
BMS・・・競走馬の母父をファクターとする１走あたり賞金を示すカラム
farm・・・生産者をファクターとする１走あたり賞金を示すカラム
trainer・・・調教師をファクターとする１走あたり賞金を示すカラム
owner・・・馬主をファクターとする１走あたり賞金を示すカラム
value・・・取引価格をファクターとする１走あたり賞金を示すカラム

【図1】