(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-05
(45)【発行日】2024-03-13
(54)【発明の名称】情報処理方法、情報処理装置、およびプログラム
(51)【国際特許分類】
G06Q 50/02 20240101AFI20240306BHJP
【FI】
G06Q50/02
(21)【出願番号】P 2022503030
(86)(22)【出願日】2020-02-28
(86)【国際出願番号】 JP2020008445
(87)【国際公開番号】W WO2021171591
(87)【国際公開日】2021-09-02
【審査請求日】2022-06-09
(73)【特許権者】
【識別番号】522230624
【氏名又は名称】園生 裕造
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】園生 裕造
【審査官】松野 広一
(56)【参考文献】
【文献】特開2006-004362(JP,A)
【文献】特開平11-290553(JP,A)
【文献】特表2012-501671(JP,A)
【文献】樋口 尚吾 外4名,投票行動時系列データ解析に基づく意思決定戦略に関する考察,電子情報通信学会技術研究報告,日本,一般社団法人電子情報通信学会,2015年06月11日,Vol.115 No.97,pp.7-11,ISSN 0913-5685
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
動物の潜在的競技パフォーマンスを予測する
情報処理装置によって実行される情報処理方法であって、
対象の動物の
両親の識別情報を含むパラメータを取得する取得工程と、
前記取得工程において取得した前記
対象の動物の両親の前記識別情報に基づき、前記対象の動物の祖先にあたる動物を特定する特定工程と、
前記特定工程において特定した前記対象の動物の祖先にあたる前記動物の評価値に基づいて、前記対象の動物の潜在的競技パフォーマンスを予測する予測工程と
を含み、
前記潜在的競技パフォーマンスは、競技における獲得賞金及び出場回数の少なくともいずれかを含み、
前記評価値は、前記対象の動物の祖先にあたる動物のそれぞれについて求められた、前記対象の動物の祖先にあたる動物と、その子孫の動物との競技パフォーマンスの平均および分散であ
り、
前記競技パフォーマンスは、競技における獲得賞金及び出場回数の少なくともいずれかを含み、
前記予測工程において、前記対象の動物の潜在的競技パフォーマンスは、機械学習で得られたモデルであって、前記対象の動物の祖先にあたる動物の評価値を入力として、前記対象の動物の潜在的競技パフォーマンスの予測値を出力する前記モデルに基づいて予測されることを特徴とする情報処理方法。
【請求項2】
複数の動物及び前記複数の動物の祖先にあたる動物の評価値と競技パフォーマンスとに基づいて前記モデルを学習する学習工程をさらに備えることを特徴とする
請求項1に記載の情報処理方法。
【請求項3】
前記対象の動物は馬であり、
前記競技パフォーマンスは、競馬のレースにおける獲得賞金および出走回数の少なくともいずれかであることを特徴とする
請求項1または2に記載の情報処理方法。
【請求項4】
前記対象の動物の祖先にあたる前記動物は、前記対象の動物の母馬、父馬、父母馬、父父馬、母母馬、母父馬、父父父馬、父父母馬、父母父馬、父母母馬、母父父馬、母父母馬、母母父馬、および母母母馬の少なくともいずれかを含むことを特徴とする
請求項3に記載の情報処理方法。
【請求項5】
前記パラメータは、前記対象の動物を出産した母馬の年齢、前記対象の動物の毛色、および前記対象の動物の性別の少なくともいずれかを含み、
前記予測工程において、前記対象の動物の潜在的競技パフォーマンスは、前記対象の動物を出産した母馬の年齢、前記対象の動物の毛色、および前記対象の動物の性別の少なくともいずれかにさらに基づいて予測されることを特徴とする
請求項3または4に記載の情報処理方法。
【請求項6】
通信部を介して、前記予測工程において予測した前記対象の動物の前記潜在的競技パフォーマンスを外部装置に提供する提供工程をさらに備え、
前記取得工程において、前記パラメータは前記通信部を介して前記外部装置から取得されることを特徴とする
請求項1から5のいずれか1項に記載の情報処理方法。
【請求項7】
表示部を介して、前記予測工程において予測した前記対象の動物の前記潜在的競技パフォーマンスをユーザに提供する提供工程をさらに備え、
前記取得工程において、前記パラメータはユーザインタフェースを介して取得されることを特徴とする
請求項1から5のいずれか1項に記載の情報処理方法。
【請求項8】
前記対象の動物の祖先にあたる前記動物の評価値が欠落している場合に、前記対象の動物の祖先にあたる前記動物の欠落している評価値を、前記対象の動物の祖先にあたる前記動物と血縁関係にある動物の評価値に基づいて補完する補完工程をさらに備えることを特徴とする
請求項1から7のいずれか1項に記載の情報処理方法。
【請求項9】
馬の潜在的競技パフォーマンスを予測する
情報処理装置によって実行される情報処理方法であって、
対象の馬の父馬および母馬の識別情報、前記対象の馬の性別、毛色、ならびに前記対象の馬を出産した時点での母馬の年齢を含むパラメータを取得する取得工程と、
前記取得工程において取得した前記パラメータに基づいて、前記対象の馬の出走回数および獲得賞金を含む
潜在的競技パフォーマンスを予測する予測工程と、
前記取得工程において取得された前記パラメータに基づいて予測された
前記潜在的競技パフォーマン
スを出力する出力工程と、
を含み、
前記予測工程において、前記対象の動物の潜在的競技パフォーマンスは、機械学習で得られたモデルであって、前記パラメータを入力として、前記対象の動物の潜在的競技パフォーマンスの予測値を出力する前記モデルに基づいて予測され、
前記出力工程において、前記対象の馬の前記潜在的競技パフォーマンスはネットワークを介して外部装置に送信される、または前記情報処理装置のディスプレイに表示される
ことを特徴とする情報処理方法。
【請求項10】
動物の潜在的競技パフォーマンスを予測する情報処理装置であって、
1以上のプロセッサと、
メモリと、
前記メモリに格納されたプログラムであって、前記1以上のプロセッサにより実行されると、
請求項1から9のいずれか1項に記載の情報処理方法を前記情報処理装置に実行させるための命令群を含むプログラムと
を備える情報処理装置。
【請求項11】
動物の潜在的競技パフォーマンスを予測する情報処理装置であって、
対象の動物の
両親の識別情報を含むパラメータを取得する取得手段と、
前記取得手段が取得した前記
対象の動物の両親の前記識別情報に基づき、前記対象の動物の祖先にあたる動物を特定する特定手段と、
前記特定手段が特定した前記対象の動物の祖先にあたる前記動物の評価値に基づいて、前記対象の動物の潜在的競技パフォーマンスを予測する予測手段と、
を含み、
前記潜在的競技パフォーマンスは、競技における獲得賞金及び出場回数の少なくともいずれかを含み、
前記評価値は、前記対象の動物の祖先にあたる動物のそれぞれについて求められた、前記対象の動物の祖先にあたる動物と、その子孫の動物との競技パフォーマンスの平均および分散であ
り、
前記競技パフォーマンスは、協議における獲得賞金及び出場回数の少なくともいずれかを含み、
前記予測手段は、機械学習で得られたモデルであって、前記対象の動物の祖先にあたる動物の評価値を入力として、前記対象の動物の潜在的競技パフォーマンスの予測値を出力する前記モデルに基づいて前記対象の動物の潜在的競技パフォーマンスを予測することを特徴とする情報処理装置。
【請求項12】
請求項1から9のいずれか1項に記載の情報処理方法をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、情報処理装置、およびプログラムに関するものである。
【背景技術】
【0002】
これまで、サラブレッド競走馬のような対象の生物学的パラメータに基づいて、当該対象の潜在的競技パフォーマンスを予測するための方法が提案されている。特許文献1には、1以上の一塩基多型の存在に基づいて競技パフォーマンスを予測する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【0004】
発明の実施態様のうちの一つによれば、動物の潜在的競技パフォーマンスを予測する情報処理装置によって実行される情報処理方法は、対象の動物の両親の識別情報を含むパラメータを取得する取得工程と、前記取得工程において取得した前記対象の動物の両親の前記識別情報に基づき、前記対象の動物の祖先にあたる動物を特定する特定工程と、前記特定工程において特定した前記対象の動物の祖先にあたる前記動物の評価値に基づいて、前記対象の動物の潜在的競技パフォーマンスを予測する予測工程とを含み、前記潜在的競技パフォーマンスは、競技における獲得賞金及び出場回数の少なくともいずれかを含み、
前記評価値は、前記対象の動物の祖先にあたる動物のそれぞれについて求められた、前記対象の動物の祖先にあたる動物と、その子孫の動物との競技パフォーマンスの平均および分散であり、前記競技パフォーマンスは、競技における獲得賞金及び出場回数の少なくともいずれかを含み、前記予測工程において、前記対象の動物の潜在的競技パフォーマンスは、機械学習で得られたモデルであって、前記対象の動物の祖先にあたる動物の評価値を入力として、前記対象の動物の潜在的競技パフォーマンスの予測値を出力する前記モデルに基づいて予測される。
【図面の簡単な説明】
【0005】
添付図面は明細書に含まれ、その一部を構成し、本発明の実施の形態を示し、その記述と共に本発明の原理を説明するために用いられる。
【
図1】第1の実施形態に係る情報処理装置のハードウェア構成図。
【
図2】第1の実施形態に係る情報処理装置のソフトウェア構成図。
【
図3】第1の実施形態に係る情報処理装置が有する競走馬データのデータ構造の一例を示す図。
【
図4】第1の実施形態に係る情報処理装置が有する繁殖馬データのデータ構造の一例を示す図。
【
図5A】第1の実施形態に係る情報処理装置が実行する学習処理の一例を示すフローチャート。
【
図5B】第1の実施形態に係る情報処理装置が実行する学習処理の一例を示すフローチャート。
【
図6】第1の実施形態に係る情報処理装置が実行する予測処理の一例を示すフローチャート。
【
図7】第2の実施形態に係る情報処理装置が実行する補完処理の一例を示すフローチャート。
【
図8】競走馬の血縁関係および競走馬の競技パフォーマンスの一例を示す図。
【
図9A】機械学習モデルの説明変数の一例を示す図。
【
図9B】機械学習モデルの目的変数の一例を示す図。
【発明を実施するための形態】
【0006】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態で説明されている特徴の組み合わせの全てが発明に必須のものとは限らない。実施形態で説明されている複数の特徴のうち二つ以上の特徴は任意に組み合わされてもよい。また、同一若しくは同様の構成には同一の参照番号を付し、重複した説明は省略する。
【0007】
<第1の実施形態>
以下、本実施形態に係る情報処理装置について説明する。情報処理装置は、動物の潜在的競技パフォーマンスを予測する情報処理方法を実行する。本実施形態では、予測対象の動物を、馬、特には、幼駒を対象とする場合を説明する。具体的には、幼駒の父馬、母馬などの、幼駒と血統関係にある馬(本明細書では血縁馬と呼ぶ)の競技パフォーマンスに基づいて、幼駒の潜在的競技パフォーマンスを予測する。本実施形態では、潜在的競技パフォーマンスとは、競馬のレースの出場回数、獲得賞金であるものとして説明を行う。なお、本実施形態では、潜在的競技パフォーマンスを予測する対象の動物として馬を例に説明を行うが、それ以外にも牛、犬、鶏などの任意の動物の潜在的競技パフォーマンスを予測するためにも本実施形態を適用することができる。この場合、競技パフォーマンスは動物が参加する競技に合わせて選択することができる。
【0008】
図1は、本実施形態に係る情報処理装置1のハードウェア構成図である。情報処理装置1は、プロセッサ101、メモリ102、ストレージ103、およびネットワークI/F(インタフェース)104を有する。これらの構成要素は、バス105を介して相互に通信可能である。
【0009】
プロセッサ101は、システム制御部であり、情報処理装置1の全体を制御する。プロセッサ101は、ストレージ103に格納されたプログラム(命令群)またはオペレーティングシステム(OS)を実行するCPU、GPU(Graphics Processing Unit)、およびマイクロコントローラの少なくとも何れかを含む。
【0010】
メモリ102は、プロセッサ101のワークメモリとして用いられるDRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)などで構成される。
【0011】
ストレージ103は、プロセッサ101が実行するプログラム、OS、並びにプログラムによって使用されるデータテーブルおよび設定値の少なくとも何れかを格納するHDD(Hard Disk Drive)、SSD(Solid State Drive)を含む。また、ストレージ103は、PROM(Programmable Read Only Memory)、EPROM(Erasable ROM)、EEPROM(Electrically EPROM)を含んでもよい。
【0012】
ネットワークI/F104は、外部装置(不図示)と接続し、データ通信を実行するための通信部であって、有線ネットワークI/Fおよび無線ネットワークI/Fの少なくとも何れかを含む。無線ネットワークI/Fは、Wi-Fi(WirelessFidelity)(登録商標)やBluetooth(登録商標)等に準拠した無線通信を行いうる。
【0013】
なお、一例では、情報処理装置1は、ユーザ操作を受け付けるキーボードおよびタッチパネルなどの入力部、ならびにディスプレイやスピーカーなどの出力部の少なくともいずれかを含むユーザインタフェース(UI)を備えてもよい。
【0014】
情報処理装置1は、例えばパーソナルコンピュータ、携帯電話、スマートフォン、PDA、タブレット端末、ウェアラブル端末などの任意の情報処理端末、或いはパフォーマンス予測装置として実現することができる。
【0015】
図2は、本実施形態に係る情報処理装置1のソフトウェア構成を表す図である。
図2に示す情報処理装置1のソフトウェアモジュールは、プロセッサ101がストレージ103に格納されたプログラムを実行することで実現される。情報処理装置1のソフトウェアモジュールは、競走馬データ管理部201、繁殖馬データ管理部202、幼駒パラメータ取得部203、血縁馬特定部204、学習部205、予測部206、および提供部207を含む。
【0016】
競走馬データ管理部201は、過去の競走馬の成績や血統などのデータをストレージ103で管理する。一例では、競走馬データ管理部201は、競走馬のデータをネットワークI/F104を介して受信した場合には、ストレージ103に格納されたデータを更新してもよい。また、競走馬データ管理部201は、定期的にインターネット上のデータベースにアクセスし、新しい競走馬データを取得してもよい。
【0017】
繁殖馬データ管理部202は、仔馬を生むために牧場に繁養されている馬のデータをストレージ103で管理する。一例では、繁殖馬データ管理部202は、繁殖馬のデータを新たにネットワークI/F104を介して受信した場合には、ストレージ103に格納されたデータを更新してもよい。また、繁殖馬データ管理部202は、定期的にインターネット上のデータベースにアクセスし、新しい繁殖馬データを取得してもよい。
【0018】
幼駒パラメータ取得部203は、潜在的競技パフォーマンスを予測すべき幼駒のパラメータを取得する。一例では、幼駒パラメータ取得部203は、ネットワークI/F104を介して外部装置から幼駒のパラメータを取得してもよい。また、一例では、情報処理装置1は、ユーザインタフェース(UI)(不図示)を備え、UIを介して潜在的競技パフォーマンスを予測すべき幼駒のパラメータを取得してもよい。幼駒のパラメータは、幼駒の性別、両親を特定可能な情報などを含む。幼駒のパラメータの詳細については後述する。
【0019】
血縁馬特定部204は、幼駒パラメータ取得部203が取得したパラメータに基づいて、潜在的競技パフォーマンスを予測すべき幼駒と血縁関係にある馬を特定する。一例では、血縁馬特定部204は、幼駒の父馬、母馬、父父馬(父馬の父親、即ち、幼駒の父方の祖父)、父母馬(母馬の父親、即ち、幼駒の母方の祖父)、母父馬(父馬の母親、即ち、幼駒の父方の祖母)、母母馬(母馬の母親、即ち、幼駒の母方の祖母)を特定する。また、一例では、血縁馬特定部204は、幼駒の兄弟、従兄弟、従姉妹にあたる馬を特定する。また、一例では、血縁馬特定部204は、幼駒の父馬、母馬、父父馬、父母馬、母父馬、および母母馬、並びにこれらの子孫にあたる馬を特定する。
【0020】
学習部205は、競走馬データ管理部201および繁殖馬データ管理部202が管理する競走馬データおよび繁殖馬データに基づいて、予測部206が保持する機械学習モデルのパラメータを調整する。例えば、学習部205は、ランダムフォレスト、ニューラルネットワーク、パーセプトロンなど、公知の機械学習アルゴリズムを使用して、機械学習モデルのパラメータの調整を行う学習処理を実行可能である。学習部205が実行する学習処理の詳細な説明については
図5Aおよび
図5Bを参照して後述する。
【0021】
予測部206は、幼駒パラメータ取得部203が取得した幼駒のパラメータに基づいて、機械学習モデルに入力する入力データを生成する。また、予測部206は、生成した入力データを機械学習モデルに入力し、出力として競技パフォーマンスの予測値を得る。予測部206の詳細な説明については
図6を参照して後述する。
【0022】
提供部207は、予測部206によって予測された幼駒の潜在的競技パフォーマンスをユーザまたは外部装置に提供する。例えば、提供部207は、ネットワークI/F104を介して外部装置に幼駒の競技パフォーマンスの予測値を送信してもよい。あるいは、情報処理装置1がディスプレイ、スピーカー、プリンタなどの出力装置を備える場合には、これらの出力装置の少なくとも何れかによって情報処理装置1のユーザに幼駒の競技パフォーマンスの予測値を提示してもよい。
【0023】
次に、
図3を参照して、競走馬データ管理部201が管理する競走馬データの一例について説明する。
【0024】
競走馬データ管理部201が管理するデータは、識別情報301、馬名302、生年月日303、性別304、品種305、毛色306、実績情報307、および血縁馬識別情報308を含む。
【0025】
識別情報301は、競走馬の識別子である。馬名302は、競走馬につけられた名前である。生年月日303は、競走馬の生年月日に対応する情報である。性別304は、競走馬の性別に関する情報である。品種305は、「サラブレッド」、「サラブレッド系種」、「準サラブレッド」、「アングロアラブ」などの競走馬の品種を指し示す情報である。毛色306は、「栗毛」、「栃栗毛」、「鹿毛」、「黒鹿毛」、「青鹿毛」などの競走馬の毛色を指し示す情報である。
【0026】
実績情報307は、競走馬のこれまでの実績情報を示す情報で、本実施形態では、実績情報307は出走回数情報309および賞金情報310を含む。出走回数情報309は、競走馬が現在までに何回レースに出場したかを示す情報である。一例では、出走回数情報309は、レースの種類ごとの出走回数に関する情報を含んでもよい。賞金情報310は、競走馬のこれまでの獲得賞金額(収得賞金)を示す情報である。
【0027】
なお、一例では、実績情報307は、競走馬の着順や、競走馬が出場したレースの種別(芝、ダート、障害、右回り、左回り)や、競走馬が出場したレースの着順またはそれぞれの着順になった回数を更に含むことができる。すなわち、実績情報307は、競走馬の競技パフォーマンスを指し示す指標であれば任意の情報を含みうる。
【0028】
血縁馬識別情報308は、競走馬と血縁関係にある馬の識別情報を示す。本実施形態に係る血縁馬識別情報308は、父馬識別情報311、母馬識別情報312、父父馬識別情報313、父母馬識別情報314、母父馬識別情報315、および母母馬識別情報316を含む。
【0029】
父馬識別情報311は、父馬の識別情報であり、例えばある競走馬の競走馬データに含まれる父馬識別情報311と、当該競走馬の父馬の競走馬データに含まれる識別情報301とが対応付けられていてもよい。また、ある競走馬の競走馬データに含まれる父馬識別情報311と、当該競走馬の父馬の繁殖馬データに含まれる識別情報とが対応付けられてもよい。母馬識別情報312は母馬の、父父馬識別情報313は父父馬(父馬の父馬)の識別情報を示す。同様に、父母馬識別情報314は父母馬、母父馬識別情報315は母父馬、母母馬識別情報316は母母馬の識別情報を示す。本実施形態では、競走馬の血縁に関する情報として、父馬、母馬、父父馬、父母馬、母父馬、母母馬の、二世代前までの祖先の馬を特定可能な情報を含むものとして説明するが、当然ながら三世代(父父父馬、父父母馬、父母父馬、父母母馬、母父父馬、母父母馬、母母父馬、および母母母馬)以上の祖先の馬を考慮してもよい。
【0030】
なお、本実施形態では、一例では、血縁馬識別情報308は、子馬、孫馬などの子孫を特定可能な情報を含んでもよい。この場合であっても、血縁関係の遠近で、特定する子孫を限定してもよい。例えば、子馬、孫馬、曾孫馬などに限定してもよいし、競走馬と血統的につながりがあって、競走馬からみて5親等以内の馬などの限定を加えて血族関係にある血縁馬を特定してもよい。
【0031】
また、一例では、競走馬データ管理部201は、競走馬が生まれた牧場、牧場オーナーなどの生産者に関する情報を示す生産者情報、競走馬の調教を担当した調教師の情報を示す調教師情報、競走馬のオーナーの情報を示す馬主情報を含むデータを管理してもよい。
【0032】
なお、本実施形態では、幼駒の潜在的競技パフォーマンスとして、出走数、賞金を予測するものとして説明を行うが、他のパラメータを予測することを目的としている場合には、当該他のパラメータが競走馬データ管理部201に含まれてもよい。例えば、競走馬の勝ちレース数を予測することを目的とする場合には、競走馬データ管理部201は総合一着回数を含む競走馬データを管理してもよいし、距離別の勝ちレース数を予測することを目的とする場合には、距離ごとの一着回数を管理してもよい。
【0033】
次に、
図4を参照して、繁殖馬データ管理部202が管理する繁殖馬データについて説明する。
【0034】
繁殖馬データは、識別情報401、生年月日402、性別403、品種404、毛色405、父馬繁殖登録情報406、母馬繁殖登録情報407を含む。
【0035】
識別情報401は、繁殖馬の識別情報であり、一例では、ある繁殖馬の識別情報401は、当該繁殖馬が競走馬として活動していた場合には、競走馬データに含まれる識別情報301と対応付けられていてもよい。生年月日402、性別403、品種404、毛色405は、競走馬の生年月日303、性別304、品種305、毛色306と同様のため、説明を省略する。
【0036】
父馬繁殖登録情報406は、繁殖馬の父馬の識別情報であり、母馬繁殖登録情報407は、繁殖馬の母馬の識別情報である。父馬繁殖登録情報406および母馬繁殖登録情報407は、その父馬および母馬の繁殖馬データの識別情報401と対応付けられてもよい。
【0037】
<学習処理>
次に、
図5Aおよび
図5Bを参照して、予測部206が有する機械学習モデルを学習する学習部205の処理について説明する。
図5Aおよび
図5Bの学習処理は、UIまたはネットワークI/F104を介して学習処理の実行要求を受信した際に実行されてもよいし、情報処理装置1が所定の時間間隔で実行してもよい。なお、
図5Aおよび
図5Bの学習処理は、プロセッサ101が、メモリ102をワークスペースとしてストレージ103に格納されたプログラムを実行することで実現される。
【0038】
まず、S501で、プロセッサ101は、競走馬データ管理部201が管理する競走馬データを取得する。ここで、競走馬データ管理部201が管理する競走馬データに重複するレコードや、競走馬データに含まれるデータのうち、学習に使用しないデータが含まれる場合には、これらのレコードやデータを削除するなどのデータの整形処理が行われてもよい。また、S501では、例えば競走馬データの生年月日402を限定して競走馬データを取得するなどして、期間を限定して競走馬の学習を行ってもよい。これによって、開催されたレース数や賞金額が大きく異なる時期の競走馬の競技パフォーマンスが過度に学習処理に影響を与えることを防ぐことができる。
【0039】
続いて、S502で、プロセッサ101は、各競走馬の血縁馬を、競走馬データ管理部201が管理する競走馬データの血縁馬識別情報308、繁殖馬データ管理部202が管理する繁殖馬データの父馬繁殖登録情報406および母馬繁殖登録情報407の少なくともいずれかに基づいて特定する。例えば、ある競走馬に対応する競走馬データの血縁馬識別情報308を取得すれば、当該競走馬の祖先の馬を特定することができる。また、ある競走馬に対応する競走馬データの識別情報301が、他の競走馬データの血縁馬識別情報308に含まれていないかを検索することで、当該競走馬の子孫の馬を特定することができる。
【0040】
続いて、S503で、プロセッサ101は、各競走馬の血縁馬のそれぞれについて、血縁馬のそれぞれの子孫の競走馬の出走回数情報309および賞金情報310の平均値及び分散を計算して、血縁馬の加工済み競技パフォーマンスを取得する。血縁馬の加工済み競技パフォーマンスは、血縁馬とその子孫の競技パフォーマンスに基づく血縁馬の評価値として扱われる。
【0041】
続いて、S503で、血統馬の競技パフォーマンスを加工する。ここで、
図5Bを参照して、S503の詳細について説明する。まず、S5031で、プロセッサ101はいずれかの血縁馬の子孫を特定する。続いて、S5032で、プロセッサは、特定したいずれかの血縁馬および当該血縁馬の子孫の競技パフォーマンスを取得する。次に、S5033で、プロセッサ101は、血縁馬及び当該血縁馬の子孫の競技パフォーマンスの平均、分散を計算する。続いて、S5034で、プロセッサ101は血縁馬と血縁馬の子孫の競技パフォーマンスの平均、分散をその血縁馬の加工済み競技パフォーマンスとして格納する。これをすべての血縁馬について繰り返す(S5035)。なお、本実施形態では、血縁馬と血縁馬の子孫との競技パフォーマンスの平均、分散を計算するものとして説明を行ったが、血縁馬との血縁関係の遠近に応じて重みづけを行ってもよい。
【0042】
ここで、加工済み競技パフォーマンスについて、
図8の競走馬の血統とそれぞれの出走回数情報および賞金情報とを示す図を参照して説明する。
図8は、馬A801、馬B802、馬C803の子孫の競走馬を示す血統図である。
図8において、馬A801を例に説明すると、上段8011は識別情報を、下段左8012は性別、下段中央8013は賞金金額、下段右8014は出走回数を示す。他の馬に関しても同様に図示している。例えば、馬D804の出走回数は24回、獲得賞金は55M(55000000)円である。
【0043】
図8では、馬A801と馬B802とが、馬D804および馬E805を出産している。また、馬E805は、馬F806との間に馬I809を含む子馬を出産したことがわかる。また、馬B802と馬C803とが、馬G807、馬H808を出産したことがわかる。
【0044】
例えば、馬D804に関して、S502では、父馬として馬B802、母馬として馬A801が血統関係にある馬を特定される。別の例では、S502で、馬A801、馬B802、馬E805、馬G807、馬H808、馬I809が血統関係にある馬として特定されてもよい。
【0045】
ここで、馬D804の血縁馬である馬A801の加工済み競技パフォーマンスを計算する場合を説明する。馬A801の子孫は馬D804、馬E805、および馬I809である。このため、馬A801および馬A801の子孫馬の賞金額の平均は48.75、分散は279.69として求まる。また、馬A801および馬A801の子孫馬の出走回数の平均は17.75、分散は35.19として求まる。これらの値が、馬A801の競技パフォーマンス(加工済み競技パフォーマンスと呼ぶ)としてメモリに記憶される。同様に、各血統馬について、加工済み競技パフォーマンスを計算する。このように計算することで、血縁関係を考慮して、血縁馬の競技パフォーマンスを算出することができる。
【0046】
続いて、S504で、プロセッサ101は、競走馬を出産した時点での母馬の年齢を競走馬の生年月日303と、母馬の繁殖馬データの生年月日402または母馬の競走馬データの生年月日303とから計算して取得する。なお、競走馬データベースに競走馬の出産時の母馬の年齢が格納されている場合には、計算せず、当該出産時の母馬の年齢を取得してもよい。
【0047】
続いて、S505で、プロセッサ101は、説明変数と目的変数とのセットを生成する。目的変数は、幼駒の潜在的競技パフォーマンスとして推定したい競技パフォーマンスを指す。例えば、S505で、プロセッサ101は、競走馬ごとに、目的変数として出走回数情報309および賞金情報310を抽出する。また、プロセッサ101は、目的変数に影響を与える説明変数として、競走馬ごとに競走馬データ管理部201が管理する競走馬データのうち、性別304、品種305、毛色306、競走馬を出産した時点での母馬の年齢、血縁馬の加工済み競技パフォーマンスを抽出する。
【0048】
ここで、
図9Aおよび
図9Bを参照して、説明変数と目的変数について説明する。
【0049】
図9Aは、説明変数を示す図である。識別情報901は、競走馬の識別情報901であり、一例では
図3の識別情報301と対応する。性別902、毛色903は、それぞれ競走馬の性別と経路を示すデータであり、一例では
図3の性別304および毛色306に対応する。母馬出産年齢904は、競走馬を出産した時点での母馬の年齢であり、S504で取得した出産時の母馬年齢である。
【0050】
父馬の賞金の平均および分散905、父馬の出走回数の平均および分散906は、S503で計算した父馬の加工済み競技パフォーマンスである。
図8の例では、競走馬が馬D804の場合は、馬B802の加工済み競技パフォーマンスである。母馬から母母馬の賞金および出走回数の平均および分散(907~916)は、母馬から母母馬の加工済み競技パフォーマンスである。
【0051】
図9Bは、説明変数に対応する賞金951および出走回数952を示す。賞金951は、
図3の賞金情報310および出走回数情報309に対応する。
図8の例では、競走馬が馬D804の場合は、馬D804の賞金および出走回数(55M、24)である。
【0052】
競走馬データ管理部201にある競走馬とその競走馬と血縁関係にある馬との競走馬データが格納されている場合には、プロセッサ101は説明変数および目的変数の両方を取得することができる。そのため、説明変数および目的変数の両方を用いて、機械学習モデルのパラメータチューニングを行うことができる。
【0053】
なお、S505では、プロセッサ101は、説明変数および目的変数のセットのうち、少なくとも一部を抽出し、抽出したセットの目的変数および説明変数を標準化してもよい。例えば、加工済み競技パフォーマンスにおける出走回数を標準化する場合、すべての競走馬の出走回数の平均が0、分散が1になるよう、スケールを変更してもよい。なお、毛色405などの値が得られない項目については、標準化処理は行われなくてもよい。
【0054】
続いて、S506で、プロセッサ101は、説明変数を予測部206の機械学習モデルに入力した場合に、上記説明変数に対応する目的変数を出力するよう、機械学習モデルの調整を行う。例えば、S506では、ランダムフォレストのノードの分岐条件の設定を行う。別の例では、なお、パラメータチューニングにはグリッドサーチなどの公知の技術を利用することができる。また、S507では、プロセッサ101は、学習に使用した目的変数と説明変数とのセットを記憶するとともに、学習後のランダムフォレストモデルを記憶する。なお、S506の学習の際、説明変数をランダムに選んで決定木の調整を行うなど、機械学習モデルの学習方法についての公知技術を適用してもよい。
【0055】
以上説明したように、
図5Aおよび
図5Bの処理では、すでに競技パフォーマンスが存在する競走馬について、その競走馬と血縁関係にある馬の競技パフォーマンスに基づいて、予測部206の機械学習モデルの学習を行う。
【0056】
<予測処理>
次に、
図6を参照して、予測部206が実行する、機械学習モデルを使用した幼駒の潜在的競技パフォーマンスの予測処理について説明する。
図6の処理は、プロセッサ101が、メモリ102をワークスペースとしてストレージ103に格納されたプログラムを実行することで実現される。
【0057】
まず、S601で、プロセッサ101は、父馬の識別情報、母馬の識別情報、性別、毛色、および母馬の出産年齢を含む幼駒のパラメータを取得する。一例では、S601で取得される父馬の識別情報は、繁殖馬データ管理部202が管理する識別情報401と対応付けられてもよい。一例では、情報処理装置1はユーザI/F(不図示)を備え、ユーザI/Fを介してパラメータの少なくとも何れかの指定を受け付けてもよい。また、別の例では、情報処理装置1はウェブサーバとして動作し、ネットワークI/F104を介して他の通信装置から少なくとも何れかのパラメータを取得してもよい。あるいは、例えば幼駒の識別子又は馬名を受け付けたプロセッサ101は、外部のデータベースにアクセスして父馬、母馬の識別情報を検索してもよい。
【0058】
続いて、プロセッサ101は処理をS602に進め、パラメータを取得した幼駒と血縁関係にある馬を特定する。本実施形態では、S602では、幼駒の父馬の識別情報、母馬の識別情報に基づいて父馬、母馬を特定するものとして説明を行う。
【0059】
続いて、プロセッサ101は処理をS603に進め、父馬、母馬の加工済み競技パフォーマンスを計算する。また、予測部206の機械学習モデルおよび
図9Aを参照して説明した父馬、母馬の学習時に使用した説明変数を取得し、目的変数の一部を抽出する。例えば、父馬の識別情報に対応する識別情報901を含む説明変数に含まれる父馬の賞金の平均および分散905は、幼駒にとって父父馬の賞金の平均および分散として使用することができる。同様に、父馬の識別情報に対応する識別情報901を含む説明変数に含まれる母馬の賞金の平均および分散907は、幼駒にとって父母馬の賞金の平均および分散として使用することができる。このようにして、父馬の識別子に対応する説明変数の少なくとも一部を、父馬の子供の潜在的競技パフォーマンスを予測する際に使用することで、予測処理を実行する際の計算量を減らすことができる。同様に、母馬の識別子に対応する説明変数から、母馬の子供の潜在的競技パフォーマンスを予測する際に使用する。なお、S603では、父馬、母馬の加工済み競技パフォーマンスは計算するものとして説明したが、一例では、学習処理時に、
図9Aに示す説明変数と対応付けて父馬、母馬の加工済み競技パフォーマンスを計算し、記憶しておくことで、予測処理をさらに高速に実行することができる。
【0060】
続いて、プロセッサ101は処理をS604に進め、機械学習モデルに、取得した幼駒のパラメータ、および幼駒の血縁馬の加工済み競技パフォーマンスを入力する。そして、出力として、幼駒の潜在的競技パフォーマンスとして、競技パフォーマンスの予想値を取得する。
【0061】
ここで、
図10を参照して、入力と出力の関係について説明する。
【0062】
図10は、
図9Aに示す説明変数を入力として、
図9Bに示す目的変数を出力する機械学習モデル1000を示す図である。
図10では、機械学習モデル1000はランダムフォレストであるものとして説明を行うが、他の機械学習技術を適用することができる。
【0063】
機械学習モデル1000は、複数の決定木1~nを含む。決定木1~nのそれぞれに、
図9Aに示す説明変数の少なくとも一部を入力する。なお、異なる決定木には異なる項目の説明変数が入力されてもよい。次に、決定木1~nのそれぞれは、入力された説明変数に基づき、回帰分析を行う。そして、平均モジュール1001は、それぞれの決定木1~nからの出力を平均し、幼駒の賞金951および出走回数952の予測値を出力する。このようにして、S604では、予測部206は説明変数を機械学習で調整されたモデルに入力し、目的変数を出力する。
【0064】
なお、
図10の例では、賞金951および出走回数952の予測値はそれぞれ1つの値であるものとして説明を行ったが、一例では、賞金951の予測値は、値の範囲(50M~65M)であってもよいし、それぞれの決定木1~nが予測した賞金の平均値および分散であってもよい。
【0065】
続いて、プロセッサ101は処理をS605に進め、取得した幼駒の潜在的競技パフォーマンスを提供する。S605では、例えば情報処理装置1がウェブサーバとして動作する場合には、情報処理装置1はネットワークI/F104を介して他の通信装置に目的変数を示す信号を送信してもよい。また、情報処理装置1が表示部(不図示)を備える場合には、情報処理装置1は表示部に目的変数を示す画面を表示してもよい。これによって、他の情報処理装置または情報処理装置1のユーザに、入力データに対応する幼駒の潜在的競技パフォーマンスを提供することができる。
【0066】
以上説明したように、本実施形態に係る情報処理装置は、幼駒と血縁関係にある血縁馬の競技パフォーマンスに基づいて幼駒の潜在的競技パフォーマンスを予測する。これによって、幼駒の遺伝情報の調査などを行う必要がないため、幼駒の潜在的競技パフォーマンスを高速かつ簡便に予測することができる。
【0067】
また、本実施形態に係る情報処理装置は、幼駒を出産した場合の母馬の年齢に基づいて幼駒の潜在的競技パフォーマンスを予測する。これによって、より正確に幼駒の潜在的競技パフォーマンスを予測することができる。
【0068】
また、本実施形態に係る情報処理装置は、幼駒と血縁関係にある競走馬の競技パフォーマンスは、当該血縁関係にある競走馬の子孫の競技パフォーマンスに基づいて加工され、幼駒の潜在的競技パフォーマンスの予測に使用される。これによって、高い競技パフォーマンスが期待できる血統であるが、例外的に低い競技パフォーマンスを有する馬や、怪我などによって十分に競技パフォーマンスを発揮できなかった馬によって、幼駒の潜在的競技パフォーマンスが過度に低く見積もられることを防ぐことができる。
【0069】
また、本実施形態に係る情報処理装置は、血縁馬として父馬、母馬、父父馬、父母馬、母父馬、母母馬の競技パフォーマンスに基づいて幼駒の潜在的競技パフォーマンスを予測する。これによって、血縁馬が幼駒の競技パフォーマンスに与える影響を詳細に分析することができ、より正確に幼駒の潜在的競技パフォーマンスを予測することができる。
【0070】
<第2実施形態>
第1実施形態では、すでに競技パフォーマンスが存在する競走馬と当該競走馬の血縁関係にある馬の競技パフォーマンスに基づいて、機械学習モデルのパラメータ調整を行う競走馬データ管理部201および繁殖馬データ管理部202が有するデータに基づいて幼駒の潜在的競技パフォーマンスを予測する情報処理装置について説明した。一例では、競走馬データまたは繁殖馬データが欠落することによって、幼駒と血縁関係にある馬の少なくとも一部の競技パフォーマンスを取得することができない場合がある。第2実施形態では、1つの血縁馬の競技パフォーマンスを取得することができない場合に、当該1つの血縁馬の競技パフォーマンスを推定して補完する処理について説明する。なお、第1実施形態と同様の構成、機能、または処理については説明を省略する。
【0071】
図7は、第2実施形態に係る予測処理の一例を示すフローチャートである。S5031、S5032については、第1実施形態と同様である。
【0072】
S701で、プロセッサ101は、学習に使用する競技馬と血縁関係にある馬のうち、競技パフォーマンスが取得できない馬がいるか否かを判定する。競技パフォーマンスが取得できない馬が存在しない場合(S701でNo)、プロセッサ101は、処理をS5033に進める。以降は第1実施形態と同様のため、説明を省略する。
【0073】
S701で、競技パフォーマンスが取得できない馬がいる場合(S701でYes)、プロセッサ101は処理をS702に進め、競技パフォーマンスが取得できない馬と血縁関係にある馬を特定する。S702の処理は、競技パフォーマンスが取得できない馬の識別情報を用いて、S502,S5031と同様に行うことができる。続いて、プロセッサ101は処理をS703に進め、競技パフォーマンスが取得できない馬と血縁関係にある馬の競技パフォーマンスを取得する。続いて、プロセッサ101は処理をS704に進め、競技パフォーマンスが取得できない馬と血縁関係にある馬の競技パフォーマンスに基づいて、競技パフォーマンスが取得できない馬の競技パフォーマンスを推定する。例えば、競技パフォーマンスが取得できない馬の競技パフォーマンスを目的変数として、競技パフォーマンスが取得できない馬と血縁関係にある馬の競技パフォーマンスを説明変数として、機械学習モデルに入力することで、競技パフォーマンスが取得できない馬の目的変数を取得することができる。この場合、S704で使用される機械学習モデルは、競技パフォーマンスが取得できる馬およびその馬と血縁関係にある馬に基づいて調整された機械学習モデルであってもよい。すなわち、一度競技パフォーマンスが取得できる馬およびその馬と血縁関係にある馬の競技パフォーマンスに基づいて機械学習モデルを調整し、その後、競技パフォーマンスが取得できない馬の競技パフォーマンスを推定してもよい。これによって一部の馬に競技パフォーマンスが存在しない場合であっても、その競技パフォーマンスを推定して学習処理に使用することができるため、機械学習モデルの学習データを増やすことができる。
【0074】
本実施形態では、学習時に競技パフォーマンスが取得できない馬がいる場合に、競技パフォーマンスが取得できない馬の競技パフォーマンスを補完して学習処理を行う場合について説明した。一例では、予測時に競技パフォーマンスが取得できない馬がいる場合にも同様の処理を行うことができる。これによって、幼駒と血縁関係にある馬の競技パフォーマンスを取得できない場合であっても、その競技パフォーマンスを推定することができるため、競技パフォーマンスが存在しない馬によって幼駒の潜在的競技パフォーマンスを予測することができなくなる可能性を減らすことができる。
【0075】
<その他の実施形態>
本実施形態では、幼駒の潜在的競技パフォーマンスを予測するアプリケーションを例に説明を行ったが、本実施形態は、他のアプリケーションにも適用することができる。
【0076】
例えば、特定の母馬に対して、良好な潜在的競技パフォーマンスを有する幼駒を生産するための父馬を特定することを目的として本実施形態に係る情報処理装置の構成を変更してもよい。この場合、特定の母馬に対して、候補となりうる父馬(並びに当該父馬に対応する父父馬、父母馬、父父父馬、父父母馬、父母父馬、および父母母馬)を入力し、母馬の出産年齢を仮定して入力することで、存在しない幼駒の潜在的競技パフォーマンスを予測することができる。これによって、どの母馬と父馬とで幼駒を生産すれば高い潜在的競技パフォーマンスを有する幼駒が生まれるかを判断することができる。
【0077】
さらに、母馬が幼駒を生産するのに適切な年齢を特定することを目的として本実施形態に係る情報処理装置の構成を変更してもよい。この場合、特定の母馬及び特定の父馬について、母馬の出産年齢を仮想的に設定して複数回予測を行うことで、どの出産年齢で生まれた幼駒が高い潜在的競技パフォーマンスを有するかを判断することができ、母馬に出産させるタイミングを判断することができる。
【0078】
また、上述の各実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読み出し実行する処理でも実現可能である。
【0079】
発明は上記の実施形態に制限されるものではなく、発明の要旨の範囲内で、種々の変形・変更が可能である。