特許第6201219号(P6201219)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東芝情報システム株式会社の特許一覧

特許6201219数量予測システム及び数量予測用プログラム
<>
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000002
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000003
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000004
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000005
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000006
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000007
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000008
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000009
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000010
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000011
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000012
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000013
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000014
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000015
  • 特許6201219-数量予測システム及び数量予測用プログラム 図000016
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6201219
(24)【登録日】2017年9月8日
(45)【発行日】2017年9月27日
(54)【発明の名称】数量予測システム及び数量予測用プログラム
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20170914BHJP
   G06F 19/00 20110101ALI20170914BHJP
   G06N 99/00 20100101ALI20170914BHJP
【FI】
   G06Q30/02 310
   G06F19/00 100
   G06N99/00 153
【請求項の数】13
【全頁数】16
(21)【出願番号】特願2015-62163(P2015-62163)
(22)【出願日】2015年3月25日
(65)【公開番号】特開2016-181204(P2016-181204A)
(43)【公開日】2016年10月13日
【審査請求日】2016年7月26日
(73)【特許権者】
【識別番号】391016358
【氏名又は名称】東芝情報システム株式会社
(74)【代理人】
【識別番号】100074147
【弁理士】
【氏名又は名称】本田 崇
(72)【発明者】
【氏名】村松 久
(72)【発明者】
【氏名】朝倉 克己
【審査官】 小山 和俊
(56)【参考文献】
【文献】 特開平09−016553(JP,A)
【文献】 特開2010−266974(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
G06F 19/00
G06N 99/00
(57)【特許請求の範囲】
【請求項1】
所定対象の外的条件と内的条件の少なくとも1つの条件が所定のときに、前記所定対象の所定事象が所定時間内に発生する数量を、機械学習による複数の分類器を用いて、予測する数量予測システムであって、
所定対象の外的条件と内的条件の少なくとも1つの条件情報と、前記発生する数量とを含む一連データが複数含まれた教師データに基づき、前記所定対象の外的条件と内的条件の少なくとも1つの条件情報を含む対象データに対して、発生する数量が第1の数量以上であるか否かを判定すると共に判定数量が前記第1の数量である、前記分類器中の第1の分類器と、
前記教師データに基づき、前記対象データに対して、発生する数量が第1の数量より大きい第2の数量以上であるか否かを判定すると共に判定数量が前記第2の数量である、前記分類器中の第2の分類器と、
前記教師データに基づき、前記対象データに対して、発生する数量が第2の数量より大きい第3の数量以上であるか否かを判定すると共に判定数量が前記第3の数量である、前記分類器中の第3の分類器と、
・・・
前記教師データに基づき、前記対象データに対して、発生する数量が第(n−1)の数量より大きい第n(2以上の整数)の数量以上であるか否かを判定すると共に判定数量が前記第nの数量である、前記分類器中の第nの分類器と、
前記第1の分類器から第nの分類器までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この境界の分類器の判定数量を用いて予測数量を決定する決定手段と、
を具備することを特徴とする数量予測システム。
【請求項2】
第1の分類器から第nの分類器を1セットして、N(2以上の整数)セットの分類器を具備し、
教師データをN分割して、分割した教師データを異なる1セットの分類器に与えることを特徴とする請求項1に記載の数量予測システム。
【請求項3】
1セット中に、第1の分類器から第nの分類器をそれぞれM(2以上の整数)個設けたことを特徴とする請求項2に記載の数量予測システム。
【請求項4】
決定手段は、複数の第1の分類器の判定結果の多数決を第1の分類器の判定結果とし、複数の第2の分類器の判定結果の多数決を第2の分類器の判定結果とし、・・・、複数の第nの分類器の判定結果の多数決を第nの分類器の判定結果とすることを特徴とする請求項2または3に記載の数量予測システム。
【請求項5】
分類器は、生成のアルゴリズムにRandom Forestを採用して生成することを特徴とする請求項2乃至4のいずれか1項に記載の数量予測システム。
【請求項6】
決定手段は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、
判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測数量とすることを特徴とする請求項1乃至5のいずれか1項に記載の数量予測システム。
【請求項7】
決定手段は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、
判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量と、「否」と判定した分類器が連続している分類器中の最も第1の分類器に近い分類器の判定数量と、の中間値を予測数量とすることを特徴とする請求項1乃至5のいずれか1項に記載の数量予測システム。
【請求項8】
コンピュータを、機械学習による複数の分類器として機能させ、所定対象の外的条件と内的条件の少なくとも1つの条件が所定のときに、前記所定対象の所定事象が所定時間内に発生する数量を、予測する数量予測用プログラムであって、
前記コンピュータを、
所定対象の外的条件と内的条件の少なくとも1つの条件情報と、前記発生する数量とを含む一連データが複数含まれた教師データに基づき、前記所定対象の外的条件と内的条件の少なくとも1つの条件情報を含む対象データに対して、発生する数量が第1の数量以上であるか否かを判定すると共に判定数量が前記第1の数量である、前記分類器中の第1の分類器と、
前記教師データに基づき、前記対象データに対して、発生する数量が第1の数量より大きい第2の数量以上であるか否かを判定すると共に判定数量が前記第2の数量である、前記分類器中の第2の分類器と、
前記教師データに基づき、前記対象データに対して、発生する数量が第2の数量より大きい第3の数量以上であるか否かを判定すると共に判定数量が前記第3の数量である、前記分類器中の第3の分類器と、
・・・・
前記教師データに基づき、前記対象データに対して、発生する数量が第(n−1)の数量より大きい第n(2以上の整数)の数量以上であるか否かを判定すると共に判定数量が前記第nの数量である、前記分類器中の第nの分類器と、
前記第1の分類器から第nの分類器までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この境界の分類器の判定数量を用いて予測数量を決定する決定手段と、
して機能させるための数量予測用プログラム。
【請求項9】
コンピュータを、第1の分類器から第nの分類器を1セットして、N(2以上の整数)セットの分類器として機能させ、
教師データをN分割して、分割した教師データを異なる1セットの分類器に与えることを特徴とする請求項8に記載の数量予測用プログラム。
【請求項10】
コンピュータを、
1セット中のM(2以上の整数)個の第1の分類器として、
1セット中のM個の第2の分類器として、
・・・、
1セット中のM個の第nの分類器として
それぞれ機能させることを特徴とする請求項9に記載の数量予測用プログラム。
【請求項11】
コンピュータを、
複数の第1の分類器の判定結果の多数決を第1の分類器の判定結果とし、複数の第2の分類器の判定結果の多数決を第2の分類器の判定結果とし、・・・、複数の第nの分類器の判定結果の多数決を第nの分類器の判定結果とする決定手段として機能させることを特徴とする請求項9または10に記載の数量予測用プログラム。
【請求項12】
コンピュータを、
第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測数量とする決定手段として機能させることを特徴とする請求項8乃至11のいずれか1項に記載の数量予測用プログラム。
【請求項13】
コンピュータを、
第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量と、「否」と判定した分類器が連続している分類器中の最も第1の分類器に近い分類器の判定数量と、の中間値を予測数量とする決定手段として機能さることを特徴とする請求項8乃至11のいずれか1項に記載の数量予測用プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、商品の販売数、製品の歩留り数、入場者数、営業担当者の販売達成率など、数量を予測する数量予測システムに関するものである。一般的には、所定対象の所定事象が所定時間内に発生する数量を予測する数量予測システム及び数量予測用プログラムである。商品の販売数の例では、「所定対象」は商品であり、「所定事象」は販売されることであり、「所定時間」は1日や1か月などの期間である。
【背景技術】
【0002】
従来の商品販売予測装置として、天候、日付、曜日、時刻などを収集し、これを多段階分類や偏差を求める処理により予測に有効なデータ系列を得て、このデータ系列の全データを重回帰分析して予測に対する貢献度の高い情報を選択し、選択された情報によって商品販売の予測を行うものが開示されている(特許文献1)。しかしながら、この装置では、収集情報がビックデータと称されるような大量のデータである場合には、処理時間が膨大となり、実用的ではない。
【0003】
また、特許文献2には、世帯人数や世帯構成員の特徴などのユーザ属性を測定する装置として、単位期間の生活関連量データとユーザ属性値との組を含む教師データセットからサブセットを生成し、このサブセット毎に分岐判定式による学習の結果として葉ノードにユーザ属性値が対応付けられた決定木を生成して、推定対象データを決定木に入力して到達先となった葉ノードに対応付けられたユーザ属性値に基づいて単位ユーザ属性推定値を推定し、単位ユーザ属性推定値から推定期間のユーザ属性推定値を決定する装置が開示されている。この特許文献2に記載の装置は、決定木を用いるために処理が簡素であるものの、1世帯などの少ないデータを用いるものであり、ビックデータと称されるような大量のデータ向きの装置ではない。
【0004】
前述の特許文献1に示された如き、天候、日付、曜日、時刻などの条件と販売数量などが一連の教師データとされて用いられる装置として、分類器が知られている。図15に示した装置は、項目1、・・・、項目mによって示される条件の場合に、AであるかBであるかのラベル分けを決定する装置である。項目1として数値があり、項目mとしてXYZのいずれかが示されている。ここでは、項目2から項目(m−1)までに他の条件が入るが、省略してある。
【0005】
教師データ101は、例えば過去のデータであり、ラベルがABのいずれであるか既知である。このような教師データ101を取り込んで、分類器生成プログラム100は、ラベルABに分類を行うA/B分類器200を作成する。ここで、A/B分類器200は機械学習によって例えばy=f(項目1,項目2,・・・,項目m)のような予測モデルを用いて、y(1または0)を導き出す。ここに、1はラベルAであり、0はラベルBとすることができる。
【0006】
上記の分類器200に、項目1、・・・、項目mの値があるが、ラベルが未知である分類対象データ102を投入すると、分類器200がラベル分けを行って、分類結果データ103が得られる。このような分類器に関連する技術は、特許文献3や特許文献4などに示されている。しかしながら、これらの分類器によっては、ラベル分けが行われるだけであり、数量予測を行うものではなかった。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開平8−212191号公報
【特許文献2】特開2014−167715号公報
【特許文献3】特開2009−238193号公報
【特許文献4】特開2008−217375号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は上記のような数量予測システムの現状に鑑みてなされたもので、その目的は、簡単な処理により適切に数量予測を行うことが可能な数量予測システムを提供することである。また、他の目的は、分散処理を行い易い分類器を用いて数量予測システムを構成し、処理の高速化を図ることを可能とすることである。
【課題を解決するための手段】
【0009】
本発明に係る数量予測システムは、所定対象の外的条件と内的条件の少なくとも1つの条件が所定のときに、前記所定対象の所定事象が所定時間内に発生する数量を、機械学習による複数の分類器を用いて、予測する数量予測システムであって、所定対象の外的条件と内的条件の少なくとも1つの条件情報と、前記発生する数量とを含む一連データが複数含まれた教師データに基づき、前記所定対象の外的条件と内的条件の少なくとも1つの条件情報を含む対象データに対して、発生する数量が第1の数量以上であるか否かを判定すると共に判定数量が前記第1の数量である、前記分類器中の第1の分類器と、前記教師データに基づき、前記対象データに対して、発生する数量が第1の数量より大きい第2の数量以上であるか否かを判定すると共に判定数量が前記第2の数量である、前記分類器中の第2の分類器と、前記教師データに基づき、前記対象データに対して、発生する数量が第2の数量より大きい第3の数量以上であるか否かを判定すると共に判定数量が前記第3の数量である、前記分類器中の第3の分類器と、・・・ 前記教師データに基づき、前記対象データに対して、発生する数量が第(n−1)の数量より大きい第n(2以上の整数)の数量以上であるか否かを判定すると共に判定数量が前記第nの数量である、前記分類器中の第nの分類器と、前記第1の分類器から第nの分類器までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この境界の分類器の判定数量を用いて予測数量を決定する決定手段と、を具備することを特徴とする。
【0010】
本発明に係る数量予測システムでは、第1の分類器から第nの分類器を1セットして、N(2以上の整数)セットの分類器を具備し、教師データをN分割して、分割した教師データを異なる1セットの分類器に与えることを特徴とする。
【0011】
本発明に係る数量予測システムでは、1セット中に、第1の分類器から第nの分類器をそれぞれM(2以上の整数)個設けたことを特徴とする。
【0012】
本発明に係る数量予測システムでは、決定手段は、複数の第1の分類器の判定結果の多数決を第1の分類器の判定結果とし、複数の第2の分類器の判定結果の多数決を第2の分類器の判定結果とし、・・・、複数の第nの分類器の判定結果の多数決を第nの分類器の判定結果とすることを特徴とする。
【0013】
本発明に係る数量予測システムでは、分類器は、生成のアルゴリズムにRandom Forestを採用して生成することを特徴とする。
【0014】
本発明に係る数量予測システムでは、決定手段は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測数量とすることを特徴とする。
【0015】
本発明に係る数量予測システムでは、決定手段は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量と、「否」と判定した分類器が連続している分類器中の最も第1の分類器に近い分類器の判定数量と、の中間値を予測数量とすることを特徴とする。
【0016】
本発明に係る数量予測用プログラムは、コンピュータを、機械学習による複数の分類器として機能させ、所定対象の外的条件と内的条件の少なくとも1つの条件が所定のときに、前記所定対象の所定事象が所定時間内に発生する数量を、予測する数量予測用プログラムであって、前記コンピュータを、所定対象の外的条件と内的条件の少なくとも1つの条件情報と、前記発生する数量とを含む一連データが複数含まれた教師データに基づき、前記所定対象の外的条件と内的条件の少なくとも1つの条件情報を含む対象データに対して、発生する数量が第1の数量以上であるか否かを判定すると共に判定数量が前記第1の数量である、前記分類器中の第1の分類器と、前記教師データに基づき、前記対象データに対して、発生する数量が第1の数量より大きい第2の数量以上であるか否かを判定すると共に判定数量が前記第2の数量である、前記分類器中の第2の分類器と、前記教師データに基づき、前記対象データに対して、発生する数量が第2の数量より大きい第3の数量以上であるか否かを判定すると共に判定数量が前記第3の数量である、前記分類器中の第3の分類器と、・・・・ 前記教師データに基づき、前記対象データに対して、発生する数量が第(n−1)の数量より大きい第n(2以上の整数)の数量以上であるか否かを判定すると共に判定数量が前記第nの数量である、前記分類器中の第nの分類器と、前記第1の分類器から第nの分類器までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この境界の分類器の判定数量を用いて予測数量を決定する決定手段と、して機能させることを特徴とする。
【0017】
本発明に係る数量予測用プログラムでは、コンピュータを、第1の分類器から第nの分類器を1セットして、N(2以上の整数)セットの分類器として機能させ、教師データをN分割して、分割した教師データを異なる1セットの分類器に与えることを特徴とする。
【0018】
本発明に係る数量予測用プログラムでは、コンピュータを、1セット中のM(2以上の整数)個の第1の分類器として、1セット中のM個の第2の分類器として、・・・、1セット中のM個の第nの分類器としてそれぞれ機能させることを特徴とする。
【0019】
本発明に係る数量予測用プログラムでは、コンピュータを、複数の第1の分類器の判定結果の多数決を第1の分類器の判定結果とし、複数の第2の分類器の判定結果の多数決を第2の分類器の判定結果とし、・・・、複数の第nの分類器の判定結果の多数決を第nの分類器の判定結果とする決定手段として機能させることを特徴とする。
【0020】
本発明に係る数量予測用プログラムでは、コンピュータを、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測数量とする決定手段として機能させることを特徴とする。
【0021】
本発明に係る数量予測用プログラムでは、コンピュータを、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量と、「否」と判定した分類器が連続している分類器中の最も第1の分類器に近い分類器の判定数量と、の中間値を予測数量とする決定手段として機能さることを特徴とする。
【発明の効果】
【0022】
本発明によれば、所定対象の外的条件と内的条件の少なくとも1つの条件が所定のときに、前記所定対象の所定事象が所定時間内に発生する数量を、機械学習による複数の分類器を用いて、予測するので、複数の分類器を並列動作させて処理の高速化を図ることが可能である。
【0023】
また、本発明によれば、発生する数量が第1の数量より大きい第2の数量以上であるか否かを判定すると共に判定数量が前記第2の数量である、前記分類器中の第2の分類器と、前記教師データに基づき、前記対象データに対して、発生する数量が第2の数量より大きい第3の数量以上であるか否かを判定すると共に判定数量が前記第3の数量である、前記分類器中の第3の分類器と、・・・前記教師データに基づき、前記対象データに対して、発生する数量が第(n−1)の数量より大きい第n(2以上の整数)の数量以上であるか否かを判定すると共に判定数量が前記第nの数量である、前記分類器中の第nの分類器とを用いて、前記第1の分類器から第nの分類器までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この境界の分類器の判定数量を用いて予測数量を決定するので、「肯定」と「否」との境界の分類器の判定数量により、いくつまでの数量が発生するか予測可能となる。
【図面の簡単な説明】
【0024】
図1】本発明の第1の実施形態に係る数量予測システムの構成図。
図2】本発明の第1の実施形態に係る数量予測システムを生成するプロセスの構成図。
図3】本発明の第1の実施形態に係る数量予測システムの構成図。
図4】本発明の第1の実施形態に係る数量予測システムの判定手段による判定の一例を示す図。
図5】本発明の第2の実施形態に係る数量予測システムを生成するプロセスの構成図。
図6】本発明の第2の実施形態に係る数量予測システムの構成図。
図7】本発明の第2の実施形態に係る数量予測システムの判定手段による判定の一例を示す図。
図8】本発明の第2の実施形態に係る数量予測システムの判定手段による「最小値法」を用いた判定の一例を示す図。
図9】本発明の第2の実施形態に係る数量予測システムの判定手段による「最大値法」を用いた判定の一例を示す図。
図10】本発明の第2の実施形態に係る数量予測システムの判定手段による「平均値法」を用いた判定の一例を示す図。
図11】本発明の第2の実施形態に係る数量予測システムの判定手段による「連続欠落部(否部)注目法」を用いた判定の一例を示す図。
図12】本発明の第2の実施形態に係る数量予測システムの判定手段による「重み法」を用いた判定の一例を示す図。
図13】本発明の第2の実施形態に係る数量予測システムの判定手段による「複数回試行多数決法」を用いた判定の一例を示す図。
図14】分類器10〜分類器100を用いる数量予測システムの信頼度を可視化するための判定結果テーブルを示す図。
図15】分類器を用いて構成した分類装置のブロック図。
【発明を実施するための形態】
【0025】
以下添付図面を参照して本発明に係る数量予測システム及び数量予測システムの実施形態を説明する。各図において同一の構成要素には同一の符号を付し、重複する説明を省略する。図1に本発明に係る数量予測システムにおける第1の実施形態のブロック図が示されている。この実施形態では、第1の分類器11、第2の分類器12、第3の分類器13が用いられる。一般的に、n(2以上の整数)個の分類器が用いられる。
【0026】
第1の分類器11、第2の分類器12、第3の分類器13は、機械学習による分類器である。第1の分類器11は、教師データ50に基づき、対象データ60に対して、発生する数量が第1の数量(10)以上であるか否かを判定するものである。第2の分類器12は、教師データ50に基づき、対象データ60に対して、発生する数量が第1の数量(10)より大きい第2の数量(20)以上であるか否かを判定するものである。第3の分類器13は、教師データ50に基づき、対象データ60に対して、発生する数量が第2の数量(20)より大きい第3の数量(30)以上であるか否かを判定するものである。一般的に、第nの分類器は、教師データ50に基づき、対象データ60に対して、発生する数量が第(n−1)の数量より大きい第nの数量以上であるか否かを判定するものである。なお、各分類器間の数量の差(きざみ)は、一定でなくても良いし、整数でなくとも良いことは明白である。
【0027】
本システムは、所定対象の外的条件と内的条件の少なくとも1つの条件が所定のときに、前記所定対象の所定事象が所定時間内に発生する数量を予測するものである。ここで商品の販売数を予測するシステムでは、「所定対象」は商品であり、「所定事象」は販売されることであり、「所定時間」は1日や1か月などの期間である。また、製品の歩留り数を予測するシステムでは、「所定対象」は製品であり、「所定事象」は良品が製造されることであり、「所定時間」は1日や1か月などの期間である。また、入場者数を予測するシステムでは、「所定対象」は人であり、「所定事象」は人が入場することであり、「所定時間」は1日や1か月などの期間である。更に、営業担当者の販売達成率を予測するシステムでは、「所定対象」は或る営業担当者であり、「所定事象」は或る営業担当者が商品を販売することであり、「所定時間」は1日や1か月などの期間である。
【0028】
所定対象の外的条件とは、温度や湿度、天気、騒音(デシベル)などであり、所定対象の内的条件とは、商品や製品であれば、組成(何からできているか、何が何%含まれているかなど)、固さや柔らかさなどであり、人であれば、体温、脈拍数、病気などとすることができる。
【0029】
教師データ50は、所定対象の外的条件と内的条件の少なくとも1つの条件情報と、発生する数量とを含む一連データが複数含まれて構成される。この第1の実施形態では、条件情報として項目1〜項目mがあり、項目1に温度が採用され、項目mに天気が採用されている。「発生する数量」は数量であり、一連データはNoにより決定する、表中の一行分のデータを意味する。
【0030】
第1の分類器11は分類器生成プログラム21によって作成され、第2の分類器12は分類器生成プログラム22によって作成され、第3の分類器13は分類器生成プログラム23によって作成される。第1の分類器11、第2の分類器12、第3の分類器13は機械学習による複数の分類器として作成され、例えば、判定結果をZ(「肯定」=1,「否」=0)とし、所定関数fを用いて、Z=f(項目1,項目2,・・・,項目m)により判定を行うものとすることができる。
【0031】
対象データ60は、教師データ50と同じ条件情報である項目1〜項目mを有する一連データであって、数量が求められていないデータである。第1の分類器11、第2の分類器12、第3の分類器13は、教師データ50に基づき上記の如くして生成された機械学習による分類器であり、上記の対象データ60に対して判定を行う。
【0032】
ここでは、判定結果を、「肯定」=○により表し、「否」=×により表す。図1に示した判定結果では、No.3の対象データに着目している。第1の分類器11は10以上について○であり、第2の分類器12は20以上について○であり、第3の分類器13は30以上について×である。
【0033】
第1の分類器11の出力、第2の分類器12の出力、第3の分類器13の出力は、決定手段30へ与えられる。決定手段30は、第1の分類器から第3(一般的には、第n)の分類器13までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この分類器の判定数量を用いて予測数量を決定する。即ち、上記図1のNo.3の対象データについては、判定結果が「肯定」と「否」との境界の分類器は、第2の分類器12と第3の分類器13である。第2の分類器12の判定数量は20であり、第3の分類器13の判定数量は30であるから、予測数量を20以上30未満と決定する。
【0034】
上記のように、決定手段30は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測数量とする。
【0035】
しかし、判定結果が「肯定」から「否」へ最初に変化した分類器より大きい判定数量に対応する分類器の判定結果が、以降「否」が連続するとは限らない。例えば、判定結果が「肯定」から「否」へ最初に変化した以降において、「・・・、肯定、否、肯定、否、肯定、否、否、・・・」のような結果となる場合もある。このような場合には、決定手段30は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量と、「否」と判定した分類器が連続している分類器中の最も第1の分類器に近い分類器の判定数量と、の中間値を予測数量とする。ここで、中間値は、中央値であっても良いし、「肯定」と「否」が混じり合う区間において、「肯定」と「否」の数により比例させても良い。例えば、「肯定」が2「否」が1であれば比例配分により、区間の3分の2の数値としても良い。
【0036】
または、決定手段30は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「否」の連続となる境界における最初の分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測しても良い。
【0037】
図2に、第1の実施形態に係る数量予測システムの分類器生成プロセスの構成図を示す。つまり、第1の実施形態に係る数量予測システムは、分類器がそれぞれ全ての教師データ50を用いるシステムである。このため、第1の分類器11を生成するための第1の分類器生成プログラム21、第2の分類器12を生成するための第2の分類器生成プログラム22、第3の分類器13を生成するための第3の分類器生成プログラム23を備える。第1の分類器生成プログラム21は、第1の分類器11を生成する。第2の分類器生成プログラム22は、第2の分類器12を生成する。第3の分類器生成プログラム23は、第3の分類器13を生成する。
【0038】
この第1の実施形態では、図3に示されるように、第1の分類器11、第2の分類器12、第3の分類器13に対し、それぞれ対象データ60が与えられる。図4に示すように、第1の分類器11は10以上について○であり、第2の分類器12は20以上について○であり、第3の分類器13は30以上について×となっている。
【0039】
第1の分類器11の出力、第2の分類器12の出力、第3の分類器13の出力は、決定手段30へ与えられる。決定手段30は、第1の分類器から第3(一般的には、第n)の分類器13までの判定結果に基づき、判定結果が「肯定」と「否」との境界の分類器を検出し、この分類器の判定数量を用いて予測数量を決定する。
【0040】
図5に、第2の実施形態に係る数量予測システムの分類器生成プロセスの構成図を示す。つまり、第2の実施形態に係る数量予測システムは、教師データ50を3分割し、分割データ50−1〜50−3とする。第1の分類器から第nの分類器を1セットとして、N(2以上の整数)セットの分類器を備える。この実施形態では、n=3、N=3である。この分割数Nは、教師データ50のアイテム数(No.)と条件情報数(項目数)と処理リソースにより所望の処理時間となるように決定することができる。
【0041】
第1の分類器11−1と第2の分類器12−1と第3の分類器13−1は分割データ50−1を用いてそれぞれ異なる分類器生成プログラム21−1、22−1、23−1によって作成される。第1の分類器11−2と第2の分類器12−2と第3の分類器13−2は分割データ50−2を用いてそれぞれ異なる分類器生成プログラム21−2、22−2、23−2によって作成され、第1の分類器11−3と第2の分類器12−3と第3の分類器13−3は分割データ50−3を用いてそれぞれ異なる分類器生成プログラム21−3、22−3、23−3によって作成される。
【0042】
図5の例では、1セット中に、第1の分類器から第nの分類器をそれぞれM(2以上の整数)個設ける。つまり、第1の分類器11−1〜11−3と第2の分類器12−1〜12−3と第3の分類器13−1〜13−3は、それぞれ生成プログラム(生成プロセス)を備えており、生成のアルゴリズムにRandom Forestを採用して生成される。これにより、分類器生成そのものを並列処理することができる。第1の分類器11−1〜11−3は3個生成され、第2の分類器12−1〜12−3は3個生成され、更に、第3の分類器13−1〜13−3も3個生成される。
【0043】
以上のように複数の第1の分類器11と複数の第2の分類器12と複数の第3の分類器13を用いて、Hadoopといった分散環境で分割データ50−1、50−2、50−3を用いて並列処理する。例えば、第1の分類器11−1と第2の分類器12−1と第3の分類器13−1の1セットを第1のコンピュータに生成し、第1の分類器11−2と第2の分類器12−2と第3の分類器13−2の1セットを第2のコンピュータに生成し、第1の分類器11−3と第2の分類器12−3と第3の分類器13−3の1セットを第3のコンピュータに生成し、並列処理することができる。
【0044】
図6に、第2の実施形態に係る数量予測システムの構成図、つまり、対象データ60を用いて、複数の分類器により判定を行い、決定手段40により処理する構成の構成図を示す。対象データ60は分類器の数と同じ経路に分岐されて、分類器11−1〜11−3、第2の分類器12−1〜12−3、第3の分類器13−1〜13−3、へ送られる。
【0045】
第1の分類器11−1〜11−3は、発生する数量が第1の数量(10)以上であるか否かを判定するものである。第2の分類器12−1〜12−3は、発生する数量が第2の数量(20)以上であるか否かを判定するものである。第3の分類器13−1〜13−3は、発生する数量が第3の数量(30)以上であるか否かを判定するものである。
【0046】
第1の分類器11−1〜11−3の判定結果を全て決定手段40に与える。第2の分類器12−1〜12−3の判定結果を全て決定手段40に与える。第3の分類器13−1〜13−3の判定結果を全て決定手段40に与える。決定手段40は、決定手段40の機能に加えて、複数の第1の分類器11−1〜11−3の判定結果(対象データ中の同じ一連データを対象として判定を行った判定結果)の多数決を第1の分類器の判定結果とし、複数の第2の分類器12−1〜12−3の判定結果(対象データ中の同じ一連データを対象として判定を行った判定結果)の多数決を第2の分類器の判定結果とし、・・・、複数の第nの分類器の判定結果(対象データ中の同じ一連データを対象として判定を行った判定結果)の多数決を第nの分類器の判定結果とする機能を有する。決定手段40は、分類器を生成するコンピュータを複数とする場合に、いずれか1台に、または別の一台に設けることができる。
【0047】
従って、図7(a)に示すように、第1の分類器11−1〜11−3が判定した「○(肯定)」と「×(否)」とを用いて、図7(a)に示すように、決定手段40が多数決により○で示される「肯定」を判定結果とする。同様に、第2の分類器12−1〜12−3が判定した「○(肯定)」と「×(否)」とを用いて、決定手段40が多数決により○で示される「肯定」を判定結果とする。更に、第3の分類器13−1〜13−3が判定した「○(肯定)」と「×(否)」とを用いて、決定手段40が多数決により×で示される「否」を判定結果とする。
【0048】
即ち、決定手段40は、第1の分類器11−1〜11−3の3つの判定結果について更に多数決処理し、第1の分類器の1つの判定結果(「肯定」=○、「否」=×)を得る。同様に、決定手段40は、第2の分類器12−1〜12−3の3つの判定結果について更に多数決処理し、第2の分類器の1つの判定結果(「肯定」=○、「否」=×)を得る。また、決定手段40は、第3の分類器13−1〜13−3の3つの判定結果について更に多数決処理し、第3の分類器の1つの判定結果(「肯定」=○、「否」=×)を得る。
【0049】
図7の例では、第1の分類器の最終的な1つの判定結果は○であり、第2の分類器の最終的な1つの判定結果は○であり、第3の分類器の最終的な1つの判定結果はで×ある。この結果、図1によって処理を行った場合と同様に、予測数量を20以上30未満と決定することができる。
【0050】
以上説明した第2の実施形態によれば、同じ数量に対する判定を行う分類器を複数生成し判定するので、生成/判定が並列処理されることにより、最終的に予測した数量を出力するまでの時間を短縮することが可能である。特に、教師データが多量であり、対象データが少量である場合に大きな時間短縮の効果を得ることができる。
【0051】
上記において、決定手段40は、第1の分類器側から第nの分類器側へ各分類器の判定結果を検出し、判定結果が「肯定」から「否」へ最初に変化した境界における分類器の判定数量未満で、前記境界における分類器より1つ第1の分類器側の判定数量以上である第1の数量を予測数量とするものとしたが、これに限定されない。
【0052】
ここでは、「最小値法」、「最大値法」、「平均値法」、「連続欠落部(否部)注目法」、「重み法」及び、「複数回試行多数決法」を説明する。分類器は、10以上、20以上、・・・、90以上の9種類とし、判定結果はいずれも同じである。「最小値法」は、昇順に並べた分類器の最低値から連続する「正しい(肯定)がn以上」である場合の最上位の分類器の判定値を予測値と決定するものである。この手法でn=2とすると、図8に示すように、「肯定(○)」が10以上の分類器から30以上の判定器まで2以上連続するので、その最上位の分類器の判定値30を予測値と決定する。
【0053】
「最大値法」は、昇順に並べた分類器の最高値から降順に最初に「正しい(n以上)」と判定した分類器の判定値を予測値と決定するものである。図9では、最高値である90以上の判定器から降順に検査すると、最初に、「肯定(○)」となるのは80以上の分類器であるから80を予測値と決定する。
【0054】
「平均値法」は、「否(×)」と判定した最初の分類器の1つ前の分類器の判定値と、「否(×)」と判定した最後の分類器の1つ前の分類器の判定値との平均を求める。図10の例では、30以上の分類器と80以上の分類器となるので、この平均値の55を予測値と決定する。
【0055】
「連続欠落部(否部)注目法」は、昇順に並べた分類器の最低値から連続する「否(×)」がn以上」である場合の最下位の分類器の1つ下位の分類器の判定値を予測値と決定するものである。この手法でn=2とすると、図11に示すように、「否(×)」が60以上の分類器から70以上の分類器まで2以上連続するので、その最下位の分類器の1つ下位の分類器の判定値50を予測値と決定する。
【0056】
「重み法」は、昇順に並べた各分類器と、その前後nに重みを付け、特定の閾値以下となった境界における分類器の判定値を予測値とする。最小分類器未満は全て「正しい」、最大分類器超は「正しくない」とする。重み表の一例を、図12(a)に示す。この例は、昇順に並べた各分類器の1つを対象分類器として、この対象分類器と、その前後2に重み付けを行うものである。図12(a)において、「0」は対象分類器を示し、「−1」は対象分類器より1つ前の分類器を示し、「−2」は対象分類器より2つ前の分類器を示し、「+1」は対象分類器より1つ後の分類器を示し、「+2」は対象分類器より2つ後の分類器を示す。
【0057】
上記重み表を用いて、分類器の判定結果が「○」の場合重み付けを行い、「×」の場合は重み付けを行わない。それぞれの分類器に重み付けをした値の合算を結果値とする。図12(a)の重み表を用いて判定結果が図12(b)の上段のようである場合の重み付結果を図12(b)の下段に示す。予め定めた境界値を下回る重みを持つ分類器の1つ前の分類器の判定値を予測値と決定する。図12の例では、50を予め定めた境界値としており、重みが37.5である60以上の判定を行う分類器が境界となり、その1つ前の分類器の判定値50を予測値と決定する。予め定めた境界値を50としたが、一例に過ぎず、75や100であってもよい。
【0058】
「複数回試行多数決法」は、10以上の分類器から90以上の分類器を用いて複数回の判定を行う。例えば3回試行した例を図13に示す。分類器毎に複数回の判定結果について多数決を用いて判定結果を得る。この判定結果について、「最小値法」、「最大値法」、「平均値法」、「連続欠落部(否部)注目法」、「重み法」のいずれかを用いて予測値を決定する。図13の例では、多数決の判定結果は50以上の分類器までが「肯定(○)」となる。この判定結果について「最小値法」を用いると、判定値50が予測値となる。なお、複数回試行して、この中から所定回をランダムに抽出して、抽出したデータについて、上記のような手法を適用しても良い。
【0059】
第1の実施形態と第2の実施形態において、対象データとして教師データ(一部で良い)を採用することにより、当該数量予測システムの評価を行うことができる。この場合、第1の分類器から第nの分類器の判定結果(多数決処理後のもの)を、教師データと比較したテーブルとしてディスプレイやプリンタから出力することにより、システムの信頼度を可視化(見える化)することが可能である。
【0060】
例えば、分類器10〜分類器100を用いる数量予測システムの信頼度を可視化するための判定結果テーブルを図14に示す。分類器10は予測数値が10以上であるか否か判定し、判定結果(「肯定」=○、「否」=×)を得るものであり、分類器20は予測数値が20以上であるか否か判定し、判定結果(「肯定」=○、「否」=×)を得るものであり、・・・(以下同様)・・・、分類器100は予測数値が100以上であるか否か判定し、判定結果(「肯定」=○、「否」=×)を得るものである。
【0061】
「アイテムNo.」は、一連データの番号であり、「数量実績」は教師データ中の数量である。テーブル中の○、×において、「白抜き」の表示となっているところが、教師データに対して誤判定となったことを示す。これにより、誤判定の度合いなどが一目瞭然であり、分類器の生成に用いる関数や、用いる条件(項目)を変更して適切な分類器の作成に役立てることができる。また、○、×の「白抜き」など特殊態様の表示に加えて、分類器毎や全体の正答率を表示するようにしても良い。
【0062】
本発明の予測の対象は、上記の適用範囲に限定されない。例えば、販売分野においては、販売数予測や販売達成率予測に適用することができる。また、製造分野においては、歩留まり予測や機器故障率予測に適用することができる。また、交通分野においては、交通量予測や渋滞予測や交通事故確率予測に適用することができる。また、農業分野においては、生産高予測や害虫発生率予測に適用することができる。水産業分野においては、漁獲量予測に適用することができる。更に、経済・人口の分野においては、株価予測や出生率予測に適用することができる。
【符号の説明】
【0063】
11、11−1〜11−3 第1の分類器
12、12−1〜12−3 第2の分類器
13、13−1〜13−3 第3の分類器
30、40 決定手段
50 教師データ
50−1〜50−3 分割データ
60 対象データ


図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15