(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-10
(45)【発行日】2023-10-18
(54)【発明の名称】データ処理装置、データ処理方法及びプログラム
(51)【国際特許分類】
G06Q 10/06 20230101AFI20231011BHJP
G06N 20/00 20190101ALI20231011BHJP
G06Q 10/04 20230101ALI20231011BHJP
【FI】
G06Q10/06
G06N20/00 130
G06Q10/04
(21)【出願番号】P 2022019281
(22)【出願日】2022-02-10
【審査請求日】2022-10-27
(73)【特許権者】
【識別番号】592008055
【氏名又は名称】株式会社KDDIテクノロジー
(74)【代理人】
【識別番号】100166006
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】森 英一
【審査官】石田 紀之
(56)【参考文献】
【文献】特開2021-47715(JP,A)
【文献】特開2017-107443(JP,A)
【文献】特開2012-146126(JP,A)
【文献】特開2021-163412(JP,A)
【文献】米国特許出願公開第2012/0041797(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した学習済みモデルであって、前記作業の前記属性データ、を入力したときに前記作業が予定通りに完了するか否かを示す完了予測データを出力するように構成された第1の学習済みモデルを記憶する第1モデル記憶部と、
前記作業の前記属性データと、作業が予定通りに完了したかを示す情報と、前記複数の工程それぞれの完了日である複数の工程完了日それぞれと作業開始日との差分の少なくともいずれかと、を関連付けた第2の学習用作業データを学習し、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を入力すると前記完了予測データを出力する学習済みモデルであって、前記複数の工程のうちそれぞれ異なる工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した複数の第2の学習済みモデルを記憶する第2モデル記憶部と、
前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を関連付けた1以上の作業データを取得する取得部と、
前記取得部が取得した前記1以上の作業データを前記第1の学習済みモデル又は複数の前記第2の学習済みモデルのいずれかに入力し、前記完了予測データを出力する推論部と、
を有するデータ処理装置。
【請求項2】
前記取得部が取得した1以上の前記作業データそれぞれが示す前記作業における完了済みの工程に基づいて、前記第1の学習済みモデルと複数の前記第2の学習済みモデルとから前記作業データそれぞれについて入力する学習済みモデルを選択する選択部をさらに有し、
前記推論部は、前記取得部が取得した1以上の前記作業データそれぞれを、前記選択部が選択した前記学習済みモデルに入力し、前記完了予測データを出力する、
請求項1に記載のデータ処理装置。
【請求項3】
前記選択部は、前記取得部が取得した1以上の前記作業データそれぞれが前記工程のいずれも完了していないことを示す場合に前記第1の学習済みモデルを選択し、取得した1以上の前記作業データそれぞれがいずれかの工程が完了していることを示す場合に、完了している工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した前記第2の学習済みモデルを選択する、
請求項2に記載のデータ処理装置。
【請求項4】
前記第1モデル記憶部は、前記作業の実施組織を前記属性データとしてさらに含む前記第1の学習用作業データを学習した前記第1の学習済みモデルを記憶し、
前記第2モデル記憶部は、前記実施組織を前記属性データとしてさらに含む前記第2の学習用作業データを学習した前記第2の学習済みモデルを記憶し、
前記取得部は、前記実施組織を前記属性データにさらに含む前記1以上の作業データを取得し、
前記推論部は、前記取得部が取得した前記1以上の作業データを入力する、
請求項1から3のいずれか1項に記載のデータ処理装置。
【請求項5】
前記第1モデル記憶部は、前記作業の実施場所を前記属性データとしてさらに含む前記第1の学習用作業データを学習した前記第1の学習済みモデルを記憶し、
前記第2モデル記憶部は、前記実施場所を前記属性データとしてさらに含む前記第2の学習用作業データを学習した前記第2の学習済みモデルを記憶し、
前記取得部は、前記実施場所を前記属性データにさらに含む前記1以上の作業データを取得し、
前記推論部は、前記取得部が取得した前記1以上の作業データを入力する、
請求項1から4のいずれか1項に記載のデータ処理装置。
【請求項6】
前記第2モデル記憶部は、前記作業において逐次的に実施される3以上の工程であって、前記3以上の工程それぞれの完了日相互の差分をさらに関連付けた前記第2の学習用作業データを学習した前記第2の学習済みモデルを記憶し、
前記推論部は、前記3以上の工程それぞれの完了日相互の差分をさらに含む前記1以上の作業データを入力する、
請求項1から5のいずれか1項に記載のデータ処理装置。
【請求項7】
コンピュータが実行する、第1モデル記憶部に記憶された、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、前記作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した学習済みモデルであって、前記作業の前記属性データを入力したときに前記作業が予定通りに完了するか否かを示す完了予測データを出力するように構成された第1の学習済みモデルを取得するステップと、
第2モデル記憶部に記憶された、前記作業の前記属性データと、作業が予定通りに完了したかを示す情報と、前記複数の工程それぞれの完了日である複数の工程完了日の少なくともいずれかと作業開始日との差分と、を関連付けた第2の学習用作業データを学習し、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を入力すると前記完了予測データを出力する学習済みモデルであって、前記複数の工程のうちそれぞれ異なる工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した複数の第2の学習済みモデルを取得するステップと、
前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を関連付けた1以上の作業データを取得するステップと、
前記作業データを取得するステップにおいて取得された前記1以上の作業データを前記第1の学習済みモデル又は複数の前記第2の学習済みモデルのいずれかに入力し、前記完了予測データを出力するステップと、
を有するデータ処理方法。
【請求項8】
コンピュータに、
第1モデル記憶部に記憶された、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、前記作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した学習済みモデルであって、前記作業の前記属性データを入力したときに前記作業が予定通りに完了するか否かを示す完了予測データを出力するように構成された第1の学習済みモデルを取得するステップと、
第2モデル記憶部に記憶された、前記作業の前記属性データと、作業が予定通りに完了したかを示す情報と、前記複数の工程それぞれの完了日である複数の工程完了日の少なくともいずれかと作業開始日との差分と、を関連付けた第2の学習用作業データを学習し、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を入力すると前記完了予測データを出力する学習済みモデルであって、前記複数の工程のうちそれぞれ異なる工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した複数の第2の学習済みモデルを取得するステップと、
前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を関連付けた1以上の作業データを取得するステップと、
前記作業データを取得するステップにおいて取得された前記1以上の作業データを前記第1の学習済みモデル又は複数の前記第2の学習済みモデルのいずれかに入力し、前記完了予測データを出力するステップと、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置、データ処理方法及びプログラムに関する。
【背景技術】
【0002】
作業の進捗状況を推論するシステムが知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のシステムにおいては、現場の状況を撮像した画像データを入力することで進捗状況の推論を行う。しかし、従来のシステムにおいては、画像データを取得するためのコストが大きく、十分な量のデータが入手できない場合に作業が予定通りに完了するかどうかを十分な精度で予測することができないという問題が生じる。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、入手が容易なデータに基づいて作業が予定通りに完了するかどうかをより高い精度で推論できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様のデータ処理装置においては、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した学習済みモデルであって、前記作業の前記属性データ、を入力したときに前記作業が予定通りに完了するか否かを示す完了予測データを出力するように構成された第1の学習済みモデルを記憶する第1モデル記憶部と、前記作業の前記属性データと、作業が予定通りに完了したかを示す情報と、前記複数の工程それぞれの完了日である複数の工程完了日それぞれと作業開始日との差分の少なくともいずれかと、を関連付けた第2の学習用作業データを学習し、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を入力すると前記完了予測データを出力する学習済みモデルであって、前記複数の工程のうちそれぞれ異なる工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した複数の第2の学習済みモデルを記憶する第2モデル記憶部と、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を関連付けた1以上の作業データを取得する取得部と、前記取得部が取得した前記1以上の作業データを前記第1の学習済みモデル又は複数の前記第2の学習済みモデルのいずれかに入力し、前記完了予測データを出力する推論部と、を有する
【0007】
前記取得部が取得した1以上の前記作業データそれぞれが示す前記作業における完了済みの工程に基づいて、前記第1の学習済みモデルと複数の前記第2の学習済みモデルとから前記作業データそれぞれについて入力する学習済みモデルを選択する選択部をさらに有し、前記推論部は、前記取得部が取得した1以上の前記作業データそれぞれを、前記選択部が選択した前記学習済みモデルに入力し、前記完了予測データを出力してもよい。
【0008】
前記選択部は、前記取得部が取得した1以上の前記作業データそれぞれが前記工程のいずれも完了していないことを示す場合に前記第1の学習済みモデルを選択し、取得した1以上の前記作業データそれぞれがいずれかの工程が完了していることを示す場合に、完了している工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した前記第2の学習済みモデルを選択してもよい。
【0009】
前記第1モデル記憶部は、前記作業の実施組織を前記属性データとしてさらに含む前記第1の学習用作業データを学習した前記第1の学習済みモデルを記憶し、前記第2モデル記憶部は、前記実施組織を前記属性データとしてさらに含む前記第2の学習用作業データを学習した前記第2の学習済みモデルを記憶し、前記取得部は、前記実施組織を前記属性データにさらに含む前記1以上の作業データを取得し、前記推論部は、前記取得部が取得した前記1以上の作業データを入力してもよい。
【0010】
前記第1モデル記憶部は、前記作業の実施場所を前記属性データとしてさらに含む前記第1の学習用作業データを学習した前記第1の学習済みモデルを記憶し、前記第2モデル記憶部は、前記実施場所を前記属性データとしてさらに含む前記第2の学習用作業データを学習した前記第2の学習済みモデルを記憶し、前記取得部は、前記実施場所を前記属性データにさらに含む前記1以上の作業データを取得し、前記推論部は、前記取得部が取得した前記1以上の作業データを入力してもよい。
【0011】
前記第2モデル記憶部は、前記作業において逐次的に実施される3以上の工程であって、前記3以上の工程それぞれの完了日相互の差分をさらに関連付けた前記第2の学習用作業データを学習した前記第2の学習済みモデルを記憶し、前記推論部は、前記3以上の工程それぞれの完了日相互の差分をさらに含む前記1以上の作業データを入力してもよい。
【0012】
本発明の第2の態様のデータ処理方法においては、コンピュータが実行する、第1モデル記憶部に記憶された、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、前記作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した学習済みモデルであって、前記作業の前記属性データを入力したときに前記作業が予定通りに完了するか否かを示す完了予測データを出力するように構成された第1の学習済みモデルを取得するステップと、第2モデル記憶部に記憶された、前記作業の前記属性データと、作業が予定通りに完了したかを示す情報と、前記複数の工程それぞれの完了日である複数の工程完了日の少なくともいずれかと作業開始日との差分と、を関連付けた第2の学習用作業データを学習し、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を入力すると前記完了予測データを出力する学習済みモデルであって、前記複数の工程のうちそれぞれ異なる工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した複数の第2の学習済みモデルを取得するステップと、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を関連付けた1以上の作業データを取得するステップと、前記作業データを取得するステップにおいて取得された前記1以上の作業データを前記第1の学習済みモデル又は複数の前記第2の学習済みモデルのいずれかに入力し、前記完了予測データを出力するステップと、を有する。
【0013】
本発明の第3の態様のプログラムにおいては、コンピュータに、第1モデル記憶部に記憶された、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、前記作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した学習済みモデルであって、前記作業の前記属性データを入力したときに前記作業が予定通りに完了するか否かを示す完了予測データを出力するように構成された第1の学習済みモデルを取得するステップと、第2モデル記憶部に記憶された、前記作業の前記属性データと、作業が予定通りに完了したかを示す情報と、前記複数の工程それぞれの完了日である複数の工程完了日の少なくともいずれかと作業開始日との差分と、を関連付けた第2の学習用作業データを学習し、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を入力すると前記完了予測データを出力する学習済みモデルであって、前記複数の工程のうちそれぞれ異なる工程までの前記工程完了日それぞれと作業開始日との差分を含む前記第2の学習用作業データを学習した複数の第2の学習済みモデルを取得するステップと、前記作業の前記属性データと、前記複数の工程完了日それぞれと作業開始日との差分と、を関連付けた1以上の作業データを取得するステップと、前記作業データを取得するステップにおいて取得された前記1以上の作業データを前記第1の学習済みモデル又は複数の前記第2の学習済みモデルのいずれかに入力し、前記完了予測データを出力するステップと、を実行させる。
【発明の効果】
【0014】
本発明によれば、作業が予定通りに完了するかどうかをより高い精度で推論できるようにするという効果を奏する。
【図面の簡単な説明】
【0015】
【
図1】実施形態にかかるデータ処理装置1の概要を説明する図である。
【
図2】データ処理装置1の構成を示すブロック図である。
【
図3】作業データのデータ構造の一例を示す図である。
【
図4】学習済みモデルを用いた推論処理の一例を説明する図である。
【
図5】データ処理装置1における処理の流れを示すフローチャートである。
【
図6】変形例にかかるデータ処理装置1における作業データのデータ構造の一例を示す図である。
【発明を実施するための形態】
【0016】
[データ処理装置1の概要]
図1は、実施形態にかかるデータ処理装置1の概要を説明する図である。データ処理装置1は、作業データに基づいて作業が予定通りに完了するか否かを予測する装置である。データ処理装置1において予測の対象となる作業は、逐次的に実施される複数の工程から構成される作業である。予測の対象となる作業は、例えば工事である。より具体的には、予測の対象となる作業は、無線通信基地局の建設工事である。作業データは作業の属性、作業を構成する複数の工程の完了日それぞれと作業開始日との差分を含む。データ処理装置1は、例えばサーバやパーソナルコンピュータである。
【0017】
データ処理装置1における学習について説明する。データ処理装置1は、学習用作業データD1を取得する。学習用作業データD1は、モデルに学習させるための教師データである。学習用作業データD1は、作業データに含まれる情報に加え、作業が予定通りに完了したかを示す情報を含む。学習用作業データD1のうち工程の完了日と作業開始日との差分を含まないものを第1学習用作業データと言い、学習用作業データD1に含まれる全ての情報を含むものを第2学習用作業データと言う。データ処理装置1は、一例として、取得した学習用作業データD1に含まれる工程の完了日と作業開始日との差分を削除する前処理をすることで第1学習用作業データを生成し、取得した学習用作業データD1をそのまま第2学習用作業データとする。データ処理装置1は、第1学習用作業データと第2学習用作業データとをそれぞれ別々に取得しても良い。
【0018】
データ処理装置1は、第1学習用作業データと第2学習用作業データとを第1学習器L1と第2学習器L2とにそれぞれ学習させる。第1学習器L1と第2学習器L2とはそれぞれ、第1学習済みモデルM1と複数の第2学習済みモデルM2とを生成する。複数の第2学習済みモデルM2は、第2学習用作業データに含まれる作業を構成する工程のうちどの工程の完了日と作業開始日との差分までを学習させるかが異なる。一例として、作業がA、B、C及びDの順に逐次的に実施される工程から構成される場合において、データ処理装置1は、工程Aの完了日と作業開始日との差分を学習した第2学習済みモデルM21、工程A及びBそれぞれの完了日と作業開始日との差分を学習した第2学習済みモデルM22、工程A、B及びCそれぞれの完了日と作業開始日との差分を学習した第2学習済みモデルM23をそれぞれ生成する。なお、いずれの第2学習済みモデルも作業を構成する工程のうち最後に実施される工程の完了日(上述の例においては工程D)と作業開始日との差分は学習しない。これは、作業の最後に実施される工程の完了日は、推論結果への寄与率が他の特徴量と比較して極めて大きくなる一方、推論段階においては通常得られない情報だからである。
【0019】
データ処理装置1における推論について説明する。データ処理装置1は、推論に用いる作業データD2を取得する。データ処理装置1は、取得した作業データD2に含まれる工程の完了日と作業開始日との差分がどの工程までの完了を示すかに応じて、取得した作業データD2の推論に用いる学習済みモデルを選択する。一例として、データ処理装置1は、いずれの工程も完了していない場合は第1学習済みモデルM1を、工程Aが完了している場合は、第2学習済みモデルM21を、工程A及びBが完了している場合は、第2学習済みモデルM22を、工程A、B及びCが完了している場合は、第2学習済みモデルM23をそれぞれ選択する。
【0020】
データ処理装置1は、取得した作業データD2を選択した学習済みモデルに入力し、完了予測データD3を出力する。完了予測データD3は、作業が予定通りに完了するか否かを示すデータである。データ処理装置1は、このように作業データD2に基づいて完了予測データD3を出力することにより、作業が予定通りに完了するかどうかをより高い精度で推論した結果を出力することができる。
【0021】
[データ処理装置1の構成]
図2は、データ処理装置1の構成を示すブロック図である。データ処理装置1は、通信部11、記憶部12及び制御部13を有する。記憶部12は、第1モデル記憶部121と第2モデル記憶部122とを有する。制御部13は、取得部131、推論部132、選択部133及び学習部134を有する。
【0022】
通信部11は、他の装置とデータの送受信するための通信インターフェースである。記憶部12は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)等の記憶媒体である。記憶部12は、制御部13が実行する各種のプログラムを記憶する。
【0023】
第1モデル記憶部121は、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、作業が予定通りに完了したかを示す情報と、を関連付けた第1の学習用作業データを教師データとして学習した第1の学習済みモデルを記憶する。第1の学習済みモデルは、作業の属性データを入力したときに作業が予定通りに完了するか否かを示す完了予測データを出力する。
【0024】
第2モデル記憶部122は、作業の属性データと、作業が予定通りに完了したかを示す情報と、複数の工程それぞれの完了日である複数の工程完了日それぞれと作業開始日との差分の少なくともいずれかと、を関連付けた第2の学習用作業データを学習した第2の学習済みモデルを記憶する。第2の学習済みモデルは、作業の属性データと、複数の工程完了日それぞれと作業開始日との差分と、を入力すると完了予測データを出力する。第2モデル記憶部122は、複数の工程のうちそれぞれ異なる工程までの工程完了日それぞれと作業開始日との差分を含む第2の学習用作業データを学習した複数の第2の学習済みモデルを記憶する。
【0025】
学習部134は、上述の通り、モデルに学習用作業データに含まれるデータを特徴量として学習させ、第1の学習済みモデルと第2の学習済みモデルとを生成し、それぞれ第1モデル記憶部121と第2モデル記憶部122とに記憶させる。学習部134は、一例として、決定木を用いた推論を行う学習済みモデルを生成する。データ処理装置1は、一例として、既知のLightGBM(Gradient Boosting Machine)やXGboost(eXtreme Gradient Boosting)により学習済みモデルを生成してもよい。
【0026】
図3は、作業データのデータ構造の一例を示す図である。
図3(a)は、学習に用いる学習用作業データを示す。学習用作業データは、属性データと、工程完了日と作業開始日との差分と、完了情報と、を関連付けたデータである。
図3(b)は、推論に用いる作業データを示す。作業データは、属性データ、工程完了日と作業開始日との差分を関連付けたデータである。属性データは、作業の内容を決定する要素を示すデータである。属性データは一例として、作業種別、実施組織、作業エリアの情報を含む。
【0027】
作業種別は作業の種類を示すデータである。作業種別は例えば、作業A(鉄塔における基地局の設置)、作業B(ビル屋上における基地局の設置)等の値を有する。実施組織は作業を担当する組織又は作業を委託する委託先を示す。作業エリアは作業が実施される県域や地域等のエリアを示す。属性データは、作業の特徴を示すデータをさらに含んでもよい。
【0028】
工程完了日は作業を構成する複数の工程が完了した日付を示す。工程完了日が空欄又は負の値の作業データは、当該工程が完了していないことを示す。完了情報は、作業が予定通りに完了したかを示す情報である。一例として、完了情報における「1」、「2」及び「3」はそれぞれ、「作業が完了予定日までに完了したこと」、「作業が完了予定日までには完了しなかったが、完了予定日が属する月の末日までに完了したこと」及び「完了予定日が属する月の末日までに完了しなかったこと」を示す。
【0029】
図4は、学習済みモデルを用いた推論処理の一例を説明する図である。
図4は、学習部134が生成した学習済みモデルの構造の一例を示す。
図4に示す決定木は、複数のノードと各ノードを接続するエッジから構成されている。分岐を持たないノードを特に終端ノードという。終端ノード以外のそれぞれのノードには、学習の結果に基づいて、推論対象の作業データについて評価すべき条件が設定されている。
【0030】
データ処理装置1は、最上位のノードであるルートノードRNを起点として、ノードに設定された条件について推論対象の作業データを評価する。そして、各ノードにおける条件に合致するエッジの先にあるノードに設定された条件をさらに評価する。データ処理装置1は、これを終端ノードLNに行きつくまで繰り返す。例えば、ルートノードRNにおいては、「作業開始日と工程B完了日との差分が60日以上か」という条件が設定されている。そして、評価対象の作業データにおいて、作業開始日と工程B完了日との差分が60日未満である場合、60日未満に対応するエッジで接続されているノードにおける条件である「工程Cの完了日と工程Bの完了日との差分が14日未満か」を評価する。なお、ノードに設定されている評価対象の条件に対応するデータが作業データにおいて欠損している場合は、一例として、分岐先のノードのうち正確度の高いノードを選択してもよい。
【0031】
終端ノードLNには、学習の結果に基づき、それぞれの終端ノードに対応する完了予測データが設定されている。データ処理装置1は、行き着いた終端ノードに対応する完了予測データを推論対象の作業データの推論結果として出力する。完了予測データは、一例として、作業が完了予定日までに完了することを示す「クラス1」、作業が完了予定日までに完了しないが完了予定日が属する月の末日までに完了することを示す「クラス2」及び作業が完了予定日の属する月の末日までに完了しないことを示す「クラス3」のいずれかで出力される。なお、データ処理装置1は、「作業が予定通りに完了する」又は「作業が予定通りに完了しない」の2クラスに分類された完了予測データを出力するよう構成されてもよい。
【0032】
図2に戻り、第1モデル記憶部121及び第2モデル記憶部122は、作業の実施組織又は作業の実施場所を属性データとしてさらに含む学習用作業データを学習した第1の学習済みモデル及び第2の学習済みモデルをそれぞれ記憶してもよい。また、第1モデル記憶部121及び第2モデル記憶部122は、実施組織又は作業の実施場所に代えて又は加えて、作業の特徴を示す属性データをさらに学習させた学習済みモデルを記憶してもよい。作業の特徴を示す属性データは、一例として、基地局を製造したメーカーを示す情報や、設備の増設工事であるか否かを示すフラグや、同一の土地所有者の別の敷地において既に工事を行った実績があるかを示すフラグである。
【0033】
制御部13は、例えばCPU(Central Processing Unit)である。制御部13は、記憶部12に記憶されている制御プログラムを実行することにより、取得部131、推論部132、選択部133および学習部134として機能する。
【0034】
取得部131は、作業の属性データと、複数の工程それぞれの工程完了日と作業開始日との差分と、を関連付けた1以上の作業データを取得する。取得部131は、通信部11を介して他の装置(不図示)から
図3に示す作業データを取得する。一例として、取得部131は、複数の作業データを含むリストを取得する。なお、取得部131は、複数の工程の完了日と作業開始日との差分に変えて複数の工程それぞれの完了日と作業開始日とを関連付けた1以上の作業データを取得してもよい。この場合、取得部131は、取得した作業データに含まれる複数の工程それぞれの完了日と作業開始日との差分を前処理として算出する。
【0035】
推論部132は、取得部131が取得した1以上の作業データを第1の学習済みモデル又は複数の第2の学習済みモデルのいずれかに入力し、完了予測データを出力する。一例として、データ処理装置1においては、第1の学習済みモデルと複数の第2の学習済みモデルのうち推論に用いる学習済みモデルが予め設定されていてもよい。この場合、選択部133は、推論に用いる学習済みモデルの設定を参照し、設定に対応する学習済みモデルを第1モデル記憶部121又は第2モデル記憶部122から取得する。そして、推論部132は、取得部131が取得した1以上の作業データを取得した学習済みモデルに入力し、完了予測データを出力してもよい。データ処理装置1においては、例えば、「第1の学習済みモデルを使用する」、「複数の第2の学習済みモデルのうち学習した工程の完了日の種類が最も多い学習済みモデルを使用する」等の候補から使用するモデルが設定されている。
【0036】
さらに、選択部133は、学習段階におけるモデルの精度に基づいて使用する学習済みモデルを決定してもよい。具体的には、選択部133は、各モデルに関連付けられた精度が最も高い学習済みモデルを第1モデル記憶部121又は第2モデル記憶部122から取得する。なお、この場合においては、第1モデル記憶部121及び第2モデル記憶部122は第1の学習済みモデル及び複数の第2の学習済みモデルそれぞれに関連付けて学習段階に学習用作業データを使用して推論を行った結果に基づく精度を記憶している。精度は、例えば正確度を用いる。正確度は、学習段階で予測した学習用作業データのうち、予測結果が教師データと一致するデータの割合である。
【0037】
この場合の一例として、工程A、B及びCを学習した第2の学習済みモデルよりも工程A、Bを学習した第2の学習済みモデルの精度が高い場合において、選択部133は、両方のモデルを使用可能な作業データを取得した場合に、より精度の高い学習済みモデルを選択する。データ処理装置1がこのように構成されることで、精度を向上させることができる。
【0038】
推論部132は、一例として、作業と完了予測データとを対応付けた画面を、通信部11を介して他の装置に表示させてもよい。また、推論部132は、作業が予定通りに完了しないことを完了予測データが示す作業を特定する情報を、ユーザに注意を促すメッセージとともに他の装置に表示させてもよい。
【0039】
データ処理装置1がこのように構成されることで、作業が予定通りに完了するかどうかをより高い精度で推論できるようにするという効果を奏する。また、データ処理装置1は、入手が容易なデータに基づいて作業が予定通りに完了するかどうかを推論することができる。
【0040】
作業データが示す作業の進捗状況に応じて適切な学習済みモデルを選択することで予測の精度を高めることができる。そこで、データ処理装置1においては、選択部133が選択した学習済みモデルを用いて推論部132が推論するように構成されてもよい。
【0041】
選択部133は、取得部131が取得した1以上の作業データが示す作業における完了済みの工程に基づいて、第1の学習済みモデルと複数の第2の学習済みモデルとから作業データそれぞれについて入力する学習済みモデルを選択する。選択部133は、一例として、取得部131が取得した作業データが、いずれの工程も完了していないことを示す場合は第1の学習済みモデルを選択し、いずれかの工程が完了していることを示す場合は、第2の学習済みモデルを選択する。
【0042】
一例として、選択部133は、取得部131が取得した1以上の作業データに含まれる複数の工程それぞれの完了日と作業開始日との差分に数値が含まれない場合又は負の値が含まれている場合に当該工程が完了していないと判定し、複数の工程それぞれの完了日と作業開始日との差分に0以上の数値が含まれている場合に当該工程が完了していると判定する。選択部133は、取得部131が取得した1以上の作業データそれぞれに複数の工程それぞれの完了有無を示す情報が含まれている場合は、作業データに含まれる完了有無を示す情報に基づいて完了した工程を判定してもよい。
【0043】
選択部133は、取得部131が取得した1以上の作業データそれぞれが工程のいずれも完了していないことを示す場合に第1の学習済みモデルを選択し、取得した1以上の前記作業データそれぞれがいずれかの工程が完了していることを示す場合に、完了している工程までの工程完了日それぞれと作業開始日との差分を含む第2の学習用作業データを学習した第2の学習済みモデルを選択してもよい。具体的には、推論対象の作業が工程A、B、C及びDから構成される場合において、作業データがいずれの工程も完了していないことを示す場合は、第1の学習済みモデルを選択し、工程Aまでを完了していることを示す場合は、工程Aの完了日と作業開始日との差分を学習した第2の学習済みモデルを選択し、工程Bまでを完了していることを示す場合は、工程A及びBそれぞれの完了日と作業開始日との差分を学習した第2の学習済みモデルを選択し、工程Cまでを完了していることを示す場合は、工程A、B及びCそれぞれの完了日と作業開始日との差分を学習した第2の学習済みモデルを選択する。
【0044】
そして、推論部132は、取得部131が取得した1以上の作業データそれぞれを、選択部133が選択した学習済みモデルに入力し、完了予測データを出力する。データ処理装置1がこのように構成されることで、作業データが示す作業の進捗状況に応じて適切な学習済みモデルを選択でき、予測の精度を高めることができる。
【0045】
ところで、作業の完了時期と関連性を有する適切な属性データを選択して推論に用いることで予測の精度をさらに向上させることができる。
【0046】
取得部131は、実施組織又は作業の実施場所を属性データにさらに含む1以上の作業データを取得する。実施組織は、作業を担当する組織や作業の委託先を示す。作業の実施場所は、作業が実施される県域や県域をさらに分割したエリアを示す。
【0047】
推論部132は、取得部131が取得した1以上の作業データを入力する。推論部132は、実施組織又は作業の実施場所を属性データにさらに含む作業データを、実施組織又は作業の実施場所を含む学習用作業データを学習した第1の学習済みモデル又は複数の第2の学習済みモデルのいずれかに入力し、完了予測データを出力する。
【0048】
取得部131は、実施組織又は作業の実施場所に代えて又は加えて、作業の特徴を示す属性データをさらに取得してもよい。作業の特徴を示す属性データは、一例として、基地局を製造したメーカーを示す情報や、設備の増設工事であるか否かを示すフラグや、同一の土地所有者の別の敷地において既に工事を行った実績があるかを示すフラグである。
【0049】
この場合、推論部132は、作業の特徴を示す属性データをさらに含む作業データを、作業の特徴を示す属性データを含む学習用作業データを学習した第1の学習済みモデル又は複数の第2の学習済みモデルのいずれかに入力し、完了予測データを出力する。
【0050】
データ処理装置1が作業の完了時期と関連性を有する適切な属性データをさらに用いて推論するよう構成されることで、予測の精度をさらに向上させることができる。
【0051】
ところで、学習に用いるデータの量が増えるほど、推論の精度が向上することが期待できる。そこで、データ処理装置1は、作業を構成するそれぞれの工程の完了日相互の差分をさらに学習し、推論に用いるよう構成されてもよい。
【0052】
学習部134は、作業を構成する3以上の工程それぞれの完了日相互の差分をさらに学習させた第2の学習済みモデルを生成してもよい。学習部134は、一例として、工程の完了日と作業開始日との差分同士の差分を取ることで、完了日相互の差分を算出する。学習部134は、一例として、推論対象の作業が工程A、B、C及びDから構成される場合において、学習部134は、工程Bの完了日と作業開始日との差分に加えて、工程Bの完了日と工程Aの完了日との差分を学習した第2の学習済みモデルを生成し、工程Cの完了日と作業開始日との差分に加えて、工程Cの完了日と工程Aの完了日との差分及び工程Cの完了日と工程Bの完了日との差分を学習した第2の学習済みモデルを生成する。なお、この場合においても学習部134は、作業を構成する工程のうち最後の工程と他の工程の完了日との差分は第2学習済みモデルに学習させない。
【0053】
第2モデル記憶部122は、学習部134が生成した、作業において逐次的に実施される3以上の工程であって、3以上の工程それぞれの完了日相互の差分をさらに関連付けた第2の学習用作業データを学習した複数の第2の学習済みモデルを記憶する。なお、第2モデル記憶部122が記憶する複数の第2の学習済みモデルそれぞれは、いずれの工程までの完了日相互の差分及び完了日と開始日との差分を学習したかが異なる。
【0054】
推論部132は、3以上の工程それぞれの完了日相互の差分をさらに含む1以上の作業データを入力してもよい。すなわち、推論部132は、取得した作業データに含まれるそれぞれの工程の完了日と作業開始日との差分同士の差分を取ることで工程の完了日相互の差分を算出する。そして、推論部132は、算出した差分をさらに関連付けた作業データを第2学習済みモデルに入力し、完了予測データを出力する。
【0055】
データ処理装置1がこのように構成されることで、学習に用いるデータの量を増加させることができ、推論の精度を向上させることができる。
【0056】
[データ処理装置1における処理の流れ]
図5は、データ処理装置1における処理の流れを示すフローチャートである。
図5に示すフローチャートは、データ処理装置1が推論処理を開始するための指示を受け付けたタイミングから開始している。
【0057】
取得部131は、複数の作業データを取得する(S101)。選択部133は、取得した作業データから推論対象の1つの作業データを選択する(S102)。選択部133は、選択した作業データにおいて完了した工程があるかを判定する(S103)。
【0058】
選択した作業データにおいて完了した工程がある場合(S103におけるYES)、選択部133は、完了した工程に対応する第2学習済みモデルを選択し(S104)、第2モデル記憶部122から取得する。選択した作業データにおいて完了した工程がない場合(S103におけるNO)、選択部133は、第1学習済みモデルを選択し(S105)、第1モデル記憶部121から取得する。
【0059】
推論部132は、選択部133が選択した学習済みモデルに選択した作業データを入力し、作業データに対応する完了予測データを得る(S106)。そして、選択部133は、取得した作業データに未選択の作業データがあるかを判定する(S107)。未選択の作業データがある場合(S107におけるYES)、S102に戻り、データ処理装置1は、処理を繰り返す。
【0060】
未選択の作業データがない場合(S107におけるNO)、推論部132は、それぞれの作業データについての完了予測データを出力し(S108)、データ処理装置1は、処理を終了する。
【0061】
[変形例]
上記の実施形態においては作業の完了状況を示すデータとして、作業を構成するそれぞれの工程の完了日と作業開始日との差分を用いる例について説明した。これに対して、作業の完了予定日と実際に作業が完了した日とをさらに関連付けた学習用作業データを学習した学習済みモデルを生成し、作業の完了予定日をさらに関連付けた作業用データを用いて推論するよう構成されてもよい。
【0062】
第1モデル記憶部121は、逐次的に実施される複数の工程を含む作業の作業内容を示す属性データと、作業開始日と、作業完了予定日と、実際の作業完了日と、を関連付けた第1の学習用作業データを教師データとして学習した第1の学習済みモデルを記憶する。第1の学習済みモデルは、作業の属性データと、作業開始日と、作業完了予定日と、を入力したときに作業が予定通りに完了するか否かを示す完了予測データを出力する。
【0063】
第2モデル記憶部122は、作業の属性データと、作業開始日と、作業完了予定日と、実際の作業完了日と、複数の工程それぞれの完了日である複数の工程完了日の少なくともいずれかと、を関連付けた第2の学習用作業データを学習した第2の学習済みモデルを記憶する。第2の学習済みモデルは、作業の属性データと、作業開始日と、作業完了予定日と、複数の工程完了日と、を入力すると完了予測データを出力する。第2モデル記憶部122は、複数の工程のうちそれぞれ異なる工程までの工程完了日を含む第2の学習用作業データを学習した複数の第2の学習済みモデルを記憶する。
【0064】
取得部131は、作業の属性データと、作業開始日と、作業完了予定日と、複数の工程それぞれの工程完了日、を関連付けた1以上の作業データを取得する。
図6は、変形例にかかるデータ処理装置1における作業データのデータ構造の一例を示す図である。
図6(a)は、学習に用いる学習用作業データを示す。学習用作業データは、属性データ、作業開始日、作業の完了予定日、それぞれの工程の完了日及び実績完了日を関連付けたデータである。
図6(b)は、推論に用いる作業データを示す。作業データは、属性データ、作業開始日、作業の完了予定日及びそれぞれの工程の完了日を含む。なお、実績完了日は実際に作業が完了した日を示す。
【0065】
選択部133は、取得部131が取得した1以上の作業データに含まれる複数の工程それぞれの完了日が示す作業における完了済みの工程に基づいて、第1の学習済みモデルと複数の第2の学習済みモデルとから作業データそれぞれについて入力する学習済みモデルを選択する。すなわち、選択部133は、取得部131が取得した1以上の作業データそれぞれに含まれる複数の工程の完了日が工程のいずれも完了していないことを示す場合に第1の学習済みモデルを選択し、複数の工程それぞれの完了日と作業開始日との差分がいずれかの工程が完了していることを示す場合に、完了している工程までの工程完了日を学習した第2の学習済みモデルを選択してもよい。
【0066】
なお、上記の変形例においては、作業開始日と、作業完了予定日と、実際の作業完了日と複数の工程それぞれの完了日に代えて、作業完了予定日と作業開始日との差分と、実際の作業完了日と作業開始日との差分と、複数の工程の完了日それぞれと作業開始日との差分と、を用いてもよい。
【0067】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0068】
1 データ処理装置
11 通信部
12 記憶部
13 制御部
121 第1モデル記憶部
122 第2モデル記憶部
131 取得部
132 推論部
133 選択部
134 学習部