(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-30
(45)【発行日】2022-12-08
(54)【発明の名称】情報処理装置、情報処理プログラム及び情報処理システム
(51)【国際特許分類】
G06Q 10/06 20120101AFI20221201BHJP
【FI】
G06Q10/06 332
(21)【出願番号】P 2020192653
(22)【出願日】2020-11-19
【審査請求日】2021-02-18
(73)【特許権者】
【識別番号】501440684
【氏名又は名称】ソフトバンク株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】堀 隆之
(72)【発明者】
【氏名】金 容範
(72)【発明者】
【氏名】鈴木 裕真
(72)【発明者】
【氏名】金田 麟太郎
(72)【発明者】
【氏名】小林 宏暢
(72)【発明者】
【氏名】田口 正雄
(72)【発明者】
【氏名】河野 肇
(72)【発明者】
【氏名】山口 崇行
(72)【発明者】
【氏名】稲澤 宏典
【審査官】加舎 理紅子
(56)【参考文献】
【文献】特開2005-076913(JP,A)
【文献】特開2015-102307(JP,A)
【文献】今西 智哉 他,学習効率を考慮したキャンパスエネルギーマネジメントシステムの提案と実証,計測自動制御学会論文集 ,公益社団法人計測自動制御学会,2015年05月31日,第51巻,第5号,p.344-351
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量
に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された
前記空調前の前記個々の人物の仕事の生産性
に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて、
前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、
を備える情報処理装置。
【請求項2】
前記生産性判別モデルを用いて、前
記個々の人物の仕事量に関する情報
から前
記個々の人物の仕事の生産性
に関する情報を推定する推定部
をさらに備え、
前記推定部は、
前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す各カテゴリに該当する確率を算出し、各カテゴリに該当する確率のうち、最も高い確率に対応するカテゴリのラベルを出力し、
前記決定部は、
前記空調前の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報と、前記空調後の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報との比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項
1に記載の情報処理装置。
【請求項3】
前記決定部は、
前記空調前の
前記ラベルに対応する前記個々の人物の仕事の生産性
の高さを示す情報よりも、前記空調後の
前記ラベルに対応する前記個々の人物の仕事の生産性
の高さを示す情報の方が
、生産性が高い
ことを示す場合には
、前記個々の報酬を示す値を
正の値に決定する、
請求項
2に記載の情報処理装置。
【請求項4】
前記決定部は、
前記空調前の
前記ラベルに対応する前記個々の人物の仕事の生産性
の高さを示す情報よりも、前記空調後の
前記ラベルに対応する前記個々の人物の仕事の生産性
の高さを示す情報の方が
、生産性が低い
ことを示す場合には
、前記個々の報酬を示す値を
負の値に決定する、
請求項
2または3に記載の情報処理装置。
【請求項5】
前記決定部は、
前記空調前の
前記ラベルに対応する前記個々の人物の仕事の生産性
の高さを示す情報と前記空調後の
前記ラベルに対応する前記個々の人物の仕事の生産性
の高さを示す情報が同じ場合には、前記個々の報酬を示す値をゼロに決定する、
請求項
2~
4のいずれか1項に記載の情報処理装置。
【請求項6】
前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物による情報機器の操作量に関するPC操作情報に基づいて、前記個々の人物の仕事の生産性
に関する情報として、前記操作量を前記個々の人物による前記情報機器の操作の持続時間で除した値であるPC操作に関する
前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項
1~5のいずれか1項に記載の情報処理装置。
【請求項7】
前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物の発言量に関する音声情報に基づいて、前記個々の人物の仕事の生産性
に関する情報として、前記発言量を前記個々の人物による発言の持続時間で除した値である発話に関する
前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項
1~6のいずれか1項に記載の情報処理装置。
【請求項8】
前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物の動作量に関する人物活動情報に基づいて、前記個々の人物の仕事の生産性
に関する情報として、前記動作量を前記個々の人物による動作の持続時間で除した値である人物活動に関する
前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項
1~7のいずれか1項に記載の情報処理装置。
【請求項9】
前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物による情報機器の操作量に関するPC操作情報、前記個々の人物の発言量に関する音声情報、または前記個々の人物の動作量に関する人物活動情報のうち少なくともいずれか一つに基づいて、
前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項
1~8のいずれか1項に記載の情報処理装置。
【請求項10】
前記空調制御モデルを用いて空調を制御する空調制御部、
をさらに備える請求項1~
9のいずれか1項に記載の情報処理装置。
【請求項11】
前記空調制御部は、
前記空調制御モデルの入力情報として空間を撮像した画像に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される空調制御情報に基づいて空調を制御する、
請求項
10に記載の情報処理装置。
【請求項12】
前記空調制御部は、
前記空間を撮像した画像に関する情報として、赤外線カメラで前記空間を撮像したサーマル画像またはRGBカメラで前記空間を撮像したRGB画像のうち少なくともいずれか一方に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される前記空調制御情報に基づいて空調を制御する、
請求項
10に記載の情報処理装置。
【請求項13】
前記空調制御部は、
前記空調制御モデルの入力情報として前記空間の温度および湿度に関する環境情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される前記空調制御情報に基づいて空調を制御する、
請求項
10~
12のいずれか1項に記載の情報処理装置。
【請求項14】
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量
に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された
前記空調前の前記個々の人物の仕事の生産性
に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて、
前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定手順と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
【請求項15】
情報処理装置と、空調装置とを含む情報処理システムであって、
前記情報処理装置は、
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量
に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された
前記空調前の前記個々の人物の仕事の生産性
に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて、
前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、
を備え、
前記空調装置は、
前記学習部によって強化学習された空調制御モデルから出力された前記空調制御情報に従って空調を行う、
情報処理システム。
【請求項16】
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量
に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された
前記空調前の前記個々の人物の仕事の生産性
に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて
前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定し、決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御モデルを用いて空調を制御する空調制御部と、
を備える情報処理装置。
【請求項17】
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量
に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された
前記空調前の前記個々の人物の仕事の生産性
に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて
前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定し、決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御モデルを用いて空調を制御する空調制御手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
【請求項18】
情報処理装置と、空調装置とを含む情報処理システムであって、
前記情報処理装置は、
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量
に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された
前記空調前の前記個々の人物の仕事の生産性
に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて
前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定し、決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御モデルを用いて空調を制御する空調制御部と、
を備え、
前記空調装置は、
前記空調制御部から出力された前記空調制御情報に従って空調を行う、
情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理プログラム及び情報処理システムに関する。
【背景技術】
【0002】
従来、利用者にとって快適な空間を提供するための技術が知られている。例えば、カメラで撮像した利用者の画像等に基づいて、作業空間における利用者の集中度を評価する。そして、利用者の集中度が低下したタイミングで作業空間における空気環境を変化させる技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来技術では、利用者の集中度が低下したタイミングで作業空間における空気環境を変化させるにすぎないため、空間に所在する集団の生産性を向上させることができるとは限らない。
【課題を解決するための手段】
【0005】
実施形態に係る情報処理装置は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された前記個々の人物の仕事の生産性に基づいて、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、を備える。
【図面の簡単な説明】
【0006】
【
図1】
図1は、実施形態に係る情報処理システムの構成例を示す図である。
【
図2】
図2は、実施形態に係る情報処理装置の構成例を示す図である。
【
図3】
図3は、実施形態に係る個々の人物の生産性の推定処理の一例について説明するための図である。
【
図4】
図4は、実施形態に係る仕事量に関する情報について説明するための図である。
【
図5】
図5は、実施形態に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。
【
図6】
図6は、実施形態に係る情報処理手順を示す図である。
【
図7】
図7は、実施形態に係る情報処理手順を示す図である。
【
図8】
図8は、実施形態に係る情報処理手順を示す図である。
【
図9】
図9は、実施形態に係る情報処理手順を示す図である。
【
図10】
図10は、実施形態に係る情報処理手順を示す図である。
【
図11】
図11は、実施形態に係る情報処理手順を示す図である。
【
図12】
図12は、実施形態に係る情報処理手順を示す図である。
【
図13】
図13は、変形例に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。
【
図14】
図14は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0007】
以下に、本願に係る情報処理装置、情報処理プログラム及び情報処理システムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理プログラム及び情報処理システムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0008】
(実施形態)
〔1.はじめに〕
従来、空間に所在する人物の仕事の生産性を向上させるために空調を制御する技術が知られている。しかしながら、空間に所在する個々の人物の生産性を考慮して空調を制御するだけでは、空間に所在する複数の人物全員の生産性(以下、集団の生産性ともいう)を向上させることができるとは限らない。
【0009】
これに対し、実施形態に係る情報処理装置100は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。また、情報処理装置100は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。これにより、情報処理装置100は、空間に所在する集団の生産性が高くなるような空調動作を出力する空調制御モデルを用いて、空調を制御することができる。したがって、情報処理装置100は、空間に所在する集団の生産性を向上させることを可能とすることができる。
【0010】
〔2.情報処理システムの構成〕
まず、
図1を用いて、実施形態に係る情報処理システムの構成について説明する。
図1は、実施形態に係る情報処理システムの構成例を示す図である。情報処理システム1には、空調装置10と、センサ装置20と、情報処理装置100とが含まれてよい。空調装置10と、センサ装置20と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続されてよい。なお、情報処理システム1には、任意の数の空調装置10と任意の数のセンサ装置20と任意の数の情報処理装置100とが含まれてもよい。
【0011】
空調装置10は、空間の空気の温度や湿度などを調整する装置である。例えば、空調装置10は、情報処理装置100による空調制御の対象となる各空間に設置された空調機器(例えば、エアコン)であってよい。また、空調装置10は、IoT(Internet of Things)技術により、他の装置と通信可能であってよい。空調装置10は、情報処理装置100の制御に従って制御対象となる空間の空調を行うことができる。具体的には、空調装置10は、空間に設置された空調機器による空調を制御する空調制御情報を情報処理装置100から受信することができる。例えば、空調装置10は、空調制御情報として、冷房設定による空調を行うことを示す冷房情報または暖房設定による空調を行うことを示す暖房情報を受信してよい。また、空調装置10は、空調制御情報として、空間の設定温度を示す温度情報および空間の設定湿度を示す湿度情報を受信してよい。続いて、空調装置10は、情報処理装置100から受信した空調制御情報に従って、空間の空調を行う。例えば、空調装置10は、冷房情報(暖房情報)を受信すると、空間の温度や湿度を冷房設定(暖房設定)によって調整してよい。また、空調装置10は、温度情報を受信すると、空間の温度が設定温度や設定湿度に保たれるように調整してよい。また、空調装置10は、湿度情報を受信すると、空間の湿度が設定湿度に保たれるように調整してよい。なお、以下では、空調装置10のことを「空調機器」と記載する場合がある。
【0012】
なお、
図1に示すように、空調装置10が設置された空間に応じて、空調装置10を空調装置10-1~10-2のように区別して説明する場合がある。例えば、空調装置10-1は、会議室R1に設置されている空調装置10であってよい。また、例えば、空調装置10-2は、会議室R2に設置されている空調装置10であってよい。また、以下では、空調装置10-1~10-2について、特に区別なく説明する場合には、空調装置10と記載する。
【0013】
センサ装置20は、空間の物理的な状態や空間に存在する利用者の物理的な状態を検知する装置である。センサ装置20は、空間の物理的な状態や空間に存在する利用者の物理的な状態を示す情報をセンサ情報として取得してよい。例えば、センサ装置20は、画像センサであってよい。例えば、センサ装置20は、RGBカメラであってよい。すなわち、センサ装置20は、例えば、空間に存在する利用者を被写体として含むRGB画像をセンサ情報として取得してよい。また、例えば、センサ装置20は、赤外線カメラであってよい。すなわち、センサ装置20は、例えば、空間に存在する利用者を被写体として含むサーマル画像をセンサ情報として取得してよい。また、センサ装置20は、環境センサであってよい。例えば、センサ装置20は、USB型の環境センサであってよい。すなわち、センサ装置20は、例えば、空間の温度や湿度などの環境に関する情報(以下、環境情報ともいう)をセンサ情報として取得してよい。また、センサ装置20は、取得したセンサ情報を情報処理装置100に送信してよい。また、センサ装置20が取得する環境情報は、後述する快適さの判定において利用可能な情報であればよく、上記の例に限定されない。例えば、センサ装置20は、環境情報として気圧や照度などの任意の情報を取得してよい。
【0014】
なお、
図1に示すように、センサ装置20が設置された空間に応じて、センサ装置20をセンサ装置20-1~20-2のように区別して説明する場合がある。例えば、センサ装置20-1は、会議室R1に設置されているセンサ装置20である。また、例えば、センサ装置20-2は、会議室R2に設置されているセンサ装置20である。また、以下では、センサ装置20-1~20-2について、特に区別なく説明する場合には、センサ装置20と記載する。
【0015】
端末装置30は、空間に存在する利用者によって利用される情報処理装置である。端末装置30は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)や、ヘッドマウントディスプレイ等である。実施形態では、端末装置30がノート型PCまたはデスクトップPC(以下、単にPCと記載する場合がある)である例について説明する。
【0016】
また、端末装置30には、利用者の物理的な状態を検知する各種のセンサが搭載または接続されている。例えば、端末装置30には、カメラやマイクといったセンサが接続されている。端末装置30は、各種のセンサによって、利用者の物理的な状態を示す人物センサ情報を検出してよい。例えば、端末装置30は、人物センサ情報の一例として、カメラによって利用者の画像を検出してよい。また、端末装置30は、人物センサ情報の一例として、マイクによって利用者の音声を検出してよい。また、端末装置30は、人物センサ情報の一例として、利用者によるPCに対する操作履歴に関する操作ログ情報を検出してよい。端末装置30は、人物センサ情報を検出すると、検出した人物センサ情報を情報処理装置100に送信してよい。
【0017】
なお、
図1に示すように、端末装置30を利用する利用者に応じて、端末装置30を端末装置30-1~30-2のように区別して説明する場合がある。例えば、端末装置30-1は、利用者ID「U1」で識別される利用者U1によって利用される端末装置30である。また、例えば、端末装置30-2は、利用者ID「U2」で識別される利用者U2によって利用される端末装置30である。また、以下では、端末装置30-1~30-2について、特に区別なく説明する場合には、端末装置30と記載する。なお、以下では、利用者のことを「人物」と記載する場合がある。
【0018】
情報処理装置100は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。また、情報処理装置100は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。
【0019】
〔3.情報処理装置の構成〕
次に、
図2を用いて、実施形態に係る情報処理装置100の構成について説明する。
図2は、実施形態に係る情報処理装置100の構成例を示す図である。情報処理装置100は、通信部110と、記憶部120と、制御部130とを有してよい。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0020】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、空調装置10やセンサ装置20との間で情報の送受信を行う。
【0021】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
【0022】
記憶部120は、センサ装置20によって検出されたセンサ情報を記憶してよい。例えば、記憶部120は、センサ情報の一例として、利用者が所在する空間を撮像したRGB画像およびサーマル画像と空間を識別する識別情報とを対応付けて記憶してよい。また、記憶部120は、センサ情報の一例として、利用者が所在する空間の温度および湿度に関する環境情報と空間を識別する識別情報とを対応付けて記憶してよい。
【0023】
また、記憶部120は、各種の学習モデルに関する情報を記憶してよい。例えば、記憶部120は、生産性判別モデルに関する情報を記憶してよい。また、記憶部120は、空調制御モデルに関する情報を記憶してよい。例えば、記憶部120は、各種の学習モデルの接続係数に関する情報を記憶してよい。
【0024】
また、記憶部120は、端末装置30によって検出された人物センサ情報を記憶してよい。例えば、記憶部120は、人物センサ情報の一例として、端末装置30に搭載されたカメラによって検出された利用者の画像と利用者を識別する識別情報とを対応付けて記憶してよい。また、記憶部120は、人物センサ情報の一例として、端末装置30に搭載されたマイクによって検出された利用者の音声情報と利用者を識別する識別情報とを対応付けて記憶してよい。また、記憶部120は、人物センサ情報の一例として、端末装置30によって検出された利用者によるPCに対する操作履歴に関する操作ログ情報と利用者を識別する識別情報とを対応付けて記憶してよい。
【0025】
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0026】
制御部130は、取得部131と、生成部132と、推定部133と、空調制御部134と、決定部135と、学習部136とを機能部として有し、以下に説明する情報処理の作用を実現または実行してよい。なお、制御部130の内部構成は、
図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、各機能部は、制御部130の機能を示したものであり、必ずしも物理的に区別されるものでなくともよい。
【0027】
(取得部131)
取得部131は、複数の人物が所在する空間に所在する個々の人物の仕事量に関する情報を取得してよい。具体的には、取得部131は、個々の人物の人物センサ情報を端末装置30から取得してよい。続いて、取得部131は、個々の人物の人物センサ情報を取得すると、取得した個々の人物の人物センサ情報に基づいて、個々の人物の仕事量に関する情報を算出してよい。
【0028】
また、取得部131は、個々の人物の人物センサ情報を取得すると、取得した人物センサ情報と個々の人物を識別可能な識別情報とを対応付けて記憶部120に記憶してよい。例えば、取得部131は、空調機器による空調が行われる前(以下、「空調前」と記載する場合がある)の空間に所在する個々の人物の人物センサ情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調機器による空調が行われた後(以下、「空調後」と記載する場合がある)の空間に所在する個々の人物の人物センサ情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得された個々の人物の人物センサ情報を区別して記憶部120に格納してよい。
【0029】
ここで、個々の人物の仕事量に関する情報とは、個々の人物による仕事の量である仕事量を数値化して表した情報のことを指す。
図4を用いて、仕事量に関する情報について詳しく説明する。
図4は、仕事量に関する情報について説明するための図である。
図4に示す仕事量に関する情報は、個々の人物の仕事の生産性を評価する指標として用いることができる。
図4では、仕事量に関する情報として、PC(情報機器)操作情報、音声情報、および人物活動情報についてそれぞれ説明する。
【0030】
図4の左側に示す例では、取得部131は、個々の人物の仕事量に関する情報の一例として、個々の人物による情報機器の操作量に関するPC操作情報(以下では、個々の人物のPC操作情報と記載する場合がある)を取得してよい。例えば、取得部131は、個々の人物の人物センサ情報の一例として、個々の人物によるPCに対する操作履歴に関する操作ログ情報(以下では、個々の人物の操作ログ情報と記載する場合がある)を端末装置30から取得してよい。続いて、取得部131は、個々の人物の操作ログ情報を取得すると、取得した個々の人物の操作ログ情報に基づいて、個々の人物のPC操作情報を算出してよい。例えば、取得部131は、個々の人物のPC操作情報の一例として、キーボード入力の操作量、マウス操作の操作量、PCの起動時間の長さ、電源の消費量、プリンタの出力枚数、および通信量に関する情報を算出してよい。
【0031】
また、取得部131は、個々の人物のPC操作情報を算出すると、算出した個々の人物のPC操作情報と個々の人物を識別可能な識別情報とを対応付けて記憶部120に記憶してよい。例えば、取得部131は、空調前の空間に所在する個々の人物のPC操作情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間に所在する個々の人物のPC操作情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得された個々の人物のPC操作情報を区別して記憶部120に格納してよい。
【0032】
図4の中央に示す例では、取得部131は、個々の人物の仕事量に関する情報の一例として、個々の人物の発言量に関する音声情報(以下では、個々の人物の音声情報と記載する場合がある)を取得してよい。例えば、取得部131は、個々の人物の人物センサ情報の一例として、端末装置30に搭載されたマイクによって検出された音声情報を端末装置30から取得してよい。続いて、取得部131は、音声情報を取得すると、取得した音声情報に基づいて、個々の人物の音声情報を取得してよい。例えば、取得部131は、公知の複数話者識別技術を用いて、取得した音声情報に複数の話者の音声が含まれる場合には、それぞれの話者の音声を識別してよい。続いて、取得部131は、個々の人物の音声を識別したうえで、公知の音源分離(ノイズ除去)技術を用いて、個々の人物の音声情報に含まれるノイズを除去してよい。続いて、取得部131は、個々の人物の音声情報として、ノイズを除去した個々の人物の音声情報を取得してよい。
【0033】
また、取得部131は、個々の人物の音声情報を取得すると、取得した個々の人物の音声情報と個々の人物を識別可能な識別情報とを対応付けて記憶部120に記憶してよい。例えば、取得部131は、空調前の空間に所在する個々の人物の音声情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間に所在する個々の人物の音声情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得された個々の人物の音声情報を区別して記憶部120に格納してよい。
【0034】
図4の右側に示す例では、取得部131は、個々の人物の仕事量に関する情報の一例として、個々の人物の動作量に関する人物活動情報(以下では、個々の人物の人物活動情報と記載する場合がある)を取得してよい。例えば、取得部131は、個々の人物の人物センサ情報の一例として、端末装置30に搭載されたカメラによって検出された画像を端末装置30から取得してよい。続いて、取得部131は、画像を取得すると、取得した画像に基づいて、個々の人物の人物活動情報を取得してよい。例えば、取得部131は、画像を取得すると、画像に含まれる個々の人物が撮像された領域(以下、個々の人物領域ともいう)を特定する。例えば、取得部131は、個々の人物の姿勢を推定する姿勢推定処理に基づいて、画像に含まれる個々の人物領域を特定してよい。続いて、取得部131は、画像に含まれる個々の人物領域を特定すると、個々の人物の人物活動情報として、画像に含まれる個々の人物領域に関する情報を取得する。
【0035】
また、取得部131は、個々の人物の人物活動情報を取得すると、取得した個々の人物の人物活動情報と個々の人物を識別可能な識別情報とを対応付けて記憶部120に記憶してよい。例えば、取得部131は、空調前の空間に所在する個々の人物の人物活動情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間に所在する個々の人物の人物活動情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得された個々の人物の人物活動情報を区別して記憶部120に格納してよい。
【0036】
また、取得部131は、人物が所在する空間の物理的な状態や空間に所在する人物の物理的な状態を示すセンサ情報をセンサ装置20から取得してよい。具体的には、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置されたRGBカメラから複数の人物が所在する空間を撮像したRGB画像を取得してよい。続いて、取得部131は、RGB画像を取得すると、取得したRGB画像と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調前の空間を撮像したRGB画像と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間を撮像したRGB画像と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得されたRGB画像を区別して記憶部120に格納してよい。
【0037】
また、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置された赤外線カメラから複数の人物が所在する空間を撮像したサーマル画像を取得してよい。続いて、取得部131は、サーマル画像を取得すると、取得したサーマル画像と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調前の空間を撮像したサーマル画像と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間を撮像したサーマル画像と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得されたサーマル画像を区別して記憶部120に格納してよい。
【0038】
また、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置された環境センサから複数の人物が所在する空間の温度および湿度に関する環境情報を取得してよい。続いて、取得部131は、取得した温度および湿度に関する環境情報と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調前の空間の温度および湿度に関する環境情報と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間の温度および湿度に関する環境情報と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得された環境情報を区別して記憶部120に格納してよい。
【0039】
また、取得部131は、各種の機械学習モデル(以下、単に「学習モデル」と記載する場合がある)に関する情報を外部の情報処理装置から取得してよい。具体的には、取得部131は、学習モデルの一例として、個々の人物のPC操作情報が入力情報として入力された場合に、個々の人物のPC操作情報の特徴を示す特徴ベクトルV1を出力情報として出力する学習モデルM1を取得してよい。例えば、取得部131は、個々の人物のPC操作情報から個々の人物のPC操作情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルM1を取得してよい。例えば、取得部131は、ニューラルネットワークである学習モデルM1を取得してよい。例えば、取得部131は、個々の人物のPC操作情報が入力情報として入力された場合に、個々の人物のPC操作情報の特徴を示す2048次元の特徴ベクトルV1を出力情報として出力する学習モデルM1を取得してよい。続いて、取得部131は、学習モデルM1を取得すると、学習モデルM1に関する情報と学習モデルM1を識別する識別情報「M1」とを対応付けて記憶部120に格納してよい。
【0040】
また、取得部131は、学習モデルの一例として、個々の人物の音声情報が入力情報として入力された場合に、個々の人物の音声情報の特徴を示す特徴ベクトルV2を出力情報として出力する学習モデルM2を取得してよい。例えば、取得部131は、個々の人物の音声情報から個々の人物の音声情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルM2を取得してよい。例えば、取得部131は、ニューラルネットワークである学習モデルM2を取得してよい。例えば、取得部131は、個々の人物の音声情報が入力情報として入力された場合に、個々の人物の音声情報の特徴を示す2048次元の特徴ベクトルV2を出力情報として出力する学習モデルM2を取得してよい。続いて、取得部131は、学習モデルM2を取得すると、学習モデルM2に関する情報と学習モデルM2を識別する識別情報「M2」とを対応付けて記憶部120に格納してよい。
【0041】
また、取得部131は、学習モデルの一例として、個々の人物の人物活動情報が入力情報として入力された場合に、個々の人物の人物活動情報の特徴を示す特徴ベクトルV3を出力情報として出力する学習モデルM3を取得してよい。例えば、取得部131は、ImageNet等の画像データベースに登録されている多数の(例えば、1000万枚を超える)画像から画像に写っている物体名(クラス)を推定するよう学習された学習モデルM3を取得してよい。例えば、取得部131は、畳み込みニューラルネットワークである学習モデルM3を取得してよい。例えば、取得部131は、Resnet50である学習モデルM3を取得してよい。例えば、取得部131は、個々の人物の人物活動情報が入力情報として入力された場合に、個々の人物の人物活動情報の特徴を示す2048次元の特徴ベクトルV3を出力情報として出力する学習モデルM3を取得してよい。続いて、取得部131は、学習モデルM3を取得すると、学習モデルM3に関する情報と学習モデルM3を識別する識別情報「M3」とを対応付けて記憶部120に格納してよい。
【0042】
また、取得部131は、学習モデルの一例として、RGB画像が入力情報として入力された場合に、RGB画像の特徴を示す特徴ベクトルV5を出力情報として出力する学習モデルM5を取得してよい。例えば、取得部131は、ImageNet等の画像データベースに登録されている多数の(例えば、1000万枚を超える)画像から画像に写っている物体名(クラス)を推定するよう学習された学習モデルM5を取得してよい。例えば、取得部131は、畳み込みニューラルネットワークである学習モデルM5を取得してよい。例えば、取得部131は、Resnet50である学習モデルM5を取得してよい。例えば、取得部131は、RGB画像が入力情報として入力された場合に、RGB画像の特徴を示す2048次元の特徴ベクトルV5を出力情報として出力する学習モデルM5を取得してよい。続いて、取得部131は、学習モデルM5を取得すると、学習モデルM5に関する情報と学習モデルM5を識別する識別情報「M5」とを対応付けて記憶部120に格納してよい。
【0043】
また、取得部131は、学習モデルの一例として、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す特徴ベクトルV6を出力情報として出力する学習モデルM6を取得してよい。例えば、取得部131は、ImageNet等の画像データベースに登録されている多数の(例えば、1000万枚を超える)サーマル画像からサーマル画像に写っている物体名(クラス)を推定するよう学習された学習モデルM6を取得してよい。例えば、取得部131は、畳み込みニューラルネットワークである学習モデルM6を取得してよい。例えば、取得部131は、Resnet50である学習モデルM6を取得してよい。例えば、取得部131は、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す2048次元の特徴ベクトルV6を出力情報として出力する学習モデルM6を取得してよい。続いて、取得部131は、学習モデルM6を取得すると、学習モデルM6に関する情報と学習モデルM6を識別する識別情報「M6」とを対応付けて記憶部120に格納してよい。
【0044】
また、取得部131は、学習モデルの一例として、空間の温度および湿度に関する環境情報が入力情報として入力された場合に、空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルV8を出力情報として出力する学習モデルM8を取得してよい。例えば、取得部131は、空間の温度および湿度に関する環境情報から空間の温度および湿度に関する情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルM8を取得してよい。例えば、取得部131は、ニューラルネットワークである学習モデルM8を取得してよい。例えば、取得部131は、温度および湿度に関する環境情報が入力情報として入力された場合に、温度および湿度に関する環境情報の特徴を示す2048次元の特徴ベクトルV8を出力情報として出力する学習モデルM8を取得してよい。続いて、取得部131は、学習モデルM8を取得すると、学習モデルM8に関する情報と学習モデルM8を識別する識別情報「M8」とを対応付けて記憶部120に格納してよい。
【0045】
(生成部132)
生成部132は、空間に所在する個々の人物の仕事量に関する情報に基づいて、個々の人物の仕事の生産性(以下では、「仕事の生産性」を「生産性」と記載する場合がある)を推定する生産性判別モデルM4を生成してよい。具体的には、生成部132は、空間に所在する個々の人物の仕事量に関する情報の一例として、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルV4が入力情報として入力された場合に、個々の人物の仕事の生産性を出力情報として出力する生産性判別モデルM4を生成してよい。例えば、生成部132は、特徴ベクトルV4が入力情報として入力された場合に、生産性を示す各カテゴリC1に特徴ベクトルV4が分類される確率を出力情報として出力するよう学習された生産性判別モデルM4を生成してよい。例えば、生成部132は、特徴ベクトルV4が入力情報として入力された場合に、生産性が高いことを示す「高い」カテゴリに分類される確率と生産性が普通であることを示す「普通」カテゴリに分類される確率と生産性が低いことを示す「低い」カテゴリに分類される確率を出力情報として出力する生産性判別モデルM4を生成してよい。
【0046】
より具体的には、生成部132は、空間に所在する個々の人物の仕事量に関する情報の一例として、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルV4を生成してよい。例えば、生成部132は、記憶部120を参照して、取得部131によって取得された個々の人物のPC操作情報と学習モデルM1に関する情報を取得してよい。続いて、生成部132は、個々の人物のPC操作情報と学習モデルM1に関する情報を取得すると、学習モデルM1を用いて、個々の人物のPC操作情報の特徴を示す特徴ベクトルV1を生成してよい。また、生成部132は、記憶部120を参照して、取得部131によって取得された個々の人物の音声情報と学習モデルM2に関する情報を取得してよい。続いて、生成部132は、個々の人物の音声情報と学習モデルM2に関する情報を取得すると、学習モデルM2を用いて、個々の人物の音声情報の特徴を示す特徴ベクトルV2を生成してよい。また、生成部132は、記憶部120を参照して、取得部131によって取得された個々の人物の人物活動情報と学習モデルM3に関する情報を取得してよい。続いて、生成部132は、個々の人物の人物活動情報と学習モデルM3に関する情報を取得すると、学習モデルM3を用いて、個々の人物の人物活動情報の特徴を示す特徴ベクトルV3を生成してよい。
【0047】
続いて、生成部132は、特徴ベクトルV1~V3を生成すると、生成した特徴ベクトルV1~V3に基づいて、特徴ベクトルV1~V3の特徴を示す特徴マップMP1を生成してよい。続いて、生成部132は、特徴マップMP1を生成すると、特徴マップMP1に対する最大値プーリングにより、特徴マップMP1から特徴マップMP1の特徴を示す特徴ベクトルV4を生成してよい。例えば、生成部132は、最大値プーリングにより、特徴マップMP1の特徴を示す2048次元の特徴ベクトルV4を生成してよい。このようにして、生成部132は、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルV4を生成してよい。
【0048】
続いて、生成部132は、特徴ベクトルV4を生成すると、生成した特徴ベクトルV4が入力情報として入力された場合に、個々の人物の仕事の生産性を出力情報として出力するよう生産性判別モデルM4を学習させる。例えば、生成部132は、特徴ベクトルV4が入力情報として入力された場合に、生産性を示す各カテゴリC1に特徴ベクトルV4が分類される確率を出力情報として出力するよう生産性判別モデルM4を学習させる。例えば、生成部132は、特徴ベクトルV4が入力情報として入力された場合に、生産性が高いことを示す「高い」カテゴリに分類される確率と生産性が普通であることを示す「普通」カテゴリに分類される確率と生産性が低いことを示す「低い」カテゴリに分類される確率を出力情報として出力するよう生産性判別モデルM4を学習させる。
【0049】
なお、生産性を示すカテゴリC1は、任意の分類であってよく、上記の例に限定されない。例えば、生産性の分類は、「やや高い」、「やや低い」など他の分類を含んでよい。また、生成部132は、特徴ベクトルV4が入力情報として入力された場合に、特徴ベクトルV4が分類される生産性のカテゴリC1のラベルを出力情報として出力するよう学習された生産性判別モデルM4を生成してよい。例えば、生成部132は、特徴ベクトルV4が入力情報として入力された場合に、生産性を示す各カテゴリC1に特徴ベクトルV4が分類される確率が最も高いカテゴリのラベルを出力情報として出力するよう学習された生産性判別モデルM4を生成してよい。続いて、生成部132は、生産性判別モデルM4を生成すると、生産性判別モデルM4に関する情報と生産性判別モデルM4を識別する識別情報「M4」とを対応付けて記憶部120に格納してよい。
【0050】
(推定部133)
推定部133は、複数の人物が所在する空間に所在する個々の人物の仕事量に関する情報に基づいて、複数の人物が所在する空間に所在する個々の人物の仕事の生産性を推定する。具体的には、推定部133は、空調前の複数の人物が所在する空間に所在する個々の人物の仕事量に基づいて、空調前の個々の人物の仕事の生産性を推定してよい。また、推定部133は、空調後の空間に所在する個々の人物の仕事量に基づいて、空調後の個々の人物の仕事の生産性を推定してよい。
【0051】
より具体的には、推定部133は、所定の空間に所在する個々の人物の仕事量に関する情報から所定の空間に所在する個々の人物の仕事の生産性を推定するよう学習された生産性判別モデルM4を用いて、空間に所在する個々の人物の仕事量に関する情報から空間に所在する個々の人物の仕事の生産性を推定する。また、推定部133は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するPC操作情報、個々の人物の発言量に関する音声情報、または個々の人物の動作量に関する人物活動情報のうち少なくともいずれか一つに基づいて、個々の人物の仕事の生産性を推定する。ここで、
図3を用いて、実施形態に係る個々の人物の生産性の推定処理について詳しく説明する。
図3は、実施形態に係る個々の人物の生産性の推定処理の一例について説明するための図である。
【0052】
図3では、推定部133は、個々の人物の仕事量に関する情報の一例として、個々の人物による情報機器の操作量に関するPC操作情報D1の特徴を示す特徴ベクトルV1を生成してよい。具体的には、推定部133は、記憶部120を参照して、取得部131によって取得された学習モデルM1に関する情報を取得してよい。続いて、推定部133は、学習モデルM1に関する情報を取得すると、学習モデルM1の入力情報として、個々の人物のPC操作情報D1を学習モデルM1に入力してよい。続いて、推定部133は、学習モデルM1の出力情報として、個々の人物のPC操作情報の特徴を示す特徴ベクトルV1を学習モデルM1から出力してよい。
【0053】
また、推定部133は、個々の人物の仕事量に関する情報の一例として、個々の人物の発言量に関する音声情報D2の特徴を示す特徴ベクトルV2を生成してよい。具体的には、推定部133は、記憶部120を参照して、取得部131によって取得された学習モデルM2に関する情報を取得してよい。続いて、推定部133は、学習モデルM2に関する情報を取得すると、学習モデルM2の入力情報として、個々の人物の音声情報D2を学習モデルM2に入力してよい。続いて、推定部133は、学習モデルM2の出力情報として、個々の人物の音声情報D2の特徴を示す特徴ベクトルV2を学習モデルM2から出力してよい。
【0054】
また、推定部133は、個々の人物の仕事量に関する情報の一例として、個々の人物の動作量に関する人物活動情報D3の特徴を示す特徴ベクトルV3を生成してよい。具体的には、推定部133は、記憶部120を参照して、取得部131によって取得された学習モデルM3に関する情報を取得してよい。続いて、推定部133は、学習モデルM3に関する情報を取得すると、学習モデルM3の入力情報として、個々の人物の人物活動情報D3を学習モデルM3に入力してよい。続いて、推定部133は、学習モデルM3の出力情報として、個々の人物の人物活動情報D3の特徴を示す特徴ベクトルV3を学習モデルM3から出力してよい。
【0055】
続いて、推定部133は、特徴ベクトルV1~V3を生成すると、生成した特徴ベクトルV1~V3に基づいて、特徴ベクトルV1~V3の特徴を示す特徴マップMP1を生成してよい。続いて、推定部133は、特徴マップMP1を生成すると、特徴マップMP1に対する最大値プーリングにより、特徴マップMP1から特徴マップMP1の特徴を示す特徴ベクトルV4を生成してよい。例えば、推定部133は、最大値プーリングにより、特徴マップMP1の特徴を示す2048次元の特徴ベクトルV4を生成してよい。このようにして、推定部133は、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルV4を生成してよい。
【0056】
続いて、推定部133は、個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルV4を生成すると、生成した特徴ベクトルV4に基づいて、個々の人物の生産性を推定してよい。例えば、推定部133は、記憶部120を参照して、生成部132によって生成された生産性判別モデルM4に関する情報を取得してよい。続いて、推定部133は、生産性判別モデルM4に関する情報を取得すると、生産性判別モデルM4の入力情報として、生成した特徴ベクトルV4を生産性判別モデルM4に入力してよい。続いて、推定部133は、生産性判別モデルM4の出力情報として、個々の人物の生産性を示すカテゴリC1(「高い」、「普通」、「低い」のいずれか)を出力してよい。
【0057】
(空調制御部134)
空調制御部134は、空調制御モデルを用いて空調を制御する。空調制御部134は、学習部136によって強化学習された空調制御モデルM7を用いて空調を制御する。具体的には、空調制御部134は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御モデルM7を用いて空調を制御する。
【0058】
より具体的には、空調制御部134は、空調制御モデルの入力情報として空間を撮像した画像に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部134は、空間を撮像した画像に関する情報の一例として、空間を撮像したRGB画像に関する情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部134は、RGB画像に関する情報の一例として、複数の人物が所在する空間を撮像したRGB画像の特徴を示す特徴ベクトルV5を生成してよい。例えば、空調制御部134は、記憶部120を参照して、複数の人物が所在する空間を撮像したRGB画像と学習モデルM5に関する情報を取得してよい。続いて、空調制御部134は、RGB画像を取得すると、学習モデルM5を用いて、RGB画像から、RGB画像の特徴を示す特徴ベクトルV5を生成してよい。そして、空調制御部134は、生成した特徴ベクトルV5に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部134は、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。
【0059】
また、空調制御部134は、空間を撮像した画像に関する情報の一例として、空間を撮像したサーマル画像に関する情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部134は、サーマル画像に関する情報の一例として、複数の人物が所在する空間を撮像したサーマル画像の特徴を示す特徴ベクトルV6を生成してよい。例えば、空調制御部134は、記憶部120を参照して、複数の人物が所在する空間を撮像したサーマル画像と学習モデルM6に関する情報を取得してよい。続いて、空調制御部134は、サーマル画像を取得すると、学習モデルM6を用いて、サーマル画像から、サーマル画像の特徴を示す特徴ベクトルV6を生成してよい。そして、空調制御部134は、生成した特徴ベクトルV6に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部134は、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。
【0060】
また、空調制御部134は、複数の人物が所在する空間の温度および湿度に関する環境情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部134は、空間の温度および湿度に関する環境情報の一例として、複数の人物が所在する空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルV8を生成してよい。例えば、空調制御部134は、記憶部120を参照して、複数の人物が所在する空間の温度および湿度に関する環境情報と学習モデルM8に関する情報を取得してよい。続いて、空調制御部134は、温度および湿度に関する環境情報を取得すると、学習モデルM8を用いて、温度および湿度に関する情報から、温度および湿度に関する環境情報の特徴を示す特徴ベクトルV8を生成してよい。そして、空調制御部134は、生成した特徴ベクトルV8に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部134は、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。
【0061】
より具体的には、空調制御部134は、特徴ベクトルV5~V6、V8を生成すると、生成した特徴ベクトルV5~V6、V8に基づいて、特徴ベクトルV5~V6、V8の特徴を示す特徴ベクトルV7を生成してよい。例えば、空調制御部134は、生成した特徴ベクトルV5~V6、V8に基づいて、特徴ベクトルV5~V6、V8の特徴を示す特徴マップMP2を生成してよい。続いて、空調制御部134は、特徴マップMP2を生成すると、特徴マップMP2に対する最大値プーリングにより、特徴マップMP2から特徴マップMP2の特徴を示す特徴ベクトルV7を生成してよい。例えば、空調制御部134は、最大値プーリングにより、特徴マップMP2の特徴を示す2048次元の特徴ベクトルV7を生成してよい。このようにして、空調制御部134は、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部134は、特徴ベクトルV7を生成すると、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。より具体的には、空調制御部134は、特徴ベクトルV7を空調制御モデルM7の入力情報として入力してよい。続いて、空調制御部134は、複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を空調制御モデルM7の出力情報として出力してよい。
【0062】
続いて、空調制御部134は、空調制御モデルM7から出力された空調制御情報に基づいて、空間の空調を制御してよい。具体的には、空調制御部134は、空調制御モデルM7から出力された空調制御情報を空調制御の対象となる空間に設置された空調装置10に送信してよい。このように、空調制御部134は、空調制御モデルM7を用いて、空間の空調を制御してよい。
【0063】
(決定部135)
決定部135は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。具体的には、決定部135は、空調機器による空調前の個々の人物の仕事の生産性と、空調機器による空調後の個々の人物の仕事の生産性との比較に基づいて、集団の報酬を示す値を決定する。より具体的には、決定部135は、空調前の個々の人物の仕事の生産性と、空調後の個々の人物の仕事の生産性との比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定する。続いて、決定部135は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定する。この点について、
図5を用いて詳しく説明する。
図5は、実施形態に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。
【0064】
図5において、空調制御前の状態とは、空調機器が、空調制御部134の空調制御情報に従って、複数の人物が所在する空間の空調を行う前の状態を示す。一方、空調制御後の状態とは、空調機器が、空調制御部134の空調制御情報に従って、複数の人物が所在する空間の空調を行った後の状態を示す。
【0065】
図5に示す例では、決定部135は、空調前の個々の人物の生産性が「普通」の状態であって、空調後の個々の人物の生産性が「高い」状態である場合には、空調に対する個々の報酬を示す値を正の報酬である「+1」に決定してよい。また、決定部135は、空調前の個々の人物の生産性が「低い」状態であって、空調後の個々の人物の生産性が「高い」状態である場合には、空調に対する個々の報酬を示す値を正の報酬である「+3」に決定してよい。また、決定部135は、空調前の個々の人物の生産性が「低い」状態であって、空調後の個々の人物の生産性が「普通」の状態である場合には、空調に対する個々の報酬を示す値を正の報酬である「+1」に決定してよい。このように、決定部135は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が高い場合には、正の報酬として個々の報酬を示す値を決定してよい。また、
図5の例では、数字の大小関係により報酬の価値の高さが示されている。例えば、
図5では、報酬の価値として、「+1」よりも「+3」の方が価値が高いことを示す。すなわち、
図5では、空調前の個々の人物の生産性が「普通」の状態から空調後の個々の人物の生産性が「高い」状態へ変化させる空調よりも、空調前の個々の人物の生産性が「低い」状態から空調後の個々の人物の生産性が「高い」状態へ変化させる空調の方が、個々の人物にとって快適さをより向上させる空調動作であると考えられるため、実行した空調の価値が高いことを示す。このように、決定部135は、実行した空調動作が個々の人物にとって快適さをより向上させる制御であるほど、実行した空調動作に対して価値の高い報酬を付与することを決定してよい。
【0066】
また、決定部135は、空調前の個々の人物の生産性が「高い」状態であって、空調後の個々の人物の生産性が「高い」状態である場合には、空調に対する個々の報酬を示す値を「0」に決定してよい。また、決定部135は、空調前の個々の人物の生産性が「普通」の状態であって、空調後の個々の人物の生産性が「普通」の状態である場合には、空調に対する個々の報酬を示す値を「0」に決定してよい。また、決定部135は、空調前の個々の人物の生産性が「低い」状態であって、空調後の個々の人物の生産性が「低い」状態である場合には、空調に対する個々の報酬を示す値を「0」に決定してよい。このように、決定部135は、空調前の個々の人物の仕事の生産性と空調後の個々の人物の仕事の生産性が同じ場合には、個々の報酬を示す値をゼロに決定する。
【0067】
また、決定部135は、空調前の個々の人物の生産性が「高い」状態であって、空調後の個々の人物の生産性が「普通」の状態である場合には、空調に対する個々の報酬を示す値を負の報酬である「-1」に決定してよい。また、決定部135は、空調前の個々の人物の生産性が「高い」状態であって、空調後の個々の人物の生産性が「低い」状態である場合には、空調に対する個々の報酬を示す値を負の報酬である「-3」に決定してよい。また、決定部135は、空調前の個々の人物の生産性が「普通」の状態であって、空調後の個々の人物の生産性が「低い」状態である場合には、空調に対する個々の報酬を示す値を負の報酬である「-1」に決定してよい。このように、決定部135は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が低い場合には、負の報酬として個々の報酬を示す値を決定する。また、
図5では、報酬の価値として、「-1」よりも「-3」の方が価値が低いことを示す。すなわち、
図5では、空調前の個々の人物の生産性が「高い」状態から空調後の個々の人物の生産性が「普通」の状態へ変化させる空調よりも、空調前の個々の人物の生産性が「高い」状態から空調後の個々の人物の生産性が「低い」状態へ変化させる空調の方が、個々の人物にとって快適さをより低下させる空調動作であると考えられるため、実行した空調の価値が低いことを示す。このように、決定部135は、実行した空調動作が個々の人物にとって快適さをより低下させる制御であるほど、実行した空調動作に対して価値の低い報酬を付与することを決定してよい。
【0068】
続いて、決定部135は、個々の報酬を示す値を決定すると、決定した個々の報酬を示す値に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定してよい。例えば、決定部135は、複数の人物全員についての個々の報酬を示す値を所定条件に基づいて加算することで、集団の報酬を示す値を決定する。
【0069】
(学習部136)
学習部136は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。具体的には、学習部136は、集団の報酬を示す値が最大となるよう空調制御モデルM7を強化学習してよい。学習部136は、空調制御モデルM7を強化学習すると、強化学習済みの空調制御モデルM7に関する情報と空調制御モデルM7を識別する識別情報「M7」とを対応付けて記憶部120に格納してよい。
【0070】
〔4.情報処理のフロー〕
次に、
図6~
図12を用いて、実施形態に係る情報処理の手順について説明する。
図6~
図12は、実施形態に係る情報処理手順を示すフローチャートである。
【0071】
まず、
図6を用いて、実施形態に係る情報処理の手順について説明する。
図6では、取得部131は、複数の人物が所在する空間に所在する個々の人物の仕事量に関する情報を取得してよい。具体的には、取得部131は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するPC操作情報を取得してよい。また、取得部131は、個々の人物の仕事量に関する情報として、個々の人物の発言量に関する音声情報を取得してよい。また、取得部131は、個々の人物の仕事量に関する情報として、個々の人物の動作量に関する人物活動情報を取得してよい。
【0072】
続いて、推定部133は、取得部131によって個々の人物の仕事量に関する情報が取得されると、生産性判別モデルM4を用いて、空間に所在する個々の人物の生産性を推定する(ステップS11)。具体的には、推定部133は、個々の人物による情報機器の操作量に関するPC操作情報の特徴を示す特徴ベクトルV1、個々の人物の発言量に関する音声情報の特徴を示す特徴ベクトルV2、および個々の人物の動作量に関する人物活動情報の特徴を示す特徴ベクトルV3に基づいて生成された特徴ベクトルV4を入力情報として生産性判別モデルM4に入力してよい。続いて、推定部133は、空間に所在する個々の人物の生産性を生産性判別モデルM4の出力情報として出力してよい。
【0073】
続いて、推定部133は、空間に所在する個々の人物の生産性を生産性判別モデルM4の出力情報として出力すると、出力したデータを保存する(ステップS12)。具体的には、推定部133は、生産性判別モデルM4の出力情報として出力したデータを一つ前の空間に所在する個々の人物の生産性として記憶部120に保存してよい。
【0074】
次に、
図7を用いて、実施形態に係る情報処理の手順について説明する。
図7では、
図6に続いて、空調制御部134が、空調制御モデルM7を用いて、空間に設置された空調機器による空調を制御する空調制御情報を推定する(ステップS21)。具体的には、空調制御部134は、取得部131によって取得されたセンサ情報を空調制御モデルM7の入力情報として入力してよい。より具体的には、空調制御部134は、取得部131によって取得されたセンサ情報の特徴を示す特徴ベクトルV7を空調制御モデルM7の入力情報として入力してよい。例えば、空調制御部134は、RGB画像の特徴を示す特徴ベクトルV5、サーマル画像の特徴を示す特徴ベクトルV6、および、空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルV8に基づいて生成された特徴ベクトルV7を入力情報として空調制御モデルM7に入力してよい。続いて、空調制御部134は、空間に設置された空調機器による空調を制御する空調制御情報を空調制御モデルM7の出力情報として出力してよい。
【0075】
次に、
図8を用いて、実施形態に係る情報処理の手順について説明する。
図8では、
図7に続いて、空調装置10が、情報処理装置100から出力された空調制御情報に基づいて、空間の空調を行う(ステップS31)。具体的には、空調装置10は、情報処理装置100から空調制御情報を取得してよい。続いて、空調装置10は、空調制御情報を取得すると、空間に対して、取得した空調制御情報に基づく空調動作を行うことで、空間の空調を行ってよい。例えば、空調装置10は、空調制御情報に含まれる冷暖房設定に従って空間の空調を行ってよい。また、空調装置10は、空調制御情報に含まれる設定温度になるよう空間の温度を調整してよい。また、空調装置10は、空調制御情報に含まれる設定湿度になるよう空間の湿度を調整してよい。
【0076】
また、空調装置10によって空間の空調が調整された結果、空間の環境が変化する(ステップS32)。具体的には、空間の温度は、空調装置10による空調前の温度から設定温度に変化してよい。また、空間の湿度は、空調装置10による空調前の湿度から設定湿度に変化してよい。
【0077】
また、センサ装置20は、複数の人物が所在する空間の空調後の環境に関するモニタリングを行う(ステップS33)。具体的には、センサ装置20は、複数の人物が所在する空調後の空間の物理的な状態や空調後の空間に所在する人物の物理的な状態を示すセンサ情報を取得してよい。続いて、センサ装置20は、取得したセンサ情報を情報処理装置100に送信してよい。
【0078】
次に、
図9を用いて、実施形態に係る情報処理の手順について説明する。
図9では、
図8に続いて、取得部131は、複数の人物が所在する空調後の空間に所在する個々の人物の仕事量に関する情報を取得してよい。具体的には、取得部131は、空調後の個々の人物の仕事量に関する情報として、空調後の空間に所在する個々の人物による情報機器の操作量に関するPC操作情報を取得してよい。また、取得部131は、空調後の個々の人物の仕事量に関する情報として、空調後の空間に所在する個々の人物の発言量に関する音声情報を取得してよい。また、取得部131は、空調後の個々の人物の仕事量に関する情報として、空調後の空間に所在する個々の人物の動作量に関する人物活動情報を取得してよい。
【0079】
続いて、推定部133は、取得部131によって空調後の個々の人物の仕事量に関する情報が取得されると、生産性判別モデルM4を用いて、空調後の空間に所在する個々の人物の生産性を推定する(ステップS41)。具体的には、推定部133は、空調後の空間に所在する個々の人物の仕事量の特徴を示す特徴ベクトルV4´を生産性判別モデルM4の入力情報として入力してよい。より具体的には、推定部133は、空調後の空間に所在する個々の人物による情報機器の操作量に関するPC操作情報の特徴を示す特徴ベクトルV1´、空調後の空間に所在する個々の人物の発言量に関する音声情報の特徴を示す特徴ベクトルV2´、および、空調後の空間に所在する個々の人物の動作量に関する人物活動情報の特徴を示す特徴ベクトルV3´に基づいて生成された特徴ベクトルV4´を入力情報として生産性判別モデルM4に入力してよい。続いて、推定部133は、空調後の空間に所在する個々の人物の生産性を生産性判別モデルM4の出力情報として出力してよい。
【0080】
次に、
図10を用いて、実施形態に係る情報処理の手順について説明する。
図10では、
図9に続いて、決定部135が、記憶部120に保存された一つ前の空間に所在する個々の人物の生産性と、生産性判別モデルM4の出力情報として出力された空調後の空間に所在する個々の人物の生産性との比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定してよい。続いて、決定部135は、個々の報酬を示す値を決定すると、空間に所在する複数の人物全員についての個々の報酬を示す値を加算することで、空間に所在する複数の人物にとっての空調に対する集団の報酬(全体の報酬ともいう)を示す値を決定する(ステップS51)。
【0081】
次に、
図11を用いて、実施形態に係る情報処理の手順について説明する。
図11では、
図10に続いて、推定部133は、空調後の空間に所在する個々の人物の生産性を生産性判別モデルM4の出力情報として出力すると、出力したデータを保存する(ステップS61)。具体的には、推定部133は、生産性判別モデルM4の出力情報として出力したデータを一つ前の個々の人物の生産性として記憶部120に保存してよい。
【0082】
次に、
図12を用いて、実施形態に係る情報処理の手順について説明する。
図12では、
図11に続いて、学習部136が、空調に対する集団の報酬(全体の報酬ともいう)を示す値と、空調制御に関する空調動作を示す空調制御情報とに基づいて、空調制御モデルM7を強化学習する(ステップS71)。
【0083】
〔5.変形例〕
上述した実施形態に係る情報処理システム1は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理システム1の他の実施形態について説明する。なお、実施形態と同一部分には、同一符号を付して説明を省略する。
【0084】
上述した実施形態では、推定部133が生産性判別モデルM4を用いて個々の人物の生産性を推定する例について説明したが、推定部133が生産性判別モデルM4を用いずに個々の人物の生産性を推定してもよい。具体的には、推定部133は、個々の人物の生産性の一例として、個々の人物の仕事量に関する情報に基づいて、個々の人物の仕事の生産性を示す生産性スコア(以下では、個々の生産性スコアと記載する場合がある)を算出してよい。
【0085】
例えば、推定部133は、個々の人物の仕事量に関する情報の一例として、個々の人物による情報機器の操作量に関するPC操作情報に基づいて、個々の人物の仕事の生産性の一例として、個々の人物の操作量を個々の人物による情報機器の操作の持続時間で除した値であるPC操作に関する生産性スコアを算出してよい。ここで、PC操作に関する生産性スコアp(PC操作情報)の算出式は以下の式(1)で示される。
【0086】
【0087】
例えば、推定部133は、取得部131によって個々の人物の操作ログ情報が取得されると、個々の人物による各操作(キーボード入力操作、マウス操作、プリンタの出力、通信等)を特定してよい。続いて、推定部133は、個々の人物の各操作を特定すると、個々の人物による各操作の持続時間を操作ごとに算出してよい。また、推定部133は、個々の人物の操作量の一例として、キーボード入力の操作量、マウス操作の操作量、PCの起動時間の長さ、電源の消費量、プリンタの出力枚数、および通信量に関する情報を算出してよい。続いて、推定部133は、個々の人物の操作量を算出すると、PC操作に関する生産性スコアの一例として、個々の人物の各操作量を個々の人物の各操作の持続時間で除した値を操作ごとに算出してよい。また、推定部133は、PC操作に関する生産性スコアとして、個々の人物の各操作量を個々の人物の各操作の持続時間で除した値を加算した値を算出してよい。
【0088】
また、推定部133は、個々の人物の仕事量に関する情報の一例として、個々の人物の発言量に関する音声情報に基づいて、個々の人物の仕事の生産性の一例として、個々の人物の発言量を個々の人物による発言の持続時間で除した値である発話に関する生産性スコアを算出してよい。ここで、発話に関する生産性スコアp(音声情報)の算出式は以下の式(2)で示される。
【0089】
【0090】
例えば、推定部133は、取得部131によって取得された音声情報に複数の話者の音声が含まれる場合には、公知の複数話者識別技術を用いて、それぞれの話者の音声を識別してよい。続いて、推定部133は、それぞれの話者(個々の人物)の音声を識別したうえで、公知の音源分離(ノイズ除去)技術を用いて、個々の人物の音声に含まれるノイズを除去してよい。続いて、推定部133は、ノイズを除去すると、個々の人物の発言の持続時間を算出してよい。なお、推定部133は、個々の人物の発言の持続時間の代わりに、個々の人物の発言に係る文章の長さを算出してよい。
【0091】
また、推定部133は、個々の人物の音声を識別すると、個々の人物の発言量に関する情報の一例として、個々の人物による発話の回数を算出してよい。また、推定部133は、個々の人物の発言量に関する情報の一例として、沈黙時間(発言と発言の間の時間の長さ)を算出してよい。また、推定部133は、個々の人物の発言量に関する情報の一例として、発話の速度を算出してよい。また、推定部133は、個々の人物の発言量に関する情報の一例として、間投詞(「えー」など)の発生頻度を算出してよい。また、推定部133は、個々の人物の発言量に関する情報の一例として、笑い声の発生頻度を算出してよい。また、推定部133は、個々の人物の発言量に関する情報の一例として、発話者の切り替わり頻度を算出してよい。また、推定部133は、個々の人物の発言量に関する情報として、個々の人物による発話の回数、沈黙時間(発言と発言の間の時間の長さ)、発話の速度、間投詞(「えー」など)の発生頻度、笑い声の発生頻度、発話者の切り替わり頻度を加算した値を算出してよい。推定部133は、個々の人物の発言量に関する情報を算出すると、発話に関する生産性スコアとして、個々の人物の発言量に関する情報を個々の人物の発言の持続時間で除した値を算出してよい。
【0092】
また、推定部133は、個々の人物の仕事量に関する情報の一例として、個々の人物の動作量に関する人物活動情報に基づいて、個々の人物の仕事の生産性の一例として、個々の人物の動作量を個々の人物による動作の持続時間で除した値である人物活動に関する生産性スコアを算出してよい。ここで、人物活動に関する生産性スコアp(人物活動情報)の算出式は以下の式(3)で示される。
【0093】
【0094】
例えば、推定部133は、取得部131によって画像が取得されると、画像に含まれる個々の人物が撮像された領域(以下、個々の人物領域ともいう)を特定してよい。例えば、推定部133は、個々の人物の姿勢を推定する姿勢推定処理に基づいて、画像に含まれる個々の人物領域を特定してよい。続いて、推定部133は、個々の人物領域を特定すると、個々の人物の姿勢の時間変化に基づいて、個々の人物の各行動(立つ、座る、移動する等)を特定してよい。続いて、推定部133は、個々の人物の各行動を特定すると、個々の人物による各行動の持続時間を行動ごとに算出してよい。また、推定部133は、個々の人物の各行動を特定すると、個々の人物の動作量の一例として、個々の人物の各行動の回数を行動ごとに算出してよい。続いて、推定部133は、個々の人物の各行動の回数を算出すると、人物活動に関する生産性スコアの一例として、個々の人物の各行動の回数を個々の人物の各行動の持続時間で除した値を行動ごとに算出してよい。
【0095】
また、推定部133は、個々の人物領域を特定すると、個々の人物の頭部の姿勢の時間変化に基づいて、個々の人物の頭部の各動き(相槌を打つ、首を振る、首を傾げる等)を特定してよい。続いて、推定部133は、個々の人物の頭部の各動きを特定すると、個々の人物の頭部の各動きの持続時間を頭部の動きごとに算出してよい。また、推定部133は、個々の人物の頭部の各動きを特定すると、個々の人物の動作量の一例として、個々の人物の頭部の各動きの回数を頭部の動きごとに算出してよい。続いて、推定部133は、個々の人物の頭部の各動きの回数を算出すると、人物活動に関する生産性スコアの一例として、個々の人物の頭部の各動きの回数を個々の人物の頭部の各動きの持続時間で除した値を頭部の動きごとに算出してよい。また、推定部133は、人物活動に関する生産性スコアとして、個々の人物の各行動の回数を個々の人物の各行動の持続時間で除した値それぞれと個々の人物の頭部の各動きの回数を個々の人物の頭部の各動きの持続時間で除した値それぞれとを加算した値を算出してよい。
【0096】
また、推定部133は、個々の人物の仕事の生産性の一例として、PC操作に関する生産性スコアと発話に関する生産性スコアと人物活動に関する生産性スコアを加算した値を個々の生産性スコアとして算出してよい。ここで、個々の生産性スコアPの算出式は以下の式(4)で示される。
【0097】
【0098】
また、決定部135は、推定部133によって算出された個々の生産性スコアに基づいて、集団の報酬を決定してよい。この点について、
図13を用いて詳しく説明する。
図13は、変形例に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。
図13では、空調前(一つ前の状態)の個々の生産性スコアをP(t-1)、空調後の個々の生産性スコアをP(t)で示す。決定部135は、空調前の個々の生産性スコアP(t-1)と空調後の個々の生産性スコアP(t)に基づいて、個々の報酬を示す値として「(P(t)/P(t-1))-1」で表現される生産性の増減率を算出してよい。
【0099】
具体的には、決定部135は、空調前の個々の生産性スコアP(t-1)よりも空調後の個々の生産性スコアP(t)の方が大きい場合には、個々の報酬を示す値を「(P(t)/P(t-1))-1」で表現される正の報酬に決定してよい。また、決定部135は、空調前の個々の生産性スコアP(t-1)と空調後の個々の生産性スコアP(t)が同じ場合には、個々の報酬を示す値を「(P(t)/P(t-1))-1」で表現されるゼロに決定してよい。また、決定部135は、空調前の個々の生産性スコアP(t-1)よりも空調後の個々の生産性スコアP(t)の方が小さい場合には、個々の報酬を示す値を「(P(t)/P(t-1))-1」で表現される負の報酬に決定してよい。
【0100】
〔6.効果〕
上述してきたように、実施形態に係る情報処理装置100は、決定部135と学習部136を備える。決定部135は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。学習部136は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。
【0101】
これにより、情報処理装置100は、個々の人物の仕事の生産性に基づく集団にとって最適な生産性を実現する空調制御を行うことが可能となる。したがって、情報処理装置100は、集団の生産性を考慮した空調制御を可能とすることができる。
【0102】
また、決定部135は、空調機器による空調前の個々の人物の仕事の生産性と、空調機器による空調後の個々の人物の仕事の生産性との比較に基づいて、集団の報酬を示す値を決定する。具体的には、決定部135は、空調前の個々の人物の仕事の生産性と、空調後の個々の人物の仕事の生産性との比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定する。続いて、決定部135は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定する。例えば、決定部135は、複数の人物全員についての個々の報酬を示す値を所定条件に基づいて加算することで、集団の報酬を示す値を決定する。
【0103】
これにより、情報処理装置100は、個々の人物の空調前後の生産性の変化に基づいて、空調に対する集団の報酬を決定することができるため、集団の生産性を考慮した空調制御を可能とすることができる。
【0104】
また、決定部135は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が高い場合には、正の報酬として個々の報酬を示す値を決定する。
【0105】
これにより、情報処理装置100は、個々の人物の生産性をより高い状態に変化させる空調動作に対して正の報酬を付与するため、集団の生産性をより高い状態に変化させる空調動作を出力するよう空調制御モデルを強化学習させることができる。したがって、情報処理装置100は、集団の生産性をより高い状態に変化させる空調制御を可能とすることができる。
【0106】
また、決定部135は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が低い場合には、負の報酬として個々の報酬を示す値を決定する。
【0107】
これにより、情報処理装置100は、個々の人物の生産性をより低い状態に変化させる空調動作に対して負の報酬を付与するため、集団の生産性をより低い状態に変化させる空調動作を出力しないよう空調制御モデルを強化学習させることができる。したがって、情報処理装置100は、集団の生産性をより低い状態に変化させない空調制御を可能とすることができる。
【0108】
また、決定部135は、空調前の個々の人物の仕事の生産性と空調後の個々の人物の仕事の生産性が同じ場合には、個々の報酬を示す値をゼロに決定する。
【0109】
これにより、情報処理装置100は、個々の人物の生産性を変化させない空調動作に対しては報酬を付与しないため、集団の生産性を変化させる空調動作を出力するよう空調制御モデルを強化学習させることができる。
【0110】
また、情報処理装置100は、推定部133をさらに備える。推定部133は、空間に所在する個々の人物の仕事量に関する情報に基づいて、空間に所在する個々の人物の仕事の生産性を推定する。具体的には、推定部133は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するPC操作情報に基づいて、個々の人物の仕事の生産性として、操作量を個々の人物による情報機器の操作の持続時間で除した値であるPC操作に関する生産性スコアを算出する。また、推定部133は、個々の人物の仕事量に関する情報として、個々の人物の発言量に関する音声情報に基づいて、個々の人物の仕事の生産性として、発言量を個々の人物による発言の持続時間で除した値である発話に関する生産性スコアを算出する。また、推定部133は、個々の人物の仕事量に関する情報として、個々の人物の動作量に関する人物活動情報に基づいて、個々の人物の仕事の生産性として、動作量を個々の人物による動作の持続時間で除した値である人物活動に関する生産性スコアを算出する。
【0111】
これにより、情報処理装置100は、個々の人物の仕事量を数値化することにより、より精度よく個々の生産性を推定することができる。
【0112】
また、推定部133は、所定の空間に所在する個々の人物の仕事量に関する情報から所定の空間に所在する個々の人物の仕事の生産性を推定するよう学習された生産性判別モデルを用いて、空間に所在する個々の人物の仕事量に関する情報から空間に所在する個々の人物の仕事の生産性を推定する。具体的には、推定部133は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するPC操作情報、個々の人物の発言量に関する音声情報、または個々の人物の動作量に関する人物活動情報のうち少なくともいずれか一つに基づいて、個々の人物の仕事の生産性を推定する。
【0113】
これにより、情報処理装置100は、個々の生産性を推定するよう学習した機械学習モデル用いることにより、より精度よく個々の生産性を推定することができる。
【0114】
また、情報処理装置100は、空調制御部134をさらに備える。空調制御部134は、空調制御モデルを用いて空調を制御する。具体的には、空調制御部134は、空調制御モデルの入力情報として空間を撮像した画像に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部134は、空間を撮像した画像に関する情報として、赤外線カメラで空間を撮像したサーマル画像またはRGBカメラで空間を撮像したRGB画像のうち少なくともいずれか一方に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。また、空調制御部134は、空調制御モデルの入力情報として空間の温度および湿度に関する環境情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。
【0115】
これにより、情報処理装置100は、集団の生産性を考慮した空調動作を学習した空調制御モデルを用いて、空間の空調を制御することができるので、集団の生産性を考慮した空調制御を可能とすることができる。
【0116】
また、空調制御部134は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御モデルを用いて空調を制御する。
【0117】
これにより、情報処理装置100は、個々の人物の仕事の生産性に基づく集団の生産性を考慮した空調動作を学習した空調制御モデルを用いて、空間の空調を制御することができるので、集団の生産性を考慮した空調制御を可能とすることができる。
【0118】
〔7.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100は、例えば
図14に示すような構成のコンピュータ1000によって実現される。
図14は、情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
【0119】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0120】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。
【0121】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0122】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0123】
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
【0124】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0125】
〔8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0126】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、上述した実施形態では、情報処理装置100が空調制御部134と決定部135と学習部136を備える例について説明したが、空調制御部134と決定部135と学習部136をそれぞれ別々の装置が備えてもよい。例えば、空調制御部134を備える装置と、決定部135および学習部136を備える装置とが別々の装置であってよい。
【0127】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0128】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、学習部は、学習手段や学習回路に読み替えることができる。
【符号の説明】
【0129】
1 情報処理システム
10 空調装置
20 センサ装置
100 情報処理装置
110 通信部
120 記憶部
130 制御部
131 取得部
132 生成部
133 推定部
134 空調制御部
135 決定部
136 学習部