特許7186207 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ソフトバンクモバイル株式会社の特許一覧

特許7186207情報処理装置、情報処理プログラム及び情報処理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-11-30

(45)【発行日】2022-12-08

(54)【発明の名称】情報処理装置、情報処理プログラム及び情報処理システム

(51)【国際特許分類】

G06Q 10/06 20120101AFI20221201BHJP

【ＦＩ】

G06Q10/06 332

【請求項の数】 18

(21)【出願番号】P 2020192653

(22)【出願日】2020-11-19

(65)【公開番号】P2022081234

(43)【公開日】2022-05-31

【審査請求日】2021-02-18

(73)【特許権者】

【識別番号】501440684

【氏名又は名称】ソフトバンク株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】堀隆之

(72)【発明者】

【氏名】金容範

(72)【発明者】

【氏名】鈴木裕真

(72)【発明者】

【氏名】金田麟太郎

(72)【発明者】

【氏名】小林宏暢

(72)【発明者】

【氏名】田口正雄

(72)【発明者】

【氏名】河野肇

(72)【発明者】

【氏名】山口崇行

(72)【発明者】

【氏名】稲澤宏典

【審査官】加舎理紅子

(56)【参考文献】

【文献】特開２００５－０７６９１３（ＪＰ，Ａ）

【文献】特開２０１５－１０２３０７（ＪＰ，Ａ）

【文献】今西智哉他，学習効率を考慮したキャンパスエネルギーマネジメントシステムの提案と実証，計測自動制御学会論文集，公益社団法人計測自動制御学会，2015年05月31日，第５１巻，第５号，ｐ．３４４－３５１

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された前記空調前の前記個々の人物の仕事の生産性に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、
を備える情報処理装置。

【請求項2】

前記生産性判別モデルを用いて、前記個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す各カテゴリに該当する確率を算出し、各カテゴリに該当する確率のうち、最も高い確率に対応するカテゴリのラベルを出力し、
前記決定部は、
前記空調前の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報と、前記空調後の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報との比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項１に記載の情報処理装置。

【請求項3】

前記決定部は、
前記空調前の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報よりも、前記空調後の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報の方が、生産性が高いことを示す場合には、前記個々の報酬を示す値を正の値に決定する、
請求項２に記載の情報処理装置。

【請求項4】

前記決定部は、
前記空調前の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報よりも、前記空調後の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報の方が、生産性が低いことを示す場合には、前記個々の報酬を示す値を負の値に決定する、
請求項２または３に記載の情報処理装置。

【請求項5】

前記決定部は、
前記空調前の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報と前記空調後の前記ラベルに対応する前記個々の人物の仕事の生産性の高さを示す情報が同じ場合には、前記個々の報酬を示す値をゼロに決定する、
請求項２～４のいずれか１項に記載の情報処理装置。

【請求項6】

前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物による情報機器の操作量に関するＰＣ操作情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記操作量を前記個々の人物による前記情報機器の操作の持続時間で除した値であるＰＣ操作に関する前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項１～５のいずれか１項に記載の情報処理装置。

【請求項7】

前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物の発言量に関する音声情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記発言量を前記個々の人物による発言の持続時間で除した値である発話に関する前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項１～６のいずれか１項に記載の情報処理装置。

【請求項8】

前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物の動作量に関する人物活動情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記動作量を前記個々の人物による動作の持続時間で除した値である人物活動に関する前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項１～７のいずれか１項に記載の情報処理装置。

【請求項9】

前記個々の人物の仕事量に関する情報に基づいて、前記個々の人物の仕事の生産性に関する情報として、前記個々の人物の仕事の生産性の高さを示す生産性スコアを算出する推定部をさらに備え、
前記推定部は、
前記個々の人物の仕事量に関する情報として、前記個々の人物による情報機器の操作量に関するＰＣ操作情報、前記個々の人物の発言量に関する音声情報、または前記個々の人物の動作量に関する人物活動情報のうち少なくともいずれか一つに基づいて、前記生産性スコアを算出し、
前記決定部は、
前記空調前の前記個々の人物について算出された前記生産性スコアと、前記空調後の前記個々の人物について算出された前記生産性スコアとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項１～８のいずれか１項に記載の情報処理装置。

【請求項10】

前記空調制御モデルを用いて空調を制御する空調制御部、
をさらに備える請求項１～９のいずれか１項に記載の情報処理装置。

【請求項11】

前記空調制御部は、
前記空調制御モデルの入力情報として空間を撮像した画像に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される空調制御情報に基づいて空調を制御する、
請求項１０に記載の情報処理装置。

【請求項12】

前記空調制御部は、
前記空間を撮像した画像に関する情報として、赤外線カメラで前記空間を撮像したサーマル画像またはＲＧＢカメラで前記空間を撮像したＲＧＢ画像のうち少なくともいずれか一方に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される前記空調制御情報に基づいて空調を制御する、
請求項１０に記載の情報処理装置。

【請求項13】

前記空調制御部は、
前記空調制御モデルの入力情報として前記空間の温度および湿度に関する環境情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される前記空調制御情報に基づいて空調を制御する、
請求項１０～１２のいずれか１項に記載の情報処理装置。

【請求項14】

複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された前記空調前の前記個々の人物の仕事の生産性に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定手順と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。

【請求項15】

情報処理装置と、空調装置とを含む情報処理システムであって、
前記情報処理装置は、
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された前記空調前の前記個々の人物の仕事の生産性に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、
を備え、
前記空調装置は、
前記学習部によって強化学習された空調制御モデルから出力された前記空調制御情報に従って空調を行う、
情報処理システム。

【請求項16】

複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された前記空調前の前記個々の人物の仕事の生産性に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定し、決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御モデルを用いて空調を制御する空調制御部と、
を備える情報処理装置。

【請求項17】

複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された前記空調前の前記個々の人物の仕事の生産性に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定し、決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御モデルを用いて空調を制御する空調制御手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。

【請求項18】

情報処理装置と、空調装置とを含む情報処理システムであって、
前記情報処理装置は、
複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に関する情報から前記個々の人物の仕事の生産性に関する情報を推定するよう学習された生産性判別モデルを用いて、前記空調機器による空調前および空調後の前記個々の人物の仕事量に関する情報から前記空調前および前記空調後の前記個々の人物の仕事の生産性に関する情報をそれぞれ推定し、推定された前記空調前の前記個々の人物の仕事の生産性に関する情報と、前記空調後の前記個々の人物の仕事の生産性に関する情報との比較に基づいて前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定し、前記個々の報酬を示す値を所定条件に基づいて計算することで、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定し、決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御モデルを用いて空調を制御する空調制御部と、
を備え、
前記空調装置は、
前記空調制御部から出力された前記空調制御情報に従って空調を行う、
情報処理システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理プログラム及び情報処理システムに関する。

【背景技術】

【0002】

従来、利用者にとって快適な空間を提供するための技術が知られている。例えば、カメラで撮像した利用者の画像等に基づいて、作業空間における利用者の集中度を評価する。そして、利用者の集中度が低下したタイミングで作業空間における空気環境を変化させる技術が知られている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２０－２０５７１号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上記の従来技術では、利用者の集中度が低下したタイミングで作業空間における空気環境を変化させるにすぎないため、空間に所在する集団の生産性を向上させることができるとは限らない。

【課題を解決するための手段】

【0005】

実施形態に係る情報処理装置は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された前記個々の人物の仕事の生産性に基づいて、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、を備える。

【図面の簡単な説明】

【0006】

【図1】図１は、実施形態に係る情報処理システムの構成例を示す図である。

【図2】図２は、実施形態に係る情報処理装置の構成例を示す図である。

【図3】図３は、実施形態に係る個々の人物の生産性の推定処理の一例について説明するための図である。

【図4】図４は、実施形態に係る仕事量に関する情報について説明するための図である。

【図5】図５は、実施形態に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。

【図6】図６は、実施形態に係る情報処理手順を示す図である。

【図7】図７は、実施形態に係る情報処理手順を示す図である。

【図8】図８は、実施形態に係る情報処理手順を示す図である。

【図9】図９は、実施形態に係る情報処理手順を示す図である。

【図10】図１０は、実施形態に係る情報処理手順を示す図である。

【図11】図１１は、実施形態に係る情報処理手順を示す図である。

【図12】図１２は、実施形態に係る情報処理手順を示す図である。

【図13】図１３は、変形例に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。

【図14】図１４は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【発明を実施するための形態】

【0007】

以下に、本願に係る情報処理装置、情報処理プログラム及び情報処理システムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理プログラム及び情報処理システムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

【0008】

（実施形態）
〔１．はじめに〕
従来、空間に所在する人物の仕事の生産性を向上させるために空調を制御する技術が知られている。しかしながら、空間に所在する個々の人物の生産性を考慮して空調を制御するだけでは、空間に所在する複数の人物全員の生産性（以下、集団の生産性ともいう）を向上させることができるとは限らない。

【0009】

これに対し、実施形態に係る情報処理装置１００は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。また、情報処理装置１００は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。これにより、情報処理装置１００は、空間に所在する集団の生産性が高くなるような空調動作を出力する空調制御モデルを用いて、空調を制御することができる。したがって、情報処理装置１００は、空間に所在する集団の生産性を向上させることを可能とすることができる。

【0010】

〔２．情報処理システムの構成〕
まず、図１を用いて、実施形態に係る情報処理システムの構成について説明する。図１は、実施形態に係る情報処理システムの構成例を示す図である。情報処理システム１には、空調装置１０と、センサ装置２０と、情報処理装置１００とが含まれてよい。空調装置１０と、センサ装置２０と、情報処理装置１００とは所定のネットワークＮを介して、有線または無線により通信可能に接続されてよい。なお、情報処理システム１には、任意の数の空調装置１０と任意の数のセンサ装置２０と任意の数の情報処理装置１００とが含まれてもよい。

【0011】

空調装置１０は、空間の空気の温度や湿度などを調整する装置である。例えば、空調装置１０は、情報処理装置１００による空調制御の対象となる各空間に設置された空調機器（例えば、エアコン）であってよい。また、空調装置１０は、ＩｏＴ（Internet of Things）技術により、他の装置と通信可能であってよい。空調装置１０は、情報処理装置１００の制御に従って制御対象となる空間の空調を行うことができる。具体的には、空調装置１０は、空間に設置された空調機器による空調を制御する空調制御情報を情報処理装置１００から受信することができる。例えば、空調装置１０は、空調制御情報として、冷房設定による空調を行うことを示す冷房情報または暖房設定による空調を行うことを示す暖房情報を受信してよい。また、空調装置１０は、空調制御情報として、空間の設定温度を示す温度情報および空間の設定湿度を示す湿度情報を受信してよい。続いて、空調装置１０は、情報処理装置１００から受信した空調制御情報に従って、空間の空調を行う。例えば、空調装置１０は、冷房情報（暖房情報）を受信すると、空間の温度や湿度を冷房設定（暖房設定）によって調整してよい。また、空調装置１０は、温度情報を受信すると、空間の温度が設定温度や設定湿度に保たれるように調整してよい。また、空調装置１０は、湿度情報を受信すると、空間の湿度が設定湿度に保たれるように調整してよい。なお、以下では、空調装置１０のことを「空調機器」と記載する場合がある。

【0012】

なお、図１に示すように、空調装置１０が設置された空間に応じて、空調装置１０を空調装置１０－１～１０－２のように区別して説明する場合がある。例えば、空調装置１０－１は、会議室Ｒ１に設置されている空調装置１０であってよい。また、例えば、空調装置１０－２は、会議室Ｒ２に設置されている空調装置１０であってよい。また、以下では、空調装置１０－１～１０－２について、特に区別なく説明する場合には、空調装置１０と記載する。

【0013】

センサ装置２０は、空間の物理的な状態や空間に存在する利用者の物理的な状態を検知する装置である。センサ装置２０は、空間の物理的な状態や空間に存在する利用者の物理的な状態を示す情報をセンサ情報として取得してよい。例えば、センサ装置２０は、画像センサであってよい。例えば、センサ装置２０は、ＲＧＢカメラであってよい。すなわち、センサ装置２０は、例えば、空間に存在する利用者を被写体として含むＲＧＢ画像をセンサ情報として取得してよい。また、例えば、センサ装置２０は、赤外線カメラであってよい。すなわち、センサ装置２０は、例えば、空間に存在する利用者を被写体として含むサーマル画像をセンサ情報として取得してよい。また、センサ装置２０は、環境センサであってよい。例えば、センサ装置２０は、ＵＳＢ型の環境センサであってよい。すなわち、センサ装置２０は、例えば、空間の温度や湿度などの環境に関する情報（以下、環境情報ともいう）をセンサ情報として取得してよい。また、センサ装置２０は、取得したセンサ情報を情報処理装置１００に送信してよい。また、センサ装置２０が取得する環境情報は、後述する快適さの判定において利用可能な情報であればよく、上記の例に限定されない。例えば、センサ装置２０は、環境情報として気圧や照度などの任意の情報を取得してよい。

【0014】

なお、図１に示すように、センサ装置２０が設置された空間に応じて、センサ装置２０をセンサ装置２０－１～２０－２のように区別して説明する場合がある。例えば、センサ装置２０－１は、会議室Ｒ１に設置されているセンサ装置２０である。また、例えば、センサ装置２０－２は、会議室Ｒ２に設置されているセンサ装置２０である。また、以下では、センサ装置２０－１～２０－２について、特に区別なく説明する場合には、センサ装置２０と記載する。

【0015】

端末装置３０は、空間に存在する利用者によって利用される情報処理装置である。端末装置３０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）や、ヘッドマウントディスプレイ等である。実施形態では、端末装置３０がノート型ＰＣまたはデスクトップＰＣ（以下、単にＰＣと記載する場合がある）である例について説明する。

【0016】

また、端末装置３０には、利用者の物理的な状態を検知する各種のセンサが搭載または接続されている。例えば、端末装置３０には、カメラやマイクといったセンサが接続されている。端末装置３０は、各種のセンサによって、利用者の物理的な状態を示す人物センサ情報を検出してよい。例えば、端末装置３０は、人物センサ情報の一例として、カメラによって利用者の画像を検出してよい。また、端末装置３０は、人物センサ情報の一例として、マイクによって利用者の音声を検出してよい。また、端末装置３０は、人物センサ情報の一例として、利用者によるＰＣに対する操作履歴に関する操作ログ情報を検出してよい。端末装置３０は、人物センサ情報を検出すると、検出した人物センサ情報を情報処理装置１００に送信してよい。

【0017】

なお、図１に示すように、端末装置３０を利用する利用者に応じて、端末装置３０を端末装置３０－１～３０－２のように区別して説明する場合がある。例えば、端末装置３０－１は、利用者ＩＤ「Ｕ１」で識別される利用者Ｕ１によって利用される端末装置３０である。また、例えば、端末装置３０－２は、利用者ＩＤ「Ｕ２」で識別される利用者Ｕ２によって利用される端末装置３０である。また、以下では、端末装置３０－１～３０－２について、特に区別なく説明する場合には、端末装置３０と記載する。なお、以下では、利用者のことを「人物」と記載する場合がある。

【0018】

情報処理装置１００は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。また、情報処理装置１００は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。

【0019】

〔３．情報処理装置の構成〕
次に、図２を用いて、実施形態に係る情報処理装置１００の構成について説明する。図２は、実施形態に係る情報処理装置１００の構成例を示す図である。情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有してよい。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示させるための表示部（例えば、液晶ディスプレイ等）を有してもよい。

【0020】

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、例えば、空調装置１０やセンサ装置２０との間で情報の送受信を行う。

【0021】

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。

【0022】

記憶部１２０は、センサ装置２０によって検出されたセンサ情報を記憶してよい。例えば、記憶部１２０は、センサ情報の一例として、利用者が所在する空間を撮像したＲＧＢ画像およびサーマル画像と空間を識別する識別情報とを対応付けて記憶してよい。また、記憶部１２０は、センサ情報の一例として、利用者が所在する空間の温度および湿度に関する環境情報と空間を識別する識別情報とを対応付けて記憶してよい。

【0023】

また、記憶部１２０は、各種の学習モデルに関する情報を記憶してよい。例えば、記憶部１２０は、生産性判別モデルに関する情報を記憶してよい。また、記憶部１２０は、空調制御モデルに関する情報を記憶してよい。例えば、記憶部１２０は、各種の学習モデルの接続係数に関する情報を記憶してよい。

【0024】

また、記憶部１２０は、端末装置３０によって検出された人物センサ情報を記憶してよい。例えば、記憶部１２０は、人物センサ情報の一例として、端末装置３０に搭載されたカメラによって検出された利用者の画像と利用者を識別する識別情報とを対応付けて記憶してよい。また、記憶部１２０は、人物センサ情報の一例として、端末装置３０に搭載されたマイクによって検出された利用者の音声情報と利用者を識別する識別情報とを対応付けて記憶してよい。また、記憶部１２０は、人物センサ情報の一例として、端末装置３０によって検出された利用者によるＰＣに対する操作履歴に関する操作ログ情報と利用者を識別する識別情報とを対応付けて記憶してよい。

【0025】

（制御部１３０）
制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

【0026】

制御部１３０は、取得部１３１と、生成部１３２と、推定部１３３と、空調制御部１３４と、決定部１３５と、学習部１３６とを機能部として有し、以下に説明する情報処理の作用を実現または実行してよい。なお、制御部１３０の内部構成は、図２に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、各機能部は、制御部１３０の機能を示したものであり、必ずしも物理的に区別されるものでなくともよい。

【0027】

（取得部１３１）
取得部１３１は、複数の人物が所在する空間に所在する個々の人物の仕事量に関する情報を取得してよい。具体的には、取得部１３１は、個々の人物の人物センサ情報を端末装置３０から取得してよい。続いて、取得部１３１は、個々の人物の人物センサ情報を取得すると、取得した個々の人物の人物センサ情報に基づいて、個々の人物の仕事量に関する情報を算出してよい。

【0028】

また、取得部１３１は、個々の人物の人物センサ情報を取得すると、取得した人物センサ情報と個々の人物を識別可能な識別情報とを対応付けて記憶部１２０に記憶してよい。例えば、取得部１３１は、空調機器による空調が行われる前（以下、「空調前」と記載する場合がある）の空間に所在する個々の人物の人物センサ情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調機器による空調が行われた後（以下、「空調後」と記載する場合がある）の空間に所在する個々の人物の人物センサ情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得された個々の人物の人物センサ情報を区別して記憶部１２０に格納してよい。

【0029】

ここで、個々の人物の仕事量に関する情報とは、個々の人物による仕事の量である仕事量を数値化して表した情報のことを指す。図４を用いて、仕事量に関する情報について詳しく説明する。図４は、仕事量に関する情報について説明するための図である。図４に示す仕事量に関する情報は、個々の人物の仕事の生産性を評価する指標として用いることができる。図４では、仕事量に関する情報として、ＰＣ（情報機器）操作情報、音声情報、および人物活動情報についてそれぞれ説明する。

【0030】

図４の左側に示す例では、取得部１３１は、個々の人物の仕事量に関する情報の一例として、個々の人物による情報機器の操作量に関するＰＣ操作情報（以下では、個々の人物のＰＣ操作情報と記載する場合がある）を取得してよい。例えば、取得部１３１は、個々の人物の人物センサ情報の一例として、個々の人物によるＰＣに対する操作履歴に関する操作ログ情報（以下では、個々の人物の操作ログ情報と記載する場合がある）を端末装置３０から取得してよい。続いて、取得部１３１は、個々の人物の操作ログ情報を取得すると、取得した個々の人物の操作ログ情報に基づいて、個々の人物のＰＣ操作情報を算出してよい。例えば、取得部１３１は、個々の人物のＰＣ操作情報の一例として、キーボード入力の操作量、マウス操作の操作量、ＰＣの起動時間の長さ、電源の消費量、プリンタの出力枚数、および通信量に関する情報を算出してよい。

【0031】

また、取得部１３１は、個々の人物のＰＣ操作情報を算出すると、算出した個々の人物のＰＣ操作情報と個々の人物を識別可能な識別情報とを対応付けて記憶部１２０に記憶してよい。例えば、取得部１３１は、空調前の空間に所在する個々の人物のＰＣ操作情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調後の空間に所在する個々の人物のＰＣ操作情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得された個々の人物のＰＣ操作情報を区別して記憶部１２０に格納してよい。

【0032】

図４の中央に示す例では、取得部１３１は、個々の人物の仕事量に関する情報の一例として、個々の人物の発言量に関する音声情報（以下では、個々の人物の音声情報と記載する場合がある）を取得してよい。例えば、取得部１３１は、個々の人物の人物センサ情報の一例として、端末装置３０に搭載されたマイクによって検出された音声情報を端末装置３０から取得してよい。続いて、取得部１３１は、音声情報を取得すると、取得した音声情報に基づいて、個々の人物の音声情報を取得してよい。例えば、取得部１３１は、公知の複数話者識別技術を用いて、取得した音声情報に複数の話者の音声が含まれる場合には、それぞれの話者の音声を識別してよい。続いて、取得部１３１は、個々の人物の音声を識別したうえで、公知の音源分離（ノイズ除去）技術を用いて、個々の人物の音声情報に含まれるノイズを除去してよい。続いて、取得部１３１は、個々の人物の音声情報として、ノイズを除去した個々の人物の音声情報を取得してよい。

【0033】

また、取得部１３１は、個々の人物の音声情報を取得すると、取得した個々の人物の音声情報と個々の人物を識別可能な識別情報とを対応付けて記憶部１２０に記憶してよい。例えば、取得部１３１は、空調前の空間に所在する個々の人物の音声情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調後の空間に所在する個々の人物の音声情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得された個々の人物の音声情報を区別して記憶部１２０に格納してよい。

【0034】

図４の右側に示す例では、取得部１３１は、個々の人物の仕事量に関する情報の一例として、個々の人物の動作量に関する人物活動情報（以下では、個々の人物の人物活動情報と記載する場合がある）を取得してよい。例えば、取得部１３１は、個々の人物の人物センサ情報の一例として、端末装置３０に搭載されたカメラによって検出された画像を端末装置３０から取得してよい。続いて、取得部１３１は、画像を取得すると、取得した画像に基づいて、個々の人物の人物活動情報を取得してよい。例えば、取得部１３１は、画像を取得すると、画像に含まれる個々の人物が撮像された領域（以下、個々の人物領域ともいう）を特定する。例えば、取得部１３１は、個々の人物の姿勢を推定する姿勢推定処理に基づいて、画像に含まれる個々の人物領域を特定してよい。続いて、取得部１３１は、画像に含まれる個々の人物領域を特定すると、個々の人物の人物活動情報として、画像に含まれる個々の人物領域に関する情報を取得する。

【0035】

また、取得部１３１は、個々の人物の人物活動情報を取得すると、取得した個々の人物の人物活動情報と個々の人物を識別可能な識別情報とを対応付けて記憶部１２０に記憶してよい。例えば、取得部１３１は、空調前の空間に所在する個々の人物の人物活動情報と個々の人物を識別可能な識別情報と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調後の空間に所在する個々の人物の人物活動情報と個々の人物を識別可能な識別情報と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得された個々の人物の人物活動情報を区別して記憶部１２０に格納してよい。

【0036】

また、取得部１３１は、人物が所在する空間の物理的な状態や空間に所在する人物の物理的な状態を示すセンサ情報をセンサ装置２０から取得してよい。具体的には、取得部１３１は、センサ情報の一例として、複数の人物が所在する空間に設置されたＲＧＢカメラから複数の人物が所在する空間を撮像したＲＧＢ画像を取得してよい。続いて、取得部１３１は、ＲＧＢ画像を取得すると、取得したＲＧＢ画像と空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。例えば、取得部１３１は、空調前の空間を撮像したＲＧＢ画像と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調後の空間を撮像したＲＧＢ画像と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得されたＲＧＢ画像を区別して記憶部１２０に格納してよい。

【0037】

また、取得部１３１は、センサ情報の一例として、複数の人物が所在する空間に設置された赤外線カメラから複数の人物が所在する空間を撮像したサーマル画像を取得してよい。続いて、取得部１３１は、サーマル画像を取得すると、取得したサーマル画像と空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。例えば、取得部１３１は、空調前の空間を撮像したサーマル画像と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調後の空間を撮像したサーマル画像と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得されたサーマル画像を区別して記憶部１２０に格納してよい。

【0038】

また、取得部１３１は、センサ情報の一例として、複数の人物が所在する空間に設置された環境センサから複数の人物が所在する空間の温度および湿度に関する環境情報を取得してよい。続いて、取得部１３１は、取得した温度および湿度に関する環境情報と空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。例えば、取得部１３１は、空調前の空間の温度および湿度に関する環境情報と空調前の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。また、取得部１３１は、空調後の空間の温度および湿度に関する環境情報と空調後の空間を識別する識別情報とを対応付けて記憶部１２０に格納してよい。すなわち、取得部１３１は、空調の前後においてそれぞれ取得された環境情報を区別して記憶部１２０に格納してよい。

【0039】

また、取得部１３１は、各種の機械学習モデル（以下、単に「学習モデル」と記載する場合がある）に関する情報を外部の情報処理装置から取得してよい。具体的には、取得部１３１は、学習モデルの一例として、個々の人物のＰＣ操作情報が入力情報として入力された場合に、個々の人物のＰＣ操作情報の特徴を示す特徴ベクトルＶ１を出力情報として出力する学習モデルＭ１を取得してよい。例えば、取得部１３１は、個々の人物のＰＣ操作情報から個々の人物のＰＣ操作情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルＭ１を取得してよい。例えば、取得部１３１は、ニューラルネットワークである学習モデルＭ１を取得してよい。例えば、取得部１３１は、個々の人物のＰＣ操作情報が入力情報として入力された場合に、個々の人物のＰＣ操作情報の特徴を示す２０４８次元の特徴ベクトルＶ１を出力情報として出力する学習モデルＭ１を取得してよい。続いて、取得部１３１は、学習モデルＭ１を取得すると、学習モデルＭ１に関する情報と学習モデルＭ１を識別する識別情報「Ｍ１」とを対応付けて記憶部１２０に格納してよい。

【0040】

また、取得部１３１は、学習モデルの一例として、個々の人物の音声情報が入力情報として入力された場合に、個々の人物の音声情報の特徴を示す特徴ベクトルＶ２を出力情報として出力する学習モデルＭ２を取得してよい。例えば、取得部１３１は、個々の人物の音声情報から個々の人物の音声情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルＭ２を取得してよい。例えば、取得部１３１は、ニューラルネットワークである学習モデルＭ２を取得してよい。例えば、取得部１３１は、個々の人物の音声情報が入力情報として入力された場合に、個々の人物の音声情報の特徴を示す２０４８次元の特徴ベクトルＶ２を出力情報として出力する学習モデルＭ２を取得してよい。続いて、取得部１３１は、学習モデルＭ２を取得すると、学習モデルＭ２に関する情報と学習モデルＭ２を識別する識別情報「Ｍ２」とを対応付けて記憶部１２０に格納してよい。

【0041】

また、取得部１３１は、学習モデルの一例として、個々の人物の人物活動情報が入力情報として入力された場合に、個々の人物の人物活動情報の特徴を示す特徴ベクトルＶ３を出力情報として出力する学習モデルＭ３を取得してよい。例えば、取得部１３１は、ＩｍａｇｅＮｅｔ等の画像データベースに登録されている多数の（例えば、１０００万枚を超える）画像から画像に写っている物体名（クラス）を推定するよう学習された学習モデルＭ３を取得してよい。例えば、取得部１３１は、畳み込みニューラルネットワークである学習モデルＭ３を取得してよい。例えば、取得部１３１は、Ｒｅｓｎｅｔ５０である学習モデルＭ３を取得してよい。例えば、取得部１３１は、個々の人物の人物活動情報が入力情報として入力された場合に、個々の人物の人物活動情報の特徴を示す２０４８次元の特徴ベクトルＶ３を出力情報として出力する学習モデルＭ３を取得してよい。続いて、取得部１３１は、学習モデルＭ３を取得すると、学習モデルＭ３に関する情報と学習モデルＭ３を識別する識別情報「Ｍ３」とを対応付けて記憶部１２０に格納してよい。

【0042】

また、取得部１３１は、学習モデルの一例として、ＲＧＢ画像が入力情報として入力された場合に、ＲＧＢ画像の特徴を示す特徴ベクトルＶ５を出力情報として出力する学習モデルＭ５を取得してよい。例えば、取得部１３１は、ＩｍａｇｅＮｅｔ等の画像データベースに登録されている多数の（例えば、１０００万枚を超える）画像から画像に写っている物体名（クラス）を推定するよう学習された学習モデルＭ５を取得してよい。例えば、取得部１３１は、畳み込みニューラルネットワークである学習モデルＭ５を取得してよい。例えば、取得部１３１は、Ｒｅｓｎｅｔ５０である学習モデルＭ５を取得してよい。例えば、取得部１３１は、ＲＧＢ画像が入力情報として入力された場合に、ＲＧＢ画像の特徴を示す２０４８次元の特徴ベクトルＶ５を出力情報として出力する学習モデルＭ５を取得してよい。続いて、取得部１３１は、学習モデルＭ５を取得すると、学習モデルＭ５に関する情報と学習モデルＭ５を識別する識別情報「Ｍ５」とを対応付けて記憶部１２０に格納してよい。

【0043】

また、取得部１３１は、学習モデルの一例として、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す特徴ベクトルＶ６を出力情報として出力する学習モデルＭ６を取得してよい。例えば、取得部１３１は、ＩｍａｇｅＮｅｔ等の画像データベースに登録されている多数の（例えば、１０００万枚を超える）サーマル画像からサーマル画像に写っている物体名（クラス）を推定するよう学習された学習モデルＭ６を取得してよい。例えば、取得部１３１は、畳み込みニューラルネットワークである学習モデルＭ６を取得してよい。例えば、取得部１３１は、Ｒｅｓｎｅｔ５０である学習モデルＭ６を取得してよい。例えば、取得部１３１は、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す２０４８次元の特徴ベクトルＶ６を出力情報として出力する学習モデルＭ６を取得してよい。続いて、取得部１３１は、学習モデルＭ６を取得すると、学習モデルＭ６に関する情報と学習モデルＭ６を識別する識別情報「Ｍ６」とを対応付けて記憶部１２０に格納してよい。

【0044】

また、取得部１３１は、学習モデルの一例として、空間の温度および湿度に関する環境情報が入力情報として入力された場合に、空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルＶ８を出力情報として出力する学習モデルＭ８を取得してよい。例えば、取得部１３１は、空間の温度および湿度に関する環境情報から空間の温度および湿度に関する情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルＭ８を取得してよい。例えば、取得部１３１は、ニューラルネットワークである学習モデルＭ８を取得してよい。例えば、取得部１３１は、温度および湿度に関する環境情報が入力情報として入力された場合に、温度および湿度に関する環境情報の特徴を示す２０４８次元の特徴ベクトルＶ８を出力情報として出力する学習モデルＭ８を取得してよい。続いて、取得部１３１は、学習モデルＭ８を取得すると、学習モデルＭ８に関する情報と学習モデルＭ８を識別する識別情報「Ｍ８」とを対応付けて記憶部１２０に格納してよい。

【0045】

（生成部１３２）
生成部１３２は、空間に所在する個々の人物の仕事量に関する情報に基づいて、個々の人物の仕事の生産性（以下では、「仕事の生産性」を「生産性」と記載する場合がある）を推定する生産性判別モデルＭ４を生成してよい。具体的には、生成部１３２は、空間に所在する個々の人物の仕事量に関する情報の一例として、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルＶ４が入力情報として入力された場合に、個々の人物の仕事の生産性を出力情報として出力する生産性判別モデルＭ４を生成してよい。例えば、生成部１３２は、特徴ベクトルＶ４が入力情報として入力された場合に、生産性を示す各カテゴリＣ１に特徴ベクトルＶ４が分類される確率を出力情報として出力するよう学習された生産性判別モデルＭ４を生成してよい。例えば、生成部１３２は、特徴ベクトルＶ４が入力情報として入力された場合に、生産性が高いことを示す「高い」カテゴリに分類される確率と生産性が普通であることを示す「普通」カテゴリに分類される確率と生産性が低いことを示す「低い」カテゴリに分類される確率を出力情報として出力する生産性判別モデルＭ４を生成してよい。

【0046】

より具体的には、生成部１３２は、空間に所在する個々の人物の仕事量に関する情報の一例として、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルＶ４を生成してよい。例えば、生成部１３２は、記憶部１２０を参照して、取得部１３１によって取得された個々の人物のＰＣ操作情報と学習モデルＭ１に関する情報を取得してよい。続いて、生成部１３２は、個々の人物のＰＣ操作情報と学習モデルＭ１に関する情報を取得すると、学習モデルＭ１を用いて、個々の人物のＰＣ操作情報の特徴を示す特徴ベクトルＶ１を生成してよい。また、生成部１３２は、記憶部１２０を参照して、取得部１３１によって取得された個々の人物の音声情報と学習モデルＭ２に関する情報を取得してよい。続いて、生成部１３２は、個々の人物の音声情報と学習モデルＭ２に関する情報を取得すると、学習モデルＭ２を用いて、個々の人物の音声情報の特徴を示す特徴ベクトルＶ２を生成してよい。また、生成部１３２は、記憶部１２０を参照して、取得部１３１によって取得された個々の人物の人物活動情報と学習モデルＭ３に関する情報を取得してよい。続いて、生成部１３２は、個々の人物の人物活動情報と学習モデルＭ３に関する情報を取得すると、学習モデルＭ３を用いて、個々の人物の人物活動情報の特徴を示す特徴ベクトルＶ３を生成してよい。

【0047】

続いて、生成部１３２は、特徴ベクトルＶ１～Ｖ３を生成すると、生成した特徴ベクトルＶ１～Ｖ３に基づいて、特徴ベクトルＶ１～Ｖ３の特徴を示す特徴マップＭＰ１を生成してよい。続いて、生成部１３２は、特徴マップＭＰ１を生成すると、特徴マップＭＰ１に対する最大値プーリングにより、特徴マップＭＰ１から特徴マップＭＰ１の特徴を示す特徴ベクトルＶ４を生成してよい。例えば、生成部１３２は、最大値プーリングにより、特徴マップＭＰ１の特徴を示す２０４８次元の特徴ベクトルＶ４を生成してよい。このようにして、生成部１３２は、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルＶ４を生成してよい。

【0048】

続いて、生成部１３２は、特徴ベクトルＶ４を生成すると、生成した特徴ベクトルＶ４が入力情報として入力された場合に、個々の人物の仕事の生産性を出力情報として出力するよう生産性判別モデルＭ４を学習させる。例えば、生成部１３２は、特徴ベクトルＶ４が入力情報として入力された場合に、生産性を示す各カテゴリＣ１に特徴ベクトルＶ４が分類される確率を出力情報として出力するよう生産性判別モデルＭ４を学習させる。例えば、生成部１３２は、特徴ベクトルＶ４が入力情報として入力された場合に、生産性が高いことを示す「高い」カテゴリに分類される確率と生産性が普通であることを示す「普通」カテゴリに分類される確率と生産性が低いことを示す「低い」カテゴリに分類される確率を出力情報として出力するよう生産性判別モデルＭ４を学習させる。

【0049】

なお、生産性を示すカテゴリＣ１は、任意の分類であってよく、上記の例に限定されない。例えば、生産性の分類は、「やや高い」、「やや低い」など他の分類を含んでよい。また、生成部１３２は、特徴ベクトルＶ４が入力情報として入力された場合に、特徴ベクトルＶ４が分類される生産性のカテゴリＣ１のラベルを出力情報として出力するよう学習された生産性判別モデルＭ４を生成してよい。例えば、生成部１３２は、特徴ベクトルＶ４が入力情報として入力された場合に、生産性を示す各カテゴリＣ１に特徴ベクトルＶ４が分類される確率が最も高いカテゴリのラベルを出力情報として出力するよう学習された生産性判別モデルＭ４を生成してよい。続いて、生成部１３２は、生産性判別モデルＭ４を生成すると、生産性判別モデルＭ４に関する情報と生産性判別モデルＭ４を識別する識別情報「Ｍ４」とを対応付けて記憶部１２０に格納してよい。

【0050】

（推定部１３３）
推定部１３３は、複数の人物が所在する空間に所在する個々の人物の仕事量に関する情報に基づいて、複数の人物が所在する空間に所在する個々の人物の仕事の生産性を推定する。具体的には、推定部１３３は、空調前の複数の人物が所在する空間に所在する個々の人物の仕事量に基づいて、空調前の個々の人物の仕事の生産性を推定してよい。また、推定部１３３は、空調後の空間に所在する個々の人物の仕事量に基づいて、空調後の個々の人物の仕事の生産性を推定してよい。

【0051】

より具体的には、推定部１３３は、所定の空間に所在する個々の人物の仕事量に関する情報から所定の空間に所在する個々の人物の仕事の生産性を推定するよう学習された生産性判別モデルＭ４を用いて、空間に所在する個々の人物の仕事量に関する情報から空間に所在する個々の人物の仕事の生産性を推定する。また、推定部１３３は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するＰＣ操作情報、個々の人物の発言量に関する音声情報、または個々の人物の動作量に関する人物活動情報のうち少なくともいずれか一つに基づいて、個々の人物の仕事の生産性を推定する。ここで、図３を用いて、実施形態に係る個々の人物の生産性の推定処理について詳しく説明する。図３は、実施形態に係る個々の人物の生産性の推定処理の一例について説明するための図である。

【0052】

図３では、推定部１３３は、個々の人物の仕事量に関する情報の一例として、個々の人物による情報機器の操作量に関するＰＣ操作情報Ｄ１の特徴を示す特徴ベクトルＶ１を生成してよい。具体的には、推定部１３３は、記憶部１２０を参照して、取得部１３１によって取得された学習モデルＭ１に関する情報を取得してよい。続いて、推定部１３３は、学習モデルＭ１に関する情報を取得すると、学習モデルＭ１の入力情報として、個々の人物のＰＣ操作情報Ｄ１を学習モデルＭ１に入力してよい。続いて、推定部１３３は、学習モデルＭ１の出力情報として、個々の人物のＰＣ操作情報の特徴を示す特徴ベクトルＶ１を学習モデルＭ１から出力してよい。

【0053】

また、推定部１３３は、個々の人物の仕事量に関する情報の一例として、個々の人物の発言量に関する音声情報Ｄ２の特徴を示す特徴ベクトルＶ２を生成してよい。具体的には、推定部１３３は、記憶部１２０を参照して、取得部１３１によって取得された学習モデルＭ２に関する情報を取得してよい。続いて、推定部１３３は、学習モデルＭ２に関する情報を取得すると、学習モデルＭ２の入力情報として、個々の人物の音声情報Ｄ２を学習モデルＭ２に入力してよい。続いて、推定部１３３は、学習モデルＭ２の出力情報として、個々の人物の音声情報Ｄ２の特徴を示す特徴ベクトルＶ２を学習モデルＭ２から出力してよい。

【0054】

また、推定部１３３は、個々の人物の仕事量に関する情報の一例として、個々の人物の動作量に関する人物活動情報Ｄ３の特徴を示す特徴ベクトルＶ３を生成してよい。具体的には、推定部１３３は、記憶部１２０を参照して、取得部１３１によって取得された学習モデルＭ３に関する情報を取得してよい。続いて、推定部１３３は、学習モデルＭ３に関する情報を取得すると、学習モデルＭ３の入力情報として、個々の人物の人物活動情報Ｄ３を学習モデルＭ３に入力してよい。続いて、推定部１３３は、学習モデルＭ３の出力情報として、個々の人物の人物活動情報Ｄ３の特徴を示す特徴ベクトルＶ３を学習モデルＭ３から出力してよい。

【0055】

続いて、推定部１３３は、特徴ベクトルＶ１～Ｖ３を生成すると、生成した特徴ベクトルＶ１～Ｖ３に基づいて、特徴ベクトルＶ１～Ｖ３の特徴を示す特徴マップＭＰ１を生成してよい。続いて、推定部１３３は、特徴マップＭＰ１を生成すると、特徴マップＭＰ１に対する最大値プーリングにより、特徴マップＭＰ１から特徴マップＭＰ１の特徴を示す特徴ベクトルＶ４を生成してよい。例えば、推定部１３３は、最大値プーリングにより、特徴マップＭＰ１の特徴を示す２０４８次元の特徴ベクトルＶ４を生成してよい。このようにして、推定部１３３は、空間に所在する個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルＶ４を生成してよい。

【0056】

続いて、推定部１３３は、個々の人物の仕事量に関する情報の特徴を示す特徴ベクトルＶ４を生成すると、生成した特徴ベクトルＶ４に基づいて、個々の人物の生産性を推定してよい。例えば、推定部１３３は、記憶部１２０を参照して、生成部１３２によって生成された生産性判別モデルＭ４に関する情報を取得してよい。続いて、推定部１３３は、生産性判別モデルＭ４に関する情報を取得すると、生産性判別モデルＭ４の入力情報として、生成した特徴ベクトルＶ４を生産性判別モデルＭ４に入力してよい。続いて、推定部１３３は、生産性判別モデルＭ４の出力情報として、個々の人物の生産性を示すカテゴリＣ１（「高い」、「普通」、「低い」のいずれか）を出力してよい。

【0057】

（空調制御部１３４）
空調制御部１３４は、空調制御モデルを用いて空調を制御する。空調制御部１３４は、学習部１３６によって強化学習された空調制御モデルＭ７を用いて空調を制御する。具体的には、空調制御部１３４は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御モデルＭ７を用いて空調を制御する。

【0058】

より具体的には、空調制御部１３４は、空調制御モデルの入力情報として空間を撮像した画像に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部１３４は、空間を撮像した画像に関する情報の一例として、空間を撮像したＲＧＢ画像に関する情報が空調制御モデルＭ７に入力された場合に、空調制御モデルＭ７の出力情報として空調制御モデルＭ７から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部１３４は、ＲＧＢ画像に関する情報の一例として、複数の人物が所在する空間を撮像したＲＧＢ画像の特徴を示す特徴ベクトルＶ５を生成してよい。例えば、空調制御部１３４は、記憶部１２０を参照して、複数の人物が所在する空間を撮像したＲＧＢ画像と学習モデルＭ５に関する情報を取得してよい。続いて、空調制御部１３４は、ＲＧＢ画像を取得すると、学習モデルＭ５を用いて、ＲＧＢ画像から、ＲＧＢ画像の特徴を示す特徴ベクトルＶ５を生成してよい。そして、空調制御部１３４は、生成した特徴ベクトルＶ５に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルＶ７を生成してよい。続いて、空調制御部１３４は、空調制御モデルＭ７を用いて、特徴ベクトルＶ７から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。

【0059】

また、空調制御部１３４は、空間を撮像した画像に関する情報の一例として、空間を撮像したサーマル画像に関する情報が空調制御モデルＭ７に入力された場合に、空調制御モデルＭ７の出力情報として空調制御モデルＭ７から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部１３４は、サーマル画像に関する情報の一例として、複数の人物が所在する空間を撮像したサーマル画像の特徴を示す特徴ベクトルＶ６を生成してよい。例えば、空調制御部１３４は、記憶部１２０を参照して、複数の人物が所在する空間を撮像したサーマル画像と学習モデルＭ６に関する情報を取得してよい。続いて、空調制御部１３４は、サーマル画像を取得すると、学習モデルＭ６を用いて、サーマル画像から、サーマル画像の特徴を示す特徴ベクトルＶ６を生成してよい。そして、空調制御部１３４は、生成した特徴ベクトルＶ６に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルＶ７を生成してよい。続いて、空調制御部１３４は、空調制御モデルＭ７を用いて、特徴ベクトルＶ７から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。

【0060】

また、空調制御部１３４は、複数の人物が所在する空間の温度および湿度に関する環境情報が空調制御モデルＭ７に入力された場合に、空調制御モデルＭ７の出力情報として空調制御モデルＭ７から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部１３４は、空間の温度および湿度に関する環境情報の一例として、複数の人物が所在する空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルＶ８を生成してよい。例えば、空調制御部１３４は、記憶部１２０を参照して、複数の人物が所在する空間の温度および湿度に関する環境情報と学習モデルＭ８に関する情報を取得してよい。続いて、空調制御部１３４は、温度および湿度に関する環境情報を取得すると、学習モデルＭ８を用いて、温度および湿度に関する情報から、温度および湿度に関する環境情報の特徴を示す特徴ベクトルＶ８を生成してよい。そして、空調制御部１３４は、生成した特徴ベクトルＶ８に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルＶ７を生成してよい。続いて、空調制御部１３４は、空調制御モデルＭ７を用いて、特徴ベクトルＶ７から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。

【0061】

より具体的には、空調制御部１３４は、特徴ベクトルＶ５～Ｖ６、Ｖ８を生成すると、生成した特徴ベクトルＶ５～Ｖ６、Ｖ８に基づいて、特徴ベクトルＶ５～Ｖ６、Ｖ８の特徴を示す特徴ベクトルＶ７を生成してよい。例えば、空調制御部１３４は、生成した特徴ベクトルＶ５～Ｖ６、Ｖ８に基づいて、特徴ベクトルＶ５～Ｖ６、Ｖ８の特徴を示す特徴マップＭＰ２を生成してよい。続いて、空調制御部１３４は、特徴マップＭＰ２を生成すると、特徴マップＭＰ２に対する最大値プーリングにより、特徴マップＭＰ２から特徴マップＭＰ２の特徴を示す特徴ベクトルＶ７を生成してよい。例えば、空調制御部１３４は、最大値プーリングにより、特徴マップＭＰ２の特徴を示す２０４８次元の特徴ベクトルＶ７を生成してよい。このようにして、空調制御部１３４は、複数の人物が所在する空間の特徴を示す特徴ベクトルＶ７を生成してよい。続いて、空調制御部１３４は、特徴ベクトルＶ７を生成すると、空調制御モデルＭ７を用いて、特徴ベクトルＶ７から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。より具体的には、空調制御部１３４は、特徴ベクトルＶ７を空調制御モデルＭ７の入力情報として入力してよい。続いて、空調制御部１３４は、複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を空調制御モデルＭ７の出力情報として出力してよい。

【0062】

続いて、空調制御部１３４は、空調制御モデルＭ７から出力された空調制御情報に基づいて、空間の空調を制御してよい。具体的には、空調制御部１３４は、空調制御モデルＭ７から出力された空調制御情報を空調制御の対象となる空間に設置された空調装置１０に送信してよい。このように、空調制御部１３４は、空調制御モデルＭ７を用いて、空間の空調を制御してよい。

【0063】

（決定部１３５）
決定部１３５は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。具体的には、決定部１３５は、空調機器による空調前の個々の人物の仕事の生産性と、空調機器による空調後の個々の人物の仕事の生産性との比較に基づいて、集団の報酬を示す値を決定する。より具体的には、決定部１３５は、空調前の個々の人物の仕事の生産性と、空調後の個々の人物の仕事の生産性との比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定する。続いて、決定部１３５は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定する。この点について、図５を用いて詳しく説明する。図５は、実施形態に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。

【0064】

図５において、空調制御前の状態とは、空調機器が、空調制御部１３４の空調制御情報に従って、複数の人物が所在する空間の空調を行う前の状態を示す。一方、空調制御後の状態とは、空調機器が、空調制御部１３４の空調制御情報に従って、複数の人物が所在する空間の空調を行った後の状態を示す。

【0065】

図５に示す例では、決定部１３５は、空調前の個々の人物の生産性が「普通」の状態であって、空調後の個々の人物の生産性が「高い」状態である場合には、空調に対する個々の報酬を示す値を正の報酬である「＋１」に決定してよい。また、決定部１３５は、空調前の個々の人物の生産性が「低い」状態であって、空調後の個々の人物の生産性が「高い」状態である場合には、空調に対する個々の報酬を示す値を正の報酬である「＋３」に決定してよい。また、決定部１３５は、空調前の個々の人物の生産性が「低い」状態であって、空調後の個々の人物の生産性が「普通」の状態である場合には、空調に対する個々の報酬を示す値を正の報酬である「＋１」に決定してよい。このように、決定部１３５は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が高い場合には、正の報酬として個々の報酬を示す値を決定してよい。また、図５の例では、数字の大小関係により報酬の価値の高さが示されている。例えば、図５では、報酬の価値として、「＋１」よりも「＋３」の方が価値が高いことを示す。すなわち、図５では、空調前の個々の人物の生産性が「普通」の状態から空調後の個々の人物の生産性が「高い」状態へ変化させる空調よりも、空調前の個々の人物の生産性が「低い」状態から空調後の個々の人物の生産性が「高い」状態へ変化させる空調の方が、個々の人物にとって快適さをより向上させる空調動作であると考えられるため、実行した空調の価値が高いことを示す。このように、決定部１３５は、実行した空調動作が個々の人物にとって快適さをより向上させる制御であるほど、実行した空調動作に対して価値の高い報酬を付与することを決定してよい。

【0066】

また、決定部１３５は、空調前の個々の人物の生産性が「高い」状態であって、空調後の個々の人物の生産性が「高い」状態である場合には、空調に対する個々の報酬を示す値を「０」に決定してよい。また、決定部１３５は、空調前の個々の人物の生産性が「普通」の状態であって、空調後の個々の人物の生産性が「普通」の状態である場合には、空調に対する個々の報酬を示す値を「０」に決定してよい。また、決定部１３５は、空調前の個々の人物の生産性が「低い」状態であって、空調後の個々の人物の生産性が「低い」状態である場合には、空調に対する個々の報酬を示す値を「０」に決定してよい。このように、決定部１３５は、空調前の個々の人物の仕事の生産性と空調後の個々の人物の仕事の生産性が同じ場合には、個々の報酬を示す値をゼロに決定する。

【0067】

また、決定部１３５は、空調前の個々の人物の生産性が「高い」状態であって、空調後の個々の人物の生産性が「普通」の状態である場合には、空調に対する個々の報酬を示す値を負の報酬である「－１」に決定してよい。また、決定部１３５は、空調前の個々の人物の生産性が「高い」状態であって、空調後の個々の人物の生産性が「低い」状態である場合には、空調に対する個々の報酬を示す値を負の報酬である「－３」に決定してよい。また、決定部１３５は、空調前の個々の人物の生産性が「普通」の状態であって、空調後の個々の人物の生産性が「低い」状態である場合には、空調に対する個々の報酬を示す値を負の報酬である「－１」に決定してよい。このように、決定部１３５は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が低い場合には、負の報酬として個々の報酬を示す値を決定する。また、図５では、報酬の価値として、「－１」よりも「－３」の方が価値が低いことを示す。すなわち、図５では、空調前の個々の人物の生産性が「高い」状態から空調後の個々の人物の生産性が「普通」の状態へ変化させる空調よりも、空調前の個々の人物の生産性が「高い」状態から空調後の個々の人物の生産性が「低い」状態へ変化させる空調の方が、個々の人物にとって快適さをより低下させる空調動作であると考えられるため、実行した空調の価値が低いことを示す。このように、決定部１３５は、実行した空調動作が個々の人物にとって快適さをより低下させる制御であるほど、実行した空調動作に対して価値の低い報酬を付与することを決定してよい。

【0068】

続いて、決定部１３５は、個々の報酬を示す値を決定すると、決定した個々の報酬を示す値に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定してよい。例えば、決定部１３５は、複数の人物全員についての個々の報酬を示す値を所定条件に基づいて加算することで、集団の報酬を示す値を決定する。

【0069】

（学習部１３６）
学習部１３６は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。具体的には、学習部１３６は、集団の報酬を示す値が最大となるよう空調制御モデルＭ７を強化学習してよい。学習部１３６は、空調制御モデルＭ７を強化学習すると、強化学習済みの空調制御モデルＭ７に関する情報と空調制御モデルＭ７を識別する識別情報「Ｍ７」とを対応付けて記憶部１２０に格納してよい。

【0070】

〔４．情報処理のフロー〕
次に、図６～図１２を用いて、実施形態に係る情報処理の手順について説明する。図６～図１２は、実施形態に係る情報処理手順を示すフローチャートである。

【0071】

まず、図６を用いて、実施形態に係る情報処理の手順について説明する。図６では、取得部１３１は、複数の人物が所在する空間に所在する個々の人物の仕事量に関する情報を取得してよい。具体的には、取得部１３１は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するＰＣ操作情報を取得してよい。また、取得部１３１は、個々の人物の仕事量に関する情報として、個々の人物の発言量に関する音声情報を取得してよい。また、取得部１３１は、個々の人物の仕事量に関する情報として、個々の人物の動作量に関する人物活動情報を取得してよい。

【0072】

続いて、推定部１３３は、取得部１３１によって個々の人物の仕事量に関する情報が取得されると、生産性判別モデルＭ４を用いて、空間に所在する個々の人物の生産性を推定する（ステップＳ１１）。具体的には、推定部１３３は、個々の人物による情報機器の操作量に関するＰＣ操作情報の特徴を示す特徴ベクトルＶ１、個々の人物の発言量に関する音声情報の特徴を示す特徴ベクトルＶ２、および個々の人物の動作量に関する人物活動情報の特徴を示す特徴ベクトルＶ３に基づいて生成された特徴ベクトルＶ４を入力情報として生産性判別モデルＭ４に入力してよい。続いて、推定部１３３は、空間に所在する個々の人物の生産性を生産性判別モデルＭ４の出力情報として出力してよい。

【0073】

続いて、推定部１３３は、空間に所在する個々の人物の生産性を生産性判別モデルＭ４の出力情報として出力すると、出力したデータを保存する（ステップＳ１２）。具体的には、推定部１３３は、生産性判別モデルＭ４の出力情報として出力したデータを一つ前の空間に所在する個々の人物の生産性として記憶部１２０に保存してよい。

【0074】

次に、図７を用いて、実施形態に係る情報処理の手順について説明する。図７では、図６に続いて、空調制御部１３４が、空調制御モデルＭ７を用いて、空間に設置された空調機器による空調を制御する空調制御情報を推定する（ステップＳ２１）。具体的には、空調制御部１３４は、取得部１３１によって取得されたセンサ情報を空調制御モデルＭ７の入力情報として入力してよい。より具体的には、空調制御部１３４は、取得部１３１によって取得されたセンサ情報の特徴を示す特徴ベクトルＶ７を空調制御モデルＭ７の入力情報として入力してよい。例えば、空調制御部１３４は、ＲＧＢ画像の特徴を示す特徴ベクトルＶ５、サーマル画像の特徴を示す特徴ベクトルＶ６、および、空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルＶ８に基づいて生成された特徴ベクトルＶ７を入力情報として空調制御モデルＭ７に入力してよい。続いて、空調制御部１３４は、空間に設置された空調機器による空調を制御する空調制御情報を空調制御モデルＭ７の出力情報として出力してよい。

【0075】

次に、図８を用いて、実施形態に係る情報処理の手順について説明する。図８では、図７に続いて、空調装置１０が、情報処理装置１００から出力された空調制御情報に基づいて、空間の空調を行う（ステップＳ３１）。具体的には、空調装置１０は、情報処理装置１００から空調制御情報を取得してよい。続いて、空調装置１０は、空調制御情報を取得すると、空間に対して、取得した空調制御情報に基づく空調動作を行うことで、空間の空調を行ってよい。例えば、空調装置１０は、空調制御情報に含まれる冷暖房設定に従って空間の空調を行ってよい。また、空調装置１０は、空調制御情報に含まれる設定温度になるよう空間の温度を調整してよい。また、空調装置１０は、空調制御情報に含まれる設定湿度になるよう空間の湿度を調整してよい。

【0076】

また、空調装置１０によって空間の空調が調整された結果、空間の環境が変化する（ステップＳ３２）。具体的には、空間の温度は、空調装置１０による空調前の温度から設定温度に変化してよい。また、空間の湿度は、空調装置１０による空調前の湿度から設定湿度に変化してよい。

【0077】

また、センサ装置２０は、複数の人物が所在する空間の空調後の環境に関するモニタリングを行う（ステップＳ３３）。具体的には、センサ装置２０は、複数の人物が所在する空調後の空間の物理的な状態や空調後の空間に所在する人物の物理的な状態を示すセンサ情報を取得してよい。続いて、センサ装置２０は、取得したセンサ情報を情報処理装置１００に送信してよい。

【0078】

次に、図９を用いて、実施形態に係る情報処理の手順について説明する。図９では、図８に続いて、取得部１３１は、複数の人物が所在する空調後の空間に所在する個々の人物の仕事量に関する情報を取得してよい。具体的には、取得部１３１は、空調後の個々の人物の仕事量に関する情報として、空調後の空間に所在する個々の人物による情報機器の操作量に関するＰＣ操作情報を取得してよい。また、取得部１３１は、空調後の個々の人物の仕事量に関する情報として、空調後の空間に所在する個々の人物の発言量に関する音声情報を取得してよい。また、取得部１３１は、空調後の個々の人物の仕事量に関する情報として、空調後の空間に所在する個々の人物の動作量に関する人物活動情報を取得してよい。

【0079】

続いて、推定部１３３は、取得部１３１によって空調後の個々の人物の仕事量に関する情報が取得されると、生産性判別モデルＭ４を用いて、空調後の空間に所在する個々の人物の生産性を推定する（ステップＳ４１）。具体的には、推定部１３３は、空調後の空間に所在する個々の人物の仕事量の特徴を示す特徴ベクトルＶ４´を生産性判別モデルＭ４の入力情報として入力してよい。より具体的には、推定部１３３は、空調後の空間に所在する個々の人物による情報機器の操作量に関するＰＣ操作情報の特徴を示す特徴ベクトルＶ１´、空調後の空間に所在する個々の人物の発言量に関する音声情報の特徴を示す特徴ベクトルＶ２´、および、空調後の空間に所在する個々の人物の動作量に関する人物活動情報の特徴を示す特徴ベクトルＶ３´に基づいて生成された特徴ベクトルＶ４´を入力情報として生産性判別モデルＭ４に入力してよい。続いて、推定部１３３は、空調後の空間に所在する個々の人物の生産性を生産性判別モデルＭ４の出力情報として出力してよい。

【0080】

次に、図１０を用いて、実施形態に係る情報処理の手順について説明する。図１０では、図９に続いて、決定部１３５が、記憶部１２０に保存された一つ前の空間に所在する個々の人物の生産性と、生産性判別モデルＭ４の出力情報として出力された空調後の空間に所在する個々の人物の生産性との比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定してよい。続いて、決定部１３５は、個々の報酬を示す値を決定すると、空間に所在する複数の人物全員についての個々の報酬を示す値を加算することで、空間に所在する複数の人物にとっての空調に対する集団の報酬（全体の報酬ともいう）を示す値を決定する（ステップＳ５１）。

【0081】

次に、図１１を用いて、実施形態に係る情報処理の手順について説明する。図１１では、図１０に続いて、推定部１３３は、空調後の空間に所在する個々の人物の生産性を生産性判別モデルＭ４の出力情報として出力すると、出力したデータを保存する（ステップＳ６１）。具体的には、推定部１３３は、生産性判別モデルＭ４の出力情報として出力したデータを一つ前の個々の人物の生産性として記憶部１２０に保存してよい。

【0082】

次に、図１２を用いて、実施形態に係る情報処理の手順について説明する。図１２では、図１１に続いて、学習部１３６が、空調に対する集団の報酬（全体の報酬ともいう）を示す値と、空調制御に関する空調動作を示す空調制御情報とに基づいて、空調制御モデルＭ７を強化学習する（ステップＳ７１）。

【0083】

〔５．変形例〕
上述した実施形態に係る情報処理システム１は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理システム１の他の実施形態について説明する。なお、実施形態と同一部分には、同一符号を付して説明を省略する。

【0084】

上述した実施形態では、推定部１３３が生産性判別モデルＭ４を用いて個々の人物の生産性を推定する例について説明したが、推定部１３３が生産性判別モデルＭ４を用いずに個々の人物の生産性を推定してもよい。具体的には、推定部１３３は、個々の人物の生産性の一例として、個々の人物の仕事量に関する情報に基づいて、個々の人物の仕事の生産性を示す生産性スコア（以下では、個々の生産性スコアと記載する場合がある）を算出してよい。

【0085】

例えば、推定部１３３は、個々の人物の仕事量に関する情報の一例として、個々の人物による情報機器の操作量に関するＰＣ操作情報に基づいて、個々の人物の仕事の生産性の一例として、個々の人物の操作量を個々の人物による情報機器の操作の持続時間で除した値であるＰＣ操作に関する生産性スコアを算出してよい。ここで、ＰＣ操作に関する生産性スコアｐ(ＰＣ操作情報)の算出式は以下の式（１）で示される。

【0086】

【数1】

【0087】

例えば、推定部１３３は、取得部１３１によって個々の人物の操作ログ情報が取得されると、個々の人物による各操作（キーボード入力操作、マウス操作、プリンタの出力、通信等）を特定してよい。続いて、推定部１３３は、個々の人物の各操作を特定すると、個々の人物による各操作の持続時間を操作ごとに算出してよい。また、推定部１３３は、個々の人物の操作量の一例として、キーボード入力の操作量、マウス操作の操作量、ＰＣの起動時間の長さ、電源の消費量、プリンタの出力枚数、および通信量に関する情報を算出してよい。続いて、推定部１３３は、個々の人物の操作量を算出すると、ＰＣ操作に関する生産性スコアの一例として、個々の人物の各操作量を個々の人物の各操作の持続時間で除した値を操作ごとに算出してよい。また、推定部１３３は、ＰＣ操作に関する生産性スコアとして、個々の人物の各操作量を個々の人物の各操作の持続時間で除した値を加算した値を算出してよい。

【0088】

また、推定部１３３は、個々の人物の仕事量に関する情報の一例として、個々の人物の発言量に関する音声情報に基づいて、個々の人物の仕事の生産性の一例として、個々の人物の発言量を個々の人物による発言の持続時間で除した値である発話に関する生産性スコアを算出してよい。ここで、発話に関する生産性スコアｐ(音声情報)の算出式は以下の式（２）で示される。

【0089】

【数2】

【0090】

例えば、推定部１３３は、取得部１３１によって取得された音声情報に複数の話者の音声が含まれる場合には、公知の複数話者識別技術を用いて、それぞれの話者の音声を識別してよい。続いて、推定部１３３は、それぞれの話者（個々の人物）の音声を識別したうえで、公知の音源分離（ノイズ除去）技術を用いて、個々の人物の音声に含まれるノイズを除去してよい。続いて、推定部１３３は、ノイズを除去すると、個々の人物の発言の持続時間を算出してよい。なお、推定部１３３は、個々の人物の発言の持続時間の代わりに、個々の人物の発言に係る文章の長さを算出してよい。

【0091】

また、推定部１３３は、個々の人物の音声を識別すると、個々の人物の発言量に関する情報の一例として、個々の人物による発話の回数を算出してよい。また、推定部１３３は、個々の人物の発言量に関する情報の一例として、沈黙時間（発言と発言の間の時間の長さ）を算出してよい。また、推定部１３３は、個々の人物の発言量に関する情報の一例として、発話の速度を算出してよい。また、推定部１３３は、個々の人物の発言量に関する情報の一例として、間投詞（「えー」など）の発生頻度を算出してよい。また、推定部１３３は、個々の人物の発言量に関する情報の一例として、笑い声の発生頻度を算出してよい。また、推定部１３３は、個々の人物の発言量に関する情報の一例として、発話者の切り替わり頻度を算出してよい。また、推定部１３３は、個々の人物の発言量に関する情報として、個々の人物による発話の回数、沈黙時間（発言と発言の間の時間の長さ）、発話の速度、間投詞（「えー」など）の発生頻度、笑い声の発生頻度、発話者の切り替わり頻度を加算した値を算出してよい。推定部１３３は、個々の人物の発言量に関する情報を算出すると、発話に関する生産性スコアとして、個々の人物の発言量に関する情報を個々の人物の発言の持続時間で除した値を算出してよい。

【0092】

また、推定部１３３は、個々の人物の仕事量に関する情報の一例として、個々の人物の動作量に関する人物活動情報に基づいて、個々の人物の仕事の生産性の一例として、個々の人物の動作量を個々の人物による動作の持続時間で除した値である人物活動に関する生産性スコアを算出してよい。ここで、人物活動に関する生産性スコアｐ(人物活動情報)の算出式は以下の式（３）で示される。

【0093】

【数3】

【0094】

例えば、推定部１３３は、取得部１３１によって画像が取得されると、画像に含まれる個々の人物が撮像された領域（以下、個々の人物領域ともいう）を特定してよい。例えば、推定部１３３は、個々の人物の姿勢を推定する姿勢推定処理に基づいて、画像に含まれる個々の人物領域を特定してよい。続いて、推定部１３３は、個々の人物領域を特定すると、個々の人物の姿勢の時間変化に基づいて、個々の人物の各行動（立つ、座る、移動する等）を特定してよい。続いて、推定部１３３は、個々の人物の各行動を特定すると、個々の人物による各行動の持続時間を行動ごとに算出してよい。また、推定部１３３は、個々の人物の各行動を特定すると、個々の人物の動作量の一例として、個々の人物の各行動の回数を行動ごとに算出してよい。続いて、推定部１３３は、個々の人物の各行動の回数を算出すると、人物活動に関する生産性スコアの一例として、個々の人物の各行動の回数を個々の人物の各行動の持続時間で除した値を行動ごとに算出してよい。

【0095】

また、推定部１３３は、個々の人物領域を特定すると、個々の人物の頭部の姿勢の時間変化に基づいて、個々の人物の頭部の各動き（相槌を打つ、首を振る、首を傾げる等）を特定してよい。続いて、推定部１３３は、個々の人物の頭部の各動きを特定すると、個々の人物の頭部の各動きの持続時間を頭部の動きごとに算出してよい。また、推定部１３３は、個々の人物の頭部の各動きを特定すると、個々の人物の動作量の一例として、個々の人物の頭部の各動きの回数を頭部の動きごとに算出してよい。続いて、推定部１３３は、個々の人物の頭部の各動きの回数を算出すると、人物活動に関する生産性スコアの一例として、個々の人物の頭部の各動きの回数を個々の人物の頭部の各動きの持続時間で除した値を頭部の動きごとに算出してよい。また、推定部１３３は、人物活動に関する生産性スコアとして、個々の人物の各行動の回数を個々の人物の各行動の持続時間で除した値それぞれと個々の人物の頭部の各動きの回数を個々の人物の頭部の各動きの持続時間で除した値それぞれとを加算した値を算出してよい。

【0096】

また、推定部１３３は、個々の人物の仕事の生産性の一例として、ＰＣ操作に関する生産性スコアと発話に関する生産性スコアと人物活動に関する生産性スコアを加算した値を個々の生産性スコアとして算出してよい。ここで、個々の生産性スコアＰの算出式は以下の式（４）で示される。

【0097】

【数4】

【0098】

また、決定部１３５は、推定部１３３によって算出された個々の生産性スコアに基づいて、集団の報酬を決定してよい。この点について、図１３を用いて詳しく説明する。図１３は、変形例に係る個々の報酬を決定するための報酬テーブルの一例について説明するための図である。図１３では、空調前（一つ前の状態）の個々の生産性スコアをＰ(t-1)、空調後の個々の生産性スコアをＰ(t)で示す。決定部１３５は、空調前の個々の生産性スコアＰ(t-1)と空調後の個々の生産性スコアＰ(t)に基づいて、個々の報酬を示す値として「(Ｐ(t)/Ｐ(t-1))-１」で表現される生産性の増減率を算出してよい。

【0099】

具体的には、決定部１３５は、空調前の個々の生産性スコアＰ(t-1)よりも空調後の個々の生産性スコアＰ(t)の方が大きい場合には、個々の報酬を示す値を「(Ｐ(t)/Ｐ(t-1))-１」で表現される正の報酬に決定してよい。また、決定部１３５は、空調前の個々の生産性スコアＰ(t-1)と空調後の個々の生産性スコアＰ(t)が同じ場合には、個々の報酬を示す値を「(Ｐ(t)/Ｐ(t-1))-１」で表現されるゼロに決定してよい。また、決定部１３５は、空調前の個々の生産性スコアＰ(t-1)よりも空調後の個々の生産性スコアＰ(t)の方が小さい場合には、個々の報酬を示す値を「(Ｐ(t)/Ｐ(t-1))-１」で表現される負の報酬に決定してよい。

【0100】

〔６．効果〕
上述してきたように、実施形態に係る情報処理装置１００は、決定部１３５と学習部１３６を備える。決定部１３５は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。学習部１３６は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。

【0101】

これにより、情報処理装置１００は、個々の人物の仕事の生産性に基づく集団にとって最適な生産性を実現する空調制御を行うことが可能となる。したがって、情報処理装置１００は、集団の生産性を考慮した空調制御を可能とすることができる。

【0102】

また、決定部１３５は、空調機器による空調前の個々の人物の仕事の生産性と、空調機器による空調後の個々の人物の仕事の生産性との比較に基づいて、集団の報酬を示す値を決定する。具体的には、決定部１３５は、空調前の個々の人物の仕事の生産性と、空調後の個々の人物の仕事の生産性との比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定する。続いて、決定部１３５は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定する。例えば、決定部１３５は、複数の人物全員についての個々の報酬を示す値を所定条件に基づいて加算することで、集団の報酬を示す値を決定する。

【0103】

これにより、情報処理装置１００は、個々の人物の空調前後の生産性の変化に基づいて、空調に対する集団の報酬を決定することができるため、集団の生産性を考慮した空調制御を可能とすることができる。

【0104】

また、決定部１３５は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が高い場合には、正の報酬として個々の報酬を示す値を決定する。

【0105】

これにより、情報処理装置１００は、個々の人物の生産性をより高い状態に変化させる空調動作に対して正の報酬を付与するため、集団の生産性をより高い状態に変化させる空調動作を出力するよう空調制御モデルを強化学習させることができる。したがって、情報処理装置１００は、集団の生産性をより高い状態に変化させる空調制御を可能とすることができる。

【0106】

また、決定部１３５は、空調前の個々の人物の仕事の生産性よりも、空調後の個々の人物の仕事の生産性の方が低い場合には、負の報酬として個々の報酬を示す値を決定する。

【0107】

これにより、情報処理装置１００は、個々の人物の生産性をより低い状態に変化させる空調動作に対して負の報酬を付与するため、集団の生産性をより低い状態に変化させる空調動作を出力しないよう空調制御モデルを強化学習させることができる。したがって、情報処理装置１００は、集団の生産性をより低い状態に変化させない空調制御を可能とすることができる。

【0108】

また、決定部１３５は、空調前の個々の人物の仕事の生産性と空調後の個々の人物の仕事の生産性が同じ場合には、個々の報酬を示す値をゼロに決定する。

【0109】

これにより、情報処理装置１００は、個々の人物の生産性を変化させない空調動作に対しては報酬を付与しないため、集団の生産性を変化させる空調動作を出力するよう空調制御モデルを強化学習させることができる。

【0110】

また、情報処理装置１００は、推定部１３３をさらに備える。推定部１３３は、空間に所在する個々の人物の仕事量に関する情報に基づいて、空間に所在する個々の人物の仕事の生産性を推定する。具体的には、推定部１３３は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するＰＣ操作情報に基づいて、個々の人物の仕事の生産性として、操作量を個々の人物による情報機器の操作の持続時間で除した値であるＰＣ操作に関する生産性スコアを算出する。また、推定部１３３は、個々の人物の仕事量に関する情報として、個々の人物の発言量に関する音声情報に基づいて、個々の人物の仕事の生産性として、発言量を個々の人物による発言の持続時間で除した値である発話に関する生産性スコアを算出する。また、推定部１３３は、個々の人物の仕事量に関する情報として、個々の人物の動作量に関する人物活動情報に基づいて、個々の人物の仕事の生産性として、動作量を個々の人物による動作の持続時間で除した値である人物活動に関する生産性スコアを算出する。

【0111】

これにより、情報処理装置１００は、個々の人物の仕事量を数値化することにより、より精度よく個々の生産性を推定することができる。

【0112】

また、推定部１３３は、所定の空間に所在する個々の人物の仕事量に関する情報から所定の空間に所在する個々の人物の仕事の生産性を推定するよう学習された生産性判別モデルを用いて、空間に所在する個々の人物の仕事量に関する情報から空間に所在する個々の人物の仕事の生産性を推定する。具体的には、推定部１３３は、個々の人物の仕事量に関する情報として、個々の人物による情報機器の操作量に関するＰＣ操作情報、個々の人物の発言量に関する音声情報、または個々の人物の動作量に関する人物活動情報のうち少なくともいずれか一つに基づいて、個々の人物の仕事の生産性を推定する。

【0113】

これにより、情報処理装置１００は、個々の生産性を推定するよう学習した機械学習モデル用いることにより、より精度よく個々の生産性を推定することができる。

【0114】

また、情報処理装置１００は、空調制御部１３４をさらに備える。空調制御部１３４は、空調制御モデルを用いて空調を制御する。具体的には、空調制御部１３４は、空調制御モデルの入力情報として空間を撮像した画像に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部１３４は、空間を撮像した画像に関する情報として、赤外線カメラで空間を撮像したサーマル画像またはＲＧＢカメラで空間を撮像したＲＧＢ画像のうち少なくともいずれか一方に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。また、空調制御部１３４は、空調制御モデルの入力情報として空間の温度および湿度に関する環境情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。

【0115】

これにより、情報処理装置１００は、集団の生産性を考慮した空調動作を学習した空調制御モデルを用いて、空間の空調を制御することができるので、集団の生産性を考慮した空調制御を可能とすることができる。

【0116】

また、空調制御部１３４は、複数の人物が所在し空調機器により空調が行われる空間に所在する個々の人物の仕事量に基づいて推定された個々の人物の仕事の生産性に基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御モデルを用いて空調を制御する。

【0117】

これにより、情報処理装置１００は、個々の人物の仕事の生産性に基づく集団の生産性を考慮した空調動作を学習した空調制御モデルを用いて、空間の空調を制御することができるので、集団の生産性を考慮した空調制御を可能とすることができる。

【0118】

〔７．ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置１００は、例えば図１４に示すような構成のコンピュータ１０００によって実現される。図１４は、情報処理装置１００の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を備える。

【0119】

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

【0120】

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、所定の通信網を介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータを所定の通信網を介して他の機器へ送信する。

【0121】

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

【0122】

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

【0123】

例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。

【0124】

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

【0125】

〔８．その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

【0126】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、上述した実施形態では、情報処理装置１００が空調制御部１３４と決定部１３５と学習部１３６を備える例について説明したが、空調制御部１３４と決定部１３５と学習部１３６をそれぞれ別々の装置が備えてもよい。例えば、空調制御部１３４を備える装置と、決定部１３５および学習部１３６を備える装置とが別々の装置であってよい。

【0127】

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0128】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、学習部は、学習手段や学習回路に読み替えることができる。

【符号の説明】

【0129】

１情報処理システム
１０空調装置
２０センサ装置
１００情報処理装置
１１０通信部
１２０記憶部
１３０制御部
１３１取得部
１３２生成部
１３３推定部
１３４空調制御部
１３５決定部
１３６学習部

【図1】