IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

<>
  • 特開-空気調和システム 図1
  • 特開-空気調和システム 図2
  • 特開-空気調和システム 図3
  • 特開-空気調和システム 図4
  • 特開-空気調和システム 図5
  • 特開-空気調和システム 図6
  • 特開-空気調和システム 図7
  • 特開-空気調和システム 図8
  • 特開-空気調和システム 図9
  • 特開-空気調和システム 図10
  • 特開-空気調和システム 図11
  • 特開-空気調和システム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024140307
(43)【公開日】2024-10-10
(54)【発明の名称】空気調和システム
(51)【国際特許分類】
   F24F 11/46 20180101AFI20241003BHJP
   F24F 11/64 20180101ALI20241003BHJP
   F24F 11/65 20180101ALI20241003BHJP
   F24F 11/70 20180101ALI20241003BHJP
【FI】
F24F11/46
F24F11/64
F24F11/65
F24F11/70
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023051393
(22)【出願日】2023-03-28
(71)【出願人】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110001461
【氏名又は名称】弁理士法人きさ特許商標事務所
(72)【発明者】
【氏名】范 芸青
(72)【発明者】
【氏名】齊藤 信
【テーマコード(参考)】
3L260
【Fターム(参考)】
3L260AB02
3L260BA02
3L260BA75
3L260CA03
3L260CA12
3L260CA13
3L260CA32
3L260CA34
3L260CB62
3L260CB67
3L260DA05
3L260EA01
3L260EA22
3L260FA09
3L260FC40
(57)【要約】
【課題】空調負荷の変動に対して室温が目標値からアンダーシュートまたはオーバシュートすることを抑制し、室内に居る人の快適性を維持する空気調和システムを得る。
【解決手段】空調対象空間を空気調和する空気調和装置と、空気調和装置の運転データと空調対象空間に関する環境情報とを含む状態変数に基づいて、空調対象空間に発生する空調負荷を予測する負荷推定手段と、空気調和装置の空調能力を調整する関数を更新する学習手段と、を有し、学習手段は、空調負荷に対して空調対象空間の温度変動量が小さいほど報酬が増える報酬条件を設定し、報酬条件に基づいて、関数の更新を繰り返すことによって空気調和装置に必要な空調能力および空調能力の適用時間を学習し、報酬が最も多くなる空調能力および適用時間を求める。
【選択図】図1
【特許請求の範囲】
【請求項1】
空調対象空間を空気調和する空気調和装置と、
前記空気調和装置の運転データと前記空調対象空間に関する環境情報とを含む状態変数に基づいて、前記空調対象空間に発生する空調負荷を予測する負荷推定手段と、
前記空気調和装置の空調能力を調整する関数を更新する学習手段と、
を有し、
前記学習手段は、
前記空調負荷に対して前記空調対象空間の温度変動量が小さいほど報酬が増える報酬条件を設定し、前記報酬条件に基づいて、前記関数の更新を繰り返すことによって前記空気調和装置に必要な前記空調能力および前記空調能力の適用時間を学習し、前記報酬が最も多くなる前記空調能力および前記適用時間を求める、
空気調和システム。
【請求項2】
前記学習手段は、
前記学習を実行することで、前記報酬が最も多くなる前記空調能力の最大値および前記適用時間を求め、前記適用時間に前記空調能力を現在の空調能力から増加させて前記最大値に到達させる空調制御を前記空気調和装置に実行させる、
請求項1に記載の空気調和システム。
【請求項3】
前記空調対象空間の人数、換気量および日射量と外気温度とを含む前記環境情報を取得し、前記空気調和装置から前記運転データを取得する取得手段と、
過去の前記運転データおよび前記環境情報である履歴情報を記憶するデータベースと、を有し、
前記負荷推定手段は、
前記データベースによって記憶される前記履歴情報と、前記取得手段によって取得された前記環境情報および前記運転データとに基づいて、前記空調負荷を予測する、
請求項1に記載の空気調和システム。
【請求項4】
前記学習手段は、
前記空調負荷に対して、前記空調能力および前記適用時間を変動パラメータとするトライアル条件を複数生成し、複数の前記トライアル条件のうち、前記温度変動量が最小になる、前記空調能力および前記適用時間を求める、
請求項1~3のいずれか1項に記載の空気調和システム。
【請求項5】
前記学習手段は、
前記空調負荷に基づいて学習期間を決定し、決定した前記学習期間において、前記空調能力および前記適用時間の変動パラメータのうち、前記温度変動量が最小になる、前記空調能力および前記適用時間を求める、
請求項1~3のいずれか1項に記載の空気調和システム。
【請求項6】
前記学習手段は、前記空気調和装置の運転中または前記空気調和装置が運転を停止した後に、前記空調能力および前記適用時間を学習する、
請求項1~3のいずれか1項に記載の空気調和システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、空気調和装置を有する空気調和システムに関する。
【背景技術】
【0002】
従来、日射量、外気温度および湿度などの環境条件の急激な変動に対して、快適性を維持する空気調和装置が提案されている(例えば、特許文献1参照)。特許文献1に開示された空気調和装置は、日射量等の現在の環境情報を検知する手段と、環境情報を記憶する手段と、温熱環境評価指標に基づいて設定温度などの制御目標を決定する手段と、現在の環境情報と過去に記憶した環境情報とに基づいて空調負荷を予測する手段と、制御目標および予測された空調負荷に基づいて空調負荷の変動の影響を打ち消すように空調能力を制御する手段とを有する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開平05-264086号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の空気調和装置は、空調負荷の変動に対して、空調負荷の変動の影響を打ち消す空調能力に対応する空調制御を実行する時間が長すぎると、室温が目標値を超えるオーバシュートが発生してしまう。また、従来の空気調和装置において、空調負荷の変動の影響を打ち消す空調能力に対応する空調制御を実行する時間が短すぎると、室温が目標値に到達しないアンダーシュートが発生してしまうおそれがある。
【0005】
本開示は、上記のような課題を解決するためになされたもので、空調負荷の変動に対して室温が目標値からアンダーシュートまたはオーバシュートすることを抑制する空気調和システムを得るものである。
【課題を解決するための手段】
【0006】
本開示に係る空気調和システムは、空調対象空間を空気調和する空気調和装置と、前記空気調和装置の運転データと前記空調対象空間に関する環境情報とを含む状態変数に基づいて、前記空調対象空間に発生する空調負荷を予測する負荷推定手段と、前記空気調和装置の空調能力を調整する関数を更新する学習手段と、を有し、前記学習手段は、前記空調負荷に対して前記空調対象空間の温度変動量が小さいほど報酬が増える報酬条件を設定し、前記報酬条件に基づいて、前記関数の更新を繰り返すことによって前記空気調和装置に必要な前記空調能力および前記空調能力の適用時間を学習し、前記報酬が最も多くなる前記空調能力および前記適用時間を求めるものである。
【発明の効果】
【0007】
本開示によれば、予測される空調負荷に対して、空調対象空間の温度変動量が小さいほど報酬が増えるように、空調能力を調整する関数の更新が繰り返されることで、必要な空調能力だけでなく、空調能力の適用時間が学習され、報酬が最も多くなる空調能力および適用時間が求まる。そのため、温度変動量が最も小さくなる空調能力に対応する空調制御が適切な長さの時間に空気調和装置によって実行される。その結果、予測された空調負荷が発生したときに、室温が目標値からアンダーシュートまたはオーバシュートしてしまうことを抑制できる。
【図面の簡単な説明】
【0008】
図1】実施の形態1に係る空気調和システムの一構成例を示すブロック図である。
図2図1に示した空気調和装置の一構成例を示す冷媒回路図である。
図3図2に示したコントローラの一構成例を示す機能ブロック図である。
図4図3に示した負荷推定手段によって実行される空調負荷予測方法の一例を示す概念図である。
図5図1に示した情報処理装置の一構成例を示す機能ブロック図である。
図6】実施の形態1に係る学習手段によって実行される、適用時間および空調能力の強化学習を示すイメージ図である。
図7】室内の温度変動量の算出方法を示す図である。
図8】実施の形態1に係る空気調和システムの動作手順の一例を示すフローチャートである。
図9図8に示したステップS3における学習手段の動作手順の一例を示すフローチャートである。
図10】変形例1に係る空気調和システムの構成例を示すブロック図である。
図11】変形例2に係る空気調和システムの構成例を示すブロック図である。
図12】変形例3に係る空気調和システムの構成例を示すブロック図である。
【発明を実施するための形態】
【0009】
本開示の実施の形態について、図面を用いて詳細に説明する。本実施の形態で説明する各種の具体的な設定例は一例であり、記載された設定例に限定されない。また、本開示の実施の形態において、通信とは、無線通信および有線通信のいずれか一方または両方を意味する。本実施の形態において、通信は、無線通信と有線通信とが混在した通信方式であってもよい。通信方式は、例えば、ある区間では無線通信が行われ、別の空間では有線通信が行われるものであってもよい。また、ある装置から他の装置への通信が有線通信で行われ、他の装置からある装置への通信が無線通信で行われるものであってもよい。
【0010】
実施の形態1.
本実施の形態1の空気調和システムの構成を説明する。図1は、実施の形態1に係る空気調和システムの一構成例を示すブロック図である。図1に示すように、空気調和システム1は、空気調和装置2と、情報処理装置3と、データベース40とを有する。空気調和装置2、情報処理装置3およびデータベース40のそれぞれは、互いに他の装置と、ネットワーク50を介して通信接続される。ネットワーク50は、例えば、インターネットである。空気調和装置2、情報処理装置3およびデータベース40のそれぞれは、TCP(Transmission Control Protocol)/IP(Internet Protocol)等の通信規格にしたがって通信する。
【0011】
(空気調和装置2の構成)
図2は、図1に示した空気調和装置の一構成例を示す冷媒回路図である。空気調和装置2は、熱源を生成する熱源側ユニット4と、熱源側ユニット4で生成される熱源を用いて空調対象空間の空気を調和する負荷側ユニット5とを有する。熱源側ユニット4は、圧縮機7、四方弁8、熱源側熱交換器13、膨張弁9および室外ファン10を有する。負荷側ユニット5は、負荷側熱交換器14、室内ファン11、風向調整手段12およびコントローラ30を有する。圧縮機7、熱源側熱交換器13、膨張弁9および負荷側熱交換器14が冷媒配管16で接続され、冷媒が循環する冷媒回路15が構成される。
【0012】
図3は、図2に示したコントローラの一構成例を示す機能ブロック図である。空気調和装置2は、図3に示すように環境検出部20を有する。環境検出部20は、室温検出手段21、湿度検出手段22、人検知手段23、日射量検出手段24、換気量検出手段25および外気温度検出手段26を有する。室温検出手段21、湿度検出手段22、人検知手段23、日射量検出手段24、換気量検出手段25および外気温度検出手段26のそれぞれは、信号線(図示せず)を介してコントローラ30と通信接続される。圧縮機7、四方弁8、膨張弁9、室外ファン10、室内ファン11および風向調整手段12のそれぞれは、信号線(図示せず)を介してコントローラ30と通信接続される。
【0013】
圧縮機7は、冷媒を吸入し、吸入した冷媒を圧縮して高温高圧の冷媒を吐出する。圧縮機7は、例えば、運転周波数を制御することで容量を変化させることができるインバータ圧縮機である。四方弁8は、空気調和装置2の運転モードに対応して、冷媒回路15を循環する冷媒の流通方向を切り替える。運転モードは、例えば、暖房運転、冷房運転および除霜運転である。負荷側ユニット5の運転モードが冷房運転の場合、図2に示す四方弁8の内部は実線に示す流路となる。負荷側ユニット5の運転モードが暖房運転の場合、図2に示す四方弁8の内部は破線に示す流路となる。
【0014】
室外ファン10は、外気を吸い込み、吸い込んだ外気を熱源側熱交換器13に送出する。室外ファン10は、例えば、プロペラファンである。熱源側熱交換器13は、外気と冷媒とを熱交換させる熱交換器である。熱源側熱交換器13は、例えば、伝熱管(図示せず)および複数の放熱フィン(図示せず)を有するフィンアンドチューブ型熱交換器である。膨張弁9は、冷媒を減圧して膨張させる。膨張弁9は、例えば、電子膨張弁である。
【0015】
室内ファン11は、負荷側ユニット5が行う空気調和の空調対象空間である部屋から空気を吸い込み、吸い込んだ空気を負荷側熱交換器14に送出する。室内ファン11は、例えば、クロスフローファンである。負荷側熱交換器14は、室内の空気と冷媒とを熱交換させる熱交換器である。負荷側熱交換器14は、例えば、伝熱管(図示せず)および複数の放熱フィン(図示せず)を有するフィンアンドチューブ型熱交換器である。風向調整手段12は、負荷側熱交換器14において冷媒と熱交換を行った後の空気が負荷側ユニット5から室内に吹き出される吹出口(図示せず)に設けられている。風向調整手段12は、負荷側熱交換器14の吹出口(図示せず)から空気が室内に吹き出される方向を調整する。風向調整手段12は、例えば、フラップである。
【0016】
図2に示すように、室温検出手段21、湿度検出手段22、人検知手段23、日射量検出手段24および換気量検出手段25は、負荷側ユニット5に設けられている。外気温度検出手段26は、熱源側ユニット4に設けられている。室温検出手段21は、空調対象空間の部屋の空気の温度である室温を検出する。湿度検出手段22は、部屋の空気の湿度を検出する。人検知手段23は、部屋にいる人の数を検知する。日射量検出手段24は、部屋の単位時間当たりの日射量を検出する。換気量検出手段25は、部屋の単位時間当たりの換気量を検出する。外気温度検出手段26は、外気温度を検出する。
【0017】
室温検出手段21および外気温度検出手段26は、例えば、サーミスタである。室温検出手段21および外気温度検出手段26のそれぞれは、一定の周期で空気の温度を検出し、検出値をコントローラ30に送信する。人検知手段23は、例えば、赤外線センサである。人検知手段23は、一定の周期で部屋にいる人を赤外線で検知し、赤外線画像のデータをコントローラ30に送信する。湿度検出手段22は、例えば、湿度センサである。湿度センサは、空気中の湿気を吸着する物質と、物質が水分を含むことで変化する電気伝導度を検出する電極とを有する。湿度センサは、空気中の湿気を吸着する物質の電気伝導度を測定することで湿度を検出する。湿度検出手段22は、一定の周期で湿度を検出し、検出した値をコントローラ30に送信する。
【0018】
日射量検出手段24は、例えば、フォトダイオードを用いた照度計である。図2は、説明の便宜上、日射量検出手段24が負荷側ユニット5に設けられている場合を示しているが、日射量検出手段24は、空調対象空間である部屋の床面または窓に設けられている。日射量検出手段24は、ルクス[lx]という単位で表される日射量を検出する。日射量検出手段24は、一定の周期で日射量を検出すると、検出した値をコントローラ30に送信する。換気量検出手段25は、例えば、風速センサである。風速センサは、風速を検出し、検出した風速を風量に換算し、換気量として出力する。図2は、説明の便宜上、換気量検出手段25が負荷側ユニット5に設けられている場合を示しているが、換気量検出手段25は、換気口(図示せず)または換気扇(図示せず)の近くに設けられている。換気量検出手段25は、一定の周期で換気量を検出し、検出した値をコントローラ30に送信する。
【0019】
ここで、空気調和装置2において、運転モードが冷房運転および暖房運転のそれぞれの場合の冷媒の流れを説明する。
【0020】
(冷房運転)
はじめに、図2を参照して、負荷側ユニット5が冷房運転を行う場合の冷媒の流れを説明する。負荷側ユニット5が冷房運転を行う場合、圧縮機7から吐出される冷媒が熱源側熱交換器13に流入するように、四方弁8の内部が実線で示される流路に切り替えられる。低温低圧の冷媒が圧縮機7によって圧縮されることで、高温高圧のガス冷媒が圧縮機7から吐出される。圧縮機7から吐出されたガス冷媒は、四方弁8を経由して、熱源側熱交換器13に流入する。熱源側熱交換器13に流入した冷媒は、熱源側熱交換器13において、外気と熱交換することで凝縮し、低温高圧の液冷媒となって熱源側熱交換器13から流出する。
【0021】
熱源側熱交換器13から流出した液冷媒は、膨張弁9によって減圧され低温低圧の液冷媒になる。低温低圧の液冷媒は、負荷側熱交換器14に流入する。負荷側熱交換器14に流入した冷媒は、負荷側熱交換器14において、室内の空気と熱交換することで蒸発し、低温低圧のガス冷媒となって負荷側熱交換器14から流出する。負荷側熱交換器14において、冷媒が室内の空気から吸熱することで、室内の空気が冷却される。負荷側熱交換器14から流出した冷媒は、四方弁8を介して圧縮機7に吸入される。負荷側ユニット5が冷房運転を行っている間、圧縮機7から吐出される冷媒が熱源側熱交換器13、膨張弁9および負荷側熱交換器14を順に流通した後、圧縮機7に吸引されるまでのサイクルが繰り返される。
【0022】
(暖房運転)
次に、図2を参照して、負荷側ユニット5が暖房運転を行う場合の冷媒の流れを説明する。負荷側ユニット5が暖房運転を行う場合、圧縮機7から吐出される冷媒が負荷側熱交換器14に流入するように、四方弁8の内部が破線で示される流路に切り替えられる。低温低圧の冷媒が圧縮機7によって圧縮されることで、高温高圧のガス冷媒が圧縮機7から吐出される。圧縮機7から吐出された高温高圧のガス冷媒は、四方弁8を経由して、負荷側熱交換器14に流入する。負荷側熱交換器14に流入した冷媒は、負荷側熱交換器14において、室内の空気と熱交換することで凝縮され、高温高圧の液冷媒となって負荷側熱交換器14から流出する。負荷側熱交換器14において、冷媒から室内の空気に放熱することで、室内の空気が暖められる。
【0023】
負荷側熱交換器14から流出した高温高圧の液冷媒は、膨張弁9によって低温低圧の液冷媒になる。低温低圧の液冷媒は、熱源側熱交換器13に流入する。熱源側熱交換器13に流入した冷媒は、熱源側熱交換器13において、外気と熱交換することで蒸発し、低温低圧のガス冷媒となって熱源側熱交換器13から流出する。熱源側熱交換器13から流出した冷媒は、四方弁8を介して圧縮機7に吸入される。負荷側ユニット5が暖房運転を行っている間、圧縮機7から吐出される冷媒が負荷側熱交換器14、膨張弁9および熱源側熱交換器13を順に流通した後、圧縮機7に吸引されるまでのサイクルが繰り返される。
【0024】
このようにして、冷媒が圧縮と膨張とを繰り返しながら冷媒回路15を循環することによって、ヒートポンプが形成される。図2を参照して、負荷側ユニット5が冷房運転および暖房運転を行う場合を説明したが、空気調和装置2は、除湿、加湿、空気清浄または送風などの運転を行って、室内の空気を調和してもよい。
【0025】
(コントローラ30の構成)
次に、図3を参照して、コントローラ30の構成を説明する。コントローラ30は、例えば、マイクロコンピュータである。コントローラ30は、取得手段31と、冷凍サイクル制御手段32と、負荷推定手段と33と、時間を計測するタイマー34とを有する。
【0026】
取得手段31は、環境検出部20に含まれる各検出手段から検出値または赤外線画像のデータを受信する。取得手段31は、室温検出手段21、湿度検出手段22および外気温度検出手段26の検出値を冷凍サイクル制御手段32に送信する。取得手段31は、人検知手段23から赤外線画像のデータを受信すると、赤外線画像から室内の人の有無および人数を判定する。例えば、取得手段31は、赤外線画像から温度を求め、壁面または床面の温度を基準にして、基準の温度よりも温度の高い部分を人と判定する。取得手段31は、室内の温度、湿度、人数、換気量および日射量の情報と外気温度の情報とを含む環境情報を、負荷推定手段33に送信する。
【0027】
また、取得手段31は、一定の周期で冷凍サイクル制御手段32から運転データを取得し、運転データおよび環境情報をデータベース40に送信する。運転データは、空気調和装置2の機器の運転状態を示す情報である。運転データは、例えば、圧縮機7の運転周波数、膨張弁9の開度、四方弁8の流通方向および室外ファン10の回転数を含む情報である。運転データは、空気調和装置2のサーモオンおよびサーモオフの周期と、凝縮温度および蒸発温度の情報とを含んでいてもよい。また、運転データは、ユーザによって入力された指示、設定温度および設定湿度のそれぞれの履歴と、1日における空気調和装置2の運転開始から停止までの継続時間と、空気調和装置2のサーモオンおよびサーモオフのそれぞれの時刻との情報を含んでいてもよい。さらに、負荷側ユニット5において、室内から空気が吸い込まれる吸込口(図示せず)に、吸い込まれる空気の温度を検出する温度センサ(図示せず)が設けられている場合、運転データは、負荷側ユニット5に吸い込まれる空気の温度の情報を含んでいてもよい。
【0028】
冷凍サイクル制御手段32は、空気調和装置2のユーザによって設定された運転モードにしたがって四方弁8を制御する。また、冷凍サイクル制御手段32は、室温検出手段21の検出値が予め設定された設定温度に一致し、湿度検出手段22の検出値が予め設定された設定湿度に一致するように、圧縮機7の運転周波数、膨張弁9の開度および室外ファン10の回転数を制御する。冷凍サイクル制御手段32は、ユーザによって設定された風量にしたがって室内ファン11の回転数を制御し、ユーザによって設定された風向にしたがって風向調整手段12のベーンの方向を制御する。
【0029】
冷凍サイクル制御手段32は、一定の周期で圧縮機7、四方弁8、膨張弁9および室外ファン10の各機器の運転データを取得手段31および負荷推定手段33に送信する。冷凍サイクル制御手段32は、空調能力Qcの最大値Qcmaxおよび適用時間timeXの情報を、負荷推定手段33を介して、情報処理装置3から受信する。冷凍サイクル制御手段32は、適用時間timeXに空調能力Qcを現在の空調能力Qsから増加させて最大値Qcmaxに到達させる空調制御を実行する。例えば、冷凍サイクル制御手段32は、適用時間timeXに空調能力Qcが現在の空調能力Qsから最大値Qcmaxに到達するように、圧縮機7の運転周波数、膨張弁9の開度および室外ファン10の回転数を制御する。
【0030】
負荷推定手段33は、冷凍サイクル制御手段32から受信する運転データを基に空気調和装置2の現在の空調能力Qsを求める。負荷推定手段33は、空気調和装置2の運転データと空調対象空間に関する環境情報とを含む状態変数に基づいて、空調対象空間に発生する空調負荷Qrを予測する。負荷推定手段33は、現在の空調能力Qsおよび予測した空調負荷Qrの情報を、ネットワーク50を介して、情報処理装置3に送信する。図4は、図3に示した負荷推定手段によって実行される空調負荷予測方法の一例を示す概念図である。
【0031】
図4は、空調負荷Qrを予測する学習モデルとして、多層パーセプトロン(MPL:Multilayer perceptron)モデルを用いる場合を示す。多層パーセプトロンは、線形回帰の入力層と出力層との間に隠れ層が設けられ、重みつき和の結果に非線形関数を適用することで、非線形回帰を可能にしたモデルである。負荷推定手段33は、図4に示すように、室内の温度、湿度、人数、換気量および日射量を含む室内環境情報と、外気温度を含む室外環境情報との状態変数を入力として、時間変化に対する空調負荷Qrを推定する。
【0032】
MPLモデルを作成する際、過去の運転データおよび環境情報を用いる。過去の運転データおよび環境情報はデータベース40に記憶されている。MPLモデルを作成する際、過去の運転データのセットを、訓練セットと検証セットとに分割し、検証セットでの精度が最も高くなるように、ハイパーパラメータとして、隠れ層の層数、隠れ層のノード数および正則化パラメータを調整した。その後、調整したパラメータを用いて、学習モデルに過去の運転データの全てのセットを用いて、再度、学習を実行させた。
【0033】
コントローラ30のハードウェア構成例について説明する。図3に示したコントローラ30の各手段の機能がハードウェアで実行される場合、取得手段31、冷凍サイクル制御手段32、負荷推定手段33およびタイマー34は、専用の処理回路で構成される。処理回路は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、または、これらを組み合わせたものである。取得手段31、冷凍サイクル制御手段32、負荷推定手段33およびタイマー34が1つの処理回路で実現されてもよく、これらの手段のそれぞれが別々の処理回路で実現されてもよい。
【0034】
一方、図3に示したコントローラ30の各手段の機能がソフトウェアで実行される場合、コントローラ30は、CPU(Central Processing Unit)等のプロセッサ(図示せず)と、メモリ(図示せず)とを有する構成である。プロセッサ(図示せず)がメモリ(図示せず)に記憶されたプログラムを読み出して実行することによって、取得手段31、冷凍サイクル制御手段32および負荷推定手段33の各手段の機能が実現される。メモリ(図示せず)は、例えば、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable and Programmable ROM)およびEEPROM(Electrically Erasable and Programmable ROM)等の不揮発性の半導体メモリである。
【0035】
なお、本実施の形態1においては、図2を参照し、コントローラ30が負荷側ユニット5に設けられている場合で説明したが、コントローラ30の設置位置は負荷側ユニット5に限定されない。コントローラ30は、熱源側ユニット4に設けられていてもよく、負荷側ユニット5および熱源側ユニット4の両方を除く位置に設けられていてもよい。また、凝縮温度および蒸発温度を検出する温度センサ(図示せず)が空気調和装置2に設けられていてもよい。
【0036】
また、本実施の形態1においては、負荷推定手段33が、MPLモデルを用いて空調負荷Qrを予測する場合で説明したが、空調負荷Qrを予測する方法はMPLモデルを用いる場合に限定されない。
【0037】
また、本実施の形態1においては、取得手段31が外気温度の情報を外気温度検出手段26から取得して負荷推定手段33およびデータベース40に送信する場合で説明したが、外気温度の提供元は外気温度検出手段26に限らない。例えば、空気調和装置2が設置された地域の天気予報の情報を提供する気象情報提供サーバ(図示せず)がネットワーク50に接続される場合、取得手段31は、外気温度の情報を含む気象情報を気象情報提供サーバから取得してもよい。また、気象情報提供サーバ(図示せず)が、空気調和装置2が設置された地域の日射量の予測値を提供してもよい。この場合、取得手段31は、気象情報提供サーバ(図示せず)から日射量の予測値を取得し、取得した日射量の予測値を含む気象情報を負荷推定手段33およびデータベース40に送信する。
【0038】
(データベース40の構成)
次に、データベース40の構成を説明する。データベース40は、情報を記憶する記憶手段(図示せず)と、メモリ管理ユニット(Memory Mangagement Unit)(図示せず)とを有する。メモリ管理ユニット(図示せず)は、記憶手段(図示せず)が記憶する情報を管理するとともに、記憶手段からの情報の読み出しおよび記憶手段への情報の書き込みを行う。記憶手段41は、例えば、SSD(Solid State Drive)またはHDD(Hard Disk Drive)である。
【0039】
データベース40は、過去の運転データおよび環境情報の履歴情報を記憶する。履歴情報は、例えば、予め決められた期間tpdに蓄積された運転データおよび環境情報である。期間tpdは、例えば、1年である。また、データベース40は、機器情報を記憶していてもよい。機器情報は、圧縮機7の定格能力と、冷媒配管16によって接続される熱源側ユニット4および負荷側ユニット5の接続構成と、空気調和装置2から運転データおよび環境情報を受信する周期との情報を含んでいてもよい。
【0040】
(情報処理装置3の構成)
次に、情報処理装置3の構成を説明する。図5は、図1に示した情報処理装置の一構成例を示す機能ブロック図である。情報処理装置3は、例えば、サーバ装置である。情報処理装置3は、記憶手段41と、学習手段42とを有する。学習手段42は、温度変動判定部43と、報酬算出部44と、最適条件設定部45と、更新部46とを有する。記憶手段41は、例えば、SSDまたはHDDである。学習手段42は、プログラムを記憶するメモリ(図示せず)と、プログラムにしたがって処理を実行するプロセッサ(図示せず)とを有する構成である。
【0041】
学習手段42は、予測された空調負荷Qrに対して、空調能力Qcを変化させる時間をパラメータとするトライアル条件を複数生成し、必要な空調能力Qcと空調能力Qcの適用時間timeXとを推定する。具体的には、学習手段42は、空調負荷Qrに対して、空調能力Qcを変化させることによって、室温Trの温度変化量が最小になる適切な運転条件を求める。運転条件は、空調能力Qcに相当する。
【0042】
学習手段42は、例えば、DQN学習またはQ学習によって強化学習を行う。Q学習では、エージェントが、状態sでどのような行動aをとれば行動価値関数(報酬)が最も大きくなるかを学習する。本実施の形態1においては、状態sは空調対象空間の温度であり、行動aはコントローラ30が実行する空気調和装置2の運転条件である。学習手段42は、Q関数Q(s,a)を、式(1)で繰り返すことによって、最適なQ値を求める。Q関数は、空気調和装置2の空調能力Qcを調整する関数である。
Q(s,a)←Q(s,a)+α×[R+γ×maxQ(st+1,at+1)-Q(s,a)] ・・・(1)
【0043】
式(1)において、αは、学習率であり、Q値の更新量を制御するパラメータである。γは、割引率であり、その後に得られる報酬をどの程度考慮するかを制御するパラメータである。Rは、エージェントがst+1に遷移したときに得た報酬である。学習手段42は、例えば、ε-greedy法にしたがって、Q値の最大の行動を選択して報酬を求め、s、a、R、st+1、Q(s,a)を記憶手段41に保存する。Q関数をMPLによってQ-networkで表すと、学習手段42は、誤差関数を求めて、Q-networkの重みを更新する。
【0044】
学習手段42は、予測された空調負荷Qrに基づいて学習期間を決定する。学習手段42は、決定した学習期間において、適用時間timeXおよび空調能力Qcの最大値Qcmaxの変動パラメータのうち、室温Trの温度変動量が最小になる、適用時間timeXおよび空調能力Qcの最大値Qcmaxの組み合わせパターンを求める。
【0045】
図6は、実施の形態1に係る学習手段によって実行される、適用時間および空調能力の強化学習を示すイメージ図である。図6は、運転モードが冷房運転の場合である。図6の上段の3つのグラフの横軸は時間であり、縦軸は空調能力Qcである。図6の下段の3つのグラフの横軸は時間であり、縦軸は予測される室温Trである。図7は、室内の温度変動量の算出方法を示す図である。図7の横軸は時間であり、縦軸は室温の予測変動を示す。
【0046】
適用時間timeXを、空調負荷Qrに対して、空気調和装置2の現在の空調能力Qsから空調能力Qcを変化させて最大値Qcmaxに到達するまでの室内の温度変動を最小にする時間と定義する。温度変動判定部43は、現在の空調能力Qsおよび予測された空調負荷Qrを情報処理装置3から受信すると、空調能力Qcの最大値Qcmaxと適用時間timeXとをパラメータとするトライアル条件を複数生成する。温度変動判定部43は、生成する複数のトライアル条件毎に、現在の空調能力Qsから空調能力Qcを最大値Qcmaxまで連続的に変化させる。
【0047】
温度変動判定部43は、各トライアル条件において、図7に示すように、室温の最高値Trmaxと最低値Trminとを求める。温度変動判定部43は、室内の温度変動量ΔTを、ΔT=|Trmax|+|Trmin|の式を用いて求める。温度変動判定部43は、求めた温度変動量ΔTを記憶手段41に記憶させる。
【0048】
図6は、運転条件が「最大値Qcmax_1=予測された空調負荷Qr」、「最大値Qcmax_2=予測された空調負荷Qrの2倍」および「最大値Qcmax_3=予測された空調負荷Qrの2.5倍」の3つの場合を示す。図6を参照して、温度変動判定部43の動作を説明する。
【0049】
運転条件が空調能力Qcの最大値QcmaxがQcmax_1である場合、温度変動判定部43は、現在の空調能力Qsから空調能力Qcを予め決められた傾きで空調能力Qcが最大値Qcmax_1に到達するまでの時間を適用時間timeX_1とする。温度変動判定部43は、図6の上段左側のグラフに示すように、適用時間timeX_1の半分の時間で空調能力Qcが最大値Qcmax_1に到達するように、空調能力Qcを経時的に大きくさせる。空調能力Qcが最大値Qcmax_1に到達すると、温度変動判定部43は、一旦、サーモオフして、空調能力Qcを下げる。続いて、温度変動判定部43は、最初に設定した傾きに沿って、空調能力Qcを最大値Qmax_1まで変化させる。この空調能力Qcの変化に対応して、温度変動判定部43は、室温Trの変化を予測する。
【0050】
この場合の室温Trの予測変動を、図6の下段左側のグラフに示す。室温Trの予測変動を参照すると、初期段階の傾きに沿った空調能力Qcによる空調制御が行われると、傾きの値が小さいので、空調能力Qcは空調負荷Qrを相殺する能力が低く、室温Trが徐々に室温最高値Trmax_1まで上昇する。サーモオフした後、空調能力Qcを再び大きくする空調制御が行われると、空調能力Qcが空調負荷Qrより大きいので、室温Trが徐々に下がり、室温最低値Trmin_1まで下がる。その後、室温Trが元に戻る。温度変動判定部43は、温度変動量ΔTを、ΔT=|Trmax_1|+|Trmin_1|の式を用いて求める。
【0051】
続いて、温度変動判定部43は、空調能力Qcの最大値QcmaxがQcmax_1である場合と同様にして、空調能力Qcの最大値QcmaxがQcmax_2およびQcmax_3のそれぞれについて、温度変動量ΔTを求める。ただし、図6の例に示すように、空調能力Qcの最大値QcmaxがQcmax_2またはQcmax_3である場合、Qcmax_2およびQcmax_3>空調負荷Qrの関係である。そのため、温度変動判定部43は、空調能力Qcの最大値QcmaxがQcmax_2またはQcmax_3である場合、適用時間timeXを適用時間timeX_1よりも短い時間に設定する。
【0052】
温度変動判定部43は、空調負荷Qrが入力されると、図6を参照して説明したように、適用時間timeXと空調能力Qcとの組み合わせに関して、複数のトライアル条件について温度変動量ΔTを求める。温度変動判定部43は、運転条件として、空調能力Qcの最大値をQcmax_1→Qcmax_2→Qcmax_3→・・・と変化させるが、各最大値Qcmax_j(j=1,2,3,・・・)において、適用時間timeXの値をいろいろ変化させる。図6は、空調能力Qcの最大値QcmaxがQcmax_1~3のそれぞれの運転条件において、1つの適用時間timeXの場合しか示していないが、温度変動判定部43は、適用時間timeX_1をいろいろな値に変化させ、変化させた値毎に室内の温度変動量ΔTを求める。
【0053】
報酬算出部44は、温度変動量ΔTが最小になるように報酬条件を設定する。報酬算出部44は、温度変動量ΔTに対応して報酬を決定する。例えば、温度変動量ΔTが予め決められた閾値Pthより小さい場合、報酬算出部44は、報酬を多くする。一方、温度変動量ΔTが閾値Pth以上である場合、報酬算出部44は、報酬を少なくする。報酬算出部44は、温度変動量ΔTが小さいほど報酬を増やし、温度変動量ΔTが大きいほど報酬を減らすようにしてもよい。
【0054】
最適条件設定部45は、複数のトライアル条件毎の報酬を比較する。最適条件設定部45は、報酬が最大になるトライアル条件を、温度変動量ΔTが最小になる、空調能力Qcの最大値Qcmaxおよび適用時間timeXの組み合わせとして決定する。図6を参照して説明したように、適用時間timeXおよび空調能力Qcの最大値Qcmaxのそれぞれを変動パラメータとしている。空調能力Qcの最大値Qcmaxおよびお適用時間timeXの組み合わせパターンの最適性の判断は、室温Trの変動量である温度変動量ΔTを基準に行われる。最適条件設定部45は、温度変動量ΔTが最も小さくなる、空調能力Qcの最大値Qcmaxと適用時間timeXとの組み合わせパターンを決める。最適条件設定部45は、決定した空調能力Qcの最大値Qcmaxおよび適用時間timeXの組み合わせの情報を、コントローラ30の負荷推定手段33を介して、冷凍サイクル制御手段32に送信する。
【0055】
更新部46は、現在の空調能力Qs、室温Tr、空調負荷Qr、適用時間timeXおよび空調能力Qcの最大値Qcmaxを記憶手段41に保存する。更新部46は、誤差関数を求めて、Q-networkの重みを更新する。
【0056】
図6において、各運転条件の室温最高値Trmaxを比較すると、|Trmax_1|>|Trmax_2|>|Trmax_3|の関係である。また、各運転条件の室温最低値Trminを比較すると、|Trmax_1|<|Trmax_2|<|Trmax_3|の関係である。さらに、各運転条件の適用時間timeXを比較すると、timeX_1>timeX_2>timeX_3の関係である。これは、Qcmax_1<Qcmax_2<Qcmax_3に設定されているからである。空調能力Qcの最大値Qcmaxが小さすぎると、発生する空調負荷Qrに対して空調能力Qcが不十分となり、室温Trが設定温度からアンダーシュートする。一方、空調能力Qcの最大値Qcmaxが大きすぎると、発生する空調負荷Qrに対して空調能力Qcが過剰となり、室温Trが設定温度からオーバシュートする。この問題に対して、本実施の形態1においては、上述したように、報酬算出部44によって温度変動量ΔTが最小になるように報酬条件が設定されているので、適切な空調能力Qcの最大値Qcmaxおよび適用時間timeXの組み合わせが求まる。
【0057】
なお、更新部46は、ネットワーク50を介してデータベース40と通信し、強化学習の結果をデータベース40に記憶させてもよい。この場合の強化学習の結果とは、空調負荷Qrと、報酬が最も多くなる空調能力Qcの最大値Qcmaxおよび適用時間timeXと、温度変動量ΔTとを組み合わせた情報である。学習手段42は、新たに空調負荷Qrが入力されると、空調負荷Qrに対して学習を実行する前に、データベース40と通信し、過去に行った強化学習の結果を参照する。そして、学習手段42は、新たな空調負荷Qrに近似した過去の空調負荷Qrと共にデータベース40に記憶された温度変動量ΔTを読み出し、読み出した温度変動量ΔTを参考値として、新たな空調負荷Qrに対する強化学習に用いてもよい。
【0058】
また、本実施の形態1においては、空気調和装置2に必要な空調能力Qcについて最大値Qcmaxを学習するとともに、報酬が最も多くなる最大値Qcmaxを求める場合で説明したが、必要な空調能力Qcに対応する値は最大値Qcmaxに限らない。例えば、図6の上段に示すグラフにおいて、時間変化に対する空調能力Qcの変化を示す傾きであってもよい。また、図6の上段に示すグラフは、適用時間timeXに発生させるサーモオフの回数が1回の場合を示しているが、サーモオフの回数は1回に限らない。適用時間timeXに発生させるサーモオフの回数は、0回でもよく、2回以上であってもよい。さらに、適用時間timeXにおけるサーモオフの回数を空気調和装置2の運転条件に含め、学習手段42が空調能力Qc、適用時間timeXおよびサーモオフの回数を学習してもよい。
【0059】
(空気調和システム1の動作)
次に、本実施の形態1の空気調和システム1の動作を説明する。図8は、実施の形態1に係る空気調和システムの動作手順の一例を示すフローチャートである。
【0060】
ステップS1において、取得手段31は、冷凍サイクル制御手段32から機器の運転データを取得し、環境検出部20から環境情報を取得する。ステップS2において、負荷推定手段33は、運転データおよび環境情報の状態変数に基づいて、空調負荷Qrを予測する。負荷推定手段33は、現在の空調能力Qsおよび予測した空調負荷Qrの情報を情報処理装置3に送信する。
【0061】
ステップS3において、学習手段42は、現在の空調能力Qsおよび予測される空調負荷Qrの情報をコントローラ30から受信すると、空調負荷Qrに対応する空調能力および適用時間を求める。図9は、図8に示したステップS3における学習手段の動作手順の一例を示すフローチャートである。学習手段42は、空気調和装置2の運転中または空気調和装置2が運転を停止した後に、図9に示すフローにしたがって処理を実行することで、空調負荷Qrに対して、空調能力Qcおよび適用時間timeXを学習する。
【0062】
ステップS11において、温度変動判定部43に空調負荷Qrが入力される。現在の空調能力Qsも温度変動判定部43に入力される。ステップS12において、温度変動判定部43は、空調能力Qcの最大値Qcmax_jに初期値(j=1)を設定する。ステップS13において、温度変動判定部43は、適用時間timeX_kに初期値(k=1)を設定する。
【0063】
ステップS14において、温度変動判定部43は、空調能力Qcの最大値Qcmax_1を運転条件として、変動パラメータである適用時間timeXに適用時間timeX_1を適用した場合について、予測される温度変動量ΔTを求める。ステップS15において、報酬算出部44は、トライアル条件が空調能力Qcの最大値Qcmax_1と適用時間timeX_1との組み合わせパターンの場合の報酬を算出する。
【0064】
ステップS16において、温度変動判定部43は、適用時間timeX_kが適用時間timeX_n(nは2以上の整数)に達しているか否かを判定する。ステップS16の判定の結果、適用時間timeX_kが適用時間timeX_nに達していない場合、温度変動判定部43は、kの値に1を加算した後(ステップS17)、ステップS14の処理に戻る。一方、ステップS16の判定の結果、適用時間timeX_kが適用時間timeX_nに達している場合、温度変動判定部43は、ステップS18の処理に進む。
【0065】
ステップS18において、温度変動判定部43は、空調能力Qcの最大値Qcmax_jが最大値Qcmax_m(mは2以上の整数)に達しているか否かを判定する。ステップS18の判定の結果、空調能力Qcの最大値Qcmax_jが最大値Qcmax_mに達していない場合、温度変動判定部43は、jの値に1を加算した後(ステップS19)、ステップS13の処理に戻る。一方、ステップS18の判定の結果、空調能力Qcの最大値Qcmax_jが最大値Qcmax_mに達している場合、学習手段42は、ステップS20の処理に進む。
【0066】
ステップS20において、最適条件設定部45は、報酬が最大になる、空調能力Qcの最大値Qcmaxおよび適用時間timeXの組み合わせパターンを求める。最適条件設定部45は、求めた空調能力Qcの最大値Qcmaxおよび適用時間timeXの情報を、ネットワーク50およびコントローラ30の負荷推定手段33を介して、冷凍サイクル制御手段32に送信する。
【0067】
ステップS21において、更新部46は、最適条件設定部45によって決定された、空調能力Qcの最大値Qcmaxおよび適用時間timeXの組み合わせの情報を記憶手段41に記憶させる。その際、更新部46は、最適条件設定部45によって決定された、空調能力Qcの最大値Qcmaxおよび適用時間timeXの組み合わせの情報をデータベース40にも記憶させてもよい。
【0068】
図8に示したフローチャートの説明に戻る。図8に示したステップS3の学習処理が終了すると、ステップS4において、冷凍サイクル制御手段32は、空調能力Qcの最大値Qcmaxおよび適用時間timeXの情報を情報処理装置3から受信すると、空調能力Qcの最大値Qcmaxおよび適用時間timeXにしたがって空調制御を実行する。具体的には、冷凍サイクル制御手段32は、適用時間timeXに空調能力Qcを現在の空調能力Qsから増加させて最大値Qcmaxに到達するように、圧縮機7の運転周波数、膨張弁9の開度および室外ファン10の回転数を制御する。
【0069】
このようにして、予測される空調負荷Qrに対して、必要な空調能力Qcおよび空調能力Qcの適用時間timeXが求まる。空調負荷が空調負荷Qrに変動したとき、冷凍サイクル制御手段32が、適用時間timeXに空調能力Qcを現在の空調能力Qsから増加させて最大値Qcmaxに到達するように空調制御を実行する。適用時間timeXに空調能力Qcが徐々に増加して最大値Qcmaxに到達するように空調制御が行われる。そのため、室温Trの変動が抑えられるだけでなく、室温Trが設定温度からアンダーシュートまたはオーバシュートすることが抑制される。
【0070】
図9に示すステップS11~S20を学習手段42が実行する期間が学習期間に相当するが、学習手段42は、予測される空調負荷Qrの大きさに対応して学習期間を決めてもよい。例えば、空調負荷Qrが大きいほど、温度変動判定部43は、トライアル条件の数を増やしてもよい。トライアル条件の数はm×nで表される。整数mおよびnの一方または両方の数が大きいほど、学習期間が長くなる。また、学習手段42は、予測される空調負荷Qrの変動要因に対応して学習期間を決めてもよい。ただし、学習期間は、10分以下であることが望ましい。また、図9に示すフローは、適用時間timeX_1~timeX_nの値が各最大値Qcmax_jで同じ場合を示しているように見えるが、図6を参照して説明したように、適用時間timeX_1~timeX_nの値は最大値Qcmax_j毎に異なっていてもよい。
【0071】
本実施の形態1の空気調和システム1は、空調対象空間を空気調和する空気調和装置2と、空気調和装置2の運転データと空調対象空間に関する環境情報とを含む状態変数に基づいて、空調対象空間に発生する空調負荷Qrを予測する負荷推定手段33と、空気調和装置2の空調能力Qcを調整するQ関数を更新する学習手段42とを有する。学習手段42は、空調負荷Qrに対して空調対象空間の温度変動量ΔTが小さいほど報酬を増やす報酬条件を設定し、報酬条件に基づいて、Q関数の更新を繰り返すことによって空気調和装置2に必要な空調能力Qcおよび空調能力Qcの適用時間timeXを学習し、報酬が最も多くなる空調能力Qcおよび適用時間timeXを求める。
【0072】
本実施の形態1によれば、予測される空調負荷Qrに対して、室内の温度変動量ΔTが小さいほど報酬が増えるようにQ関数の更新が繰り返されることで、必要な空調能力Qcだけでなく、空調能力Qcの適用時間timeXが学習され、報酬が最も多くなる空調能力Qcおよび適用時間timeXが求まる。そのため、温度変動量ΔTが最も小さくなる空調能力Qcに対応する空調制御が適切な長さの適用時間timeXに空気調和装置2によって実行される。その結果、予測された空調負荷Qrが発生したときに、室温Trが設定温度からアンダーシュートまたはオーバシュートすることを抑制できる。そのため、室内に居る人の快適性を維持することができる。
【0073】
従来、空調負荷を急激に変動させる要因が発生すると、室温Trが変動するという問題がある。空調負荷を急激に変動させる要因として、例えば、換気装置(図示せず)による換気量が一時的大きくなること、室内に居る人の数が急に増えること、外気温度が上昇または日射量が突然増加することなどが考えられる。このような空調負荷の急激な変動に対して、本実施の形態1において、負荷推定手段33は、空調対象空間の温度、湿度、人数、換気量および日射量と外気温度とを含む環境情報を状態変数として空調負荷Qrを予測する。そして、学習手段42は、負荷推定手段33によって変動要因に基づいて予測された空調負荷Qrを相殺できる空調能力Qcおよび適用時間timeXを学習する。学習手段42は、学習によって、室温Trの局所的なアンダーシュートおよびオーバシュートが発生しない適切な、空調能力Qcの最大値Qcmaxおよび適用時間timeXを決定する。室内の環境が急激に変動した場合でも、適用時間timeXに空調能力Qcを空調能力Qsから徐々に変化させる空調制御を行うことで、室温Trの変動を早く抑制し、室温Trが設定温度から大きくずれることがない。適切な空調能力に対応する空調制御によって、室内に居る人に快適な空調を実現することができる。
【0074】
なお、本開示の空気調和システムは図1に示した構成の場合に限らない。空気調和システム1は、ネットワーク50に接続される複数の空気調和装置2を有する構成であってもよい。以下に、本開示の空気調和システムの変形例を説明する。
【0075】
(変形例1)
図10は、変形例1に係る空気調和システムの構成例を示すブロック図である。本変形例1の空気調和システム1aは、空気調和装置2aと、情報処理装置3aとを有する。空気調和装置2aおよび情報処理装置3aのそれぞれは、ネットワーク50を介して相互に通信接続される。
【0076】
空気調和装置2aは、図3に示したコントローラ30の替わりに、コントローラ30aを有する。コントローラ30aは、取得手段31および冷凍サイクル制御手段32を有する。情報処理装置3aは、負荷推定手段33と、学習手段42と、記憶手段41を含むデータベース40とを有する。
【0077】
本変形例1の場合、空調負荷Qrの推定処理が情報処理装置3aで実行されるので、空気調和装置2aのコントローラ30aの演算処理の負荷が軽減する。
【0078】
(変形例2)
図11は、変形例2に係る空気調和システムの構成例を示すブロック図である。本変形例2の空気調和システム1bは、空気調和装置2bと、情報処理装置3aと、取得手段31aと、環境検出部20とを有する。情報処理装置3aは変形例1で説明した情報処理装置3aと同一の構成である。空気調和装置2bおよび情報処理装置3aのそれぞれは、ネットワーク50を介して相互に通信接続される。取得手段31aおよび情報処理装置3aのそれぞれは、ネットワーク50を介して相互に通信接続される。
【0079】
空気調和装置2bは、図3に示したコントローラ30の替わりに、コントローラ30bを有する。コントローラ30bは、冷凍サイクル制御手段32を有する。図3に示した室温検出手段21を含む環境検出部20の各検出手段は、検出値または画像データを取得手段31aに送信する。また、室温検出手段21、湿度検出手段22および外気温度検出手段26のそれぞれは検出値を冷凍サイクル制御手段32に送信する。取得手段31aは、ネットワーク50を介して、情報処理装置3aと通信接続される通信装置である。取得手段31aは、例えば、Wi-Fi(登録商標)ルータである。
【0080】
本変形例2の場合、空気調和装置2の運転データおよび環境情報を空気調和装置2bとは別に設けられた通信装置が情報処理装置3aに送信する処理を行うので、空気調和装置2bのコントローラ30bの情報処理の負荷が軽減する。
【0081】
(変形例3)
図12は、変形例3に係る空気調和システムの構成例を示すブロック図である。本変形例3の空気調和システム1cは、複数の空気調和装置2a-1~2a-v(vは2以上の整数)と、空気調和装置2a-1~2a-vを制御する集中コントローラ6とを有する。空気調和装置2a-1~2a-vは、例えば、1つの建物に設置されている。集中コントローラ6は、空気調和装置2a-1~2a-vが設置された建物に設置されているが、別の建物に設置されていてもよい。集中コントローラ6は、変形例1で説明した情報処理装置3aと同一の構成である。空気調和装置2a-1~2a-vのそれぞれは、変形例1で説明した空気調和装置2aと同一の構成である。
【0082】
空気調和装置2a-1~2a-vと集中コントローラ6とは、ネットワーク51を介して通信接続される。ネットワーク51は、例えば、LAN(Local Area Network)である。空気調和装置2a-1~2a-vの各装置の取得手段31は、ネットワーク51の基地局(図示せず)と無線で通信接続される場合、Wi-Fi(登録商標)等の無線通信規格にしたがって接続される。空気調和装置2a-1~2a-vの各装置の取得手段31は、Bluetooth(登録商標)等の近距離無線通信規格にしたがって、ネットワーク51の基地局(図示せず)と通信接続されてもよい。ネットワーク51は、インターネットであってもよく、LANおよびインターネットが組み合わされたものであってもよい。
【0083】
本変形例3によれば、複数の空気調和装置2a-1~2a-vの運転データおよび環境情報が、時間経過に伴って、教師データとして、情報処理装置3aのデータベース40に蓄積される。そのため、学習手段42は、多くの教師データを基に、空調負荷Qrの変動に対して必要な空調能力および適用時間を求める学習モデルを更新できる。その結果、空調負荷Qrの変動に対して、より適切な空調能力および適用時間を求めることができる。
【0084】
以下、本開示の空気調和システムの諸態様を付記としてまとめて記載する。
【0085】
(付記1)
空調対象空間を空気調和する空気調和装置と、
前記空気調和装置の運転データと前記空調対象空間に関する環境情報とを含む状態変数に基づいて、前記空調対象空間に発生する空調負荷を予測する負荷推定手段と、
前記空気調和装置の空調能力を調整する関数を更新する学習手段と、
を有し、
前記学習手段は、
前記空調負荷に対して前記空調対象空間の温度変動量が小さいほど報酬が増える報酬条件を設定し、前記報酬条件に基づいて、前記関数の更新を繰り返すことによって前記空気調和装置に必要な前記空調能力および前記空調能力の適用時間を学習し、前記報酬が最も多くなる前記空調能力および前記適用時間を求める、
空気調和システム。
(付記2)
前記学習手段は、
前記学習を実行することで、前記報酬が最も多くなる前記空調能力の最大値および前記適用時間を求め、前記適用時間に前記空調能力を現在の空調能力から増加させて前記最大値に到達させる空調制御を前記空気調和装置に実行させる、
付記1に記載の空気調和システム。
(付記3)
前記空調対象空間の人数、換気量および日射量と外気温度とを含む前記環境情報を取得し、前記空気調和装置から前記運転データを取得する取得手段と、
過去の前記運転データおよび前記環境情報である履歴情報を記憶するデータベースと、を有し、
前記負荷推定手段は、
前記データベースによって記憶される前記履歴情報と、前記取得手段によって取得された前記環境情報および前記運転データとに基づいて、前記空調負荷を予測する、
付記1または2に記載の空気調和システム。
(付記4)
前記学習手段は、
前記空調負荷に対して、前記空調能力および前記適用時間を変動パラメータとするトライアル条件を複数生成し、複数の前記トライアル条件のうち、前記温度変動量が最小になる、前記空調能力および前記適用時間を求める、
付記1~3のいずれか1つに記載の空気調和システム。
(付記5)
前記学習手段は、
前記空調負荷に基づいて学習期間を決定し、決定した前記学習期間において、前記空調能力および前記適用時間の変動パラメータのうち、前記温度変動量が最小になる、前記空調能力および前記適用時間を求める、
付記1~4のいずれか1つに記載の空気調和システム。
(付記6)
前記学習手段は、前記空気調和装置の運転中または前記空気調和装置が運転を停止した後に、前記空調能力および前記適用時間を学習する、
付記1~5のいずれか1つに記載の空気調和システム。
【符号の説明】
【0086】
1、1a~1c 空気調和システム、2、2a、2a-1~2a-v、2b 空気調和装置、3、3a 情報処理装置、4 熱源側ユニット、5 負荷側ユニット、6 集中コントローラ、7 圧縮機、8 四方弁、9 膨張弁、10 室外ファン、11 室内ファン、12 風向調整手段、13 熱源側熱交換器、14 負荷側熱交換器、15 冷媒回路、16 冷媒配管、20 環境検出部、21 室温検出手段、22 湿度検出手段、23 人検知手段、24 日射量検出手段、25 換気量検出手段、26 外気温度検出手段、30、30a、30b コントローラ、31、31a 取得手段、32 冷凍サイクル制御手段、33 負荷推定手段、34 タイマー、40 データベース、41 記憶手段、42 学習手段、43 温度変動判定部、44 報酬算出部、45 最適条件設定部、46 更新部、50、51 ネットワーク。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12