(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025031561
(43)【公開日】2025-03-07
(54)【発明の名称】コンクリート状態の多元時系列モニタリングデータの補完方法
(51)【国際特許分類】
E02B 7/02 20060101AFI20250228BHJP
G01N 33/38 20060101ALN20250228BHJP
【FI】
E02B7/02 Z
G01N33/38
【審査請求】有
【請求項の数】9
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024111412
(22)【出願日】2024-07-11
(31)【優先権主張番号】202311071771.5
(32)【優先日】2023-08-24
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】523054492
【氏名又は名称】中国長江電力股▲ふん▼有限公司
(71)【出願人】
【識別番号】518012559
【氏名又は名称】河海大学
(74)【代理人】
【識別番号】100095407
【弁理士】
【氏名又は名称】木村 満
(74)【代理人】
【識別番号】100132883
【弁理士】
【氏名又は名称】森川 泰司
(74)【代理人】
【識別番号】100148633
【弁理士】
【氏名又は名称】桜田 圭
(74)【代理人】
【識別番号】100147924
【弁理士】
【氏名又は名称】美恵 英樹
(72)【発明者】
【氏名】唐 暁丹
(72)【発明者】
【氏名】白 治朋
(72)【発明者】
【氏名】王 龍宝
(72)【発明者】
【氏名】趙 新益
(72)【発明者】
【氏名】儲 洪強
(72)【発明者】
【氏名】倉 昊
(72)【発明者】
【氏名】蒋 林華
(57)【要約】 (修正有)
【課題】コンクリート状態の多元時系列モニタリングデータの補完方法
【解決手段】収集された多元生データに対してBox-Cox変換を行うステップと、Box-Cox変換後の多元時系列データで行列D
n,mを構成し、且つ行列D
n,mの列を切断した後に再構成操作を行い、再構成後の新たな行列を、P
n,m*n′とするステップと、再構成後の行列P
n,m*n′中の欠損値を予測し、欠損値を補完し、補完後の行列から行列D
n,mを抽出するステップと、抽出された行列D
n,m中のデータに対して逆変換を行うステップとを含む。本発明は、生データに対して、それが正規分布に従うようにBox-Cox変換を行い、変換後のデータをシーケンス行列に組織し、行列の列を分割することで行列を再構成し、連鎖方程式による多重補完法を用いて再構成行列の欠損値を充填し、多元時系列モニタリングデータの補完を実現する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
コンクリート自動化モニタリングシステムが収集した多元生データに対して、それが正規分布に従うように、Box-Cox変換を行うステップS1と、
Box-Cox変換後の多元時系列データで行列D
n,mを構成し、行列D
n,mの列を切断して再構成操作を行い、再構成後の新たな行列を、P
n,m*n′とするステップS2と、
再構成後の行列P
n,m*n′中の欠損値を予測し、欠損値を補完し、補完後の行列から行列D
n,mを抽出するステップS3と、
抽出された行列D
n,mにおけるデータに対して逆変換を行うことにより、データと観測データとを同一桁にし、最終的に多元時系列データの補完を実現するステップS4と、を含み、
前記ステップS2の具体的な過程は、
Box-Cox変換後の多元時系列データで行列D
n,mを構成するステップS2-1であって、行列の各行は、タイムスタンプ上のデータ記録を表し、行列D
n,mは、
【数1】
で表され、
ここで、第1の列は、タイムスタンプであり、残りの列、すなわち、s
1,s
2,…,s
m-1は、変数である、ステップS2-1と、
行列D
n,mの各列を長さが同一のn′個の短い列ブロックに分割するステップS2-2であって、n′は、自己相関値に基づいて計算され、分割後の行列は、
【数2】
で表され、
再構成後の行列は、D′
n/n′,m*n′=[T
1,T
2,…,T
n′,s
11,s
12,…,s
1n′,…,s
(m-1)1,s
(m-1)2,…,s
(m-1)n′]である、ステップS2-2と、
再構成後の行列D′
n/n′,m*n′をn′回複製し、次にn′個の行列D
n/n′,m*n′を垂直に組み合わせて遅延シーケンス行列
【数3】
を形成するステップS2-3と、
遅延シーケンス行列H
n,m*n′を行ごとに行列D
n,mの後にスプライシングし、遅延行列の各行における繰り返し要素を削除し、新たな遅延シーケンス行列をH′
n,m*(n′-1)とし、行列D
n,mと新たな遅延シーケンス行列とによって新たな行列P
n,m*n′=[D
n,m,H′
n,m*(n′-1)]を構成するステップS2-4と、である、ことを特徴とするコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項2】
前記ステップS1における多元生データは、温度、pH値、抵抗率、塩素イオン濃度、カルシウムイオン濃度、浸透流を含む、ことを特徴とする請求項1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項3】
前記ステップS1の具体的な過程は、
コンクリート自動化モニタリングシステムから多元生データを収集するステップS1-1と、
収集された多元生データに対して、それが正規分布に従うようにBox-Cox変換を行い、変数の時系列次元の回帰特性を保証するステップS1-2であって、その式は、
【数4】
であり、
ここで、x
λ
iは、生データであり、a
iは、変換後のデータであり、nは、データ数であり、λは、変換係数であり、データシーケンス自体によって決定される、ステップS1-2と、
最尤推定を用いてパラメータλの値を推定し、尤度関数L(λ)を確立するステップS1-3であって、その式は、
【数5】
であり、
ここで、
【数6】
は、aの最尤推定を表し、
【数7】
は、シーケンスの平均値を表す、ステップS1-3と、である、ことを特徴とする請求項1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項4】
前記ステップS2-2におけるn′の求解方法は、
ある行における要素が全部欠損することがあるか否かについて、行列D
n,mの各行を観察するA1と、
存在する場合、nのすべての約数を含み、それに対応する商がオリジナル行列の列m以上であるセットSを確立するA2と、
存在しない場合、そのままA4を実行するA3と、
n′は、セットS中の要素であり、新たな列の長さn/n′は、行列D
n,mの列の長さより大きく、すなわち、n/n′>mであり、n′は、
【数8】
を満たし、ここで
【数9】
がxより大きい最小整数を表し、分割後の行列の行数及び列数は、いずれもmより大きいA4と、である、ことを特徴とする請求項1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項5】
前記ステップS3の具体的なステップは、
連鎖方程式による多重補完法を用いて再構成後の行列P中の欠損値を予測し、欠損値を補完するステップS3-1と、
新たな行列P中の欠損値が補完された後、補完後の行列から行列Dn,mを抽出するステップS3-2と、である、ことを特徴とする請求項1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項6】
前記ステップS3-1における連鎖方程式アルゴリズムの具体的なステップは、
行列中の欠損値を推定するステップB1と、
順に1つの変数を選択し、且つその推定値を削除し、削除された推定値の変数を補完モデルの従属変数とし、残りをモデルの独立変数とし、従属変数の特徴に基づいて補完モデルを選択して欠損値を予測するステップB2と、
行列のデータ列を充填し、補完結果で前の推定値を置き換えるステップB3と、
欠損値を含む変数毎に対して、欠損値がいずれも置き換えられるまでB2-B3のステップを繰り返すステップB4と、
補完モデルが収束するまで複数回反復トレーニングするステップB5と、である、ことを特徴とする請求項5に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項7】
前記ステップB1において行列中の欠損値を推定する方法は、収集されたデータの平均値で変数中の欠損値を置き換えることである、ことを特徴とする請求項6に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項8】
前記ステップB2における補完モデルの選択方法は、選択された列の変数のデータ特徴に基づいて補完モデルを選択し、データ間の関係が線形である場合、線形回帰モデルを選択し、線形関数をフィッティングすることで欠損値を推定し、変数データが連続的又は離散的なデータである場合、K近傍モデルを選択し、データ間の類似性に基づいて、最近傍の観測値を用いて欠損値を推定することである、ことを特徴とする請求項6に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【請求項9】
前記ステップS4の具体的なステップは、
抽出された行列D
n,mにおけるデータに対してBox-Coxの逆変換を行うステップS4-1であって、その式は、
【数10】
であり、
ここで、λは、S1-3で求めた最適解である、ステップS4-1と、
逆変換後のデータで構成される行列W
n,mを補完後の行列とするステップS4-2と、である、ことを特徴とする請求項3に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、水利水力発電分野に関し、具体的には、コンクリート状態の多元時系列モニタリングデータの補完方法に関する。
【背景技術】
【0002】
コンクリートは、非常に重要な建築材料として、応用範囲が非常に広い。高層ビルではコンクリートは、地盤を支える役割を果たす。水利分野では、水資源の開発利用に伴い、コンクリートダムは、中国全国にわたっており、コンクリートダムが正常に運転できるか否かは、水利工事のセキュリティに直接関係し、人々の生命財産の安全に影響を与える。コンクリート建築材料の建築時間の増加に伴い、コンクリートモニタリングデータに対して信頼性分析を行うことは、コンクリートの正常状態を把握することに寄与し、それによってビルの安定した安全運転を確保する。しかし、モニタリングシステムの劣化、伝送などの故障問題のため、大量のモニタリングデータの欠損は、現在のコンクリートダムの管理の課題の一つとなっている。モニタリングデータの欠損により、コンクリート状態評価の正確性を低下させる。従って、紛失した多元時系列モニタリングデータを回復することは、コンクリートビルの分析管理の重要な課題となっている。
【0003】
データ補完のキーは、欠損データと収集されたデータとの間にデータ依存性を確立することである。回帰機械学習モデルは、欠損値と他の変数との関係を学習することで欠損値を予測してもよい。しかしながら、複数の変数の全てに欠損データが存在する場合、回帰モデルを直接適用すると多変数データ補完問題を解決することができない。
【0004】
したがって、この問題を解決する新しい技術案が必要である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来技術に存在する欠点を克服するために、コンクリート状態の多元時系列モニタリングデータの補完方法を提供し、主に、生データに対して、それが正規分布に従うようにBox-Cox変換を行い、変換後のデータをシーケンス行列に組織し、行列の列を分割することで行列を再構成し、連鎖方程式による多重補完を用いて再構成行列の欠損値を充填し、多元時系列モニタリングデータの補完を実現する。
【課題を解決するための手段】
【0006】
上記目的を実現するために、本発明は、
コンクリート自動化モニタリングシステムが収集した多元生データに対して、それが正規分布に従うように、Box-Cox変換を行うステップS1と、
Box-Cox変換後の多元時系列データで行列Dn,mを構成し、時間情報によって多元データ間の相互依存性を強化するために且つ行列Dn,mの列を切断して再構成操作を行い、再構成後の新たな行列をPn,m*n′とするステップS2と、
再構成後の行列Pn,m*n′中の欠損値を予測し、欠損値を補完し、補完後の行列から行列Dn,mを抽出するステップS3と、
抽出された行列Dn,mにおけるデータに対して逆変換を行うことにより、データと観測データとを同一桁にし、最終的に多元時系列データの補完を実現するステップS4と、を含むコンクリート状態の多元時系列モニタリングデータの補完方法を提供する。
【0007】
さらに、前記ステップS1における多元生データは、温度、pH値、抵抗率、塩素イオン濃度、カルシウムイオン濃度、浸透流を含む。
【0008】
さらに、前記ステップS1の具体的な過程は、
コンクリート自動化モニタリングシステムから、温度、pH値、抵抗率、塩素イオン濃度、カルシウムイオン濃度、浸透流である合計6つの変数を含む多元生データを収集するステップS1-1であって、システム測定頻度は、15分間である、ステップS1-1と、
収集された多元生データに対して、それが正規分布に従うようにBox-Cox変換を行い、変数の時系列次元の回帰特性を保証するステップS1-2であって、その式は、
【数1】
であり、
ここで、x
λ
iは、生データであり、a
iは、変換後のデータであり、nは、データ数であり、λは、変換係数であり、データシーケンス自体によって決定される、ステップS1-2と、
最尤推定を用いてパラメータλの値を推定し、尤度関数L(λ)を確立するステップS1-3であって、その式は、
【数2】
であり、
ここで、
【数3】
は、aの最尤推定を表し、
【数4】
は、シーケンスの平均値を表す、ステップS1-3と、である。
【0009】
さらに、前記ステップS2の具体的な過程は、
Box-Cox変換後の多元時系列データで行列D
n,mを構成するステップS2-1であって、行列の各行は、タイムスタンプ上のデータ記録を表し、行列D
n,mは、
【数5】
で表され、
ここで、第1の列は、タイムスタンプであり、残りの列、すなわち、s
1,s
2,…,s
m-1は、変数であり、mの値は、7である、ステップS2-1と、
行列における連続的な欠損要素の割合を最小化するために、行列D
n,mの各列を長さが同一のn′個の短い列ブロックに分割するステップS2-2であって、n′は、自己相関値に基づいて計算され、分割後の行列は、
【数6】
で表され、
第2列の変数1、すなわち、s
1を例として、s
1=[s
11,s
12,…,s
1n′]
Tであり、ここで、
【数7】
であり、これらの短い列ブロックが新たな列と見なされかつ水平に組み合わせられて行列を再構成することにより、行列の列関連性を保証し、再構成後の行列は、D′
n/n′,m*n′=[T
1,T
2,…,T
n′,s
11,s
12,…,s
1n′,…,s
(m-1)1,s
(m-1)2,…,s
(m-1)n′]である、ステップS2-2と、
時系列データにおける時間繰り返しパターンを強化するために、再構成後の行列D′
n/n′,m*n′をn′回複製し、次にn′個の行列D
n/n′,m*n′を垂直に組み合わせて遅延シーケンス行列
【数8】
を形成するステップS2-3と、
遅延シーケンス行列H
n,m*n′を行ごとに行列D
n,mの後にスプライシングし、重複する観測値及び欠損値が後続の補完結果に与える影響を避けるために遅延行列の各行における繰り返し要素を削除して、新たな遅延シーケンス行列をH′
n,m*(n′-1)とし、行列D
n,mと新たな遅延シーケンス行列とによって新たな行列P
n,m*n′=[D
n,m,H′
n,m*(n′-1)]を構成するステップS2-4と、である。
【0010】
さらに、前記ステップS2-2でのnの求解方法は、
ある行における要素が全部欠損することがあるか否かについて、行列D
n,mの各行を観察するA1と、
存在する場合、nのすべての約数を含み、それに対応する商がオリジナル行列の列m以上であるセットSを確立するA2と、
存在しない場合、そのままA4を実行するA3と、
n′は、セットS中の要素であり、新たな列の長さn/n′は、行列D
n,mの列の長さより大きく、すなわち、n/n′>mであり、n′は、
【数9】
を満たすべきであり、ここで
【数10】
がxより大きい最小整数を表し、分割後の行列の行数及び列数は、いずれもmより大きいA4と、である。
【0011】
さらに、前記ステップS3の具体的なステップは、
連鎖方程式による多重補完法を用いて再構成後の行列P中の欠損値を予測し、欠損値を補完するステップS3-1と、
新たな行列P中の欠損値が補完された後、補完後の行列から行列Dn,mを抽出するステップS3-2と、である。
【0012】
さらに、前記ステップS3-1における連鎖方程式アルゴリズムの具体的なステップは、
行列中の欠損値を推定するステップB1と、
順に1つの変数を選択し、且つその推定値を削除し、削除された推定値の変数を補完モデルの従属変数とし、残りをモデルの独立変数とし、従属変数の特徴に基づいて適切な補完モデルを選択して欠損値を予測するステップB2と、
行列のデータ列を充填し、補完結果で前の推定値を置き換えるステップB3と、
欠損値を含む変数毎に対して、欠損値がいずれも置き換えられるまでB2-B3のステップを繰り返すステップB4と、
補完モデルが収束するまで複数回反復トレーニングするステップB5と、である。
【0013】
さらに、前記ステップB1において行列における欠損値を推定する方法は、収集されたデータの平均値で変数中の欠損値を置き換えることである。
【0014】
さらに、前記ステップB2における補完モデルの選択方法は、選択された列の変数のデータ特徴に基づいて適切な補完モデルを選択し、データ間の関係が線形である場合、線形回帰モデルを選択し、線形関数をフィッティングすることで欠損値を推定し、変数データが連続的又は離散的なデータである場合、K近傍モデルを選択し、データ間の類似性に基づいて、最近傍の観測値を用いて欠損値を推定することである。
【0015】
さらに、前記ステップS4の具体的なステップは、
抽出された行列D
n,mにおけるデータに対してBox-Coxの逆変換を行うステップS4-1であって、その式は、
【数11】
であり、
ここで、λは、S1-3で求めた最適解である、ステップS4-1と、
逆変換後のデータで構成される行列W
n,mを補完後の行列とするステップS4-2と、である。
【0016】
連鎖方程式方法の多重補完に対して一連の回帰モデルを利用し、且つ前に推定された値を用いて後続の変数を予測することを許容し、これは、多変数データ補完問題を解決することができるが、連鎖方程式は、時系列データの補完のために設計されたものではなく、一般的なデータ補完のために特に設計されたものである。本発明において、連鎖方程式方法におけるデータ間の時間関連性を強化するために、行列を再構成することで時系列データにおける時間繰り返しパターンを強化し、欠損値と観測値との間の関連性を向上させる。
【発明の効果】
【0017】
本発明は、従来技術と比較して、以下の利点を有する。
【0018】
1、Box-Cox変換を利用して、収集された生データを正規分布の変数に変換することにより、連鎖方程式に用いられる補完モデルによる欠損値の推定精度を向上させることができる。
【0019】
2、連鎖方程式は、データ間の時間連結を考慮しないため、補完前に行列を再構成して時系列データの時間繰り返しパターンを強化し、それによって欠損値と観測値との関連性を向上させて補完精度を向上させる。
【0020】
3、コンクリート自動化モニタリング器械は、故障問題により一定期間内に変数データが欠損し、行列を再構成する過程で、行列を列に応じて分割することで各行にいずれも当該変数の観測値があることを保証し、最終的に欠損値を予測する正確さを向上させる。
【図面の簡単な説明】
【0021】
【
図2】行列再構成中に列に応じてオリジナル行列を分割して列ブロックを水平に組み合わせる模式図である。
【発明を実施するための形態】
【0022】
以下、図面及び具体的な実施例を参照して、本発明をさらに説明するが、これらの実施例が本発明を説明するためのものに過ぎず、本発明の範囲を限定するものではなく、本発明を読んだ後、当業者が本発明の様々な等価形態に対して行った修正がいずれも本願の添付の特許請求の範囲に限定された範囲にあることを理解すべきである。
【0023】
図1に示すように、本発明は、以下のステップS1-S4を含むコンクリート状態の多元時系列モニタリングデータの補完方法を提供する。
【0024】
S1:コンクリート自動化モニタリングシステムが収集した温度、pH値、抵抗率、塩素イオン濃度、カルシウムイオン濃度、浸透流を含む多元生データに対して、それが正規分布に従うように、Box-Cox変換を行い、
Box-Cox変換の具体的なステップは、
コンクリート自動化モニタリングシステムから、温度、pH値、抵抗率、塩素イオン濃度、カルシウムイオン濃度、浸透流である合計6つの変数を含む多元生データを収集するステップS1-1であって、システム測定頻度は、15分間である、ステップS1-1と、
収集された多元生データに対して、それが正規分布に従うようにBox-Cox変換を行い、変数の時系列次元の回帰特性を保証するステップS1-2であって、その式は、
【数12】
であり、
ここで、x
λ
iは、生データであり、a
iは、変換後のデータであり、nは、データ数であり、λは、変換係数であり、データシーケンス自体によって決定される、ステップS1-2と、
最尤推定を用いてパラメータλの値を推定し、尤度関数L(λ)を確立するステップS1-3であって、その式は、
【数13】
であり、
ここで、
【数14】
は、aの最尤推定を表し、
【数15】
は、シーケンスの平均値を表す、ステップS1-3と、であり、
上記の全てのステップは、コンピュータによって実行される。
【0025】
S2:変換後の多元時系列データで行列D
n,mを構成し、時間情報を利用して多元データ間の相互依存性を強化するために、まず当該行列の列を切断し、次に再構成操作を行い、再構成後の新たな行列は、P
n,m*n′であり、
図2を参照すると、具体的な過程は、
Box-Cox変換後の多元時系列データで行列D
n,mを構成するステップS2-1であって、行列の各行は、タイムスタンプ上のデータ記録を表し、行列D
n,mは、
【数16】
で表され、
ここで、第1の列は、タイムスタンプであり、残りの列、すなわち、s
1,s
2,…,s
m-1は、変数であり、mの値は、7である、ステップS2-1と、
行列における連続的な欠損要素の割合を最小化するために、行列D
n,mの各列を長さが同一のn′個の短い列ブロックに分割するステップS2-2であって、n′は、自己相関値に基づいて計算され、分割後の行列は、
【数17】
で表され、
第2列の変数1、すなわち、s
1を例として、s
1=[s
11,s
12,…,s
1n′]
Tであり、ここで、
【数18】
であり、これらの短い列ブロックが新たな列と見なされかつ水平に組み合わせられて行列を再構成することにより、行列の列関連性を保証し、再構成後の行列は、D′
n/n′,m*n′=[T
1,T
2,…,T
n′,s
11,s
12,…,s
1n′,…,s
(m-1)1,s
(m-1)2,…,s
(m-1)n′]であり、
n′の求解方法は、
ある行における要素が全部欠損することがあるか否かについて、行列D
n,mの各行を観察するA1と、
存在する場合、nのすべての約数を含み、それに対応する商がオリジナル行列の列m以上であるセットSを確立するA2と、
存在しない場合、そのままA4を実行するA3と、
n′は、セットS中の要素であり、新たな列の長さn/n′は、行列D
n,mの列の長さより大きく、すなわち、n/n′>mであり、n′は、
【数19】
を満たすべきであり、ここで
【数20】
がxより大きい最小整数を表し、分割後の行列の行数及び列数は、いずれもmより大きいA4と、である、ステップS2-2と、
時系列データにおける時間繰り返しパターンを強化するために、再構成後の行列D′
n/n′,m*n′をn′回複製し、次にn′個の行列D
n/n′,m*n′を垂直に組み合わせて遅延シーケンス行列
【数21】
を形成するステップS2-3と、
具体的には
図3に示すように、遅延シーケンス行列H
n,m*n′を行ごとに行列D
n,mの後にスプライシングし、重複する観測値及び欠損値が後続の補完結果に与える影響を避けるために遅延行列の各行における繰り返し要素を削除して、新たな遅延シーケンス行列をH′
n,m*(n′-1)とし、行列D
n,mと新たな遅延シーケンス行列とによって新たな行列P
n,m*n′=[D
n,m,H′
n,m*(n′-1)]を構成するステップS2-4と、であり、
上記の全てのステップは、コンピュータによって実行される。
【0026】
S3:連鎖方程式による多重補完法を用いて再構成後の行列Pn,m*n′における欠損値を予測し、欠損値を補完した後、補完後の行列から行列Dn,mを抽出し、
具体的なステップは、
連鎖方程式による多重補完法を用いて再構成後の行列P中の欠損値を予測し、欠損値を補完するステップS3-1であって、
連鎖方程式アルゴリズムの具体的なステップは、
行列における欠損値を推定するB1であって、
収集されたデータの平均値で変数中の欠損値を置き換える、B1と、
順に1つの変数を選択し、且つその推定値を削除し、削除された推定値の変数を補完モデルの従属変数とし、残りをモデルの独立変数とし、従属変数の特徴に基づいて適切な補完モデルを選択して欠損値を予測するB2であって、
補完モデルの選択方法は、選択された列の変数のデータ特徴に基づいて適切な補完モデルを選択し、データ間の関係が線形である場合、線形回帰モデルを選択し、線形関数をフィッティングすることで欠損値を推定し、変数データが連続的又は離散的なデータである場合、K近傍モデルを選択し、データ間の類似性に基づいて、最近傍の観測値を用いて欠損値を推定することである、B2と、
行列のデータ列を充填し、補完結果で前の推定値を置き換えるB3と、
欠損値を含む変数毎に対して、欠損値がいずれも置き換えられるまでB2-B3のステップを繰り返すB4と、
補完モデルが収束するまで複数回反復トレーニングするB5と、である、ステップS3-1と、
新たな行列P中の欠損値が補完された後、補完後の行列から行列Dn,mを抽出するステップS3-2と、であり、
上記の全てのステップは、コンピュータによって実行される。
【0027】
S4:新たな行列から抽出されたオリジナル行列におけるデータに対してデータ逆変換を行うことにより、データと観測データとを同一桁にし、最終的に多元時系列データの補完を実現し、
逆変換の具体的なステップは、
抽出された行列D
n,mにおけるデータに対してBox-Coxの逆変換を行うステップS4-1であって、その式は、
【数22】
であり、
ここで、λは、S13で求めた最適解である、ステップS4-1と、
逆変換後のデータで構成される行列W
n,mを補完後の行列とするステップS4-2と、であり、
上記の全てのステップは、コンピュータによって実行される。
【0028】
本実施例は、他の外部ネットワーク要素との間で情報の送受信を行う過程において、信号の送受信を実現するためのネットワークインターフェースと、前記プロセッサで実行可能なコンピュータプログラム指令を記憶するためのメモリと、コンピュータプログラム指令を実行する際に、上記コンセンサス方法のステップを実行するためのプロセッサと、を含むコンクリート性状態多元時系列モニタリングデータ補完システムをさらに提供する。
【0029】
本実施例は、コンピュータプログラムが記憶されるコンピュータ記憶媒体をさらに提供し、プロセッサが前記コンピュータプログラムを実行する場合、上記の方法を実現することができる。前記コンピュータ可読媒体は、有形かつ非一時的なものと考えられてもよい。非一時的な有形のコンピュータ可読媒体の非限定的な例は、不揮発性メモリ回路(例えば、フラッシュメモリ回路、消去可能なプログラマブル読み取り専用メモリ回路又はマスク読み取り専用メモリ回路)、揮発性メモリ回路(例えば、スタティックランダムアクセスメモリ回路又はダイナミックランダムアクセスメモリ回路)、磁気記憶媒体(例えば、アナログ又はデジタルテープ又はハードディスクドライブ)、光記憶媒体(例えば、CD、DVD又はブルーレイディスク)等を含む。コンピュータプログラムは、少なくとも1つの非一時的な有形のコンピュータ可読媒体に記憶されたプロセッサ実行可能指令を含む。コンピュータプログラムはさらに、記憶されているデータを含んでもよいし、それに依存してもよい。コンピュータプログラムは、専用コンピュータのハードウェアと対話する基本入力出力システム(BIOS)、専用コンピュータの特定のデバイスと対話するデバイスドライバープログラム、1つ以上のオペレーティングシステム、ユーザアプリケーション、バックグラウンドサービス、バックグラウンドアプリケーションなどを含んでもよい。
【0030】
当業者であれば、本願の実施例が方法、システム又はコンピュータプログラム製品として提供できることを理解すべきである。したがって、本願は、完全なハードウェア実施例、完全なソフトウェア実施例又はソフトウェアとハードウェアとを組み合わせた実施例の形式を採用することができる。そして、本願は、コンピュータ使用可能なプログラムコードを含む1つ以上のコンピュータ使用可能な記憶媒体(磁気ディスクメモリ、CD-ROM、光学メモリなどを含むが、これらに限定されない)に実装されるコンピュータプログラム製品の形式を採用することができる。
【0031】
(付記)
(付記1)
コンクリート自動化モニタリングシステムが収集した多元生データに対して、それが正規分布に従うように、Box-Cox変換を行うステップS1と、
Box-Cox変換後の多元時系列データで行列D
n,mを構成し、行列D
n,mの列を切断して再構成操作を行い、再構成後の新たな行列を、P
n,m*n′とするステップS2と、
再構成後の行列P
n,m*n′中の欠損値を予測し、欠損値を補完し、補完後の行列から行列D
n,mを抽出するステップS3と、
抽出された行列D
n,mにおけるデータに対して逆変換を行うことにより、データと観測データとを同一桁にし、最終的に多元時系列データの補完を実現するステップS4と、を含み、
前記ステップS2の具体的な過程は、
Box-Cox変換後の多元時系列データで行列D
n,mを構成するステップS2-1であって、行列の各行は、タイムスタンプ上のデータ記録を表し、行列D
n,mは、
【数23】
で表され、
ここで、第1の列は、タイムスタンプであり、残りの列、すなわち、s
1,s
2,…,s
m-1は、変数である、ステップS2-1と、
行列D
n,mの各列を長さが同一のn′個の短い列ブロックに分割するステップS2-2であって、n′は、自己相関値に基づいて計算され、分割後の行列は、
【数24】
で表され、
再構成後の行列は、D′
n/n′,m*n′=[T
1,T
2,…,T
n′,s
11,s
12,…,s
1n′,…,s
(m-1)1,s
(m-1)2,…,s
(m-1)n′]である、ステップS2-2と、
再構成後の行列D′
n/n′,m*n′をn′回複製し、次にn′個の行列D
n/n′,m*n′を垂直に組み合わせて遅延シーケンス行列
【数25】
を形成するステップS2-3と、
遅延シーケンス行列H
n,m*n′を行ごとに行列D
n,mの後にスプライシングし、遅延行列の各行における繰り返し要素を削除し、新たな遅延シーケンス行列をH′
n,m*(n′-1)とし、行列D
n,mと新たな遅延シーケンス行列とによって新たな行列P
n,m*n′=[D
n,m,H′
n,m*(n′-1)]を構成するステップS2-4と、である、ことを特徴とするコンクリート状態の多元時系列モニタリングデータの補完方法。
【0032】
(付記2)
前記ステップS1における多元生データは、温度、pH値、抵抗率、塩素イオン濃度、カルシウムイオン濃度、浸透流を含む、ことを特徴とする付記1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0033】
(付記3)
前記ステップS1の具体的な過程は、
コンクリート自動化モニタリングシステムから多元生データを収集するステップS1-1と、
収集された多元生データに対して、それが正規分布に従うようにBox-Cox変換を行い、変数の時系列次元の回帰特性を保証するステップS1-2であって、その式は、
【数26】
であり、
ここで、x
λ
iは、生データであり、a
iは、変換後のデータであり、nは、データ数であり、λは、変換係数であり、データシーケンス自体によって決定される、ステップS1-2と、
最尤推定を用いてパラメータλの値を推定し、尤度関数L(λ)を確立するステップS1-3であって、その式は、
【数27】
であり、
ここで、
【数28】
は、aの最尤推定を表し、
【数29】
は、シーケンスの平均値を表す、ステップS1-3と、である、ことを特徴とする付記1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0034】
(付記4)
前記ステップS2-2におけるn′の求解方法は、
ある行における要素が全部欠損することがあるか否かについて、行列D
n,mの各行を観察するA1と、
存在する場合、nのすべての約数を含み、それに対応する商がオリジナル行列の列m以上であるセットSを確立するA2と、
存在しない場合、そのままA4を実行するA3と、
n′は、セットS中の要素であり、新たな列の長さn/n′は、行列D
n,mの列の長さより大きく、すなわち、n/n′>mであり、n′は、
【数30】
を満たし、ここで
【数31】
がxより大きい最小整数を表し、分割後の行列の行数及び列数は、いずれもmより大きいA4と、である、ことを特徴とする付記1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0035】
(付記5)
前記ステップS3の具体的なステップは、
連鎖方程式による多重補完法を用いて再構成後の行列P中の欠損値を予測し、欠損値を補完するステップS3-1と、
新たな行列P中の欠損値が補完された後、補完後の行列から行列Dn,mを抽出するステップS3-2と、である、ことを特徴とする付記1に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0036】
(付記6)
前記ステップS3-1における連鎖方程式アルゴリズムの具体的なステップは、
行列中の欠損値を推定するステップB1と、
順に1つの変数を選択し、且つその推定値を削除し、削除された推定値の変数を補完モデルの従属変数とし、残りをモデルの独立変数とし、従属変数の特徴に基づいて補完モデルを選択して欠損値を予測するステップB2と、
行列のデータ列を充填し、補完結果で前の推定値を置き換えるステップB3と、
欠損値を含む変数毎に対して、欠損値がいずれも置き換えられるまでB2-B3のステップを繰り返すステップB4と、
補完モデルが収束するまで複数回反復トレーニングするステップB5と、である、ことを特徴とする付記5に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0037】
(付記7)
前記ステップB1において行列中の欠損値を推定する方法は、収集されたデータの平均値で変数中の欠損値を置き換えることである、ことを特徴とする付記6に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0038】
(付記8)
前記ステップB2における補完モデルの選択方法は、選択された列の変数のデータ特徴に基づいて補完モデルを選択し、データ間の関係が線形である場合、線形回帰モデルを選択し、線形関数をフィッティングすることで欠損値を推定し、変数データが連続的又は離散的なデータである場合、K近傍モデルを選択し、データ間の類似性に基づいて、最近傍の観測値を用いて欠損値を推定することである、ことを特徴とする付記6に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【0039】
(付記9)
前記ステップS4の具体的なステップは、
抽出された行列D
n,mにおけるデータに対してBox-Coxの逆変換を行うステップS4-1であって、その式は、
【数32】
であり、
ここで、λは、S1-3で求めた最適解である、ステップS4-1と、
逆変換後のデータで構成される行列W
n,mを補完後の行列とするステップS4-2と、である、ことを特徴とする付記3に記載のコンクリート状態の多元時系列モニタリングデータの補完方法。
【外国語明細書】