IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 生態環境部南京環境科学研究所の特許一覧

特開2024-46580汚染場所の同一媒体のバッチデータに基づく統合統計システムおよび方法
<>
  • 特開-汚染場所の同一媒体のバッチデータに基づく統合統計システムおよび方法 図1
  • 特開-汚染場所の同一媒体のバッチデータに基づく統合統計システムおよび方法 図2
  • 特開-汚染場所の同一媒体のバッチデータに基づく統合統計システムおよび方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024046580
(43)【公開日】2024-04-03
(54)【発明の名称】汚染場所の同一媒体のバッチデータに基づく統合統計システムおよび方法
(51)【国際特許分類】
   G06F 9/448 20180101AFI20240327BHJP
   G06F 9/445 20180101ALI20240327BHJP
【FI】
G06F9/448
G06F9/445 130
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023052527
(22)【出願日】2023-03-29
(11)【特許番号】
(45)【特許公報発行日】2023-10-12
(31)【優先権主張番号】202211169793.0
(32)【優先日】2022-09-22
(33)【優先権主張国・地域又は機関】CN
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
2.WINDOWS
(71)【出願人】
【識別番号】521088468
【氏名又は名称】生態環境部南京環境科学研究所
(74)【代理人】
【識別番号】100216471
【弁理士】
【氏名又は名称】瀬戸 麻希
(72)【発明者】
【氏名】李旭偉
(72)【発明者】
【氏名】▲とう▼紹坡
(72)【発明者】
【氏名】孔令雅
(72)【発明者】
【氏名】謝文逸
(72)【発明者】
【氏名】豆葉枝
(72)【発明者】
【氏名】劉国強
(72)【発明者】
【氏名】王夢傑
(72)【発明者】
【氏名】李勗之
【テーマコード(参考)】
5B376
【Fターム(参考)】
5B376AC23
(57)【要約】      (修正有)
【課題】汚染場所の同一媒体のバッチデータに基づく統合統計システムおよび方法を提供する。
【解決手段】統合統計方法は、汚染場所データを取得するステップS1と、特徴指標を識別および更新するステップS2と、データの集約統合およびデータ統計分析を行うステップS3と、統合統計後の汚染場所データを出力するステップS4と、を含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
テンプレートダウンロードモジュール(101)と、
前記テンプレートダウンロードモジュール(101)は汚染場所データの導入テンプレ
ートを提供するために使用され、テンプレートダウンロードモジュール(101)が提供
する導入テンプレートのフォーマットは複数のワークシートを含むフォームファイルであ
り、
導入モジュール(102)と、
前記導入モジュール(102)は前記導入テンプレートを介して汚染場所データを導入
して一時保存データを得るために使用され、前記一時保存データは、特徴指標、特徴指標
に対応する特徴データを含み、前記一時保存データのフォーマットは複数のワークシート
を含むフォームファイルであり、
データ記憶モジュール(103)と、
前記データ記憶モジュール(103)は前記一時保存データを記憶するために使用され
、前記一時保存データの記憶方式は、特徴指標と特徴データを対応して記憶し、データ記
憶モジュール(103)は3つのリストを介して一時保存データを記憶し、前記3つのリ
ストはそれぞれリスト1、リスト2、リスト3であり、前記リスト1は一時保存データ中
の特徴指標を記憶するために使用され、前記リスト2は特徴指標に対応する特徴データを
記憶するために使用され、前記リスト3は一時保存データ中のワークシートの名称および
ワークシート中の特徴指標を記憶するために使用され、
特徴指標管理モジュール(104)と、
前記特徴指標管理モジュール(104)は標準化特徴指標を決定して与えるために使用
され、前記特徴指標管理モジュール(104)はリスト4と命名されたリストを有し、前
記リスト4は標準化特徴指標を記憶し、
特徴指標調整モジュール(105)と、
前記特徴指標調整モジュール(105)はlist1に記憶された特徴指標に対して重
複・スペース削除操作を行い、重複・スペース削除特徴指標を得て、次に距離類似度アル
ゴリズムを編集して、前記重複・スペース削除特徴指標と前記標準化特徴指標の2つを類
似度指数計算し、計算した類似度指数に基づいて重複・スペース削除特徴指標を更新、保
持または削除し、
データ選択モジュール(106)と、
前記データ選択モジュール(106)は検索欄を提供し、検索欄を通じて検索項を選択
するために使用され、前記検索欄は、未検出指標濾過、データ統計分析という2つの検索
項を含み、
データ計算モジュール(107)と、
前記データ計算モジュール(107)は前記データ選択モジュール(106)が選択し
た検索項およびテンプレートのヘッダに導入された特徴指標の順序を統合して位置決め条
件を得て、位置決め条件を通じて以下のように汚染場所データの集約統合、一括統計分析
を完成し:
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュール(1
05)で処理されたリスト2中の内容が空の特徴データを削除し、次にリスト1、リスト
2、リスト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データと
し、
位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュール(1
05)で処理されたリスト2中の内容が空の特徴データを削除し、リスト1、リスト2、
リスト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、
次にリスト1中の特徴データを一括統計分析して、一括統計データを得て、最後に前記一
括統計データを統合統計後の汚染場所データに統合して、統合統計後の汚染場所データを
得て、
そのうちに、一括統計分析は、平均値、最大値と最小値、分散と標準差を求めることを含
み、
導出モジュール(108)と、
前記導出モジュール(108)は統合統計後の汚染場所データを導出するために使用さ
れ、導出モジュール(108)のデータ出力フォーマットは複数のワークシートを含むフ
ォームファイルであり、
を含むことを特徴とする汚染場所の同一媒体のバッチデータに基づく統合統計システム。
【請求項2】
請求項1に記載の汚染場所の同一媒体のバッチデータに基づく統合統計システムに基づく
汚染場所の同一媒体のバッチデータに基づく統合統計方法であって、
S1、汚染場所データを統合統計システムに導入し、導入後の汚染場所データを前処理し
て対応するデータ構造に記憶し、前記汚染場所データは特徴指標および前記特徴指標に対
応する特徴データを含み、特徴指標は汚染物の検出指標、検出限界、単位を含むステップ
と、
S2、特徴指標の識別および更新:
情報処理装置では、特徴指標管理モジュール(104)によって標準化特徴指標を決定し
て特定し、特徴指標調整モジュール(105)はまずステップS1で記憶された特徴指標
に対して重複・スペース削除操作を行って、重複・スペース削除特徴指標を得て、特徴指
標調整モジュール(105)は次に距離類似度アルゴリズムを編集して前記重複・スペー
ス削除特徴指標と前記標準化特徴指標の2つの類似度指数を計算し、計算した類似度指数
に基づいて重複・スペース削除特徴指標を更新、保持または削除するステップと、
S3、汚染場所データの集約統合と一括統計分析:
情報処理装置では、データ選択モジュール(106)の検索欄を介して検索項を選択し、
データ選択モジュール(106)は前記検索項をデータ計算モジュール(107)に返信
し、
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュール(1
05)で処理したリスト2中の内容が空の特徴データを削除し、次にリスト1、リスト2
、リスト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし

位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュール(1
05)で処理したリスト2中の内容が空の特徴データを削除し、リスト1、リスト2、リ
スト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、次
にリスト1中の特徴データを一括統計分析して一括統計データを得て、最後に前記一括統
計データを統合統計後の汚染場所データに統合して統合統計後の汚染場所データを得て、
一括統計分析は平均値、最大値と最小値、分散と標準差を求めることを含むステップと、
S4、統合統計後の汚染場所データの出力:
情報処理装置では、導出モジュール(108)によって統合統計後の汚染場所データを出
力し、統合統計後の汚染場所データのフォーマットはフォームファイルであるステップと

を含むことを特徴とする汚染場所の同一媒体のバッチデータに基づく統合統計方法。
【請求項3】
前記計算して得られた類似度指数に基づいて重複・スペース削除特徴指標を更新、保持ま
たは削除することは、
両者の類似度指数が90%を超え文字表現が一致している場合、重複・スペース削除特徴
指標を保持して決定後の特徴指標としてマークし、
両者の類似度指数が90%を超え文字表現が一致していない場合、重複・スペース削除特
徴指標を標準化特徴指標に更新して決定後の特徴指標としてマークし、
両者の類似度指数が90%未満である場合、ステップS1で記憶した特徴指標も保持し、
類似度指数計算が終了した後、マークしていない特徴指標および特徴指標に対応する特徴
データを削除することを含む、
ことを特徴とする請求項2に記載の汚染場所の同一媒体のバッチデータに基づく統合統計
方法。
【請求項4】
前記ステップS1は以下のステップを含み:
S1-1、汚染場所データを統合統計システムに導入し、
情報処理装置では、テンプレートダウンロードモジュール(101)を通じて汚染場所デ
ータの導入テンプレートをダウンロードし、次に汚染場所データを汚染場所データ導入テ
ンプレートに記入して、導入可能な汚染場所データを得て、導入モジュール(102)は
ファイル出力ストリームを通じて導入可能な汚染場所データを読み取り、導入可能な汚染
場所データを再分布して一時保存データを得て、データ記憶モジュール(103)のさら
なる処理を待ち、
前記汚染場所データ導入テンプレートおよび一時保存データはいずれも複数のワークシー
トを含むフォームファイルであり、各ワークシートのヘッダは汚染場所データの特徴指標
であり、各前記ヘッダのある列は前記特徴指標に対応する特徴データである、ことを特徴
とする請求項2に記載の汚染場所の同一媒体のバッチデータに基づく統合統計方法。
【請求項5】
前記再分布は行列変換、行統合、列統合である、ことを特徴とする請求項4に記載の汚染
場所の同一媒体のバッチデータに基づく統合統計方法。
【請求項6】
前記ステップS1は以下のステップをさらに含み:
S1-2、前処理後の汚染場所データを記憶し:
情報処理装置では、データ記憶モジュール(103)はまずリスト1、リスト2、リスト
3という3つのリストを作成し、さらに一時保存データ中のワークシートの順序に従って
、各ワークシートの各行データを読み取り、各ワークシート中の特徴指標に対してスペー
ス・重複削除操作を行ってリスト1に格納し、各ワークシート中の特徴指標に対応する特
徴データをリスト2に格納し、各ワークシートの名称およびワークシート中の特徴指標を
リスト3に格納する、ことを特徴とする請求項4に記載の汚染場所の同一媒体のバッチデ
ータに基づく統合統計方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、汚染場所データ処理の技術分野に関し、具体的には汚染場所の同一媒体のバッ
チデータに基づく統合統計システムおよび方法に関する。
【背景技術】
【0002】
空間情報技術の発展に伴い、トレンド分析理論は汚染場所の分野に広く応用され、それに
対応して、汚染場所のマスデータに対する掘削分析需要も大幅に増加し、伝統的な場所環
境データの取得、統合、洗浄、掘削方法はバッチデータの処理要求を満たすことが困難で
ある。
本発明は中国の伝統的な汚染場所情報の統計分析モデルを改善し、汚染場所情報の取得コ
ストを大幅に節約し、情報の全面性を保障するとともに、汚染場所に関するデータの統合
効率と負担単位の分析能力を向上させ、時間と経済コストを節約する。
【発明の概要】
【0003】
本発明が解決しようとする技術的問題は、従来の場所環境データの取得、統合、洗浄およ
び掘削方法はバッチデータの処理要求を満たすことが困難であることである。
本発明の一側面として、本発明は汚染場所の同一媒体のバッチデータに基づく統合統計シ
ステムを提供し、それは以下を含み:
テンプレートダウンロードモジュール、テンプレートダウンロードモジュールは汚染場所
データの導入テンプレートを提供するために使用され、テンプレートダウンロードモジュ
ールが提供する導入テンプレートのフォーマットは複数のワークシートを含むフォームフ
ァイルであり、
導入モジュール、導入モジュールは導入テンプレートを介して汚染場所データを導入して
一時保存データを得るために使用され、一時保存データは、特徴指標、特徴指標に対応す
る特徴データを含み、一時保存データのフォーマットは複数のワークシートを含むフォー
ムファイルであり、
データ記憶モジュール、データ記憶モジュールは一時保存データを記憶するために使用さ
れ、一時保存データの記憶方式は、特徴指標と特徴データを対応して記憶し、データ記憶
モジュールは3つのリストを介して一時保存データを記憶し、3つのリストはそれぞれリ
スト1、リスト2、リスト3であり、リスト1は一時保存データ中の特徴指標を記憶する
ために使用され、リスト2は特徴指標に対応する特徴データを記憶するために使用され、
リスト3は一時保存データ中のワークシートの名称およびワークシート中の特徴指標を記
憶するために使用され、
特徴指標管理モジュール、特徴指標管理モジュールは標準化特徴指標を決定して与えるた
めに使用され、特徴指標管理モジュールはリスト4と命名されたリストを有し、リスト4
は標準化特徴指標を記憶し、
特徴指標調整モジュール、特徴指標調整モジュールはlist1に記憶された特徴指標に
対して重複・スペース削除操作を行い、重複・スペース削除特徴指標を得て、次に距離類
似度アルゴリズムを編集して、重複・スペース削除特徴指標と標準化特徴指標の2つを類
似度指数計算し、計算した類似度指数に基づいて重複・スペース削除特徴指標を更新、保
持または削除し、
データ選択モジュール、データ選択モジュールは検索欄を提供し、検索欄を通じて検索項
を選択するために使用され、検索欄は、未検出指標濾過、データ統計分析という2つの検
索項を含み、
データ計算モジュール、データ計算モジュールはデータ選択モジュールが選択した検索項
およびテンプレートのヘッダに導入された特徴指標の順序を統合して位置決め条件を得て
、位置決め条件を通じて以下のように汚染場所データの集約統合、一括統計分析を完成し

位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュールで処
理されたリスト2中の内容が空の特徴データを削除し、次にリスト1、リスト2、リスト
3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、
位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュールで処
理されたリスト2中の内容が空の特徴データを削除し、リスト1、リスト2、リスト3中
のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、次にリスト
1中の特徴データを一括統計分析して、一括統計データを得て、最後に一括統計データを
統合統計後の汚染場所データに統合して、統合統計後の汚染場所データを得て、
そのうちに、一括統計分析は、平均値、最大値と最小値、分散と標準差を求めることを含
み、
導出モジュール、導出モジュールは統合統計後の汚染場所データを導出するために使用さ
れ、導出モジュールのデータ出力フォーマットは複数のワークシートを含むフォームファ
イルである。
本発明の別の側面として、本発明は、上記の汚染場所の同一媒体のバッチデータに基づく
統合統計システムに基づく汚染場所の同一媒体のバッチデータに基づく統合統計方法をさ
らに提供し、この方法は以下のステップを含み:
S1、汚染場所データを統合統計システムに導入し、導入後の汚染場所データを前処理し
て対応するデータ構造に記憶し、汚染場所データは特徴指標および特徴指標に対応する特
徴データを含み、特徴指標は汚染物の検出指標、検出限界、単位を含み、
S2、特徴指標の識別および更新:
情報処理装置では、特徴指標管理モジュールによって標準化特徴指標を決定して特定し、
特徴指標調整モジュールはまずステップS1で記憶された特徴指標に対して重複・スペー
ス削除操作を行って、重複・スペース削除特徴指標を得て、特徴指標調整モジュールは次
に距離類似度アルゴリズムを編集して重複・スペース削除特徴指標と標準化特徴指標の2
つの類似度指数を計算し、計算した類似度指数に基づいて重複・スペース削除特徴指標を
更新、保持または削除し、
S3、汚染場所データの集約統合と一括統計分析:
情報処理装置では、データ選択モジュールの検索欄を介して検索項を選択し、データ選択
モジュールは検索項をデータ計算モジュールに返信し、
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュールで処
理したリスト2中の内容が空の特徴データを削除し、次にリスト1、リスト2、リスト3
中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、
位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュールで処
理したリスト2中の内容が空の特徴データを削除し、リスト1、リスト2、リスト3中の
データを導入テンプレートに書き込み、統合統計後の汚染場所データとし、次にリスト1
中の特徴データを一括統計分析して一括統計データを得て、最後に一括統計データを統合
統計後の汚染場所データに統合して統合統計後の汚染場所データを得て、
一括統計分析は平均値、最大値と最小値、分散と標準差を求めることを含み、
S4、統合統計後の汚染場所データの出力:
情報処理装置では、導出モジュールによって統合統計後の汚染場所データを出力し、統合
統計後の汚染場所データのフォーマットはフォームファイルである。
本発明の別の側面として、計算して得られた類似度指数に基づいて重複・スペース削除特
徴指標を更新、保持または削除することは、以下の内容を含み:
両者の類似度指数が90%を超え文字表現が一致している場合、重複・スペース削除特徴
指標を保持して決定後の特徴指標としてマークし、
両者の類似度指数が90%を超え文字表現が一致していない場合、重複・スペース削除特
徴指標を標準化特徴指標に更新して決定後の特徴指標としてマークし、
両者の類似度指数が90%未満である場合、ステップS1で記憶した特徴指標も保持し、
類似度指数計算が終了した後、マークしていない特徴指標および特徴指標に対応する特徴
データを削除する。
本発明の別の側面として、ステップS1は以下のステップを含み:
S1-1、汚染場所データを統合統計システムに導入し、
情報処理装置では、テンプレートダウンロードモジュールを通じて汚染場所データの導入
テンプレートをダウンロードし、次に汚染場所データを汚染場所データ導入テンプレート
に記入して、導入可能な汚染場所データを得て、導入モジュールはファイル出力ストリー
ムを通じて導入可能な汚染場所データを読み取り、導入可能な汚染場所データを再分布し
て一時保存データを得て、データ記憶モジュールのさらなる処理を待ち、
汚染場所データ導入テンプレートおよび一時保存データはいずれも複数のワークシートを
含むフォームファイルであり、各ワークシートのヘッダは汚染場所データの特徴指標であ
り、各ヘッダのある列は特徴指標に対応する特徴データである。
本発明の別の側面として、再分布は行列変換、行統合、列統合である。
本発明の別の側面として、ステップS1は以下のステップをさらに含み:
S1-2、前処理後の汚染場所データを記憶し:
情報処理装置では、データ記憶モジュールはまずリスト1、リスト2、リスト3という3
つのリストを作成し、さらに一時保存データ中のワークシートの順序に従って、各ワーク
シートの各行データを読み取り、各ワークシート中の特徴指標に対してスペース・重複削
除操作を行ってリスト1に格納し、各ワークシート中の特徴指標に対応する特徴データを
リスト2に格納し、各ワークシートの名称およびワークシート中の特徴指標をリスト3に
格納する。
【0004】
本発明は以下の有益な効果を有する。
(1)本発明が提供する統合統計方法は単回処理のマスデータは百万レベルであり、単回
のマスデータの処理時間は5秒以内であり、本分野の汚染場所データの手動リスト処理に
2~3日かかる時間と人件費と比較すると、処理速度を大幅に向上させ、汚染場所データ
の整理よび処理プロジェクト全体のために大量の人力、財力と時間を節約することができ
る。
(2)本発明は構造化データの理念を通じて、手動処理量の百倍、さらに千万倍のデータ
量を超える収集データを結合して全体化、統一化とバッチ化の転換モードを行う。分散し
たデータをフォーマットの需要に基づいて統合することで、前期データ処理の時間コスト
を大幅に削減でき、次の汚染特性と傾向をグラフにして分析するための基礎構造を形成し
、汚染物の空間と時間分布傾向を把握し、場所中の汚染物の全体的な変化傾向と汚染原因
分析を判別および掲示する。
【図面の簡単な説明】
【0005】
図1】実施例1の汚染場所の同一媒体のバッチデータに基づく統合統計システムの構造図である。
図2】実施例2の汚染場所の同一媒体のバッチデータに基づく統合統計方法のフローチャートである。
図3】実施例3中のwindowオブジェクトの概略図である。
【0006】
[符号の説明]
101 テンプレートダウンロードモジュール
102 導入モジュール
103 データ記憶モジュール
104 特徴指標管理モジュール
105 特徴指標調整モジュール
106 データ選択モジュール
107 データ計算モジュール
108 導出モジュール
【発明を実施するための形態】
【0007】
用語解釈
距離類似度編集アルゴリズム:距離類似度編集アルゴリズムはLevenshtein距
離類似度編集アルゴリズムとも呼ばれ、Levenshteinは距離を指し、編集距離
とも呼ばれ、2つの文字列間で、1つからもう1つに変換するのに必要な最小編集操作回
数を指す。許可された編集操作は、1つの文字をもう1つの文字に置換し、1つの文字を
挿入し、1つの文字を削除することを含む。Levenshtein距離類似度編集アル
ゴリズムは1965年にロシアの科学者Vladimir levenshteinによ
って最初に発明された。
HSSFWorkbook:HSSFWorkbookはプログラミング言語Javaが
excelファイルを導入するツールクラスであり、HSSFWorkbookの対応す
るツールクラスはorg.apache.poi.hssf.usermodel.HS
SFWorkbookであり、HSSFWorkbook:Exce12003以前(2
003を含む)のバージョンであり、拡張子は.x1sである。
list:listは集合であり、集合はJava APIが提供する一連のクラスであ
り、複数のオブジェクトを動的に保存するために使用できる。アレイと異なり、集合はサ
イズ可変のシーケンスであり、参照タイプであれば要素タイプは限定されない。集合に基
本データタイプを置くことができないが、基本データタイプのパッケージ類を置くことが
できる。集合類はすべて汎型をサポートし、データセキュリティの使用法である。Jav
aリストは集合の一種であり、リスト中の要素は順序付けられており、繰り返しが許可さ
れている。JavaリストはJava listとも呼ばれる。
math関数:math関数はコンピュータープログラミング言語の関数であり、主にデ
ータ演算に応用される。math関数はコンピュータープログラムの一部の問題を解決す
るために適用され得る。
【0008】
実施例1
本実施例は、汚染場所の同一媒体のバッチデータに基づく統合統計システムであり、図1
に示すように、以下を含み:
テンプレートダウンロードモジュール101と、テンプレートダウンロードモジュール1
01は汚染場所データの導入テンプレートを提供するために使用され、テンプレートダウ
ンロードモジュール101が提供する導入テンプレートのフォーマットは複数のワークシ
ート(例えばマイクロソフト社のexcel、以下excelと略称する)を含むフォー
ムファイルである。
本実施例では、excelファイル:Microsoft ExcelはWindows
とApple Macintoshオペレーティングシステムを使用するコンピューター
のためにMicrosoftが作成したスプレッドシートソフトウェアであり、exce
lファイルはMicrosoft Excelフォーマット標準のスプレッドシートファ
イルである。ワークシート:ワークシートはexcelファイル中のsheet部分であ
り、1つのexcelファイルは複数のワークシートを含み得て、ワークシートはexc
elファイルに依存している。
導入モジュール102と、導入モジュール102は導入テンプレートを介して汚染場所デ
ータを導入して一時保存データを得るために使用され、一時保存データは、特徴指標、特
徴指標に対応する特徴データを含み、一時保存データのフォーマットは複数のワークシー
トを含むexcelファイルである。
本実施例では、特徴指標は汚染物の検出指標、検出限界、単位を含み、特徴データは汚染
物の検出濃度値を含み、汚染物はアセトン、2-プロパノール、酢酸ビニル、2-ブタノン
、酢酸エチル、4-メチル-2-ペンタノン、2-ヘキサノン、二硫化炭素、ベンゼン、トル
エン、エチルベンゼン、p-m-キシレン、スチレン、o-キシレン、イソプロピルベンゼ
ン、m-エチルトルエン、1,3,5-トリメチルベンゼン、o-エチルトルエン、1,2,4-
トリメチルベンゼン、12,3-トリメチルベンゼン、m-ジエチルベンゼン、クロロジフ
ルオロメタンを含む。
データ記憶モジュール103と、データ記憶モジュール103は一時保存データを記憶す
るために使用され、一時保存データの記憶方式は、特徴指標と特徴データを対応して記憶
し、データ記憶モジュール103は3つのリストを介して一時保存データを記憶し、3つ
のlistはそれぞれlist1、list2、list3であり、list1は一時保
存データ中の特徴指標を記憶するために使用され、list2は特徴指標に対応する特徴
データを記憶するために使用され、list3は一時保存データ中のワークシートの名称
およびワークシート中の特徴指標を記憶するために使用され、、
特徴指標管理モジュール104と、特徴指標管理モジュール104は標準化特徴指標を決
定して与えるために使用され、特徴指標管理モジュール104は標準化特徴指標が記憶さ
れたlist4を有し、標準化特徴指標は汚染場所の従業員によって決定されてlist
4に導かれて書き込まれ、書き込む方式は、コンピュータープログラムによって書き込ま
れる。
特徴指標調整モジュール105と、特徴指標調整モジュール105はlist1に記憶さ
れた特徴指標に対して重複・スペース削除操作を行い、重複・スペース削除特徴指標を得
て、Levenshtein距離類似度アルゴリズムを編集して、重複・スペース削除特
徴指標と標準化特徴指標の2つを類似度指数計算し、計算した類似度指数に基づいて重複
・スペース削除特徴指標を更新、保持または削除し、
データ選択モジュール106と、データ選択モジュール106は検索欄を提供し、検索欄
を通じて検索項を選択するために使用され、検索欄は、未検出指標濾過、データ統計分析
という2つの検索項を含み、
データ計算モジュール107と、データ計算モジュール107はデータ選択モジュール1
06が選択した検索項およびテンプレートのヘッダに導入された特徴指標の順序を統合し
て位置決め条件を得て、位置決め条件を通じて以下のように汚染場所データの集約統合、
一括統計分析を完成し:
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュール10
5で処理されたlist2中の内容が空の特徴データを削除し、次にlist1、lis
t2、list3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所デー
タとし、
位置決め条件中の検索項がデータ統計分析である場合時、まず特徴指標調整モジュール1
05で処理されたlist2中の内容が空の特徴データを削除し、list1、list
2、list3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データ
とし、次にlist1中の特徴データを一括統計分析し、一括統計データを得て、最後に
一括統計データを統合統計後の汚染場所データに統合して、統合統計後の汚染場所データ
を得て、
一括統計分析は、平均値、最大値と最小値、分散と標準差を求めることを含み、
導出モジュール108と、導出モジュール108は統合統計後の汚染場所データを導出す
るために使用され、導出モジュール108のデータ出力フォーマットは複数のワークシー
トを含むexcelファイルである。
本実施例では、アーキテクチャ技術としてJFrameを使用し、Javaをプログラミ
ング言語として統合統計システムを実現する。ここで、Javaはほとんどのプログラミ
ング言語に共通するいくつかの特徴を持ち、特にインターネットの分散環境のために設計
されている。JavaはC++言語に似た形式や間隔を持っているが、C++言語よりも
使いやすく、プログラミングの際にオブジェクト指向の方法を徹底的に採用している。
JFrameはコンピューター言語JavaのGUIプログラムを指し、JFrameは
画面上のwindowオブジェクトであり、図3に示すように、最大化、最小化、閉じる
ことができる。
本実施例では、一括統計分析は改善されたmath関数に基づいて実現され、具体的な改
善点は、math関数の入力パラメータをstreamフロー形式に変更することである
。その中で、math関数はコンピュータープログラミング言語の関数の一種であり、主
にデータ演算に適用されている。math関数はコンピュータープログラムの一部の問題
を解決するために適用され得る。
改善されたmath関数は以下を含み:
平均値の計算式:list.stream().mapToDouble(BigDeci
mal::doubleValue).average().getAsDouble()、平
均値の計算式は入力パラメータを1組のデータ集合listとし、steamフローのm
aptoDoubleの方法を用いて、データに対してmapマッピングを行い、その後
averageで平均値を求めるインタフェースを呼び出して直接に計算し、最後にge
tAsDoubleの方式で結果をdoubleタイプに直接に変換する。
ここで、list.stream()は集合をストリームに実装することを表し、mapT
oDouble()はデータに対してmapマッピングを行うことを表し、average
()は平均値を求めることを表す。
最大値と最小値の計算式:list.stream().reduce(list.get(
0), BigDecimal::max)、最大値と最小値の計算式はstreamフローで
計算し、reduce方法を呼び出して1組数の最大値と最小値を取得する。
math関数中の分散と標準差の計算方式:まず和を計算し、次に平均値を計算する方式
を用いて、分散と標準差を求める。
上記データ処理関数は従来のmath関数で最大値、最小値、平均値を求める方法と比較
すると、従来のmath関数はコードが優美ではないだけでなく、効率も低く、しかも少
量のデータしか処理できなく、上記関数はstreamフロー計算を結合して処理を行い
、マルチデータ同時処理による解きをサポートし、正解率が100%に達し、計算速度を
極めて向上させ、マスデータ処理に適応し、效率も従来のmath関数の4倍以上になる
。同時に、コードが簡潔で、後期の機能拡張が便利である。
【0009】
実施例2
本実施例は、実施例1の汚染場所の同一媒体のバッチデータに基づく統合統計システムに
基づく汚染場所の同一媒体のバッチデータに基づく統合統計方法を提供し、図2に示すよ
うに、以下のステップを含み:
S1、汚染場所データを統合統計システムに導入し、導入後の汚染場所データを前処理し
て対応するデータ構造に記憶し、汚染場所データは特徴指標および特徴指標に対応する特
徴データを含み、特徴指標は汚染物の検出指標、検出限界、単位を含み、かつ以下のステ
ップを含み:
S1-1、汚染場所データを統合統計システムに導入し、
情報処理装置では、テンプレートダウンロードモジュール101を通じて汚染場所データ
の導入テンプレートをダウンロードし、次に汚染場所データを汚染場所データ導入テンプ
レートに記入して、導入可能な汚染場所データを得て、導入モジュール102はファイル
出力ストリームを通じて導入可能な汚染場所データを読み取り、導入可能な汚染場所デー
タを再分布して一時保存データを得て、データ記憶モジュール103のさらなる処理を待
ち、再分布は行列変換、行統合、列統合であ、本実施例では、一時保存データをHSSF
Workbookに保存し、
汚染場所データ導入テンプレートおよび一時保存データはいずれも複数のワークシートを
含むexcelファイルであり、各ワークシートのヘッダは汚染場所データの特徴指標で
あり、各ヘッダのある列は特徴指標に対応する特徴データであり、
S1-2、前処理後の汚染場所データを記憶し:
情報処理装置では、データ記憶モジュール103はまずlist1、list2、lis
t3という3つのlistを作成し、さらに一時保存データ中のワークシートの順序に従
って、各ワークシートの各行データを読み取り、各ワークシート中の特徴指標に対してス
ペース・重複削除操作を行ってlist1に格納し、各ワークシート中の特徴指標に対応
する特徴データをlist2に格納し、各ワークシートの名称およびワークシート中の特
徴指標をlist3に格納する。
S2、特徴指標識別および更新:
情報処理装置では、特徴指標管理モジュール104によって標準化特徴指標を決定して特
定し、特徴指標調整モジュール105はまずステップS1で記憶された特徴指標に対して
重複・スペース削除操作を行って、重複・スペース削除特徴指標を得て、特徴指標調整モ
ジュール105はLevenshtein距離類似度アルゴリズムを編集して、重複・ス
ペース削除特徴指標と標準化特徴指標の2つの類似度指数を計算し、計算した類似度指数
に基づいて重複・スペース削除特徴指標を更新、保持または削除し、以下の内容を含み:
両者の類似度指数が90%を超え文字表現が一致している場合、重複・スペース削除特徴
指標を保持して決定後の特徴指標としてマークし、
両者の類似度指数が90%を超え文字表現が一致していない場合、重複・スペース削除特
徴指標を標準化特徴指標に更新して決定後の特徴指標としてマークし、
両者の類似度指数が90%未満である場合、ステップS1で記憶した特徴指標も保持する

本実施例では、特徴指標管理モジュール104は標準化特徴指標が記憶されたlist4
を有し、標準化特徴指標は汚染場所従業員によって決定されてlist4に導かれて書き
込まれ、書き込む方式は、コンピュータープログラムによって書き込まれる。
類似度指数計算が終了した後、マークしていない特徴指標および特徴指標に対応する特徴
データを削除し、
S3、汚染場所データの集約統合と一括統計分析:
情報処理装置では、データ選択モジュール106の検索欄を介して検索項を選択し、デー
タ選択モジュール106は検索項をデータ計算モジュール107に返信し、
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュール10
5で処理したlist2中の内容が空の特徴データを削除し、次にlist1、list
2、list3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データ
とし、
位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュール10
5で処理したlist2中の内容が空の特徴データを削除し、list1、list2、
list3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし
、次にlist1中の特徴データを一括統計分析して一括統計データを得て、最後に一括
統計データを統合統計後の汚染場所データに統合して統合統計後の汚染場所データを得て

ここで、一括統計分析は平均値、最大値と最小値、分散と標準差を求めることを含む。
S4、出力統合統計後の汚染場所データ:
情報処理装置では、導出モジュール108によって統合統計後の汚染場所データを出力し
、統合統計後の汚染場所データのフォーマットはexcelファイルである。
図1
図2
図3
【手続補正書】
【提出日】2023-06-20
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
テンプレートダウンロードモジュール(101)と、
前記テンプレートダウンロードモジュール(101)は汚染場所データの導入テンプレ
ートを提供するために使用され、テンプレートダウンロードモジュール(101)が提供
する導入テンプレートのフォーマットは複数のワークシートを含むフォームファイルであ
り、
導入モジュール(102)と、
前記導入モジュール(102)は前記導入テンプレートを介して汚染場所データを導入
して一時保存データを得るために使用され、前記一時保存データは、特徴指標、特徴指標
に対応する特徴データを含み、前記一時保存データのフォーマットは複数のワークシート
を含むフォームファイルであり、
データ記憶モジュール(103)と、
前記データ記憶モジュール(103)は前記一時保存データを記憶するために使用され
、前記一時保存データの記憶方式は、特徴指標と特徴データを対応して記憶し、データ記
憶モジュール(103)は3つのリストを介して一時保存データを記憶し、前記3つのリ
ストはそれぞれリスト1、リスト2、リスト3であり、前記リスト1は一時保存データ中
の特徴指標を記憶するために使用され、前記リスト2は特徴指標に対応する特徴データを
記憶するために使用され、前記リスト3は一時保存データ中のワークシートの名称および
ワークシート中の特徴指標を記憶するために使用され、
特徴指標管理モジュール(104)と、
前記特徴指標管理モジュール(104)は標準化特徴指標を決定して与えるために使用
され、前記特徴指標管理モジュール(104)はリスト4と命名されたリストを有し、前
記リスト4は標準化特徴指標を記憶し、
特徴指標調整モジュール(105)と、
前記特徴指標調整モジュール(105)はリスト1に記憶された特徴指標に対して重複
・スペース削除操作を行い、重複・スペース削除特徴指標を得て、次に距離類似度アルゴ
リズムを編集して、前記重複・スペース削除特徴指標と前記標準化特徴指標の2つを類似
度指数計算し、計算した類似度指数に基づいて重複・スペース削除特徴指標を更新、保持
または削除し、
データ選択モジュール(106)と、
前記データ選択モジュール(106)は検索欄を提供し、検索欄を通じて検索項を選択
するために使用され、前記検索欄は、未検出指標濾過、データ統計分析という2つの検索
項を含み、
データ計算モジュール(107)と、
前記データ計算モジュール(107)は前記データ選択モジュール(106)が選択し
た検索項およびテンプレートのヘッダに導入された特徴指標の順序を統合して位置決め条
件を得て、位置決め条件を通じて以下のように汚染場所データの集約統合、一括統計分析
を完成し:
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュール(1
05)で処理されたリスト2中の内容が空の特徴データを削除し、次にリスト1、リスト
2、リスト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データと
し、
位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュール(1
05)で処理されたリスト2中の内容が空の特徴データを削除し、リスト1、リスト2、
リスト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、
次にリスト1中の特徴指標を一括統計分析して、一括統計データを得て、最後に前記一括
統計データを統合統計後の汚染場所データに統合して、統合統計後の汚染場所データを得
て、
そのうちに、一括統計分析は、平均値、最大値と最小値、分散と標準差を求めることを含
み、
導出モジュール(108)と、
前記導出モジュール(108)は統合統計後の汚染場所データを導出するために使用さ
れ、導出モジュール(108)のデータ出力フォーマットは複数のワークシートを含むフ
ォームファイルであり、
を含むことを特徴とする汚染場所の同一媒体のバッチデータに基づく統合統計システム。
【請求項2】
請求項1に記載の汚染場所の同一媒体のバッチデータに基づく統合統計システムに基づく
汚染場所の同一媒体のバッチデータに基づく統合統計方法であって、
S1、汚染場所データを統合統計システムに導入し、導入後の汚染場所データを前処理し
て対応するデータ構造に記憶し、前記汚染場所データは特徴指標および前記特徴指標に対
応する特徴データを含み、特徴指標は汚染物の検出指標、検出限界、単位を含むステップ
と、
S2、特徴指標の識別および更新:
情報処理装置では、特徴指標管理モジュール(104)によって標準化特徴指標を決定し
て特定し、特徴指標調整モジュール(105)はまずステップS1で記憶された特徴指標
に対して重複・スペース削除操作を行って、重複・スペース削除特徴指標を得て、特徴指
標調整モジュール(105)は次に距離類似度アルゴリズムを編集して前記重複・スペー
ス削除特徴指標と前記標準化特徴指標の2つの類似度指数を計算し、計算した類似度指数
に基づいて重複・スペース削除特徴指標を更新、保持または削除するステップと、
S3、汚染場所データの集約統合と一括統計分析:
情報処理装置では、データ選択モジュール(106)の検索欄を介して検索項を選択し、
データ選択モジュール(106)は前記検索項をデータ計算モジュール(107)に返信
し、
位置決め条件中の検索項が未検出指標濾過である場合、まず特徴指標調整モジュール(1
05)で処理したリスト2中の内容が空の特徴データを削除し、次にリスト1、リスト2
、リスト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし

位置決め条件中の検索項がデータ統計分析である場合、まず特徴指標調整モジュール(1
05)で処理したリスト2中の内容が空の特徴データを削除し、リスト1、リスト2、リ
スト3中のデータを導入テンプレートに書き込み、統合統計後の汚染場所データとし、次
にリスト1中の特徴指標を一括統計分析して一括統計データを得て、最後に前記一括統計
データを統合統計後の汚染場所データに統合して統合統計後の汚染場所データを得て、
一括統計分析は平均値、最大値と最小値、分散と標準差を求めることを含むステップと、
S4、統合統計後の汚染場所データの出力:
情報処理装置では、導出モジュール(108)によって統合統計後の汚染場所データを出
力し、統合統計後の汚染場所データのフォーマットはフォームファイルであるステップと

を含むことを特徴とする汚染場所の同一媒体のバッチデータに基づく統合統計方法。
【請求項3】
前記計算して得られた類似度指数に基づいて重複・スペース削除特徴指標を更新、保持ま
たは削除することは、
両者の類似度指数が90%を超え文字表現が一致している場合、重複・スペース削除特徴
指標を保持して決定後の特徴指標としてマークし、
両者の類似度指数が90%を超え文字表現が一致していない場合、重複・スペース削除特
徴指標を標準化特徴指標に更新して決定後の特徴指標としてマークし、
両者の類似度指数が90%未満である場合、ステップS1で記憶した特徴指標も保持し、
類似度指数計算が終了した後、マークしていない特徴指標および特徴指標に対応する特徴
データを削除することを含む、
ことを特徴とする請求項2に記載の汚染場所の同一媒体のバッチデータに基づく統合統計
方法。
【請求項4】
前記ステップS1は以下のステップを含み:
S1-1、汚染場所データを統合統計システムに導入し、
情報処理装置では、テンプレートダウンロードモジュール(101)を通じて汚染場所デ
ータの導入テンプレートをダウンロードし、次に汚染場所データを汚染場所データ導入テ
ンプレートに記入して、導入可能な汚染場所データを得て、導入モジュール(102)は
ファイル出力ストリームを通じて導入可能な汚染場所データを読み取り、導入可能な汚染
場所データを再分布して一時保存データを得て、データ記憶モジュール(103)のさら
なる処理を待ち、
前記汚染場所データ導入テンプレートおよび一時保存データはいずれも複数のワークシー
トを含むフォームファイルであり、各ワークシートのヘッダは汚染場所データの特徴指標
であり、各前記ヘッダのある列は前記特徴指標に対応する特徴データである、ことを特徴
とする請求項2に記載の汚染場所の同一媒体のバッチデータに基づく統合統計方法。
【請求項5】
前記再分布は行列変換、行統合、列統合である、ことを特徴とする請求項4に記載の汚染
場所の同一媒体のバッチデータに基づく統合統計方法。
【請求項6】
前記ステップS1は以下のステップをさらに含み:
S1-2、前処理後の汚染場所データを記憶し:
情報処理装置では、データ記憶モジュール(103)はまずリスト1、リスト2、リスト
3という3つのリストを作成し、さらに一時保存データ中のワークシートの順序に従って
、各ワークシートの各行データを読み取り、各ワークシート中の特徴指標に対してスペー
ス・重複削除操作を行ってリスト1に格納し、各ワークシート中の特徴指標に対応する特
徴データをリスト2に格納し、各ワークシートの名称およびワークシート中の特徴指標を
リスト3に格納する、ことを特徴とする請求項4に記載の汚染場所の同一媒体のバッチデ
ータに基づく統合統計方法。