特開2023-156984 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 新日鐵住金株式会社の特許一覧

特開2023-156984処理装置、処理方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023156984

(43)【公開日】2023-10-25

(54)【発明の名称】処理装置、処理方法、およびプログラム

(51)【国際特許分類】

G06F 17/16 20060101AFI20231018BHJP

G06F 17/15 20060101ALI20231018BHJP

【ＦＩ】

G06F17/16 P

G06F17/15

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

(21)【出願番号】P 2023032833

(22)【出願日】2023-03-03

(31)【優先権主張番号】P 2022066411

(32)【優先日】2022-04-13

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】000006655

【氏名又は名称】日本製鉄株式会社

(74)【代理人】

【識別番号】100090273

【弁理士】

【氏名又は名称】國分孝悦

(72)【発明者】

【氏名】福島寿和

(72)【発明者】

【氏名】中川淳一

(72)【発明者】

【氏名】川野秀一

【テーマコード（参考）】

5B056

【Ｆターム（参考）】

5B056BB23

5B056BB38

(57)【要約】

【課題】複数の母集団において影響因子により影響を受ける被影響因子を同時に特定するための指標を算出することができるようにする。
【解決手段】処理装置１００は、複数の母集団における標本データから共通影響因子のデータおよび非共通影響因子（固有影響因子）のデータを抽出して、共通影響因子行列Ｘ^mおよび固有影響因子行列Ｚ^mを作成し、共通影響因子行列Ｘ^mおよび固有影響因子行列Ｚ^mを用いてスパース正則化を適用した回帰分析を実行することにより、共通影響因子行列Ｘ^mに対する回帰係数行列Ｂ^mおよび固有影響因子行列Ｚ^mに対する回帰係数行列Ｃ^mを算出する。
【選択図】図１

【特許請求の範囲】

【請求項1】

複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す回帰式における回帰係数を算出する処理を実行する処理装置であって、
前記複数の影響因子のデータと、前記少なくとも１つの被影響因子のデータと、をそれぞれが含む複数の標本データとして、複数の母集団のそれぞれにおける複数の標本データを取得する標本データ取得手段と、
前記複数の標本データのうち、前記複数の母集団の全てに存在する前記影響因子である共通影響因子のデータを抽出することと、前記複数の標本データのうち、前記共通影響因子と異なる前記影響因子である非共通影響因子のデータを抽出することと、を実行する標本データ抽出手段と、
前記被影響因子のデータと、前記共通影響因子のデータと、前記非共通影響因子のデータと、を用いて、スパース正則化を適用した回帰分析を実行することにより、第１回帰式における第１回帰係数を前記回帰係数として算出する第１回帰係数算出手段と、
を有し、
前記第１回帰式の説明変数は、前記共通影響因子と、前記非共通影響因子と、を含み、
前記第１回帰式の目的変数は、前記被影響因子を含み、
前記第１回帰式は、前記共通影響因子の値を要素とする共通影響因子行列と、当該共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、前記非共通影響因子の値を要素とする非共通影響因子行列と、当該非共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、を別々の項として含み、
前記第１回帰係数算出手段は、前記第１回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、前記共通影響因子に対する前記第１回帰係数のスパース正則化項と、前記非共通影響因子に対する前記第１回帰係数のスパース正則化項と、を含むコスト関数を用いて、前記第１回帰式における前記第１回帰係数を算出する、処理装置。

【請求項2】

前記共通影響因子に対する前記第１回帰係数のスパース正則化項は、グループＬａｓｓｏによるスパース正則化項であり、
前記非共通影響因子に対する前記第１回帰係数のスパース正則化項は、Ｌａｓｓｏによるスパース正則化項である、請求項１に記載の処理装置。

【請求項3】

前記非共通影響因子は、前記複数の母集団のうち、１つの前記母集団にしか存在しない固有の前記影響因子である固有影響因子を含む、請求項１に記載の処理装置。

【請求項4】

前記被影響因子は、複数あり、
前記第１回帰式は、多変量回帰式である、請求項１に記載の処理装置。

【請求項5】

前記第１回帰係数算出手段により算出された前記第１回帰係数に基づいて、前記被影響因子に影響を与える前記影響因子を特定する影響因子特定手段を更に有する、請求項１～４の何れか１項に記載の処理装置。

【請求項6】

前記標本データを用いた回帰分析を行うことにより、前記影響因子特定手段により特定された前記影響因子と、前記被影響因子との関係を表す第２回帰式における第２回帰係数を前記回帰係数として算出する第２回帰係数算出手段を有する、請求項５に記載の処理装置。

【請求項7】

前記第２回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、Ｌ２正則化項と、を含むコスト関数を用いて、前記第２回帰式における前記第２回帰係数を算出する、請求項６に記載の処理装置。

【請求項8】

前記標本データ取得手段は、前記複数の標本データを用いて再標本化を行うことにより、前記複数の母集団に対する前記標本データを含み、且つ、前記複数の母集団に対する前記標本データとしてそれぞれ複数の前記標本データを含む標本データセットを複数作成し、
前記標本データ抽出手段は、前記標本データセットに含まれる複数の前記標本データから前記共通影響因子のデータおよび前記非共通影響因子のデータを抽出することを、複数の前記標本データセットのそれぞれに対して行い、
前記第１回帰係数算出手段は、１つの前記標本データセットから前記標本データ抽出手段により抽出された前記共通影響因子のデータおよび前記非共通影響因子のデータを用いて前記第１回帰係数を算出することを、複数の前記標本データセットのそれぞれについて行うことにより、前記第１回帰式における前記第１回帰係数として複数通りの前記第１回帰係数を算出し、
前記影響因子特定手段は、前記複数通りの第１回帰係数に基づいて、前記被影響因子に影響を与える前記影響因子を特定する、請求項５に記載の処理装置。

【請求項9】

請求項１～４の何れか１項に記載の処理装置で算出された前記回帰係数を回帰係数とする回帰式を用いて前記被影響因子の値を算出する処理を実行する処理装置であって、
前記複数の影響因子のうち少なくとも２つの影響因子のデータを含む評価用データを取得する評価用データ取得手段と、
前記評価用データから、前記共通影響因子のデータを抽出することと、前記評価用データから、前記非共通影響因子のデータを抽出することと、を実行する評価用データ抽出手段と、
前記評価用データ抽出手段により抽出された前記共通影響因子のデータと、前記評価用データから前記評価用データ抽出手段により抽出された前記非共通影響因子のデータと、請求項１～４の何れか１項に記載の処理装置で算出された前記回帰係数を回帰係数とする回帰式と、に基づいて、前記被影響因子の値を算出する被影響因子算出手段と、
を有する、処理装置。

【請求項10】

前記母集団は、処理プロセスであり、
前記複数の処理プロセスにおける前記複数の影響因子の組み合わせは相互に異なり、
前記影響因子は、前記処理プロセスで処理する際に前記処理プロセスにおける処理に用いられる因子であり、
前記被影響因子は、前記影響因子を用いて前記処理プロセスで処理されることにより得られる因子である、請求項１～４の何れか１項に記載の処理装置。

【請求項11】

前記処理プロセスは、特定物質を含む被処理水に存在する微生物群を用いて前記被処理水を処理する処理プロセスであり、
前記影響因子は、前記微生物群の量に関する因子であり、
前記被影響因子は、前記特定物質の量の変化速度に関する因子である、請求項１０に記載の処理装置。

【請求項12】

複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す回帰式における回帰係数を算出する処理を実行する処理方法であって、
前記複数の影響因子のデータと、前記少なくとも１つの被影響因子のデータと、をそれぞれが含む複数の標本データとして、複数の母集団のそれぞれにおける複数の標本データを取得する標本データ取得工程と、
前記複数の標本データのうち、前記複数の母集団の全てに存在する前記影響因子である共通影響因子のデータを抽出することと、前記複数の標本データのうち、前記共通影響因子と異なる前記影響因子である非共通影響因子のデータを抽出することと、を実行する標本データ抽出工程と、
前記被影響因子のデータと、前記共通影響因子のデータと、前記非共通影響因子のデータと、を用いて、スパース正則化を適用した回帰分析を実行することにより、第１回帰式における第１回帰係数を前記回帰係数として算出する第１回帰係数算出工程と、
を有し、
前記第１回帰式の説明変数は、前記共通影響因子と、前記非共通影響因子と、を含み、
前記第１回帰式の目的変数は、前記被影響因子を含み、
前記第１回帰式は、前記共通影響因子の値を要素とする共通影響因子行列と、当該共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、前記非共通影響因子の値を要素とする非共通影響因子行列と、当該非共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列とを含む項と、を別々の項として含み、
前記第１回帰係数算出工程では、前記第１回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、前記共通影響因子に対する前記第１回帰係数のスパース正則化項と、前記非共通影響因子に対する前記第１回帰係数のスパース正則化項と、を含むコスト関数を用いて、前記第１回帰式における前記第１回帰係数を算出する、処理方法。

【請求項13】

前記第１回帰係数算出工程により算出された前記第１回帰係数に基づいて、前記被影響因子に影響を与える前記影響因子を特定する影響因子特定工程を更に有する、請求項１２に記載の処理方法。

【請求項14】

請求項１２または１３に記載の処理方法で算出された前記回帰係数を回帰係数とする回帰式を用いて前記被影響因子の値を算出する処理を実行する処理方法であって、
前記複数の影響因子のうち少なくとも２つの影響因子のデータを含む評価用データを取得する評価用データ取得工程と、
前記評価用データから、前記共通影響因子のデータを抽出することと、前記評価用データから、前記非共通影響因子のデータを抽出することと、を実行する評価用データ抽出工程と、
前記評価用データ抽出工程により抽出された前記共通影響因子のデータと、前記評価用データから前記評価用データ抽出工程により抽出された前記非共通影響因子のデータと、請求項１２または１３に記載の処理方法で算出された前記回帰係数を回帰係数とする回帰式と、に基づいて、前記被影響因子の値を算出する被影響因子算出工程と、
を有する、処理方法。

【請求項15】

請求項１～４の何れか１項に記載の処理装置の各手段としてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、処理装置、処理方法、およびプログラムに関し、特に、影響因子と被影響因子との関係を回帰分析より求めるために用いて好適なものである。

【背景技術】

【0002】

影響因子と被影響因子との関係を回帰分析より求めることが行われている。特許文献１には、コークス炉排水（安水）に含まれる特定物質の量の変化に影響を与える微生物群を特定する技術が開示されている。特許文献１では、微生物群の含有量を説明変数とし、特定物質の量の変化速度を目的変数とする回帰式の回帰係数を、罰則付き回帰分析を行うことにより算出する。このようにして算出された回帰係数のうち、０（零）でない回帰係数に対応する微生物群を、特定物質の量の変化に関わる微生物群として特定する。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２０－３６５７９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１に記載の技術における回帰式は、同一の水処理プロセスにおいて、微生物群の含有量（説明変数）と、特定物質の量の変化速度（目的変数）との関係を定める式である。従って、１つの水処理プロセスごとに回帰分析（回帰係数の算出）を行う必要がある。よって、複数の水処理プロセスにおいて特定物質の量の変化に関わる微生物群を同時に特定することができない。このことは、水処理プロセスに限らず、複数の母集団において影響因子により影響を受ける被影響因子を特定する場合においても共通して存在する課題である。

【0005】

本発明は、以上のような問題点に鑑みてなされたものであり、複数の母集団において影響因子により影響を受ける被影響因子を同時に特定するための指標を算出することができるようにすることを目的とする。

【課題を解決するための手段】

【0006】

本発明の処理装置は、複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す回帰式における回帰係数を算出する処理を実行する処理装置であって、前記複数の影響因子のデータと、前記少なくとも１つの被影響因子のデータと、をそれぞれが含む複数の標本データとして、複数の母集団のそれぞれにおける複数の標本データを取得する標本データ取得手段と、前記複数の標本データのうち、前記複数の母集団の全てに存在する前記影響因子である共通影響因子のデータを抽出することと、前記複数の標本データのうち、前記共通影響因子と異なる前記影響因子である非共通影響因子のデータを抽出することと、を実行する標本データ抽出手段と、前記被影響因子のデータと、前記共通影響因子のデータと、前記非共通影響因子のデータと、を用いて、スパース正則化を適用した回帰分析を実行することにより、第１回帰式における第１回帰係数を前記回帰係数として算出する第１回帰係数算出手段と、を有し、前記第１回帰式の説明変数は、前記共通影響因子と、前記非共通影響因子と、を含み、前記第１回帰式の目的変数は、前記被影響因子を含み、前記第１回帰式は、前記共通影響因子の値を要素とする共通影響因子行列と、当該共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、前記非共通影響因子の値を要素とする非共通影響因子行列と、当該非共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、を別々の項として含み、前記第１回帰係数算出手段は、前記第１回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、前記共通影響因子に対する前記第１回帰係数のスパース正則化項と、前記非共通影響因子に対する前記第１回帰係数のスパース正則化項と、を含むコスト関数を用いて、前記第１回帰式における前記第１回帰係数を算出する。

【0007】

本発明の処理方法は、複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す回帰式における回帰係数を算出する処理を実行する処理方法であって前記複数の影響因子のデータと、前記少なくとも１つの被影響因子のデータと、をそれぞれが含む複数の標本データとして、複数の母集団のそれぞれにおける複数の標本データを取得する標本データ取得工程と、前記複数の標本データのうち、前記複数の母集団の全てに存在する前記影響因子である共通影響因子のデータを抽出することと、前記複数の標本データのうち、前記共通影響因子と異なる前記影響因子である非共通影響因子のデータを抽出することと、を実行する標本データ抽出工程と、前記被影響因子のデータと、前記共通影響因子のデータと、前記非共通影響因子のデータと、を用いて、スパース正則化を適用した回帰分析を実行することにより、第１回帰式における第１回帰係数を前記回帰係数として算出する第１回帰係数算出工程と、を有し、前記第１回帰式の説明変数は、前記共通影響因子と、前記非共通影響因子と、を含み、前記第１回帰式の目的変数は、前記被影響因子を含み、前記第１回帰式は、前記共通影響因子の値を要素とする共通影響因子行列と、当該共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、前記非共通影響因子の値を要素とする非共通影響因子行列と、当該非共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列とを含む項と、を別々の項として含み、前記第１回帰係数算出工程では、前記第１回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、前記共通影響因子に対する前記第１回帰係数のスパース正則化項と、前記非共通影響因子に対する前記第１回帰係数のスパース正則化項と、を含むコスト関数を用いて、前記第１回帰式における前記第１回帰係数を算出する。

【0008】

本発明のプログラムは、前記処理装置の各手段としてコンピュータを機能させる。

【発明の効果】

【0009】

本発明によれば、複数の母集団において影響因子により影響を受ける被影響因子を同時に特定するための指標を算出することができる。

【図面の簡単な説明】

【0010】

【図1】第１実施形態の処理装置の機能的な構成の一例を示す図である。

【図2】第１実施形態の標本データ取得部、標本データ抽出部、第１回帰係数算出部、影響因子特定部、および特定影響因子出力部による処理方法の一例を説明するフローチャートである。

【図3】第１～第４実施形態の評価用データ取得部、評価用データ抽出部、被影響因子算出部、および被影響因子出力部による処理方法の一例を説明するフローチャートである。

【図4】複数の母集団のそれぞれに含まれる標本データの一例を示す図である。

【図5】標本データに対する処理方法の一例を説明する図である。

【図6】共通影響因子および固有影響因子から、被影響因子に影響を与える影響因子が特定されることを概念的に示す図である。

【図7】第２～第４実施形態の処理装置の機能的な構成の一例を示す図である。

【図8】第２～第４実施形態の標本データ取得部、標本データ抽出部、第１回帰係数算出部、影響因子特定部、特定影響因子出力部、および第２回帰係数算出部による処理方法の一例を説明するフローチャートである。

【図9】複数の標本データを用いて再標本化を行う手法の一例を説明する図である。

【図10】複数の標本データセットを用いて特定影響因子を特定する手法の一例を説明する図である。

【図11】生物処理装置の構成の一例を示す図である。

【図12】運転日数一日当たりの亜硝酸生成速度と運転日数との関係の第１の例を示す図である。

【図13】運転日数一日当たりのチオシアン除去速度と運転日数との関係の第１の例を示す図である。

【図14】運転日数一日当たりのフェノール除去速度と運転日数との関係の第１の例を示す図である。

【図15】運転日数一日当たりのチオ硫酸除去速度と運転日数との関係の第１の例を示す図である。

【図16】運転日数一日当たりの亜硝酸生成速度と運転日数との関係の第２の例を示す図である。

【図17】運転日数一日当たりのチオシアン除去速度と運転日数との関係の第２の例を示す図である。

【図18】運転日数一日当たりのフェノール除去速度と運転日数との関係の第２の例を示す図である。

【図19】運転日数一日当たりのチオ硫酸除去速度と運転日数との関係の第２の例を示す図である。

【発明を実施するための形態】

【0011】

以下、図面を参照しながら、本発明の実施形態を説明する。
（第１実施形態）
まず、第１実施形態を説明する。
図１は、第１実施形態の処理装置１００の機能的な構成の一例を示す図である。処理装置１００のハードウェアは、例えば、プロセッサ、主記憶装置、補助記憶装置、および入出力装置を備える情報処理装置、または専用のハードウェアを用いることにより実現される。

【0012】

図１において、処理装置１００は、標本データ取得部１１０と、標本データ抽出部１２０と、第１回帰係数算出部１３０と、影響因子特定部１４０と、特定影響因子出力部１５０と、評価用データ取得部１６０と、評価用データ抽出部１７０と、被影響因子算出部１８０と、被影響因子出力部１９０と、備える。図２は、標本データ取得部１１０、標本データ抽出部１２０、第１回帰係数算出部１３０、影響因子特定部１４０、および特定影響因子出力部１５０による処理方法の一例を説明するフローチャートである。図３は、評価用データ取得部１６０、評価用データ抽出部１７０、被影響因子算出部１８０、および被影響因子出力部１９０による処理方法の一例を説明するフローチャートである。以下に、図２および図３のフローチャートを参照しながら、本実施形態の処理方法を、図１に示す処理装置１００が有する機能の一例と共に説明する。

【0013】

［標本データ採取工程（Ｓ２０１）］
標本データ採取工程では、複数の母集団ｍのそれぞれから、複数の標本データを採取する（ｍは１以上Ｍ以下の整数であり、Ｍは２以上の整数である）。
図４は、複数の母集団ｍのそれぞれに含まれる標本データ（ｙ^m ₁，ｆ^m ₁），・・・，（ｙ^m _nm，ｆ^m _nm）の一例を示す図である。なお、ｙ^m _nm，ｆ^m _nmの「^m _nm」は、各図において、ｎ_mの上にｍが付されている記号に対応する。なお、このような表記は、「^m _nm」以外の記号（例えば「¹ _n1」等）および「ｙ」、「ｆ」以外の記号（例えば後述する図５の「ｘ」等）においても同じである。

【0014】

図４において、ｆ^m ₁は、母集団ｍの１番目の影響因子ベクトルであり、ｆ^m _1,1，・・・，ｆ^m _1,sを要素とする行ベクトルである（ｆ^m ₁∈Ｒ^1×s（ｓは２以上の整数））。ｆ^m _nmは、母集団ｍのｎ_m番目の影響因子ベクトルであり、ｆ^m _nm,1，・・・，ｆ^m _nm,sを要素とする行ベクトルである（ｆ^m _nm∈Ｒ^1×s（ｓは２以上の整数））。なお、Ｒは実数全体であることを示す（このことは他の記載においても同じである）。影響因子ベクトルｆ^m _nmの各要素ｆ^m _nm,1，・・・，ｆ^m _nm,sは、影響因子の値である。ここで、「ｆ」に対して上付きで付している記号「ｍ」は、母集団ｍに属することを示す。このように各記号に対して上付きで付している記号は、当該記号が示すデータが属する母集団を示す。「ｆ」に対して下付きで付している記号「ｎ_m，１」、「ｎ_m，ｓ」は、それぞれ、ｎ_m行１列、ｎ_m行ｓ列の値であることを示す。このように各記号に対して下付きで付している記号において「，」の前の値は、当該記号が示すデータを格納する行列（ベクトル）の行数に対応し、「，」の後の値は、当該記号が示すデータを格納する行列（ベクトル）の列数に対応する。

【0015】

また、図４において、ｙ^m ₁は、母集団ｍの１番目の被影響因子ベクトルであり、ｙ^m _1,1，・・・，ｙ^m _1,qを要素とする行ベクトルである（ｆ^m ₁∈Ｒ^1×q（ｑは１以上の整数））。ｙ^m _nmは、母集団ｍのｎ_m番目の被影響因子ベクトルであり、ｙ^m _nm,1，・・・，ｙ^m _nm,qを要素とする行ベクトルであり、ｙ^m _nm,1，・・・，ｙ^m _nm,qを要素とする行ベクトルである（ｙ^m _nm∈Ｒ^1×q（ｑは１以上の整数））。被影響因子ベクトルｙ^m _nmの各要素ｙ^m _nm,1，・・・，ｙ^m _nm,qは、被影響因子の値である。被影響因子ベクトルｙ^m _nmに含まれる被影響因子の値は、影響因子ベクトルｆ^m _nmに含まれる影響因子の値によって影響を受ける被影響因子の値である。

【0016】

本実施形態では、影響因子ベクトルｙ¹ ₁，・・・，ｙ^M _nMと、当該影響因子ベクトルに対応して採取される被影響因子ベクトルｆ¹ ₁，・・・，ｆ^M _nMとの組が１つの標本データである場合を例示する。図４において、（ｙ^m _nm，ｆ^m _nm）は、母集団ｍのｎ_m番目の標本データである。

【0017】

図４に示す例では、母集団ｍの数がＭであり、各母集団１，・・・，ｍ，・・・，Ｍには、それぞれｎ₁個，・・・，ｎ_m個，・・・，ｎ_M個の標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）が含まれる。ここで、ｎ₁，・・・，ｎ_m，・・・，ｎ_Mは、それぞれ２以上の整数であり、相互に同じ値であっても異なる値であってもよい。即ち、各母集団１，・・・，ｍ，・・・，Ｍに含まれる標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）の数は、同じであっても異なっていてもよい。ｎ₁，・・・，ｎ_m，・・・，ｎ_Mは、例えば、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）が採取されたタイミング（日時）に対応する。

【0018】

このように母集団１～Ｍには、影響因子と、当該影響因子によって影響を受ける被影響因子とが含まれる。各母集団１～Ｍに含まれる影響因子の組み合わせは相互に異なるものとする。本実施形態では、各母集団１～Ｍに含まれる影響因子には、他の母集団には存在しない影響因子が含まれ、且つ、全ての母集団１～Ｍに共通して存在する影響因子が含まれる場合を例示する。以下の説明では、母集団１～Ｍを代表する変数をｍとする。

【0019】

後述する実施例では、母集団ｍのそれぞれは、被処理水を生物学的に処理する処理プロセスである。また、影響因子は、処理プロセスに存在し、当該処理プロセスにおける処理に用いられる微生物群の量に関する因子である。また、被影響因子は、処理前後における特定物質の量の変化速度（特定物質の量の変化）に関する因子である。被処理水は、当該被処理水に存在する微生物を用いることにより処理され、当該被処理水における特定物質の量が変化（減少または増加）する。即ち、処理前後における特定物質の量の変化速度は、処理プロセスに存在する微生物群に影響を受ける。母集団ｍのそれぞれが被処理水を生物学的に処理する処理プロセスである場合、本実施形態では、各処理プロセス（母集団ｍ）には、他の処理プロセスには存在しない微生物群（影響因子）が含まれ、且つ、全ての処理プロセス（母集団ｍ）には当該全ての処理プロセスに共通して存在する微生物群が含まれるものとする。ここで、微生物群は、或る形質または遺伝子型に基づいて分類される微生物集団を指し、例えば、属、種、亜種が挙げられるが、これらに限定されない。当該遺伝子型としては単に微生物のゲノムの塩基配列も含み物とする。微生物群の数は、例えば、１００種類以上１００万種類以下であっても、１０００以上１万種類以下であってもよい。

【0020】

処理プロセスは、被処理水を生物学的に処理する処理プロセスに限定されない。例えば、処理プロセスは、製品の製造プロセスであってもよい。例えば、処理プロセスは、熱延コイルの製造プロセスであってもよい。この場合、影響因子は、例えば、被圧延材に対して操作量として用いられる物理量（例えば、仕上圧延機の圧下量、冷却スプレーの冷却水の流量、加熱装置の電力量、被圧延材の搬送速度）である。また、被影響因子は、熱延コイルの品質（例えば、引張強度）である。即ち、被圧延材に対して操作量として用いられる物理量によって熱延コイルの品質は影響を受ける。母集団ｍのそれぞれが製造プロセスである場合、本実施形態では、各製造プロセス（母集団ｍ）には、他の製造プロセスには存在しない種類の物理量（影響因子）が含まれ、且つ、全ての製造プロセス（母集団ｍ）には、当該製造プロセスに共通して存在する同種の物理量が含まれるものとする。
以上のように母集団ｍが処理プロセスである場合、影響因子は、当該処理プロセスで処理される際に用いられる因子であればよく、処理プロセスで処理する際に、被影響因子の特性を決定する状態因子（処理プロセスにおいてその属性（量など）を制御できない制御不能因子）であっても、処理プロセスにおいてその属性を制御可能な制御可能因子であってもよい。

【0021】

また、母集団ｍは、処理プロセスに限定されない。例えば、母集団ｍは、人間であってもよい。この場合、影響因子は、例えば、人間の各種の遺伝子の数に関する因子である。また、被影響因子は、人間の特定の疾患に対する検査項目に関する因子である。即ち、人間の遺伝子によって特定の疾患に対する検査項目の値は影響を受ける。母集団ｍのそれぞれが人間である場合、本実施形態では、各人間（母集団ｍ）には、他の人間には存在しない遺伝子が含まれ、且つ、全ての人間（母集団ｍ）には、当該人間に共通して存在する同種の遺伝子が含まれるものとする。

【0022】

影響因子の値は、例えば、観測値（測定値等）および計算値のうちの少なくとも一方を含む。被影響因子の値も、影響因子の値と同様に、例えば、観測値（測定値等）および計算値のうちの少なくとも一方を含む。

【0023】

標本データ採取工程では、母集団ｍから、ｓ種類の影響因子の値ｆ^m _1,1，・・・，ｆ^m _1,s，・・・，ｆ^m _nm,1，・・・，ｆ^m _nm,s（ｓ×ｎ_m個の影響因子の値）を採取することを、全ての母集団１～Ｍのそれぞれに対して実施する。また、母集団ｍから、ｑ種類の被影響因子の値ｙ^m _1,1，・・・，ｙ^m _1,q，・・・，ｙ^m _nm,1，・・・，ｙ^m _nm,q（q×ｎ_m個の被影響因子の値）を採取することを、全ての母集団１～Ｍのそれぞれに対して実施される。なお、影響因子および被影響因子のうち、母集団ｍ（ｍ＝１～Ｍ）に存在しない種類の因子の値は、０（零）であるものとする。

【0024】

以上のようにして、ｓ種類の影響因子の値ｆ^m _1,1，・・・，ｆ^m _1,s，・・・，ｆ^m _nm,1，・・・，ｆ^m _nm,s（ｍ＝１～Ｍ）と、当該影響因子によって影響を受けるｑ種類の被影響因子の値ｙ^m _1,1，・・・，ｙ^m _1,q，・・・，ｙ^m _nm,1，・・・，ｙ^m _nm,q（ｍ＝１～Ｍ）との組が採取される。これらの影響因子および被影響因子の値から、標本データ（ｙ¹ ₁，f¹ ₁）～（ｙ¹ _n1，f¹ _n1），・・・，（ｙ^m ₁，f^m ₁）～（ｙ^m _nm，f^m _nm），・・・，（ｙ^M ₁，f^M ₁）～（ｙ^M _nM，f^M _nM）が得られる。

【0025】

［標本データ取得工程（Ｓ２０２）、標本データ取得部１１０］
標本データ取得部１１０は、標本データ採取工程で採取された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を取得する。標本データの取得形態として、例えば、外部装置からの送信、オペレータによるユーザインターフェースに対する標本データの入力操作、および可搬型記憶媒体からの読み出しのうち、少なくとも１つが採用される。

【0026】

なお、標本データ取得部１１０は、ｓ種類の影響因子の値ｆ^m _1,1，・・・，ｆ^m _1,s，・・・，ｆ^m _nm,1，・・・，ｆ^m _nm,s（ｍ＝１～Ｍ）と、ｑ種類の被影響因子の値ｙ^m _1,1，・・・，ｙ^m _1,q，・・・，ｙ^m _nm,1，・・・，ｙ^m _nm,q（ｍ＝１～Ｍ）との組を取得して、標本データ（ｙ¹ ₁，f¹ ₁）～（ｙ¹ _n1，f¹ _n1），・・・，（ｙ^m ₁，f^m ₁）～（ｙ^m _nm，f^m _nm），・・・，（ｙ^M ₁，f^M ₁）～（ｙ^M _nM，f^M _nM）を作成してもよい。

【0027】

図５は、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）に対する処理方法の一例を説明する図である。
本実施形態では、標本データ取得部１１０は、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）から、ｓ種類の影響因子の値ｆ^m _1,1，・・・，ｆ^m _1,s，・・・，ｆ^m _nm,1，・・・，ｆ^m _nm,sを要素とする影響因子ベクトルｆ^m ₁，・・・，ｆ^m _nmを抽出することを、全ての母集団１～Ｍ（ｍ＝１～Ｍ）のそれぞれについて実施する。なお、影響因子ベクトルｆ^m ₁，・・・，ｆ^m _nm（ｍ＝１～Ｍ）の同一の列には同種の影響因子の値が格納されている。

【0028】

そして、標本データ取得部１１０は、影響因子ベクトルｆ^m ₁，・・・，ｆ^m _nmを第１行，・・・，第ｎ_m行に格納する影響因子行列Ｆ^mを作成する。これにより、Ｍ個の影響因子行列Ｆ¹～Ｆ^Mが作成される。図５の「母集団ｍの標本データ」の欄には、１つの影響因子行列Ｆ^mを例示する。影響因子行列Ｆ^mは、ｎ_m行ｓ列の行列である（Ｆ^m∈Ｒ^nm×s）。なお、図５の「母集団ｍの標本データ」の欄において影響因子行列Ｆ^mの破線で囲んだ領域を示すｆ^m ₁、ｆ^m _nmは、それぞれ、図４に示す（ｙ^m ₁,ｆ^m ₁）、（ｙ^m _nm,ｆ^m _nm）のｆ^m ₁、ｆ^m _nmに対応する。

【0029】

標本データ取得部１１０は、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）から、ｑ種類の被影響因子の値ｙ^m _1,1，・・・，ｙ^m _1,q，・・・，ｙ^m _nm,1，・・・，ｙ^m _nm,qを要素とする被影響因子ベクトルｙ^m ₁，・・・，ｙ^m _nmを抽出することを、全ての母集団１～Ｍ（ｍ＝１～Ｍ）のそれぞれについて実施する。なお、被影響因子ベクトルｙ^m ₁，・・・，ｙ^m _nm（ｍ＝１～Ｍ）の同一列には同種の被影響因子の値が格納されている。

【0030】

そして、標本データ取得部１１０は、被影響因子ベクトルｙ^m ₁，・・・，ｙ^m _nmを第１行，・・・，第ｎ_m行に格納する被影響因子行列Ｙ^mを作成することを、全ての母集団１～Ｍ（ｍ＝１～Ｍ）のそれぞれについて実施する。これにより、Ｍ個の被影響因子行列Ｙ¹～Ｙ^Mが作成される。図５の「母集団ｍの標本データ」の欄には、１つの被影響因子行列Ｙ^mを例示する。被影響因子行列Ｙ^mは、ｎ_m行ｑ列の行列である（Ｙ^m∈Ｒ^nm×q）。なお、図５の「母集団ｍの標本データ」の欄において被影響因子行列Ｙ^mの破線で囲んだ領域を示すｙ^m ₁、ｙ^m _nmは、それぞれ、図４に示す（ｙ^m ₁,ｆ^m ₁）、（ｙ^m _nm,ｆ^m _nm）のｙ^m ₁、ｙ^m _nmに対応する。

【0031】

ここで、被影響因子行列Ｙ^mに格納される被影響因子の値ｙ^m _1,1，・・・，ｙ^m _1,q，・・・，ｙ^m _nm,1，・・・，ｙ^m _nm,qは、影響因子行列Ｆ^mにおいて当該被影響因子の値が格納される行と同じ行に格納される影響因子の値ｆ^m _1,1，・・・，ｆ^m _1,s，・・・，ｆ^m _nm,1，・・・ｆ^m _nm,sに対応する値であることを示す。
以上のように、標本データ取得部１１０は、Ｍ個の被影響因子行列Ｙ^m（Ｙ^m∈Ｒ^nm×q、ｍ＝１～Ｍ）と、Ｍ個の影響因子行列Ｆ^m（Ｆ^m∈Ｒ^nm×s、ｍ＝１～Ｍ）とを作成する。

【0032】

［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］
標本データ抽出部１２０は、標本データ取得部１１０により取得された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）のうち、複数の母集団１～Ｍの全てに存在する影響因子である共通影響因子のデータを抽出する。

【0033】

また、標本データ抽出部１２０は、標本データ取得部１１０により取得された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）のうち、共通影響因子とは異なる影響因子である非共通影響因子のデータを抽出する。本実施形態では、標本データ抽出部１２０が、複数の母集団１～Ｍのうち、１つの母集団に固有の種類の影響因子（当該母集団にしか存在しない種類の影響因子）である固有影響因子のみを、非共通影響因子として抽出する場合を例示する。

【0034】

前述したように各母集団１～Ｍにおける影響因子ベクトルｆ^m ₁，・・・，ｆ^m _nm（ｍ＝１～Ｍ）の同一の列には同種の影響因子の値が格納され、各母集団１～Ｍにおける影響因子ベクトルｆ^m ₁，・・・，ｆ^m _nm（ｍ＝１～Ｍ）は、影響因子行列Ｆ^m（ｍ＝１～Ｍ）の第１行，・・・，第ｎ_m行に格納される。そこで、本実施形態では、標本データ抽出部１２０は、影響因子行列Ｆ^mの列のうち、全ての母集団１～Ｍに共通して存在する共通影響因子の値が格納されている列の値を抽出して列ベクトルＦ^m _gとすることを、全ての母集団１～Ｍに共通して存在するｐ種類の影響因子のそれぞれについて実施する（ｐ＜ｓ、ｇ＝１～ｐ）。これにより、ｐ個の列ベクトルＦ^m _g（ｇ＝１～ｐ）が作成される。

【0035】

ここで、共通影響因子を示す記号をｘとする。具体的には図５の「列ベクトルＦ_g ^m」の欄に示すように、影響因子行列Ｆ^mの列のうち、全ての母集団１～Ｍに共通して存在する共通影響因子の値が格納されている第ｇ列の値からなる列ベクトルをＦ_g ^m（＝（ｆ^m _1,g，・・・，ｆ^m _nm,g）^T）とする。なお、Ｔは転置行列であることを示す（このことは他の式でも同じである）。この列ベクトルＦ_g ^mを列ベクトルＸ_g ^mと表記すると共に、この列ベクトルＦ_g ^mの要素ｆ^m _1,g，・・・，ｆ^m _nm,gを、ｘ^m _1,g，・・・，ｘ^m _nm,gと表記する（図５の「列ベクトルＦ_g ^m」の欄を参照）。ここでは、全ての母集団１～Ｍに共通して存在する共通影響因子がｐ種類あるものとしている。従って、このような共通影響因子の値を要素とする列ベクトルＸ_g ^mがｐ個作成される（図５の「母集団ｍのｐ種の共通影響因子のデータ」の欄に示すＸ₁ ^m，・・・，Ｘ_p ^mを参照）。

【0036】

標本データ抽出部１２０は、ｐ個の列ベクトルＸ₁ ^m，・・・，Ｘ_p ^mを、抽出元の影響因子行列Ｆ^mにおいて小さい列番号に格納されていたものほど小さい列番号の列に格納されるように格納して共通影響因子行列Ｘ^mを作成する。共通影響因子行列Ｘ^mは、ｎ_m行ｐ列の行列（ｍ＝１～Ｍ）である（Ｘ^m∈Ｒ^nm×p）。このような共通影響因子行列Ｘ^mの作成を、全ての母集団１～Ｍのそれぞれについて実施する。このようにしてｎ_m行ｐ列の共通影響因子行列Ｘ^mとしてＭ個の行列が作成される。図５の「母集団ｍのｐ種の共通影響因子のデータ」の欄に示す共通影響因子行列Ｘ^mにおいて破線で囲まれるＸ^m ₁、Ｘ^m _pは、それぞれ、影響因子行列Ｆ^mにおいて、全ての母集団１～Ｍに共通して存在する共通影響因子の値が格納されている列のうち、列番号が１番目に小さい列、列番号がｐ番目に小さい列（列番号が最も大きいの列）の値からなる列ベクトルであることを示す。

【0037】

また、本実施形態では、標本データ抽出部１２０は、影響因子行列Ｆ^mの列のうち、１つの母集団ｍに固有の固有影響因子の値が格納されている列の値を抽出して列ベクトルＦ^m _hとすることを、当該影響因子行列Ｆ^mに存在するｒ_m種類の固有影響因子のそれぞれについて実施する（ｈ＝１～ｒ_m、ｍ＝１～Ｍ）。これにより、ｒ_m個の列ベクトルＦ^m _h（ｈ＝１～ｒ_m）が作成される。

【0038】

ここで、固有影響因子を示す記号をｚとする。具体的には図５の「列ベクトルＦ_h ^mの」欄に示すように、影響因子行列Ｆ^mの列のうち、母集団ｍに固有の固有影響因子の値が格納されている第ｈ列の値からなる列ベクトルをＦ_h ^m（＝（ｆ^m _1,h，・・・，ｆ^m _nm,h）^T）とする。この列ベクトルＦ_h ^mをＺ_h ^mと表記すると共に、この列ベクトルＦ_h ^mの要素ｆ^m _1,h，・・・，ｆ^m _nm,hを、ｚ^m _1,h，・・・，ｚ^m _nm,hと表記する（図５の「列ベクトルＦ_h ^m」の欄を参照）。ここでは、母集団ｍに固有の固有影響因子がｒ_m種類あるものとしている（ｒ_mは母集団ｍ毎に定められる値である）。従って、このような固有影響因子の値を要素とする列ベクトルＺ_h ^mがｒ_m個作成される（図５の「母集団ｍのｒ_m種の非共通影響因子（固有影響因子）のデータ」の欄に示すＺ₁ ^m，・・・，Ｚ_rm ^mを参照）。

【0039】

標本データ抽出部１２０は、ｒ_m個の列ベクトルＺ₁ ^m，・・・，Ｚ_rm ^mを、抽出元の影響因子行列Ｆ^mにおいて小さい列番号に格納されていたものほど小さい列番号の列に格納されるように格納して固有影響因子行列Ｚ^mを作成する。固有影響因子行列Ｚ^mは、ｎ_m行ｒ_m列の行列（ｍ＝１～Ｍ）である（Ｚ^m∈Ｒ^nm×rm）。このような固有影響因子行列Ｚ^mの作成を、全ての母集団１～Ｍのそれぞれについて実施する。このようにしてｎ_m行ｒ_m列の固有影響因子行列Ｚ^mとしてＭ個の行列が作成される。図５の「母集団ｍのｒ_m種の非共通影響因子（固有影響因子）のデータ」の欄に示す固有影響因子行列Ｚ^mにおいて破線で囲まれるＺ^m ₁、Ｚ^m _rmは、それぞれ、影響因子行列Ｆ^mにおいて、母集団ｍに固有の固有影響因子の値が格納されている列のうち、列番号が１番目に小さい列、列番号がｒ_m番目に小さい列（列番号が最も大きいの列）の値からなる列ベクトルであることを示す。

【0040】

標本データ抽出部１２０は、以上のようにして、Ｍ個の共通影響因子行列Ｘ^m（Ｘ^m∈Ｒ^nm×p、ｍ＝１～Ｍ）と、Ｍ個の固有影響因子行列Ｚ^m（Ｚ^m∈Ｒ^nm×rm、ｍ＝１～Ｍ）とを作成する。

【0041】

［第１回帰係数算出工程（Ｓ２０４）、第１回帰係数算出部１３０］
第１回帰係数算出部１３０は、少なくとも１つの被影響因子のデータと、共通影響因子のデータと、非共通影響因子のデータと、を用いて、正則化として少なくともスパース正則化を適用した回帰分析を実行することにより、複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す第１回帰式における第１回帰係数を算出する。この第１回帰式の説明変数（独立変数）は、共通影響因子と、非共通影響因子と、を含み、この第１回帰式の目的変数（従属変数）は、被影響因子を含む。

【0042】

前述したように本実施形態では、非共通影響因子が固有影響因子のみである場合を例示する。本実施形態では、第１回帰係数算出部１３０は、ｑ種類の被影響因子の値を格納する被影響因子行列Ｙ^m（Ｙ^m∈Ｒ^nm×q）と、ｐ種類の共通影響因子の値を格納する共通影響因子行列Ｘ^m（Ｘ^m∈Ｒ^nm×p）と、ｒ_m種類の固有影響因子の値を格納する固有影響因子行列Ｚ^m（Ｚ^m∈Ｒ^nm×rm）と、を用いて、以下の（１）式の第１回帰式における第１回帰係数行列Ｂ^m（Ｂ^m∈Ｒ^p×q）、Ｃ^m（Ｃ^m∈Ｒ^rm×q）および切片ベクトルα^m（α^m∈Ｒ^q）を算出する。なお、被影響因子の種類の数が２以上である場合（ｑ≧２）、（１）式は、多変量回帰式である。被影響因子の種類の数が１である場合（ｑ＝１）、（１）式は、重回帰式である。

【0043】

【数1】

【0044】

ここで、１_nmは、全ての要素が１であるｎ_m行の列ベクトルである。α^mは、第１回帰式のｑ個の切片ａ^m ₁，・・・，ａ^m _qを要素とする切片ベクトル（列ベクトル（ａ^m ₁，・・・，ａ^m _q）^T、α^m∈Ｒ^q）である。１_nm（α^m）^Tは、以下の（２）式のように表される。

【0045】

【数2】

【0046】

また、Ｂ^mは、共通影響因子行列Ｘ^mの要素である共通影響因子の値ｘ^m _1,1～ｘ^m _1,p，・・・，ｘ^m _nm,1～ｘ^m _nm,pに乗算される第１回帰係数ｂ^m _1,1～ｂ^m _1,q，・・・，ｂ^m _p,1～ｂ^m _p,qの値を要素とするｐ行ｑ列の第１回帰係数行列（Ｂ^m∈Ｒ^p×q）である。前述したように、ｐは共通影響因子の種類の数であり、ｑは被影響因子の種類の数である。Ｘ^mＢ^mは、以下の（３）式のように表される。

【0047】

【数3】

【0048】

Ｃ^mは、固有影響因子行列Ｚ^mの要素である固有影響因子の値ｚ^m _1,1～ｚ^m _1,rm，・・・，ｚ^m _nm,1～ｚ^m _nm,rmに乗算される第１回帰係数ｃ^m _1,1～ｃ^m _1,q，・・・，ｃ^m _rm,1～ｃ^m _rm,qの値を要素とするｒ_m行ｑ列の第１回帰係数行列（Ｃ^m∈Ｒ^rm×q）である。前述したように、ｒ_mは母集団ｍにおける固有影響因子の種類の数であり、ｑは被影響因子の種類の数である。Ｚ^mＣ^mは、以下の（４）式のように表される。

【0049】

【数4】

【0050】

以上の（１）式の第１回帰式における第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mを算出する方法の一例を以下に説明する。まず、（１）式を以下の（５）式のように変更する。

【0051】

【数5】

【0052】

ここで、Ｅ^mは、以下の（６）式に示すように、（１）式の左辺と右辺との誤差ｅ^m _1,1～ｅ^m _1,q，・・・，ｅ^m _nm,1～e^m _nm,qを要素とするｎ_m行ｑ列の行列である誤差行列（Ｅ^m∈Ｒ^nm×q）である。

【数6】

【0053】

本実施形態では、誤差行列Ｅ^mの各要素の値を最小化する最小化問題として以下の（７）式のコスト関数を用いる。

【0054】

【数7】

【0055】

ここで、（７）式の第１項の||・||_Fは、フロベニウスノルムを表す。（７）式の第２項の||・||₂は、Ｌ２ノルムを表す。（７）式の第３項の||・||₁は、Ｌ１ノルムを表す。これらのノルムの表記の方法は、他の式においても同じである。

【0056】

（７）式の第１項は、（１）式の第１回帰式で算出される被影響因子の値（１_nm（α^m）^T＋Ｘ^mＢ^m＋Ｚ^mＣ^m）と、標本データにおける被影響因子の値（Ｙ^m）との差を表す損失関数の一例である。（７）式の第１項の「１_nm（α^m）^T－Ｘ^mＢ^m－Ｚ^mＣ^m）のＸ^m、Ｚ^mには、それぞれ、標本データ抽出部１２０により作成された共通影響因子行列Ｘ^m、固有影響因子行列Ｚ^mが与えられる。（７）式の第１項の「Ｙ^m」には、標本データ取得部１１０により作成された被影響因子行列Ｙ^mが与えられる。

【0057】

（７）式の第２項は、共通影響因子に対する第１回帰係数β^m _1,1～β^m _1,p，・・・，β^m _p,1～β^m _p,q（第１回帰係数行列Ｂ^m）の正則化項の一例である。
（７）式の第３項は、固有影響因子に対する第１回帰係数ｃ^m _1,1～ｃ^m _1,q，・・・，ｃ^m _rm,1～ｃ^m _rm,q（第１回帰係数行列Ｃ^m）の正則化項の一例である。
以下に（７）式の計算方法の一例を説明する。
（７）式の第１項は、以下の（８）式のように表される。

【0058】

【数8】

【0059】

ここで、ｔｒ［］は、［］内の行列のトレースをとることを表す。
（７）式の第２項において、λは、非負の値または正の値を有する正則化パラメータであり、予め設定される。β_j,kは、全ての母集団ｍ（ｍ＝１～Ｍ）における第１回帰係数行列Ｂ^mの第ｊ行第ｋ列の要素β¹ _j,k，・・・，β^M _j,kをこの順で第１行，・・・，第Ｍ行に格納した列ベクトルである（β_j,k＝（β¹ _j,k，・・・，β^M _j,k）^T）。（７）式の第２項の||β_j,k||₂は、Ｌ２ノルムを表すので、原点からβ_j,kまでの距離はユークリッド距離と同値である。従って、（７）式の第２項は、以下の（９）式のように表される。（９）式は、Ｍ個の母集団１～Ｍの間の正則化であるグループLassoと呼ばれる正則化項に対応する。

【0060】

【数9】

【0061】

（７）式の第３項において、γ_mは、非負の値または正の値を有する正則化パラメータであり、母集団ｍ毎に予め設定される。（７）式の第３項の||Ｃ^m||₁は、Ｌ１ノルムを表し、以下の（１０）式のように表される。（１０）式は、グループ内の正則化であるLassoと呼ばれる正則化項（Ｌ１正則化項）に対応する。

【0062】

【数10】

【0063】

ここで、（７）式には微分することができない正則化項が含まれる。そこで、本実施形態では、交互方向乗数法（ＡＤＭＭ：Alternating Direction Method of Multipliers）を用いて（７）式のコスト関数の値を最小化する最小化問題を解く場合を例示する。（７）式のコスト関数の値を最小化する最小化問題を交互方向乗数法に適用することができるように、（７）式を以下の（１１）式のように書き換える。

【0064】

【数11】

【0065】

ここで、拡張ラグランジュ関数（Augmented Lagrangian）Ｌ_pは、以下の（１２）式のように表される。

【0066】

【数12】

【0067】

ここで、ρは、正の値を有するパラメータであり、予め設定される。ρは、例えば１．０である。なお、ｕ_j,kおよびＶ^mは、ラグラジュ乗数である。
交互方向乗数法では、Ｂ^m、η_j,k、ｕ_j,k、Ｃ^m、Ｄ^m、Ｖ^m、α^mを、この順で更新することを、交互方向乗数法で定められている収束条件を満足するまで繰り返し実行する。以下のこれらの変数の更新則の概要を説明する。

【0068】

＜Ｂ^mの更新＞
Ｂ^mは、以下の（１３）式で表される。ここで、Ｈ^m（Ｈ^m∈Ｒ^p×q）を、第ｊ行第ｋ列の要素がη^m _j,k（＝β^m _j,k）の行列と定義する。また、Ｕ^m（Ｕ^m∈Ｒ^p×q）を、第ｊ行第ｋ列の要素がｕ^m _j,kの行列と定義する。行列Ｈ^m、Ｕ^mを用いて以下の（１３）式の右辺第３項目を以下の（１４）式のように書き直す。そして、（１４）式の関係を用いて（１３）式をＢ^mについて偏微分することにより、以下の（１５）式に示すＢ^mの更新値（最小解）を得る。ここで、arg min Ｂ^m｛｝は、｛｝内の関数を最小にするＢ^mを表す（なお、arg min Ｂ^mは、（１３）式においてarg minの下にＢ^mが付されている記号に対応する）。arg minの意味は、その他の式においても同じである。なお、（１３）式においてＩ_pは、ｐ行ｐ列の単位行列である。

【0069】

【数13】

【0070】

＜η_j,kの更新＞
η_j,kは、以下の（１６）式で表される。（１６）式において、近接写像proxは、グループ毎にスケーリングされたソフト閾値処理（soft-thresholding operator）となる。従って、η_j,kは、以下の（１７）式により計算される。具体的にη_j,kの更新値は、以下の（１８）式のようになる。ここで、（max（１－λ／ρ／||β_j,k－ｕ_j,k||₂，０）は、「１－λ／ρ／||β_j,k－ｕ_j,k||₂」と「０」とのうちの最大値を表す。maxの意味は、その他の式においても同じである。

【0071】

【数14】

【0072】

＜ｕ_j,kの更新＞
ｕ_j,kの更新値は、以下の（１９）式のようになる。

【0073】

【数15】

【0074】

＜Ｃ^mの更新＞
Ｃ^mは、以下の（２０）式で表される。（２０）式をＣ^mについて偏微分することにより、以下の（２１）式に示すＣ^mの更新値（最小解）を得る。ここで、Ｉ_rmは、ｒ_m行、ｒ_m列の単位行列を表す。

【0075】

【数16】

【0076】

＜Ｄ^mの更新＞
Ｄ^mは、以下の（２２）式で表される。（Ｄ^m）_i,jは、Ｄ^mの第ｉ行第ｊ列の要素であることを表す。このような表記の方法は、その他の式においても同じである。（２２）式の計算を実行すると、以下の（２３）式が得られる。ここで、sgnは、符号関数を表す。abs（）は、（）内の値の絶対値をとることを表す。具体的にＤ^mの更新値は、以下の（２４）式のようになる。

【0077】

【数17】

【0078】

＜Ｖ^mの更新＞
Ｖ^mの更新値は、以下の（２５）式のようになる。

【0079】

【数18】

【0080】

＜α^mの更新＞
α^mは、以下の（２６）式で表される。（２６）式をα^mについて偏微分することにより、以下の（２７）式に示すα^mの更新値（最小解）が得られる。

【0081】

【数19】

【0082】

本実施形態では、第１回帰係数算出部１３０は、以上のようにして（１）式の第１回帰式における第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mを算出する。

【0083】

なお、本実施形態では、交互方向乗数法を用いて（７）式のコスト関数の値を最小化する最小化問題を解く場合を例示した。しかしながら、（７）式のコスト関数の値を最小化する最小化問題を解く手法は、交互方向乗数法に限定されない。例えば、座標降下法、近接勾配法、最小角回帰法であってもよい。

【0084】

［影響因子特定工程（Ｓ２０５）、影響因子特定部１４０］
影響因子特定部１４０は、第１回帰係数算出部１３０により算出された第１回帰係数行列Ｂ^m（の要素β^m _1,1～β^m _1,q，・・・，β^m _p,1～β^m _p,q）、Ｃ^m（の要素ｃ^m _1,1～ｃ^m _1,q，・・・，ｃ^m _rm,1～ｃ^m _rm,q）に基づいて、被影響因子ｙ^m _1,1～ｙ^m _nm,qに影響を与える影響因子を特定する。

【0085】

本実施形態では、影響因子特定部１４０は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pのうち、当該共通影響因子に乗算される第１回帰係数β^m _1,1，・・・，β^m _p,qが０（零）以外の値となる共通影響因子を、被影響因子に影響を与える共通影響因子として抽出する。影響因子特定部１４０は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pの全てを選択して、このような抽出を実行する。

【0086】

また、影響因子特定部１４０は、固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmのうち、当該固有影響因子に乗算される第１回帰係数ｃ^m _1,1，・・・，ｃ^m _rm,qが０（零）以外の値となる固有影響因子を、被影響因子に影響を与える固有影響因子として抽出する。影響因子特定部１４０は、固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmの全てを選択して、このような抽出を実行する。
なお、影響因子特定部１４０は、０（零）以外の値となる影響因子（共通影響因子、固有影響因子）を抽出することに代えて、例えば、絶対値が閾値を上回る値の影響因子を抽出することにより、被影響因子に影響を与える影響因子として特定してもよい。

【0087】

図６は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pおよび固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmから、被影響因子ｙ^m _1,1～ｙ^m _nm,qに影響を与える影響因子が特定されることを概念的に示す図である。
図６において、母集団１、２（Ｍ＝２）における共通影響因子６１１～６１４のうち、被影響因子に影響を与える影響因子は、共通影響因子６１２～６１３であることを示す。四角内にクロスマークが付されている共通影響因子６１１、６１４は、被影響因子に影響を与える影響因子でないことを示す。

【0088】

このように、被影響因子に影響を与える共通影響因子６１２～６１３を特定することにより、被影響因子に影響を与える影響因子として全ての母集団１、２（Ｍ＝２）に存在する影響因子を特定することができる。
例えば、母集団ｍのそれぞれが、被処理水を生物学的に処理する処理プロセスであり、影響因子ｆ^m _nmが、処理プロセスの各微生物群の含有量に関する因子であり、被影響因子ｙ^m _nmが、処理前後における特定物質の量の変化速度に関する因子である場合、特定物質の量の変化（例えば減少）に影響を与える微生物群として全ての処理プロセスに存在する微生物群を特定することができる。

【0089】

また、母集団ｍのそれぞれが、熱延コイルの製造プロセスであり、影響因子ｆ^m _nmが、被圧延材に対して操作量として用いられる物理量であり、被影響因子ｙ^m _nmが、熱延コイルの品質である場合、コイルの品質を向上させるのに影響を与える物理量として全ての製造プロセスに存在する物理量を特定することができる。

【0090】

また、母集団ｍのそれぞれが、人間であり、影響因子ｆ^m _nmが、人間の各種の遺伝子の数に関する因子であり、被影響因子ｙ^m _nmが、人間の特定の疾患に対する検査項目に関する因子である場合、特定の疾患に影響を与える遺伝子として全ての人間に存在する遺伝子を特定することができる。

【0091】

また、母集団１における固有影響因子６２１～６２４のうち、被影響因子に影響を与える影響因子は、固有影響因子６２２～６２３であり、固有影響因子６２１、６２４は、被影響因子に影響を与える影響因子ではないことを示す。また、母集団２における固有影響因子６３１～６３３のうち、被影響因子に影響を与える影響因子は、固有影響因子６３３であり、固有影響因子６３１～６３２は、被影響因子に影響を与える影響因子ではないことを示す。

【0092】

このように、被影響因子に影響を与える固有影響因子６２２～６２３、６３３を特定することにより、被影響因子に影響を与える影響因子として、各母集団１、２（Ｍ＝２）に固有の固有影響因子を特定することができる。
例えば、母集団ｍのそれぞれが、被処理水を生物学的に処理する処理プロセスであり、影響因子ｆ^m _nmが、処理プロセスの各微生物群の含有量に関する因子であり、被影響因子ｙ^m _nmが、処理前後における特定物質の量の変化速度に関する因子である場合、特定物質の量の変化（例えば減少）に影響を与える微生物群として、１つの処理プロセスに固有の微生物群を特定することができる。

【0093】

また、母集団ｍのそれぞれが、熱延コイルの製造プロセスであり、影響因子ｆ^m _nmが、被圧延材に対して操作量として用いられる物理量であり、被影響因子ｙ^m _nmが、熱延コイルの品質である場合、コイルの品質を向上させるのに影響を与える物理量として、１つの製造プロセスに固有の物理量を特定することができる。

【0094】

また、母集団ｍのそれぞれが、人間であり、影響因子ｆ^m _nmが、人間の各種の遺伝子の数に関する因子であり、被影響因子ｙ^m _nmが、人間の特定の疾患に対する検査項目に関する因子である場合、人間の特定の疾患に影響を与える遺伝子として、一人の人間に固有の遺伝子を特定することができる。

【0095】

［特定影響因子出力工程（Ｓ２０６）、特定影響因子出力部１５０］
特定影響因子出力部１５０は、影響因子特定部１４０により、被影響因子に影響を与える影響因子として特定された影響因子の情報を出力する。影響因子の情報の出力形態は、例えば、コンピュータディスプレイへの表示、外部装置への送信、および可搬型記憶媒体への記憶のうち、少なくとも１つである。

【0096】

［評価用データ採取工程（Ｓ３０１）］
評価用データ採取工程（Ｓ３０１）を実行するタイミングは特に限定されない。評価用データ採取工程（Ｓ３０１）は、例えば、標本データ採取工程（Ｓ２０１）が終了した後に実行されても、第１回帰係数算出工程（Ｓ２０４）が終了した後に実行されても、標本データ採取工程（Ｓ２０１）の前に実行されてもよい。

【0097】

評価用データ採取工程では、標本データ採取工程（Ｓ２０１）で標本データの採取の対象となった複数の母集団ｍ（ｍ＝１，・・・，Ｍ）のうちの少なくとも１つの母集団ｍから、評価用データを採取する。本実施形態では、評価用データには、影響因子の値が含まれ、被影響因子の値は含まれないものとする。評価用データは、例えば、［標本データ採取工程（Ｓ２０１）、標本データ抽出部１２０］」の欄で説明した影響因子行列Ｆ^mの要素ｆ^m _1,1，・・・，ｆ^m _nm,sの値である。また、［標本データ採取工程（Ｓ２０１）、標本データ抽出部１２０］の欄で説明したように、影響因子の値（影響因子行列Ｆ^mの要素ｆ^m _1,1，・・・，ｆ^m _nm,sの値）は、例えば、観測値（測定値等）および計算値のうちの少なくとも一方を含む。

【0098】

なお、評価用データ採取工程で採取される影響因子行列Ｆ^mの要素ｆ^m _1,1、ｆ^m _nm,sは、標本データ採取工程で採取される影響因子行列Ｆ^mの要素ｆ^m _1,1、ｆ^m _nm,sとは異なるものである。評価用データ採取工程で採取される影響因子行列Ｆ^mの要素ｆ^m _1,1、ｆ^m _nm,sは、例えば、標本データ採取工程で採取される影響因子行列Ｆ^mの要素ｆ^m _1,1、ｆ^m _nm,sよりも後のタイミングで採取される。また、評価用データ（影響因子行列Ｆ^mの要素）のうち、母集団ｍ（ｍ＝１～Ｍ）に存在しない種類の影響因子の値は、０（零）であるものとする。なお、ｎ_mの値は１であっても２以上であってもよい。

【0099】

［評価用データ取得工程（Ｓ３０２）、評価用データ取得部１６０］
評価用データ取得部１６０は、評価用データ採取工程で採取された評価用データｆ^m _1,1，・・・，ｆ^m _nm,sを取得する。評価用データの取得形態として、例えば、外部装置からの送信、オペレータによるユーザインターフェースに対する評価用データの入力操作、および可搬型記憶媒体からの読み出しのうち、少なくとも１つが採用される。

【0100】

［評価用データ抽出工程（Ｓ３０３）、評価用データ抽出部１７０］
評価用データ抽出工程（Ｓ３０３）は、少なくとも、標本データ抽出部１２０による標本データ抽出工程（Ｓ２０３）が終了した後に実行される。評価用データ抽出工程（Ｓ３０３）は、第１回帰係数算出部１３０による第１回帰係数算出工程（Ｓ２０４）が終了した後に実行されてもよい。

【0101】

評価用データ抽出部１７０は、評価用データ取得部１６０により取得された評価用データｆ^m _1,1，・・・，ｆ^m _nm,sのうち、共通影響因子のデータを抽出する。評価用データ抽出部１７０における抽出対象の共通影響因子は、標本データ抽出部１２０が抽出した共通影響因子と同種の影響因子である。共通影響因子のデータは、例えば、［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］の欄で説明した共通影響因子行列Ｘ^mの要素ｘ^m _1,1，・・・，ｘ^m _nm,pの値として得られる。ただし、共通影響因子のデータ（共通影響因子行列Ｘ^mの要素ｘ^m _1,1，・・・，ｘ^m _nm,pの値）そのものは、［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］の欄で説明した共通影響因子のデータ（共通影響因子行列Ｘ^mの要素ｘ^m _1,1，・・・，ｘ^m _nm,pの値）と異なる。

【0102】

評価用データ抽出部１７０は、評価用データ取得部１６０により取得された評価用データｆ^m _1,1，・・・，ｆ^m _nm,sのうち、非共通影響因子のデータを抽出する。評価用データ抽出部１７０における抽出対象の非共通影響因子は、標本データ抽出部１２０が抽出した非共通影響因子と同種の影響因子である。［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］の欄で説明したように、本実施形態では、評価用データ抽出部１７０が、固有影響因子のみを、非共通影響因子として抽出する場合を例示する。固有影響因子のデータは、例えば、［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］の欄で説明した固有影響因子行列Ｚ^mの要素ｚ^m _1,1，・・・，ｚ^m _nm,rmの値として得られる。ただし、固有影響因子のデータ（固有影響因子行列Ｚ^mの要素ｚ^m _1,1，・・・，ｚ^m _nm,rmの値）そのものは、［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］の欄で説明した固有影響因子のデータ（固有影響因子行列Ｚ^mの要素ｚ^m _1,1，・・・，ｚ^m _nm,rmの値）と異なる。

【0103】

［被影響因子算出工程（Ｓ３０４）、被影響因子算出部１８０］
被影響因子算出工程（Ｓ３０４）は、少なくとも、第１回帰係数算出部１３０による第１回帰係数算出工程（Ｓ２０４）が終了した後に実行される。

【0104】

被影響因子算出部１８０は、評価用データ抽出部１７０により評価用データｆ^m _1,1，・・・，ｆ^m _nm,sから抽出された、共通影響因子のデータおよび非共通影響因子（固有影響因子）のデータと、図２のステップＳ２０４の処理で第１回帰係数算出部１３０により算出された、第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mが代入された（１）式の第１回帰式と、に基づいて、被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出する。

【0105】

具体的に被影響因子算出部１８０は、評価用データ抽出部１７０により抽出された、共通影響因子行列Ｘ^mの要素ｘ^m _1,1，・・・，ｘ^m _nm,pの値および固有影響因子行列Ｚ^mの要素ｚ^m _1,1，・・・，ｚ^m _nm,rmの値を、第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mが代入された（１）式の第１回帰式に代入して、（１）式の左辺の値（被影響因子行列Ｙ^mの要素ｙ^m _1,1，・・・，ｙ^m _nm,qの値）を算出する。

【0106】

［被影響因子出力工程（Ｓ３０５）、被影響因子出力部１９０］
被影響因子出力部１９０は、被影響因子算出部１８０により算出された被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値の情報を出力する。被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値の情報の出力形態は、例えば、コンピュータディスプレイへの表示、外部装置への送信、および可搬型記憶媒体への記憶のうち、少なくとも１つである。

【0107】

［まとめ］
以上のように本実施形態では、処理装置１００は、複数の母集団における標本データから共通影響因子のデータおよび非共通影響因子（固有影響因子）のデータを抽出して、共通影響因子行列Ｘ^mおよび固有影響因子行列Ｚ^mを作成し、共通影響因子行列Ｘ^mおよび固有影響因子行列Ｚ^mを用いてスパース正則化を適用した回帰分析を実行することにより、共通影響因子行列Ｘ^mに対する第１回帰係数行列Ｂ^mおよび固有影響因子行列Ｚ^mに対する第１回帰係数行列Ｃ^mを算出する。このようにして算出された第１回帰係数行列Ｂ^m、Ｃ^mの各要素の値により、複数の母集団において影響因子により影響を受ける被影響因子を特定することができる。従って、複数の母集団において影響因子により影響を受ける被影響因子を同時に特定するための指標を算出することができる。また、複数の母集団における標本データを用いるので、標本データの数を多くすることができ、より精緻な解析を実行することができる。

【0108】

また、本実施形態では、処理装置１００は、第１回帰係数行列Ｂ^m、Ｃ^mの各要素の値に基づいて、複数の母集団において被影響因子に影響を与える影響因子を特定する。従って、複数の母集団において被影響因子に影響を与える被影響因子を同時に特定することができる。より具体的には、被影響因子に影響を与える影響因子として複数の母集団の全てに存在する共通影響因子を特定することができる。また、被影響因子に影響を与える影響因子として共通影響因子と異なる非共通影響因子を特定することができる。ここで、非共通影響因子として、１つの母集団に固有の影響因子である固有通影響因子を用いることにより、被影響因子に影響を与える影響因子として特定の１つの母集団にのみ存在する影響因子を複数の母集団のそれぞれにおいて特定することができる。このように、複数の母集団の全てに存在する影響因子と、複数の母集団の一部のみに存在する影響因子とを分けて評価することができる。

【0109】

例えば、被処理水を生物学的に処理する複数の処理プロセスにおいて、処理前後における特定物質の量の変化速度を被影響因子とすると共に、処理プロセスの各微生物群の含有量を影響因子とする場合、特定物質の量の変化に影響を与える微生物群として全ての処理プロセスに共通して存在する一または複数の微生物群を特定することにより、全ての処理プロセスに対し被処理水の処理条件として共通の処理条件を適用することができる。また、被処理水を生物学的に処理する複数の処理プロセスにおいて、特定物質の量の変化に影響を与える微生物群として一部の処理プロセスのみに存在する一または複数の微生物群を特定することにより、処理水の処理条件として、当該一部の処理プロセスに特化した処理条件を適用することができる。

【0110】

ここで、被処理水の処理条件の具体例について簡単に説明する。
まず、特定された微生物群が処理水中に存在することは、例えば、微生物群の塩基配列に基づき、処理プロセスから、当該塩基配列を有する核酸を検出することで、検出することが可能である。例えば、特定された微生物群が、処理プロセス内で所望の物質の分解反応に寄与するものである場合、特定された微生物群の生育に適した条件に処理条件を制御すればよい。例えば、特定された微生物群が、処理水プロセス内で所望の物質の分解反応を抑制するものである場合、特定された微生物群の生育に適さない条件を処理条件として採用すればよい。処理条件とは、例えば、処理プロセスの温度、ｐＨ、溶存酸素濃度、塩濃度、水理学的滞留時間（ＨＲＴ）、汚泥滞留時間（ＳＲＴ）、微生物固定用担体の投入、生育促進または阻害物質の添加、処理槽中の攪拌速度、および前記処理条件の異なる処理槽の組み合わせ等が挙げられる。

【0111】

また、微生物群の少なくとも一種を含む微生物資源を移植して、被処理水を処理してもよい。微生物資源としては、例えば活性汚泥、微生物製剤、微生物担体、微生物株、土壌、底泥、海水、河川水、湖水等が挙げられる。例えば、生物学的排水処理装置を新設する際に、特定された微生物群の少なくとも一種を含み、好ましくはそれら微生物群の量が多い微生物資源を移植することで、短時間で必要な処理性能を得ることが可能である。また、例えば、既設の生物学的排水処理装置の微生物が一時的な毒物の流入などにより死滅し、処理性能が悪化した場合に、特定された微生物群の少なくとも一種を含み、好ましくはそれら微生物群の量が多い微生物資源を移植することで、短時間で必要な処理性能まで回復することが可能である。

【0112】

また、本実施形態では、処理装置１００は、評価用データｆ^m _1,1，・・・，ｆ^m _nm,sから抽出された非共通影響因子（固有影響因子）のデータと、前述したようにして算出した第１回帰係数行列Ｂ^m、Ｃ^mが代入された（１）式の第１回帰式と、に基づいて、被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出する。従って、影響因子の値が与えられた場合の被影響因子の値を複数の母集団において同時に算出することができる。

【0113】

被処理水を生物学的に処理する複数の処理プロセスにおいて、処理前後における特定物質の量の変化速度を被影響因子とすると共に、処理プロセスの微生物の含有量を影響因子とする場合、一または複数の微生物群により、各処理プロセスにおいて特定物質の量がどのくらいの速度で変化するのかについての知見を得ることができる。具体的には、特定物質の量の変化に影響を与える微生物群として全ての処理プロセスに共通して存在する一または複数の微生物群により、各処理プロセスにおいて特定物質の量がどのくらいの速度で変化するのかについての知見を得ることができる。また、特定物質の量の変化に影響を与える微生物群として一部の処理プロセスのみに存在する一または複数の微生物群により、各処理プロセスにおいて特定物質の量がどのくらいの速度で変化するのかについての知見を得ることができる。

【0114】

［変形例］
＜変形例１＞
本実施形態では、非共通影響因子が固有影響因子のみである場合を例示した。しかしながら、被影響因子は固有影響因子に限定されない。例えば、標本データ抽出部１２０は、共通影響因子と異なる全ての影響因子を、非共通影響因子の一群として抽出してもよい。また、標本データ抽出部１２０は、複数の母集団１～Ｍのうち、類似の特性を持つ複数の母集団に固有の影響因子を、非共通影響因子の一群として抽出してもよい。また、標本データ抽出部１２０が抽出する非共通影響因子群は、１つでも複数でもよい。複数の非共通影響因子群を抽出する場合、複数の非共通影響因子群のそれぞれについて別々の非共通影響因子行列を作成すると共に、当該非共通影響因子行列に対する第１回帰係数行列をそれぞれ作成する。そして、第１回帰式において、複数の非共通影響因子行列のそれぞれに対する正則化項を設定する。

【0115】

＜変形例２＞
本実施形態では、共通影響因子に対する第１回帰係数β^m _1,1～β^m _1,q，・・・，β^m _p,1～β^m _p,q（第１回帰係数行列Ｂ^m）のスパース正則化項（（７）式の第２項）がグループLasso（Least Absolute. Shrinkage and Selection Operator）によるスパース正則化項である場合を例示した。また、固有影響因子に対する第１回帰係数ｃ^m _1,1～ｃ^m _1,q，・・・，ｃ^m _rm,1～ｃ^m _rm,q（第１回帰係数行列Ｃ^m）のスパース正則化項（（７）式の第３項）がグループ内の正則化であるLassoによるスパース正則化項（Ｌ１正則化項）である場合を例示した。しかしながら、スパース正則化項（第１回帰係数の値をスパースにする正則化（すなわち、第１回帰係数の値を０（零）に誘導して０（零）に縮小可能な正則化）を行うための正則化項）は、これらのスパース正則化項に限定されない。スパース正則化項は、例えば、エラスティックネット（Elastic Net）正則化項、ＳＣＡＤ（Smoothly Clipped Absolute Deviation）正則化項であってもよい。

【0116】

なお、共通影響因子に対する第１回帰係数β^m _1,1～β^m _1,q，・・・，β^m _p,1～β^m _p,q（第１回帰係数行列Ｂ^m）の正則化項と、固有影響因子に対する第１回帰係数ｃ^m _1,1～ｃ^m _1,q，・・・，ｃ^m _rm,1～ｃ^m _rm,q（第１回帰係数行列Ｃ^m）の正則化項とをスパース正則化項とすることで、第１回帰係数β^m _1,1～β^m _1,q，・・・，β^m _p,1～β^m _p,q、ｃ^m _1,1～ｃ^m _1,q，・・・，ｃ^m _rm,1～ｃ^m _rm,qの最適解として０（零）が算出され易くなる。即ち、被影響因子に与える影響が小さい影響因子に対する第１回帰係数が０になり易くなる。

【0117】

＜変形例３＞
本実施形態では、被影響因子の種類の数（＝ｑ）は１以上であっても２以上であってもよい。（１）式によれば、被影響因子の種類の数（＝ｑ）が２以上である場合でも、１つの多変量回帰式で、ｑ種類の被影響因子の値を同時に算出することができる（図４の「母集団ｍの標本データ」の欄の被影響因子Ｙ^mも参照）。しかしながら、必ずしもこのようにする必要はない。例えば、２種類以上のｑ種類のそれぞれの被影響因子について個別に（１）式の第１回帰式を構築することを（即ち、ｑ＝１として第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mを算出することを）、ｑ種類の被影響因子のそれぞれについて個別に行ってもよい。このようにする場合、（１）式の第１回帰式としてｑ個の第１回帰式が構築される。

【0118】

＜変形例４＞
本実施形態では、第１回帰係数を算出する処理と、被影響因子の値を算出する処理と、が同一の処理装置で実現される場合を例示した。しかしながら、第１回帰係数を算出する処理（図２のフローチャートによる処理）と、被影響因子の値を算出する処理（図３のフローチャートによる処理）と、は別の処理装置で実現されてもよい。被影響因子の値を算出する処理（図３のフローチャートによる処理）を実行する処理装置は、図２のステップＳ２０１～Ｓ２０４の処理で算出された、第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mが代入された（１）式の第１回帰式の情報を取得して、図３のフローチャートによる処理を実行する。この場合、被影響因子の値を算出する処理（図３のフローチャートによる処理）を実行する処理装置では、図２のステップＳ２０５～Ｓ２０６の処理は実行されない。一方、第１回帰係数を算出する処理（図２のフローチャートによる処理）を実行する処理装置では、図３のフローチャートによる処理は実行されない。

【0119】

（第２実施形態）
次に、第２実施形態を説明する。第１実施形態では、被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出する回帰式として（１）式の第１回帰式を用いる場合を例示した。（１）式の第１回帰式においては、第１回帰係数算出部１３０により算出された第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mが代入される。第１実施形態では、第１回帰係数算出部１３０は、第１回帰係数行列Ｂ^m、Ｃ^mにおいて０（零）となる要素（第１回帰係数）を算出し得る。この場合、（１）式の第１回帰式において、影響因子ｆ^m _1,1、ｆ^m _nm,sのうち、０（零）となる第１回帰係数を含む項は（当該第１回帰係数に乗算される影響因子の値に関わらず）０（零）になる。

【0120】

これに対し、本実施形態では、標本データ取得部１１０により取得された標本データを用いた回帰分析の一例として線形回帰を行うことにより、第２回帰式における第２回帰係数を算出する場合を例示する。第２回帰式は、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定された共通影響因子および固有影響因子と、被影響因子と、の関係を表す。第１回帰式における説明変数は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pおよび固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmの全てである。これに対し、第２回帰式における説明変数は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pおよび固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmの全てのうち、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定された共通影響因子および固有影響因子である。このように本実施形態は、第１実施形態に対し、第２回帰式を算出することによる構成および処理が主として異なる。したがって、本実施形態の説明において、第１実施形態と同一の部分については、図１～図６に付した符号と同一の符号を付す等して詳細な説明を省略する。

【0121】

図７は、第２実施形態の処理装置１００の機能的な構成の一例を示す図である。図８は、標本データ取得部１１０、標本データ抽出部１２０、第１回帰係数算出部１３０、影響因子特定部１４０、特定影響因子出力部１５０、および第２回帰係数算出部２００による処理方法の一例を説明するフローチャートである。

【0122】

図７において、処理装置１００は、図１に示す処理装置１００に対し、第２回帰係数算出部２００をさらに有する。また、本実施形態の処理装置１００では、被影響因子算出部１８０が有する機能の一部が第１実施形態と異なる。
また、図８に示すフローチャートでは、図２に示すフローチャートに対しＳ２０７が追加される。また、図８に示すフローチャートでは、図２に示すフローチャートに対しＳ２０６における処理の一部が異なる。
また、評価用データ取得部１６０、評価用データ抽出部１７０、被影響因子算出部１８０、および被影響因子出力部１９０による処理方法の一例を説明するフローチャートは、図３と同じである。ただし、Ｓ３０４の処理の一部が異なる。以下に、第１実施形態と異なる部分について説明する。

【0123】

［第２回帰係数算出工程（Ｓ２０７）、第２回帰係数算出部２００］
標本データ抽出部１２０は、標本データ取得部１１０により取得された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて線形回帰を行うことにより、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定された影響因子と、当該影響因子により影響を受ける被影響因子と、の関係を表す第２回帰式における第２回帰係数を算出する。

【0124】

なお、第２回帰式における説明変数には、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定された影響因子の少なくとも１つが含まれていればよい。また、第２回帰式における目的変数には、影響因子により影響を受ける被影響因子の少なくとも１つが含まれていればよい。ただし、第２回帰式における説明変数には、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定された影響因子の全てが含まれ、且つ、第２回帰式における目的変数には、当該影響因子により影響を受ける被影響因子の全てが含まれるのが好ましい。そこで、本実施形態では、第２回帰式が、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定された影響因子の全てと、当該影響因子により影響を受ける被影響因子の全てと、の関係を表す場合を例示する。
また、第２回帰係数を算出する際に用いられる標本データは、（１）式の第１回帰式における第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mを算出する際に用いられた標本データと同じであっても異なっていてもよい。

【0125】

第１実施形態では、影響因子特定部１４０が、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pのうち、当該共通影響因子に乗算される第１回帰係数β^m _1,1，・・・，β^m _p,qが０（零）以外の値となる共通影響因子を、被影響因子に影響を与える共通影響因子として特定する場合を例示した。また、影響因子特定部１４０が、固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmのうち、当該固有影響因子に乗算される第１回帰係数ｃ^m _1,1，・・・，ｃ^m _rm,qが０（零）以外の値となる固有影響因子を、被影響因子に影響を与える固有影響因子として特定する場合を例示した。そこで、本実施形態でも、影響因子特定部１４０がこのようにして被影響因子に影響を与える共通影響因子および固有影響因子が特定する場合を例示する。以下の説明では、影響因子特定部１４０により被影響因子に影響を与える影響因子として特定される影響因子を、必要に応じて、特定影響因子と称する。
本実施形態では、以下の（２８）式～（２９）式のように第２回帰式が表される場合を例示する。

【0126】

【数20】

【0127】

（２８）式において、Ｙ^m、１_nm、α^mは、（１）式に示したものと同じである。ただし、Ｙ^m、α^mの要素の値自体は、（１）式と（２８）式とで異なる。なお、被影響因子の種類の数が２以上である場合（ｑ≧２）、（２８）式は、多変量回帰式である。被影響因子の種類の数が１である場合（ｑ＝１）、（２８）式は、重回帰式である。

【0128】

（２８）式において、特定影響因子行列Χ^mは、影響因子特定部１４０により特定されたｗ種類の特定影響因子の値を格納する行列である。特定影響因子行列Χ^m（Χ^m∈Ｒ^nm×w）は、例えば、第１実施形態における共通影響因子行列Ｘ^m（Ｘ^m∈Ｒ^nm×p）の説明において、ｐ種類の共通影響因子を、ｗ種類の特定影響因子に置き換えることにより得られる。したがって、ここでは、その詳細な説明を省略する。なお、（２９）式において、個々の特定影響因子の値は、特定影響因子行列Χ^mの要素χ^m _1,1，・・・，χ^m _1,w，・・・，χ^m _nm,1，・・・，χ^m _nm,wで表される。また、特定影響因子行列Χ^mの同一の列には同種の特定影響因子の値が格納される。

【0129】

（２８）式において、第２回帰係数行列Ξ^mは、特定影響因子行列Χ^mの要素である特定影響因子の値χ^m _1,1，・・・，χ^m _1,w，・・・，χ^m _nm,1，・・・，χ^m _nm,wに乗算される第２回帰係数ξ^m _1,1～ξ^m _1,q，・・・，ξ^m _w,1～ξ^m _w,qの値を要素とするｗ行ｑ列の第２回帰係数行列（Ξ^m∈Ｒ^w×q）である。

【0130】

第２回帰係数算出部２００は、（２８）式の第２回帰式における第２回帰係数行列Ξ^mおよび切片ベクトルα^mを算出する。第２回帰係数行列Ξ^mおよび切片ベクトルα^mを算出する手法は、線形回帰を行う公知の手法（例えば、最小二乗法）でよい。第２回帰係数算出部２００は、例えば、以下の（３０）式のコスト関数を最小化の値を最小にする最小化問題を解くことにより、第２回帰係数行列Ξ^mおよび切片ベクトルα^mを算出する。

【0131】

【数21】

【0132】

なお、第２回帰係数算出工程（Ｓ２０７）は、影響因子特定工程（Ｓ２０５）と特定影響因子出力工程（Ｓ２０６）との間で行われてもよい。

【0133】

［被影響因子算出工程（Ｓ３０４）、被影響因子算出部１８０］
被影響因子算出工程（Ｓ３０４）は、少なくとも、第２回帰係数算出部２００による第２回帰係数算出工程（Ｓ２０７）が終了した後に実行される。

【0134】

被影響因子算出部１８０は、評価用データ抽出部１７０により評価用データｆ^m _1,1，・・・，ｆ^m _nm,sから抽出された、共通影響因子のデータおよび非共通影響因子（固有影響因子）のデータと、図８のステップＳ２０７の処理で第２回帰係数算出部２００により算出された、第２回帰係数行列Ξ^mおよび切片ベクトルα^mが代入された（２８）式の第２回帰式と、に基づいて、被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出する。
具体的に被影響因子算出部１８０は、評価用データ抽出部１７０により抽出された共通影響因子行列Ｘ^mの要素ｘ^m _1,1，・・・，ｘ^m _nm,pのうち、特定影響因子を示す要素の値と、評価用データ抽出部１７０により抽出された固有影響因子行列Ｚ^mの要素ｚ^m _1,1，・・・，ｚ^m _nm,rmのうち、特定影響因子を示す要素の値と、を、第２回帰係数行列Ξ^mおよび切片ベクトルα^mが代入された（２８）式の第２回帰式（第２回帰係数行列Ξ^m）に代入して、（２８）式の左辺の値（被影響因子行列Ｙ^mの要素ｙ^m _1,1，・・・，ｙ^m _nm,qの値）を算出する。

【0135】

【0136】

なお、本実施形態においても第１実施形態で説明した種々の変形例を採用してもよい。また、被影響因子算出部１８０は、第２回帰式に加えて、第１回帰式を用いて被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出してもよい。このようにすることで、例えば、第１回帰式で算出された被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値と、第２回帰式で算出された被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値と、に基づいて、いずれの回帰式が適切であるのかを評価することができる。

【0137】

また、第１回帰式および第２回帰式を構築した後、被影響因子算出部１８０による算出を行う前に、例えば、標本データ取得部１１０により取得された標本データを用いて第１回帰式および第２回帰式を評価し、評価が高い方の回帰式を、被影響因子算出部１８０が被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出するために用いる回帰式として採用してもよい。例えば、標本データの説明変数（ｘ^m _1,1，・・・，ｘ^m _nm,p、ｚ^m _1,1，・・・，ｚ^m _nm,rm）を第１回帰式および第２回帰式に代入することにより算出される目的変数（ｙ^m _1,1，・・・，ｙ^m _nm,q）と、標本データの目的変数とを、比較することにより、第１回帰式および第２回帰式を評価してもよい。また、例えば、交差検証法により、第１回帰式および第２回帰式を評価してもよい。

【0138】

（第３実施形態）
次に、第３実施形態を説明する。第２実施形態では、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて線形回帰を行うことにより第２回帰係数行列Ξ^mを算出する場合を例示した。この場合、標本データの数（ｎ_M）が影響因子特定部１４０により特定された特定影響因子の種類の数（ｗ）よりも少ないと、線形回帰を行うことができない。そこで、本実施形態では、このような場合でも第２回帰式（第２回帰係数行列Ξ^m）を算出することができるようにする。具体的には、第２回帰式で算出される被影響因子の値と、標本データにおける被影響因子の値と、の差を表す損失関数と、Ｌ２正則化項と、を含むコスト関数を用いて、第２回帰係数行列Ξ^mを算出する。このようなコスト関数を用いていれば回帰分析の手法は限定されないが、本実施形態では、回帰分析の手法としてリッジ回帰を用いる場合を例示する。なお、リッジ回帰に代えて、例えば、エラスティックネットを用いて回帰分析を行ってもよい。このように本実施形態と第２実施形態とは、第２回帰係数行列Ξ^mを算出する手法が主として異なる。よって、本実施形態の説明において、第１～第２の実施形態と同一の部分については、図１～図８に付した符号と同一の符号を付す等して詳細な説明を省略する。

【0139】

［第２回帰係数算出工程（Ｓ２０７）、第２回帰係数算出部２００］
標本データ抽出部１２０は、標本データ取得部１１０により取得された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて（前記線形回帰ではなく）リッジ回帰を行うことにより、第２回帰式における第２回帰係数を算出する。第２実施形態で説明したように、第２回帰式は、影響因子特定部１４０により特定された特定影響因子と、当該特定影響因子により影響を受ける被影響因子と、の関係を表す。

【0140】

第２回帰式は、例えば（２８）式である。この場合、第２回帰係数算出部２００は、（２８）式の第２回帰式における第２回帰係数行列Ξ^mおよび切片ベクトルα^mを算出する。第２回帰係数行列Ξ^mおよび切片ベクトルα^mを算出する手法は、リッジ回帰を行う公知の手法で実現すればよい。第２回帰係数算出部２００は、例えば、以下の（３１）式のコスト関数を最小化の値を最小にする最小化問題を解くことにより、第２回帰係数行列Ξ^mおよび切片ベクトルα^mを算出する。

【0141】

【数22】

【0142】

（３１）式に示す例では、（３１）式の第１項が、第２回帰式で算出される被影響因子の値（１_nm（α^m）^T＋Χ^mΞ^m）と、標本データにおける被影響因子の値（Ｙ^m）と、の差を表す損失関数に対応する。また、（３１）式の第２項がＬ２正則化項に対応する。

【0143】

［まとめ］
以上のように本実施形態では、処理装置１００は、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて線形回帰を行うことにより第２回帰係数行列Ξ^mを算出する。したがって、第２実施形態で説明した効果に加え、標本データの数（ｎ_M）が影響因子特定部１４０により特定された特定影響因子の種類の数（ｗ）より少なくても第２回帰係数行列Ξ^mを算出することができる。また、Ｌ２正則化を行うことにより、求めた回帰係数の変動幅を抑えることができる。したがって、例えば、被影響因子の単位時間当たりの変化量が大きい場合であっても、線形回帰を行うことにより得られる第２回帰式を用いる場合に比べ、第２回帰式で算出される被影響因子の時間変化が過度に大きくなる場合において、実際の被影響因子の時間変化に近づけることが可能になる。

【0144】

なお、本実施形態においても第１～第２実施形態で説明した種々の変形例を採用してもよい。第２実施形態の変形例において、第１回帰式（第１回帰係数行列Ｂ^m、Ｃ^m）と、本実施形態で説明した第２回帰式（第２回帰係数行列Ξ^m）と、の２つの回帰式を算出し、それぞれの回帰式を用いて被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出してもよい。また、第１回帰式（第１回帰係数行列Ｂ^m、Ｃ^m）と、第２実施形態で説明した第２回帰式（第２回帰係数行列Ξ^m）と、本実施形態で説明した第２回帰式（第２回帰係数行列Ξ^m）と、の３つの回帰式を算出し、それぞれの回帰式を用いて被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出してもよい。

【0145】

（第４実施形態）
次に、第４実施形態を説明する。第１～第３実施形態では、標本データ取得部１１０が標本データ採取工程で採取された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）のみを取得する場合を例示した。これに対し、本実施形態では、まず、標本データ採取工程で採取された標本データを用いて再標本化を行うことにより、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を複数セット作成する。そして、作成した複数の標本データのセットのそれぞれを用いて複数通りの第１回帰係数行列Ｂ^m、Ｃ^mを算出し、算出した複数通りの第１回帰係数行列Ｂ^m、Ｃ^mに基づいて、特定影響因子（被影響因子に影響を与える影響因子）を特定する。このようにすれば、被影響因子ｙ^m _1,1～ｙ^m _nm,qに影響を与える影響因子の数をより絞り込むことができる。以下の説明では、標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）のセットを、必要に応じて、標本データセットと称する。なお、第１～第３実施形態では、標本データセットは１つである。

【0146】

本実施形態は、第１～第３実施形態に対し、複数の標本データセットを取得することと、複数通りの第１回帰係数行列Ｂ^m、Ｃ^mを算出することと、特定影響因子を特定する際に複数通りの第１回帰係数行列Ｂ^m、Ｃ^mを用いることと、が主として異なる。したがって、本実施形態の説明において第１～第３実施形態と同一の部分については、図１～図８に付した符号と同一の符号を付す等して詳細な説明を省略する。なお、本実施形態では、第２～第３実施形態の構成を例示して説明する。ただし、第１実施形態に本実施形態の手法を適用してもよい。この場合、本実施形態の説明において、第２回帰式（第２回帰係数行列Ξ^m）を算出する処理が行われない。

【0147】

本実施形態において、処理装置１００の機能的な構成は、例えば、図７のようになる。ただし、標本データ取得部１１０、標本データ抽出部１２０、第１回帰係数算出部１３０、および影響因子特定部１４０が有する機能の一部が第１～第３実施形態と異なる。また、本実施形態において、標本データ取得部１１０、標本データ抽出部１２０、第１回帰係数算出部１３０、影響因子特定部１４０、特定影響因子出力部１５０、および第２回帰係数算出部２００による処理方法の一例を説明するフローチャートは、例えば、図８のようになる。ただし、Ｓ２０２～Ｓ２０４の処理の一部が異なる。以下に、第１～第３実施形態と異なる部分について説明する。

【0148】

【0149】

本実施形態では、標本データ取得部１１０は、複数の標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて再標本化を行うことにより、複数の母集団１～Ｍに対する標本データを含み、且つ、複数の母集団１～Ｍに対する標本データとしてそれぞれ複数の標本データを含む標本データセットを複数作成する。本実施形態では、Bootstrap法を用いる場合を例示するが、再標本化の手法は限定されない。例えば、Jackknife法等の公知の手法を用いてもよい。

【0150】

図９は、複数の標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて再標本化を行う手法の一例を説明する図である。

【0151】

図９において、標本データセット９００は、標本データ採取工程で採取された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）である。図９では、標本データ取得部１１０が、標本データセット９００を用いてＮＬ－１個（ＮＬは正の整数）の標本データセット９０１～９０３を作成する場合を例示する。本実施形態では、標本データセット９００も第１回帰係数行列Ｂ^m、Ｃ^mの算出に用いる場合を例示する。したがって、標本データセット９００～９０３の総数はＮＬ個になる。ただし、例えば、標本データセット９００を第１回帰係数行列Ｂ^m、Ｃ^mの算出に用いなくてもよい。この場合、ＮＬは２以上の整数とする。ＮＬの値が大きいほど、被影響因子ｙ^m _1,1～ｙ^m _nm,qの推定精度が向上する第１回帰係数行列Ｂ^m、Ｃ^mが算出され易くなる一方で、計算負荷が高くなる。ＮＬの値はこのような観点から予め設定される。ＮＬは、例えば、１０００である。

【0152】

Bootstrap法では、重複を許して標本データセット９００に含まれる標本データがランダムに選択される。なお、第１実施形態の［標本データ採取工程（Ｓ２０１）］の項で説明したように、本実施形態でも、影響因子ベクトルｙ¹ ₁，・・・，ｙ^M _nMと、当該影響因子ベクトルに対応して採取される被影響因子ベクトルｆ¹ ₁，・・・，ｆ^M _nMとの組が１つの標本データである場合を例示する。

【0153】

また、本実施形態では、標本データ取得部１１０が、標本データセット９０１～９０３に含まれる各母集団の標本データを、標本データセット９００に含まれる当該母集団の標本データからランダムに選択することを、全ての母集団１～Ｍのそれぞれについて個別に行う場合を例示する。例えば、標本データセット９０１に含まれる母集団１の標本データは、標本データセット９００に含まれる母集団１の標本データからランダムに選択される。ただし、必ずしもこのようにする必要はない。例えば、母集団１～Ｍのうちの一部の母集団では、標本データセット９００に含まれる標本データがそのままコピーされてもよい。

【0154】

また、本実施形態では、標本データ取得部１１０が、標本データセット９０１～９０３に含まれる各母集団の標本データの数を、標本データセット９００に含まれる当該母集団の標本データの数と同じにする場合を例示する。例えば、標本データセット９０１に含まれる母集団１の標本データの数は、標本データセット９００に含まれる母集団１の標本データの数ｎ₁と同じになる。ただし、必ずしもこのようにする必要はなく、少なくとも１つの母集団において、標本データセット９００に標本データの数と異なる数の標本データが選択されてもよい。

【0155】

ここで、標本データセット９０１を例に挙げて、図９における標本データセット９０１～９０３に含まれる標本データの表記方法を説明する。まず、標本データセット９０１の母集団１の標本データの先頭（最上部）に（ｙ¹ ₄，ｆ¹ ₄）を示していることは、標本データセット９０１においては、標本データセット９００の母集団１の標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ ₃，ｆ¹ ₃）が（少なくとも）選択されなかったことを示す。また、標本データセット９０１の母集団ｍの標本データの再後尾（最下部）に（ｙ^m _nm-2，ｆ^m _nm-2）を示していることは、標本データセット９０１においては、標本データセット９００の母集団１の標本データ（ｙ¹ _nm-1，ｆ¹ _nm-1）～（ｙ¹ _nm，ｆ¹ _nm）が（少なくとも）選択されなかったことを示す。また、標本データセット９０１の母集団Ｍの先頭に（ｙ^M ₁，ｆ^M ₁）が示されており、且つ、最後尾に（ｙ^M _nM，ｆ^M _nM）が示されていることは、標本データセット９０１においては、標本データ（ｙ^M ₂，ｆ^M ₂）～（ｙ^M _nM-1，ｆ^M _nM-1）の少なくとも１つが選択されなかったことを示す。標本データセット９０２～９０３においても同様の表記である。なお、標本データセット９０２において、先頭に（ｙ¹ ₁₀，ｆ¹ ₁₀）を示し、最後尾に（ｙ¹ _nm-1，ｆ¹ _nm-1）を示していることは、標本データセット９０２においては、標本データセット９００の母集団１の標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ ₉，ｆ¹ ₉）、（ｙ¹ _nm，ｆ¹ _nm）が（少なくとも）選択されなかったことを示す。

【0156】

図９に示す例では、１つの標本データセット９００～９０３には、複数の母集団１～Ｍに対する標本データが含まれる。また、１つの標本データセット９００～９０３には、当該複数の母集団１～Ｍに対する標本データとして、それぞれ複数（ｎ₁個，・・・，ｎ_m個，・・・，ｎ_M個）の標本データが含まれる。このような標本データセット９００～９０３として複数（ＮＬ個）の標本データセット９００～９０３が標本データ取得部１１０により取得される。

【0157】

［標本データ抽出工程（Ｓ２０３）、標本データ抽出部１２０］
標本データ抽出部１２０は、標本データセット９００～９０３に含まれる複数の標本データから共通影響因子のデータおよび非共通影響因子のデータを抽出することを、複数の標本データセットのそれぞれに対して行う。本実施形態でも、第１実施形態と同様に、標本データ抽出部１２０が、Ｍ個の共通影響因子行列Ｘ^m（Ｘ^m∈Ｒ^nm×p、ｍ＝１～Ｍ）およびＭ個の固有影響因子行列Ｚ^m（Ｚ^m∈Ｒ^nm×rm、ｍ＝１～Ｍ）を算出する場合を例示する。

【0158】

図１０は、複数の標本データセット９００～９０３を用いて特定影響因子（被影響因子に影響を与える影響因子）を特定する手法の一例を説明する図である。
標本データ抽出部１２０は、複数の標本データセット９００～９０３のうちの１つの標本データセットに含まれる複数の標本データを用いて、第１実施形態で説明したようにしてＭ個の共通影響因子行列Ｘ^mおよびＭ個の固有影響因子行列Ｚ^mを算出することを、ＮＬ個の標本データセット９００～９０３のそれぞれに対して行う。これにより、Ｍ個の共通影響因子行列Ｘ^mおよびＭ個の固有影響因子行列Ｚ^mの組がＮＬ組得られる（図１０の上から二段目の「Ｘ^m，Ｚ^m（ｍ＝１～Ｍ）」を参照）。

【0159】

［第１回帰係数算出工程（Ｓ２０４）、第１回帰係数算出部１３０］
第１回帰係数算出部１３０は、複数の標本データセット９００～９０３のうちの１つの標本データセットから標本データ抽出部１２０により抽出された共通影響因子のデータおよび非共通影響因子のデータを用いて第１回帰係数を算出することを、複数の標本データセット９００～９０３のそれぞれについて行うことにより、第１回帰式における第１回帰係数として複数通りの第１回帰係数を算出する。前述したように本実施形態でも第１実施形態と同様に、標本データ抽出部１２０が、Ｍ個の共通影響因子行列Ｘ^mおよびＭ個の固有影響因子行列Ｚ^mを算出する場合を例示する。また、本実施形態でも、第１実施形態と同様に、第１回帰式が（１）式である場合を例示する。

【0160】

したがって、第１回帰係数算出部１３０は、ＮＬ個の標本データセット９００～９０３のうちの１つの標本データセットから標本データ抽出部１２０により算出されたＭ個の共通影響因子行列Ｘ^mおよびＭ個の固有影響因子行列Ｚ^mを用いて第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mを算出することを、ＮＬ個の標本データセット９００～９０３のそれぞれについて行う。これにより、第１回帰係数行列Ｂ^m、Ｃ^mの組がＮＬ組得られる（図１０の上から三段目の「Ｂ^m，Ｃ^m（ｍ＝１～Ｍ）」を参照）。

【0161】

［影響因子特定工程（Ｓ２０５）、影響因子特定部１４０］
影響因子特定部１４０は、第１回帰係数算出部１３０により算出された複数通りの第１回帰係数に基づいて、特定影響因子（被影響因子に影響を与える影響因子）を特定する。本実施形態では、影響因子特定部１４０が、第１回帰係数算出部１３０により算出されたＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mに基づいて、特定影響因子を特定する場合を例示する。

【0162】

具体的に本実施形態では、影響因子特定部１４０は、以下の処理を、母集団１～Ｍのそれぞれについて個別に行う。
まず、影響因子特定部１４０は、ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mから一組の第１回帰係数行列Ｂ^m、Ｃ^mを選択する。影響因子特定部１４０は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pのうち、当該共通影響因子に乗算される第１回帰係数β^m _1,1，・・・，β^m _p,qが０（零）以外の値となる共通影響因子を、選択した第１回帰係数行列Ｂ^mから特定する。影響因子特定部１４０は、共通影響因子ｘ^m _1,1，・・・，ｘ^m _nm,pの全てを選択して、このような共通影響因子の特定を実行する。また、影響因子特定部１４０は、固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmのうち、当該固有影響因子に乗算される第１回帰係数ｃ^m _1,1，・・・，ｃ^m _rm,qが０（零）以外の値となる固有影響因子を、選択した第１回帰係数行列Ｃ^mから特定する。影響因子特定部１４０は、固有影響因子ｚ^m _1,1，・・・，ｚ^m _nm,rmの全てを選択して、このような固有影響因子の特定を実行する。

【0163】

影響因子特定部１４０は、以上のようにして、０（零）以外の値の第１回帰係数β^m _1,1，・・・，β^m _p,qに乗算される共通影響因子および固有影響因子を、ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mのうちの一組の第１回帰係数行列Ｂ^m、Ｃ^mから特定する。
なお、影響因子特定部１４０は、０（零）以外の値となる影響因子（共通影響因子、固有影響因子）を特定することに代えて、例えば、絶対値が閾値を上回る値の影響因子を特定してもよい。

【0164】

影響因子特定部１４０は、以上のような共通影響因子および固有影響因子の特定を、ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mのそれぞれについて個別に行う。これにより、ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mのそれぞれから、共通影響因子および固有影響因子が特定される（図１０の上から四段目の「共通影響因子固有影響因子」を参照）。

【0165】

ここで、共通影響因子および固有影響因子のうちの或る１つの影響因子の特定回数をＮＬ'回とする。影響因子特定部１４０は、ＮＬ'／ＮＬを、当該影響因子の信頼度として算出する。影響因子特定部１４０は、このような影響因子の信頼度の算出を、特定した影響因子（共通影響因子および固有影響因子）のそれぞれについて実行する。影響因子特定部１４０は、このようにして算出した信頼度のうち基準値以上の信頼度を有する影響因子を、被影響因子に影響を与える影響因子として特定する。本実施形態では、このように、第１回帰式において０（零）以外の値（または絶対値が閾値を上回る値）を有する第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qに乗算される影響因子（共通影響因子、固有影響因子）のうち、基準値以上の信頼度を有する影響因子を、特定影響因子（被影響因子に影響を与える共通影響因子および固有影響因子）として特定する。例えば、基準値が「１」である場合、影響因子特定部１４０は、図１０の上から四段目のＮＬ組の「共通影響因子固有影響因子」の全てに含まれる影響因子を、特定影響因子（共通影響因子、固有影響因子）として特定する。

【0166】

ここで、基準値は０超１以下の値であり、予め設定される。基準値を大きくするほど、被影響因子により大きな影響を与える影響因子を特定することができる。ただし、基準値が或る程度大きい値になると、それ以上基準値を大きくしても、特定影響因子が変わらない場合がある。このような場合には、基準値が、特定影響因子として特定される影響因子が変わらない範囲で可及的に小さい値になるように基準値を調整してもよい。また、基準値が大きすぎると、特定影響因子（被影響因子に影響を与える共通影響因子および固有影響因子）が１つも特定されない場合がある。このような場合、特定影響因子（被影響因子に影響を与える共通影響因子および固有影響因子）が少なくとも１つ特定されるように基準値を調整するのが好ましい。基準値の調整は、例えば、試行錯誤的に行えばよい。なお、共通影響因子および固有影響因子のうちの一方が特定影響因子として１つも特定されないことがあってもよい。例えば、或る母集団ｍにおいて共通影響因子が１つも特定されない場合、当該母集団ｍにおいて共通影響因子は被影響因子に寄与していないことを表す。一方、或る母集団ｍにおいて固有影響因子が１つも特定されない場合、当該母集団ｍにおいて固有影響因子は被影響因子に寄与していないことを表す。

【0167】

［第２回帰係数算出工程（Ｓ２０７）、第２回帰係数算出部２００］
第２～第３実施形態で説明したように、標本データ抽出部１２０は、標本データ取得部１１０により取得された標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて回帰分析（例えば、線形回帰やリッジ回帰）を行うことにより、影響因子特定部１４０により特定された特定影響因子と、当該特定影響因子により影響を受ける被影響因子との関係を表す第２回帰式における第２回帰係数を算出する。前述したように、第２～第３本実施形態では、影響因子特定部１４０により特定される特定影響因子は、第１回帰式において０（零）以外の値（または絶対値が閾値を上回る値）を有する第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qに乗算される影響因子（共通影響因子、固有影響因子）である。これに対し本実施形態では、影響因子特定部１４０により特定される特定影響因子は、このような影響因子のうち、基準値以上の信頼度を有する影響因子である。したがって本実施形態では、（２９）式におけるｗ種類の特定影響因子は、基準値以上の信頼度を有する影響因子になる。

【0168】

第２回帰係数算出部２００は、第２回帰係数行列Ξ^m（第２回帰係数ξ^m _1,1～ξ^m _1,q，・・・，ξ^m _w,1～ξ^m _w,q）を、第２実施形態で説明したように線形回帰により算出してもよいし、第３実施形態で説明したようにリッジ回帰等のＬ２正則化を含む罰則付きの回帰により算出してもよい。なお、第２回帰係数算出部１３０は、第２実施形態で説明した第２回帰式（第２回帰係数行列Ξ^m）と、第３実施形態で説明した第２回帰式（第２回帰係数行列Ξ^m）と、の双方を算出してもよい。

【0169】

［まとめ］
以上のように本実施形態では、処理装置１００は、標本データ取得部１１０は、複数の標本データ（ｙ¹ ₁，ｆ¹ ₁）～（ｙ¹ _n1，ｆ¹ _n1），・・・，（ｙ^m ₁，ｆ^m ₁）～（ｙ^m _nm，ｆ^m _nm），・・・，（ｙ^M ₁，ｆ^M ₁）～（ｙ^M _nM，ｆ^M _nM）を用いて再標本化を行うことによりＮＬ個の標本データセット９００～９０３を作成する。そして、処理装置１００は、標本データセット９００～９０３に含まれる複数の標本データから共通影響因子のデータおよび非共通影響因子のデータを抽出することを、ＮＬ個の標本データセット９００～９０３のそれぞれに対して行う。そして、処理装置１００は、複数の標本データセット９００～９０３のうちの１つの標本データセットから抽出した共通影響因子のデータおよび非共通影響因子のデータを用いて第１回帰係数行列Ｂ^m、Ｃ^mを算出することを、ＮＬ個の標本データセット９００～９０３のそれぞれについて行うことにより、ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mを算出する。そして、処理装置１００は、ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^mに基づいて、被影響因子ｙ^m _1,1～ｙ^m _nm,qに影響を与える影響因子を特定する。したがって、被影響因子ｙ^m _1,1～ｙ^m _nm,qにより影響を与える影響因子を特定することができる。また、被影響因子ｙ^m _1,1～ｙ^m _nm,qにより影響を与える影響因子の数をより絞り込むことができる。これにより、例えば、標本データの数（ｎ_M）が影響因子特定部１４０により特定された特定影響因子の種類の数（ｗ）よりも少なくなることを抑制することができる。したがって、例えば、第２回帰式（第２回帰係数行列Ξ^m）を算出する際に、第２実施形態で説明した線形回帰を用いることができる可能性を高めることができる。

【0170】

なお、本実施形態においても第１～第３実施形態で説明した種々の変形例を採用してもよい。本実施形態においても、第２回帰式だけでなく第１回帰式を用いて被影響因子ｙ^m _1,1，・・・，ｙ^m _nm,qの値を算出してもよい。

【0171】

（その他の変形例）
なお、以上説明した本発明の実施形態は、コンピュータがプログラムを実行することによって実現することができる。また、前記プログラムを記録したコンピュータ読み取り可能な記録媒体及び前記プログラム等のコンピュータプログラムプロダクトも本発明の実施形態として適用することができる。記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－ＲＯＭ、磁気テープ、不揮発性のメモリカード、ＲＯＭ等を用いることができる。また、本発明の実施形態は、ＰＬＣ（Programmable Logic Controller）により実現されてもよいし、ＡＳＩＣ（Application Specific Integrated Circuit）等の専用のハードウェアにより実現されてもよい。
また、以上説明した本発明の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその技術思想、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。

【0172】

（実施例）
次に、本発明の実施例を説明する。なお、以下の実施例は、実施可能性や効果の一例を示すものであり、本発明は、以下の実施例に限定されない。例えば、後述する亜硝酸生成速度、チオシアン除去速度、フェノール除去速度およびチオ硫酸除去速度から１つ、２つ、または３つを選択して用いてもよい。
［実施例１］
まず、実施例１を説明する。実施例１では、第１実施形態に関する実施例を説明する。
本実施例では、生物学的排水処理プロセスにおいて、処理前後における特定物質の量の変化速度に影響を与える微生物種を特定する場合について説明する。本実施例では、MBBR（Moving Bed Biofilm Reactor）により、２種類の人工排水（被処理水）それぞれにおける、特定物質の量の変化速度と微生物群の含有量とを標本データとして採取し、本実施形態で説明した（１）式の第１回帰式における第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mを算出した。このように本実施例では、母集団ｍの数が２（Ｍ＝２）であり、被影響因子が特定物質の量の変化速度であり、影響因子が微生物群の含有量である場合を例示する。また、このようにして算出した第１回帰係数行列Ｂ^m、Ｃ^mおよび切片ベクトルα^mが代入された（１）式の第１回帰式を用いた特定物質の量の変化速度の予測精度を検証した。以下に、本実施例を詳細に説明する。以下の説明では、２種類の人工排水（被処理水）のうち一方の人工排水を処理するMBBRをMBBR Run2と称し、他方の人工排水を処理するMBBRをMBBR Run3と称することとする。

【0173】

＜特定物質の量の変化速度の採取＞
<<MBBR Run2>>
まず、MBBR Run2における特定物質の量の変化速度の採取について説明する。なお、特定物質の量の変化速度の採取の手法は、特許文献１に記載されているように公知の技術で実現することができ、本実施例で説明する手法に限定されない。
工業用水と自然海水とを体積比２：３で混合して得られた溶媒中に、表１に示す溶質を表１に示す濃度で溶解し、人工排水（被処理水）を調製した。

【0174】

【表1】

【0175】

また、図１１に示すように、１つの槽内で生物処理領域２０ａと沈降領域２０ｂとが隔壁２３により互いに隔てられていると共にこの隔壁２３の下方で互いに連通する構造を有する一体型の生物処理装置２０を用意した。また、１０ｍｍ×１０ｍｍ×１０ｍｍの大きさのスポンジ担体２１〔流動担体（関東イノアック製ＡＱ－１）〕と、微生物植種源として高濃度の活性汚泥と、をポリ瓶に投入し、当該ポリ瓶を手でよく揉み、一晩蓋をして浸け置くことで、微生物をスポンジ担体２１に付着させた。

【0176】

このようにして準備されたスポンジ担体２１および活性汚泥を、生物処理装置２０の生物処理領域２０ａ内にスポンジ担体２１の生物処理領域２０ａに対する体積比が２０％（ｖ／ｖ）となるように投入し、生物処理装置２０を準備した。

【0177】

このようにして準備された生物処理装置２０内に前述した被処理水２４を流入させた。スポンジ担体２１に微生物を定着させる微生物馴致処理（第１段処理）時には、生物処理領域２０ａ内の被処理水２４の水理学的滞留時間が２４時間となるように被処理水２４を生物処理装置２０内に流入させた。また、各生物処理装置２０内の被処理水２４に空気曝気２２を行って好気性流動床を形成させ、微生物の馴致を行った。また、５ｗｔ％－水酸化ナトリウム水溶液を用いてｐＨを７．５付近に調整しながら処理を行った。そして、生物処理装置２０で処理された処理水２５を生物処理装置２０から排出させた。

【0178】

この生物学的処理の運転開始後、すぐにチオシアン酸イオンの除去が認められ、その後チオシアン酸イオンの除去率が９９％以上で安定したため、１８日目で微生物馴致処理（第１段処理）を終了した。この微生物馴致処理（第１段処理）の期間、被処理水中のアンモニアの２２％以上が亜硝酸イオンに酸化された。

【0179】

この微生物馴致処理（第１段処理）の終了後、生物処理装置２０の生物処理領域２０ａ内の処理水について、チオシアン酸イオン濃度、亜硝酸イオン濃度、フェノール濃度、およびチオ硫酸ナトリウムイオン濃度を測定して、チオシアン酸イオン、亜硝酸イオン、フェノール、およびチオ硫酸ナトリウムイオンのモニタリングを行った。

【0180】

また、生物処理装置２０の生物処理領域２０ａ内の処理水のｐＨを測定してｐＨ値のモニタリング行いながら、運転開始後１９日目より生物処理領域２０ａ内の被処理水２４の水理学的滞留時間が１８時間となるように被処理水２４の流入量を増やし（第２段処理）、次に、運転開始後３９日目より生物処理領域２０ａ内の被処理水２４の水理学的滞留時間が１２時間となるように被処理水２４の流入量を更に増やし（第３段処理）、更に、運転開始後４６日目より生物処理領域２０ａ内の被処理水２４の水理学的滞留時間が８時間となるように被処理水２４の流入量を更に増やした（第４段処理）。その後、７４日目より生物処理領域２０ａ内の被処理水２４の水理学的滞留時間が１０時間となるように被処理水２４の流入量を減らし（第５段処理）、更に９６日目より生物処理領域２０ａ内の被処理水２４の水理学的滞留時間が２４時間となるように被処理水２４の流入量を減らし（第６段処理）、最終的に１６４日目まで運転を継続した。

【0181】

この間、第２段処理において生物処理領域２０ａ内の被処理水２４の水理学的滞留時間を１８時間に短縮したことにより、チオシアン酸イオンの除去率を高い値に維持しつつ、亜硝酸イオンの生成の減少傾向が観察され始め、更に生物処理領域２０ａ内の被処理水２４の水理学的滞留時間を１２時間に短縮することにより、チオシアン酸イオンの除去率を高い値に維持しつつ、亜硝酸イオンの生成を更に抑制することができた。

【0182】

しかしながら、更に、第４段処理において生物処理領域２０ａ内の被処理水２４の水理学的滞留時間を８時間に短縮した場合には、亜硝酸イオンの生成をほぼ完全に抑制しながらも、しばらく継続するとチオシアン酸イオンの除去率が低下した。

【0183】

このように、チオシアン酸イオンの除去率が目標値を超えて上昇してしまったため、第５段処理においては、生物処理領域２０ａ内の被処理水２４の水理学的滞留時間を第４段処理の条件（水理学的滞留時間が１２時間）に近い１０時間に戻して生物学的処理を行った。その結果、チオシアン酸イオンの除去率を９４％以上に維持しつつ、亜硝酸イオンの生成をほぼ完全に抑制することができた。

【0184】

そこで更に、第６段処理においては、生物処理領域２０ａ内の被処理水２４の水理学的滞留時間を２４時間に延長したところ、チオシアン酸イオンの除去率を高い値に維持しながらも、更に驚くべきことには、その後７６日間にも亘って、亜硝酸イオンの生成をほぼ完全に抑制することができた。

【0185】

本実施例での生物学的処理において、運転日数に対する一日当たりの亜硝酸生成速度、チオシアン除去速度、フェノール除去速度、およびチオ硫酸除去速度を、それぞれ以下の（３２）式、（３３）式、（３４）式および（３５）に従い算出した。
運転日数に対する一日当たりの亜硝酸生成速度＝処理水の亜硝酸濃度÷水理学的滞留時間×２４・・・（３２）
運転日数に対する一日当たりのチオシアン除去速度＝被処理水のチオシアン濃度÷水理学的滞留時間×２４－処理水のチオシアン濃度・・・（３３）
運転日数に対する一日当たりのフェノール除去速度＝被処理水のフェノール濃度÷水理学的滞留時間×２４－処理水のフェノール濃度・・・（３４）
運転日数に対する一日当たりのチオ硫酸除去速度＝被処理水のチオ硫酸濃度÷水理学的滞留時間×２４－処理水のチオ硫酸濃度・・・（３５）

【0186】

MBBR Run2による生物学的処理における、運転日数に対する一日当たりの亜硝酸生成速度、チオシアン除去速度、フェノール除去速度およびチオ硫酸除去速度を、図１２、図１３、図１４、図１５にそれぞれ示す。図１２は、運転日数一日当たりの亜硝酸生成速度と運転日数との関係を示す図である。図１３は、運転日数一日当たりのチオシアン除去速度と運転日数との関係を示す図である。図１４は、運転日数一日当たりのフェノール除去速度と運転日数との関係を示す図である。図１５は、運転日数一日当たりのチオ硫酸除去速度と運転日数との関係を示す図である。

【0187】

<<MBBR Run3>>
次に、MBBR Run3における特定物質の量の変化速度の採取について説明する。
工業用水と自然海水とを体積比２：３で混合して得られた溶媒中に、表２に示す溶質を表２に示す濃度で溶解し、人工排水（被処理水）を調製した。

【0188】

【表2】

【0189】

また、１０ｍｍ×１０ｍｍ×１０ｍｍの大きさのスポンジ担体２１〔流動担体（関東イノアック製ＡＱ－１）〕と、微生物植種源として高濃度の活性汚泥と、をポリ瓶に投入し、当該ポリ瓶を手でよく揉み、一晩蓋をして浸け置くことで、微生物をスポンジ担体２１に付着させた。なお、ここで投入する活性汚泥は、チオシアン分解微生物、フェノール分解微生物、チオ硫酸分解微生物が多い植種源とすることが好ましい。

【0190】

このようにして準備されたスポンジ担体２１（５００個）および活性汚泥を、生物処理装置２０の生物処理領域２０ａ内に投入し、生物処理装置２０を準備した。

【0191】

このようにして準備された生物処理装置２０内に前述した被処理水２４を流入させると共に微生物植種源として活性汚泥を投入した。第１段処理時には、生物処理領域２０ａ内の水理学的滞留時間が２４時間となるように被処理水２４を生物処理装置２０内に流入させた。また、各生物処理装置２０内の被処理水２４に空気曝気２２を行って好気性流動床を形成させ、微生物の馴致を行った。また、５ｗｔ％－水酸化ナトリウム水溶液を用いてｐＨを７．５付近に調整しながら処理を行った。そして、生物処理装置２０で処理された処理水２５を生物処理装置２０から排出させた。

【0192】

各生物処理装置２０の生物処理領域２０ａ内の処理水について、チオシアン酸イオン濃度、亜硝酸イオン濃度、フェノール濃度、およびチオ硫酸イオン濃度を測定してチオシアン酸イオン、亜硝酸イオン、フェノールおよびチオ硫酸イオンのモニタリングを行った。モニタリングは週２回程度行った。

【0193】

この第１段処理が安定した後、１日当たりに流入するチオシアン酸イオン濃度、フェノール濃度、およびチオ硫酸イオン濃度が、それぞれ表３に示す値になるように被処理水２４を生物処理装置２０内に流入させた。各段とも少なくとも２週間程度運転することで、各段での処理水濃度の変動が安定することを確認してから、次の段に移行した。モニタリングは週２回程度行った。

【0194】

【表3】

【0195】

MBBR Run3による生物学的処理における、運転日数に対する一日当たりの亜硝酸生成速度、チオシアン除去速度、フェノール除去速度、およびチオ硫酸除去速度を、図１６、図１７、図１８、図１９にそれぞれ示す。図１６は、亜硝酸イオンのモニタリングの結果から得られた、運転日数一日当たりの亜硝酸イオン生成速度と運転日数との関係を示す図である。図１７は、チオシアン酸イオンのモニタリングの結果から得られた、運転日数一日当たりのチオシアン酸イオン除去速度と運転日数との関係を示す図である。また、図１８は、フェノールのモニタリングの結果から得られた、運転日数一日当たりのフェノール除去速度と運転日数との関係を示す図である。また、図１９は、チオ硫酸のモニタリングの結果から得られた、運転日数一日当たりのチオ硫酸除去速度と運転日数との関係を示す図である。

【0196】

＜微生物群の含有量の採取＞
本実施例では、ＤＮＡの抽出、塩基配列の解読、微生物群の決定、微生物群の含有量の採取を、この順で実行した。なお、微生物群の含有量の採取の手法は、特許文献１に記載されているように公知の技術で実現することができ、本実施例で説明する手法に限定されない。

【0197】

生物処理装置２０の生物処理領域２０ａ内の微生物が付着したスポンジ担体２１からのＤＮＡ抽出および次世代シーケンス微生物相解析は委託（日鉄環境株式会社）により実施した。
特定物質の量の変化速度の測定時点に対応した時点ごとに、微生物が付着したスポンジ担体２１を採取し、採取したスポンジ担体２１を４分割した後、Extrap Soil DNA Plus ver.2（日鉄環境）を用いてＤＮＡの抽出および精製を行った。
精製後のＤＮＡ溶液のＤＮＡ濃度を、PicoGreen dsDNA Assay Kit（Invitrogen）を用いて測定した。
表４に示すプライマーを用いて真正細菌の16S rRNA遺伝子のＶ４領域およびＶ５領域を対象にしたＰＣＲ増幅を行った。

【0198】

【表4】

【0199】

ＰＣＲ産物を、次世代シーケンサー（MiSeq）を用いて解析することで、塩基配列を決定した。
得られた塩基配列をQIIME（Quantitative Insights Into Microbial Ecology）パイプラインを用いて次の解析を行った。まず、データのクオリティ、キメラをチェックし、基準を満たした配列データのみフィルタリングした。
基準を満たした配列データについて、類似性の高い（相同性９７％以上の）配列データを１つのグループのクラスタとしてまとめ、各クラスタ配列の中で最も出現頻度の高い配列を代表ＯＴＵ（ＯＴＵ；Operational Taxonomic Unit；操作的分類単位）配列とし、その代表配列を用いて以降の解析を実施した。すなわち、検出された各ＯＴＵの存在および量が、一微生物群の存在および量を示すものとして扱った。これらＯＴＵは各試料で重複して検出されるもの、１試料のみから検出されるもの様々であった。また、各ＯＴＵの検出回数から全ＯＴＵに対する各ＯＴＵの相対割合を算出した。

【0200】

スポンジ担体２１に付着した真正細菌の遺伝子数をリアルタイムＰＣＲ法の一つであるQP-PCR法（日鉄環境株式会社）により定量した。具体的に、前述した精製後のＤＮＡ溶液を適宜希釈した後、表５に示すプライマーおよびQProbeを用いて反応液を調製し、Rotor-Gene Q（QIAGEN）により遺伝子数を定量した。

【0201】

【表5】

【0202】

採取日によってスポンジ担体２１に付着した微生物の総量は異なる。従って、生物学的排水処理プロセスの運転期間における各ＯＴＵの変動を正確に把握するため、前述した全ＯＴＵに対する各ＯＴＵの相対割合に、スポンジ担体２１に付着した真正細菌の遺伝子数を乗じることで、各ＯＴＵの量を決定した。

【0203】

＜標本データ＞
MBBR Run2を用いて採取された、或る運転日数における各特定物質の量の変化速度（亜硝酸生成速度、チオシアン除去速度、フェノール除去速度、チオ硫酸除去速度）と、当該運転日数における各微生物の含有量（ＯＴＵの量）とを、全運転日数においてそれぞれ求めたものを、MBBR Run2における標本データとした。
MBBR Run3を用いて採取された、或る運転日数における各特定物質の量の変化速度（亜硝酸生成速度、チオシアン除去速度、フェノール除去速度、チオ硫酸除去速度）と、当該運転日数における各微生物群の含有量（ＯＴＵの量）とを、全運転日数においてそれぞれ求めたものを、をMBBR Run3における標本データとした。

【0204】

＜第１回帰式＞
前述した標本データを用いて、各特定物質の量の変化速度を目的変数とし、各微生物群の含有量を説明変数とする多変量回帰式を構築した。
本実施例では、発明例１、発明例２、比較例１、および比較例２のそれぞれの手法で多変量回帰式を構築した。

【0205】

発明例１では、本実施形態で説明した手法でｑ＝４として多変量回帰式（（１）式）を構築した。
発明例２では、本実施形態で説明した手法でｑ＝１として４つの多変量回帰式（（１）式）を構築した（＜変形例３＞の欄を参照）。
比較例１では、MBBR Run2における標本データのみを用いて、共通影響因子と固有影響因子とを区別せずに全ての影響因子を同一の説明変数とする多変量回帰式を構築した。比較例２では、MBBR Run2における標本データとMBBR Run3における標本データとを用いて、共通影響因子と固有影響因子とを区別せずに全ての影響因子を同一の説明変数とする多変量回帰式を構築した。

【0206】

なお、比較例１～２における多変量回帰モデルとして、「Hastie, T., Tibshirani, R., Friedman, J. (2009) The Elements of Statistical Learning - Data Mining, Inference, and Prediction (Second Edition). Springer.」に記載されている多変量回帰モデルを用いた。

【0207】

＜結果＞
発明例１～２および比較例１～２の手法のそれぞれで実施した交差検証法における決定係数Ｒ²の値を表６に示す。

【0208】

【表6】

【0209】

表６において、発明例１と比較例１との結果を比較すると、MBBR Run2における標本データのみを用いて多変量回帰式を構築するよりも、本実施形態で説明したようにして多変量回帰式を構築する方が、予測精度が高くなることが分かる。

【0210】

また、比較例２に示すように、MBBR Run2における標本データとMBBR Run3における標本データとを単純に結合して多変量回帰式を構築すると、負の相関が観察され、異なる母集団（MBBRのRun）のデータ集合を無策で統合することによる悪影響が顕在化することが分かる。

【0211】

また、発明例２に示すように、ｑ＝１として実施形態で説明したようにして多変量回帰式を構築しても、ｑ＝４として実施形態で説明したようにして多変量回帰式を構築する発明例１よりは劣るものの、比較例１～２よりも予測精度が高くなることが分かる。

【0212】

また、発明例１の手法で構築した多変量回帰係数の第１回帰係数行列Ｂ^m、Ｃ^mにおいて０（零）以外の要素に対応する微生物群の種類を特定した結果、MBBR Run2とMBBR Run3に共通するとされた微生物群は１７５種、MBBR Run2に固有の微生物群は１５５種と判断された。このように、本実施形態で説明した手法では、２つのMBBRに共通して特定物質の除去に関わる微生物と固有の微生物とに区別することができることが分かる。

【0213】

次に、実施例２～３について説明する。実施例２～３においても、実施例１と同様に、生物学的排水処理プロセスにおいて、処理前後における特定物質の量の変化速度に影響を与える微生物種を特定する場合について説明する。また、本実施例でも実施例１と同様に、MBBR（Moving Bed Biofilm Reactor）により、２種類の人工排水（被処理水）それぞれにおける、特定物質の量の変化速度と微生物群の含有量とを標本データとして採取した。なお、実施例２～３においても、図１１に示す生物処理装置２０を用いて標本データを採取した。また、２種類の人工排水は、実施例１に示したMBBR Run2およびMBBR Run3と異なるものである。２種類の人工排水のうち一方の人工排水を処理するMBBRをMBBR Run1と称し、他方の人工排水を処理するMBBRをMBBR Run5と称することとする。MBBR Run1とMBBR Run5とでは、微生物群の含有量が異なる。

【0214】

なお、特定物質の量の変化速度の採取、ＤＮＡの抽出、塩基配列の解読、微生物群の決定、微生物群の含有量の採取、および標本データの作成については、実施例１の説明に倣って行った。これらの詳細については実施例１で行っており、また、実施例２～３では、各実施形態で説明した処理装置１００の機能が発揮されることを確認することを主目的とすることから、これらの詳細な説明を省略する。ただし、実施例２～３では、特定物質の量の変化速度として、チオシアン除去速度およびチオ硫酸除去速度を用い、亜硝酸生成速度およびフェノール除去速度を用いなかった。したがって、（３）式、（４）式、および（６）式のｑは２（ｑ＝２）になる。MBBR Run1の標本データの数は２２個であった。また、MBBR Run5の標本データの数は２８個であった。

【0215】

［実施例２］
次に、実施例２を説明する。実施例２では、第１～第３実施形態に関する実施例を説明する。
発明例３では、第１実施形態で説明した手法で第１回帰式（（１）式）を構築した。
発明例４では、第２実施形態で説明した手法で第２回帰式（（２８）式）をリッジ回帰により構築した。

【0216】

発明例３～４の手法のそれぞれで実施した交差検証法における決定係数Ｒ²の値を表７に示す。なお、交差検証法においては、前述の２２個のMBBR Run1の標本データと、２８個のMBBR Run5の標本データの組からランダムに１つずつ標本データを抽出して残りの標本データを用いて第１回帰式（第１回帰係数行列Ｂ^m、Ｃ^m）および第２回帰式（第２回帰係数行列Ξ^m）を算出し、標本データの説明変数を第１回帰式および第２回帰式に代入することにより目的変数を算出することを、前述の標本データの全ての組を１つずつ抽出した場合について行った。そして、標本データの説明変数を第１回帰式および第２回帰式に代入することにより算出した目的変数と、当該標本データの目的変数と、の散布図から決定係数Ｒ²を算出した。

【0217】

【表7】

【0218】

発明例４では、発明例３で構築した第１回帰式の第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qのうち、０（零）以外の値の第１回帰係数に乗算される影響因子（共通影響因子および固有影響因子）を特定し、第２回帰式における説明変数を、当該特定した影響因子を説明変数とした。

【0219】

チオ硫酸の変化速度が目的変数である場合、交差検証法において算出された共通影響因子の数の平均値は７８．１個であった。また、チオシアンの変化速度が目的変数である場合、交差検証法において算出された共通影響因子の数の平均値は１４５．８個であった。また、チオ硫酸の変化速度が目的変数である場合、交差検証法において算出された固有影響因子の数の平均値は、MBBR Run1において１４．６個であり、MBBR Run5において２９．５個であった。また、チオシアンの変化速度が目的変数である場合、交差検証法において算出された固有影響因子の数の平均値は、MBBR Run1において１３．６個であり、MBBR Run5において４１．５個であった。

【0220】

また、発明例４において、チオ硫酸の変化速度が目的変数である場合の正則化係数λ_k（（２８）式の第２項）の値を０．０１とした（λ_k＝０．０１）。また、チオシアンの変化速度が目的変数である場合の正則化係数λ_k（（２８）式の第２項）の値を０．１とした（λ_k＝０．１）。

【0221】

第１回帰式および第２回帰式のいずれを用いるかは、母集団ｍの環境などに応じて定めればよいことになるが、表７に示すように本実施例においては、第３実施形態で説明したように第２回帰式を用いる方が第１実施形態で説明したように第１回帰式を用いる場合よりも、決定係数Ｒ²の値が大きくなったので、第２回帰式を用いるのが好ましいことが分かる。ただし、第１回帰式を用いても決定係数Ｒ²の値は実用上使用できる精度である。

【0222】

なお、前述したように、MBBR Run1およびMBBR Run5の標本データの数の和は５０個（＝２２＋２８）であり、本実施例では、説明変数の数（共通影響因子および固有影響因子の総数）が標本データの数よりも多くなった。したがって、線形回帰により第２回帰式（第２回帰係数行列Ξ^m）を算出することができなかった。

【0223】

［実施例３］
次に、実施例３を説明する。実施例３では、第４実施形態に関する実施例を説明する。
発明例５では、第４実施形態で説明したようにBootstrap法を用いて標本データを再標本化して１０００個（ＮＬ＝１０００）の第１回帰式（（１）式）を構築し、１０００個の第１回帰式（ＮＬ組の第１回帰係数行列Ｂ^m、Ｃ^m）に基づいて特定影響因子を特定し、当該特定影響因子を説明変数とする第２回帰式（（２８）式）を線形回帰により構築した。

【0224】

本実施例では標本データセットの数ＮＬを１０００個（ＮＬ＝１０００）とし、ＮＬ'／ＮＬに対する基準値を１とした。すなわち、第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qのうち、１０００組の第１回帰係数行列Ｂ^m、Ｃ^mの全てにおいて０（零）以外の値を有する第１回帰係数に乗算される影響因子（共通影響因子および固有影響因子）のみを、特定影響因子（被影響因子に影響を与える共通影響因子および固有影響因子）として特定した。

【0225】

その結果、チオ硫酸の変化速度が目的変数である場合、第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qのうち、０（零）以外の値を有する第１回帰係数に乗算される共通影響因子の数は、（２２７個中）７３個であった。そのうち、１０００組の第１回帰係数行列Ｂ^m、Ｃ^mの全てにおいて０（零）以外の値を有する第１回帰係数に乗算される共通影響因子の数は、（２２７個中）１９個であった。

【0226】

また、チオ硫酸の変化速度が目的変数である場合、第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qのうち、０（零）以外の値を有する第１回帰係数に乗算される固有影響因子の数は、MBBR Run1において（１６１個中）１４個であり、MBBR Run5において（１５２個中）１３０個であった。そのうち、１０００組の第１回帰係数行列Ｂ^m、Ｃ^mの全てにおいて０（零）以外の値を有する第１回帰係数に乗算される固有影響因子の数は、MBBR Run1において（１６１個中）０個であり、MBBR Run5において（１５２個中）４個であった。

【0227】

一方、チオシアンの変化速度が目的変数である場合、第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qのうち、０（零）以外の値を有する第１回帰係数に乗算される共通影響因子の数は、（２２７個中）１３７個であった。そのうち、１０００組の第１回帰係数行列Ｂ^m、Ｃ^mの全てにおいて０（零）以外の値を有する第１回帰係数に乗算される共通影響因子の数は、（２２７個中）７９個であった。

【0228】

また、チオシアンの変化速度が目的変数である場合、第１回帰係数β^m _1,1，・・・，β^m _p,q、ｃ^m _1,1，・・・，ｃ^m _rm,qのうち、０（零）以外の値を有する第１回帰係数に乗算される固有影響因子の数は、MBBR Run1において（１６１個中）１５個であり、MBBR Run5において（１５２個中）３８個であった。そのうち、１０００組の第１回帰係数行列Ｂ^m、Ｃ^mの全てにおいて０（零）以外の値を有する第１回帰係数に乗算される固有影響因子の数は、MBBR Run1において（１６１個中）４個であり、MBBR Run5において（１５２個中）１５個であった。

【0229】

以上のように、チオシアンの変化速度が目的変数である場合、特定影響因子の数（共通影響因子および固有影響因子の総数）は９７個（＝７９＋３＋１５）になった。前述したように、MBBR Run1およびMBBR Run5の標本データの数の和は５０個（＝２２＋２８）であった。したがって、チオシアンについては、線形回帰により第２回帰式（第２回帰係数行列Ξ^m）を算出することができなかった。

【0230】

一方、チオ硫酸の変化速度が目的変数である場合、特定影響因子の数（共通影響因子および固有影響因子の総数）は２３個（＝１９＋０＋４）になり、MBBR Run1およびMBBR Run5の標本データの数の和（＝５０個）よりも少なくなった。したがって、チオ硫酸の変化速度を目的変数とする第２回帰式を線形回帰により算出した。

【0231】

そして、本実施例では、前述の２２個のMBBR Run1の標本データと、２８個のMBBR Run5の標本データを用いて第１回帰式（第１回帰係数行列Ｂ^m、Ｃ^m）および第２回帰式（第２回帰係数行列Ξ^m）を算出し、算出した標本データの目的変数と、当該標本データの目的変数と、の散布図から決定係数Ｒ²を算出した。その結果、以下の表８に示すように、決定係数Ｒ²は０．８７８となった。

【0232】

【表8】

【0233】

実施例２においてはチオ硫酸の変化速度を目的変数とする第２回帰式を算出することができなかったが、Bootstrap法を用いて影響因子の数を絞り込むことで、チオ硫酸の変化速度を目的変数とする第２回帰式として、実用上使用できる精度の第２回帰式を線形回帰により算出することができた。ただし、チオシアンの変化速度を目的変数とする第２回帰式を算出することができなかった。

【0234】

そこで、発明例６では、発明例５のようにして特定した影響因子を説明変数とする第２回帰式（（２８）式）を（線形回帰ではなく）リッジ回帰により構築した。そして、標本データの説明変数（ｘ^m _1,1，・・・，ｘ^m _nm,p、ｚ^m _1,1，・・・，ｚ^m _nm,rm）を第２回帰式に代入することにより算出される目的変数（ｙ^m _1,1，・・・，ｙ^m _nm,q）と、標本データの目的変数と、から決定係数Ｒ²を算出した。その結果を表８に示す。

【0235】

本実施例の発明例６においてはチオシアンの変化速度を目的変数とする第２回帰式を算出することができなかったが、Bootstrap法を用いて影響因子の数を絞り込んだうえでリッジ回帰を行うことで、チオシアンの変化速度を目的変数とする第２回帰式として、実用上使用できる精度の第２回帰式を線形回帰により算出することができた。

【0236】

（実施形態の開示）
なお、以上説明した本実施形態の開示は、例えば、次のようになる。
［開示１］
複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す回帰式における回帰係数を算出する処理を実行する処理装置であって、
前記複数の影響因子のデータと、前記少なくとも１つの被影響因子のデータと、をそれぞれが含む複数の標本データとして、複数の母集団のそれぞれにおける複数の標本データを取得する標本データ取得手段と、
前記複数の標本データのうち、前記複数の母集団の全てに存在する前記影響因子である共通影響因子のデータを抽出することと、前記複数の標本データのうち、前記共通影響因子と異なる前記影響因子である非共通影響因子のデータを抽出することと、を実行する標本データ抽出手段と、
前記被影響因子のデータと、前記共通影響因子のデータと、前記非共通影響因子のデータと、を用いて、スパース正則化を適用した回帰分析を実行することにより、第１回帰式における第１回帰係数を前記回帰係数として算出する第１回帰係数算出手段と、
を有し、
前記第１回帰式の説明変数は、前記共通影響因子と、前記非共通影響因子と、を含み、
前記第１回帰式の目的変数は、前記被影響因子を含み、
前記第１回帰式は、前記共通影響因子の値を要素とする共通影響因子行列と、当該共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、前記非共通影響因子の値を要素とする非共通影響因子行列と、当該非共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、を別々の項として含み、
前記第１回帰係数算出手段は、前記第１回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、前記共通影響因子に対する前記第１回帰係数のスパース正則化項と、前記非共通影響因子に対する前記第１回帰係数のスパース正則化項と、を含むコスト関数を用いて、前記第１回帰式における前記第１回帰係数を算出する、処理装置。
［開示２］
前記共通影響因子に対する前記第１回帰係数のスパース正則化項は、グループＬａｓｓｏによるスパース正則化項であり、
前記非共通影響因子に対する前記第１回帰係数のスパース正則化項は、Ｌａｓｓｏによるスパース正則化項である、開示１に記載の処理装置。
［開示３］
前記非共通影響因子は、前記複数の母集団のうち、１つの前記母集団にしか存在しない固有の前記影響因子である固有影響因子を含む、開示１または２に記載の処理装置。
［開示４］
前記被影響因子は、複数あり、
前記第１回帰式は、多変量回帰式である、開示１～３の何れか１つに記載の処理装置。
［開示５］
前記第１回帰係数算出手段により算出された前記第１回帰係数に基づいて、前記被影響因子に影響を与える前記影響因子を特定する影響因子特定手段を更に有する、開示１～４の何れか１つに記載の処理装置。
［開示６］
前記標本データを用いた回帰分析を行うことにより、前記影響因子特定手段により特定された前記影響因子と、前記被影響因子との関係を表す第２回帰式における第２回帰係数を前記回帰係数として算出する第２回帰係数算出手段を有する、開示５に記載の処理装置。
［開示７］
前記第２回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、Ｌ２正則化項と、を含むコスト関数を用いて、前記第２回帰式における前記第２回帰係数を算出する、開示６に記載の処理装置。
［開示８］
前記標本データ取得手段は、前記複数の標本データを用いて再標本化を行うことにより、前記複数の母集団に対する前記標本データを含み、且つ、前記複数の母集団に対する前記標本データとしてそれぞれ複数の前記標本データを含む標本データセットを複数作成し、
前記標本データ抽出手段は、前記標本データセットに含まれる複数の前記標本データから前記共通影響因子のデータおよび前記非共通影響因子のデータを抽出することを、複数の前記標本データセットのそれぞれに対して行い、
前記第１回帰係数算出手段は、１つの前記標本データセットから前記標本データ抽出手段により抽出された前記共通影響因子のデータおよび前記非共通影響因子のデータを用いて前記第１回帰係数を算出することを、複数の前記標本データセットのそれぞれについて行うことにより、前記第１回帰式における前記第１回帰係数として複数通りの前記第１回帰係数を算出し、前記影響因子特定手段は、前記複数通りの第１回帰係数に基づいて、前記被影響因子に影響を与える前記影響因子を特定する、開示５～７の何れか１つに記載の処理装置。
［開示９］
開示１～８の何れか１つに記載の処理装置で算出された前記回帰係数を回帰係数とする回帰式を用いて前記被影響因子の値を算出する処理を実行する処理装置であって、
前記複数の影響因子のうち少なくとも２つの影響因子のデータを含む評価用データを取得する評価用データ取得手段と、
前記評価用データから、前記共通影響因子のデータを抽出することと、前記評価用データから、前記非共通影響因子のデータを抽出することと、を実行する評価用データ抽出手段と、
前記評価用データ抽出手段により抽出された前記共通影響因子のデータと、前記評価用データから前記評価用データ抽出手段により抽出された前記非共通影響因子のデータと、開示１～４の何れか１項に記載の処理装置で算出された前記回帰係数を回帰係数とする回帰式と、に基づいて、前記被影響因子の値を算出する被影響因子算出手段と、
を有する、処理装置。
［開示１０］
前記母集団は、処理プロセスであり、
前記複数の処理プロセスにおける前記複数の影響因子の組み合わせは相互に異なり、
前記影響因子は、前記処理プロセスで処理する際に前記処理プロセスにおける処理に用いられる因子であり、
前記被影響因子は、前記影響因子を用いて前記処理プロセスで処理されることにより得られる因子である、開示１～９の何れか１項に記載の処理装置。
［開示１１］
前記処理プロセスは、特定物質を含む被処理水に存在する微生物群を用いて前記被処理水を処理する処理プロセスであり、
前記影響因子は、前記微生物群の量に関する因子であり、
前記被影響因子は、前記特定物質の量の変化速度に関する因子である、開示１０に記載の処理装置。
［開示１２］
複数の影響因子と、当該複数の影響因子により影響を受ける少なくとも１つの被影響因子との関係を表す回帰式における回帰係数を算出する処理を実行する処理方法であって、
前記複数の影響因子のデータと、前記少なくとも１つの被影響因子のデータと、をそれぞれが含む複数の標本データとして、複数の母集団のそれぞれにおける複数の標本データを取得する標本データ取得工程と、
前記複数の標本データのうち、前記複数の母集団の全てに存在する前記影響因子である共通影響因子のデータを抽出することと、前記複数の標本データのうち、前記共通影響因子と異なる前記影響因子である非共通影響因子のデータを抽出することと、を実行する標本データ抽出工程と、
前記被影響因子のデータと、前記共通影響因子のデータと、前記非共通影響因子のデータと、を用いて、スパース正則化を適用した回帰分析を実行することにより、第１回帰式における第１回帰係数を前記回帰係数として算出する第１回帰係数算出工程と、
を有し、
前記第１回帰式の説明変数は、前記共通影響因子と、前記非共通影響因子と、を含み、
前記第１回帰式の目的変数は、前記被影響因子を含み、
前記第１回帰式は、前記共通影響因子の値を要素とする共通影響因子行列と、当該共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列と、を含む項と、前記非共通影響因子の値を要素とする非共通影響因子行列と、当該非共通影響因子に対する前記第１回帰係数の値を要素とする回帰係数行列とを含む項と、を別々の項として含み、
前記第１回帰係数算出工程では、前記第１回帰式で算出される前記被影響因子の値と、前記標本データにおける前記被影響因子の値と、の差を表す損失関数と、前記共通影響因子に対する前記第１回帰係数のスパース正則化項と、前記非共通影響因子に対する前記第１回帰係数のスパース正則化項と、を含むコスト関数を用いて、前記第１回帰式における前記第１回帰係数を算出する、処理方法。
［開示１３］
前記第１回帰係数算出工程により算出された前記第１回帰係数に基づいて、前記被影響因子に影響を与える前記影響因子を特定する影響因子特定工程を更に有する、開示１２に記載の処理方法。
［開示１４］
開示１２または１３に記載の処理方法で算出された前記回帰係数を回帰係数とする回帰式を用いて前記被影響因子の値を算出する処理を実行する処理方法であって、
前記複数の影響因子のうち少なくとも２つの影響因子のデータを含む評価用データを取得する評価用データ取得工程と、
前記評価用データから、前記共通影響因子のデータを抽出することと、前記評価用データから、前記非共通影響因子のデータを抽出することと、を実行する評価用データ抽出工程と、
前記評価用データ抽出工程により抽出された前記共通影響因子のデータと、前記評価用データから前記評価用データ抽出工程により抽出された前記非共通影響因子のデータと、開示１２または１３に記載の処理方法で算出された前記回帰係数を回帰係数とする回帰式と、に基づいて、前記被影響因子の値を算出する被影響因子算出工程と、
を有する、処理方法。
［開示１５］
開示１～１１の何れか１項に記載の処理装置の各手段としてコンピュータを機能させるためのプログラム。

【符号の説明】

【0237】

２０生物処理装置
２０ａ生物処理領域
２０ｂ沈降領域
２１スポンジ担体
２２空気曝気
２３隔壁
２４被処理水
２５処理水
１００処理装置
１１０標本データ取得部
１２０標本データ抽出部
１３０第１回帰係数算出部
１４０影響因子特定部
１５０特定影響因子出力部
１６０評価用データ取得部
１７０評価用データ抽出部
１８０被影響因子算出部
１９０被影響因子出力部
２００第２回帰係数算出部
９００～９０３標本データセット

【図1】