IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 高月 峰夫の特許一覧

特許7495674化合物の環境・生体有害性の評価方法及び設計方法、化学物質の製造方法、化合物並びに化学物質
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-28
(45)【発行日】2024-06-05
(54)【発明の名称】化合物の環境・生体有害性の評価方法及び設計方法、化学物質の製造方法、化合物並びに化学物質
(51)【国際特許分類】
   G16C 20/30 20190101AFI20240529BHJP
【FI】
G16C20/30
【請求項の数】 3
(21)【出願番号】P 2023502319
(86)(22)【出願日】2022-02-16
(86)【国際出願番号】 JP2022006164
(87)【国際公開番号】W WO2022181420
(87)【国際公開日】2022-09-01
【審査請求日】2023-03-07
【審判番号】
【審判請求日】2023-12-13
(31)【優先権主張番号】P 2021028723
(32)【優先日】2021-02-25
(33)【優先権主張国・地域又は機関】JP
(31)【優先権主張番号】P 2021145421
(32)【優先日】2021-09-07
(33)【優先権主張国・地域又は機関】JP
【早期審理対象出願】
(73)【特許権者】
【識別番号】521082477
【氏名又は名称】高月 峰夫
(74)【代理人】
【識別番号】100151367
【弁理士】
【氏名又は名称】柴 大介
(72)【発明者】
【氏名】高月 峰夫
【合議体】
【審判長】瀬良 聡機
【審判官】野田 定文
【審判官】冨永 保
(56)【参考文献】
【文献】特開2019-20791(JP,A)
【文献】特開2017-97803(JP,A)
【文献】国際公開第2017/203601(WO,A1)
【文献】吉澤一成,特集「応用物理における計算科学の現状と将来展望」,応用物理,74(8),岩瀬暢男編集兼発行人,社団法人応用物理学会発行,2005年8月10日,p.1039~1044
【文献】高塚和夫,巨大分子系の計算化学 超大型計算機時代の理論化学の新展開,公益社団法人日本化学会編,株式会社化学同人発行,2012年3月30日,p.12~22
(58)【調査した分野】(Int.Cl.,DB名)
G16C10/00-99/00
(57)【特許請求の範囲】
【請求項1】
化合物の化学構造パラメータに基づく前記化合物の環境及び生体に対する有害性の評価方法であって、前記化学構造パラメータが、
前記化合物のPNQi(i=1,2,3)であって、前記PNQ及び/若しくは前記PNQ、並びに/又は前記PNQである非量子構造化学パラメータと、
前記化合物の量子化学構造パラメータPQ(j=1,2,3,4,5)からなる群から選ばれる1以上のパラメータである量子化学構造パラメータとを含み、
前記PNQは前記化合物中の窒素原子の有無を示すパラメータ;
前記PNQは前記化合物中のカテコール可能位置を示すパラメータ;そして、
前記PNQは前記化合物中の芳香環の有無を示すパラメータであり、
前記PQは前記化合物中の分極の程度を示すパラメータ;
前記PQは前記化合物中の窒素原子の最大の電荷を示すパラメータ;
前記PQは前記化合物中のフロンティア軌道間のエネルギー差を示すパラメータ:
前記PQは前記化合物中のフロンティア軌道の対称性を示すパラメータ;そして、
前記PQは前記化合物中のフロンティア軌道の位相を示すパラメータであり、
前記有害性の指標の実験値が既知の化合物(既知化合物)の前記実験値と相関の高い、前記既知化合物の、少なくとも前記非量子構造化学パラメータと前記量子化学構造パラメータとを含む化学構造パラメータの組合せを選択するステップ1及び、
有害性の指標の実験値が未知の化合物(未知化合物)の有害性を、前記未知化合物の前記化学構造パラメータの組合せで評価するステップ2を行い、
前記ステップ2において、下記〔評価基準〕:
〔評価基準〕前記ステップ1で選択された前記化学構造パラメータを説明変数とし、前記有害性の予測値を被説明変数とする式について、既知化合物を用いた重回帰分析により、前記式を計算するステップ2-1を行い、前記未知化合物の前記化学構造パラメータを前記計算した式に適用するステップ2-2を行って前記未知化合物の有害性の予測値を評価する;
を採用する前記未知化合物の有害性の評価方法。
【請求項2】
前記有害性の指標の実験値が既知の化合物の前記実験値を被説明変数V
前記化合物の化学構造パラメータを説明変数として、
前記被説明変数Vと前記説明変数を使用した統計解析モデル又は機械学習で計算される前記被説明変数Vの予測値VPEとの一致度が所定の目標値を超えるように、前記化学構造パラメータを選択して、
前記被説明変数Vと前記選択された説明変数を使用した統計解析モデル又は機械学習で計算される前記被説明変数Vの予測値Vが、有害性が低いと評価される被説明変数Vの範囲への属否によって環境及び生体に対する有害性を評価し、
前記一致度は、
前記被説明変数Vと前記予測値VPEとの単回帰分析による相関係数であるか、
前記化合物の全数に対する、前記被説明変数Vと前記予測値VPEの組合せ(VE,PE)の前記被説明変数Vと前記予測値VPEのどちらもが前記有害性が低いと評価される前記指標の範囲に入る数の割合である、
請求項1記載の環境及び生体に対する有害性の評価方法。
【請求項3】
前記化合物の環境に対する有害性の指標が、
生分解性の指標であるBOD、DOC及び分解度からなる群からなる指標から選ばれる1以上の指標であり、
前記環境及び生体に対する有害性の指標が、
EC50、LD50、LC50、NOEC、LOEC、NOEL及びLOELからなる群からなる指標から選ばれる1以上の指標である請求項1又は2記載の環境及び生体に対する有害性の評価方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、化合物の生分解性を含む環境及び生体に対する有害性(以下「環境・生体有害性」ともいう)の評価方法、設計方法、製造方法、当該設計方法で設計された化合物、当該製造方法で製造されうる化学物質に関する。
【背景技術】
【0002】
化合物や化学物質の生物や人の健康への悪影響は、人間の安全・安心な生活にとって重要な問題であるという国際的な認識の下、ストックホルム条約においては、 1)残留性 2)生物蓄積性 3)長距離移動性 4)人の健康や生態系に対する有害性 を指標とするPOPs(Persistent Organic Pollutants,残留性有機汚染物質)が指定され、その生産・販売を禁止することとされている。
【0003】
(残留性)
これらの指標のうち残留性は、環境中で化合物が光や微生物により分解されることなく、環境中で長時間残留する可能性である環境に対する有害性を評価することとなる。
【0004】
環境中での残留性に大きく寄与するのは、水中や土壌中に生息する微生物による化合物の分解性、すなわち生分解性である。このため、既存の化合物の安全性評価や新規化学物質の開発において、化合物の微生物による生分解性が評価されている。
【0005】
POPsに対しては、化合物の生分解性の評価軸として、日本国内ではOECDテストガイドライン301C法が採用されており、化合物と好気性微生物の混合体を添加した水溶液中における生化学的学的酸素要求量(BOD)が測定され、4週間後のBOD分解度が60%以上となることが、良分解性の基準とされている。
【0006】
BODに基づいて化合物の生分解性が良分解性と判断された場合、「生物蓄積性」や「人の健康や生態系に対する有害性」の評価を行う必要がない場合があるため、化合物のBODは、POPsの指標としては最も重要な基本的指標である。
【0007】
(生物蓄積性)
上記の指標における生物蓄積性は、環境中にある量が少なくても、生物に蓄積しやすいため、食物連鎖による生物濃縮によってより高次の捕食者の体内に高い濃度で蓄積してしまうことによる悪影響に対する懸念が反映された生体に対する有害性である。
【0008】
生物蓄積性は化学物質の生物濃縮度(BCF=魚体中濃度/水中濃度)であらわされ、5000以上が高濃縮性として規制される。
【0009】
生物濃縮度は、オクタノールと水の混合物に物質を溶解させたときのオクタノール中の物質濃度と水中の物質濃度の比であるオクタノール/水分配係数(Kow)と相関性が高いとされ、BCFの5000以上は、Kowの常用対数値LogKowの5以上に相当するとされる(非特許文献9)。
【0010】
なお、LogKowが大きいほど化学物質は油脂に溶けやすく、水に溶けにくい、すなわち生物体内に蓄積しやすいことになる。
【0011】
(長距離移動性)
上記の指標における長距離移動性は、POPsが環境中で分解されにくいため、例えば、発生・使用時に飛散したり、揮発したりして空気中に拡散したものが、大気の流れに乗って移動し、冷たい空気に触れることで地上に降下することが考えられ、これを繰り返して、熱帯や亜熱帯、温暖な地域で環境中に排出されたPOPsが、中緯度地方や極域へと長距離を移動して、地球全体に広範囲に移動・拡散することを考慮した指標である。
【0012】
従って、長距離移動性は、残留性(従って、生分解性)と相関の高い指標であると考えられる。
【0013】
(人の健康や生態系に対する有害性)
生体に対する有害性としての、人を含む哺乳動物の健康や生態系を構成する環境生物に対する有害性については、環境生物に対する有害性は半数影響濃度(EC50)又は半数致死濃度(LC50)を、哺乳動物に対する有害性は半数致死量(LD50)を指標とする場合がある。
【0014】
EC50又はLC50は、環境中の生物を用いた有害性試験で、1群の実験生物の50%に影響を与えるあるいは死亡に至る化合物の濃度をいい、LogKowと相関があるといわれており、LogKowからEC50やLC50を含む生態毒性の予測システムとして環境省が生態毒性予測システム「KATE(ケイト)」を公開している(https://kate.nies.go.jp/onnet.html)。
【0015】
環境中の生物を用いた試験に於いて、EC50は主に藻類、甲殻類、LC50は魚類について測定されている。
【0016】
LD50は、1回の投与で1群の実験動物の50%を死亡させると予想される単回投与量をいい、哺乳動物に対する短期毒性の指標とされ、哺乳動物に対する長期毒性(慢性毒性)を予想するための指標ともされる。
【0017】
EC50及びLD50は、しばしば、環境・生体有害性の評価対象となる化合物の分子量(M)当りの数値であるEC50/M、LC50/M、LD50/M、さらにその逆数の対数であるLog(1/EC50/M)、Log(1/LD50/M)、Log(1/LD50/M)を指標とする場合がある。
【0018】
しかし、BODによる生分解性試験や、生物を用いてEC50、LC50、LD50を求める毒性試験は時間を要し、その費用は1化合物当たり数百万円と高価であるため、化合物の開発段階や製品設計等において、例えば、BODによる生分解性試験を行う必要のある化合物を絞り込むために、化合物の生分解性を簡単かつ安価に評価する方法でスクリーニングできることが望まれている。
【0019】
BODの測定によらない化合物の生分解性の評価方法としては、化合物の化学式等の化学構造に基づく計算によって当該化合物のBODを予測することが検討されてきた。
【0020】
例えば、非特許文献1では、42の部分構造及び分子量を記述子とし、下記式(1)
=a+Σa+am+1MW (1)
(式(1)中、Yは化学物質jが良分解性となる確率;aは定数項;a(p=1.2.・・・,m(mは自然数))は化学物質jの部分構造pの回帰係数;f(p=1.2.・・・,m(mは自然数))は化学物質jの部分構造pの数;MWは化学物質jの分子量である)により算出されたYが0.5以上で良分解性、0.5未満で難分解性と判定される。
【0021】
非特許文献1では、42の部分構造に対して表1に示す回帰係数が割り当てられている。
【先行技術文献】
【非特許文献】
【0022】
【文献】(独)製品評価技術基盤機構化学物質管理センター「OECD原則に基づく構造活性相関モデルのバリエーション」(2006年6月23日)
【文献】菊池修「分子軌道法―電子計算機によるその活用」(1989)講談社
【文献】時田澄男・富永信秀「BASICによる分子軌道法入門」(1987)共立出版)
【文献】化学便覧 基礎編II 改訂5版(2004)丸善
【文献】CRC Handbook of Chemistry and Physics(1997)
【文献】Compendium of Chemical Terminology,2nd ed.(the "Gold Book")(1997)
【文献】染川賢一「有機分子の分子軌道計算と活用」(2013)九州大学出版会
【文献】総務省「ICTスキル総合習得教材 3-5:人工知能と機械学習」https://www.soumu.go.jp/ict_skill/pdf/ict_skill_3_5.pdf
【文献】環境省「POPs残留性有機汚染物質」(2016年3月)http://www.env.go.jp/air/dioxin/2016POPs.pdf
【0023】
【表1】
【発明の概要】
【発明が解球決しようとする課題】
【0024】
一方で、化合物の生分解性、並びに、環境生物及び人を含む哺乳動物を含む生体に対する有害性と化合物の化学構造を特徴づけるパラメータ(以下「化学構造パラメータ」という)との関係や、当該関係を検討する基礎となる化合物の官能基構造と化学構造パラメータとの関係は、化合物の生分解や生体反応時の反応機構を考慮して適切に考察されておらず、これらの関係はほとんど解明されていない。
【0025】
そのため、非特許文献1にみられるように、従来の計算による化合物の生分解性の評価方法では、化学構造パラメータは、化合物の部分構造の化学式と分子量だけであり、化合物の生分解や生体反応時の反応機構が考慮されていないため、評価の信頼性が十分とはいえない。
【0026】
本発明は、化合物の生分解時や生体反応時の反応機構を考慮して選択された、量子化学に基づいて開発された分子軌道法で計算される化合物の軌道エネルギーや電子の分布の情報等に基く化学構造パラメータ(以下「量子化学構造パラメータ」という)を利用して、化合物の生分解性及び生体有害性の評価方法、当該評価方法で生分解性を評価する工程を含む化合物の設計方法、当該設計方法で設計された化合物、当該評価方法で生分解性を評価する工程を含む化学物質の製造方法及び当該製造方法で製造されうる化学物質を提供することを課題とする。
【課題を解決するための手段】
【0027】
本発明は、
〔1〕化合物の化学構造パラメータに基づく前記化合物の環境及び生体に対する有害性の評価方法であって、前記化学構造パラメータが、前記化合物の量子化学構造パラメータを含む化合物の環境及び生体に対する有害性の評価方法(以下「本発明1」という);
〔2〕前項〔1〕記載の評価方法で化合物の生分解性を評価する工程を含む、前項〔1〕記載の化合物の設計方法(以下「本発明2」という); 及び
〔3〕前項〔2〕記載の設計方法で設計された化合物(以下「本発明3」という)。
〔4〕前項〔1〕記載の評価方法で、化学物質の製造工程で製造される化合物の生分解性を評価する工程を含む、化学物質の製造方法(以下「本発明4」という)。
〔5〕前項〔4〕記載の化学物質の製造方法で得られうる化学物質(以下「本発明5」という)。
【0028】
以下、本発明1~5をまとめて「本発明」ともいう。
【発明の効果】
【0029】
本発明によれば、化合物の生分解時や生体反応時の反応機構を考慮して選択された、量子化学に基づいて開発された分子軌道法で計算される軌道エネルギーや電子の分布の情報等に基く化学構造パラメータ(以下「量子化学構造パラメータ」という)を利用して、化合物の生分解性及び生体に対する有害性の評価方法、当該評価方法で生分解性及び生体に対する有害性を評価する工程を含む化合物の設計方法、当該設計方法で設計された化合物、当該評価方法で生分解性及び生体に対する有害性を評価する工程を含む化学物質の製造方法及び当該製造方法で製造されうる化学物質を提供することができる。
【0030】
なお、本明細書において、非量子化学構造パラメータとは、量子力学に基づく量子化学の概念が導入される以前から確立されている化合物の化学構造を特徴づける化学式及び物性値であり、原子の名称、分子の名称、周期律表に基づく原子の分類、分子式・組成式等の化学構造式、原子量、分子量、融点、沸点、蒸気圧、水溶解度、水・オクタノール分配係数、解離定数、熱力学的物性値、統計力学的物性値等が挙げられる。
【0031】
化学構造パラメータは、量子化学構造パラメータと非量子化学構造パラメータとを含む。
【図面の簡単な説明】
【0032】
図1】ベンゼン環が酸化されてカテコールを形成する反応と、ベンゼン環のカテコール可能位置の模式図である。
図2】ベンゼン環の上面視にて図示された、カテコール可能位置における、o-シメン、m-シメン、p-シメンのLUMO1フロンティア軌道である。
図3】ベンゼン環の上面視にて図示された、カテコール可能位置における、2,6-キシレノールと1,2,4-トリメチルベンゼンのLUMO1フロンティア軌道である。
図4】C1及びC2の重心を結ぶ直線に垂直な直線が、上面視のLUMO1フロンティア軌道の断面積が最大の断面の輪郭によって切り取られてなる線分L及びLの模式図である。
図5】カルボニル基含有化合物のβ酸化の反応機構の模式図である。
図6】アセチルCoAを含有するカルボニル基含有化合物のβ酸化の模式図である。
図7】酸素によるベンゼン環の開裂機構の模式図である。
図8】化合物のBODと窒素原子の有無の関係を示す図である。
図9】窒素原子を含まない脂肪族化合物のBODと最大分極の関係を示す図である。
図10】窒素原子を含まない脂肪族化合物のBODとΔEHLの関係を示す図である。
図11】窒素原子を含まない脂肪族化合物のBODとΔELLの関係を示す図である。
図12】窒素原子を含まない芳香族化合物のBODと最大分極の関係を示す図である。
図13】窒素原子を含まない芳香族化合物のBODとΔEHLの関係を示す図である。
図14】窒素原子を含まない芳香族化合物のBODとΔELLの関係を示す図である。
図15】窒素原子を含む脂肪族化合物のBODと最大分極の関係を示す図である。
図16】窒素原子を含む脂肪族化合物のBODとN分極の関係を示す図である。
図17】窒素原子を含む脂肪族化合物のBODとN電荷の関係を示す図である。
図18】窒素原子を含む脂肪族化合物のBODとΔEHLの関係を示す図である。
図19】窒素原子を含む脂肪族化合物のBODとΔELLの関係を示す図である。
図20】窒素原子を含む芳香族化合物のBODと最大分極の関係を示す図である。
図21】窒素原子を含む芳香族化合物のBODとN分極の関係を示す図である。
図22】窒素原子を含む芳香族化合物のBODとN電荷の関係を示す図である。
図23】窒素原子を含む芳香族化合物のBODとΔEHLの関係を示す図である。
図24】窒素原子を含む芳香族化合物のBODとΔELLの関係を示す図である。
図25】窒素原子を含む脂肪族化合物のN分極とN結合形態との関係を示す図である。
図26】窒素原子を含む脂肪族化合物のN電荷とN結合形態との関係を示す図である。
図27】窒素原子を含む脂肪族化合物のΔEHLとN結合形態との関係を示す図である。
図28】窒素原子を含む脂肪族化合物のΔELLとN結合形態との関係を示す図である。
図29】窒素原子を含む芳香族化合物のN分極とN結合形態との関係を示す図である。
図30】窒素原子を含む芳香族化合物のN電荷とN結合形態との関係を示す図である。
図31】窒素原子を含む芳香族化合物のΔEHLとN結合形態との関係を示す図である。
図32】窒素原子を含む芳香族化合物のΔELLとN結合形態との関係を示す図である。
図33】ニューラルネットワーク分析の手順の1例を示す図である。
図34】ディープラーニング分析の手順の1例を示す図である。
図35】本発明1の手順の1例を示すフローチャート図である。
図36-1】BODが既知の脂肪族・脂環式化合物のBODと予測値VPEの相関プロットである。
図36-2】BODが既知の芳香族化合物のBODと予測値VPEの相関プロットである。
図37-1】Log(1/EC50/MW)が既知の化合物のLog(1/EC50/MW)と予測値VPEの相関プロットである。
図37-2】Log(1/LD50/MW)が既知の化合物のLog(1/LD50/MW)と予測値VPEの相関プロットである。
【発明を実施するための形態】
【0033】
《量子化学構造パラメータ》
分子軌道法に基づく量子化学構造パラメータの計算方法を、本発明に必要な範囲で説明する。
【0034】
〔分子軌道法〕
量子化学では、量子力学の原理に従う原子及び分子の状態は波動関数で記述され、原子の波動関数Ψ及び分子の波動関数ΨMは、原子のHamilton演算子H及び分子のHamilton演算子HMに対して以下の波動方程式を満たす。
Ψ=EΨ (1-1)
MΨM=EMΨM (1-2)
【0035】
原子についての波動方程式(1-1)は、厳密に又は高い精度で波動関数を解析的に求めることができるが、分子についての波動方程式(1-2)は、原子の波動方程式(1-1)のように解析的に解くことができないため、様々な近似を採用して非解析的に解くことになる。
【0036】
分子軌道法とは、分子である化合物の電子のエネルギー状態を記述する波動関数(以下「分子軌道」という)を、当該化合物を構成する原子について1の波動方程式(1-1)を解いて得た原子の波動関数(以下「原子軌道」という)の線形結合で近似して、波動方程式(1-2)を計算して近似的に分子軌道を求め、当該分子軌道に基づいて化合物の電子構造と反応機構を解釈する量子化学の分野で開発された手法である。
【0037】
本明細書では、化合物のm番目の分子軌道をψ(τ)(m=1・・・n)
(式中、τは空間座標及びスピン座標を表し、nは上記の線形結合に使用する原子軌道の数である)と表記する(以下では「ψ(τ)」を「ψ」と略記する)。
【0038】
分子軌道ψは、化合物を構成する原子がそれぞれ有する原子軌道の合計数nの各原子軌道χ(τ)(a=1・・・n)(以下では「χ(τ)」を「χ」と略記する)と、原子軌道χの重みを示す軌道係数cmaを用いて以下の式(3-1)(Σはn個のaについて和をとることを意味する)で表わす。
ψmaχ (2-1)
【0039】
式(3-1)の関係にある場合、分子軌道ψは(n個の)原子軌道χで構成されているともいう。
【0040】
分子軌道ψに対応する電子の軌道エネルギーEは,その化合物に対応するHamilton演算子をHとすると、以下の式(2-2)で表される。
=∫ψHψdτ/∫ψ dτ (2-2)
【0041】
式(2-2)のψに式(2-1)のψを代入して、式(2-2)を書き直すと、以下の式(2-3)になる。
∫(Σmaχ)dτ=∫(Σmaχ)H(Σmaχ)dτ
(2-3)
【0042】
ここで、
ab=∫χHχdτ(a≠b、共鳴積分)
aa=∫χHχdτ(クーロン積分)
ab=∫χχdτ(重なり積分)
(式中、「ab」は、n個の原子軌道の中のa番目とb番目の原子軌道が積分内に含まれることを示し、a,b=1・・・nである)とおくと、式(2-3)は以下の式(2-4)に変形できる。
=ΣaΣbmambabaΣbmambab (2-4)
【0043】
分子軌道法では、変分原理に基づき、軌道係数cmaの関数である軌道エネルギーEは、その極小値で安定化するため、cmaで偏微分して以下の式(3)が0となるcmaを求めEを決定する。
Σama(Hab-Eab)=0 (3)
【0044】
各mについて(即ち、原子軌道の数nだけ)式(3)が成立し、n次連立方程式(Hartree-Fockの式)が構成され、E及びcmaはそれぞれn個の解E及びcma(m=1・・・n)を有し、各E及びcmaに対応するn個の分子軌道ψmaχが存在することになる。
【0045】
n個のE(m=1・・・n)は対応する分子軌道ψの軌道エネルギー、
n個のcma(m=1・・・n)は対応する分子軌道ψにおける原子軌道χの軌道係数ということになる。
【0046】
式(2-1)~(2-4)及び(3)の関係を表にすると以下のようになる。
【0047】
【表2】
【0048】
行列H=〔Hab〕、行列S=〔Sab〕、行列E=〔Eδab〕(δabはa=bの場合1、a≠bの場合0)、行列C=〔cab〕及び零行列Oを用いると(m,a,b=1・・・n(原子軌道の数))、式(4)は式(5)と等価である。
(H-ES)C=O (4)
【0049】
以下では、行列Eを「軌道エネルギー行列E」、行列Cを「軌道係数行列C」ともいう。
【0050】
式(5)が、C=O以外の解をもつには、行列式である以下の式(6)で表される永年方程式が成立する必要がある。
|H-ES|=0 (5)
【0051】
原理的には、式(5)の条件の下で、式(4)を解くと軌道エネルギー行列E及び軌道係数行列Cが計算できる。
【0052】
分子軌道法では、軌道エネルギー行列Eと軌道係数行列Cを式(4)及び(5)に基づいて計算するために、Hab(a≠b、共鳴積分)、Haa(クーロン積分)及びSab(重なり積分)を実験値に置き換える等の近似を導入して計算する経験的・半経験的方法と、近似を導入せずにすべて計算する非経験的方法が開発されている。
【0053】
経験的・半経験的方法としては、非特許文献2で紹介されるような方法、例えば、SCF(Self-Consistent Field)法;π電子系におけるLCAO-SCF法(例えば、Pariser-Parr-Pople法);原子価電子に対するLCAO-SCF法(例えば、CNDO法);半経験的SCF法、非制限SCF法、ヒュッケル法、拡張ヒュッケル法、ω-法、CIND/2法、CNDO/2法、MOPAC(Molecular Orbital PACkage)、Gaussian等が採用されている。
【0054】
さらに精度の高い近似を導入した方法として、Moller-Plesset摂動法(MP法)、配置間相互作用法(CI法)、多配置SCF法(MCSCF法)、クラスター展開法(CC法)、Iterative CI-General Single and Double法(ICI-GSD法)等が開発されている。
【0055】
本発明1では、これらの方法をコンピュータで計算するための公知のプログラムを適用することもできるし、これらの方法を組合わせて、式(5)の解が最適化するように、コンピュータの性能の向上に応じて(特に、近年は進化するAIを活用して)、分子軌道、原子軌道、行列H及びSの積分パラメータ等の関数形やパラメータを化合物の化学構造や反応性に基づいて自動学習によって近似関数やパラメータを生成して軌道エネルギー行列Eと軌道係数行列Cをいくらでも精度よく計算することができる。
【0056】
〔分子軌道法による量子化学構造パラメータの計算プログラム〕
分子軌道法による量子化学構造パラメータの計算プログラムは、コンピュータに以下のステップ1~3を実行させる。
【0057】
<ステップ1>
化合物を構成する原子の空間座標を決定するステップである。
【0058】
<ステップ2>
ステップ1で決定した空間座標を使用して原子軌道(各原子の波動関数)を計算して、式(5)を数値計算によって解き、軌道エネルギー行列E及び軌道係数行列Cを計算するステップである。
【0059】
<ステップ3>
ステップ1及び2で計算された化合物の軌道エネルギー及び軌道係数を用いて、当該化合物の種々の量子化学構造パラメータを計算するステップである。
【0060】
本明細書では、拡張ヒュッケル法を適用して、化合物の軌道エネルギー行列E、軌道係数行列C及び量子化学構造パラメータを、式(4)及び(5)に基づいて計算するためのプログラムの各ステップを詳細に説明する(なお、本明細書では、非特許文献2及び3に開示されるBASIC用プログラムに基づき作成された拡張ヒュッケル法による分子軌道法の計算プログラムを利用して当該プログラムを作成して具体的な計算をした)。
【0061】
(1)ステップ1
化合物を構成する原子の空間座標を決定するステップである。
【0062】
分子軌道法による化合物の量子化学構造パラメータを計算する際、最も安定したエネルギー状態における化合物を構成する原子の空間座標は計算結果に大きな影響を与えるため、正確に統一した方法で決定する必要がある。
【0063】
近年、量子化学の分野で必要とされる数値計算をコンピュータで行う場合に、基礎となる化合物の原子配列の記述方法(例えば、「線形表記法」、「結合リスト」等)種々開発されており、「線形表記法」としてSMILES記法,SMARTS記法,InChI記法などが知られており、これらの原子配列の記述方法に基づき、分子モデリング及び編集をコンピュータで行うためのプログラム(例えば、公開プログラム「Avogadro」(http://avogadro.cc/)が開発されている。
【0064】
本発明1における分子軌道法に基づく計算は、上記したような、化合物の原子配列の記述方法と分子モデリング及び編集用プログラムを使用して化合物を構成する原子の空間座標を決定することが好ましい。
【0065】
以下では、化合物の原子配列の記述方法としてSMILES記法により化合物の原子配列を記述し、公開プログラム「Avogadro」を使用して化合物の原子の空間座標を計算したが、本発明1においては、SMILES記法及び公開プログラム「Avogadro」に限定されず、量子化学構造パラメータの計算結果が量子化学の分野で妥当とみなされる範囲であれば、いずれの記述方法及びプログラムを使用してもよい。
【0066】
(2)ステップ2
ステップ1で決定した空間座標を使用して原子軌道(各原子の波動関数)を計算して、式(5)を数値計算によって解き、軌道エネルギー行列E及び軌道係数行列Cを計算するステップである。
【0067】
式(5)を解くには、共鳴積分Hij(i≠j)、クーロン積分Hii及び重なり積分Sijを計算しなければならない。
【0068】
本明細書では、拡張ヒュッケル法で計算するに当たり、原子軌道、クーロン積分及び共鳴積分について以下の前提及び近似を採用する。
【0069】
<採用する原子軌道>
拡張ヒュッケル法では、式(2)の原子軌道χは、化合物を構成する各原子の最外殻の原子軌道を採用する。
【0070】
例えば、Hでは1s軌道;C、N、O、Fではそれぞれ2s軌道、2px軌道、2py軌道、2pz軌道を採用する。
【0071】
<原子軌道の関数形>
重なり積分Sabを計算するために、原子軌道を式(6):
χ(r)=rp-lexp(-r(Z-s)/p'a) (6)
(式(7)中、pは主量子数、lは方位量子数、a0は遮蔽定数、Zは原子番号、sは他の電子による遮蔽定数(スレーターの規則に従って他電子の寄与をきめる)、p'は有効主量子数でp>3の時は小さく見積もるが、本明細書では主量子数が1(水素)と2(炭素、窒素、酸素、フッ素)の原子のみを扱うので、p'=pとしてスレーター型原子軌道を採用する。
【0072】
<重なり積分>
重なり積分Sabは、原子軌道χaの関数形が決まれば計算でき、拡張ヒュッケル法では、原子軌道χaとして式(6)の関数形を採用するので具体的に計算できることになる。
【0073】
重なり積分Sabの計算結果は、表3のように整理でき、この場合、所定の規格化条件の下で、行列S=〔Sab〕は対称行列になるので、Sab=Sbaである。
【0074】
【表3】
【0075】
以下では、メタノール(CHOH)、酢酸(CHCOOH)、ニトロメタン(CHNH )及びフェノール(C OH)に対して分子軌道法を適用して量子化学構造パラメータを計算例を挙げながら説明するが、化合物が同種の原子を複数含む場合、それぞれの原子を以下のように区別する。
【0076】
<メタノール(CHOH)>
メチル基を構成している3個の水素原子をH1、H2、H3、酸素原子に結合している水素原子をH4とする。
【0077】
<酢酸(CHCOOH)>
メチル基を構成している炭素原子をC1、メチル基を構成している3個の水素原子をH1、H2、H3、
カルボキシル基を構成している炭素原子をC2、炭素原子のみに結合している酸素原子をO1、炭素原子と水素原子に結合している酸素原子をO2、酸素原子と結合している水素原子をH4とする。
【0078】
<ニトロメタン(CHNO)>
メチル基を構成している3個の水素原子をH1、H2、H3、
ニトロ基を構成している2個の酸素原子をO1、O2とする。
【0079】
<フェノール(CHOH)>
水酸基に結合している炭素原子をC1、
C1、から右回りにC2、C3、C4、C5、C6、
フェノールを構成している水素原子をH1、
C2に結合している水素原子をH2、C3に結合している水素原子をH3、
C4に結合している水素原子をH4、C5に結合している水素原子をH5、
C6に結合している水素原子をH6とする。
【0080】
メタノール(CHOH)の場合、構成原子の原子軌道について、
炭素原子Cにはχ1に2s軌道、χ2に2px軌道、χ3に2py軌道、χ4に2pz軌道を、
酸素原子Oには、χ5に2s軌道、χ6に2px軌道、χ7に2py軌道、χ8に2pz軌道を、
水素原子H1には、χ9に1s軌道を、
水素原子H2:χ10に1s軌道を、
水素原子H3:χ11に1s軌道を、
水素原子H4:χ12に1s軌道を割り当てて重なり積分を計算するので、表3-1のように整理できる。
【0081】
【表3-1】
【0082】
酢酸(CHCOOH)、ニトロメタン(CHNO)及びフェノール(COH)についても同様に、表3-2~3-4のように整理できる。
【0083】
【表3-2】
【0084】
【表3-3】
【0085】
【表3-4】
【0086】
<クーロン積分>
クーロン積分Habは、i番目の原子軌道χaのイオン化ポテンシャルの値Iaを用いて式(7):
ab=-Ia (7)
で計算する;
【0087】
BODを評価しようとする化合物は、多くの場合、水素原子(H)、炭素原子(C)、窒素原子(N)、酸素原子(O)、弗素原子(F)、硫黄原子(S)、塩素原子(Cl)等で構成されており、これらの原子軌道のイオン化ポテンシャルは、化学及び物理における基本定数であり、従前から知られるHoffmannが使用した値や、最新の情報が各国(例えば、日本では非特許文献4;米国及びIUPACでは非特許文献5;国際機関では非特許文献6)で提供されているが、各種化合物に対して計算結果と実験データがよく一致しているHoffmannが用いた値を利用するのが好ましい。
【0088】
本明細書の分子軌道法による計算の例示説明では、表2に示すHoffmannが拡張ヒュッケル法に用いた値を採用した。
【0089】
【表4】
【0090】
<共鳴積分>
共鳴積分Habは、重なり積分Sabとクーロン積分HaaとHbbの平均値に比例するというWolfsburg-Helmholzの近似式である下記式(8):
ab=KSab(Haa+Hbb)/2 (8)
【0091】
式(8)中、Kは定数で、拡張ヒュッケル法ではHoffmannの使用したK=1.75が採用される。なお、定数Kは、式(8)を使用しない様々な経験的・半経験的方法と非経験的方法で導出される量子化学構造パラメータと整合する範囲で任意に決めてよい。
【0092】
拡張ヒュッケル法において、原子軌道、クーロン積分、共鳴積分は、量子化学の分野で妥当される他の関数及び近似方法を採用してよく、例えば、原子軌道はガウス型原子軌道を採用してもよい。
【0093】
〔軌道エネルギー行列E及び軌道係数行列Cの計算〕
拡張ヒュッケル法では、採用された行列H=〔Hab〕及びS=〔Sab〕を用いて式(5)を解いて軌道エネルギー行列E及び軌道係数行列Cを計算する。
【0094】
式(4)を変形すると以下の式(4-1)を得る:
HC=SCE (4-1)
【0095】
行列Sの固有値行列Mと固有ベクトルVをヤコビ法で求めると式(4-2)を得る:
-1SV=M (4-2)
【0096】
式(-2)を変形して得るS=VM1/21/2-1を式(4-1)に代入して、
W=M1/2-1C (4-3)
A=M-1/2-1HVM-1/2 (4-4)
として整理すると式(4-5)となり、行列Eは行列Aの固有値であり、行列Wは行列Aの固有ベクトルであることがわかる:
E=W-1AW (4-5)
【0097】
そこで、式(4-4)によって行列Aを計算し、さらに、式(4-5)に基づき、
行列Aの固有値を計算して軌道エネルギー行列Eを求め、
行列Aの固有ベクトルWを計算し、式(4-3)を介して軌道係数行列Cを求める。
【0098】
メタノール(CHOH)、酢酸(CHCOOH)、ニトロメタン(CHNO)及びフェノール(COH)について、拡張ヒュッケル法を適用した分子軌道法によりEm及びcabを計算した結果を表2-1~2-4にまとめた(表の着色したマスに対応する分子軌道は後述する電子占有軌道である)。
【0099】
<電子占有軌道と電子非占有軌道>
安定した化合物は、軌道エネルギーの低い分子軌道から順に、化合物に存在する電子の中から、1つの分子軌道を最大で(スピン座標の異なる)2個の電子が占有すると考え、
電子1個又は2個が入っている分子軌道を電子占有軌道といい、
電子が入っていない(電子2個分の空席のある)分子軌道を電子非占有軌道という。
【0100】
電子占有軌道の軌道エネルギーのうち、最大の軌道エネルギーをHOMO1、二番目に大きい軌道エネルギーをHOMO2といい、軌道エネルギーがHOMO1である軌道とHOMO2である軌道をまとめて高準位占有軌道という。
【0101】
電子占有軌道の係数から電子密度,正味電荷,結合次数など、化合物の化学反応性を決める量子化学構造パラメータを計算できる。
【0102】
電子非占有軌道の軌道エネルギーのうち、最も低い軌道エネルギーをLUMO1、二番目に低い軌道がLUMO2といい、軌道エネルギーがLUMO1である軌道とLUMO2である軌道をまとめて低準位非占有軌道という。
【0103】
高準位占有軌道と低準位非占有軌道をまとめてフロンティア軌道という。
【0104】
フロンティア軌道は、求電子反応、求核反応の位置選択性などの化合物の化学的性質を決める重要な軌道であり、これらの軌道の軌道係数からフロンティア電子密度など,化合物の化学反応性を決める重要な量子化学構造パラメータを計算することができる。
【0105】
拡張ヒュッケル法では、フロンティア軌道を、以下のようにして決める。
【0106】
拡張ヒュッケル法では、安定した化合物は、化合物の最外殻に入っている電子(以下「原子価電子」という)が、軌道エネルギーの低い分子軌道から順に、1つの分子軌道に2個ずつ存在していると考え、原子価電子の空席のない分子軌道を原子価電子占有軌道、原子価電子の空席のある分子軌道を原子価電子非占有軌道という。
【0107】
その上で、
原子価電子占有軌道で2番目に大きい軌道エネルギーをHOMO2、
原子価電子占有軌道で最大の軌道エネルギーをHOMO1、
原子価電子非占有軌道で最小の軌道エネルギーをLUMO1、
原子価電子非占有軌道で2番目に小さい軌道エネルギーをLUMO2とする。
【0108】
原子価電子の数は、Hが1、Cが4、Oが6、Nが6なので、
メタノール(CHOH)の原子価電子の総数は、4+3+6+1=14;
酢酸(CHCOOH)の原子価電子の総数は、4+3+4+6+6+1=24;
ニトロメタン(CHNO)の原子価電子の総数は、4+3+5+12=24;
フェノール(COH)の原子価電子の総数は、24+5+6+1=36 となる。
【0109】
メタノール(CHOH)の分子軌道は12個であるので、14個の原子価電子は、
7個の原子価電子占有軌道を形成し、軌道エネルギーの低い順に、
6番目の軌道の軌道エネルギーがHOMO2、
7番目の軌道の軌道エネルギーがHOMO1、
8番目の軌道の軌道エネルギーがLUMO1、
9番目の軌道の軌道エネルギーがLUMO2となる。
【0110】
酢酸(CHCOOH)の分子軌道は20個であり、24個の原子価電子は、
12個の原子価電子占有軌道を形成し、軌道エネルギーの低い順に、
11番目の軌道の軌道エネルギーがHOMO2、
12番目の軌道の軌道エネルギーがHOMO1、
13番目の軌道の軌道エネルギーがLUMO1、
14番目の軌道の軌道エネルギーがLUMO2となる。
【0111】
ニトロメタン(CHNO)の分子軌道は19個であり、24個の原子価電子は、
12個の原子価電子占有軌道を形成し、軌道エネルギーの低い順に、
11番目の軌道の軌道エネルギーがHOMO2、
12番目の軌道の軌道エネルギーがHOMO1、
13番目の軌道の軌道エネルギーがLUMO1、
14番目の軌道の軌道エネルギーがLUMO2となる。
【0112】
フェノール(C OH)の分子軌道は34個であり、36個の原子価電子は、
18個の原子価電子占有軌道を形成し、軌道エネルギーの低い順に、
17番目の軌道の軌道エネルギーがHOMO2、
18番目の軌道の軌道エネルギーがHOMO1、
19番目の軌道の軌道エネルギーがLUMO1、
20番目の軌道の軌道エネルギーがLUMO2となる。
【0113】
量子化学構造パラメータの値を種々比較するに際しては、Ei及びcijの小数点以下の有効桁数は、好ましく3~10桁、より好ましくは3~8桁、更に好まし3~6桁、更に好ましくは3~5桁である。
【0114】
本明細書の分子軌道法による計算の例示説明では小数点以下の有効桁数を4桁で計算しているが、表3~6では、表の見易さを考慮して小数点以下の有効桁数をEiでは2桁、cijでは3桁にして表示している。
【0115】
【表2-1】
【0116】
【表2-2】
【0117】
【表2-3】
【0118】
【表2-4】
【0119】
(3)ステップ3
ステップ1及び2で計算された化合物の軌道エネルギー及び軌道係数を用いて、当該化合物の種々の量子化学構造パラメータを計算するステップである。
【0120】
(原子軌道χの電子密度N
化合物の分子軌道ψを構成する原子軌道χの電子密度Nは、原子軌道χが構成する原子価電子占有軌道の電子の存在確率の総和として、軌道係数cと重なり積分Sから以下の式(9-1)で計算できる。
=2Σm’Σam’bm’ab (9-1)
【0121】
拡張ヒュッケル法では、b及びm’は以下の範囲で和をとる:
b=1・・・n(分子軌道を構成する原子軌道の数);
m’=原子価電子が入っている化合物の分子軌道の番号の範囲
【0122】
m’は、例えば、メタノール(CHOH)、酢酸(CHCOOH)、ニトロメタン(CHNO)及びフェノール(COH)では、以下の表5の〇のついた分子軌道についての軌道係数を用いる:
【0123】
【表5】
【0124】
<メタノール(CHOH)の場合の計算例>
(1)表2-1及び表5から、メタノールの分子軌道を構成する特定の原子軌道χに対して、b及びm’は以下の範囲である:
b=1・・・12;m’=1,3,4,5,6,7,8
【0125】
(2)χの電子密度Nは以下のように計算できる。
=2Σm’Σ1m’bm’1b
=2Σm’(c1m’c1m’S11+c1m’c2m’S12+・・・+c1m’c12m’S1・12
=2〔c11c11S11+c11c21S12+・・・+c11c12・1S1・12
+c13c13S11+c13c23S13+・・・+c13c12・3S1・12
+c14c14S11+c14c24S12+・・・+c14c12・4S1・12
+c15c15S11+c15c25S12+・・・+c15c12・5S1・12
+c16c16S11+c16c26S12+・・・+c16c12・6S1・12
+c17c17S11+c17c2iS12+・・・+c17c12・7S1・12
+c18c18S11+c18c28S12+・・・+c18c12・8S1・12〕=1.0925
【0126】
同様に他の原子軌道について計算すると、以下の結果となる。
原子軌道χの電子密度:N=2Σm’Σ2m’bm’2b=0.4766
原子軌道χの電子密度:N=2Σm’Σ3m’bm’3b=1.0990
原子軌道χの電子密度:N=2Σm’Σ4m’bm’4b=1.0963
原子軌道χの電子密度:N=2Σm’Σ5m’bm’5b=1.7526
原子軌道χの電子密度:N=2Σm’Σ6m’bm’6b=1.6350
原子軌道χの電子密度:N=2Σm’Σ7m’bm’7b=1.7955
原子軌道χの電子密度:N=2Σm’Σ8m’bm’8b=1.9920
原子軌道χの電子密度:N=2Σm’Σ9m’bm’9b=0.8929
原子軌道χ10の電子密度:N10=2Σm’Σ10m’bm’10b=0.8929
原子軌道χ11の電子密度:N11=2Σm’Σ11m’bm’11b=0.8911
原子軌道χ12の電子密度:N12=2Σm’Σ12m’bm’12b=0.3835
【0127】
(原子Aの電子密度M
化合物を構成する原子Aの電子密度Mは、
原子Aを構成する原子軌道χ(A)aの電子密度N(A)の総和として、
以下の式(9-2)で計算できる。
=ΣaN(A)a (9-2)
【0128】
<メタノール(CHOH)の場合の計算例>
(1)表2-1からメタノールを構成する各原子の原子軌道は以下の通りである:、
炭素原子Cは、χ、χ、χ、χ
炭素原子Oは、χ、χ、χ、χ
水素原子H1は、χ
水素原子H2は、χ10
水素原子H3は、χ11
水素原子H4は、χ12
(2)従って、各原子の電子密度は以下のように計算できる:
=N(C)+N(C)+N(C)+N(C)=1.0925+0.4766+1.099+1.096=3.7641
=N(O)+N(O)+N(O)+N(O)=1.7526+1.6350+1.7955+1.9920=7.1751
H1=N(H1)=0.8929
H2=N(H2)10=0.8929
H3=N(H3)11=0.8911
H4=N(H4)12=0.3835
【0129】
(原子軌道χ及び原子軌道χの間の結合次数Nab
化合物の分子軌道を構成する原子軌道χ及びχ間の結合次数Nabは、原子価電子が入っている分子軌道を構成する原子軌道間の電子の存在確率の総和として軌道係数cと重なり積分Sから、以下の式(9-3)で計算できる。
ab=4Σm’am’bm’ab=SabΣm’am’bm’(9-3)
【0130】
<メタノール(CHOH)の場合の計算例>
12=4S12〔c11c11+c13c23+c14c24+c15c25+c16c26+c17c27+c18c28〕=0
13=4S13〔c11c31+c13c23+c14c34+c15c35+c16c36+c17c37+c18c38〕=0
・・・
1・12=4S1・12〔c11c12・1+c13c12・3+c14c12・4+c15c12・5+c16c12・6+c17c12・7+c18c12・8〕=-0.0483
【0131】
23=4S23〔c21c31+c23c23+c24c34+c25c35+c26c36+c27c37+c28c38〕=0
24=4S24〔c21c41+c23c43+c24c44+c25c45+c26c46+c27c47+c28c48〕=0
・・・
2・12=4S1・12〔c11c12・1+c13c12・3+c14c12・4+c15c12・5+c16c12・6+c17c12・7+c18c12・8〕=-0.0235
【0132】
同様にして他の原子軌道間の結合次数を計算し、その結果は表6のように整理でき、具体的な数値を入れると表6-1のように整理できる。
【0133】
【表6】
【0134】
【表6-1】
【0135】
表6及び6-1中の、横列の原子軌道と縦列の原子軌道が同じである対角に並ぶマス内の白抜数値が、その原子軌道の電子密度であり、
横列の原子軌道と縦列の原子軌道が異なるマス内の数値が、
横列の原子軌道と縦列の原子軌道の結合次数である。
【0136】
(原子A及び原子Aの間の結合次数(MA1A2))
化合物を構成する原子Aと原子A間の結合次数MA1A2は、
原子Aを構成する原子軌道χa(A1)間の結合次数Na(A1)と、
原子Aを構成する原子軌道χa(A2)間の結合次数Na(A2)の総和として、
以下の式(9-4)で計算できる。
A1A2=Σa(A1)Σa(A2)a(A1)a(A2) (9-4)
(式(9-4)中、
Σa(A1)は原子Aを構成する原子軌道χa(A1)について和をとり、
ΣA2は原子Aを構成する原子軌道χa(A1)について和をとることを意味する。
【0137】
<メタノール(CHOH)の場合の計算例>
(1)メタノールを構成する炭素原子Cと酸素原子Oの間の結合次数MCOでは、
表2-1から、
Cに属する原子軌道はχ、χ、χ、χであり、
Oに属する原子軌道はχ、χ、χ、χであるから、
Σa(C)は、a(C)=1・・・4について和をとり、
Σa(O)は、a(O)=5・・・8について和をとる。
【0138】
(2)メタノールを構成するCとOの間の結合次数MCOは以下のように計算できる。
CO=Σa(C)Σa(O)a(C)a(O)
=Σa(C)(N1a(O)+N2a(O)+N3a(O) +N4a(O)
=(N15+N25+N35+N45)+(N16+N26+N36+N46
+(N17+N27+N37+N47)+(N18+N28+N38+N48
=0.0518+0.0988+0.0000+0.0000+0.1180+0.2525-0.0005+0.0000
+0.0000+0.0000-0.0374+0.0000+0.0000+0.0000+0.0000-0.0314
=0.4517
【0139】
同様にして、他の原子間でも以下のように結合次数を計算できる。
CH1=0.8226 MCH2=0.8226 MCH3=0.8174 MCH4=-0.0765
OH1=-0.0582 MOH2=-0.0582 MOH3=-0.0563 MOH4=-0.5033
H1H2=-0.0742 MH1H3=-0.0758 MH1H4=-0.0141 MH2H3=-0.0758
【0140】
メタノールについて、各構成原子についての電子密度と結合次数は表7のように整理でき、具体的な数値を入れると表7-1のように整理できる。
【0141】
【表7】
【0142】
【表7-1】
【0143】
表7及び7-1中の原子記号はメタノールの構成原子を表し、
横列の原子と縦列の原子が同じ対角に並ぶマス内の白抜数値が、
その原子の電子密度であり、
横列の原子と縦列の原子が異なるマス内の数値が、
横列の原子と縦列の原子の結合次数である。
【0144】
酢酸(CHCOOH)、ニトロメタン(CHNO)及びフェノール(COH)について、拡張ヒュッケル法を適用した分子軌道法により計算されたE及びcabに基づき各構成原子の電子密度及び構成原子間の結合次数を計算した結果を表8~10にまとめた。
【0145】
【表7-2】
【0146】
【表7-3】
【0147】
【表7-4】
【0148】
(分極値)
化合物の構成原子の分極値を以下のようにして計算できる。
【0149】
(1)原子Aの原子価電子数から原子Aの電子密度を差し引いて原子Aの電荷を求める。
(2)原子Aに結合している原子Bの電荷を同様にして求める。
(3)原子Aの電荷と原子Bの電荷の差の絶対値を原子Aと原子Bの間の分極値とする。
【0150】
式で表すと以下のようになる。
(1)原子Aの電荷=原子Aの原子価電子数-原子Aの電子密度
(2)原子Bの電荷=原子Bの原子価電子数-原子Bの電子密度
(3)原子Aと原子Bの間の分極値=|原子Aの電荷-原子Bの電荷|
【0151】
<メタノール(CHOH)の場合の計算例>
(1)メタノールを構成する原子の原子価電子数は、
炭素原子Cが4、酸素原子Oが6、水素原子Hが1だから、
C、O、H1、H2、H3、H4の電荷は、表7の各原子の電子密度とから、以下のように計算できる。
C:4-3.7644=0.2356
O:6-7.1751=-1.1751
H1:1-0.8929=0.1071 H2:1-0.8929=0.1071
H3:1-0.8911=0.1089 H4:1-0.3835=0.6165
(2)上記(1)で求めた電荷から、結合する原子間の分極値は以下のように計算できる。
(2-1)CとOの間の分極値:|0.2356-(-1.1751)|=1.4107
(2-2)CとH1の間の分極値:|0.2356-0.1071|=0.1285
(2-3)CとH2の間の分極値:|0.2356-0.1071|=0.1285
(2-4)CとH3の間の分極値:|0.2356-0.1089|=0.1267
(2-5)OとH4の間の分極値:|-1.1751-0.6165|=1.7916
【0152】
メタノールについて、各構成原子の電荷と結合する原子間の分極値は表8-1のように整理できる。
【0153】
【表8-1】
【0154】
表8-1中の原子記号はメタノールの構成原子を表し、
横列の原子と縦列の原子が同じ対角に並ぶマス内の白抜数値が、その原子の電荷であり、
横列の原子と縦列の原子が異なるマス内の数値が、横列の原子と縦列の原子の分極値である(直接結合していない原子間の分極値は形式的に「0.0000」を入れている)。
【0155】
酢酸(CHCOOH)、ニトロメタン(CHNO)及びフェノール(COH)についても、同様に、拡張ヒュッケル法を適用した分子軌道法により計算された各構成原子の電子密度及び構成原子間の結合次数から計算した電荷と分極値の結果を表8-2~4にまとめた。
【0156】
【表8-2】
【0157】
【表8-3】
【0158】
【表8-4】
【0159】
(分極及び電荷の程度を示すパラメータ)
化合物を構成する原子間の分極の程度を示すパラメータの指標として「最大分極」が、
化合物が窒素原子を含む場合は、窒素原子に関する「N分極」及び「N電荷」が有用である。
【0160】
(1)最大分極
化合物中の構成原子間の分極値を計算し、最大の分極値を最大分極とする。
【0161】
(2)N分極
窒素原子を含む化合物中の窒素原子に隣接した原子との間の最大の分極値をN分極とする。
【0162】
(3)N電荷
窒素原子を含む化合物中の窒素原子の最大の電荷をN電荷とする。
【0163】
(フロンティア軌道に関するパラメータ)
(1)HOMO1-LUMO1
化合物の軌道エネルギーEiから、HOMO1-LUMO1(以下「ΔEHL」ともいう)を計算する。
【0164】
(2)LUMO2-LUMO1
化合物の軌道エネルギーEiから、LUMO2-LUMO1(以下「ΔELL」ともいう)を計算する。
【0165】
メタノール(CHOH)、酢酸(CHCOOH)、ニトロメタン(CHNO)及びフェノール(COH)について、
既に測定されているBOD、並びに、
拡張ヒュッケル法を適用した分子軌道法により計算された電荷、分極値及びEに基づく最大電極、N電荷、N分極、ΔEEHL及びΔELL計算結果を表9にまとめた。
【0166】
なお、本明細書で使用するBODは、NITE化学物質総合情報提供システム(NITE-CHRIP)(https://www.nite.go.jp/chem/chrip/chrip_search/systemTop)で提供されている生分解性試験結果に拠った。
【0167】
BODの単位は%であるが、本明細書では%を省いて数値のみで説明しる場合がある。
なお、例えば、試験に於いて不純物が含まれている場合にBODが100を超えることがあるが、本明細書では、100を超えた数値のままにした。
【0168】
【表9】
【0169】
(3)芳香族化合物のLUMO1フロンティア軌道の位相とその対称性
【0170】
芳香族化合物の軌道エネルギーLUMO1のフロンティア軌道(以下「LUMO1フロンティア軌道」ともいう)のカテコール可能位置の位相と対称性を以下のように定義する。
(3-1)カテコール可能位置
加水分解やβ酸化に関与する極性基の存在しない芳香族化合物の生分解は、環境中の極性を持たない酸素分子(O)が芳香環に結合してカテコール生成を経由し、芳香環を開裂して微生物の体内に取り込みやすい化合物に変化させることである(図7参照)。
【0171】
従って、芳香族化合物の生分解は、ベンゼン環が酸化されてカテコールを形成しうるベンゼン環のカテコール可能位置を有することが重要である。
【0172】
そこで、ベンゼン環への官能基Aの結合態様に応じて、
カテコール可能位置が4組ある場合をカテコール可能位置4;
カテコール可能位置が3組ある場合をカテコール可能位置3;
カテコール可能位置が2組ある場合をカテコール可能位置2;
カテコール可能位置が1.5組ある場合をカテコール可能位置1.5;
カテコール可能位置が1組ある場合をカテコール可能位置1とした(図1参照)。
【0173】
(3-2)芳香族化合物のLUMO1フロンティア軌道の図示
J.J.P.Stewartにより開発された半経験的分子軌道法を高速に計算できるMOPAC (Molecular Orbital PACkage)のPM5(Parametric Method 5)バージョンを用いて(参照インターネットサイト:Stewart Computational Chemistry - MOPAC Home Page (openmopac.net))、LUMO1フロンティア軌道を3次元的に図示する。
【0174】
図示は、非特許文献7の付録のCD-Rを用いて行った。
【0175】
ベンゼン環の上面視にて図示された例として、カテコール可能位置における、o-シメン、m-シメン、p-シメンのLUMO1フロンティア軌道を図2に、2,6-キシレノールと1,2,4-トリメチルベンゼンのLUMO1フロンティア軌道を図3に示した。
【0176】
各化合物のカテコール可能位置は、丸で囲まれた部分である。
【0177】
(3-3)芳香族化合物のLUMO1フロンティア軌道の位相
図示されたLUMO1フロンティア軌道において、
カテコール可能位置を構成する炭素原子の原子軌道に対応する軌道係数は、0、正の数又は負の数のいずれかの数値となるが、カテコール可能位置を構成する2つの炭素原子の原子軌道に対応する軌道係数が、
同符号(どちらも正又は負)である場合は位相が等しいといい、
異符号((正,負)、(正,±0)又は(負,±0))及びどちらも0((±0,±0))の場合は位相が異なるという。
【0178】
図2及び3の原図では、正負のいずれか一方が青に、他の一方が赤に彩色されている。
図2及び3では、原図で青に彩色されている部分「B」を付し、赤に彩色されている部分を「R」を付した。
【0179】
(3-4)芳香族化合物のLUMO1フロンティア軌道の対称性
図示されたカテコール可能位置のLUMO1フロンティア軌道の対称性を以下のようにランク付けした。
【0180】
カテコール可能位置を構成する2つの炭素原子をC1及びC2としたとき、C1及びC2の重心を結ぶ直線に垂直な直線が、上面視のLUMO1フロンティア軌道の断面積が最大の断面の輪郭によって切り取られてなる線分において(図4参照)、線分がC1の重心位置を通過するときの長さと、線分がC2の重心位置を通過するときの長さの。大きい方をL、小さい方をLとしたとき、長さの比(L/L)を計算する。
【0181】
化合物中にカテコール可能位置が複数ある場合、各カテコール可能位置について計算した比(L/L)の中の最大値が、
0.8超1以下である場合はランクA、
0.6超0.8未満である場合はランクB、
0超0.6未満である場合はランクC、
0、L=L=0又は位相が異なる場合はランクDとする。
【0182】
カテコール可能位置におけるフロンティア軌道の対称性は、他の方法、例えば、C1とC2の重心を結ぶ線分の中点Oを通過するLに平行な直線がフロンティア軌道に切り取られる線分をLとしたとき、フロンティア軌道が線分LとLに挟まれた部分の面積Sと線分LとLに挟まれた部分の面積Sとの比(S/S)の大小とを指標としてもよい(図4参照)。
【0183】
(3-5)芳香族化合物のLUMO1フロンティア軌道の位相と対称性の例
o-シメン、m-シメン、p-シメン、2,6-キシレノール及び1,2,4-トリメチルベンゼンのLUMO1フロンティア軌道におけるカテコール可能位置の位相と対称性を表10-1に整理した。
【0184】
【表10-1】
【0185】
(4)化合物の官能基近傍のフロンティア軌道の形状
化合物の官能基の生体環境中での反応性の程度が、生体に対する有害性と関係していることから、この化合物の官能基近傍(好ましくは官能基上)の化合物のフロンティア軌道の形状(以下「軌道の形状」という)が、化合物の環境・生体有害性の有力な説明変数となりうる。
【0186】
化合物の官能基近傍の軌道の形状としては、例えば、当該官能基上のフロンティア軌道の拡がり、位相の同一性、電子密度分布、ハロゲン基やチオール基等で見られる官能基固有の特徴的形状等が考えられる。
【0187】
なお、ハロゲン基やチオール基等で見られる官能基固有の特徴的形状とは、例えば、ハロゲン基のLUMO1フロンティア軌道では、位相が細かく反転しビーズ玉のような特徴的形状であり、チオール基では、LUMO1フロンティア軌道は傘のような特徴的形状である。
【0188】
例えば、化合物のHOMO1フロンティア軌道の官能基上の軌道の形状が、位相が揃った軌道が広く分布している場合を形状「1」;軌道が存在しないか、位相が反転している場合を形状「0」とし、
同様に、化合物のLUMO1フロンティア軌道の官能基上の軌道の形状が、位相が揃った軌道が広く分布している場合を形状「1」;軌道が存在しないか、位相が反転している場合を形状「0」とすることができる。
【0189】
(4-1)硫黄化合物のフロンティア軌道の官能基上の軌道の形状の例
【0190】
【表10-2】
【0191】
(4-2)ハロゲン化合物のフロンティア軌道の官能基上の軌道の形状の例
【0192】
【表10-3】
【0193】
(4-3)アミン化合物のフロンティア軌道の官能基上の軌道の形状の例
【0194】
【表10-4】
【0195】
(4-4)ニトロ化合物のフロンティア軌道の官能基上の軌道の形状の例
【0196】
【表10-5】
【0197】
なお、フロンティア軌道の位相、対称性及び上述した軌道の形状は、定常状態のフロンティア軌道(波動関数)が0ではない部分の範囲の位相、対称性及び形状であり、軌道係数cを用いる等して、環境・生体有害性により対応する波動関数の数値の範囲をより定量的に規定して、その範囲の位相、対称性及び形状等で評価することもできる。
【0198】
化合物のフロンティア軌道の形状は、後述する環境・生体有害性の指標として有用であるが、化合物のフロンティア軌道以外の形状も環境・生体有害性の指標とすることができる場合もあると考えられる。
【0199】
《化合物の生分解及び環境生物・人との生体反応の反応機構》
(化合物の生分解の反応機構)
化合物の生分解は、微生物が環境中に多く存在する有機化合物を加水分解やβ酸化により水(HO)と二酸化炭素(CO)にまで分解してエネルギーを得る過程で行われる。
【0200】
カルボニル基含有化合物であるカルボキシル基含有化合物の加水分解の例を図5に示した。
【0201】
アセチルCoAを含有するカルボニル基含有化合物のβ酸化の例を図6に示した。
【0202】
これらの過程ではいずれも極性を持つ水分子が化合物に結合することが重要となる。
【0203】
加水分解やβ酸化に関与する極性基の存在しない芳香族化合物の生分解は、環境中の極性を持たない酸素分子(O)が芳香環に結合することで、カテコール生成を経由して芳香環を開裂して微生物の体内に取り込みやすい化合物に変化させることである。
【0204】
酸化によるベンゼン環の開裂の例を図7に示した。
【0205】
(化合物の生体反応の反応機構)
生体内では、一連の化学反応が整然と行われている。
この整然とした化学反応の流れを乱し生物の健康を損なう化学物質が毒物である。
また、生体内の多くの化学反応は酸化と還元である。
【0206】
例えば、オキシゲナーゼでは酵素から基質への酸素の伝達、すなわち酸化であり電子の受容である。
また、ピリジンヌクレオチドを補酵素とする脱水素酵素反応では補酵素から基質への水素の移動、すなわち還元であり電子の供与である。
【0207】
このことは、生体内での異常な化学反応すなわち毒性は電子の移動を予測することによって可能となることを示している。
フロンティア電子軌道について考えれば、電子を与える還元では高準位占有軌道が、そして電子を受け入れる酸化では低準位占有軌道が重要な役割を果たすことになる。
【0208】
従来は、高準位占有軌道と低準位占有軌道のエネルギーで各種反応を説明してきていた。
しかし、酸化・還元反応は単なる電子の移動ではなく、水分子や酸素分子などの分子を介しての電子の移動であることから、その反応の起こりやすさを考慮する必要がある。
【0209】
本発明に於いて、それぞれの軌道の位相と形状を考慮するすることによって、反応の予測精度が向上することが明らかとなった。
【0210】
《化合物の生分解性と化学構造パラメータの関係》
【0211】
化合物の生分解性の指標をBODとした場合の、BODが既知の化合物と当該化合物の以下の化学構造パラメータの関係を説明する。
【0212】
(1)非量子化学構造パラメータ
(1-1)窒素原子の有無
(1-2)生分解性が低い化合物に関する技術常識
(1-3)カテコール可能位置
【0213】
(2)量子化学構造パラメータ
(2-1)分極の程度を示すパラメータ:最大分極、N電極
(2-2)電荷の程度を示すパラメータ:N電荷
(2-3)フロンティア軌道のエネルギーに関するパラメータ:ΔEHL、ΔELL
(2-4)フロンティア軌道のエネルギー分布の対称性
(2-5)フロンティア軌道の位相。
【0214】
〔BODが既知の化合物の例〕
NITE化学物質総合情報提供システムで提供されている、BODが既知の化合物で、
Windows10載のパソコンで作動するソフトにより拡張ヒュッケル法の計算を実行でき、水素、炭素、窒素、酸素及びフッ素で構成され総電子数が100以下の化合物を選択した。
【0215】
(窒素原子の有無による分類)
BODが既知の化合物をさらに以下を考慮して分類した。
【0216】
窒素を含まない化合物は、加水分解やβ酸化などにより炭素原子と水素原子が酸化され、生分解における最終形態が二酸化炭素(CO)と水(HO)であること、
窒素原子を含む化合物は、ニトロ基(-NO)やアミノ基(-NH)等性質の大きく異なる窒素原子を含む官能基を有して複雑な酸化過程を経て、生分解における最終形態がアンモニア(NH)や硝酸(HNO)であること、
芳香族化合物は、生分解過程に於いてカテコールを経た芳香環の開裂が必須であることとを考慮して、生分解性の評価の対象となる化合物を、以下のように分類する:
(1)窒素原子を含まない脂肪族化合物
(2)窒素原子を含む脂肪族化合物
(3)窒素原子を含まない芳香族化合物
(4)窒素原子を含む芳香族化合物
【0217】
(生分解性が低い化合物に関する技術常識)
但し、従前の化合物の生分解性の蓄積から、
(a)炭素原子に3つ以上の炭素が結合したtertiary基を有する化合物;及び
(b)エステル結合、アミド結合、尿素結合を有しない化合物で、分子量が800以上の化合物は、
(BODが40以下で)生分解し難いことが技術常識となっている。
【0218】
上記(a)に該当する化合物として、例えば、以下が挙げられる。
ジ-tert-ブチルペルオキシド(Mw=146、BOD=0)
tert-ブチルペルオキシド(Mw=90、BOD=0)
tert-ブチルメチルエーテル(Mw=90、BOD=0)
tert-ブチルアルコール(Mw=74、BOD=3)
2-(tert-ブチルアミノ)エタノール(Mw=117、BOD=2)
tert-ブチルアミン(Mw=73、BOD=0)
4-tert-ブチル安息香酸(Mw=178、BOD=4)
2-tert-ブチルフェノール(Mw=150、BOD=0)
tert-ブチルベンゼン(Mw=134、BOD=0)
tert-アミルベンゼン(Mw=148、BOD=29)
【0219】
上記(a)及び(b)に該当する化合物は、原則、以下の説明の対象外とする
【0220】
BODが既知の化合物群について量子化学構造パラメータを計算した例として、
窒素原子を含まない脂肪族化合物群の例を表11に、
窒素原子を含まない芳香族化合物群の例を表12に
窒素原子を含む脂肪族化合物群の例を表13及び14に、
窒素原子を含まない芳香族化合物群の例を表15にまとめた。
【0221】
<窒素原子を含まない脂肪族化合物群の例>
【0222】
【表11】
【0223】
<窒素原子を含まない芳香族化合物群の例>
【0224】
【表12】
【0225】
<窒素原子を含む脂肪族化合物群の例(その1)>
【0226】
【表13】
【0227】
<窒素原子を含む脂肪族化合物群の例(その2)>
【0228】
【表14】
【0229】
<窒素原子を含む芳香族化合物群の例>
【0230】
【表15】
【0231】
〔化合物のBODと窒素原子の有無の関係〕
表11~15の化合物を横軸に番号順に並べ、縦軸にBODをとると、
図8のように整理できる。
【0232】
図8からわかるように、BODが50以上の化合物の割合が、
窒素原子を含まない化合物の方が、窒素原子を含む化合物よりも高いことがわかる。
【0233】
BODが50以上の化合物の割合を表16のように整理できる。
【0234】
【表16】
【0235】
表16から、窒素原子を含まない化合物の7割以上でBODが50以上であり(生分解性が高く)、窒素原子を含む芳香族化合物の7割以上でBODが50未満である(生分解性が低い)ことがわかる。
【0236】
言い換えると、
窒素原子を含まない化合物の生分解性は高い傾向にあると評価でき、
窒素原子を含む芳香族化合物の生分解性は低い傾向にあると評価でき、
窒素原子を含む脂肪族化合物の生分解性の傾向は、窒素原子を含まないことだけでは評価し難いことがわかる。
【0237】
〔化合物のBODと量子化学構造パラメータの関係〕
(窒素分子を含まない化合物の分極値、ΔEHL及びHLLとの関係)
表11~13から、窒素分子を含まない化合物のBODと最大分極、ΔEHL及びΔELLの関係を、図9~14に示す。
【0238】
図9~14に示される関係に基づき、BODが50以上の化合物の割合を表17のように整理できる。
【0239】
【表17】
【0240】
表17から、BODが50以上である(生分解性が高い)化合物は、窒素原子を含まない脂肪族化合物は、最大分極が1.0以上で8割以上、ΔEHLが8.0未満で9割、ΔELLが7.0以上で9割、窒素原子を含まない芳香族化合物は、ΔEHLが3.5未満で9割、ΔELLが7.0以上で9割であることがわかる。
【0241】
言い換えると、量子化学構造パラメータが上記の範囲にある窒素原子を含まない化合物の生分解性は非常に高い傾向にあると評価できる。
【0242】
(窒素分子を含む化合物の分極値、ΔEHL及びHLLとの関係)
表14~15から、窒素分子を含まない化合物のBODと最大分極、N電荷。N分極、ΔEHL及びΔELLの関係を、図15~24に示す。
【0243】
図15~24に示される関係に基づき、BODが50以上の化合物の割合を表18のように整理できる。
【0244】
【表18】
【0245】
表18から、BODが50以上である(生分解性が高い)化合物は、
窒素原子を含む脂肪族化合物は、N分極が1.5以上で0、
窒素原子を含む芳香族化合物は、
N分極が2.5以上、N電荷が1.0以上、ΔEHLが2.5未満、ΔELLが1.8以上で1割程度、 ΔELLが2.5以上で0であることがわかる。
【0246】
言い換えると、量子化学構造パラメータが上記の範囲にある窒素原子を含む化合物の生分解性は非常に低い傾向にあると評価できる。
【0247】
(芳香族化合物のフロンティア軌道(カテコール可能位置)の対称性との関係)
表12及び表15の芳香族化合物のうち、MOPACのPM5バージョンで計算可能な炭素、窒素、酸素及びフッ素の原子数の合計が15以下であるものについて、BOD、ΔELL、N結合形態及び対称性を表12-2及び表15-に整理した。
【0248】
【表12-2】
【0249】
【表15-2】
【0250】
表12-2及び表15-2に基づき、50≦BODなる化合物の割合(%)と、窒素原子の有無、ΔELL、及びカテコール可能位置のLUMO1フロンティア軌道の対称性との関係を表12-3及び表15-3に整理した。
【0251】
【表12-3】
【0252】
【表15-3】
【0253】
《化合物のBODと化学構造パラメータの関係(まとめ)その1》
表16~18、12-2、15-2、12-3及び15-3に基づき、化合物のBODと化学構造パラメータの関係を表19-1及び19-2に整理した。
【0254】
【表19-1】
【0255】
表19-1から、脂肪族化合物の生分解性は以下の傾向にあることがわかる:
(1)窒素原子を含まない脂肪族化合物は、全体に生分解し易く、その中で、 最大分極が1.0以上であるとさらに生分解し易く、
ΔEHLが8.0未満であるとさらに生分解し易く、又は、
ΔELLが7.0以下であるとさらに生分解し易い。
【0256】
(2)窒素原子を含む脂肪族化合物で、N分極が1.5以上であると極めて生分解し難い。
【0257】
【表19-2】
【0258】
表19-2から、芳香族化合物の生分解性は以下の傾向にあることがわかる:
(1)窒素原子を含まない芳香族化合物は、全体に生分解し易く、その中で、ΔELLが0.5以上であるとさらに生分解し易いが、
ΔELLが0.5未満であるとむしろ生分解し難く、その中で、例外的に、
カテコール可能位置のLUMO1フロンティア軌道の対称性がよいものは生分解し易い。
【0259】
(2)窒素原子を含む芳香族化合物は、全体に生分解し難いが、その中で、
カテコール可能位置のフロンティア軌道の、
対称性がよいものは生分解し易く、対称性の低いものはさらに生分解し難い。
【0260】
なお、表19-1及び表19-2は、生分解性をBOD=50を基準に評価しているが、生分解性の要求水準に応じて、基準となるBOD値は異なってよい(例えば、BOD=60を基準にしてもよく)。
【0261】
基準となるBOD値は異なると、量子化学構造パラメータと生分解性の対応する範囲は表19-1及び表19-2に示される範囲と異なってくるが、その異なる範囲について生分解性の良否の傾向を判断することができる。
【0262】
以下では、表19-1及び表19-2を参照して生分解性の傾向を判断する場合、当該判断は、上記した基準の変動に伴う範囲の修正も織り込んでいるとする。
【0263】
化合物の生分解性と関係づけられるその他の量子化学構造パラメータとしては、化合物が水中の微生物に取り込まれるためには、水との親和性が重要となる理由から、親水性エネルギー、化合物が生分解されるためには、分解酵素に取り込まれる必要があり、酵素との親和性には化合物全体の電荷分布が重要となる理由から、双極子モーメント、化合物が酵素によって分解されるには、一定の空間からなる活性サイトに侵入する必要があり、化合物の三次元的広がりがこれを支配する理由から、ファンデルワールス半径及びファンデルワールス体積、化合物が水、二酸化炭素、アンモニアあるいは硝酸にまで分解されるには、様々な結合が解離される必要があり、それぞれの結合に対する解離エネルギーがこれに関与する理由から、解離エネルギーなどが挙げられる。
【0264】
〔窒素原子を含む官能基と量子化学構造パラメータの関係〕
窒素原子を含む化合物のBODを化合物の化学構造パラメータと関連付ける上で、重要となる、窒素原子を含む官能基と量子化学構造パラメータの関係の関係を説明する。
【0265】
窒素原子を含む官能基と量子化学構造パラメータの関係について、
脂肪族化合物の場合を図25~28に、芳香族化合物の場合を図29~32に整理した。
【0266】
図24~32に示される関係に基づき、窒素原子を含む官能基と量子化学構造パラメータの関係を表20-1及び表20-2のように整理できる。
【0267】
【表20-1】
【0268】
【表20-2】
【0269】
表20-1及び表20-2から、窒素原子を含む化合物は、N分極とN電荷によって、窒素原子を含む官能基毎にクラスターに分けることができる。
【0270】
特に、NOを有する化合物は、N電極とN電荷(特にN電荷)が他の官能基を有する化合物に比べて高く、かつ、BODが50未満の化合物が9割ある。
即ち、NOを有する化合物は、N電極とN電荷が大きい故に生分解性が低いということが示唆される。
【0271】
なお、生分解性に関係すると考えられる官能基としては、例えば、
アルデヒド、ケトン、カルボン酸等の窒素原子を含まないカルボニル基含有系官能基;
アミノ基、ニトロ基、シアノ基、アミド基等の窒素原子を含む官能基;
フェノール、トルエン、エチルベンゼン、ベンジルアルコール、安息香酸、スチレン、クレゾール、フタル酸、サルチル酸等の窒素原子を含まない芳香環含有官能基;
アニリン、ニトロベンゼン、ベンゾニトリル等の窒素原子を含む芳香環含有官能基;
ホルマート、アセタート、プロピオナート、ブチラート等のエステル化合物;
ホルムアミド、アセトアミド、ベンズアミド、アセトアニリド等のアミド化合物;
ピリジン、ピぺリジン、キノリン、ベンゾフラン等の複素環化合物等が挙げられる。
【0272】
これらの官能基についても、量子化学構造パラメータによってクラスターに分けることができ、分極・電荷の程度を示すパラメータ等の量子化学構造パラメータは生分解性の因子として大きな意義を有すると考えられる。
【0273】
〔化合物のBODと量子化学構造パラメータの関係(補足)〕
(芳香族化合物のBODとフロンティア軌道の関係)
芳香族化合物が生分解されるには芳香環が開裂される必要がある。
開裂にあたっては、酸素分子が芳香環に結合してカテコールが生成され、カテコール部分が開裂する必要がある。
結合する酸素分子は不対電子対を有しており、この電子が芳香環のπ電子軌道の空軌道に入る必要がある。空軌道の内、最も電子を受け入れやすいのは、空軌道の中で最もエネルギーの低いLUMO1フロンティア軌道である。
【0274】
また、軌道エネルギーがLUMO1の近傍にあるLUMO2、HOMO1、HOMO2を有するフロンティア軌道も電子の受け入れ易さに関与していると考えられる。
【0275】
さらに、酸素分子のフロンティア軌道では、各原子に属する軌道の位相が揃っておりかつ極性を持たない。
このため、酸素分子が芳香環に結合してこれを開裂するためには、芳香環はカテコール可能位置に軌道を有し、この軌道の位相が揃っており対称性が良好であれば開裂が進みやすくなる。
【0276】
このことから、芳香族化合物の生分解性をBODで評価するための量子化学構造パラメータとして、好ましくはフロンティア軌道の軌道エネルギーであるLUMO1、LUMO2、HOMO1及びHOMO2、より好ましくはLUMO1及び/又はこれらの位相と対称性を採用することが好ましい。
【0277】
(芳香族化合物のBODとカテコール可能位置の関係)
前述の通り、芳香族化合物の生分解性に於いてカテコール生成が重要であるが、芳香族化合物は様々な置換基を有し、その数と配置によってカテコールの生成が可能な数が異なる。
技術常識からカテコール可能位置の数が多いほど生分解性が良好であることから、芳香族化合物の生分解性をBODで評価するための非量子化学構造パラメータとしてカテコール可能位置を採用することが好ましい。
【0278】
(脂肪族化合物のBODと最大分極の関係)
脂肪族化合物の生分解の初期過程は加水分解であり、水分子が化合物に結合する必要がある。水分子は極性を有しており、化合物の極性の高い部分に結合して酵素により加水分解を進める。
【0279】
従って、脂肪族化合物の生分解性をBODで評価するには、脂肪族化合物中の分極の最も大きい部分を比較することが有用であり、量子化学構造パラメータとして脂肪族化合物中の最大分極を採用することが好ましい。
【0280】
(窒素原子を含む化合物のBODとN電荷とN分極の関係)
窒素原子を含む化合物の生分解の最終形態は、アンモニア或いは硝酸であり、窒素原子を含まない化合物とは異なった分解酵素が関与している。
【0281】
また、窒素原子は構成する官能基によってその電荷は、例えばニトロ基の場合のように正、及び、例えばアミノ基等の場合のように負のいずれにもなり得る。
【0282】
従来の生分解性予測手法では、各官能基の生分解性への寄与は一定としていたが、本発明では、官能基がN電荷とN分極により分類され、さらにそのグループ内に於いてBODが分布を持つことが明らかとなった。
【0283】
以上の知見から、窒素原子を含む化合物の生分解性をBODで評価する場合、窒素原子を含む化合物をN電荷とN分極で分類する操作を含めることが好ましく、当該操作の結果を当該評価をAIを利用した機械学習を適用して当該評価を行う場合の教師データとして使用すること(言い換えると、当該評価に対してAIを利用した機械学習において、教師データとして当該操作の結果を使用すること)が好ましい。
【0284】
《化合物のBODと化学構造パラメータの関係(まとめ)その2》
〔脂肪族化合物及び脂環式化合物のBODと化学構造パラメータの相関〕
脂肪族化合物及び脂環式化合物について、
BODを被説明変数V
量子化学構造パラメータ(最大分極,N分極,HOMO1,LUMO1)、及び
化合物の官能基の種類を説明変数として、
化合物のBODと化学構造パラメータの相関を、重回帰分析を適用して考察する。
【0285】
周期律表の第2周期までの水素、炭素、窒素、酸素で構成される代表的な官能基を有する脂肪族化合物及び脂環式化合物を対象とし、BODの予測に対して寄与の大きい量子化学構造パラメータ(最大分極、N分極、HOMO1、LUMO1)と官能基の有無について表21-1及び表21-2に整理した(官能基中、「tertiary基」は「tert-基」と表記した)。
【0286】
【表21-1】
【0287】
【表21-2】
【0288】
FGtertはtertiary基の有無(無しの場合0、有りの場合1)
FGOHはヒドロキシル基の有無(無しの場合0、有りの場合1)、
FGCOOHはカルボキシル基の有無(無しの場合0、有りの場合1)、
FGCHOはアルデヒド基の有無(無しの場合0、有りの場合1)、
FGNH2はアミノ基の有無(無しの場合0、有りの場合1)、
FGCNはシアノ基の有無(無しの場合0、有りの場合1)、
FGNO2はニトロ基の有無(無しの場合0、有りの場合1)、
被説明変数VをBODとし、
説明変数が量子化学構造パラメータと非量子化学構造パラメータ(最大分極,N分極,HOMO1,LUMO1,FGtert,FGOH,FGCOOH,FGCHO,FGNH2,FGCN,FGNO2)の場合に、
重回帰分析を適用した場合の被説明変数BODの予測値(目的変数)VPEは、下記式(10-1):
PE=a最大分極+aN分極+aHOMO1+aLUMO1
+aFGtert+aFGOH+aFGCOOH+aFGCHO+aFGNH2
+a10FGCN+a11FGNO2+a (10-1)
(式(10-1)中、a(定数)及びa~a11は偏回帰係数である)で表される。
【0289】
なお、同種の官能基が2以上ある場合も「1」としている。
【0290】
表21-1及び表21-2のデータについて、
説明変数が(FGtert,FGOH,FGCOOH,FGCHO,FGNH2,FGCN,FGNO2)の場合の重回帰分析A、及び、
説明変数が(最大分極,N分極,HOMO1,LUMO1,FGtert,FGOH,FGCOOH,FGCHO,FGNH2,FGCN,FGNO2)の場合の重回帰分析Bを行い、
偏回帰係数、及び、被説明変数と被説明変数の予測値の相関係数を表21-3に整理した。
【0291】
【表21-3】
【0292】
重回帰分析A及びBの場合について、被説明変数BODを縦軸、その予測値VPEを横軸にしてプロットすると図36-1のようになる。
【0293】
例えば、生分解性の指標がBODで、BODを被説明変数V、BODの予測値をVPEとして、
生分解性が良い(環境に対する有害性が低い)とする基準として、
60≦BODを生分解性が良く(良分解)、BOD<60を生分解性が不良(難分解)
を採用すると、図36-1において、BODとVPEの組合せ(BOD,VPE)のプロットにおいて、
60≦BODかつ60≦P(「的中域」ともいう)のプロットの数と、
BOD<60かつP<60(「的中域」ともいう)のプロットの数の和の、
プロットの全数(化合物の全数)に対する割合(%)は、
予測値の良分解・難分解の的中率(BODとVPEの一致度)ということができる(各重回帰分析における的中率を表21-3に掲載した)。
【0294】
〔芳香族化合物のBODと化学構造パラメータの相関〕
芳香族化合物について、BODを被説明変数V、量子化学構造パラメータ(最大分極,N分極,HOMO1,LUMO1,L2/L1,CCP,L/L)(「CCP」は「カテコール可能位置」、「L/L」は「対称性」である)、及び、化合物の官能基の種類を説明変数として、化合物のBODと化学構造パラメータの相関を、重回帰分析を適用して考察する。
【0295】
CCP(カテコール位置)は、量子化学構造パラメータであるフロンティア軌道の対称性を特定するためのパラメータであることから、量子化学構造パラメータに含めた。
【0296】
周期律表の第2周期までの水素、炭素、窒素、酸素で構成される代表的な官能基を有する芳香族化合物を対象とし、BODの予測に対して寄与の大きい量子化学構造パラメータ(最大分極、N分極、HOMO1、LUMO1、CCP、L/L)と官能基の有無について表22-1に整理した。
【0297】
【表21-4】
【0298】
FGtertはtertiary基の有無(無しの場合0、有りの場合1)
FGOHはヒドロキシル基の有無(無しの場合0、有りの場合1)、
FGCOOHはカルボキシル基の有無(無しの場合0、有りの場合1)、
FGCHOはアルデヒド基の有無(無しの場合0、有りの場合1)、
FGNH2はアミノ基の有無(無しの場合0、有りの場合1)、
FGCNはシアノ基の有無(無しの場合0、有りの場合1)、
FGNO2はニトロ基の有無(無しの場合0、有りの場合1)、
被説明変数VをBODとし、説明変数が量子化学構造パラメータと非量子化学構造パラメータ(最大分極,N分極,HOMO1,LUMO1,CCP,LS/LL,FGtert,FGOH,FGCOOH,FGCHO,FGNH2,FGCN,FGNO2)の場合に、重回帰分析を適用した場合の被説明変数BODの予測値(目的変数)VPEは、下記式(10-2):
PE=a最大分極+aN分極+aHOMO1+aLUMO1+aCCP+aLS/LL
+aFGtert+aFGOH+aFGCOOH+a10FGCHO+a11FGNH2
+a12FGCN+a13FGNO2+a (10-2)
(式(10-2)中、CCPはカテコール位置、a及び(定数)a~a13は偏回帰係数である)で表される。
【0299】
なお、同種の官能基が2以上ある場合も「1」としている。
【0300】
表21-4のデータについて、
説明変数が(FGtert,FGOH,FGCOOH,FGCHO,FGNH2,FGCN,FGNO2)の場合の重回帰分析A、及び、
説明変数が(最大分極,N分極,HOMO1,LUMO1,CCP,LS/LL,FGtert,FGOH,FGCOOH,FGCHO,FGNH2,FGCN,FGNO2)の場合の重回帰分析Bを行い、
偏回帰係数、及び、被説明変数と被説明変数の予測値の相関係数を表21-5に整理した。
【0301】
【表21-5】
【0302】
重回帰分析A及びBの場合について、被説明変数BODを縦軸、その予測値VPEを横軸にしてプロットすると図36-2のようになる。
【0303】
例えば、脂肪族・脂環式化合物の場合と同様に、
60≦BODを生分解性が良く(良分解)、BOD<60を生分解性が不良(難分解)
という基準に基づくと、図36-2において、
60≦BODかつ60≦Pのプロットの数と、
BOD<60かつP<60のプロットの数の和の、
プロットの全数に対する割合(%)は、
予測値の良分解・難分解の的中率(BODとVPEの一致度)ということができる(各重回帰分析における的中率を表21-5に掲載した)。
【0304】
《化合物の生体有害性と化学構造パラメータの関係》
〔化合物の生体有害性の評価軸〕
【0305】
化合物の環境生物に対する有害性は、化合物の半数影響濃度(EC50)又は半数致死量(LD50)を指標とすることができ、本発明の効果の検証においては、データが比較的入手し易い、甲殻類であるミジンコに対する半数影響濃度(EC50)を採用した。
【0306】
ミジンコに対する化合物の半数影響濃度(EC50)のデータは、環境省の生態影響試験(藻類、甲殻類、魚類)結果一覧(平成31年3月版)(https://www.env.go.jp/chemi/sesaku/seitai.html)に掲載されたものを利用した。
【0307】
化合物の人体に対する有害性は、化合物の半数致死量(LD50)を指標とすることができるが、人体を使用しての実験データはないため、本発明の効果の検証においては、哺乳動物であるマウスとラットに対する半数致死量(LD50)を採用した。
【0308】
マウスとラットに対する半数致死量(LD50)は、
厚生労働省「職場のあんぜんサイト」の「化学物質-GHS対応モデルラベル・モデルSDS情報」(https://anzeninfo.mhlw.go.jp/anzen/gmsds/gmsds_index_202101.html)」によって検索できる安全データシートに掲載されたデータと、
(一般財団法人)化学物質評価研究機構の公開データベース(https://www.cerij.or.jp/evaluation_document/hazard_assessment_report_03.html)に掲載されたデータを利用して、複数のデータがある場合は、最も毒性が強い値を採用した。
【0309】
表22-1~3に、各化合物について、
ミジンコに対する半数影響濃度(EC50)に基づいて算出されるLog(1/EC50/M)の値、
オクタノール/水分配係数(Kow)の常用対数値LogKow、及び、
化学構造パラメータを整理した。
【0310】
【表22-1】
【0311】
【表22-2】
【0312】
【表22-3】
【0313】
表22-4に、各化合物について、
マウス及びラットに対する半数致死濃度(L50)に基づいて算出されるLog(1/LC50/M)の値、
オクタノール/水分配係数(Kow)の常用対数値LogKow、及び、
化学構造パラメータを整理した。
【0314】
【表22-4】
【0315】
〔重回帰分析〕
従前は、化合物の環境生物及び人体に対する有害性と化合物の物性又は化学構造の相関は、化合物の環境有害性の評価値Log(1/EC50/M)又は人体有害性の評価値Log(1/LD50/M)を被説明変数、化合物のオクタノール/水分配係数の対数LogKowを説明変数として関係づけることが行われてきた。
【0316】
本発明では、Log(1/EC50/M)又はLog(1/LD50/M)を被説明変数V、LogKowに加えて、化合物の官能基の種類と量子化学構造パラメータを説明変数として、化合物の環境生物及び人体に対する有害性の例としてのミジンコ及び人体に対する有害性と化合物の物性又は化学構造の相関を、重回帰分析を適用して考察する。
【0317】
(環境生物及び人体に対する有害性と化合物の物性又は化学構造の相関)
OSは軌道の形状で0又は1、
FGは窒素含有官能基の有無(無しの場合0、有りの場合1)、
FGHLはハロゲン含有官能基の有無(無しの場合0、有りの場合1)、
FGは硫黄含有官能基の有無(無しの場合0、有りの場合1)、
被説明変数をLog(1/EC50/MW)又はLog(1/LD50/MW)、説明変数を(LogKow,HOMO1,LUMO1,ΔEHL,OSHOMO1,OSLUMO1,FG,FGHL,FG)として、重回帰分析を適用した場合の被説明変数をLog(1/EC50/MW)又はLog(1/LD50/MW)の予測値VPEは下記式(11):
PE=aLogKow+aHOMO1+aLUMO1+aΔEHL+aOSHOMO1
+aOSLUMO1+aFG+aFGHL+aFG+a (11)
(式(11)中、a(定数)及びa~aは偏回帰係数である)で表される。
【0318】
なお、同種の官能基が2以上ある場合も「1」としている。
【0319】
表22-1~3及び表22-4のデータについて、
説明変数がLogKowの場合の単回帰分析A、
説明変数が(LogKow,HOMO1,LUMO1,ΔEHL,OSHOMO1,OSLUMO1)の場合の重回帰分析B、及び、
説明変数が(LogKow,HOMO1,LUMO1,ΔEHL,OSHOMO1,OSLUMO1,FG,FGHL,FG)の場合の重回帰分析Cを行い、
偏回帰係数、及び、被説明変数Vと被説明変数の予測値VPEの相関係数を表22-5に整理した。
【0320】
【表22-5】
【0321】
ミジンコについて、重回帰分析A及びCの場合について、被説明変数Log(1/EC50/MW)を縦軸、その予測値VPEを横軸にしてプロットすると図37-1のようになる。
【0322】
マウス・ラットについて、回帰分析A及びCの場合について、被説明変数Log(1/LD50/MW)を縦軸、その予測値Pを横軸にしてプロットすると図37-2のようになる。
【0323】
《本発明1》
本発明1は、化合物の化学構造パラメータに基づく前記化合物の環境及び生体に対する有害性の評価方法であって、前記化学構造パラメータが、前記化合物の量子化学構造パラメータを含む化合物の環境及び生体に対する有害性の評価方法である。
【0324】
化合物の環境に対する有害性の指標としては、化合物の生分解性、加水分解性、土壌中分解性、光分解性、オゾン分解性等が挙げられる。
【0325】
さらに化合物の生分解性の指標としては、化合物のBOD、DOC(溶存有機炭素量(Dissolved Organic Carbon))、分解度等からなる群からなる実験値から選ばれる1以上の実験値が挙げられる。
【0326】
なお、「分解度」は、化審法対応試験(OECD(経済協力開発機構)が加盟国に対してその採用につき勧告を出したテストガイドライン及びMPD(上市前最小安全性評価項目)を、化審法上可能な範囲で導入した試験)(https://www.nite.go.jp/chem/kasinn/s61/kasinhou02.html)の分解度試験(https://www.nite.go.jp/data/000009318.pdf)で得られる「分解度」であり、酸素消費量から算出される分解度と直接定量値から算出される分解度がある。
【0327】
生体に対する有害性の指標としては、EC50、LD50、LC50、NOEC(無影響濃度(No Observed Effect Concentration))、LOEC(最小影響濃度(Lowest Observed Effect Concentration))、NOEL(無影響用量(No Observed Effect Level))、LOEL(最小影響濃度(Lowest Observed Effect Level))等からなる群からなる指標から選ばれる1以上の指標が挙げられる。
【0328】
環境及び生体に対する有害性の指標の実験値(以下「指標実験値」ともいう)が未知の化合物の環境及び生体に対する有害性の評価方法は、以下の態様が挙げられる。
【0329】
(態様I)
指標実験値が未知の化合物の量子化学構造パラメータを含む化学構造パラメータ(以下「化学構造パラメータ」ともいう)について、非量子化学構造パラメータを認定し、及び量子化学構造パラメータを計算(以下「化学構造パラメータを認定及び計算」ともいう)して、当該化学構造パラメータと、直接的に当該化合物の有害性を評価する態様。
【0330】
例えば、以下のステップを有する有害性の評価方法である。
【0331】
〈ステップI-1〉
指標実験値が既知の化合物の化学構造パラメータを認定及び計算して、
認定した官能基毎に、
当該化合物の当該化学構造パラメータと指標実験値との相関関係を、
化学構造パラメータの数の次元の座標軸上にプロットして、
有害性が低いと評価される指標実験値の範囲に対応する当該化学構造パラメータの範囲を、指標実験値の予測範囲とする。
【0332】
〈ステップI-2〉
指標実験値が未知の化合物の化学構造パラメータを認定及び計算して、化学構造パラメータの計算値が、認定された官能基に対応する指標実験値の予測範囲に入れば、有害性は低く、認定された官能基に対応する指標実験値の予測範囲に入らなければ、有害性は高い、と判断する。
【0333】
(態様II)
指標実験値が未知の化合物の化学構造パラメータを認定及び計算して、当該化学構造パラメータに所定の重回帰分析を適用して得られた指標実験値の予測値によって、当該化合物の有害性を評価する態様。
【0334】
例えば、以下のような有害性の評価方法である。
【0335】
指標実験値が既知の化合物の指標実験値を被説明変数V
当該化合物の化学構造パラメータを説明変数として、
前記被説明変数Vと前記説明変数を使用した統計解析モデル又は機械学習で計算される予測値VPEとの一致度が所定の目標値を超えるように、前記化学構造パラメータを選択して、
前記被説明変数Vと前記選択された説明変数を使用した統計解析モデル又は機械学習で計算される予測値 PE の有害性が低いと評価される被説明変数Vの範囲への属否によって環境及び生体に対する有害性を評価する。
【0336】
なお、一致度は、
前記被説明変数Vと前記予測値VPEとの単回帰分析による相関係数(例えば、表25、図37-1及び図37-2を導いた態様における相関係数)であるか、
前記化合物の全数に対する、前記被説明変数Vと前記予測値の組合せ(VE,PE)の前記被説明変数Vと前記予測値VPEのどちらもが前記有害性が低いと評価される前記指標の範囲に入る数の割合(例えば表21-3及び図36-1、及び表21-4及び図36-2を導いた態様における的中率)である。
【0337】
態様IIにおける指標実験値の予測値(例えば、BOD予測値)の計算は、機械学習により計算することがより好ましい。以下、機械学習の説明は非特許文献8に拠った。
【0338】
非特許文献8によれば、機械学習とは、データから規則性や判断基準を学習し、それに基づき未知のものを予測・判断する技術と、人工知能に関わる分析技術を意味し、利用できるデータ(入力データと出力データ)の状況により「教師あり学習」「教師なし学習」「強化学習」に分類される(表23)
【0339】
【表23】
【0340】
本発明1では、化合物の化学構造パラメータと有害性の指標(例えば、BOD)が利用でき、化学構造パラメータが入力に関するデータで、有害性の指標(例えば、BOD)が出力に関するデータであることから、「教師なし学習」を間接的に利用しつつ「教師あり学習」と「強化学習」により直接的に計算した結果を利用できる。
【0341】
強化学習では、例えば、「ニューラルネットワーク分析」が有用であり、AIに図33に例示する入力層、中間層、出力層に相当するステップを繰り返し実行させ、出力層において計算された出力が教師データと照合され、出力と教師データの一致度が高くなるように、繰り返しの中で重みのつけ方を調整する。
【0342】
強化学習では、「ニューラルネットワーク分析」における中間層を2層以上に多層化した図34に例示する「ディープラーニング分析」を適用すると、出力と教師データの一致度を高くすることができる。
【0343】
出力に関するデータにおける「教師データ」として、本明細書で説明し、実施態様例1で評価の基礎とする、有害性の指標(例えば、BOD)が既知の化合物の(例えば、表12-3、15-3、16~18、19-1、19-2、20-1及び20-2からなる群から選ばれる少なくとも1以上の表に基づく)量子化学構造パラメータを含む化学構造パラメータと有害性の指標(例えば、生分解性)の関係を使用することが好ましい。
【0344】
本発明1の態様II(例えば、実施態様例2)は、入力された化合物の化学構造パラメータに基づき、AIにより「決定木」「クラスタリング」「アソシエーション分析」「ソーシャルネットワーク分析」及び「ニューラルネットワーク分析」からなる群の少なくとも1以上の分析手法を適用して、有害性の指標の実験値(例えば、BOD実測値)に対して有害性の指標の実験値の予測値(例えば、BOD予測値)の差が小さくなる(有害性の指標の実験値の予測値(例えば、BOD予測値)の精度が向上する)ように、化合物の化学構造パラメータを自動生成して入力データを豊富化したり、化学構造パラメータへの重みのつけ方を自動調整する方法である。
【0345】
本発明1の態様II(例えば、実施態様例3)の計算は、化学構造パラメータと有害性の指標(例えば、BOD)のデータに基づき、公知のソフトウェアにより計算に必要なステップを、例えばコンピュータが実行して行うことができる。
【0346】
〔化合物の環境に対する有害性の評価方法〕
本発明1のうち、環境に対する有害性の評価方法を、化合物の生分解性の評価方法を例にして説明する。
【0347】
以下では、化合物の生分解性の指標としてBODを例にして説明するが、他の指標を使用してもよい。
【0348】
本発明1では、化合物の生分解性は、例えば、当該化合物のBODが高いほど高いとする。
【0349】
但し、BODはPOPsの指標として最も重要な基本的指標であるので、現状の他の指標の多くは、BODと相関が取れており、本明細書で説明されるBODと化学構造パラメータとの関係性は、当該指標と化学構造パラメータに反映されることになるため、そのような他の指標を使用した本発明の実施態様も本発明に含まれる。
【0350】
化合物のBODがどの程度であれば生分解性がよいかは、化合物の生分解性を評価しようとする技術分野により異なってよい。
【0351】
例えば、化合物のBODが、
50以上の場合を生分解し易い(以下「良分解」ともいう)、
50未満の場合を生分解し難い(以下「難分解」ともいう)という基準にしても、
60以上で良分解、60未満で難分解としてもよい。
【0352】
取り扱う化合物を製造、販売、使用、廃棄等する過程で、これらの作業環境での生分解を予定している産業技術分野や、化合物の環境中での挙動によって環境生物や人の健康への影響を議論する環境科学分野では、多くの場合、
化合物のBODが60以上で良分解、60未満で難分解という基準が採用され、化合物のBODが40以下では化合は実質的に生分解しないと評価される。
【0353】
なお、BODが既知の化合物について得た、表12-3、15-3、16~18、19-1及び19-2に基づく量子化学構造パラメータを含む化学構造パラメータと生分解性の関係は、
化合物のBODが50以上で良分解、50未満で難分解という基準でも、
化合物のBODが60以上で良分解、60未満で難分解という基準でも概ね成立する。
【0354】
本発明1によるBODが未知の化合物の生分解性の評価方法は、以下の態様が挙げられる。
【0355】
(態様I)
BODが未知の化合物の量子化学構造パラメータを含む化学構造パラメータを認定及び計算して、当該化学構造パラメータから、直接的に当該化合物の生分解性を評価する態様(例えば、実施態様例1)。
【0356】
(態様II)
BODが未知の化合物の量子化学構造パラメータを含む化学構造パラメータを認定及び計算して、当該化学構造パラメータを用いて当該化合物の予想されるBOD(以下「BOD予測値」ともいう)を計算して、当該化合物の生分解性を評価する方法(例えば、実施態様例2、3、4及び5)。
【0357】
態様I及びIIを適用して計算するに際して、基本手順として、化合物の化学構造パラメータを認定又は計算する手順(ステップ)が好ましく、より好ましくは必要である。
【0358】
■基本手順■
化合物の少なくとも以下の化学構造パラメータを認定及び計算する。
【0359】
(1)非量子化学構造パラメータの認定
(1-1)窒素原子の有無の認定
(1-2)脂肪族化合物と芳香族化合物の判別
(1-3)生分解性が低い化合物に関する技術常識
(1-3-1)tertiary基の有無
(1-3-2)エステル結合、アミド結合、尿素結合を有しない化合物の分子量
(1-4)カテコール可能位置
【0360】
(2)窒素原子を含まない脂肪族化合物の量子化学構造パラメータの計算
(2-1)最大分極 (2-2)ΔEHL (2-3)ΔEHL
【0361】
(3)窒素原子を含まない芳香族化合物の量子化学構造パラメータの計算
(3-1)ΔEHL (3-2)ΔELL
(3-3)カテコール可能位置のLUMO1フロンティア軌道の対称性
(3-4)カテコール可能位置のLUMO1フロンティア軌道以外のフロンティア軌道の対称性
【0362】
(4)窒素原子を含む脂肪族化合物の量子化学構造パラメータの計算
(4-1)N電荷
【0363】
(5)窒素原子を含む芳香族化合物の量子化学構造パラメータの計算
(5-1)N分極 (5-2)N電荷 (5-3)ΔEHL (5-4)ΔELL
(5-5)カテコール可能位置のLUMO1フロンティア軌道の対称性
【0364】
■本発明1の実施態様例1■
BODが既知の化合物の表12-3、15-3、16~18、19-1、19-2、20-1及び20-2からなる群から選ばれる少なくとも1以上の表に基づく量子化学構造パラメータを含む化学構造パラメータと生分解性の関係は、BODが未知の化合物に対しても適用できるとして、BODが未知の化合物の生分解性を以下のように評価する。
【0365】
<実施態様例1の追加手順>
BODが未知の化合物の、基本手順で認定又は計算された化学構造パラメータから選ばれる少なくとも1以上のパラメータ(但し、少なくとも量子化学構造パラメータを含む)に基づき、表12-3、15-3、16~18、19-1、19-2、20-1及び20-2からなる群から選ばれる少なくとも1以上の表を参照して、BODが未知の化合物が、基準以上のBODに該当する可能性、又は、良分解となる(若しくは難分解となる)可能性を評価する。
【0366】
■本発明1の実施態様例2■
<実施態様例2の追加手順1>
BODが既知の化合物のBOD予測値を目的変数Y、
BODが既知の化合物について、基本手順で認定又は計算された化学構造パラメータから選ばれる少なくとも1以上のパラメータ(但し、少なくとも量子化学構造パラメータを含む)を説明変数X(i=1・・・n)(nは化学構造パラメータの数)、
α及びα(i=1・・・n)を偏回帰係数として、
下記式(12-1)で示される重回帰式を求める(Σはiについての和を意味する)。
Y=α+α+・・・+α=α+Σα (12-1)
【0367】
偏回帰係数は、BODが既知の化合物群の各化合物のBOD実測値と、説明変数Xに対応する化学構造パラメータxに対して最小二乗法を適用して求める。
【0368】
<実施態様例2の追加手順2>
重回帰式(10)を用いて計算されたBODが既知の化合物の目的変数Yの値を、BODが既知の化合物のBOD予想値とし、
重回帰式(10)を用いて計算されたBODが既知の化合物のBOD予想値に基づき良分解としたものが、当該化合物群のBOD測定値でも良分解であった割合が、重回帰式の計算結果の的中率となり、
BODが既知の化合物のBOD予想値に基づき良分解としたものが、当該化合物群のBOD測定値でも難分解であった割合が、重回帰式の計算結果のリスクになると評価できる。
【0369】
<実施態様例2の追加手順3>
重回帰式(12-1)を用いて計算されたBODが未知の化合物のBOD予想値に基づき、上記的中率(上記リスク)の下で、当該化合物の生分解性が評価されることになる。
【0370】
例えば、重回帰式(12-1)を用いて計算されたBODが未知の化合物のBOD予想値が65であれば、上記的中率(上記リスク)の下で、当該化合物良分解性であると評価できる。
【0371】
例えば、基本手順で認定又は計算された化学構造パラメータから選ばれる少なくとも1以上のパラメータとして、窒素原子の有無(X)、ΔELL(X)、対称性(X)を使用すると、式(12-1)は、式(12-2)となる。
Y=α+α+α+α (12-2)
【0372】
ここで、ダミー変数を、
窒素原子の有無(X)は、窒素を含まない場合を0、含む場合を1、
対称性(X)は、ランクがAの場合1、Bの場合2、Cの場合3、Dの場合4、
として重回帰式を求めると、Xに0、Xに1を代入すると、窒素原子を含まない、対称性がランクAの芳香族化合物の重回帰式を得ることができる。
【0373】
また、ダミー変数の他の規定の仕方の例として、例えば、
脂肪族化合物の場合を1、芳香族化合物の場合を2、
tertiary基の含まない場合を0、含む場合を1、
エステル結合、アミド結合、尿素結合を有しない場合で、
分子量が800以上の場合を0、800未満の場合を1としてもよい。
【0374】
■本発明1の実施態様例3■
<実施態様例3の追加手順1>
【0375】
入力されたBOD既知の化合物の化学構造パラメータに基づき、AIにより「決定木」「クラスタリング」「アソシエーション分析」及び「ニューラルネットワーク分析」からなる群から選ばれる少なくとも1以上の分析手法を適用して、BOD実測値に対してBOD予測値の差が小さくなる(BOD予測値の精度が向上する)ように、化合物の化学構造パラメータを自動生成したり、化学構造パラメータへの重みのつけ方を自動調整して、最も精度の高いBOD予測値を計算する。
【0376】
AIにより「決定木」「クラスタリング」「アソシエーション分析」及び「ニューラルネットワーク分析」からなる群から選ばれる少なくとも1以上の分析手法等で化合物を分類するに際して、例えば表20-1及び表20-2に示すような、窒素原子を含む化合物が、N分極、N電荷、ΔEHL,ΔELL等の量子化学構造パラメータで、例えば表20-1及び表20-2に示すようにカテゴライズされることが有用な要素として導入できる。
【0377】
<実施態様例3の追加手順2>
AIによって計算されたBODが既知の化合物のBOD予想値に基づき良分解としたものが、当該化合物群のBOD測定値でも良分解であった割合が、AIによる計算結果の的中率となり、
AIによって計算されたBODが既知の化合物のBOD予想値に基づき良分解としたものが、当該化合物群のBOD測定値でも難分解であった割合が、AIによる計算結果のリスクになると評価できる。
【0378】
<実施態様例3の追加手順3>
AIにより計算されたBODが未知の化合物のBOD予想値に基づき、上記的中率(上記リスク)の下で、当該化合物の生分解性が評価されることになる。
【0379】
例えば、AIにより計算されたBODが未知の化合物のBOD予想値が65であれば、上記的中率(上記リスク)の下で、当該化合物は良分解性であると評価できる。
【0380】
化学構造パラメータは、
実施態様例1では、BODの高低との相関が高いものを選択し、
実施態様例2では、BOD予測値である重回帰式の計算結果の的中率が高くなるように選択し、
実施態様例3では、AIによる計算結果であるBOD予測値の出力と、教師データとの一致が高くなるように選択することが好ましい。
【0381】
例えば、脂肪族化合物と芳香族化合物を判別し、窒素原子の有無を認定し、最大分極、ΔEHL、ΔELLを計算し、カテコール可能位置を選択しフロンティア軌道の対称性をランク付けするというステップを踏んで、これらの結果を実施態様例1~3に適用して化合物の生分解性を評価することが好ましい(ステップの流れを図35に示すフローチャートに示した)。
【0382】
■本発明1の実施態様例4■
本発明1の実施態様例2を、脂肪族・脂環式化合物に対して具体的に適用した場合について説明する。
【0383】
周期律表の第2周期までの水素、炭素、窒素、酸素で構成される代表的な官能基を有するBODが既知の脂肪族化合物及び脂環式化合物について、
BODを被説明変数V
化合物の非量子化学構造パラメータである官能基としてtertiary基、ヒドロキシル基、カルボキシル基、アルデヒド基、アミノ基、シアノ基及びニトロ基を認定し、
量子化学構造パラメータとして最大分極、N分極、HOMO1及びLUMO1を計算し、これらの化学構造パラメータを説明変数として、
被説明変数Vと説明変数に、重回帰分析を適用して、重回帰式(10-1)によって被説明変数Vの予測値VPEを計算し、表21-3及び図36-1の結果を得た。
【0384】
表21-3及び図36-1から、特定の官能基だけを説明変数にするよりも、特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数にする方が,被説明変数Vと予測値VPEの一致度(的中率)が大幅に向上することがわかる。
【0385】
例えば、被説明変数Vと予測値VPEの一致度(的中率)の目標値を70%以上にして、特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数に適用した場合の偏回帰係数を使用した重回帰式(10-1)によって、
BOD(非説明変数V)が未知の脂肪族・脂環式化合物の被説明変数Vの予測値Vを計算して、
予測値Vの的中域の属否によって、BODが未知の脂肪族・脂環式化合物の生分解性を、例えば、
<60であれば、難分解性であり(環境有害性は高い)、
60≦Vあれば、良分解性である(環境有害性は低い)と評価することができる。
【0386】
■本発明1の実施態様例5■
本発明1の実施態様例2を、芳香族化合物に対して具体的に適用した場合について説明する。
【0387】
周期律表の第2周期までの水素、炭素、窒素、酸素で構成される代表的な官能基を有するBODが既知の芳香族化合物について、
BODを被説明変数V
化合物の非量子化学構造パラメータである官能基としてtertiary基、ヒドロキシル基、カルボキシル基、アルデヒド基、アミノ基、シアノ基及びニトロ基を認定し、
量子化学構造パラメータとして最大分極、N分極、HOMO1、LUMO1、CCP(カテコール可能位置)及び対称性(L/L)を計算し、
これらの化学構造パラメータを説明変数として、
被説明変数Vと説明変数に、重回帰分析を適用して、重回帰式(10-2)によって被説明変数の予測値VPEを計算し、表21-5及び図36-2の結果を得た。
【0388】
表21-5及び図36-2から、特定の官能基だけを説明変数にするよりも、特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数にする方が的中率は大幅に向上することがわかる。
【0389】
例えば、被説明変数Vと予測値VPEの一致度(的中率)の目標値を70%以上にして、特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数に適用した場合の偏回帰係数を使用した重回帰式(10-2)によって、
BOD(非説明変数V)が未知の芳香族化合物の被説明変数Vの予測値Vを計算して、
予測値Vの的中域の属否によって、BODが未知の芳香族化合物の生分解性が、
<60であれば、難分解性であり(環境有害性は高い)、
60≦Vあれば、良分解性である(環境有害性は低い)と評価することができる。
【0390】
〔化合物の生体に対する有害性の評価方法〕
本発明1のうち、生体に対する有害性の評価方法を、化合物のLog(1/EC50/M)及びLog(1/LD50/M)を例にして説明する。
【0391】
以下では、生体の有害性の指標として化合物のLog(1/EC50/M)及びLog(1/LD50/M)を使用して説明するが、他の指標を使用してもよい。
【0392】
■本発明1の実施態様例6■
化合物の環境生物に対する有害性の評価方法の例として、甲殻類に属するミジンコに対する有害性の指標として測定されている化合物のLog(1/EC50/M)と化合物の化学構造パラメータの相関を検討する。
【0393】
Log(1/EC50/M)を被説明変数V
化合物の非量子化学構造パラメータとしてLogKow及び特定の官能基(窒素含有官能基、ハロゲン含有官能基及び硫黄含有官能基)を認定し、
量子化学構造パラメータとしてHOMO1、LUMO1を、ΔEHL、OSHOMO1及びOSLUMO1を計算し、
これらの化学構造パラメータを説明変数として、
被説明変数Vと説明変数に、重回帰分析を適用して、重回帰式(11)によって被説明変数の予測値VPEを計算し、表22-5及び図37-1の結果を得た。
【0394】
表22-5及び図37-1から、従来の説明変数(LogKow)だけの重回帰分析Aよりも、
さらに特定の量子化学構造パラメータを説明変数にする重回帰分析B、
さらに特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数にする重回帰分析Cの方が、相関係数が大幅に向上することがわかる。
【0395】
例えば、被説明変数Vと予測値VPEの相関係数の目標値を0.5以上にして、特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数を適用した場合(重回帰分析C)の偏回帰係数を使用した重回帰式(11)によって、
非説明変数Vが未知の化合物の被説明変数Vの予測値Vを計算して、
Log(1/EC50/M)が未知の化合物のミジンコに対する有害性を評価することができる。
【0396】
例えば、甲殻類及び魚類に対する有害性は「農業資材審議会農薬分科会特定農薬小委員会及び中央環境審議会土壌農薬部会農薬小委員会第7回合同会合」(http://www.env.go.jp/council/10dojo/y104-02b.html)で提出された「資料3 水産動植物に対する安全性に係る評価の目安の改定について(案)」(http://www.env.go.jp/council/10dojo/y104-02/mat03.pdf)の「参考5表7」によれば、
EC50≦1mg/Lであれば、クラス1の有害性(急性毒性)、
1mg/L<EC50≦1mg/Lであれば、クラス2の有害性(急性毒性)と評価される。
【0397】
従って、例えば、化合物のミジンコに対するLog(1/EC50/M)の予測値VからEC50(の予測値)を算出して、クラス1の有害性に属するか、クラス2に属するか、どのクラスの有害性にも属さず有害性は高くないか等を評価することができる。
【0398】
■本発明1の実施態様例
化合物の生体に対する有害性の評価方法の例として、哺乳類に属するマウス及びラットに対する有害性の指標として測定されている化合物のLog(1/LD50/M)と化合物の化学構造パラメータの相関を検討する。
【0399】
Log(1/LD50/M)を被説明変数V
化合物の非量子化学構造パラメータとしてLogKow及び特定の官能基(窒素含有官能基、ハロゲン含有官能基及び硫黄含有官能基)を認定し、
量子化学構造パラメータとしてHOMO1、LUMO1を、ΔEHL、OSHOMO1及びOSLUMO1を計算し、
これらの化学構造パラメータを説明変数として、
被説明変数Vと説明変数に、重回帰分析を適用して、重回帰式(11)によって被説明変数の予測値VPEを計算し、表22-5及び図37-2の結果を得た。
【0400】
表22-5及び図37から、従来の説明変数(LogKow)だけの重回帰分析Aよりも、
さらに特定の量子化学構造パラメータを説明変数にする重回帰分析B、
さらに特定の官能基と特定の量子化学構造パラメータを含む化学構造パラメータを説明変数にする重回帰分析Cの方が、この順で相関係数が大幅に向上することがわかる。
【0401】
例えば、被説明変数Vと予測値VPEの相関係数の目標値を0.5以上にして、LogKow、特定の官能基及び特定の量子化学構造パラメータを含む化学構造パラメータを説明変数を適用した場合(重回帰分析C)の偏回帰係数を使用した重回帰式(11)によって、
非説明変数Vが未知の化合物の被説明変数Vの予測値Vを計算して、
Log(1/LD50/M)が未知の化合物のマウス・ラットに対する有害性を評価することができる。
【0402】
例えば、哺乳類に対する有害性は「毒物劇物の判定基準の改定について(通知)」(http://www.nihs.go.jp/law/dokugeki/kijun.pdf)によれば、
LD50≦50mg/kgであれば、経口毒物、
50mg/kg<LD50≦300mg/kgであれば、経口劇物と評価される。
【0403】
従って、例えば、化合物のマウス・マットに対するLog(1/LD50/M)の予測値VからLD50(の予測値)を算出して、経口毒物に属するか、経口薬物に属するか、いずれにも属さず有害性は高くないか等を評価することができる。
【0404】
本発明1の実施態様例1~6からもわかるように、本発明1によれば、例えば、生分解性において、多くの官能基を説明変数にして、化合物の生分解の反応機構を考慮せずに重回帰分析をした従来の方法(非特許文献1)に比べて、生分解の反応機構に寄与する主要な少数の官能基と当該反応機構に寄与する量子化学構造パラメータを説明変数にするだけで、重回帰分析により、化合物の生分解性を精度よく評価できることがわかる。
【0405】
本発明1における環境及び生体に対する有害性の反応機構を考慮した官能基と量子化学構造パラメータを入力データとして選択し、機械学習を適用すれば、環境及び生体に対する有害性の評価を更に高めることができる。
【0406】
《本発明2及び本発明3》
本発明2は、本発明1の評価方法で化合物の生分解性等の環境及び生体に対する有害性を評価する工程を含む化合物の設計方法であり、
本発明3は、本発明2の設計方法で設計された化合物である。
【0407】
本発明2は、生分解性等の環境及び生体に対する有害性の評価を必要とする化合物を新規に設計したり、生分解性を必要とする用途に適するように既存の化合物を設計する際に有用である。
【0408】
本発明2によれば、生分解性等の環境及び生体に対する有害性を考慮して、新規に化合物を設計したり既存の化合物を選択(選択も設計の一手法に含める)する場合、従前のように設計・選択の主目的を達成する複数の候補化合物全てについて生分解性等の環境及び生体に対する有害性を実測しなくても、本発明1の評価方法で候補化合物の生分解性等の環境及び生体に対する有害性を評価して、候補化合物を絞り込むことができる。
【0409】
本発明2の設計方法は、取り扱う化合物を製造、販売、使用、廃棄等する過程で、これらの作業環境での生分解等により環境保全又は生体に対する安全性の維持を予定している産業技術分野における新規化合物や新規用途の開発に有用であるばかりでなく、1973年以前から製造されていた既存化学物質等生分解性等の環境及び生体に対する有害性のデータが無いままに大量に生産されている化合物に対して環境挙動を含む環境及び生体に対する有害性を推定する用途においても有益である。
【0410】
本発明3の化合物は、本発明2の設計方法で設計されているため、生分解性等の環境及び生体に対する有害性の実測試験が簡略化されて設計され、化合物の設計コストが低減されているため、利益率を高くし、又は、販売価格を抑制することができる。
【0411】
《本発明4及び本発明5》
本発明4は、本発明1の評価方法で、化学物質の製造工程で製造される化合物の生分解性等の環境及び生体に対する有害性を評価する工程を含む、化学物質の製造方法であり、
本発明5は、本発明4の化学物質の製造方法で得られうる化学物質である。
【0412】
本発明4は、例えば、化合物の製造過程で不純物や副生物が生じる場合、不純物内の化合物や副生物の生分解性等の環境及び生体に対する有害性を本発明1の評価方法で評価して、製造結果物の精製や副生物の除去の程度を調整して、SDGs(持続的な開発目標)を考慮した環境負荷等の環境及び生体に対する有害性を抑制する観点からみて工程管理精度の高い化学物質の製造方法を提供できる。
【0413】
本発明4における化学物質は、化合物でも組成物でもこれらで構成される構造物でもよい。
【0414】
本発明5は、本発明4の製造方法で製造されているため、環境負荷等の環境及び生体に対する有害性を抑制する観点からみてSDGs(持続的な開発目標)の要請に沿うものとなる。

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36-1】
図36-2】
図37-1】
図37-2】