特開2024-108452 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-108452機械学習プログラム、最適化プログラム、機械学習方法、最適化方法および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024108452

(43)【公開日】2024-08-13

(54)【発明の名称】機械学習プログラム、最適化プログラム、機械学習方法、最適化方法および情報処理装置

(51)【国際特許分類】

G06T 7/00 20170101AFI20240805BHJP

G06N 3/0455 20230101ALI20240805BHJP

【ＦＩ】

G06T7/00 350C

G06N3/0455

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023012832

(22)【出願日】2023-01-31

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】山崎公裕

(72)【発明者】

【氏名】中川章

(72)【発明者】

【氏名】和田裕一郎

(72)【発明者】

【氏名】和田睦世

(72)【発明者】

【氏名】河東孝

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096AA06

5L096AA09

5L096BA08

5L096DA02

5L096FA23

5L096GA08

5L096GA51

5L096GA55

5L096HA11

5L096JA11

5L096KA04

5L096KA15

(57)【要約】（修正有）

【課題】周波数画像を用いた機械学習を精度よく実行する情報処理装置、機械学習方法及びプログラム並びに最適化方法を提供する。
【解決手段】情報処理装置において、機械学習実行部は、射影画像データテーブルから、ある射影方向θ、φの射影画像を取得し、射影画像をフーリエ変換することで、第１の周波数画像を生成し、第１の周波数画像を、エンコーダーに入力して、デコーダーからフーリエ空間の３次元密度構造を推定３次元密度構造を射影方向θ、φに射影することで、第２の周波数画像を取得し、第１の周波数画像と、第２の周波数画像との差分をＰθ，φ（ｕ’，ｖ’）に設定し、下式（３）を基にして、推定誤差を算出し、推定誤差が小さくなるように、Ａｕｔｏ－Ｅｎｃｏｄｅｒ型ニューラルネットワークの機械学習を実行する。

【選択図】図２

【特許請求の範囲】

【請求項1】

第１の周波数画像を入力したエンコーダーの出力をデコーダーに入力することによって、第２の周波数画像を取得し、
第１の周波数に関する重みが前記第１の周波数より高い第２の周波数に関する重みより小さい損失関数と前記第１の周波数画像と前記第２の周波数画像とに基づいて、前記エンコーダーと前記デコーダーとの訓練を実行する、
処理をコンピュータに実行させる機械学習プログラム。

【請求項2】

前記損失関数は、各周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分に、前記第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算した値を累計した推定誤差を算出する関数であり、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする請求項１に記載の機械学習プログラム。

【請求項3】

前記取得する処理は、前記第１の周波数画像を入力した前記エンコーダーの出力を前記デコーダーに入力することによって、３次元密度構造を推定し、前記３次元密度構造を基にして、前記第２の周波数画像を取得することを特徴とする請求項１に記載の機械学習プログラム。

【請求項4】

前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記第１の周波数画像または前記第２の周波数画像のある周波数座標に基づく値が閾値よりも大きい場合には、前記ある周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分を０に設定する処理を更に実行することを特徴とする請求項２に記載の機械学習プログラム。

【請求項5】

前記損失関数は、ガウスフィルタを更に含み、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記ガウスフィルタを更に含む前記損失関数を基にして算出される推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする請求項２に記載の機械学習プログラム。

【請求項6】

第１の３次元密度構造をある射影方向で射影した射影画像に基づく第１の周波数画像と、フーリエ空間の第２の３次元密度構造を前記ある射影方向で射影した第２の周波数画像との差分に、第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算し、
乗算結果が小さくなるように、前記第１の周波数画像の値を調整する、
処理をコンピュータに実行させる最適化プログラム。

【請求項7】

【請求項8】

【請求項9】

第１の周波数画像を入力したエンコーダーの出力をデコーダーに入力することによって、第２の周波数画像を取得し、
第１の周波数に関する重みが前記第１の周波数より高い第２の周波数に関する重みより小さい損失関数と前記第１の周波数画像と前記第２の周波数画像とに基づいて、前記エンコーダーと前記デコーダーとの訓練を実行する、
処理を実行する制御部を有する情報処理装置。

【請求項10】

第１の３次元密度構造をある射影方向で射影した射影画像に基づく第１の周波数画像と、フーリエ空間の第２の３次元密度構造を前記ある射影方向で射影した第２の周波数画像との差分に、第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算し、
乗算結果が小さくなるように、前記第１の周波数画像の値を調整する、
処理を実行する制御部を有する情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、周波数画像を用いた機械学習技術に関する。

【背景技術】

【0002】

観測することが難しい３次元密度構造を様々な角度から射影した各射影画像を基にして、３次元密度構造を推定することが求められている。たとえば、Auto-Encoder型ニューラルネットワークを利用して、射影画像から３次元密度構造を推定する従来技術がある。

【0003】

図５は、従来技術を説明するための図である。図５に示すように、Auto-Encoder型ニューラルネットワークは、エンコーダー１０ａと、デコーダー１０ｂとが含まれる。ここでは、従来技術の処理を実行する装置を「従来装置」と表記する。

【0004】

従来装置は、ある３次元密度構造をある射影方向Ｒで射影した射影画像４に対してフーリエ変換を実行することで、２次元の周波数画像５を生成する。ある３次元密度構造は、タンパク質の密度構造等である。従来装置は、周波数画像５を、エンコーダー１０ａに入力することで、出力結果ｚを取得する。従来装置は、射影画像４を射影した際の射影方向Ｒに関する位置情報と、出力結果ｚとをデコーダー１０ｂに入力することで、フーリエ空間の３次元密度構造６を推定する。３次元密度構造６に対して逆フーリエ変換を実行することで、実空間の３次元密度構造が得られる。

【0005】

ここで、従来装置は、周波数画像５と、推定周波数画像７との差分（誤差）を基にした評価関数を基にして、エンコーダー１０ａと、デコーダー１０ｂとに対する機械学習を実行する。推定周波数画像７は、３次元密度構造６を射影方向Ｒで射影した周波数画像である。たとえば、従来装置が利用する評価関数Ｌを、式（１）に示す。

【0006】

【数1】

【0007】

式（１）の「Ｘ」、周波数画像５の各周波数座標に対応する値である。「ξ」、「θ」は、エンコーダー１０ａおよびデコーダー１０ｂのパラメータに対応する。式（１）の右辺の第１項は、周波数画像５と、推定周波数画像７との差分を評価する期待値Ｅの項である。式（１）の右辺の第２項は、ＫＬダイバージェンスによって定義される項であり、ｑξ（ｚ｜Ｘ）の分布と、ｐ（ｚ）の分布とが近くなるほど、値が小さくなる。なお、ｑξ（ｚ｜Ｘ）は、ｐ（ｚ｜Ｘ）の近似である。ｐ（ｚ）は、Ｎ（０，Ｉ）の正規分布に従う。Ｉは、単位行列である。

【0008】

従来装置は、式（１）に示す評価関数Ｌの値が最小化するように、エンコーダー１０ａと、デコーダー１０ｂとの機械学習を実行する。

【先行技術文献】

【非特許文献】

【0009】

【非特許文献1】Ellen D. Zhong, et al. RECONSTRUCTING CONTINUOUS DISTRIBUTIONS OF 3D PROTEIN STRUCTURE FROM CRYO-EM IMAGES, arXiv:1909.05215v3 [q-bio.QM] 15 Feb 2020

【発明の概要】

【発明が解決しようとする課題】

【0010】

上記のように、従来装置は、機械学習を実行する場合に、式（１）の評価関数Ｌを利用しており、たとえば、実際のタンパク質の各射影画像と、推定した３次元密度構造の各射影画像との差分を、立体構造間の差分として評価している。しかし、２次元の周波数画像間の差分は、３次元密度構造の差と等価ではない。このため、従来技術のように、エンコーダー１０ａおよびデコーダー１０ｂに対して機械学習を実行すると、３次元密度構造の推定精度に影響を与えるという問題がある。

【0011】

図６は、従来技術の課題を説明するための図（１）である。たとえば、ある３次元密度構造１５をランダムな射影方向によって射影することで得られた２次元の射影画像を、射影画像１６，１７とする。射影画像１６，１７に対してフーリエ変換を実行し、フーリエ変換の結果を、３次元周波数空間にマッピングすると、図７に示すものとなる。

【0012】

図７は、従来技術の課題を説明するための図（２）である。３次元周波数空間では、周波数の原点０からの距離Ｒが大きいほど、周波数が大きくなる。３次元周波数空間のｘ成分をω_ｘとし、ｙ成分をω_ｙとし、ｚ成分をω_ｚとする。３次元周波数空間における原点０からの距離Ｒを式（２）で定義する。

【0013】

【数2】

【0014】

たとえば、領域Ａ１の距離Ｒは、領域Ａ２の距離Ｒよりも小さい。このため、領域Ａ１の周波数は、領域Ａ２の周波数よりも小さい。

【0015】

ここで、距離Ｒの周波数は、距離に応じて「１／Ｒ^２」の重みで重複される。距離Ｒが小さい周波数ほど、「１／Ｒ^２」の比率で周波数の値が重複し、周波数が評価されることを意味する。

【0016】

たとえば、従来技術のように、周波数画像５と、推定周波数画像７との差分をそのまま計算すると、領域Ａ２に含まれる周波数の値よりも、領域Ａ１に含まれる周波数の値に重きを置いて差分が算出される。これは、３次元密度構造の詳細構造を、ローパスフィルタで暈した結果同士を比較していることと等価である。

【0017】

図８は、従来技術の課題を説明するための図（３）である。上記のように、従来技術では、推定した３次元密度構造と、実際の３次元密度構造とを暈した結果を比較して、差分を算出しており、３次元密度構造の推定精度が劣化する。理想的には、推定した３次元密度構造と、実際の３次元密度構造との差分を、周波数画像の周波数によらず均等に評価することが望ましい。

【0018】

１つの側面では、本発明は、周波数画像を用いた機械学習を精度よく実行できる機械学習プログラム、最適化プログラム、機械学習方法、最適化方法および情報処理装置を提供することを目的とする。

【課題を解決するための手段】

【0019】

１つの実施態様では、コンピュータが次の処理を実行する。コンピュータは、第１の周波数画像を入力したエンコーダーの出力をデコーダーに入力することによって、第２の周波数画像を取得する。コンピュータは、第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい損失関数と第１の周波数画像と第２の周波数画像とに基づいて、エンコーダーとデコーダーとの訓練を実行する。

【発明の効果】

【0020】

周波数画像を用いた機械学習を精度よく実行できる。

【図面の簡単な説明】

【0021】

【図1】図１は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。

【図2】図２は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。

【図3】図３は、３次元密度構造の最適化の一例を説明するための図である。

【図4】図４は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

【図5】図５は、従来技術を説明するための図である。

【図6】図６は、従来技術の課題を説明するための図（１）である。

【図7】図７は、従来技術の課題を説明するための図（２）である。

【図8】図８は、従来技術の課題を説明するための図（３）である。

【発明を実施するための形態】

【0022】

以下に、本願の開示する機械学習プログラム、最適化プログラム、機械学習方法、最適化方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

【実施例0023】

本実施例に係る情報処理装置は、第１の周波数画像を、Auto-Encoder型ニューラルネットワークに入力して、第２の周波数画像を取得し、第１の周波数画像と、第２の周波数画像との差分を評価して、Auto-Encoder型ニューラルネットワークの機械学習を実行する。第１の周波数画像は、CryoEMにおける入力画像であり、図５で説明した周波数画像５等である。第２の周波数画像は、CryoEMにおける推定画像であり、図５で説明した推定周波数画像６等である。Auto-Encoder型ニューラルネットワークは、エンコーダー１０ａおよびデコーダー１０ｂを含む。

【0024】

図７で説明したように、距離Ｒの周波数は、距離に応じて「１／Ｒ^２」の重みで重複される。距離Ｒが小さい周波数ほど、「１／Ｒ^２」の比率で周波数の値が重複し、第１の周波数画像と、第２の周波数画像との差分をそのまま計算すると、高周波数の値よりも、低周波数の値に重きを置いて差分（誤差）が算出される。たとえば、領域Ａ２に含まれる周波数の値よりも、領域Ａ１に含まれる周波数の値に重きを置いて差分が算出される。以下の説明では、周波数画像の座標であって、２次元のフーリエ変換の座標を「周波数座標」と表記する。

【0025】

ここで、情報処理装置は、第１の周波数画像と、第２の周波数画像との差分を、周波数画像の周波数（周波数座標）によらず均等に評価するために、距離Ｒの各周波数座標の差分（２乗誤差）に対して、それぞれＲ^２を乗じて累積加算する。距離Ｒは、式（２）によって定義されるが、周波数画像は、２次元の画像であるため、「ω_ｚ」の値は０となる。

【0026】

たとえば、情報処理装置は、第１の周波数画像と、第２の周波数画像との差分を評価する場合に、（ｕ’，ｖ’）を２次元のフーリエ変換の周波数座標とし、第１の周波数画像と第２の周波数画像とから、周波数座標（ｕ’，ｖ’）におけるフーリエ変換の差分を計算し、Ｐ_θ，φ（ｕ’，ｖ’）に設定する。情報処理装置は、各周波数座標に対して定義された補正フィルタ係数Ｆ（ｕ’，ｖ’）を用いて、式（３）に示す評価関数によって、推定誤差を計算する。情報処理装置は、推定誤差を計算する場合に、補正フィルタ係数Ｆ（ｕ’，ｖ’）として、「ｕ’^２＋ｖ’^２」を利用する。この「ｕ’^２＋ｖ’^２」は、「Ｒ^２」に対応する。

【0027】

【数3】

【0028】

ここで、周波数画像上の周波数座標（ｕ’_１，ｖ’_１）と原点との距離ｒ_１を式（４）のように定義する。周波数画像上の周波数座標（ｕ’_２，ｖ’_２）と原点との距離ｒ_２を式（５）のように定義する。

【0029】

【数4】

【0030】

【数5】

【0031】

距離ｒ_１と距離ｒ_２との双方が特定の周波数帯域Ｃ_１，Ｃ_２の間にあり、Ｃ_１≦ｒ_１＜ｒ_２≦Ｃ_２の関係を満たすとき、式（６）の関係を満たす周波数座標（ｕ’_１，ｖ’_１）と、周波数座標（ｕ’_２，ｖ’_２）との組み合わせが少なくとも一つ以上存在することを条件として、情報処理装置は、式（３）に示す評価関数によって、推定誤差を計算するものとする。

【0032】

【数6】

【0033】

上記のように、特定の周波数帯域Ｃ_１，Ｃ_２の間に限定したのは、一般に高周波成分には誤差が大きく含まれるため、高周波成分の誤差の影響が大きくなりすぎることを抑止するためである。

【0034】

情報処理装置は、評価関数による推定誤差が小さくなるように、Auto-Encoder型ニューラルネットワークに対して機械学習を実行する。

【0035】

上記のように、本実施例に係る情報処理装置は、第１の周波数画像を、Auto-Encoder型ニューラルネットワークに入力して、第２の周波数画像を取得し、第１の周波数画像と、第２の周波数画像との差分を評価する場合に、式（３）の評価関数によって、推定誤差を計算する。かかる評価関数は、第１の周波数に関する重みが、第２の周波数（第１の周波数よりも高い周波数）に関する重みよりも小さい評価関数である。これによって、第１の周波数画像と、第２の周波数画像との差分を、周波数画像の周波数（周波数座標）によらず均等に評価でき、周波数画像を用いた機械学習を精度よく実行できる。

【0036】

次に、上述した処理を実行する情報処理装置の構成例について説明する。図１は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図１に示すように、この情報処理装置１００は、通信部１１０と、入力部１２０と、表示部１３０と、記憶部１４０と、制御部１５０とを有する。

【0037】

通信部１１０は、ネットワークを介して、外部装置等との間でデータ通信を実行する。たとえば、通信部１１０は、外部装置等から、射影画像データテーブル１４１のデータを受信する。

【0038】

入力部１２０は、情報処理装置１００の制御部１５０に各種の情報を入力する場合にユーザにより操作される。

【0039】

表示部１３０は、制御部１５０から出力される情報を表示する。

【0040】

記憶部１４０は、射影画像データテーブル１４１と、オートエンコーダデータ１４２とを有する。記憶部１４０は、その他の情報を有していてもよい。

【0041】

射影画像データテーブル１４１は、複数の射影画像のデータを保持する。たとえば、射影画像データテーブル１４１の各射影画像は、実際のタンパク質（３次元密度構造）に対し、ある射影方向θ、φで射影された２次元の画像である。射影画像データテーブル１４１は、射影画像と、かかる射影画像を生成する場合に設定した射影方向の情報とを対応付けて、保持してもよい。

【0042】

オートエンコーダデータ１４２は、Auto-Encoder型ニューラルネットワークのデータである。たとえば、Auto-Encoder型ニューラルネットワークは、図５に示したAuto-Encoder型ニューラルネットワークであり、エンコーダー１０ａおよびデコーダー１０ｂを含む。

【0043】

制御部１５０は、取得部１５１と、機械学習実行部１５２と、構造推定部１５３とを有する。

【0044】

取得部１５１は、通信部１１０を介して、外部装置等から、射影画像データテーブル１４１のデータを取得する。取得部１５１は、取得した射影画像データテーブル１４１を、記憶部１４０に登録する。取得部１５１は、入力部１２０から、射影方向や、射影画像のデータを取得してもよい。

【0045】

機械学習実行部１５２は、オートエンコーダデータ１４２を読み出して、Auto-Encoder型ニューラルネットワークを実行し、Auto-Encoder型ニューラルネットワークに対する機械学習を実行する。Auto-Encoder型ニューラルネットワークには、エンコーダー１０ａおよびデコーダー１０ｂが含まれる。以下において、機械学習実行部１５２の処理の一例について説明する。

【0046】

機械学習実行部１５２は、射影画像データテーブル１４１から、射影画像および射影方向を取得する。機械学習実行部１５２は、取得した射影画像に対してフーリエ変換を実行することで、第１の周波数画像を生成する。機械学習実行部１５２は、第１の周波数画像を、エンコーダー１０ａに入力し、エンコーダー１０ａの出力結果ｚを取得する。機械学習実行部１５２は、出力結果ｚと、射影方向に関する情報とをデコーダー１０ｂに入力することで、デコーダー１０ｂからフーリエ空間の３次元密度構造の推定結果を取得する。

【0047】

機械学習実行部１５２は、推定結果の３次元密度構造に対して、所定の射影方向の射影を行うことで、第２の周波数画像を取得する。たとえば、かかる所定の射影方向は、射影画像データテーブル１４１から取得した射影画像に対応する射影方向である。

【0048】

機械学習実行部１５２は、式（３）の評価関数を基にして、第１の周波数画像の各周波数座標の値と、第２の周波数画像の各周波数座標の値との差分の累積加算し、推定誤差を得る。機械学習実行部１５２は、推定誤差が小さくなるように、Auto-Encoder型ニューラルネットワークに対して機械学習を実行する。たとえば、機械学習実行部１５２は、誤差逆伝播学習法に基づいて、Auto-Encoder型ニューラルネットワークのエンコーダー１０ａおよびデコーダー１０ｂのパラメータを更新する。

【0049】

機械学習実行部１５２は、射影画像データテーブル１４１に格納された各射影画像を基にして、上記処理を繰り返し実行することで、Auto-Encoder型ニューラルネットワークを訓練する。

【0050】

ところで、機械学習実行部１５２は、推定誤差を算出する場合の補正フィルタ係数Ｆ（ｕ’，ｖ’）として、「ｕ’^２，ｖ’^２」を利用していたが、「ｕ’^２，ｖ’^２」の代わりに、「ｕ’^２，ｖ’^２」に比例する値を利用してもよい。

【0051】

また、機械学習実行部１５２は、推定誤差を算出する場合に、周波数画像（第１の周波数画像および第２の周波数画像）上の全ての周波数座標に対して、補正フィルタ係数を乗算していたが、これに限定されるものではない。機械学習実行部１５２は、周波数画像のある周波数座標（ｕ’_２，ｖ’_２）に設定された値の２乗の和「ｕ’_２ ^２＋ｖ’_２ ^２」が閾値以下である場合には、補正フィルタ係数Ｆ（ｕ’，ｖ’）として、「ｕ’_２ ^２＋ｖ’_２ ^２」に比例する値を利用する。一方、機械学習実行部１５２は、周波数画像のある周波数座標（ｕ’_２，ｖ’_２）に設定された値の２乗の和「ｕ’_２ ^２＋ｖ’_２ ^２」が閾値以下でない場合には、補正フィルタ係数Ｆ（ｕ’，ｖ’）として、「０」を利用する。

【0052】

従来技術では、周波数画像の原点から周波数座標（ｕ’，ｖ’）までの距離ｒによらず、補正フィルタ係数Ｆ（ｕ’，ｖ’）＝１であったため、ｒが大きい高周波数成分で、高周波が大幅にカットされてしまい、高周波の差分に対する貢献度が小さかった。そのため、機械学習実行部１５２は、ある正の数δを導入してＯ（Ｆ（ｕ’，ｖ’））≧Ｏ（ｒ^δ）となるように、補正フィルタ係数Ｆ（ｕ’，ｖ’）を設定する。

【0053】

なお、機械学習実行部１５２は、補正フィルタ係数Ｆ（ｕ’，ｖ’）の各周波数の重みを制御するパラメータσを用いて、式（７）の評価関数を用いて、推定誤差を算出してもよい。式（７）に含まれるＨ（ｕ，ｖ）は、式（８）によって示され、周波数画像に対する分散σ^２のガウスフィルタのフーリエ変換を示す。

【0054】

【数7】

【0055】

【数8】

【0056】

構造推定部１５３は、機械学習実行部１５２によって訓練済みのAuto-Encoder型ニューラルネットワークを基にして、３次元密度構造を推定する。

【0057】

たとえば、構造推定部１５３は、入力部１２０等から、対象の射影画像を取得する。構造推定部１５３は、射影画像に対してフーリエ変換を実行することで、周波数画像を生成する。

【0058】

構造推定部１５３は、周波数画像を、訓練済みのAuto-Encoder型ニューラルネットワークに入力し、フーリエ空間の３次元密度構造を推定する。構造推定部１５３は、フーリエ空間の３次元密度構造に対して、逆フーリエ変換を実行することで、実空間の３次元密度構造を推定する。構造推定部１５３は、推定結果を、表示部１３０に出力して表示させる。

【0059】

次に、本実施例に係る情報処理装置１００が、Auto-Encoder型ニューラルネットワークの機械学習を実行する処理の手順について説明する。図２は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。情報処理装置１００の機械学習実行部１５２は、射影画像データテーブル１４１から、ある射影方向θ、φの射影画像を取得する（ステップＳ１０１）。

【0060】

機械学習実行部１５２は、射影画像をフーリエ変換することで、第１の周波数画像を生成する（ステップＳ１０２）。機械学習実行部１５２は、第１の周波数画像を、エンコーダー１０ａに入力して、デコーダー１０ｂからフーリエ空間の３次元密度構造を推定する（ステップＳ１０３）。

【0061】

機械学習実行部１５２は、３次元密度構造を射影方向θ、φに射影することで、第２の周波数画像を取得する（ステップＳ１０４）。機械学習実行部１５２は、各周波数座標において、第１の周波数画像と、第２の周波数画像との差分をＰ_θ，φ（ｕ’，ｖ’）に設定する（ステップＳ１０５）。

【0062】

機械学習実行部１５２は、式（３）を基にして、推定誤差を算出する（ステップＳ１０６）。機械学習実行部１５２は、推定誤差が小さくなるように、Auto-Encoder型ニューラルネットワークの機械学習を実行する（ステップＳ１０７）。

【0063】

次に、本実施例の効果について説明する。情報処理装置１００は、第１の周波数画像を、Auto-Encoder型ニューラルネットワークに入力して、第２の周波数画像を取得し、第１の周波数画像と、第２の周波数画像との差分を評価する場合に、式（３）の評価関数によって、推定誤差を計算する。かかる評価関数は、第１の周波数に関する重みが、第２の周波数（第１の周波数よりも高い周波数）に関する重みよりも小さい評価関数である。これによって、第１の周波数画像と、第２の周波数画像との差分を、周波数画像の周波数（周波数座標）によらず均等に評価でき、周波数画像を用いた機械学習を精度よく実行できる。

【0064】

情報処理装置１００は、周波数画像のある周波数座標（ｕ’_２，ｖ’_２）に設定された値の２乗の和「ｕ’_２ ^２＋ｖ’_２ ^２」が閾値以下である場合には、補正フィルタ係数Ｆ（ｕ’，ｖ’）として、「ｕ’_２ ^２＋ｖ’_２ ^２」に比例する値を利用する。一方、情報処理装置１００は、周波数画像のある周波数座標（ｕ’_２，ｖ’_２）に設定された値の２乗の和「ｕ’_２ ^２＋ｖ’_２ ^２」が閾値以下でない場合には、補正フィルタ係数Ｆ（ｕ’，ｖ’）として、「０」を利用する。これによって、ノイズの影響が低周波よりも大きい高周波の貢献度が大きくなりすぎることを抑止することができる。

【0065】

ところで、上述した情報処理装置１００は、上記のアイデアを３次元密度構造の最適化に適用することもできる。図３は、３次元密度構造の最適化の一例を説明するための図である。

【0066】

図３では、実空間の３次元密度構造２０を、実空間の３次元密度構造３０に最適化する場合について説明する。たとえば、３次元密度構造２０は、推定対象となる３次元密度構造である。情報処理装置１００は、３次元密度構造２０を、第１射影方向によって射影することで、射影画像２１を生成する。情報処理装置１００は、射影画像２１に対して２次元のフーリエ変換を実行することで、周波数画像２１ａを生成する。

【0067】

一方、情報処理装置１００は、実際の３次元密度構造３０に対して３次元のフーリエ変換を実行することで、フーリエ空間の３次元密度構造３０ａを生成する。情報処理装置１００は、３次元密度構造３０ａを、第１射影方向によって射影することで、周波数画像３１ａを生成する。

【0068】

情報処理装置１００は、各周波数座標について、周波数画像２１ａと周波数画像３１ａとの差分を算出し、算出した差分に、補正フィルタ係数Ｆ（ｕ’，ｖ’）を乗算した値を累積することで、推定誤差を算出する。情報処理装置１００は、推定誤差が小さくなるように、周波数画像２１ａの各周波数座標の値を調整する。

【0069】

続いて、情報処理装置１００は、３次元密度構造２０を、第１射影方向とは異なる第２射影方向によって射影することで、射影画像２２を生成する。情報処理装置１００は、射影画像２２に対して２次元のフーリエ変換を実行することで、周波数画像２２ａを生成する。

【0070】

情報処理装置１００は、３次元密度構造３０ａを、第２射影方向によって射影することで、周波数画像３２ａを生成する。

【0071】

情報処理装置１００は、各周波数座標について、周波数画像２２ａと周波数画像３２ａとの差分を算出し、算出した差分に、補正フィルタ係数Ｆ（ｕ’，ｖ’）を乗算した値を累積することで、推定誤差を算出する。情報処理装置１００は、推定誤差が小さくなるように、周波数画像２２ａの各周波数座標の値を調整する。

【0072】

同様にして、情報処理装置１００は、３次元密度構造２０を他の射影方向で射影した射影画像をフーリエ変換した周波数画像について、上記の処理を繰り返し実行することで、調整後の周波数画像を得る。情報処理装置１００は、各調整後の周波数画像を逆フーリエ変換することで、調整後の射影画像を取得し、各射影画像を基にして、実空間の３次元密度構造４０を生成する。これによって、情報処理装置１００は、３次元密度構造２０を、３次元密度構造４０に最適化することができる。図３で説明した処理は、情報処理装置１００の制御部１５０が実行してもよい。

【0073】

次に、上述した情報処理装置１００と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図４は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

【0074】

図４に示すように、コンピュータ３００は、各種演算処理を実行するＣＰＵ３０１と、ユーザからのデータの入力を受け付ける入力装置３０２と、ディスプレイ３０３とを有する。また、コンピュータ３００は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置３０４と、インタフェース装置３０５とを有する。また、コンピュータ３００は、各種情報を一時記憶するＲＡＭ３０６と、ハードディスク装置３０７とを有する。そして、各装置３０１～３０７は、バス３０８に接続される。

【0075】

ハードディスク装置３０７は、取得プログラム３０７ａ、機械学習実行プログラム３０７ｂ、構造推定プログラム３０７ｃを有する。また、ＣＰＵ３０１は、各プログラム３０７ａ～３０７ｃを読み出してＲＡＭ３０６に展開する。

【0076】

取得プログラム３０７ａは、取得プロセス３０６ａとして機能する。機械学習実行プログラム３０７ｂは、機械学習実行プロセス３０６ｂとして機能する。構造推定プログラム３０７ｃは、構造推定プロセス３０６ｃとして機能する。

【0077】

取得プロセス３０６ａの処理は、取得部１５１の処理に対応する。機械学習実行プロセス３０６ｂの処理は、機械学習実行部１５２の処理に対応する。構造推定プロセス３０６ｃの処理は、構造推定部１５３の処理に対応する。

【0078】

なお、各プログラム３０７ａ～３０７ｃについては、必ずしも最初からハードディスク装置３０７に記憶させておかなくても良い。例えば、コンピュータ３００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤ、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ３００が各プログラム３０７ａ～３０７ｃを読み出して実行するようにしてもよい。

【0079】

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。

【0080】

（付記１）第１の周波数画像を入力したエンコーダーの出力をデコーダーに入力することによって、第２の周波数画像を取得し、
第１の周波数に関する重みが前記第１の周波数より高い第２の周波数に関する重みより小さい損失関数と前記第１の周波数画像と前記第２の周波数画像とに基づいて、前記エンコーダーと前記デコーダーとの訓練を実行する、
処理をコンピュータに実行させる機械学習プログラム。

【0081】

（付記２）前記損失関数は、各周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分に、前記第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算した値を累計した推定誤差を算出する関数であり、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする付記１に記載の機械学習プログラム。

【0082】

（付記３）前記取得する処理は、前記第１の周波数画像を入力した前記エンコーダーの出力を前記デコーダーに入力することによって、３次元密度構造を推定し、前記３次元密度構造を基にして、前記第２の周波数画像を取得することを特徴とする付記１に記載の機械学習プログラム。

【0083】

（付記４）前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記第１の周波数画像または前記第２の周波数画像のある周波数座標に基づく値が閾値よりも大きい場合には、前記ある周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分を０に設定する処理を更に実行することを特徴とする付記２に記載の機械学習プログラム。

【0084】

（付記５）前記損失関数は、ガウスフィルタを更に含み、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記ガウスフィルタを更に含む前記損失関数を基にして算出される推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする付記２に記載の機械学習プログラム。

【0085】

（付記６）第１の３次元密度構造をある射影方向で射影した射影画像に基づく第１の周波数画像と、フーリエ空間の第２の３次元密度構造を前記ある射影方向で射影した第２の周波数画像との差分に、第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算し、
乗算結果が小さくなるように、前記第１の周波数画像の値を調整する
処理をコンピュータに実行させることを特徴とする最適化プログラム。

【0086】

（付記７）第１の周波数画像を入力したエンコーダーの出力をデコーダーに入力することによって、第２の周波数画像を取得し、
第１の周波数に関する重みが前記第１の周波数より高い第２の周波数に関する重みより小さい損失関数と前記第１の周波数画像と前記第２の周波数画像とに基づいて、前記エンコーダーと前記デコーダーとの訓練を実行する、
処理をコンピュータが実行する機械学習方法。

【0087】

（付記８）前記損失関数は、各周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分に、前記第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算した値を累計した推定誤差を算出する関数であり、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする付記７に記載の機械学習方法。

【0088】

（付記９）前記取得する処理は、前記第１の周波数画像を入力した前記エンコーダーの出力を前記デコーダーに入力することによって、３次元密度構造を推定し、前記３次元密度構造を基にして、前記第２の周波数画像を取得することを特徴とする付記７に記載の機械学習方法。

【0089】

（付記１０）前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記第１の周波数画像または前記第２の周波数画像のある周波数座標に基づく値が閾値よりも大きい場合には、前記ある周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分を０に設定する処理を更に実行することを特徴とする付記８に記載の機械学習方法。

【0090】

（付記１１）前記損失関数は、ガウスフィルタを更に含み、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記ガウスフィルタを更に含む前記損失関数を基にして算出される推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする付記８に記載の機械学習方法。

【0091】

（付記１２）第１の３次元密度構造をある射影方向で射影した射影画像に基づく第１の周波数画像と、フーリエ空間の第２の３次元密度構造を前記ある射影方向で射影した第２の周波数画像との差分に、第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算し、
乗算結果が小さくなるように、前記第１の周波数画像の値を調整する
処理をコンピュータが実行する最適化方法。

【0092】

（付記１３）第１の周波数画像を入力したエンコーダーの出力をデコーダーに入力することによって、第２の周波数画像を取得し、
第１の周波数に関する重みが前記第１の周波数より高い第２の周波数に関する重みより小さい損失関数と前記第１の周波数画像と前記第２の周波数画像とに基づいて、前記エンコーダーと前記デコーダーとの訓練を実行する、
処理を実行する制御部を有する情報処理装置。

【0093】

（付記１４）前記損失関数は、各周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分に、前記第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算した値を累計した推定誤差を算出する関数であり、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする付記１３に記載の情報処理装置。

【0094】

（付記１５）前記取得する処理は、前記第１の周波数画像を入力した前記エンコーダーの出力を前記デコーダーに入力することによって、３次元密度構造を推定し、前記３次元密度構造を基にして、前記第２の周波数画像を取得することを特徴とする付記１３に記載の情報処理装置。

【0095】

（付記１６）前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記第１の周波数画像または前記第２の周波数画像のある周波数座標に基づく値が閾値よりも大きい場合には、前記ある周波数座標における前記第１の周波数画像と前記第２の周波数画像との差分を０に設定する処理を更に実行することを特徴とする付記１４に記載の情報処理装置。

【0096】

（付記１７）前記損失関数は、ガウスフィルタを更に含み、前記エンコーダーと前記デコーダーの訓練を実行する処理は、前記ガウスフィルタを更に含む前記損失関数を基にして算出される推定誤差を基にして、前記エンコーダーと前記デコーダーとの訓練を実行することを特徴とする付記１４に記載の情報処理装置。

【0097】

（付記１８）第１の３次元密度構造をある射影方向で射影した射影画像に基づく第１の周波数画像と、フーリエ空間の第２の３次元密度構造を前記ある射影方向で射影した第２の周波数画像との差分に、第１の周波数に関する重みが第１の周波数より高い第２の周波数に関する重みより小さい重みを乗算し、
乗算結果が小さくなるように、前記第１の周波数画像の値を調整する
処理を実行する制御部を有する情報処理装置。

【符号の説明】

【0098】

１００情報処理装置
１１０通信部
１２０入力部
１３０表示部
１４０記憶部
１４１射影画像データテーブル
１４２オートエンコーダデータ
１５０制御部
１５１取得部
１５２機械学習実行部
１５３構造推定部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

【図8】

IP Force 特許公報掲載プロジェクト 2022.1.31 β版