(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024077831
(43)【公開日】2024-06-10
(54)【発明の名称】予測装置、予測方法及びプログラム
(51)【国際特許分類】
G16Z 99/00 20190101AFI20240603BHJP
G06Q 10/04 20230101ALI20240603BHJP
G01W 1/00 20060101ALN20240603BHJP
【FI】
G16Z99/00
G06Q10/04
G01W1/00 Z
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022190017
(22)【出願日】2022-11-29
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り ・令和4年5月27日に公開された2022年度人工知能学会全国大会(第36回)の大会論文集のウェブサイト ・令和4年6月14日から17日に開催された2022年度人工知能学会全国大会(第36回) ・令和4年8月30日に公開された2022年 第21回情報科学技術フォーラム講演論文集/DVD-ROM (2件) ・令和4年9月13日から15日に開催された2022年 第21回情報科学技術フォーラム(2件) ・令和4年11月24日に公開されたACCV2022/国際学会の発表論文集のウェブサイト
【国等の委託研究の成果に係る記載事項】(出願人による申告)2020年度、国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)、人と共に進化する次世代人工知能に関する技術開発事業、「実世界に埋め込まれる人間中心の人工知能技術の研究開発」委託事業、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】598121341
【氏名又は名称】慶應義塾
(71)【出願人】
【識別番号】301021533
【氏名又は名称】国立研究開発法人産業技術総合研究所
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】杉浦 孔明
(72)【発明者】
【氏名】和田 唯我
(72)【発明者】
【氏名】兼田 寛大
(72)【発明者】
【氏名】飯田 紡
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA04
5L049AA04
5L049DD01
(57)【要約】
【課題】太陽フレアの規模を精度良く予測する。
【解決手段】予測装置が、予測基準時刻より前に撮影された太陽全体の磁場画像の時系列を取得する画像取得部と、予測基準時刻より前に観測された宇宙空間に由来する観測データから太陽の活動領域に関する物理特徴量の時系列を抽出する特徴量抽出部と、磁場画像の時系列及び物理特徴量の時系列に太陽フレアの規模を表す情報が付与された学習データを用いて学習された予測モデルに、画像取得部で取得された磁場画像の時系列及び特徴量抽出部で抽出された物理特徴量の時系列を入力することで、予測基準時刻以降に発生する太陽フレアの規模を予測する予測部と、を備える。
【選択図】
図8
【特許請求の範囲】
【請求項1】
予測基準時刻より前に撮影された太陽全体の磁場画像の時系列を取得するように構成されている画像取得部と、
前記予測基準時刻より前に観測された宇宙空間に由来する観測データから太陽の活動領域に関する物理特徴量の時系列を抽出するように構成されている特徴量抽出部と、
前記磁場画像の時系列及び前記物理特徴量の時系列に太陽フレアの規模を表す情報が付与された学習データを用いて学習された予測モデルに、前記画像取得部で取得された前記磁場画像の時系列及び前記特徴量抽出部で抽出された前記物理特徴量の時系列を入力することで、前記予測基準時刻以降に発生する太陽フレアの規模を予測するように構成されている予測部と、
を備える予測装置。
【請求項2】
請求項1に記載の予測装置であって、
前記予測モデルは、
前記磁場画像から画像特徴量を抽出する特徴抽出層と、
前記物理特徴量の次元を削減する次元削減層と、
前記特徴抽出層の出力及び前記次元削減層の出力を入力に含む第1系列変換層と、
前記次元削減層の出力及び前記次元削減層の出力を入力に含む第2系列変換層と、
を含む予測装置。
【請求項3】
請求項2に記載の予測装置であって、
前記第1系列変換層は、前記特徴抽出層の出力をクエリとし、前記次元削減層の出力をキー及びバリューに含む第1注意機構を含み、
前記第2系列変換層は、前記次元削減層の出力をクエリとし、前記特徴抽出層の出力をキー及びバリューに含む第2注意機構を含む、
予測装置。
【請求項4】
請求項1から3のいずれかに記載の予測装置であって、
前記予測部は、前記予測基準時刻直後の所定の時間長の時間区間で発生する太陽フレアの最大のクラスを出力するように構成されている、
予測装置。
【請求項5】
請求項1から3のいずれかに記載の予測装置であって、
前記予測部は、前記予測基準時刻直後の所定の時間長の時間区間で観測されるX線強度の最大値を出力するように構成されている、
予測装置。
【請求項6】
請求項4に記載の予測装置であって、
前記予測モデルは、太陽フレアの予測結果に関する評価指標に基づく項を有する損失関数を用いて学習されている、
予測装置。
【請求項7】
請求項6に記載の予測装置であって、
前記評価指標は、精度に関する評価指標及び信頼性に関する評価指標を含む、
予測装置。
【請求項8】
請求項4に記載の予測装置であって、
前記予測モデルは、前記学習データにおける前記クラスごとの発生頻度に基づいて学習された後、前記クラスごとの発生頻度が均等となるように前記学習データから抽出した第2の学習データを用いて出力層を再学習されている、
予測装置。
【請求項9】
請求項3に記載の予測装置であって、
前記予測部は、前記第1注意機構又は前記第2注意機構から得られるアテンションマップを出力するように構成されている、
予測装置。
【請求項10】
請求項9に記載の予測装置であって、
前記予測部は、前記アテンションマップに従って着色したヒートマップを前記磁場画像と共に出力するように構成されている、
予測装置。
【請求項11】
コンピュータが、
予測基準時刻より前に撮影された太陽全体の磁場画像の時系列を取得する画像取得手順と、
前記予測基準時刻より前に観測された宇宙空間に由来する観測データから太陽の活動領域に関する物理特徴量の時系列を抽出する特徴量抽出手順と、
前記磁場画像の時系列及び前記物理特徴量の時系列に太陽フレアの規模を表す情報が付与された学習データを用いて学習された予測モデルに、前記画像取得手順で取得された前記磁場画像の時系列及び前記特徴量抽出手順で抽出された前記物理特徴量の時系列を入力することで、前記予測基準時刻以降に発生する太陽フレアの規模を予測する予測手順と、
を実行する予測方法。
【請求項12】
コンピュータに、
予測基準時刻より前に撮影された太陽全体の磁場画像の時系列を取得する画像取得手順と、
前記予測基準時刻より前に観測された宇宙空間に由来する観測データから太陽の活動領域に関する物理特徴量の時系列を抽出する特徴量抽出手順と、
前記磁場画像の時系列及び前記物理特徴量の時系列に太陽フレアの規模を表す情報が付与された学習データを用いて学習された予測モデルに、前記画像取得手順で取得された前記磁場画像の時系列及び前記特徴量抽出手順で抽出された前記物理特徴量の時系列を入力することで、前記予測基準時刻以降に発生する太陽フレアの規模を予測する予測手順と、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予測装置、予測方法及びプログラムに関する。
【背景技術】
【0002】
宇宙空間に生じる現象を予測する宇宙天気予報システムが利用されている。例えば、特許文献1には、宇宙空間に生じる現象を予測するための予測システムが開示されている。特許文献1に開示された予測システムは、宇宙空間に由来する時系列の観測データを取得し、観測データのうち予測タイミングより前のデータ要素に基づいて複数の特徴量を算出し、算出された複数の特徴量を予測モデルに与えることで、予測タイミングに引き続く所定長さの予測期間内において、1または複数の事象の各々が発生する確率を算出する。
【0003】
宇宙空間で生じる様々な現象の中でも、太陽で生じる爆発現象(一般的に「太陽フレア」と呼ばれる)の予測は重要である。太陽フレアによって放出されるX線又は高エネルギー粒子等は、例えば、電波障害、停電、又は宇宙飛行士への健康的被害等をもたらすことが知られている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、従来技術では、太陽フレアの予測性能が低いという課題がある。例えば、従来技術では、実際に発生する太陽フレアよりも規模を小さく予測することがある。
【0006】
本発明の一態様は、上記のような技術的課題に鑑みて、太陽フレアの規模を精度良く予測することを目的とする。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、本発明の一態様による予測装置は、予測基準時刻より前に撮影された太陽全体の磁場画像の時系列を取得する画像取得部と、予測基準時刻より前に観測された宇宙空間に由来する観測データから太陽の活動領域に関する物理特徴量の時系列を抽出する特徴量抽出部と、磁場画像の時系列及び物理特徴量の時系列に太陽フレアの規模を表す情報が付与された学習データを用いて学習された予測モデルに、画像取得部で取得された磁場画像の時系列及び特徴量抽出部で抽出された物理特徴量の時系列を入力することで、予測基準時刻以降に発生する太陽フレアの規模を予測する予測部と、を備える。
【発明の効果】
【0008】
本発明の一態様によれば、太陽フレアの規模を精度良く予測することができる。
【図面の簡単な説明】
【0009】
【
図1】太陽フレア予測システムの全体構成の一例を示すブロック図である。
【
図2】太陽フレアクラスごとの発生頻度の一例を示すグラフである。
【
図3】太陽フレア予測タスクの一例を示すブロック図である。
【
図5】第1実施形態における予測モデルの具体例を示すブロック図である。
【
図6】第1実施形態における画像特徴抽出器の具体例を示すブロック図である。
【
図7】コンピュータのハードウェア構成の一例を示すブロック図である。
【
図8】太陽フレア予測システムの機能構成の一例を示すブロック図である。
【
図9】第1実施形態における学習処理の一例を示すフローチャートである。
【
図10】予測処理の一例を示すフローチャートである。
【
図11】第2実施形態における予測モデルの具体例を示すブロック図である。
【
図12】第2実施形態における画像特徴抽出器の具体例を示すブロック図である。
【
図13】第2実施形態における学習処理の一例を示すフローチャートである。
【
図14】データセットのサンプル数の一例を示す図である。
【
図15】ハイパーパラメータの一例を示す図である。
【発明を実施するための形態】
【0010】
以下、本発明の各実施形態について添付の図面を参照しながら説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0011】
本明細書において、「^」は本来直後の文字の真上に表記されるべき記号であるが、テキスト記法の制限により本文中では直前に表記している。数式中では本来の文字の真上に表記する。
【0012】
[第1実施形態]
太陽フレアに代表される大規模な太陽活動は、例えば、電波障害、停電、又は宇宙飛行士への健康的被害等、様々な影響をもたらすことが知られている。例えば、経済損失に関する試算では、1859年に発生した「キャリントン・イベント」と同等の太陽フレアが発生した場合、北米全体で約1,630億ドルの損失が生じると推定されている。したがって、太陽フレアの予測は極めて重要なタスクである。
【0013】
太陽フレアを正確に予測することは、専門家であっても非常に困難である。太陽フレアの予測性能に関する評価指標には、完璧な予測に対してスコア1.0を返すGMGS(Gandin-Murphy-Gerrity score)、BSS(Brier Skill Score)及びTSS(True Skill Statistics)等がある。例えば、2010年から2015年までの期間における専門家予測を評価すると、GMGSが0.48、BSS≧Mが0.16、TSS≧Mが0.50程度であった。
【0014】
太陽フレアを予測する従来技術には、以下のようなものがある。例えば、参考文献1には、太陽の観測画像を畳み込みニューラルネットワーク(CNN; Convolutional Neural Network)に入力して、太陽フレアの発生確率をクラス(規模)ごとに算出する方法が開示されている。
【0015】
〔参考文献1〕Xin Huang, Huaning Wang, Long Xu, Jinfu Liu, Rong Li, and Xinghua Dai, "Deep Learning Based Solar Flare Forecasting Model. I. Results for Line-of-sight Magnetograms," The Astrophysical Journal, 856:7(11pp), 2018 March 20.
【0016】
例えば、参考文献2には、宇宙空間に由来する観測データから抽出した物理特徴量をディープニューラルネットワーク(DNN; Deep Neural Network)に入力して、黒点等の活動領域ごとに太陽フレアを予測する方法が開示されている(以下、「DeFN」と呼ぶ)。また、参考文献3には、参考文献2に開示された手法を拡張し、予測の信頼性に適したネットワーク構造を採用した手法が開示されている(以下、「DeFN-R」と呼ぶ)。
【0017】
〔参考文献2〕N. Nishizuka, K. Sugiura, Y. Kubo, M. Den, and M. Ishii, "Deep flare net (DeFN) model for solar flare prediction," The Astrophysical Journal, 858:113(8pp), 2018 May 10.
【0018】
〔参考文献3〕Naoto Nishizuka, Yuki Kubo, Komei Sugiura, Mitsue Den, and Mamoru Ishii, "Reliable Probability Forecast of Solar Flares: Deep FlareNet-Reliable (DeFN-R)," The Astrophysical Journal, 899:150(8pp), 2020 August 20.
【0019】
本発明の一実施形態は、宇宙空間に由来する観測データに基づいて、太陽フレアを予測する太陽フレア予測システムである。一実施形態における太陽フレア予測システムは、太陽全体の磁場画像の時系列及び太陽の活動領域に関する物理特徴量の時系列を学習済みの予測モデルに入力することで、基準時刻以降に発生する太陽フレアの規模に関する予測結果を出力する。
【0020】
本実施形態における予測モデルは、磁場画像の時系列を入力とする磁場画像モジュール(MM; Magnetogram Module)と、物理特徴量の時系列を入力とする黒点特徴モジュール(SFM; Sunspot Feature Module)とを含む。磁場画像モジュール及び黒点特徴モジュールは、入力特徴量間の時間的な対応関係をモデル化するために、注意機構付き系列変換モデルに基づく中間層を有する。本実施形態における注意機構付き系列変換モデルは、例えば、Transformerである。Transformerの詳細は、参考文献4に開示されている。
【0021】
〔参考文献4〕Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin, "Attention Is All You Need," Proceedings of the 31st International Conference on Neural Information Processing Systems (NIPS 2017), pp. 6000-6010, December 2017.
【0022】
本実施形態における予測モデルは、太陽フレアの予測性能に関する評価指標に基づく項を有する損失関数を用いて学習される。本実施形態における損失関数は、太陽フレア予測における精度と信頼性とのバランスを最適化するために、精度に関する評価指標に基づく項と、信頼性に関する評価指標に基づく項とを有する。精度に関する評価指標は、例えば、GMGSである。信頼性に関する評価指標は、例えば、BSSである。
【0023】
<太陽フレア予測システムの全体構成>
本実施形態における太陽フレア予測システムの全体構成を、
図1を参照しながら説明する。
図1は、本実施形態における太陽フレア予測システムの全体構成の一例を示すブロック図である。
【0024】
図1に示されているように、本実施形態における太陽フレア予測システム1は、観測衛星3、地上観測施設4、地上受信施設5、収集装置10、予測装置20及びユーザ端末30を含む。地上観測施設4は、望遠鏡41及び観測装置42を含む。地上受信施設5は、アンテナ51及び通信装置52を含む。地上観測施設4、地上受信施設5、収集装置10、予測装置20及びユーザ端末30は、LAN(Local Area Network)又はインターネット等の通信ネットワークを介してデータ通信可能に接続されている。
【0025】
観測衛星3は、宇宙空間において太陽2から放射される各種電磁波又は粒子等を観測する人工衛星である。観測衛星3は、観測結果を表す電波を地球上へ随時送信する。
【0026】
地上観測施設4は、地球上から太陽2を観測する設備を有する施設である。望遠鏡41は、光学望遠鏡及び電波望遠鏡の少なくとも一方である。電波望遠鏡は、例えば、電波へリオグラフ、太陽電波強度偏頗計、ミリ波電波望遠鏡、又はミリ波干渉計等である。観測装置42は、望遠鏡41により観測された信号に基づいて時系列の観測データを出力する。
【0027】
地上受信施設5は、地球上で観測衛星3と通信する設備を有する施設である。アンテナ51は、観測衛星3から送信された電波を受信する。通信装置52は、アンテナ51により受信された電波を信号処理して時系列の観測データを出力する。
【0028】
収集装置10は、地上観測施設4及び地上受信施設5から観測データを収集するパーソナルコンピュータ、ワークステーション、サーバ等の情報処理装置である。収集装置10は、地上観測施設4及び地上受信施設5から収集した観測データを蓄積する。収集装置10は、予測装置20からの要求に応じて、蓄積している観測データを予測装置20に提供する。
【0029】
収集装置10は、地上観測施設4及び地上受信施設5の一方のみから観測データを収集してもよい。収集装置10は、複数の地上観測施設4から複数の観測データを収集してもよい。収集装置10は、複数の地上受信施設5から複数の観測データを収集してもよい。収集装置10は、単一の地上観測施設4に配置された複数の望遠鏡41により観測された複数の観測データを収集してもよい。収集装置10は、単一の地上受信施設5で複数の観測衛星3から受信した複数の観測データを収集してもよい。
【0030】
予測装置20は、収集装置10から提供される観測データに基づいて、太陽フレアを予測するパーソナルコンピュータ、ワークステーション、サーバ等の情報処理装置である。予測装置20は、磁場画像の時系列及び物理特徴量の時系列に基づいて、太陽フレアの規模を予測する予測モデルを学習する。予測装置20は、収集装置10から提供される観測データから磁場画像の時系列及び物理特徴量の時系列を生成し、生成された磁場画像の時系列及び物理特徴量の時系列を学習済みの予測モデルに入力することで、太陽フレアの規模を予測する。
【0031】
ユーザ端末30は、太陽フレア予測システム1のユーザが操作するパーソナルコンピュータ、タブレット端末、スマートフォン等の情報処理端末である。ユーザ端末30は、ユーザの操作に応じて、予測装置20に太陽フレアの予測結果を要求する。ユーザ端末30は、予測装置20から太陽フレアの予測結果を受信し、ユーザに対して出力する。
【0032】
なお、
図1に示した太陽フレア予測システム1の全体構成は一例であって、用途や目的に応じて様々なシステム構成例があり得る。例えば、収集装置10及び予測装置20は、複数台のコンピュータにより実現してもよいし、クラウドコンピューティングのサービスとして実現してもよい。また、例えば、太陽フレア予測システム1は、収集装置10、予測装置20及びユーザ端末30がそれぞれ備えるべき機能を兼ね備えたスタンドアローンの情報処理装置として実現してもよい。
【0033】
≪太陽フレア予測タスク≫
本実施形態における太陽フレア予測タスクは、基準時刻直前の第1の時間長の時間区間(以下、「取得期間」とも呼ぶ)に観測された観測データに基づいて、基準時刻直後の第2の時間長の時間区間((以下、「予測期間」とも呼ぶ))に発生する最大の太陽フレアクラス(以下、単に「クラス」とも呼ぶ)を予測するタスクである。本実施形態では、取得期間の時間長を4時間とし、予測期間の時間長を24時間とする。ただし、取得期間及び予測期間の時間長はこれらに限定されず、任意に決定することが可能である。
【0034】
太陽フレアクラスは、太陽フレアの規模を表す指標である。本実施形態における太陽フレアクラスは、X線等級を用いるものとする。本実施形態では、太陽フレアにより放射されるX線強度の最大値が大きい方から、X,M,C,Oの計4つのクラスを規定する。実用上は、X,M,Cクラスの太陽フレアの発生確率が重要である。特に、発生頻度が相対的に高いMクラス及びCクラスに注目されることが多い。なお、太陽フレアクラスの指標としては、X線等級に代えて、Hα等級又はRスケール等を用いてもよい。
【0035】
時刻tにおける太陽フレアクラスは、X線強度の最大値ptにより、次式のように定義される。ただし、ptは時刻tから1時間以内のX線強度の最大値であり、flareclass(・)は4種類の太陽フレアクラス(X,M,C,O)についての1-of-K表現である。
【0036】
【0037】
本タスクの入力は、時刻(t-k,t](時刻t-kから時刻tまでのうち時刻t-kを含まない半開区間)における1時間ごとの磁場画像Vt-k+1,t及び物理特徴量Ft-k+1,tである。本タスクの出力は、各太陽フレアクラスに関する予測確率を示す4次元ベクトルp(^yt)である。
【0038】
本タスクでは、モデル出力p(^y
t)とy
tとが等しくなることが望ましい。しかしながら、太陽フレアは各クラスの発生頻度が不均衡である。
図2は、クラスごとの発生頻度の一例を示すグラフである。
図2に示したグラフは、2010年から2017年までに発生した太陽フレアのクラスごとの割合を示している。
図2に示されているように、Xクラスは全体の1%、Mクラスは全体の8%であり、90%以上の太陽フレアはCクラス以下である。
【0039】
上記のように太陽フレアはクラスごとの発生頻度が不均衡であるため、各クラスを均等に評価する損失関数を用いて予測モデルを学習すると、全体の90%を占めるOクラス又はCクラスといった自明な解が出力されることになる。こうした自明な解を避けるため、本タスクでは、本分野において標準的に用いられている評価尺度を用いて予測結果を評価する。具体的には、本タスクにおける評価尺度には、GMGS、BSS≧M、TSS≧Mを用いる。なお、「≧M」は、太陽フレアクラスがMクラス以上(すなわち、Xクラス又はMクラス)、又は太陽フレアクラスがMクラス未満(すなわち、Cクラス又はOクラス)の二値として評価したことを示す。
【0040】
本実施形態における太陽フレア予測タスクの時間的関係について、
図3を参照しながら説明する。
図3は、本実施形態における太陽フレア予測タスクの一例を示す概念図である。
【0041】
図3に示されているように、太陽フレア予測タスクでは、任意の基準時刻に対して、基準時刻の直前の取得期間における磁場画像の時系列及び物理特徴量の時系列に基づいて、基準時刻直後の予測期間において太陽フレアが発生する確率がクラスごとに算出される。取得期間は、例えば、4時間である。予測期間は、例えば、24時間である。
【0042】
なお、本実施形態における太陽フレア予測タスクで算出される発生確率は、例えば、Mクラス以上の太陽フレアが発生する確率及びCクラス以下の太陽フレアが発生する確率をそれぞれ算出するようにしてもよい。
【0043】
以下、学習処理における基準時刻を「学習基準時刻」とも呼ぶ。また、予測処理における基準時刻を「予測基準時刻」とも呼ぶ。実運用では、予測契機が発生したときの現在時刻が予測基準時刻となる。予測契機は、太陽フレアを予測する契機となる事象である。例えば、予測契機は、所定の時間間隔(例えば、1時間)が経過したときである。また、例えば、ユーザから予測の実行を要求されたときを予測契機としてもよい。
【0044】
≪観測データ≫
本実施形態における観測データは、世界各国において整備されている観測設備から取得することができる。例えば、アメリカ航空宇宙局(NASA; National Aeronautics and Space Administration)が管理する太陽観測衛星であるソーラー・ダイナミクス・オブザーバトリー(SDO; Solar Dynamics Observatory)、及び、アメリカ海洋大気庁(NOAA; National Oceanic and Atmospheric Administration)が管理する気象衛星であるゴーズ(GOES; Geostationary Operational Environmental Satellite)等により収集された観測データを利用することができる。
【0045】
本実施形態では、視線方向磁場画像(line-of-sight magnetogram)、ベクトル磁場画像(vector magnetogram)、1600Åフィルター処理がなされた極端紫外線(EUV; Extreme Ultraviolet)高温コロナ発光画像(hot coronal brightening)、131Åフィルター処理がなされた極端紫外線高温コロナ発光画像、軟X線放射強度曲線(the light curves of the soft X-ray emission)等を、観測データとして利用することができる。
【0046】
視線方向磁場画像は、例えば、SDOに搭載されたHMI(Helioseismic and Magnetic Imager)により観測される。また、光球上部の紫外線連続光は、例えば、SDOに搭載されたAIA(Atmospheric Imaging Assembly)の1600Åフィルター処理結果により得られる。太陽フレアが生じている領域のEUV高温コロナ発光画像は、例えば、SDOによる131Åフィルター処理結果により得られる。1-8Åの範囲にわたるX線放射の全面積分値は、例えば、GOESにより観測される。
【0047】
視線方向磁場画像の観測周期は、例えば、45秒である。ベクトル磁場画像の観測周期は、例えば、12分である。1600Åフィルター処理画像及び131Åフィルター処理画像の観測周期は、例えば、いずれも12秒である。GOESの観測周期は、例えば、1分以下である。このような観測周期で生じるデータサイズ等を考慮して、本実施形態における太陽フレア予測システム1では、例えば、1時間周期で物理特徴量の抽出を行うものとする。
【0048】
≪物理特徴量≫
物理特徴量は、例えば、SDO及びGOESにより収集された観測データから抽出される特徴量である。本実施形態では、物理特徴量は90種類の特徴量を用いる。各特徴量の詳細は、参考文献5に開示されている。
【0049】
〔参考文献5〕N. Nishizuka, K. Sugiura, Y. Kubo, M. Den, S. Watari, and M. Ishii, "Solar flare prediction model with three machine-learning algorithms using ultraviolet brightening and vector magnetograms," The Astrophysical Journal, 835:156(10pp), 2017 February 1.
【0050】
本実施形態における物理特徴量は、太陽の活動領域(AR; active regions)に関する特徴量である。太陽の活動領域は、例えば、太陽黒点である。太陽の活動領域は、視線方向磁場画像の全面画像から検出するとよい。視線方向磁場画像は、ベクトル磁場画像と比較してノイズが少なく、活動領域の検出処理をより正確に実行できる。
【0051】
太陽の活動領域は、例えば、各視線方向磁場画像において、予め定められた閾値(例えば、140ガウス)以上の領域を探索及び抽出することで検出することができる。視線方向磁場画像から検出された活動領域のフレーム内の座標位置は、他の画像(すなわち、異なる波長で観測された画像)にも適用される。なお、光球面画像(photospheric images)において天体の外縁に検出された活動領域については、無効なものとして物理特徴量の算出対象から除外してもよい。検出された活動領域をトラッキングするにあたって、ユニークな識別番号を付与してもよい。より具体的な活動領域の検出方法については、参考文献5等を参照されたい。
【0052】
本実施形態では、SDOにより収集された視線方向磁場画像、ベクトル磁場画像、及び1600Åフィルター処理がなされたEUV高温コロナ発光画像、並びにGOESにより収集された1-8Åの範囲のX線データから、予測に用いる物理特徴量が算出される。さらに、107K以上の温度で放出される20価の鉄イオン(FeXX)および23価の鉄イオン(FeXXIII)の輝線発光を示す、131Åフィルター処理がなされた極端紫外線高温コロナ発光画像から、物理特徴量が算出されてもよい。
【0053】
実用上の予測を想定すると、131Åフィルター処理がなされたEUV高温コロナ発光画像、及びGOESにより収集されたX線データの直前1時間前及び直前2時間前の画像を物理特徴量として採用してもよい。また、131Åフィルター処理がなされたEUV高温コロナ発光画像における各活動領域における最大強度を物理特徴量として採用してもよい。
【0054】
本実施形態では、参考文献5に開示されている90種類の特徴量が、検出された活動領域の各々について算出される。本実施形態では、各物理特徴量を要素とする特徴量ベクトルを生成して、学習済みの予測モデルに入力することで、太陽フレアの発生確率が推定される。なお、上述した物理特徴量のすべてを含む特徴量ベクトルを必ずしも生成する必要はなく、その一部を用いるように構成してもよい。
【0055】
≪予測モデル≫
本実施形態における予測モデルについて、
図4乃至
図6を参照しながら説明する。
図4は、本実施形態における予測モデルの一例を示すブロック図である。
【0056】
図4に示されているように、本実施形態における予測モデルは、磁場画像の時系列及び物理特徴量の時系列を入力とし、太陽フレアの予測結果を出力するディープニューラルネットワークである。本実施形態における予測モデルは、画像特徴抽出層110、次元削減層120、磁場画像系列変換層130、物理特徴量系列変換層140及び出力層150を含む。
【0057】
画像特徴抽出層110は、予測モデルに入力された磁場画像の時系列に含まれる各磁場画像から画像特徴量を抽出する。画像特徴抽出層110の出力は、磁場画像系列変換層130及び物理特徴量系列変換層140に入力される。
【0058】
次元削減層120は、予測モデルに入力された物理特徴量の時系列に含まれる各物理特徴量の次元数を削減する。次元削減層120の出力は、磁場画像系列変換層130及び物理特徴量系列変換層140に入力される。
【0059】
磁場画像系列変換層130及び物理特徴量系列変換層140は、画像特徴抽出層110の出力及び次元削減層120の出力を入力とし、磁場画像の時系列と物理特徴量の時系列との対応関係を計算する系列変換モデルである。磁場画像系列変換層130及び物理特徴量系列変換層140の出力は、出力層150に入力される。
【0060】
磁場画像系列変換層130及び物理特徴量系列変換層140は、注意機構付き系列変換モデルに基づく中間層である。磁場画像系列変換層130は、画像特徴抽出層110の出力をクエリとし、次元削減層120の出力をキー及びバリューに含む注意機構を有する。物理特徴量系列変換層140は、次元削減層120の出力をクエリとし、画像特徴抽出層110の出力をキー及びバリューに含む注意機構を有する。
【0061】
出力層150は、磁場画像系列変換層130の出力及び物理特徴量系列変換層140の出力に基づいて、太陽フレアのクラスごとの発生確率を計算する。本実施形態における出力層150は、発生確率が最も高いクラスを予測結果として出力する。
【0062】
(ネットワーク構造)
図5は、本実施形態における予測モデルの具体例を示すブロック図である。
図5に示されているように、本実施形態における予測モデル1000は、磁場画像モジュール(Magnetogram Module)1001、黒点特徴モジュール(Sunspot Feature Module)1002及び出力層(Feed Forward & Softmax)1500を含む。
【0063】
磁場画像モジュール1001は、画像特徴抽出器(Image Feature Extractor)1100及びTransformer層(Transformer Layer)1300を含む。Transformer層1300は、多頭注意層(Multi-head Attention)1301、順伝播層(Feed Forward)1302及びバッチ正規化層(Batch Norm)1303を含むネットワークがNV層接続されて構成される。なお、NVは1以上の整数であり、例えば1である。
【0064】
黒点特徴モジュール1002は、順伝播層1201、バッチ正規化層1202及びTransformer層1400を含む。Transformer層1400は、多頭注意層1401、順伝播層1402及びバッチ正規化層1403を含むネットワークがNF層接続されて構成される。なお、NFは1以上の整数であり、例えば2である。
【0065】
予測モデル1000の入力xは、次式で定義される。ただし、vt∈R512×512は時刻tにおける磁場画像であり、ft∈R90は時刻tにおける物理特徴量である。
【0066】
【0067】
磁場画像モジュール1001では、磁場画像Vt-k+1:tが次式のように計算される。ただし、fFEは画像特徴抽出器1100である。本実施形態における画像特徴抽出器1100の出力hvは、128次元のベクトルである。
【0068】
【0069】
黒点特徴モジュール1002では、物理特徴量Ft-k+1:tが次式のように計算される。ただし、fBNはバッチ正規化層1202であり、fFFNは順伝播層1201である。本実施形態におけるバッチ正規化層1202の出力hFは、128次元のベクトルである。
【0070】
【0071】
Transformer層1300では、磁場画像Vt-k+1:tと物理特徴量Ft-k+1:tとの対応関係が計算される。Transformer層1300の入力は、クエリqがhVであり、キーk及びバリューvがhVFである。なお、hVFは画像特徴抽出器1100の出力hVとバッチ正規化層1202の出力hFとを結合することで得られる。
【0072】
N(≧2)層目以降のTransformer層1300の入力は、クエリq、キーk及びバリューvすべてをN-1層目のTransformer層1300の出力とする。もしくは、N層目以降のTransformer層1300の入力は、クエリqをN-1層目のTransformer層1300の出力とし、キーk及びバリューvをN-1層目のTransformer層1400の出力としてもよい。
【0073】
多頭注意層1301では、hV及びhVFがそれぞれhV
(i)∈Rk×d及びhVF
(i)∈Rk×2d(i=1,…,Nhead、d=H/Nhead)に分割される。ただし、Hは隠れ層の数を表し、Nheadはヘッド数を表す。
【0074】
次に、i番目のヘッドについて、クエリQ(i)∈Rk×d、キーK(i)∈Rk×2d及びバリューV(i)∈Rk×2dが次式のように計算される。ただし、Wq
(i),Wk
(i),Wv
(i)はそれぞれQ(i),K(i),V(i)の重みである。
【0075】
【0076】
Transformer層1300の出力htrnは、次式により計算される。
【0077】
【0078】
Transformer層1400は、入力されるクエリqがhFである点を除いて、Transformer層1300と同様に計算される。
【0079】
出力層150では、予測クラスy*
tが次式により計算される。ただし、hMMは磁場画像モジュール1001の出力であり、hSFMは黒点特徴モジュール1002の出力であり、p(^yti)はi番目のクラスに関する予測確率である。
【0080】
【0081】
図6は、本実施形態における画像特徴抽出器の具体例を示すブロック図である。
図6に示されているように、本実施形態における画像特徴抽出器1100は、畳み込み層(Convolution)1101、バッチ正規化層1102、活性化関数(ReLU)1103、最大プーリング層(Max Pooling)1104、畳み込み層1105、バッチ正規化層1106、活性化関数1107、畳み込み層1108、バッチ正規化層1109、活性化関数1110、畳み込み層1111、バッチ正規化層1112、活性化関数1113、平均プーリング層(Average Pooling)1114及び平滑化層(Flatten)1115を含む。また、本実施形態における画像特徴抽出器1100は、最大プーリング層1104の出力をバッチ正規化層1112の出力に加算するスキップコネクションを有する。
【0082】
(損失関数)
本実施形態における予測モデル1000は、太陽フレア予測の評価指標に基づく項を含む損失関数を用いて学習される。本実施形態における評価指標は、GMGS及びBSSである。以下、GMGSに基づく項を「GMGS損失」と呼ぶ。また、BSSに基づく項を「BSS損失」と呼ぶ。
【0083】
従来技術で用いられている損失関数は、GMGSとは無関係な重みを用いてクラス間のバランスを調整している。そのため、GMGSの改善には有効ではない。一方で、GMGSのスコア行列を重みとして用いることで、GMGSを効果的に向上させることができる。
【0084】
GMGS損失LGMGSは次式により定義される。ただし、Nはサンプル数であり、Iはクラス数であり、si*j*はGMGSのスコア行列であり、p(^yni)はn番目のサンプルのi番目のクラスに関する予測確率であり、yniは正解ラベルであり、y'niはラベル平滑化されたynである。
【0085】
【0086】
BSS損失LBSSは次式により定義される。なお、BSSは微分可能であるため、BSS損失にそのまま利用することができる。
【0087】
【0088】
本実施形態における損失関数Lは、次式により定義される。ただし、LCEはynと^ynとの交差エントロピー損失であり、λCEは交差エントロピー損失の重みであり、λGMGSはGMGS損失の重みであり、λBSSはBSS損失の重みである。
【0089】
【0090】
<太陽フレア予測システムのハードウェア構成>
本実施形態における太陽フレア予測システム1に含まれる各装置のハードウェア構成を、
図7を参照しながら説明する。
【0091】
≪コンピュータのハードウェア構成≫
本実施形態における収集装置10、予測装置20及びユーザ端末30は、例えばコンピュータにより実現される。
図7は、本実施形態におけるコンピュータのハードウェア構成の一例を示すブロック図である。
【0092】
図7に示されているように、本実施形態におけるコンピュータ500は、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503、HDD(Hard Disk Drive)504、入力装置505、表示装置506、通信I/F(Interface)507及び外部I/F508を有する。CPU501、ROM502及びRAM503は、いわゆるコンピュータを形成する。コンピュータ500の各ハードウェアは、バスライン509を介して相互に接続されている。なお、入力装置505及び表示装置506は外部I/F508に接続して利用する形態であってもよい。
【0093】
CPU501は、ROM502又はHDD504等の記憶装置からプログラムやデータをRAM503上に読み出し、処理を実行することで、コンピュータ500全体の制御や機能を実現する演算装置である。
【0094】
ROM502は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)の一例である。ROM502は、HDD504にインストールされている各種プログラムをCPU501が実行するために必要な各種プログラム、データ等を格納する主記憶装置として機能する。具体的には、ROM502には、コンピュータ500の起動時に実行されるBIOS(Basic Input/Output System)、EFI(Extensible Firmware Interface)等のブートプログラムや、OS(Operating System)設定、ネットワーク設定等のデータが格納されている。
【0095】
RAM503は、電源を切るとプログラムやデータが消去される揮発性の半導体メモリ(記憶装置)の一例である。RAM503は、例えば、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等である。RAM503は、HDD504にインストールされている各種プログラムがCPU501によって実行される際に展開される作業領域を提供する。
【0096】
HDD504は、プログラムやデータを格納している不揮発性の記憶装置の一例である。HDD504に格納されるプログラムやデータには、コンピュータ500全体を制御する基本ソフトウェアであるOS、及びOS上において各種機能を提供するアプリケーション等がある。なお、コンピュータ500はHDD504に替えて、記憶媒体としてフラッシュメモリを用いる記憶装置(例えばSSD:Solid State Drive等)を利用するものであってもよい。
【0097】
入力装置505は、ユーザが各種信号を入力するために用いるタッチパネル、操作キーやボタン、キーボードやマウス、音声等の音データを入力するマイクロホン等である。
【0098】
表示装置506は、画面を表示する液晶や有機EL(Electro-Luminescence)等のディスプレイ、音声等の音データを出力するスピーカ等で構成されている。
【0099】
通信I/F507は、通信ネットワークに接続し、コンピュータ500がデータ通信を行うためのインタフェースである。
【0100】
外部I/F508は、外部装置とのインタフェースである。外部装置には、ドライブ装置510等がある。
【0101】
ドライブ装置510は、記録媒体511をセットするためのデバイスである。ここでいう記録媒体511には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記録媒体511には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。これにより、コンピュータ500は外部I/F508を介して記録媒体511の読み取り及び/又は書き込みを行うことができる。
【0102】
なお、HDD504にインストールされる各種プログラムは、例えば、配布された記録媒体511が外部I/F508に接続されたドライブ装置510にセットされ、記録媒体511に記録された各種プログラムがドライブ装置510により読み出されることでインストールされる。あるいは、HDD504にインストールされる各種プログラムは、通信I/F507を介して、通信ネットワークとは異なる他のネットワークよりダウンロードされることでインストールされてもよい。
【0103】
<太陽フレア予測システムの機能構成>
本実施形態における太陽フレア予測システムの機能構成を、
図8を参照しながら説明する。
図8は、本実施形態における太陽フレア予測システム1の機能構成の一例を示すブロック図である。
【0104】
≪収集装置の機能構成≫
図8に示されているように、本実施形態における収集装置10は、観測データ記憶部100及び観測データ収集部101を備える。
【0105】
観測データ収集部101は、例えば、
図7に示されているHDD504からRAM503上に展開されたプログラムがCPU501に実行させる処理によって実現される。観測データ記憶部100は、例えば、
図7に示されているHDD504を用いて実現される。
【0106】
観測データ収集部101は、地上観測施設4に設置された観測装置42及び地上受信施設5に設置された通信装置52から観測データを収集する。観測データ収集部101は、収集した観測データを観測データ記憶部100に記憶する。
【0107】
観測データ記憶部100には、観測データが蓄積される。観測データは、観測データ収集部101により収集される。
【0108】
≪予測装置の機能構成≫
図8に示されているように、本実施形態における予測装置20は、モデル記憶部200、データ取得部201、画像取得部202、特徴量抽出部203、モデル学習部204及び予測部205を備える。
【0109】
データ取得部201、画像取得部202、特徴量抽出部203、モデル学習部204及び予測部205は、例えば、
図7に示されているHDD504からRAM503上に展開されたプログラムがCPU501に実行させる処理によって実現される。モデル記憶部200は、例えば、
図7に示されているHDD504を用いて実現される。
【0110】
モデル記憶部200には、学習済みの予測モデルが記憶される。予測モデルは、モデル学習部204により学習される。
【0111】
データ取得部201は、収集装置10に蓄積された観測データを取得する。データ取得部201は、学習処理においては、学習対象とする学習基準時刻直前の取得期間及び学習基準時刻直後の予測期間に含まれる観測データを取得する。データ取得部201は、予測処理においては、予測対象とする予測基準時刻直前の取得期間に含まれる観測データを取得する。
【0112】
画像取得部202は、データ取得部201により取得された観測データから太陽全体の磁場画像の時系列を取得する。画像取得部202は、まず、観測データに含まれる複数の磁場画像を所定の時間間隔で取得する。所定の時間間隔は、例えば、1時間である。次に、画像取得部202は、取得した磁場画像を撮影日時の順に整列する。これにより、太陽全体の磁場画像の時系列が得られる。
【0113】
本実施形態における磁場画像は、SDOに搭載されたHMIにより観測された視線方向磁場画像である。なお、1枚の磁場画像には、太陽全体が撮影されている。
【0114】
特徴量抽出部203は、データ取得部201により取得された観測データから所定の物理特徴量の時系列を抽出する。特徴量抽出部203は、まず、観測データから太陽の活動領域を検出する。次に、特徴量抽出部203は、所定の時間間隔で物理特徴量の計算に必要な観測データをサンプリングする。所定の時間間隔は、例えば、1時間である。続いて、特徴量抽出部203は、検出した活動領域ごとに、各サンプルから所定の物理特徴量を計算する。そして、特徴量抽出部203は、計算した物理特徴量を観測日時の順に整列する。これにより、物理特徴量の時系列が得られる。
【0115】
モデル学習部204は、学習処理において、画像取得部202により取得された磁場画像の時系列及び特徴量抽出部203により抽出された物理特徴量の時系列に基づいて学習データを生成し、生成された学習データに基づいて予測モデルを学習する。モデル学習部204は、学習済みの予測モデルをモデル記憶部200に記憶する。
【0116】
予測部205は、予測処理において、画像取得部202により取得された磁場画像の時系列及び特徴量抽出部203により抽出された物理特徴量の時系列を、モデル記憶部200から読み出した予測モデルに入力することで、太陽フレアの発生確率をクラスごとに予測する。予測部205は、ユーザ端末30からの要求に応じて、太陽フレアの予測結果をユーザ端末30に送信する。
【0117】
<太陽フレア予測システムの処理手順>
本実施形態における太陽フレア予測システム1が実行する予測方法の処理手順を、
図9及び
図10を参照しながら説明する。本実施形態における予測方法は、学習処理(
図9参照)及び予測処理(
図10参照)を含む。
【0118】
≪学習処理≫
図9は、本実施形態における学習処理の一例を示すフローチャートである。
【0119】
ステップS1において、ユーザ端末30は、ユーザの操作に応じて、予測モデルの学習要求を予測装置20に送信する。予測装置20では、データ取得部201が、ユーザ端末30から受信した予測モデルの学習要求に応じて、収集装置10に観測データの取得要求を送信する。当該取得要求には、学習に用いる観測データの時間範囲を示す情報(開始日時及び終了日時)が含まれてもよい。
【0120】
収集装置10は、予測装置20から受信した観測データの取得要求に応じて、観測データ記憶部100から観測データを読み出す。取得要求に時間範囲を示す情報が含まれる場合、収集装置10は、当該時間範囲に観測された観測データを読み出す。取得要求に時間範囲を示す情報が含まれない場合、収集装置10は、蓄積されているすべての観測データを読み出す。収集装置10は、読み出した観測データを予測装置20に送信する。
【0121】
予測装置20では、データ取得部201が、収集装置10から観測データを受信する。データ取得部201は、受信した観測データをHDD504等の記憶部に記憶する。
【0122】
ステップS2において、予測装置20が備える画像取得部202は、記憶部に記憶されている観測データから太陽全体の磁場画像の時系列を取得する。画像取得部202は、まず、観測データの全時間範囲において、観測データに含まれる複数の磁場画像を所定の時間間隔で取得する。取得する時間間隔は、例えば、1時間である。
【0123】
次に、画像取得部202は、学習対象とする学習基準時刻を決定する。学習基準時刻は、観測データを取得した時間範囲のうち学習に必要な数の磁場画像を取得可能な全時刻である。
【0124】
続いて、画像取得部202は、各学習基準時刻について、撮影日時が当該学習基準時刻直前の取得期間に含まれる磁場画像を選択する。次に、画像取得部202は、各学習基準時刻について、選択した各磁場画像を撮影日時の順に整列する。これにより、学習基準時刻ごとの磁場画像の時系列が生成される。
【0125】
画像取得部202は、生成した磁場画像の時系列をモデル学習部204に送る。モデル学習部204は、画像取得部202から学習基準時刻ごとの磁場画像の時系列を受け取る。
【0126】
ステップS3において、予測装置20が備える特徴量抽出部203は、記憶部に記憶されている観測データから物理特徴量の時系列を抽出する。特徴量抽出部203は、まず、観測データに基づいて太陽の活動領域を検出する。次に、特徴量抽出部203は、検出した活動領域の位置情報を記憶部等に記憶する。検出済みの活動領域の位置情報が記憶部等に記憶されている場合、活動領域の検出は行わず、記憶部に記憶されている位置情報に基づいて活動領域を特定すればよい。
【0127】
次に、特徴量抽出部203は、観測データの全時間範囲において、物理特徴量の計算に必要な観測データを所定の時間間隔でサンプリングする。サンプリングを行う時間間隔は、例えば、1時間である。
【0128】
続いて、特徴量抽出部203は、各学習基準時刻について、観測日時が当該学習基準時刻直前の取得期間に含まれるサンプルを選択する。次に、特徴量抽出部203は、各学習基準時刻について、活動領域ごとに、選択した各サンプルから所定の物理特徴量を計算する。そして、特徴量抽出部203は、計算した物理特徴量を観測日時の順に整列する。これにより、学習基準時刻ごとの物理特徴量の時系列が生成される。
【0129】
特徴量抽出部203は、生成した物理特徴量の時系列をモデル学習部204に送る。モデル学習部204は、特徴量抽出部203から学習基準時刻ごとの物理特徴量の時系列を受け取る。
【0130】
ステップS4において、予測装置20が備えるモデル学習部204は、記憶部に記憶されている観測データから教師ラベルを取得する。モデル学習部204は、まず、各学習基準時刻について、当該学習基準時刻直後の予測期間におけるX線強度の推移を観測データから取得する。次に、モデル学習部204は、取得したX線強度の推移に基づいて、当該予測期間に発生した太陽フレアの最大のクラスを決定する。
【0131】
続いて、モデル学習部204は、学習基準時刻ごとに決定した最大のクラスを表す教師ラベルを、当該学習基準時刻の磁場画像の時系列及び物理特徴量の時系列に付与する。これにより、学習基準時刻ごとに磁場画像の時系列、物理特徴量の時系列及び教師ラベルが対応付けられた学習データが生成される。
【0132】
ステップS5において、予測装置20が備えるモデル学習部204は、ステップS4で生成した学習データに基づいて、予測モデルを学習する。モデル学習部204は、任意の最適化メソッドを用いて、予測モデルを規定するネットワークパラメータを最適化する。最適化メソッドは、例えば、Adam(Adaptive Moment Estimation)を用いることができる。モデル学習部204は、学習済みの予測モデルをモデル記憶部200に記憶する。
【0133】
≪予測処理≫
図10は、本実施形態における予測処理の一例を示すフローチャートである。
【0134】
ステップS11において、予測装置20が備えるデータ取得部201は、予め定めた時間間隔で、予め定めた予測契機が発生したか否かを判定する。予測契機が発生した場合(YES)、データ取得部201は、ステップS12に処理を進める。予測契機が発生していない場合(NO)、次の時間間隔が経過するまで処理を停止する。
【0135】
ステップS12において、予測装置20が備えるデータ取得部201は、予測契機が発生したことに応じて、収集装置10に観測データの取得要求を送信する。当該取得要求には、予測基準時刻を示す情報が含まれる。予測基準時刻は、例えば、予測契機が発生したときの現在時刻である。
【0136】
収集装置10は、予測装置20から受信した観測データの取得要求に応じて、観測データ記憶部100から予測基準時刻直前の取得期間に観測された観測データを読み出す。収集装置10は、読み出した観測データを予測装置20に送信する。
【0137】
予測装置20では、データ取得部201が、収集装置10から観測データを受信する。データ取得部201は、受信した観測データをHDD504等の記憶部に記憶する。
【0138】
ステップS13において、予測装置20が備える画像取得部202は、記憶部に記憶されている観測データから太陽全体の磁場画像の時系列を取得する。画像取得部202は、まず、予測基準時刻直前の取得期間において、観測データに含まれる複数の磁場画像を所定の時間間隔で取得する。取得する時間間隔は、学習処理のステップS2と同様である。
【0139】
次に、画像取得部202は、取得した各磁場画像を撮影日時の順に整列する。これにより、予測基準時刻に対応する磁場画像の時系列が生成される。
【0140】
画像取得部202は、生成した磁場画像の時系列を予測部205に送る。予測部205は、画像取得部202から予測基準時刻に対応する磁場画像の時系列を受け取る。
【0141】
ステップS14において、予測装置20が備える特徴量抽出部203は、記憶部に記憶されている観測データから物理特徴量の時系列を抽出する。特徴量抽出部203は、まず、予測基準時刻直前の取得期間において、観測データから物理特徴量の計算に必要な観測データを所定の時間間隔でサンプリングする。サンプリングを行う時間間隔は、学習処理のステップS3と同様である。
【0142】
次に、特徴量抽出部203は、活動領域ごとに、各サンプルから所定の物理特徴量を計算する。続いて、特徴量抽出部203は、計算した物理特徴量を観測日時の順に整列する。これにより、予測基準時刻に対応する物理特徴量の時系列が生成される。
【0143】
特徴量抽出部203は、生成した物理特徴量の時系列を予測部205に送る。予測部205は、特徴量抽出部203から予測基準時刻に対応する物理特徴量の時系列を受け取る。
【0144】
ステップS15において、予測装置20が備える予測部205は、モデル記憶部200から学習済みの予測モデルを読み出す。次に、予測部205は、画像取得部202から受け取った磁場画像の時系列及び特徴量抽出部203から受け取った物理特徴量の時系列を、読み出した予測モデルに入力する。予測部205は、予測モデルから出力される予測結果を取得する。当該予測結果は、予測基準時刻直後の予測期間に発生する太陽フレアの最大のクラスの発生確率である。
【0145】
ステップS16において、予測装置20が備える予測部205は、予測モデルから出力された予測結果を記憶部に記憶する。予測部205は、ユーザ端末30から予測結果の取得要求を受信した場合、当該取得要求に応じて、最新の予測結果をユーザ端末30に送信する。
【0146】
ユーザ端末30では、予測装置20から受信した予測結果を表示装置506に表示する。ユーザ端末30は、視認性等を考慮して予測結果を加工してグラフィカルに表示してもよい。ユーザ端末30は、過去に取得した予測結果を記憶部等に記憶しておき、予測結果の推移を表示してもよい。
【0147】
<第1実施形態の効果>
本実施形態における予測装置は、予測基準時刻より前の太陽全体の磁場画像の時系列及び太陽の活動領域に関する物理特徴量の時系列を学習済みの予測モデルに入力することで、予測基準時刻以降に発生する太陽フレアの規模を予測する。したがって、本実施形態における予測装置によれば、太陽フレアの規模を精度良く予測することができる。
【0148】
本実施形態における予測モデルは、磁場画像の時系列を入力とする磁場画像モジュールと、物理特徴量の時系列を入力とする黒点特徴モジュールとを含む。磁場画像モジュールは、黒点特徴モジュールの中間層の出力を入力に含む磁場画像系列変換層を含み、黒点特徴モジュールは、磁場画像モジュールの中間層の出力を入力に含む物理特徴量系列変換層を含む。したがって、本実施形態における予測装置によれば、磁場画像の時系列と物理特徴量の時系列との対応関係をモデル化することができる。
【0149】
本実施形態における予測モデルは、太陽フレアの予測結果に関する評価指標に基づく項を有する損失関数を用いて学習されている。評価指標は、精度に関するGMGS及び信頼性に関するBSSを含む。したがって、本実施形態における予測装置によれば、精度と信頼性とのバランスを考慮した予測モデルを学習することができる。
【0150】
[変形例1]
第1実施形態では、太陽フレア予測タスクを、予測基準時刻直後の予測期間に発生する太陽フレアの最大のクラスを出力する分類タスクとして構成した。ここで、太陽フレア予測タスクを、予測基準時刻直後の予測期間におけるX線強度の最大値を予測する回帰タスクとして構成してもよい。
【0151】
太陽フレアクラスは、太陽フレアにより発生するX線強度の対数を所定の数値範囲に分類することで決定される。したがって、学習データに付与する教師ラベルを、学習基準時刻直後の予測期間におけるX線強度の最大値とすれば、予測基準時刻直後の予測期間におけるX線強度の最大値を予測する予測モデルを学習することが可能となる。
【0152】
なお、X線強度の最大値を予測する予測モデルでは、損失関数にGMGS損失及びBSS損失を含めない。本変形例における損失関数Lは、交差エントロピー損失LCEのみからなる損失関数としてもよいし、式(18)に示した損失関数において重みλGMGS,λBSSを0とした損失関数としてもよい。
【0153】
[変形例2]
第1実施形態では、予測装置20が、予測基準時刻直後の予測期間に発生する太陽フレアの最大のクラスを、予測結果として出力するように構成した。ここで、予測装置20は、予測結果と共に、アテンションマップを出力するように構成してもよい。
【0154】
アテンションマップとは、注意機構付き系列変換モデルにおいて、入力された特徴量それぞれの注目の度合いを示す情報である。アテンションマップによれば、入力された特徴量のうち、予測結果に強い影響を与えた箇所を把握することができる。
【0155】
例えば、入力された太陽全体の磁場画像に、アテンションマップに従って着色したヒートマップを重ね合わせて表示すれば、磁場画像のうち予測結果に影響を与えた領域を直感的に認識することが可能となる。また、例えば、入力された太陽全体の磁場画像とアテンションマップに従って着色したヒートマップとを対比可能に並べて表示してもよい。
【0156】
太陽フレアの発生メカニズムは、未だ未解明の部分が多い。本変形例のように予測結果とアテンションマップとを対応付けて出力することで、太陽フレアの研究に有益な情報を得られることが期待できる。
【0157】
[第2実施形態]
本発明の第2実施形態は、第1実施形態における太陽フレア予測システムにおいて、予測モデルのネットワーク構造、及び予測モデルの学習処理を変形した太陽フレア予測システムである。具体的には、本実施形態における予測モデルは、時系列予測に適したネットワーク構造であるInformerの注意機構を、注意機構付き系列変換モデルに導入する。Informerの詳細は、参考文献6に開示されている。
【0158】
〔参考文献6〕Haoyi Zhou, Shanghang Zhang, Jieqi Peng, Shuai Zhang, Jianxin Li, Hui Xiong, and Wancai Zhang, "Informer: Beyond efficient transformer for long sequence timeseries forecasting," Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 35, No. 12, pp. 11106-11115, 2021.
【0159】
本実施形態における予測モデルは、太陽フレア予測に寄与する画像特徴量を抽出するために、画像特徴抽出器としてConvNeXtを導入する。ConvNeXtの詳細は、参考文献7に開示されている。
【0160】
〔参考文献7〕Zhuang Liu, Hanzi Mao, Chao-Yuan Wu, Christoph Feichtenhofer, Trevor Darrell, and Saining Xie, "A convnet for the 2020s," Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), pp. 11976-11986, 2022.
【0161】
本実施形態における予測モデルは、発生頻度が低いクラスへの過学習を防ぐため、cRT(Classifier Re-training)に基づく再学習機構を導入する。cRTの詳細は、参考文献8に開示されている。
【0162】
〔参考文献8〕Bingyi Kang, Saining Xie, Marcus Rohrbach, Zhicheng Yan, Albert Gordo, Jiashi Feng, and Yannis Kalantidis, "Decoupling representation and classifier for long-tailed recognition," ICLR, 2020.
【0163】
太陽フレアは、クラスごとの発生頻度が大きく異なる。クラスごとのサンプル数に偏りがある場合、クラス間のサンプル数が均等になるように学習データをサンプリングする必要がある。しかしながら、そのようなオーバーサンプリングを伴う学習では、サンプル数が極端に少ないクラスへの過学習を招くおそれがある。すなわち、クラスごとのサンプル数が自然の発生頻度に従う学習データで予測モデルを学習した場合、発生頻度が最も低いXクラスへの過学習が起きる可能性がある。
【0164】
本実施形態における学習処理では、二段階で予測モデルを学習する。第1段階では、通常の手法で収集した学習データに基づいて予測モデル全体を学習する。第2段階では、まず、学習データからクラス間のサンプル数が均等となるようにサンプリングした第2の学習データを生成する。次に、出力層以外のパラメータを固定した上で、第2の学習データを用いて予測モデルを再学習する。すなわち、クラス間のサンプル数を均等にした学習データを用いて、式(14)で示した順伝播層fFFNのパラメータのみを再学習する。
【0165】
≪予測モデル≫
本実施形態における予測モデルについて、
図11及び
図12を参照しながら説明する。
図11は、本実施形態における予測モデルの具体例を示すブロック図である。
図11に示されているように、本実施形態における磁場画像モジュール1001は、画像特徴抽出器1100及びTransformer層1300を含む。Transformer層1300は、Probsparse注意層(Probsparse Attention)1311、レイヤ正規化層(Layer Norm)1312、畳み込み層1313、活性化関数1314及びレイヤ正規化層1315を含む。また、本実施形態におけるTransformer層1300は、レイヤ正規化層1312の出力をレイヤ正規化層1315の出力に加算するスキップコネクションを有する。
【0166】
本実施形態における黒点特徴モジュール1002は、順伝播層1211、バッチ正規化層1212、活性化関数1213及びTransformer層1400を含む。本実施形態における黒点特徴モジュール1002のTransformer層1400は、Probsparse注意層1411、レイヤ正規化層1412、畳み込み層1413、活性化関数1414及びレイヤ正規化層1415を含む。また、本実施形態におけるTransformer層1400は、レイヤ正規化層1412の出力をレイヤ正規化層1415の出力に加算するスキップコネクションを有する。
【0167】
以下、本実施形態における予測モデル1000の処理について、第1実施形態との相違点を中心に説明する。
【0168】
本実施形態における黒点特徴モジュール1002では、物理特徴量Ft-k+1,tが次式のように計算される。ただし、ReLUは活性化関数1213であり、fBNはバッチ正規化層1212であり、fFFNは順伝播層1211である。
【0169】
【0170】
本実施形態におけるTransformer層1300の出力htrnは、次式により計算される。ただし、fLNはレイヤ正規化層であり、fconvは畳み込み層である。
【0171】
【0172】
Transformer層1400は、入力されるクエリqがhFである点を除いて、Transformer層1300と同様に計算される。
【0173】
図12は、本実施形態における画像特徴抽出器の具体例を示すブロック図である。
図12に示されているように、本実施形態における画像特徴抽出器1100は、畳み込み層1121、レイヤ正規化層1122、畳み込み層1123、レイヤ正規化層1124、畳み込み層1125、活性化関数(GeLU)1126及び畳み込み層1127を含む。また、本実施形態における画像特徴抽出器1100は、レイヤ正規化層1122の出力を畳み込み層1127の出力に加算するスキップコネクションを有する。
【0174】
本実施形態における画像特徴抽出器1100は、
図12に示したネットワークが4段で接続されており、i(=1,…,4)段目における層数N
iは、3,3,9,3である。すなわち、本実施形態における画像特徴抽出器1100は、18層のConvNeXtで構成されている。
【0175】
≪学習処理≫
図13は、本実施形態における学習処理の一例を示すフローチャートである。ステップS1からS5までは第1実施形態における学習処理(
図9参照)と同様であるため、説明を省略する。
【0176】
ステップS6において、予測装置20が備えるモデル学習部204は、ステップS4で生成した学習データからクラス間のサンプル数が均等となるようにサンプリングする。これにより、クラス間のサンプル数が均等である第2の学習データが生成される。
【0177】
ステップS7において、予測装置20が備えるモデル学習部204は、ステップS6で生成した第2の学習データに基づいて、予測モデルを学習する。このとき、モデル学習部204は、出力層以外のパラメータを固定した上で、予測モデルを再学習する。すなわち、モデル学習部204は、クラス間のサンプル数を均等にした第2の学習データを用いて、出力層のパラメータのみを再学習する。モデル学習部204は、再学習済みの予測モデルでモデル記憶部200に記憶されている予測モデルを更新する。
【0178】
<第2実施形態の効果>
本実施形態における予測装置は、学習データにおける太陽フレアのクラスごとの発生頻度に基づいて予測モデル全体を学習した後、太陽フレアのクラスごとの発生頻度が均等となるように第2の学習データを抽出し、予測モデルの出力層を再学習する。太陽フレアはクラスごとの発生頻度が大きく異なるため、発生頻度が低いクラスへの過学習が発生し易い。本実施形態における予測装置は、上記のように構成することにより、発生頻度が低いクラスへの過学習を回避することができる。
【0179】
本実施形態における予測モデルは、Transformer層に、時系列予測に適した構造であるInformerの注意機構を導入し、画像特徴抽出器に、太陽フレア予測に寄与する画像特徴量を抽出するConvNeXtを導入した。本実施形態における予測装置は、上記のように構成することにより、太陽フレアの規模をより精度良く予測することができる。
【0180】
[実験結果]
上記の各実施形態における効果を検証するために比較実験を行った。実験結果について、
図14乃至
図16を参照しながら説明する。
【0181】
比較実験では、SDOのウェブアーカイブ及び物理特徴量データベースから収集したデータセットを用いて、各実施形態による予測結果を評価した。なお、SDOのウェブアーカイブは、参考文献9に開示されている。物理特徴量データベースは、参考文献10に開示されている。
【0182】
〔参考文献9〕National Aeronautics and Space Administration, "SDO | Data", [online],[令和4年9月20日検索],インターネット<URL: https://sdo.gsfc.nasa.gov/data/>
【0183】
〔参考文献10〕National Institute of Information and Communications Technology, "Database of Deep Flare Net (AI flare prediction)", [online],[令和4年9月20日検索],インターネット<URL: https://wdc.nict.go.jp/IONO/wdc/solarflare/index.html>
【0184】
図14は、データセットに含まれるサンプル数の一例を示す図である。
図14に示されているように、当該データセットには、2010年から2017年までの61,315サンプルが含まれている。なお、当該データセットにおいて、正解ラベルがX,M,C,Oクラスとなるサンプルはそれぞれ、492、4,745、19,736、36,342となっている。このように、XクラスやMクラスの太陽フレアは発生する可能性が極めて低い事象である。例えば、2017年に発生したXクラスの太陽フレアは全体の約2.9%である。
【0185】
比較実験では、時系列予測において標準的な手法である時系列交差検証に基づいて、データセットをトレーニングセットとテストセットとに分割した。時系列交差検証では、トレーニングセットを構成するサンプルは、テストセットを構成するサンプルよりも時系列的に前のサンプルで構成される。
【0186】
図15は、ハイパーパラメータの一例を示す図である。N
V,#H
V,#A
Vは、磁場画像モジュールにおけるTransformer層の層数、隠れ層の次元数、注意機構のヘッド数を表す。N
F,#H
F,#A
Fは、黒点特徴モジュールにおけるTransformer層の層数、隠れ層の次元数、注意機構のヘッド数を表す。λ
GMGS,λ
BSSは、それぞれGMGS損失の重み及びBSS損失の重みである。最適化にはAdamを使用した。学習率は2.1×10
-6とした。バッチサイズは48とした。
【0187】
図16は、実験結果の一例を示す図である。
図16には、各実施形態における太陽フレア予測システムによる予測結果に関する評価指標が示されている。評価指標は、GMGS、TSS
≧M及びBSS
≧Mを使用した。なお、
図16には、各手法における平均値と年度ごとの平均値の標準偏差が示されている。ただし、2016年はXクラスの太陽フレアが観測されなかったため、GMGSについては近似値を用いた。
【0188】
図16には、比較例として、2つの従来技術(第1従来技術、第2従来技術)による予測結果及び専門家による予測結果の評価指標が示されている。第1従来技術は、参考文献2に開示されているDeFNである。第2従来技術は、参考文献3に開示されているDeFN-Rである。専門家予測の評価結果は、参考文献11に開示されている。
【0189】
〔参考文献11〕Yuki Kubo, Mitsue Den, and Mamoru Ishii, "Verification of Operational Solar Flare Forecast," Journal of Space Weather and Space Climate, Vol. 7, p. A20 (16pp), 2017.
【0190】
図16に示されているように、第1従来技術及び第2従来技術におけるGMGSは、それぞれ0.375、0.302であった。これに対し、第1実施形態及び第2実施形態におけるGMGSは、それぞれ0.503、0.500であった。したがって、各実施形態で従来技術よりも良好な結果が得られた。
【0191】
専門家による予測結果に関するGMGS、BSS≧M、TSS≧Mは、それぞれ0.48、0.16、0.50である。第1実施形態におけるGMGS、BSS≧M、TSS≧Mは、それぞれ0.503、0.082、0.530であった。したがって、第1実施形態ではGMGS及びTSS≧M(すなわち、精度に関する評価指標)で専門家予測よりも良好な結果が得られた。第2実施形態におけるGMGS、BSS≧M、TSS≧Mは、それぞれ0.500、0.22、0.530であった。したがって、第2実施形態ではGMGS、BSS≧M、TSS≧M(すなわち、精度及び信頼性に関する評価指標)すべてで専門家を超える予測性能を達成することができた。
【0192】
上記の比較実験により、各実施形態における太陽フレア予測システムによれば、従来技術や専門家よりも高い予測性能で太陽フレアの規模を予測できることが示された。
【0193】
[補足]
上記実施形態おいて、Transformer層1300は、第1系列変換層の一例である。Transformer層1400は、第2系列変換層の一例である。多頭注意層1301及びProbsparse注意層1311は、第1注意機構の一例である。多頭注意層1401及びProbsparse注意層1411は、第2注意機構の一例である。
【0194】
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等の機器を含むものとする。
【0195】
以上、本発明の実施の形態について詳述したが、本発明はこれらの実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形又は変更が可能である。
【符号の説明】
【0196】
1 太陽フレア予測システム
2 太陽
3 観測衛星
4 地上観測施設
5 地上受信施設
10 収集装置
20 予測装置
30 ユーザ端末
41 望遠鏡
42 観測装置
51 アンテナ
52 通信装置
100 観測データ記憶部
101 観測データ収集部
200 モデル記憶部
201 データ取得部
202 画像取得部
203 特徴量抽出部
204 モデル学習部
205 予測部