IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人加計学園の特許一覧

特開2023-168884雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム
<>
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図1
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図2
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図3
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図4
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図5
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図6
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図7
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図8
  • 特開-雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023168884
(43)【公開日】2023-11-29
(54)【発明の名称】雲海発生予測システム、雲海発生予測方法及び雲海発生予測プログラム
(51)【国際特許分類】
   G01W 1/10 20060101AFI20231121BHJP
【FI】
G01W1/10 R
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022080258
(22)【出願日】2022-05-16
(71)【出願人】
【識別番号】599035627
【氏名又は名称】学校法人加計学園
(74)【代理人】
【識別番号】100187838
【弁理士】
【氏名又は名称】黒住 智彦
(74)【代理人】
【識別番号】100220892
【弁理士】
【氏名又は名称】舘 佳耶
(74)【代理人】
【識別番号】100205589
【弁理士】
【氏名又は名称】日野 和将
(72)【発明者】
【氏名】大橋 唯太
(57)【要約】
【課題】
雲海の発生を予測できる雲海発生予測システムを提供するものである。
【解決手段】
雲海の発生を予測する雲海発生予測システムを、予測地域の近くにおける、気温及び風速を含む気象データを取得する気象データ取得手段10と、気象データ取得手段10で取得された気象データに基づいて、雲海の発生を予測する雲海予測手段22とで構成した。雲海予測手段22は、所定時間での気温低下量を加味して、雲海の発生を予測するものとすることが好ましい。また、雲海予測手段22は、予測地域の近くにおける過去の気象データを説明変数とし、予測地域における雲海の発生の履歴データを目的変数とした教師データを学習させて作成した雲海発生予測モデルを用いて、雲海の発生を予測するものとすることも好ましい。
【選択図】 図3
【特許請求の範囲】
【請求項1】
雲海の発生を予測する雲海発生予測システムであって、
予測地域の近くにおける、気温及び風速を含む気象データを取得する気象データ取得手段と、
気象データ取得手段で取得された気象データに基づいて、雲海の発生を予測する雲海予測手段と、
を備えたことを特徴とする雲海発生予測システム。
【請求項2】
雲海予測手段が、所定時間での気温低下量を加味して、雲海の発生を予測する請求項1記載の雲海発生予測システム。
【請求項3】
雲海予測手段が、予測地域の近くにおける過去の気象データを説明変数とし、予測地域における雲海の発生の履歴データを目的変数とした教師データを学習させて作成した雲海発生予測モデルを用いて、雲海の発生を予測する請求項2記載の雲海発生予測システム。
【請求項4】
気象データ取得手段が、予測地域の近くにおける、標高が異なる複数地点の気象データを取得し、
雲海予測手段が、それら複数地点の気象データに基づいて、雲海の発生を予測する
請求項3記載の雲海発生予測システム。
【請求項5】
雲海予測手段が、気象データ取得手段で取得された前日までの気象データに基づいて、予測対象日の雲海の発生を予測する請求項4記載の雲海発生予測システム。
【請求項6】
請求項1~5いずれか記載の雲海発生予測システムを用いた雲海発生予測方法。
【請求項7】
雲海の発生を予測するための雲海発生予測プログラムであって、
予測地域の近くにおける、気温及び風速を含む気象データに基づいて、雲海の発生を予測する処理をコンピュータに実行させる雲海発生予測プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、雲海の発生を予測する雲海発生予測システムと、この雲海発生予測システムを用いた雲海発生予測方法と、雲海の発生を予測するための雲海発生予測プログラムとに関する。
【背景技術】
【0002】
雲海が広がる幻想的な景色に魅了される人は多い。このため、雲海が見られる地域のなかには、それを売りに観光客を増やし、さらには、町おこしを図ろうとするところもある。しかし、雲海は頻繁に現れるものではなく、観光客が実際に足を運んでも雲海が見られるとは限らない。観光客をがっかりさせないためにも、雲海の発生が前もって分かればよいのだが、現状では、そのようなことを可能にする技術は確立されていない。あえて言えば、特許文献1に公開されているように、霧の発生の予測に関する技術があるくらいである。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6184148号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1の技術は、局所的な範囲(地点)における霧の発生を予測するものであり、比較的広い範囲(地域)における雲海の発生を予測するものではない。また、予測に用いる気象データは、気象庁が一般に提供しているものを利用することが手軽で好ましいところ、特許文献1の技術では、気象庁から提供されている気象データだけでは予測を行えないおそれがある。というのも、特許文献1の技術では、湿度や露点温度等を予測に用いているところ、気象庁管轄の気象データ観測地点のなかには、湿度等を計測していないところもあるからである。気象庁から湿度等を得られない場合には、湿度等を得るための計測手段を独自に設置する等、多大なコストと手間がかかる。
【0005】
本発明は、上記課題を解決するために為されたものであり、雲海の発生を予測できる雲海発生予測システムを提供するものである。また、この雲海発生予測システムを用いた雲海発生予測方法を提供することも本発明の目的である。さらに、雲海の発生を予測できる雲海発生予測プログラムを提供することも本発明の目的である。
【課題を解決するための手段】
【0006】
上記課題は、
雲海の発生を予測する雲海発生予測システムであって、
予測地域の近くにおける、気温及び風速を含む気象データを取得する気象データ取得手段と、
気象データ取得手段で取得された気象データに基づいて、雲海の発生を予測する雲海予測手段と、
を備えたことを特徴とする雲海発生予測システム
を提供することによって解決される。
【0007】
ここで、「雲海」とは、高所(観測点)から見下ろしたときに、雲や霧等の雲状体の上面が広い範囲にわたって面状に(海のように)広がって見える状態のことをいう。雲海が観測できるときには、図1(a),(b)に示すように、雲状体Cの上面は、観測点Pよりも低い位置となる。雲状体Cの下部は、図1(a)に示すように、地面(低所の地面)から上側に位置してもよいし、図1(b)に示すように、地面に接していてもよい。これに対し、図2(a)~(c)の場合は、「雲海」には該当しない。というのも、図2(a)の状態では、雲状体Cが広い範囲にわたって面状に広がっておらず、雲状体Cが局所的に形成されているに過ぎないからである。また、図2(b),(c)の状態はいずれも、雲状体Cの上面が観測点Pよりも高い位置にあり、観測点Pから見下ろしたときに、雲状体Cの上面が見えないからである。
【0008】
雲状体がどの程度の範囲に広がっていれば、「雲海」と言えるのかについては、明確に定義されていないが、本明細書においては、雲状体が3km以上の範囲にわたって広がっていれば、「雲海」に該当するものとする。より大規模な雲海は、5km以上の範囲にわたって広がることもあり、さらに大規模なものになると10km以上の範囲わたって広がることもあり得る。雲海が形成される範囲に、特に上限はないが、通常、100km以下である。雲海の観測点の高さも、特に限定されないが、通常、低地(雲海を形成しうる雲状体で覆われる低地)から50m以上の高さとされる。観測点の高さに、特に上限はないが、通常、3000m以下である。
【0009】
本発明の雲海発生予測システムでは、雲海の発生を予測することができる。このため、雲海を目的に現地まで足を運んだ観光客が雲海を見られないという事態の発生を抑えることができる。さらに、本発明の雲海発生予測システムでは、主に気温と風速に基づいて予測を行い、湿度や露点温度については特に計測する必要がない。このため、気象庁が提供する気象データだけに基づいて、雲海の発生の予測を行うことが可能である。したがって、湿度等の計測手段を独自に設置する等の手間を要さない。
【0010】
本発明の雲海発生予測システムにおいては、雲海予測手段を、所定時間での気温低下量を加味して、雲海の発生を予測するものとすることが好ましい。というのも、雲海の発生には、大気中の水蒸気量が深く関わっているところ、大気中の水蒸気量は、所定時間での気温低下量と相関があると考えられるからである。このため、所定時間での気温低下量を加味することで、雲海の発生をより正確に予測することが可能となる。
【0011】
本発明の雲海発生予測システムにおいては、コンピュータによる機械学習を利用して、雲海の発生を予測することが好ましい。具体的には、雲海予測手段を、予測地域の近くにおける過去の気象データを説明変数とし、予測地域における雲海の発生の履歴データを目的変数とした教師データを学習させて作成した雲海発生予測モデルを用いて、雲海の発生を予測するものとすることが好ましい。コンピュータによる機械学習を利用することによって、予測精度の高い雲海発生予測モデルを自動的かつ容易に作成することができる。これにより、雲海の発生の予測を、高い精度にもかかわらず容易に行うことが可能となる。
【0012】
本発明の雲海発生予測システムにおいては、雲海予測手段を、標高が異なる複数地点の気象データに基づいて、雲海の発生を予測するものとすることが好ましい。というのも、大気の状態に高さ方向の偏りがあるときに雲海が発生しやすくなるところ、標高が異なる複数地点の気象データから、その偏りを観測しやすくなるからである。これにより、雲海の発生をより正確に予測することが可能となる。
【0013】
本発明の雲海発生予測システムにおいては、雲海予測手段を、気象データ取得手段で取得された前日までの気象データに基づいて、予測対象日の雲海の発生を予測するものとすることが好ましい。というのも、雲海は早朝しか見られないことが多いため、予測対象日当日に雲海が発生することが分かっても、雲海が発生している現場に間に合わないおそれがあるからである。予測対象日の前日に、雲海の発生の見込みが分かれば、余裕をもって、雲海を見に行くための準備を行うことができる。
【0014】
また、上記課題は、
雲海の発生を予測するための雲海発生予測プログラムであって、
予測地域の近くにおける、気温及び風速を含む気象データに基づいて、雲海の発生を予測する処理をコンピュータに実行させる雲海発生予測プログラム
を提供することによっても解決される。
【0015】
本発明の雲海発生予測プログラムによって、上記雲海発生予測システムと同じように、雲海の発生を予測することが可能となる。
【発明の効果】
【0016】
以上のように、本発明によって、雲海の発生を予測できる雲海発生予測システムを提供することが可能となる。また、この雲海発生予測システムを用いた雲海発生予測方法を提供することも可能となる。さらに、雲海の発生を予測できる雲海発生予測プログラムを提供することも可能となる。
【図面の簡単な説明】
【0017】
図1】「雲海」に該当する場合を説明するための図である。
図2】「雲海」に該当しない場合を説明するための図である。
図3】本発明の雲海発生予測システムの全体像を示した図である。
図4図3の機械学習手段が機械学習を行う際に用いる教師データの一例を示した図である。
図5】機械学習アルゴリズムの一種であるサポートベクターマシン及びディシジョンツリー(決定木)を説明するための図である。
図6】機械学習アルゴリズムの一種であるニューラルネットワークを説明するための図である。
図7】(a)図3の雲海予測手段に入力される予測元データの一例を示した図であり、(b)図3の雲海予測手段から出力される雲海の発生の予測結果の一例を示した図である。
図8図3の雲海予測手段が行う処理の流れを示したフローチャートである。
図9】本発明の雲海発生予測システムにおける予測精度の評価結果を示した箱ひげ図である。
【発明を実施するための形態】
【0018】
本発明の雲海発生予測システムについて、図面を用いてより具体的に説明する。しかし、以下で述べる構成は、飽くまで好適な実施形態であり、本発明の雲海発生予測システムの技術的範囲は、以下で述べる構成に限定されない。本発明の雲海発生予測システムには、発明の趣旨を損なわない範囲で適宜変更を施すことができる。
【0019】
1.雲海発生予測システムの概要
図3は、本発明の雲海発生予測システムの全体像を示した図である。本発明の雲海発生予測システム1を用いると、過去の気象データに基づいて、将来における雲海の発生を予測することができる。例えば、予測対象日の前日(午後9時)までの気象データに基づいて、予測対象日(午前5~7時頃)における雲海の発生を予測することが可能である。このため、予測対象日に雲海を見に行く予定の観光客は、雲海発生予測システム1によって得られた予測結果を参考にして、雲海を実際に見に行くか否かを、余裕をもって判断することができる。
【0020】
雲海発生予測システム1は、主に、気象データ取得手段10と、雲海予測手段22とで構成される。気象データ取得手段10は、例えば、温度計や風速計等の計測機器であり、雲海の発生の予測対象となる地域(以降、単に予測地域と呼ぶことがある。)の近くに設置される。雲海予測手段22は、例えば、パソコン等のコンピュータ20で実現され、気象データ取得手段10で取得された気温や風速等の気象データに基づいて、雲海の発生を予測するための演算処理を行う。雲海予測手段22で算出された予測結果は、例えば、インターネットを介して、サーバ30の予測結果用記憶手段31に記憶(アップロード)される。観光客は、例えば、スマートフォン等のユーザ用端末60からサーバ30にアクセスすることで、雲海の発生の予測結果を知ることができる。
【0021】
気象データ取得手段10は、予測地域の近くに独自に設置することもできるが、その設置には多大な費用と手間がかかる。このため、本実施形態では、気象庁が運営している地域気象観測システム(通称、アメダス)を利用して、気象データを取得している。気象庁は、日本全国に約1300箇所の気象データ観測所を有しており、そこで気温や風速等の気象データを得ている。それぞれの気象データ観測所における気象データは、気象庁のサーバ40の気象データ用記憶手段41に記憶され、インターネットを介してダウンロードできるようになっている。地域気象観測システムを利用することで、自前の気象データ取得手段10を用意しなくても、予測地域の近くの気象データを簡単に取得することができる。本実施形態では、気象データ取得手段10を独自に用意しないで済むように、地域気象観測システムから得られる気象データのみで雲海の発生を予測できるようにしている。
【0022】
ところで、近年では、コンピュータによる機械学習を利用して、種々の予測を行う技術の開発が行われている。本実施形態においても、機械学習によって作成した学習済みモデル(雲海発生予測モデル)を用いて、雲海の発生を予測する。機械学習は、機械学習手段21(コンピュータ20)によって行われる。機械学習のための教師データは、気象データ取得手段10から得られる予測地域の近くにおける気象データ(本実施形態においては、気象データ用記憶手段41に記憶されたデータ)と、雲海発生確認手段50で確認できる予測地域付近の雲海発生状況とに基づいて作成される。雲海発生確認手段50としては、雲海を臨める展望台等の近くに大抵設置されているライブカメラを利用することができる。ライブカメラを利用することによって、インターネットを介して予測地域の雲海発生状況を簡単に確認することができ、教師データを効率的に作成することができる。
【0023】
2.雲海発生予測システムの構成
以下、雲海発生予測システム1の構成についてより詳しく説明する。本実施形態においては、雲海発生予測システム1を、気象データ取得手段10及び気象データ用記憶手段41(サーバ40)と、雲海発生確認手段50と、機械学習手段21と、雲海予測手段22とで構成される。
【0024】
2.1 気象データ取得手段及び気象データ用記憶手段
気象データ取得手段10は、予測地域の近くにおける気象データを取得するためのものである。本実施形態では、上述したように、気象庁の地域気象観測システムを利用しており、そのシステムで用いられている各種の計測機器を気象データ取得手段10としている。それらの計測機器で得られた気象データは、気象庁のサーバ40(気象データ用記憶手段41)からダウンロードできるようになっている。気象データは、気象庁以外の気象データ提供機関が運営しているシステムからダウンロードすることも可能である。また、気象庁や気象データ提供機関が提供している気象データは、API(アプリケーション・プログラミング・インターフェース)等を利用して、所望のタイミングで自動的に取得することもできる。
【0025】
地域気象観測システムにおける多くの気象データ観測地点では、気温と風速と降水量と日照時間が観測されている。このため、本実施形態では、地域気象観測システムから気温と風速と降水量と日照時間を取得して、それらの気象データに基づいて雲海の発生を予測している。これに対して、気象庁の地域気象観測システムでは、湿度や露点温度等を観測している気象データ観測地点が比較的少ない。このため、湿度や露点温度等は、雲海の発生に直接的な影響を与えるパラメータであるが、本実施形態では、湿度や露点温度等を用いなくても、雲海の発生を予測できるようにしている。
【0026】
2.2 雲海発生確認手段
雲海発生確認手段50は、予測地域で雲海が発生しているか否かを確認するためのものである。雲海が発生しているか否かに関する情報は、機械学習のための教師データに用いられる。
【0027】
観察者による直接の目視によって予測地域の雲海発生状況を確認する場合には、雲海発生確認手段50はなくてもよいが、雲海は、通常、早朝に発生するものであり、連日早朝に、現地まで足を運んで雲海の発生を確認するのは、観察者にとって負担が大きい。このため、本実施形態では、雲海発生確認手段50を用いるとともに、雲海発生確認手段50としてライブカメラを採用している。これにより、インターネットを介して遠隔から雲海の発生の有無を確認できるため、現地まで足を運ぶ手間を省くことができる。さらに、ライブカメラの映像を録画しておけば、予測地域における雲海の発生の有無をいつでも確認することが可能となる。
【0028】
2.3 機械学習手段
機械学習手段21は、機械学習を行って、雲海の発生を予測するための学習済みモデル(雲海発生予測モデル)を作成するためのものである。本実施形態では、コンピュータ20が、機械学習のためのプログラムを実行することで、機械学習手段21として機能するようにしている。機械学習手段21は、教師データに基づいて機械学習を行い、学習済みモデルを作成する。
【0029】
図4は、機械学習に用いる教師データの一例を示した図(表)である。教師データは、目的変数と、説明変数とで構成される。「目的変数」とは、予測したい変数(事象)であり、「説明変数」とは、目的変数に影響を及ぼしうる変数である。本実施形態で言えば、雲海の発生の有無に関する履歴データ(図4の表における「翌日の雲海発生有無」の列のデータ)が目的変数に対応し、地域気象観測システムから得られる複数時刻(例えば12時、15時、18時及び21時)の気象データ(図4の表における「気温」、「風速」、「降水量」及び「日照時間」の列のデータ)が説明変数に対応する。さらに、本実施形態では、所定時間での気温低下量(図4の表における「12時-18時気温低下量」、「12時-21時気温低下量」、「15時-18時気温低下量」、「15時-21時気温低下量」、「18時-21時気温低下量」の列のデータ)も、説明変数に加えている。換言すると、一日のなかで気温が低下する可能性が極めて高い2つの時刻での気温低下量を、説明変数に加えている。この気温低下量を説明変数に加えることで、予測精度の高い学習済みモデルを作成することができる。というのも、雲海の発生には、大気中の水蒸気量が深く関わっているところ、大気中の水蒸気量は、上記の気温低下量と間接的な相関があると考えられるからである。具体的には、大気中の水蒸気量が多いときには、気温があまり下がらないが、大気中の水蒸気量が少ないときには、大幅に気温が下がる傾向があると考えられる。このため、上記の気温低下量を説明変数に加えることで、大気中の水蒸気量と直接的な相関がある湿度や露点温度等を説明変数に加えなくても、学習済みモデルの予測精度を高めることが可能となる。
【0030】
説明変数は、予測地域の近くにおける1地点の気象データで構成してもよいが、標高が異なる複数地点の気象データで構成することが好ましい。というのも、大気の状態に高さ方向の偏りがあるときに雲海が発生しやすくなるところ、標高が異なる複数地点の気象データから、その偏りを観測しやすくなるからである。これにより、予測精度の高い学習済みモデルを作成することが可能となる。
【0031】
気象データを得る地点の標高差は、特に限定されないが、50m以上あることが好ましい。気象データを得る地点の標高差は、100m以上あることがより好ましく、200m以上あることがさらに好ましい。気象データを得る地点の標高差に特に上限はないが、あえて言えば、その標高差を3000m以下とすることができる。
【0032】
また、気象データを得る地点間の水平距離も、特に制限されないが、100kmを越えると、説明変数を複数地点の気象データで構成する有効性が低くなるおそれがある。このため、気象データを得る地点間の水平距離は、100km以下にすることが好ましい。この水平距離は、50km以下にすることがより好ましく、30km以下にすることがさらに好ましい。ただし、気象データを得る地点間の水平距離は、1km以下とされることは稀であり、通常、5km以上とされる。
【0033】
教師データのデータ量(データ集計期間)は、作成にかけられる手間等に応じて適宜決定される。しかし、教師データのデータ量が少なすぎると、作成された学習済みモデルの予測精度が低くなるおそれがある。このため、教師データは、3箇月分以上のデータ量とすることが好ましい。教師データは、5箇月以上のデータ量とすることがより好ましく、10箇月以上のデータ量とすることがさらに好ましい。ただし、教師データのデータ量が多すぎると、機械学習の処理に膨大な時間がかかってしまう。このため、教師データは、120箇月分以下のデータ量とすることが好ましい。教師データは、60箇月以下のデータ量とすることがより好ましく、30箇月以下とすることがさらに好ましい。本実施形態では、教師データを、12箇月分のデータ量としている。具体的には、全国的に雲海が発生しやすい10~12月のデータを4年分蓄積したものを、教師データとしている。
【0034】
教師データは、説明変数となる気象データを、気象庁のサーバ40(気象データ用記憶装置41)から取得し、目的変数となる雲海の発生の有無を、ライブカメラ(雲海発生確認手段50)の映像から判定することで作成できる(図3参照)。本実施形態では、雲海の発生の有無を、ライブカメラの映像から人為的に判断しているが、コンピュータによる画像解析によって自動的に判断するようにすることも可能である。
【0035】
このような教師データに基づく機械学習によって、機械学習手段21は、学習済みモデルを作成する。学習済みモデルの作成アルゴリズム(機械学習アルゴリズム)としては、例えば、サポートベクターマシンやニューラルネットワーク等を採用することができる。
【0036】
図5は、サポートベクターマシンを説明するための図(グラフ)である。横軸x及び縦軸yは、任意の説明変数(本実施形態においては、気温や風速等)を表している。教師データに基づいて、この座標空間に目的変数の真偽(ここでは○印又は×印)がプロットされる。本実施形態で言えば、図4に示すように、2021年10月1日の気温や風速等ではその翌日に雲海が発生しているので、その気温や風速等に対応する座標に○印がプロットされる。また、2021年10月2日の気温や風速等ではその翌日に雲海が発生していないので、その気温や風速等に対応する座標に×印がプロットされる。サポートベクターマシンに基づく機械学習では、このような目的変数の真偽の分布から、目的変数の真偽を区分する境界Bを決定する処理が行われる。境界Bが定まることによって、所定の説明変数の値(座標)から、目的変数の真偽を判定することが可能となる。本実施形態で言えば、気温や風速等の値が与えられたときに、それに対応する座標が、境界Bに対して雲海が発生する側にあるか否か(○印側にあるか×印側にあるか)を判定することが可能となる。サポートベクターマシンに基づく機会学習では、このような境界Bに基づいて雲海の発生の有無を判定する学習済みモデルが作成される。
【0037】
図6は、ニューラルネットワークを説明するための図である。ニューラルネットワークは、入力層と、中間層(隠れ層)と、出力層とで構成される。また、それぞれの層は、単数又は複数のノード(X~X、Y~Y、Z)で構成される。図6では、中間層を、単一の層で示しているが、複数の層で構成してもよい。
【0038】
入力層の各ノードX~Xには、説明変数1~nの各値(本実施形態においては、気温や風速等の値)が入力される。入力層の各ノードX~Xから出力される数値は、それぞれに重み係数α1.1~αn.mが乗算されて、中間層の各ノードY~Yに入力される。また、中間層の各ノードY~Yから出力される数値も、それぞれに重み係数β~βが乗算されて、出力層のノードZに入力される。出力層のノードZから出力される数値は、目的変数の値(例えば、予測対象の事象の発生確率を表す0~1の範囲の値)とされる。ニューラルネットワークに基づく機械学習では、教師データに整合するように、重み係数α1.1~αn.m,β~βを決定する処理が行われる。本実施形態で言えば、例えば、ニューラルネットワークに、2021年10月1日の気温や風速等の各値を入力すると、翌日に雲海が発生するという結果(例えば、0.5以上1以下の値)を出力し、2021年10月2日の気温や風速等の各値を入力すると、翌日に雲海は発生しないという結果(例えば、0以上0.5未満の値)を出力するように、重み係数α1.1~αn。m,β~βが決定される。ニューラルネットワークに基づく機械学習では、全教師データに対して重み係数α1.1~αn.m,β~βが最適化されたニューラルネットワークが、学習済みモデルとして作成される。
【0039】
機械学習アルゴリズムは、サポートベクターマシンやニューラルネットワークに限られず、例えば、ディシジョンツリー(決定木)やランダムフォレストやロジスティック回帰等を採用することも可能である。ディシジョンツリーに基づく機械学習では、図5に示すように、教師データに基づく目的変数の真偽の分布から、目的変数の真偽を適切にグルーピングできる説明変数の境界値を決定する。本実施形態で言えば、例えば、境界値x,y,yを決定することで、x≧xかつy≧yの領域、及び、x<xかつy≧yの領域に、目的変数が真になる(翌日に雲海が発生する)領域を画定でき、x≧xかつy<yの領域、及び、x<xかつy<yの領域に、目的変数が偽になる(翌日に雲海が発生しない)領域を画定できる。これにより、所定の説明変数の値(座標)がどこの領域に位置するかによって、翌日に雲海が発生するか否かを判定することが可能となる。ディシジョンツリーに基づく機械学習では、このようなxやy等の境界値に基づいて雲海の発生の有無を判定する学習済みが作成される。また、ランダムフォレストに基づく機械学習では、グルーピングの境界値が異なる複数のディシジョンツリーを作成したうえで、複数のディシジョンツリーの予測結果を多数決等によって調整する学習済みモデルが作成される。さらに、ロジスティック回帰に基づく機械学習では、目的変数pが、次式のような説明変数q~qの関数(シグモイド関数と呼ばれる。)になっていることを前提として、教師データに整合するように、説明変数の係数γ~γ(回帰変数と呼ばれる。)を決定する。この場合には、教師データに対して係数γ~γが最適化されたシグモイド関数が、学習済みモデルとして作成される。
【0040】
【数1】
【0041】
2.4 雲海予測手段
雲海予測手段22は、雲海の発生を予測するためのものである。本実施形態では、コンピュータ20が、雲海を予測するためのプログラムを実行することで、雲海予測手段22として機能するようにしている。
【0042】
図7(a)は、雲海予測手段22に入力される予測元データの一例を示した図(表)であり、図7(b)は、雲海予測手段22から出力される雲海の発生の予測結果の一例を示した図(表)である。本実施形態では、雲海予測手段22に、予測対象日の前日の予測元データを入力すると、予測対象日における雲海の発生の予測結果が出力されるようにしている。予測元データは、図7(a)に示すように、標高が異なる複数地点における所定時刻の気温、風速、降水量及び日照時間、並びに、所定時間での気温低下量で構成される。予測結果は、例えば、図7(b)に示すように、雲海が発生するか否かの二値(例えば、雲海の発生を意味する「1」か雲海の未発生を意味する「0」)で出力される。ただし、予測結果は、雲海が発生するか否かの二値的な情報ではなく、連続的な発生確率(例えば、0~100%の数値)で表すことも可能である。機械学習の具体的な処理内容は、プログラミング言語(例えば、Python)で記述されるところ、このようなプログラミング言語で用意されているライブラリ(例えば、predict関数やpredict_proba関数等)を用いることで、所望の形式で予測結果を表すことができる。
【0043】
図8は、雲海予測手段22が行う処理の流れを示したフローチャートである。雲海予測手段22は、気象データ取得ステップS101と、予測元データ作成ステップS102と、予測モデル適用ステップS103とを経て、雲海の発生の予測結果を算出する。
【0044】
気象データ取得ステップS101において、雲海予測手段22は、サーバ40(気象データ用記憶手段41、図3参照)から、気象データ(予測地域の近くにおける所定時刻の気温、風速、降水量及び日照時間)を取得する。その取得方法は、特に限定されず、所定の時刻(例えば、午後9時)にその日(12時、15時、18時及び21時)の気象データを一括でダウンロードしてもよいし、所定の時刻(12時、15時、18時及び21時)になるごとに、その時刻の気象データを得るようにしてもよい。
【0045】
予測元データ作成ステップS102において、雲海予測手段22は、各時刻の気温から所定時間での気温低下量を算出して、図7(a)に示したような予測元データを作成する。本実施形態では、予測元データを雲海予測手段22で作成しているが、外部で作成された予測元データを雲海予測手段22に入力するようにしてもよい。
【0046】
予測モデル適用ステップS103において、雲海予測手段22は、予測元データを学習済みモデル(図5,6参照)に適用して、図7(b)に示したような予測結果を算出する。ここで用いられる学習済みモデルは、1つに限られず、複数であってもよい。例えば、複数の学習済みモデルの予測結果が的中していたか否かの成績をつけいき、その成績が最良の学習済みモデルの予測結果を出力するようにしてもよい。あるいは、複数の学習済みモデルの予測結果を合成(例えば、成績上位2つのモデルの予測結果を平均化)して新たな予測結果を算出してもよい。
【0047】
2.5 その他
本実施形態では、機械学習手段21及び雲海予測手段22の機能を、同一のコンピュータ20(図3参照)で実現しているが、別々のコンピュータで実現してもよい。例えば、演算処理量が比較的多い機械学習手段21には、演算処理能力が高いワークステーションを用い、演算処理量が比較的少ない雲海予測手段22には、一般的なパソコンを用いることも可能である。また、本実施形態では、雲海予測手段22で算出された予測結果を、サーバ30(予測結果用記憶手段31)を介して公開するようにしているが、例えば、コンピュータ20に記憶されている予測結果を外部から直接閲覧できるようにしてもよいし、サービス登録者に対してコンピュータ20からメール配信するようにしてもよい。この場合には、サーバ30を設ける必要はない。さらに、本実施形態では、予測結果を確認するためのユーザ用端末60として、スマートフォンを想定しているが、ユーザ用端末60は、これに限らず、例えば、タブレット端末やパソコン等とすることもできる。
【0048】
3.実施例
本発明の雲海発生予測システム1で算出した予測結果がどの程度的中するのかを確認するために、雲海発生予測システム1(特にその学習済みモデル)の予測精度を評価した。この評価では、予測地域を、広島県の三次市市街及びその周辺に設定し、雲海の観測点を、高谷山の展望台(ライブカメラの設置地点)に設定した。気象データとしては、気象庁管轄の三次地域気象観測所(標高約159m)で観測されたものを用いた。気象データの集計期間(データ量)は、2018~2021年の各年の10~12月の期間(計368日分のデータ量)とした。雲海の発生の有無は、確認日当日の午前5~7時の間に雲海が現れたか否かで判断した。以上の条件で作成した教師データを、実施例1とした。さらに、この実施例1の教師データに、説明変数として、高野地域気象観測所(標高約570m)で観測された気象データを加えたものを、実施例2とした。
【0049】
実施例1及び実施例2に基づく学習済みモデルのそれぞれに対して、交差検証(クロスバリデーション)で行い、それらの予測精度を評価した。具体的には、4年分の教師データのうち、3年分の教師データを機械学習のためのデータとし、1年分の教師データを学習済みモデルを評価するためのデータとして用いる検証を行った。より具体的には、2018~2020年の教師データで学習済みモデルを作成し、2021年の教師データを使ってその学習済みモデルの予測結果と実際の結果とを照合し、これとは別に、2019~2021年の教師データで学習済みモデルを作成し、2018年の教師データを使ってその学習済みモデルの予測結果と実際の結果とを照合するといったように、機械学習のための教師データと、学習済みモデルの評価のための教師データとを入れ替えて、計4つの予測的中率(正解率)を得た。
【0050】
さらに、この交差検証を、4種の学習済みモデルに対してそれぞれ行った。4種の学習済みモデルは、サポートベクターマシン、ニューラルネットワーク、ランダムフォレスト、及びロジスティック回帰に基づく機械学習によって作成した。それぞれの機械学習の際には、再帰的特徴量削減法を適用して、目的変数に影響を及ぼさない(相関関係が弱い)説明変数を除外する操作を行った。4種の学習済みモデルのそれぞれに対して交差検証を行うと、計16の予測的中率を得ることができる。
【0051】
図9は、本評価の結果を示した箱ひげ図である。左側が、実施例1の教師データ(三次地域気象観測所の気象データのみで構成されたもの)に基づいて作成した学習済みモデルの箱ひげ図であり、右側が、実施例2の教師データ(三次地域気象観測所と高野地域気象観測所との両方の気象データで構成されたもの)に基づいて作成した学習済みモデルの箱ひげ図である。
【0052】
実施例1に基づく学習済みモデルにおける計16の予測的中率の平均値は73.7%であり、中央値は72.8%であり、第1四分位数は72.2%であり、第3四分位数は75.0%であり、最小値は69.3%であり、最大値は79.3%であった。この結果から、実施例1、つまり、1地点の気象データで構成された教師データに基づく学習済みモデルでも、予測精度が充分に高いことが確認できた。
【0053】
また、実施例2に基づく学習済みモデルにおける計16の予測的中率の平均値は約77.9%であり、中央値は約78.4%であり、第1四分位数は約76.9%であり、第3四分位数は約80.4%であり、最小値は69.6%であり、最大値81.8%であった。実施例1と比べると、予測的中率の分布(特に、全サンプル数の半数を占める第1四分位数から第3四分位数までの範囲)が全体的に高いことが確認できた。この比較から、実施例2、つまり、標高が異なる複数地点の気象データで構成された教師データに基づく学習済みモデルでは、予測精度がさらに高められることがわかった。
【符号の説明】
【0054】
1 雲海発生予測システム
10 気象データ取得手段
20 コンピュータ
21 機械学習手段
22 雲海予測手段
30 サーバ(予測結果記憶用)
31 予測結果用記憶手段
40 サーバ(気象データ記憶用)
41 気象データ用記憶手段
50 雲海発生確認手段
60 ユーザ用端末
C 雲状体
P 観測地点
図1
図2
図3
図4
図5
図6
図7
図8
図9