特許7270528 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ジャパンマリンユナイテッド株式会社の特許一覧

特許7270528情報処理装置、船舶および情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-04-27

(45)【発行日】2023-05-10

(54)【発明の名称】情報処理装置、船舶および情報処理方法

(51)【国際特許分類】

G06T 7/00 20170101AFI20230428BHJP

B63B 43/20 20060101ALI20230428BHJP

B63B 49/00 20060101ALN20230428BHJP

【ＦＩ】

G06T7/00 350C

B63B43/20

B63B49/00 Z

【請求項の数】 6

(21)【出願番号】P 2019204657

(22)【出願日】2019-11-12

(65)【公開番号】P2021077202

(43)【公開日】2021-05-20

【審査請求日】2022-04-25

【国等の委託研究の成果に係る記載事項】（出願人による申告）令和元年度、国立研究開発法人新エネルギー・産業技術総合開発機構、「高効率・高速処理を可能とするＡＩチップ・次世代コンピューティングの技術開発／革新的ＡＩエッジコンピューティング技術の開発／ソフトテンソルプロセッサによる超広範囲センシングＡＩエッジ技術の研究開発」委託研究、産業技術力強化法第１７条の適用を受ける特許出願

(73)【特許権者】

【識別番号】502116922

【氏名又は名称】ジャパンマリンユナイテッド株式会社

(74)【代理人】

【識別番号】110001461

【氏名又は名称】弁理士法人きさ特許商標事務所

(72)【発明者】

【氏名】天谷一朗

(72)【発明者】

【氏名】比留井仁

【審査官】小池正彦

(56)【参考文献】

【文献】特開２００５－０３１７８９（ＪＰ，Ａ）

【文献】小林充，外3名，深層学習による景観画像からの船影の検出，日本船舶海洋工業会講演会論文集，日本，日本船舶海洋工業会，2018年05月22日，第26号，p121-124

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００

Ｂ６３Ｂ４３／２０

Ｂ６３Ｂ４９／００

(57)【特許請求の範囲】

【請求項1】

長手方向よりも前記長手方向に直交する短手方向の長さが短い形状を有する物体の画像を含む画像データが入力されると、前記画像データを前記短手方向に拡大した拡大画像データを生成する前処理手段と、
前記前処理手段によって生成された前記拡大画像データに対して、特徴マップを生成する畳み込み処理および前記特徴マップを縮小するプーリング処理の組み合わせ処理を行って前記画像データが示す画像に含まれる前記物体を検出する物体検出手段と、
を有する情報処理装置。

【請求項2】

前記画像データの基準画像データとして、前記物体の画像を含まない参照画像データを記憶する記憶手段をさらに有し、
前記前処理手段は、
前記参照画像データと前記画像データとの差分を求め、求めた差分画像データを用いて前記拡大画像データを生成する、請求項１に記載の情報処理装置。

【請求項3】

前記物体は船であり、
前記画像データは、水に浮かぶ前記船の画像を含むものである、
請求項１または２に記載の情報処理装置。

【請求項4】

前記前処理手段は、
前記画像データにおいて、水平線を検出し、前記水平線を基準にして前記短手方向の予め決められた幅の画像データに対して前記拡大画像データを生成する、
請求項３に記載の情報処理装置。

【請求項5】

請求項１～４のいずれか１項に記載の情報処理装置を備えた船舶。

【請求項6】

情報処理装置が行う情報処理方法であって、
長手方向よりも前記長手方向に直交する短手方向の長さが短い形状を有する物体の画像を含む画像データが入力されると、前記画像データを前記短手方向に拡大した拡大画像データを生成するステップと、
生成された前記拡大画像データに対して、特徴マップを生成する畳み込み処理および前記特徴マップを縮小するプーリング処理の組み合わせ処理を行って前記画像データが示す画像に含まれる前記物体を検出するステップと、
を有する情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像から物体を検出する情報処理装置、その情報処理装置を備えた船舶、および情報処理方法に関する。

【背景技術】

【0002】

航行中の船舶において、船員は、水面に浮かぶブイ等の浮遊物、岩礁、および他の船などの障害物に自船が衝突しないように、自船の周囲を監視する作業を、航行中、休みなく行っている。監視作業は船員への負担が大きく、衝突事故の大半は、障害物の見逃しなど船員に起因する。船員の負荷を低減するとともに、衝突事故の防止を目的として、カメラの撮影画像から周囲の物体を自動的に検出する監視システムの開発が行われている。

【0003】

画像認識による船舶検出システムの一例が知られている（非特許文献１参照）。非特許文献１に開示されたシステムは、畳み込みニューラルネットワークを応用した物体検出技術を浦賀水道が撮影された景観画像に適用し、浦賀水道を航行する船舶を検出する。将来、普及が予想される自律運航船において、周囲を監視するシステムは必須であり、画像認識による船舶検出システムの実用化が期待されている。

【先行技術文献】

【非特許文献】

【0004】

【文献】小林充、外３名、「深層学習による景観画像からの船影の検出」日本船舶海洋工学会講演会論文集、２０１８年、第２６号、ｐｐ．１２１－１２４

【発明の概要】

【発明が解決しようとする課題】

【0005】

非特許文献１に開示されたシステムにおいて、観測地点から２～３ｋｍ離れた航路を航行する船舶の検出率が低い。これは、風景画像における船影のサイズが、物体検出技術の検出限界よりも小さいことが原因である。非特許文献１においては、船舶の特有な形状により、船影の幅方向の検出サイズよりも高さ方向の検出サイズが小さいことが報告されている。非特許文献１に開示されたシステムは、船舶に限らず、長手方向の長さと短手方向の長さとの比が大きい物体を検出する際、長手方向の特徴を検出できたとしても、短手方向の特徴を検出できない場合があり、物体の検出率が低下してしまう。

【0006】

本発明は、上記のような課題を解決するためになされたもので、画像から長手方向の長さと短手方向の長さとの比が大きい物体を検出する精度を向上させる情報処理装置、その情報処理装置を備えた船舶、および情報処理方法を得るものである。

【課題を解決するための手段】

【0007】

本発明に係る情報処理装置は、長手方向よりも前記長手方向に直交する短手方向の長さが短い形状を有する物体の画像を含む画像データが入力されると、前記画像データを前記短手方向に拡大した拡大画像データを生成する前処理手段と、前記前処理手段によって生成された前記拡大画像データに対して、特徴マップを生成する畳み込み処理および前記特徴マップを縮小するプーリング処理の組み合わせ処理を行って前記画像データが示す画像に含まれる前記物体を検出する物体検出手段と、を有するものである。

【0008】

本発明に係る船舶は、上記の情報処理装置を備えたものである。

【0009】

本発明に係る情報処理方法は、情報処理装置が行う情報処理方法であって、長手方向よりも前記長手方向に直交する短手方向の長さが短い形状を有する物体の画像を含む画像データが入力されると、前記画像データを前記短手方向に拡大した拡大画像データを生成するステップと、生成された前記拡大画像データに対して、特徴マップを生成する畳み込み処理および前記特徴マップを縮小するプーリング処理の組み合わせ処理を行って前記画像データが示す画像に含まれる前記物体を検出するステップと、を有するものである。

【発明の効果】

【0010】

本発明によれば、特徴量を抽出する処理が行われる前の画像データにおいて、検出対象の物体の短手方向の長さが拡大されるため、プーリング処理において物体の短手方向の特徴が消失することが抑制される。そのため、長手方向の長さと短手方向の長さとの比が大きい物体を検出する精度を向上させることができる。

【図面の簡単な説明】

【0011】

【図1】本実施の形態１に係る情報処理装置の一構成例を示すブロック図である。

【図2】図１に示した処理部の一構成例を示す機能ブロック図である。

【図3】図２に示した物体検出手段に入力される画像データの一例を説明するための模式図である。

【図4】比較例の情報処理装置の一構成例を示すブロック図である。

【図5】図４に示した処理部の一構成例を示す機能ブロック図である。

【図6】図４に示した比較例の情報処理装置による画像認識モデル作成処理および物体検出処理のそれぞれの手順の一例を示すフロー図である。

【図7】図５に示した物体検出手段の動作手順を説明するための模式図である。

【図8】図５に示した畳み込み処理手段が行う畳み込み処理の一例を説明するための模式図である。

【図9】図５に示したプーリング手段が行うプーリング処理の一例を説明するための模式図である。

【図10】船の種類が客船の場合の学習画像の一例を示す模式図である。

【図11】船の種類が自動車運搬船の場合の学習画像の一例を示す模式図である。

【図12】船の種類が石油タンカーの場合の学習画像の一例を示す模式図である。

【図13】船の種類がコンテナ船の場合の学習画像の一例を示す模式図である。

【図14】船の種類がＬＮＧ運搬船の場合の学習画像の一例を示す模式図である。

【図15】検出処理対象の画像データの一例を示す模式図である。

【図16】比較例の物体検出処理の過程において、船体の特徴が消失してしまった場合の一例を示す画像のイメージ図である。

【図17】図１に示した情報処理装置による画像認識モデル作成処理および物体検出処理のそれぞれの手順の一例を示すフロー図である。

【図18】図２に示した前処理手段が生成した拡大画像データが示す画像の一例を示すイメージ図である。

【図19】変形例１において、入力される画像データが示す画像の一例を示す模式図である。

【図20】変形例１において、基準画像データである参照画像データが示す画像の一例を示す模式図である。

【図21】図１９に示した画像と図２０に示した画像との差分の画像のデータである差分画像データが示す画像の一例を示す模式図である。

【図22】変形例２において、入力される画像データが示す画像の一例を示す模式図である。

【図23】図２２に示す画像データを用いて、図２に示した前処理手段が生成した拡大画像データが示す画像の一例を示す模式図である。

【発明を実施するための形態】

【0012】

実施の形態１．
本実施の形態１の情報処理装置の構成を説明する。図１は、本実施の形態１に係る情報処理装置の一構成例を示すブロック図である。情報処理装置１は、入力される画像データによって表される画像に含まれる物体を検出する処理部２と、処理部２が実行する演算に必要な情報および処理部２による演算の結果を記憶する記憶部３とを有する。本実施の形態１においては、検出対象の物体が船の場合で説明する。記憶部３は、例えば、ハードディスクである。記憶部３は、２次記憶装置の役目を果たす。

【0013】

処理部２は、プログラムを記憶するメモリ３１と、プログラムにしたがって処理を実行するＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）３２とを有する。メモリ３１は、フラッシュメモリ等の不揮発性メモリを有する。メモリ３１は、不揮発性メモリの他に、ＳＲＡＭ（ＳｔａｔｉｃＲｎｄ）等の揮発性メモリを有していてもよい。メモリ３１は、プログラムを記憶するだけでなく、ＧＰＵ３２による演算の結果を一時的に記憶するキャッシュメモリおよび入力される画像データを記憶するフレームメモリとしての役目も果たす。メモリ３１および記憶部３は記憶手段の一例である。

【0014】

なお、本実施の形態１においては、処理部２にＧＰＵ３１が設けられている場合で説明するが、ＧＰＵの代わりにＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）が設けられていてもよい。また、ＧＰＵの代わりに、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）およびＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）等の専用回路が処理部２に設けられていてもよい。

【0015】

図２は、図１に示した処理部の一構成例を示す機能ブロック図である。処理部２は、モデル作成手段２１と、前処理手段１０と、物体検出手段２２とを有する。モデル作成手段２１は、教師データとして入力される複数のデータセットを用いて、画像認識モデルを生成する。本実施の形態１の画像認識モデルは、海上を撮影した画像に含まれる船を検出するものである。なお、本実施の形態１においては、情報処理装置１が画像データから船の有無を検出するだけでなく、船の種類も検出する場合で説明するが、船の種類まで検出しなくてもよい。

【0016】

船の種類は、例えば、コンテナを運搬するコンテナ船、石油を運搬する石油タンカー、自動車を運搬する自動車運搬船、旅客を乗せて運ぶ客船、および液化天然ガス（ＬＮＧ）を運搬するＬＮＧ運搬船などである。本実施の形態１においては、船の種類が、コンテナ船、石油タンカー、自動車運搬船、客船およびＬＮＧ運搬船の５種類の場合で説明するが、船の種類は５種類に限定されない。

【0017】

物体検出手段２２は、モデル作成手段２１によって作成された画像認識モデルを用いて、画像データに対して画像認識処理を行って特徴量を抽出し、船の有無および船の種類を判定する。例えば、物体検出手段２２は、畳み込みニューラルネットワークを用いて、画像データが示す画像に含まれる船を検出する。前処理手段１０は、物体検出手段２２による物体検出精度を向上させるために、入力される画像データを加工して、加工した画像データを物体検出手段２２に提供する。

【0018】

情報処理装置１の画像認識処理の対象となる画像データは、例えば、カメラ６０から入力される。カメラ６０は、陸上に固定されていてもよく、船などの移動手段に設置されていてもよい。画像データの一例を、図３を参照して説明する。図３は、図２に示した物体検出手段に入力される画像データの一例を説明するための模式図である。図３に示すように、カメラ６０は、レンズ６１と、撮像部６２と、Ａ／Ｄ（アナログ／デジタル）変換部６３とを有する。撮像部６２は、マトリクス状に配置された複数の受光素子（不図示）を有する。撮像部６２は、例えば、ＣＣＤ（ＣｈａｒｇｅＣｏｕｐｌｅｄＤｅｖｉｃｅ）またはＣＭＯＳ（ＣｏｍｐｌｅｍｅｎｔａｒｙＭｅｔａｌＯｘｉｄｅＳｅｍｉｃｏｎｄｕｃｔｏｒ）イメージセンサである。

【0019】

レンズ６１は、船および水面等で反射した光を撮像部６２に集光する。撮像部６２は、複数の受光素子によって検出される光の強度を電気信号に変換し、変換した複数の電気信号を出力する。Ａ／Ｄ変換部６３は、撮像部６２から受信する複数の電気信号を、順次、標本化および量子化してアナログ信号からデジタル信号に変換して情報処理装置１に送信する。複数のデジタル信号は、２次元の画像データとして、カメラ６０から情報処理装置１に入力される。カメラ６０から情報処理装置１に入力される２次元の画像データのイメージを、図３に示す。

【0020】

カメラ６０によって撮影される風景の画像には、船以外のものが含まれていてもよい。船以外のものは、例えば、島、ブイ、および船が接岸する岸壁などである。また、カメラ６０によって撮影される風景の画像に、船が被写体として含まれない場合もある。また、カメラ６０によって撮影される風景の画像は、２次元の静止画像であってもよく、２次元の動画像であってもよい。以下では、説明を簡単にするために、情報処理装置１による情報処理の対象画像が静止画像の場合で説明する。静止画像の各画素のデータは、白黒表示における明るさのレベルを示す値であってもよく、Ｒ（赤色）、Ｇ（緑色）およびＢ（青色）の各成分の明るさのレベルを示す値であってもよい。

【0021】

本実施の形態１の情報処理装置１を詳しく説明する前に、比較例の情報処理装置について説明する。図４は、比較例の情報処理装置の一構成例を示すブロック図である。図５は、図４に示した処理部の一構成例を示す機能ブロック図である。

【0022】

図４に示すように、比較例の情報処理装置１００は、処理部１２０および記憶部１３０を有する。処理部１２０のハードウェア構成は図１を参照して説明した処理部２と同様な構成であるため、その詳細な説明を省略する。また、記憶部１３０のハードウェア構成は図１を参照して説明した記憶部３と同様な構成であるため、その詳細な説明を省略する。図５に示すように、処理部１２０は、モデル作成手段２１と、物体検出手段２２とを有する。物体検出手段２２は、畳み込み処理手段１１と、プーリング手段１２と、結合手段１３と、出力手段１４とを有する。

【0023】

次に、図４に示した比較例の情報処理装置１００の動作手順を説明する。図６は、図４に示した比較例の情報処理装置による画像認識モデル作成処理および物体検出処理のそれぞれの手順の一例を示すフロー図である。モデル作成手段２１が行う画像認識モデル作成処理を説明する前に、モデル作成手段２１によって作成された画像認識モデルを用いて、物体検出手段２２が行う物体検出処理について説明する。

【0024】

物体検出手段２２は、カメラ６０から画像データが入力されると（ステップＳ２０１）、画像データに対して画像認識モデルを適用し、画像データで表される画像に含まれる船の検出処理を行う（ステップＳ２０２）。以下に、ステップＳ２０２で行われる情報処理方法について、詳しく説明する。

【0025】

図７は、図５に示した物体検出手段の動作手順を説明するための模式図である。畳み込み処理手段１１は、画像データにフィルタをかけて特徴マップを生成する畳み込み処理を行う。例えば、畳み込み処理手段１１は、画像データの各画素におけるＲＧＢの３つの成分の明るさのレベルに対して特徴マップを生成する。プーリング手段１２は、畳み込み処理手段１１によって生成された特徴マップのサイズを縮小する。さらに、畳み込み処理手段１１は、プーリング手段１２によって縮小された特徴マップに対して畳み込み処理を行う。続いて、プーリング手段１２は、畳み込み処理手段１１によって生成された特徴マップのサイズをさらに縮小する。

【0026】

結合手段１３は、複数の２次元の特徴マップを１次元の特徴マップに変換し、船の種類毎に特徴量の総和Ｓｋを求める。本実施の形態１においては、船の種類は５種類なので、ｋを０～４のいずれかの整数とする。出力手段１４は、５種類の船の特徴量の総和Ｓｋの合計値Ｓｕｍを分母とし、船の種類毎の特徴量の総和Ｓｋを分子として、船の種類毎の検出確率を算出する。出力手段１４は、算出した各船の検出確率のうち、最も大きい値を示す検出確率に対応する船の種類を出力する。その際、出力手段１４は、算出した各船の検出確率の結果の全てをリスト化して出力してもよい。

【0027】

なお、図７は、畳み込み処理およびプーリング処理の組み合わせ処理が２回の場合を示しているが、この組み合わせ処理の回数は２回に限らない。組み合わせ処理の回数は１回でもよく、３回以上であってもよい。

【0028】

次に、畳み込み処理手段１１が行う畳み込み処理について、図８を参照して説明する。図８は、図５に示した畳み込み処理手段が行う畳み込み処理の一例を説明するための模式図である。ここでは、説明を簡単にするために、２次元の画像データの水平方向（Ｘ軸矢印方向）および垂直方向（Ｙ軸矢印方向）のそれぞれの画素数が１０個であるものとする。水平方向にＬ列（Ｌは正の整数）および垂直方向にＬ行でマトリクス状に配置されるデータを「Ｌ×Ｌ」と表記する。また、各画素の位置を、図８に示すＸ軸およびＹ軸を座標軸とした座標で表す。最上段の左端の座標を原点（０，０）とし、最下段の右端の座標を（９，９）とする。画像データには、画素毎に光の強度を示すデータが記録されている。例えば、座標（０，０）の画素のデータはａ_００である。ここでは、画素のデータａ_００～ａ_９９は、白黒表示における明るさのレベルを示す値の場合で説明するが、ＲＧＢの各成分の明るさのレベルを示す値であってもよい。

【0029】

ｗ（ｗ＜Ｌ）を正の整数とするとき、畳み込み処理手段１１は、Ｌ×Ｌの画像データに対して、ｗ×ｗの画素のデータを抜き出し、抜き出したｗ×ｗの画素のデータに対してｗ×ｗの重みフィルタｗｆの内積を求める。そして、畳み込み処理手段１１は、内積の結果を活性化関数ｆ１に入力することで、特徴マップを求める。図８は、Ｌ＝１０、ｗ＝３の場合を示す。重みフィルタｗｆおよび活性化関数ｆ１は、後述する画像認識モデル作成処理によって画像認識モデルに設定される。

【0030】

図８に示すように、畳み込み処理手段１１は、１０×１０の画像データにおいて、基準となる原点側から３×３の画像データを抜き出し、抜き出した画像データに対して３×３の重みフィルタｗｆの内積を求める。重みフィルタｗｆは、例えば、エッジ検出フィルタである。例えば、畳み込み処理手段１１は、図８の画像データに示す破線枠で囲まれた３×３の画像データに対して重みフィルタｗｆの内積を求める。内積の結果Ｒｉ００は、Ｒｉ００＝ａ_００×（－１）＋ａ_１０×（－１）＋ａ_２０×（－１）＋ａ_０１×（－１）＋ａ_１１×８＋ａ_２１×（－１）＋ａ_０２×（－１）＋ａ_１２×（－１）＋ａ_２２×（－１）の式によって算出される。そして、畳み込み処理手段１１は、内積の結果Ｒｉ００を活性化関数ｆ１に入力することで、８×８の特徴マップの破線枠で示す特徴量ｂ_００を算出する。

【0031】

続いて、畳み込み処理手段１１は、１０×１０の画像データにおいて、３×３の破線枠をＸ軸矢印方向に１画素分だけシフトさせ、特徴量ｂ_００と同様にして、特徴量ｂ_１０を算出する。畳み込み処理手段１１は、３×３の破線枠を右端の座標（９，０）に到達する位置まで１画素分ずつシフトさせる度に特徴量を算出する。畳み込み処理手段１１は、特徴量ｂ_７０を算出した後、３×３の破線枠を原点側に戻すとともに、Ｙ軸矢印方向に１画素分シフトさせ、特徴量ｂ_０１を算出する。このようにして、畳み込み処理手段１１は、特徴量の算出処理を繰り返し、図８の右側下段に示す、８×８の特徴マップを生成する。ここでは、シフト量が１画素分の場合を説明したが、シフト量は１画素分に限らない。

【0032】

次に、図５に示したプーリング手段１２が行うプーリング処理について、図９を参照して説明する。図９は、図５に示したプーリング手段が行うプーリング処理の一例を説明するための模式図である。プーリング手段１２が図８に示した８×８の特徴マップに対してプーリング処理する場合を説明する。

【0033】

プーリング手段１２は、図８で求められた８×８の特徴マップに対して、４×４の特徴マップに縮小するプーリング処理を行う。具体的には、プーリング手段１２は、８×８の特徴マップに対して、２×２の特徴量のグループ毎に縮小処理を行う。ここでは、プーリングサイズが２×２の場合で説明するが、プーリングサイズは２×２に限らない。プーリング処理の種類として、例えば、最大値プーリング、平均値プーリングおよびＬｐプーリングがある。Ｌｐプーリングのｐは指数を表す。

【0034】

各プーリング処理について、図９の８×８の特徴マップに示す、２×２の破線枠で囲まれた４つの特徴量の場合で説明する。最大値プーリングの場合、プーリング手段１２は、ｂ_００、ｂ_１０、ｂ_０１およびｂ_１１のうち、最大値を特徴量ｃ_００とする。平均値プーリングの場合、プーリング手段１２は、特徴量ｃ_００として、ｃ_００＝（ｂ_００＋ｂ_１０＋ｂ_０１＋ｂ_１１）／４を算出する。ｐ＝２のＬ２プーリングの場合、プーリング手段１２は、特徴量ｃ_００として、ｃ_００＝（ｂ_００ ^２＋ｂ_１０ ^２＋_ｂ０１ ^２＋ｂ_１１ ^２）^１／２を算出する。

【0035】

このようにして、８×８の特徴マップのサイズが４×４の特徴マップに縮小される。つまり、プーリング処理が、１回、行われることにより、特徴マップのサイズが１／４に縮小される。ここでは、説明のために、画像データが１０×１０のデータの場合で説明したが、画像データは、例えば、７２０×４８０のサイズである。そのため、畳み込み処理およびプーリング処理の組み合わせ処理は、１回に限らず、複数、行われることが多い。

【0036】

結合手段１３は、４×４の特徴マップを１次元の特徴マップに変換し、船の種類毎に特徴量の総和Ｓｋを求める。出力手段１４は、５種類の船の特徴量の総和Ｓｋの合計値Ｓｕｍと、船の種類毎の特徴量の総和Ｓｋとを用いて、船の種類毎の検出確率を算出する。そして、出力手段１４は、算出した各船の検出確率のうち、最も大きい値を示す検出確率に対応する船の種類を出力する。ユーザは、出力手段１４の出力結果から、検出された船の種類がわかる。また、出力手段１４は、算出した各船の検出確率の結果の全てをリスト化して出力してもよい。この場合、ユーザは、船の種類毎の検出確率を示すリストから、各船の検出確率を比較することができる。なお、結合手段１３および出力手段１４の動作は畳み込みニューラルネットワークの全結合層および出力層の処理と同様なため、その詳細な説明を省略する。

【0037】

次に、図６を参照して、モデル作成手段２１が画像認識モデルを作成する画像認識モデル作成処理について説明する。モデル作成手段２１は、教師データを用いて、重みフィルタｗｆおよび活性化関数ｆ１の最適値を求め、求めた最適値を予め決められた画像認識モデルに反映させる。はじめに、画像認識モデル作成処理に用いられる学習画像の具体例を説明する。

【0038】

図１０～図１４は学習画像の例を示す模式図である。図１０～図１４においては、説明のために、Ｘ軸方向とＺ軸方向とを定義している。図１０～図１４に示す各画像は、船がＸ軸矢印方向に船尾を向け、Ｘ軸矢印と反対方向に船首を向けている場合の画像である。図１０は、船の種類が客船の場合の学習画像の一例を示す模式図である。また、空と海との境界は「水平線」と称され、船体が水に浮かんでいるときの水面ぎわの線は「喫水線」と称されるが、以下では、どちらも水平線の用語を使用する。

【0039】

図１０を参照して説明すると、一般的に、船は、船首から船尾までの長手方向（Ｘ軸矢印方向）の長さに対して、水面から垂直な方向（Ｚ軸矢印方向）の長さが短い形状を有する。また、船は、船体と船体の上に設けられた上部構造物の、大きく２つの構造に分けられる。図１０の画像８１に示すように、客船は、船体７１ａと、上部構造物７２ａとに分けられる。客船は、上部構造物７２ａとして、複数の客室を含む客室棟７４と、客室棟７４の上に設けられたブリッジ７３ａとを有する。客船は、船体７１ａのうち、水平線７０から上の部分のＺ軸方向の長さと、客室棟７４のＺ軸方向との長さとがほぼ同じという特徴がある。

【0040】

図１１は、船の種類が自動車運搬船の場合の学習画像の一例を示す模式図である。図１１の画像８２に示す自動車運搬船は、多くの自動車を格納するために空間の大きい船倉を船体７１ｂに有している。図１１に示す画像８２の例では、目立つ上部構造物は、ブリッジ７３ｂだけである。自動車運搬船は、水平線７０よりもＺ軸方向に長い船体７１ｂを有するという特徴がある。

【0041】

図１２は、船の種類が石油タンカーの場合の学習画像の一例を示す模式図である。石油タンカーは、自動車運搬船と同様に、目立つ上部構造物がブリッジ７３ｃだけであり、かつ、空間の大きい船倉を船体７１ｃに有している。しかし、図１２の画像８３に示すように、石油タンカーは船体７１ｃの大部分が水平線７０よりも下にある。石油タンカーは、船体７１ｃの水平線７０からＺ軸方向の長さと船首から船尾までの長さとのアスペクト比が、客船および自動車運搬船と比べて大きいという特徴がある。

【0042】

図１３は、船の種類がコンテナ船の場合の学習画像の一例を示す模式図である。コンテナ船の場合、図１３の画像８４に示すように、船体７１ｄの甲板の上には複数のコンテナ７５が山積みされる。コンテナ船には、上部構造物として、山積みされたコンテナ７５の最上面よりも高い位置にブリッジが配置されたブリッジ棟７３ｄが設けられている。これは、船員が船首の前方を見られるようにするためである。コンテナ船は、水平線７０からＺ軸方向の船体の長さよりも、長いブリッジ棟７３ｄを有する特徴がある。

【0043】

図１４は、船の種類がＬＮＧ運搬船の場合の学習画像の一例を示す模式図である。ＬＮＧ運搬船の場合、図１４の画像８５に示すように、船体７１ｅの甲板の上に、半球状のタンク７６が露出している。画像８５の例においては、タンク７６の数は４つである。また、ＬＮＧ運搬船には、タンク７６の最上面よりも高い位置にブリッジが配置されたブリッジ棟７３ｅが甲板の上に設けられている。ＬＮＧ運搬船は、船体７１ｅの上に半球状のタンク７６が露出している特徴がある。

【0044】

図６に示したステップＳｇ１０１において、モデル作成手段２１に、図１０～図１４に示す学習画像の画像データが入力される。続いて、モデル作成手段２１は、図に示さない入力部を介して、図１０～図１４に示す学習画像に対応して各画像が示す船の種類が入力されると、学習画像と船の種類とを対応づけたデータセットを作成する（ステップＳｇ１０２）。この場合、モデル作成手段２１は、５つデータセットを作成する。そして、モデル作成手段２１は、誤差逆伝播法により、船の種類の誤検出率が小さくなるように、予め決められた画像認識モデルに含まれる重みフィルタおよび活性化関数の最適値を算出する。続いて、モデル作成手段２１は、算出した最適値を反映させた画像認識モデルを作成する（ステップＳｇ１０３）。モデル作成手段２１は、作成した画像認識モデルを物体検出手段２２に渡す。

【0045】

なお、データセットは図１０～図１４に示す学習画像に対応する５つの教師データの場合に限らない。モデル作成手段２１は、準備された学習画像に対して、画像のサイズ、角度、色調および輝度等をランダムに変更してデータセットの数を増やすデータオーギュメンテーション（データ拡張）を行ってもよい。例えば、モデル作成手段２１は、図１０～図１４に示した各学習画像に対して左右反転させた画像を生成して、データセットを増やしてもよい。モデル作成手段２１は、教師データのデータ拡張を行うことで、ロバスト性を高めた学習を行うことができる。

【0046】

次に、比較例の情報処理装置１００が行う物体検出処理の課題を説明する。図１５は、検出処理対象の画像データの一例を示す模式図である。図１５は、石油タンカーをカメラ６０が撮影した画像であるが、図１２に示した石油タンカーと比べて、船体７１ｃのうち、水平線７０から水中に隠れてしまう部分が大きくなっている。図１５に示す画像９０は、例えば、石油タンカーが船倉に石油を満載したときの状態である。

【0047】

図１０～図１４の画像に示された船と比べると、画像９０が示す石油タンカーは、船体７１ｃのうち、水面から露出している部分が少ない。そのため、物体検出手段２２が船体７１ｃと水平線７０とを区別できないおそれがある。原因の１つとして、プーリング処理が考えられる。図９を参照して説明したように、プーリング処理において、特徴マップがダウンサイジングされる。図９に示した例においては、特徴マップが１／４に縮小される。図１５に示すように、目立った上部構造物を有していない船体７１ｃが水平線７０に平行な細長い形状であるため、プーリング処理により水面より露出している船体７１ｃのＺ軸方向の特徴が早い段階で消失してしまうことが考えられる。

【0048】

図１６は、比較例の物体検出処理の過程において、船体の特徴が消失してしまった場合の一例を示す画像のイメージ図である。図１６に示す画像９１の場合、物体検出手段２２は、ブリッジ７３ｃを、例えば、船以外の島またはブイと判定し、船が存在しないという結果を出力してしまう。

【0049】

検出対象の船が石油タンカーの場合について説明したが、石油タンカーの場合に限らず、長手方向に対して短手方向が短い形状を有する物体を検出する場合であれば、同じ課題が発生する。そこで、本実施の形態１の情報処理装置１は、物体検出処理の過程で特徴が消失してしまうことを抑制する前処理手段１０を有する。

【0050】

図２に示した前処理手段１０の構成を説明する。図２に示した構成のうち、モデル作成手段２１および物体検出手段２２の構成は、比較例の情報処理装置１００について説明した構成と同様であるため、その詳細な説明を省略する。図２に示した前処理手段１０は、画像データが入力されると、画像データを船の短手方向に拡大した拡大画像データを生成する。前処理手段１０は、生成した拡大画像データを物体検出手段２２に提供する。

【0051】

次に、本実施の形態１の情報処理装置１の動作手順を説明する。図１７は、図１に示した情報処理装置による画像認識モデル作成処理および物体検出処理のそれぞれの手順の一例を示すフロー図である。なお、画像認識モデル作成処理は比較例の情報処理装置１００が行う画像認識モデル作成処理と同様であるため、その説明を省略する。また、ステップＳ１０３の処理は図６に示したステップＳ２０２と同様な処理であるため、その詳細な説明を省略する。

【0052】

前処理手段１０は、カメラ６０から画像データが入力されると（ステップＳ１０１）、入力された画像データを拡大する処理を行う（ステップＳ１０２）。具体的には、前処理手段１０は、検出される船の船首から船尾の方向に平行な長手方向に対して垂直方向（Ｚ軸矢印方向）に画像データを拡大した拡大画像データを生成する。

【0053】

図１８は、図２に示した前処理手段が生成した拡大画像データが示す画像の一例を示すイメージ図である。図１８に示す画像９２は、前処理手段１０が図１５に示した画像９０による画像データをＺ軸方向に２倍に拡大したものである。前処理手段１０は、生成した拡大画像データを物体検出手段２２に渡す。物体検出手段２２は、前処理手段１０から拡大画像データを受け取ると、拡大画像データに対して画像認識モデルを適用し、画像データで表される画像に含まれる船の検出処理を行う（ステップＳ１０３）。

【0054】

本実施の形態１においては、図１５に示した船体７１ｃの水平線７０から露出した部分のＺ軸方向の長さが２倍になっている。そのため、ステップＳ１０２において、畳み込み処理およびプーリング処理の組み合わせ処理が複数回行われても、船体７１ｃの特徴が消失してしまうことが抑制される。その結果、石油タンカーのように横長の船体７１ｃが特徴として抽出され、船の存在が検出される。

【0055】

（変形例１）
変形例１では、検出対象の画像に、船以外に、長手方向に対して長手方向に直交する短手方向の長さが短い形状を有するものが含まれている場合について説明する。長手方向に対して短手方向の長さが短い形状を有するものとして、例えば、船を接岸させる岸壁がある。

【0056】

図１９は、変形例１において、入力される画像データが示す画像の一例を示す模式図である。図２０は、変形例１において、基準画像データである参照画像データが示す画像の一例を示す模式図である。図２１は、図１９に示した画像と図２０に示した画像との差分の画像のデータである差分画像データが示す画像の一例を示す模式図である。

【0057】

カメラ６０が陸上に固定されている場合、カメラ６０が撮影する風景の画像に、常に、船以外の構造物が含まれることがある。図２０に示す画像１０２を参照すると、カメラ６０の視野角に船が入っていないときに、岸壁１５０がカメラ６０の被写体として撮影されている。画像１０２のように船の画像を含まない画像データを、物体検出対象の画像データの基準画像データとして、メモリ３１が予め記憶している。このような基準画像データを、参照画像データと称する。参照画像データが複数ある場合、記憶部３が複数の参照画像データを記憶してもよい。

【0058】

図１９に示す画像１０１には、被写体として、石油タンカーの他に岸壁１５０が含まれている。前処理手段１０は、図１９に示す画像１０１の画像データが入力されると、画像データと参照画像データと差分を求め、求めた差分の画像を示すデータである差分画像データを用いて拡大画像データを生成する。前処理手段１０は、生成した拡大画像データを物体検出手段２２に渡す。物体検出手段２２が差分画像データの拡大画像データを用いて物体検出処理を行ったとき、船体７１ｃの特徴が消失してしまうことが抑制されるとともに、岸壁１５０が船と誤検出されてしまうことを防ぐことができる。

【0059】

変形例１によれば、検出処理対象の画像データが示す画像に、船体の形状に近似した横長の構造物が含まれていても、その構造物が差分画像データから除かれるため、船の検出精度が向上する。

【0060】

（変形例２）
変形例２では、入力される画像データに対して拡大対象の範囲を小さくする場合について説明する。図２２は、変形例２において、入力される画像データが示す画像の一例を示す模式図である。図２３は、図２２に示す画像データを用いて、図２に示した前処理手段が生成した拡大画像データが示す画像の一例を示す模式図である。

【0061】

前処理手段１０は、図２２に示す画像１１１の画像データにおいて、水平線７０を検出する。前処理手段１０は、画像データから水平線７０を検出する際、例えば、エッジ検出フィルタを用いる。前処理手段１０は、エッジ検出フィルタを画像データにかける際、垂直方向（Ｚ軸矢印方向）に隣接する複数の画素に対してフィルタ処理を行えばよい。図２２に示すように、水平線７０は水平方向（Ｘ軸方向）と平行に伸びているので、水平線７０を跨ぐ方向にフィルタ処理をかければ、より検出されやすくなる。この場合、水平方向のフィルタ処理を行わなくてすむので、前処理手段１０は、水平線７０の検出処理を早く行うことができる。

【0062】

前処理手段１０は、水平線７０を検出すると、水平線７０を基準にして船体７１ｃの短手方向の一定の幅の画像データに対して、図２３に示す画像１１３の拡大画像データを生成する。破線枠１１２に示す範囲が拡大対象の画像である。破線枠１１２は、水平線７０を基準にして垂直上方向（Ｚ軸矢印方向）および垂直下方向（Ｚ軸矢印と反対方向）のそれぞれの距離が同じになる幅を有する。水平線７０は拡大対象の範囲の基準線の役目を果たす。図２２に示す例では、画像１１１の垂直方向の長さをＺ０とすると、破線枠１１２の垂直方向の幅Ｚ１は、Ｚ１＝（１／２）×Ｚ０で表される。画像１１１全体のうち、破線枠１１２で囲まれる面積は画像１１１の半分の面積である。この場合、画像データのうち、拡大する画像データの範囲が１／２で済む。

【0063】

変形例２によれば、物体検出処理の対象となる画像データに対して水平線７０を基準にして短手方向の予め決められた幅の画像データが拡大されるので、画像データを一時的に保存するためのフレームメモリの使用容量を増やさずに済む。図２２および図２３を参照して説明した例の場合、図１８に示した画像９２の場合に比べて、フレームメモリの使用容量を１／２に削減できる。

【0064】

なお、変形例２において、画像データの拡大範囲の基準となる基準線が水平線７０の場合で説明したが、基準線は水平線７０に限らない。例えば、図２２に示した画像１１１において、垂直方向（Ｚ軸矢印方向）の長さＺ０の中心を通り、水平方向（Ｘ軸矢印方向）に平行な線を基準線としてもよい。通常、カメラ６０の画角の中心付近に水平線７０が位置するからである。この場合、前処理手段１０は水平線７０の検出処理を行う必要がない。

【0065】

また、上述の実施の形態１においては、物体検出処理の対象となる画像データがカメラ６０から入力される場合で説明したが、画像データは、データサーバ等の外部装置（不図示）からネットワークを介して情報処理装置１に入力されてもよい。

【0066】

さらに、上述の実施の形態１においては、情報処理装置１がモデル作成手段２１を備えている場合で説明したが、情報処理装置１は必ずしもモデル作成手段２１を備えていなくてもよい。例えば、モデル作成手段２１がサーバ等の外部装置（不図示）に設けられ、外部装置と情報処理装置１とが通信できるように接続されていればよい。

【0067】

本実施の形態１の情報処理装置１は、長手方向よりも長手方向に直交する短手方向の長さが短い形状を有する物体の画像を含む画像データから物体を検出する物体検出手段２２と、前処理手段１０とを有する。前処理手段１０は、長手方向よりも短手方向の長さが短い形状を有する物体の画像を含む画像データが入力されると、画像データを短手方向に拡大した拡大画像データを生成する。物体検出手段２２は、前処理手段１０によって生成された拡大画像データに対して、特徴マップを生成する畳み込み処理および特徴マップを縮小するプーリング処理の組み合わせ処理を行って画像データが示す画像に含まれる物体を検出する。

【0068】

比較例の情報処理装置１００は、多段の畳み込み処理により船の特徴を抽出する画像認識モデルを画像認識モデル作成処理により作成し、作成した画像認識モデルを用いて、海上で撮影された風景の画像に対して船を検出している。この場合、石油タンカーのように船体の露出部分が薄く、横の長さと縦の長さとのアスペクト比が大きな物体は、畳み込みニューラルネットワークによる演算処理において、早い段階でプーリング処理の画像縮小により物体のサイズが小さくなってしまう。そのため、アスペクト比の大きい物体は、十分な特徴量を持つと判断されず、船として検出されない。

【0069】

これに対し、本実施の形態１によれば、特徴量を抽出する処理が行われる前の画像データにおいて、検出対象の物体の短手方向の長さが拡大されるため、プーリング処理において物体の短手方向の特徴が消失することが抑制される。そのため、長手方向の長さと短手方向の長さとの比が大きい物体を検出する精度を向上させることができる。

【0070】

本実施の形態１において、検出対象の物体が船である場合、船は水平線に平行な横長な形状を有するが、水平線から船の露出部分の垂直方向の長さが拡大されるため、プーリング処理において船の露出部分の特徴が消失することが抑制される。その結果、船の検出精度を大幅に改善することができる。

【0071】

一方、画像認識モデル作成処理において、船体の露出部分について水平線から垂直方向の長さを種々変更した学習画像を有するデータセットを追加して、石油タンカーのような船の検出率を向上させることも考えられる。しかし、検出精度を上げようとすると、多くの学習画像を準備しなければならない。

【0072】

これに対して、本実施の形態１の情報処理装置１においては、船の検出対象の画像を船体の短手方向に引き伸ばすだけで検出精度が向上するため、船体の水平線から垂直方向の長さが異なる多くの学習画像を用いて画像認識モデル作成処理を行う必要がない。

【0073】

また、本実施の形態１において、メモリ３１が画像データの基準画像データとして、船の画像を含まない参照画像データを記憶し、前処理手段１０は、参照画像データと画像データとの差分を求め、求めた差分画像データを用いて拡大画像データを生成してもよい。この場合、検出処理対象の画像データが示す画像に、船体の形状に近似した横長の構造物が含まれていても、その構造物が差分画像データから除かれるため、船の検出精度が向上する。

【0074】

また、本実施の形態１において、前処理手段１０は、画像データに対して、水平線を検出し、水平線を基準にして短手方向の予め決められた幅の画像データに対して拡大画像データを生成してもよい。この場合、画像データを一時的に保存するためのフレームメモリの使用容量を増やさずに済む。

【0075】

さらに、本実施の形態１で説明した情報処理装置１を船舶が備えていてもよい。情報処理装置１を備える船舶は、例えば、コンテナ船、石油タンカー、自動車運搬船、客船およびＬＮＧ運搬船である。情報処理装置１を備える船舶の種類は限定されない。船舶が情報処理装置１を備えている場合、船員の監視負荷を低減するとともに、衝突事故の防止を図ることができる。

【0076】

なお、本実施の形態１において、重力方向に垂直な長手方向に対して重力方向に平行な短手方向の形状を有する場合について説明したが、重力方向に垂直な短手方向に対して重力方向に平行な長手方向の形状を有する場合にも本実施の形態１を適用できる。

【0077】

例えば、コンピュータが道路の状況を認識して自動車を運転する自動運転技術に、本実施の形態１の情報処理方法を適用してもよい。電信柱および歩行者に比べて、標識およびミラーを支持するポールは直径が小さい。本実施の形態１の情報処理方法を適用した自動運転技術によって、標識およびミラーを支持するポールのように細い物体も検出できるようになる。

【0078】

また、本実施の形態１において図１７を参照して説明した情報処理方法をコンピュータに実行させるためのプログラムを、記録媒体に記録してもよく、ネットワークを介して他の情報処理装置にインストールしてもよい。記録媒体は、例えば、磁気ディスクおよび光学ディスクである。光学ディスクは、例えば、ＣＤ（ＣｏｍｐａｃｔＤｉｓｃ）およびＤＶＤ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｃ）である。記録媒体は、フラッシュメモリ等の半導体メモリが搭載されたＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリであってもよい。

【符号の説明】

【0079】

１情報処理装置、２処理部、３記憶部、１０前処理手段、１１畳み込み処理手段、１２プーリング手段、１３結合手段、１４出力手段、２１モデル作成手段、２２物体検出手段、３１メモリ、３２ＧＰＵ、６０カメラ、６１レンズ、６２撮像部、６３Ａ／Ｄ変換部、７０水平線、７１ａ～７１ｅ船体、７２ａ上部構造物、７３ａ～７３ｃブリッジ、７３ｄ、７３ｅブリッジ棟、７４客室棟、７５コンテナ、７６タンク、８１～８５画像、９０～９２画像、１００情報処理装置、１１１画像、１１２破線枠、１１３画像、１２０処理部、１３０記憶部、１５０岸壁。

【図1】