(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-17
(45)【発行日】2024-09-26
(54)【発明の名称】情報処理システム、情報処理方法、及び記録媒体
(51)【国際特許分類】
G06N 3/08 20230101AFI20240918BHJP
【FI】
G06N3/08
(21)【出願番号】P 2023510239
(86)(22)【出願日】2021-12-17
(86)【国際出願番号】 JP2021046803
(87)【国際公開番号】W WO2022209048
(87)【国際公開日】2022-10-06
【審査請求日】2023-07-18
(31)【優先権主張番号】P 2021057842
(32)【優先日】2021-03-30
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100104765
【氏名又は名称】江上 達夫
(74)【代理人】
【識別番号】100107331
【氏名又は名称】中村 聡延
(74)【代理人】
【識別番号】100131015
【氏名又は名称】三輪 浩誉
(72)【発明者】
【氏名】高本 亮
【審査官】真木 健彦
(56)【参考文献】
【文献】中国特許出願公開第111951195(CN,A)
【文献】中国特許出願公開第106991648(CN,A)
【文献】中国特許出願公開第111047541(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00 - 99/00
G06T 5/50
(57)【特許請求の範囲】
【請求項1】
特徴量を入力する入力手段と、
前記特徴量に離散ウェーブレット変換を実行する変換手段と、
前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解する分解手段と、
前記第1周波数成分に対して畳み込み処理を行う第1処理手段と、
前記第2周波数成分に対して畳み込み処理を行う第2処理手段と、
前記離散ウェーブレット変換の結果に対して畳み込み処理を行う第3処理手段と、
前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、
前記離散ウェーブレット変換の結果の畳み込み処理の結果と、を統合して統合情報を生成する統合手段と、
前記統合情報を出力する出力手段と、
を備えることを特徴とする情報処理システム。
【請求項2】
前記第1周波数成分は、所定閾値よりも周波数が高い高周波成分であり、
前記第2周波数成分は、前記所定閾値よりも周波数が低い低周波成分である、
ことを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記第1周波数成分の畳み込み処理の結果から、一部の成分を除去する除去手段を更に備え、
前記統合手段は、前記一部の成分を除去した前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、
前記離散ウェーブレット変換の結果の畳み込み処理の結果と、を統合する
ことを特徴とする請求項1
又は2に記載の情報処理システム。
【請求項4】
前記統合手段は、各畳み込み処理の結果を足し合わせることで前記統合情報を生成することを特徴
とする請求項1から
3のいずれか一項に記載の情報処理システム。
【請求項5】
前記統合手段は、各畳み込み処理の結果を掛け合わせることで前記統合情報を生成することを特徴
とする請求項1から
3のいずれか一項に記載の情報処理システム。
【請求項6】
前記統合手段は、各畳み込み処理の結果を連結することで前記統合情報を生成することを特徴
とする請求項1から
3のいずれか一項に記載の情報処理システム。
【請求項7】
前記統合手段は、各畳み込み処理の結果を注意機構で統合して前記統合情報を生成することを特徴とする請求項1から
3のいずれか一項に記載の情報処理システム。
【請求項8】
特徴量を入力し、
前記特徴量に離散ウェーブレット変換を実行し、
前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解し、
前記第1周波数成分に対して畳み込み処理を行い、
前記第2周波数成分に対して畳み込み処理を行い、
前記離散ウェーブレット変換の結果に対して畳み込み処理を行い、
前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、
前記離散ウェーブレット変換の結果の畳み込み処理の結果と、を統合して統合情報を生成し、
前記統合情報を出力する、
ことを特徴とする情報処理方法。
【請求項9】
特徴量を入力し、
前記特徴量に離散ウェーブレット変換を実行し、
前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解し、
前記第1周波数成分に対して畳み込み処理を行い、
前記第2周波数成分に対して畳み込み処理を行い、
前記離散ウェーブレット変換の結果に対して畳み込み処理を行い、
前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、
前記離散ウェーブレット変換の結果の畳み込み処理の結果と、を統合して統合情報を生成し、
前記統合情報を出力する、
ようにコンピュータを動作させることを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
この開示は、例えば深層学習に用いる情報を処理する情報処理システム、情報処理方法、及び記録媒体の技術分野に関する。
【背景技術】
【0002】
この種のシステムとして、ウェーブレット変換を用いて情報を変換するものが知られている。例えば特許文献1では、画像処理の帯域フィルタとして離散ウェーブレット変換を用いることが開示されている。特許文献2では、水平方向及び垂直方向に離散ウェーブレット分解を施すことで、フレーム画像を2次元周波数成分に分解することが開示されている。特許文献3では、画像データに対してウェーブレット変換を施し、複数の周波数帯域毎の画像を表す画像データを得ることが開示されている。
【0003】
その他の関連する技術として、例えば特許文献4では、DL-ANNネットワークの学習において、投影データを高周波成分と低周波成分とに分けることが開示されている。特許文献5では、複数の部分ニューラルネットワークからの出力を統合して学習を行うことが開示されている。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2019/172262号
【文献】特開2011-004343号公報
【文献】特開平11-272867号公報
【文献】特開2020-099662号公報
【文献】特開2020-030480号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
この開示は、先行技術文献に開示されたことを目的とする。
【課題を解決するための手段】
【0006】
この開示の情報処理システムの一の態様は、特徴量を入力する入力手段と、前記特徴量に離散ウェーブレット変換を実行する変換手段と、前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解する分解手段と、前記第1周波数成分に対して畳み込み処理を行う第1処理手段と、前記第2周波数成分に対して畳み込み処理を行う第2処理手段と、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合して統合情報を生成する統合手段と、前記統合情報を出力する出力手段と、を備える。
【0007】
この開示の情報処理方法の一の態様は、特徴量を入力し、前記特徴量に離散ウェーブレット変換を実行し、前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解し、前記第1周波数成分に対して畳み込み処理を行い、前記第2周波数成分に対して畳み込み処理を行い、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合して統合情報を生成し、前記統合情報を出力する。
【0008】
この開示の記録媒体の一の態様は、特徴量を入力し、前記特徴量に離散ウェーブレット変換を実行し、前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解し、前記第1周波数成分に対して畳み込み処理を行い、前記第2周波数成分に対して畳み込み処理を行い、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合して統合情報を生成し、前記統合情報を出力するようにコンピュータを動作させるコンピュータプログラムが記録されている。
【図面の簡単な説明】
【0009】
【
図1】第1実施形態に係る情報処理システムのハードウェア構成を示すブロック図である。
【
図2】第1実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図3】第1実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図4】第2実施形態に係る情報処理システムによる離散ウェーブレット変換の一例を示す概念図ある。
【
図5】第2実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図6】第3実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図7】第3実施形態に係る情報処理システムによる情報統合の一例を示す概念図である。
【
図8】第3実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図9】第4実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図10】第4実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【
図11】第5実施形態に係る情報処理システムによる情報統合の手法を示す概念図である。
【
図12】第6実施形態に係る情報処理システムによる情報統合の手法を示す概念図である。
【
図13】第7実施形態に係る情報処理システムによる情報統合の手法を示す概念図である。
【
図14】第8実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【
図15】第8実施形態の変形例に係る情報処理システムの機能的構成を示すブロック図である。
【
図16】第8実施形態に係る情報処理システムによる注意機構を用いた情報統合の一例を示す概念図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、情報処理システム、情報処理方法、、コンピュータプログラム、及び記録媒体の実施形態について説明する。
【0011】
<第1実施形態>
第1実施形態に係る情報処理システムについて、
図1から
図3を参照して説明する。
【0012】
(ハードウェア構成)
まず、
図1を参照しながら、第1実施形態に係る情報処理システム10のハードウェア構成について説明する。
図1は、第1実施形態に係る情報処理システムのハードウェア構成を示すブロック図である。
【0013】
図1に示すように、第1実施形態に係る情報処理システム10は、プロセッサ11と、RAM(Random Access Memory)12と、ROM(Read Only Memory)13と、記憶装置14とを備えている。情報処理システム10は更に、入力装置15と、出力装置16と、を備えていてもよい。プロセッサ11と、RAM12と、ROM13と、記憶装置14と、入力装置15と、出力装置16とは、データバス17を介して接続されている。
【0014】
プロセッサ11は、コンピュータプログラムを読み込む。例えば、プロセッサ11は、RAM12、ROM13及び記憶装置14のうちの少なくとも一つが記憶しているコンピュータプログラムを読み込むように構成されている。或いは、プロセッサ11は、コンピュータで読み取り可能な記録媒体が記憶しているコンピュータプログラムを、図示しない記録媒体読み取り装置を用いて読み込んでもよい。プロセッサ11は、ネットワークインタフェースを介して、情報処理システム10の外部に配置される不図示の装置からコンピュータプログラムを取得してもよい(つまり、読み込んでもよい)。プロセッサ11は、読み込んだコンピュータプログラムを実行することで、RAM12、記憶装置14、入力装置15及び出力装置16を制御する。本実施形態では特に、プロセッサ11が読み込んだコンピュータプログラムを実行すると、プロセッサ11内には、入力される特徴量を処理するための機能ブロックが実現される。また、プロセッサ11として、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(field-programmable gate array)、DSP(Demand-Side Platform)、ASIC(Application Specific Integrated Circuit)のうち一つを用いてもよいし、複数を並列で用いてもよい。
【0015】
RAM12は、プロセッサ11が実行するコンピュータプログラムを一時的に記憶する。RAM12は、プロセッサ11がコンピュータプログラムを実行している際にプロセッサ11が一時的に使用するデータを一時的に記憶する。RAM12は、例えば、D-RAM(Dynamic RAM)であってもよい。
【0016】
ROM13は、プロセッサ11が実行するコンピュータプログラムを記憶する。ROM13は、その他に固定的なデータを記憶していてもよい。ROM13は、例えば、P-ROM(Programmable ROM)であってもよい。
【0017】
記憶装置14は、情報処理システム10が長期的に保存するデータを記憶する。記憶装置14は、プロセッサ11の一時記憶装置として動作してもよい。記憶装置14は、例えば、ハードディスク装置、光磁気ディスク装置、SSD(Solid State Drive)及びディスクアレイ装置のうちの少なくとも一つを含んでいてもよい。
【0018】
入力装置15は、情報処理システム10のユーザからの入力指示を受け取る装置である。入力装置15は、例えば、キーボード、マウス及びタッチパネルのうちの少なくとも一つを含んでいてもよい。
【0019】
出力装置16は、情報処理システム10に関する情報を外部に対して出力する装置である。例えば、出力装置16は、情報処理システム10に関する情報を表示可能な表示装置(例えば、ディスプレイ)であってもよい。
【0020】
(機能的構成)
次に、
図2を参照しながら、第1実施形態に係る情報処理システム10の機能的構成について説明する。
図2は、第1実施形態に係る情報処理システムの機能的構成を示すブロック図である。
【0021】
図2に示すように、第1実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、特徴量入力部110と、離散ウェーブレット変換部120と、分解部130と、第1処理部140と、第2処理部150と、統合部160と、出力部170と、を備えて構成されている。特徴量入力部110、離散ウェーブレット変換部120、分解部130、第1処理部140、第2処理部150、統合部160、及び出力部170の各々は、例えば上述したプロセッサ11において実現されてよく、より具体的には、ニューラルネットワークの一部として構成されてよい。
【0022】
特徴量入力部110は、特徴量を入力可能に構成されている。言い換えれば、特徴量入力部110は、特徴量を取得可能に構成されている。特徴量は、例えば画像から抽出される特徴量であってよい。より具体的には、特徴量は、画像に含まれる生体の特定部位(例えば、顔や目)に対応する特徴量であってよい。
【0023】
離散ウェーブレット変換部120は、特徴量入力部110が入力する特徴量に対して、離散ウェーブレット変換を実行可能に構成されている。なお、離散ウェーブレット変換については、既存の技術を適宜採用することができるため、ここでの詳しい説明は省略する。
【0024】
分解部130は、離散ウェーブレット変換の結果(即ち、特徴量を変換した情報)を、第1周波数成分と、第2周波数成分と、に分解可能に構成されている。第1周波数成分及び第2周波数成分の周波数帯域は、予め設定されていればよい。
【0025】
第1処理部140は、分解部130で分解された第1周波数成分に対して畳み込み処理を実行可能に構成されている。第1処理部140は、第1周波数成分に対して、1回だけ畳み込み処理を行ってもよいし、複数回畳み込み処理を行ってもよい。また、畳込み処理の後に、非線形関数の作用、正規化等の処理を行ってもよい。これらの処理(即ち、非線形関数の作用、正規化等)は、以降で説明するすべての畳込み処理の後で実行されてもよい。
【0026】
第2処理部150は、分解部130で分解された第2周波数成分に対して畳み込み処理を実行可能に構成されている。第2処理部150は、第2周波数成分に対して、1回だけ畳み込み処理を行ってもよいし、複数回畳み込み処理を行ってもよい。
【0027】
なお、上述した構成では、第1処理部140が第1周波数成分に対して畳み込み処理を実行し、第2処理部150が第2周波数成分に対して畳み込み処理を実行しているが、これらの処理が1つの処理部によって実行されるようにしてもよい。具体的には、第1処理部140及び第2処理部150の機能を統合した1つの処理部が、第1周波数成分に対する畳込み処理と、第2周波数成分に対する畳込み処理と、をそれぞれ実行可能に構成されていてもよい。
【0028】
統合部160は、第1処理部140の畳み込み処理の結果(即ち、第1周波数成分に対して畳み込み処理を行ったもの)と、第2処理部150の畳み込み処理の結果(即ち、第2周波数成分に対して畳み込み処理を行ったもの)と、を統合して統合情報を生成可能に構成されている。なお、統合手法については、特に限定されるものではない。統合手法の具体例については、後述する他の実施形態において詳しく説明する。
【0029】
出力部170は、統合部160で生成した統合情報を出力可能に構成されている。統合情報は、上述したように、特徴量入力部110が入力する特徴量に各種処理を行うことで得られる情報として出力される。統合情報は、ニューラルネットワークの深層学習に用いる情報として出力されてよい。
【0030】
(動作の流れ)
次に、
図3を参照しながら、第1実施形態に係る情報処理システム10の動作の流れについて説明する。
図3は、第1実施形態に係る情報処理システムの動作の流れを示すフローチャートである。
【0031】
図3に示すように、第1実施形態に係る情報処理システム10が動作する際には、まず特徴量入力部110が特徴量を入力する(ステップS101)。入力された特徴量は、離散ウェーブレット変換部120に出力される。そして、離散ウェーブレット変換部120が、入力された特徴量に離散ウェーブレット変換を行う(ステップS102)。離散ウェーブレットの変換結果は、分解部130に出力される。
【0032】
続いて、分解部130が、離散ウェーブレット変換部120の変換結果を、第1周波数成分と、第2周波数成分と、に分解する(ステップS103)。第1周波数成分は、第1処理部140に出力される。第2周波数成分は、第2処理部150に出力される。
【0033】
続いて、第1処理部140が、第1周波数成分に対して畳み込み処理を実行する(ステップS104)。また、第2処理部150が、第2周波数成分に対して畳み込み処理を実行する(ステップS105)。なお、ステップS104及びS105の処理は、互いに前後して実行されてもよいし、同時に並行して実行されてもよい。第1処理部140及び第2処理部150の処理結果は、それぞれ統合部160に出力される。
【0034】
続いて、統合部160が、第1処理部140の処理結果と、第2処理部150の処理結果とを統合して統合情報を生成する(ステップS106)。そして、出力部170が、統合部160で生成した統合情報を出力する(ステップS107)。
【0035】
(技術的効果)
次に、第1実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0036】
図1から
図3で説明したように、第1実施形態に係る情報処理システム10では、離散ウェーブレット変換によって得られる第1周波数成分及び第2周波数成分の各々に対して畳み込み処理が実行され、その後それらが統合されて統合情報として出力される。このようにすれば、第1周波数成分及び第2周波数成分の各々が保持されるため、例えば単純にダウンサンプリングした場合と比較すると、より精度の高い情報を出力することができる。また、第1周波数成分及び第2周波数成分で別々に畳み込み処理を行ってから統合しているため、通常の畳み込み処理を行った場合と比較すると、メモリコストの増大を抑制しつつ、高品質な出力(中間特徴量)を得ることができる。なお、このような技術的効果は、例えばDNN(Deep Neural Network)の入力に近い層で使用することで顕著に発揮される(例えば、元の解像度に同じチャンネル数の畳込み処理を作用させた場合、メモリコストを1/4に削減できる)。
【0037】
<第2実施形態>
第2実施形態に係る情報処理システム10について、
図4及び
図5を参照して説明する。なお、第2実施形態は、上述した第1実施形態と比べて一部の動作が異なるのみで、その構成等については、第1実施形態(
図1及び
図2参照)と同一であってよい。このため、以下では、すでに説明した第1実施形態と重複する部分について適宜説明を省略するものとする。
【0038】
(離散ウェーブレット変換)
まず、
図4を参照しながら、第2実施形態に係る情報処理システム10による離散ウェーブレット変換について具体的に説明する。
図4は、第2実施形態に係る情報処理システムによる離散ウェーブレット変換の一例を示す概念図ある。
【0039】
図4に示すように、第2実施形態に係る情報処理システム10は、オリジナルデータ(即ち、特徴量入力部110が入力する特徴量)を離散ウェーブレット変換した結果を、高周波成分(第1実施形態の第1周波数成分に相当)と、低周波成分(第1実施形態の第2周波数成分に相当)と、に分解する。高周波成分は、例えばウェーブレット関数であってよい。また、低周波成分は、例えばスケーリング関数であってよい。
【0040】
(動作の流れ)
次に、
図5を参照しながら、第2実施形態に係る情報処理システム10の動作の流れについて説明する。
図5は、第2実施形態に係る情報処理システムの動作の流れを示すフローチャートである。なお、
図5では、
図3で示した処理と同様の処理に同一の符号を付している。
【0041】
図5に示すように、第2実施形態に係る情報処理システム10が動作する際には、まず特徴量入力部110が特徴量を入力する(ステップS101)。そして、離散ウェーブレット変換部120が、入力された特徴量に離散ウェーブレット変換を行う(ステップS102)。
【0042】
続いて、分解部130が、離散ウェーブレット変換部120の変換結果を、高周波成分と、低周波成分と、に分解する(ステップS201)。高周波成分は、第1処理部140に出力される。第2周波数成分は、第2処理部150に出力される。
【0043】
続いて、第1処理部140が、高周波成分に対して畳み込み処理を実行する(ステップS202)。また、第2処理部150が、低周波成分に対して畳み込み処理を実行する(ステップS203)。なお、ステップS202及びS203の処理は、互いに前後して実行されてもよいし、同時に並行して実行されてもよい。
【0044】
続いて、統合部160が、第1処理部140の処理結果(即ち、高周波成分に対する処理結果)と、第2処理部150の処理結果(即ち、低周波成分に対する処理結果)と、を統合して統合情報を生成する(ステップS204)。そして、出力部170が、統合部160で生成した統合情報を出力する(ステップS107)。
【0045】
(技術的効果)
次に、第2実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0046】
図4及び
図5で説明したように、第2実施形態に係る情報処理システム10では、離散ウェーブレット変換の結果が高周波成分と低周波成分に分解され、それら各々に対して畳み込み処理が実行された後に統合される。このようにすれば、画像の低レベル特徴量を示す高周波成分が保持されるため、例えば高周波成分をカットする場合と比較すると、より精度の高い情報を出力することができる。また、高周波成分及び低周波成分で別々に畳み込み処理を行ってから統合しているため、メモリコストの増大を抑制しつつ、高品質な出力(中間特徴量)を得ることができる。なお、第2実施形態に係る技術的効果は、例えば視線検出等の低レベル特徴量(例えば、目尻の位置等)が重要な処理において顕著に発揮される。
【0047】
以下の実施形態では、上述した第2実施形態の構成(即ち、離散ウェーブレット変換の結果が、高周波成分と低周波成分とに分解される構成)を前提にして説明を進める。
【0048】
<第3実施形態>
第3実施形態に係る情報処理システム10について、
図6から
図8を参照して説明する。なお、第3実施形態は、上述した第1及び第2実施形態と比べて一部の構成及び動作が異なるのみで、その他の部分については第1及び第2実施形態と同一であってよい。このため、以下では、すでに説明した実施形態と重複する部分について適宜説明を省略するものとする。
【0049】
(機能的構成)
まず、
図6を参照しながら、第3実施形態に係る情報処理システム10の機能的構成について説明する。
図6は、第3実施形態に係る情報処理システムの機能的構成を示すブロック図である。なお、
図6では、
図2で示した構成要素と同様の要素に同一の符号を付している。
【0050】
図6に示すように、第3実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、特徴量入力部110と、離散ウェーブレット変換部120と、分解部130と、第1処理部140と、第2処理部150と、統合部160と、出力部170と、第3処理部180と、を備えて構成されている。即ち、第3実施形態に係る情報処理システム10は、第1実施形態の構成(
図2参照)に加えて、第3処理部180を更に備えて構成されている。
【0051】
第3処理部180は、離散ウェーブレット変換の結果に対して畳み込み処理を実行可能に構成されている。即ち、第3処理部180は、分解部130で分解される前の高周波成分(第1周波数成分)及び低周波成分(第2周波数成分)の両方に対して畳み込み処理を実行可能に構成されている。第3処理部180は、離散ウェーブレット変換の結果に対して、1回だけ畳み込み処理を行ってもよいし、複数回畳み込み処理を行ってもよい。
【0052】
なお、第3処理部180の出力結果は、統合部160に出力される構成となっている。第3実施形態に係る統合部130は、第1処理部140の処理結果と、第2処理部150の処理結果と、第3処理部180の処理結果と、を統合可能に構成されている。
【0053】
(統合例)
次に、
図7を参照しながら、第3実施形態に係る情報処理システム10による統合例(即ち、統合部160の動作)について説明する。
図7は、第3実施形態に係る情報処理システムによる情報統合の一例を示す概念図である。
【0054】
図7に示すように、オリジナルデータから得られた高周波成分と低周波成分とでは、それぞれ別々に畳み込み処理が実行される(図中の下方向の矢印参照)。そして、第3実施形態では特に、高周波成分及び低周波成分の両方(全チャンネル)に対して、分解することなく畳み込み処理が実行される(図中の上方向の矢印参照)。これらの各畳み込み処理の結果は、統合部160において統合される。即ち、高周波成分に対して畳み込み処理を行ったものと、低周波成分に対して畳み込み処理を行ったものと、高周波成分及び低周波成分の両方に対して畳み込み処理を行ったものと、が統合される。なお、これら3つの結果を統合する具体的な手法については、後述する他の実施形態において詳しく説明する。
【0055】
(動作の流れ)
次に、
図8を参照しながら、第3実施形態に係る情報処理システム10の動作の流れについて説明する。
図8は、第3実施形態に係る情報処理システムの動作の流れを示すフローチャートである。なお、
図8では、
図5で示した処理と同様の処理に同一の符号を付している。
【0056】
図8に示すように、第3実施形態に係る情報処理システム10が動作する際には、まず特徴量入力部110が特徴量を入力する(ステップS101)。そして、離散ウェーブレット変換部120が、入力された特徴量に離散ウェーブレット変換を行う(ステップS102)。離散ウェーブレット変換の結果は、分解部130に加えて、第3処理部180にも出力される。
【0057】
続いて、分解部130が、離散ウェーブレット変換部120の変換結果を、高周波成分と、低周波成分と、に分解する(ステップS201)。高周波成分は、第1処理部140に出力される。第2周波数成分は、第2処理部150に出力される。
【0058】
続いて、第1処理部140が、高周波成分に対して畳み込み処理を実行する(ステップS202)。また、第2処理部150が、低周波成分に対して畳み込み処理を実行する(ステップS203)。更に、第3処理部180が、離散ウェーブレット変換部120の変換結果に対して畳み込み処理を実行する(ステップS301)。なお、ステップS202、S203、及びS301の処理は、互いに前後して実行されてもよいし、同時に並行して実行されてもよい。
【0059】
続いて、統合部160が、第1処理部140の処理結果(即ち、高周波成分に対する処理結果)と、第2処理部150の処理結果(即ち、低周波成分に対する処理結果)と、第3処理部180の処理結果(即ち、全チャンネルに対する処理結果)と、を統合して統合情報を生成する(ステップS302)。そして、出力部170が、統合部160で生成した統合情報を出力する(ステップS107)。
【0060】
(技術的効果)
次に、第3実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0061】
図6から
図8で説明したように、第3実施形態に係る情報処理システム10では、第1周波数成分及び第2周波数成分に対して別々に畳み込み処理を行ったものに加えて、第1周波数成分及び第2周波数成分の両方(即ち、分解前のもの)に畳み込み処理結果を行ったものが統合される。このようにすれば、統合の際に、高周波成分と低周波成分との相互作用を効率よく取り込むことができる。具体的には、第3処理部180の処理の結果が有する高周波成分と低周波成分との相互作用を用いて、より適切な統合が行える。その結果、統合部160の負担を軽減することができ、例えばニューラルネットワークの学習を容易に行うことが可能となる。
【0062】
以下の実施形態では、上述した第3実施形態の構成(即ち、第1処理部140、第2処理部150、及び第3処理部180の処理結果が統合される構成)を前提にして説明を進める。
【0063】
<第4実施形態>
第4実施形態に係る情報処理システム10について、
図9及び
図10を参照して説明する。なお、第4実施形態は、上述した第1から第3実施形態と比べて一部の構成及び動作が異なるのみで、その他の部分については第1から第3実施形態と同一であってよい。このため、以下では、すでに説明した実施形態と重複する部分については適宜説明を省略するものとする。
【0064】
(機能的構成)
まず、
図9を参照しながら、第4実施形態に係る情報処理システム10の機能的構成について説明する。
図9は、第4実施形態に係る情報処理システムの機能的構成を示すブロック図である。なお、
図9では、
図6で示した構成要素と同様の要素に同一の符号を付している。
【0065】
図9に示すように、第4実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、特徴量入力部110と、離散ウェーブレット変換部120と、分解部130と、第1処理部140と、第2処理部150と、統合部160と、出力部170と、第3処理部180と、ノイズ除去部190とを備えて構成されている。即ち、第4実施形態に係る情報処理システム10は、第3実施形態の構成(
図6参照)に加えて、第3処理部180を更に備えて構成されている。
【0066】
ノイズ除去部190は、高周波成分に対する畳み込み処理の結果から、一部の成分を除去可能に構成されている。具体的には、ノイズ除去部190は、高周波成分に対する畳み込み処理の結果から、ノイズに相当する高周波成分(即ち、高周波成分の高周波成分)を除去可能に構成されている。ノイズ除去部190は、例えば高周波成分に対する畳み込み処理の結果に、更に離散ウェーブレット変換やフーリエ変換を行って、その結果の高周波成分を除去する。或いは、ノイズ除去部190は、例えば高周波成分に対する畳み込み処理の結果に、ローパスフィルタをかけることで、その高周波成分を除去してもよい。
【0067】
(動作の流れ)
次に、
図10を参照しながら、第4実施形態に係る情報処理システム10の動作の流れについて説明する。
図10は、第4実施形態に係る情報処理システムの動作の流れを示すフローチャートである。なお、
図10では、
図8で示した処理と同様の処理に同一の符号を付している。
【0068】
図10に示すように、第4実施形態に係る情報処理システム10が動作する際には、まず特徴量入力部110が特徴量を入力する(ステップS101)。そして、離散ウェーブレット変換部120が、入力された特徴量に離散ウェーブレット変換を行う(ステップS102)。
【0069】
続いて、分解部130が、離散ウェーブレット変換部120の変換結果を、高周波成分と、低周波成分と、に分解する(ステップS201)。高周波成分は、第1処理部140に出力される。第2周波数成分は、第2処理部150に出力される。
【0070】
続いて、第1処理部140が、高周波成分に対して畳み込み処理を実行する(ステップS202)。そして第4実施形態では特に、高周波成分に対して畳み込み処理を実行した結果が、ノイズ除去部190に出力される。ノイズ除去部190は、高周波成分の畳み込み処理結果から、ノイズ成分を除去する(ステップS401)。
【0071】
他方、第2処理部150は、低周波成分に対して畳み込み処理を実行する(ステップS203)。また、第3処理部180は、離散ウェーブレット変換部120の変換結果に対して畳み込み処理を実行する(ステップS301)。
【0072】
続いて、統合部160が、高周波成分に対する処理結果(ノイズを除去したもの)と、第低周波成分に対する処理結果と、全チャンネルに対する処理結果と、を統合して統合情報を生成する(ステップS302)。そして、出力部170が、統合部160で生成した統合情報を出力する(ステップS107)。
【0073】
(技術的効果)
次に、第4実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0074】
図8及び
図9で説明したように、第4実施形態に係る情報処理システム10では、高周波成分の一部の成分(ノイズ成分)が除去される。このようにすれば、高周波成分に含まれるノイズを減らすことができるため、例えば脆弱性をついた攻撃(所謂、Adversarial Attack)等に対する頑健性、堅牢性を高めることができる。
【0075】
<第5実施形態>
第5実施形態に係る情報処理システム10について、
図11を参照して説明する。なお、第5実施形態は、上述した第1から第4実施形態に適用可能な統合手法の一例を説明するものであり、その構成や動作については第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した実施形態と重複する部分については適宜説明を省略するものとする。
(統合例)
まず、
図11を参照しながら、第5実施形態に係る情報処理システム10による統合手法について具体的に説明する。
図11は、第5実施形態に係る情報処理システムによる情報統合の手法を示す概念図である。
【0076】
図11に示すように、第5実施形態に係る統合部160は、高周波成分の畳み込み処理の結果(即ち、第1処理部140の処理結果)と、低周波成分の畳み込み処理の結果(即ち、第2処理部150の処理結果)と、全チャンネルの畳み込み処理の結果(即ち、第3処理部180の処理結果)と、を足し合わせることで統合する。
【0077】
例えば、統合部160は、全チャンネルの畳み込み処理の結果を「Conv(all)」、高周波成分の畳み込み処理の結果を「Conv(high)」、低周波成分の畳み込み処理の結果を「Conv(low)」とし、下記式(1)を用いて統合してよい。
【0078】
Conv(all)+C1×Conv(high)+C2×Conv(low)・・・(1)
【0079】
なお、C1及びC2は所定の係数であり、予め設定されていればよい。ここでは、Conv(high)及びConv(low)に係数が掛けられているが、Conv(high)及びConv(low)の一方のみに係数が掛けられてもよい。また、Conv(all)に係数が掛けられてもよい。
【0080】
(技術的効果)
次に、第5実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0081】
図11で説明したように、第5実施形態に係る情報処理システム10では、各畳み込み処理の結果を足し合わせることで統合情報が生成される。このようにすれば、比較的容易に統合情報を生成することができる。なお、上述した実施形態では、全チャンネルの畳み込み処理の結果を統合する(即ち、3つの処理結果を統合する)例を挙げたが、周波成分の畳み込み処理の結果と、低周波成分の畳み込み処理の結果と、を統合する(即ち、2つの処理結果を統合する)場合には、それら2つの結果を足し合わせて統合すればよい。
【0082】
<第6実施形態>
第6実施形態に係る情報処理システム10について、
図12を参照して説明する。なお、第6実施形態は、上述した第5実施形態と同様に、第1から第4実施形態に適用可能な統合手法の一例を説明するものであり、その構成や動作については第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した実施形態と重複する部分については適宜説明を省略するものとする。
(統合例)
まず、
図12を参照しながら、第6実施形態に係る情報処理システム10による統合手法について具体的に説明する。
図12は、第6実施形態に係る情報処理システムによる情報統合の手法を示す概念図である。
【0083】
図12に示すように、第6実施形態に係る統合部160は、高周波成分の畳み込み処理の結果(即ち、第1処理部140の処理結果)と、低周波成分の畳み込み処理の結果(即ち、第2処理部150の処理結果)と、全チャンネルの畳み込み処理の結果(即ち、第3処理部180の処理結果)と、を掛け合わせることで統合する。
【0084】
例えば、統合部160は、下記式(2)を用いて統合してよい。
【0085】
Conv(all)×Conv(high)+Conv(low)・・・(2)
【0086】
(技術的効果)
次に、第6実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0087】
図12で説明したように、第6実施形態に係る情報処理システム10では、各畳み込み処理の結果を掛け合わせることで統合情報が生成される。このようにすれば、比較的容易に統合情報を生成することができる。なお、上述した実施形態では、全チャンネルの畳み込み処理の結果を統合する(即ち、3つの処理結果を統合する)例を挙げたが、周波成分の畳み込み処理の結果と、低周波成分の畳み込み処理の結果と、を統合する(即ち、2つの処理結果を統合する)場合には、それら2つの結果を掛け合わせて統合すればよい。
【0088】
<第7実施形態>
第7実施形態に係る情報処理システム10について、
図13を参照して説明する。なお、第7実施形態は、上述した第5及び第6実施形態と同様に、第1から第4実施形態に適用可能な統合手法の一例を説明するものであり、その構成や動作については第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した実施形態と重複する部分については適宜説明を省略するものとする。
(統合例)
まず、
図13を参照しながら、第7実施形態に係る情報処理システム10による統合手法について具体的に説明する。
図13は、第7実施形態に係る情報処理システムによる情報統合の手法を示す概念図である。
【0089】
図13に示すように、第7実施形態に係る統合部160は、高周波成分の畳み込み処理の結果(即ち、第1処理部140の処理結果)と、低周波成分の畳み込み処理の結果(即ち、第2処理部150の処理結果)と、全チャンネルの畳み込み処理の結果(即ち、第3処理部180の処理結果)と、を連結することで統合する。
【0090】
例えば、統合部160は、[Conv(all),Conv(high),Conv(low)]のように、各畳み込み処理の結果を、チャンネル方向に繋げるようにして連結すればよい。
【0091】
(技術的効果)
次に、第7実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0092】
図13で説明したように、第7実施形態に係る情報処理システム10では、各畳み込み処理の結果を連結することで統合情報が生成される。このようにすれば、比較的容易に統合情報を生成することができる。なお、上述した実施形態では、全チャンネルの畳み込み処理の結果を統合する(即ち、3つの処理結果を統合する)例を挙げたが、周波成分の畳み込み処理の結果と、低周波成分の畳み込み処理の結果と、を統合する(即ち、2つの処理結果を統合する)場合には、それら2つの結果を連結して統合すればよい。
【0093】
<第8実施形態>
第8実施形態に係る情報処理システム10について、
図14から
図16を参照して説明する。なお、第8実施形態に係る情報処理システム10は、上述した第5から第7実施形態と同様に、第1から第4実施形態に適用可能な統合手法の一例を説明するものであり、主な構成や動作については第1から第4実施形態と同一であってよい。このため、以下では、すでに説明した実施形態と重複する部分については適宜説明を省略するものとする。
【0094】
(機能的構成)
まず、
図14及び
図15を参照しながら、第8実施形態に係る情報処理システム10の機能的構成について説明する。
図14は、第8実施形態に係る情報処理システムの機能的構成を示すブロック図である。
図15は、第8実施形態の変形例に係る情報処理システムの機能的構成を示すブロック図である。なお、
図14及び
図15では、
図6で示した構成要素と同様の要素に同一の符号を付している。
【0095】
図14に示すように、第8実施形態に係る情報処理システム10は、その機能を実現するための処理ブロックとして、特徴量入力部110と、離散ウェーブレット変換部120と、分解部130と、第1処理部140と、第2処理部150と、統合部160と、出力部170と、第3処理部180と、を備えて構成されている。そして特に、第8実施形態に係る統合部160は、アテンションマップ生成部161と、アテンション情報統合部162と、を備えている。
【0096】
アテンションマップ生成部161は、第1処理部140の結果(即ち、高周波成分の畳み込み処理結果)と、第3処理部180の結果(即ち、全チャンネルの畳み込み処理結果)と、に基づいてアテンションマップ(重要部分)を生成可能に構成されている。アテンションマップ生成部161で生成されたアテンションマップは、アテンション情報統合部162に出力される構成となっている。
【0097】
アテンション情報統合部162は、アテンションマップ生成部161で生成されたアテンションマップと、第2処理部150の結果(即ち、低周波成分の畳み込み処理結果)と、に基づいて統合情報を生成可能に構成されている。アテンションマップ情報統合部162で生成された統合情報は、出力部170に出力される構成となっている。
【0098】
図15に示すように、第8実施形態に係るアテンションマップ生成部161は、第1処理部140の結果(即ち、高周波成分の畳み込み処理結果)と、第2処理部150の結果(即ち、低周波成分の畳み込み処理結果)と、に基づいてアテンションマップ(重要部分)を生成可能に構成されていてもよい。この場合、アテンション情報統合部162は、アテンションマップ生成部161で生成されたアテンションマップと、第3処理部180の結果(即ち、全チャンネルの畳み込み処理結果)と、に基づいて統合情報を生成可能に構成されればよい。なお、アテンションマップ生成部161及びアテンション情報統合部162の構成は、
図14及び
図15の例に限られるものではない。
【0099】
(注意機構の動作)
次に、
図16を参照しながら、第8実施形態に係る注意機構(即ち、統合部160)の動作について説明する。
図16は、第8実施形態に係る情報処理システムによる注意機構を用いた情報統合の一例を示す概念図である。
【0100】
図16に示すように、第8実施形態に係る統合部160には、入力A(キー)、入力B(クエリ)、及び入力C(バリュー)が入力される。
【0101】
統合部160が動作する際には、まずアテンションマップ生成部161が、入力Aと入力Bとの行列積を計算することでアテンションマップを生成する。この際、入力A及び入力Bは、
図14で説明したように、第1処理部140の処理結果及び第3処理部180の処理結果(即ち、Conv(high),Conv(all)の組み合わせ)である。ただし、入力A及び入力Bは、それ以外の組み合わせであってもよい。具体的には、
図15で説明したように、入力A及び入力Bは、第1処理部140の処理結果及び第2処理部150の処理結果(即ち、Conv(high),Conv(low)の組み合わせ)であってもよい。また、図示は省略しているが、入力A及び入力Bは、第2処理部150の処理結果及び第3処理部180の処理結果(即ち、Conv(low),Conv(all)の組み合わせ)であってもよいし、いずれも第3処理部180の処理結果(即ち、Conv(all),Conv(all)の組み合わせ)であってもよい。
【0102】
続いて、アテンション情報統合部162は、アテンションマップと、第2処理部150の処理結果との行列式を計算する(具体的には、第2処理部150の処理結果に対して、アテンションマップとして算出された重要部分を重みとして掛ける)ことにより、統合情報を生成する。
【0103】
(技術的効果)
次に、第8実施形態に係る情報処理システム10によって得られる技術的効果について説明する。
【0104】
図14から
図16で説明したように、第8実施形態に係る情報処理システム10では、注意機構を用いて各畳み込み処理の結果が統合される。このようにすれば、特徴量における重要な部分を保持しつつ、統合情報を生成することが可能である。
【0105】
上述した各実施形態の機能を実現するように該実施形態の構成を動作させるプログラムを記録媒体に記録させ、該記録媒体に記録されたプログラムをコードとして読み出し、コンピュータにおいて実行する処理方法も各実施形態の範疇に含まれる。すなわち、コンピュータ読取可能な記録媒体も各実施形態の範囲に含まれる。また、上述のプログラムが記録された記録媒体はもちろん、そのプログラム自体も各実施形態に含まれる。
【0106】
記録媒体としては例えばフロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性メモリカード、ROMを用いることができる。また該記録媒体に記録されたプログラム単体で処理を実行しているものに限らず、他のソフトウェア、拡張ボードの機能と共同して、OS上で動作して処理を実行するものも各実施形態の範疇に含まれる。
【0107】
この開示は上記実施形態に限定されるものではない。この開示は、請求の範囲及び明細書全体から読み取ることのできる発明の要旨又は思想に反しない範囲で適宜変更可能であり、そのような変更を伴う情報処理システム、情報処理方法、コンピュータプログラム、及び記録媒体もまたこの開示の技術思想に含まれる。
【0108】
<付記>
以上説明した実施形態に関して、更に以下の付記のようにも記載されうるが、以下には限られない。
【0109】
(付記1)
付記1に記載の情報処理システムは、特徴量を入力する入力手段と、前記特徴量に離散ウェーブレット変換を実行する変換手段と、前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解する分解手段と、前記第1周波数成分に対して畳み込み処理を行う第1処理手段と、前記第2周波数成分に対して畳み込み処理を行う第2処理手段と、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合して統合情報を生成する統合手段と、前記統合情報を出力する出力手段と、を備えることを特徴とする情報処理システムである。
【0110】
(付記2)
付記2に記載の情報処理システムは、前記第1周波数成分は、所定閾値よりも周波数が高い高周波成分であり、前記第2周波数成分は、前記所定閾値よりも周波数が低い低周波成分である、ことを特徴とする付記1に記載の情報処理システムである。
【0111】
(付記3)
付記3に記載の情報処理システムは、前記離散ウェーブレット変換の結果に対して畳み込み処理を行う第3処理手段を更に備え、前記統合手段は、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、前記離散ウェーブレット変換の結果の畳み込み処理の結果と、を統合することを特徴とする付記1又は2に記載の情報処理システムである。
【0112】
(付記4)
付記4に記載の情報処理システムは、前記推定手段は、前記第1周波数成分の畳み込み処理の結果から、一部の成分を除去する除去手段を更に備え、前記統合手段は、前記一部の成分を除去した前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合することを特徴とする付記1から3のいずれか一項に記載の情報処理システムである。
【0113】
(付記5)
付記5に記載の情報処理システムは、前記統合手段は、各畳み込み処理の結果を足し合わせることで前記統合情報を生成することを特徴等する付記1から4のいずれか一項に記載の情報処理システムである。
【0114】
(付記6)
付記6に記載の情報処理システムは、前記統合手段は、各畳み込み処理の結果を掛け合わせることで前記統合情報を生成することを特徴等する付記1から4のいずれか一項に記載の情報処理システムである。
【0115】
(付記7)
付記7に記載の情報処理システムは、前記統合手段は、各畳み込み処理の結果を連結することで前記統合情報を生成することを特徴等する付記1から4のいずれか一項に記載の情報処理システムである。
【0116】
(付記8)
付記8に記載の情報処理システムは、前記統合手段は、各畳み込み処理の結果を注意機構で統合して前記統合情報を生成することを特徴とする付記1から4のいずれか一項に記載の情報処理システムである。
【0117】
(付記9)
付記9に記載の情報処理方法は、特徴量を入力し、前記特徴量に離散ウェーブレット変換を実行し、前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解し、前記第1周波数成分に対して畳み込み処理を行い、前記第2周波数成分に対して畳み込み処理を行い、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合して統合情報を生成し、前記統合情報を出力する、ことを特徴とする情報処理方法である。
【0118】
(付記10)
付記10に記載のコンピュータプログラムは、特徴量を入力し、前記特徴量に離散ウェーブレット変換を実行し、前記離散ウェーブレット変換の結果を、第1周波数成分と第2周波数成分とに分解し、前記第1周波数成分に対して畳み込み処理を行い、前記第2周波数成分に対して畳み込み処理を行い、前記第1周波数成分の畳み込み処理の結果と、前記第2周波数成分の畳み込み処理の結果と、を統合して統合情報を生成し、前記統合情報を出力する、ようにコンピュータを動作させることを特徴とするコンピュータプログラムである。
【0119】
(付記11)
付記11に記載の記録媒体は、付記10に記載のコンピュータプログラムを記録していることを特徴とする記録媒体である。
【0120】
法令で許容される限りにおいて、この出願は、2021年3月30日に出願された日本出願特願2021-057842を基礎とする優先権を主張し、その開示の全てをここに取り込む。また、法令で許容される限りにおいて、本願明細書に記載された全ての公開公報及び論文をここに取り込む。
【符号の説明】
【0121】
10 情報処理システム
11 プロセッサ
110 特徴量入力部
120 離散ウェーブレット変換部
130 分解部
140 第1処理部
150 第2処理部
160 統合部
161 アテンションマップ生成部
162 アテンション情報統合部
170 出力部
180 第3処理部
190 ノイズ除去部