(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023183077
(43)【公開日】2023-12-27
(54)【発明の名称】制御装置、制御装置の制御方法、及びプログラム
(51)【国際特許分類】
G10L 25/51 20130101AFI20231220BHJP
G10L 25/18 20130101ALI20231220BHJP
G10L 25/24 20130101ALI20231220BHJP
G10L 25/30 20130101ALI20231220BHJP
G01M 99/00 20110101ALI20231220BHJP
G01H 17/00 20060101ALI20231220BHJP
【FI】
G10L25/51
G10L25/18
G10L25/24
G10L25/30
G01M99/00 Z
G01H17/00 Z
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022096498
(22)【出願日】2022-06-15
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110001243
【氏名又は名称】弁理士法人谷・阿部特許事務所
(72)【発明者】
【氏名】原田 啓二
【テーマコード(参考)】
2G024
2G064
【Fターム(参考)】
2G024CA13
2G024FA01
2G024FA06
2G024FA11
2G064AB02
2G064AB13
2G064BA02
2G064BD02
2G064CC02
2G064CC42
2G064CC43
2G064DD02
(57)【要約】
【課題】音認識の速度を向上させること。
【解決手段】検査対象の動作音を検査する制御装置であって、検査対象の動作音を収音した収音データを取得する取得手段と、収音データを基にスペクトラムデータを生成する第一生成手段と収音データを基にケプストラムデータを生成する第二生成手段と、スペクトラムデータおよびケプストラムデータを合成し、合成データを生成する第三生成手段と、合成データを基に検査対象の動作音に所定の音が含まれるかどうか判定する判定手段と、を備えることを特徴とする。
【選択図】
図4
【特許請求の範囲】
【請求項1】
検査対象の動作音を検査する制御装置であって、
前記検査対象の動作音を収音した収音データを取得する取得手段と、
前記収音データを基にスペクトラムデータを生成する第一生成手段と、
前記収音データを基にケプストラムデータを生成する第二生成手段と、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、
前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定手段と、
を備えることを特徴とする制御装置。
【請求項2】
前記判定手段は、前記合成データを入力として前記所定の音が含まれるかを検出するように学習された学習済みモデルを用いて前記判定を行うことを特徴とする請求項1に記載の制御装置。
【請求項3】
前記学習済みモデルは、動作音を収音した収音データから生成されたスペクトラムデータおよびケプストラムデータを合成した合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて学習されていることを特徴とする請求項2に記載の制御装置。
【請求項4】
前記第一生成手段は、前記収音データに対し1回フーリエ変換を行うことにより前記スペクトラムデータを生成し、前記第二生成手段は、前記収音データに対し2回フーリエ変換を行うことにより前記ケプストラムデータを取得することを特徴とする請求項1に記載の制御装置。
【請求項5】
前記第三生成手段は、
前記スペクトラムデータの信号成分の強さを時間順に一辺がN、もう一辺がN/2の行列に並べ替え、
前記ケプストラムデータの信号成分の強さをケフレンシーの数値順に一辺がN、もう一辺がN/2の行列に並べ替え、
一辺がNである辺を互いに合わせN×Nの前記合成データを生成することを特徴とする請求項1に記載の制御装置。
【請求項6】
前記所定の音は、機械振動音であることを特徴とする請求項1に記載の制御装置。
【請求項7】
前記機械振動音は、ギアの可動モールド部材同士の嵌合不良により生じる周期性を持った異音であることを特徴とする請求項6に記載の制御装置。
【請求項8】
検査対象の動作音を検査するための制御装置の制御方法であって、
前記検査対象の動作音を示す収音データを取得する取得ステップと、
前記収音データを基にスペクトラムデータを生成する第一生成ステップと、
前記収音データを基にケプストラムデータを生成する第二生成ステップと、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成ステップと、
前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定ステップと、
を備えることを特徴とする制御装置の制御方法。
【請求項9】
検査対象の動作音を検査するための制御装置において動作することが可能なプログラムであって、前記制御装置を、
前記検査対象の動作音を示す収音データを取得する取得ステップと、
前記収音データを基にスペクトラムデータを生成する第一生成ステップと、
前記収音データを基にケプストラムデータを生成する第二生成ステップと、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成ステップと、
前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定ステップと、
として機能させることを特徴とするプログラム。
【請求項10】
検査対象の動作音を検査する学習済みモデルを作成する制御装置であって、
学習対象の動作音を示す収音データを取得する取得手段と、
前記収音データを基にスペクトラムデータを生成する第一生成手段と、
前記収音データを基にケプストラムデータを生成する第二生成手段と、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、
前記合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて前記所定の音が含まれるかを検出するように前記学習済みモデルを作成する学習手段と、
を備えることを特徴とする制御装置。
【請求項11】
検査対象の動作音を検査する学習済みモデルを作成する制御装置の制御方法であって、
学習対象の動作音を示す収音データを取得する取得ステップと、
前記収音データを基にスペクトラムデータを生成する第一生成ステップと、
前記収音データを基にケプストラムデータを生成する第二生成ステップと、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成ステップと、
前記合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて前記所定の音が含まれるかを検出するように前記学習済みモデルを作成する学習ステップと、
を備えることを特徴とする制御装置の制御方法。
【請求項12】
検査対象の動作音を検査する学習済みモデルを作成する制御装置において動作することが可能なプログラムでであって、前記制御装置を
学習対象の動作音を示す収音データを取得する取得手段と、
前記収音データを基にスペクトラムデータを生成する第一生成手段と、
前記収音データを基にケプストラムデータを生成する第二生成手段と、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、
前記合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて前記所定の音が含まれるかを検出するように前記学習済みモデルを作成する学習手段と、
として機能させることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音認識における技術に関する。
【背景技術】
【0002】
従来、ニューラルネットワークを用いた音声認識装置が提案されている。特許文献1では、音声データから、音声の特徴を表すスペクトラムデータおよびケプストラムデータを生成し、それらを学習データ、もしくは教師データとするニューラルネットワークを利用した音声認識装置が提案されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1では、スペクトラムデータで判別できるがケプストラムデータで判別できない音声、あるいはその反対のような音声を認識する場合、それぞれのデータから推論を行う必要がある。即ち、スペクトラムデータまたはケプストラムデータを一つずつニューラルネットワークに入力し、その両方の出力から結果を判定する必要がある。
【0005】
そこで、本発明は、音認識の速度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
本発明の一様態に係る制御装置は、検査対象の動作音を検査する制御装置であって前記検査対象の動作音を収音した収音データを取得する取得手段と、前記収音データを基にスペクトラムデータを生成する第一生成手段と、前記収音データを基にケプストラムデータを生成する第二生成手段と、前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定手段と、を備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、音認識の速度を向上させることができる。
【図面の簡単な説明】
【0008】
【
図2】振動音検査装置のハードウェア構成を示す図である。
【
図3】振動音検査装置のソフトウェア構成を示す図である。
【
図6】収音データを基に作成したスペクトラムデータを示す図である。
【
図7】収音データを基に作成したケプストラムデータを示す図である。
【発明を実施するための形態】
【0009】
<実施形態1>
本実施形態は、音認識を用いた装置の例として、マルチファンクションインクジェットプリンタ(以下、MFP)生産工場において組み立て完了後の機械振動音検査を行う機械振動音検査装置について説明する。機械振動音とは、ギアなどの可動モールド部材同士の嵌合不良により生じる周期性を持った異音のことである。
【0010】
図1は本実施形態における振動音検査システムの概要を示す図である。本システムは、機械振動音検査装置(制御装置)100、機械振動音検査装置100と接続され動作音を取得するマイクロフォン(以下、マイクと呼ぶ)101、および振動音検査の検査対象であるMFP102を含んでいる。MFP102から動作音を発生させ、マイクロフォン101にて収音し、収音データを用いて機械振動音検査装置において音認識を行い、異音検出を行うためのシステムである。
【0011】
図2は、機械振動音検査装置100のハードウェアの主要な構成を示す図である。機械振動音検査装置100は、CPU201、ROM202、RAM203、GPU(グラフィックプロセッシングユニット)204、およびGPUメモリ205を備えている。また、機械振動音検査装置100は、ハードディスク装置206、操作部207、マイク101、アンプ208、およびネットワークインターフェース209を備えている。
【0012】
CPU201はメインボード全体を制御している。ROM202は電源の供給がない状態でもデータを保持しておくことができるメモリのことである。RAM203は、CPU201がワークメモリとして使用する。また、機械振動音検査装置100は外部に、ハードディスク装置206、または操作部207等を接続することが可能である。ネットワークインターフェース209は、LAN8により外部ネットワークと通信を行うためのインターフェイスである。
【0013】
機械振動音検査装置100は、GPU204と、GPU204がワークメモリとして使用するGPUメモリ205と、を含んでいる。GPU204は、各種演算処理をCPU201の代わりに実行させることが可能である。GPU204は、データをより多く並列処理することで効率的な演算を行うことができる。そのため、機械学習を用いた推論のような処理コストのかかる処理を行う場合にはGPU204で処理を行うことが有効である。また、CPUのような汎用的な用途にも使用することができる。本実施形態においてGPU204は、音認識の学習または推論等に使用される。
【0014】
本実施形態においてCPU201には、マイク101にて取得しアンプ208を用いて増大させた収音データに対し、フーリエ変換を行うためのFFT演算処理回路が備えられている。収音データはフーリエ変換によって音解析、音認識を行うためのデータに変換される。なお、FFT演算処理回路はGPU204が備えていてもよく、収音データのフーリエ変換はCPU201、GPU204のいずれが行ってもよい。
【0015】
図3は機械振動音検査装置100のソフトウェア構成を説明する図である。機械振動音検査装置100は、収音データ取得部301、スペクトラムデータ生成部302、ケプストラムデータ生成部303、データ合成部304、および機械振動音判定部305を備える。
【0016】
収音データ取得部301は、マイク101が取得しアンプ208によって増大させた収音データを取得する。スペクトラムデータ生成部302は、収音データ取得部301によって取得した収音データに対し、FFT演算処理回路を用いて1回フーリエ変換を行い、スペクトラムデータを生成する。
【0017】
ケプストラムデータ生成部303は、スペクトラムデータ生成部302によって生成したスペクトラムデータに対し、1回フーリエ変換を行うことでケプストラムデータを生成する。即ち、ケプストラムデータは、収音データ取得部301によって取得した収音データに対し、2回フーリエ変換したデータである。スペクトラムデータおよびケプストラムデータはいずれも収音データの解析をする際に用いられる。本実施形態においては、スペクトラムデータまたはケプストラムデータの個々のデータからのみ判別可能な機械振動音を判別するために両者のデータを用いて機械振動音検査を行う。
【0018】
データ合成部304は、スペクトラムデータ生成部302およびケプストラムデータ生成部303において生成したスペクトラムデータおよびケプストラムデータを合成し合成データを生成する。合成の処理の詳細は後述する。また、データ合成部304は、合成データを機械振動音判定部305に送信する。
【0019】
機械振動音判定部305は、合成データに機械振動音が含まれるかどうか判定する。本実施形態においては、判定に音認識の推論を用いる。以下、推論を用いた機械振動音検査のフローを説明していく。
【0020】
図4は機械振動音検査フローを示すフローチャートである。本実施形態において機械振動音検査装置は、MFP102の製造工場において、任意のMFPを組立ラインから外し、テスト動作を実行させ、動作音をマイク101より取得し、所定の機械振動音が検出されるかどうかを検査する。機械振動音が検出されるかどうかの判定には、機械振動音検査装置が備えるGPUによる学習または推論を用いる。学習または推論に用いられる入力データについては以下のフローチャートの説明にて後述する。
図4の各ステップのうちS405~S409における処理は、機械振動音検査装置100のCPU201が、RAM203に記憶されているプログラムコードを、ROM202に展開し実行することにより行われる。なお、各処理の説明における記号「S」は、当該フローチャートにおけるステップであることを意味する。
【0021】
まず、S401において、検査者によって任意のMFPであるMFP102が一台組立ラインから取り出される。次に、S402において、検査者によってMFP102が検査台に設置される。
【0022】
次に、S403において、検査者によって検査台に設置されたMFP102に電源が入れられ、機械振動音が発生しやすい特殊モードが実行される。S404において、機械振動音検査装置100は、その動作中の音を機械振動音検査装置100と接続されているマイク101で2秒間録音して、収音データ作成する。
【0023】
図5は、S404において作成された収音データを示す図である。具体的には、
図5はMFP102のスキャナユニット初期化動作音の収音データであり、音圧をサンプリングレート44.1kHzで収音したデータをプロットしたものである。本図においてX軸は時間を示し、Y軸は音の強さを示す。
【0024】
S405において、機械振動音検査装置100は収音データのスペクトラムデータを生成する。
【0025】
図6は、本実施形態のスペクトラムデータを示す図である。まず、
図6(a)は、本実施形態において取得した収音データを基に生成した収音データの3Dスペクトラムデータを示す。本図において、X軸は時間、Y軸は周波数、Z軸は信号の強さを示す。また、
図6(a)のスペクトラムデータから時間および信号成分の強さを取り出して2次元プロットしたものが
図6(b)である。なお、信号成分の強さは、白枠603に示す範囲で矢印602の方向に取り出したものである。
【0026】
さらに、
図6(b)に示す2次元プロットから信号成分の強さを取り出して、時間順に正方行列に並べ替えて画像化したものが
図6(c)である。
【0027】
図6(a)、(b)、および(c)を比較すると、
図6(c)は、各プロットの濃度が信号成分の強さに比例していることがわかる。例えば、
図6(b)の点Saは、
図6(c)の点Saとしてプロットされており、点Saは
図6(b)において信号の強さが最も大きいため、
図6(c)においてもっとも濃くプロットされている。また同様に、点Sbは、
図6(b)において点Saに次いで2番目に信号の強さが大きいことが示されており、
図6(c)においては、2番目に濃くプロットされている。
【0028】
なお、機械振動音がある場合は、
図6(c)において、濃度の高い縦のスジ(以下、縦スジ)が現れる。
図6(c)にはこの縦スジはない。
【0029】
次にS406において、機械振動音検査装置100は、S404にて取得した収音データからケプストラムデータを生成する。
【0030】
図7(a)は、
図6(a)のスペクトラムデータをフーリエ変換することで生成した3Dケプストラムデータを示す図である。X軸は時間、Y軸はケフレンシー(英: Quefrency)、Z軸は信号の強さを示す。このケプストラムデータからケフレンシーおよび信号成分の強さを取り出して2次元プロットしたものが
図7(b)である。なお、信号成分の強さは、白枠703に示す範囲で矢印702の方向に取り出したものである。
【0031】
さらに、
図7(b)に示す2次元プロットから信号成分の強さを取り出して、時間順に正方行列に並べ替えて画像化したものが
図7(c)である。
【0032】
図7(a)、(b)、および(c)を比較すると、
図7(c)は、各プロットの濃度が信号成分の強さに比例していることがわかる。例えば、
図7(b)の点Caは
図7(c)の点Caに示されている。また、
図7(b)の点Cbは
図7(c)の点Cbに示されている。なお、前述したように、機械振動音がある場合は濃度の高いことを示す縦スジが現れる。
図7(c)には縦スジ1~5が確認できるため、機械振動音があると判定される。
【0033】
S407において、機械振動音検査装置100は、スペクトラムデータおよびケプストラムデータを合成し合成データを生成する。
【0034】
図8は、前述した
図6(c)の2次元スペクトログラムと、
図7(c)の2次元ケプストログラムとを合成し画像化した図である。具体的には、
図6(c)のスペクトラムデータの信号成分の強さを、時間順に一辺がN(Nは任意の値)、もう一辺がN/2の行列に並べ替える。次に、
図7(c)のケプストラムデータの信号成分の強さを、ケフレンシーの数値順に一辺がN、もう一辺がN/2の行列に並べ替える。そして、上記2つのデータを、一辺がNの辺に合わせることでN×Nの合成データを生成する。なお、本実施形態では、例として1×1の合成データを生成している。
図8に示すように、合成データの右半分は
図6(c)のスペクトラムデータであり、左半分は、
図7(c)のケプストラムデータとなる。従って、上記の2つデータを合わせることでデータ同士は互いに干渉等の影響を及ぼすようなことはなく、振動音検査においてスペクトラムデータ、ケプストラムデータのそれぞれを単独の学習データとした場合と比べて出力結果への影響は考慮しなくてもよい。
【0035】
S408において、機械振動音検査装置100は、生成した合成データを学習済み畳み込みニューラルネットワーク(以下、CNN)に入力する。
【0036】
図9は、本実施形態に用いる学習モデルを利用する際の入出力の構造を示す概念図である。
図9(a)は、学習時における、学習モデル903とその入出力データとの関係を示す。学習時において用いられる学習用データは、入力データX(901)と教師データT(902)とを含む。入力データX(901)は、学習モデル903の入力層のデータである。本実施形態における入力データXは
図4のS407にて作成されるデータと同等のデータである。入力データXを機械学習モデルである学習モデル903に入力すると、学習モデル903が認識した結果として出力データY(904)が出力される。学習時には、入力データXの認識結果の正解データとして、異音があるかないかを示すデータである教師データT(902)が与えられる。出力データYと教師データTとを損失関数905に与えることにより、認識結果の正解からのずれ量L(906)が得られる。多数の学習用データに対してずれ量Lが小さくなるように、学習モデル903中のニューラルネットワークのノード間の結合重み付け係数等を更新する。機械学習の具体的なアルゴリズムとしては、最近傍法、ナイーブベイズ法、決定木、サポートベクターマシンなどが挙げられる。また、ニューラルネットワークを利用して、学習するための特徴量および結合重み付け係数を自ら生成する深層学習(ディープラーニング)も挙げられる。適宜、上記アルゴリズムのうち利用できるものを用いて本実施形態に適用することができる。例えば、リカレントニューラルネットワーク(RNN)として、Long short-term memory(LSTM)または双方向RNNなどを用いてもよい。さらにネットワーク構造として、複数のネットワーク構造を組み合わせたものを用いてもよい。例えば、畳み込みニューラルネットワーク(CNN)と、RNNもしくはLSTMなどの再帰型ニューラルネットワークまたはオートエンコーダなどとを組み合わせてもよい。
【0037】
図9(b)は、推論時における、学習済モデル908とその入出力データとの関係を示す。入力データX(907)は、学習済モデル908の入力層のデータである。本実施形態における入力データXは、上述した合成データである。入力データXを、機械学習モデルである学習済モデル908に入力すると、学習済モデル908が認識した結果として出力データY(909)が出力される。推論時には、この出力データYを推論結果として利用する。なお、推論時の学習済モデル908は、学習時の学習モデル903と同等のニューラルネットワークを備えるものとして説明したが、推論で必要な部分のみを抽出したものを学習済モデル908として用意することもできる。これによって学習済モデル908のデータ量を削減したり、推論時のニューラルネットワーク処理時間を短縮したりすることが可能である。
【0038】
図10は、本実施形態における学習済モデル908を用いた推論の流れを示す図である。まず、入力データ(即ち、合成データ)1001に第一の畳み込みフィルタ1011、及び第一のプーリングフィルタ1021をかけて第一の中間データ1003を生成する。次に、第一の中間データ1003に第二の畳み込みフィルタ1031、及び第二のプーリングフィルタ1041をかけて第二の中間データ1005を生成する。さらに第二の中間データ1005を第一の全結合層1006、次いで第二の全結合層1007にかけた後、出力1008を得る。
【0039】
S409において、ニューラルネットワークの出力に基づいて異音の有無を判定する。異音が有ると判定した場合は、S410においてMFP102を検査作業台から外して再調整を行った後、本検査フローをS402からやり直す。異音が無いと判定した場合はS411において、MFP102を組み立てラインに戻し、本フローを終了する。
【0040】
以上、説明したように、本実施形態によれば、音認識の速度を向上させることができる。即ち、収音データの解析に用いられるスペクトラムデータおよびケプストラムデータを合成したデータを用いて推論を行うことで、それぞれのデータで推論を行うよりも、時間を短縮することができる。
【0041】
<その他の実施形態>
実施形態1ではGPU204が音認識の学習または推論等を行う説明をしたが、これに限らず、例えば、CPU201を用いても構わない。また、GPUとCPUとが協働する形態があってもよい。または、ネットワークインターフェース209を用いて、合成データを外部に送信し、外部で音認識を行った結果を取得するような形態であってもよい。
【0042】
また、上述の実施形態では、機械振動音の検出に推論を用いたが、必ずしも学習モデルを用いる必要はない。例えば、機械振動音を数値化し、
図4のS409において予め設定された閾値を用いて、当該機械振動音の値を基にMFPの再調整が必要かどうか判定するような形態がであってもよい。
【0043】
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステムまたは装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。又、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0044】
また、本発明は以下の構成を含む。
【0045】
(構成1)
検査対象の動作音を検査する制御装置であって、
前記検査対象の動作音を収音した収音データを取得する取得手段と、
前記収音データを基にスペクトラムデータを生成する第一生成手段と、
前記収音データを基にケプストラムデータを生成する第二生成手段と、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、
前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定手段と、
を備えることを特徴とする制御装置。
【0046】
(構成2)
前記判定手段は、前記合成データを入力として前記所定の音が含まれるかを検出するように学習された学習済みモデルを用いて前記判定を行うことを特徴とする構成1に記載の制御装置。
【0047】
(構成3)
前記学習済みモデルは、動作音を収音した収音データから生成されたスペクトラムデータおよびケプストラムデータを合成した合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて学習されていることを特徴とする構成2に記載の制御装置。
【0048】
(構成4)
前記第一生成手段は、前記収音データに対し1回フーリエ変換を行うことにより前記スペクトラムデータを生成し、前記第二生成手段は、前記収音データに対し2回フーリエ変換を行うことにより前記ケプストラムデータを取得することを特徴とする構成1乃至3のいずれか一項に記載の制御装置。
【0049】
(構成5)
前記第三生成手段は、
前記スペクトラムデータの信号成分の強さを時間順に一辺がN、もう一辺がN/2の行列に並べ替え、
前記ケプストラムデータの信号成分の強さをケフレンシーの数値順に一辺がN、もう一辺がN/2の行列に並べ替え、
一辺がNである辺を互いに合わせN×Nの前記合成データを生成することを特徴とする構成1乃至4のいずれか一項に記載の制御装置。
【0050】
(構成6)
前記所定の音は、機械振動音であることを特徴とする構成1乃至5のいずれか一項に記載の制御装置。
【0051】
(構成7)
前記機械振動音は、ギアの可動モールド部材同士の嵌合不良により生じる周期性を持った異音であることを特徴とする構成6に記載の制御装置。
【0052】
(構成8)
検査対象の動作音を検査するための制御装置の制御方法であって、
前記検査対象の動作音を示す収音データを取得する取得ステップと、
前記収音データを基にスペクトラムデータを生成する第一生成ステップと、
前記収音データを基にケプストラムデータを生成する第二生成ステップと、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成ステップと、
前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定ステップと、
を備えることを特徴とする制御装置の制御方法。
【0053】
(構成9)
検査対象の動作音を検査するための制御装置において動作することが可能なプログラムであって、前記制御装置を、
前記検査対象の動作音を示す収音データを取得する取得ステップと、
前記収音データを基にスペクトラムデータを生成する第一生成ステップと、
前記収音データを基にケプストラムデータを生成する第二生成ステップと、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成ステップと、
前記合成データを基に前記検査対象の動作音に所定の音が含まれるかどうか判定する判定ステップと、
として機能させることを特徴とするプログラム。
【0054】
(構成10)
検査対象の動作音を検査する学習済みモデルを作成する制御装置であって、
学習対象の動作音を示す収音データを取得する取得手段と、
前記収音データを基にスペクトラムデータを生成する第一生成手段と、
前記収音データを基にケプストラムデータを生成する第二生成手段と、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、
前記合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて前記所定の音が含まれるかを検出するように前記学習済みモデルを作成する学習手段と、
を備えることを特徴とする制御装置。
【0055】
(構成11)
検査対象の動作音を検査する学習済みモデルを作成する制御装置の制御方法であって、
学習対象の動作音を示す収音データを取得する取得ステップと、
前記収音データを基にスペクトラムデータを生成する第一生成ステップと、
前記収音データを基にケプストラムデータを生成する第二生成ステップと、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成ステップと、
前記合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて前記所定の音が含まれるかを検出するように前記学習済みモデルを作成する学習ステップと、
を備えることを特徴とする制御装置の制御方法。
【0056】
(構成12)
検査対象の動作音を検査する学習済みモデルを作成する制御装置において動作することが可能なプログラムでであって、前記制御装置を
学習対象の動作音を示す収音データを取得する取得手段と、
前記収音データを基にスペクトラムデータを生成する第一生成手段と、
前記収音データを基にケプストラムデータを生成する第二生成手段と、
前記スペクトラムデータおよび前記ケプストラムデータを合成し、合成データを生成する第三生成手段と、
前記合成データと、前記合成データに所定の音が含まれるかを示す教師データと、を用いて前記所定の音が含まれるかを検出するように前記学習済みモデルを作成する学習手段と、
として機能させることを特徴とするプログラム。
【符号の説明】
【0057】
100 機械振動音検査装置
101 マイクロフォン
102 MFP
201 CPU
204 GPU