(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
G07C 5/00 20060101AFI20241111BHJP
H04R 3/00 20060101ALI20241111BHJP
【FI】
G07C5/00 Z
H04R3/00 320
(21)【出願番号】P 2020206541
(22)【出願日】2020-12-14
【審査請求日】2023-11-17
(73)【特許権者】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】100134832
【氏名又は名称】瀧野 文雄
(74)【代理人】
【識別番号】100165308
【氏名又は名称】津田 俊明
(74)【代理人】
【識別番号】100115048
【氏名又は名称】福田 康弘
(72)【発明者】
【氏名】小林 孝史
(72)【発明者】
【氏名】中村 健二
(72)【発明者】
【氏名】小島 良
【審査官】山本 裕太
(56)【参考文献】
【文献】特開2020-077237(JP,A)
【文献】特開2003-308079(JP,A)
【文献】特開平11-352987(JP,A)
【文献】特開2018-180424(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G07C 5/00
H04R 3/00
(57)【特許請求の範囲】
【請求項1】
マイクにより収音された音声に、ボイスチェンジ処理を施す音声処理部と、
前記ボイスチェンジ処理が施された音声を記憶
可能な記憶部と、を有
し、
前記ボイスチェンジ処理は、話されている会話内容が分かる状態で、話している人物が誰であるのかを特定できないように音声を変換する処理である、情報処理装置。
【請求項2】
前記音声処理部によりボイスチェンジ処理が施される音声は、前記マイクにより収音された音のうちの一部の音である、請求項1の情報処理装置。
【請求項3】
前記一部の音は、周波数が400Hzから700Hzの間の音である、請求項2に記載の情報処理装置。
【請求項4】
前記一部の音は、所定の人物の声、または、前記所定の人物以外の人物の声である、請求項2に記載の情報処理装置。
【請求項5】
前記マイクにより収録された音声、および/または、カメラで撮影された画像に基づいて、話している人物が前記所定の人物であるのか否かを判別する発声人物判別部をさらに有する、請求項4に記載の情報処理装置。
【請求項6】
カメラにより撮影された画像に基づいて、人物が話しているのか否かを判定する発声判定部をさらに有し、
前記音声処理部によりボイスチェンジ処理が施される音声は、人物が話していると判定されている間に収音された音声で
あり、
前記記憶部は、人物が話していると判定されていないときに収音された音声を記憶可能である、請求項1から5のいずれか一項に記載の情報処理装置。
【請求項7】
前記マイクは、移動体内の音声を収音する、請求項1から6のいずれか一項に記載の情報処理装置。
【請求項8】
前記移動体内は複数の領域に分割され、前記複数の領域の各々には、当該領域の音声を収音するマイクが設置されており、
前記音声処理部によりボイスチェンジ処理が施される音声は、前記移動体内に設置された複数のマイクのうちの一部のマイクにより収音された音声である、請求項7に記載の情報処理装置。
【請求項9】
前記移動体内に2つのマイクが設置されており、
前記情報処理装置は、前記2つのマイクに収音された音声に基づいて、当該音声が発生した位置を特定する音声発生位置特定部をさらに有し、
前記音声処理部によりボイスチェンジ処理が施される音声は、所定の領域内で発生した音声である、請求項7に記載の情報処理装置。
【請求項10】
前記マイクにより収音された音声を一時的に記憶する一時記憶部をさらに有する、請求項1から9のいずれか一項に記載の情報処理装置。
【請求項11】
コンピュータで実行される情報処理方法であって、
マイクにより収音された音声に、ボイスチェンジ処理を施す音声処理工程と、
前記ボイスチェンジ処理が施された音声を記憶部に記憶する記憶処理工程と、を有
し、
前記ボイスチェンジ処理は、話されている会話内容が分かる状態で、話している人物が誰であるのかを特定できないように音声を変換する処理である、情報処理方法。
【請求項12】
請求項11に記載の情報処理方法を、コンピュータに実行させる情報処理プログラム。
【請求項13】
請求項12に記載の情報処理プログラムを記憶しているコンピュータ読み取り可能な記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置に関する。
【背景技術】
【0002】
ドライブレコーダは、運転中の車内外の画像に合わせ、車内の音声も記録している。このような音声は、事故などのイベントが発生したときに、イベントの発生の原因究明などに用いることができるが、プライバシーの観点から、自身の声が記録されることを望まないユーザが存在する。
【0003】
そこで、例えば、特許文献1には、イベントが発生したときのみ、音声データを記録する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に開示された技術では、イベントの発生が適切に検知できなかったときには、音声データが記録されず、音声に基づく、イベントの発生の原因究明を行うことができなくなる。
【0006】
本発明が解決しようとする課題としては、プライバシーを保護しつつ、音声を記録することが一例として挙げられる。
【課題を解決するための手段】
【0007】
上記課題を解決するために、請求項1に記載の発明は、マイクにより収音された音声に、ボイスチェンジ処理を施す音声処理部と、前記ボイスチェンジ処理が施された音声を記憶する記憶部と、を有する。
【0008】
請求項11に記載の発明は、コンピュータで実行される情報処理方法であって、マイクにより収音された音声に、ボイスチェンジ処理を施す音声処理工程と、前記ボイスチェンジ処理が施された音声を記憶部に記憶する記憶処理工程と、を有する。
【0009】
請求項12に記載の発明は、請求項11に記載の情報処理方法を、コンピュータにより実行させる。
【0010】
請求項13に記載の発明は、請求項12に記載の情報処理プログラムを記憶している。
【図面の簡単な説明】
【0011】
【
図1】本発明の一実施例に係る情報処理装置100を示す図である。
【
図2】本発明の一実施例に係る制御部110を示す図である。
【
図3】本発明の一実施例に係る情報処理装置における処理動作を示す図である。
【発明を実施するための形態】
【0012】
本発明の一実施形態に係る情報処理装置は、マイクにより収音された音声に、ボイスチェンジ処理を施す音声処理部と、前記ボイスチェンジ処理が施された音声を記憶する記憶部と、を有する。このように、本実施形態では、記憶部には、ボイスチェンジ処理が施された音声のみが記憶される。このため、本実施形態では、記憶部に記憶された音声を第三者に聞かれたとしても、第三者に発言者が誰であるのかを特定されることがない。つまり、本実施形態では、プライバシーを保護しつつ、音声を記録することが可能である。
【0013】
前記音声処理部によりボイスチェンジ処理が施される音声は、前記マイクにより収音された音のうちの一部の音であるようにしても良い。このようにすることで、一部の音以外の音を、ボイスチェンジ処理が施されていない状態で記録することが可能になる。
【0014】
前記一部の音は、周波数が400Hzから700Hzの間の音であるようにしても良い。。このようにすることで、人間の声の周波数領域の音のみがボイスチェンジ処理が施されることになる。結果、プライバシーを保護しつつ、人間の声以外の音を、ボイスチェンジ処理が施されていない状態で記録することが可能になる。
【0015】
前記一部の音は、所定の人物の声、または、前記所定の人物以外の人物の声であるようにしても良い。このようにすることで、特定の人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0016】
前記情報処理装置は、前記マイクにより収録された音声、および/または、カメラで撮影された画像に基づいて、話している人物が前記所定の人物であるのか否かを判別する発声人物判別部をさらに有するようにしても良い。このようにすることで、特定の人物の声が話しているのか否かを判別することが可能になる。
【0017】
情報処理装置は、カメラにより撮影された画像に基づいて、人物が話しているのか否かを判定する発声判定部をさらに有するようにし、前記音声処理部によりボイスチェンジ処理が施される音声は、人物が話していると判定されている間に収音された音声であるようにしても良い。このようにすることで、プライバシーを保護しつつ、物が話している間の音以外の音を、ボイスチェンジ処理が施されていない状態で記録することが可能になる。
【0018】
前記マイクは、移動体内の音声を収音するようにしても良い。このようにすることで、移動体内に乗員のプライバシーを保護しつつ、音声を記録することが可能になる。
【0019】
前記移動体内は複数の領域に分割され、前記複数の領域の各々には、当該領域の音声を収音するマイクが設置されるようにし、前記音声処理部によりボイスチェンジ処理が施される音声は、前記移動体内に設置された複数のマイクのうちの一部のマイクにより収音された音声であるようにしても良い。このようにすることで、特定の領域にいる人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0020】
前記移動体内に2つのマイクが設置されるようにし、前記情報処理部は、前記2つのマイクに収音された音声に基づいて、当該音声が発生した位置を特定する音声発生位置特定部をさらに有するようにし、前記音声処理部によりボイスチェンジ処理が施される音声は、所定の領域内で発生した音声であるようにしても良い。このようにすることで、特定の領域にいる人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0021】
前記情報処理装置は、前記マイクにより収音された音声を一時的に記憶する一時記憶部をさらに有するようにしても良い。このようにすることで、例えば、事故などのイベントの発生の原因究明において発言者の特定が必要な場合などに、記憶部に記憶された音声を用いることが可能になる。
【0022】
また、本発明の一実施形態にかかる情報処理方法は、コンピュータで実行される情報処理方法であって、マイクにより収音された音声に、ボイスチェンジ処理を施す音声処理工程と、前記ボイスチェンジ処理が施された音声を記憶部に記憶する記憶処理工程と、を有する。このように、本実施形態では、記憶部には、ボイスチェンジ処理が施された音声のみが記憶される。このため、本実施形態では、記憶部に記憶された音声を第三者に聞かれたとしても、第三者に発言者が誰であるのかを特定されることがない。つまり、本実施形態では、プライバシーを保護しつつ、音声を記録することが可能である。
【0023】
また、本発明の一実施形態に係る情報処理プログラムは、上記の情報処理方法を、コンピュータに実行させる。このため、本実施形態では、コンピュータを用いて、プライバシーを保護しつつ、音声を記録することが可能である。
【0024】
また、本発明の一実施形態に係るコンピュータ読み取り可能な記憶媒体は、上記の情報処理プログラムを記憶している。このため、本実施形態では、上記の情報処理プログラムを、機器に組み込む以外にも単体で流通することが可能であり、バージョンアップ等を容易に行うことが可能である。
【実施例】
【0025】
<情報処理装置100>
図1は、本発明の一実施例に係る情報処理装置100を示す図である。情報処理装置100は、例えば、ドライブレコーダやスマートフォンなどの自動車(移動体)に設置される機器であり、自動車内の音声を記憶する。情報処理装置100は、この記憶した音声を、クライド(外部装置)に送信するようにしても良い。
【0026】
情報処理装置100は、制御部110と、記憶部120と、マイク130と、通信部140と、カメラ150と、を有する。制御部110は、CPUなどを有するコンピュータにより構成される。記憶部120は、例えば、ハードディスクやメモリなどの記憶装置である。マイク130は、音声を収音する装置である。通信部140は、他の装置との間で情報の送受信を行うための通信装置である。カメラ150は、画像を撮影する装置である。
【0027】
図2は、本発明の一実施例に係る制御部110を示す図である。制御部110は、音声処理部111と、記憶処理部112と、送信処理部113と、を有する。
【0028】
音声処理部111は、マイク130により収音された音声に、ボイスチェンジ処理を施す。ボイスチェンジ処理は、話されている会話内容が分かる状態で、話している人物が誰であるのかを特定できないように音声を変換する処理であり、例えば、ピッチシフト処理や、フォルマントシフト処理、ディレイ処理、エコー処理、これらの処理の組み合わせなどの音声変換処理である。
【0029】
記憶処理部112は、音声処理部111によりボイスチェンジ処理が施された音声を、記憶部120に記憶する。送信処理部113は、記憶部120に記憶された音声を、通信部130により外部装置に送信する。
【0030】
このように、本実施例では、記憶部120には、ボイスチェンジ処理が施された音声のみが記憶される。このため、本実施例では、記憶部120に記憶された音声を第三者に聞かれたとしても、第三者に発言者が誰であるのかを特定されることがない。また、本実施例では、外部装置には、ボイスチェンジ処理が施された音声のみが送信される。このため、本実施例では、外部装置に送信された音声を第三者に聞かれたとしても、第三者に発言者が誰であるのかを特定されることがない。つまり、本実施例では、プライバシーを保護しつつ、音声を記録することが可能である。
【0031】
記憶処理部112がマイク130により収音された音声を記憶部120に記憶するようにし、送信処理部113が音声処理部111によりボイスチェンジ処理が施された音声を通信部130により外部装置に送信するようにしても良い。このようにすることで、外部装置に送信された音声により第三者に発言者が誰であるのかを特定されることを防ぎつつ、記憶部120には、ボイスチェンジ処理が施されていない音声を記録することが可能になり、発言者の特定が必要な場合などに、記憶部120に記憶された音声を用いることが可能になる。
【0032】
このとき、記憶処理部112は、マイク130により収音された音声を暗号化し、暗号化された音声を記憶部120に記憶するようにすると良い。そして、特定の者(例えば、情報処理装置100のユーザ)のみが複合化できるように音声を暗号化するようにすると良い。このようにすることで、記憶部120に記憶されたデータを第三者に取得されたとしても、第三者にデータを複合化されることを防ぐことが可能になり、記憶部120に記憶した音声を第三者に聞かれることを防ぐことが可能になる。
【0033】
図3は、本発明の一実施例に係る情報処理装置における処理動作を示す図である。音声処理部111は、マイク130により収音された音声に、ボイスチェンジ処理を施す(ステップS301)。記憶処理部112は、音声処理部111によりボイスチェンジ処理が施された音声を、記憶部120に記憶する(ステップS302)。送信処理部113は、記憶部120に記憶された音声を、外部装置に送信する(ステップS303)。
【0034】
<特定の音声に対する処理>
音声処理部111は、マイクにより収音された音声の全てに、ボイスチェンジ処理を施しても良いし、マイクにより収音された音声の一部に、ボイスチェンジ処理を施しても良い。
【0035】
音声処理部111は、例えば、マイクにより収音された音声のうちの、周波数が400Hzから700Hzの間の音だけに、ボイスチェンジ処理を施すようにすると良い。このようにすることで、人間の声の周波数領域の音のみがボイスチェンジ処理が施されることになる。結果、プライバシーを保護しつつ、人間の声以外の音を、ボイスチェンジ処理が施されていない状態で記録することが可能になる。
【0036】
また、音声処理部111は、例えば、所定の人物の声だけに、ボイスチェンジ処理を施すようにすると良い。このようにすることで、特定の人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0037】
また、音声処理部111は、例えば、所定の人物以外の人物の声だけに、ボイスチェンジ処理を施すようにすると良い。このようにすることで、特定の人物以外の人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0038】
このとき、制御部110は、例えば、マイク130により収録された音声、および/または、カメラ150で撮影された画像に基づいて、話している人物が所定の人物であるのか否かを判別する発声人物判別部114を有するようにすると良い。
【0039】
例えば、記憶部120が所定の人物の声の音声データや声の特徴などの所定の人物の声に関する情報を記憶するようにし、発声人物判別部114は、この記憶された情報とマイク130により収録された音声に基づいて、既存の音声分析技術を用いて、マイク130により収録された音声に、所定の人物の声が含まれるいるのか否かを判別するようにすると良い。また、例えば、記憶部120が所定の人物の顔の画像データや顔の特徴などの所定の人物の顔に関する情報を記憶するようにし、発声人物判別部114は、この記憶された情報とカメラ150で撮影された画像に基づいて、既存の画像分析技術を用いて、所定の人物の声が話しているのか否かを判別するようにすると良い。
【0040】
制御部110は、カメラ150により撮影された画像に基づいて、人物が話しているのか否かを判定する発声判定部115を有するようにしても良い。発声判定部115は、例えば、既存の画像分析技術を用いて、カメラ150により撮影された画像に話をしている人物がいるのか否かを判定する。そして、音声処理部111は、人物が話していると判定されている間に収音された音声だけに、ボイスチェンジ処理を施すようにしても良い。このようにすることで、プライバシーを保護しつつ、人物が話している間の音以外の音を、ボイスチェンジ処理が施されていない状態で記録することが可能になる。
【0041】
<特定の領域で発生した音声に対する処理>
自動車内を複数の領域に分割し、複数の領域ごとに、マイク130を設置し、複数のマイク130の各々は、設置された領域の音声を収録するようにするようにしても良い。そして、音声処理部111は、複数のマイク130の一部のマイクにより収音された音声だけを、ボイスチェンジ処理を施すようにしても良い。このようにすることで、特定の領域にいる人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0042】
例えば、マイク130は、運転席の音声のみを収音するマイク(運転席マイク)と、助手席の音声のみを収音するマイク(助手席マイク)と、後部座席の音声のみを収音するマイク(後部座席マイク)と、を含むようにすると良い。そして、音声処理部111は、運転席マイクにより収音された音声だけに、ボイスチェンジ処理を施すようにすると良い。このようにすることで、運転手のプライバシーを保護しつつ、音声を記録することが可能になる。また、音声処理部111は、助手席マイクにより収音された音声と後部座席マイクにより収音された音声だけに、ボイスチェンジ処理を施すようにしても良い。このようにすることで、運転手以外の人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0043】
また、自動車に、2つのマイク130を設置するようにしても良い。2つのマイク130により収音された音声の間のずれを測定することにより、マイク130により収音された音声が発生した位置を特定することが可能である。そこで、制御部110は、2つのマイク130により収音された音声に基づいて、音声が発生した位置を特定する音声発生位置特定部116を有するようにすると良い。そして、音声処理部111は、所定の領域内で発生した音声だけに、ボイスチェンジ処理を施すようにしても良い。このようにすることでも、特定の領域にいる人物のプライバシーを保護しつつ、音声を記録することが可能になる。
【0044】
<ボイスチェンジ処理が施されていない音声の一時記憶>
制御部110は、マイク130により収音された音声を一時的に記憶部120に記憶させる一時記憶処理部117を有するようにしても良い。一時記憶処理部117は、例えば、マイク130により収音された音声を記憶部120に記憶し、記憶されてから所定の時間が経過した音声を記憶部120から消去していくようにすると良い。このとき、例えば、情報処理装置100が設置された自動車に事故などのイベントが発生したことを示す情報を取得する手段を情報処理装置100が有するようにし、一時記憶処理部117は、事故などのイベントが発生したときに、一時記憶処理部117により記憶部120に一時的に記憶された音声が消去されないようにすると良い。このようにすることで、事故などのイベントの発生前後の音声を、ボイスチェンジ処理が施されていない状態で、記憶部120に記憶しておくことが可能になる。結果、事故などのイベントの発生の原因究明において発言者の特定が必要な場合などに、記憶部120に記憶された音声を用いることが可能になる。
【0045】
情報処理装置100は、記憶部120の他に記憶装置を有するようにし、一時記憶処理部117は、マイク130により収音された音声を一時的に記憶する際に、記憶部120ではなく、この記憶装置に記憶するようにしても良い。
【0046】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に記載した本発明の趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更が可能である。
【符号の説明】
【0047】
100 情報処理装置
110 制御部
111 音声処理部
112 記憶処理部
113 送信処理部
114 発声人物判別部
115 発声判定部
116 音声発生位置特定部
117 一時記憶処理部
120 記憶部
130 マイク
140 通信部
150 カメラ