IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通テン株式会社の特許一覧

<>
  • 特開-車内通話装置及び車内通話方法 図1
  • 特開-車内通話装置及び車内通話方法 図2
  • 特開-車内通話装置及び車内通話方法 図3
  • 特開-車内通話装置及び車内通話方法 図4
  • 特開-車内通話装置及び車内通話方法 図5
  • 特開-車内通話装置及び車内通話方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023179267
(43)【公開日】2023-12-19
(54)【発明の名称】車内通話装置及び車内通話方法
(51)【国際特許分類】
   G10L 15/22 20060101AFI20231212BHJP
   G10L 15/10 20060101ALI20231212BHJP
   H04R 3/00 20060101ALI20231212BHJP
   H04R 3/12 20060101ALI20231212BHJP
   G06F 3/16 20060101ALI20231212BHJP
   G06F 3/01 20060101ALI20231212BHJP
【FI】
G10L15/22 453
G10L15/10 200W
H04R3/00 320
H04R3/12 A
G06F3/16 650
G06F3/01 510
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2022092489
(22)【出願日】2022-06-07
(71)【出願人】
【識別番号】000237592
【氏名又は名称】株式会社デンソーテン
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】引間 勝昭
【テーマコード(参考)】
5D220
5E555
【Fターム(参考)】
5D220AA12
5D220BA01
5D220CC06
5E555AA46
5E555BA23
5E555BB23
5E555BC04
5E555CA47
5E555CB64
5E555CC01
5E555DA21
5E555DA31
5E555EA23
5E555FA00
(57)【要約】
【課題】車両の前席と後席との間で双方向の通話のための処理負荷を低減すること。
【解決手段】実施形態に係る車内通話装置は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、音声に含まれるワードを認識する音声認識部と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリと、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。
【選択図】図2
【特許請求の範囲】
【請求項1】
車室内に備えられた複数のマイクのいずれかに入力された音声を、前記車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、
音声に含まれるワードを認識する音声認識部と、
前記複数のマイクと前記複数のスピーカを関連付ける関連付け情報を記憶したメモリと、
を備え、
前記コントローラは、前記音声認識部によって、前記複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記音声が入力されたマイクに、前記特定のワードに続いて入力された音声が、前記複数のスピーカのうち、前記音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する
車内通話装置。
【請求項2】
前記関連付け情報は、前記複数のマイクと前記複数のスピーカのうちの、第1のマイクと第2のスピーカ、および、第2のマイクと第1のスピーカとを関連付ける情報を含み、
前記コントローラは、
前記音声認識部によって、前記第1のマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記第1のマイクに、前記特定のワードに続いて入力された音声が、前記第2のスピーカから出力されるように制御し、
前記音声認識部によって、前記第2のマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記第2のマイクに、前記特定のワードに続いて入力された音声が、前記第1のスピーカから出力されるように制御する
請求項1に記載の車内通話装置。
【請求項3】
前記関連付け情報は、前記複数のマイクのうちのいずれか1つのマイクと、前記複数のスピーカに含まれるスピーカのグループとを関連付ける情報を含み、
前記コントローラは、前記音声認識部によって、前記複数のマイクのいずれかのマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記音声が入力されたマイクに、前記特定のワードに続いて入力された音声が、前記複数のスピーカのうち、前記音声が入力されたマイクと関連付けられたスピーカのグループから出力されるように制御する
請求項1に記載の車内通話装置。
【請求項4】
前記関連付け情報は、前記特定のワードの種類ごとに、前記複数のマイクのうちのいずれか1つのマイクと、前記スピーカのグループに含まれるいずれかのスピーカとを関連付ける情報をさらに含み、
前記コントローラは、前記関連付け情報に基づいて、前記音声が、前記グループに含まれるスピーカのうち、前記特定のワードの種類に対応するスピーカから出力されるように制御する
請求項3に記載の車内通話装置。
【請求項5】
前記関連付け情報は、前記複数のマイクと前記複数のスピーカのうちの、第3のマイクと第4のスピーカ、および、第4のマイクと第3のスピーカとを関連付ける情報を含み、
前記コントローラは、
前記音声認識部によって、前記第3のマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記第3のマイクに、前記特定のワードに続いて入力された音声が、前記第4のスピーカから出力されるように制御し、
前記音声認識部によって、前記第4のスピーカから音声が出力された後、前記関連付け情報に基づいて、前記第4のスピーカと対応付けられた前記第4のマイクに入力された音声が、前記第3のマイクと対応付けられた前記第3のスピーカから出力されるように制御する
請求項1に記載の車内通話装置。
【請求項6】
前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記関連付け情報は、第1の座席に対応して備えられたマイクに、第2の座席に対応して備えられたスピーカを関連付ける情報を含む
請求項1に記載の車内通話装置。
【請求項7】
前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記第1のマイクおよび前記第1のスピーカは、第1の座席に対応して備えられ、前記第2のマイクおよび前記第2のスピーカは、第2の座席に対応して備えられている
請求項2に記載の車内通話装置。
【請求項8】
前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記関連付け情報は、第1の座席に対応して備えられたマイクに、第1の座席を除く座席に対応して備えられたスピーカのグループを関連付ける情報が含まれる
請求項3に記載の車内通話装置。
【請求項9】
前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記第3のマイクおよび前記第3のスピーカは、第1の座席に対応して備えられ、前記第4のマイクおよび前記第4のスピーカは、第2の座席に対応して備えられている
請求項5に記載の車内通話装置。
【請求項10】
車室内に備えられた複数のマイクのいずれかに入力された音声を、前記車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラによって実行される車内通話方法であって、
車室内に備えられた複数のマイクのいずれかに入力された音声に特定のワードが含まれている場合、前記複数のマイクと前記複数のスピーカを関連付ける関連付け情報に基づき、前記音声が入力されたマイクに、前記特定のワードに続いて入力された音声を、
前記音声が入力されたマイクと関連付けられたスピーカから出力させる
車内通話方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、車内通話装置及び車内通話方法に関する。
【背景技術】
【0002】
近年、ミニバン等の大型車両で、In Car Communication(ICC)通話の普及が進んでいる。ICCには、1Way-ICCと2Way-ICCの2種類の機能がある。1Way-ICCは、前席で収集された音声を後席のスピーカから出力させる機能である。
【0003】
一方、2Way-ICCは、前席で収集された音声を後席のスピーカから出力させるとともに、後席で収集された音声を前席のスピーカから出力させる機能である。2Way-ICCによれば、前席と後席との間で双方向の通話が可能となる。
【0004】
2Way-ICCは、カーオーディオやカーナビゲーション等の車載機器に搭載されたコントローラ(例えばCPU)に、「2way-ICCソリューション」と呼ばれるプログラムを実行させることで実現される。
【0005】
なお、ここでいう「ソリューション」とは機能(ここではICC機能)を実行するための「手段」を指し、上述のようにコントローラが実行するプログラムとして実装されるものに限らず、ASIC(application specific integrated circuit)、FPGA(field-programmable gate array)、その他のデジタル回路・アナログ回路等のハードウェアにより実装されるものも含まれるものとする(以下同じ)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】国際公開第2018/167949号
【特許文献2】特開2006-101048号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来の技術では、車両の前席と後席との間で双方向の通話を実現するための処理負荷が大きいという問題がある。
【0008】
例えば、2way-ICCソリューションは、双方向の通話を実現するため、前席のマイクと後席のマイクに対応した2つの入力チャンネル、及び前席のスピーカと後席のスピーカに対応した2つの出力チャンネルを備える。
【0009】
そして、2way-ICCソリューションは、前席のスピーカから出力される音声と、後席のスピーカから出力される音声のそれぞれについて、エコーキャンセルを行う。
【0010】
このように、2way-ICCソリューションは、2つのチャンネルの音声に対して、CPU(Central Processing Unit)負荷が大きいエコーキャンセルを行うことになる。また、ICC機能をハードウェアで実装する場合には、チャンネル数分のエコーキャンセラを備える必要があり、回路規模が大きくなる。
【0011】
本発明は、上記に鑑みてなされたものであって、車両の前席と後席との間で双方向の通話のためのエコーキャンセラの処理負荷を低減し、あるいは回路規模の増大を抑制することができる車内通話装置及び車内通話方法を提供することを目的とする。
【課題を解決するための手段】
【0012】
上述した課題を解決し、目的を達成するために、本発明に係る車内通話装置は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、音声に含まれるワードを認識する音声認識部と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリと、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。
【発明の効果】
【0013】
本発明によれば、車両の前席と後席との間で双方向の通話のための処理負荷を低減することができる。
【図面の簡単な説明】
【0014】
図1図1は、第1の実施形態の車両の構成例を示す図である。
図2図2は、第1の実施形態の車内通話システムの構成例を示す図である。
図3図3は、第1の実施形態のモード情報の例を示す図である。
図4図4は、第1の実施形態の車内通話方法の手順を示すフローチャートである。
図5図5は、第2の実施形態のモード情報の例を示す図である。
図6図6は、第2の実施形態の車内通話方法の手順を示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、添付図面を参照して、本願の開示する車内通話装置及び車内通話方法の実施形態を詳細に説明する。なお、以下に示す実施形態により本発明が限定されるものではない。
【0016】
[第1の実施形態]
まず、図1を用いて、実施形態の車両について説明する。図1は、第1の実施形態の車両の構成例を示す図である。
【0017】
図1に示すように、車両Vは、3列の座席を備えた、6~8人乗りの車両である。車両Vは、車内通話装置10を有する。
【0018】
車内通話装置10は、各座席に搭乗した乗員間での会話を支援するための装置である。例えば、車内通話装置10は、マイクに入力された音声を特定のスピーカから出力させる。
【0019】
また、車室内には、各座席に対応するマイクロホン(以下、マイク)が備えられる。また、車室内には、座席の各列に対応するスピーカが備えられる。
【0020】
前列(運転席がある列)の右側の座席(以下、前席右)には、マイク20a_Rが備えられる。また、前列の左側の座席(以下、前席左)には、マイク20a_Lが備えられる。
【0021】
中列(前列の1つ後の列)の右側の座席(以下、中席右)には、マイク20b_Rが備えられる。また、中列の左側の座席(以下、中席左)には、マイク20b_Lが備えられる。
【0022】
後列(中列の1つ後の列)の右側の座席(以下、後席右)には、マイク20c_Rが備えられる。また、後列の左側の座席(以下、後席左)には、マイク20c_Lが備えられる。
【0023】
また、前列、中列及び後列には、それぞれスピーカ30a、スピーカ30b及びスピーカ30cが備えられる。
【0024】
車内通話システム1は、車内通話装置10と、上記のマイク及びスピーカとを含むシステムである。
【0025】
例えば、前席右の乗員と中席右の乗員とが通話をする場合、車内通話装置10は、マイク20a_Rに入力された音声をスピーカ30bに出力させ、マイク20b_Rに入力された音声をスピーカ30aに出力させればよい。
【0026】
従来は、このような双方向の通話を実現するために、処理負荷が大きい2way-ICCソリューションが利用されていた。
【0027】
一方、第1の実施形態の車内通話装置10は、1way-ICCソリューションによって双方向の通話を実現することで、処理負荷を低減させる。
【0028】
図2を用いて、車内通話システム1の構成及び処理を説明する。図2は、第1の実施形態の車内通話システムの構成例を示す図である。
【0029】
図2に示すように、車内通話装置10には、マイク20a_R、マイク20a_L、マイク20b_R及びマイク20b_Lから音声が入力される。この場合、車内通話装置10には、4チャンネルの音声が入力される。
【0030】
車内通話装置10に入力される音声のチャンネル数は、図2に示すものに限られない。例えば、車内通話装置10には、マイク20c_R及びマイク20c_Lから音声が入力される場合がある。
【0031】
また、車内通話装置10は、スピーカ30a及びスピーカ30bに音声を出力させる。車内通話装置10は、さらにスピーカ30cに音声を出力させてもよい。
【0032】
また、車内通話装置10は、カーナビゲーションシステムの一部の機能として実現されてもよい。また、車内通話装置10は、カーナビゲーションシステムの音声認識等の機能を利用するものであってもよい。
【0033】
図2の例では、搭乗者Uaは、マイク20a_R及びスピーカ30aが対応付けられた前席右に搭乗しているものとする。また、搭乗者Ubは、マイク20b_Rが対応付けられた中席右に搭乗しているものとする。
【0034】
車内通話装置10は、AD(Analog to Digital)コンバータ11、ヘッドユニット12及びアンプ13を有する。
【0035】
ADコンバータ11は、入力されたアナログの音声信号をデジタルの音声信号に変換し、ヘッドユニット12に出力する。例えば、ADコンバータ11は、アナログの音声信号をサンプリング周波数(Fs)が48kHz、量子化ビット数が24bitのデジタルの音声信号に変換する。
【0036】
また、ADコンバータ11とヘッドユニット12との間のインタフェースにおいて、ADコンバータ11がスレーブ側であり、ヘッドユニット12がマスター側である。
【0037】
ヘッドユニット12は、DSP(Digital Signal Processor)121及びSoC(System on a Chip)122を有する。
【0038】
SoC122は、コントローラの一例である。SoC122は、例えば後述するMW1223の処理によってコントローラとして機能する。
【0039】
DSP121は、ADコンバータ11から受け取ったデジタルの音声信号に対してフィルタリング等の処理を行い、当該処理後の音声信号をSoC122に出力する。
【0040】
ここで、SoC122に入力された音声信号は、Hard SRC(Sampling Rate Converter)によってサンプリング周波数が48kHzから24kHzに変換され、量子化ビット数が24bitから16bitに変換される。
【0041】
また、SoC122から出力される音声信号は、Hard SRCによってサンプリング周波数が24kHzから48kHzに変換され、量子化ビット数が16bitから24bitに変換される。
【0042】
SoC122は、ECNR(Echo Canceller and Noise Reduction)1221、ASR(Automatic Speech Recognition)1222、MW(Middleware)1223、ICC-1way1225、及びセレクタ1226を有する。なお、SoC122の各部は、プログラムによって実現される。
【0043】
ECNR1221は、車両Vの走行音等のノイズの除去を行う。
【0044】
ASR1222は、音声認識を行う。例えば、ASR1222は、深層学習モデルを用いて音声信号をテキストに変換する。そして、ASR1222は、テキストに特定のワードが含まれていることを認識することができる。ASR1222は、音声認識部の一例である。
【0045】
MW1223は、セレクタ1226を制御する。さらに、MW1223は、後述するアンプ13のセレクタ1301を制御する。
【0046】
ICC-1way1225は、1way-ICCソリューションである。例えば、ICC-1way1225は、1つのチャンネルの音声信号についてエコーキャンセルを行う。ICC-1way1225は、2way-ICCソリューションと比べて処理負荷が小さい。
【0047】
また、ICC-1way1225に入力される音声信号のチャンネルは、ICC-1way1225の前段に備えられたセレクタ1226によって決定される。複数(図2の例では4つ)のチャンネルの音声信号のうち、セレクタ1226によって選ばれた1つのチャンネルの音声信号がICC-1way1225に入力される。
【0048】
アンプ13は、ヘッドユニット12から出力されたデジタルの音声信号に対してEQ(イコライズ)を行い、デジタルの音声信号をアナログの音声信号に変換し、変換した音声信号をパワーアンプ(P-IC)により増幅し、スピーカに音声を出力させる。
【0049】
また、アンプ13は、ICC-1way1225からの音声信号を、いずれかのスピーカにつながる経路にMIXする。また、MIXの前段にはセレクタ1301が備えられる。
【0050】
セレクタ1301は、ICC-1way1225からの音声信号を、いずれのスピーカから出力させるかを選択することができる。
【0051】
なお、アンプ13とヘッドユニット12との間のインタフェース(INIC:Intelligent Network Interface Controller)において、アンプ13がスレーブ側であり、ヘッドユニット12がマスター側である。
【0052】
MW1223によるセレクタ(セレクタ1226及びセレクタ1301)の制御方法を説明する。なお、ここで説明する各処理の主体は、MW1223ではなく、SoC122又はコントローラ等に言い換えられてもよい。
【0053】
これまで説明したように、セレクタ(セレクタ1226及びセレクタ1301)は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを切り替えることができる。
【0054】
MW1223は、図3に示すようなモード情報に応じて、セレクタが選択するチャンネルを制御する。モード情報はメモリ1224に記憶されているものとする。図3は、第1の実施形態のモード情報の例を示す図である。また、図3のモード情報は、マイクを識別する情報と(マイクch)と座席の位置(シートポジション)を対応付けたテーブルに、モードを示す列が追加されたものであってもよい。
【0055】
モード情報は、マイクとモードを対応付けた情報である。言い替えればモード情報は1つのマイクに入力された音声がどのスピーカから出力されるべきかを示す情報でり、車両に搭載された複数のマイクと複数のスピーカとを対応付ける情報である。
【0056】
まず、ASR1222による認識対象のワードのリストである音声辞書には、セレクタを制御するための特定のワードが事前に追加される。例えば、特定のワードとして、「Hey ICC」(ヘイ アイシーシー)というワードが音声辞書に追加されているものとする。
【0057】
MW1223は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラの一例である。車内通話装置10は、MW1223に加え、音声に含まれるワードを認識する音声認識部(ASR1222)と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリ1224と、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。モード情報は、関連付け情報の一例である。
【0058】
ここで、マイク20a_Rが1chに対応し、マイク20a_Lが2chに対応し、マイク20b_Rが3chに対応し、マイク20a_Lが4chに対応している。
【0059】
ASR1222は、SoC122に入力された1ch、2ch、3ch、4chの音声信号のそれぞれについて音声認識を行う。
【0060】
MW1223は、ASR1222によって「Hey ICC」が認識されたチャンネルの音声信号がICC-1way1225に入力されるように、セレクタ1226を制御する。
【0061】
ここで、MW1223は、モード情報を参照し、「Hey ICC」が認識されたチャンネルに対応するモードを特定する。
【0062】
例えば、モード情報におけるマイクchが「1ch」であり、モードが「前席→中席モード」である場合、MW1223は、中席側のスピーカ30bにつながる経路に、ICC-1way1225からの音声信号がMIXされるようにセレクタ1301を制御する。
【0063】
これにより、前席の搭乗者Uaが、「Hey ICC」と発声した後に、中席の搭乗者Ubへの用件を発声すれば、当該要件の音声がスピーカ30bから出力されることになる。
【0064】
マイク20a_Rは、第1のマイクの一例である。また、マイク20b_Rは、第2のマイクの一例である。また、スピーカ30aは、第1のスピーカの一例である。また、スピーカ30bは、第2のスピーカの一例である。なお、メモリ1224の関連付け情報は、複数のマイクと複数のスピーカのうちの、第1のマイクと第2のスピーカ、および、第2のマイクと第1のスピーカとを関連付ける情報を含む。図2のモード情報によれば、MW1223は、例えば以下のような制御を行う。
【0065】
MW1223は、ASR1222によって、マイク20a_R(マイクch:1ch)に入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、マイク20a_Rに、特定のワードに続いて入力された音声が、スピーカ30bから出力されるように制御する(モード:前席→中席モード)。
【0066】
MW1223は、ASR1222によって、マイク20b_R(マイクch:3ch)に入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、マイク20b_Rに、特定のワードに続いて入力された音声が、スピーカ30aから出力されるように制御する(モード:中席→前席モード)。
【0067】
このように、MW1223は、車室内に備えられた複数のマイクのいずれかに入力された音声に特定のワードが含まれている場合、音声が入力されたマイクにさらに入力された音声を、1wayのICCソリューションであるICC-1way1225に入力する。そして、MW1223は、ICC-1way1225から出力される音声を、マイクと関連付けられたスピーカから出力させる。
【0068】
また、ここでは、複数のマイクおよび複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、第1マイクおよび第1のスピーカは、第1の座席(例えば前席)に対応して備えられ、第2マイクおよび第2のスピーカは、第2の座席(例えば後席)に対応して備えられている。
【0069】
図4を用いて、第1の実施形態の車内通話方法の手順を説明する。図4は、第1の実施形態の車内通話方法の手順を示すフローチャートである。
【0070】
まず、図4に示すように、ASR1222は、複数のマイクから入力された音声のそれぞれについて音声認識を行う(ステップS101)。
【0071】
ここで、MW1223は、ASR1222の音声に特定のワードが含まれているか否かを判定する(ステップS102)。
【0072】
例えば、ASR1222は、複数のチャンネルの音声のそれぞれを基にテキストを生成し、当該テキストに「Hey ICC」が含まれている場合、対応するチャンネルをMW1223に通知する。MW1223は、当該通知があった場合に、音声に特定のワードが含まれていると判定する。
【0073】
音声に特定のワードが含まれていない場合(ステップS102、No)、MW1223は、ステップS103以降の処理を行わない。また、ASR1222は、ステップS101に戻り、引き続き音声認識を行う。
【0074】
一方、音声に特定のワードが含まれている場合(ステップS102、Yes)、MW1223は、モード情報を参照することによりモードを特定し、さらにモードに示されるスピーカを特定する(ステップS103)。例えば、モード「前席→中席モード」には、中席に備えられたスピーカ30bが対応する。
【0075】
さらに、MW1223は、特定したスピーカから音声が出力されるように、セレクタを制御する(ステップS104)。
【0076】
例えば、MW1223は、ステップS103における音声が入力されたマイクに対応するチャンネルの音声信号がICC-1way1225に入力されるようにセレクタ1226を制御する。
【0077】
さらに、MW1223は、ステップS103で特定したスピーカから出力される音声信号にICC-1way1225から出力された音声信号がMIXされるようにセレクタ1301を制御する。
【0078】
上述してきたように、実施形態に係る車内通話装置10は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、音声に含まれるワードを認識する音声認識部と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリと、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。
【0079】
なお、1つのマイクに複数のスピーカが関連付けられていてもよい。例えば、図1において、前席のマイク20aに中席のスピーカ30bと後席のスピーカ30cが関連付けられていてもよい。この場合、前席の乗員がマイク20aに向かって「Hey ICC」と発話すると、それに続く発話が中席と後席のスピーカ30b、スピーカ30c両方から出力されることになる。これにより前席の乗員が車両の他の列のシートの乗員全員に話しかけることができる。同様に、中席のマイク20bが、前席と後席のスピーカ30a、30cの両方に関連付けられていてもよいし、後席のマイク20cが前席と中席のスピーカ30a、30bの両方に関連付けられていてもよい。
【0080】
第1の実施形態では、2way-ICCソリューションよりも処理負荷が小さい1way-ICCソリューションを使って車両の前席と後席との間で双方向の通話を実現しているため、処理負荷が低減される。また、ICC機能をハードウェアで実装する場合には回路規模が小さくて済む。
【0081】
また、2way-ICCソリューションは、1way-ICCソリューションよりも高価であるため、第1の実施形態によれば低コスト化を図ることができる。
【0082】
さらに、2way-ICCソリューションの場合、2way-ICCソリューションから出力される音声信号をアンプに送信するためのインタフェースチャンネルを、2つ設ける必要がある。一方、第1の実施形態では、1way-ICCソリューションから出力される音声信号をアンプに送信するためのインタフェースチャンネルが1つあればよい。
【0083】
音声信号を送信するためのインタフェースチャンネルが増えると、通信にかかる負荷が大きくなる。
【0084】
第1の実施形態によれば、通信にかかる負荷も抑止できる。
【0085】
また、インタフェースの増加を物理的なワイヤーハーネスの増設により実現する場合であっても、第1の実施形態によればワイヤーハーネスにかかる費用を抑えるという効果が得られる。
【0086】
[第2の実施形態]
第2の実施形態では、マイクだけでなく、認識されたワードに応じて出力先のスピーカが特定される。これにより、図1に示すような3列の座席を備えた車両において、前席と中席だけでなく、前席と後席、中席と後席といった任意の組み合わせの座席間で通話を行うことができる。
【0087】
第2の実施形態では、関連付け情報は、複数のマイクのうちのいずれか1つのマイクと、複数のスピーカに含まれるスピーカのグループとを関連付ける情報を含む。MW1223は、ASR1222によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカのグループから出力されるように制御する。
【0088】
第2の実施形態では、図5のようなモード情報が用いられる。図5は、第2の実施形態のモード情報の例を示す図である。MW1223は、音声から認識されたワードが、モード情報の起動用ワードに含まれる場合、マイクと当該ワードに対応するモードを特定する。
【0089】
例えば、1chに対応する前席右にあるマイク20a_Rに入力された音声から、「Hey 中席」(ヘイ チュウセキ)というワードが認識された場合、MW1223は、モード情報を参照し、モードが「前席→中席モード」であることを特定する。この場合、MW1223は、中席に対応するスピーカ30bから音声が出力されるようにセレクタを制御する。
【0090】
また、例えば、4chに対応する中席左にあるマイク20b_Lに入力された音声から、「Hey 後席」(ヘイ コウセキ)というワードが認識された場合、MW1223は、モード情報を参照し、モードが「中席→後席モード」であることを特定する。この場合、MW1223は、後席に対応するスピーカ30cから音声が出力されるようにセレクタを制御する。
【0091】
また、例えば、5chに対応する後席右にあるマイク20c_Rに入力された音声から、「Hey 中席」(ヘイ チュウセキ)というワードが認識された場合、MW1223は、モード情報を参照し、モードが「後席→中席モード」であることを特定する。この場合、MW1223は、中席に対応するスピーカ30bから音声が出力されるようにセレクタを制御する。
【0092】
図6を用いて、第2の実施形態の車内通話方法の手順を説明する。図6は、第2の実施形態の車内通話方法の手順を示すフローチャートである。
【0093】
まず、図6に示すように、ASR1222は、複数のマイクから入力された音声のそれぞれについて音声認識を行う(ステップS201)。
【0094】
ここで、MW1223は、ASR1222の音声に、特定のワード(モード情報の起動用ワード)が含まれているか否かを判定する(ステップS202)。
【0095】
例えば、ASR1222は、複数のチャンネルの音声信号のそれぞれを基にテキストを生成し、当該テキストに起動用ワードのいずれか(「Hey 前席」、「Hey 中席」、「Hey 後席」のいずれか)が含まれている場合、対応するチャンネルをMW1223に通知する。MW1223は、当該通知があった場合に、音声に特定のワードが含まれていると判定する。
【0096】
音声に特定のワードが含まれていない場合(ステップS202、No)、MW1223は、ステップS203以降の処理を行わない。また、ASR1222は、ステップS201に戻り、引き続き音声認識を行う。
【0097】
一方、音声に特定のワードが含まれている場合(ステップS202、Yes)、MW1223は、モード情報を参照することによりモードを特定し、さらにモードに示されるスピーカを特定する(ステップS203)。例えば、モード「前席→中席モード」には、中席に備えられたスピーカ30bが対応する。
【0098】
なお、MW1223は、モードが「X席→Y席モード」のように表記されている場合、矢印の先にあるY席にあるスピーカを当該モードに対応するスピーカとみなすことができる。また、モード情報に、モードに対応するスピーカを識別するための情報を示す列が追加されてもよい。
【0099】
さらに、MW1223は、特定したスピーカから音声が出力されるように、セレクタを制御する(ステップS204)。
【0100】
また、第1の実施形態と同様に、第2の実施形態においても、1つのマイクに複数のスピーカが関連付けられていてもよい。例えば、図1において、前席のマイク20aに中席のスピーカ30bと後席のスピーカ30cが関連付けられていてもよい。
【0101】
例えば、前席の乗員がマイク20aに向かって「Hey ICC」のようにシートを特定しないようなワードを起動用ワードとして発話すると、それに続く発話が中席と後席のスピーカ30b、スピーカ30c両方から出力されるようにしてもよい(図5の「前席→中席&後席モード」に相当)。
【0102】
これにより前席の乗員が起動用ワードを使い分けることによって、車両の他の列のシートの乗員に個別に話しかけることもできるし、全員に話しかけることもできる。同様に、中席のマイク20bが、前席と後席のスピーカ30a、30cの両方に関連付けられていてもよいし(図5の「中席→前席&後席モード」に相当)、後席のマイク20cが前席と中席のスピーカ30a、30bの両方に関連付けられていてもよい(図5の「後席→前席&中席モード」に相当)。
【0103】
このように、関連付け情報は、特定のワードの種類ごとに、複数のマイクのうちのいずれか1つのマイクと、スピーカのグループに含まれるいずれかのスピーカとを関連付ける情報をさらに含む。MW1223は、関連付け情報に基づいて、音声が、グループに含まれるスピーカのうち、特定のワードの種類に対応するスピーカから出力されるように制御する。これにより、1つのマイクからスピーカのグループに対して音声を出力させることができる。
【0104】
ここで、第1の実施形態と第2の実施形態を対比する。まず、第1の実施形態は、1つのマイクに対し、1つのスピーカが対応付けられていることから、以下のように表現される。
【0105】
複数のマイクおよび複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、関連付け情報は、第1の座席(例えば前席)に対応して備えられたマイクに、第2の座席(例えば後席)に対応して備えられたスピーカを関連付ける情報を含む。
【0106】
一方、第2の実施形態は、1つのマイクに対し、複数のスピーカが対応付けられていることがあるため、以下のように表現される。
【0107】
複数のマイクおよび複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、関連付け情報は、第1の座席に対応して備えられたマイクに、第1の座席を除く座席に対応して備えられたスピーカのグループを関連付ける情報が含まれる。
【0108】
[第3の実施形態]
第3の実施形態では、マイクとスピーカがあらかじめ対応付けられ、スピーカから出力された発話に対して、対応するマイクから返答をすることが可能になる。
【0109】
ここでは、マイク20a_Rは、第3のマイクの一例である。また、マイク20b_Rは、第4のマイクの一例である。また、スピーカ30aは、第3のスピーカの一例である。また、スピーカ30bは、第4のスピーカの一例である。
【0110】
また、前席のマイク20a_Rと前席のスピーカ30aはあらかじめ対応付けられているものとする。また、中席のマイク20b_Rと中席のスピーカ30bはあらかじめ対応付けられているものとする。マイクとスピーカを対応付けるための情報は、モード情報に含まれていてもよい。第3の実施形態では、MW1223は、例えば以下のような制御を行う。
【0111】
ここでは、関連付け情報は、複数のマイクと複数のスピーカのうちの、第3のマイクと第4のスピーカ、および、第4のマイクと第3のスピーカとを関連付ける情報を含む。MW1223は、ASR1222によって、第3のマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、第3のマイクに、特定のワードに続いて入力された音声が、第4のスピーカから出力されるように制御する。MW1223は、ASR1222によって、第4のスピーカから音声が出力された後、関連付け情報に基づいて、第4のスピーカと対応付けられた第4のマイクに入力された音声が、第3のマイクと対応付けられた第3のスピーカから出力されるように制御する。
【0112】
また、第3の実施形態では、ピーカは、車室内の複数の座席にそれぞれ対応して備えられており、第3のマイクおよび第3のスピーカは、第1の座席に対応して備えられ、第4のマイクおよび第4のスピーカは、第2の座席に対応して備えられれている。
【0113】
さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細及び代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲及びその均等物によって定義される総括的な発明の概念の精神又は範囲から逸脱することなく、様々な変更が可能である。
【符号の説明】
【0114】
Ua、Ub 搭乗者
V 車両
1 車内通話システム
10 車内通話装置
11 ADコンバータ
12 ヘッドユニット
13 アンプ
20a_R、20a_L、20b_R、20b_L、20c_R、20c_L マイク
30a、30b、30c スピーカ
121 DSP
122 SoC
1221 ECNR
1222 ASR
1223 MW
1224 メモリ
1225 ICC-1way
1226、1301 セレクタ
図1
図2
図3
図4
図5
図6