特開2023-179267 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通テン株式会社の特許一覧

特開2023-179267車内通話装置及び車内通話方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023179267

(43)【公開日】2023-12-19

(54)【発明の名称】車内通話装置及び車内通話方法

(51)【国際特許分類】

G10L 15/22 20060101AFI20231212BHJP

G10L 15/10 20060101ALI20231212BHJP

H04R 3/00 20060101ALI20231212BHJP

H04R 3/12 20060101ALI20231212BHJP

G06F 3/16 20060101ALI20231212BHJP

G06F 3/01 20060101ALI20231212BHJP

【ＦＩ】

G10L15/22 453

G10L15/10 200W

H04R3/00 320

H04R3/12 A

G06F3/16 650

G06F3/01 510

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2022092489

(22)【出願日】2022-06-07

(71)【出願人】

【識別番号】000237592

【氏名又は名称】株式会社デンソーテン

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】引間勝昭

【テーマコード（参考）】

5D220

5E555

【Ｆターム（参考）】

5D220AA12

5D220BA01

5D220CC06

5E555AA46

5E555BA23

5E555BB23

5E555BC04

5E555CA47

5E555CB64

5E555CC01

5E555DA21

5E555DA31

5E555EA23

5E555FA00

(57)【要約】

【課題】車両の前席と後席との間で双方向の通話のための処理負荷を低減すること。
【解決手段】実施形態に係る車内通話装置は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、音声に含まれるワードを認識する音声認識部と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリと、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。
【選択図】図２

【特許請求の範囲】

【請求項1】

車室内に備えられた複数のマイクのいずれかに入力された音声を、前記車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、
音声に含まれるワードを認識する音声認識部と、
前記複数のマイクと前記複数のスピーカを関連付ける関連付け情報を記憶したメモリと、
を備え、
前記コントローラは、前記音声認識部によって、前記複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記音声が入力されたマイクに、前記特定のワードに続いて入力された音声が、前記複数のスピーカのうち、前記音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する
車内通話装置。

【請求項2】

前記関連付け情報は、前記複数のマイクと前記複数のスピーカのうちの、第１のマイクと第２のスピーカ、および、第２のマイクと第１のスピーカとを関連付ける情報を含み、
前記コントローラは、
前記音声認識部によって、前記第１のマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記第１のマイクに、前記特定のワードに続いて入力された音声が、前記第２のスピーカから出力されるように制御し、
前記音声認識部によって、前記第２のマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記第２のマイクに、前記特定のワードに続いて入力された音声が、前記第１のスピーカから出力されるように制御する
請求項１に記載の車内通話装置。

【請求項3】

前記関連付け情報は、前記複数のマイクのうちのいずれか１つのマイクと、前記複数のスピーカに含まれるスピーカのグループとを関連付ける情報を含み、
前記コントローラは、前記音声認識部によって、前記複数のマイクのいずれかのマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記音声が入力されたマイクに、前記特定のワードに続いて入力された音声が、前記複数のスピーカのうち、前記音声が入力されたマイクと関連付けられたスピーカのグループから出力されるように制御する
請求項１に記載の車内通話装置。

【請求項4】

前記関連付け情報は、前記特定のワードの種類ごとに、前記複数のマイクのうちのいずれか１つのマイクと、前記スピーカのグループに含まれるいずれかのスピーカとを関連付ける情報をさらに含み、
前記コントローラは、前記関連付け情報に基づいて、前記音声が、前記グループに含まれるスピーカのうち、前記特定のワードの種類に対応するスピーカから出力されるように制御する
請求項３に記載の車内通話装置。

【請求項5】

前記関連付け情報は、前記複数のマイクと前記複数のスピーカのうちの、第３のマイクと第４のスピーカ、および、第４のマイクと第３のスピーカとを関連付ける情報を含み、
前記コントローラは、
前記音声認識部によって、前記第３のマイクに入力された音声に前記特定のワードが含まれていることが認識された場合、前記関連付け情報に基づいて、前記第３のマイクに、前記特定のワードに続いて入力された音声が、前記第４のスピーカから出力されるように制御し、
前記音声認識部によって、前記第４のスピーカから音声が出力された後、前記関連付け情報に基づいて、前記第４のスピーカと対応付けられた前記第４のマイクに入力された音声が、前記第３のマイクと対応付けられた前記第３のスピーカから出力されるように制御する
請求項１に記載の車内通話装置。

【請求項6】

前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記関連付け情報は、第１の座席に対応して備えられたマイクに、第２の座席に対応して備えられたスピーカを関連付ける情報を含む
請求項１に記載の車内通話装置。

【請求項7】

前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記第１のマイクおよび前記第１のスピーカは、第１の座席に対応して備えられ、前記第２のマイクおよび前記第２のスピーカは、第２の座席に対応して備えられている
請求項２に記載の車内通話装置。

【請求項8】

前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記関連付け情報は、第１の座席に対応して備えられたマイクに、第１の座席を除く座席に対応して備えられたスピーカのグループを関連付ける情報が含まれる
請求項３に記載の車内通話装置。

【請求項9】

前記複数のマイクおよび前記複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、前記第３のマイクおよび前記第３のスピーカは、第１の座席に対応して備えられ、前記第４のマイクおよび前記第４のスピーカは、第２の座席に対応して備えられている
請求項５に記載の車内通話装置。

【請求項10】

車室内に備えられた複数のマイクのいずれかに入力された音声を、前記車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラによって実行される車内通話方法であって、
車室内に備えられた複数のマイクのいずれかに入力された音声に特定のワードが含まれている場合、前記複数のマイクと前記複数のスピーカを関連付ける関連付け情報に基づき、前記音声が入力されたマイクに、前記特定のワードに続いて入力された音声を、
前記音声が入力されたマイクと関連付けられたスピーカから出力させる
車内通話方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、車内通話装置及び車内通話方法に関する。

【背景技術】

【0002】

近年、ミニバン等の大型車両で、In Car Communication（ＩＣＣ）通話の普及が進んでいる。ＩＣＣには、1Way-ICCと2Way-ICCの２種類の機能がある。1Way-ICCは、前席で収集された音声を後席のスピーカから出力させる機能である。

【0003】

一方、2Way-ICCは、前席で収集された音声を後席のスピーカから出力させるとともに、後席で収集された音声を前席のスピーカから出力させる機能である。2Way-ICCによれば、前席と後席との間で双方向の通話が可能となる。

【0004】

2Way-ICCは、カーオーディオやカーナビゲーション等の車載機器に搭載されたコントローラ（例えばＣＰＵ）に、「2way-ICCソリューション」と呼ばれるプログラムを実行させることで実現される。

【0005】

なお、ここでいう「ソリューション」とは機能（ここではＩＣＣ機能）を実行するための「手段」を指し、上述のようにコントローラが実行するプログラムとして実装されるものに限らず、ＡＳＩＣ（application specific integrated circuit）、ＦＰＧＡ（field-programmable gate array）、その他のデジタル回路・アナログ回路等のハードウェアにより実装されるものも含まれるものとする（以下同じ）。

【先行技術文献】

【特許文献】

【0006】

【特許文献1】国際公開第２０１８／１６７９４９号

【特許文献2】特開２００６－１０１０４８号公報

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかしながら、従来の技術では、車両の前席と後席との間で双方向の通話を実現するための処理負荷が大きいという問題がある。

【0008】

例えば、2way-ICCソリューションは、双方向の通話を実現するため、前席のマイクと後席のマイクに対応した２つの入力チャンネル、及び前席のスピーカと後席のスピーカに対応した２つの出力チャンネルを備える。

【0009】

そして、2way-ICCソリューションは、前席のスピーカから出力される音声と、後席のスピーカから出力される音声のそれぞれについて、エコーキャンセルを行う。

【0010】

このように、2way-ICCソリューションは、２つのチャンネルの音声に対して、ＣＰＵ（Central Processing Unit）負荷が大きいエコーキャンセルを行うことになる。また、ＩＣＣ機能をハードウェアで実装する場合には、チャンネル数分のエコーキャンセラを備える必要があり、回路規模が大きくなる。

【0011】

本発明は、上記に鑑みてなされたものであって、車両の前席と後席との間で双方向の通話のためのエコーキャンセラの処理負荷を低減し、あるいは回路規模の増大を抑制することができる車内通話装置及び車内通話方法を提供することを目的とする。

【課題を解決するための手段】

【0012】

上述した課題を解決し、目的を達成するために、本発明に係る車内通話装置は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、音声に含まれるワードを認識する音声認識部と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリと、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。

【発明の効果】

【0013】

本発明によれば、車両の前席と後席との間で双方向の通話のための処理負荷を低減することができる。

【図面の簡単な説明】

【0014】

【図1】図１は、第１の実施形態の車両の構成例を示す図である。

【図2】図２は、第１の実施形態の車内通話システムの構成例を示す図である。

【図3】図３は、第１の実施形態のモード情報の例を示す図である。

【図4】図４は、第１の実施形態の車内通話方法の手順を示すフローチャートである。

【図5】図５は、第２の実施形態のモード情報の例を示す図である。

【図6】図６は、第２の実施形態の車内通話方法の手順を示すフローチャートである。

【発明を実施するための形態】

【0015】

以下、添付図面を参照して、本願の開示する車内通話装置及び車内通話方法の実施形態を詳細に説明する。なお、以下に示す実施形態により本発明が限定されるものではない。

【0016】

［第１の実施形態］
まず、図１を用いて、実施形態の車両について説明する。図１は、第１の実施形態の車両の構成例を示す図である。

【0017】

図１に示すように、車両Ｖは、３列の座席を備えた、６～８人乗りの車両である。車両Ｖは、車内通話装置１０を有する。

【0018】

車内通話装置１０は、各座席に搭乗した乗員間での会話を支援するための装置である。例えば、車内通話装置１０は、マイクに入力された音声を特定のスピーカから出力させる。

【0019】

また、車室内には、各座席に対応するマイクロホン（以下、マイク）が備えられる。また、車室内には、座席の各列に対応するスピーカが備えられる。

【0020】

前列（運転席がある列）の右側の座席（以下、前席右）には、マイク２０ａ＿Ｒが備えられる。また、前列の左側の座席（以下、前席左）には、マイク２０ａ＿Ｌが備えられる。

【0021】

中列（前列の１つ後の列）の右側の座席（以下、中席右）には、マイク２０ｂ＿Ｒが備えられる。また、中列の左側の座席（以下、中席左）には、マイク２０ｂ＿Ｌが備えられる。

【0022】

後列（中列の１つ後の列）の右側の座席（以下、後席右）には、マイク２０ｃ＿Ｒが備えられる。また、後列の左側の座席（以下、後席左）には、マイク２０ｃ＿Ｌが備えられる。

【0023】

また、前列、中列及び後列には、それぞれスピーカ３０ａ、スピーカ３０ｂ及びスピーカ３０ｃが備えられる。

【0024】

車内通話システム１は、車内通話装置１０と、上記のマイク及びスピーカとを含むシステムである。

【0025】

例えば、前席右の乗員と中席右の乗員とが通話をする場合、車内通話装置１０は、マイク２０ａ＿Ｒに入力された音声をスピーカ３０ｂに出力させ、マイク２０ｂ＿Ｒに入力された音声をスピーカ３０ａに出力させればよい。

【0026】

従来は、このような双方向の通話を実現するために、処理負荷が大きい2way-ICCソリューションが利用されていた。

【0027】

一方、第１の実施形態の車内通話装置１０は、1way-ICCソリューションによって双方向の通話を実現することで、処理負荷を低減させる。

【0028】

図２を用いて、車内通話システム１の構成及び処理を説明する。図２は、第１の実施形態の車内通話システムの構成例を示す図である。

【0029】

図２に示すように、車内通話装置１０には、マイク２０ａ＿Ｒ、マイク２０ａ＿Ｌ、マイク２０ｂ＿Ｒ及びマイク２０ｂ＿Ｌから音声が入力される。この場合、車内通話装置１０には、４チャンネルの音声が入力される。

【0030】

車内通話装置１０に入力される音声のチャンネル数は、図２に示すものに限られない。例えば、車内通話装置１０には、マイク２０ｃ＿Ｒ及びマイク２０ｃ＿Ｌから音声が入力される場合がある。

【0031】

また、車内通話装置１０は、スピーカ３０ａ及びスピーカ３０ｂに音声を出力させる。車内通話装置１０は、さらにスピーカ３０ｃに音声を出力させてもよい。

【0032】

また、車内通話装置１０は、カーナビゲーションシステムの一部の機能として実現されてもよい。また、車内通話装置１０は、カーナビゲーションシステムの音声認識等の機能を利用するものであってもよい。

【0033】

図２の例では、搭乗者Ｕａは、マイク２０ａ＿Ｒ及びスピーカ３０ａが対応付けられた前席右に搭乗しているものとする。また、搭乗者Ｕｂは、マイク２０ｂ＿Ｒが対応付けられた中席右に搭乗しているものとする。

【0034】

車内通話装置１０は、ＡＤ（Analog to Digital）コンバータ１１、ヘッドユニット１２及びアンプ１３を有する。

【0035】

ＡＤコンバータ１１は、入力されたアナログの音声信号をデジタルの音声信号に変換し、ヘッドユニット１２に出力する。例えば、ＡＤコンバータ１１は、アナログの音声信号をサンプリング周波数（Ｆｓ）が４８ｋＨｚ、量子化ビット数が２４ｂｉｔのデジタルの音声信号に変換する。

【0036】

また、ＡＤコンバータ１１とヘッドユニット１２との間のインタフェースにおいて、ＡＤコンバータ１１がスレーブ側であり、ヘッドユニット１２がマスター側である。

【0037】

ヘッドユニット１２は、ＤＳＰ（Digital Signal Processor）１２１及びＳｏＣ（System on a Chip）１２２を有する。

【0038】

ＳｏＣ１２２は、コントローラの一例である。ＳｏＣ１２２は、例えば後述するＭＷ１２２３の処理によってコントローラとして機能する。

【0039】

ＤＳＰ１２１は、ＡＤコンバータ１１から受け取ったデジタルの音声信号に対してフィルタリング等の処理を行い、当該処理後の音声信号をＳｏＣ１２２に出力する。

【0040】

ここで、ＳｏＣ１２２に入力された音声信号は、ＨａｒｄＳＲＣ（Sampling Rate Converter）によってサンプリング周波数が４８ｋＨｚから２４ｋＨｚに変換され、量子化ビット数が２４ｂｉｔから１６ｂｉｔに変換される。

【0041】

また、ＳｏＣ１２２から出力される音声信号は、ＨａｒｄＳＲＣによってサンプリング周波数が２４ｋＨｚから４８ｋＨｚに変換され、量子化ビット数が１６ｂｉｔから２４ｂｉｔに変換される。

【0042】

ＳｏＣ１２２は、ＥＣＮＲ（Echo Canceller and Noise Reduction）１２２１、ＡＳＲ（Automatic Speech Recognition）１２２２、ＭＷ（Middleware）１２２３、ICC-1way１２２５、及びセレクタ１２２６を有する。なお、ＳｏＣ１２２の各部は、プログラムによって実現される。

【0043】

ＥＣＮＲ１２２１は、車両Ｖの走行音等のノイズの除去を行う。

【0044】

ＡＳＲ１２２２は、音声認識を行う。例えば、ＡＳＲ１２２２は、深層学習モデルを用いて音声信号をテキストに変換する。そして、ＡＳＲ１２２２は、テキストに特定のワードが含まれていることを認識することができる。ＡＳＲ１２２２は、音声認識部の一例である。

【0045】

ＭＷ１２２３は、セレクタ１２２６を制御する。さらに、ＭＷ１２２３は、後述するアンプ１３のセレクタ１３０１を制御する。

【0046】

ICC-1way１２２５は、1way-ICCソリューションである。例えば、ICC-1way１２２５は、１つのチャンネルの音声信号についてエコーキャンセルを行う。ICC-1way１２２５は、2way-ICCソリューションと比べて処理負荷が小さい。

【0047】

また、ICC-1way１２２５に入力される音声信号のチャンネルは、ICC-1way１２２５の前段に備えられたセレクタ１２２６によって決定される。複数（図２の例では４つ）のチャンネルの音声信号のうち、セレクタ１２２６によって選ばれた１つのチャンネルの音声信号がICC-1way１２２５に入力される。

【0048】

アンプ１３は、ヘッドユニット１２から出力されたデジタルの音声信号に対してＥＱ（イコライズ）を行い、デジタルの音声信号をアナログの音声信号に変換し、変換した音声信号をパワーアンプ（Ｐ－ＩＣ）により増幅し、スピーカに音声を出力させる。

【0049】

また、アンプ１３は、ICC-1way１２２５からの音声信号を、いずれかのスピーカにつながる経路にＭＩＸする。また、ＭＩＸの前段にはセレクタ１３０１が備えられる。

【0050】

セレクタ１３０１は、ICC-1way１２２５からの音声信号を、いずれのスピーカから出力させるかを選択することができる。

【0051】

なお、アンプ１３とヘッドユニット１２との間のインタフェース（ＩＮＩＣ：Intelligent Network Interface Controller）において、アンプ１３がスレーブ側であり、ヘッドユニット１２がマスター側である。

【0052】

ＭＷ１２２３によるセレクタ（セレクタ１２２６及びセレクタ１３０１）の制御方法を説明する。なお、ここで説明する各処理の主体は、ＭＷ１２２３ではなく、ＳｏＣ１２２又はコントローラ等に言い換えられてもよい。

【0053】

これまで説明したように、セレクタ（セレクタ１２２６及びセレクタ１３０１）は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを切り替えることができる。

【0054】

ＭＷ１２２３は、図３に示すようなモード情報に応じて、セレクタが選択するチャンネルを制御する。モード情報はメモリ１２２４に記憶されているものとする。図３は、第１の実施形態のモード情報の例を示す図である。また、図３のモード情報は、マイクを識別する情報と（マイクｃｈ）と座席の位置（シートポジション）を対応付けたテーブルに、モードを示す列が追加されたものであってもよい。

【0055】

モード情報は、マイクとモードを対応付けた情報である。言い替えればモード情報は１つのマイクに入力された音声がどのスピーカから出力されるべきかを示す情報でり、車両に搭載された複数のマイクと複数のスピーカとを対応付ける情報である。

【0056】

まず、ＡＳＲ１２２２による認識対象のワードのリストである音声辞書には、セレクタを制御するための特定のワードが事前に追加される。例えば、特定のワードとして、「ＨｅｙＩＣＣ」（ヘイアイシーシー）というワードが音声辞書に追加されているものとする。

【0057】

ＭＷ１２２３は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラの一例である。車内通話装置１０は、ＭＷ１２２３に加え、音声に含まれるワードを認識する音声認識部（ＡＳＲ１２２２）と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリ１２２４と、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。モード情報は、関連付け情報の一例である。

【0058】

ここで、マイク２０ａ＿Ｒが１ｃｈに対応し、マイク２０ａ＿Ｌが２ｃｈに対応し、マイク２０ｂ＿Ｒが３ｃｈに対応し、マイク２０ａ＿Ｌが４ｃｈに対応している。

【0059】

ＡＳＲ１２２２は、ＳｏＣ１２２に入力された１ｃｈ、２ｃｈ、３ｃｈ、４ｃｈの音声信号のそれぞれについて音声認識を行う。

【0060】

ＭＷ１２２３は、ＡＳＲ１２２２によって「ＨｅｙＩＣＣ」が認識されたチャンネルの音声信号がICC-1way１２２５に入力されるように、セレクタ１２２６を制御する。

【0061】

ここで、ＭＷ１２２３は、モード情報を参照し、「ＨｅｙＩＣＣ」が認識されたチャンネルに対応するモードを特定する。

【0062】

例えば、モード情報におけるマイクｃｈが「１ｃｈ」であり、モードが「前席→中席モード」である場合、ＭＷ１２２３は、中席側のスピーカ３０ｂにつながる経路に、ICC-1way１２２５からの音声信号がＭＩＸされるようにセレクタ１３０１を制御する。

【0063】

これにより、前席の搭乗者Ｕａが、「ＨｅｙＩＣＣ」と発声した後に、中席の搭乗者Ｕｂへの用件を発声すれば、当該要件の音声がスピーカ３０ｂから出力されることになる。

【0064】

マイク２０ａ＿Ｒは、第１のマイクの一例である。また、マイク２０ｂ＿Ｒは、第２のマイクの一例である。また、スピーカ３０ａは、第１のスピーカの一例である。また、スピーカ３０ｂは、第２のスピーカの一例である。なお、メモリ１２２４の関連付け情報は、複数のマイクと複数のスピーカのうちの、第１のマイクと第２のスピーカ、および、第２のマイクと第１のスピーカとを関連付ける情報を含む。図２のモード情報によれば、ＭＷ１２２３は、例えば以下のような制御を行う。

【0065】

ＭＷ１２２３は、ＡＳＲ１２２２によって、マイク２０ａ＿Ｒ（マイクｃｈ：１ｃｈ）に入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、マイク２０ａ＿Ｒに、特定のワードに続いて入力された音声が、スピーカ３０ｂから出力されるように制御する（モード：前席→中席モード）。

【0066】

ＭＷ１２２３は、ＡＳＲ１２２２によって、マイク２０ｂ＿Ｒ（マイクｃｈ：３ｃｈ）に入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、マイク２０ｂ＿Ｒに、特定のワードに続いて入力された音声が、スピーカ３０ａから出力されるように制御する（モード：中席→前席モード）。

【0067】

このように、ＭＷ１２２３は、車室内に備えられた複数のマイクのいずれかに入力された音声に特定のワードが含まれている場合、音声が入力されたマイクにさらに入力された音声を、1wayのＩＣＣソリューションであるICC-1way１２２５に入力する。そして、ＭＷ１２２３は、ICC-1way１２２５から出力される音声を、マイクと関連付けられたスピーカから出力させる。

【0068】

また、ここでは、複数のマイクおよび複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、第１マイクおよび第１のスピーカは、第１の座席（例えば前席）に対応して備えられ、第２マイクおよび第２のスピーカは、第２の座席（例えば後席）に対応して備えられている。

【0069】

図４を用いて、第１の実施形態の車内通話方法の手順を説明する。図４は、第１の実施形態の車内通話方法の手順を示すフローチャートである。

【0070】

まず、図４に示すように、ＡＳＲ１２２２は、複数のマイクから入力された音声のそれぞれについて音声認識を行う（ステップＳ１０１）。

【0071】

ここで、ＭＷ１２２３は、ＡＳＲ１２２２の音声に特定のワードが含まれているか否かを判定する（ステップＳ１０２）。

【0072】

例えば、ＡＳＲ１２２２は、複数のチャンネルの音声のそれぞれを基にテキストを生成し、当該テキストに「ＨｅｙＩＣＣ」が含まれている場合、対応するチャンネルをＭＷ１２２３に通知する。ＭＷ１２２３は、当該通知があった場合に、音声に特定のワードが含まれていると判定する。

【0073】

音声に特定のワードが含まれていない場合（ステップＳ１０２、Ｎｏ）、ＭＷ１２２３は、ステップＳ１０３以降の処理を行わない。また、ＡＳＲ１２２２は、ステップＳ１０１に戻り、引き続き音声認識を行う。

【0074】

一方、音声に特定のワードが含まれている場合（ステップＳ１０２、Ｙｅｓ）、ＭＷ１２２３は、モード情報を参照することによりモードを特定し、さらにモードに示されるスピーカを特定する（ステップＳ１０３）。例えば、モード「前席→中席モード」には、中席に備えられたスピーカ３０ｂが対応する。

【0075】

さらに、ＭＷ１２２３は、特定したスピーカから音声が出力されるように、セレクタを制御する（ステップＳ１０４）。

【0076】

例えば、ＭＷ１２２３は、ステップＳ１０３における音声が入力されたマイクに対応するチャンネルの音声信号がICC-1way１２２５に入力されるようにセレクタ１２２６を制御する。

【0077】

さらに、ＭＷ１２２３は、ステップＳ１０３で特定したスピーカから出力される音声信号にICC-1way１２２５から出力された音声信号がＭＩＸされるようにセレクタ１３０１を制御する。

【0078】

上述してきたように、実施形態に係る車内通話装置１０は、車室内に備えられた複数のマイクのいずれかに入力された音声を、車室内に備えられた複数のスピーカのいずれから出力させるかを制御するコントローラと、音声に含まれるワードを認識する音声認識部と、複数のマイクと複数のスピーカを関連付ける関連付け情報を記憶したメモリと、を備える。コントローラは、音声認識部によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカから出力されるように制御する。

【0079】

なお、１つのマイクに複数のスピーカが関連付けられていてもよい。例えば、図１において、前席のマイク２０ａに中席のスピーカ３０ｂと後席のスピーカ３０ｃが関連付けられていてもよい。この場合、前席の乗員がマイク２０ａに向かって「ＨｅｙＩＣＣ」と発話すると、それに続く発話が中席と後席のスピーカ３０ｂ、スピーカ３０ｃ両方から出力されることになる。これにより前席の乗員が車両の他の列のシートの乗員全員に話しかけることができる。同様に、中席のマイク２０ｂが、前席と後席のスピーカ３０a、３０ｃの両方に関連付けられていてもよいし、後席のマイク２０ｃが前席と中席のスピーカ３０a、３０ｂの両方に関連付けられていてもよい。

【0080】

第１の実施形態では、2way-ICCソリューションよりも処理負荷が小さい1way-ICCソリューションを使って車両の前席と後席との間で双方向の通話を実現しているため、処理負荷が低減される。また、ICC機能をハードウェアで実装する場合には回路規模が小さくて済む。

【0081】

また、2way-ICCソリューションは、1way-ICCソリューションよりも高価であるため、第１の実施形態によれば低コスト化を図ることができる。

【0082】

さらに、2way-ICCソリューションの場合、2way-ICCソリューションから出力される音声信号をアンプに送信するためのインタフェースチャンネルを、２つ設ける必要がある。一方、第１の実施形態では、1way-ICCソリューションから出力される音声信号をアンプに送信するためのインタフェースチャンネルが１つあればよい。

【0083】

音声信号を送信するためのインタフェースチャンネルが増えると、通信にかかる負荷が大きくなる。

【0084】

第１の実施形態によれば、通信にかかる負荷も抑止できる。

【0085】

また、インタフェースの増加を物理的なワイヤーハーネスの増設により実現する場合であっても、第１の実施形態によればワイヤーハーネスにかかる費用を抑えるという効果が得られる。

【0086】

［第２の実施形態］
第２の実施形態では、マイクだけでなく、認識されたワードに応じて出力先のスピーカが特定される。これにより、図１に示すような３列の座席を備えた車両において、前席と中席だけでなく、前席と後席、中席と後席といった任意の組み合わせの座席間で通話を行うことができる。

【0087】

第２の実施形態では、関連付け情報は、複数のマイクのうちのいずれか１つのマイクと、複数のスピーカに含まれるスピーカのグループとを関連付ける情報を含む。ＭＷ１２２３は、ＡＳＲ１２２２によって、複数のマイクのいずれかのマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、音声が入力されたマイクに、特定のワードに続いて入力された音声が、複数のスピーカのうち、音声が入力されたマイクと関連付けられたスピーカのグループから出力されるように制御する。

【0088】

第２の実施形態では、図５のようなモード情報が用いられる。図５は、第２の実施形態のモード情報の例を示す図である。ＭＷ１２２３は、音声から認識されたワードが、モード情報の起動用ワードに含まれる場合、マイクと当該ワードに対応するモードを特定する。

【0089】

例えば、１ｃｈに対応する前席右にあるマイク２０ａ＿Ｒに入力された音声から、「Ｈｅｙ中席」（ヘイチュウセキ）というワードが認識された場合、ＭＷ１２２３は、モード情報を参照し、モードが「前席→中席モード」であることを特定する。この場合、ＭＷ１２２３は、中席に対応するスピーカ３０ｂから音声が出力されるようにセレクタを制御する。

【0090】

また、例えば、４ｃｈに対応する中席左にあるマイク２０ｂ＿Ｌに入力された音声から、「Ｈｅｙ後席」（ヘイコウセキ）というワードが認識された場合、ＭＷ１２２３は、モード情報を参照し、モードが「中席→後席モード」であることを特定する。この場合、ＭＷ１２２３は、後席に対応するスピーカ３０ｃから音声が出力されるようにセレクタを制御する。

【0091】

また、例えば、５ｃｈに対応する後席右にあるマイク２０ｃ＿Ｒに入力された音声から、「Ｈｅｙ中席」（ヘイチュウセキ）というワードが認識された場合、ＭＷ１２２３は、モード情報を参照し、モードが「後席→中席モード」であることを特定する。この場合、ＭＷ１２２３は、中席に対応するスピーカ３０ｂから音声が出力されるようにセレクタを制御する。

【0092】

図６を用いて、第２の実施形態の車内通話方法の手順を説明する。図６は、第２の実施形態の車内通話方法の手順を示すフローチャートである。

【0093】

まず、図６に示すように、ＡＳＲ１２２２は、複数のマイクから入力された音声のそれぞれについて音声認識を行う（ステップＳ２０１）。

【0094】

ここで、ＭＷ１２２３は、ＡＳＲ１２２２の音声に、特定のワード（モード情報の起動用ワード）が含まれているか否かを判定する（ステップＳ２０２）。

【0095】

例えば、ＡＳＲ１２２２は、複数のチャンネルの音声信号のそれぞれを基にテキストを生成し、当該テキストに起動用ワードのいずれか（「Ｈｅｙ前席」、「Ｈｅｙ中席」、「Ｈｅｙ後席」のいずれか）が含まれている場合、対応するチャンネルをＭＷ１２２３に通知する。ＭＷ１２２３は、当該通知があった場合に、音声に特定のワードが含まれていると判定する。

【0096】

音声に特定のワードが含まれていない場合（ステップＳ２０２、Ｎｏ）、ＭＷ１２２３は、ステップＳ２０３以降の処理を行わない。また、ＡＳＲ１２２２は、ステップＳ２０１に戻り、引き続き音声認識を行う。

【0097】

一方、音声に特定のワードが含まれている場合（ステップＳ２０２、Ｙｅｓ）、ＭＷ１２２３は、モード情報を参照することによりモードを特定し、さらにモードに示されるスピーカを特定する（ステップＳ２０３）。例えば、モード「前席→中席モード」には、中席に備えられたスピーカ３０ｂが対応する。

【0098】

なお、ＭＷ１２２３は、モードが「Ｘ席→Ｙ席モード」のように表記されている場合、矢印の先にあるＹ席にあるスピーカを当該モードに対応するスピーカとみなすことができる。また、モード情報に、モードに対応するスピーカを識別するための情報を示す列が追加されてもよい。

【0099】

さらに、ＭＷ１２２３は、特定したスピーカから音声が出力されるように、セレクタを制御する（ステップＳ２０４）。

【0100】

また、第１の実施形態と同様に、第２の実施形態においても、１つのマイクに複数のスピーカが関連付けられていてもよい。例えば、図１において、前席のマイク２０ａに中席のスピーカ３０ｂと後席のスピーカ３０ｃが関連付けられていてもよい。

【0101】

例えば、前席の乗員がマイク２０ａに向かって「ＨｅｙＩＣＣ」のようにシートを特定しないようなワードを起動用ワードとして発話すると、それに続く発話が中席と後席のスピーカ３０ｂ、スピーカ３０ｃ両方から出力されるようにしてもよい（図５の「前席→中席＆後席モード」に相当）。

【0102】

これにより前席の乗員が起動用ワードを使い分けることによって、車両の他の列のシートの乗員に個別に話しかけることもできるし、全員に話しかけることもできる。同様に、中席のマイク２０ｂが、前席と後席のスピーカ３０a、３０ｃの両方に関連付けられていてもよいし（図５の「中席→前席＆後席モード」に相当）、後席のマイク２０ｃが前席と中席のスピーカ３０a、３０ｂの両方に関連付けられていてもよい（図５の「後席→前席＆中席モード」に相当）。

【0103】

このように、関連付け情報は、特定のワードの種類ごとに、複数のマイクのうちのいずれか１つのマイクと、スピーカのグループに含まれるいずれかのスピーカとを関連付ける情報をさらに含む。ＭＷ１２２３は、関連付け情報に基づいて、音声が、グループに含まれるスピーカのうち、特定のワードの種類に対応するスピーカから出力されるように制御する。これにより、１つのマイクからスピーカのグループに対して音声を出力させることができる。

【0104】

ここで、第１の実施形態と第２の実施形態を対比する。まず、第１の実施形態は、１つのマイクに対し、１つのスピーカが対応付けられていることから、以下のように表現される。

【0105】

複数のマイクおよび複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、関連付け情報は、第１の座席（例えば前席）に対応して備えられたマイクに、第２の座席（例えば後席）に対応して備えられたスピーカを関連付ける情報を含む。

【0106】

一方、第２の実施形態は、１つのマイクに対し、複数のスピーカが対応付けられていることがあるため、以下のように表現される。

【0107】

複数のマイクおよび複数のスピーカは、車室内の複数の座席にそれぞれ対応して備えられており、関連付け情報は、第１の座席に対応して備えられたマイクに、第１の座席を除く座席に対応して備えられたスピーカのグループを関連付ける情報が含まれる。

【0108】

［第３の実施形態］
第３の実施形態では、マイクとスピーカがあらかじめ対応付けられ、スピーカから出力された発話に対して、対応するマイクから返答をすることが可能になる。

【0109】

ここでは、マイク２０ａ＿Ｒは、第３のマイクの一例である。また、マイク２０ｂ＿Ｒは、第４のマイクの一例である。また、スピーカ３０ａは、第３のスピーカの一例である。また、スピーカ３０ｂは、第４のスピーカの一例である。

【0110】

また、前席のマイク２０ａ＿Ｒと前席のスピーカ３０ａはあらかじめ対応付けられているものとする。また、中席のマイク２０ｂ＿Ｒと中席のスピーカ３０ｂはあらかじめ対応付けられているものとする。マイクとスピーカを対応付けるための情報は、モード情報に含まれていてもよい。第３の実施形態では、ＭＷ１２２３は、例えば以下のような制御を行う。

【0111】

ここでは、関連付け情報は、複数のマイクと複数のスピーカのうちの、第３のマイクと第４のスピーカ、および、第４のマイクと第３のスピーカとを関連付ける情報を含む。ＭＷ１２２３は、ＡＳＲ１２２２によって、第３のマイクに入力された音声に特定のワードが含まれていることが認識された場合、関連付け情報に基づいて、第３のマイクに、特定のワードに続いて入力された音声が、第４のスピーカから出力されるように制御する。ＭＷ１２２３は、ＡＳＲ１２２２によって、第４のスピーカから音声が出力された後、関連付け情報に基づいて、第４のスピーカと対応付けられた第４のマイクに入力された音声が、第３のマイクと対応付けられた第３のスピーカから出力されるように制御する。

【0112】

また、第３の実施形態では、ピーカは、車室内の複数の座席にそれぞれ対応して備えられており、第３のマイクおよび第３のスピーカは、第１の座席に対応して備えられ、第４のマイクおよび第４のスピーカは、第２の座席に対応して備えられれている。

【0113】

さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細及び代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲及びその均等物によって定義される総括的な発明の概念の精神又は範囲から逸脱することなく、様々な変更が可能である。

【符号の説明】

【0114】

Ｕａ、Ｕｂ搭乗者
Ｖ車両
１車内通話システム
１０車内通話装置
１１ＡＤコンバータ
１２ヘッドユニット
１３アンプ
２０ａ＿Ｒ、２０ａ＿Ｌ、２０ｂ＿Ｒ、２０ｂ＿Ｌ、２０ｃ＿Ｒ、２０ｃ＿Ｌマイク
３０ａ、３０ｂ、３０ｃスピーカ
１２１ＤＳＰ
１２２ＳｏＣ
１２２１ＥＣＮＲ
１２２２ＡＳＲ
１２２３ＭＷ
１２２４メモリ
１２２５ ICC-1way
１２２６、１３０１セレクタ

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版