特開2024-148421 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＪＶＣケンウッドの特許一覧

特開2024-148421通信装置、通信方法、及び通信プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024148421

(43)【公開日】2024-10-18

(54)【発明の名称】通信装置、通信方法、及び通信プログラム

(51)【国際特許分類】

H04M 1/00 20060101AFI20241010BHJP

【ＦＩ】

H04M1/00 H

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2023061531

(22)【出願日】2023-04-05

(71)【出願人】

【識別番号】308036402

【氏名又は名称】株式会社ＪＶＣケンウッド

(74)【代理人】

【識別番号】100083806

【弁理士】

【氏名又は名称】三好秀和

(74)【代理人】

【識別番号】100111235

【弁理士】

【氏名又は名称】原裕子

(74)【代理人】

【識別番号】100170575

【弁理士】

【氏名又は名称】森太士

(72)【発明者】

【氏名】佐藤真樹

(72)【発明者】

【氏名】清水薫

(72)【発明者】

【氏名】在原康貴

(72)【発明者】

【氏名】榎本徳明

(72)【発明者】

【氏名】小野時成

【テーマコード（参考）】

5K127

【Ｆターム（参考）】

5K127FA07

5K127GB72

5K127MA10

(57)【要約】

【課題】発言するユーザの発言速度が速い場合でも、このユーザの発言内容を理解し易くする。
【解決手段】他の通信装置３から送信された音声データを受信する通信部１１と、音声データの発言速度を調整する音声調整装置１２と、発言速度が調整された音声データを出力する音声出力部１４を備える。音声調整装置１２は、音声データの発言速度を算出する発言速度計算部２４と、発言速度が所定の目標速度Ｓ以上である場合には、発言速度を目標速度Ｓに変更し、目標速度Ｓ未満である場合には、発言速度を変更せずに、音声データを読み出す読み出し制御部２６を備える。
【選択図】図２

【特許請求の範囲】

【請求項1】

ネットワークを経由して他の通信装置との通信が可能な通信装置であって、
前記他の通信装置から送信された音声データを受信する通信部と、
前記音声データの発言速度を調整する音声調整装置と、
前記発言速度が調整された音声データを出力する音声出力部と、
を備え、
前記音声調整装置は、
前記音声データの発言速度を算出する発言速度計算部と、
前記発言速度が所定の目標速度以上である場合には、発言速度を前記目標速度に変更し、前記目標速度未満である場合には、発言速度を変更せずに、前記音声データを読み出す読み出し制御部と、
を備えた通信装置。

【請求項2】

複数の前記他の通信装置のユーザのうち、一のユーザの発言が終了し、他のユーザが発言を開始するまでの無音時間を計測し、発言したユーザについて、所定期間中の前記無音時間の代表値である第１の値を算出する無音時間計測部、を更に備え、
前記読み出し制御部は、いずれかのユーザの前記第１の値が、所定の許容無音時間以上の場合に、前記目標速度を低下させる
請求項１に記載の通信装置。

【請求項3】

複数の前記他の通信装置のユーザのうち、一のユーザの発言が終了し、他のユーザが発言を開始するまでの無音時間を計測し、発言したユーザについて、所定期間中の前記無音時間の代表値である第１の値を計測し、また、全てのユーザについての前記第１の値に基づいて算出される代表値を示す第２の値を算出する無音時間計測部、を備え、
前記読み出し制御部は、いずれかのユーザの前記第１の値と、前記第２の値との差分が、所定の指標時間以上である場合には、前記目標速度を低下させる
請求項１または２に記載の通信装置。

【請求項4】

ネットワークを経由して他の通信装置との間で通信する通信方法であって、
前記他の通信装置から送信された音声データを受信するステップと、
前記音声データを記憶するステップと、
前記音声データの発言速度を計測するステップと、
前記発言速度が所定の目標速度以上である場合には、発言速度を前記目標速度に変更し、前記目標速度未満である場合には、発言速度を変更せずに、前記音声データを読み出すステップと、
前記発言速度が調整された音声データを出力するステップと、
を備えた通信方法。

【請求項5】

ネットワークを経由して他の通信装置との間で通信する処理をコンピュータに実行させる通信プログラムであって、
前記他の通信装置から送信された音声データを受信するステップと、
前記音声データを記憶するステップと、
前記音声データの発言速度を計測するステップと、
前記発言速度が所定の閾値以上である場合には、発言速度を所定の目標速度に変更し、前記閾値未満である場合には、発言速度を変更せずに、前記音声データを読み出すステップと、
前記発言速度が調整された音声データを出力するステップと、
をコンピュータに実行させる通信プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、通信装置、通信方法、及び通信プログラムに関する。

【背景技術】

【0002】

離れた場所に居る複数のユーザが音声通話するオンライン通信システムが、ビジネス用途、家族間の通話などで採用されている。通信システムは、若年層から高齢者までの幅広い年齢層のユーザが利用しており、発言するユーザの発言速度が速い場合には、他のユーザがこの発言内容を聞き取れず、発言内容を理解できないことがある。

【0003】

特許文献１には、オンライン通信で複数のユーザが会話する際に、会言速度を測定し、会言速度と所定の基準速度との差分が大きいときには、発言者に対して発言速度を遅くするように提案することが開示されている。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０２１－６９０９９号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかし、特許文献１では発言速度が速い場合には、この発言するユーザに対して発言速度を遅くすることを提案することに留まっており、発言するユーザが発言速度を遅くしない場合には、他のユーザは、発言するユーザの発言内容を理解することが困難になるという問題があった。

【0006】

本発明は、このような従来の課題を解決するためになされたものであり、その目的とするところは、発言するユーザの発言速度が速い場合でも、このユーザの発言内容を理解し易くすることが可能な通信装置、通信方法、及び通信プログラムを提供することにある。

【課題を解決するための手段】

【0007】

上記目的を達成するため、本発明に係る通信装置は、ネットワークを経由して他の通信装置との通信が可能な通信装置であって、前記他の通信装置から送信された音声データを受信する通信部と、前記音声データの発言速度を調整する音声調整装置と、前記発言速度が調整された音声データを出力する音声出力部と、を備え、前記音声調整装置は、前記音声データの発言速度を算出する発言速度計算部と、前記発言速度が所定の目標速度以上である場合には、発言速度を前記目標速度に変更し、前記目標速度未満である場合には、発言速度を変更せずに、前記音声データを読み出す読み出し制御部と、を備える。

【0008】

本発明に係る通信方法は、ネットワークを経由して他の通信装置との間で通信する通信方法であって、前記他の通信装置から送信された音声データを受信するステップと、前記音声データの発言速度を計測するステップと、前記発言速度が所定の目標速度以上である場合には、発言速度を前記目標速度に変更し、前記目標速度未満である場合には、発言速度を変更せずに、前記音声データを読み出すステップと、前記発言速度が調整された音声データを出力するステップと、を備える。

【0009】

本発明に係る通信プログラムは、ネットワークを経由して他の通信装置との間で通信する処理をコンピュータに実行させる通信プログラムであって、前記他の通信装置から送信された音声データを受信するステップと、前記音声データの発言速度を計測するステップと、前記発言速度が所定の閾値以上である場合には、発言速度を所定の目標速度に変更し、前記閾値未満である場合には、発言速度を変更せずに、前記音声データを読み出すステップと、前記発言速度が調整された音声データを出力するステップと、をコンピュータに実行させる通信プログラムである。

【発明の効果】

【0010】

本発明によれば、発言するユーザの発言速度が速い場合でも、このユーザの発言内容を理解しやすくすることが可能になる。

【図面の簡単な説明】

【0011】

【図1】図１は、実施形態に係る通信装置を含むネットワーク構成を示すブロック図である。

【図2】図２は、図１に示す音声調整装置の詳細な構成を示すブロック図である。

【図3】図３は、発言速度を変更する処理の手順を示すフローチャートである。

【図4】図４は、目標速度を変更する処理の手順を示すフローチャートである。

【発明を実施するための形態】

【0012】

以下、本発明の実施形態について図面を参照して説明する。図１は実施形態に係る通信装置１を含むネットワーク構成を示すブロック図、図２は図１に示す音声調整装置１２の詳細な構成を示すブロック図である。

【0013】

図１に示すように、本実施形態に係る通信装置１は、ネットワーク２を経由して、他の複数の通信装置３-1、３-2、・・３-n（以下、総称して「通信装置３」という）に接続されており、各通信装置３との間でオンライン通信が可能とされている。例えば、通信装置１と、他の通信装置３との間でｗｅｂ（ウェブ）会議、オンライン会議、又はリモート会議（以後、これらを纏めてｗｅｂ会議と呼ぶ）による通話が可能である。

【0014】

通信装置１は、通信部１１と、音声調整装置１２と、音声入力部１３と、音声出力部１４、を備えている。

【0015】

通信部１１は、ネットワーク２を経由して他の通信装置３から送信される音声データ、画像データなどを受信する。通信部１１はまた、ユーザが音声入力部１３から音声を入力した際に、この音声データをネットワーク２を経由して他の通信装置３に送信する。

【0016】

音声調整装置１２は、他の通信装置３から送信された音声データを調整して音声出力部１４に出力する。音声調整装置１２の詳細については、図２を参照して後述する。

【0017】

音声入力部１３は、マイクロフォンを備えておりユーザが発言した音声を取得し、通信部１１に出力する。

【0018】

音声出力部１４は、スピーカを備えており音声調整装置１２で発言速度が調整された音声データを出力する。

【0019】

なお、通信装置１は、上記した構成要素１１～１４以外にも、ユーザの画像を撮像するカメラ、他の通信装置３から送信された画像データを表示するディスプレイなどを備えている。図１ではこれらの記載を省略している。

【0020】

図２に示すように、音声調整装置１２は、音声メモリ２１と、発言時間計測部２２と、発言語数計測部２３と、発言速度計算部２４と、無音時間計測部２５と、読み出し制御部２６を備えている。音声調整装置１２は、音声データの発言速度を調整する。

【0021】

図２に示すように、図１に示した通信部１１にて受信された音声データは、音声メモリ２１、発言時間計測部２２、発言語数計測部２３、及び無音時間計測部２５に入力される。

【0022】

音声メモリ２１は、音声データを取得し、発言時間計測部２２から出力される書き込みイネーブルＤ１に応じて音声データを記憶する。また、後述する読み出し制御部２６から読み出し指令が出力された際には、読み出しイネーブルＤ２に応じて音声データを読み出して、音声出力部１４（図１参照）に出力する。

【0023】

発言時間計測部２２は、音声データの波形のエンベロープを検出し、検出したエンベロープに基づき、一定以上のレベルを発言期間と判断する。発言時間計測部２２は、発言期間を書き込みイネーブルＤ１として、音声メモリ２１及び発言語数計測部２３に出力する。発言時間計測部２２は、書き込みイネーブルＤ１をカウントイネーブルとして計測し、この計測結果を発言時間Ｔ１として発言速度計算部２４に出力する。

【0024】

発言語数計測部２３は、音声データの波形から既存技術の音声認識処理により子音を判別し、書き込みイネーブルＤ１の期間中の子音をカウントする。発言語数計測部２３は、このカウント値を発言語数Ｈ１とし発言速度計算部２４に出力する。発言語数の検出は、母音と子音を検出する音声認識技術を利用した周知技術を採用することができる。本実施形態では正確な文字起こしは不要であるので、子音の個数を判別する簡易的な語数判定を採用することも可能である。

【0025】

発言速度計算部２４は、音声データの発言速度を算出する。発言速度計算部２４は、発言時間Ｔ１及び発言語数Ｈ１に基づき、下記（１）式により、発言速度Ｖ１を算出する。

【0026】

Ｖ１＝Ｈ１／Ｔ１ …（１）
発言速度計算部２４は、上記（１）式で算出した発言速度Ｖ１を、読み出し制御部２６に出力する。また、発言速度Ｖ１は、同一のユーザによる複数回の発言に対して発言速度を算出し、これらの平均値としてもよい。発言速度Ｖ１の算出方法は上記（１）式に限定されるものではなく、他の算出方法を採用してもよい。

【0027】

無音時間計測部２５は、ｗｅｂ会議において通信装置１のユーザ及び複数の他の通信装置３のユーザのうち、一のユーザの発言が終了し、他のユーザが発言を開始するまでの無音時間を計測し、発言を開始したユーザ（他のユーザ）について、所定期間中の無音時間の代表値である第１の値を算出する。「第１の値」は、例えば無音時間の平均値（平均無音時間「ＣＭpi」）である。

【0028】

所定期間は、例えば複数の通信装置の間でのオンライン通信（Ｗｅｂ会議）期間とすることができる。所定期間はこれに限定されず、ユーザにより任意に設定してもよい。

【0029】

上記した第１の値は無音時間の平均値以外にも、最大値、最小値、中央値、最頻値、標準偏差に所定値を乗じた数値を平均値に加算した数値、などを採用してもよい。なお、上記した「標準偏差に所定値を乗じた数値を平均値に加算した数値」は「（標準偏差）*（所定値ｎ）＋（平均値）」（但し、ｎは任意の実数）で算出することができる。

【0030】

無音時間計測部２５はまた、全てのユーザについての所定期間中の無音時間の代表値である第１の値に基づいて算出される代表値である第２の値を算出する。「第２の値」は、例えば各ユーザについての平均無音時間の平均値（全体の平均無音時間「ＣＭpi_all」）である。なお、第２の値は平均無音時間の平均値以外にも、最大値、最小値、中央値、最頻値、標準偏差に所定値を乗じた数値を平均値に加算した数値、などを採用してもよい。なお、平均値、中央値、最頻値を採用することが好ましい。

【0031】

無音時間計測部２５はまた、いずれかのユーザの無音時間が計測されるごとに、このユーザの平均無音時間（第１の値）を更新する。

【0032】

無音時間計測部２５はまた、全てのユーザについての無音時間が計測されるごとに、全てのユーザについての平均無音時間の平均値（全体の平均無音時間；第２の値）を更新する。

【0033】

読み出し制御部２６は、発言速度計算部２４で算出された発言速度Ｖ１に基づき、音声メモリ２１に記憶されている音声データの再生速度を調整して読み出す制御を行う。即ち、音声メモリ２１に記憶されている音声データは、読み出し制御部２６により発言速度が調整され、出力音声として出力される。「発言速度を調整する」とは、音声データの再生速度を遅くする、そのままとする、及び速くすることを含む。また、音声速度を遅くする或いはそのままとすれば、音声メモリ２１のアンダーフローを回避できる。

【0034】

読み出し制御部２６は、音声データを再生する際の目標速度Ｓを設定し、上記（１）式で算出された発言速度Ｖ１が目標速度Ｓ以上であるか否かを判定する。読み出し制御部２６は、発言速度Ｖ１が目標速度Ｓ以上である場合には、発言速度Ｖ１を目標速度Ｓに低下させて音声データを再生する。なお、目標速度Ｓは後述する条件に応じて可変とされている。

【0035】

読み出し制御部２６は、目標速度Ｓに応じた読み出しイネーブルＤ２を設定し、音声メモリ２１に出力する。具体的に、発言速度Ｖ１が目標速度Ｓ以上である場合には、読み出しイネーブルＤ２を書き込みイネーブルＤ１よりも大きく設定する。こうすることにより、入力音声に対してゆっくりとした出力音声を得ることができ、聞き取る側のユーザは、音声データを認識し易くなる。

【0036】

読み出し制御部２６は、発言速度Ｖ１が目標速度Ｓ未満である場合に、書き込みイネーブルＤ１と読み出しイネーブルＤ２を同一に設定する。即ち、入力された音声データの発言速度を変更せずに再生する。

【0037】

音声メモリ２１に記憶されている音声データの再生速度を低下させる際に、単純に読み出しクロックの速度を低下させると、これに連動して音声周波数が低下し、女性の声が男性の声に聞こえるなどの弊害が発生する。これを回避するために、クロックについては書き込み側と同一とし、アドレスをある範囲で繰り返しに読み出すという周知の方法を採用して、再生速度を低下させてもよい。読み出しイネーブルＤ２の設定方法については、既存の音程を変化させない音声速度変換技術（例えば、特開平８－３２８５８６号公報に開示されている技術）などを採用することができる。

【0038】

即ち、読み出し制御部２６は、発言速度計算部２４で算出された発言速度Ｖ１が目標速度Ｓ以上である場合には、音声データの再生速度を目標速度Ｓに変更し、発言速度Ｖ１が目標速度Ｓ未満である場合には、音声データを発言速度と同一の再生速度で出力する。

【0039】

また、読み出し制御部２６は、無音時間計測部２５で計測された各ユーザの無音時間の代表値である平均無音時間ＣＭpi（第１の値）が更新される毎、及び、全てのユーザの平均無音時間の平均値である全体の平均無音時間ＣＭpi_all（第２の値）が更新される毎に、更新された数値を取得する。読み出し制御部２６は、更新された数値に応じて、目標速度Ｓを変更する処理を行う。

【0040】

平均無音時間ＣＭpiは、無音時間をカウントする無音時間カウンタにより取得したカウント値を平均することで算出可能である。無音時間カウンタは、ｗｅｂ会議に参加している各ユーザｐ１～ｐｎについて設定されており、過去の応答時に要した無音時間の平均値を算出する。例えば、ユーザｐ２が過去に実施した会話中で、無音時間が３秒、４秒、５秒であった場合には、ユーザｐ２についての平均無音時間（これを、「ＣＭp2」とする）は、過去３回の平均値である「４秒」である。なお、平均無音時間の代わりに、無音時間の最大値、最小値、中央値、最頻値、標準偏差に所定値を乗じた数値を平均値に加算した数値、などを代表値として採用してもよい。無音時間の最大値を示す最大無音時間を採用する場合には、無音時間が３秒、４秒、５秒であった場合には、最大無音時間は５秒となる。

【0041】

読み出し制御部２６は、ユーザｐ２の平均無音時間ＣＭp2が所定の許容無音時間Ｔth（例えば、Ｔth＝５秒）以上の場合（ＣＭp2≧Ｔth）には、このユーザｐ２の平均無音時間ＣＭp2とユーザ全体の平均無音時間（これを、「ＣＭpi_all」とする）を比較する。読み出し制御部２６は、ＣＭp2とＣＭpi_allとの差分「ＣＭp2－ＣＭpi_all」が所定の指標時間ＴＭ以上である場合（（ＣＭp2－ＣＭpi_all）≧ＴＭ）には目標速度Ｓを低下させ、指標時間ＴＭ未満である場合には目標速度Ｓを変化させない。なお、上記した「ＣＭp2≧Ｔth」の場合、及び（ＣＭp2－ＣＭpi_all）≧ＴＭ」の場合、のいずれか一方の場合に目標速度Ｓを低下させてもよい。

【0042】

即ち、読み出し制御部２６は、無音時間の代表値である第１の値が、所定の許容無音時間Ｔth以上の場合に、目標速度Ｓを低下させる。また、読み出し制御部２６は、いずれかのユーザの平均無音時間（第１の値）と、全てのユーザの平均無音時間の平均値（全体の平均無音時間；第２の値）との差分が、所定の指標時間ＴＭ以上である場合には、目標速度Ｓを低下させる。

【0043】

また、読み出し制御部２６は、音声メモリ２１に記憶されるデータ量が増大し、書き込み可能な領域が減少した場合には、音声メモリ２１のオーバーフローを回避するために、音声データの速度低下を制限する。

【0044】

上述した通信装置１は、ＣＰＵ（中央処理装置）、メモリ、及び入出力部を備えるマイクロコンピュータを用いて実現可能である。通信装置１は、複数の情報処理部（通信部１１、音声入力部１３、音声出力部１４、発言時間計測部２２、発言語数計測部２３、発言速度計算部２４、発言語数計測部２３、読み出し制御部２６）として機能させるためのコンピュータプログラムを、マイクロコンピュータにインストールして実行する。これにより、通信装置１のマイクロコンピュータは、通信装置１が備える複数の情報処理部として機能する。また、ここではソフトウェアによって通信装置１を実現する例を示すが、各情報処理を実行するための専用のハードウェアを用意して、通信装置１を構成してもよい。また、通信装置１に含まれる各情報処理部が実行する情報処理を個別のハードウェアにより構成してもよい。

【0045】

次に、上記のように構成された本実施形態に係る通信装置１の動作について説明する。図３は、発言速度を変更する処理の手順を示すフローチャートである。以下、図３を参照して発言速度変更処理について説明する。

【0046】

本実施形態では、図１に示す他の通信装置３（３-1、３-2、・・３-n）から通信装置１に音声データが送信されたときに、この音声データの発言速度に応じて、再生速度を調整し、音声出力部１４から速度が調整された音声データを出力する例について説明する。

【0047】

初めに、図１に示す通信装置１、及び他の通信装置３（３-1、３-2、・・３-n）の間でｗｅｂ会議が開始されると、各通信装置のユーザどうしの会話が行われる。他の通信装置３における一のユーザが発言を開始すると、このユーザの音声データは通信装置１の通信部１１にて受信され、更に音声調整装置１２に入力される。この音声データは、図２に示す音声メモリ２１、発言時間計測部２２、発言語数計測部２３、及び無音時間計測部２５に入力される。また、目標速度Ｓは、初期的な数値に設定されている。以下では、先に発言したユーザを「ユーザｐ１」とし、この発言に続いて発言するユーザを「ユーザｐ２」として示すことにする。

【0048】

図３のステップＳ１０１において、発言時間計測部２２は、ユーザｐ１が発言した音声データに基づき、この音声データの波形エンベロープを測定する。発言時間計測部２２は、波形エンベロープが所定の閾値を超えているか否かを判定し、超えている場合には（Ｓ１０１；ＹＥＳ）、ユーザｐ１が発言を開始したものと判断し、ステップＳ１０２に処理を進める。

【0049】

ステップＳ１０２において発言時間計測部２２は、音声データの発言時間をカウントし、カウント値を「Ｔ」する。また、発言語数計測部２３は、音声データの発言語数をカウントし、カウント値を「Ｗ」とする。これらのカウント値Ｔ、Ｗを発言速度計算部２４に出力する。

【0050】

ステップＳ１０３において発言時間計測部２２は、ユーザｐ１による発言が終了したか否かを判定する。例えば、音声データの波形エンベロープが所定の閾値以下になった場合に、発言が終了したと判断する。

【0051】

ステップＳ１０４において、発言速度計算部２４は、ユーザｐ１が発言した音声データに基づき、上述した（１）式によりユーザｐ１が発言した音声データの発言速度（Ｗ/Ｔ）を算出する。読み出し制御部２６は、算出された発言速度（Ｗ/Ｔ）が目標速度Ｓ以上であるか否かを判定する。発言速度（Ｗ/Ｔ）が目標速度Ｓよりも速い場合には（Ｓ１０４；ＹＥＳ）、ステップＳ１０５に処理を進め、そうでなければ（Ｓ１０４；ＮＯ）、ステップＳ１０６に処理を進める。

【0052】

ステップＳ１０５において読み出し制御部２６は、発言速度（Ｗ/Ｔ）を目標速度Ｓとするための補正値Ａを設定する。具体的には、「Ｓ＝Ａ*（Ｗ/Ｔ）」の方程式に基づき、補正値Ａ（０＜Ａ＜１）を「Ａ＝Ｓ*（Ｔ/Ｗ）」で算出する。ユーザｐ１が発言した音声データの発言速度に補正値Ａを乗じることにより、音声メモリ２１から出力される音声データの再生速度が目標速度Ｓとなるように調整する。

【0053】

また、音声データを出力する際の再生速度が目標速度Ｓとなるように、読み出しイネーブルＤ２を設定して、音声メモリ２１に記憶されている音声データを読み出す。その結果、ユーザｐ１が発言した音声データが、目標速度Ｓに変更された再生速度で出力される。このため、ユーザｐ１が早口で発言した音声データに対して、ユーザｐ２はゆっくりとした速度で聞き取ることができる。

【0054】

ステップＳ１０６において、読み出し制御部２６は、ユーザｐ１が発言した音声データの発言速度を変更せずに音声メモリ２１に記憶されている音声データを読み出す。即ち、読み出しイネーブルＤ２を書き込みイネーブルＤ１と同一に設定する。

【0055】

上記のように、ユーザｐ１の発言による音声データの発言速度が目標速度Ｓ以上である場合には、この音声データの再生速度を目標速度Ｓまで低下させる。ユーザｐ１の発言による音声データの発言速度が目標速度Ｓ未満の場合には、この音声データをそのまま出力する。

【0056】

また、本実施形態に係る通信装置１では、ｗｅｂ会議の状況に応じて上述した目標速度Ｓを変更する処理を行う。以下、目標速度Ｓの変更処理を、図４に示すフローチャートを参照して説明する。

【0057】

初めにステップＳ２０１において発言時間計測部２２は、ｗｅｂ会議に参加しているユーザｐ１による発言の開始、終了を検出したか否かを判定する。発言の開始及び終了の検出については、図３のステップＳ１０１、Ｓ１０３に記載したように、波形エンベロープが閾値を上回ったか否かにより判定する方法を採用することができる。発言の開始、終了を検出した場合には、ステップＳ２０２に処理を進める。

【0058】

ステップＳ２０２において無音時間計測部２５は、各ユーザｐ１～ｐｎに対して設定されている無音時間カウンタＣp1、Ｃp2、・・Ｃpnのカウント値を「０」にリセットし、更に各無音時間カウンタＣp1、Ｃp2、・・Ｃpnによるカウントを開始する。「無音時間カウンタ」は、ユーザｐ１が発言を終了してから、この発言に対して他のユーザ（例えば、ユーザｐ２）が発言を開始するまでの無音時間をカウントする。

【0059】

ステップＳ２０３において発言時間計測部２２は、ユーザｐ２が発言を開始したか否かを判定する。例えば、ユーザｐ１が発言を終了し、その５秒後にユーザｐ２発言を開始した場合にはＹＥＳ判定となり、ステップＳ２０４に処理を進める。また、ユーザｐ２に対して設定されている無音時間カウンタＣp2は、５秒をカウントする。

【0060】

ステップＳ２０４において無音時間計測部２５は、各無音時間カウンタＣp1、Ｃp2、・・Ｃpnのカウントを停止する。

【0061】

ステップＳ２０５において無音時間計測部２５は、発言を開始したユーザＰｉを特定し（この例では、ユーザｐ２）、ユーザｐｉの平均無音時間ＣＭpi（この場合は、「ＣＭp2」）を更新する。

【0062】

ステップＳ２０６において読み出し制御部２６は、平均無音時間ＣＭpiが所定の許容無音時間Ｔth以上であるか否かを判定する。許容無音時間Ｔth以上である場合には（Ｓ２０６；ＹＥＳ）、ステップＳ２０７に処理を進め、そうでなければ（Ｓ２０６；ＮＯ）、ステップＳ２０９に処理を進める。なお、上記では、発言を開始したユーザＰｉの平均無音時間ＣＭpiが許容無音時間Ｔth以上であることを判定する例について示したが、全てのユーザのうちの少なくとも一人のユーザの平均無音時間（第１の値）が許容無音時間Ｔth以上となったことを判定してもよい。即ち、少なくとも一人のユーザの平均無音時間（第１の値）が許容無音時間Ｔth以上となった場合に、Ｓ２０６でＹＥＳと判定してもよい。

【0063】

許容無音時間Ｔthは、通常の会話のやりとりにおいて、ユーザｐ１の発言が終了した後に、次のユーザｐ２が発言を開始するまでの時間（無音時間）の許容値であり、例えば５秒に設定する。

【0064】

ステップＳ２０７において読み出し制御部２６は、発言を開始したユーザｐ２の平均無音時間ＣＭp2と、ユーザ全体の平均無音時間ＣＭpi_allの差分を算出し、差分がバラツキの指標時間ＴＭ以上であるか否かを判定する。差分が指標時間ＴＭ以上である場合には（Ｓ２０７；ＹＥＳ）、ステップＳ２０８に処理を進め、そうでなければ（Ｓ２０７；ＮＯ）、ステップＳ２０９に処理を進める。

【0065】

指標時間ＴＭは、各ユーザｐ１～ｐｎごとの無音時間のバラツキを示す指標となる時間である。指標時間ＴＭは、例えば５秒に設定する。例えば、あるユーザ（これをユーザｐ３とする）は、平均的に前回の発言の終了から無音時間３秒程度で発言を開始し、他のユーザ（これをユーザｐ４とする）は、平均的に無音時間５秒程度で発言を開始する、というデータがある場合には、ユーザｐ３とユーザｐ４の無音時間のバラツキは、２秒である。このバラツキは、最大でも５秒程度であるとして、例えば指標時間ＴＭを５秒に設定する。

【0066】

仮に、ｗｅｂ会議における各ユーザの発言が消極的な場合（いわゆる、会議が盛り上がっていない場合）には、ユーザ全員についての無音時間が長くなる傾向となる。このため、平均無音時間ＣＭpiは、全てのユーザｐ１～ｐｎについて長くなり、平均無音時間ＣＭpiのバラツキはほぼ変化しないと考えられる。

【0067】

一方、特定のユーザ（これを、ユーザｐ２とする）について、平均無音時間ＣＭp2が長くなった場合、即ち、ユーザ全体の平均無音時間ＣＭpi_allに対し、突出してユーザｐ２の平均無音時間ＣＭp2が長くなった場合には、この原因は会議における発言が消極的であるのではなく、ユーザｐ２がその直前に発言したユーザｐ１の発言速度が速いことにより、発言内容の認識が遅れているものと考えられる。

【0068】

そこで、無音時間のバラツキを示す指標時間ＴＭを設定して、ユーザｐ２の平均無音時間ＣＭp2と、ユーザ全体の平均無音時間ＣＭpi_allとの差分を算出し、この差分に応じて、無音時間が長くなっている原因が、会議が消極的であることによるものであるのか、或いは、発言速度が速いことによる認識の遅れによるものであるのかを判定する。

【0069】

具体的には、ユーザｐ２の平均無音時間ＣＭp2と、ユーザ全体の平均無音時間ＣＭpi_allとの差分が指標時間ＴＭ以上である場合には、前回発言したユーザｐ１の発言速度が速いことにより、ユーザｐ２の認識が遅れているものと判断することができる。

【0070】

ステップＳ２０８において読み出し制御部２６は、目標速度Ｓを低下させる処理を行う。即ち、いずれかのユーザの無音時間の平均値（第１の値）が所定の許容無音時間Ｔth以上であり、いずれかのユーザの平均無音時間（第１の値）と全体の平均無音時間（第２の値）との差分が所定の指標時間ＴＭ以上である場合に、目標速度Ｓを低下させる。これにより、図３のステップＳ１０５に示した発言速度の補正処理で用いる目標速度を、適正な数値に変更することができる。なお上記では、Ｓ２０６でＹＥＳと判定され、且つＳ２０７でＹＥＳ判定された場合、即ち「ＣＭpi≧Ｔth」且つ「（ＣＭpi－ＣＭpi_all）≧ＴＭ」の場合に目標速度Ｓを低下させる例について示したが、Ｓ２０６、Ｓ２０７のいずれか一方でＹＥＳ判定された場合に目標速度Ｓを低下させてもよい。その後、ステップＳ２０９に処理を進める。

【0071】

ステップＳ２０９において発言時間計測部２２は、ユーザｐ２による発言が終了したか否かを判定する。終了した場合には（Ｓ２０９；ＹＥＳ）、ステップＳ２０２に処理を戻す。こうして、ｗｅｂ会議の状況に応じて目標速度Ｓを適正な数値に変更することができる。

【0072】

上記の処理では、ユーザの無音時間の平均値を採用しているので、例えば機器の不具合などの突発的な理由により、あるユーザの無音時間が長くなった場合でも、この影響を軽減或いは回避して目標速度Ｓを設定することができる。

【0073】

また、図４に示した目標速度Ｓの変更処理は、各ユーザの過去の発言データに基づいて処理を行うので、図３に示した発言速度変更処理を実行する際において、ある程度のデータが取得されるまでは、図４に示した処理を実行せずに、初期的に設定した一定の目標速度Ｓを採用するようにしてもよい。

【0074】

また、ｗｅｂ会議に参加する各ユーザの年齢を取得し、各ユーザの平均年齢、または最高年齢に基づき、平均年齢または最高年齢が高いほど目標速度Ｓを低下させてもよい。例えば、最高年齢が所定の閾値年齢（例えば、７０歳）以上である場合には、目標速度Ｓを低下させる。こうすることにより、会話の聞き取りが苦手な高齢者がｗｅｂ会議に参加する場合に、高齢者が容易に他のユーザの発言内容を理解することが可能になる。

【0075】

このように、本実施形態に係る通信装置１では、ｗｅｂ会議などのネットワークを経由した音声通信を行う際に、発言したユーザｐ１の発言速度が速い場合には、予め設定した目標速度となるように、音声データの再生速度を変更する。このため、ユーザｐ１が発言した音声データを聞き取る他のユーザは、ゆっくりとした音声で聞き取ることができるので、発言内容を容易に理解することが可能になる。

【0076】

即ち、ｗｅｂ会議が行われているとき、一のユーザが発言を開始すると、このユーザが発言した音声データの発言速度（Ｗ/Ｔ）が算出される。この発言速度が所定の目標速度Ｓを超える場合には、発言速度（Ｗ/Ｔ）が目標速度Ｓとなるように、調整される。このため、ｗｅｂ会議に会議に参加している一のユーザの発言速度が速い場合でも、この発言内容を聞き取る他のユーザは、発言者の発言内容を容易に認識することができる。

【0077】

本実施形態では、ユーザｐ１の発言が終了した後、次のユーザｐ２の発言が開始されるまでの平均無音時間ＣＭp2が、所定の許容無音時間Ｔth（例えば、５秒）以上の場合には、目標速度Ｓが遅くなるように設定する。即ち、平均無音時間ＣＭp2が許容無音時間Ｔth以上ということは、ユーザｐ１の発言速度が速く、ユーザｐ１の発言内容に対するユーザｐ２の理解が遅れているものと推察される。目標速度Ｓを遅くすることにより、ユーザｐ２は、ユーザｐ１の発言内容を容易に理解できるようになる。

【0078】

本実施形態では、ユーザｐ２の平均無音時間ＣＭp2と、ユーザ全体の平均無音時間ＣＭpi_allとの差分を演算し、この差分が指標時間ＴＭ未満の場合には、目標速度Ｓを変更しない。従って、会議が盛り上がらないときのように、ユーザ全体の平均無音時間ＣＭpi_allが大きい場合には、ユーザｐ２の平均無音時間ＣＭp2が大きい場合でも、両者の差分は小さくなり、指標時間ＴＭ以上とならない。会議が盛り上がらず、各ユーザｐ１～ｐｎの発言が消極的な場合においては、ユーザｐ２の平均無音時間ＣＭp2が大きい場合であっても、目標速度Ｓを変更しない。

【0079】

一方、ユーザｐ２の平均無音時間ＣＭp2とユーザ全体の平均無音時間ＣＭpi_allとの差分が指標時間ＴＭ以上の場合には、ユーザｐ１の発言内容に対するユーザｐ２の理解が遅れているものと推察される。このような場合に、目標速度Ｓを低下させるので、ユーザｐ２は、ユーザｐ１の発言を遅い速度で聞き取ることができ、ユーザｐ１の発言内容を理解し易くなる。

【0080】

本実施形態では、ｗｅｂ会議に参加する各ユーザの平均年齢または最高年齢に応じて目標速度Ｓを変更することにより、高齢者のような会話認知力が衰えたユーザであっても、良好なコミュニケーションを行うことが可能になる。

【0081】

なお、本実施形態ではオンライン通信としてｗｅｂ会議について説明したが、例えば遠隔地に居る家族間のテレビ電話による通信などにおいても採用することができる。この場合には、例えば遠隔地にいる高齢の親族と会話する際に極めて有用である。

【0082】

以上、本発明の実施形態を記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例及び運用技術が明らかとなろう。

【符号の説明】

【0083】

１通信装置
２ネットワーク
３（３-1～３-n）他の通信装置
１１通信部
１２音声調整装置
１３音声入力部
１４音声出力部
２１音声メモリ
２２発言時間計測部
２３発言語数計測部
２４発言速度計算部
２５無音時間計測部
２６読み出し制御部

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版