特開2024-55546 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 株式会社ＮＴＴドコモの特許一覧

特開2024-55546発話スタイル改善支援装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024055546

(43)【公開日】2024-04-18

(54)【発明の名称】発話スタイル改善支援装置

(51)【国際特許分類】

G10L 25/60 20130101AFI20240411BHJP

G10L 25/90 20130101ALI20240411BHJP

G10L 25/21 20130101ALI20240411BHJP

G10L 21/003 20130101ALI20240411BHJP

G10L 21/0316 20130101ALI20240411BHJP

【ＦＩ】

G10L25/60

G10L25/90

G10L25/21

G10L21/003

G10L21/0316

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2022162565

(22)【出願日】2022-10-07

(71)【出願人】

【識別番号】392026693

【氏名又は名称】株式会社ＮＴＴドコモ

(74)【代理人】

【識別番号】100088155

【弁理士】

【氏名又は名称】長谷川芳樹

(74)【代理人】

【識別番号】100113435

【弁理士】

【氏名又は名称】黒木義樹

(74)【代理人】

【識別番号】100121980

【弁理士】

【氏名又は名称】沖山隆

(74)【代理人】

【識別番号】100128107

【弁理士】

【氏名又は名称】深石賢治

(72)【発明者】

【氏名】千葉麻莉子

(72)【発明者】

【氏名】山田渉

(72)【発明者】

【氏名】落合桂一

(57)【要約】

【課題】発話者の発話スタイルを容易に改善する。
【解決手段】発話スタイル改善支援装置１０は、発話音声を取得する音声取得部１１と、発話音声の特徴を示す発話特徴情報を取得する発話特徴解析部１２であって、発話特徴情報は、発話に関する所定の特徴の程度を表す、発話特徴解析部１２と、発話特徴情報に基づいて、発話者に提示するフィードバック音声における制御強度を判定する制御強度判定部であって、発話特徴情報が第１の程度である場合に、制御強度を第１の制御強度とすることを判定し、発話特徴情報が第１の程度より高い程度である第２の程度である場合に、制御強度を第１の制御強度とは異なる第２の制御強度とすることを判定する、制御強度判定部１３と、制御強度に基づいて発話音声を加工してフィードバック音声を生成する生成部１４と、フィードバック音声を出力する提示部１５と、を備える
【選択図】図３

【特許請求の範囲】

【請求項1】

発話者の発話スタイルの改善を支援する発話スタイル改善支援装置であって、
前記発話者により発せられた発話音声を取得する音声取得部と、
前記発話音声の特徴を示す発話特徴情報を取得する発話特徴解析部であって、前記発話特徴情報は、発話に関する所定の特徴の程度を表す、発話特徴解析部と、
前記発話特徴情報に基づいて、前記発話者に提示するフィードバック音声における制御強度を判定する制御強度判定部であって、前記発話特徴情報が第１の程度である場合に、前記制御強度を第１の制御強度とすることを判定し、前記発話特徴情報が前記第１の程度より高い程度である第２の程度である場合に、前記制御強度を前記第１の制御強度とは異なる第２の制御強度とすることを判定する、制御強度判定部と、
前記制御強度に基づいて前記発話音声を加工して前記フィードバック音声を生成する生成部と、
前記フィードバック音声を出力する提示部と、
を備える発話スタイル改善支援装置。

【請求項2】

前記発話特徴解析部は、前記発話音声の発話速度を前記発話特徴情報として取得する、
請求項１に記載の発話スタイル改善支援装置。

【請求項3】

前記発話特徴解析部は、前記発話音声における基本周波数の変化の大きさにより表される抑揚の大きさを前記発話特徴情報として取得する、
請求項１に記載の発話スタイル改善支援装置。

【請求項4】

前記発話特徴解析部は、前記発話音声における音量を前記発話特徴情報として取得する、
請求項１に記載の発話スタイル改善支援装置。

【請求項5】

前記発話特徴解析部は、前記発話音声における基本周波数により表される音程の高さを前記発話特徴情報として取得する、
請求項１に記載の発話スタイル改善支援装置。

【請求項6】

前記制御強度判定部は、前記発話特徴情報における前記程度に基づいて、遅延時間の大きさを前記制御強度として判定し、
前記生成部は、判定された前記遅延時間に応じて前記発話音声の発声のタイミングに対して遅延させた前記発話音声を、前記フィードバック音声として生成し、
前記第２の制御強度は、前記第１の制御強度として判定される遅延時間より大きい遅延時間である、
請求項１に記載の発話スタイル改善支援装置。

【請求項7】

前記制御強度判定部は、前記発話特徴情報における前記程度に基づいて、抑揚の大きさを前記制御強度として判定し、
前記生成部は、判定された前記抑揚の大きさに応じて抑揚を変化させた前記発話音声を、前記フィードバック音声として生成し、
前記第２の制御強度は、前記第１の制御強度として判定される抑揚の大きさより大きい又は小さい抑揚の大きさである、
請求項１に記載の発話スタイル改善支援装置。

【請求項8】

前記制御強度判定部は、前記発話特徴情報における前記程度に基づいて、音声の大きさを前記制御強度として判定し、
前記生成部は、判定された前記音声の大きさに応じて音量を変化させた前記発話音声を、前記フィードバック音声として生成し、
前記第２の制御強度は、前記第１の制御強度として判定される音声の大きさより大きい音声の大きさである、
請求項１に記載の発話スタイル改善支援装置。

【請求項9】

前記制御強度判定部は、前記発話特徴情報における前記程度に基づいて、音程の高さを前記制御強度として判定し、
前記生成部は、判定された前記音程の高さに応じて周波数を変化させた前記発話音声を、前記フィードバック音声として生成し、
前記第２の制御強度は、前記第１の制御強度として判定される音程の高さより高い又は低い音程の高さである、
請求項１に記載の発話スタイル改善支援装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、発話者の発話スタイルの改善を支援する発話スタイル改善支援装置に関する。

【背景技術】

【0002】

人との音声によるコミュニケーションにおいては、状況に応じた適切な話し方、発話の仕方が求められる。例えば、年配の人とのコミュニケーションにおいては、大きめの音量でゆっくりと発話することが求められる。発話を伴うプレゼンテーションに関して、プレゼンテーションを行っている対象者の音声データから言語特徴量及び韻律特徴量を抽出し、それらの特徴量を解析に基づいて、プレゼンテーションの所定の評価項目について定量的に評価した評価値を含む解析結果を推定し、解析結果を出力するシステムが知られている（例えば、特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２０－１９０５７９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、自身の発話の特徴に関する評価結果が発話者に提供された場合であっても、発話者が評価結果の参照により自身の発話の特徴を把握し、把握した特徴に基づいて発話のスタイルを改善することは容易ではなかった。

【0005】

そこで、本発明は、上記問題点に鑑みてなされたものであり、発話者の発話スタイルを容易に改善することを目的とする。

【課題を解決するための手段】

【0006】

上記課題を解決するために、本開示の一側面に係る発話スタイル改善支援装置は、発話者の発話スタイルの改善を支援する発話スタイル改善支援装置であって、発話者により発せられた発話音声を取得する音声取得部と、発話音声の特徴を示す発話特徴情報を取得する発話特徴解析部であって、発話特徴情報は、発話に関する所定の特徴の程度を表す、発話特徴解析部と、発話特徴情報に基づいて、発話者に提示するフィードバック音声における制御強度を判定する制御強度判定部であって、発話特徴情報が第１の程度である場合に、制御強度を第１の制御強度とすることを判定し、発話特徴情報が第１の程度より高い程度である第２の程度である場合に、制御強度を第１の制御強度とは異なる第２の制御強度とすることを判定する、制御強度判定部と、制御強度に基づいて発話音声を加工してフィードバック音声を生成する生成部と、フィードバック音声を出力する提示部と、を備える。

【0007】

上記の側面によれば、発話音声に基づいて発話特徴情報が取得され、発話特徴情報に基づいて、フィードバック音声における制御強度が判定される。従って、制御強度には、発話音声の特徴が反映される。そして、判定された制御強度に応じて発話音声を加工することにより生成されたフィードバック音声が発話者に提示される。フィードバック音声は、発話音声の加工により生成されるので、フィードバック音声を提示された発話者は、自らの発話スタイルを意図的に調整することを要さず、無意識的な発話スタイルの改善が促される。

【発明の効果】

【0008】

本発明の一側面により、発話者の発話スタイルを容易に改善することが可能となる。

【図面の簡単な説明】

【0009】

【図1】本実施形態の発話スタイル改善支援装置により解決される課題を説明する図である。

【図2】本実施形態の発話スタイル改善支援装置を実現するシステム構成の一例を示す図である。

【図3】本実施形態の発話スタイル改善支援装置の機能的構成を示すブロック図である。

【図4】発話スタイル改善支援装置のハードブロック図である。

【図5】発話音声からの発話速度の取得の例を示す図である。

【図6】発話音声からの抑揚の取得の例を示す図である。

【図7】発話音声からの音量の取得の例を示す図である。

【図8】発話特徴情報として取得された発話速度と、制御強度として判定される遅延時間との関係の一例を示す図である。

【図9】フィードバック音声の生成処理の具体例を示す図である。

【図10】発話スタイル改善支援装置における発話スタイル改善支援方法の処理内容を示すフローチャートである。

【図11】発話スタイル改善支援プログラムの構成を示す図である。

【発明を実施するための形態】

【0010】

本発明に係る発話スタイル改善支援装置の実施形態について図面を参照して説明する。なお、可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。

【0011】

図１は、本実施形態の発話スタイル改善支援装置により解決される課題を説明する図である。図１の従来の発話スタイルの改善サイクルＴ０に示されるように、例えば、発話者の発話ｔ０１に基づいて、発話者に対してフィードバック提示ｔ０２が行われる。フィードバック提示ｔ０２は、例えば、発話ｔ０１の解析処理により得られた評価データである。発話者は、評価データ等により構成されるフィードバック提示ｔ０２の参照により、自らの発話の特徴を理解した上で、意識的な調整をしながら発話ｔ０１を行う。

【0012】

本実施形態の発話スタイル改善支援装置が適用された発話スタイルの改善サイクルＴ１では、発話者の発話ｔ１１に基づいて発話特徴情報が取得され、発話特徴情報に基づいて制御強度が判定され、制御強度に基づいて発話音声が加工されることにより、フィードバック音声が生成される。そして、フィードバック音声からなるフィードバック提示ｔ１２が発話者に提供される。

【0013】

発話者が発話した音声に遅延を付加したフィードバック音声を当該発話者に聞かせることを聴覚遅延フィードバック（ＤＡＦ）という。ＤＡＦでは、フィードバック音声における遅延が大きいほど（遅延時間に上限あり）、発話の流暢さが失われ、発話速度が低下することが知られている。

【0014】

また、発話者が発話した音声の音量をより大きくしたフィードバック音声を当該発話者に聞かせることにより、発話者の発話が阻害され、発話の音量が低下する。また、発話者が発声した音声の抑揚及び音程を変化させた音声をフィードバック音声として発話者に聞かせることにより、その影響を受けて、発話における抑揚及び音程が変化する。

【0015】

発話者は、フィードバック音声の聴覚による認識により、無意識的にスタイルが調整された発話ｔ１１を発する。従って、発話スタイルの容易な改善が実現される。

【0016】

図２は、本実施形態の発話スタイル改善支援装置を実現するシステム構成の一例を示す図である。発話スタイル改善支援装置を実現するシステム１は、一例として、発話スタイル改善支援装置を構成するコンピュータｐｃ及びヘッドセットｈｓを含み得る。コンピュータｐｃのプロセッサが、発話スタイル改善支援装置の各機能部を実現する。ヘッドセットｈｓは、発話音声を取得するためのマイクロフォン及びフィードバック音声を発話者に出力するためのスピーカを含む。

【0017】

図３は、本実施形態に係る発話スタイル改善支援装置の機能的構成を示す図である。本実施形態の発話スタイル改善支援装置１０は、発話者の発話スタイルの改善を支援する装置である。

【0018】

発話スタイル改善支援装置１０は、図３に示すように、機能的には、音声取得部１１、発話特徴解析部１２、制御強度判定部１３、生成部１４及び提示部１５を備える。これらの各機能部１１～１５は、一つの装置（コンピュータ）に構成されてもよいし、複数の装置（例えば、ネットワークを介して通信可能に構成されたサーバ及び端末）に分散されて構成されてもよい。

【0019】

発話スタイル改善支援装置１０は、発話特徴解析モデル記憶部１７を備えてもよい。発話特徴解析モデル記憶部１７は、発話音声の発話特徴情報を取得するための学習済みの機械学習モデルを記憶している記憶手段である。なお、発話特徴解析モデル記憶部１７は、図３に例示されるように、発話スタイル改善支援装置１０に備えられてもよいし、発話スタイル改善支援装置１０からアクセス可能な他の装置に構成されてもよい。

【0020】

なお、図３に示したブロック図は、機能単位のブロックを示している。これらの機能ブロック（構成部）は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した１つの装置を用いて実現されてもよいし、物理的又は論理的に分離した２つ以上の装置を直接的又は間接的に（例えば、有線、無線などを用いて）接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記１つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。

【0021】

機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知（broadcasting）、通知（notifying）、通信（communicating）、転送（forwarding）、構成（configuring）、再構成（reconfiguring）、割り当て（allocating、mapping）、割り振り（assigning）などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック（構成部）は、送信部（transmitting unit）や送信機（transmitter）と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。

【0022】

例えば、本発明の一実施の形態における発話スタイル改善支援装置１０は、コンピュータとして機能してもよい。図４は、本実施形態に係る発話スタイル改善支援装置１０のハードウェア構成の一例を示す図である。発話スタイル改善支援装置１０は、物理的には、プロセッサ１００１、メモリ１００２、ストレージ１００３、通信装置１００４、入力装置１００５、出力装置１００６、バス１００７などを含むコンピュータ装置として構成されてもよい。

【0023】

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。発話スタイル改善支援装置１０のハードウェア構成は、図４に示した各装置を１つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。

【0024】

発話スタイル改善支援装置１０における各機能は、プロセッサ１００１、メモリ１００２などのハードウェア上に所定のソフトウェア（プログラム）を読み込ませることで、プロセッサ１００１が演算を行い、通信装置１００４による通信や、メモリ１００２及びストレージ１００３におけるデータの読み出し及び／又は書き込みを制御することで実現される。

【0025】

プロセッサ１００１は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ１００１は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置（ＣＰＵ：Central Processing Unit）で構成されてもよい。例えば、図３に示した各機能部１１～１５などは、プロセッサ１００１で実現されてもよい。

【0026】

また、プロセッサ１００１は、プログラム（プログラムコード）、ソフトウェアモジュールやデータを、ストレージ１００３及び／又は通信装置１００４からメモリ１００２に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、発話スタイル改善支援装置１０の各機能部１１～１５は、メモリ１００２に格納され、プロセッサ１００１で動作する制御プログラムによって実現されてもよい。上述の各種処理は、１つのプロセッサ１００１で実行される旨を説明してきたが、２以上のプロセッサ１００１により同時又は逐次に実行されてもよい。プロセッサ１００１は、１以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。

【0027】

メモリ１００２は、コンピュータ読み取り可能な記録媒体であり、例えば、ＲＯＭ（Read Only Memory）、ＥＰＲＯＭ（Erasable Programmable ＲＯＭ）、ＥＥＰＲＯＭ（Electrically Erasable Programmable ＲＯＭ）、ＲＡＭ（Random Access Memory）などの少なくとも１つで構成されてもよい。メモリ１００２は、レジスタ、キャッシュ、メインメモリ（主記憶装置）などと呼ばれてもよい。メモリ１００２は、本発明の一実施の形態に係る疑似データ生成方法及び文生成方法を実施するために実行可能なプログラム（プログラムコード）、ソフトウェアモジュールなどを保存することができる。

【0028】

ストレージ１００３は、コンピュータ読み取り可能な記録媒体であり、例えば、ＣＤ－ＲＯＭ（Compact Disc ＲＯＭ）などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー（登録商標）ディスク、磁気ストリップなどの少なくとも１つで構成されてもよい。ストレージ１００３は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ１００２及び／又はストレージ１００３を含むデータベース、サーバその他の適切な媒体であってもよい。

【0029】

通信装置１００４は、有線及び／又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア（送受信デバイス）であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。

【0030】

入力装置１００５は、外部からの入力を受け付ける入力デバイス（例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど）である。出力装置１００６は、外部への出力を実施する出力デバイス（例えば、ディスプレイ、スピーカー、LEDランプなど）である。なお、入力装置１００５及び出力装置１００６は、一体となった構成（例えば、タッチパネル）であってもよい。

【0031】

また、プロセッサ１００１やメモリ１００２などの各装置は、情報を通信するためのバス１００７で接続される。バス１００７は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。

【0032】

また、発話スタイル改善支援装置１０は、マイクロプロセッサ、デジタル信号プロセッサ（ＤＳＰ：Digital Signal Processor）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）、ＦＰＧＡ（Field Programmable Gate Array）などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ１００１は、これらのハードウェアの少なくとも１つで実装されてもよい。

【0033】

次に、発話スタイル改善支援装置１０の各機能部について説明する。音声取得部１１は、発話者により発せられた発話音声を取得する。具体的には、音声取得部１１は、入力装置１００５の一例であるマイクロフォンを介して、発話音声を取得する。より具体的には、音声取得部１１は、図２に示されるヘッドセットｈｓのマイクロフォンを介して発話音声を取得してもよい。

【0034】

発話特徴解析部１２は、発話音声の特徴を示す発話特徴情報を取得する。発話特徴情報は、発話に関する所定の特徴の程度を表す情報である。以下、発話の特徴の種類ごとに、発話特徴情報の取得について説明する。

【0035】

図５は、発話特徴情報の一例としての発話速度の発話音声からの取得を示す図である。発話特徴解析部１２は、音声取得部１１により取得された発話音声を表す音声波形ｓｗを取得する。次いで、発話特徴解析部１２は、音声波形ｓｗに基づいて、発話長を取得する。

【0036】

具体的には、発話特徴解析部１２は、音声波形ｓｗにおける時間軸に沿う単位時間（フレーム）ごとに、音声が発せられている音声区間であるか、又は、音声が発せられていない非音声区間であるか、を判定することにより、音声区間情報ｗｖを取得する。発話特徴解析部１２は、音声区間であることが判定された区間に相当する時間を発話長として取得する。

【0037】

発話特徴解析部１２は、音声区間の音声波形ｓｗに基づいて、音声認識を行い、音声波形ｓｗの音声区間に相当する発話テキストｗｍを取得する。発話特徴解析部１２は、発話テキストｗｍに基づいて、音素数（一例としてモーラ数）を取得する。そして、発話特徴解析部１２は、発話速度を以下のように算出する。
発話速度＝音素数／発話長

【0038】

音声波形ｓｗからの音声区間の検出は、例えば、音声区間検出モデルを用いた周知の検出技術により実施されてもよい。音声区間検出モデルは、音声波形ｓｗの入力に基づいて、フレームごとの音声区間であるか、又は、非音声区間であるかを示すデータを出力する。音声区間検出モデルは、各フレームの音声波形と、フレームが音声区間であるか非音声区間であるかを示すラベルとのペアからなる教師データを用いた機械学習により構築されてもよい。発話特徴解析部１２は、発話特徴解析モデル記憶部１７に記憶されている音声区間検出モデルを用いて、音声区間の検出を実施する。

【0039】

また、音声波形ｓｗの音声区間に相当する発話テキストの取得は、例えば、音声認識モデルを用いた周知の音声認識技術により実施されてもよい。音声認識モデルは、音声波形ｓｗの入力に基づいて、テキストを出力する。音声認識モデルは、音声波形と、当該音声波形に相当するテキストを表すラベルとのペアからなる教師データを用いた機械学習により構築されてもよい。発話特徴解析部１２は、発話特徴解析モデル記憶部１７に記憶されている音声認識モデルを用いて、発話テキストの取得を実施する。

【0040】

また、発話特徴解析部１２は、音素数に代えて音節数を発話長で除することにより、発話速度を算出してもよい。音節数の検出の一例として、発話特徴解析部１２は、音声波形ｓｗに基づいて、音声の強度を時間軸に沿って検出し、所与の強度値に基づいてピークをフィルタリングし、ディップとピークとの所与の差分レベルに基づいてフィルタリングし、無音部分の対するピークを除外し、残存するピークの数を音節数として取得する。そして、発話特徴解析部１２は、以下の式により発話速度を算出する。
発話速度＝音節数／発話長

【0041】

発話特徴解析部１２は、発話音声の抑揚の大きさを発話特徴情報として取得してもよい。抑揚の大きさは、発話音声における周波数の変化の大きさの程度により表される。発話特徴解析部１２は、一例として、基本周波数の変化の大きさの程度を、抑揚の大きさとして取得してもよい。

【0042】

図６は、発話特徴情報の一例としての抑揚の大きさの発話音声からの取得を示す図である。発話特徴解析部１２は、音声取得部１１により取得された発話音声を表す音声波形ｓｗを取得する。次いで、発話特徴解析部１２は、音声波形ｓｗに基づいて、抑揚の大きさを示す情報を発話特徴情報として取得する。

【0043】

具体的には、図６に示されるように、発話特徴解析部１２は、音声波形ｓｗに基づいて、時間軸に沿って基本周波数ｆｃを取得する。音声波形に基づく基本周波数の取得には、周知の周波数解析技術を適用できる。

【0044】

発話特徴解析部１２は、基本周波数ｆｃにおける最大の周波数と最小の周波数との差を、発話音声の抑揚の大きさを示す発話特徴情報として取得してもよい。また、発話特徴解析部１２は、基本周波数ｆｃの時間軸に沿う変化（例えば微分値）の、所定時間幅の移動平均を発話音声の抑揚の大きさを示す発話特徴情報として取得してもよい。また、発話特徴解析部１２は、基本周波数ｆｃの変化を時間で微分した微分値の絶対値を、発話音声の抑揚の大きさを示す発話特徴情報として取得してもよい。また、発話特徴解析部１２は、基本周波数ｆｃの変化を示す指標となるいかなる値を、発話特徴情報として取得してもよい。

【0045】

発話特徴解析部１２は、発話音声における音量を発話特徴情報として取得してもよい。図７は、発話音声からの音量の取得の例を示す図である。発話特徴解析部１２は、音声取得部１１により取得された音声波形ｓｗを取得する。次いで、発話特徴解析部１２は、音声波形ｓｗの２乗平均平方根を算出することにより、振幅値ａｖを取得する。発話特徴解析部１２は、振幅値ａｖを発話音声の音量の情報として用いてもよいし、振幅値ａｖの対数からなる対数振幅値を発話音声の音量の情報として用いてもよい。発話特徴解析部１２は、振幅値ａｖ又は対数振幅値の所定時間幅における集計値（例えば、移動平均値等）を発話特徴情報として取得してもよい。

【0046】

発話特徴解析部１２は、発話音声における音程の高さを発話特徴情報として取得してもよい。音程の高さは、発話音声における周波数により表される。発話特徴解析部１２は、一例として、基本周波数を音程の高さとして取得してもよい。発話特徴解析部１２は、音声波形ｓｗに基づいて、時間軸に沿って基本周波数ｆｃを取得する。発話特徴解析部１２は、時刻ごとの基本周波数を、発話特徴情報として取得してもよいし、時刻ごとの基本周波数の移動平均を、発話特徴情報として取得してもよい。

【0047】

再び図３を参照して、制御強度判定部１３は、発話特徴情報に基づいて、発話者に提示するフィードバック音声における制御強度を判定する。生成部１４は、判定された制御強度に基づいて発話音声を加工してフィードバック音声を生成する。具体的には、制御強度判定部１３は、発話特徴情報が第１の程度である場合に、制御強度を第１の制御強度とすることを判定し、発話特徴情報が第１の程度より高い程度である第２の程度である場合に、制御強度を第１の制御強度とは異なる第２の制御強度とすることを判定する。

【0048】

さらに具体的には、制御強度判定部１３は、発話特徴情報における程度に基づいて、遅延時間の大きさを制御強度として判定する。制御強度判定部１３は、発話速度を発話特徴情報として、発話速度が速いほど、大きい遅延時間を制御強度として取得してもよい。なお、制御強度判定部１３は、抑揚の大きさ、音量及び音程の高さのいずれかを発話特徴情報として、制御強度としての遅延時間の大きさを判定してもよい。

【0049】

より具体的には、制御強度判定部１３は、発話速度が所与の閾値以上である場合に、遅延時間を設定して、フィードバック音声を遅延させることを判定してもよい。また、制御強度判定部１３は、発話速度が所与の閾値未満である場合に、遅延時間をゼロとして、フィードバック音声を遅延させないことを判定してもよい。

【0050】

図８は、発話特徴情報として取得された発話速度と、制御強度として判定される遅延時間との関係の一例を示す図である。図８に示されるように、制御強度判定部１３は、１分あたりのモーラ数で表される発話速度（ｓｐｅｅｃｈｒａｔｅ）が閾値ｔｓ未満で有る場合に、遅延時間（ｄｅｌａｙｔｉｍｅ）をゼロとすることを判定し、発話速度が閾値ｔｓ以上である場合には、発話速度に応じて最大値ｄｍを上限として遅延時間を単調増加させることを判定してもよい。

【0051】

生成部１４は、判定された遅延時間に応じて発話音声の発声のタイミングに対して遅延させた発話音声を、フィードバック音声として生成する。例えば、生成部１４は、所定の記憶手段に構成したバッファに発話音声を保持し、遅延時間経過後にバッファの保持した発話音声をフィードバック音声として出力する。

【0052】

また、制御強度判定部１３は、発話特徴情報における程度に基づいて、抑揚の大きさを制御強度として判定してもよい。制御強度判定部１３は、抑揚の大きさを発話特徴情報として、抑揚が大きいほど、抑揚を大きくすることを制御強度として判定してもよい。また、制御強度判定部１３は、発話特徴情報としての抑揚が大きいほど、抑揚を小さくすることを制御強度として判定してもよい。なお、制御強度判定部１３は、発話速度、音量及び音程の高さのいずれかを発話特徴情報として、制御強度としての抑揚の大きさを判定してもよい。

【0053】

より具体的には、制御強度判定部１３は、発話特徴情報としての抑揚の大きさが所与の閾値以上である場合に、フィードバック音声における抑揚をより大きくすることを判定してもよい。制御強度判定部１３は、発話特徴情報としての抑揚の大きさが所与の閾値未満である場合に、フィードバック音声における抑揚をより小さくすることを判定してもよい。

【0054】

または、その逆に、制御強度判定部１３は、発話特徴情報としての抑揚の大きさが所与の閾値以上である場合に、フィードバック音声における抑揚をより小さくすることを判定してもよい。制御強度判定部１３は、発話特徴情報としての抑揚の大きさが所与の閾値未満である場合に、フィードバック音声における抑揚をより大きくすることを判定してもよい。

【0055】

生成部１４は、制御強度として判定された抑揚の大きさに応じて抑揚を変化させた発話音声を、フィードバック音声として生成する。具体的には、生成部１４は、発話音声における時間軸の沿う基本周波数の最大の周波数と最小の周波数との差を変化させたり、発話音声における時間軸の沿う基本周波数の遷移を、周波数の大きさの方向に拡大又は縮小させたりすることにより抑揚を変化させて、フィードバック音声を生成してもよい。フィードバック音声の生成の具体例については、図９を参照して後に説明する。

【0056】

また、制御強度判定部１３は、発話特徴情報における程度に基づいて、音声の大きさを制御強度として判定してもよい。制御強度判定部１３は、音声の大きさ（音量）を発話特徴情報として、音量が大きいほど、音量を大きくすることを制御強度として判定してもよい。なお、制御強度判定部１３は、発話速度、抑揚の大きさ及び音程の高さのいずれかを発話特徴情報として、制御強度としての音量の大きさを判定してもよい。

【0057】

より具体的には、制御強度判定部１３は、発話特徴情報としての音量の大きさが所与の閾値以上である場合に、フィードバック音声における音量をより大きくすることを判定してもよい。制御強度判定部１３は、発話特徴情報としての音量の大きさが所与の閾値未満である場合に、フィードバック音声における音量をより小さくすることを判定してもよい。

【0058】

生成部１４は、制御強度として判定された音量の大きさに応じて音量を変化させた発話音声を、フィードバック音声として生成する。生成部１４は、周知の音響信号処理技術及び音声分析変換合成処理技術を用いて、フィードバック音声を生成してもよい。具体的には、生成部１４は、一例として、発話音声から得られる音声波形を定数倍することにより音量を変化させて、フィードバック音声を生成してもよい。フィードバック音声の生成の他の具体例については、図９を参照して後に説明する。

【0059】

また、制御強度判定部１３は、発話特徴情報における程度に基づいて、音程の高さを制御強度として判定してもよい。制御強度判定部１３は、音程の高さを発話特徴情報として、音程が高いほど、音程を高くすることを制御強度として判定してもよい。また、制御強度判定部１３は、発話特徴情報としての音程が高いほど、音程を低くすることを制御強度として判定してもよい。なお、制御強度判定部１３は、発話速度、抑揚の大きさ及び音量の大きさのいずれかを発話特徴情報として、制御強度としての音程の高さを判定してもよい。

【0060】

より具体的には、制御強度判定部１３は、発話特徴情報としての音程の高さが所与の閾値以上である場合に、フィードバック音声における音程をより高くすることを判定してもよい。制御強度判定部１３は、発話特徴情報としての音程の高さが所与の閾値未満である場合に、フィードバック音声における音程をより低くすることを判定してもよい。

【0061】

または、その逆に、制御強度判定部１３は、発話特徴情報としての音程の高さが所与の閾値以上である場合に、フィードバック音声における音程をより低くすることを判定してもよい。制御強度判定部１３は、発話特徴情報としての音程の高さが所与の閾値未満である場合に、フィードバック音声における音程をより高くすることを判定してもよい。

【0062】

生成部１４は、制御強度として判定された音程の高さに応じて音程を変化させた発話音声を、フィードバック音声として生成する。フィードバック音声の生成の具体例については、図９を参照して後に説明する。

【0063】

生成部１４は、周知の音響信号処理技術及び音声分析変換合成処理技術を用いて、フィードバック音声を生成できる。図９を参照して、フィードバック音声の生成処理の具体例を説明する。図９に示されるように、生成部１４は、音声取得部１１により取得され発話特徴解析部１２による発話特徴情報の取得に供された発話音声ｓｖを取得する。次いで、生成部１４は、発話音声ｓｖを、基本周波数ｐｍ０１、スペクトル包絡ｐｍ０２及び非周期性指標ｐｍ０３を含む特徴量要素ｐｍ０に分割する。

【0064】

次に、生成部１４は、制御強度判定部１３により制御強度として判定された抑揚の大きさ、音声の大きさ（音量）及び音程の高さのうちの少なくとも一つに基づいて特徴量要素ｐｍ０における各特徴量を変換する。そして、生成部１４は、変換後の基本周波数ｐｍ１１、スペクトル包絡ｐｍ１２及び非周期性指標ｐｍ１３を含む特徴量要素ｐｍ１に基づいて音声の再合成を行い、フィードバック音声ｆｖを生成する。例えば、生成部１４は、スペクトル包絡ｐｍ０２に定数（負の値を含む）を加算して、変換後のスペクトル包絡ｐｍ１２を得ることにより、音量が変更されたフィードバック音声ｆｖを生成する。また、例えば、生成部１４は、基本周波数ｐｍ０１を、制御強度としての抑揚の大きさ又は音程の高さに基づいて変化させて、変換後の基本周波数ｐｍ１１を得ることにより、抑揚の大きさ又は音程の高さが変更されたフィードバック音声ｆｖを生成する。

【0065】

再び図３を参照して、提示部１５は、フィードバック音声を出力する。具体的には、提示部１５は、出力装置１００６の一例であるスピーカを介して、フィードバック音声を出力する。より具体的には、提示部１５は、図２に示されるヘッドセットｈｓのスピーカを介してフィードバック音声を出力してもよい。

【0066】

図１０は、発話スタイル改善支援装置１０における発話スタイル改善支援方法の処理内容を示すフローチャートである。

【0067】

ステップＳ１において、音声取得部１１は、発話者により発せられた発話音声を取得する。ステップＳ２において、発話特徴解析部１２は、ステップＳ１において取得された発話音声から、発話特徴情報を取得する。

【0068】

ステップＳ３において、制御強度判定部１３は、発話特徴情報に基づいて、発話者に提示するフィードバック音声における制御強度を判定する。

【0069】

ステップＳ４において、生成部１４は、ステップＳ３において判定された制御強度に基づいて発話音声を加工してフィードバック音声を生成する。

【0070】

ステップＳ５において、提示部１５は、フィードバック音声を出力する。

【0071】

次に、図１１を参照して、コンピュータを、本実施形態の発話スタイル改善支援装置１０として機能させるための発話スタイル改善支援プログラムについて説明する。図１１は、発話スタイル改善支援プログラムの構成を示す図である。発話スタイル改善支援プログラムＰ１は、発話スタイル改善支援装置１０における発話スタイル改善支援処理を統括的に制御するメインモジュールｍ１０、音声取得モジュールｍ１１、発話特徴解析モジュールｍ１２、制御強度判定モジュールｍ１３、生成モジュールｍ１４及び提示モジュールｍ１５を備えて構成される。そして、各モジュールｍ１１～ｍ１５により、音声取得部１１、発話特徴解析部１２、制御強度判定部１３、生成部１４及び提示部１５のための各機能が実現される。

【0072】

なお、発話スタイル改善支援プログラムＰ１は、通信回線等の伝送媒体を介して伝送される態様であってもよいし、図１１に示されるように、記録媒体Ｍ１に記憶される態様であってもよい。

【0073】

以上説明した本実施形態の発話スタイル改善支援装置１０、発話スタイル改善支援方法、発話スタイル改善支援プログラムＰ１によれば、発話音声に基づいて発話特徴情報が取得され、発話特徴情報に基づいて、フィードバック音声における制御強度が判定される。従って、制御強度には、発話音声の特徴が反映される。そして、判定された制御強度に応じて発話音声を加工することにより生成されたフィードバック音声が発話者に提示される。フィードバック音声は、発話音声の加工により生成されるので、フィードバック音声を提示された発話者は、自らの発話スタイルを意図的に調整することを要さず、無意識的な発話スタイルの改善が促される。

【0074】

本開示に係る発明は、例えば、以下のように把握される。

【0075】

本開示の第１の一側面に係る発話スタイル改善支援装置は、発話者の発話スタイルの改善を支援する発話スタイル改善支援装置であって、発話者により発せられた発話音声を取得する音声取得部と、発話音声の特徴を示す発話特徴情報を取得する発話特徴解析部であって、発話特徴情報は、発話に関する所定の特徴の程度を表す、発話特徴解析部と、発話特徴情報に基づいて、発話者に提示するフィードバック音声における制御強度を判定する制御強度判定部であって、発話特徴情報が第１の程度である場合に、制御強度を第１の制御強度とすることを判定し、発話特徴情報が第１の程度より高い程度である第２の程度である場合に、制御強度を第１の制御強度とは異なる第２の制御強度とすることを判定する、制御強度判定部と、制御強度に基づいて発話音声を加工してフィードバック音声を生成する生成部と、フィードバック音声を出力する提示部と、を備える。

【0076】

【0077】

第２の側面に係る発話スタイル改善支援装置では、第１の側面に係る発話スタイル改善支援装置において、発話特徴解析部は、発話音声の発話速度を発話特徴情報として取得することとしてもよい。

【0078】

上記の側面によれば、発話音声における発話速度に応じた制御強度に基づいて、発話音声からフィードバック音声が生成される。従って、フィードバック音声を提示された発話者に対して、発話速度の無意識的な調整が促される。

【0079】

第３の側面に係る発話スタイル改善支援装置では、第１の側面に係る発話スタイル改善支援装置において、発話特徴解析部は、発話音声における基本周波数の変化の大きさにより表される抑揚の大きさを発話特徴情報として取得することとしてもよい。

【0080】

上記の側面によれば、発話音声における抑揚の大きさに応じた制御強度に基づいて、発話音声からフィードバック音声が生成される。従って、フィードバック音声を提示された発話者に対して、発話における抑揚の無意識的な調整が促される。

【0081】

第４の側面に係る発話スタイル改善支援装置では、第１の側面に係る発話スタイル改善支援装置において、発話特徴解析部は、発話音声における音量を発話特徴情報として取得することとしてもよい。

【0082】

上記の側面によれば、発話音声における音量に応じた制御強度に基づいて、発話音声からフィードバック音声が生成される。従って、フィードバック音声を提示された発話者に対して、発話における音量の無意識的な調整が促される。

【0083】

第５の側面に係る発話スタイル改善支援装置では、第１の側面に係る発話スタイル改善支援装置において、発話特徴解析部は、発話音声における基本周波数により表される音程の高さを発話特徴情報として取得することとしてもよい。

【0084】

上記の側面によれば、発話音声における音程の高さに応じた制御強度に基づいて、発話音声からフィードバック音声が生成される。従って、フィードバック音声を提示された発話者に対して、発話における音程の無意識的な調整が促される。

【0085】

第６の側面に係る発話スタイル改善支援装置では、第１～５の側面のうちのいずれか一つの側面に係る発話スタイル改善支援装置において、制御強度判定部は、発話特徴情報における程度に基づいて、遅延時間の大きさを制御強度として判定し、生成部は、判定された遅延時間に応じて発話音声の発声のタイミングに対して遅延させた発話音声を、フィードバック音声として生成し、第２の制御強度は、第１の制御強度として判定される遅延時間より大きい遅延時間であることとしてもよい。

【0086】

上記の側面によれば、発話の特徴に応じて遅延時間の大きさが制御強度として判定され、発話の所定の特徴の程度が大きいほど、大きい遅延時間を有するフィードバック音声が生成される。従って、発話の特徴における程度が大きいほど、発話者に対して、より低速で発話することが促される。

【0087】

第７の側面に係る発話スタイル改善支援装置では、第１～５の側面のうちのいずれか一つの側面に係る発話スタイル改善支援装置において、制御強度判定部は、発話特徴情報における程度に基づいて、抑揚の大きさを制御強度として判定し、生成部は、判定された抑揚の大きさに応じて抑揚を変化させた発話音声を、フィードバック音声として生成し、第２の制御強度は、第１の制御強度として判定される抑揚の大きさより大きい又は小さい抑揚の大きさであることとしてもよい。

【0088】

上記の側面によれば、発話の特徴に応じて抑揚の大きさが制御強度として判定され、発話の所定の特徴の程度が大きいほど、大きい又は小さい抑揚を有するフィードバック音声が生成される。従って、発話の特徴における程度が大きいほど、発話者に対して、より抑揚を大きく又は小さく発話することが促される。

【0089】

第８の側面に係る発話スタイル改善支援装置では、第１～５の側面のうちのいずれか一つの側面に係る発話スタイル改善支援装置において、制御強度判定部は、発話特徴情報における程度に基づいて、音声の大きさを制御強度として判定し、生成部は、判定された音声の大きさに応じて音量を変化させた発話音声を、フィードバック音声として生成し、第２の制御強度は、第１の制御強度として判定される音声の大きさより大きい音声の大きさであることとしてもよい。

【0090】

上記の側面によれば、発話の特徴に応じて音量の大きさが制御強度として判定され、発話の所定の特徴の程度が大きいほど、大きい音量を有するフィードバック音声が生成される。従って、発話の特徴における程度が大きいほど、発話者に対して、より小さい音量で発話することが促される。

【0091】

第９の側面に係る発話スタイル改善支援装置では、第１～５の側面のうちのいずれか一つの側面に係る発話スタイル改善支援装置において、制御強度判定部は、発話特徴情報における程度に基づいて、音程の高さを制御強度として判定し、生成部は、判定された音程の高さに応じて周波数を変化させた発話音声を、フィードバック音声として生成し、第２の制御強度は、第１の制御強度として判定される音程の高さより高い又は低い音程の高さであることとしてもよい。

【0092】

上記の側面によれば、発話の特徴に応じて音程の高さが制御強度として判定され、発話の所定の特徴の程度が大きいほど、高い又は低い音程を有するフィードバック音声が生成される。従って、発話の特徴における程度が大きいほど、発話者に対して、より高い又は低い音程で発話することが促される。

【0093】

以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。

【0094】

情報の通知は、本開示において説明した態様／実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング（例えば、ＤＣＩ（Downlink Control Information）、ＵＣＩ（Uplink Control Information））、上位レイヤシグナリング（例えば、ＲＲＣ（Radio Resource Control）シグナリング、ＭＡＣ（Medium Access Control）シグナリング、報知情報（ＭＩＢ（Master Information Block）、ＳＩＢ（System Information Block）））、その他の信号又はこれらの組み合わせによって実施されてもよい。また、ＲＲＣシグナリングは、ＲＲＣメッセージと呼ばれてもよく、例えば、ＲＲＣ接続セットアップ（RRC Connection Setup）メッセージ、ＲＲＣ接続再構成（RRC Connection Reconfiguration）メッセージなどであってもよい。

【0095】

本明細書で説明した各態様／実施形態は、ＬＴＥ（Long Term Evolution）、ＬＴＥ－Ａ（LTE-Advanced）、ＳＵＰＥＲ３Ｇ、ＩＭＴ－Ａｄｖａｎｃｅｄ、４Ｇ、５Ｇ、ＦＲＡ（Future Radio Access）、Ｗ－ＣＤＭＡ（登録商標）、ＧＳＭ（登録商標）、ＣＤＭＡ２０００、ＵＭＢ（Ultra Mobile Broadband）、ＩＥＥＥ８０２．１１（Ｗｉ－Ｆｉ）、ＩＥＥＥ８０２．１６（ＷｉＭＡＸ）、ＩＥＥＥ８０２．２０、ＵＷＢ（Ultra-WideBand）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、その他の適切なシステムを利用するシステム及び／又はこれらに基づいて拡張された次世代システムに適用されてもよい。また、複数のシステムが組み合わされて（例えば、ＬＴＥ及びＬＴＥ－Ａの少なくとも一方と５Ｇとの組み合わせ等）適用されてもよい。

【0096】

本明細書で説明した各態様／実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。

【0097】

本開示において基地局によって行われるとした特定動作は、場合によってはその上位ノード（upper node）によって行われることもある。基地局を有する１つ又は複数のネットワークノード（network nodes）からなるネットワークにおいて、端末との通信のために行われる様々な動作は、基地局及び基地局以外の他のネットワークノード（例えば、ＭＭＥ又はＳ－ＧＷなどが考えられるが、これらに限られない）の少なくとも１つによって行われ得ることは明らかである。上記において基地局以外の他のネットワークノードが１つである場合を例示したが、複数の他のネットワークノードの組み合わせ（例えば、ＭＭＥ及びＳ－ＧＷ）であってもよい。

【0098】

情報等（※「情報、信号」の項目参照）は、上位レイヤ（又は下位レイヤ）から下位レイヤ（又は上位レイヤ）へ出力され得る。複数のネットワークノードを介して入出力されてもよい。

【0099】

入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。

【0100】

判定は、１ビットで表される値（０か１か）によって行われてもよいし、真偽値（Boolean：trueまたはfalse）によって行われてもよいし、数値の比較（例えば、所定の値との比較）によって行われてもよい。

【0101】

本開示において説明した各態様／実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知（例えば、「Ｘであること」の通知）は、明示的に行うものに限られず、暗黙的（例えば、当該所定の情報の通知を行わない）ことによって行われてもよい。

【0102】

以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。

【0103】

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。

【0104】

また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線（ＤＳＬ）などの有線技術及び／又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び／又は無線技術は、伝送媒体の定義内に含まれる。

【0105】

本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。

【0106】

なお、本開示において説明した用語及び／又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。

【0107】

本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。

【0108】

また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。例えば、無線リソースはインデックスによって指示されるものであってもよい。

【0109】

上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々なチャネル（例えば、ＰＵＣＣＨ、ＰＤＣＣＨなど）及び情報要素は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。

【0110】

本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)（例えば、テーブル、データベース又は別のデータ構造での探索）、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)（例えば、情報を受信すること）、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)（例えば、メモリ中のデータにアクセスすること）した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断（決定）」は、「想定する（assuming）」、「期待する（expecting）」、「みなす（considering）」などで読み替えられてもよい。

【0111】

本開示で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。

【0112】

本明細書で「第１の」、「第２の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、２つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第１および第２の要素への参照は、２つの要素のみがそこで採用され得ること、または何らかの形で第１の要素が第２の要素に先行しなければならないことを意味しない。

【0113】

「含む（include）」、「含んでいる（including）」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または（or）」は、排他的論理和ではないことが意図される。

【0114】

本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。

【0115】

本開示において、「ＡとＢが異なる」という用語は、「ＡとＢが互いに異なる」ことを意味してもよい。なお、当該用語は、「ＡとＢがそれぞれＣと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。

【符号の説明】

【0116】

１０…発話スタイル改善支援装置、１１…音声取得部、１２…発話特徴解析部、１３…制御強度判定部、１４…生成部、１５…提示部、１７…発話特徴解析モデル記憶部、Ｍ１…記録媒体、ｍ１０…メインモジュール、ｍ１１…音声取得モジュール、ｍ１２…発話特徴解析モジュール、ｍ１３…制御強度判定モジュール、ｍ１４…生成モジュール、ｍ１５…提示モジュール、Ｐ１…発話スタイル改善支援プログラム。

【図1】