IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧

特許7404568プログラム、情報処理装置、及び情報処理方法
<>
  • 特許-プログラム、情報処理装置、及び情報処理方法 図1
  • 特許-プログラム、情報処理装置、及び情報処理方法 図2
  • 特許-プログラム、情報処理装置、及び情報処理方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-12-15
(45)【発行日】2023-12-25
(54)【発明の名称】プログラム、情報処理装置、及び情報処理方法
(51)【国際特許分類】
   H04M 1/00 20060101AFI20231218BHJP
   G11B 27/02 20060101ALI20231218BHJP
   G11B 27/00 20060101ALI20231218BHJP
   H04L 65/403 20220101ALI20231218BHJP
   H04M 3/56 20060101ALI20231218BHJP
【FI】
H04M1/00 H
G11B27/02 H
G11B27/00 B
H04L65/403
H04M3/56 Z
【請求項の数】 9
(21)【出願番号】P 2023005771
(22)【出願日】2023-01-18
【審査請求日】2023-03-31
【早期審査対象出願】
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】西川 洋右
(72)【発明者】
【氏名】木村 浩太
【審査官】石井 則之
(56)【参考文献】
【文献】国際公開第2007/013180(WO,A1)
【文献】特開2011-087074(JP,A)
【文献】特開2020-141208(JP,A)
【文献】特開2010-232780(JP,A)
【文献】特開平09-247641(JP,A)
【文献】特開2005-181391(JP,A)
【文献】中国特許出願公開第114268761(CN,A)
【文献】特開2005-202014(JP,A)
【文献】特開2006-229356(JP,A)
【文献】特開2005-323308(JP,A)
【文献】特開2022-016997(JP,A)
【文献】特開2008-141560(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04M 1/00
1/24- 3/00
3/16- 3/20
3/38- 3/58
7/00- 7/16
11/00-11/10
99/00
G11B27/00-27/06
H04L13/00-13/18
61/00-65/80
69/00-101/695
(57)【特許請求の範囲】
【請求項1】
コンピュータにおいて仮想の集音部として機能し、
前記コンピュータを、
前記コンピュータが有する集音部が集音した音を示す音データを取得する取得部、
前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部、
前記取得部が取得した前記音データに基づいて、前記コンピュータのユーザの発言を検知する検知部
オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音部が指定されている場合に、前記会議制御部に音データを出力する出力部であって、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部、及び、
前記検知部が前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替える切替部であって、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示していない場合には、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替え、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示している場合には、前記出力状態を切り替える前記選択の状況に関わらず、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替える切替部、
として機能させ、
前記記憶制御部は、前記検知部がユーザの発言を検知する前から、前記取得部が取得した前記音データを前記記憶部に記憶させる、
プログラム。
【請求項2】
前記検知部は、前記ユーザの発言が途切れることを検知し、
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングまでに前記記憶部に記憶された音データを出力する、
請求項1に記載のプログラム。
【請求項3】
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力し、前記記憶部に記憶された音データを全て出力し終えたタイミングから、前記取得部が取得した音データを直接出力する、
請求項2に記載のプログラム。
【請求項4】
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなくなると、前記取得部が取得した音データを出力しないように制御する、
請求項3に記載のプログラム。
【請求項5】
前記検知部は、前記ユーザの発言を検知した後に前記ユーザの発言が途切れたことを検知し、
前記切替部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを前記出力部が出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなかった場合に、前記会議制御部における音データの前記外部装置への出力状態を、前記外部装置に音データを送信する状態から前記外部装置に音データを送信しない状態に切り替える、
請求項に記載のプログラム。
【請求項6】
前記検知部は、前記音データが示す音の周波数、音量レベル、音の継続時間の少なくともいずれかに基づいて、前記ユーザの発言を検知する、
請求項1に記載のプログラム。
【請求項7】
前記取得部は、前記ユーザの音声を示すユーザ音声データを取得し、
前記検知部は、前記ユーザ音声データに基づいて前記ユーザの音声の特徴を示すユーザ特徴データを生成し、前記取得部が取得した音データの特徴を示す特徴データと、前記ユーザ特徴データとの類似度に基づいて前記ユーザの発言を検知する、
請求項1に記載のプログラム。
【請求項8】
仮想の集音部として機能し、音データを出力する情報処理装置であって、
集音部が集音した音を示す音データを取得する取得部と、
前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部と、
前記取得部が取得した前記音データに基づいて、ユーザの発言を検知する検知部と、
オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音部が指定されている場合に、前記会議制御部に音データを出力する出力部であって、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部と、
前記検知部が前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替える切替部であって、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示していない場合には、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替え、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示している場合には、前記出力状態を切り替える前記選択の状況に関わらず、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替える切替部と、
を有し、
前記記憶制御部は、前記検知部がユーザの発言を検知する前から、前記取得部が取得した前記音データを前記記憶部に記憶させる、
情報処理装置。
【請求項9】
仮想の集音部として機能するコンピュータが実行する、
集音部が集音した音を示す音データを取得するステップと、
取得した前記音データを記憶部に記憶させるステップと、
取得した前記音データに基づいて、ユーザの発言を検知するステップと、
オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音部が指定されている場合に、前記会議制御部に音データを出力するステップであって、前記ユーザの発言を検知すると、前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力するステップと、
前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替えるステップであって、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示していない場合には、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知するステップにおける前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替え、取得した前記ユーザが前記会議の開催者であるか否かを示す情報が、前記ユーザが前記会議の開催者であることを示している場合には、前記出力状態を切り替える前記選択の状況に関わらず、前記検知するステップにおける前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替えるステップと、
を有し、
前記記憶部に記憶させるステップにおいて、前記コンピュータは、前記ユーザの発言を検知する前から、取得した前記音データを前記記憶部に記憶させる、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログラム、情報処理装置、及び情報処理方法に関する。
【背景技術】
【0002】
インターネット等の通信ネットワークを利用してオンラインで会議を行うためのシステムが知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2022-039129号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
オンライン会議のシステムでは、ユーザが利用する端末側において、ユーザが発言する場合に限定してユーザの音声を発信することができるように、端末が集音した音を示す音データをサーバに送信するか否かを切り替えることができる。しかしながら、ユーザが発言する際に、音データをサーバに送信することを忘れたり、音データをサーバに送信するように切り替えることを忘れたりして、ユーザの発言の一部が伝わらないという問題が生じていた。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、ユーザの発言の一部が伝わらなくなることを抑制することを目的とする。
【0006】
本発明の第1の態様に係るプログラムは、コンピュータを、前記コンピュータが有する集音部が集音した音を示す音データを取得する取得部、前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部、前記取得部が取得した前記音データに基づいて、前記コンピュータのユーザの発言を検知する検知部、及び、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部、として機能させる。
【0007】
前記検知部は、前記ユーザの発言が途切れることを検知し、前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングまでに前記記憶部に記憶された音データを出力してもよい。
【0008】
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力すると、前記取得部が取得した音データを直接出力してもよい。
【0009】
前記出力部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなくなると、前記取得部が取得した音データを出力しないように制御してもよい。
【0010】
前記プログラムは、前記コンピュータにおいて仮想の集音部として機能し、前記出力部は、オンラインで会議を行うためのアプリケーションプログラムが実行されることにより機能する会議制御部に対する音データの入力元として前記仮想の集音装置が指定されている場合に、前記会議制御部に音データを出力してもよい。
【0011】
前記プログラムは、前記コンピュータを、前記検知部が前記ユーザの発言を検知すると、前記会議制御部における音データの外部装置への出力状態を、前記外部装置に音データを送信しない状態から前記外部装置に音データを送信する状態に切り替える切替部、としてさらに機能させてもよい。
【0012】
前記検知部は、前記ユーザの発言を検知した後に前記ユーザの発言が途切れたことを検知し、前記切替部は、前記ユーザの発言が途切れたことを検知したタイミングに前記記憶部に記憶された音データを前記出力部が出力してから所定時間以内に前記検知部が前記ユーザの発言を検知しなかった場合に、前記会議制御部における音データの前記外部装置への出力状態を、前記外部装置に音データを送信する状態から前記外部装置に音データを送信しない状態に切り替えてもよい。
【0013】
前記切替部は、前記ユーザから前記会議制御部における音データの前記外部装置への出力状態を切り替えるか否かの選択を受け付け、前記出力状態を切り替える選択を受け付けていることに応じて、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替えてもよい。
【0014】
前記切替部は、前記会議制御部により実現されるオンラインの会議において前記ユーザが前記会議の開催者であるか否かを示す情報を取得し、取得した情報が、前記ユーザが前記会議の開催者であることを示している場合に、前記検知部による前記ユーザの発言の検出状況に基づいて、前記会議制御部における音データの前記外部装置への出力状態を切り替えてもよい。
【0015】
前記検知部は、前記音データが示す音の周波数、音量レベル、音の継続時間の少なくともいずれかに基づいて、前記ユーザの発言を検知してもよい。
前記取得部は、前記ユーザの音声を示すユーザ音声データを取得し、前記検知部は、前記ユーザ音声データに基づいて前記ユーザの音声の特徴を示すユーザ特徴データを生成し、前記取得部が取得した音データの特徴を示す特徴データと、前記ユーザ特徴データとの類似度に基づいて前記ユーザの発言を検知してもよい。
【0016】
本発明の第2の態様に係る情報処理装置は、音データを出力する情報処理装置であって、集音部が集音した音を示す音データを取得する取得部と、前記取得部が取得した前記音データを記憶部に記憶させる記憶制御部と、前記取得部が取得した前記音データに基づいて、ユーザの発言を検知する検知部と、前記検知部が前記ユーザの発言を検知すると、前記検知部が前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力する出力部と、を有する。
【0017】
本発明の第3の態様に係る情報処理方法は、コンピュータが実行する、集音部が集音した音を示す音データを取得するステップと、取得した前記音データを記憶部に記憶させるステップと、取得した前記音データに基づいて、ユーザの発言を検知するステップと、前記ユーザの発言を検知すると、前記ユーザの発言を検知したタイミングよりも所定時間前のタイミングに前記記憶部に記憶された音データと、当該音データよりも後に前記記憶部に記憶された音データとを、前記記憶部に記憶された時刻が古い順に出力するステップと、を有する。
【発明の効果】
【0018】
本発明によれば、ユーザの発言の一部が伝わらなくなることを抑制することができるという効果を奏する。
【図面の簡単な説明】
【0019】
図1】情報処理装置の概要を示す図である。
図2】情報処理装置の機能構成を示す図である。
図3】情報処理装置における処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0020】
[情報処理装置1の概要]
図1は、情報処理装置1の概要を示す図である。情報処理装置1は、ユーザが他のユーザとオンライン会議を行うために使用するパーソナルコンピュータ、タブレット端末、スマートフォン等のコンピュータである。情報処理装置1は、インターネットや携帯電話回線等の通信ネットワークを介してオンライン会議を制御するオンライン会議サーバ2に通信可能に接続されている。
【0021】
情報処理装置1は、マイクロフォン等の集音部を有しており、情報処理装置1のユーザの音声等を集音し、音データを生成する。また、情報処理装置1には、オンライン会議を行うための会議アプリケーションプログラムがインストールされている。ユーザは、会議アプリケーションプログラムを実行することにより、オンライン会議サーバ2を介して他のユーザとのオンライン会議を行うことができる。なお、以下の説明において、情報処理装置1のユーザを単にユーザともいう。
【0022】
情報処理装置1には、仮想の集音部として機能する音声制御プログラムがインストールされている。情報処理装置1は、会議アプリケーションプログラムと、音声制御プログラムとを実行している場合、集音部が生成した音データを、仮想の集音部を介してオンライン会議サーバ2に送信する。
【0023】
具体的には、情報処理装置1は、音声制御プログラムを実行することにより仮想の集音部として機能し、集音部が生成した音データを自身に設けられている記憶部に記憶させるとともに、当該音データに基づいてユーザの発言を検知する。情報処理装置1は、ユーザの発言を検知すると、ユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部に記憶された音データと、当該音データよりも後に記憶部に記憶された音データとを、記憶部に記憶された時刻が古い順に、オンライン会議サーバ2に送信する。これにより、情報処理装置1は、オンライン会議サーバ2に、ユーザが発言を開始した時点の音データから送信することができるので、ユーザの発言の一部が伝わらなくなることを抑制することができる。
【0024】
[情報処理装置1の機能構成]
続いて、情報処理装置1の構成について説明する。図2は、情報処理装置1の機能構成を示す図である。情報処理装置1は、通信部11と、操作部12と、表示部13と、集音部14と、出音部15と、記憶部16と、制御部17とを有する。
【0025】
通信部11は、インターネットや携帯電話回線等の通信ネットワークを介してオンライン会議サーバ2等の外部装置とデータを送受信するための通信インターフェースである。
操作部12は、ユーザの操作を受け付ける操作デバイスである。例えば、情報処理装置1がパーソナルコンピュータである場合、操作部12は、マウスやキーボードである。
表示部13は、例えば液晶ディスプレイである。表示部13は、制御部17の制御に基づいて、オンライン会議サーバ2から受信した他のユーザの映像を表示する。
【0026】
集音部14は、情報処理装置1の周囲の音を集めることが可能なマイクロフォンである。集音部14は、例えば、ユーザが発した音声を含む、情報処理装置1の周囲で発生した音を集音する。集音部14は、集音した音を音データに変換し、制御部17に出力する。
出音部15は、制御部17から入力された音信号に基づいて音を出力するスピーカである。
【0027】
記憶部16は、各種のデータを記憶する記憶媒体であり、ROM(Read Only Memory)、RAM(Random Access Memory)、及びハードディスク等を有する。記憶部16は、制御部17が実行するプログラムを記憶する。記憶部16は、制御部17を、取得部171、記憶制御部172、検知部173、出力部174、及び切替部175として機能させる音声制御プログラムを記憶する。また、記憶部16は、制御部17を、オンライン会議を実現させるための会議制御部176として機能させる会議アプリケーションプログラムを記憶する。
【0028】
制御部17は、例えばCPU(Central Processing Unit)である。制御部17は、記憶部16に記憶された音声制御プログラムを実行することにより、取得部171、記憶制御部172、検知部173、出力部174、及び切替部175として機能する。制御部17は、記憶部16に記憶された会議アプリケーションプログラムを実行することにより会議制御部176として機能する。
【0029】
[初期設定]
オンライン会議を実現させる機能である会議制御部176に対して仮想の集音部が出力する音データを入力するために、情報処理装置1において設定を行う必要がある。まず、ユーザは操作部12を操作することにより、音声制御プログラム及び会議アプリケーションプログラムを情報処理装置1に実行させる。音声制御プログラムが実行されると、会議制御部176が用いる情報処理装置1の集音部として、集音部14と、音声制御プログラムにより実現される仮想の集音部が選択可能となる。
【0030】
ユーザは、操作部12を介して、会議制御部176において用いる集音部として、仮想の集音部を選択する。これにより、集音部14が集音した音が、音声制御プログラムにより実現される仮想の集音部を介して会議制御部176に出力される。
【0031】
[仮想の集音部の動作]
続いて、音声制御プログラムにより実現される仮想の集音部の具体的な処理について説明する。取得部171、記憶制御部172、検知部173、出力部174、及び切替部175は、協働することにより、仮想の集音部として機能する。
【0032】
取得部171は、集音部14が集音した音を示す音データを取得する。
記憶制御部172は、取得部171が取得した音データを記憶部16に記憶させる。記憶制御部172は、例えば、記憶部16に設けられている先入れ先出し方式の記憶領域である音声バッファ領域に取得部171が取得した音データを記憶させる。記憶制御部172は、音データを圧縮する圧縮処理を行い、圧縮された音データを音声バッファ領域に記憶させるようにしてもよい。音声バッファ領域は、現在時刻よりも所定時間(例えば、数百ミリ秒から1秒未満)前のタイミングから現在時刻までの音データが記憶される。記憶制御部172は、所定時間前のタイミングよりも前に取得された音データが音声バッファ領域に記憶されている場合、当該音データを削除する。
【0033】
検知部173は、取得部171が取得した音データに基づいて、情報処理装置1のユーザの発言を検知する。検知部173は、音データが示す音の周波数、音量レベル、音の継続時間の少なくともいずれかに基づいて、ユーザの発言を検知する。例えば、検知部173は、取得部171が取得した音データが示す音に、人の声に対応する周波数帯の音が含まれているとともに、取得した音データが示す音のレベルが所定のレベルを超えると、ユーザが発言していることを検知する。このようにすることで、情報処理装置1は、ユーザの発言とは異なる雑音がユーザの発言として検知されてしまうことを抑制することができる。
【0034】
また、検知部173は、取得部171が取得した音データに基づいて、ユーザの発言を検知した後にユーザの発言が途切れることを検知する。例えば、検知部173は、取得部171が取得した音データが示す音に、人の声に対応する周波数帯の音が含まれていない場合、又は、取得した音データが示す音のレベルが所定のレベルを超えていない場合に、ユーザの発言が途切れたことを検知する。
【0035】
なお、検知部173は、予めユーザの音声の特徴を示すユーザ特徴データを生成し、当該特徴データと、取得部171が取得した音データが示す音の特徴を示す特徴データとに基づいてユーザの発言を検知してもよい。この場合、取得部171は、ユーザの音声を示すユーザ音声データを取得する。例えば、取得部171は、音データの取得を開始してから所定時間経過するまでの間にユーザの音声を特定するためのユーザのテスト音声を受け付けることにより、ユーザの音声を示すユーザ音声データを取得する。
【0036】
検知部173は、取得部171が取得したユーザ音声データに基づいてユーザの音声の特徴を示すユーザ特徴データを生成し、記憶部16に記憶させておく。そして、検知部173は、取得部171が取得した音データが示す音の特徴を示す特徴データと、記憶部16に記憶されているユーザ特徴データとの類似度に基づいてユーザの発言を検知する。例えば、検知部173は、取得部171が取得した音データに対応する特徴データと、ユーザ特徴データとの類似度を算出し、算出した類似度が所定の閾値を超える場合にユーザの発言を検知する。このようにすることで、情報処理装置1は、ユーザの音声を精度良く検知することができる。
【0037】
出力部174は、会議アプリケーションプログラムが実行することにより機能する会議制御部176に対する音データの入力元として仮想の集音部が指定されている場合に、会議制御部176に音データを出力する。
【0038】
具体的には、出力部174は、検知部173がユーザの発言を検知すると、検知部173がユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部16に記憶された音データと、当該音データよりも後に記憶部16に記憶された音データとを、記憶部16に記憶された時刻が古い順に出力する。例えば、出力部174は、検知部173がユーザの発言を検知すると、記憶部16に設けられている音声バッファ領域から、記憶された時刻が古い音データから順番に取得して会議制御部176に出力する。
【0039】
そして、出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに記憶部16に記憶された音データを出力する。この場合、記憶制御部172は、ユーザの発言を検知した後にユーザの発言が途切れることを検知部173が検知したことに応じて、記憶部16の音声バッファ領域に音データを記憶させることを停止する。これにより、音声バッファ領域には、ユーザの発言が途切れた後に取得部171が取得した音データが記憶されなくなる。出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに音声バッファ領域に記憶された音データを出力する。
【0040】
そして、出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに記憶部16の音声バッファ領域に記憶された音データを出力すると、取得部171が取得した音データを会議制御部176に直接出力する。この場合、出力部174は、音データを圧縮せずに、会議制御部176に出力するようにしてもよい。このようにすることで、情報処理装置1は、ユーザの発言が途切れたタイミングで、ユーザの音声をリアルタイムに会議制御部176に出力することができる。
【0041】
また、出力部174は、ユーザの発言が途切れたことを検知部173が検知したタイミングに記憶部16の音声バッファ領域に記憶された音データを出力してから所定時間以内に検知部173がユーザの発言を検知しなくなると、取得部171が取得した音データを会議制御部176に出力しないように制御する。このようにすることで、情報処理装置1は、ユーザの発言以外の雑音が他のユーザに聞こえてしまうことを抑制することができる。
【0042】
切替部175は、会議制御部176を制御することにより、会議制御部176が音データをオンライン会議サーバ2に送信するか否かを切り替えることができる。この機能については後述する。
【0043】
[会議制御部の動作]
続いて、会議制御部176の動作について説明する。会議制御部176は、通信部11を介して、出力部174から出力された音データをオンライン会議サーバ2に送信する。オンライン会議サーバ2は、情報処理装置1から受信した音データをユーザと会議を行う他のユーザの端末(不図示)に送信する。
【0044】
会議制御部176は、通信部11を介して、オンライン会議サーバ2が他のユーザの端末から受信した音データを、オンライン会議サーバ2から受信する。会議制御部176は、受信した音データを出音部15に入力し、当該音データが示す音を出音部15に出力させる。これにより、ユーザの音データが示すユーザの音声が他のユーザの端末から出力されるとともに、他のユーザの音データが示す他のユーザの音声が情報処理装置1から出力され、ユーザと他のユーザとの間でオンライン会議を行うことができる。
【0045】
なお、会議制御部176は、通信部11を介して、情報処理装置1が備える撮像部(不図示)から出力された映像データをオンライン会議サーバ2に送信してもよい。オンライン会議サーバ2は、情報処理装置1から受信した映像データを他のユーザの端末に送信してもよい。また、会議制御部176は、オンライン会議サーバ2が他のユーザの端末から受信した映像データを、オンライン会議サーバ2から受信してもよい。そして、会議制御部176は、受信した映像データを表示部13に表示させてもよい。このようにすることで、ユーザと他のユーザとの間で互いの映像を確認しながらオンライン会議を行うことができる。
【0046】
また、会議制御部176は、操作部12を介して、出力部174から出力された音データのオンライン会議サーバ2への出力状態である音声出力状態を切り替える操作を受け付ける。会議制御部176は、音声出力状態が、オンライン会議サーバ2に音データを送信する状態であるON状態において、オンライン会議サーバ2に音データを送信しない状態であるOFF状態にする切替操作を受け付けると、音声出力状態をON状態からOFF状態に切り替えることにより、オンライン会議サーバ2に音データを送信しないように制御する。会議制御部176は、音声出力状態がOFF状態である場合に、音声出力状態をON状態に切り替える切替操作を受け付けると、音声出力状態をOFF状態からON状態に切り替えることにより、オンライン会議サーバ2に音データを送信する。
【0047】
[仮想の集音部による会議制御部の制御]
続いて、仮想の集音部の一部として機能する切替部175による会議制御部176の制御について説明する。
【0048】
切替部175は、会議制御部176がオンライン会議サーバ2に音データを送信しない状態において検知部173がユーザの発言を検知すると、会議制御部176における音声出力状態を、オンライン会議サーバ2に音データを送信しない状態(OFF状態)からオンライン会議サーバ2に音データを送信する状態(ON状態)に切り替える。具体的には、切替部175は、会議制御部176における音声出力状態がOFF状態である場合に、検知部173がユーザの発言を検知すると、会議制御部176における音声出力状態を、OFF状態からON状態に切り替える。
【0049】
また、切替部175は、会議制御部176における音声出力状態がON状態である場合に、検知部173がユーザの発言が途切れたことを検知すると、会議制御部176における音声出力状態を、ON状態からOFF状態に切り替える。
【0050】
具体的には、切替部175は、検知部173がユーザの発言が途切れたことを検知したタイミングに記憶部16の音声バッファ領域に記憶された音データを出力部174が出力してから所定時間以内に検知部173がユーザの発言を検知しなかった場合に、会議制御部176における音声出力状態を、ON状態からOFF状態に切り替える。
【0051】
このようにすることで、情報処理装置1は、音声バッファ領域に記憶された所定時間分の音データが出力された後に、音声出力状態をON状態からOFF状態に切り替えることができる。これにより、情報処理装置1は、ユーザが発言していたときの音声がオンライン会議サーバ2に途中で送信されなくなることを抑制することができる。
【0052】
なお、切替部175は、ユーザから操作部12を介して会議制御部176における音声出力状態を自動的に切り替えるか否かの選択を受け付けてもよい。そして、切替部175は、当該音声出力状態を自動的に切り替える選択を受け付けていることに応じて、検知部173によるユーザの発言の検出状況に基づいて、会議制御部176における音声出力状態を切り替えてもよい。このようにすることで、情報処理装置1は、ユーザが会議制御部176における音声出力状態を自動的に切り替えることを選択した場合に、会議制御部176における音データのオンライン会議サーバ2への音声出力状態を切り替えることができる。
【0053】
また、切替部175は、会議制御部176により実現されるオンラインの会議においてユーザが会議の開催者であるか否かを示す開催者特定用情報を取得してもよい。例えば、切替部175は、オンラインの会議におけるホストを示すホスト情報を開催者特定用情報として取得したり、オンラインの会議の画面を示す会議画面情報を開催者特定用情報として取得したりする。切替部175は、取得した開催者特定用情報に基づいて、ユーザが会議の開催者であるか否かを特定する。
【0054】
そして、切替部175は、取得した開催者特定用情報が、ユーザが会議の開催者であることを示している場合に、検知部173によるユーザの発言の検出状況に基づいて、会議制御部176における音声出力状態を切り替える。この場合、切替部175は、会議制御部176が、ユーザから音声出力状態を切り替える選択を受け付けているか否かに関わらず、検知部173によるユーザの発言の検出状況に基づいて、会議制御部176における音声出力状態を切り替えてもよい。
【0055】
ユーザが会議の開催者である場合、オンライン会議サーバ2への発言が多くなり、音声出力状態を頻繁に切り替える必要があるのに対し、ユーザが音声出力状態を切り替えることを忘れてしまうことがある。これに対し、情報処理装置1は、ユーザが会議の開催者である場合に、ユーザから音声出力状態を切り替える選択を受け付けているか否かに関わらず、音声出力状態を自動的に切り替えることができるので、ユーザの発言が他のユーザに伝わらなくなることを抑制することができる。
【0056】
[動作フロー]
続いて、情報処理装置1における処理の流れについて説明する。図3は、情報処理装置1における処理の流れを示すフローチャートである。なお、本フローチャートに示す処理が行われる前に、会議制御部176において用いる集音部として、仮想の集音部が選択されているものとする。
【0057】
まず、切替部175は、会議制御部176における音声出力状態をOFFにし、会議制御部176が出力部174から取得する音データをオンライン会議サーバ2に送信しないように会議制御部176を制御する(S1)。
続いて、取得部171は、集音部14が集音した音を示す音データを取得する(S2)。記憶制御部172は、S2において取得された音データを音声バッファ領域に記憶させる(S3)。
【0058】
続いて、制御部17は、検知部173がユーザの発言を検知したか否かを判定する(S4)。制御部17は、検知部173がユーザの発言を検知したと判定すると(S4のYES)、S5に処理を移し、検知部173がユーザの発言を検知していないと判定すると(S4のNO)、S2に処理を移す。
【0059】
S5において、切替部175は、会議制御部176における音声出力状態をONにし、会議制御部176が出力部174から取得する音データをオンライン会議サーバ2に送信するように会議制御部176を制御する。
【0060】
続いて、出力部174は、音声バッファ領域に記憶されている音データを会議制御部176に出力する(S6)。ここで、出力部174は、音声バッファ領域に記憶されている音データのうち、最も古い音データから順に会議制御部176に出力する。記憶制御部172は、会議制御部176に出力された音データを音声バッファ領域から消去する。
【0061】
続いて、取得部171は、集音部14が集音した音を示す音データを取得する(S7)。記憶制御部172は、S7において取得された音データを音声バッファ領域に記憶させる(S8)。
【0062】
続いて、制御部17は、検知部173がユーザの発言が途切れたことを検知したか否かを判定する(S9)。制御部17は、検知部173がユーザの発言が途切れたことを検知したと判定すると(S9のYES)、S10に処理を移し、検知部173がユーザの発言が途切れたことを検知していないと判定すると(S9のNO)、S6に処理を移す。
【0063】
続いて、出力部174は、音声バッファ領域に音データが残存しているか否かを判定する(S10)。出力部174は、音データが残存していると判定すると(S10のYES)、S11に処理を移し、音声バッファ領域に残存している音データを会議制御部176に出力する。出力部174は、音データが残存していないと判定すると(S10のNO)、S12に処理を移し、新たに取得部171が取得した音データを会議制御部176に直接出力する。
【0064】
続いて、取得部171は、集音部14が集音した音を示す音データを取得する(S13)。続いて、制御部17は、検知部173がユーザの発言を所定時間検出せず、ユーザが所定時間発言しなかったか否かを判定する(S14)。制御部17は、ユーザが所定時間発言しなかったと判定すると(S14のYES)、S15に処理を移し、ユーザが所定時間内に発言したと判定すると(S14のNO)、S10に処理を移す。
【0065】
続いて、制御部17は、会議制御部176によるオンラインの会議が終了したか否かを判定する(S15)。例えば、制御部17は、会議アプリケーションの実行が終了したか否かを判定することにより、オンラインの会議が終了したか否かを判定する。制御部17は、オンラインの会議が終了したと判定すると(S15のYES)、本フローチャートに係る処理を終了し、オンラインの会議が終了していないと判定すると(S15のNO)、S1に処理を移す。
【0066】
[変形例1]
なお、上述の実施の形態では、音声制御プログラムと、会議アプリケーションプログラムとが異なるものであることとしたが、これに限らない。会議アプリケーションプログラムが、取得部171、記憶制御部172、検知部173、出力部174、及び切替部175として機能してもよい。これにより、ユーザの発言を検知した場合に限定して、音声をオンライン会議サーバ2に送信する会議アプリケーションプログラムを実現することができる。
【0067】
[変形例2]
また、上述の実施形態において、出力部174は、ユーザの発言が途切れたことを検知したタイミングまでに記憶部16に記憶された音データを、記憶部16から取得して会議制御部176に出力したが、これに限らない。出力部174は、ユーザの発言を検知したことに応じて、記憶部16の音声バッファ領域に記憶されている音データを、音声バッファ領域に残存する音データがなくなるまで、取得部171が音データを取得する間隔よりも早い間隔、すなわち、ユーザの発言が実際の発言速度に比べて早口になるように会議制御部176に出力してもよい。これにより、情報処理装置1は、ユーザの発言を検知したタイミングよりも前に音声バッファ領域に記憶された音データを早期に出力し、音声バッファ領域から音データを出力することによるユーザの発言の遅れを早期に解消させることができる。
【0068】
[情報処理装置1による効果]
以上説明したように、本実施の形態に係る情報処理装置1は、集音部14が集音した音を示す音データを取得し、取得した音データを記憶部16に記憶させ、取得した音データに基づいて、ユーザの発言を検知すると、ユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部16に記憶された音データと、当該音データよりも後に記憶部16に記憶された音データとを、記憶部16に記憶された時刻が古い順に出力する。このようにすることで、情報処理装置1は、ユーザの発言の一部が伝わらなくなることを抑制することができる。
【0069】
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
【0070】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0071】
1 情報処理装置
2 オンライン会議サーバ
11 通信部
12 操作部
13 表示部
14 集音部
15 出音部
16 記憶部
17 制御部
171 取得部
172 記憶制御部
173 検知部
174 出力部
175 切替部
176 会議制御部
【要約】
【課題】ユーザの発言の一部が伝わらなくなることを抑制する。
【解決手段】音声制御プログラムは、情報処理装置1を、情報処理装置1が有する集音部14が集音した音を示す音データを取得する取得部171、取得部171が取得した音データを記憶部16に記憶させる記憶制御部172、取得部171が取得した音データに基づいて、情報処理装置1のユーザの発言を検知する検知部173、及び、検知部173がユーザの発言を検知すると、検知部173がユーザの発言を検知したタイミングよりも所定時間前のタイミングに記憶部16に記憶された音データと、当該音データよりも後に記憶部16に記憶された音データとを、記憶部16に記憶された時刻が古い順に出力する出力部174、として機能させる。
【選択図】図2

図1
図2
図3