(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023178023
(43)【公開日】2023-12-14
(54)【発明の名称】情報表示制御装置および情報表示方法
(51)【国際特許分類】
H04N 7/15 20060101AFI20231207BHJP
H04N 21/258 20110101ALI20231207BHJP
H04M 3/56 20060101ALI20231207BHJP
【FI】
H04N7/15 150
H04N21/258
H04M3/56 C
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022091049
(22)【出願日】2022-06-03
(71)【出願人】
【識別番号】308036402
【氏名又は名称】株式会社JVCケンウッド
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】櫻田 雄大
(72)【発明者】
【氏名】渡辺 廉
(72)【発明者】
【氏名】楠美 麻梨子
(72)【発明者】
【氏名】小池 博一
(72)【発明者】
【氏名】糟谷 純一
(72)【発明者】
【氏名】中村 功大
(72)【発明者】
【氏名】内田 早紀
【テーマコード(参考)】
5C164
5K201
【Fターム(参考)】
5C164FA10
5C164PA43
5C164SC11S
5C164VA09P
5C164VA51P
5C164YA21
5K201BB09
5K201CA02
5K201CA06
5K201CC10
5K201DC05
5K201ED05
5K201ED07
5K201EF04
5K201EF09
(57)【要約】
【課題】複数人数での発話内容に基づくキーワードから、適切に参照情報を表示させること。
【解決手段】制御装置20は、少なくとも発話によるコミュニケーションに参加している複数の参加者の発話を認識する発話認識部21と、複数の参加者における、主となる発言者を特定する特定部22と、発話認識部21が認識した発話から、参照情報を要するキーワードを抽出する抽出部26と、抽出部26が抽出したキーワードに対する参照情報を取得する情報取得部27と、情報取得部27が取得した参照情報を表示する表示制御部28と、を備え、抽出部26は、キーワードを抽出する条件を、主となる発言者の発話に対して重み付けを行って抽出する。
【選択図】
図3
【特許請求の範囲】
【請求項1】
少なくとも発話によるコミュニケーションに参加している複数の参加者の発話を認識する発話認識部と、
前記複数の参加者における、主となる発言者を特定する特定部と、
前記発話認識部が認識した発話から、参照情報を要するキーワードを抽出する抽出部と、
前記抽出部が抽出した前記キーワードに対する前記参照情報を取得する情報取得部と、
前記情報取得部が取得した前記参照情報を表示する表示制御部と、
を備え、
前記抽出部は、前記キーワードを抽出する条件を、前記主となる発言者の発話に対して重み付けを行って抽出する、
情報表示制御装置。
【請求項2】
前記抽出部は、前記発話認識部が認識した発話から抽出したキーワードに対する前記参照情報の必要性レベルが所定の閾値以上である場合に前記参照情報を要するキーワードとして抽出し、前記主となる発言者の発話に基づくキーワードである場合は、前記主となる発言者以外の他の発言者に対して前記閾値を低くする、
請求項1に記載の情報表示制御装置。
【請求項3】
前記抽出部は、前記発話認識部が認識した発話から抽出したキーワードに対する前記参照情報の必要性レベルとして難解性レベルが所定閾値以上である場合に、前記参照情報を要するキーワードとして抽出する、
請求項2に記載の情報表示制御装置。
【請求項4】
前記抽出部は、前記発話認識部が認識した発話から抽出したキーワードに対する前記参照情報の必要性レベルとして周知性レベルが所定閾値以下である場合に、前記参照情報を要するキーワードとして抽出する、
請求項2に記載の情報表示制御装置。
【請求項5】
少なくとも発話によるコミュニケーションに参加している複数の参加者の発話を認識する発話認識ステップと、
前記複数の参加者における、主となる発言者を特定する特定ステップと、
前記発話認識ステップで認識した発話から、参照情報を要するキーワードを抽出する抽出ステップと、
前記抽出ステップで抽出した前記キーワードに対する前記参照情報を取得する情報取得ステップと、
前記情報取得ステップで取得した前記参照情報を表示する表示ステップと、
を含み、
前記抽出ステップにおいては、前記キーワードを抽出する条件を、前記主となる発言者の発話に対して重み付けを行って抽出する、
情報表示制御装置が実行する情報表示方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報表示制御装置および情報表示方法に関する。
【背景技術】
【0002】
会議や会話において、相手が発言した語句の付加的情報を表示する技術が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
複数人数が発言する会議または会話などにおいては、様々な発言者の発言に基づく付加情報などの参照情報が多数表示される。このような場合、表示された情報を見ることにより、会議または会話における発言の聴取が疎かになるおそれがある。
【0005】
本開示は、上記に鑑みてなされたものであって、複数人数での発話内容に基づくキーワードから、適切に参照情報を表示させることを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本開示に係る情報表示制御装置は、少なくとも発話によるコミュニケーションに参加している複数の参加者の発話を認識する発話認識部と、前記複数の参加者における、主となる発言者を特定する特定部と、前記発話認識部が認識した発話から、参照情報を要するキーワードを抽出する抽出部と、前記抽出部が抽出した前記キーワードに対する前記参照情報を取得する情報取得部と、前記情報取得部が取得した前記参照情報を表示する表示制御部と、を備え、前記抽出部は、前記キーワードを抽出する条件を、前記主となる発言者の発話に対して重み付けを行って抽出する。
【0007】
本開示に係る情報表示方法は、少なくとも発話によるコミュニケーションに参加している複数の参加者の発話を認識する発話認識ステップと、前記複数の参加者における、主となる発言者を特定する特定ステップと、前記発話認識ステップで認識した発話から、参照情報を要するキーワードを抽出する抽出ステップと、前記抽出ステップで抽出した前記キーワードに対する前記参照情報を取得する情報取得ステップと、前記情報取得ステップで取得した前記参照情報を表示する表示ステップと、を含み、前記抽出ステップにおいては、前記キーワードを抽出する条件を、前記主となる発言者の発話に対して重み付けを行って抽出する。
【発明の効果】
【0008】
本開示によれば、複数人数での発話内容に基づくキーワードから、適切に参照情報を表示させることができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、情報表示装置の使用例の一例を示す概略図である。
【
図2】
図2は、情報表示装置の使用例の他の例を示す概略図である。
【
図3】
図3は、第一実施形態に係る情報表示制御装置を有する情報表示装置の構成例を示すブロック図である。
【
図4】
図4は、キーワード情報の一例を示す図である。
【
図5】
図5は、キーワードの必要性レベル等を説明する図である。
【
図6】
図6は、第一実施形態に係る情報表示制御装置における処理の流れの一例を示すフローチャートである。
【
図7】
図7は、第二実施形態に係る情報表示制御装置における処理の流れの一例を示すフローチャートである。
【
図8】
図8は、第三実施形態に係る情報表示制御装置における処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下に添付図面を参照して、本開示に係る情報表示制御装置および情報表示方法の実施形態を詳細に説明する。なお、以下の実施形態により本発明が限定されるものではない。
【0011】
[第一実施形態]
<情報表示装置>
図1は、情報表示装置の使用例の一例を示す概略図である。
図2は、情報表示装置の使用例の他の例を示す概略図である。
図3は、第一実施形態に係る情報表示制御装置(以下、「制御装置」という。)20を有する情報表示装置10の構成例を示すブロック図である。情報表示装置10は、例えば、会議または会話のような、少なくとも発話によるコミュニケーションにおいて、参加者の発話に含まれるキーワードの参照情報を表示する。
【0012】
図1に示すように、情報表示装置10は、複数人数の参加者が1か所に集まって行われる会議(以下、「リアル会議」という。)または会話において使用される。この場合に使用される情報表示装置10は、例えば、参加者が使用するスマートフォンのような情報端末装置の機能の1つとして実装されていてもよい。
図1に示すリアル会議は、発表者M11と、他の参加者M12、他の参加者M13、他の参加者M14および他の参加者M15が参加している。他の参加者M15は、情報表示装置10を使用している。
【0013】
図2に示すように、情報表示装置10は、複数人数の参加者が参加して、オンラインで行われる会議(以下、「WEB会議」という。)または会話において使用される。この場合に使用される情報表示装置10は、例えば、図示しないWEB会議システムを介してオンラインのWEB会議または会話に参加する際に使用されるノート型のパーソナルコンピュータやスマートフォンのような情報端末装置の機能の1つとして実装されていてもよい。
【0014】
以下の説明では、リアル会議またはWEB会議のどちらかの会議において使用される場合について説明する。リアル会議とWEB会議との区別を特に要しない場合、会議という。
【0015】
情報表示装置10は、会議において、複数人数での発話内容に基づくキーワードを、主発言者の発話に対して重み付けを行って抽出する。情報表示装置10は、
図3に示すように、マイクロフォン11と、表示部12と、キーワード情報記憶部18と、通信部19と、制御装置20とを備える。WEB会議に使用する情報表示装置10は、さらに図示しないカメラを備える。
【0016】
マイクロフォン11は、情報表示装置10を使用している会議の参加者の音声を収音するマイクロフォンである。マイクロフォン11は、収音した音声データを制御装置20の発話認識部21に出力する。
図1に示すように、リアル会議に使用される情報表示装置10である場合、マイクロフォン11は、発言者の音声を収音する。
図2に示すように、WEB会議に使用される情報表示装置10である場合、マイクロフォン11は、情報表示装置10を使用する参加者自身の音声を収音する。
【0017】
表示部12は、例えば、液晶ディスプレイまたは有機EL(Electro-Luminescence)ディスプレイなどを含むディスプレイである。表示部12は、制御装置20の表示制御部28から出力された映像信号に基づいて、映像を表示する。
【0018】
表示部12には、会議の参加者の発話に含まれるキーワードに対応する参照情報が表示される。表示部12において参照情報が表示される範囲を、参照情報表示範囲110という。
図1に示すように、リアル会議に使用される情報表示装置10である場合、参照情報表示範囲110は、表示部12の全面に表示されてもよい。
図2に示すように、WEB会議に使用される情報表示装置10である場合、参照情報表示範囲110は、表示部12の一部、例えば、下部、上部、左側部または右側部に表示されてもよい。WEB会議に使用される情報表示装置10である場合、参照情報表示範囲110は、表示部12にポップアップ表示されてもよい。参照情報表示範囲110は、例えば、3行以下程度の文字が表示される範囲である。
【0019】
図2に示すように、WEB会議に使用される情報表示装置10である場合、表示部12は、参加者の映像、および、画面共有された資料などが表示される。表示部12は、例えば、主となる発言者(以下、「主発言者」という。)の映像101が、他の参加者の映像102、映像103より大きく表示される。
【0020】
キーワード情報記憶部18は、キーワード情報として、キーワードごとに参照情報を記憶する。キーワード情報記憶部18は、例えば、RAM(Random Access Memory)、フラッシュメモリなどの半導体メモリ素子などの記録媒体である。キーワード情報記憶部18は、通信部19を介して無線接続される外部記録部であってもよい。
【0021】
キーワード情報記憶部18は、キーワード情報として、キーワードごとに、必要性レベルおよび参照情報を記憶する。必要性レベルとは、キーワード毎に対する参照情報の表示が必要となる指針を示すレベルであり、例えば、難解性レベルおよび周知性レベルなどを含む。
【0022】
キーワードは、補足的に説明を行うことが必要とされる単語である。キーワードは、例えば、一般的に知られていない語句、専門用語、略語、難解語および流行語などである。難解性レベルは、難解語であるキーワードの難解性を示す。難解性レベルは、例えば、1から5までの数値によって5段階で示される。難解性レベルは、難解性が高いほど、つまり難解な単語であるほど数値が大きくなる。周知性レベルは、一般的に知られていない語句、専門用語、略語などのキーワードにおける周知性を示す。周知性レベルは、例えば、1から5までの数値によって5段階で示される。周知性レベルは、周知性が高いほど、つまり周知されている単語であるほど数値が大きくなる。
【0023】
参照情報は、例えば、キーワードの意味、具体的な説明説明である。キーワードが略語の場合、参照情報は、略していない正式名称でもよい。なお、説明は、文字以外に、例えば、写真または図などでもよい。参照情報は、例えば、キーワードの付加的な情報である付加情報でもよい。
【0024】
参照情報は、人が数秒程度で読むことが可能な、例えば100文字以下程度の文字数としてもよい。
【0025】
図4は、キーワード情報の一例を示す図である。
図4に示すキーワード情報は、キーワードごとに、必要性レベルが記憶され、キーワードに基づき、参照情報が検索される。参照情報は、後述する通信部19を用いて検索される情報に加えて、予め記憶されていてもよい。例えば、キーワード「○○○」については、難解性レベル「5」、周知性レベル「1」、参照情報「○・・・○」と記憶されている。例えば、キーワード「△△△」については、難解性レベル「3」、周知性レベル「5」、参照情報「△・・・△」と記憶されている。
【0026】
図4の例においては、例えば、様々なキーワードに対して5段階の必要性レベルが対応付けられている。この場合において、必要性レベルの一例である難解性レベルは、難解性レベル「1」が、難解性が低いことを示しており、言い換えると、分かりやすいキーワードである。また、難解性レベル「5」が、難解性が高いことを示しており、言い換えると、容易に理解できないキーワードである。また、必要性レベルの一例である周知性レベルは、周知性レベル「1」が、周知性が低いことを示しており、言い換えると、一般的に周知されていないキーワードである。また、周知性レベル「5」が、周知性が高いことを示しており、言い換えると、一般的に良く周知されているキーワードである。
【0027】
参照情報が、通信部19によってWEB上で検索される場合は、例えば、キーワードに対するウィキペディア(登録商標)のような特定のWEBメディアによる情報、キーワードに関する最新のニュースなどが検索される。また、キーワードが商品名やサービス名である場合は、その商品やサービスを提供する提供元のWEBサイトなどが検索される。さらには、WEB上のサーチエンジンによって検索された結果に対し、広告を除く最上位に表示される内容を参照情報としてもよい。
【0028】
通信部19は、無線通信などを行うための通信ユニットである。通信部19は、例えば、Wi-Fi(登録商標)や携帯電話回線などを用いた通信方法で通信を行い、イントラネットやインターネットに接続される。通信部19は、制御装置20の通信制御部29によって通信を制御される。
図1に示すように、リアル会議に使用される情報表示装置10である場合、通信部19は、外部記録部であるキーワード情報記憶部18からキーワード情報を取得や、参照情報の検索を行う。
図2に示すように、WEB会議に使用される情報表示装置10である場合、通信部19は、他の参加者が使用する情報表示装置10との間で、参加者の音声および映像を相互に通信するとともに、参照情報の検索を行う。より詳しくは、通信部19は、マイクロフォン11で収音した参加者の音声、および、カメラで撮影した参加者の映像を、他の参加者が使用する情報表示装置10へ送信する。通信部19は、他の参加者が使用する情報表示装置10から、他の参加者の音声および映像を受信する。
【0029】
以下の説明において、入力された音声とは、リアル会議に使用される情報表示装置10である場合、マイクロフォン11で収音した音声である。入力された音声とは、WEB会議に使用される情報表示装置10である場合、マイクロフォン11で収音した音声、および、通信部19を介して取得した、他の参加者が使用する情報表示装置10から取得した他の参加者の音声である。
【0030】
<情報表示制御装置>
制御装置20は、情報表示装置10の各部を制御する。制御装置20は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)などで構成された演算処理装置(制御装置)であり、RAM又はROM(Read Only Memory)などの記憶装置を有する。制御装置20は、記憶されているプログラムをメモリにロードして、プログラムに含まれる命令を実行する。制御装置20には上述したRAMなどの内部メモリが含まれ、内部メモリは制御装置20におけるデータの一時記憶などに用いられる。制御装置20は、プログラムの実行によって実現される機能ブロックなどの構成要素として、発話認識部21と、特定部22と、抽出部26と、情報取得部27と、表示制御部28と、通信制御部29とを有する。
【0031】
発話認識部21は、少なくとも発話によるコミュニケーションに参加している複数の参加者の発話を認識する。発話認識部21は、入力された音声を分析し、音声に含まれる発話内容を認識する。発話認識部21は、入力された音声に対して、音素毎または単語毎の音響モデル分析を行い、音素モデルや言語モデルとの対比を行うことで、発話内容を認識する。
【0032】
特定部22は、複数の参加者における、主発言者を特定する。特定部22は、例えば、WEB会議またはリアル会議における、ファシリテータ、発表者、リーダー、または、会議の主催者のような主たる参加者を主発言者として特定してもよい。
【0033】
特定部22は、入力された音声から、例えば、WEB会議またはリアル会議において最初に発言した人、または、最初に例えば10秒以上のように所定時間以上発言した人を、主発言者として特定してもよい。特定部22は、入力された音声から、例えば、リアル会議の場合、リアル会議において最初に発言した人の声の特徴を声紋分析などによって特定して、主発言者として特定してもよい。
【0034】
特定部22は、例えば、WEB会議の場合、WEB会議システムから取得したWEB会議の開催情報から、WEB会議を招集した人を主発言者として特定してもよい。特定部22は、リアル会議の場合、参加者のメール情報またはスケジュール情報などからリアル会議の開催情報を取得して、主発言者を特定してもよい。
【0035】
特定部22は、WEB会議の場合、WEB会議システムから取得した情報から、画面共有、つまり発言するための資料などの表示を共有している人を主発言者として特定してもよい。
【0036】
特定部22は、WEB会議の場合、WEB会議システムから取得した情報から、発言するために発言ボタンまたは挙手ボタンなどの所定の操作を行った人を、主発言者として特定してもよい。
【0037】
特定部22は、WEB会議の場合、
図2に示す映像101のように、最も大きく映像が表示されている他の参加者を、主発言者として特定してもよい。
【0038】
特定部22は、リアル会議の場合、カメラが撮影した参加者の映像から、立ち上がっている人、挙手した人、または、ホワイトボードまたはプロジェクタによって投影された投影画面の前に立っている人などを主発言者として特定してもよい。
【0039】
抽出部26は、発話認識部21が認識した発話から、参照情報を要するキーワードを抽出する。抽出部26は、キーワードを抽出する条件を、主発言者の発話に対して重み付けを行って抽出する。より詳しくは、抽出部26は、主発言者の発話を、主発言者以外の他の発言者の発話よりも優先して、言い換えると、主発言者の発話の重みを重くしてキーワードを抽出する。
【0040】
主発言者は、他の発言者に比べて、会議の議題に沿った、重要な発言を行うことが多い。そこで、主発言者の発話を、主発言者以外の他の発言者の発話よりも優先してキーワードを抽出することにより、会議の内容の理解に重要なキーワードを優先的に抽出する。
【0041】
抽出部26は、抽出部26によって抽出されるキーワードが、特定部22によって特定された主発言者の声の特徴に一致するか否かによって、抽出されたキーワードが主発言者による発話であるか否かを判定すればよい。
【0042】
本実施形態では、抽出部26は、発話認識部21が認識した発話から抽出したキーワードに対する参照情報の必要性レベルに応じて、参照情報を要するキーワードとして抽出してもよい。より詳しくは、抽出部26は、発話認識部21が認識した発話から抽出したキーワードに対する参照情報の必要性レベルが所定の閾値以上である場合、参照情報を要するキーワードとして抽出する。抽出部26は、主発言者の発話に基づくキーワードである場合、主発言者以外の他の発言者に対して必要性レベルの閾値を低くする。
【0043】
図5は、キーワードにおける参照情報の必要性レベルおよび必要レベルの一例である難解性レベルと周知性レベルを説明する図である。抽出部26は、発話認識部21が認識した発話から抽出したキーワードに対する参照情報の必要性レベルが閾値t1以上である場合、参照情報を要するキーワードとして抽出する。抽出部26は、主発言者の発話に基づくキーワードである場合、抽出したキーワードに対する参照情報の必要性レベルが閾値t2(t2<t1)以上である場合、参照情報を要するキーワードとして抽出する。例えば、必要性レベルが
図5に示すように5段階に分類されている場合、抽出部26は、主発言者の発話に基づくキーワードに対して、必要性レベルが例えば3以上である場合、参照情報を要するキーワードとして抽出し、主発言者以外の発話に基づくキーワードに対して、必要性レベルが例えば4以上である場合、参照情報を要するキーワードとして抽出する。
【0044】
本実施形態では、抽出部26は、発話認識部21が認識した発話から抽出したキーワードに対する参照情報の必要性レベルとして難解性レベルが所定閾値以上である場合、参照情報を要するキーワードとして抽出してもよい。例えば、難解性レベルが
図5に示すように5段階に分類されている場合、抽出部26は、主発言者の発話に基づくキーワードに対して、難解性レベルが例えば3以上である場合、参照情報を要するキーワードとして抽出し、主発言者以外の発話に基づくキーワードに対して、難解性レベルが例えば4以上である場合、参照情報を要するキーワードとして抽出する。言い換えると、主発言者の発話に基づくキーワードにおいては、難解性レベルが低いキーワード、つまり、より難解ではないキーワードも含めて、参照情報を要するキーワードとする。
【0045】
本実施形態では、抽出部26は、発話認識部21が認識した発話から抽出したキーワードに対する参照情報の必要性レベルとして周知性レベルが所定閾値未満である場合、参照情報を要するキーワードとして抽出してもよい。例えば、周知性レベルが
図5に示すように5段階に分類されている場合、抽出部26は、周知性レベルが例えば3未満である場合、参照情報を要するキーワードとして抽出する。抽出部26は、主発言者の発話に基づくキーワードに対して、周知性レベルが例えば3以下である場合、参照情報を要するキーワードとして抽出し、主発言者以外の発話に基づくキーワードに対して、周知性レベルが例えば2以下である場合、参照情報を要するキーワードとして抽出する。言い換えると、主発言者の発話に基づくキーワードにおいては、周知性レベルが高いキーワード、つまり、より周知されているキーワードも含めて、参照情報を要するキーワードとする。
【0046】
図5において、難解性レベルが閾値t1以上であることは、必要性レベルが閾値t1以上であることに対応し、難解性レベルが閾値t2以上であることは、必要性レベルが閾値t2以上であることに対応する。また、周知性レベルが閾値t1以下であることは、必要性レベルが閾値t1以上であることに対応し、周知性レベルが閾値t2以下であることは、必要性レベルが閾値t2以上であることに対応する。
【0047】
情報取得部27は、抽出部26が抽出したキーワード、つまり、抽出部26が参照情報を要すると判断したキーワードに対する参照情報を取得する。本実施形態では、情報取得部27は、WEB上の情報に基づき、キーワードに対する参照情報を取得する。
【0048】
表示制御部28は、表示部12における映像の表示を制御する。表示制御部28は、表示部12に対して映像の映像信号を出力する。
【0049】
表示制御部28は、情報取得部27が取得した参照情報の表示部12への表示を制御する。表示制御部28は、抽出部26によって抽出されたキーワードに対応する参照情報を表示部12の参照情報表示範囲110に表示するための映像信号を出力する。表示制御部28は、参照情報を、例えば5秒から10秒間程度の所定期間表示する。表示制御部28は、参照情報を表示中に、次の参照情報を表示する場合、所定期間の経過前でも次の参照情報に表示を変えてもよい。表示制御部28は、参照情報を表示中に、次の参照情報を表示する場合、例えば、必要性レベルが高い参照情報を表示してもよい。
【0050】
WEB会議に使用される情報表示装置10である場合、表示制御部28は、WEB会議の映像の表示を制御する。表示制御部28は、カメラが撮影している映像を含むWEB会議の映像の映像信号を出力する。
【0051】
通信制御部29は、通信部19による通信を制御する。
図1に示すように、リアル会議に使用される情報表示装置10である場合、通信制御部29は、通信部19を介して、外部記録部であるキーワード情報記憶部18からキーワード情報の受信や、参照情報の検索を行うよう制御する。
図2に示すように、WEB会議に使用される情報表示装置10である場合、通信制御部29は、通信部19を介して、他の参加者が使用する情報表示装置10との間で、参加者の音声および映像を相互に通信するとともに、参照情報の検索を行うよう制御する。より詳しくは、通信制御部29は、通信部19を介して、マイクロフォン11で収音した参加者の音声、および、カメラで撮影した参加者の映像を、他の参加者が使用する情報表示装置10へ送信するよう制御する。通信制御部29は、通信部19を介して、他の参加者が使用する情報表示装置10から、他の参加者の音声および映像を受信するよう制御する。
【0052】
<情報表示制御装置における情報処理>
次に、
図6を用いて、制御装置20における処理の流れについて説明する。
図6に示す処理は、
図1に示すように、リアル会議に使用される情報表示装置10である場合、参照情報を表示させるためのアプリケーションを起動することで開始される。
図2に示すように、WEB会議に使用される情報表示装置10である場合、WEB会議を行うアプリケーションの起動、またはWEB会議の開始によって開始される。この場合、WEB会議を行うアプリケーションに、参照情報を表示させる機能が含まれていてもよく、ユーザの操作によって、参照情報を表示させる機能のオン/オフを選択可能としてもよい。情報表示装置10が起動されることで、
図6に示すフローチャートの処理が開始される。
【0053】
制御装置20は、主発言者を特定する(ステップS101)。より詳しくは、制御装置20は、特定部22によって、例えば、入力された音声から、ファシリテータ、発表者、リーダー、または、会議の主催者のような主たる参加者を主発言者として特定する。なお、主発言者を特定する方法はこれに限定されない。制御装置20は、ステップS102へ進む。
【0054】
制御装置20は、発話認識を開始する(ステップS102)。より詳しくは、制御装置20は、発話認識部21によって、入力された音声を分析し、音声に含まれる発話内容を認識する。制御装置20は、ステップS103へ進む。
【0055】
制御装置20は、キーワードが抽出されたか否かを判定する(ステップS103)。より詳しくは、制御装置20は、抽出部26によって、発話認識部21が認識した発話から、参照情報を要するキーワードを抽出する。制御装置20は、抽出部26によって、発話認識部21が認識した発話から抽出したキーワードに対する参照情報の必要性レベルが所定の閾値以上である場合、参照情報を要するキーワードとして抽出する。制御装置20は、キーワードが抽出されたと判定する場合(ステップS103でYes)、ステップS104へ進む。制御装置20は、キーワードが抽出されたと判定しない場合(ステップS103でNo)、ステップS108へ進む。
【0056】
キーワードが抽出されたと判定する場合(ステップS103でYes)、制御装置20は、抽出されたキーワードは主発言者による発話であるか否かを判定する(ステップS104)。より詳しくは、制御装置20は、抽出部26によって、抽出されたキーワードが、特定部22により特定された主発言者の声の特徴に一致するか否かに基づいて、抽出されたキーワードが主発言者による発話であるか否かを判定する。制御装置20は、抽出されたキーワードは主発言者による発話であると判定する場合(ステップS104でYes)、ステップS106へ進む。制御装置20は、抽出されたキーワードは主発言者による発話であると判定しない場合(ステップS104でNo)、ステップS105へ進む。
【0057】
抽出されたキーワードは主発言者による発話であると判定しない場合(ステップS104でNo)、制御装置20は、抽出されたキーワードの参照情報の必要性レベルが閾値t1以上であるか否かを判定する(ステップS105)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報の必要性レベルを取得する。このように、制御装置20は、抽出部26によって、主発言者の発話に基づくキーワードである場合、主発言者以外の他の発言者に対して閾値を低くして参照情報を要するキーワードとして抽出する。制御装置20は、抽出されたキーワードの参照情報の必要性レベルが閾値t1以上であると判定する場合(ステップS105でYes)、ステップS107へ進む。制御装置20は、抽出されたキーワードの参照情報の必要性レベルが閾値t1以上であると判定しない場合(ステップS105でNo)、ステップS108へ進む。
【0058】
抽出されたキーワードは主発言者による発話であると判定する場合(ステップS104でYes)、制御装置20は、抽出されたキーワードの参照情報の必要性レベルが閾値t2以上であるか否かを判定する(ステップS106)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報の必要性レベルを取得する。制御装置20は、抽出されたキーワードの参照情報の必要性レベルが閾値t2以上であると判定する場合(ステップS106でYes)、ステップS107へ進む。制御装置20は、抽出されたキーワードの参照情報の必要性レベルが閾値t2以上であると判定しない場合(ステップS106でNo)、ステップS108へ進む。
【0059】
制御装置20は、参照情報を取得して、所定期間表示する(ステップS107)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報を取得する。制御装置20は、表示制御部28によって、抽出部26によって抽出されたキーワードに対応する参照情報の映像信号を所定期間出力する。制御装置20は、ステップS108へ進む。
【0060】
制御装置20は、処理を終了するか否かを判定する(ステップS108)。例えば、情報表示装置10の電源がOFFにされたことや、図示しない操作部の操作がされたことなどで、
図6に示すフローチャートを開始するトリガとなったアプリケーションなどを終了させる操作が行われたことで、処理を終了することが判定される。制御装置20は、処理を終了すると判定された場合(ステップS108でYes)、本処理を終了する。制御装置20は、処理を終了すると判定されない場合(ステップS108でNo)、ステップS103の処理を再度実行する。
【0061】
ステップS105、ステップS106において、必要性レベルとして難解性レベルが所定閾値以上であるか否かを条件にする場合について説明する。難解性レベルを示す数値が大きいほど難解となる5段階で、様々なキーワードに難解性レベルが対応付けられている場合、ステップS105においては、制御装置20は、抽出されたキーワードの参照情報の難解性レベルが4以上であるか否かを判定する。ステップS106においては、制御装置20は、抽出されたキーワードの参照情報の難解性レベルが3以上であるか否かを判定する。
【0062】
ステップS105、ステップS106において、必要性レベルとして周知性レベルが所定閾値未満であるか否かを条件にする場合について説明する。周知性レベルを示す数値が大きいほど周知となる5段階で、様々なキーワードに周知性レベルが対応付けられている場合、ステップS105においては、制御装置20は、抽出されたキーワードの参照情報の周知性レベルが2以下であるか否かを判定する。ステップS106においては、制御装置20は、抽出されたキーワードの参照情報の周知性レベルが3以下であるか否かを判定する。
【0063】
<効果>
上述したように、本実施形態では、キーワードを抽出する条件を、主発言者の発話に対して重み付けを行って抽出する。本実施形態によれば、複数人数での発話内容に基づくキーワードから、主発言者の発話に対して重み付けを行って適切に参照情報を表示させることができる。本実施形態は、表示される参照情報を絞ることにより、参加者が表示される参照情報の確認に時間を要し、会議における発言の聴取が疎かになる可能性を抑えることができる。
【0064】
本実施形態では、認識した発話から抽出したキーワードに対する参照情報の必要性レベルが所定の閾値以上である場合に参照情報を要するキーワードとして抽出する。本実施形態では、主発言者の発話に基づくキーワードである場合は、主発言者以外の他の発言者に対して閾値を低くしてキーワードを抽出する。本実施形態は、主発言者の発話に基づくキーワードの参照情報を、他の発言者の発話に基づくキーワードの参照情報より優先して表示することができる。本実施形態は、主発言者を優先して適切に参照情報を表示させることができる。
【0065】
本実施形態では、認識した発話から抽出したキーワードに対する参照情報の必要性レベルとして難解性レベルが所定閾値以上である場合に、参照情報を要するキーワードとして抽出する。本実施形態は、難解性レベルが高いキーワードの参照情報を適切に表示することができる。
【0066】
本実施形態では、認識した発話から抽出したキーワードに対する参照情報の必要性レベルとして周知性レベルが所定閾値以下である場合に、参照情報を要するキーワードとして抽出する。本実施形態は、周知性レベルが低いキーワードの参照情報を適切に表示することができる。
【0067】
本実施形態においては、主発言者の発話に基づくキーワードと、主発言者以外の他の発言者の発話に基づくキーワードに対して、抽出部26が、参照情報を要するキーワードを、異なる重み付け条件で抽出する構成とした。本実施形態においては、抽出部26に代えて、表示制御部28が同等の機能を有する構成としてもよい。
【0068】
この場合、表示制御部28は、キーワードを表示する条件を、主となる発言者の発話に対して重み付けを行って表示させる。表示制御部28は、例えば、主発言者の発話に基づくキーワードの必要性レベルが閾値t2以上の場合に、参照情報を表示させ、主発言者以外の他の発言者の発話に基づくキーワードの必要性レベルが閾値t1以上の場合に、参照情報を表示させる処理を行う。
【0069】
この場合、
図6のステップS107において、抽出部26は、必要性レベルがt2以上のキーワードに対する参照情報を取得する。また、ステップS107において、表示制御部28は、ステップS104がYesの場合、必要性レベルがt2以上のキーワードに対する参照情報を表示させ、ステップS104がNoの場合、必要性レベルがt1以上のキーワードに対する参照情報を表示させる。
【0070】
[第二実施形態]
図7を参照しながら、本実施形態に係る情報表示装置10について説明する。
図7は、第二実施形態に係る情報表示制御装置における処理の流れの一例を示すフローチャートである。情報表示装置10は、基本的な構成は第一実施形態の情報表示装置10と同様である。以下の説明においては、情報表示装置10と同様の構成要素には、同一の符号または対応する符号を付し、その詳細な説明は省略する。本実施形態では、情報表示装置10は、会議において、複数人数での発話内容に基づくキーワードから、主発言者の発話に対して重み付けを行って表示態様を変えて参照情報を表示する。本実施形態では、情報表示装置10は、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に対して長い時間表示する。本実施形態では、表示制御部28における処理が第一実施形態と異なる。
【0071】
本実施形態では、キーワード情報記憶部18は、キーワード情報として、キーワードごとに参照情報を記憶していればよい。本実施形態では、キーワード情報は必要性レベルを含まなくてよい。
【0072】
表示制御部28は、参照情報を表示する条件を、主発言者の発話に基づくキーワードに対して重み付けを行って表示する。より詳しくは、表示制御部28は、主発言者の発話を、主発言者以外の他の発言者の発話よりも優先して、言い換えると、主発言者の発話の重みを重くしてキーワードの参照情報を表示する。
【0073】
本実施形態では、表示制御部28は、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合と表示態様を変えて表示する。表示制御部28は、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に比べて、目立つように、または、確認しやすいように表示態様を変えて表示する。
【0074】
表示態様を変えるとは、例えば、表示する時間を変えること、または、表示する情報量を変えることである。表示態様を変えるとは、例えば、表示する文字の大きさを変えること、色を変えること、または、参照情報表示範囲110の大きさを変えること、表示する位置を変えることでもよい。
【0075】
本実施形態では、表示制御部28は、参照情報を表示する時間を、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に対して長い時間表示させる。表示制御部28は、主発言者の発話に基づくキーワードの参照情報の表示時間を例えば5秒間とし、他の発言者の発話に基づくキーワードの参照情報の表示時間を例えば3秒間として参照情報を表示する。
【0076】
主発言者は、他の発言者に比べて、会議の話題に沿った発言のような重要な発言を行うことが多い。そこで、主発言者の発話に基づくキーワードに対する参照情報を、主発言者以外の他の発言者の発話に基づくキーワードに対する参照情報よりも長い期間表示することにより、会議の内容の理解に重要なキーワードをより確認しやすくする。
【0077】
次に、
図7を用いて、制御装置20における処理の流れについて説明する。
図7に示すステップS111からステップS114、ステップS117の処理は、
図6に示すフローチャートのステップS101からステップS104、ステップS108と同様の処理を行う。
【0078】
抽出されたキーワードは主発言者による発話であると判定する場合(ステップS114でYes)、制御装置20は、参照情報を取得して、第一期間tm1(tm1<tm2)表示する(ステップS115)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報を取得する。制御装置20は、表示制御部28によって、抽出部26によって抽出されたキーワードに対応する参照情報の映像信号を第一期間tm1出力する。制御装置20は、ステップS117へ進む。
【0079】
抽出されたキーワードは主発言者による発話であると判定しない場合(ステップS114でNo)、制御装置20は、参照情報を取得して、第二期間tm2表示する(ステップS116)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報を取得する。制御装置20は、表示制御部28によって、抽出部26によって抽出されたキーワードに対応する参照情報の映像信号を第二期間tm2出力する。制御装置20は、ステップS117へ進む。
【0080】
<効果>
上述したように、参照情報を表示する条件を、主発言者の発話に基づくキーワードに対して重み付けを行って表示する。本実施形態によれば、複数人数での発話内容に基づくキーワードから、適切に参照情報を表示させることができる。
【0081】
本実施形態では、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合と表示態様を変えて表示する。本実施形態は、主発言者の発話に基づくキーワードの参照情報を、他の発言者の発話に基づくキーワードの参照情報に比べて、例えば、確認しやすい表示態様で表示することができる。
【0082】
本実施形態では、参照情報を表示する時間を、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に対して長い時間表示させることができる。
【0083】
[第三実施形態]
図8は、第三実施形態に係る情報表示制御装置における処理の流れの一例を示すフローチャートである。情報表示装置10は、基本的な構成は第二実施形態の情報表示装置10と同様である。以下の説明においては、情報表示装置10と同様の構成要素には、同一の符号または対応する符号を付し、その詳細な説明は省略する。本実施形態では、情報表示装置10は、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に対して情報量を多く表示する。本実施形態では、表示制御部28における処理が第二実施形態と異なる。
【0084】
本実施形態では、キーワード情報記憶部18は、キーワード情報の参照情報は、例えば、最大情報量lv1の参照情報と、最大情報量lv2の参照情報とを記憶してもよい。この場合、例えば、最大情報量lv1の参照情報は3行程度の参照情報であり、最大情報量lv2の参照情報は1行程度の参照情報である。
【0085】
本実施形態では、表示制御部28は、参照情報を表示する情報量(以下、「最大情報量」という。)を、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に対して多く表示させる。表示制御部28は、主発言者の発話に基づくキーワードの参照情報を表示する情報量を例えば最大3行(最大情報量3行)とし、他の発言者の発話に基づくキーワードの参照情報を表示する情報量を例えば最大1行(最大情報量1行)とする。
【0086】
表示制御部28は、例えば、取得した参照情報の先頭から、最大情報量分を表示してもよい。表示制御部28は、例えば、取得した参照情報のうち、表示する最大情報量に応じて、最大情報量lv1の参照情報または最大情報量lv2の参照情報を表示してもよい。
【0087】
主発言者は、他の発言者に比べて、会議の話題に沿った発言のような重要な発言を行うことが多い。そこで、主発言者の発話に基づくキーワードに対する参照情報を、主発言者以外の他の発言者の発話に基づくキーワードに対する参照情報よりも情報量を多く表示することにより、会議の内容の理解に重要なキーワードの理解をより深めることが可能になる。
【0088】
次に、
図8を用いて、制御装置20における処理の流れについて説明する。
図8に示すステップS121からステップS124、ステップS127の処理は、
図6に示すフローチャートのステップS101からステップS104、ステップS108と同様の処理を行う。
【0089】
抽出されたキーワードは主発言者による発話であると判定する場合(ステップS124でYes)、制御装置20は、参照情報を取得して、最大情報量lv1(lv1<lv2)を表示する(ステップS125)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報を取得する。制御装置20は、表示制御部28によって、抽出部26によって抽出されたキーワードに対応する、最大情報量lv1の参照情報の映像信号を出力する。制御装置20は、ステップS127へ進む。
【0090】
抽出されたキーワードは主発言者による発話であると判定しない場合(ステップS124でNo)、制御装置20は、参照情報を取得して、最大情報量lv2(ステップS126)。より詳しくは、制御装置20は、情報取得部27によって、キーワード情報記憶部18のキーワード情報から、抽出部26が抽出したキーワードに対する参照情報を取得する。制御装置20は、表示制御部28によって、抽出部26によって抽出されたキーワードに対応する、最大情報量lv2の参照情報の映像信号を出力する。制御装置20は、ステップS127へ進む。
【0091】
<効果>
上述したように、本実施形態では、参照情報を表示する情報量を、主発言者の発話に基づくキーワードに対する参照情報である場合は、他の発言者の発話に基づくキーワードに対する参照情報である場合に対して多く表示させることができる。
【0092】
本開示に係る情報表示装置は、上述した実施形態以外にも種々の異なる形態にて実施されてもよい。
【0093】
図示した情報表示装置の各構成要素は、機能概念的なものであり、必ずしも物理的に図示の如く構成されていなくてもよい。すなわち、各装置の具体的形態は、図示のものに限られず、各装置の処理負担や使用状況などに応じて、その全部または一部を任意の単位で機能的または物理的に分散または統合してもよい。
【0094】
情報表示装置の構成は、例えば、ソフトウェアとして、メモリにロードされたプログラムなどによって実現される。上記実施形態では、これらのハードウェアまたはソフトウェアの連携によって実現される機能ブロックとして説明した。すなわち、これらの機能ブロックについては、ハードウェアのみ、ソフトウェアのみ、または、それらの組み合わせによって種々の形で実現できる。
【0095】
上記した構成要素には、当業者が容易に想定できるもの、実質的に同一のものを含む。さらに、上記した構成は適宜組み合わせが可能である。また、本発明の要旨を逸脱しない範囲において構成の種々の省略、置換または変更が可能である。
【0096】
[変形例]
上記では、主発言者が使用する情報表示装置10と、他の発言者が使用する情報表示装置10とでは、参照情報の表示を変えてもよい。例えば、主発言者が使用する情報表示装置10は、参照情報を表示しないようにしてもよい。
【符号の説明】
【0097】
10 情報表示装置
11 マイクロフォン
12 表示部
18 キーワード情報記憶部
19 通信部
20 制御装置(情報表示制御装置)
21 発話認識部
22 特定部
26 抽出部
27 情報取得部
28 表示制御部
29 通信制御部