特開2019-191713(P2019-191713A)IP Force 特許公報掲載プロジェクト 2015.5.11 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧
特開2019-191713決定プログラム、決定方法、及び決定装置
<>
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000003
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000004
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000005
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000006
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000007
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000008
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000009
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000010
  • 特開2019191713-決定プログラム、決定方法、及び決定装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2019-191713(P2019-191713A)
(43)【公開日】2019年10月31日
(54)【発明の名称】決定プログラム、決定方法、及び決定装置
(51)【国際特許分類】
   G06F 17/24 20060101AFI20191004BHJP
   G06F 17/22 20060101ALI20191004BHJP
   G06Q 10/10 20120101ALI20191004BHJP
   G10L 15/00 20130101ALI20191004BHJP
   G06F 3/16 20060101ALI20191004BHJP
【FI】
   G06F17/24
   G06F17/22 617
   G06Q10/10
   G10L15/00 200U
   G06F3/16 650
   G06F3/16 620
【審査請求】有
【請求項の数】11
【出願形態】OL
【全頁数】28
(21)【出願番号】特願2018-80957(P2018-80957)
(22)【出願日】2018年4月19日
(71)【出願人】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(72)【発明者】
【氏名】角 勝
【テーマコード(参考)】
5B109
5L049
【Fターム(参考)】
5B109KB06
5B109MH02
5B109VC03
5L049AA20
(57)【要約】
【課題】会議における発話に関する文字情報を適切に校正可能にする。
【解決手段】本願に係る決定プログラムは、取得手順と、表示手順と、決定手順とを、会議に参加中のユーザが利用する端末装置に実行させる。取得手順は、音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する。表示手順は、取得手順により取得された文字情報を表示する。決定手順は、表示手順により表示された文字情報のうち、所定の文字列に対するユーザの選択に基づいて、所定の文字列を校正するかどうかを決定する。
【選択図】図1
【特許請求の範囲】
【請求項1】
会議に参加中のユーザが利用する端末装置が実行する決定プログラムであって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得手順と、
前記取得手順により取得された前記文字情報を表示する表示手順と、
前記表示手順により表示された前記文字情報のうち、所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定手順と、
を端末装置に実行させることを特徴とする決定プログラム。
【請求項2】
前記表示手順は、
前記文字情報のうち、校正に関する所定の条件を満たす前記所定の文字列を、前記ユーザが選択可能に表示する
ことを特徴とする請求項1に記載の決定プログラム。
【請求項3】
前記表示手順は、
前記所定の文字列に他の変換候補がある場合、前記他の変換候補を表示し、
前記決定手順は、
前記他の変換候補に対する前記ユーザの選択を示す選択情報に基づいて、前記所定の文字列をいずれの変換候補に校正するかを決定する
ことを特徴とする請求項1または請求項2に記載の決定プログラム。
【請求項4】
前記決定手順は、
前記他の変換候補のうち、前記ユーザが一の変換候補を選択した場合、当該一の変換候補に前記所定の文字列を校正すると決定する
ことを特徴とする請求項3に記載の決定プログラム。
【請求項5】
前記決定手順は、
前記他の変換候補のいずれも前記ユーザが選択しなかった場合、前記所定の文字列を校正しないと決定する
ことを特徴とする請求項3または請求項4に記載の決定プログラム。
【請求項6】
前記取得手順は、
前記会議の前記参加ユーザのうち、前記ユーザ以外の他のユーザの前記他の変換候補に対する選択を示す選択情報を取得し、
前記決定手順は、
前記他のユーザの選択情報に基づいて、前記所定の文字列をいずれの変換候補校正に校正するかを決定する
ことを特徴とする請求項3に記載の決定プログラム。
【請求項7】
前記決定手順は、
前記参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に前記所定の文字列を校正すると決定する
ことを特徴とする請求項6に記載の決定プログラム。
【請求項8】
前記決定手順は、
前記所定の文字列を前記一の変換候補に校正するとユーザが選択した後、前記取得手順により取得された一の文字情報に前記所定の文字列が含まれる場合、前記一の文字情報中の前記所定の文字列を前記一の変換候補に変換すると決定する
ことを特徴とする請求項4または請求項7に記載の決定プログラム。
【請求項9】
前記決定手順による決定結果に基づいて、前記会議の前記参加ユーザの他の発話情報に対応する他の文字情報を生成する生成手順、
さらに前記端末装置に実行させることを特徴とする請求項1〜8のいずれか1項に記載の決定プログラム。
【請求項10】
会議に参加中のユーザが利用する端末装置が実行する決定方法であって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得工程と、
前記取得工程により取得された前記文字情報を表示する表示工程と、
前記表示工程により表示された前記文字情報のうち、所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定工程と、
を含んだことを特徴とする決定方法。
【請求項11】
会議に参加中のユーザが利用する決定装置であって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得部と、
前記取得部により取得された前記文字情報を表示する表示部と、
前記表示部により表示された前記文字情報のうち、所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定部と、
を備えたことを特徴とする決定装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、決定プログラム、決定方法、及び決定装置に関する。
【背景技術】
【0002】
従来、音声認識技術を用いて、ユーザが発言(発話)に基づく音声情報を文字情報に変換する技術が提供されている。例えば、このような技術は、企業等で行われる会議の議事録の自動生成等の種々の用途に用いられている。
【0003】
このように会議の議事録を自動生成する場合、ユーザの発話の誤変換等が生じる可能性があるため、議事録を校正する必要がある。例えば、各発言者の音声情報と文字情報とをリンクさせて保存された議事録文書の中から議事録文書を検索し、検索された議事録文書を表示し、表示した議事録文書に対応する音声情報を再生することで議事録文書の校正作業を行う技術が提供されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2007−180828号公報
【特許文献2】特開2016−206932号公報
【特許文献3】特開2004−279860号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来技術では、会議における発話に関する文字情報を適切に校正可能にすることが難しい場合がある。例えば、上記のように検索した議事録文書を表示し、表示した議事録文書に対応する音声情報を再生し、議事録の校正を行う場合、再度会議の音声情報を聞き直すことになるため、ユーザが会議後に一から議事録を作成する場合と同様の作業時間(コスト)が生じ得る。このような場合、会議における発話に関する文字情報を適切に校正できるとは言い難い。そのため、より適切に文字情報を校正することが望まれる。
【0006】
本願は、上記に鑑みてなされたものであって、会議における発話に関する文字情報を適切に校正可能にする決定プログラム、決定方法、及び決定装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る決定プログラムは、会議に参加中のユーザが利用する端末装置が実行する決定プログラムであって、音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得手順と、前記取得手順により取得された前記文字情報を表示する表示手順と、前記表示手順により表示された前記文字情報のうち、所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定手順と、を端末装置に実行させることを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、会議における発話に関する文字情報を適切に校正可能にすることができるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、実施形態に係る決定処理の一例を示す図である。
図2図2は、実施形態に係る決定システムの構成例を示す図である。
図3図3は、実施形態に係る端末装置の構成例を示す図である。
図4図4は、実施形態に係る議事録情報記憶部の一例を示す図である。
図5図5は、実施形態に係る校正情報記憶部の一例を示す図である。
図6図6は、実施形態に係るユーザ情報記憶部の一例を示す図である。
図7図7は、実施形態に係る決定処理の一例を示すフローチャートである。
図8図8は、実施形態に係る決定処理の一例を示すフローチャートである。
図9図9は、端末装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る決定プログラム、決定方法、及び決定装置を実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る決定プログラム、決定方法、及び決定装置が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
(実施形態)
〔1.決定処理〕
まず、図1を用いて、実施形態に係る決定処理の一例について説明する。図1は、実施形態に係る決定処理の一例を示す図である。図1では、端末装置10にサービス提供装置50(図2参照)が提供するネットワークを介して複数人が会議を行うためのサービス(以下「ウェブ会議サービス」ともいう)を利用するためのアプリケーション(以下、「ウェブ会議アプリAP11」ともいう)がインストール済みであるものとする。なお、ウェブ会議アプリAP11は、ウェブ会議専用のアプリケーションに限らず、ウェブブラウザ等の汎用的なアプリケーションであってもよい。
【0012】
〔決定システムの構成〕
まず、図1の説明に先だって、図2を用いて、決定システム1の構成について説明する。図2は、実施形態に係る決定システムの構成例を示す図である。図2に示すように、決定システム1には、複数の端末装置10と、サービス提供装置50とが含まれる。複数の端末装置10と、サービス提供装置50とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示した決定システム1には、複数台のサービス提供装置50が含まれてもよい。また、サービス提供装置50が配信するウェブ会議アプリAP11において表示される各種情報の提供は、サービス提供装置50以外の装置が行ってもよい。複数の端末装置10は、ウェブ会議に参加するユーザ(以下、「参加ユーザ」ともいう)の各々により利用される。例えば、各参加ユーザは、自身が利用する端末装置10を用いてウェブ会議に参加する。各参加ユーザは、自身が利用する端末装置10にインストールされたウェブ会議アプリAP11を用いてウェブ会議に参加する。
【0013】
端末装置10は、ユーザによって利用されるコンピュータである。端末装置10は、文字情報のうち、所定の文字列に対するユーザの選択に基づいて、所定の文字列を校正するかどうかを決定する決定装置(情報処理装置)である。例えば、端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。以下では、端末装置10をユーザと表記する場合がある。すなわち、ユーザを端末装置10と読み替えることもできる。なお、図1の例では、端末装置10がノート型PCである場合を一例として示す。
【0014】
端末装置10は、ユーザがウェブ会議を行うために用いる情報処理装置である。端末装置10は、ウェブ会議に関する各種情報を出力する。端末装置10は、端末装置10を利用するユーザ以外のユーザの発言(音声)を音出する。また、端末装置10は、開催されたウェブ会議を画面に表示する。例えば、端末装置10は、ユーザが発する音声(以下「発話」や「発言」ともいう)を音センサにより検知し、音センサにより検知された会議の参加ユーザの発話から生成された文字情報を表示する。
【0015】
例えば、端末装置10は、ウェブ会議に関する種々の従来技術が適宜用いて、ウェブ会議に関する種々の処理を制御情報等により実行してもよい。端末装置10は、ウェブ会議に関する種々の処理を制御情報により実行してもよい。端末装置10は、制御情報として、ウェブブラウザ等の所定のアプリケーション上で実行されるスクリプトを取得し、取得したスクリプトを実行してもよい。このような制御情報は、実施形態に係る決定プログラム等に対応するものであり、例えば、CSS(Cascading Style Sheets)、JavaScript(登録商標)、HTML、あるいは、上述した決定処理等を記述可能な任意の言語によって実現される。以下、実施形態に係る決定プログラムに従って上述した決定処理等を実行する端末装置10等について、詳細に説明する。
【0016】
図1に示す例において、端末装置10は、音声認識の機能を有し、ユーザが発する音声を検知し、検知した音声(発話)を文字情報に変換する。例えば、端末装置10は、音声認識機能によりユーザの発話を変換した文字情報を他の端末装置10やサービス提供装置50に送信する。この場合、端末装置10は、ユーザの発話を変換した文字情報とともに、その発話が行われた日時や発話を行ったユーザを特定する情報(ユーザID等)を送信する。
【0017】
また、端末装置10は、音声認識サービスを提供する音声認識サーバから情報を取得可能であってもよい。この場合、決定システム1は、音声認識サーバが含まれてもよい。なお、図1の例では、端末装置10や音声認識サーバが、種々の従来技術を適宜用いてユーザの発話を認識したり、発話したユーザを特定したりするものとして、音声認識の機能に関する説明を省略する。
【0018】
サービス提供装置50は、端末装置10を利用するユーザにウェブ会議サービスを提供する情報処理装置である。例えば、サービス提供装置50は、端末装置10を利用するユーザにウェブ会議アプリAP11に関するウェブ会議サービスを提供する。例えば、サービス提供装置50は、端末装置10にウェブ会議アプリAP11に関する各種情報を提供する。また、サービス提供装置50は、音声認識の機能を有してもよい。この場合、サービス提供装置50は、音声認識の機能により生成した文字情報等の各種情報を端末装置10へ送信してもよい。
【0019】
以下、図1を用いて、決定処理の詳細を説明する。図1に示す例では、議事録情報記憶部141(図4参照)に示す会議ID「MT11」により識別される会議(以下、「会議MT11」ともいう)を一例として説明する。具体的には、図1では会議MT11に参加中のユーザU1が利用する端末装置10が決定処理を行う場合を一例として説明する。なお、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により識別されるユーザであることを示す。例えば、「ユーザU1」と記載した場合、そのユーザはユーザID「U1」により識別されるユーザである。
【0020】
また、図1の例では、会議MT11の設定ユーザ(開催者)がユーザU1であり、会議MT11の他の参加ユーザであるユーザU2〜U4がユーザU1により招待された場合を一例として説明する。すなわち、会議MT11は、ユーザU1〜U4の4人のユーザが行う会議である。ユーザU1〜U4の各々が利用する端末装置10には、ウェブ会議アプリAP11がインストールされているものとする。なお、ユーザU2〜U4が利用する端末装置10にも、ユーザU1の端末装置10と同様の情報が表示されているものとする。例えば、ユーザU2〜U4が利用する端末装置10には、ユーザU1の端末装置10の表示画面が共有されていてもよい。
【0021】
図1の例では、説明を簡単にするために、ユーザU1が利用する端末装置10のみを図示する。図1では、ユーザU1が利用する端末装置10における表示内容の変更に応じて、端末装置10を端末装置10−1〜10−3として説明する。なお、端末装置10−1〜10−3は同一の端末装置10である。また、以下では、端末装置10−1〜10−3について、特に区別なく説明する場合には、端末装置10と記載する。
【0022】
図1の例では、決定処理を行う部分を説明するために、会議MT11の途中から説明する。まず、端末装置10に表示される各種情報を説明する。端末装置10には、ウェブ会議アプリAP11により、会議MT11に参加するユーザU1〜U4の画像(動画)や各ユーザの発言が変換された文字情報等が表示される。図1の例では、端末装置10−1に示すように、端末装置10の右半分には4分割された領域に各ユーザU1〜U4の動画(ライブ映像)が表示され、端末装置10の左半分の領域AR11に各ユーザU1〜U4の発言が変換された文字情報が表示される。
【0023】
会議MT11に参加中のユーザU1の端末装置10−1は、会議MT11の各種情報を表示する(ステップS11)。図1の例では、端末装置10−1は、14時05分58秒におけるユーザU1の発言に対応する文字情報「では次の議題に…」を領域AR11に表示する。例えば、端末装置10は、ユーザU1の発言に基づく発話情報「では次の議題に…」を文字情報に変換する。例えば、端末装置10は、発話情報「では次の議題に…」を音声認識機能により文字情報に変換する。図1の例では、端末装置10−1は、ユーザU1の発話情報「では次の議題に…」と、その発話情報を変換した文字情報とを他の端末装置10やサービス提供装置50へ送信する。なお、ユーザの音声を検知する装置は、端末装置10自体であってもよいし、専用のマイクやスマートスピーカ等の別装置であってもよい。
【0024】
例えば、端末装置10は、音声認識に関する種々の技術を適宜用いて、検知した発話等の音声情報を文字情報に変換する。例えば、端末装置10は、音声情報の文字情報への変換において、形態素解析や仮名漢字変換等の自然言語処理技術を適宜用いて、漢字やひらがなやカタカナやアルファベット等の種々の種別の文字(記号)を含む文字情報に変換する。なお、端末装置10は、ユーザU1の発話(音声情報)を音声認識サーバへ送信し、音声認識サーバから発話の文字情報を取得してもよい。
【0025】
図1の例では、端末装置10−1は、14時06分02秒におけるユーザU4の発言に対応する文字情報「XXXXXXXXXXX…」を、領域AR11における14時05分58秒におけるユーザU1の発言に対応する文字情報の下に続けて表示する。なお、「XXXXXXXXXXX…」は、「ではユーザU2さん説明お願いします」等の具体的な発言であるものとする。例えば、ユーザU4が利用する端末装置10は、ユーザU4の発言に基づく発話情報「XXXXXXXXXXX…」を文字情報に変換する。例えば、端末装置10は、発話情報「XXXXXXXXXXX…」を音声認識機能により文字情報に変換する。
【0026】
例えば、ユーザU4が利用する端末装置10も、ユーザU1が利用する端末装置10と同様に、音声認識に関する種々の技術を適宜用いて、検知した発話等の音声情報を文字情報に変換するものとする。このように、ユーザU1〜U4の各々が利用する各端末装置10は、自装置の音声認識機能により、音声情報を文字情報に変換する。すなわち、ユーザU1〜U4の各々が利用する各端末装置10は、自装置(ローカル)で文字情報への変換を行い、その変換した文字情報を他の端末装置10やサービス提供装置50へ送信する。ユーザU4が利用する端末装置10は、ユーザU4の発話情報「XXXXXXXXXXX…」と、その発話情報を変換した文字情報とを他の端末装置10やサービス提供装置50へ送信する。
【0027】
これにより、ユーザU1が利用する端末装置10−1は、14時06分02秒におけるユーザU4の発話情報「XXXXXXXXXXX…」を音声出力するとともに、その発言情報に対応する文字情報「XXXXXXXXXXX…」を領域AR11に表示する。このように、端末装置10は、音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得し、その文字情報を表示する。
【0028】
そして、図1の例では、端末装置10−1は、14時06分14秒におけるユーザU2の発言に対応する文字情報「XXXXの過程では…」を、領域AR11における14時06分02秒におけるユーザU4の発言に対応する文字情報の下に続けて表示する。例えば、ユーザU2が利用する端末装置10は、ユーザU2の発言に基づく発話情報「XXXXの過程では…」を文字情報に変換する。例えば、ユーザU2が利用する端末装置10は、発話情報「XXXXの過程では…」を音声認識機能により文字情報に変換する。ユーザU2が利用する端末装置10は、ユーザU2の発話情報「XXXXの過程では…」と、その発話情報を変換した文字情報とを他の端末装置10やサービス提供装置50へ送信する。
【0029】
これにより、ユーザU1が利用する端末装置10−1は、14時06分14秒におけるユーザU2の発話情報「XXXXの過程では…」を音声出力するとともに、その発言情報に対応する文字情報「XXXXの過程では…」を領域AR11に表示する。
【0030】
ここで、領域AR11に表示される文字情報「XXXXの過程では…」中の文字列「過程」(以下、「箇所PT11」ともいう)には、他の変換候補がある。なお、端末装置10−1は、仮名漢字変換機能における種々の情報等を適宜用いて、他の変換候補の有無を判定してもよい。また、端末装置10−1は、仮名漢字変換機能における種々の情報等を適宜用いて、他の変換候補の情報を取得してもよい。ここに、端末装置10−1は、文字情報「XXXXの過程では…」のうち、文字列「過程」を他の文字列とは異なる態様で表示する。図1の例では、端末装置10−1は、文字情報「XXXXの過程では…」のうち、文字列「過程」に下線を付して表示する。また、端末装置10−1は、文字情報「XXXXの過程では…」のうち、文字列「過程」をユーザU1が選択可能に表示する。
【0031】
例えば、端末装置10−1は、文字情報「XXXXの過程では…」中の文字列「過程」をユーザU1が指定(選択)した場合に他の変換候補が表示されるように文字列「過程」を表示する。例えば、端末装置10−1は、文字情報「XXXXの過程では…」中の文字列「過程」にマウスカーソルMC11が重畳された場合に、他の変換候補が表示されるように文字列「過程」を表示する。なお、端末装置10−1は、文字列「過程」を選択可能にしたり、他の変換候補を表示したりする処理を、ウェブコンテンツの表示等に関する種々の従来技術を適宜用いて実現してもよい。なお、ある文字列に複数の変換候補がある場合、端末装置10−1は、その文字列をひらがなで表示してもよい。この場合、図1の例では、端末装置10は、文字列「過程」も文字列「かてい」の変換候補として表示してもよい。例えば、端末装置10は、音声認識が文字列「かてい」の複数の変換候補のうち、いずれの変換候補とするか決定できない場合、文字列「かてい」と表示してもよい。
【0032】
そして、ユーザU1は文字列「過程」である箇所PT11を指定する(ステップS12)。図1の例では、ユーザU1が端末装置10−1に接続されたマウス等を操作し、箇所PT11が表示される領域にマウスカーソルMC11を移動させることにより、箇所PT11を選択(指定)する。これにより、端末装置10は、端末装置10−1から端末装置10−2に表示が変化する。
【0033】
図1の例では、端末装置10−2は、箇所PT11の他の変換候補CH11〜CH13を表示する。具体的には、端末装置10−2は、箇所PT11の他の変換候補CH11である文字列「課程」や、他の変換候補CH12である文字列「仮定」や、他の変換候補CH13である文字列「家庭」を表示する。このように、端末装置10−2は、文字列「過程」の他の変換候補、すなわち、文字列「かてい」の変換候補である文字列「課程」や文字列「仮定」や文字列「家庭」を表示する。
【0034】
そして、ユーザU1は、他の変換候補CH11〜CH13のうち、他の変換候補CH12である文字列「仮定」を選択する(ステップS13)。図1の例では、ユーザU1が端末装置10−1に接続されたマウス等を操作し、他の変換候補CH12が表示される領域にマウスカーソルMC11を移動させることにより、他の変換候補CH12を選択する。端末装置10−2は、ユーザU1の選択に基づいて、箇所PT11を他の変換候補CH12に校正すると決定する。
【0035】
そして、端末装置10−2は、ユーザU1の選択に基づいて、箇所PT11を校正する(ステップS14)。端末装置10は、ユーザU1の選択に基づいて、箇所PT11を校正する。端末装置10は、文字情報「XXXXの過程では…」中の文字列「過程」を文字列「仮定」に校正する。これにより、端末装置10は、端末装置10−2から端末装置10−3に表示が変化する。
【0036】
図1の例では、端末装置10−3は、14時06分14秒におけるユーザU2の発話情報に対応する文字情報のうち、文字列「過程」が他の変換候補CH12である文字列「仮定」に変更された文字情報を表示する。例えば、端末装置10は、上述の決定処理に基づいて、議事録情報記憶部141(図4参照)の情報を更新し、校正情報記憶部142(図5参照)に校正結果に関する情報を追加する。
【0037】
また、図1の例では、端末装置10−3は、14時06分21秒におけるユーザU3の発言に対応する文字情報を、領域AR11における14時06分14秒におけるユーザU2の発言に対応する文字情報の下に続けて表示する。すなわち、図1の例では、端末装置10−3は、校正の対象となったユーザU2の発言に対応する文字情報の下に続けて、14時06分21秒におけるユーザU3の発言に対応する文字情報を表示する。このように、端末装置10は、会議MT11における発言の校正を行いながら、会議MT11を続行する。すなわち、端末装置10は、会議MT11の議事録の生成及びその校正を行うと同時に、会議MT11を続行する。
【0038】
上述したように、端末装置10は、会議における発言の文字情報に対する校正を会議中において行う。具体的には、端末装置10は、会議における発言がリアルタイムに変換された文字情報を表示するとともに、その文字情報に対する校正の指示(選択)を会議に参加中のユーザから取得する。そして、端末装置10は、会議中に変換された文字情報中の文字列に対するユーザの校正の選択に基づいて、その文字列に対する校正を行うかどうかを会議中にリアルタイムに決定する。これにより、端末装置10は、会議における発言の文字情報に対する校正を会議中において行うことを可能にする。したがって、端末装置10は、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0039】
〔1−1.システム構成について〕
なお、上記決定処理を実現するシステム構成については、図2に示す決定システム1に限らず種々の態様であってもよい。図2の例では、サービスを提供するサーバとしてのサービス提供装置50とクライアントとしての端末装置10とを備える構成であり、サービス提供装置50と端末装置10とは別体(別装置)であったが、サービス提供装置50と端末装置10とは一体であってもよい。
【0040】
また、図1の例では、ユーザU1が利用する端末装置10が文字情報の校正を行う場合を示したが、サービス提供装置50が文字情報の校正を行い、ユーザが利用する各端末装置10は、情報の表示、ユーザの発話の検知、ユーザの選択の受け付け等の処理を行ってもよい。この場合、サービス提供装置50は、ユーザの選択に基づいて文字情報の校正を行った場合、その校正後の文字情報を各ユーザの端末装置10に送信してもよい。
【0041】
また、決定システムは、図2に示す決定システム1と異なり、サービスを提供するサーバとしてのサービス提供装置50を有しない構成であってもよい。この場合、各端末装置10は、サーバ装置を介さずに、端末装置10間で会議の情報の通信を行ってもよい。例えば、各端末装置10は、いわゆるP2P(Peer to Peer)のような態様により、各端末装置10間で会議の情報の通信を行ったり、共有を行ったりしてもよい。また、図2の決定システム1のように、サービスを提供するサーバとしてのサービス提供装置50を有する場合であっても、サービス提供装置50を介さずに、端末装置10間で会議の情報の通信を行ってもよい。
【0042】
〔1−2.複数ユーザの選択〕
図1の例では、ユーザU1の選択のみに基づいて、文字列の校正を行うかを決定する場合を示したが、端末装置10は、他のユーザU2〜U4の選択も加味して文字列の校正を行うかを決定してもよい。すなわち、端末装置10は、ユーザU1以外の会議の参加ユーザの変換候補に対する選択を示す選択情報を取得し、その選択情報に基づいて、所定の文字列をいずれの変換候補校正に校正するかを決定してもよい。この場合、ユーザU1が利用する端末装置10は、ユーザU2〜U4の各々が利用する3台の端末装置10から、ユーザU2〜U4の各々の選択情報を取得する。
【0043】
例えば、端末装置10は、参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に所定の文字列を校正すると決定してもよい。図1の例では、ユーザU1以外のユーザU2〜U4の3人が、他の変換候補CH11である文字列「課程」を選択した場合、端末装置10は、他の変換候補CH11が最も多く選択されたと判定(決定)する。端末装置10は、他の変換候補CH12を選択したユーザ数が1人であり、他の変換候補CH11を選択したユーザ数が3人であるため、他の変換候補CH11が最多のユーザにより選択されたと判定する。この場合、端末装置10は、ユーザU2〜U4の選択に基づいて、箇所PT11を他の変換候補CH11に校正すると決定する。
【0044】
そして、端末装置10は、ユーザU2〜U4の選択に基づいて、箇所PT11を校正する。端末装置10は、ユーザU2〜U4の選択に基づいて、箇所PT11を校正する。端末装置10は、文字情報「XXXXの過程では…」中の文字列「過程」を文字列「課程」に校正する。
【0045】
〔1−3.校正結果の利用〕
また、端末装置10は、校正結果の情報を用いて、その校正に関する決定処理以後の処理を行ってもよい。例えば、端末装置10は、ある決定処理においてユーザにより選択された変換候補(以下「優先候補」とする)を、その決定処理以後の処理において優先的に選択するようにしてもよい。例えば、端末装置10は、音声情報から文字情報へ変換する際に、優先候補を優先して選択するようにしてもよいし、音声認識モデルを優先候補が選択されやすくなるように更新してもよい。
【0046】
〔1−3−1.変換候補の選択〕
端末装置10は、ある文字列(以下「対象文字列」とする)を一の変換候補(優先候補)に校正するとユーザが選択した後において、発話から変換された文字情報に対象文字列が含まれる場合、対象文字列を優先候補に変換すると決定する。例えば、端末装置10は、図5中の校正情報記憶部142に示すように、会議MT21において、対象文字列「様る」を優先候補「サマる」に校正すると決定した後において、発話から変換された文字情報に対象文字列「様る」が含まれる場合、対象文字列「様る」を優先候補「サマる」に変換すると決定する。このように、端末装置10は、ある会議において、参加ユーザが一度コミット(同意)した言葉を、その会議中はその用語(意味)として捉えると決定する。これにより、端末装置10は、会議の参加ユーザに応じた適切な議事録生成を行うことができる。
【0047】
〔1−3−2.音声変換モデル〕
また、端末装置10は、発話情報(音声情報)を文字情報に変換する音声変換モデルを更新(生成)してもよい。例えば、端末装置10は、決定処理の結果に基づいて、音声変換モデルを更新(生成)してもよい。そして、端末装置10は、更新した音声変換モデルを用いて、更新後における会議の発話情報に対応する文字情報を生成してもよい。この場合、端末装置10は、校正に関する決定結果を正解情報として、音声認識モデルを更新する。端末装置10は、決定結果を正解情報として、強化学習を行なうことにより音声認識モデルを更新する。図1の場合、端末装置10は、文字情報「XXXXの過程では…」中の文字列「過程」を文字列「仮定」と校正した決定結果を正解情報として、強化学習を行なうことにより音声認識モデルを更新してもよい。このように、端末装置10は、会議における校正を随時反映して音声認識モデルを更新することにより、音声認識の精度を向上させることができる。
【0048】
また、端末装置10は、会議の参加ユーザや会議の種別等に応じて、音声認識モデル群から、音声認識モデルを選択肢、その音声認識モデルを用いてもよい。例えば、端末装置10は、ユーザU1〜U4が参加ユーザとして含まれる会議については、ユーザU1〜U4用の音声認識モデル(以下「専用音声認識モデル」)を選択して、その音声認識モデルを用いてもよい。そして、端末装置10は、専用音声認識モデルを用いた会議における校正に関する決定結果を正解情報として、専用音声認識モデルを更新する。そして、端末装置10は、更新した専用音声認識モデルを用いて、更新後の会議における発話から文字情報を生成する。これにより、端末装置10は、各会議に特化した専用音声認識モデルを生成することが可能となり、専用音声認識モデルの精度を向上させ、会議の参加ユーザに応じた適切な議事録生成を行うことができる。
【0049】
〔2.端末装置の構成〕
次に、図3を用いて、実施形態に係る端末装置10の構成について説明する。図3は、実施形態に係る端末装置の構成例を示す図である。図3に示すように、端末装置10は、通信部11と、入力部12と、出力部13と、記憶部14と、制御部15とを有する。
【0050】
また、端末装置10は、音声による入出力インターフェイスとなるマイク(音センサ)やスピーカを有する。また、端末装置10は、音センサやスピーカが外部接続等により通信可能に接続されてもよい。例えば、音センサ等のユーザの発話を検知するセンサを含むセンサ部(図示省略)を有してもよい。
【0051】
例えば、センサ部は、音センサにより周囲の音を集音(検知)する。例えば、センサ部は、音センサによりユーザの発話等の種々の音声情報を検知する。また、例えば、センサ部は、カメラ等の画像センサを有してもよい。例えば、センサ部は、画像センサにより周囲の画像を撮像(検知)する。なお、例えば、センサ部は、上記に限らず種々のセンサを有してもよい。例えば、センサ部は、GPS(Global Positioning System)センサ等の位置センサを有してもよい。なお、センサ部は、複数のセンサ情報を検知可能であってもよい。センサ部は、照度センサ、温度センサ、湿度センサ、心拍(脈拍)センサ、加速度センサ、発汗センサ、呼気(ガス)センサ等の種々のセンサが含まれてもよい。
【0052】
(通信部11)
通信部11は、例えば、通信回路等によって実現される。そして、通信部11は、図示しない所定の通信網と有線または無線で接続され、外部の情報処理装置との間で情報の送受信を行う。例えば、通信部11は、所定のネットワークN(図2参照)と有線または無線で接続され、サービス提供装置50との間で情報の送受信を行う。
【0053】
(入力部12)
入力部12は、ユーザから各種操作が入力される。例えば、入力部12は、タッチパネル機能により表示面(例えば出力部13)を介してユーザからの各種操作を受け付けてもよい。また、入力部12は、端末装置10に設けられたボタンや、端末装置10に接続されたキーボードやマウスからの各種操作を受け付けてもよい。
【0054】
(出力部13)
出力部13は、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等によって実現されるタブレット端末等の表示画面であり、各種情報を表示するための表示装置を含んでもよい。また、出力部13は、音声を出力するスピーカを含んでもよい。
【0055】
(記憶部14)
記憶部14は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14は、例えば、端末装置10にインストールされているアプリケーションに関する情報、例えばプログラム等を記憶する。また、実施形態に係る記憶部14は、図3に示すように、議事録情報記憶部141と、校正情報記憶部142と、ユーザ情報記憶部143とを有する。なお、記憶部14は、各会議の開催日時や所要時間や参加ユーザ等の種々の情報を記憶してもよい。
【0056】
(議事録情報記憶部141)
実施形態に係る議事録情報記憶部141は、議事録に関する各種情報(議事録情報)を記憶する。例えば、議事録情報記憶部141は、各会議の参加ユーザの発言やその日時や校正の有無等を含む議事録情報を記憶する。図4は、実施形態に係る議事録情報記憶部の一例を示す図である。図4に示す議事録情報記憶部141は、「会議ID」、「発言ID」、「日時」、「発言者」、「発言情報」、「校正」、「校正ID」といった項目が含まれる。
【0057】
「会議ID」は、議事録の生成対象となる会議を識別するための識別情報を示す。「発言ID」は、ユーザの発言(発話)を識別するための識別情報を示す。「日時」は、対応する発言が行われた日時を示す。なお、図4の例では、「日時」に記憶される情報を「DT11−1」等の符号で図示するが、「日時」には、「2018年4月14日14時06分02秒」等の具体的な日時が記憶されるものとする。「発言者」は、対応する発言(発話)を行ったユーザを示す。
【0058】
「発言情報」は、対応する発言IDにより識別される発言の具体的な内容を示す。例えば、「発言情報」には、発言に対応する文字情報が記憶される。「発言情報」には、発言の音声情報が変換された文字情報が記憶される。
【0059】
「校正」は、対応する発言情報に対する校正の有無を示す。「校正」は、音声情報から自動で変換された文字情報に対して校正が行われたか否かを示す。例えば、「校正」は、音声情報から自動で変換された文字情報について、音声認識による誤認識や変換ミスがあり、校正が必要であったか否かを示す。例えば、対応する発言情報に対する校正が行われた場合は、「校正」には「有」が記憶される。例えば、対応する発言情報に対する校正が行われた場合は、「校正」には「無」が記憶される。なお、「校正」には「有」や「無」の代わりに、校正されたことを示す「1」や校正されていないことを示す「0」等のフラグが記憶されてもよい。「校正ID」は、校正を識別するための識別情報を示す。
【0060】
図4に示す例では、会議ID「MT11」により識別される会議(会議MT11)においては、発言ID「S11−1」により識別される発言(発言S11−1)が行われたことを示す。また、会議MT11においては、発言ID「S11−2」により識別される発言(発言S11−2)や発言ID「S11−3」により識別される発言(発言S11−3)等が行われたことを示す。
【0061】
発言S11−1は、日時DT11−1にユーザU1により行われたことを示す。発言S11−1は、「では次の議題に…」といった発言内容であることを示す。発言S11−1は、校正が「無」、すなわち校正が行われず、音声認識による自動変換による文字情報のままであることを示す。
【0062】
発言S11−3は、日時DT11−3にユーザU2により行われたことを示す。発言S11−3は、「XXXXの仮定では…」といった発言内容であることを示す。発言S11−3は、校正が「有」、すなわち音声認識による自動変換による文字情報に対する校正が行われたことを示す。発言S11−3に対して校正は、校正ID「PR11」により識別される校正(校正PR11)であることを示す。
【0063】
なお、議事録情報記憶部141は、上記に限らず、目的に応じて種々の情報を記憶してもよい。議事録情報記憶部141は、各会議の開催日時や所要時間や参加ユーザ等の種々の情報を各会議に対応付けて記憶してもよい。また、議事録情報記憶部141は、各会議の発言に対する校正の回数や用いた音声認識モデルの識別情報等の種々の情報が各会議に対応付けて記憶してもよい。
【0064】
(校正情報記憶部142)
実施形態に係る校正情報記憶部142は、校正に関する各種情報を記憶する。図5は、実施形態に係る校正情報記憶部の一例を示す図である。例えば、校正情報記憶部142は、ユーザが過去に行った通信に関する情報を記憶する。図5に示す校正情報記憶部142には、「校正ID」、「会議ID」、「参加者」、「発言」、「校正者」、「校正箇所」、「校正前」、「校正後」といった項目が含まれる。
【0065】
「校正ID」は、校正を識別するための識別情報を示す。「会議ID」は、会議を識別するための識別情報を示す。「参加者」は、対応する会議に参加したユーザ(参加ユーザ)を示す。「発言」は、対応する校正が行われた発言を示す。例えば、「発言」には、対応する校正が行われた発言を識別する情報が記憶される。
【0066】
「校正者」は、対応する校正を行ったユーザを示す。「校正箇所」は、対応する校正の対象となる箇所を示す。例えば、「校正箇所」は、文字情報のうち、いずれの範囲が校正されたかを示す。「校正前」は、対応する校正を行われる前の文字列を示す。「校正後」は、対応する校正を行われる後の文字列を示す。
【0067】
例えば、図5に示す例では、校正ID「PR11」により識別される校正(校正PR11)は、ユーザU1〜U4が参加する会議MT11の発言S11−3に対する校正であることを示す。校正PR11の校正者は、ユーザU1であることを示す。校正PR11の校正箇所は、発言S11−3の文字情報のうちX〜Y文字の範囲(箇所PT11)であることを示す。校正PR11の校正前の文字列は「過程」であり、校正PR11の校正後の文字列は「仮定」であることを示す。すなわち、校正PR11は、発言S11−3の文字情報のうちX〜Y文字の文字列「過程」を文字列「仮定」に校正(変更)したことを示す。
【0068】
なお、校正情報記憶部142は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、校正情報記憶部142は、各校正が行われた日時を記憶してもよい。
【0069】
(ユーザ情報記憶部143)
実施形態に係るユーザ情報記憶部143は、ユーザに関する各種情報を記憶する。例えば、ユーザ情報記憶部143は、ユーザ属性に関する各種情報やユーザの行動に関する各種情報を記憶する。図6は、実施形態に係るユーザ情報記憶部の一例を示す図である。図6に示すユーザ情報記憶部143は、「ユーザID」、「年齢」、「性別」、「端末ID」、「音声情報」、「画像情報」といった項目が含まれる。
【0070】
「ユーザID」は、ユーザを識別するための識別情報を示す。また、「年齢」は、ユーザIDにより識別されるユーザの年齢を示す。なお、「年齢」は、例えば35歳など、ユーザIDにより識別されるユーザの具体的な年齢であってもよい。また、「性別」は、ユーザIDにより識別されるユーザの性別を示す。
【0071】
「端末ID」は、端末装置10を識別するための識別情報を示す。例えば、「端末ID」は、ユーザがウェブ会議に利用する端末装置10を識別するための識別情報を示す。
【0072】
「音声情報」は、ユーザIDにより識別されるユーザの音声情報を示す。「音声情報」は、発話を行ったユーザを識別するための音声の特徴情報であってもよい。なお、図6の例では、各ユーザの音声情報を概念的に記号「VP1」等で示すが、「音声情報」としては、これらの格納場所を示すファイルパス名などが格納されてもよい。
【0073】
「画像情報」は、ユーザIDにより識別されるユーザの画像情報を示す。「画像情報」は、ユーザを識別したり、ウェブ会議の画面に表示したりするための画像や動画であってもよい。なお、図6の例では、各ユーザの画像情報を概念的に記号「IM1」等で示すが、「画像情報」としては、これらの格納場所を示すファイルパス名などが格納されてもよい。
【0074】
図6の例では、ユーザID「U1」により識別されるユーザ(ユーザU1)の年齢は、「20代」であり、性別は、「男性」であることを示す。ユーザU1は、端末ID「TM1」により識別される端末装置10を利用するユーザであることを示す。また、ユーザU1の音声情報は音声情報VPであり、画像情報は、画像情報IM1であることを示す。
【0075】
なお、ユーザ情報記憶部143は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、ユーザ情報記憶部143は、各ユーザの端末装置10から取得した各ユーザの位置情報の履歴を記憶してもよい。例えば、ユーザ情報記憶部143は、他のデモグラフィック属性情報やサイコグラフィック属性情報を記憶してもよい。例えば、ユーザ情報記憶部143は、氏名、家族構成、収入、ライフスタイル等の情報を記憶してもよい。また、ユーザ情報記憶部143は、ユーザが利用する端末装置10を識別する情報(端末ID)を記憶してもよい。
【0076】
(制御部15)
制御部15は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、端末装置10内部の記憶部14などの記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。例えば、この各種プログラムは、決定処理を行うアプリケーションのプログラムが含まれる。また、制御部15は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0077】
図3に示すように、制御部15は、取得部151と、生成部152と、表示部153と、決定部154と、送信部155とを有し、以下に説明する決定処理の機能や作用を実現または実行する。なお、制御部15の内部構成は、図3に示した構成に限られず、後述する決定処理を行う構成であれば他の構成であってもよい。また、制御部15が有する各処理部の接続関係は、図3に示した接続関係に限られず、他の接続関係であってもよい。
【0078】
(取得部151)
取得部151は、各種情報を取得する。例えば、取得部151は、記憶部14から各種情報を取得する。例えば、取得部151は、議事録情報記憶部141や校正情報記憶部142やユーザ情報記憶部143等から各種情報を取得する。また、取得部151は、各種情報を外部の情報処理装置から取得してもよい。例えば、取得部151は、他の端末装置10から送信される電子メールを取得する。
【0079】
例えば、取得部151は、サービス提供装置50から各種情報を取得する。例えば、取得部151は、サービス提供装置50からウェブ会議アプリAP11に関する各種情報を取得する。例えば、取得部151は、サービス提供装置50からウェブ会議アプリAP11のインストールに用いる情報やウェブ会議アプリAP11のアップデートに用いる情報を取得する。例えば、取得部151は、サービス提供装置50からウェブ会議アプリAP11において提供されるウェブ会議に関する各種情報を取得する。取得部151は、サービス提供装置50からウェブ会議に参加中の他のユーザの発話情報やその発話情報の文字情報を取得してもよい。
【0080】
例えば、取得部151は、センサ部等のマイク(音センサ)により、端末装置10を利用するユーザの発話情報を取得する。例えば、取得部151は、入力部12を介して、端末装置10を利用するユーザによる各種操作の入力を取得する。例えば、取得部151は、端末装置10を利用するユーザにより入力された文字情報を取得する。
【0081】
取得部151は、音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する。取得部151は、会議の参加ユーザのうち、ユーザ以外の他のユーザの他の変換候補に対する選択を示す選択情報を取得する。
【0082】
図1の例では、取得部151は、他のユーザU2〜U4の発話が変換された文字情報を他の端末装置10から取得する。取得部151は、ユーザU4の発話情報「XXXXXXXXXXX…」と、その発話情報を変換した文字情報とをユーザU4が利用する他の端末装置10から取得する。取得部151は、ユーザU2の発話情報「XXXXの過程では…」と、その発話情報を変換した文字情報とをユーザU2が利用する他の端末装置10やサービス提供装置50から取得する。
【0083】
(生成部152)
生成部152は、種々の情報を生成する。生成部152は、取得部151により取得された情報に基づいて各種情報を生成する。生成部152は、記憶部14に記憶された情報に基づいて各種情報を生成する。生成部152は、議事録情報記憶部141や校正情報記憶部142やユーザ情報記憶部143等に記憶された情報に基づいて各種情報を生成する。
【0084】
例えば、生成部152は、取得部151により取得されたユーザの発話情報から文字情報を生成する。例えば、生成部152は、発話情報(音声情報)を文字情報に変換する音声変換モデルを生成してもよい。例えば、生成部152は、ウェブ会議アプリAP11に表示する各種情報を生成する。例えば、生成部152は、ウェブ会議アプリAP11に表示する各種情報を生成する。
【0085】
生成部152は、音声認識の機能により、ユーザの発話情報から文字情報を生成する。生成部152は、音声認識に関する種々の従来技術を適宜用いてユーザの発話情報から文字情報を生成する。生成部152は、音声認識モデルを用いて、ユーザの発話情報から文字情報を生成する。生成部152は、決定部154による決定結果に基づいて、会議の参加ユーザの他の発話情報に対応する他の文字情報を生成する。生成部152は、決定部154による決定結果を正解情報として、音声認識モデルを更新する。生成部152は、決定部154による決定結果を正解情報として、強化学習を行なうことにより音声認識モデルを更新する。
【0086】
図1の例では、生成部152は、ユーザU1の発言に基づく発話情報「では次の議題に…」を文字情報に変換する。例えば、端末装置10は、発話情報「では次の議題に…」を音声認識機能により文字情報に変換する。生成部152は、音声認識に関する種々の技術を適宜用いて、検知した発話等の音声情報を文字情報に変換する。生成部152は、音声情報の文字情報への変換において、形態素解析や仮名漢字変換等の自然言語処理技術を適宜用いて、漢字やひらがなやカタカナやアルファベット等の種々の種別の文字(記号)を含む文字情報に変換する。なお、生成部152は、ユーザU1の発話(音声情報)を音声認識サーバへ送信部155により送信し、音声認識サーバから発話の文字情報を取得部151に取得することで、文字情報を生成してもよい。
【0087】
(表示部153)
表示部153は、種々の情報を表示する。例えば、表示部153は、出力部13を介して各種情報を表示する。表示部153は、取得部151により取得された情報に基づいて各種情報を表示する。表示部153は、記憶部14に記憶された情報に基づいて各種情報を表示する。表示部153は、議事録情報記憶部141や校正情報記憶部142やユーザ情報記憶部143等に記憶された情報に基づいて各種情報を表示する。表示部153は、生成部152により生成された各種情報を表示する。例えば、表示部153は、議事録情報記憶部141等の記憶部14に記憶された各種情報を用いて、ウェブ会議アプリAP11に関する種々の情報を表示する。
【0088】
表示部153は、取得部151により取得された文字情報を表示する。表示部153は、文字情報のうち、校正に関する所定の条件を満たす所定の文字列を、ユーザが選択可能に表示する。表示部153は、所定の文字列に他の変換候補がある場合、他の変換候補を表示する。
【0089】
図1の例では、表示部153は、会議MT11の各種情報を表示する。表示部153は、14時05分58秒におけるユーザU1の発言に対応する文字情報「では次の議題に…」を領域AR11に表示する。表示部153は、14時06分02秒におけるユーザU4の発言に対応する文字情報「XXXXXXXXXXX…」を、領域AR11における14時05分58秒におけるユーザU1の発言に対応する文字情報の下に続けて表示する。表示部153は、14時06分14秒におけるユーザU2の発言に対応する文字情報「XXXXの過程では…」を、領域AR11における14時06分02秒におけるユーザU4の発言に対応する文字情報の下に続けて表示する。
【0090】
図1の例では、表示部153は、文字情報「XXXXの過程では…」のうち、文字列「過程」を他の文字列とは異なる態様で表示する。表示部153は、文字情報「XXXXの過程では…」のうち、文字列「過程」に下線を付して表示する。また、端末装置10−1は、文字情報「XXXXの過程では…」のうち、文字列「過程」をユーザU1が選択可能に表示する。表示部153は、文字情報「XXXXの過程では…」中の文字列「過程」をユーザU1が指定(選択)した場合に他の変換候補が表示されるように文字列「過程」を表示する。表示部153は、文字情報「XXXXの過程では…」中の文字列「過程」にマウスカーソルMC11が重畳された場合に、他の変換候補が表示されるように文字列「過程」を表示する。
【0091】
図1の例では、表示部153は、箇所PT11の他の変換候補CH11〜CH13を表示する。表示部153は、箇所PT11の他の変換候補CH11である文字列「課程」や、他の変換候補CH12である文字列「仮定」や、他の変換候補CH13である文字列「家庭」を表示する。表示部153は、文字列「過程」の他の変換候補、すなわち、文字列「かてい」の変換候補である文字列「課程」や文字列「仮定」や文字列「家庭」を表示する。表示部153は、14時06分14秒におけるユーザU2の発話情報に対応する文字情報のうち、文字列「過程」が他の変換候補CH12である文字列「仮定」に変更された文字情報を表示する。表示部153は、14時06分21秒におけるユーザU3の発言に対応する文字情報を、領域AR11における14時06分14秒におけるユーザU2の発言に対応する文字情報の下に続けて表示する。表示部153は、校正の対象となったユーザU2の発言に対応する文字情報の下に続けて、14時06分21秒におけるユーザU3の発言に対応する文字情報を表示する。
【0092】
(決定部154)
決定部154は、各種情報を決定する。決定部154は、取得部151により取得された情報に基づいて各種情報を決定する。決定部154は、記憶部14に記憶された情報に基づいて各種情報を決定する。決定部154は、議事録情報記憶部141や校正情報記憶部142やユーザ情報記憶部143等に記憶された情報に基づいて各種情報を決定する。
【0093】
決定部154は、表示部153により表示された文字情報のうち、所定の文字列に対するユーザの選択に基づいて、所定の文字列を校正するかどうかを決定する。決定部154は、他の変換候補に対するユーザの選択を示す選択情報に基づいて、所定の文字列をいずれの変換候補に校正するかを決定する。決定部154は、他の変換候補のうち、ユーザが一の変換候補を選択した場合、当該一の変換候補に所定の文字列を校正すると決定する。決定部154は、他の変換候補のいずれもユーザが選択しなかった場合、所定の文字列を校正しないと決定する。
【0094】
決定部154は、他のユーザの選択情報に基づいて、所定の文字列をいずれの変換候補校正に校正するかを決定する。決定部154は、参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に所定の文字列を校正すると決定する。決定部154は、所定の文字列を一の変換候補に校正するとユーザが選択した後、取得手順により取得された一の文字情報に所定の文字列が含まれる場合、一の文字情報中の所定の文字列を一の変換候補に変換すると決定する。
【0095】
図1の例では、決定部154は、ユーザU1の選択に基づいて、箇所PT11を他の変換候補CH12に校正すると決定する。決定部154は、ユーザU1の選択に基づいて、箇所PT11を校正する。決定部154は箇所PT11を他の変換候補CH12に校正する。決定部154は、ユーザU1の選択に基づいて、箇所PT11を校正する。決定部154は、文字情報「XXXXの過程では…」中の文字列「過程」を文字列「仮定」に校正する。
【0096】
(送信部155)
送信部155は、各種情報を送信する。例えば、送信部155は、入力部12により入力されたユーザ操作に従って、外部の情報処理装置へ種々の情報を送信する。例えば、送信部155は、生成した文字情報を指定された送信先へ送信する。例えば、送信部155は、ユーザが生成した文字情報を他の端末装置10へ送信する。例えば、送信部155は、ユーザが生成した電子メールを宛先に指定されたメールアドレスへ送信する。
【0097】
送信部155は、端末装置10のセンサ部等の音センサが検知したユーザの発話情報(音声情報)を他の端末装置10へ送信する。送信部155は、取得部151が取得した端末装置10を利用するユーザの発話情報を他の端末装置10へ送信する。送信部155は、端末装置10を利用するユーザの発話情報から生成された文字情報を他の端末装置10へ送信する。
【0098】
また、例えば、送信部155は、サービス提供装置50に各種情報を提供する。送信部155は、取得部151が取得した端末装置10を利用するユーザの発話情報をサービス提供装置50へ送信する。送信部155は、端末装置10を利用するユーザの発話情報から生成された文字情報をサービス提供装置50へ送信する。
【0099】
例えば、送信部155は、サービス提供装置50にウェブ会議アプリAP11に関する各種情報の要求を送信する。送信部155は、サービス提供装置50にウェブ会議アプリAP11を用いた会議の設定を要求する。送信部155は、サービス提供装置50に会議の開始時間や所要時間や参加ユーザの情報等を送信する。
【0100】
図1の例では、送信部155は、ユーザU1の発話情報「では次の議題に…」と、その発話情報を変換した文字情報とを他の端末装置10やサービス提供装置50へ送信する。
【0101】
なお、上述した制御部15による決定処理等の処理は、所定のアプリケーションにより行われる場合、制御部15の各部は、例えば、所定のアプリケーションにより実現されてもよい。例えば、制御部15による決定処理や表示処理や生成処理等の処理は、JavaScript(登録商標)などを含む制御情報により実現されてもよい。また、上述した決定処理や表示処理や生成処理等が専用アプリにより行われる場合、制御部15は、例えば、所定のアプリ(例えば図1のウェブ会議アプリAP11等)や専用アプリを制御するアプリ制御部を有してもよい。
【0102】
〔3.決定処理のフロー〕
次に、図7及び図8を用いて、実施形態に係る端末装置10による決定処理の手順について説明する。図7は、実施形態に係る決定処理の一例を示すフローチャートである。
【0103】
図7に示すように、端末装置10は、参加ユーザの発話情報から生成された文字情報を取得する(ステップS101)。そして、端末装置10は、文字情報を表示する(ステップS102)。そして、端末装置10は、文字情報のうち、所定の文字列に対するユーザの指定に基づいて、所定の文字列を校正するかどうかを決定する(ステップS103)。
【0104】
次に、図8を用いて、複数の変換候補がある場合の端末装置10による決定処理の手順について説明する。図8は、実施形態に係る決定処理の一例を示すフローチャートである。
【0105】
図8に示すように、端末装置10は、参加ユーザの発話情報から生成された文字情報を取得する(ステップS201)。そして、端末装置10は、複数の変換候補がある所定の文字列を、ユーザが指定可能に文字情報を表示する(ステップS202)。端末装置10は、複数の変換候補がある所定の文字列を、ユーザが選択可能に文字情報を表示する。
【0106】
そして、端末装置10は、複数の変換候補に対するユーザの選択を示す選択情報を取得する(ステップS203)。端末装置10は、選択情報に基づいて、所定の文字列を変換候補に校正するかを決定する(ステップS204)。
【0107】
〔4.効果〕
上述してきたように、実施形態に係る端末装置10は、取得部151と、表示部153と、決定部154とを有する。取得部151は、音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する。表示部153は、取得部151により取得された文字情報を表示する。決定部154は、表示部153により表示された文字情報のうち、所定の文字列に対するユーザの選択に基づいて、所定の文字列を校正するかどうかを決定する。
【0108】
このように、実施形態に係る端末装置10は、会議の参加ユーザの発話情報から生成され、表示された文字情報のうち、所定の文字列に対するユーザの選択に基づいて、所定の文字列を校正するかどうかを決定することにより、会議に参加中のユーザの選択に従ってリアルタイムに、会議の参加ユーザの発話情報に基づく文字情報を校正するかを決定することができる。したがって、端末装置10は、会議における発話に関する文字情報を適切に校正可能にすることができる。すなわち、端末装置10は、会議の終了時には、校正後の会議の議事録を生成可能にすることができる。
【0109】
また、実施形態に係る端末装置10において、表示部153は、文字情報のうち、校正に関する所定の条件を満たす所定の文字列を、ユーザが選択可能に表示する。
【0110】
このように、実施形態に係る端末装置10は、文字情報のうち、校正に関する所定の条件を満たす所定の文字列を、ユーザが選択可能に表示することにより、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0111】
また、実施形態に係る端末装置10において、表示部153は、所定の文字列に他の変換候補がある場合、他の変換候補を表示する。決定部154は、他の変換候補に対するユーザの選択を示す選択情報に基づいて、所定の文字列をいずれの変換候補に校正するかを決定する。
【0112】
このように、実施形態に係る端末装置10は、所定の文字列に他の変換候補がある場合、他の変換候補を表示するし、他の変換候補に対するユーザの選択を示す選択情報に基づいて、所定の文字列をいずれの変換候補に校正するかを決定することにより、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0113】
また、実施形態に係る端末装置10において、決定部154は、他の変換候補のうち、ユーザが一の変換候補を選択した場合、当該一の変換候補に所定の文字列を校正すると決定する。
【0114】
このように、実施形態に係る端末装置10は、他の変換候補のうち、ユーザが一の変換候補を選択した場合、当該一の変換候補に所定の文字列を校正すると決定することにより、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0115】
また、実施形態に係る端末装置10において、決定部154は、他の変換候補のいずれもユーザが選択しなかった場合、所定の文字列を校正しないと決定する。
【0116】
このように、実施形態に係る端末装置10は、他の変換候補のいずれもユーザが選択しなかった場合、所定の文字列を校正しないと決定することにより、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0117】
また、実施形態に係る端末装置10において、取得部151は、会議の参加ユーザのうち、ユーザ以外の他のユーザの他の変換候補に対する選択を示す選択情報を取得する。決定部154は、他のユーザの選択情報に基づいて、所定の文字列をいずれの変換候補校正に校正するかを決定する。
【0118】
このように、実施形態に係る端末装置10は、会議の参加ユーザのうち、ユーザ以外の他のユーザの他の変換候補に対する選択を示す選択情報に基づいて、所定の文字列をいずれの変換候補校正に校正するかを決定することにより、複数のユーザの選択を考慮して校正可否を決定することができる。したがって、端末装置10は、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0119】
また、実施形態に係る端末装置10において、決定部154は、参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に所定の文字列を校正すると決定する。
【0120】
このように、実施形態に係る端末装置10は、参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に所定の文字列を校正すると決定することにより、複数のユーザの選択を考慮して校正可否を決定することができる。したがって、端末装置10は、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0121】
また、実施形態に係る端末装置10において、決定部154は、所定の文字列を一の変換候補に校正するとユーザが選択した後、取得手順により取得された一の文字情報に所定の文字列が含まれる場合、一の文字情報中の所定の文字列を一の変換候補に変換すると決定する。
【0122】
このように、実施形態に係る端末装置10は、所定の文字列を一の変換候補に校正するとユーザが選択した後は、その選択を反映した校正を行うと決定することにより、その会議中で実際に使われる用語を反映した文字情報を自動で生成することが可能となる。したがって、端末装置10は、会議における発話に関する文字情報を適切に校正可能にすることができる。
【0123】
また、実施形態に係る端末装置10は、生成部152を有する。生成部152は、決定部154による決定結果に基づいて、会議の参加ユーザの他の発話情報に対応する他の文字情報を生成する。
【0124】
このように、実施形態に係る端末装置10は、校正の決定結果に基づいて、会議の参加ユーザの他の発話情報に対応する他の文字情報を生成することにより、その会議における言葉の用い方(辞書)を随時反映し、音声情報を文字情報に変換することができる。したがって、端末装置10は、会議における発話の適切な文字変換を可能にすることができる。
【0125】
〔5.プログラム〕
上述してきた端末装置10やサービス提供装置50による処理は、本願に係る決定プログラムや表示プログラムや生成プログラムにより実現される。例えば、端末装置10に係る生成部152や表示部153や決定部154は、端末装置10が有するCPUやMPU等によって、例えばウェブ会議アプリAP11等に含まれる決定プログラムがRAMを作業領域として、決定プログラムに係る生成手順が実行されることにより実現される。端末装置10に係る他の処理部も同様に、表示プログラムによる各手順が実行されることにより実現される。例えば、端末装置10に係る表示部153は、端末装置10が有するCPUやMPU等によって、例えばウェブ会議アプリAP11等に含まれる表示プログラムがRAMを作業領域として、表示プログラムに係る表示手順が実行されることにより実現される。また、端末装置10に係る生成部152は、生成プログラムによる各手順が実行されることにより実現される。例えば、端末装置10に係る生成部152は、端末装置10が有するCPUやMPU等によって、例えばウェブ会議アプリAP11等に含まれる生成プログラムがRAMを作業領域として、生成プログラムに係る生成手順が実行されることにより実現される。
【0126】
なお、本願に係る端末装置10やサービス提供装置50が実行する処理は、必ずしも全てが決定プログラムや表示プログラムや生成プログラムによって実現されるものでなくてもよい。例えば、端末装置10外の情報等は、端末装置10が有するOS(Operating System)によって取得されてもよい。すなわち、決定プログラムや表示プログラムや生成プログラム自体が、上述してきたような端末装置10で実行される処理を実行するのではなく、OSによって取得されたデータ(例えば、会議情報等を表示するために用いるデータ)を受け取ったりすることにより、上述してきた端末装置10の処理を実現するようにしてもよい。
【0127】
〔6.ハードウェア構成〕
上述してきた実施形態に係る端末装置10は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、端末装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0128】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0129】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定のネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定のネットワークNを介して他の機器へ送信する。
【0130】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0131】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0132】
例えば、コンピュータ1000が実施形態に係る端末装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部15の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定のネットワークNを介してこれらのプログラムを取得してもよい。
【0133】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0134】
〔7.その他〕
また、上記各実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0135】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0136】
また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0137】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0138】
1 決定システム
10 端末装置(コンピュータ、決定装置)
141 議事録情報記憶部
142 校正情報記憶部
143 ユーザ情報記憶部
15 制御部
151 取得部
152 生成部
153 表示部
154 決定部
155 送信部
50 サービス提供装置
N ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
【手続補正書】
【提出日】2019年3月1日
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
会議に参加中のユーザが利用する端末装置が実行する決定プログラムであって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得手順と、
前記取得手順により取得された前記文字情報のうち、前記ユーザが校正可能な対象となる所定の文字列前記文字情報の他の文字列とは異なる表示態様で表示する表示手順と、
前記表示手順により表示された前記文字情報のうち、前記所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定手順と、
を端末装置に実行させることを特徴とする決定プログラム。
【請求項2】
前記表示手順は、
前記文字情報のうち、校正に関する所定の条件を満たす前記所定の文字列を、前記ユーザが選択可能に表示する
ことを特徴とする請求項1に記載の決定プログラム。
【請求項3】
前記表示手順は、
前記所定の文字列に他の変換候補がある場合、前記他の変換候補を表示し、
前記決定手順は、
前記他の変換候補に対する前記ユーザの選択を示す選択情報に基づいて、前記所定の文字列をいずれの変換候補に校正するかを決定する
ことを特徴とする請求項1または請求項2に記載の決定プログラム。
【請求項4】
前記決定手順は、
前記他の変換候補のうち、前記ユーザが一の変換候補を選択した場合、当該一の変換候補に前記所定の文字列を校正すると決定する
ことを特徴とする請求項3に記載の決定プログラム。
【請求項5】
前記決定手順は、
前記他の変換候補のいずれも前記ユーザが選択しなかった場合、前記所定の文字列を校正しないと決定する
ことを特徴とする請求項3または請求項4に記載の決定プログラム。
【請求項6】
前記取得手順は、
前記会議の前記参加ユーザのうち、前記ユーザ以外の他のユーザの前記他の変換候補に対する選択を示す選択情報を取得し、
前記決定手順は、
前記他のユーザの選択情報に基づいて、前記所定の文字列をいずれの変換候補校正に校正するかを決定する
ことを特徴とする請求項3に記載の決定プログラム。
【請求項7】
前記決定手順は、
前記参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に前記所定の文字列を校正すると決定する
ことを特徴とする請求項6に記載の決定プログラム。
【請求項8】
前記決定手順は、
前記所定の文字列を前記一の変換候補に校正するとユーザが選択した後、前記取得手順により取得された一の文字情報に前記所定の文字列が含まれる場合、前記一の文字情報中の前記所定の文字列を前記一の変換候補に変換すると決定する
ことを特徴とする請求項4または請求項7に記載の決定プログラム。
【請求項9】
前記決定手順による決定結果に基づいて、前記会議の前記参加ユーザの他の発話情報に対応する他の文字情報を生成する生成手順、
さらに前記端末装置に実行させることを特徴とする請求項1〜8のいずれか1項に記載の決定プログラム。
【請求項10】
会議に参加中のユーザが利用する端末装置が実行する決定方法であって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得工程と、
前記取得工程により取得された前記文字情報のうち、前記ユーザが校正可能な対象となる所定の文字列前記文字情報の他の文字列とは異なる表示態様で表示する表示工程と、
前記表示工程により表示された前記文字情報のうち、前記所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定工程と、
を含んだことを特徴とする決定方法。
【請求項11】
会議に参加中のユーザが利用する決定装置であって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得部と、
前記取得部により取得された前記文字情報のうち、前記ユーザが校正可能な対象となる所定の文字列前記文字情報の他の文字列とは異なる表示態様で表示する表示部と、
前記表示部により表示された前記文字情報のうち、前記所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定する決定部と、
を備えたことを特徴とする決定装置。
【手続補正書】
【提出日】2019年7月31日
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
会議に参加中のユーザが利用する端末装置が実行する決定プログラムであって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得手順と、
前記取得手順により取得された前記文字情報のうち、前記ユーザが校正可能な対象となる所定の文字列を前記文字情報の他の文字列とは異なる表示態様で表示する表示手順と、
前記表示手順により表示された前記文字情報のうち、前記所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定し、前記所定の文字列を優先候補に校正すると決定した後において、発話から変換された文字情報に前記所定の文字列が含まれる場合、前記所定の文字列を優先候補に変換すると決定する決定手順と、
を端末装置に実行させることを特徴とする決定プログラム。
【請求項2】
前記表示手順は、
前記文字情報のうち、校正に関する所定の条件を満たす前記所定の文字列を、前記ユーザが選択可能に表示する
ことを特徴とする請求項1に記載の決定プログラム。
【請求項3】
前記表示手順は、
前記所定の文字列に他の変換候補がある場合、前記他の変換候補を表示し、
前記決定手順は、
前記他の変換候補に対する前記ユーザの選択を示す選択情報に基づいて、前記所定の文字列をいずれの変換候補に校正するかを決定する
ことを特徴とする請求項1または請求項2に記載の決定プログラム。
【請求項4】
前記決定手順は、
前記他の変換候補のうち、前記ユーザが一の変換候補を選択した場合、当該一の変換候補に前記所定の文字列を校正すると決定する
ことを特徴とする請求項3に記載の決定プログラム。
【請求項5】
前記決定手順は、
前記他の変換候補のいずれも前記ユーザが選択しなかった場合、前記所定の文字列を校正しないと決定する
ことを特徴とする請求項3または請求項4に記載の決定プログラム。
【請求項6】
前記取得手順は、
前記会議の前記参加ユーザのうち、前記ユーザ以外の他のユーザの前記他の変換候補に対する選択を示す選択情報を取得し、
前記決定手順は、
前記他のユーザの選択情報に基づいて、前記所定の文字列をいずれの変換候補校正に校正するかを決定する
ことを特徴とする請求項3に記載の決定プログラム。
【請求項7】
前記決定手順は、
前記参加ユーザが選択した変換候補のうち、最も多く選択された一の変換候補に前記所定の文字列を校正すると決定する
ことを特徴とする請求項6に記載の決定プログラム。
【請求項8】
前記決定手順は、
前記所定の文字列を前記一の変換候補に校正するとユーザが選択した後、前記取得手順により取得された一の文字情報に前記所定の文字列が含まれる場合、前記一の文字情報中の前記所定の文字列を前記一の変換候補に変換すると決定する
ことを特徴とする請求項4または請求項7に記載の決定プログラム。
【請求項9】
前記決定手順による決定結果に基づいて、前記会議の前記参加ユーザの他の発話情報に対応する他の文字情報を生成する生成手順、
をさらに前記端末装置に実行させることを特徴とする請求項1〜8のいずれか1項に記載の決定プログラム。
【請求項10】
会議に参加中のユーザが利用する端末装置が実行する決定方法であって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得工程と、
前記取得工程により取得された前記文字情報のうち、前記ユーザが校正可能な対象となる所定の文字列を前記文字情報の他の文字列とは異なる表示態様で表示する表示工程と、
前記表示工程により表示された前記文字情報のうち、前記所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定し、前記所定の文字列を優先候補に校正すると決定した後において、発話から変換された文字情報に前記所定の文字列が含まれる場合、前記所定の文字列を優先候補に変換すると決定する決定工程と、
を含んだことを特徴とする決定方法。
【請求項11】
会議に参加中のユーザが利用する決定装置であって、
音センサにより検知された会議の参加ユーザの発話情報から生成された文字情報を取得する取得部と、
前記取得部により取得された前記文字情報のうち、前記ユーザが校正可能な対象となる所定の文字列を前記文字情報の他の文字列とは異なる表示態様で表示する表示部と、
前記表示部により表示された前記文字情報のうち、前記所定の文字列に対する前記ユーザの選択に基づいて、前記所定の文字列を校正するかどうかを決定し、前記所定の文字列を優先候補に校正すると決定した後において、発話から変換された文字情報に前記所定の文字列が含まれる場合、前記所定の文字列を優先候補に変換すると決定する決定部と、
を備えたことを特徴とする決定装置。