(58)【調査した分野】(Int.Cl.,DB名)
前記第2のユーザが応答可能な状況であると判定された場合、前記第1の端末と前記第2のユーザが所持する第2の端末との間に通話用の接続を確立し、前記第1の音声情報を前記第2の端末に転送する通話制御部、をさらに備える、
請求項1に記載の業務支援装置。
【発明を実施するための形態】
【0012】
以下、図面を適宜参照して、本開示の実施の形態について、詳細に説明する。ただし、必要以上に詳細な説明は省略する場合がある。例えば、すでによく知られた事項の詳細説明及び実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の記載の主題を限定することは意図されていない。
【0013】
(本実施の形態)
<システムの構成>
図1は、本実施の形態に係る業務支援システム10の構成例を示すブロック図である。
【0014】
業務支援システム10は、第1の端末20A、第2の端末20B、及び、業務支援装置100を備える。第1の端末20A、第2の端末20B、及び、業務支援装置100は、通信ネットワーク30を通じて、互いに情報を送受信可能である。
【0015】
第1の端末20Aは、第1のユーザが所持する端末20である。第2の端末20Bは、第2のユーザが所持する端末20である。端末20の例として、スマートフォン、タブレット、PC、マイク付きヘッドフォン、マイク及びヘッドフォン付きAR(Augmented Reality)眼鏡が挙げられる。なお、本実施の形態において、第1の端末20A及び第2の端末20Bを区別しない場合、単に端末20と称する場合がある。また、本実施の形態において、第1のユーザ及び第2のユーザを区別しない場合、単にユーザと称する場合がある。
【0016】
第1のユーザと第2のユーザとの関係は、同じ会社の社員同士の関係であってよい。あるいは、第1のユーザと第2のユーザとの関係は、セールスパーソンと顧客の関係であってもよい。ただし、第1のユーザと第2のユーザとの関係は、これらの関係に限られない。また、本実施の形態では、ユーザの数が2人であるが、ユーザの数は何人であってもよい。
【0017】
業務支援装置100は、各ユーザの業務を支援する装置である。例えば、業務支援装置100は、第1のユーザが第1の端末20Aを通じて、第2のユーザに向けて問い合わせを行ったところ、第2のユーザがその問い合わせに応答できない状況にある場合、第2のユーザのエージェントモデル300B(
図2参照)を稼働させて、第2のユーザに代わって第1のユーザからの問い合わせに応答する。これにより、第1のユーザは、第2のユーザが問い合わせに応答できない状況にある場合であっても、第2のユーザへの問い合わせに対する応答を得ることができる。つまり、コミュニケーションを効率的に行うことができる。
【0018】
以下、一例として、第1のユーザが第2のユーザに向けて問い合わせを行い、第2のユーザ又は第2のユーザのエージェントモデル300Bがその問い合わせに応答する場合について説明する。加えて、第2のユーザが、当該第2のユーザの業務に関する情報を、第2の端末20Bを通じて業務支援装置100に登録する場合についても説明する。
【0019】
<業務支援装置の構成>
図2は、本実施の形態に係る業務支援装置100の構成例を示すブロック図である。
【0020】
業務支援装置100は、ユーザ情報管理部101、業務情報管理部102、スケジュール情報管理部103、現況情報管理部104、会話情報管理部105、エージェントモデル管理部106、受信部107、テキスト変換部108、テキスト解析部109、情報登録部110、応答判定部111、応答生成部112、通話制御部113、音声変換部114、送信部115、及び、エージェントモデル学習部116を備える。ユーザ情報管理部101、業務情報管理部102、スケジュール情報管理部103、現況情報管理部104、会話情報管理部105、エージェントモデル管理部106は、
図8に示すメモリ1002及びストレージ1003の少なくとも1つに構成されてよい。受信部107及び送信部115は、
図8に示す通信装置1006によって実現されてよい。テキスト変換部108、テキスト解析部109、情報登録部110、応答判定部111、応答生成部112、通話制御部113、音声変換部114、及び、エージェントモデル学習部116は、
図8に示すプロセッサ1001がメモリ1002からコンピュータプログラムを読み出して実行することにより実現されてよい。したがって、本実施の形態において、テキスト変換部108、テキスト解析部109、情報登録部110、応答判定部111、応答生成部112、通話制御部113、音声変換部114、又は、エージェントモデル学習部116が主体の処理は、プロセッサが主体の処理に読み替えることができる。
【0021】
ユーザ情報管理部101は、各ユーザのユーザ情報を管理する。例えば、ユーザ情報管理部101は、第1のユーザのユーザ情報、及び、第2のユーザのユーザ情報を管理する。ユーザ情報には、ユーザの氏名、性別、年齢等が含まれてよい。ユーザ情報には、属性情報(例えばユーザの職場、部署、役職、権限等を示す情報)が含まれてよい。ユーザ情報には、ユーザが所持する端末20の端末情報(例えば電話番号、IPアドレス等)が含まれてよい。ユーザ情報管理部101には、ユーザ情報が予め登録されてよい。
【0022】
業務情報管理部102は、各ユーザの業務情報を管理する。例えば、業務情報管理部102は、第1のユーザの業務情報、及び、第2のユーザの業務情報を管理する。業務情報には、業務が行われた日時、業務の進捗状況、業務のタスク等が含まれてよい。ユーザは、端末20を通じて、業務情報を登録できてよい。ユーザが業務情報を登録する方法については後述する。
【0023】
スケジュール情報管理部103は、各ユーザのスケジュール情報を管理する。例えば、スケジュール情報管理部103は、第1のユーザのスケジュール情報、及び、第2のユーザのスケジュール情報を管理する。スケジュール情報には、イベントが行われる日時及び時間、イベントの内容、イベントが行われる場所等が含まれてよい。
【0024】
現況情報管理部104は、各ユーザの現況情報を管理する。例えば、現況情報管理部104は、第1のユーザの現況情報、及び、第2のユーザの現況情報を管理する。現況情報には、応答可能、取り込み中、会議中、休暇中といったユーザの現在の状況を示す情報が含まれてよい。
【0025】
会話情報管理部105は、各ユーザの会話情報を管理する。例えば、会話情報管理部105は、第1のユーザの会話情報、及び、第2のユーザの会話情報を管理する。第1のユーザの会話情報には、第1のユーザが過去に他のユーザと行った会話の内容がテキスト情報として含まれてよい。第2のユーザの会話情報には、第2のユーザが過去に他のユーザと行った会話の内容がテキスト情報として含まれてよい。
【0026】
エージェントモデル管理部106は、各ユーザのエージェントモデル300を管理する。例えば、エージェントモデル管理部106は、第1のユーザのエージェントモデル300A、及び、第2のユーザのエージェントモデル300Bを管理する。エージェントモデル300は、ユーザに代わって応答を行うプログラム及び/又はデータであってよい。エージェントモデル300は、機械学習モデル、AI(Artificial Intelligence)、学習器、分類器といった他の用語に読み替えられてもよい。エージェントモデル300の生成又は学習方法については後述する。
【0027】
受信部107は、端末20から送信された情報を、通信ネットワーク30を通じて受信する。例えば、受信部107は、第1のユーザによって第1の端末20Aに入力された第1の音声情報を受信する。例えば、受信部107は、第2のユーザによって第2の端末20Bに入力された第3の音声情報を受信する。
【0028】
テキスト変換部108は、公知の音声認識技術を用いて、音声情報をテキスト情報に変換する。例えば、テキスト変換部108は、受信部107によって受信された第1の音声情報を第1のテキスト情報に変換する。例えば、テキスト変換部108は、受信部107によって受信された第3の音声情報を第3のテキスト情報に変換する。
【0029】
テキスト解析部109は、公知の文章解析技術を用いて、テキスト情報の文章を解析し、その解析結果に基づく処理を実行する。例えば、テキスト解析部109は、第1のテキスト情報に第2のユーザへの問い合わせに関する情報が含まれると解析した場合、第2のユーザへの問い合わせに関する情報を応答判定部111に送信する。例えば、テキスト解析部109は、第3のテキスト情報に第2のユーザの業務進捗に関する情報が含まれると解析した場合、第2のユーザの業務進捗に関する情報を業務情報管理部102に送信する。例えば、テキスト解析部109は、第3のテキスト情報に第2のユーザのスケジュール登録に関する情報が含まれると解析した場合、第2のユーザのスケジュール登録に関する情報をスケジュール情報管理部103に提供する。
【0030】
情報登録部110は、端末20を通じてユーザから送信された業務に関する情報を、業務情報として業務情報管理部102に登録する。情報登録部110は、端末20を通じてユーザから送信されたスケジュールに関する情報を、スケジュール情報としてスケジュール情報管理部103に登録する。
【0031】
応答判定部111は、テキスト解析部109によって特定された問い合わせ先のユーザが応答可能な状況であるか否かを判定する。例えば、応答判定部111は、問い合わせ先が第2のユーザである場合、その第2のユーザの状況を示す情報に基づいて、第2のユーザが問い合わせに応答可能な状況であるか否かを判定する。例えば、応答判定部111は、問い合わせ先が第2のユーザである場合、その第2のユーザのスケジュール情報及び現況情報の少なくとも1つに基づいて、第2のユーザが問い合わせに応答可能な状況であるか否かを判定する。
【0032】
応答生成部112は、応答判定部111にて問い合わせ先のユーザが応答不可能な状況であると判定された場合、問い合わせ先のユーザのエージェントモデル300を用いて、問い合わせに対する応答を含むテキスト情報を生成する。例えば、応答生成部112は、応答判定部111にて第2のユーザが応答不可能な状況であると判定された場合、第2のユーザのエージェントモデル300Bを用いて、第1のユーザからの問い合わせに対する応答を含む第2のテキスト情報を生成する。
【0033】
通話制御部113は、応答判定部111にて問い合わせ先のユーザが応答可能な状況であると判定された場合、問い合わせ元のユーザの端末20と、問い合わせ先のユーザの端末20との間に通話用の接続を確立する。通話用の接続の例として、音声通話の接続、IP電話の接続、及び、所定のアプリケーションを用いる通話の接続等が挙げられる。そして、通話制御部113は、問い合わせ元のユーザの端末20から受信した音声情報を、問い合わせ先のユーザの端末20に転送してよい。例えば、通話制御部113は、応答判定部111にて第2のユーザが応答可能な状況であると判定された場合、第1の端末20Aと第2の端末20Bとの間に通話用の接続を確立し、第1の音声情報を第2の端末20Bに転送する。通話用の接続を確立した後、第1のユーザ及び第2のユーザはそれぞれ第1の端末20A及び第2の端末20Bを通じて、音声会話を行ってよい。このとき、通話制御部113は、当該音声会話を録音し、その録音した音声会話をテキスト変換部108を用いてテキスト情報に変換し、そのテキスト情報を第2のユーザの会話情報として会話情報管理部105に登録してよい。
【0034】
音声変換部114は、公知のテキスト読み上げ技術を用いて、テキスト情報を音声情報に変換する。例えば、音声変換部114は、応答生成部112によって生成された第2のテキスト情報を第2の音声情報に変換する。
【0035】
送信部115は、業務支援装置100にて生成した情報を通信ネットワーク30を通じて端末20へ送信する。例えば、送信部115は、音声変換部114にて生成された第2の音声情報を第1の端末20Aに送信する。第1の端末20Aは、その第2の音声情報を受信し、音声として出力してよい。この第2の音声情報は、第2のユーザのエージェントモデル300Bによって生成された、第1の音声情報に含まれる問い合わせに対する応答に相当するものである。よって、第1のユーザは、第2のユーザが応答不可能な状況であっても、第2のユーザに代わる第2のユーザのエージェントモデル300Bから、問い合わせに対する応答を得ることができる。つまり、コミュニケーションを効率的に行うことができる。
【0036】
エージェントモデル学習部116は、ユーザ情報管理部101のユーザ情報と、会話情報管理部105の会話情報と、業務情報管理部102の業務情報とに基づいて、問い合わせに対して応答できるように各ユーザのエージェントモデル300の学習を行う。なお、エージェントモデル300の学習方法の一例の説明については後述する(
図3、
図4参照)。
【0037】
<情報登録処理>
図3は、本実施の形態に係る情報登録処理の一例を示すフローチャートである。
【0038】
例えば、第2のユーザが、第2の端末20Bに、業務の進捗状況に関する情報、又は、スケジュール登録に関する情報等を音声で入力すると、第2の端末20Bは、その入力された音声を第3の音声情報として業務支援装置100へ送信する。この場合、業務支援装置100は、次の処理を実行してよい。
【0039】
S101として、受信部107は、第2の端末20Bから、上記の第3の音声情報を受信する。
【0040】
S102として、テキスト変換部108は、第3の音声情報を第3のテキスト情報に変換する。
【0041】
S103として、テキスト解析部109は、第3のテキスト情報を解析する。
【0042】
S104として、テキスト解析部109は、解析結果に基づき、第3のテキスト情報に業務情報が含まれるか否かを判定する。例えば、第3のテキスト情報に、「C社とプロジェクトKについて契約できた」という文章が含まれる場合、テキスト解析部109は、当該文章を業務情報と判定する。
【0043】
S104にて第3のテキスト情報に業務情報が含まれると判定された場合(S104:YES)、S105として、情報登録部110は、その業務内容を第2のユーザの業務情報として業務情報管理部102に登録する。例えば、情報登録部110は、「プロジェクトK、契約成立。X年X月X日X時X分、C社訪問の会議にて」という第2のユーザの業務情報を生成し、業務情報管理部102に登録する。なお、第3のテキスト情報に日時及び場所の情報が含まれない場合、情報登録部110は、第2の端末20Bが第2のユーザから音声を入力された日時及び場所の情報を利用して、それらの情報を補完してよい。また、情報登録部110は、生成した第2のユーザの業務情報の内容にて登録を行ってよいか否かをいったん第2の端末20Bを通じて第2のユーザに確認し、第2のユーザが許可した場合に当該登録を実行してもよい。そして、次にS106の処理が実行される。
【0044】
S104にて第3のテキスト情報に業務情報が含まれないと判定された場合(S104:NO)、次にS106の処理が実行される。
【0045】
S106として、テキスト解析部109は、解析結果に基づき、第3のテキスト情報にスケジュール情報が含まれるか否かを判定する。例えば、第3のテキスト情報に、「X月X日X時から、D社のEさんを訪問することを予定表に入れて」という文章が含まれる場合、テキスト解析部109は、当該文章を、スケジュール情報と判定する。
【0046】
S106にて第3のテキスト情報にスケジュール情報が含まれると判定された場合(S106:YES)、S107として、情報登録部110は、そのスケジュール内容を第2のユーザのスケジュール情報としてスケジュール情報管理部103に登録する。例えば、情報登録部110は、「X年X月X日X時からD社のEさんを訪問」という第2のユーザのスケジュール情報を生成し、スケジュール情報管理部103に登録する。なお、情報登録部110は、生成した第2のユーザのスケジュール情報の内容にて登録を行ってよいか否かをいったん第2の端末20Bを通じて第2のユーザに確認し、第2のユーザが許可した場合に当該登録を実行してもよい。そして、本処理は終了される。
【0047】
S106にて第3のテキスト情報にスケジュール情報が含まれないと判定された場合(S106:NO)、本処理は終了される。
【0048】
以上の処理によれば、第2のユーザは、第2の端末20Bを通じて音声で、業務の進捗状況に関する情報を業務情報管理部102に登録することができる。また、第2のユーザは、第2の端末20Bを通じて音声で、スケジュール登録に関する情報をスケジュール情報管理部103に登録することができる。
【0049】
<エージェントモデルの学習方法>
図4は、本実施の形態に係るエージェントモデル300の学習方法の一例を説明するための図である。
図5は、本実施の形態に係るエージェントモデル300の学習処理の一例を示すフローチャートである。
【0050】
図4の説明では、第2のユーザは、第1のユーザからの問い合わせと、第3のユーザからの問い合わせにそれぞれ応答したことがあるものとする。この場合、第2のユーザの会話情報には、第1のユーザからの問い合わせAと、当該問い合わせAに対する第2のユーザの第1のユーザへの応答Aが記録されている。同様に、第2のユーザの会話情報には、第3のユーザからの問い合わせBと、当該問い合わせBに対する第2のユーザの第3のユーザへの応答Bが記録されている。
【0051】
エージェントモデル学習部116は、第1のユーザからの問い合わせAとその問い合わせに対する第2のユーザの応答Bとを用いて、次のように、第2のユーザのエージェントモデル300Bの学習を行ってよい(
図5参照)。
【0052】
S201として、エージェントモデル学習部116は、第2のユーザの会話情報に含まれる問い合わせAと、当該問い合わせAに対する第2のユーザの応答Aとを抽出する。
【0053】
S202として、エージェントモデル学習部116は、問い合わせAの問い合わせ元である第1のユーザのユーザ情報を取得する。
【0054】
S203として、エージェントモデル学習部116は、第2のユーザの応答Aを解析して、第2のユーザの業務情報から、当該応答Aの根拠となっている部分業務情報A、及び、部分業務情報Bを抽出する。
【0055】
S204として、エージェントモデル学習部116は、第2のユーザのエージェントモデル300Bに対して、S201で抽出した問い合わせAと、その応答Aと、S202で抽出した問い合わせAの問い合わせ元である第1のユーザのユーザ情報と、S203で第2のユーザの業務情報から抽出した部分業務情報A、及び、部分業務情報Bとの関係性を学習させる。
【0056】
これにより、第2のユーザのエージェントモデル300Bは、第1のユーザから問い合わせAと同様の問い合わせを受けた場合、第2のユーザの業務情報の部分業務情報A及び部分業務情報Bと同様の部分業務情報に基づいて、応答Aと同様の応答を行うことができる。
【0057】
エージェントモデル学習部116は、第3のユーザからの問い合わせBとその問い合わせに対する第2のユーザの応答Bを用いて、次のように、第2のユーザのエージェントモデル300Bの学習を行ってよい(
図5参照)。
【0058】
S201として、エージェントモデル学習部116は、第2のユーザの会話情報に含まれる問い合わせBと、当該問い合わせBに対する第2のユーザの応答Bとを抽出する。
【0059】
S202として、エージェントモデル学習部116は、問い合わせBの問い合わせ元である第3のユーザのユーザ情報を取得する。
【0060】
S203として、エージェントモデル学習部116は、第2のユーザの応答Bを解析して、第2のユーザの業務情報から、当該応答Bの根拠となっている部分業務情報Bを抽出する。
【0061】
S204として、エージェントモデル学習部116は、第2のユーザのエージェントモデル300Bに対して、S201で抽出した問い合わせBと、その応答Bと、S202で抽出した問い合わせBの問い合わせ元である第3のユーザのユーザ情報と、S203で第2のユーザの業務情報から抽出した部分業務情報Bとの関係性を学習させる。
【0062】
これにより、第2のユーザのエージェントモデル300Bは、第3のユーザから問い合わせBと同様の問い合わせを受けた場合、第2のユーザの業務情報の部分業務情報Bと同様の部分業務情報に基づいて、応答Bと同様の応答を行うことができる。
【0063】
この場合、第3のユーザに対する応答Bの生成には、第1のユーザの場合とは異なり、部分業務情報Aは用いられなくてよい。なぜなら、第2のユーザが過去に第3のユーザに対して行った応答の根拠に部分業務情報Aが含まれていないということは、第2のユーザにとって部分業務情報Aに関する情報は第3のユーザに提示できない又は提示したくない情報であると推定できるからである。
【0064】
すなわち、エージェントモデル学習部116は、第2のユーザが過去に問い合わせ元のユーザに対して行った応答の根拠となっている部分業務情報と同様又は類似する部分業務情報については、当該ユーザからの問い合わせに対する応答の根拠として利用可能であることを、第2のユーザのエージェントモデル300Bに学習させてよい。加えて、エージェントモデル学習部116は、第2のユーザが過去に問い合わせ元のユーザに対して行った応答の根拠となっていない部分業務情報と同様又は類似する部分業務情報については、当該ユーザからの問い合わせに対する応答の根拠として利用不可能であることを、第2のユーザのエージェントモデル300Bに学習させてよい。
【0065】
また、エージェントモデル学習部116は、第1のユーザに対する応答の根拠として利用可能な部分業務情報については、第1のユーザと同様の属性情報を有する他のユーザに対する応答の根拠としても利用可能であることを、第2のユーザのエージェントモデル300Bに学習させてもよい。
【0066】
なお、エージェントモデル300の学習方法は、上述の方法に限られない。例えば、エージェントモデル300は、CNNにて構成される学習器(又は分類器)であり、エージェントモデル学習部116は、公知のCNNの学習方法によってエージェントモデル300の学習を行ってもよい。次に、
図6を参照して一例を説明する。
【0067】
図6は、CNNにて構成されるエージェントモデル300の学習方法を説明するための図である。
【0068】
例えば、エージェントモデル学習部116は、第2のユーザの会話情報から抽出した問い合わせAと、問い合わせ元である第1のユーザのユーザ情報と、第2のユーザの業務情報を入力データ202とし、上記問い合わせに対する第2のユーザの応答Aの根拠となっている部分業務情報A及び部分業務情報Bを入力データ202に対する正解ラベル201として関連付けた学習データ200を準備する。そして、エージェントモデル学習部116は、入力データ202を第2のユーザのエージェントモデル300Bに入力する。第2のユーザのエージェントモデル300Bは、第2のユーザの業務情報から、入力された第1のユーザのユーザ情報及び問い合わせAに対応する部分業務情報を抽出し、出力データ203として出力する。エージェントモデル学習部116は、正解ラベル201である部分業務情報A及び部分業務情報Bと、第2のユーザのエージェントモデル300Bから出力された部分業務情報とを比較し、その間のずれ(差分)が小さくなるように第2のユーザのエージェントモデル300B(CNN)の各パラメータを調整する。エージェントモデル学習部116は、複数の学習データ200について上述の処理を繰り返すことにより、第2のユーザのエージェントモデル300Bの学習を行ってよい。
【0069】
<応答処理>
図7は、本実施の形態に係る応答処理の一例を示すフローチャートである。
【0070】
例えば、第1のユーザが、第1の端末20Aに対して、第2のユーザに対する問い合わせを音声で入力すると、第1の端末20Aは、その入力された音声を第1の音声情報として業務支援装置100へ送信する。この場合、業務支援装置100は、次の応答処理を実行してよい。
【0071】
S301として、受信部107は、第1の端末20Aから、上記の第1の音声情報を受信する。
【0072】
S302として、テキスト変換部108は、第1の音声情報を第1のテキスト情報に変換する。
【0073】
S303として、テキスト解析部109は、第1のテキスト情報を解析する。
【0074】
S304として、テキスト解析部109は、S303の解析結果に基づき、第1のテキスト情報に問い合わせが含まれるか否かを判定する。例えば、第1のテキスト情報に、「東京営業部のBさん(第2のユーザ)、今話できる? C社との取引の件どうなった?」という文(以下、問い合わせ例文という)が含まれる場合、テキスト解析部109は、問い合わせが含まれると判定する。
【0075】
S304にて問い合わせが含まれないと判定された場合(S304:NO)、本処理は終了されてよい。なお、この場合、
図3に示した第2のユーザの場合と同様に、第1のユーザが、自分の業務情報等を登録するために音声情報を送信した場合も想定される。よって、この場合、
図3における第2のユーザを第1のユーザに読み替え、第3のテキスト情報を第1のテキスト情報に読み替えて、
図3のS104以降の処理が行われてもよい。
【0076】
S304にて問い合わせが含まれると判定された場合(S304:YES)、S305として、テキスト解析部109は、第1のテキスト情報から問い合わせを抽出すると共に、当該問い合わせの問い合わせ先のユーザ(ここでは第2のユーザとする)を特定する。例えば、第1のテキスト情報に、上記の問い合わせ例文が含まれる場合、テキスト解析部109は、「東京営業部のBさん(第2のユーザ)」を、問い合わせ先のユーザとして特定する。
【0077】
S306として、応答判定部111は、第2のユーザのスケジュール情報及び現況情報の少なくとも1つに基づいて、第2のユーザが応答可能な状況であるか否かを判定する。
【0078】
まず、応答判定部111が、第2のユーザは応答不可能な状況であると判定した場合(S306:NO)について説明する。
【0079】
S307として、応答生成部112は、第2のユーザのエージェントモデル300Bを用いて、第2のユーザの業務情報から、S305で抽出した問い合わせに対する応答の根拠となる部分業務情報を抽出する。例えば、応答生成部112は、第2のユーザのエージェントモデル300Bに、第1のユーザのユーザ情報、及び、S305にて抽出した問い合わせを入力し、第2のユーザのエージェントモデル300Bに部分業務情報を出力させる。
【0080】
S308として、応答生成部112は、S307にて抽出した部分業務情報を用いて、応答用の第2のテキスト情報を生成する。応答生成部112は、上記の問い合わせ例文に対して、S307にて抽出された部分業務情報を用いて、例えば「今、Bさんは会議中で応答できないので、エージェントの私が代わりに返答します。C社との取引は今日の午前10時からC社で行った会議で契約に至りました」という応答用の第2のテキスト情報(以下、応答例文という)を出力する。
【0081】
なお、第2のユーザのエージェントモデル300Bが部分業務情報を出力しない場合、応答生成部112は、例えば「済みませんが、お答えすることができません」という応答用の第2のテキスト情報を生成してもよい。
【0082】
S309として、音声変換部114は、S308にて生成された第2のテキスト情報を第2の音声情報に変換する。
【0083】
S310として、送信部115は、S309の第2の音声情報を第1の端末20Aに送信する。第1の端末20Aは、この送信された第2の音声情報を受信し、音声として出力してよい。これにより、第1のユーザは、第2のユーザが応答不可能な状況な場合であっても、第2のユーザに対する問い合わせの応答を得ることができる。よって、効率的なコミュニケーションを行うことができる。
【0084】
次に、応答判定部111が第2のユーザが応答可能な状況であると判定した場合(S306:YES)について説明する。
【0085】
S320として、通話制御部113は、第1の端末20Aと第2の端末20Bとの間に通話用の接続を確立する。
【0086】
S321として、通話制御部113は、送信部115を通じて、S301にて受信した第1の音声情報を第2の端末20Bに送信する。第2の端末20Bは、この送信された第1の音声情報を受信し、音声として出力してよい。これにより、第2のユーザは、第1のユーザから送信された第1の音声情報を聞くことができる。
【0087】
S322として、通話制御部113は、第1の端末20Aと第2の端末20Bとの間でやり取りされる音声情報を録音する。
【0088】
S323として、通話制御部113は、第1の端末20Aと第2の端末20Bとの間の通話用の接続が切断されたか否かを判定する。
【0089】
第1の端末20Aと第2の端末20Bとの間の通話用の接続が切断されていない場合(S323:NO)、S322の処理が引き続き実行される。
【0090】
第1の端末20Aと第2の端末20Bとの間の通話用の接続が切断された場合(S323:YES)、S324として、通話制御部113は、S312にて録音された会話を、テキスト変換部108を用いてテキスト情報に変換し、そのテキスト情報を、第2のユーザの会話情報として会話情報管理部105に登録する。このように登録された第2のユーザの会話情報は、上述したように、第2のユーザのエージェントモデル300Bの学習に利用されてよい。そして、本処理は終了される。
【0091】
<ハードウェア構成>
図8は、本開示に係る業務支援装置100及び端末20のハードウェアの構成の一例を示すブロック図である。
【0092】
業務支援装置100及び端末20は、
図8に示すコンピュータ1000として構成されてもよい。この場合、上述した業務支援装置100及び端末20が有する機能は、コンピュータ1000がコンピュータプログラムを実行することにより実現されてよい。
【0093】
コンピュータ1000は、プロセッサ1001、メモリ1002、ストレージ1003、入力装置1004、出力装置1005、通信装置1006、GPU(Graphics Processing Unit)1007、読取装置1008、及び、バス1009を備える。プロセッサ1001、メモリ1002、ストレージ1003、入力装置1004、出力装置1005、通信装置1006、GPU1007、読取装置1008は、バス1009に接続され、当該バス1009を介して双方向にデータを送受信できる。
【0094】
プロセッサ1001は、メモリ1002に記憶されたコンピュータプログラムを実行し、上述した機能ブロックを実現する装置である。プロセッサ1001の例として、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、コントローラ、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field-Programmable Gate Array)が挙げられる。
【0095】
メモリ1002は、コンピュータ1000が取り扱うコンピュータプログラム及びデータを記憶する装置である。メモリ1002は、ROM(Real-Only Memory)及びRAM(Random Access Memory)を含んでよい。
【0096】
ストレージ1003は、不揮発性記憶媒体で構成され、コンピュータ1000が取り扱うコンピュータプログラム及びデータを記憶する装置である。ストレージ1003の例として、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリが挙げられる。
【0097】
入力装置1004は、プロセッサ1001に入力するデータを受け付ける装置である。入力装置1004の例として、キーボード、マウス、タッチパッド、マイクが挙げられる。
【0098】
出力装置1005は、プロセッサ1001が生成したデータを出力する装置である。出力装置1005の例として、ディスプレイ、スピーカーが挙げられる。例えば、ユーザは、出力装置1005に表示されたUI(User Interface)を、入力装置1004を通じて操作することにより、所望のデータを入力又は選択してよい。
【0099】
通信装置1006は、サーバ又は端末に代表される他の装置と、通信ネットワーク30を介して、データを送受信する装置である。通信装置1006は、データを送信する送信部115とデータを受信する受信部107とを含んでよい。通信装置1006は、有線通信及び無線通信の何れに対応してもよい。有線通信の例として、Ethernet(登録商標)が挙げられる。無線通信の例として、IEEE802.11、Bluetooh、LTE(Long Term Evolution)、4G、5Gが挙げられる。
【0100】
GPU1007は、画像描写を高速に処理する装置である。なお、GPU1007は、AIの処理に利用されてもよい。例えば、GPU1007は、エージェントモデル300の学習処理、及び/又は、エージェントモデル300による検出処理に利用されてよい。
【0101】
読取装置1008は、DVD−ROM(Digital Versatile Disk Read Only Memory)又はUSB(Universal Serial Bus)メモリといった記録媒体からデータを読み取る装置である。
【0102】
(本開示のまとめ)
本開示の内容は以下のように表現することができる。
【0103】
<表現1>
ユーザの業務を支援する業務支援装置100は、第1のユーザが第1の端末20Aに入力した第1の音声情報を受信する受信部107と、第1の音声情報を第1のテキスト情報に変換するテキスト変換部108と、第1のテキスト情報が問い合わせを含む場合、問い合わせ先のユーザを特定するテキスト解析部109と、特定された問い合わせ先が第2のユーザである場合、第2のユーザの状況を示す情報に基づいて、第2のユーザが問い合わせに応答可能な状況であるか否かを判定する応答判定部111と、第2のユーザが応答不可能な状況であると判定された場合、第2のユーザの過去の応答に基づいて予め学習された第2のユーザのエージェントモデル300Bを用いて、問い合わせに対する応答を含む第2のテキスト情報を生成する応答生成部112と、第2のテキスト情報を第2の音声情報に変換する音声変換部114と、第2の音声情報を第1の端末20Aに送信する送信部115と、を備える。
【0104】
表現1の構成によれば、第2のユーザが応答不可能な状況である場合であっても、第2のユーザのエージェントモデル300Bが、第2のユーザに代わって、第1にユーザからの問い合わせに応答することができる。これにより、コミュニケーションを効率的に行うことができる。
【0105】
<表現2>
表現1の記載において、業務支援装置100は、第2のユーザが応答可能な状況であると判定された場合、第1の端末20Aと第2のユーザが所持する第2の端末20Bとの間に通話用の接続を確立し、第1の音声情報を第2の端末20Bに転送する通話制御部113、をさらに備えてよい。
【0106】
表現2に記載の構成によれば、第2のユーザが応答可能な状況である場合、第1のユーザは第2のユーザと直接音声通話を行うことができる。これにより、コミュニケーションを効率的に行うことができる。
【0107】
<表現3>
表現2の記載において、業務支援装置100は、ユーザの業務情報を管理する業務情報管理部102をさらに備え、受信部107は、第2のユーザが第2の端末20Bに入力した第3の音声情報を受信し、テキスト変換部108は、第3の音声情報を第3のテキスト情報に変換し、テキスト解析部109は、第3のテキスト情報に業務に関する情報が含まれる場合、当該業務に関する情報を第2のユーザの業務情報として業務情報管理部102に登録してよい。
【0108】
表現3に記載の構成によれば、第2のユーザが、第2の端末20Bに向かって業務に関する情報を音声で入力すると、その業務に関する情報が第2のユーザの業務情報として自動的に業務情報管理部102に登録される。これにより、第2のユーザは、業務を効率的に行うことができる。
【0109】
<表現4>
表現3の記載において、業務支援装置100は、ユーザのスケジュール情報を管理するスケジュール情報管理部103をさらに備え、テキスト解析部109は、第3のテキスト情報にスケジュールに関する情報が含まれる場合、当該スケジュールに関する情報を第2のユーザのスケジュール情報としてスケジュール情報管理部103に登録してよい。
【0110】
表現4に記載の構成によれば、第2のユーザが、第2の端末20Bに向かってスケジュールに関する情報を音声で入力すると、そのスケジュールに関する情報が第2のユーザのスケジュール情報として自動的にスケジュール情報管理部103に登録される。これにより、第2のユーザは、業務を効率的に行うことができる。
【0111】
<表現5>
表現4の記載において、第2のユーザの状況を示す情報は、第2のユーザのスケジュール情報を含み、応答判定部111は、第2のユーザのスケジュール情報に基づいて、第2のユーザが問い合わせに対して応答可能な状況であるか否かを判定してよい。
【0112】
表現5に記載の構成によれば、応答判定部111は、第2のユーザのスケジュール情報を参照して、問い合わせを受けた時刻において第2のユーザが応答可能な状態であるか否かを判定することができる。
【0113】
<表現6>
表現5の記載において、業務支援装置100は、ユーザの会話情報を管理する会話情報管理部105をさらに備え、通話制御部113は、第1の端末20Aと第2の端末20Bとの間に確立された通話用の接続において送受信される第1のユーザと第2のユーザとの間の会話を録音し、当該録音した会話をテキスト情報に変換したものを第2のユーザの会話情報として会話情報管理部105に登録してよい。
【0114】
表現6に記載の構成によれば、ユーザ間の会話の内容が会話情報として自動的に会話情報管理部105に登録される。これにより、エージェントモデル300の学習に利用する会話情報を自動的に得ることができる。
【0115】
<表現7>
表現6の記載において、業務支援装置100は、ユーザの属性を含むユーザ情報を管理するユーザ情報管理部101と、第2のユーザの会話情報に含まれる過去の問い合わせと当該過去の問い合わせに対する過去の応答と、過去の問い合わせの問い合わせ元のユーザのユーザ情報と、第2のユーザの業務情報における過去の応答の根拠となった部分の情報である部分業務情報との関係性を第2のユーザのエージェントモデル300Bに学習させるエージェントモデル学習部116と、をさらに備えてよい。
【0116】
表現7に記載の構成によれば、ユーザの過去の応答と同様の応答を行うことができるエージェントモデル300を構築できる。
【0117】
<表現8>
表現7の記載において、応答生成部112は、第1のユーザのユーザ情報、及び、第1のユーザからの問い合わせを前記第2のユーザのエージェントモデル300Bに入力し、第2のユーザのエージェントモデル300Bは、第2のユーザの業務情報から、入力に対応する部分業務情報を抽出及び出力し、応答生成部112は、出力された部分業務情報を用いて応答を含む第2のテキスト情報を生成してよい。
【0118】
表現8に記載の構成によれば、エージェントモデル300は、問い合わせ元のユーザ情報に応じた部分業務情報を出力するので、応答生成部112は、問い合わせ元のユーザに応じた応答を行うことができる。例えば、第2のユーザのエージェントモデル300Bは、第2のユーザが第3のユーザに対して過去に応答の根拠として利用したことがない部分業務情報については出力しない。よって、第3のユーザの問い合わせに対して、第3のユーザに対して提供すべきでない又は提供したくない情報が応答されることを抑止できる。
【0119】
<表現9>
第1のユーザが使用する第1の端末20Aと、第2のユーザが使用する第2の端末20Bと、ユーザの業務を支援する業務支援装置100とを備える業務支援システムにおいて、第1の端末20Aは、第1のユーザが入力した第1の音声情報を業務支援装置100へ送信し、業務支援装置100は、第1の端末20Aから送信された前記第1の音声情報を受信し、第1の音声情報を第1のテキスト情報に変換し、第1のテキスト情報が問い合わせを含む場合、問い合わせ先のユーザを特定し、特定された問い合わせ先が第2のユーザである場合、第2のユーザの状況を示す情報に基づいて、第2のユーザが前記問い合わせに応答可能な状況であるか否かを判定し、第2のユーザが応答不可能な状況であると判定された場合、第2のユーザの過去の応答に基づいて予め学習された第2のユーザのエージェントモデル300Bを用いて、問い合わせに対する応答を含む第2のテキスト情報を生成し、第2のテキスト情報を第2の音声情報に変換し、第2の音声情報を第1の端末20Aに送信し、第1の端末20Aは、業務支援装置100から送信された第2の音声情報を出力する。
【0120】
<表現10>
ユーザの業務を支援する業務支援方法において、第1の端末20Aは、第1のユーザが入力した第1の音声情報を業務支援装置100へ送信し、業務支援装置100は、第1の端末20Aから送信された第1の音声情報を受信し、第1の音声情報を第1のテキスト情報に変換し、第1のテキスト情報が問い合わせを含む場合、問い合わせ先のユーザを特定し、特定された問い合わせ先が第2のユーザである場合、第2のユーザの状況を示す情報に基づいて、第2のユーザが問い合わせに応答可能な状況であるか否かを判定し、第2のユーザが応答不可能な状況であると判定された場合、第2のユーザの過去の応答に基づいて予め学習された第2のユーザのエージェントモデル300Bを用いて、問い合わせに対する応答を含む第2のテキスト情報を生成し、第2のテキスト情報を第2の音声情報に変換し、第2の音声情報を第1の端末20Aに送信し、第1の端末20Aは、業務支援装置100から送信された第2の音声情報を出力する。
【0121】
以上、添付図面を参照しながら実施の形態について説明したが、本開示はかかる例に限定されない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例、修正例、置換例、付加例、削除例、均等例に想到し得ることは明らかであり、それらについても本開示の技術的範囲に属すると了解される。また、発明の趣旨を逸脱しない範囲において、上述した実施の形態における各構成要素を任意に組み合わせてもよい。
【解決手段】業務支援装置は、第1のユーザが第1の端末に入力した第1の音声情報を受信し、第1の音声情報を第1のテキスト情報に変換し、第1のテキスト情報が問い合わせを含む場合、問い合わせ先のユーザを特定し、特定された問い合わせ先が第2のユーザである場合、第2のユーザの状況を示す情報に基づいて、第2のユーザが問い合わせに応答可能な状況であるか否かを判定し、第2のユーザが応答不可能な状況であると判定した場合、第2のユーザの過去の応答に基づいて予め学習された第2のユーザのエージェントモデルを用いて、問い合わせに対する応答を含む第2のテキスト情報を生成し、第2のテキスト情報を第2の音声情報に変換し、第2の音声情報を第1の端末に送信する。