(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-14
(45)【発行日】2024-05-22
(54)【発明の名称】情報処理システム、情報処理方法及びプログラム
(51)【国際特許分類】
H04M 3/56 20060101AFI20240515BHJP
H04M 3/42 20060101ALI20240515BHJP
H04M 11/00 20060101ALI20240515BHJP
H04M 1/72403 20210101ALI20240515BHJP
G06F 3/0481 20220101ALI20240515BHJP
【FI】
H04M3/56 Z
H04M3/42 P
H04M11/00 301
H04M1/72403
G06F3/0481
(21)【出願番号】P 2023571446
(86)(22)【出願日】2023-11-15
(86)【国際出願番号】 JP2023041142
【審査請求日】2023-11-15
【早期審査対象出願】
(73)【特許権者】
【識別番号】509072799
【氏名又は名称】テレネット株式会社
(74)【代理人】
【識別番号】100089026
【氏名又は名称】木村 高明
(72)【発明者】
【氏名】青山 貴子
【審査官】山岸 登
(56)【参考文献】
【文献】特開2008-085903(JP,A)
【文献】特開2011-125006(JP,A)
【文献】国際公開第2014/050953(WO,A1)
【文献】特開2019-004392(JP,A)
【文献】特開2022-033526(JP,A)
【文献】特開2007-096989(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F3/01
3/048-3/04895
H04M1/00
1/24-3/00
3/16-3/20
3/38-3/58
7/00-7/16
11/00-11/10
99/00
(57)【特許請求の範囲】
【請求項1】
情報処理システムであって、
複数の通信端末のうちの1の通信端末から前記複数の通信端末のうちの前記1の通信端末以外の他の通信端末への通信を制御し、
前記他の通信端末は1以上の通信端末であり、
前記他の通信端末における設定情報に基づき前記他の通信端末の通信時における表示画面を変更するよう制御し、
前記設定情報には、
録音機能を有効にするか否か、と、
文字起こし機能を有効にするか否か、と、
の情報が含まれ
前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、
録音機能を無効、
文字起こし機能を無効、
を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報が含まれるよう制御する、
情報処理システム。
【請求項2】
請求項1に記載の情報処理システムにおいて、
前記設定情報には更に、
同時通訳設定を有効にするか否かの情報が含まれ、
前記他の通信端末における前記設定情報に含まれる同時通訳設定を有効にするか否かの情報に応じて、前記他の通信端末における音声の出力を制御する、
情報処理システム。
【請求項3】
請求項2に記載の情報処理システムにおいて、
同時通訳設定を有効にする情報を含む設定情報の通信端末では、話者によるオリジナルの言語であるオリジナル言語での音声の出力に続いて前記通信端末において選択された言語で通訳された音声が出力されるよう制御する、
情報処理システム。
【請求項4】
請求項1に記載の情報処理システムにおいて、
前記テキスト情報は、発信されたチャットの内容のテキスト情報か、受信されたチャットの内容のテキスト情報かを識別可能に前記表示画面に表示される、
情報処理システム。
【請求項5】
請求項1に記載の情報処理システムにおいて、
前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、
録音機能を有効、
文字起こし機能を無効、
を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報と音声を録音していることを示す波形グラフとが含まれるよう制御する、
情報処理システム。
【請求項6】
請求項1に記載の情報処理システムにおいて、
前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、
録音機能を有効、
文字起こし機能を有効、
を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報と音声の文字起こしの結果である文字情報とが含まれるよう制御する、
情報処理システム。
【請求項7】
請求項6に記載の情報処理システムにおいて、
前記文字情報は、発信された音声の文字起こしの結果である文字情報か、受信された音声の文字起こしの結果である文字情報かを識別可能に前記表示画面に表示される、
情報処理システム。
【請求項8】
請求項6に記載の情報処理システムにおいて、
前記設定情報には更に、
言語の情報である言語の情報が含まれ、
前記文字情報は、前記設定情報に含まれる言語の情報で示される言語に翻訳された文字情報である、
情報処理システム。
【請求項9】
請求項1に記載の情報処理システムにおいて、
前記設定情報には更に、
言語の情報である言語の情報が更に含まれ、
前記テキスト情報は、前記設定情報に含まれる言語の情報で示される言語に翻訳されたチャットの内容を示すテキスト情報である、
情報処理システム。
【請求項10】
請求項1に記載の情報処理システムにおいて、
前記他の通信端末は複数の通信端末であり、
前記他の複数の通信端末それぞれにおける設定情報に基づき前記
他の複数の通信端末それぞれの通信時における表示画面を変更するよう制御する、
情報処理システム。
【請求項11】
情報処理システムが実行する情報処理方法であって、
複数の通信端末のうちの1の通信端末から前記複数の通信端末のうちの前記1の通信端末以外の他の通信端末への通信を制御し、
前記他の通信端末における設定情報に基づき前記他の通信端末の通信時における表示画面を変更するよう制御し、
前記設定情報には、
録音機能を有効にするか否か、と、
文字起こし機能を有効にするか否か、と、
の情報が含まれ、
前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、
録音機能を無効、
文字起こし機能を無効、
を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報が含まれるよう制御する、
情報処理方法。
【請求項12】
プログラムであって、
コンピュータを、
請求項1から請求項10までの何れか1項に記載の情報処理システムとして機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
特許文献1には、1対多のグループ一斉音声通信を実現するシステムにおいて、情報の伝達ミスを低減可能な信号処理装置について開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
1対多、又は1対1の通信を行うシステムにおいて、システムを構成する装置ごとに複数の機能を有している場合がある。このような場合において装置ごとに複数の機能それぞれの設定が異なる場合がある。このような場合において各装置のユーザーインターフェースを適切に制御することが求められる。
【0005】
しかしながら、特許文献1では複数の機能それぞれの設定に応じた適切なユーザーインターフェースの制御についての開示はされていない。
【課題を解決するための手段】
【0006】
本発明の一態様によれば、情報処理システムであって、複数の通信端末のうちの1の通信端末から前記複数の通信端末のうちの前記1の通信端末以外の他の通信端末への通信を制御し、前記他の通信端末は1以上の通信端末であり、前記他の通信端末における設定情報に基づき前記他の通信端末の通信時における表示画面を変更するよう制御し、前記設定情報には、録音機能を有効にするか否か、と、文字起こし機能を有効にするか否か、との情報が含まれ、前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、録音機能を無効、文字起こし機能を無効を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報が含まれるよう制御する情報処理システムが提供される。
【0007】
また、本発明の他の態様によれば、前記情報処理システムにおいて、前記設定情報には更に、同時通訳設定を有効にするか否かの情報が含まれ、前記他の通信端末における前記設定情報に含まれる同時通訳設定を有効にするか否かの情報に応じて、前記他の通信端末における音声の出力を制御する情報処理システムが提供される。
【0008】
また、本発明の他の態様によれば、前記情報処理システムにおいて、同時通訳設定を有効にする情報を含む設定情報の通信端末では、話者によるオリジナルの言語であるオリジナル言語での音声の出力に続いて前記通信端末において選択された言語で通訳された音声が出力されるよう制御する情報処理システムが提供される。
【0009】
また、本発明の他の態様によれば、前記テキスト情報は、発信されたチャットの内容のテキスト情報か、受信されたチャットの内容のテキスト情報かを識別可能に前記表示画面に表示される情報処理システムが提供される。
【0010】
また、本発明の他の態様によれば、前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、録音機能を有効、文字起こし機能を無効、を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報と音声を録音していることを示す波形グラフとが含まれるよう制御する、情報処理システムが提供される。
【0011】
また、本発明の他の態様によれば、前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、録音機能を有効、文字起こし機能を有効、を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報と音声の文字起こしの結果である文字情報とが含まれるよう制御する、情報処理システムが提供される。
【0012】
また、本発明の他の態様によれば、前記文字情報は、発信された音声の文字起こしの結果である文字情報か、受信された音声の文字起こしの結果である文字情報かを識別可能に前記表示画面に表示される、情報処理システムが提供される。
【0013】
また、本発明の他の態様によれば、前記設定情報には更に、言語の情報である言語の情報が含まれ、前記文字情報は、前記設定情報に含まれる言語の情報で示される言語に翻訳された文字情報である、情報処理システムが提供される。
【0014】
また、本発明の他の態様によれば、前記設定情報には更に、言語の情報である言語の情報が更に含まれ、前記テキスト情報は、前記設定情報に含まれる言語の情報で示される言語に翻訳されたチャットの内容を示すテキスト情報である、情報処理システムが提供される。
【0015】
また、本発明の他の態様によれば、前記他の通信端末は複数の通信端末であり、前記他の複数の通信端末それぞれにおける設定情報に基づき前記他の複数の通信端末それぞれの通信時における表示画面を変更するよう制御する、情報処理システムが提供される。
【0016】
情報処理システムが実行する情報処理方法であって、複数の通信端末のうちの1の通信端末から前記複数の通信端末のうちの前記1の通信端末以外の他の通信端末への通信を制御し、前記他の通信端末における設定情報に基づき前記他の通信端末の通信時における表示画面を変更するよう制御し、前記設定情報には、録音機能を有効にするか否か、と、文字起こし機能を有効にするか否か、と、の情報が含まれ、前記1の通信端末のユーザーと通信中のユーザーの通信端末の前記設定情報が、録音機能を無効、文字起こし機能を無効、を示していた場合、前記通信中のユーザーの通信端末の表示画面にはチャットの内容を示すテキスト情報が含まれるよう制御する情報処理方法が提供される。
【0017】
また、本発明の他の態様によれば、コンピュータを、前記情報処理システムとして機能させるためのプログラムが提供される。
【発明の効果】
【0018】
本発明に係る情報システムにあっては、システムを構成する複数の装置それぞれにおける設定情報に基づき複数の装置それぞれにおいて適切な表示画面を表示させるよう制御することができる。
【図面の簡単な説明】
【0019】
【
図1】
図1は、本発明に係る情報処理システムのシステム構成の一例を示す図である。
【
図2】
図2は、本発明に係るサーバー装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、本発明に係る通話デバイスのハードウェア構成の一例を示す図である。
【
図4】
図4は、本発明に係る設定情報を設定する設定画面の一例を示す図である。
【
図5】
図5は、本発明に係る通話制御等に関する情報処理の一例を示すシーケンス図である。
【
図6】
図6は、本発明に係る発信者の通話デバイスの画面遷移の一例を示す図である。
【
図7】
図7は、本発明に係る受信者の通話デバイスの画面の一例を示す図(その1)である。
【
図8】
図8は、本発明に係る受信者の通話デバイスの画面の一例を示す図(その2)である。
【
図9】
図9は、本発明に係る受信者の通話デバイスの画面の一例を示す図(その3)である。
【
図10】
図10は、本発明に係る受信者の通話デバイスの画面の一例を示す図(その4)である。
【発明を実施するための形態】
【0020】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
【0021】
<実施形態1>
1.システム構成図
図1は、情報処理システム1000のシステム構成の一例を示す図である。
図1に示されるように、情報処理システム1000は、システム構成として、サーバー装置100と、複数の通話デバイス110と複数の基地局120と、を含む。
【0022】
通話デバイス110は基地局120を介してネットワーク150に接続される。サーバー装置100と複数の通話デバイス110とは基地局120及びネットワーク150を介して通信可能に接続される。同様に複数の通話デバイス110は基地局120及びネットワーク150を介してそれぞれ通信可能に接続される。
通話デバイス110は通信端末の一例である。
【0023】
サーバー装置100は、通話デバイス110同士がプッシュ・トゥ・トーク(Push to Talk)を行うための機能を提供するサーバーである。より具体的にはサーバー装置100は、実施形態1に示す1対多の通話デバイス110における通話の制御、及び、通話デバイス110それぞれの表示画面の制御等を行う。
【0024】
また後述するようにサーバー装置100は、発話者の音声を複数の言語に通訳し、通訳された音声を複数の通話デバイス110それぞれに送受信する。またサーバー装置100は、通話デバイス110において入力されたテキスト情報を複数の言語に翻訳し、翻訳されたテキスト情報を複数の通話デバイス110それぞれに送受信する。またサーバー装置100は、複数の通話デバイス110それぞれの画面の表示を制御する。
【0025】
実施形態1では通話デバイス110の画面表示及び画面遷移の制御は制御部210が行うものとして説明を行う。より具体的に説明すると、実施形態1ではサーバー装置100が通話デバイス110の画面を生成し、通話デバイス110に送信する。通話デバイス110はサーバー装置100より受信した画面を表示する。
【0026】
通話デバイス110は、ユーザーが使用するIP無線機である。IP無線機は携帯電話の電波を使用して、音声をパケットに変換し、データ通信を行う機器である。情報処理システム1000には複数の通話デバイス110が含まれ、異なる言語を母国語として使用するユーザーがそれぞれの通話デバイス110を使用するものとして説明を行う。複数のユーザーそれぞれは通話デバイス110を介して音声及びテキスト情報を用いてコミュニケーションを取る。
【0027】
特許請求の範囲に記載の情報処理システムは、複数の装置で構成されてもよいし、一つの装置で構成されてもよい。特許請求の範囲に記載の情報処理システムが一つの装置で構成される場合、その装置の一例はサーバー装置100である。特許請求の範囲に記載の情報処理システムが複数の装置で構成される場合、複数の装置の例は、実施形態1のサーバー装置100の複数の機能をそれぞれ割り当てた複数のサーバー装置、又はサーバー装置100及び複数の通話デバイス110の内の少なくとも1以上の通話デバイス110である。
2.ハードウェア構成
(1)サーバー装置100のハードウェア構成
【0028】
図2は、サーバー装置100のハードウェア構成の一例を示す図である。
図2に示されるように、サーバー装置100は、ハードウェア構成として、制御部210と、記憶部220と、通信部230と、を含む。
【0029】
制御部210は、CPU(Central Processing Unit)等であって、サーバー装置100の全体を制御する。
【0030】
記憶部220は、HDD(Hard Disk Drive)、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid Sate Drive)等の何れか、又はこれらの任意の組み合わせであって、プログラム、制御部210がプログラムに基づき処理を実行する際に利用するデータ(例えば、後述する設定情報、音声ファイル、文字起こしされたテキスト情報、翻訳されたテキスト情報)等を記憶する。
【0031】
記憶部220は、記憶媒体の一例である。なお、明細書では制御部210がプログラムに基づき処理を実行する際に利用するデータは記憶部220に記憶されるものとして説明するが、サーバー装置100と通信可能な他の装置の記憶部等に記憶されていてもよい。すなわち、データは、制御部210が参照可能であればどの装置の記憶部に記憶されていてもよい。
【0032】
制御部210が、記憶部220に記憶されているプログラムに基づき、処理を実行することによって、サーバー装置100の機能及び後述する
図5に示されるシーケンス図におけるサーバー装置100の処理等が実現される。
【0033】
通信部230は、サーバー装置100をネットワーク150に接続し、他の装置(複数の通話デバイス110)との通信を司る。
【0034】
(2)通話デバイス110のハードウェア構成
図3は、通話デバイス110のハードウェア構成の一例を示す図である。通話デバイス110は、ハードウェア構成として、制御部310と、記憶部320と、音声入力部330と、音声出力部340と、入出力部350と、通信部360と、を含む。
【0035】
制御部310は、CPU等であって、通話デバイス110の全体を制御する。記憶部320は、ROM、RAM、SSDの何れか、又はこれらの任意の組み合わせであって、プログラム、制御部310がプログラムに基づき処理を実行する際に利用するデータ等を記憶させる。制御部310が、記憶部320に記憶されているプログラムに基づき、処理を実行することによって、通話デバイス110の機能が実現される。記憶部320は、記憶媒体の一例である。
【0036】
音声入力部330は、マイク等であって操作者の音声を入力する。音声出力部340は、スピーカー等であって通信相手の音声を出力する。入出力部350は、タッチパネルディスプレイ等であって、ユーザー操作を制御部310に入力したり、制御部310の処理の結果等を表示したりする。
【0037】
通信部360は、通話デバイス110を、基地局120を介してネットワーク150に接続し、他の装置(例えば、サーバー装置100、他の通話デバイス110等)との通信を司る。
なお、以下では発信者の通話デバイス110を通話デバイス110A、受信者の通話デバイス110を通話デバイス110Bともいうが、共にハードウェア構成は
図3に示した構成と同様である。
【0038】
3.情報処理
(1)設定情報
ユーザーは自身の通話デバイス110を介して設定情報を設定する。通話デバイス110の画面を介して設定された設定情報は、通話デバイス110からサーバー装置100に送信され、サーバー装置100の記憶部220等において保持、管理される。
図4は、設定情報を設定する設定画面の一例を示す図である。
【0039】
ユーザーは、
図4に示されるような設定画面を介して設定情報を設定する。設定画面を介して設定情報が設定されると、通話デバイス110は、通話デバイス110を識別するPTT番号と、設定情報と、を関連付けてサーバー装置100に送信する。サーバー装置100は、通話デバイス110を識別するPTT番号と、設定情報と、を通話デバイス110より受信すると、PTT番号と関連付けて設定情報を記憶部220等に記憶する。
【0040】
図4に示されるように設定情報には録音、文字起こし(文字おこし)、同時通訳モード、言語の情報が含まれる。録音の情報には、録音機能がONかOFFかが設定される。ONは有効を示す。OFFは無効を示す。以下においても同様である。
【0041】
文字起こしの情報には、文字起こし機能がONかOFFかが設定される。同時通訳モードの情報には、同時通訳モードがONかOFFかが設定される。言語の情報には通訳及び翻訳の言語が設定される。ユーザーは、通話デバイス110の画面に提示される複数の言語から所望の言語を選択する。選択された言語の情報(例えば、日本語、タイ語、英語等)が設定情報に含まれる。
【0042】
録音がONの場合、通話デバイス110を介した会話がサーバー装置100において録音される。録音がOFFの場合、録音はされない。文字起こしがONの場合、通話デバイス110を介した会話が文字起こしされる。文字起こしがOFFの場合は、文字起こしはなされない。
【0043】
同時通訳モードがONの場合、通話デバイス110を介した会話が通訳され、通訳された音声が通話デバイス110から出力される。通訳は設定情報に含まれる言語の情報で示される言語でなされる。したがって同時通訳モードがONの場合、会話相手のオリジナル言語での音声の後、続けて通訳された音声が通話デバイス110から出力される。
【0044】
(2)シーケンス図
図5は、通話制御等に関する情報処理の一例を示すシーケンス図である。
図5において通話デバイス110Aは、発信者が使用する通話デバイス110である。通話デバイス110Bは、受信者が使用する通話デバイス110である。
図5の通話デバイス110Bの後の・・・は通話デバイス110Bが複数存在することを示している。
【0045】
なお、実施形態1では、制御部210が通話デバイス110の画面上の操作及び/又は設定情報等に基づき通話デバイス110に表示される画面を生成し、該当する通話デバイス110に送信するものとして説明を行う。制御部210が行うこのような処理は画面の表示制御の一例である。
【0046】
発信者は、通話デバイス110Aを操作し、通話相手となるグループを選択し、所定の操作を行う。するとコール要求が通話デバイス110Aからサーバー装置100に送信される。コール要求には、コールを識別するコールIDと選択されたグループに含まれる通話相手のPTT(Push to Talk)番号とが含まれる。PTT番号は個々の通話デバイス110を識別する情報である。発信者がグループを選択するとそのグループに含まれる通話相手のPTT番号が取得され、コール要求に含まれる。
【0047】
なお、発信者はグループを選択するのではなく、連絡先から複数の通話相手を選択するようにしてもよいし、通話履歴から複数の通話相手を選択するようにしてもよい。ただし、以下では説明の簡略化のため発信者は通話デバイス110Aの画面に表示されるグループのGUI部品を選択することで複数のグループを画面に表示させ、その中からグループを選択するものとして説明を行う。
【0048】
図6は、発信者の通話デバイス110Aの画面遷移の一例を示す図である。画面510は、ホーム画面、すなわち、通常時に表示されている画面である。発信者は画面510においてグループボタン511を選択すると、通話デバイス110Aの画面は画面510から画面520に遷移する。画面520はグループの選択画面である。
【0049】
発信者が画面520においてグループを選択(
図6の例ではグループAを選択)すると、通話デバイス110Aの画面は画面520から画面530に遷移する。画面530は、選択されたグループに含まれるメンバーの一覧を含む画面である。メンバーが多く、一画面で収まらない場合はスクロールバーが表示される。発信者はスクロールバーを操作することによって一画面に収まらないメンバーを確認することができる。
【0050】
PTTボタン531は発信者が会話をする際に選択する(又は押下する)ボタンである。発信者が会話をする間はPTTボタン531が選択し続けられる。発信者の音声通話が終了した後は、グループに含まれる他のメンバーが自身の通話デバイス110に表示されているPTTボタンを選択し、音声通話を行う。
【0051】
画面520でグループが選択され、画面530でPTTボタン531が選択されると、シーケンスSQ401において、通話デバイス110Aの制御部310は、コール要求をサーバー装置100に送信する。なお、コール要求にはコール要求を送信した発信者のPTT番号も含まれる。サーバー装置100の制御部210は、通話デバイス110Aよりコール要求を受信する。
【0052】
コール要求を受信すると、シーケンスSQ402において、制御部210は、コール要求に含まれる発信者のPTT番号に基づき発信者を特定する。また制御部210は、コール要求に含まれる通話相手(すなわち受信者)の複数のPTT番号に基づき複数の受信者を特定する。
【0053】
シーケンスSQ403において、制御部210は、コール要求に含まれる発信者のPTT番号に基づき発信者の設定情報を特定し、取得する。また制御部210は、コール要求に含まれる受信者の複数のPTT番号に基づき複数の受信者それぞれの設定情報を特定し、取得する。
【0054】
シーケンスSQ404において、制御部210は、コール制御を実行する。より具体的に説明すると、制御部210は、複数の受信者それぞれのPTT番号に基づきそれぞれのPTT番号の通話デバイス110のトークンを取得する。トークンはそれぞれの通話デバイス110を識別する情報である。
【0055】
シーケンスSQ405において、制御部210は、それぞれのトークンを用いてそれぞれの通話デバイス110に対してPTTの呼び出しであるコール情報を送信する。
なお、本実施形態では説明の簡略化のためサーバー装置100が複数の機能を提供するように説明を行う。ただし、複数のサーバー装置それぞれが実施形態1のサーバー装置100が提供する複数の機能のそれぞれを分担し、実行するようにしてもよい。
【0056】
通話デバイス100が、コール情報を受信すると、制御部310は、音声出力部340を介して呼び出し音を出力する。呼び出し音を聞いたユーザーは、入出力部350に表示されている画面においてコールに出るマークを選択する等の所定の操作を行う。入出力部350に表示されている画面を介して所定の操作を受け付けると、シーケンスSQ406において、制御部310は、コールに参加し、コールに参加したことを示す情報をサーバー装置100に送信する。
【0057】
コールに参加したことを示す情報を受信すると、シーケンスSQ407において、サーバ装置100の制御部210は、通話デバイス110Aとコールに参加したことを示す情報を送信した通話デバイス110Bとの通信(例えば、音声データの送受信、テキスト情報の送受信、画面の表示等)を制御する。
【0058】
例えば、制御部210は、複数の通話デバイスのうちの1の通話デバイス(例えば通話デバイス110A)から複数の通話デイバスのうちの1の通話デバイス以外の他の複数の通話デバイス(例えば複数の通話デバイス110B)への1対多の通信を制御する。
【0059】
図6の画面540は、発信者の通話中の画面の一例を示している。画面540ではグループ内で誰が喋っていて誰が聞いているかが示されている。また
図6の画面550は、通話中の画面の一例を示している。グループ内の1ユーザーでも同時通訳モードがONになっていた場合、グループ内の全ユーザーの画面に通訳中であることを示すステータス551が表示される。チャットアイコン552が選択されると、通話デバイス110Aの画面は画面550から画面560に遷移する。画面560は詳細表示画面の一例を示している。
【0060】
シーケンスSQ408において、制御部210は、グループに含まれるユーザーそれぞれの設定情報に基づき、通話の音声のデータを記憶部220等に記憶する。例えば、グループに含まれるユーザーのうち一人でも設定情報の録音の情報にONが設定されていた場合、そのグループの通話の音声のデータは記憶部220等に記憶される。
【0061】
シーケンスSQ409において、制御部210は、グループに含まれるユーザーそれぞれの設定情報に基づき、記録された音声のデータを文字起こしする。より具体的に説明すると、グループに含まれるユーザーのうち一人でも設定情報の文字起こしの情報にONが設定されていた場合、そのグループの通話の音声のデータに基づき通話の内容を文字起こしする。
【0062】
文字起こしとは音声データに基づき会話の内容を文章化することである。例えば、記録された音声のデータが英語の音声データであった場合、英語で文字起こしがなされる。記録された音声のデータが日本語の音声データであった場合、日本語で文字起こしがなされる。その後、制御部210は、文字起こしの情報がONであった設定情報の言語の情報に基づき、文字起こしされた文章を言語の情報で示される言語に翻訳する。制御部210は、文字起こしし、翻訳したデータを記憶部220等に記憶する。
【0063】
シーケンスSQ410において、制御部210は、グループに含まれるユーザーそれぞれの設定情報に基づき、文字起こしされた文章を音声データに変換する。文字起こしされた文章が日本語の場合、日本語の音声データに変換される。文字起こしされた文章がタイ語の場合、タイ語の音声データに変換される。
【0064】
シーケンスSQ411において、制御部210は、変換した音声データを通訳の音声としてグループのうち、該当する通話デバイス110Bに送信する。その結果、設定情報が同時通訳モードONの通話デバイス110Bではオリジナル言語の音声が出力された後、続いて、設定された言語で通訳された音声が出力される。この処理は、他の複数の通話デバイスそれぞれにおける設定情報に含まれる同時通訳設定を有効にするか否かの情報に応じて、他の複数の通話デバイスそれぞれにおける音声の出力を制御する処理の一例である。またこの処理は、同時通訳設定を有効にする情報を含む設定情報の通話デバイスでは、話者によるオリジナルの言語であるオリジナル言語での音声の出力に続いて通話デバイスにおいて選択された言語で翻訳された音声が出力されるよう制御する処理の一例でもある。
【0065】
(3)表示画面の制御
制御部210は、複数の通話デバイス110Bそれぞれにおける設定情報に基づき複数の通話デバイス110Bそれぞれの通話時における表示画面の表示を制御する。この処理は、他の複数の通話デバイスそれぞれにおける設定情報に基づき他の複数の通話デバイスそれぞれの通信時における表示画面を変更するよう制御する処理の一例である。
【0066】
以下、受信者側の画面を用いて制御部210による画面表示の制御について説明する。
図7は、受信者の通話デバイスの画面の一例を示す図(その1)である。
図7の画面600は、設定情報として、録音がOFF、文字起こしがOFF、同時通訳モードがOFFの受信側の画面の一例である。音声は、発信者のオリジナル言語で聞こえる。録音OFFのため、グループ内のユーザーによるチャットテキスト610以外は表示されていない。
【0067】
制御部210が
図7に示すような画面が表示されるように制御することは、1の通話デバイスのユーザーと通信中のユーザーの通話デバイスの設定情報が、録音機能を無効、文字起こし機能を無効、を示していた場合、通信中のユーザーの通話デバイスの表示画面にはチャットの内容を示すテキスト情報が含まれるよう制御する処理の一例である。テキスト情報は、設定情報に含まれる言語の情報で示される言語に翻訳されたチャットの内容を示すテキスト情報である。
【0068】
図8は、受信者の通話デバイスの画面の一例を示す図(その2)である。
図8の画面700は、設定情報として、録音がON、文字起こしがOFF、同時通訳モードがOFFの受信側の画面の一例である。音声は、発信者のオリジナル言語で聞こえる。録音ONのため音声を示す波形グラフ710が表示され、チャットテキスト720も表示されている。
【0069】
波形グラフ710の背景画像730は、受信者による音声の波形グラフ710であることを示している。波形グラフの背景画像740は、発信者による音声の波形グラフであることを示している。チャットテキスト720の背景画像750は、チャットテキストが受信されたチャットテキストであることを示している。すなわち、制御部210は、背景画像によって音声の波形グラフが発信者による音声か、受信者による音声かを識別可能に画面に表示するようにしている。
【0070】
同様に、制御部210は、背景画像によってチャットテキストが発信者によるチャットの内容か、受信者によるチャットの内容かを識別可能に画面に表示するようにしている。これは、テキスト情報が、発信されたチャットの内容のテキスト情報か、受信されたチャットの内容のテキスト情報かを識別可能に表示画面に表示されている一例である。
【0071】
なお、制御部210は、背景画像の色によって発信者によるものか受信者によるものかを識別可能にしてもよいし、背景画像の模様、又は形等によって発信者によるものか受信者によるものかを識別可能にしてもよい。また、制御部210は、背景画像に限られず、波形グラフそのものの色、チャットテキストの文字列の色等によって発信者によるものか受信者によるものかを識別するようにしてもよい。すなわち、波形グラフやチャットテキストが発信者によるものか受信者によるものかを識別することができればどのような態様で波形グラフやチャットテキストを表示するようにしてもよい。
【0072】
制御部210が
図8に示すような画面が表示されるように制御することは、1の通話デバイスのユーザーと通信中のユーザーの通話デバイスの設定情報が、録音機能を有効、文字起こし機能を無効、を示していた場合、通信中のユーザーの通話デバイスの表示画面にはチャットの内容を示すテキスト情報と音声を録音していることを示す波形グラフとが含まれるよう制御する処理の一例である。
【0073】
図9は、受信者の通話デバイスの画面の一例を示す図(その3)である。
図9の画面800は、設定情報として、録音ON、文字起こしON、同時通訳モードOFF、言語の情報が日本語の受信側の画面の一例である。音声は、発信者のオリジナル言語で聞こえる。文字起こしONのため言語の情報で設定された言語(
図9の例では日本語)に翻訳された文字列810が表示される。
【0074】
録音ONのため音声を示す波形グラフが表示され、チャットテキストも表示されている。チャットテキストも言語の情報で設定された言語(
図9の例では日本語)に翻訳された文字列820が表示される。制御部210は、背景画像によって翻訳された文字列が発信者による音声の文字起こしされたものか、受信者による音声の文字起こしされたものかを識別可能に画面に表示する。これは、文字情報が、発信された音声の文字起こしの結果である文字情報か、受信された音声の文字起こしの結果である文字情報かを識別可能に表示画面に表示されている一例である。
【0075】
制御部210が
図9に示すような画面が表示されるように制御することは、1の通話デバイスのユーザーと通信中のユーザーの通話デバイスの設定情報が、録音機能を有効、文字起こし機能を有効、を示していた場合、通信中のユーザーの通話デバイスの表示画面にはチャットの内容を示すテキスト情報と音声の文字起こしの結果である文字情報とが含まれるよう制御する処理の一例である。文字情報は、設定情報に含まれる言語の情報で示される言語に翻訳された文字情報である。
【0076】
なお、設定情報として、録音ON、文字起こしON、同時通訳モードON、言語の情報が日本語の場合も通話デバイス110Bの画面例は
図9と同様となる。ただし、この場合、オリジナル言語に続いて設定された言語(
図9の例では日本語)に通訳された音声が通話デバイス110Bから出力される。
【0077】
図10は、受信者の通話デバイスの画面の一例を示す図(その4)である。
図10の画面900は、設定情報として、録音ON、文字起こしON、同時通訳モードOFF、言語の情報がタイ語の受信側の画面の一例である。音声は、発信者のオリジナル言語で聞こえる。
【0078】
文字起こしONのため言語の情報で設定された言語(
図10の例ではタイ語)に翻訳された文字列910が表示される。録音ONのため音声を示す波形グラフが表示され、チャットテキストも表示されている。チャットテキストも言語の情報で設定された言語(
図10の例ではタイ語)に翻訳された文字列920が表示される。
【0079】
なお、設定情報として、録音ON、文字起こしON、同時通訳モードON、言語の情報がタイ語の場合も通話デバイス110Bの画面例は
図10と同様となる。ただし、この場合、オリジナル言語に続いて設定された言語(
図10の例ではタイ語)に通訳された音声が通話デバイス110Bから出力される。
【0080】
以上、実施形態1によれば、複数の通話デバイス110Bそれぞれにおける設定情報に基づき複数の通話デバイス110Bそれぞれにおいて適切な表示画面を表示させるよう制御することができる。
制御部210による通話デバイス110Aの表示画面の制御も通話デバイス110Bの表示画面の制御と同様である。制御部210は、通話デバイス110Aの設定情報に基づき通話デバイス110Aの表示画面の制御を行う。
【0081】
(変形例1)
実施形態1の変形例1を説明する。変形例1では実施形態1と異なる点について主に説明を行う。
実施形態1では、サーバー装置100の制御部210が通話デバイス110の画面を生成し、通話デバイス110に送信するよう説明を行った。
【0082】
しかし、これに限定されず、制御部210は設定情報や通話デバイス110の画面を介した操作等に基づいて画面に必要なデータを用意し、制御部210は用意したデータを適宜該当する通話デバイス110に送信するようにしてもよい。そして通話デバイス110はサーバー装置100より受信したデータに基づき画面を生成し、表示するようにしてもよい。
変形例1によれば、実施形態1と同様の効果を奏することができる。
【0083】
(変形例2)
実施形態1の変形例2を説明する。変形例2では実施形態1と異なる点について主に説明を行う。
実施形態1では制御部210による通話デバイス110Aと複数の通話デバイス110Bとの通信、すなわち、1対多の通信、を例に説明を行った。
【0084】
しかし、これに限定されず、制御部210による通話デバイス110A対通話デバイス110Bの通信、すなわち、1対1の通信においても同様である。このような態様においても、制御部210は、通話デバイス110Aの設定情報に基づき通話デバイス110Aの表示画面の制御を行うと共に、通話デバイス110Bの設定情報に基づき通話デバイス110Bの表示画面の制御を行う。
【0085】
変形例2によれば、通話デバイス110A及び通話デバイス110Bそれぞれにおける設定情報に基づき通話デバイス110A及び通話デバイス110Bそれぞれにおいて適切な表示画面を表示させるよう制御することができる。
【0086】
(その他の変形例)
実施形態1のその他の変形例を説明する。その他の変形例においても実施形態1と異なる点について主に説明を行う。
実施形態1のサーバー装置100による処理の一部を複数の通話デバイス110それぞれが実行するようにしてもよい。
また実施形態1では通話デバイス110間の通信としてIP無線を例に説明を行ったがこれらに限定されるものではない。通話デバイス110間及び通話デバイス110とサーバー装置100との間で通信することができればどのような通信規格であってもよい。
【0087】
また通話デバイス110もIP電話機のようなものに限られず、タブレット型コンピュータのようなものであってもよい。デバイス間で通話やテキスト情報のやり取り等することができればどのようなデバイスであってもよい。またデバイスは携帯可能なものであってもよいし、窓口等、所定の場所に据え置き可能なものであってもよい。
【0088】
最後に、本開示に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。実施形態やその変形例は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。実施形態1と上述した各変形例とは任意に組み合わせることができる。
【符号の説明】
【0089】
100 :サーバー装置
110 :通話デバイス
120 :基地局
150 :ネットワーク
210 :制御部
220 :記憶部
230 :通信部
【要約】
本発明の一態様によれば、情報処理システムが提供される。この情報処理システムは、複数の通信端末のうちの1の通信端末から複数の通信端末のうちの1の通信端末以外の他の通信端末への通信を制御する。他の通信端末における設定情報に基づき他の通信端末の通信時における表示画面を変更するよう制御する。設定情報には、録音機能を有効にするか否か、と、文字起こし機能を有効にするか否か、と、の情報が含まれる。
【選択図】
図1