IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社BRIDGE MULTILINGUAL SOLUTIONSの特許一覧

<>
  • 特許-自動通訳システム及びプログラム 図1
  • 特許-自動通訳システム及びプログラム 図2
  • 特許-自動通訳システム及びプログラム 図3
  • 特許-自動通訳システム及びプログラム 図4
  • 特許-自動通訳システム及びプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-06-24
(45)【発行日】2024-07-02
(54)【発明の名称】自動通訳システム及びプログラム
(51)【国際特許分類】
   H04M 3/42 20060101AFI20240625BHJP
   G06F 40/58 20200101ALI20240625BHJP
   G10L 15/00 20130101ALI20240625BHJP
   G10L 13/00 20060101ALI20240625BHJP
   G06F 3/16 20060101ALI20240625BHJP
   G06Q 50/10 20120101ALI20240625BHJP
【FI】
H04M3/42 P
G06F40/58
G10L15/00 200C
G10L13/00 100G
G06F3/16 650
G06Q50/10
【請求項の数】 6
(21)【出願番号】P 2024004192
(22)【出願日】2024-01-15
【審査請求日】2024-01-17
【早期審査対象出願】
(73)【特許権者】
【識別番号】512192978
【氏名又は名称】株式会社BRIDGE MULTILINGUAL SOLUTIONS
(74)【代理人】
【識別番号】100108006
【弁理士】
【氏名又は名称】松下 昌弘
(72)【発明者】
【氏名】吉川 健一
【審査官】石井 則之
(56)【参考文献】
【文献】特開平09-065424(JP,A)
【文献】特開2021-128632(JP,A)
【文献】特開2011-125006(JP,A)
【文献】特開2014-161017(JP,A)
【文献】特開2002-223299(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04M 3/42
G06F 40/58
G10L 15/00
G10L 13/00
G06F 3/16
G06Q 50/10
(57)【特許請求の範囲】
【請求項1】
発話者による第1の言語の第1の音声を通訳者が第2の言語に通訳した第2の音声を入力する入力部と、
前記入力部が入力した前記第2の音声を相互に異なる複数の第3の言語の第3の音声に通訳する自動通訳部と、
前記第1の音声と前記第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する送信部と
を有し
記入力部は、前記第1の音声を異なる複数の前記第2の言語に通訳した複数の前記第2の音声を入力し、
前記送信部は、前記第1の音声と前記複数の第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する
自動通訳システム。
【請求項2】
前記自動通訳部は、
前記複数の第2の音声のそれぞれについて、当該第2の音声を前記複数の第3の言語の前記第3の音声に通訳し、
前記複数の第3の音声を、それぞれ前記第2の言語に逆通訳した第4の音声を生成し、
前記異なる前記第2の言語に対応した複数の前記第の4音声と当該第2の音声との一致度を検出し、前記異なる第2の言語に逆通訳した前記複数の第3の音声のうち、前記一致度が高い前記第3の音声を選択して前記送信部に送信させる
請求項1に記載の自動通訳システム。
【請求項3】
前記自動通訳部は、
前記異なる複数の第3の言語の前記選択した前記第3の音声について、前記一致度が高い前記第3の音声を前記受信先が特定可能な通訳精度情報を生成し、
前記送信部は、前記通訳精度情報を前記第3の音声と関連付けて前記受信先に送信する
請求項2に記載の自動通訳システム。
【請求項4】
発話者による第1の言語の第1の音声を通訳者が第2の言語に通訳した第2の音声を入力する入力工程と、
前記入力工程が入力した前記第2の音声を相互に異なる複数の第3の言語の第3の音声に通訳する自動通訳工程と、
前記第1の音声と前記第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する送信工程と
をコンピュータに実行させるプログラムであって、
前記入力工程は、前記第1の音声を異なる複数の前記第2の言語に通訳した複数の前記第2の音声を入力し、
前記送信工程は、前記第1の音声と前記複数の第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する
プログラム。
【請求項5】
前記自動通訳工程は、
前記複数の第2の音声のそれぞれについて、当該第2の音声を前記複数の第3の言語の前記第3の音声に通訳し、
前記複数の第3の音声を、それぞれ前記第2の言語に逆通訳した第4の音声を生成し、
前記異なる前記第2の言語に対応した複数の前記第の4音声と当該第2の音声との一致度を検出し、前記異なる第2の言語に逆通訳した前記複数の第3の音声のうち、前記一致度が高い前記第3の音声を選択して前記送信工程に送信させる
請求項4に記載のプログラム。
【請求項6】
前記自動通訳工程は、
前記異なる複数の第3の言語の前記選択した前記第3の音声について、前記一致度が高い前記第3の音声を前記受信先が特定可能な通訳精度情報を生成し、
前記送信工程は、前記通訳精度情報を前記第3の音声と関連付けて前記受信先に送信する
請求項5に記載のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発話者の音声を複数の言語に通訳する自動通訳システム及びプログラムに関するものである。
【背景技術】
【0002】
例えば、国際会議等の分野で、 会場での講演者の音声を複数の言語に通訳する場合がある。
従来では、複数の言語のそれぞれに対応可能な複数の通訳者をアレンジし、各通訳者が発話者の音声を担当する言語に通訳し、視聴者が言語を選択して視聴している。
【先行技術文献】
【特許文献】
【0003】
【文献】国際公開WO2020/070959号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、マイナーな言語は通訳者の確保が難しく、多くの言語に対応する通訳者を確保すると高価格化するという問題がある。
【0005】
本発明はかかる事情に鑑みてなされたものであり、その目的は、多言語への通訳を高精度かつ低価格で提供できる自動通訳システム及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明は、発話者による第1の言語の第1の音声を通訳者が第2の言語に通訳した第2の音声を入力する入力部と、前記入力部が入力した前記第2の音声を相互に異なる複数の第3の言語の第3の音声に通訳する自動通訳部と、前記第1の音声と前記第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する送信部とを有する自動通訳システムである。
【0007】
好適には、前記入力部は、前記第1の音声を異なる複数の前記第2の言語に通訳した複数の前記第2の音声を入力し、前記送信部は、前記第1の音声と前記複数の第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する。
【0008】
好適には、前記自動通訳部は、前記複数の第2の音声のそれぞれについて、当該第2の音声を前記複数の第3の言語の前記第3の音声に通訳し、前記複数の第3の音声を、それぞれ前記第2の言語に逆通訳した第4の音声を生成し、前記異なる前記第2の言語に対応した複数の前記第の4音声と当該第2の音声との一致度を検出し、前記異なる第2の言語に逆通訳した前記複数の第3の音声のうち、前記一致度が高い前記第3の音声を選択して前記送信部に送信させる。
【0009】
好適には、前記自動通訳部は、前記異なる複数の第3の言語の前記選択した前記第3の音声について、前記一致度が高い前記第3の音声を前記受信先が特定可能な通訳精度情報を生成し、前記送信部は、前記通訳精度情報を前記第3の音声と関連付けて前記受信先に送信する。
【0010】
本発明は、発話者による第1の言語の第1の音声を通訳者が第2の言語に通訳した第2の音声を入力する入力部と、前記入力部が入力した前記第1の音声を相互に異なる複数の第3の言語の第3の音声に通訳する自動通訳部と、前記第1の音声と前記第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する送信部とを有する自動通訳システムである。
【0011】
本発明は、発話者による第1の言語の第1の音声を通訳者が第2の言語に通訳した第2の音声を入力する入力工程と、前記入力工程が入力した前記第2の音声を相互に異なる複数の第3の言語の第3の音声に通訳する自動通訳工程と、前記第1の音声と前記第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する送信工程とをコンピュータに実行させるプログラムである。
【0012】
本発明は、発話者による第1の言語の第1の音声を通訳者が第2の言語に通訳した第2の音声を入力する入力工程と、前記入力工程が入力した前記第1の音声を相互に異なる複数の第3の言語の第3の音声に通訳する自動通訳工程と、前記第1の音声と前記第2の音声と前記複数の第3の音声とを、受信先が言語を選択して出力可能な形式で関連付けて前記受信先に送信する送信工程とをコンピュータに実行させるプログラムである。
【発明の効果】
【0013】
本発明によれば、多言語への通訳を高精度かつ低価格で提供できる自動通訳システム及びプログラムを提供するができる。
【図面の簡単な説明】
【0014】
図1図1は、本発明の第1実施形態に係る通訳ビジネスモデル1を説明するための図である。
図2図2は、図1に示す通訳ビジネスモデル1で用いられるシステムを説明するための図である。
図3図3は、図1に示す自動通訳システム11の機能ブロック図である。
図4図4は、図1に示す通訳ビジネスモデル1の処理の流れを説明するためのフローチャート図である。
図5図5は、本発明の第2実施形態に係る通訳ビジネスモデル1を説明するための図である。
【発明を実施するための形態】
【0015】
以下、本発明の実施形態に係る通訳ビジネスモデルについて説明する。
<第1実施形態>
図1は、本発明の第1実施形態に係る通訳ビジネスモデル1を説明するための図である。
図2は、図1に示す通訳ビジネスモデル1で用いられるシステムを説明するための図である。
図1に示すように、通訳ビジネスモデル1は、例えば、講演者等の発話者5、第1の通訳者31、第2の通訳者32、受信者29によって利用される。受信者29は単数又はふ複数である。
【0016】
本実施形態では、自動通訳システム11は、発話者5の第1の言語の第1の音声105を、相互に異なる複数の第3の言語71~75の第3の音声81~85に自動通訳する処理を行う。
第1の言語は例えば英語である。第2の言語は例えば中国語である。
第3の言語71~75は、例えば、韓国語、タイ語、ベトナム語、スペイン語、ポルトガル語である。
【0017】
発話者5は、マイクあるいは端末装置を用いて発話の第1の音声105を自動通訳システム11に送信する。
第1の通訳者31は、第1の端末装置41を使用する。
第1の端末装置41は、自動通訳システム11から第1の音声105を入力して第1の通訳者31に出力する。
また、第1の端末装置41は、第1の通訳者31が第1の音声105を第2の言語51に通訳した第2の音声61を自動通訳システム11に送信する。
【0018】
第2の通訳者32は、第2の端末装置42を使用する。
第2の端末装置42は、自動通訳システム11から第1の音声105を入力して第2の通訳者32に出力する。
また、第2の端末装置42は、第2の通訳者32が第1の音声105を第2の言語52に通訳した第2の音声62を自動通訳システム11に送信する。
【0019】
自動通訳システム11は、自動通訳部15及び送信部33を有している。
自動通訳部15は、第1の言語の第1の音声105を、相互に異なる複数の第3の言語71~75の第3の音声81~85に通訳(翻訳)する処理を行う。
送信部33は、第1の音声と、第2の音声61,62と、複数の第3の音声81~85とを、受信者29の端末装置19が言語を選択して出力可能な形式で関連付けて多言語音声99として送信する。
【0020】
受信者29は、端末装置19を使用する。
端末装置19は、自動通訳システム11から多言語音声99を受信する。
【0021】
図3は、図1に示す自動通訳システム11の機能ブロック図である。
図3に示すように、自動通訳システム11は、例えば、ディスプレイ51,操作部53,通信部55、メモリ59及び処理部61を有する。
【0022】
ディスプレイ51は、処理部61からの信号に基づいた画像を表示する。
操作部53は、タッチパネル、キーボードやマウス等の操作手段である。
通信部55は、発話者5の端末装置、第1の端末装置41、第2の端末装置42、端末装置19等の通信を行う。
入力部57は、外部からデータを入力する端子等である。
メモリ59は、処理部61が実行するプログラムを記憶する。
処理部61は、メモリ59に記憶されたプログラムPRG1(本実施形態のプログラム)を実行して、本実施形態で規定する自動通訳システム11の処理を行う。
処理部61は、自動通訳部15及び送信部33の機能を実現する。
【0023】
図4は、図1に示す通訳ビジネスモデル1の処理の流れを説明するためのフローチャート図である。
各ステップについて説明する。
ステップST11:
発話者5の第1の言語の第1の音声105が、マイクや端末装置を介して、自動通訳システム11に入力される。
自動通訳システム11は、当該入力した第1の音声105をスピーカ13に出力する。
【0024】
ステップST12:
自動通訳システム11は、発話者5の第1の音声105を第1の通訳者31の第1の端末装置41と、第2の通訳者32の第2の端末装置42と、自動通訳部31に送信する。
【0025】
ステップST13:
第1の端末装置41は、自動通訳システム11から受信した第1の音声を第1の通訳者31に出力する。
第2の端末装置42は、自動通訳システム11から受信した第1の音声を第2の通訳者32に出力する。
【0026】
ステップST14:
第1の端末装置41に、第1の通訳者31が通訳した第2の言語131の第2の音声61が入力される。
第2の端末装置42に、第2の通訳者32が通訳した第2の言語132の第2の音声62が入力される。
自動通訳システム11の自動通訳部15は、第1の言語の第1の音声105を、相互に異なる複数の第3の言語71~75の第3の音声81~85に通訳する処理を行う。
【0027】
ステップST15:
自動通訳システム11の送信部33は、第1の音声と、第2の音声61,62と、複数の第3の音声81~85とを、受信者29の端末装置19が言語を選択して出力可能な形式で関連付けて多言語音声99として送信する。
【0028】
ステップST16:
端末装置19は、多言語音声99から受信者29が指定した言語の音声を選択して出力する。
【0029】
以上説明したように、通訳ビジネスモデル1によれば、第1の通訳者31及び第2の通訳者32が通訳できない他の言語への通訳を、自動通訳部15を用いることで自動的に行うことができる。そのため、多くの言語に対応した通訳サービスを提供できる。
本実施形態によれば、多言語への通訳を高精度かつ低価格で提供できる。
【0030】
<第2実施形態>
図5は、本発明の第2実施形態に係る通訳ビジネスモデル1を説明するための図である。
図5に示すように、通訳ビジネスモデル1は、第1実施形態と同様に、例えば、講演者等の発話者5、第1の通訳者31、第2の通訳者32、受信者29によって利用される。
【0031】
以下、第2実施形態の通訳ビジネスモデル1を第1実施形態との相違点を中心に説明する。
図5に示す自動通訳システム11は、第1実施形態で説明したもの自動通訳部15の処理以外は同じである。
本実施形態では、自動通訳部15は、発話者5の第1の音声105ではなく、第1の通訳者31が通訳した第2の音声61を第1の端末装置41から入力する。
【0032】
自動通訳部15は、第2の音声61を、相互に異なる複数の第3の言語71~75の第3の音声81~85に通訳する処理を行う。
【0033】
本実施形態では、第2の音声61が英語等の汎用性が高い言語である場合に、第2の音声61から第3の言語71~75への豊富な通訳ソフトを用いることができる。これより通訳精度も向上できる。
【0034】
<第3実施形態>
図6は、本発明の第3実施形態に係る通訳ビジネスモデル1を説明するためのフローチャート図である。
以下、第3実施形態の通訳ビジネスモデル1を第1実施形態との相違点を中心に説明する。
自動通訳部15は、第1の端末装置41からの第2の言語131の第2の音声61を、相互に異なる複数の第3の言語71~75の第3の音声81~85に通訳する処理を行う。
また、自動通訳部15は、第2の端末装置42からの第2の言語132の第2の音声62を、上述した相互に異なる複数の第3の言語71~75の第3の音声181~185に通訳する処理を行う。
【0035】
自動通訳部15は、第3の音声81~85を、それぞれ第2の言語131に逆通訳して第4の多言語音声99~95に通訳する処理を行う。
自動通訳部15は、第3の音声181~185を、それぞれ第2の言語132に逆通訳して第4の音声191~195に通訳する処理を行う。
【0036】
自動通訳部15は、第2の音声61と第4の多言語音声99~95との一致度を生成する。
自動通訳部15は、第2の音声62と第4の音声191~195との一致度を生成する。
自動通訳部15は、第3の言語71~75の各々について、第3の音声81~85及び第3の音声181~185の2つの第3の音声5のうち一致度が高い方の第3の音声を選択して送信するように処理する。
【0037】
これにより、2つの第2の言語131,132のうち、第3の言語71~75の第3の音声81~85への通訳精度の高い方を選択でき、高精度な通訳が可能となる。
【0038】
<第4実施形態>
本実施形態では、第3の実施形態に、さらに以下の機能が追加されている。
自動通訳部15は、異なる複数の第3の言語71~75の選択した前記第3の音声について、前述した一致度が高い第3の音声を受信先が特定可能な通訳精度情報を生成する。
送信部33は、通訳精度情報を第3の音声と関連付けて端末装置19に送信する。
【0039】
これにより、異なる複数の第3の言語71~75の通訳精度を受信者29が把握でき、複数言語の理解可能な受信者29が精度の高い通訳音声を選択することができる。
【0040】
本発明は上述した実施形態には限定されない。
すなわち、当業者は、本発明の技術的範囲またはその均等の範囲内において、上述した実施形態の構成要素に関し、様々な変更、コンビネーション、サブコンビネーション、並びに代替を行ってもよい。
例えば、第2、第3の言語の数は任意である。また、通訳者の数も任意である。
【産業上の利用可能性】
【0041】
本発明は、多言語に通訳する自動通訳システムに適用可能である。
【符号の説明】
【0042】
1…通訳ビジネスモデル
11…自動通訳システム
19…受信者の端末装置
41…第1の端末装置
42…第2の端末装置
61…第2の音声
62…第2の音声
81~85…第3の音声
99…多言語音声
105…第1の音声




【要約】
【課題】 多言語への通訳を高精度かつ低価格で提供できる自動通訳システムを提供する。
【解決手段】 第1の端末装置41に第1の通訳者31が通訳した第2の言語131の第2の音声61が入力される。第2の端末装置42に第2の通訳者32が通訳した第2の言語132の第2の音声62が入力される。 自動通訳システム11の自動通訳部15は、第1の言語の第1の音声105を相互に異なる複数の第3の言語71~75の第3の音声81~85に通訳する処理を行う。送信部33は、第1の音声と第2の音声61,62と複数の第3の音声81~85とを、受信者29の端末装置19が言語を選択して出力可能な形式で関連付けて多言語音声99として送信する。
【選択図】図1

図1
図2
図3
図4
図5