IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日本レカムの特許一覧 ▶ 株式会社キャンバスの特許一覧 ▶ 株式会社ハルタの特許一覧 ▶ 徳武 睦裕の特許一覧 ▶ 株式会社ファイブキャピタルの特許一覧 ▶ 勝田 欽治の特許一覧 ▶ 清 隼人の特許一覧

特許7347990音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システム
<>
  • 特許-音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システム 図1
  • 特許-音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システム 図2
  • 特許-音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-11
(45)【発行日】2023-09-20
(54)【発明の名称】音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システム
(51)【国際特許分類】
   G10L 15/22 20060101AFI20230912BHJP
   G10L 15/00 20130101ALI20230912BHJP
   G10L 15/06 20130101ALI20230912BHJP
   G06F 3/16 20060101ALI20230912BHJP
   G06F 40/58 20200101ALI20230912BHJP
【FI】
G10L15/22 200H
G10L15/00 200C
G10L15/06 300E
G06F3/16 650
G06F3/16 660
G06F40/58
【請求項の数】 5
(21)【出願番号】P 2019149223
(22)【出願日】2019-08-16
(65)【公開番号】P2021032921
(43)【公開日】2021-03-01
【審査請求日】2022-08-09
(73)【特許権者】
【識別番号】519183461
【氏名又は名称】株式会社日本レカム
(73)【特許権者】
【識別番号】521335719
【氏名又は名称】株式会社キャンバス
(73)【特許権者】
【識別番号】521335731
【氏名又は名称】株式会社ハルタ
(73)【特許権者】
【識別番号】521336989
【氏名又は名称】徳武 睦裕
(73)【特許権者】
【識別番号】521336990
【氏名又は名称】株式会社ファイブキャピタル
(73)【特許権者】
【識別番号】521337001
【氏名又は名称】勝田 欽治
(73)【特許権者】
【識別番号】521337012
【氏名又は名称】清 隼人
(74)【代理人】
【識別番号】100166589
【弁理士】
【氏名又は名称】植村 貴昭
(72)【発明者】
【氏名】齋藤 道
【審査官】大野 弘
(56)【参考文献】
【文献】特開2010-210756(JP,A)
【文献】特開平07-129594(JP,A)
【文献】特開2007-213005(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/22
G10L 15/00
G10L 15/06
G06F 40/58
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
外部に対して入出力を行うユーザインターフェイスと、
前記外部から前記ユーザインターフェイスを介して入力された音声内容を解析し、解析した当該音声内容を他の言語に変換し、変換した当該音声内容の信号を前記ユーザインターフェイスに送信する制御部とを備え、
前記制御部は、前記音声内容を解析できなかった場合、別の発音を依頼する内容の信号を前記ユーザインターフェイスに送信する、別発音依頼動作を実行し、
前記制御部が前記音声内容を解析できるまで前記別発音依頼動作を繰り返し実行し、
前記別発音依頼動作における前記別発音を依頼する内容は、前回の前記別発音依頼動作における前記別発音を依頼する内容と重複しないものとし、
複数種類の言語及びその翻訳関係についての第1言語データベースが記憶された記憶部を備え、
前記制御部は、前記別発音依頼動作が1回以上為された後に前記音声内容を解析した場合、当該音声内容が初回の前記音声内容と同一の意味であると判断し、前記第1言語データベースには当該判断の情報が反映される
翻訳端末と、
前記翻訳端末と通信可能であり、前記複数種類の言語及びその翻訳関係についての第2言語データベースが記憶されたサーバとを備え、
前記サーバが前記翻訳端末から前記判断の情報を受信することで、前記第2言語データベースにも前記判断の情報が反映される
ことを特徴とする翻訳システム。
【請求項2】
前記翻訳端末での、前記別の発音を依頼する内容とは、正確な発音を依頼する、標準語での発音を依頼する、訛りのない発音を依頼する、及び、他の表現を依頼する、のうち、いずれか1つである
請求項1に記載の翻訳システム。
【請求項3】
前記翻訳端末は、
複数種類の言語及びその翻訳関係についての第1言語データベースが記憶された記憶部と、
前記別発音依頼動作が1回以上為された後に前記音声内容を解析した場合、当該音声内容が初回の前記音声内容と同一の意味であると判断し、前記第1言語データベースの書き換えを行うか否かを決定する第1人工知能とを備え、
前記第1人工知能が書き換えを行うと決定した場合、前記第1言語データベースには前記判断の情報が反映される
請求項1又は2に記載の翻訳システム。
【請求項4】
前記サーバは、前記翻訳端末から前記判断の情報を受信すると、前記第2言語データベースの書き換えを行うか否かを決定する第2人工知能を備え、
前記第2言語データベースには、前記第2人工知能が書き換えを行うと決定した場合に、前記判断の情報が反映される
ことを特徴とする請求項1に記載の翻訳システム。
【請求項5】
複数の前記翻訳端末を備え、
前記サーバは、1つの前記翻訳端末から前記判断の情報を受信し、前記第2言語データベースに前記判断の情報を反映する場合、他の前記翻訳端末に前記判断の情報を送信するものであり、
他の前記翻訳端末は、前記サーバから受信した前記判断の情報をそれぞれ前記第1言語データベースに反映させる
ことを特徴とする請求項1又は4に記載の翻訳システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システムに関するものである。
【背景技術】
【0002】
現在、入力された言語を他の言語に翻訳して出力する翻訳装置が普及している(例えば下記特許文献1等参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開平5-61908号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の翻訳装置は、複数の言語(日本語、英語等)及びその翻訳関係についての言語データベースを有しているが、例えば、これらの言語は国ごとにその標準語のみに対応しており、同じ国であっても地域毎に微妙に異なる発音(例えば訛りや方言)にまでは対応していない。
【0005】
このように、従来の翻訳装置は、予め記憶された発音に対する翻訳は可能であるが、それ以外の発音に対しては翻訳することができない。
【0006】
本発明は、上記技術的課題に鑑み、予め記憶されていない発音に対する翻訳を行うことを可能とする、翻訳端末及び翻訳システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するための第1の発明に係る翻訳端末は、
外部に対して入出力を行うユーザインターフェイスと、
前記外部から前記ユーザインターフェイスを介して入力された音声内容を解析し、解析した当該音声内容を他の言語に変換し、変換した当該音声内容の信号を前記ユーザインターフェイスに送信する制御部とを備え、
前記制御部は、前記音声内容を解析できなかった場合、別の発音を依頼する内容の信号を前記ユーザインターフェイスに送信する、別発音依頼動作を実行する
ことを特徴とする。
【0008】
上記課題を解決するための第2の発明に係る翻訳端末は、
上記第1の発明に係る翻訳端末において、
前記別の発音を依頼する内容とは、正確な発音を依頼する、標準語での発音を依頼する、訛りのない発音を依頼する、及び、他の表現を依頼する、のうち、いずれか1つである
ことを特徴とする。
【0009】
上記課題を解決するための第3の発明に係る翻訳端末は、
上記第1又は2の発明に係る翻訳端末において、
前記制御部が前記音声内容を解析できるまで前記別発音依頼動作を繰り返し実行し、
前記別発音依頼動作における前記別発音を依頼する内容は、前回の前記別発音依頼動作における前記別発音を依頼する内容と重複しないものとする
ことを特徴とする。
【0010】
上記課題を解決するための第4の発明に係る翻訳端末は、
上記第3の発明に係る翻訳端末において、
複数種類の言語及びその翻訳関係についての第1言語データベースが記憶された記憶部を備え、
前記制御部は、前記別発音依頼動作が1回以上為された後に前記音声内容を解析した場合、当該音声内容が初回の前記音声内容と同一の意味であると判断し、前記第1言語データベースにはこの判断情報が反映される
ことを特徴とする。
【0011】
上記課題を解決するための第5の発明に係る翻訳端末は、
上記第3の発明に係る翻訳端末において、
複数種類の言語及びその翻訳関係についての第1言語データベースが記憶された記憶部と、
前記別発音依頼動作が1回以上為された後に前記音声内容を解析した場合、当該音声内容が初回の前記音声内容と同一の意味であると判断し、前記第1言語データベースの書き換えを行うか否かを決定する第1人工知能とを備え、
前記第1人工知能が書き換えを行うと決定した場合、前記第1言語データベースには前記判断の情報が反映される
ことを特徴とする。
【0012】
上記課題を解決するための第6の発明に係る翻訳システムは、
上記第4又は5の発明に係る翻訳端末と、
前記翻訳端末と通信可能であり、前記複数種類の言語及びその翻訳関係についての第2言語データベースが記憶されたサーバとを備え、
前記サーバが前記翻訳端末から前記判断情報を受信することで、前記第2言語データベースにも前記判断情報が反映される
ことを特徴とする。
【0013】
上記課題を解決するための第7の発明に係る翻訳システムは、
上記第6の発明に係る翻訳システムにおいて、
前記サーバは、前記翻訳端末から前記判断の情報を受信すると、前記第2言語データベースの書き換えを行うか否かを決定する第2人工知能を備え、
前記第2言語データベースには、前記第2人工知能が書き換えを行うと決定した場合に、前記判断の情報が反映される
ことを特徴とする。
【0014】
上記課題を解決するための第8の発明に係る翻訳システムは、
上記第5の発明に係る翻訳システムにおいて、
複数の前記翻訳端末を備え、
前記サーバは、1つの前記翻訳端末から前記判断の情報を受信し、前記第2言語データベースに前記判断の情報を反映する場合、他の前記翻訳端末に前記判断の情報を送信するものであり、
他の前記翻訳端末は、前記サーバから受信した前記判断の情報をそれぞれ前記第1言語データベースに反映させる
ことを特徴とする。
【発明の効果】
【0015】
本発明に係る翻訳端末及び翻訳システムによれば、予め記憶されていない発音に対する翻訳を行うことが可能となる。
【図面の簡単な説明】
【0016】
図1】本発明の実施例に係る翻訳端末及び翻訳システムの構成を説明するブロック図である。
図2】本発明の実施例に係る翻訳端末及び翻訳システムの動作を説明するフローチャートである。
図3】本発明の実施例に係る翻訳端末及び翻訳システムの構成を説明するブロック図である。
【発明を実施するための形態】
【0017】
以下、本発明に係る翻訳端末及び翻訳システムについて、実施例にて図面を用いて説明する。
【実施例
【0018】
まず、図1を用いて本実施例に係る翻訳端末(翻訳端末1)及び翻訳システムの構成を説明する。本実施例に係る翻訳システムは、翻訳端末1,1′,1″,…及びサーバ3を備えている。翻訳端末1,1′,1″,…は、ネットワーク(LANあるいはインターネット等)2を介して、サーバ3と互いに通信可能に接続されている。
【0019】
翻訳端末1は、主たる構成として、表示部10、音声入力部11、音声出力部12、通信部13、記憶部14、及び、制御部15を備えている。このうち、表示部10、音声入力部11、及び、音声出力部12は、外部に対して入出力を行うユーザインターフェイスである。
【0020】
表示部10は、各種表示を行うとともに、ユーザが出力言語を含む各種設定を行うことを可能とする、タッチパネル等である。
【0021】
音声入力部11は、翻訳端末1の外部から入力される音声を電気信号に変換し、変換した電気信号を後述する入力処理部21へ送信する、マイク等である。
【0022】
音声出力部12は、後述する出力処理部22から受信する電気信号に応じた音声を翻訳端末1の外部に対して出力する、スピーカー等である。
【0023】
通信部13は、ネットワーク2を介してサーバ3と通信可能な通信インターフェイスである。なお、サーバ3には、複数種類(日本語、英語等)の言語(標準語)及びその翻訳関係のデータベースである言語データベース3Aが、初期設定として記憶されている。そして、この言語データベース3Aは書き換え可能となっている。
【0024】
記憶部14は、各種情報を記憶するストレージである。複数種類の言語(標準語)及びその翻訳関係のデータベースである言語データベース14Aもこの記憶部14に記憶されている。なお記憶部14は、通信部13を用いて、サーバ3と“言語データベースを書き換えした情報”を互いに送受信することで、言語データベース14Aと言語データベース3Aとは同一の内容となる。
【0025】
制御部15は、選択要求部20、入力処理部21、出力処理部22、言語解析部23、言語変換部24、依頼設定部25、及び、言語結付部26を備えており、主に、外部から音声入力部11(ユーザインターフェイス)を介して入力された音声内容を解析し、解析した当該音声内容を他の言語に変換し、変換した当該音声内容の信号を音声出力部12(ユーザインターフェイス)に送信するものである。
【0026】
選択要求部20は、出力言語の設定を含む各種選択を要求する内容を、表示部10に送信する。
【0027】
入力処理部21は、音声入力部11から受信した内容を後述の言語解析部23に送信する。一方、出力処理部22は、後述の言語変換部24及び依頼設定部25から受信した内容を音声出力部12に送信する。
【0028】
言語解析部23は、入力処理部21から受信した信号に基づき、音声内容を解析する。言語解析部23によって解析された音声内容は、言語変換部24に送信する。ただし、言語解析部23によって音声内容を解析することができなかった場合には、後述の依頼設定部25に信号を送信する。
【0029】
言語変換部24は、言語解析部23が解析した音声内容を、予め表示部10においてユーザにより設定された出力言語に変換(翻訳)する。
【0030】
依頼設定部25は、言語解析部23から信号を受信した(言語解析部23によって音声内容を解析できなかった)場合、別の発音を依頼する内容の信号を、出力処理部22を介して音声出力部12に送信する(以下、別発音依頼動作と呼称)。
【0031】
ここでの「別の発音を依頼する内容」とは、具体的には、「正確な発音を依頼する」、「標準語での発音を依頼する」、「訛りのない発音を依頼する」、及び、「他の表現を依頼する」のうち、いずれか1つであるものとする。
【0032】
依頼設定部25は、言語解析部23が音声内容を解析できるまで別発音依頼動作を繰り返し実行する。もし、依頼設定部25が上記動作を所定回数繰り返し行っても、言語解析部23が解析できなければ、解析不能の旨を音声出力部12に送信する。
【0033】
また、(別発音依頼動作における)「別の発音を依頼する内容」は、前回の(別発音依頼動作における)「別の発音を依頼する内容」と重複しないものとする。例えば、前回が「正確な発音を依頼する」であれば、その次は「標準語での発音を依頼する」とする。
【0034】
言語結付部26は、別発音依頼動作(及び、それに対する外部から音声入力)が1回以上為された後に、言語解析部23においてその音声内容を解析した場合、解析されたその音声内容が初回の音声内容と同一の意味であると判断し(結び付け)、その判断情報を、記憶部14に送信するとともに、通信部13を介してサーバ3に送信する。
【0035】
また、記憶部14の言語データベース14A(第1言語データベース)、及び、サーバ3の言語データベース3A(第2言語データベース)には、上記判断情報が反映される(書き換えられる)。
【0036】
さらに、サーバ3は、このようにして言語データベース3Aが書き換えられると、他の翻訳端末1′,1″,…に対して、上記判断情報(すなわち書き換えられた言語データベース3Aの情報)を送信し、これにより他の翻訳端末1′,1″,…内の図示しない言語データベース(第1言語データベース)にも上記判断情報が反映される(書き換えられる)。したがって、各翻訳端末1,1′,1″,…は、各言語データベースが自動アップデートされ、互いに同一の言語データベースを記憶した状態を保つこととなる。
【0037】
なお、本実施例では、言語変換部24、依頼設定部25からそれぞれ送信する内容を、出力処理部22及び音声出力部12により音声で出力するものとしているが、本発明はこれに限定されるものではなく、代わりに、例えば表示部10により文字データとして表示するようにしてもよい。
【0038】
また本実施例では、言語結付部26の判断情報により、言語データベース14Aが自動的に書き換えられるものとしているが、本発明はこのような構成に限定されるものではなく、図3に示すように、翻訳端末1(及び1′,1″,…)が、言語結付部26の代わりに、AI(Artificial Intelligence:人工知能)31を搭載するものとしてもよい。
【0039】
このAI31は、言語結付部26と同様の処理を行うことに加え、言語データベース14Aの書き換えを行うか否かを決定し、書き換えを行うと決定した場合に、言語データベース14Aが書き換えられる(上記判断情報が反映される)ものとしてもよい。
【0040】
さらに本実施例では、言語結付部26の判断情報により、(ネットワーク2を介して)言語データベース3Aが自動的に書き換えられるものとしているが、本発明はこのような構成に限定されるものではなく、図3に示すように、サーバ3が、AI32を搭載するものとしてもよい。
【0041】
すなわち、サーバ3が翻訳端末1から(言語結付部26又はAI31による)上記判断情報を受信すると、このAI32(あるいはAI32及びサーバ管理者)により、言語データベース3Aの書き換えを行うか否かを決定し、書き換えを行うと決定した場合に、言語データベース3Aが書き換えられた(上記判断情報が反映された)上で、他の翻訳端末1′,1″,…に上記判断情報を送信するものとしてもよい。
【0042】
以上が、本実施例に係る翻訳端末及び翻訳システムの構成の説明である。以下では、上記構成とした本実施例に係る翻訳端末及び翻訳システムの動作の一例を、図2のフローチャートを用いて説明する。
【0043】
ステップS1では、選択要求部20により表示部10から出力言語の設定を要求する表示を行い、ユーザにより出力言語を設定する。なお、当該ステップは、必ずしも毎回行わなければならないものではない。例えば、初回動作時のみ必須としてもよく、あるいは、出荷時から、初期設定として特定の言語(例えば英語等)が設定されている状態としておき、ユーザが任意で変更する形にしてもよい。
【0044】
ステップS2では、ユーザにより音声入力部11に音声が入力される。ステップS3は、この音声内容が解析可能か否かで分岐するステップである。解析が可能であればステップS5へ、不能であればステップS4へ移行する。
【0045】
ステップS4では、依頼設定部25により別の発音を依頼する(別発音依頼動作)。この依頼内容は音声出力部12又は表示部10から出力され、ユーザに伝達される。ステップS4を実行した後は、ステップS2に戻る。
【0046】
ステップS5では、言語解析部23により音声内容の解析を行う。ステップS6は、ステップS4(別発音依頼動作)を行ったか否かで分岐するステップである。別発音依頼動作を行っていればステップS7A,S7Bへ、行っていなければステップS7へ移行する。
【0047】
ステップS7では、音声内容を言語変換部24により他の言語(ステップS1で設定された言語)に変換する。ステップS8では、ステップS7で変換した言語を音声出力部12又は表示部10から出力する。
【0048】
ステップS7A,S8Aは、上記ステップS7,S8とそれぞれ同じ動作を行うものであり、ここでは説明を省略する。また、ステップS7B,S8B,S9は、ステップS5において音声内容の解析を行った後、ステップS7A,S8Aと並行して行われる動作である。
【0049】
ステップS7Bでは、言語結付部26又はAI31により、初回の音声内容と(言語解析部23で)解析した音声内容とが同一の意味であると判断する(結び付ける)。
【0050】
ステップS8Bでは、上記ステップS7Bの判断情報に基づき、(AI31,32の判断により)言語データベース3A、及び、他の翻訳端末1′,1″,…における言語データベース14Aを書き換える。
以上が本実施例に係る翻訳システムの動作説明である。
【0051】
このようにして本実施例に係る翻訳端末及び翻訳システムは、予め記憶されていない発音に対する翻訳を行うことができる。
【0052】
また、別発音依頼動作を繰り返し行うことで、より確実に翻訳を行うことができる。さらに、サーバを用いて情報の送受信を行うことで、各翻訳端末の言語データベースを同一のものとすることができ、より翻訳精度を向上させることができる。
【産業上の利用可能性】
【0053】
本発明は、音声認識による自動翻訳機の人工知能による自動アップデートとそのアップデート配信及び情報システムとして好適である。
【符号の説明】
【0054】
1,1′,1″ 翻訳端末
2 ネットワーク
3 サーバ
3A 言語データベース
10 表示部
11 音声入力部
12 音声出力部
13 通信部
14 記憶部
14A 言語データベース
15 制御部
20 選択要求部
21 入力処理部
22 出力処理部
23 言語解析部
24 言語変換部
25 依頼設定部
26 言語結付部
31,32 AI(人工知能)
図1
図2
図3