特許第6987124号(P6987124)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ハイパーコネクト インコーポレイテッドの特許一覧

特許6987124通訳装置及び方法(DEVICE AND METHOD OF TRANSLATING A LANGUAGE)
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6987124
(24)【登録日】2021年12月2日
(45)【発行日】2021年12月22日
(54)【発明の名称】通訳装置及び方法(DEVICE AND METHOD OF TRANSLATING A LANGUAGE)
(51)【国際特許分類】
   G10L 15/00 20130101AFI20211213BHJP
   G06F 3/16 20060101ALI20211213BHJP
   G10L 15/22 20060101ALI20211213BHJP
【FI】
   G10L15/00 200C
   G06F3/16 650
   G10L15/22 460Z
【請求項の数】20
【全頁数】35
(21)【出願番号】特願2019-506184(P2019-506184)
(86)(22)【出願日】2017年8月2日
(65)【公表番号】特表2019-533181(P2019-533181A)
(43)【公表日】2019年11月14日
(86)【国際出願番号】KR2017008362
(87)【国際公開番号】WO2018026200
(87)【国際公開日】20180208
【審査請求日】2020年5月19日
(31)【優先権主張番号】10-2016-0098659
(32)【優先日】2016年8月2日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】517425675
【氏名又は名称】ハイパーコネクト インコーポレイテッド
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【弁理士】
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【弁理士】
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【弁理士】
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【弁理士】
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【弁理士】
【氏名又は名称】那須 威夫
(72)【発明者】
【氏名】アン サンギル
(72)【発明者】
【氏名】ジュン カンシク
(72)【発明者】
【氏名】ヨン ヒョンテク
(72)【発明者】
【氏名】チョイ ヒョク
【審査官】 渡部 幸和
(56)【参考文献】
【文献】 米国特許出願公開第2015/0350451(US,A1)
【文献】 特開平03−273449(JP,A)
【文献】 国際公開第2011/033834(WO,A1)
【文献】 特開平01−219952(JP,A)
【文献】 特開2010−276869(JP,A)
【文献】 特開2003−216607(JP,A)
【文献】 特表2007−531065(JP,A)
【文献】 特開2001−318919(JP,A)
【文献】 特開2007−080097(JP,A)
【文献】 特開2001−117920(JP,A)
【文献】 特開2013−250605(JP,A)
【文献】 特開2009−093471(JP,A)
【文献】 米国特許出願公開第2015/0134322(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00−15/34
G06F 3/00−3/16
G06F 40/00−40/58
(57)【特許請求の範囲】
【請求項1】
第1端末から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階と、
前記受信された音声認識結果を連続的に表示する段階と、
前記第1言語の語順と第2言語の語順の間の類似度を算出する段階と、
前記算出された類似度が基準値よりも大きければ、前記第1言語の音声認識結果に含まれたそれぞれの単語をそれらと同一または類似の意味を有する第2言語の単語に連続的に置換する段階と、
前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階、及び
表示された前記終結した文章を前記取得された翻訳文に置換する段階を含み、
前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、少なくとも一部が前記第2言語の単語に置換された前記終結した文章を前記取得された翻訳文に連続的に置換する段階を含む通訳方法。
【請求項2】
前記受信された音声認識結果を連続的に表示する段階は、
前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含み、
前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、
前記音声認識結果を表示する途中に、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章の前記第2言語への翻訳文を取得する段階を含み、
前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、
前記音声認識結果を表示する途中に、前記少なくとも一つ以上の終結した文章を前記取得された翻訳文に置換する段階を含む請求項1に記載の通訳方法。
【請求項3】
前記第1端末から前記音声がエンコードされることによって生成された音声データを連続的に受信する段階、及び
前記受信された音声データを用いて前記音声を連続的に再生する段階をさらに含み、
前記受信された音声認識結果を連続的に表示する段階は、
前記音声を再生する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含む請求項1に記載の通訳方法。
【請求項4】
前記第2言語の単語に連続的に置換する段階は、
前記第1言語で表示された前記それぞれの単語と同一または類似の意味を有する前記第2言語の単語を前記第1端末または第1サーバーから受信する段階、及び
前記第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換する段階を含む請求項に記載の通訳方法。
【請求項5】
前記第2言語の単語に連続的に置換する段階は、
前記第1言語で表示された前記それぞれの単語を第1サーバーに伝送する段階と、
前記伝送されたそれぞれの単語と同一または類似の意味を有する前記第2言語の単語を前記第1サーバーから受信する段階、及び
前記第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換する段階を含む請求項に記載の通訳方法。
【請求項6】
前記第2言語の単語に連続的に置換する段階は、
第1データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階と、
もし前記照会された単語に対応する前記第2言語の単語が前記第1データベース内に存在する場合、前記照会の結果として、前記照会された単語に対応する前記第2言語の単語を前記第1データベースから取得する段階、及び
前記第1言語で表示された前記照会された単語を前記取得された第2言語の単語に置換する段階を含む請求項に記載の通訳方法。
【請求項7】
前記第2言語の単語に連続的に置換する段階は、
第1データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階と、
もし前記照会された単語に対応する前記第2言語の単語が前記第1データベース内に存在しない場合、前記照会された単語を第1サーバーに伝送する段階と、
前記伝送された単語と同一または類似の意味を有する前記第2言語の単語を前記第1サーバーから受信する段階と、
前記伝送された単語及び前記受信された第2言語の単語を前記第1データベース内にキャッシュ(cache)する段階、及び
前記第1言語で表示された前記伝送された単語を前記受信された第2言語の単語に置換する段階をさらに含む請求項に記載の通訳方法。
【請求項8】
前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、
前記翻訳文を前記第1端末または第2サーバーから受信する段階を含む請求項1に記載の通訳方法。
【請求項9】
前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、
前記表示された音声認識結果内から前記終結した文章を検出する段階と、
前記終結した文章を第2サーバーに伝送する段階、及び
前記終結した文章の前記第2言語への翻訳文を前記第2サーバーから受信する段階を含む請求項1に記載の通訳方法。
【請求項10】
前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、
前記表示された音声認識結果内から前記終結した文章を検出する段階と、
第2データベースにおいて、前記終結した文章を照会する段階、及び
もし前記終結した文章に対応する前記第2言語への翻訳文が前記第2データベース内に存在する場合、前記照会の結果として、前記終結した文章に対応する前記第2言語への翻訳文を前記第2データベースから取得する段階を含む請求項1に記載の通訳方法。
【請求項11】
前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、
前記表示された音声認識結果内から前記終結した文章を検出する段階と、
第2データベースにおいて、前記終結した文章を照会する段階と、
もし前記終結した文章に対応する前記第2言語への翻訳文が前記第2データベース内に存在しない場合、前記終結した文章を第2サーバーに伝送する段階と、
前記終結した文章の前記第2言語への翻訳文を前記第2サーバーから受信する段階、及び
前記終結した文章及び前記受信された第2言語への翻訳文を前記第2データベース内にキャッシュ(cache)する段階をさらに含む請求項1に記載の通訳方法。
【請求項12】
請求項1に記載の通訳方法をコンピュータで実行させるプログラムが記録されたコンピュータで読み取り可能な記録媒体。
【請求項13】
第1端末が第1言語の音声を連続的に受信する段階と、
前記受信されている音声を連続的にエンコードする段階と、
前記エンコードされた音声を第1サーバーに連続的に伝送する段階と、
前記第1サーバーから前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階と、
前記受信された音声認識結果を第2端末に連続的に伝送する段階と、
前記第1言語の語順と第2言語の語順の間の類似度が基準値よりも大きければ、前記音声認識結果の各単語を第2サーバーに伝送する段階と、
前記伝送された各単語と同一又は類似の意味を有する第2言語の単語を前記第2サーバーから受信する段階と、
前記第2言語の単語を前記第2端末に連続的に伝送する段階と、
前記受信されている音声内から終結した文章を検出する段階と、
前記検出された文章に対応する前記第1言語のテキストを第サーバーに伝送する段階と、
前記第サーバーから前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信する段階、及び
前記受信された翻訳文を前記第2端末に伝送する段階を含む通訳方法。
【請求項14】
前記受信されている音声を連続的にエンコードする段階は、
前記音声を受信している途中に、現在までに受信された前記音声のうちの少なくとも一部を連続的にエンコードする段階を含み、
前記エンコードされた音声を第1サーバーに連続的に伝送する段階は、
前記音声を受信している途中に、現在までエンコードされた前記音声のうちの少なくとも一部を前記第1サーバーに連続的に伝送する段階を含み、
前記第1サーバーから前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階は、
前記音声を受信している途中に、前記第1サーバーから前記伝送されたエンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階を含む請求項13に記載の通訳方法。
【請求項15】
前記受信された音声認識結果を第2端末に連続的に伝送する段階は、
前記音声を受信している途中に、前記受信された音声認識結果を前記第2端末に連続的に伝送する段階を含み、
前記受信されている音声内から終結した文章を検出する段階は、
前記音声を受信している途中に、現在まで伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、
前記検出された文章に対応する前記第1言語のテキストを前記サーバーに伝送する段階は、
前記音声を受信している途中に、前記検出された少なくとも一つ以上の終結した文章に対応する前記第1言語のテキストを前記第サーバーに伝送する段階を含む請求項14に記載の通訳方法。
【請求項16】
前記第サーバーから前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信する段階は、
前記音声を受信している途中に、前記第サーバーから前記伝送されたテキストの前記第2言語への翻訳文を前記第2言語のテキストとして受信する段階を含み、
前記受信された翻訳文を前記第2端末に伝送する段階は、
前記音声を受信している途中に、前記受信された翻訳文を前記第2端末に伝送する段階を含む請求項15に記載の通訳方法。
【請求項17】
前記エンコードされた音声を前記第3サーバーに連続的に伝送する段階をさらに含み、
前記受信された音声認識結果を第2端末に連続的に伝送する段階は、
前記エンコードされた音声を伝送している途中に、前記受信された音声認識結果を前記第2端末に連続的に伝送する段階を含む請求項13に記載の通訳方法。
【請求項18】
第1端末から第1言語の音声に対する音声認識結果を第1言語のテキストとして連続的に受信する段階と、
前記受信された音声認識結果を第2端末に連続的に伝送する段階と、
前記第1言語の語順と第2言語の語順の間の類似度が基準値よりも大きければ、前記音声認識結果の単語と同一又は類似の意味を有する第2言語の単語を取得する段階と、
前記第2言語の単語を前記第2端末に連続的に伝送する段階と、
前記受信された音声認識結果内から終結した文章を検出する段階と、
前記検出された文章の第2言語への翻訳文を取得する段階、及び
前記取得された翻訳文を前記第2端末に伝送する段階を含む通訳方法。
【請求項19】
前記受信された音声認識結果を第2端末に連続的に伝送する段階は、
前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を前記第2端末に連続的に伝送する段階を含み、
前記受信された音声認識結果内から終結した文章を検出する段階は、
現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、
前記検出された文章の第2言語への翻訳文を取得する段階は、
前記検出された少なくとも一つ以上の終結した文章の前記第2言語への翻訳文を取得する段階を含み、
前記取得された翻訳文を前記第2端末に伝送する段階は、
前記音声認識結果を受信する途中に、前記取得された翻訳文を前記第2端末に伝送する段階を含む請求項18に記載の通訳方法。
【請求項20】
第1言語の音声を連続的に受信する入力部と、
前記受信されている音声を連続的にエンコードする制御部、及び
前記エンコードされた音声を第1サーバーに連続的に伝送する通信部を含み、
前記通信部は、前記第1サーバーから前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信し、
前記通信部は、前記受信された音声認識結果を第2端末に連続的に伝送し、
前記第1言語の語順と第2言語の語順の間の類似度が基準値よりも大きければ、前記通信部は、前記音声認識結果の各単語を第2サーバーに伝送し、
前記通信部は、前記伝送された各単語と同一又は類似の意味を有する第2言語の単語を前記第2サーバーから受信し、
前記通信部は、前記第2言語の単語を前記第2端末へ連続的に伝送し、
前記制御部は、前記受信されている音声内から終結した文章を検出し、
前記通信部は、前記検出された文章に対応する前記第1言語のテキストを第サーバーに伝送し、
前記通信部は、前記第サーバーから前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信し、
前記通信部は、前記受信された翻訳文を前記第2端末に伝送する通訳装置。
【発明の詳細な説明】
【技術分野】
【0001】
記載された実施例は、よりスムーズで、反応性が向上した使用者経験を提供することができる通訳装置及び方法に関する。
【背景技術】
【0002】
通信技術が発展し、電子装置が小型化するに伴って個人用端末が一般消費者に広く普及している。特に最近では、スマートフォンやスマートタブレットのような携帯用個人端末が広く普及している。前記端末の大部分は、通信機能を含んでいる。使用者は、端末を用いてインターネットで検索を行ったり、他の使用者とメッセージを送受信することができる。
【0003】
また、小型カメラ技術、小型マイク技術、小型ディスプレイ技術及び小型スピーカー技術の発展に伴い、スマートフォンのようなほとんどの端末には、カメラ、マイク、ディスプレイ及びスピーカーが含まれている。使用者は、端末を用いて音声を録音したり、音声が含まれている動画を撮影することができる。使用者は、端末に含まれたスピーカーを介して前記録音された音声を確認するか、ディスプレイを介して前記撮影された動画を確認することができる。
【0004】
また、使用者は、端末の通信機能を用いて、前記録音された音声または前記撮影された動画を他の使用者と共有することができる。使用者は、以前に録音された音声または以前に撮影された動画を他の使用者に伝送することができる。また、使用者は、端末によって現在録音されている音声または現在撮影されている動画をリアルタイムで他の使用者に伝送することができる。
【0005】
また、同時に、前記他の使用者は、自分の端末によって現在録音されている音声または現在撮影されている動画をリアルタイムで前記使用者に伝送することができる。使用者の端末に含まれたディスプレイは、使用者の端末によって現在撮影されている動画及び他の使用者の端末によって現在撮影されている動画を同時に表示することができる。また、使用者の端末に含まれたスピーカーは、他の使用者の端末によって現在録音されている音声を同時に再生することができる。すなわち、使用者及び他の使用者は、各自の端末を用いて、互いに映像通話(video call)を行うことができる。
【0006】
前記使用者及び他の使用者は、互いにすでに知っている関係であることもあり、互いに知らない関係であることもある。前記使用者の端末及び前記他の使用者の端末を含む複数の端末は、サーバーに連結されることができる。サーバーは、前記使用者の端末及び前記他の使用者の端末の間を仲介することができる。したがって、前記使用者及び他の使用者は、互いに知らない関係であったとしても、サーバーの仲介を介して互いに映像通話をすることができる。
【0007】
前記使用者が使用する言語は、前記他の使用者が使用する言語と互いに異なることができる。映像通話をする使用者が使用する言語が互いに異なる場合には、相手の音声が使用者の端末のスピーカーを介して再生されても、使用者は相手の話を聞き取れないことがある。
【発明の概要】
【発明が解決しようとする課題】
【0008】
記載された実施例によれば、映像通話をする使用者が使用する言語が互いに異なっても各自が相手の話を聞き取るようにすることができる通訳装置及び方法が提供されることができる。
【0009】
また、実施例によれば、よりスムーズな使用者経験を提供することができる通訳装置及び方法が提供されることができる。
【0010】
また、実施例によれば、反応性が向上した使用者経験を提供することができる通訳装置及び方法が提供されることができる。
【0011】
また、実施例によれば、改善された使用者経験を提供することができる通訳装置及び方法が提供されることができる。
【課題を解決するための手段】
【0012】
実施例に係る通訳方法は、第1端末から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階、前記受信された音声認識結果を連続的に表示する段階、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階、及び表示された前記終結した文章を前記取得された翻訳文に置換する段階を含むことができる。
【0013】
また、前記受信された音声認識結果を連続的に表示する段階は、前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含み、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、前記音声認識結果を表示する途中に、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章の前記第2言語への翻訳文を取得する段階を含み、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、前記音声認識結果を表示する途中に、前記少なくとも一つ以上の終結した文章を前記取得された翻訳文に置換する段階を含むことができる。
【0014】
また、前記通訳方法は、前記第1端末から前記音声がエンコードされることによって生成された音声データを連続的に受信する段階、及び前記受信された音声データを用いて前記音声を連続的に再生する段階をさらに含み、前記受信された音声認識結果を連続的に表示する段階は、前記音声を再生する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示する段階を含むことができる。
【0015】
また、前記通訳方法は、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階以前に、前記第1言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第2言語の単語に連続的に置換する段階をさらに含むことができる。
【0016】
また、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、少なくとも一部が前記第2言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階を含むことができる。
【0017】
また、前記第2言語の単語に連続的に置換する段階は、前記第1言語で表示された前記それぞれの単語と同一または類似の意味を有する前記第2言語の単語を前記第1端末または第1サーバーから受信する段階、及び前記第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換する段階を含むことができる。
【0018】
また、前記第2言語の単語に連続的に置換する段階は、前記第1言語で表示された前記それぞれの単語を第1サーバーに伝送する段階、前記伝送されたそれぞれの単語と同一または類似の意味を有する前記第2言語の単語を前記第1サーバーから受信する段階、及び前記第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換する段階を含むことができる。
【0019】
また、前記第2言語の単語に連続的に置換する段階は、第1データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階、もし前記照会された単語に対応する前記第2言語の単語が前記第1データベース内に存在する場合、前記照会の結果として、前記照会された単語に対応する前記第2言語の単語を前記第1データベースから取得する段階、及び前記第1言語で表示された前記照会された単語を前記取得された第2言語の単語に置換する段階を含むことができる。
【0020】
また、前記第2言語の単語に連続的に置換する段階は、第1データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階、もし前記照会された単語に対応する前記第2言語の単語が前記第1データベース内に存在しない場合、前記照会された単語を第1サーバーに伝送する段階、前記伝送された単語と同一または類似の意味を有する前記第2言語の単語を前記第1サーバーから受信する段階、前記伝送された単語及び前記受信された第2言語の単語を前記第1データベース内にキャッシュ(cache)する段階、及び前記第1言語で表示された前記伝送された単語を前記受信された第2言語の単語に置換する段階をさらに含むことができる。
【0021】
また、前記通訳方法は、前記第1言語の語順及び前記第2言語の語順の間の類似度を算出する段階をさらに含み、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階以前に、前記算出された類似度が基準値よりも大きければ、前記第1言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第2言語の単語に連続的に置換する段階をさらに含み、前記表示された前記終結した文章を前記取得された翻訳文に置換する段階は、少なくとも一部が前記第2言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階を含むことができる。
【0022】
また、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、前記翻訳文を前記第1端末または第2サーバーから受信する段階を含むことができる。
【0023】
また、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、前記表示された音声認識結果内から前記終結した文章を検出する段階、前記終結した文章を第2サーバーに伝送する段階、及び前記終結した文章の前記第2言語への翻訳文を前記第2サーバーから受信する段階を含むことができる。
【0024】
また、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、前記表示された音声認識結果内から前記終結した文章を検出する段階、第2データベースにおいて、前記終結した文章を照会する段階、及びもし前記終結した文章に対応する前記第2言語への翻訳文が前記第2データベース内に存在する場合、前記照会の結果として、前記終結した文章に対応する前記第2言語への翻訳文を前記第2データベースから取得する段階を含むことができる。
【0025】
また、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階は、前記表示された音声認識結果内から前記終結した文章を検出する段階、第2データベースにおいて、前記終結した文章を照会する段階、もし前記終結した文章に対応する前記第2言語への翻訳文が前記第2データベース内に存在しない場合、前記終結した文章を第2サーバーに伝送する段階、前記終結した文章の前記第2言語への翻訳文を前記第2サーバーから受信する段階、及び前記終結した文章及び前記受信された第2言語への翻訳文を前記第2データベース内にキャッシュ(cache)する段階をさらに含むことができる。
【0026】
他の実施例に係る通訳方法は、第1端末が第1言語の音声を連続的に受信する段階、前記受信されている音声を連続的にエンコードする段階、前記エンコードされた音声を第1サーバーに連続的に伝送する段階、前記第1サーバーから前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階、前記受信された音声認識結果を第2端末に連続的に伝送する段階、前記受信されている音声内から終結した文章を検出する段階、前記検出された文章に対応する前記第1言語のテキストを第2サーバーに伝送する段階、前記第2サーバーから前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信する段階、及び前記受信された翻訳文を前記第2端末に伝送する段階を含むことができる。
【0027】
また、前記受信されている音声を連続的にエンコードする段階は、前記音声を受信している途中に、現在までに受信された前記音声のうちの少なくとも一部を連続的にエンコードする段階を含み、前記エンコードされた音声を第1サーバーに連続的に伝送する段階は、前記音声を受信している途中に、現在までエンコードされた前記音声のうちの少なくとも一部を前記第1サーバーに連続的に伝送する段階を含み、前記第1サーバーから前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階は、前記音声を受信している途中に、前記第1サーバーから前記伝送されたエンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階を含むことができる。
【0028】
また、前記受信された音声認識結果を第2端末に連続的に伝送する段階は、前記音声を受信している途中に、前記受信された音声認識結果を前記第2端末に連続的に伝送する段階を含み、前記受信されている音声内から終結した文章を検出する段階は、前記音声を受信している途中に、現在まで伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、前記検出された文章に対応する前記第1言語のテキストを第2サーバーに伝送する段階は、前記音声を受信している途中に、前記検出された少なくとも一つ以上の終結した文章に対応する前記第1言語のテキストを前記第2サーバーに伝送する段階を含むことができる。
【0029】
また、前記第2サーバーから前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信する段階は、前記音声を受信している途中に、前記第2サーバーから前記伝送されたテキストの前記第2言語への翻訳文を前記第2言語のテキストとして受信する段階を含み、前記受信された翻訳文を前記第2端末に伝送する段階は、前記音声を受信している途中に、前記受信された翻訳文を前記第2端末に伝送する段階を含むことができる。
【0030】
また、前記通訳方法は、前記エンコードされた音声を前記第2端末に連続的に伝送する段階をさらに含み、前記受信された音声認識結果を第2端末に連続的に伝送する段階は、前記エンコードされた音声を伝送している途中に、前記受信された音声認識結果を前記第2端末に連続的に伝送する段階を含むことができる。
【0031】
また他の実施例に係る通訳方法は、第1端末から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階、前記受信された音声認識結果を第2端末に連続的に伝送する段階、前記受信された音声認識結果内から終結した文章を検出する段階、前記検出された文章の第2言語への翻訳文を取得する段階、及び前記取得された翻訳文を前記第2端末に伝送する段階を含むことができる。
【0032】
また、前記受信された音声認識結果を第2端末に連続的に伝送する段階は、前記音声認識結果を受信する途中に、現在までに受信された前記音声認識結果中から少なくとも一部を前記第2端末に連続的に伝送する段階を含み、前記受信された音声認識結果内から終結した文章を検出する段階は、現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出する段階を含み、前記検出された文章の第2言語への翻訳文を取得する段階は、前記検出された少なくとも一つ以上の終結した文章の前記第2言語への翻訳文を取得する段階を含み、前記取得された翻訳文を前記第2端末に伝送する段階は、前記音声認識結果を受信する途中に、前記取得された翻訳文を前記第2端末に伝送する段階を含むことができる。
【0033】
実施例に係る通訳装置は、第1端末から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する通信部、及び前記受信された音声認識結果を連続的に表示する表示部を含み、前記通信部は、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得し、前記表示部は、表示された前記終結した文章を前記取得された翻訳文に置換することができる。
【0034】
他の実施例に係る通訳装置は、第1言語の音声を連続的に受信する入力部、前記受信されている音声を連続的にエンコードする制御部、及び前記エンコードされた音声を第1サーバーに連続的に伝送する通信部を含み、前記通信部は、前記第1サーバーから前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信し、前記通信部は、前記受信された音声認識結果を第2端末に連続的に伝送し、前記制御部は、前記受信されている音声内から終結した文章を検出し、前記通信部は、前記検出された文章に対応する前記第1言語のテキストを第2サーバーに伝送し、前記通信部は、前記第2サーバーから前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信し、前記通信部は、前記受信された翻訳文を前記第2端末に伝送することができる。
【発明の効果】
【0035】
記載された実施例によれば、映像通話をする使用者が使用する言語が互いに異なっても、各自が相手の話を聞き取ることができる。
【0036】
また、実施例によれば、よりスムーズな使用者経験が提供されることができる。
【0037】
また、実施例によれば、反応性が向上した使用者経験が提供されることができる。
【0038】
また、実施例によれば、改善された使用者経験が提供されることができる。
【図面の簡単な説明】
【0039】
図1】実施例に係る通訳装置が動作する環境を示すネットワーク構成図である。
図2】実施例に係る通訳装置の構成を示すブロック図である。
図3】実施例に係る第1端末によって通訳方法が行われる過程を示すフローチャートである。
図4】実施例に係る第1端末が第1言語の音声を連続的に受信する段階を説明するための参考図である。
図5】実施例に係る第2端末によって通訳方法が行われる過程を示すフローチャートである。
図6】実施例に係る受信された音声認識結果を連続的に表示する段階を説明するための参考図である。
図7】実施例に係る受信された音声認識結果を連続的に表示する段階を説明するための他の参考図である。
図8】実施例に係る受信された音声認識結果を連続的に表示する段階を説明するためのまた他の参考図である。
図9】実施例に係る表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階が行われる過程を示すフローチャートである。
図10】他の実施例に係る表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階が行われる過程を示すフローチャートである。
図11】また他の実施例に係る表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階が行われる過程を示すフローチャートである。
図12】実施例に係る表示された終結した文章を取得された翻訳文に置換する段階を説明するための参考図である。
図13】実施例に係る受信された音声認識結果を連続的に表示する段階を説明するためのまた他の参考図である。
図14】実施例に係る表示された終結した文章を取得された翻訳文に置換する段階を説明するための他の参考図である。
図15】他の実施例に係る第2端末によって通訳方法が行われる過程を示すフローチャートである。
図16】実施例により音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。
図17】実施例に係る音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階を説明するための参考図である。
図18】実施例に係る音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階を説明するための他の参考図である。
図19】実施例に係る音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階を説明するためのまた他の参考図である。
図20】他の実施例により音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。
図21】また他の実施例により音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。
図22】また他の実施例により音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階が行われる過程を示すフローチャートである。
図23】実施例に係る第2言語の単語に置換された終結した文章を取得された翻訳文に置換する段階を説明するための参考図である。
図24】また他の実施例に係る第2端末によって通訳方法が行われる過程を示すフローチャートである。
図25】実施例に係るサーバーによって通訳方法が行われる過程を示すフローチャートである。
【発明を実施するための形態】
【0040】
本発明の利点及び特徴、そしてそれらを達成する方法は、添付した図面と共に詳細に後述されている実施例を参照すると明確になる。しかし、本発明は、以下で開示される実施例に限定されるものではなく、互いに異なる様々な形態で具現されるものであり、単に本実施例は、本発明の開示が完全になるようにして、本発明が属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は、請求項の範疇によって定義されるだけである。明細書全体にわたって同一の参照符号は、同一の構成要素を指す。
【0041】
「第1」または「第2」などが様々な構成要素を記述するために使用されるが、このような構成要素は、前記のような用語によって制限されるものではない。前記のような用語は、単に1つの構成要素を他の構成要素と区別するために使用することができる。したがって、以下に言及される第1構成要素は、本発明の技術的思想内で第2構成要素であることもできる。
【0042】
本明細書で使用される用語は、実施例を説明するためのものであって、本発明を制限しようとするものではない。本明細書において、単数形は、文句で特に言及しない限り、複数形も含む。明細書で使用される「含む(comprises)」または「含んでいる(comprising)」は、言及された構成要素または段階が1つ以上の他の構成要素または段階の存在または追加を排除しないという意味を内包する。
【0043】
他の定義がなければ、本明細書で使用されるすべての用語は、本発明が属する技術分野における通常の知識を有する者に共通的に理解され得る意味として解釈されることができる。また、一般的に使用される辞書に定義されている用語は、明白に定義されていない限り理想的にまたは過度に解釈されない。
【0044】
以下では、図1図25を参照して、実施例に係る通訳装置100、150及び方法について詳細に説明することにする。
【0045】
図1は、実施例に係る通訳装置100、150が動作する環境を示すネットワーク構成図である。図1を参照すると、通訳装置100、150が動作する環境は、第1通訳装置100、及び前記第1通訳装置100と互いに連結された第2通訳装置150を含むことができる。
【0046】
他の実施例によれば、前記通訳装置100、150が動作する環境は、前記第1通訳装置100または前記第2通訳装置150と互いに連結された第1サーバー200をさらに含むことができる。また他の実施例によれば、前記通訳装置100、150が動作する環境は、前記第1通訳装置100または前記第2通訳装置150と互いに連結された第2サーバー300をさらに含むことができる。また他の実施例によれば、前記通訳装置100、150が動作する環境は、前記第1通訳装置100または前記第2通訳装置150と互いに連結された第3サーバー400をさらに含むことができる。
【0047】
前記通訳装置100、150が動作する環境は、前記第1サーバー200〜第3サーバー400のうちのいずれか一つも含まないことができる。他の実施例によれば、前記通訳装置100、150が動作する環境は、前記第1サーバー200〜第3サーバー400のうちの少なくとも一部を含むことができる。
【0048】
第1通訳装置100は、端末であることができる。以下では、説明の便宜のために、第1通訳装置100を指す用語として、第1通訳装置100及び第1端末100を混用することにする。第1端末100は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、スマートフォン、スマートタブレット、スマートウォッチ、移動端末、デジタルカメラ、ウェアラブルデバイス(wearable device)、または携帯用電子機器などであることができる。第1端末100は、プログラムまたはアプリケーションを実行することができる。
【0049】
第1端末100は、通信網に連結されることができる。第1端末100は、前記通信網を介して、外部の他の装置と互いに連結されることができる。第1端末100は、互いに連結された他の装置にデータを伝送したり、前記他の装置からデータを受信することができる。
【0050】
第1端末100と連結された通信網は、有線通信網、無線通信網、または複合通信網を含むことができる。通信網は、3G、LTE、またはLTE−Aなどのような移動通信網を含むことができる。通信網は、ワイファイ(Wi−Fi)、UMTS/GPRS、またはイーサネット(Ethernet)(登録商標)などのような有線または無線通信網を含むことができる。通信網は、マグネチック保安送信(MST,Magnetic Secure Transmission)、RFID(Radio Frequency IDentification)、NFC(Near Field Communication)、ジグビー(ZigBee)、Z−Wave、ブルートゥース(Bluetooth)(登録商標)、低電力ブルートゥース(BLE,Bluetooth Low Energy)、または赤外線通信(IR,InfraRed communication)などのような近距離通信網を含むことができる。通信網は、近距離ネットワーク(LAN,Local Area Network)、メトロポリタン・エリア・ネットワーク(MAN,Metropolitan Area Network)、またはワイド・エリア・ネットワーク(WAN,Wide Area Network)などを含むことができる。
【0051】
図2は、実施例に係る通訳装置100、150の構成を示すブロック図である。図2を参照すると、実施例に係る通訳装置100、150は、入力部101、制御部102、保存部103、通信部104、及び表示部105を含むことができる。
【0052】
入力部101は、外部から信号を受信することができる。入力部101は、通訳装置100、150の使用者から信号を受信することができる。また、入力部101は、外部装置から信号を受信することができる。
【0053】
入力部101は、例えば、マイク、カメラ、キーボード、マウス、トラックボール、タッチスクリーン、ボタン、スイッチ、センサー、ネットワークインターフェース、または、その他の入力装置を含むことができる。入力部101は、入力部101に含まれたマイクを介して外部から音声を受信することができる。入力部101は、通訳装置100、150の使用者から音声を受信することができる。また、入力部101は、外部の音声再生装置から音声を受信することができる。
【0054】
制御部102は、通訳装置100、150の動作を制御することができる。制御部102は、通訳装置100、150に含まれたそれぞれの構成要素と互いに連結されることができる。制御部102は、通訳装置100、150に含まれたそれぞれの構成要素の動作を制御することができる。制御部102は、入力部101によって受信された信号に対する応答として、通訳装置100、150の動作を制御することができる。
【0055】
また、制御部102は、信号を処理することができる。制御部102は、入力部101によって受信された信号を処理することができる。例えば、制御部102は、入力部101に含まれたマイクを介して受信された音声を処理することができる。
【0056】
また、制御部102は、演算を行うことができる。制御部102は、入力部101によって受信された信号に基づいて演算を行うことができる。制御部102は、入力部101によって受信された信号または保存部103に保存されたデータを用いて演算を行うことができる。例えば、制御部102は、入力部101に含まれたマイクを介して受信された音声をエンコードすることができる。制御部102は、演算結果が保存部103に保存されるように制御することができる。制御部102は、演算結果が表示部105によって表示されるように制御することができる。
【0057】
制御部102は、例えば、中央処理装置(Central Processing Unit,CPU)、グラフィック処理装置(Graphic Processing Unit,GPU)、マイクロコントローラーユニット(Micro Controller Unit,MCU)、またはマイクロプロセッサ(microprocessor)を含むことができる。
【0058】
保存部103は、データを保存することができる。保存部103は、制御部102によって行われた演算結果を保存することができる。例えば、保存部103は、制御部102によってエンコードされた音声を保存することができる。保存部103は、通信部104を介して外部に伝送するデータを保存したり、通信部104を介して外部から受信されたデータを保存することができる。
【0059】
保存部103は、揮発性メモリーまたは非揮発性メモリーを含むことができる。保存部103は、例えば、フラッシュ(flash)メモリー、ROM、RAM、EEROM、EPROM、EEPROM、ハードディスクドライブ(HDD,Hard Disk Drive)、またはレジスター(register)などを含むことができる。保存部103は、例えば、ファイルシステム、データベース、またはエンベデッドデータベースなどを含むことができる。
【0060】
通信部104は、外部にデータを伝送したり、外部からデータを受信することができる。通信部104は、他の通訳装置100、150、第1サーバー200、第2サーバー300、または第3サーバー400にデータを伝送することができる。通信部104は、他の通訳装置100、150、第1サーバー200、第2サーバー300、または第3サーバー400からデータを受信することができる。通信部104は、制御部102によって行われた演算結果を外部に伝送することができる。また、通信部104は、保存部103に保存されたデータを外部に伝送することができる。
【0061】
通信部104によって伝送されるデータまたは通信部104によって受信されたデータは、保存部103に保存されることができる。例えば、通信部104は、保存部103に保存されたエンコードされた音声を第1サーバー200に伝送することができる。また、通信部104は、前記送信に対する応答として、前記第1サーバー200から前記エンコードされた音声に対する音声認識結果を受信することができる。
【0062】
通信部104は、例えば、3Gモジュール、LTEモジュール、LTE−Aモジュール、Wi−Fiモジュール、ワイギグ(WiGig)モジュール、UWB(Ultra Wide Band)モジュール、またはLANカードなどのような遠距離用のネットワークインターフェースを含むことができる。また、通信部104は、マグネチック保安送信(MST,Magnetic Secure Transmission)モジュール、ブルートゥースモジュール、NFCモジュール、RFIDモジュール、ジグビー(ZigBee)モジュール、Z−Waveモジュール、または赤外線モジュールなどのような近距離用のネットワークインターフェースを含むことができる。また、通信部104は、その他のネットワークインターフェースを含むことができる。
【0063】
表示部105は、画面を表示することができる。制御部102は、表示部105が画面を表示するように表示部105を制御することができる。表示部105は、使用者インターフェースを表示することができる。表示部105は、使用者からの入力に対する応答として、他の画面を表示することができる。
【0064】
表示部105は、データを表示することができる。表示部105は、制御部102によって行われた演算結果を表示することができる。表示部105は、保存部103に保存されたデータを表示することができる。表示部105は、通信部104によって受信されたデータを表示することができる。例えば、表示部105は、第1サーバー200から受信された音声認識結果を表示することができる。
【0065】
表示部105は、例えば、LCD(Liquid Crystal Display)、OLED(Organic Light Emitting Diode)、またはPDP(Plasma Display Panel)などの平板表示装置を含むことができる。表示部105は、曲面ディスプレイまたはフレクシブルディスプレイ(flexible display)を含むことができる。表示部105は、タッチスクリーンを含むことができる。
【0066】
第2通訳装置150は、端末であることができる。以下では、説明の便宜のために、第2通訳装置150を指す用語として、第2通訳装置150及び第2端末150を混用することにする。第2端末150は、第1端末100と互いに同じ種類の端末であることもでき、互いに異なる種類の端末であることもできる。第2端末150は、プログラムまたはアプリケーションを実行することができる。
【0067】
第2端末150は、通信網に連結されることができる。第2端末150は、前記通信網を介して外部の他の装置と互いに連結されることができる。第2端末150は、互いに連結された他の装置にデータを伝送したり、前記他の装置からデータを受信することができる。
【0068】
第2端末150は、前記第1端末100と互いに連結されることができる。第2端末150は、前記通信網を介して前記第1端末100と互いに連結されることができる。第2端末150は、第1端末100にデータを伝送したり、第1端末100からデータを受信することができる。
【0069】
互いに連結された第1端末100及び第2端末150は、互いにメッセージ、ファイル、音声データ、映像、または動画などを送受信することができる。また、第1端末100及び第2端末150は、互いに音声通話または映像通話(video call)をすることができる。
【0070】
第1端末100及び第2端末150は、互いに直接データを送受信することができる。また、第1端末100及び第2端末150は、第1サーバー200、第2サーバー300、第3サーバー400、または他の仲介装置を経由して、互いにデータを送受信することができる。
【0071】
第1端末100の使用者が使用する言語及び第2端末150の使用者が使用する言語は、互いに同一または互いに異なることができる。第1端末100の使用者が使用する言語は、第1言語であることができる。第1言語は、例えば、韓国語、英語、日本語、中国語、ドイツ語、フランス語、スペイン語、またはイタリア語などであることができる。第2端末150の使用者が使用する言語は、第2言語であることができる。第2言語は、例えば、韓国語、英語、日本語、中国語、ドイツ語、フランス語、スペイン語、またはイタリア語などであることができる。第1言語及び第2言語は、互いに同一または互いに異なることができる。
【0072】
第1サーバー200は、第1端末100または第2端末150と互いに連結されることができる。第1サーバー200が第1端末100と互いに連結された場合、第1サーバー200は、第1端末100と通信網を介して互いにデータを送受信することができる。第1サーバー200が第2端末150と互いに連結された場合、第1サーバー200は、第2端末150と通信網を介して互いにデータを送受信することができる。
【0073】
第1サーバー200は、辞書(dictionary)サーバーであることができる。第1サーバー200は、辞書サービスを提供することができる。第1サーバー200は、第1端末100または第2端末150から第1言語の単語を受信することができる。第1サーバー200は、前記受信された第1言語の単語を用いて、前記第1言語の単語の意味と互いに同一または類似の意味を有する第2言語の単語を取得することができる。第1サーバー200は、前記取得された第2言語の単語を第1端末100または第2端末150に伝送することができる。
【0074】
第2サーバー300は、第1端末100または第2端末150と互いに連結されることができる。第2サーバー300が第1端末100と互いに連結された場合、第2サーバー300は、第1端末100と通信網を介して互いにデータを送受信することができる。第2サーバー300が第2端末150と互いに連結された場合、第2サーバー300は、第2端末150と通信網を介して互いにデータを送受信することができる。
【0075】
第2サーバー300は、翻訳サーバーであることができる。第2サーバー300は、翻訳サービスを提供することができる。第2サーバー300は、第1端末100または第2端末150から第1言語の文章を受信することができる。第2サーバー300は、前記受信された第1言語の文章を用いて、前記文章の第2言語への翻訳文を取得することができる。第2サーバー300は、前記取得された翻訳文を第1端末100または第2端末150に伝送することができる。
【0076】
第3サーバー400は、第1端末100または第2端末150と互いに連結されることができる。第3サーバー400が第1端末100と互いに連結された場合、第3サーバー400は、第1端末100と通信網を介して互いにデータを送受信することができる。第3サーバー400が第2端末150と互いに連結された場合、第3サーバー400は、第2端末150と通信網を介して互いにデータを送受信することができる。
【0077】
第3サーバー400は、音声認識サーバーであることができる。第3サーバー400は、音声認識サービスを提供することができる。第3サーバー400は、第1端末100または第2端末150からエンコードされた音声を受信することができる。第3サーバー400は、前記エンコードされた音声を用いて音声認識を行うことができる。第3サーバー400は、前記音声認識の結果として、前記エンコードされた音声をテキストに変換することができる。第3サーバー400は、前記変換されたテキストを第1端末100または第2端末150に伝送することができる。
【0078】
以下では、図3図25を参照して、実施例に係る通訳方法内での通訳装置100、150のより具体的な動作について詳細に説明することにする。
【0079】
図3は、実施例に係る第1端末100によって通訳方法が行われる過程を示すフローチャートである。図3を参照すると、実施例に係る通訳方法においては、まず、第1端末100が第1言語の音声を連続的に受信する段階S100が行われることができる。
【0080】
第1端末100の使用者は、第1端末100に向かって第1言語で話をすることができる。また、外部の再生装置は、第1端末100に向かって第1言語の音声を再生することができる。前記第1言語は、例えば、韓国語、英語、日本語、中国語、ドイツ語、フランス語、スペイン語、またはイタリア語などであることができる。
【0081】
図4は、実施例に係る第1端末100が第1言語の音声を連続的に受信する段階S100を説明するための参考図である。図4に示すように、第1端末100の使用者は、第1端末100に向かって英語で話をすることができる。すなわち、前記第1言語は、英語であることができる。使用者は、「I love you. Do you love me?」のように英語の2つの文章を話すことができる。
【0082】
第1端末100は、第1端末100の入力部101に含まれたマイクを介して前記第1言語の音声を連続的に受信することができる。第1端末100は、使用者が話すのと同時に前記音声を受信することができる。使用者が話をすると、第1端末100は、前記音声をリアルタイムで受信することができる。使用者が継続して話をする場合、第1端末100は、前記音声を継続して受信することができる。
【0083】
再び図3を参照すると、次に、前記受信されている音声を連続的にエンコードする段階S110が行われることができる。第1端末100の制御部102は、入力部101によって連続的に受信されている前記音声をエンコードすることができる。前記音声が受信されている途中に、第1端末100の制御部102は、現在までに受信された前記音声のうちの少なくとも一部を連続的にエンコードすることができる。
【0084】
制御部102は、前記音声をエンコードすることによって、アナログ信号である前記音声をデジタル信号であるエンコードされた音声に変換することができる。前記エンコードされた音声は、保存部103に保存されることができる。制御部102は、アコースティックエコーキャンセレーション(acoustic echo cancellation)を行うことによって、エコー現象を減らすことができる。
【0085】
制御部102は、前記受信されている音声を連続的にエンコードすることができる。制御部102は、前記音声が受信されると同時に前記音声をエンコードすることができる。前記音声が受信されると、制御部102は、前記音声をリアルタイムでエンコードすることができる。前記音声が継続して受信されている場合、制御部102は、前記音声を継続してエンコードすることができる。
【0086】
次に、前記エンコードされた音声を第3サーバー400に連続的に伝送する段階S120が行われることができる。第3サーバー400は、音声認識サービスを提供するサーバーであることができる。前記音声が受信されている途中に、第1端末100の通信部104は、現在までにエンコードされた前記音声のうちの少なくとも一部を前記第3サーバー400に連続的に伝送することができる。
【0087】
第1端末100の通信部104は、前記エンコードされた音声を第3サーバー400に連続的に伝送することができる。通信部104は、前記音声がエンコードされると同時に前記エンコードされた音声を第3サーバー400に伝送することができる。前記音声がエンコードされると、通信部104は、前記エンコードされた音声をリアルタイムで伝送することができる。前記音声が継続してエンコードされている場合、通信部104は、前記エンコードされた音声を継続して伝送することができる。
【0088】
また、追加的に、第1端末100の通信部104は、前記エンコードされた音声を第2端末150に連続的に伝送することができる。通信部104は、前記音声がエンコードされると同時に前記エンコードされた音声を第2端末150に伝送することができる。第2端末150は、第1端末100から前記エンコードされた音声を連続的に受信することができる。第2端末150は、前記受信されたエンコードされた音声を連続的にデコードすることができる。第2端末150は、前記デコードされた音声を連続的に再生することができる。
【0089】
次に、前記第3サーバー400から前記エンコードされた音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階S130が行われることができる。前記エンコードされた音声の送信に対する応答として、第1端末100の通信部104は、第3サーバー400から前記エンコードされた音声に対する音声認識結果を受信することができる。前記音声が受信されている途中に、第1端末100の通信部104は、第1サーバー200から前記音声認識結果を連続的に受信することができる。
【0090】
通信部104は、前記音声認識結果を前記第1言語のテキストとして受信することができる。前記第1言語が英語である場合、通信部104は、前記音声認識結果として英語のテキストを受信することができる。
【0091】
第3サーバー400は、前記エンコードされた音声が認識されると同時に、前記音声認識結果を第1端末100に伝送することができる。前記エンコードされた音声が認識されると、第3サーバー400は、前記音声認識結果をリアルタイムで伝送することができる。前記エンコードされた音声が継続して認識されている場合、第3サーバー400は、前記音声認識結果を継続して伝送することができる。第1端末100の通信部104は、前記音声認識結果を前記第3サーバー400から連続的に受信することができる。
【0092】
次に、前記受信された音声認識結果を第2端末150に連続的に伝送する段階S140が行われることができる。前記音声が受信されている途中に、第1端末100の通信部104は、前記受信された音声認識結果を前記第2端末150に連続的に伝送することができる。前記エンコードされた音声を伝送している途中に、通信部104は、前記音声認識結果を第2端末150に連続的に伝送することができる。
【0093】
第1端末100の通信部104は、前記受信された音声認識結果を第2端末150に連続的に伝送することができる。通信部104は、前記音声認識結果が受信されると同時に、前記音声認識結果を第2端末150に伝送することができる。前記音声認識結果が受信されると、通信部104は、前記音声認識結果をリアルタイムで伝送することができる。前記音声認識結果が継続して受信されている場合、通信部104は、前記音声認識結果を継続して伝送することができる。
【0094】
第2端末150は、第1端末100から前記音声認識結果を連続的に受信することができる。第2端末150は、前記受信された音声認識結果を連続的に表示することができる。
【0095】
次に、前記受信されている音声内から終結した文章を検出する段階S150が行われることができる。終結した文章とは、一つの完全な文章が完成するために必要なすべての文章成分を含む文章を指すことができる。前記音声が受信されている途中に、第1端末100の制御部102は、現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。前記音声認識結果が第2端末150に連続的に伝送される途中に、第1端末100の制御部102は、現在までに伝送された前記音声認識結果内から少なくとも一つ以上の終結した文章を検出することができる。
【0096】
例えば、現在まで第2端末150に伝送された音声認識結果が図4の2つの文章中で「I love you. Do」の部分であると仮定することにする。制御部102は、前記の部分で一つの終結した文章として「I love you.」を検出することができる。
【0097】
再び図3を参照すると、次に、前記検出された文章に対応する前記第1言語のテキストを第2サーバー300に伝送する段階S160が行われることができる。前記第2サーバー300は、翻訳サービスを提供するサーバーであることができる。第1端末100の通信部104は、前記検出された文章を第1言語のテキストとして、第2サーバー300に伝送することができる。前記音声が受信されている途中に、通信部104は、前記検出された少なくとも一つ以上の終結した文章を第2サーバー300に伝送することができる。例えば、通信部104は、英語のテキスト「I love you.」を第2サーバー300に伝送することができる。
【0098】
次に、前記第2サーバー300から前記検出された文章の第2言語への翻訳文を前記第2言語のテキストとして受信する段階S170が行われることができる。第2サーバー300は、第1言語の文章を前記文章の第2言語への翻訳文に変換することができる。第2サーバー300は、前記変換された翻訳文を第1端末100に伝送することができる。
【0099】
前記検出された文章の送信に対する応答として、第1端末100の通信部104は、第2サーバー300から前記検出された文章の第2言語への翻訳文を受信することができる。前記音声が受信されている途中に、第1端末100の通信部104は、第2サーバー300から前記伝送されたテキストの第2言語への翻訳文を受信することができる。通信部104は、前記第2言語への翻訳文として第2言語のテキストを受信することができる。
【0100】
前記第2言語は、例えば、韓国語であることができる。通信部104は、「I love you.」の第2言語への翻訳文として、「私はあなたを愛しています。」を受信することができる。
【0101】
次に、前記受信された翻訳文を前記第2端末150に伝送する段階S180が行われることができる。第1端末100の通信部104は、前記受信された翻訳文を第2端末150に伝送することができる。前記音声が受信されている途中に、第1端末100の通信部104は、前記受信された翻訳文を第2端末150に伝送することができる。
【0102】
第2端末150は、第1端末100から前記第2言語への翻訳文を受信することができる。第2端末150は、第1言語で表示されていた音声認識結果に含まれた前記終結した文章を前記受信された翻訳文に置換することができる。
【0103】
図5は、実施例に係る第2端末150によって通訳方法が行われる過程を示すフローチャートである。図5を参照すると、まず、第1端末100から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階S200が行われることができる。
【0104】
第1端末100は、第3サーバー400から受信された音声認識結果を第2端末150に連続的に伝送する段階S140を行うことができる。前記音声認識結果の送信に対応して、第2端末150の通信部104は、第1端末100から前記音声認識結果を連続的に受信することができる。第1端末100が前記音声認識結果を継続して伝送する場合、第2端末150は、前記音声認識結果を継続して受信することができる。第2端末150の保存部103は、前記受信された音声認識結果を保存することができる。
【0105】
次に、前記受信された音声認識結果を連続的に表示する段階S210が行われることができる。前記音声認識結果が受信される途中に、第2端末150の表示部105は、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示することができる。
【0106】
第2端末150の表示部105は、前記音声認識結果を連続的に表示することができる。表示部105は、前記音声認識結果が受信されると同時に、前記音声認識結果を表示することができる。前記音声認識結果が受信されると、表示部105は、前記音声認識結果をリアルタイムで表示することができる。前記音声認識結果が継続して受信されている場合、表示部105は、前記音声認識結果を継続して表示することができる。
【0107】
また、第2端末150の通信部104は、第1端末100から前記音声がエンコードされることによって生成された音声データを連続的に受信することができる。第2端末150は、前記受信された音声データをデコードすることができる。第2端末150は、前記デコードされた音声を連続的に再生することができる。前記音声が再生する途中に、第2端末150の表示部105は、現在までに受信された前記音声認識結果中から少なくとも一部を連続的に表示することができる。
【0108】
これにより、前記音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する前であっても、第1端末100の使用者が話した言葉がリアルタイムで第2端末150に表示されることができる。前記第1言語の単語の発音と前記第2言語の単語の発音は、互いに全く異なるにもかかわらず、第1言語の単語の表記と前記単語に対応する第2言語の単語の表記が互いに類似していることがあり得る。したがって、第1端末100の使用者が音声を介して話した言葉を第2端末150の使用者が全く理解できない場合であっても、第2端末150の使用者は、第2端末150に表示された第1言語の単語から助けを受けることができる。
【0109】
したがって、実施例によれば、前記音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する前であっても、第1端末100の使用者が話した言葉の意味を第2端末150の使用者がより早く理解することができる。すなわち、第1端末100の使用者が話した言葉の意味を第2端末150の使用者が理解できるまで第2端末150の使用者が待たなければならない時間が短縮されることができる。したがって、実施例によれば、よりスムーズな使用者経験が提供されることができる。また、実施例によれば、反応性が向上した使用者経験が提供されることができる。また、実施例によれば、改善された使用者経験が提供されることができる。
【0110】
図6図8は、実施例に係る受信された音声認識結果を連続的に表示する段階S210を説明するための参考図である。図6を参照すると、第2端末150は、英語の音声の音声認識結果として、「I」を受信することができる。第2端末150の表示部105は、「I」を表示することができる。図7を参照すると、第2端末150は、音声認識結果として「Love」を追加的に受信することができる。第2端末の表示部105は、「I love」を表示することができる。図8を参照すると、第2端末150は、音声認識結果として「you do you」を追加的に受信することができる。第2端末の表示部105は、「I love you do you」を表示することができる。
【0111】
再び図5を参照すると、次に、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階S220が行われることができる。前記音声認識結果が表示される途中に、第2端末150は、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章の前記第2言語への翻訳文を取得することができる。
【0112】
第1端末100は、前記音声認識結果に含まれた終結した文章の第2言語への翻訳文を第2端末150に伝送する段階S180を行うことができる。前記翻訳文の送信に対する応答として、第2端末150は、第1端末100から前記翻訳文を受信することができる。
【0113】
また、他の実施例によれば、第2端末150は、第1端末100から前記翻訳文を受信する代わりに、他の方法を用いて、前記翻訳文を取得することができる。例えば、第2端末150は、第2サーバー300から前記翻訳文を受信することによって前記翻訳文を取得することができる。図9は、他の実施例に係る、表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階S220が行われる過程を示すフローチャートである。
【0114】
図9を参照すると、まず、前記表示された音声認識結果内から前記終結した文章を検出する段階S221が行われることができる。第2端末150の制御部102は、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。
【0115】
例えば、図8を参照すると、現在までに表示された音声認識結果は、「I love you do you」であることができる。第2端末150の制御部102は、前記音声認識結果内から一つの終結した文章として「I love you.」を検出することができる。
【0116】
再び図9を参照すると、次に、前記終結した文章を第2サーバー300に伝送する段階S222が行われることができる。第2端末150の通信部104は、前記検出された文章を第2サーバー300に伝送することができる。第2サーバー300は、第2端末150から前記検出された文章を受信することができる。第2サーバー300は、前記受信された文章を第2言語に翻訳することができる。第2サーバー300は、第2言語への翻訳文を第2端末150に伝送することができる。
【0117】
次に、前記終結した文章の前記第2言語への翻訳文を前記第2サーバー300から受信する段階S223が行われることができる。第2端末150の通信部104は、第2サーバー300から前記翻訳文を受信することができる。例えば、第2端末150は、韓国語の前記翻訳文として「私はあなたを愛しています。」を受信することができる。
【0118】
また他の実施例によれば、第2端末150は、他の方法を用いて前記翻訳文を取得することができる。例えば、第2端末150は、翻訳文データベースから前記翻訳文を取得することができる。図10は、また他の実施例に係る、表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階S220が行われる過程を示すフローチャートである。
【0119】
図10を参照すると、まず、前記表示された音声認識結果内から前記終結した文章を検出する段階S231が行われることができる。第2端末150の制御部102は、現在までに表示された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。
【0120】
次に、第2データベースにおいて、前記終結した文章を照会する段階S232が行われることができる。第2端末150の保存部103は、前記第2データベースを含むことができる。他の実施例によれば、前記第2データベースは、第2端末150の外部に配置されることができる。
【0121】
前記第2データベースは、翻訳文データベースであることができる。前記第2データベースは、第1言語の文章及び前記文章の第2言語への翻訳文が保存されたリレーショナルデータベース(relational data base)であることができる。前記第2データベースに含まれたそれぞれのレコードは、第1言語の文章及び前記文章の第2言語への翻訳文を含むことができる。
【0122】
第2端末150の制御部102は、前記第2データベースにおいて、第1言語の前記終結した文章を照会することができる。これにより、制御部102は、前記終結した文章に対応する翻訳文が前記第2データベース内に存在するか否かを判定することができる。
【0123】
次に、もし前記終結した文章に対応する前記第2言語への翻訳文が前記第2データベース内に存在する場合、前記照会の結果として、前記翻訳文を前記第2データベースから取得する段階S233が行われることができる。もし前記終結した文章に対応するレコードが前記第2データベースに含まれている場合、第2端末150の制御部102は、第2データベースから前記翻訳文を取得することができる。
【0124】
もし前記第2データベースが前記終結した文章に対応するレコードを含まない場合、第2端末150は、第2サーバー300から前記翻訳文を受信することによって前記翻訳文を取得することができる。図11は、また他の実施例に係る、表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階S220が行われる過程を示すフローチャートである。
【0125】
図11を参照すると、まず、前記表示された音声認識結果内から前記終結した文章を検出する段階S241が行われることができる。次に、第2データベースにおいて、前記終結した文章を照会する段階S242が行われることができる。
【0126】
次に、もし前記終結した文章に対応する前記第2言語への翻訳文が前記第2データベース内に存在しない場合、前記終結した文章を第2サーバー300に伝送する段階S243が行われることができる。第2端末150の通信部104は、前記終結した文章を第2サーバー300に伝送することができる。第2サーバー300は、前記終結した文章を受信することができる。第2サーバー300は、前記終結した文章を第2言語に翻訳することができる。第2サーバー300は、前記第2言語への翻訳文を第2端末150に伝送することができる。
【0127】
次に、前記終結した文章の前記第2言語への翻訳文を前記第2サーバー300から受信する段階S244が行われることができる。第2端末150の通信部104は、前記翻訳文を第2サーバー300から受信することができる。
【0128】
次に、前記終結した文章及び前記受信された第2言語への翻訳文を前記第2データベース内にキャッシュ(cache)する段階S245が行われることができる。第2端末150は、前記終結した文章及び前記受信された第2言語への翻訳文を前記第2データベースに保存することができる。第2データベースは、前記終結した文章及び前記受信された翻訳文を含むレコードを新たに生成することができる。これにより、次回に第2データベースにおいて、前記終結した文章が照会されると、第2端末150が前記照会の結果として前記翻訳文を取得できるように準備されることができる。
【0129】
再び図5を参照すると、次に、表示された前記終結した文章を前記取得された翻訳文に置換する段階S250が行われることができる。第2端末150の表示部105は、表示された前記終結した文章を前記取得された翻訳文に置換することができる。前記音声認識結果が表示される途中に、表示部105は、前記少なくとも一つ以上の終結した文章を前記取得された翻訳文に置換することができる。
【0130】
図12は、実施例に係る表示された終結した文章を取得された翻訳文に置換する段階S250を説明するための参考図である。図12に示すように、表示部105は、図8に表示された「I love you」を「私はあなたを愛しています。」に置換することができる。
【0131】
第2端末150の通信部104は、その後も継続して第1端末100から第1言語の音声認識結果を受信することができる。第2端末150の表示部105は、その後も継続して前記受信された音声認識結果を表示することができる。例えば、図13に示すように、通信部104は、前記音声認識結果として「love me」を追加的に受信することができる。表示部105は、「私はあなたを愛しています。do you love me」のように表示することができる。
【0132】
また、第2端末150の制御部102は、その後も継続して第1言語で表示された前記音声認識結果内から終結した文章を検出することができる。図13を参照すると、制御部102は、「do you love me」の部分を一つの終結した文章として検出することができる。制御部102は、前記検出された文章の第2言語への翻訳文を取得することができる。第2端末150の表示部105は、前記検出された文章を前記取得された翻訳文に置換することができる。例えば、図14に示すように、表示部105は、「do you love me」の部分を「あなたは私を愛していますか?」に置換することができる。
図15は、他の実施例に係る、第2端末150によって通訳方法が行われる過程を示すフローチャートである。図15を参照すると、まず、第1端末100から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階S300が行われることができる。次に、前記受信された音声認識結果を連続的に表示する段階S310が行われることができる。
【0133】
次に、前記第1言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第2言語の単語に連続的に置換する段階S320が行われることができる。第2端末150の表示部105は、第1言語で表示されたそれぞれの単語を前記第2言語の単語に連続的に置換することができる。
【0134】
これにより、前記音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する前であっても、第2端末150の使用者が意味を理解できる単語が最大限早く表示されることができる。したがって、第1端末100の使用者が話した言葉の意味を第2端末150の使用者が理解できるまで第2端末150の使用者が待たなければならない時間が短縮されることができる。したがって、実施例によれば、よりスムーズな使用者経験が提供されることができる。また、実施例によれば、反応性が向上した使用者経験が提供されることができる。また、実施例によれば、改善された使用者経験が提供されることができる。
【0135】
図16は、実施例に係る音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階S320が行われる過程を示すフローチャートである。図16を参照すると、まず、前記第1言語で表示された前記それぞれの単語と同一または類似の意味を有する前記第2言語の単語を前記第1端末100または第1サーバー200から受信する段階S321が行われることができる。
【0136】
例えば、図6に示すように音声認識結果として現在までに「I」が受信されて表示されたと仮定することにする。第2端末150の通信部104は、前記音声認識結果に含まれたそれぞれの単語に対応する第2言語の単語を受信することができる。すなわち、通信部104は、「I」に対応する韓国語の単語である「私は」を受信することができる。
【0137】
第1端末100は、第2端末150に前記音声認識結果を伝送した後に、前記音声認識結果に含まれたそれぞれの単語に対応する第2言語の単語を第2端末に伝送することができる。通信部104は、前記第2言語の単語を前記第1端末100から受信することができる。
【0138】
他の実施例によれば、第1端末100は、第2端末150に前記音声認識結果を伝送した後に、前記音声認識結果に含まれたそれぞれの単語を第1サーバー200に伝送することができる。第1サーバー200は、辞書(dictionary)サービスを提供するサーバーであることができる。第1サーバー200は、前記音声認識結果に含まれたそれぞれの単語を受信することができる。第1サーバー200は、前記それぞれの単語を前記単語に対応する第2言語の単語に変換することができる。第1サーバー200は、前記変換された第2言語の単語を第2端末150に伝送することができる。通信部104は、前記第2言語の単語を前記第1サーバー200から受信することができる。
【0139】
再び図16を参照すると、次に、前記第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換する段階S322が行われることができる。第2端末150の表示部105は、第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換することができる。
【0140】
図17図19は、実施例に係る音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階S322を説明するための参考図である。図17に示すように、第2端末150の制御部102は、前記音声認識結果に含まれた「I」を韓国語の単語である「私は」に置換することができる。また、第2端末150の通信部104は、音声認識結果として「love you」を追加的に受信することができる。第2端末150の表示部105は、前記受信された音声認識結果を追加的に表示することができる。これにより、第2端末150の表示部105には「私はlove you」が表示されることができる。
【0141】
図18を参照すると、第2端末150の通信部104は、前記第1言語で表示された音声認識結果に含まれた単語のうち、「love」に対応する韓国語の単語である「愛情」を受信することができる。第2端末150の表示部105は、「Love」を「愛情」に置換することができる。また、第2端末150の通信部104は、音声認識結果として「do you」を追加的に受信することができる。第2端末150の表示部105は、前記受信された音声認識結果を追加的に表示することができる。これにより、第2端末150の表示部105には、「私は愛情you do you」が表示されることができる。
【0142】
図19を参照すると、第2端末150の通信部104は、前記第1言語で表示された音声認識結果に含まれた単語のうち、「you」及び「do」にそれぞれ対応する韓国語の単語である「あなた」及び「する」を受信することができる。第2端末150の表示部105は、「you」を「あなた」に置換し、「do」を「する」に置換することができる。また、第2端末150の通信部104は、音声認識結果として「Love」を追加的に受信することができる。第2端末150の表示部105は、前記受信された音声認識結果を追加的に表示することができる。これにより、第2端末150の表示部105には「私は愛情あなたするyou love」が表示されることができる。
【0143】
図20は、他の実施例により、音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階S330が行われる過程を示すフローチャートである。図20を参照すると、まず、前記第1言語で表示された前記それぞれの単語を第1サーバー200に伝送する段階S331が行われることができる。
【0144】
第2端末150の通信部104は、前記第1言語で表示された前記それぞれの単語を第1サーバー200に伝送することができる。第1サーバー200は、第2端末150から前記それぞれの単語を受信することができる。第1サーバー200は、前記それぞれの単語を前記単語に対応する第2言語の単語に変換することができる。第1サーバー200は、前記変換された第2言語の単語を第2端末150に伝送することができる。
【0145】
次に、前記伝送されたそれぞれの単語と同一または類似の意味を有する前記第2言語の単語を前記第1サーバー200から受信する段階S332が行われることができる。第2端末150の通信部104は、前記第2言語の単語を前記第1サーバー200から受信することができる。
【0146】
次に、前記第1言語で表示された前記それぞれの単語を前記受信された第2言語の単語に連続的に置換する段階S333が行われることができる。第2端末150の表示部105は、前記第1言語で表示された単語を前記第2言語の単語に置換することができる。
【0147】
図21は、また他の実施例により、音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階S330が行われる過程を示すフローチャートである。図21を参照すると、まず、第1データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階S341が行われることができる。
【0148】
第2端末150の保存部103は、前記第1データベースを含むことができる。他の実施例によれば、前記第1データベースは、第2端末150の外部に配置されることができる。
【0149】
前記第1データベースは、辞書データベースであることができる。前記第1データベースは、第1言語の単語及び前記単語に対応する第2言語の単語が保存されたリレーショナルデータベースであることができる。前記第1言語の単語の意味及び前記単語に対応する第2言語の単語の意味は、互いに同一または類似することができる。前記第1データベースに含まれたそれぞれのレコードは、第1言語の単語及び前記単語に対応する第2言語の単語を含むことができる。
【0150】
第2端末150の制御部102は、前記第1データベースにおいて、前記音声認識結果に含まれた第1言語の単語を照会することができる。これにより、制御部102は、前記第1言語の単語に対応する第2言語の単語が前記第1データベース内に存在するか否かを判定することができる。
【0151】
次に、もし前記照会された単語に対応する前記第2言語の単語が前記第1データベース内に存在する場合、前記照会の結果として、前記照会された単語に対応する前記第2言語の単語を前記第1データベースから取得する段階S342が行われることができる。もし、前記第1言語の単語に対応するレコードが前記第1データベースに含まれている場合、第2端末150の制御部102は、第1データベースから前記第2言語の単語を取得することができる。
【0152】
次に、前記第1言語で表示された前記照会された単語を前記取得された第2言語の単語に置換する段階S343が行われることができる。第2端末150の表示部105は、前記第1言語で表示された単語を前記第2言語の単語に置換することができる。
【0153】
もし、前記第1データベースが前記第1言語の単語に対応するレコードを含まない場合、第2端末150は、第1サーバー200から前記第1言語の単語に対応する第2言語の単語を受信することができる。図22は、また他の実施例により、音声認識結果に含まれたそれぞれの単語を第2言語の単語に連続的に置換する段階S330が行われる過程を示すフローチャートである。図22を参照すると、まず、第1データベースにおいて、前記音声認識結果に含まれたそれぞれの単語を照会する段階S351が行われることができる。
【0154】
次に、もし前記照会された単語に対応する前記第2言語の単語が前記第1データベース内に存在しない場合、前記照会された単語を第1サーバー200に伝送する段階S352が行われることができる。第2端末150の通信部104は、前記第1言語の単語を第1サーバー200に伝送することができる。
【0155】
第1サーバー200は、第2端末150から前記第1言語の単語を受信することができる。第1サーバー200は、前記単語を前記単語に対応する第2言語の単語に変換することができる。第1サーバー200は、前記変換された第2言語の単語を第2端末150に伝送することができる。
【0156】
次に、前記伝送された単語と同一または類似の意味を有する前記第2言語の単語を前記第1サーバー200から受信する段階S353が行われることができる。第2端末150の通信部104は、前記第1サーバー200から前記第2言語の単語を受信することができる。
【0157】
次に、前記伝送された単語及び前記受信された第2言語の単語を前記第1データベース内にキャッシュ(cache)する段階S354が行われることができる。第2端末150は、前記第1言語の単語及び前記受信された第2言語の単語を前記第1データベースに保存することができる。第1データベースは、前記第1言語の単語及び前記受信された第2言語の単語を含むレコードを新たに生成することができる。これにより、次回に第1データベースにおいて、前記第1言語の単語が照会されると、第2端末150が前記照会の結果として前記第2言語の単語を取得できるように準備されることができる。
【0158】
次に、前記第1言語で表示された前記伝送された単語を前記受信された第2言語の単語に置換する段階S355が行われることができる。第2端末150の表示部105は、前記第1言語で表示された単語を前記第2言語の単語に置換することができる。
【0159】
再び図15を参照すると、次に、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階S360が行われることができる。例えば、第2端末150は、前記音声認識結果に含まれた終結した文章である「I love you」の翻訳文として、「私はあなたを愛しています。」を取得することができる。
【0160】
次に、少なくとも一部が前記第2言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階S370が行われることができる。第2端末150の表示部105は、少なくとも一部がすでに第2言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換することができる。
【0161】
例えば、図19を参照すると、表示部105は、前記終結した文章である「I love you」に対応する「私は愛情あなた」を前記取得された翻訳文に置換することができる。図23に示すように、表示部105は、「私は愛情あなた」の部分を「私はあなたを愛しています。」に置換することができる。
【0162】
また、第2端末150の通信部104は、その後も継続して第1端末100から第1言語の音声認識結果を受信することができる。第2端末150の表示部105は、その後も継続して前記受信された音声認識結果を表示することができる。第2端末150の表示部105は、その後も継続して第1言語で表示された単語を前記単語に対応する第2言語の単語に置換することができる。第2端末150の表示部105は、その後も継続して終結した文章を検出することができる。第2端末150の表示部105は、その後も継続して前記検出された文章を翻訳文に置換することができる。
【0163】
例えば、図23に示すように、通信部104は、前記音声認識結果として「me」を追加的に受信することができる。表示部105は、「me」を追加的に表示することができる。表示部105は、「love」を「愛情」に置換することができる。制御部102は、「do you love me」の部分を一つの終結した文章として検出することができる。制御部102は、前記検出された文章の第2言語への翻訳文を取得することができる。第2端末150の表示部105は、「do you love me」に対応する「するあなた愛情 me」の部分を図14に示すように、「あなたは私を愛していますか?」に置換することができる。
【0164】
図24はまた他の実施例に係る第2端末150によって通訳方法が行われる過程を示すフローチャートである。図24を参照すると、まず、第1端末100から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階S400が行われることができる。次に、前記受信された音声認識結果を連続的に表示する段階S410が行われることができる。
【0165】
次に、前記第1言語の語順及び前記第2言語の語順の間の類似度を算出する段階S420が行われることができる。第2端末150の制御部102は、前記第1言語の語順及び前記第2言語の語順の間の類似度を算出することができる。
【0166】
それぞれの言語は、一つの文章内で、主語、目的語、及び他動詞が配列される特定の順序を有することができる。例えば、英語または中国語の文章内で、主語、目的語、及び他動詞は、主語、他動詞、及び目的語の順に配列されることができる。他の例として、韓国語または日本語の文章内で、主語、目的語、及び他動詞は、主語、目的語、及び他動詞の順に配列されることができる。
【0167】
第2端末150の制御部102は、第1言語の文章内で、主語、目的語、及び他動詞が配列される順序及び第2言語の文章内で、主語、目的語、及び他動詞が配列される順序を用いて前記類似度を算出することができる。第1言語が英語であり、第2言語が中国語である場合に算出された類似度は、第1言語が英語であり、第2言語が韓国語である場合に算出された類似度に比べて高いことがあり得る。
【0168】
次に、前記算出された類似度が基準値よりも大きければ、前記第1言語で表示された前記音声認識結果に含まれたそれぞれの単語を同一または類似の意味を有する前記第2言語の単語に連続的に置換する段階S430が行われることができる。逆に、前記算出された類似度が基準値よりも大きくなければ、前記第1言語の単語を前記第2言語の単語に置換する段階S430は、行われないことがある。
【0169】
もし、第1言語の語順と第2言語の語順が十分に類似していないにもかかわらず、前記第1言語の単語が前記第2言語に置換されたら、第2端末150の使用者が経験する可読性が顕著に低いことがあり得る。逆に、もし第1言語の語順と第2言語の語順が十分に類似している場合、前記第1言語の単語が前記第2言語に置換されたら、第2端末150の使用者が経験する可読性が十分に確保されることができる。したがって、実施例によれば、よりスムーズな使用者経験が提供されることができる。また、実施例によれば、反応性が向上した使用者経験が提供されることができる。また、実施例によれば、改善された使用者経験が提供されることができる。
【0170】
前記基準値は、例えば、第1言語が英語であり、第2言語が韓国語である場合に算出された類似度と互いに同一であることができる。したがって、もし第1言語が英語であり、第2言語が中国語である場合、第2端末150の表示部105は、前記第1言語で表示されたそれぞれの単語を前記単語に対応する第2言語の単語に連続的に置換することができる。
【0171】
次に、前記表示された音声認識結果に含まれた終結した文章の第2言語への翻訳文を取得する段階S440が行われることができる。次に、少なくとも一部が前記第2言語の単語に置換された前記終結した文章を前記取得された翻訳文に置換する段階S450が行われることができる。
【0172】
図25は、実施例に係るサーバーによって通訳方法が行われる過程を示すフローチャートである。前記サーバーは、第1サーバー200、第2サーバー300、または第3サーバー400であることができる。また、前記サーバーは、第1サーバー200、第2サーバー300、または第3サーバー400とは互いに異なるサーバーであることができる。前記サーバーは、第1端末100及び第2端末150と互いに連結されることができる。
【0173】
図25を参照すると、まず、第1端末100から第1言語の音声に対する音声認識結果を前記第1言語のテキストとして連続的に受信する段階S500が行われることができる。次に、前記受信された音声認識結果を第2端末150に連続的に伝送する段階S510が行われることができる。前記音声認識結果が受信される途中に、サーバーは、現在までに受信された前記音声認識結果のうちの少なくとも一部を前記第2端末150に連続的に伝送することができる。
【0174】
次に、前記受信された音声認識結果内から終結した文章を検出する段階S520が行われることができる。サーバーは、現在までに伝送された前記音声認識結果に含まれた少なくとも一つ以上の終結した文章を検出することができる。
【0175】
次に、前記検出された文章の第2言語への翻訳文を取得する段階S530が行われることができる。サーバーは、前記検出された少なくとも一つ以上の終結した文章の前記第2言語への翻訳文を取得することができる。
【0176】
次に、前記取得された翻訳文を前記第2端末150に伝送する段階S540が行われることができる。前記音声認識結果が受信される途中に、サーバーは、前記取得された翻訳文を前記第2端末150に伝送することができる。
【0177】
以上で説明された実施例によれば、映像通話をする使用者が使用する言語が互いに異なっても、各自が相手の話を聞き取ることができる。また、よりスムーズな使用者経験が提供されることができる。また、反応性が向上した使用者経験が提供されることができる。また、改善された使用者経験が提供されることができる。
【0178】
以上で説明された実施例は、コンピュータによって実行されるプログラムモジュールのようなコンピュータによって実行可能なコマンドを含む記録媒体の形態でも具現されることができる。コンピュータ判読可能な媒体は、コンピュータによってアクセスすることができる任意の使用可能媒体であることができ、揮発性及び非揮発性媒体、分離型及び非分離型媒体をすべて含むことができる。
【0179】
また、コンピュータ判読可能な媒体は、コンピュータ保存媒体または通信媒体を含むことができる。コンピュータ保存媒体は、コンピュータ判読可能なコマンド、データ構造、プログラムモジュールまたはその他のデータのような情報の保存のための任意の方法または技術で具現された揮発性及び非揮発性、分離型及び非分離型媒体をすべて含むことができる。通信媒体は、典型的にコンピュータ判読可能なコマンド、データ構造、プログラムモジュール、または搬送波のような変調されたデータ信号のその他のデータ、またはその他の送信メカニズムを含み、任意の情報伝達媒体を含むことができる。
【0180】
以上、添付された図面を参照して、本発明の実施例を説明したが、本発明が属する技術分野における通常の知識を有する者は、本発明がその技術的思想や必須的な特徴を変更せず、他の具体的な形態で実施できることを理解することができるはずである。したがって、以上で記述した実施例は、あらゆる面で例示的なものであり、限定的ではないことを理解しなければならない。
【符号の説明】
【0181】
100:第1通訳装置、第1端末
101:入力部
102:制御部
103:保存部
104:通信部
105:表示部
150:第2通訳装置、第2端末
200:第1サーバー
300:第2サーバー
400:第3サーバー
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25