IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 前田建設工業株式会社の特許一覧

特許7526593コミュニケーションシステム、コミュニケーション方法、及びプログラム
<>
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図1
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図2
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図3
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図4
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図5
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図6
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図7
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図8
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図9
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図10
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図11
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図12
  • 特許-コミュニケーションシステム、コミュニケーション方法、及びプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-24
(45)【発行日】2024-08-01
(54)【発明の名称】コミュニケーションシステム、コミュニケーション方法、及びプログラム
(51)【国際特許分類】
   G10L 15/22 20060101AFI20240725BHJP
   G06F 40/58 20200101ALI20240725BHJP
   G10L 15/00 20130101ALI20240725BHJP
   G06F 3/16 20060101ALI20240725BHJP
   G06Q 50/08 20120101ALI20240725BHJP
   G06Q 50/10 20120101ALI20240725BHJP
【FI】
G10L15/22 470Z
G06F40/58
G10L15/00 200C
G06F3/16 650
G06F3/16 620
G06Q50/08
G06Q50/10
【請求項の数】 7
(21)【出願番号】P 2020099434
(22)【出願日】2020-06-08
(65)【公開番号】P2021193421
(43)【公開日】2021-12-23
【審査請求日】2023-04-19
(73)【特許権者】
【識別番号】000201478
【氏名又は名称】前田建設工業株式会社
(74)【代理人】
【識別番号】110000154
【氏名又は名称】弁理士法人はるか国際特許事務所
(72)【発明者】
【氏名】笠松 晃次
(72)【発明者】
【氏名】新井 祐二
【審査官】渡部 幸和
(56)【参考文献】
【文献】国際公開第2020/080501(WO,A1)
【文献】特開2017-228034(JP,A)
【文献】特開2017-182394(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 15/00
G06F 40/00
G06F 3/16
G06Q 50/00
(57)【特許請求の範囲】
【請求項1】
作業員により入力された音声を取得する取得手段と、
前記音声をテキストに変換する変換手段と、
複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正手段と、
前記修正手段の修正結果を、他の作業員の言語に翻訳する翻訳手段と、
前記他の作業員に対し、前記翻訳手段により翻訳された前記修正結果を出力する出力手段と、
前記翻訳手段により翻訳された前記修正結果を、前記作業員の言語に逆翻訳する逆翻訳手段と、
前記作業員に対し、前記逆翻訳手段により逆翻訳された前記修正結果を出力する第2出力手段と、
前記作業員の操作に基づいて、前記逆翻訳手段による逆翻訳機能のオンとオフを切り替える切替手段と、
を含み、
前記第2出力手段は、前記逆翻訳機能がオンの場合に、前記逆翻訳手段により逆翻訳された前記修正結果を出力する、
ことを特徴とするコミュニケーションシステム。
【請求項2】
作業員により入力された音声を取得する取得手段と、
前記音声をテキストに変換する変換手段と、
複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正手段と、
前記修正手段の修正結果を、他の作業員の言語に翻訳する翻訳手段と、
前記他の作業員に対し、前記翻訳手段により翻訳された前記修正結果を出力する出力手段と、
前記翻訳手段により翻訳された前記修正結果を、前記作業員の言語に逆翻訳する逆翻訳手段と、
前記作業員に対し、前記翻訳手段により翻訳されていない前記修正結果を出力する第3出力手段と、
前記作業員に対し、前記第3出力手段による出力とは異なる態様で、前記逆翻訳手段により逆翻訳された前記修正結果を出力する第2出力手段と、
を含むことを特徴とするコミュニケーションシステム。
【請求項3】
作業員により入力された音声を取得する取得手段と、
前記音声をテキストに変換する変換手段と、
複数の作業現場にそれぞれ対応する複数の用語辞書の各々を管理するサーバと、
を含むコミュニケーションシステムであって、
前記サーバは、
前記複数の作業現場のうち、前記作業員が属する前記作業現場を特定する特定手段と、
前記複数の用語辞書のうち、前記特定手段により特定された作業現場に対応する用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正手段と、
を含み、
前記コミュニケーションシステムは、他の作業員に対し、前記修正手段の修正結果を出力する出力手段を更に含む、
ことを特徴とするコミュニケーションシステム。
【請求項4】
前記修正手段は、前記特有の用語と発音が同じ又は類似する前記誤変換語を、前記特有の用語に修正する、
ことを特徴とする請求項1~3の何れかに記載のコミュニケーションシステム。
【請求項5】
前記変換手段は、前記複数の作業現場に共通の用語が登録された共通辞書に基づいて、前記音声を前記テキストに変換し、
前記修正手段は、前記共通辞書では前記特有の用語に変換されなかった前記誤変換語を、前記特有の用語に修正する、
ことを特徴とする請求項1~4の何れかに記載のコミュニケーションシステム。
【請求項6】
作業員により入力された音声を取得する取得ステップと、
前記音声をテキストに変換する変換ステップと、
複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正ステップと、
前記修正ステップの修正結果を、他の作業員の言語に翻訳する翻訳ステップと、
前記他の作業員に対し、前記翻訳ステップにより翻訳された前記修正結果を出力する出力ステップと、
前記翻訳ステップにより翻訳された前記修正結果を、前記作業員の言語に逆翻訳する逆翻訳ステップと、
前記作業員に対し、前記逆翻訳ステップにより逆翻訳された前記修正結果を出力する第2出力ステップと、
前記作業員の操作に基づいて、前記逆翻訳ステップによる逆翻訳機能のオンとオフを切り替える切替ステップと、
を含み、
前記第2出力ステップは、前記逆翻訳機能がオンの場合に、前記逆翻訳ステップにより逆翻訳された前記修正結果を出力する、
ことを特徴とするコミュニケーション方法。
【請求項7】
作業員により入力された音声を取得する取得手段、
前記音声をテキストに変換する変換手段、
複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正手段、
前記修正手段の修正結果を、他の作業員の言語に翻訳する翻訳手段、
前記他の作業員に対し、前記翻訳手段により翻訳された前記修正結果を出力する出力手段、
前記翻訳手段により翻訳された前記修正結果を、前記作業員の言語に逆翻訳する逆翻訳手段、
前記作業員に対し、前記逆翻訳手段により逆翻訳された前記修正結果を出力する第2出力手段、
前記作業員の操作に基づいて、前記逆翻訳手段による逆翻訳機能のオンとオフを切り替える切替手段、
としてコンピュータを機能させ
前記第2出力手段は、前記逆翻訳機能がオンの場合に、前記逆翻訳手段により逆翻訳された前記修正結果を出力する、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コミュニケーションシステム、コミュニケーション方法、及びプログラムに関する。
【背景技術】
【0002】
近年、建設現場などの作業現場における作業員同士のコミュニケーションを円滑にするための技術が検討されている。例えば、外国人の作業員がいる建設現場では、日本人の作業員の発言を外国語に翻訳する技術も検討されている。特許文献1には、多言語で行われる会議を開始する前に、会議の議題を含む関連情報に基づいて、単語セットの中から会議に用いられる単語を抽出し、会議中の発言を翻訳する音声翻訳装置が記載されている。また例えば、特許文献2には、特定の専門分野における専門用語の辞書を利用して翻訳する言語解析システムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2017-146587号公報
【文献】特開2008-146218号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば建設業界では、個々の建設現場に特有の建設用語が存在するので、建設現場に応じたコミュニケーションを実現する必要がある。しかしながら、特許文献1の技術は、会議の議題に応じた単語を抽出して翻訳するだけなので、建設現場に特有の用語に対応することはできない。また、特許文献2のように、建設業界全般における専門用語の辞書を用意しても、個々の建設現場に特有の用語までは網羅できない。作業現場に特有の用語が用いられるのであれば、建設業界以外の業界についても同様であり、従来の技術では、作業現場に応じたコミュニケーションを実現することができなかった。
【0005】
本発明は上記課題に鑑みてなされたものであって、その目的は、作業現場に応じたコミュニケーションを実現可能なコミュニケーションシステム、コミュニケーション方法、及びプログラムを提供することである。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明の一態様に係るコミュニケーションシステムは、作業員により入力された音声を取得する取得手段と、前記音声をテキストに変換する変換手段と、複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正手段と、他の作業員に対し、前記修正手段の修正結果を出力する出力手段と、を含むことを特徴とする。
【0007】
また、本発明の一態様では、前記修正手段は、前記特有の用語と発音が同じ又は類似する前記誤変換語を、前記特有の用語に修正する、ことを特徴とする。
【0008】
また、本発明の一態様では、前記変換手段は、前記複数の作業現場に共通の用語が登録された共通辞書に基づいて、前記音声を前記テキストに変換し、前記修正手段は、前記共通辞書では前記特有の用語に変換されなかった前記誤変換語を、前記特有の用語に修正する、ことを特徴とする。
【0009】
また、本発明の一態様では、前記コミュニケーションシステムは、前記修正結果を、前記他の作業員の言語に翻訳する翻訳手段を更に含み、前記出力手段は、前記他の作業員に対し、前記翻訳手段により翻訳された前記修正結果を出力する、ことを特徴とする。
【0010】
また、本発明の一態様では、前記コミュニケーションシステムは、前記翻訳手段により翻訳された前記修正結果を、前記作業員の言語に逆翻訳する逆翻訳手段と、前記作業員に対し、前記逆翻訳手段により逆翻訳された前記修正結果を出力する第2出力手段と、を更に含むことを特徴とする。
【0011】
また、本発明の一態様では、前記コミュニケーションシステムは、前記作業員の操作に基づいて、前記逆翻訳手段による逆翻訳機能のオンとオフを切り替える切替手段を更に含み、前記第2出力手段は、前記逆翻訳機能がオンの場合に、前記逆翻訳手段により逆翻訳された前記修正結果を出力する、ことを特徴とする。
【0012】
また、本発明の一態様では、前記コミュニケーションシステムは、前記作業員に対し、前記翻訳手段により翻訳されていない前記修正結果を出力する第3出力手段を更に含み、前記第2出力手段は、前記第3出力手段による出力とは異なる態様で、前記逆翻訳手段により逆翻訳された前記修正結果を出力する、ことを特徴とする。
【0013】
また、本発明の一態様では、前記コミュニケーションシステムは、前記複数の用語辞書の各々を管理するサーバを更に含み、前記サーバは、前記修正手段と、前記複数の作業現場のうち、前記作業員が属する前記作業現場を特定する特定手段と、を含み、前記サーバの前記修正手段は、前記複数の用語辞書のうち、前記特定手段により特定された作業現場に対応する用語辞書に基づいて、前記誤変換語を、前記特有の用語に修正する、ことを特徴とする。
【0014】
また、本発明の一態様では、前記作業現場は、建設現場であることを特徴とする。
【0015】
また、本発明の一態様に係るコミュニケーション方法は、作業員により入力された音声を取得する取得ステップと、前記音声をテキストに変換する変換ステップと、複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正ステップと、他の作業員に対し、前記修正手段の修正結果を出力する出力ステップと、を含むことを特徴とする。
【0016】
また、本発明の一態様では、前記作業現場は、建設現場であることを特徴とする。
【0017】
また、本発明の一態様に係るプログラムは、作業員により入力された音声を取得する取得手段、前記音声をテキストに変換する変換手段、複数の作業現場にそれぞれ対応する複数の用語辞書のうち、前記作業員が属する前記作業現場に対応する前記用語辞書に基づいて、前記テキストに含まれる誤変換語を、前記作業員が属する前記作業現場に特有の用語に修正する修正手段、他の作業員に対し、前記修正手段の修正結果を出力する出力手段、としてコンピュータを機能させる。
【0018】
また、本発明の一態様では、前記作業現場は、建設現場であることを特徴とする。
【発明の効果】
【0019】
本発明によれば、作業現場に応じたコミュニケーションを実現できる。
【図面の簡単な説明】
【0020】
図1】実施形態に係るコミュニケーションシステムの全体構成を示す図である。
図2】作業員がグループに参加する流れを示す図である。
図3】「ジロー」のコミュニケーション画面の一例を示す図である。
図4】「ジロー」のコミュニケーション画面の一例を示す図である。
図5】「ジョイ」のコミュニケーション画面の一例を示す図である。
図6】コミュニケーションシステムで実現される機能の一例を示す機能ブロック図である。
図7】建設現場データベースのデータ格納例を示す図である。
図8】発言内容データベースのデータ格納例を示す図である。
図9】ローカル辞書のデータ格納例を示す図である。
図10】共通辞書のデータ格納例を示す図である。
図11】訳語辞書のデータ格納例を示す図である。
図12】作業員同士でコミュニケーションを取る際に実行される処理を示すフロー図である。
図13】作業員同士でコミュニケーションを取る際に実行される処理を示すフロー図である。
【発明を実施するための形態】
【0021】
[1.コミュニケーションシステムの全体構成]
図1は、実施形態に係るコミュニケーションシステムの全体構成を示す図である。図1に示すように、コミュニケーションシステムSは、サーバ10と、複数の作業員端末20と、を含み、これらはインターネット等のネットワークNに接続可能である。なお、図1では、サーバ10を1台だけ示しているが、サーバ10は複数台存在してもよい。同様に、図1では、作業員端末20を2台だけ示しているが、作業員端末20は3台以上存在してもよい。
【0022】
サーバ10は、サーバコンピュータである。例えば、サーバ10は、制御部11、記憶部12、及び通信部13を含む。制御部11は、少なくとも1つのプロセッサを含む。制御部11は、記憶部12に記憶されたプログラムやデータに従って処理を実行する。記憶部12は、主記憶部及び補助記憶部を含む。例えば、主記憶部はRAMなどの揮発性メモリであり、補助記憶部は、ハードディスクやフラッシュメモリなどの不揮発性メモリである。通信部13は、有線通信又は無線通信用の通信インタフェースを含み、例えば、ネットワークNを介してデータ通信を行う。
【0023】
作業員端末20は、作業員が操作するコンピュータである。作業員は、作業現場で作業を行う人間である。本実施形態では、作業現場の一例として建設現場を説明する。このため、作業員は、建設現場における労働者であり、コミュニケーションシステムSのユーザである。建設現場は、作業員が作業をする場所であり、例えば、住宅やビルなどの建築現場若しくは解体現場、又は、道路やトンネルなどの工事現場である。建設現場では、複数の作業員の各々がコミュニケーションを取って作業を行う。作業員は、音声及びテキストの少なくとも一方を利用してコミュニケーションを取る。なお、建設現場から離れた場所にいる作業員がコミュニケーションシステムSを利用してもよい。例えば、遠隔地にいる作業員と、建設現場にいる作業員と、がコミュニケーションを取ってもよい。
【0024】
例えば、作業員端末20は、携帯電話機(スマートフォンを含む)、携帯情報端末(タブレット型コンピュータ及びウェアラブル端末を含む)、又はパーソナルコンピュータである。例えば、作業員端末20は、制御部21、記憶部22、通信部23、操作部24、表示部25、撮影部26、音声入力部27、及び音声出力部28を含む。制御部21、記憶部22、及び通信部23の物理的構成は、それぞれ制御部11、記憶部12、及び通信部13と同様であってよい。
【0025】
操作部24は、入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスやキーボード等を含む。表示部25は、例えば、液晶表示部又は有機EL表示部等である。撮影部26は、少なくとも1つのカメラを含む。音声入力部27は、少なくとも1つのマイクを含む。音声入力部27は、マイクを接続可能な音声入力端子を含んでもよい。音声出力部28は、少なくとも1つのスピーカーを含む。音声出力部28は、イヤホンやヘッドホンなどを接続可能な音声出力端子を含んでもよい。
【0026】
なお、記憶部12,22に記憶されるものとして説明するプログラム及びデータは、ネットワークNを介して供給されてもよい。また、サーバ10及び作業員端末20のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、コンピュータ読み取り可能な情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)や外部機器と直接的に接続するための入出力部(例えば、USB端子)が含まれてもよい。この場合、情報記憶媒体に記憶されたプログラムやデータが読取部又は入出力部を介して供給されてもよい。
【0027】
[2.コミュニケーションシステムの概要]
本実施形態では、日本人の作業員と外国人の作業員がコミュニケーションを取る場面を例に挙げて、コミュニケーションシステムSで実行される処理を説明する。例えば、作業員は、自身の作業員端末20にインストールされた翻訳アプリを利用して、使用言語が異なる他の作業員とコミュニケーションを取る。
【0028】
例えば、複数の建設現場の各々に、その建設現場のグループに参加するための2次元コードが掲示されている。グループは、コミュニケーションを取る作業員の集団である。グループは、情報共有の単位ということもできる。ある作業員が作業員端末20に入力した発言は、同じグループに属する他の作業員の使用言語に翻訳されたうえで、他の作業員の作業員端末20に送信される。同じグループに同じ言語を使用する作業員が含まれていた場合には、その作業員の作業員端末20に対しては、作業員が入力した言語の発言がそのまま送信される。
【0029】
2次元コードは、紙に印刷された状態で建設現場に掲示されてもよいし、管理権限のある作業員の作業員端末20に表示されてもよい。例えば、2次元コードには、建設現場を一意に識別する建設現場IDが含まれている。作業員は、作業員端末20を操作して2次元コードを撮影して建設現場のグループに参加する。
【0030】
本実施形態では、2次元コードに有効期限が定められている。作業員は、2次元コードの有効期限が切れるまでの間、自身の建設現場のグループに参加できる。有効期限が切れると、作業員はグループから退出(離脱)し、他の作業員とコミュニケーションを取れなくなる。2次元コードの有効期限は、任意の長さであってよく、例えば、数時間程度、1日~数週間程度、又は数ヶ月程度であってよい。2次元コードに有効期限を設けることにより、ある建設現場で働かなくなった作業員に、その建設現場の発言内容を知られないようにすることができ、機密情報の漏えいを防止できる。
【0031】
各建設現場の2次元コードの有効期限が切れると、その建設現場の2次元コードが再発行される。再発行された2次元コードには、新たな有効期限が設定される。即ち、各建設現場には、有効期限が切れるたびに2次元コードが発行されて掲示される。作業員は、有効期限が切れるたびに、自身の建設現場に掲示された2次元コードを撮影してグループに参加する。
【0032】
図2は、作業員がグループに参加する流れを示す図である。図2に示すように、作業員が作業員端末20を操作して翻訳アプリを起動させると、作業員端末20に撮影画面G1が表示される。撮影画面G1には、撮影部26が連続的に撮影した画像が表示される。作業員が建設現場に掲示された2次元コードを撮影すると、作業員端末20には、作業員の使用言語を選択するための言語選択画面G2が表示される。
【0033】
言語選択画面G2には、2次元コードが掲示された建設現場の契約者名と作業所名が表示される。作業員は、入力フォームF20に自身の会社名を入力し、入力フォームF21に自身の表示名を入力する。表示名は、他の作業員とコミュニケーションを取る際の名前である。作業員は、本名を入力してもよいが、本実施形態では個人情報保護の観点でニックネームを入力するものとする。
【0034】
入力フォームF22には、翻訳アプリが対応する複数の言語が選択可能に表示される。本実施形態では、日本語、英語、及びベトナム語の3つの言語が選択可能な場合を説明する。使用言語は、任意の言語であってよく、本実施形態の例に限られない。図2の例では、デフォルトの言語として日本語が選択されているが、作業員が他の言語を選択すると、言語選択画面G2における表示もその言語に変更される。
【0035】
作業員が入力フォームF22に使用言語を入力してボタンB23を選択すると、グループへの参加が完了する。先述したように、2次元コードの有効期限が切れている場合には、グループには参加できない。なお、作業員がボタンB24を選択すると、グループへの参加を取りやめることができる。
【0036】
グループへの参加が完了すると、作業員は、同じグループの他の作業員とコミュニケーションを取ることができるようになる。作業員は、建設現場全体のグループの中でコミュニケーションを取ってもよいが(同じグループに参加した全員とコミュニケーションを取ってもよいが)、本実施形態では、同じグループの一部の作業員同士でコミュニケーションを取るためのサブグループを作成できる。
【0037】
以降、建設現場全体のグループをメイングループと記載して、サブグループと区別する。サブグループは、メイングループに参加した作業員全員が作成できてもよいし、管理権限を有する作業員だけが作成できてもよい。作業員が翻訳アプリから所定の操作をすると、サブグループを作成するための作成画面G3が作業員端末20に表示される。
【0038】
作業員が入力フォームF30にサブグループ名を入力してボタンB31を選択すると、サブグループが作成される。なお、作業員がボタンB32を選択すると、サブグループの作成を取りやめることができる。本実施形態では、作業員がサブグループを作成すると、同じメイングループに属する他の作業員を招待するための招待コードが発行される。
【0039】
招待コードは、サブグループに参加するための認証情報であり、例えば、所定桁数の数値である。招待コードは、他のサブグループと重複しないように発行される。サブグループを作成した作業員は、招待したい他の作業員に対し、招待コードを通知する。招待コードの通知は、口頭で行われてもよいし、メールなどのツールが利用されてもよい。招待コードを含む2次元コードを作業員端末20に表示させ、他の作業員の作業員端末20で撮影させることによって、他の作業員をサブグループに招待してもよい。
【0040】
他の作業員は、自身の作業員端末20を操作してメイングループに参加し、招待コードを入力すると、その招待コードに対応するサブグループに参加できる。サブグループに参加した各作業員は、翻訳アプリから所定の操作をすると、サブグループを管理するための管理画面G4を表示させることができる。
【0041】
管理画面G4には、サブグループ名、招待コード、サブグループに登録中の作業員の表示名、使用言語、及び退出の有無などが表示される。作業員は、ボタンB40を選択して、サブグループから退出することもできる。また、作業員が閉じるボタンB41を選択すると、管理画面G4を閉じることができる。
【0042】
図2の例では、「Zグループ」というサブグループに、日本語を話す「ジロー」、英語を話す「ジョイ」、及びベトナム語を話す「グエン」の3人が参加している。サブグループに参加した作業員が翻訳アプリから所定の操作をすると、サブグループ内でコミュニケーションを取るためのコミュニケーション画面が作業員端末20に表示される。
【0043】
図3及び図4は、「ジロー」のコミュニケーション画面の一例を示す図である。図3及び図4に示すように、コミュニケーション画面G5には、「ジロー」が参加中のメイングループ名とサブグループ名が表示される。作業員がアイコンI50を選択すると、コミュニケーション時の各種設定を指定できる。
【0044】
本実施形態では、コミュニケーション画面G5に、作業員が入力した発言の逆翻訳を表示可能であり、逆翻訳機能のオン/オフを切り替えるためのボタンB51が表示される。作業員がボタンB51を右にスライドすると、逆翻訳機能がオンになる。作業員がボタンB51を左にスライドすると、逆翻訳機能がオフになる。図3の状態では、逆翻訳機能がオフであり、図4の状態では、逆翻訳機能がオンである。
【0045】
コミュニケーション画面G5の表示領域A52には、各作業員の発言が表示される。図3の例では、サブグループ内の誰も発言しておらず、表示領域A52には何も表示されていない。作業員が発言をすると、図4に示すように、発言内容を示す吹き出し画像G520A~G520Cと、逆翻訳結果を示す吹き出し画像G530と、が表示領域A52に表示される。なお、以降の説明では、吹き出し画像G520A~G520Cを区別しないときは、単に吹き出し画像G520と記載する。
【0046】
作業員は、音声入力とテキスト入力の何れかを利用して発言を入力する。発言は、メッセージ又は投稿ということもできる。図3及び図4の例では、音声入力が利用される場合を示しており、音声入力を受け付けるためのボタンB53が表示される。作業員がボタンB53を選択すると、音声入力部27が起動して、音声入力が受け付けられる。作業員がボタンB54を選択すると、テキスト入力をするための入力フォームが表示される。作業員が音声を入力した場合、その音声がテキストに変換されて入力フォームに入力されたうえで、その作業員の発言として入力されてもよい。作業員がボタンB55を選択すると、用語辞書を編集できる。用語辞書については後述する。
【0047】
図4の例では、「ジロー」と同じサブグループに属する他の作業員である「ジョイ」と「グエン」の発言を示す吹き出し画像G520A,G520Bは、表示領域A52の左側に表示される。例えば、英語で入力された「ジョイ」の発言は、日本語に翻訳されて吹き出し画像G520Aに表示される。また例えば、ベトナム語で入力された「グエン」の発言は、日本語に翻訳されて吹き出し画像G520Bに表示される。
【0048】
一方、「ジロー」の発言を示す吹き出し画像G520C,G520Dは、表示領域A52の右側に表示される。例えば、日本語で入力された「ジロー」の発言は、「ジロー」のコミュニケーション画面G5では、そのまま日本語として表示される。「ジロー」の発言は、英語とベトナム語に翻訳され、それぞれ「ジョイ」と「グエン」のコミュニケーション画面G5に表示される。
【0049】
本実施形態では、「ジロー」のコミュニケーション画面G5に、「ジロー」の発言の逆翻訳が吹き出し画像G530に表示される。逆翻訳は、英語とベトナム語の何れの翻訳から実行されてもよい。吹き出し画像G530は、逆翻訳であることが分かるように、吹き出し画像G520Cとは違う色で表示される。逆翻訳の吹き出し画像G530は、発言を入力した「ジロー」のコミュニケーション画面G5にだけ表示される。吹き出し画像G530は、「ジョイ」と「グエン」のコミュニケーション画面G5には表示されない。
【0050】
図5は、「ジョイ」のコミュニケーション画面G5の一例を示す図である。図5に示すように、「ジョイ」の使用言語は英語なので、コミュニケーション画面G5に表示される文字は全体的に英語となる。例えば、作業所名及びサブグループ名などの文字は英語になる。吹き出し画像G520Aが示す発言内容も英語になる。吹き出し画像G520Aは、「ジョイ」の発言なので、「ジョイ」のコミュニケーション画面G5では表示領域A52の右側に表示される。
【0051】
吹き出し画像G520B,G520Cは、他の作業員である「グエン」と「ジロー」の発言なので、発言内容が英語に翻訳されたうえで、表示領域A52の左側に表示される。なお、本実施形態では、使用言語が日本語の作業員だけ逆翻訳機能が提供されるものとするが、逆翻訳機能は、使用言語が外国語の作業員に提供されてもよい。この場合、「ジョイ」が逆翻訳機能をオンにすると、「ジョイ」の発言である吹き出し画像G520Aに対応する逆翻訳が表示される。
【0052】
「グエン」のコミュニケーション画面G5は、図示を省略するが、全体的にベトナム語の文字となる。「グエン」の発言である吹き出し画像G520Bは、表示領域A52の右側に表示され、他の作業員である「ジョイ」と「ジロー」の発言である吹き出し画像G520A,G520Cは、表示領域A52の左側に表示される。他の点については、「ジョイ」のコミュニケーション画面G5と同様である。
【0053】
以上のように、コミュニケーションシステムSは、各作業員の発言を翻訳して他の作業員のコミュニケーション画面G5に表示させる。この点、建設業界では、建設現場に特有の用語が用いられることが多い。このため、一般的な建設用語を登録した用語辞書だけでは、個々の建設現場に特有の用語に対応することができず、音声からテキストへの変換の精度や翻訳の精度を十分に高めることができない。そこで、本実施形態では、建設現場ごとに、その建設現場に特有の用語を登録した用語辞書を用意し、個々の建設現場に特有の用語に対応するようにしている。
【0054】
例えば、建設現場「Yトンネル作業所」における協力会社の略称が「マエコー」であり、この略称が他の建設現場で用いられないものとする。この場合、「マエコー」という用語は、「Yトンネル作業所」に特有の用語なので、全国の建設現場に共通の用語辞書や他の建設現場の用語辞書には登録されず、「Yトンネル作業所」の用語辞書にだけ登録される。
【0055】
「Yトンネル作業所」の用語辞書に「マエコー」が登録されていなかったとすると、「ジロー」が入力した「おはようございます。マエコーです。」の音声がテキストに変換された場合に、「マエコー」が1つの固有名詞として認識されず、「おはようございます。前校です。」といったテキストに変換される可能性がある。このテキストが英語の翻訳アルゴリズムに入力されると、翻訳アルゴリズムは、「前」と「校」を別々の語と解釈し、「Good morning. I’m a previous school.」といった訳文になる。この場合、正確な翻訳にならない。
【0056】
一方、「Yトンネル作業所」の用語辞書に「マエコー」が登録されると、「マエコー」が1つの固有名詞として認識されるので、「ジロー」が入力した音声が「おはようございます。マエコーです。」のテキストに変換される。このテキストが英語の翻訳アルゴリズムに入力されると、翻訳アルゴリズムは、「マエコー」を1つの語と解釈し、「Good morning. I’m Maeko.」といった訳文になる。この場合、正確な翻訳になる。
【0057】
以上のように、本実施形態のコミュニケーションシステムSは、建設現場ごとに、その建設現場に特有の用語を登録した用語辞書を用意して、建設現場に特有の表現に対応することにより、建設現場に応じたコミュニケーションを実現するようにしている。以降、コミュニケーションシステムSの詳細を説明する。
【0058】
[3.本実施形態で実現される機能]
図6は、コミュニケーションシステムSで実現される機能の一例を示す機能ブロック図である。以降、サーバ10と作業員端末20の各々で実現される機能について説明する。
【0059】
[3-1.サーバで実現される機能]
図6に示すように、サーバ10は、データ記憶部100、取得部101、変換部102、特定部103、修正部104、翻訳部105、逆翻訳部106、第1出力部107、第2出力部108、及び第3出力部109を含む。データ記憶部100は、記憶部12を主として実現され、他の各機能は、制御部11を主として実現される。
【0060】
[データ記憶部]
データ記憶部100は、本実施形態の処理を実行するために必要なデータを記憶する。例えば、データ記憶部100は、建設現場データベースDB1、発言内容データベースDB2、ローカル辞書D1、共通辞書D2、及び訳語辞書D3を記憶する。なお、本実施形態では、ローカル辞書D1、共通辞書D2、及び訳語辞書D3を別々のデータとして説明するが、これらの辞書は、1つのデータとしてまとめられていてもよい。例えば、ローカル辞書D1に、後述するローカル用語とその訳文が登録されていてもよい。また例えば、共通辞書D2に、複数の建設現場で共通の用語とその訳文が登録されていてもよい。また例えば、これらの辞書は、APIによって呼び出されるようにしてもよい。
【0061】
図7は、建設現場データベースDB1のデータ格納例を示す図である。建設現場データベースDB1は、複数の建設現場の各々に関する情報が格納されたデータベースである。図7に示すように、例えば、建設現場データベースDB1には、建設現場ID、契約者名、作業所名、2次元コードID、2次元コードの画像データ、2次元コードの有効期限、メイングループに参加した作業員の表示名、その作業員の使用言語、及びサブグループ情報が格納される。
【0062】
建設現場IDは、建設現場を一意に識別する情報である。コミュニケーションシステムSを利用する建設現場が追加されるたびに、新たに建設現場IDが発行され、建設現場データベースDB1に新たなレコードが追加される。契約者名は、翻訳アプリの契約者の名前である。コミュニケーションシステムSは、複数の建設会社によって利用可能であり、何れかの建設会社の名前が契約者名として格納される。作業所名は、建設現場の名前である。これらの情報は、コミュニケーションシステムSの管理者によって入力され、建設現場データベースDB1に登録される。
【0063】
2次元コードIDは、2次元コードを一意に識別する情報である。例えば、サーバ10は、有効期限が切れるたびに、新たな2次元コードを発行し、その2次元コードの2次元コードID、画像データ、及び有効期限を建設現場データベースDB1に格納する。なお、サーバ10は、有効期限が切れる前に、次の有効期限で使用する2次元コードを予め発行してもよい。
【0064】
2次元コードには、任意の情報が含まれてよく、建設現場を識別可能な情報が少なくとも含まれていればよい。例えば、2次元コードには、2次元コードID、建設現場ID、契約者名、及び作業所名の少なくとも1つが含まれる。有効期限は、2次元コードに含まれてもよい。サーバ10は、任意の有効期限を設定可能であり、例えば、2次元コードを生成した日の終わりを有効期限としてもよいし、2次元コードを生成してから所定時間後を有効期限としてもよい。有効期限の長さも任意であってよく、例えば、数時間程度であってもよいし、数日~数週間以上であってもよい。作業員が有効期限内の2次元コードを撮影すると、その作業員の表示名と使用言語が建設現場データベースDB1に格納され、メイングループへの参加が完了する。
【0065】
サブグループ情報は、メイングループ内で作成されたサブグループに関する情報である。サブグループ情報には、サブグループ名、招待コード、サブグループに参加した作業員の表示名、及びその作業員の退室情報が格納される。例えば、サブグループが作成されると、そのサブグループのサブグループ名と招待コードがサブグループ情報に追加される。また例えば、サブグループに作業員が参加すると、その作業員の表示名がサブグループ情報に追加される。また例えば、作業員がサブグループから退出すると、退出情報が更新される。
【0066】
図8は、発言内容データベースDB2のデータ格納例を示す図である。図8に示すように、発言内容データベースDB2は、作業員の発言内容を格納するデータベースである。本実施形態では、サブグループ内でコミュニケーションが取られるので、発言内容データベースDB2には、サブグループ内の発言内容が格納される。例えば、発言内容データベースDB2には、建設現場ID、サブグループ名、発言を入力した作業員である入力者の表示名、その発言内容、その発言内容の翻訳、その発言内容の逆翻訳、及び発言日時が格納される。
【0067】
発言内容は、音声で記録されてもよいが、本実施形態では、テキストで記録されるものとする。入力者の表示名に関連付けられた発言内容は、その入力者の言語の発言内容である。例えば、「ジロー」の発言であれば、日本語のテキストが発言内容として格納される。発言内容の翻訳は、その発言の入力者と同じサブグループの他の作業員の使用言語の翻訳である。例えば、「ジロー」の発言であれば、「ジョイ」用の英語のテキストと、「グエン」用のベトナム語のテキストと、が翻訳として格納される。
【0068】
発言内容の逆翻訳は、発言内容の翻訳から入力者の使用言語への逆翻訳である。例えば、「ジロー」の発言であれば、「ジョイ」用の英語のテキストから日本語への逆翻訳のテキスト、又は、「グエン」用のベトナム語のテキストから日本語への逆翻訳のテキストが逆翻訳として格納される。本実施形態では、逆翻訳機能は日本語のみオンにすることができるので、「ジョイ」と「グエン」が入力者の発言については、逆翻訳は格納されない。また、「ジロー」が逆翻訳機能をオフにしている場合にも逆翻訳は格納されない。なお、発言日時は、発言が入力された日時である。
【0069】
本実施形態では、サブグループにおいて発言が入力されるたびに、その発言に対応するレコードが新たに作成されて発言内容データベースDB2に格納される。例えば、日本人の作業員が発言を音声入力した場合、その作業員の表示名、後述する修正部104により修正されたテキスト(発言内容)、翻訳部105により翻訳されたテキスト、逆翻訳部106により逆翻訳されたテキスト、及び発言日時が新たなレコードに格納される。
【0070】
また例えば、日本人が発言をテキスト入力した場合、その作業員の表示名、テキスト入力されたテキスト(発言内容)、翻訳部105により翻訳されたテキスト、逆翻訳部106により逆翻訳されたテキスト、及び発言日時が新たなレコードに格納される。また例えば、外国人が発言をテキスト入力した場合、その作業員の表示名、テキスト入力されたテキスト(発言内容)、翻訳部105により翻訳されたテキスト、及び発言日時が新たなレコードに格納される。
【0071】
図9は、ローカル辞書D1のデータ格納例を示す図である。図9のデータ格納例は、「Yトンネル作業所」のローカル辞書D1を示すが、他の建設現場のローカル辞書D1もデータ形式は同様であり、データの中身だけが異なる。ローカル辞書D1は、建設現場に特有の用語が登録された用語辞書の一例である。このため、本実施形態でローカル辞書D1と記載した箇所は、用語辞書と読み替えることができる。本実施形態では、コミュニケーションシステムSを利用する建設現場ごとに、ローカル辞書D1が用意される。このため、建設現場とローカル辞書D1は、1対1で対応する。
【0072】
なお、建設現場の数とローカル辞書D1の数は、異なってもよい。近隣の複数の建設現場で1つのローカル辞書D1が共有されてもよい。例えば、ローカル辞書D1は、建設現場のエリアごとに用意されてもよい。この場合、同じエリアに属する建設現場で1つのローカル辞書D1が共有される。この場合、建設現場とローカル辞書D1は、複数対1で対応し、エリアとローカル辞書D1は、1対1で対応する。データ記憶部100は、複数のエリアにそれぞれ対応する複数のローカル辞書D1が格納される。
【0073】
サーバ10は、複数のローカル辞書D1の各々を管理する。図9に示すように、複数のローカル辞書D1の各々には、対応する建設現場に特有の建設用語が格納される。対応する建設現場とは、ローカル辞書D1が用いられる建設現場である。例えば、データ記憶部100は、建設現場IDに関連付けてローカル辞書D1を記憶する。ローカル辞書D1に関連付けられた建設現場IDが示す建設現場は、対応する建設現場に相当する。
【0074】
以降の説明では、ローカル辞書D1に登録された建設用語を、ローカル用語と記載する。ローカル用語は、対応する建設現場で用いられる用語であり、原則として他の建設現場では用いられない。ただし、ある建設現場のローカル用語と、他の建設現場のローカル用語と、が偶然一致していてもよい。ローカル用語は、建設業界で一般的な用語ではなく、対応する建設現場に特有の表現である。ローカル用語は、複数の語の組み合わせであってもよいし、文章全体を用語として扱ってもよい。例えば、ローカル用語は、対応する建設現場の作業員又は会社の名前、対応する建設現場で用いられる重機又は部材の名前、対応する建設現場又はその周辺の地名であってもよいし、これらの略称であってもよい。
【0075】
例えば、複数のローカル辞書D1の各々には、テキスト変換時に誤変換された誤変換語と、対応する建設現場に特有の建設用語と、が関連付けられている。ここでの誤変換とは、音声入力された発言をテキストに変換した場合に、異なる意味に変換されることである。誤変換語は、音声入力された発言に含まれる語ではない別の語である。誤変換語は、音声入力された発言をテキストに変換した際に誤変換された語である。誤変換は、本来の語ではない語に変換されることである。例えば、誤変換語は、漢字変換時に誤変換された語である。誤変換語は、システム側で誤認識された語ということもできる。
【0076】
例えば、誤変換語は、その発音(称呼)は正しい語と一致又は類似していることがある。発音が一致するとは、発音が全て同じことである。発音が類似するとは、発音が所定割合以上同じこと、又は、発音が同じ音が所定数以上存在することである。例えば、1音~3音程度の発音が相違する場合には、発音が類似することに相当する。また例えば、発音が相違していたとしても母音が同じであれば、発音が類似することに相当する。図8のデータ格納例であれば、「前校」と「マエコー」、「交渉時」と「高所時」、及び「チャンネルの話」と「チャンネルのばらし」の各々は、互いの発音が類似している。また、「釣りに」と「吊荷」は、互いの発音が一致している。
【0077】
例えば、正しい語の一部の発音が異なる語に変換されると、その変換後の語は誤変換語となる。また例えば、正しい語と同じ発音の語であったとしても、漢字変換又はカナ変換が正しく行われなかった誤は誤変換語となる。また例えば、正しい語とは異なる数の語に変換されると、その変換後の語は誤変換語となる。ローカル辞書D1は、対応する建設現場の作業員によって編集される。作業員は、コミュニケーション画面G5のボタンB55を選択し、ローカル辞書D1を編集できる。作業員は、誤変換語と正しい用語のペアを入力し、このペアがローカル辞書D1に登録される。
【0078】
図10は、共通辞書D2のデータ格納例を示す図である。図10に示すように、共通辞書D2は、複数の建設現場で共通の用語が登録された辞書である。データ記憶部100は、複数の共通辞書D2を記憶してもよく、例えば、建築用の共通辞書D2と、土木用の共通辞書D2と、を記憶してもよい。共通辞書D2に登録された建設用語は、全国各地の建設現場で用いられる用語であり、建設業界における一般的な専門用語である。共通辞書D2には、建設用語の訳語が登録されている。本実施形態では、共通辞書D2は、音声をテキストに変換するために使用され、日本語の用語が格納されているものとする。
【0079】
図11は、訳語辞書D3のデータ格納例を示す図である。図11に示すように、訳語辞書D3は、ある言語の用語と、他の言語の訳語と、が関連付けられている。本実施形態では、訳語辞書D3には、ローカル辞書D1に登録された用語及び共通辞書D2に登録された用語と、これらの用語の訳語と、が関連付けられている。ローカル辞書D1と共通辞書D2には日本語の用語が登録されるので、訳語辞書D3には、これら日本語の用語と、少なくとも1つの外国語の訳語と、が関連付けられる。
【0080】
[取得部]
取得部101は、作業員により入力された音声を取得する。音声は、任意のデータ形式であってよく、例えば、WMA形式又はMP3形式であってもよい。音声を取得するとは、音声のデータを取得することである。本実施形態では、複数の作業員端末20の各々の音声入力部27に音声が入力されるので、取得部101は、各作業員端末20から音声を受信することによって、各作業員が入力した音声を取得する。本実施形態では、使用言語が日本語の作業員だけが音声を入力できるので、取得部101は、使用言語が日本語の作業員により入力された音声を取得する。
【0081】
なお、作業員がテキスト入力を選択した場合には、取得部101は、作業員により入力されたテキストを取得する。テキストは、少なくとも1つの文字を含む情報である。テキストを取得するとは、テキストのデータを取得することである。テキストは、任意のデータ形式であってよく、例えば、プレーンテキスト形式、リッチテキスト形式、又はドキュメント形式であってもよい。本実施形態では、複数の作業員端末20の各々の操作部24からテキストが入力されるので、取得部101は、各作業員端末20からテキストを受信することによって、各作業員が入力したテキストを取得する。
【0082】
[変換部]
変換部102は、音声をテキストに変換する。即ち、変換部102は、音声のデータをテキストのデータに変換する。変換部102による変換語のテキストは、入力された音声と同じ言語で記述される。本実施形態では、使用言語が日本語の作業員だけが音声を入力できるので、変換部102は、入力された日本語の音声を日本語のテキストに変換する。
【0083】
変換部102は、公知の音声認識アルゴリズムに基づいて、音声をテキストに変換する。変換部102は、音声認識アルゴリズムに音声を入力し、その出力結果であるテキストを取得する。音声認識アルゴリズム自体は、種々の手法を利用可能であり、例えば、音声認識辞書を利用した手法であってもよいし、機械学習モデルを利用した手法であってもよい。音声認識辞書は、基本となる波形又はヒストグラムと対応する語が関連付けられた辞書であり、例えば、音響モデル、パターンマッチモデル、又は言語モデルの辞書である。機械学習モデルは、入力波形又はそのヒストグラムと、正解となる語と、の関係を示す訓練データが学習されたモデルであり、例えば、畳み込みニューラルネットワーク又は再帰型ニューラルネットワークのモデルである。
【0084】
本実施形態では、変換部102は、複数の建設現場に共通の用語が登録された共通辞書D2に基づいて、音声をテキストに変換する。共通辞書D2は、音声認識辞書の一種であってもよいし、機械学習モデルが参照する辞書であってもよい。変換部102は、共通辞書D2に定義された語に基づいて、音声をテキストに変換する。なお、共通辞書D2は、テキストに含まれる平仮名を漢字変換するために用いられてもよい。この場合、変換部102は、共通辞書D2を使用せずに公知の音声認識アルゴリズムによって変換したテキストに含まれる平仮名を、共通辞書D2を使って漢字変換する。また例えば、共通辞書D2は、音声から変換されたテキストを形態素解析するための用いられてもよい。この場合、変換部102は、共通辞書D2に基づいて平仮名のテキストを形態素解析し、漢字に変換したり句読点を挿入したりする。
【0085】
[特定部]
特定部103は、複数の建設現場のうち、作業員が属する建設現場を特定する。作業員が属する建設現場とは、作業員が参加するメイングループである。作業員は、実際にその建設現場にいなくてもよく、その建設現場の関係者であればよい。特定部103は、作業員端末20から受信した情報に基づいて、作業員が属する建設現場を特定する。本実施形態では、作業員が自身の作業員端末20で2次元コードを読み取ると、作業員端末20は、サーバ10に対し、2次元コードに含まれる建設現場IDを送信する。特定部103は、作業員端末20から受信した建設現場IDによって、作業員が属する建設現場を特定する。
【0086】
なお、特定部103は、他の方法によって作業員の建設現場を特定してもよい。例えば、作業員端末20は、サーバ10に対し、2次元コードに含まれる2次元コードIDを送信してもよい。この場合、特定部103は、建設現場データベースDB1を参照し、作業員端末20から受信した2次元コードによって、作業員が属する建設現場を特定する。また例えば、2次元コードを利用しなくてもよく、作業員は、自身の建設現場を識別する情報を作業員端末20に入力してもよいし、予め利用登録をしているのであれば、自身のユーザIDを作業員端末20に入力してもよい。特定部103は、これら入力された情報に基づいて、作業員が属する建設現場を特定する。
【0087】
[修正部]
修正部104は、複数の建設現場にそれぞれ対応する複数のローカル辞書D1のうち、作業員が属する建設現場に対応するローカル辞書D1に基づいて、テキストに含まれる誤変換語を、作業員が属する建設現場に特有のローカル用語に修正する。ここでの修正とは、変換部102により変換されたテキストに含まれる誤変換語を、ローカル用語(正しい語)に変換することである。本実施形態では、使用言語が日本語の作業員だけが音声入力が可能なので、修正部104は、日本語のテキストに含まれる誤変換語を、日本語のローカル用語に修正する。
【0088】
修正部104は、変換部102により変換されたテキストに、作業員が属する建設現場に対応するローカル辞書D1に登録された誤変換語が含まれるか否かを判定する。修正部104は、このテキストに誤変換語が含まれると判定した場合に、この誤変換語を、この誤変換語に関連付けられたローカル用語に修正する。例えば、図9に示す「Yトンネル作業所」のローカル辞書D1であれば、修正部104は、「ジロー」の音声から変換されたテキストに「前校」(誤変換語)が含まれていた場合に、この語を「マエコー」(ローカル用語)に修正する。他のローカル用語についても同様であり、「交渉時」、「チャンネルの話」、「釣りに」の誤変換語がテキストに含まれていた場合に、修正部104は、それぞれを「高所時」、「チャンネルのばらし」、「吊荷」に修正する。
【0089】
本実施形態では、特有の用語と発音が同じ又は類似する語が誤変換語としてローカル辞書D1に登録されているので、修正部104は、特有の用語と発音が同じ又は類似する誤変換語を、特有のローカル用語に修正する。即ち、修正部104は、変換部102により変換されたテキストに含まれる誤変換語を、当該誤変換語と発音が同じ又は類似するローカル用語に修正する。例えば、発音が一致するが漢字変換が正しく行われなかった場合には、修正部104は、正しい漢字変換になるように、誤変換後をローカル用語に修正する。また例えば、正しい発音の語に変換されなかった場合には、修正部104は、正しい発音の語になるように、誤変換後をローカル用語に修正する。
【0090】
また、本実施形態では、共通辞書D2を利用して音声からテキストへの変換が行われるので、修正部104は、共通辞書D2では特有の用語に変換されなかった誤変換語を、特有のローカル用語に修正する。即ち、修正部104は、共通辞書D2によって発生した誤変換語を、共通辞書D2には登録されていないローカル用語に修正する。
【0091】
本実施形態では、複数のローカル辞書D1の各々を管理するサーバ10が特定部103と修正部104を含むので、修正部104は、複数のローカル辞書D1のうち、特定部103により特定された建設現場に対応するローカル辞書D1に基づいて、誤変換語を、特有のローカル用語に修正する。即ち、修正部104は、特定部103の特定結果に基づいて、使用するローカル辞書D1を決定する。修正部104は、他のローカル辞書D1については、テキストの修正時に参照しない。
【0092】
[翻訳部]
翻訳部105は、各作業員の発言を示すテキストを、他の作業員の言語に翻訳する。例えば、翻訳部105は、ある言語のテキストを、少なくとも1つの他の言語のテキストに翻訳する。ここでの「ある言語」は、日本語に限られず、英語やベトナム語といった外国語であってもよい。「他の言語」は、翻訳元のテキストとは異なる言語であればよい。翻訳部105は、音声から変換されたテキストだけでなく、テキスト入力されたテキストについても翻訳をする。
【0093】
翻訳部105は、公知の翻訳アルゴリズムに基づいて、ある作業員の発言を示すテキストを、他の作業員の言語に翻訳する。翻訳アルゴリズム自体は、種々の手法を利用可能であり、例えば、ルールベース方式を利用してもよいし、コーパスベース方式を利用してもよい。コーパスベース方式は、統計的機械翻訳とニューラル機械翻訳の何れであってもよい。翻訳アルゴリズムは、翻訳前の言語と翻訳後の言語のペアごとに、翻訳アルゴリズムが用意されている。
【0094】
例えば、翻訳部105は、発言の入力者の使用言語を参照し、翻訳前のテキストの言語を特定する。翻訳部105は、同じサブグループに属する他の作業員の使用言語を参照し、翻訳後の言語を特定する。翻訳部105は、これらのペアに対応する翻訳アルゴリズムに対し、翻訳前のテキストを入力し、翻訳アルゴリズムから出力された翻訳結果(翻訳後のテキスト)を取得する。例えば、「Zグループ」の「ジロー」の発言であれば、翻訳部105は、日本語から英語に翻訳する翻訳アルゴリズムと、日本語からベトナム語に翻訳する翻訳アルゴリズムと、の各々に日本語のテキストを入力し、これらから出力された英語の翻訳結果とベトナム語の翻訳結果とを取得する。「Zグループ」に「ジロー」以外の日本人がいた場合には、この日本人については翻訳する必要がないので、日本語のテキストがそのままこの日本人に出力される。
【0095】
本実施形態では、使用言語が日本語の作業員が入力した音声はテキストに変換され、修正部104によってそのテキストが修正されるので、翻訳部105は、修正部104の修正結果を、他の作業員の言語に翻訳する。修正結果とは、修正部104による修正後のテキストである。翻訳部105は、翻訳アルゴリズムに修正後のテキストを入力し、出力された翻訳結果を取得する。なお、テキスト入力された発言のテキストは、修正部104による修正をする必要がないので、翻訳部105は、入力されたテキストをそのまま翻訳すればよい。
【0096】
[逆翻訳部]
逆翻訳部106は、翻訳部105により翻訳された修正結果を、作業員の言語に逆翻訳する。翻訳された修正結果とは、修正部104の修正後のテキストの翻訳結果である。翻訳部105によって複数の言語に翻訳される場合には、逆翻訳部106は、少なくとも1つの言語の逆翻訳を取得すればよい。作業員が逆翻訳を取得する言語を指定できてもよい。例えば、「ジロー」が英語とベトナム語の何れの逆翻訳を取得するかを指定できてもよい。
【0097】
逆翻訳部106による逆翻訳は、翻訳前の言語と翻訳後の言語の関係が翻訳部105による翻訳と逆転する点で異なるが、他の点は翻訳部105による翻訳と同様である。このため、逆翻訳部106は、公知の翻訳アルゴリズムに基づいて、逆翻訳を行えばよい。例えば、逆翻訳部106は、翻訳アルゴリズムに翻訳部105による翻訳後のテキストを入力し、出力された逆翻訳結果を取得する。逆翻訳結果は、逆翻訳後のテキストである。なお、逆翻訳部106は、音声入力された発言だけでなく、テキスト入力された発言についても逆翻訳を取得してもよい。
【0098】
[第1出力部]
第1出力部107は、他の作業員に対し、修正部104の修正結果を出力する。他の作業員とは、発言を入力した作業員とコミュニケーションを取る相手である。本実施形態では、サブグループ内でコミュニケーションが取られるので、他の作業員は、発言を入力しい作業員と同じサブグループの他の作業員である。
【0099】
本実施形態では、複数の言語間での翻訳が行われるので、第1出力部107は、他の作業員に対し、翻訳部105により翻訳された修正結果を出力する。例えば、第1出力部107は、他の作業員の作業員端末20に対し、翻訳後のテキストを表示させるためのデータを送信することによって、翻訳結果を出力する。このデータは、吹き出し画像G520を表示させるためのデータであればよく、例えば、吹き出し画像G520の画像データであってもよいし、吹き出し画像G520に含まれるテキストだけを示すデータであってもよい。他にも例えば、このデータは、発言内容データベースDB2に含まれる入力者、発言内容、翻訳、及び発言日時であってもよい。
【0100】
本実施形態では、画像を利用して視覚的に修正結果が出力される場合を説明するが、修正結果は、音声を利用して聴覚的に出力されてもよい。この場合、第1出力部107は、翻訳部105により翻訳された修正結果のテキストを音声に変換し、他の作業員の作業員端末20に対し、その音声を送信する。テキストから音声の変換は、他の作業員の作業員端末20で実行されてもよい。なお、同じサブグループに同じ使用言語の他の作業員が含まれていた場合には、第1出力部107は、他の作業員に対し、翻訳をしていない修正結果をそのまま出力すればよい。
【0101】
[第2出力部]
第2出力部108は、作業員に対し、逆翻訳部106により逆翻訳された修正結果を出力する。この作業員は、発言を入力した作業員である。逆翻訳された修正結果は、逆翻訳部106による逆翻訳結果であり、逆翻訳後のテキストである。例えば、第2出力部108は、発言を入力した作業員の作業員端末20に対し、逆翻訳後のテキストを表示させるためのデータを送信することによって、逆翻訳結果を出力する。このデータは、吹き出し画像G530を表示させるためのデータであればく、例えば、吹き出し画像G530の画像データであってもよいし、吹き出し画像G530に含まれるテキストだけを示すデータであってもよい。他にも例えば、このデータは、発言内容データベースDB2に含まれる入力者、逆翻訳、及び発言日時であってもよい。
【0102】
本実施形態では、逆翻訳機能のオン/オフが切り替えられるので、第2出力部108は、逆翻訳機能がオンの場合に、逆翻訳部106により逆翻訳された修正結果を出力する。第2出力部108は、逆翻訳機能がオフの場合には、逆翻訳部106により逆翻訳された修正結果は出力しない。逆翻訳機能がオフの場合には、逆翻訳部106による逆翻訳自体が行われないようにしてもよいし、逆翻訳自体は行われるが出力だけをしないようにしてもよい。
【0103】
例えば、第2出力部108は、後述する第3出力部109による出力とは異なる態様で、逆翻訳部106により逆翻訳された修正結果を出力する。本実施形態のように、画像を利用して視覚的に出力する場合には、第2出力部108は、第3出力部109による出力とは異なる表示態様で、逆翻訳部106により逆翻訳された修正結果を出力する。表示態様とは、画像の見た目であり、例えば、文字の色、フォント、サイズ、向き、背景、又はエフェクトなどである。本実施形態では、第2出力部108は、吹き出し画像G530の背景の色と、吹き出し画像G520の背景の色と、を異ならせることによって、表示態様を変えている。
【0104】
なお、逆翻訳結果は、音声を利用して聴覚的に出力されてもよい。この場合、第2出力部108は、逆翻訳部106により翻訳された逆翻訳結果のテキストを音声に変換し、他の作業員の作業員端末20に対し、その音声を送信する。テキストから音声の変換は、他の作業員の作業員端末20で実行されてもよい。この場合、第2出力部108は、第3出力部109とは異なる出力態様で、逆翻訳部106により逆翻訳された修正結果を出力してもよい。この出力態様とは、音の違いであり、例えば、音の周波数帯域などである。
【0105】
[第3出力部]
第3出力部109は、作業員に対し、この作業員の発言内容を出力する。この作業員は、発言を入力した作業員である。本実施形態では、音声入力が行われるとテキストに変換されて修正部104により修正されるので、第3出力部109は、作業員に対し、翻訳部105により翻訳されていない修正結果を出力する。翻訳されていない修正結果は、翻訳前のテキストである。本実施形態では、音声入力された発言であれば、修正部104の修正後のテキストは、翻訳されていない修正結果である。テキスト入力された発言であれば、第3出力部109は、作業員に対し、入力されたテキストをそのまま出力する。
【0106】
第3出力部109は、作業員に対し、翻訳部105により翻訳された修正結果を出力する。例えば、第3出力部109は、発言を入力した作業員の作業員端末20に対し、修正後のテキストを表示させるためのデータを送信することによって、修正結果を出力する。このデータは、吹き出し画像G520を表示させるためのデータであればおく、例えば、吹き出し画像G520の画像データであってもよいし、吹き出し画像G520に含まれるテキストだけを示すデータであってもよい。他にも例えば、このデータは、発言内容データベースDB2に含まれる入力者、発言内容、及び発言日時であってもよい。
【0107】
なお、本実施形態では、画像を利用して視覚的に修正結果が出力される場合を説明するが、修正結果は、音声を利用して聴覚的に出力されてもよい。この場合、第3出力部109は、修正部104の修正結果のテキストを音声に変換し、発言を入力した作業員の作業員端末20に対し、その音声を送信する。テキストから音声の変換は、この作業員の作業員端末20で実行されてもよい。
【0108】
[3-2.作業員端末で実現される機能]
図6に示すように、作業員端末20は、データ記憶部200、受付部201、切替部202、及び表示制御部203を含む。データ記憶部200は、記憶部22を主として実現され、他の各機能は、制御部21を主として実現される。
【0109】
[データ記憶部]
データ記憶部200は、本実施形態で説明する処理を実行するために必要なデータを記憶する。例えば、データ記憶部200は、翻訳アプリを記憶する。翻訳アプリは、図2図5を参照して説明した各画面を表示させるためのプログラムである。本実施形態では、サーバ10がテキスト変換機能や翻訳機能を有する場合を説明するが、これらの機能は、翻訳アプリ側に持たせてもよい。また例えば、データ記憶部200は、逆翻訳機能のオン/オフを示す情報を記憶する。この情報は、切替部202により更新される。また例えば、データ記憶部200は、過去にコミュニケーション画面G5に表示させた発言に関するデータを記憶してもよい。
【0110】
[受付部]
受付部201は、操作部24の検出信号に基づいて、作業員の操作を受け付ける。例えば、受付部201は、図2図5の各画面に対する作業員の操作を受け付ける。また例えば、受付部201は、作業員によるテキスト入力を受け付ける。また例えば、受付部201は、音声入力部27の検出信号に基づいて、作業員による音声の入力を受け付ける。
【0111】
[切替部]
切替部202は、作業員の操作に基づいて、逆翻訳部106による逆翻訳機能のオンとオフを切り替える。切替部202は、データ記憶部に記憶された、逆翻訳機能のオン/オフを示す情報を更新することによって、逆翻訳機能の切り替えを行う。切替部202は、作業員が逆翻訳機能をオンにする操作をした場合、逆翻訳機能をオンにする。切替部202は、作業員が逆翻訳機能をオフにする操作をした場合、逆翻訳機能をオフにする。
【0112】
[表示制御部]
表示制御部203は、表示部25に各種画面を表示させる。例えば、表示制御部203は、コミュニケーション画面G5において、作業員端末20を操作する作業員の発言を第1の位置に表示させ、他の作業員の発言を第2の位置に表示させる。本実施形態では、第1の位置を表示領域A52の右側とし、第2の位置を表示領域A52の左側とするが、これらの位置は、画面内の任意の位置であってよい。また例えば、表示制御部203は、コミュニケーション画面G5において、作業員の使用言語の発言内容を表示させる。
【0113】
[4.本実施形態において実行される処理]
図12及び図13は、作業員同士でコミュニケーションを取る際に実行される処理を示すフロー図である。本実施形態では、サーバ10と、使用言語が日本語の作業員の作業員端末20と、の間で実行される処理について説明する。サーバ10と、使用言語が外国語の作業員の作業員端末20と、の間でも同様の処理が実行されるが、この点については後述する。
【0114】
図12及び図13の処理は、制御部11,21がそれぞれ記憶部12,22に記憶されたプログラムに従って動作することによって実行される。この処理は、図6に示す機能ブロックにより実行される処理の一例である。この処理が実行されるにあたり、図2の流れにより、作業員はメイングループとサブグループへの参加を完了しているものとする。サーバ10は、作業員端末20の2次元コードの有効期限をチェックし、有効期限が切れている場合には、以降説明する処理は実行されない。
【0115】
図12に示すように、作業員端末20は、サーバ10に対し、コミュニケーション画面G5の表示要求を送信する(S1)。表示要求には、作業員が属する建設現場の建設現場ID、表示対象となるサブグループのサブグループ名、及び作業員の表示名が含まれる。例えば、建設現場IDと表示名は、メイングループへの参加が完了した場合に作業員端末20に記録される。また例えば、サブグループ名は、サブグループへの参加が完了した場合に作業員端末20に記録される。作業員が複数のサブグループに参加している場合には、作業員は、表示要求を送信する前に、何れかのサブグループを選択する。表示要求には、作業員が選択したサブグループのサブグループ名が含まれる。表示要求には、逆翻訳機能のオン/オフを示す情報が含まれてもよい。
【0116】
サーバ10は、表示要求を受信すると、サブグループ内で過去に入力された発言内容を示す発言データを送信する(S2)。S2においては、サーバ10は、発言内容データベースDB2を参照し、表示要求に含まれる建設現場ID及びサブグループ名が格納されたレコードを参照する。このレコードに何の発言も格納されていない場合には、サブグループ内では誰も発言していないので、サーバ10は、発言データを送信しない。サーバ10は、このレコードに発言が格納されている場合には、発言の入力者、日本語の発言内容、及び発言日時の組み合わせを少なくとも1つ含む発言データを送信する。サーバ10は、入力者が表示要求を送信した作業員の発言内容であり、逆翻訳機能がオンの場合には、逆翻訳結果も発言データに含めて送信する。
【0117】
作業員端末20は、発言データを受信すると、コミュニケーション画面G5を表示部25に表示させる(S3)。S3においては、作業員端末20は、自身を操作する作業員が入力者の発言内容を示す吹き出し画像G520を表示領域A52の右側に配置し、他の作業員の発言内容を示す吹き出し画像G520を表示領域A52の左側に配置する。作業員端末20は、表示要求を送信した作業員が逆翻訳機能をオンにしている場合には、表示要求を送信した作業員の発言内容の逆翻訳を示す吹き出し画像G530を、吹き出し画像G520とは異なる表示態様で表示領域A52の右側に配置する。なお、作業員端末20は、過去に受信した発言データを記憶部22に記録しておき、S1及びS2の処理を実行することなく、S3の処理を実行してもよい。
【0118】
作業員端末20は、操作部24の検出信号に基づいて、作業員の操作を特定する(S4)。ここでは、ボタンB51,B53,B54の各々を選択する操作、又は、コミュニケーション画面G5を閉じる操作が行われる場合を説明する。なお、アイコンI50が選択された場合にはコミュニケーション時の設定処理が実行され、ボタンB55が選択された場合にはローカル辞書D1、共通辞書D2、又は訳語辞書D3の登録処理が実行される。ここでは、これらの処理については省略する。
【0119】
作業員がボタンB51を選択した場合(S4;B51)、作業員端末20は、ボタンB51に対する操作に基づいて、逆翻訳機能のオン/オフを切り替える(S5)。逆翻訳機能のオン/オフを識別する情報は、記憶部22に記憶されているものとする。S5においては、作業員端末20は、作業員の操作に基づいて、この情報を更新する。例えば、作業員端末20は、作業員がボタンB51を右に移動させた場合に、逆翻訳機能をオンにする。また例えば、作業員端末20は、作業員がボタンB51を左に移動させた場合に、逆翻訳機能をオフにする。
【0120】
S4において、作業員がボタンB53を選択した場合(S4;B53)、作業員端末20は、音声入力部27の検出信号に基づいて、作業員により入力された音声を取得してサーバ10に送信する(S6)。S6においては、作業員端末20は、作業員の発言内容を示す音声をサーバ10に送信する。音声には、作業員の表示名などの情報が付加されており、発言を入力した作業員を識別可能となっている。また、音声には、逆翻訳機能がオンであるかオフであるかを識別する情報も付加されている。
【0121】
サーバ10は、音声を受信すると、音声認識アルゴリズムと共通辞書D2に基づいて、受信した音声をテキストに変換する(S7)。S7においては、サーバ10は、受信した音声を音声認識アルゴリズムに入力する。音声認識アルゴリズムは、共通辞書D2を参照し、入力された音声をテキストに変換する。サーバ10は、音声認識アルゴリズムから出力されたテキストを取得する。
【0122】
サーバ10は、作業員の建設現場に対応するローカル辞書D1に基づいて、S7で変換したテキストに含まれる誤変換語を、ローカル用語に修正する(S8)。S8においては、サーバ10は、S7で変換したテキストに、作業員の建設現場に対応するローカル辞書D1に登録された誤変換語が含まれるか否かを判定する。サーバ10は、このテキストに含まれると判定された誤変換語を、ローカル辞書D1に登録されたローカル用語に修正する。
【0123】
サーバ10は、機械翻訳アルゴリズムと訳語辞書D3とに基づいて、S10における修正後のテキストを翻訳する(S9)。S9においては、サーバ10は、S10における修正後のテキストを、同じサブグループに属する他の作業員の使用言語に応じた機械翻訳アルゴリズムに入力する。機械翻訳アルゴリズムは、訳語辞書D3を参照し、入力されたテキストを他の作業員の使用言語に翻訳する。サーバ10は、機械翻訳アルゴリズムから出力された翻訳結果を取得する。
【0124】
サーバ10は、機械翻訳アルゴリズムと訳語辞書D3とに基づいて、S9における翻訳後のテキストを逆翻訳する(S10)。S10においては、サーバ10は、少なくとも1つの言語の翻訳後のテキストを機械翻訳アルゴリズムに入力する。機械翻訳アルゴリズムは、訳語辞書D3を参照し、入力されたテキストを日本語に翻訳する。サーバ10は、機械翻訳アルゴリズムから出力された翻訳結果を取得する。サーバ10は、機械翻訳アルゴリズムから出力された逆翻訳結果を取得する。
【0125】
サーバ10は、発言内容データベースDB2を更新する(S11)。S11においては、サーバ10は、S6で受信した音声を入力した作業員の表示名、S8における修正後の日本語のテキスト、S9における翻訳後の外国語のテキスト、S10における逆翻訳後の日本語のテキスト、及び発言日時を格納する。なお、逆翻訳機能がオフの場合には、S10の処理が実行されないので、逆翻訳後の日本語のテキストは格納されない。
【0126】
図13に移り、サーバ10は、サブグループに参加した各作業員の作業員端末20に対し、発言データを送信する(S12)。S12においては、サーバ10は、入力者の作業員端末20に対し、S8における修正後の日本語のテキスト、S10における逆翻訳後の日本語のテキスト、及び発言日時を送信する。なお、逆翻訳機能がオフの場合には、逆翻訳後の日本語のテキストは、発言データに含まれない。
【0127】
S12においては、サーバ10は、他の作業員の作業員端末20に対し、入力者の表示名、S9における翻訳後の外国語のテキスト、及び発言日時を送信する。使用言語が日本語の他の作業員がいた場合には、サーバ10は、その作業員の作業員端末20に対し、入力者の表示名、S8における修正後の日本語のテキスト、及び発言日時を送信する。
【0128】
作業員端末20は、発言データを受信すると、表示領域A52の表示を更新する(S13)。S13においては、作業員端末20は、表示領域A52の右側に、作業員の発言内容を示す吹き出し画像G520を表示させる。逆翻訳機能がオンであり、かつ、発言データに逆翻訳結果も含まれていれば、作業員端末20は、表示領域A52の右側に、逆翻訳結果を示す吹き出し画像G530を表示させる。
【0129】
S4において、作業員がボタンB54を選択した場合(S4;B54)、作業員端末20は、コミュニケーション画面G5に入力フォームを表示させ、入力フォームに入力されたテキストをサーバに送信する(S14)。サーバ10は、テキストを受信すると、そのテキストを翻訳する(S15)。S15の処理は、S9の処理と同様であるが、S8における修正後のテキストではなく、S14において入力されたテキストが翻訳される点でS9とは異なる。続くS16の処理は、S10の処理と同様であり、その後S12の処理に移行する。
【0130】
S4において、作業員が操作をしなかった場合(S4;操作なし)、作業員端末20は、サーバ10から他の作業員の発言内容を示す発言データを受信したか否かを判定する(S17)。この発言データは、他の作業員端末20において発言が入力された場合に生成され、作業員端末20に送信される。この発言データには、入力者の表示名、日本語のテキスト、及び発言日時が含まれる。
【0131】
他の作業員の発言内容を示す発言データを受信したと判定された場合(S17;Y)、作業員端末20は、受信した発言データに基づいて、表示領域A52の表示を更新する(S18)。S18においては、作業員端末20は、他の作業員の発言内容を示す吹き出し画像G520を、表示領域A52の左側に表示させる。
【0132】
S4において、作業員がコミュニケーション画面G5を閉じる操作をした場合(S4;閉じる)、作業員端末20からコミュニケーション画面G5が消去され、本処理は終了する。
【0133】
なお、使用言語が外国語の作業員の作業員端末20と、サーバ10と、の間でも上記と同様の処理が実行される。ただし、本実施形態では、使用言語が外国語の作業員は、音声入力をすることができないので、S5~S11の処理は実行されない。他の処理については、上記と同様である。
【0134】
以上説明したコミュニケーションシステムSによれば、作業員が属する建設現場に対応するローカル辞書D1に基づいて、音声から変換されたテキストに含まれる誤変換語を、作業員が属する建設現場に特有の用語に修正するので、発言内容を正確に表すテキストに変換し、建設現場に応じたコミュニケーションを実現できる。例えば、全国の建設現場の用語を1つの用語辞書で管理する場合には、用語辞書のデータサイズが膨大になるが、建設現場ごとにローカル辞書D1を用意することによって、用語辞書のデータサイズを抑えることができる。また例えば、全国の建設現場の用語を1つの用語辞書で管理する場合には、用語辞書のデータサイズが膨大になった分だけ、テキスト修正時の処理が重くなるが、個々の用語辞書のデータサイズを抑えることで、修正時の処理を高速化できる。その結果、サーバ10の処理負荷を軽減できる。また、同じ作業員であったとしても、その作業員が別の建設現場に移動すれば、その建設現場のローカル用語を話す可能性があるので、作業員の建設現場に応じたローカル辞書D1を利用することによって、建設現場に応じたコミュニケーションを実現できる。例えば、ある作業員が建設現場Aにいる場合には、建設現場Aのローカル辞書D1を利用し、その作業員が建設現場Bにいる場合には、建設現場Bのローカル辞書D1を利用することにより、建設現場に応じたコミュニケーションを実現できる。
【0135】
また、コミュニケーションシステムSは、建設現場に特有の用語と発音が同じ又は類似する誤変換語を、特有の用語に修正することによって、テキストの変換精度をより高めることができる。
【0136】
また、コミュニケーションシステムSは、複数の建設現場に共通の用語が登録された共通辞書D2に基づいて、音声をテキストに変換し、共通辞書D2では特有の用語に変換されなかった誤変換語を、ローカル辞書D1を利用して特有の用語に修正することによって、テキストの変換精度を効果的に高めることができる。例えば、建設業界全般で利用される建設用語をローカル辞書D1に格納すると、新たな建設用語を追加する場合に、膨大な数のローカル辞書D1を編集する必要があるが、そのような建設用語については共通辞書D2で一元管理することで、辞書の管理を簡易化できる。また例えば、建設業界全般で利用される建設用語をローカル辞書D1に格納すると、個々のローカル辞書D1のデータサイズが膨大になり、かつ、複数のローカル辞書D1で重複する専門用語を登録するため無駄が生じるが、そのような建設用語を共通辞書D2に登録することによって、個々のローカル辞書D1のデータサイズを抑えることができる。
【0137】
また、コミュニケーションシステムSは、テキストへの修正結果を、他の作業員の言語に翻訳して他の作業員に出力することによって、翻訳の精度を高めて、異なる言語を使用する作業員同士のコミュニケーションを円滑にすることができる。例えば、ある建設現場に特有のローカル用語が入力されたとしても、他の言語に正確に翻訳できる。
【0138】
また、コミュニケーションシステムSは、ローカル辞書D1を利用して翻訳された発言を、作業員が使用する言語に逆翻訳して出力することによって、発言をした作業員に対し、自身の発言の翻訳が正確に行われているか否かを把握させることができる。
【0139】
また、コミュニケーションシステムSは、作業員の操作に基づいて、逆翻訳機能のオンとオフを切り替えて、逆翻訳機能がオンの場合に、逆翻訳された発言を出力することによって、作業員の利便性を高めることができる。また、逆翻訳が不要な場合には、逆翻訳された発言が表示されないので、コミュニケーション画面G5に不要な発言が表示されず、表示スペースを有効活用できる。その結果、コミュニケーション画面G5を見やすくすることができ、円滑なコミュニケーションを実現できる。また、逆翻訳機能がオフの場合に逆翻訳をしないようにしたとすると、不要な逆翻訳処理が実行されないので、サーバ10の処理負荷を軽減できる。
【0140】
また、コミュニケーションシステムSは、作業員の発言とは異なる表示態様で、逆翻訳された発言を出力することによって、作業員の発言と逆翻訳の結果とを区別しやすくなる。
【0141】
また、コミュニケーションシステムSは、サーバ10が、自身が管理する複数のローカル辞書D1のうち、特定された建設現場に対応するローカル辞書D1に基づいて、作業員の発言を翻訳することによって、サーバ10でローカル辞書D1を一元管理できる。
【0142】
[5.変形例]
なお、本発明は、以上に説明した実施の形態に限定されるものではない。本発明の趣旨を逸脱しない範囲で、適宜変更可能である。
【0143】
例えば、実施形態では、使用言語が日本語の作業員だけが音声を入力できる場合を説明したが、使用言語が外国語の作業員も音声を入力できてもよい。この場合、使用言語が外国語の作業員は、逆翻訳機能のオン/オフを指定できてもよい。使用言語が外国語の作業員が音声を入力する場合、ローカル辞書D1は、その言語における誤変換語とローカル用語との関係が登録される。共通辞書D2も同様に、その言語に応じた用語が登録される。サーバ10は、外国語で入力された音声をテキストに変換し、そのテキストに含まれる誤変換語をローカル用語に修正する。サーバ10は、修正後のテキストを、他の外国語又は日本語に翻訳し、その逆翻訳結果を取得すればよい。使用言語が外国語の作業員の作業員端末20には、その外国語の発言内容と逆翻訳結果が表示される。
【0144】
また例えば、ローカル辞書D1に登録される誤変換語とローカル用語は、互いに発音が類似してなくてもよい。また例えば、音声からテキストの変換は、共通辞書D2が利用されなくてもよい。また例えば、コミュニケーションシステムSは、翻訳機能を有していなくてもよく、日本人の作業員同士のコミュニケーションを提供してもよい。この場合、サーバ10は、日本語で入力された音声をテキストに変換し、そのテキストに含まれる誤変換語をローカル用語に修正し、修正後の日本語のテキストを作業員端末20に送信すればよい。また例えば、コミュニケーションシステムSは、逆翻訳機能を有していなくてもよい。また例えば、コミュニケーションシステムSは、別々のコンピュータでローカル辞書D1を分散管理してもよい。また例えば、サブグループ内のコミュニケーションに限られず、メイングループ内でコミュニケーションが取られてもよい。また例えば、発言を入力した作業員には、その発言は出力されなくてもよい。
【0145】
また例えば、実施形態では、サーバ10によって主な機能が実現される場合を説明したが、コミュニケーションシステムSに複数のコンピュータが含まれている場合に、各コンピュータで機能が分担されてもよい。例えば、データ記憶部100がサーバ10以外のサーバコンピュータによって実現されてもよい。また例えば、作業員端末20によって各機能が実現されてもよい。
【0146】
また、上記実施形態では、建設の現場を例として説明したが、業務領域としては、建設に限るものではない。製造業の工場における製造現場や、病院や介護などの医療現場、貨物輸送などの物流現場など、各企業や団体などの集団単位で行う現場で、多国籍の作業員が共同で働く現場であれば、本発明を同様に適用することができる。このため、実施形態で建設現場と記載した箇所は、コミュニケーションシステムSを適用する任意の業界における作業現場と読み替えることができる。他の業界における作業現場において、その作業現場に特有の用語が用いられるのであれば、実施形態と同様のローカル辞書D1によって、発言内容を正確に示すテキストに変換できる。
【符号の説明】
【0147】
S コミュニケーションシステム、N ネットワーク、10 サーバ、11,21 制御部、12,22 記憶部、13,23 通信部、24 操作部、25 表示部、26 撮影部、27 音声入力部、28 音声出力部、20 作業員端末、100 データ記憶部、101 取得部、102 変換部、103 特定部、104 修正部、105 翻訳部、106 逆翻訳部、107 第1出力部、108 第2出力部、109 第3出力部、200 データ記憶部、201 受付部、202 切替部、203 表示制御部、DB1 建設現場データベース、DB2 発言内容データベース、D1 ローカル辞書、D2 共通辞書、D3 訳語辞書、G1 撮影画面、G2 言語選択画面、G3 作成画面、G4 管理画面、G5 コミュニケーション画面。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13