IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東日本旅客鉄道株式会社の特許一覧

特許7175069異常時放送外国語化システム及び異常時放送外国語化プログラム
<>
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図1
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図2
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図3
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図4
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図5
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図6
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図7
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図8
  • 特許-異常時放送外国語化システム及び異常時放送外国語化プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-10
(45)【発行日】2022-11-18
(54)【発明の名称】異常時放送外国語化システム及び異常時放送外国語化プログラム
(51)【国際特許分類】
   G06F 40/45 20200101AFI20221111BHJP
   G06F 40/279 20200101ALI20221111BHJP
   G06F 16/35 20190101ALI20221111BHJP
   B61L 25/02 20060101ALI20221111BHJP
【FI】
G06F40/45
G06F40/279
G06F16/35
B61L25/02 A
【請求項の数】 4
(21)【出願番号】P 2017111810
(22)【出願日】2017-06-06
(65)【公開番号】P2018206136
(43)【公開日】2018-12-27
【審査請求日】2020-04-15
【前置審査】
(73)【特許権者】
【識別番号】000221616
【氏名又は名称】東日本旅客鉄道株式会社
(74)【代理人】
【識別番号】110001254
【氏名又は名称】弁理士法人光陽国際特許事務所
(72)【発明者】
【氏名】萩原 悠太
(72)【発明者】
【氏名】山口 尚人
(72)【発明者】
【氏名】小山 由貴
(72)【発明者】
【氏名】村上 喜洋
【審査官】成瀬 博之
(56)【参考文献】
【文献】特開2010-033160(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/20-40/58
G06F 16/00-16/958
B61L 25/02
(57)【特許請求の範囲】
【請求項1】
テキストデータ加工部と放送用データ配信部とを備え、外国語による放送に供するテキストデータおよび音声データを送信する異常時放送外国語化システムであって、
前記テキストデータ加工部は、
列車の運行に関わる音声放送の内容がテキストデータで表記された放送テキストデータを取得してこの放送テキストデータに含まれる文字列を単語または文節ごとに抽出する文字列抽出手段と、
少なくとも路線名及び用語と、駅名、事象、状態のうち1つとを含む文字列の性質に応じて分類された各文字列と所定の分類指標とを関連付けて記述した辞書データを用いて前記文字列抽出手段により抽出された文字列を類似の概念の文字列に分類して類似の概念を有する文字列には同一の分類指標を付与する分類指標付与手段と、を有し、
前記放送用データ配信部は、
予め作成された放送用の案内文に対応した複数の言語の文例テキストデータと音声データが記憶された記憶手段と、
前記放送テキストデータに含まれる文字列に付与されている前記分類指標を利用して、類似する単語群と条件単語と分類指標とを関連付けて記述した辞書データを参照して決定された検索の条件単語を用いて、前記記憶手段に記憶されている条件単語となる1の文字列又は2以上の文字列の組と文例テキストデータとの関係を示すテーブルを参照し、前記記憶手段からいずれかの言語の文例テキストデータの候補を抽出するデータ候補抽出処理を実行する文例候補抽出手段と、
外部からの要求に応じて前記候補の中のいずれかの文例に対応した他の言語の文例テキストデータ又は文例テキストデータおよび音声データを送信するデータ送信処理を実行するデータ送信手段と、を有し、
前記分類指標付与手段は、前記放送テキストデータに含まれる文字列に路線名がある場合に、路線名と分類指標とを関連付けて記述した前記辞書データを用いて当該路線名に前記分類指標として路線名タグを付与可能であり、
前記文例候補抽出手段は、前記路線名タグに基づいて、前記データ候補抽出処理において、指定された路線に関連する加工放送テキストデータおよび文例テキストデータの候補を抽出可能に構成されていることを特徴とする異常時放送外国語化システム。
【請求項2】
前記テキストデータ加工部は、前記文字列と前記分類指標との対応関係を規定する前記辞書データを格納する辞書データベースを備え、
前記辞書データベースには、同一の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードが対応付けられて格納されており、
前記分類指標付与手段は、前記辞書データベースを用いて前記類似文字列及び対応する前記確定ワードに同じ分類指標を付与し、
前記文例候補抽出手段は、前記データ候補抽出処理において、前記確定ワードを検索の条件単語として、前記記憶手段からいずれかの言語の文例テキストデータの候補を抽出することを特徴とする請求項1に記載の異常時放送外国語化システム。
【請求項3】
前記文例テキストデータ又は文例テキストデータおよび音声データにはそれぞれ識別コードが付与されて前記記憶手段に記憶されているとともに、前記記憶手段には1又は2以上の前記確定ワードと前記識別コードとの関係を示す参照テーブルが記憶されており、
前記文例候補抽出手段は、前記データ候補抽出処理において、前記参照テーブルを用いて前記確定ワードが合致する識別コードを抽出して該識別コードを用いて前記記憶手段より文例テキストデータ又は文例テキストデータおよび音声データを読み出し、
前記データ送信手段は、前記文例候補抽出手段によって読み出されたデータを、前記データ送信処理において送信するように構成されていることを特徴とする請求項2に記載の異常時放送外国語化システム。
【請求項4】
コンピュータを、
列車の運行に関わる音声放送の内容がテキストデータで表記された放送テキストデータおよび該放送テキストデータに含まれる文字列に付記されている分類指標を取得するデータ取得手段、
前記放送テキストデータおよび前記分類指標を利用して類似する単語群と条件単語と分類指標とを関連付けて記述した辞書データを参照して検索の条件単語を決定し、前記条件単語を用いて予め作成された放送用の案内文に対応して日本語で記述された文例テキストデータが記憶された記憶手段から複数の文例テキストデータの候補を抽出する文例候補抽出手段、
外部からの要求に応じて、前記文例候補抽出手段により抽出された候補の中のいずれかの文例に対応した他の言語の文例テキストデータ又は文例テキストデータおよび音声データを記憶手段から読み出して要求元へ提供するデータ提供手段、
として機能させる異常時放送外国語化プログラムであって、
前記分類指標には、少なくとも路線名及び用語と、駅名、事象、状態のうち1つとを含む文字列であって類似の概念の文字列に対してそれぞれ付与された路線名タグ及び用語タグと、駅名タグ、事象タグ、状態タグがあり、
前記文例候補抽出手段は、前記路線名タグに基づいて、指定された路線に関連する加工放送テキストデータおよび文例テキストデータの候補を抽出する機能を有することを特徴とする異常時放送外国語化プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、列車の運行状況に関する音声情報をテキストデータ(文字情報)に変換したデータを取得して、外国語に変換したデータを乗務員に提供し、外国語による車内放送に利用可能にするための異常時放送外国語化システム及び異常時放送外国語化プログラムに関する。
【背景技術】
【0002】
列車の乗務員や鉄道の駅構内に配置されて列車利用者の対応にあたる駅社員等の鉄道会社の社員は、各種の事態に対応し、できる限り正確な情報を列車利用者に提供するために、各自の担当する路線等の列車に運行の乱れ等が生じていないか否かを迅速に把握して、必要に応じて車内放送や駅構内放送で状況や経過を利用者に知らせたいとの要望がある。
従来、事故等の事象が発生すると、事象に関する進捗状況や復旧状況に関する情報が随時、社員である輸送指令員に報告され、輸送指令員の下に集約された情報が適宜無線等を通じた音声放送として社員に伝えられるのが一般的であった。
【0003】
しかし、輸送指令員の下に集約された情報が音声によって伝えられるのみでは、提供された時点で聞き逃してしまうと社員が当該情報を得られない可能性がある。また、聞き手である社員が内容を聞き間違える等により情報の正確性を欠いてしまうおそれもある。
このため、輸送指令員の下に集約された情報を文字情報として社員向けに配信するするシステムが実用化されている。また、特許文献1には、列車の遅延情報等の交通に関する情報を文字情報として辞書登録するようにした発明が提案されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特許第5776169号公報
【文献】特開2004-295578号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、運行中の列車に搭乗している乗務員は、列車遅延発生時等に受け取った運行状況に関する情報に基づいて車内放送を行なっているが、近年、外国人旅行者の増加に伴い外国語による放送を実施したいという要望がある。
従来、日本語から外国語へのリアルタイム翻訳に関しては、スマートホンなどに実装される翻訳ソフトがあるが、まだ正確性に難がある。一方、列車における車内放送では、乗客に対して正確な情報を伝達する必要がある。そのため、携帯端末に実装するような翻訳ソフトによる異常時放送外国語化は、適用することができない。また、翻訳ソフトによる翻訳では、翻訳された結果が正しいか否か確認することが困難である。
【0006】
また、従来、日本語から外国語への翻訳に関しては、予め辞書に複数の用例(文例)を登録しておいて、キーワードや対話場面を指定して、対応する用例の候補を複数表示させ、その中からいずれか選択して翻訳するものにおいて、検索用のキーワードや対話場面としてどのようなキーワードまたは対話場面を指定すれば容易に用例を検索できるか習得させることができるようにした発明が提案されている(特許文献2)。
しかしながら、特許文献2に記載されている発明では、音声入力またはキーワードによって用例の候補を表示させるものであり、騒音の多い車内では音声による入力は適切でない。また、キーワード入力の場合には、入力に時間がかかるため用例表示までに時間を要するという課題がある。
【0007】
そこで、本発明者らは、予めデータベースに放送すべき文例を登録しておいて、その中から音声情報から変換されたテキストデータに対応した外国語の文例候補を表示させるシステムについて検討した。しかしながら、実際に実施されている放送では、同一の意味や類似の概念を有する用語であっても、乗務員によって微妙に異なる場合がある。そのため、想定されるすべての用語に対応して、文例の候補を抽出できるようにするのは困難であるという課題があることが分かった。
また、本発明者らが適用を検討したシステムでは、予め用意しておく文例(定型文)は数千種類にも及ぶため、何らかの工夫をしないと文例の候補を表示して所望の文例を選択するまでの時間(操作の回数)が長くなるという課題があることが分かった。
【0008】
本発明は上記のような事情に鑑みてなされたものであり、列車の運行状況について放送するのに適切な文例候補を提示して乗務員等に選択させることができる異常時放送外国語化システム及び異常時放送外国語化プログラムを提供することを目的とするものである。
本発明の他の目的は、外国語による放送を流すまでの操作の短縮化が可能な異常時放送外国語化システム及び異常時放送外国語化プログラムを提供することにある。
【課題を解決するための手段】
【0009】
前記課題を解決するために、本発明は、
テキストデータ加工部と放送用データ配信部とを備え、外国語による放送に供するテキストデータおよび音声データを送信する異常時放送外国語化システムであって、
前記テキストデータ加工部は、
列車の運行に関わる音声放送の内容がテキストデータで表記された放送テキストデータを取得してこの放送テキストデータに含まれる文字列を単語または文節ごとに抽出する文字列抽出手段と、
少なくとも路線名及び用語と、駅名、事象、状態のうち1つとを含む文字列の性質に応じて分類された各文字列と所定の分類指標とを関連付けて記述した辞書データを用いて前記文字列抽出手段により抽出された文字列を類似の概念の文字列に分類して類似の概念を有する文字列には同一の分類指標を付与する分類指標付与手段と、を有し、
前記放送用データ配信部は、
予め作成された放送用の案内文に対応した複数の言語の文例テキストデータと音声データが記憶された記憶手段と、
前記放送テキストデータに含まれる文字列に付与されている前記分類指標を利用して、類似する単語群と条件単語と分類指標とを関連付けて記述した辞書データを参照して決定された検索の条件単語を用いて、前記記憶手段に記憶されている条件単語となる1の文字列又は2以上の文字列の組と文例テキストデータとの関係を示すテーブルを参照し、前記記憶手段からいずれかの言語の文例テキストデータの候補を抽出するデータ候補抽出処理を実行する文例候補抽出手段と、
外部からの要求に応じて前記候補の中のいずれかの文例に対応した他の言語の文例テキストデータ又は文例テキストデータおよび音声データを送信するデータ送信処理を実行するデータ送信手段と、を有し、
前記分類指標付与手段は、前記放送テキストデータに含まれる文字列に路線名がある場合に、路線名と分類指標とを関連付けて記述した前記辞書データを用いて当該路線名に前記分類指標として路線名タグを付与可能であり、
前記文例候補抽出手段は、前記路線名タグに基づいて、前記データ候補抽出処理において、指定された路線に関連する加工放送テキストデータおよび文例テキストデータの候補を抽出可能に構成したものである。
【0010】
上記のように構成することで、放送テキストデータに含まれる類似の概念(同一の意味)の文字列に同一の分類指標を付与し、この分類指標に基づいて記憶装置(データベース)に記憶されている複数の文例の中から放送内容に対応した複数の案内文の候補を抽出して端末装置へ送信するとともに、端末装置からの要求に応じて選択された案内文に対応する外国語の案内文の文例テキストデータおよび音声データを送信することが可能になるため、端末装置を保有する列車の乗務員等は、放送内容に対応した案内文を容易に探して選択し、その翻訳文と音声データを取得して放送することができる。
また、放送用データ配信部が、列車の乗務員等により指定された路線に関連する案内文の候補を抽出し端末装置へ送信することができ、案内文の候補が多くなり過ぎることで所望の案内文にたどり着くまでの所要時間を短縮することが可能となる。
【0011】
ここで、望ましくは、前記テキストデータ加工部は、前記文字列と前記分類指標との対応関係を規定する辞書データを格納する辞書データベースを備え、
前記辞書データベースには、同一の意味を有し言い回しの異なる複数の文字列である類似文字列について1つの確定ワードが対応付けられて格納されており、
前記分類指標付与手段は、前記辞書データベースを用いて前記類似文字列及び対応する前記確定ワードに同じ分類指標を付与し、
前記文例候補抽出手段は、前記確定ワードを検索の条件単語として、前記記憶手段からいずれかの言語の文例テキストデータの候補を抽出するように構成する。
【0012】
かかる構成によれば。テキストデータ加工部によって、外部のシステム(放送テキスト化装置)から順次送信されてくる放送文に含まれる、同じ意味でも様々な異なる言い回しで表現されることがある文字列について適切に分類指標(タグ)を付与することができ、該分類指標によって確定ワード(代表ワード)を決定し、放送用データ配信部が確定ワードを検索の条件単語として用いて、受信した放送文に対応した案内文の候補を抽出して端末装置へ送信することができる。
【0014】
さらに、望ましくは、前記文例テキストデータ又は文例テキストデータおよび音声データにはそれぞれ識別コードが付与されて前記記憶手段に記憶されているとともに、前記記憶手段には1又は2以上の前記確定ワードと前記識別コードとの関係を示す参照テーブルが記憶されており、前記文例候補抽出手段は、前記参照テーブルを用いて前記確定ワードが合致する識別コードを抽出して該識別コードを用いて前記記憶手段より文例テキストデータ又は文例テキストデータおよび音声データを読み出し、前記データ送信手段は、前記文例候補抽出手段によって抽出されたデータを送信するように構成する。
かかる構成によれば、放送用データ配信部が容易に候補となる案内文を抽出することができるとともに、端末装置より要求された案内文に対応する外国語の文例テキストデータおよび音声データを読み出して端末装置へ送信することができ、端末装置では音声データによって音声を再生することで外国語による放送をすることができる。
【0015】
また、本出願の他の発明は、
コンピュータを、
列車の運行に関わる音声放送の内容がテキストデータで表記された放送テキストデータおよび該放送テキストデータに含まれる文字列に付記されている分類指標を取得するデータ取得手段、
前記放送テキストデータおよび前記分類指標を利用して類似する単語群と条件単語と分類指標とを関連付けて記述した辞書データを参照して検索の条件単語を決定し、前記条件単語を用いて予め作成された放送用の案内文に対応して日本語で記述された文例テキストデータが記憶された記憶手段から複数の文例テキストデータの候補を抽出する文例候補抽出手段、
外部からの要求に応じて、前記文例候補抽出手段により抽出された候補の中のいずれかの文例に対応した他の言語の文例テキストデータ又は文例テキストデータおよび音声データを記憶手段から読み出して要求元へ提供するデータ提供手段、
として機能させる異常時放送外国語化プログラムであって、
前記分類指標には、少なくとも路線名及び用語と、駅名、事象、状態のうち1つとを含む文字列であって類似の概念の文字列に対してそれぞれ付与された路線名タグ及び用語タグと、駅名タグ、事象タグ、状態タグがあり、
前記文例候補抽出手段は、前記路線名タグに基づいて、指定された路線に関連する加工放送テキストデータおよび文例テキストデータの候補を抽出する機能を有するようにしたものである。
【0016】
かかるプログラムによれば、放送テキストデータに含まれる類似の概念(同一の意味)の文字列に同一の分類指標に基づいて記憶装置(データベース)に記憶されている複数の文例の中から放送内容に対応した複数の案内文の候補を抽出して端末装置へ送信するとともに、端末装置からの要求に応じて選択された案内文に対応する外国語の案内文の文例テキストデータおよび音声データを送信することができるため、列車の乗務員等は、放送内容に対応した案内文を容易に探して選択し、その翻訳文と音声データを取得して放送することができる。また、列車の乗務員等により指定された路線に関連する案内文の候補を抽出し端末装置へ送信することができ、案内文の候補が多くなり過ぎることで所望の案内文にたどり着くまでの所要時間を短縮することが可能となる。
【発明の効果】
【0017】
本発明に係る異常時放送外国語化システム及び異常時放送外国語化プログラムによれば、列車の運行状況について放送するのに適切な文例候補を提示して乗務員等に選択させることができる。また、外国語による放送を流すまでの操作の短縮化が可能な異常時放送外国語化システム及び異常時放送外国語化プログラムを実現することができるという効果がある。
【図面の簡単な説明】
【0018】
図1】本実施形態に係る異常時放送外国語化システムの概要を示すブロック図である。
図2】実施形態の異常時放送外国語化システムで使用する事象辞書データの構成例を示す図である。
図3】文例決定用テーブルの一部の構成例および案内文辞書の一部を示す図である。
図4】実施形態の異常時放送外国語化システムから送信される他を受ける端末装置におけるメインの表示画面の例を示した図である。
図5】端末装置におけるその他の定型文の候補の表示画面の例を示した図である。
図6】端末装置における路線選択画面の例を示した図である。
図7】実施形態の異常時放送外国語化システムを構成するテキストデータ加工部におけるタグ付け処理の前半部の流れを示すフローチャートである。
図8】テキストデータ加工部におけるタグ付け処理の後半部の流れを示すフローチャートである。
図9】実施形態の異常時放送外国語化システムを構成する放送用データ配信部における放送テキストおよび案内文等の送信処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照しつつ、本発明に係る異常時放送外国語化システム及び異常時放送外国語化プログラムの一実施形態について説明する。なお、以下に述べる実施形態においては、日本語放送テキストデータに基づいて英文の放送を実施する場合を例にとって説明するが、本発明は英語以外の外国語あるいは英語を含む複数の外国語で放送を実施する場合に適用することができる。
【0020】
図1は、本実施形態に係る異常時放送外国語化システム100の全体構成を示す図である。
図1に示すように、本実施形態の異常時放送外国語化システム100は、放送テキスト化装置10によってテキストデータ化された放送情報(これを以下「放送テキストデータ」という。)を加工するテキストデータ加工部20と、テキストデータ加工部20によって加工された加工後の放送テキストデータに基づいて放送する文例候補を選択し、これを配信する放送用データ配信部30とを備えている。
【0021】
また、異常時放送外国語化システム100には、ネットワークN等を介して端末装置Tが接続されており、放送用データ配信部30は、選択した放送用データをネットワークN等を介して端末装置Tへ送信するようになっている。
端末装置Tは、例えば列車の運行に関わる乗務員その他の社員(例えば駅構内に配置されて列車利用者の対応にあたる駅社員等)が使用している携帯可能な端末装置であって、液晶パネルや有機ELディスプレイ等で構成されるタッチパネル式の表示部を備えており、放送用データ配信部30から提供される情報に基づいて表示を行う。端末装置Tは例えばタブレット型の端末装置でもよいし、スマートホン等であってもよい。
【0022】
放送テキスト化装置10は、列車の運行に関わる様々な事象に関する情報が音声で伝えられる音声放送の音声データを文字情報であるテキストデータ化する機能を備えたサーバ装置(コンピュータ)である。
列車の運行に関わる何らかの事象が発生すると、当該事象の発生場所や発生時刻、現時点での状態等の情報が輸送指令室に無線等により報告される。事象の発生が報告されると、輸送指令室では、輸送指令員が、この情報を無線等により運行にかかわる乗務員その他の社員(例えば駅構内に配置されて列車利用者の対応にあたる駅社員等)に音声放送として音声で伝える。
ここで「事象」とは、事故やトラブルの発生、車両の点検等、列車の見合わせや遅延等を引き起こす原因となる事柄の総称である。また、「状態」とは、運転見合わせや運転再開、列車の運行遅延等、列車の運行状況である。
【0023】
放送テキスト化装置10は、音声放送の音声データをテキストデータ(放送テキストデータ)に自動変換する機能を備えており、放送テキスト化装置10によってテキストデータ化された放送情報(放送テキストデータ)は、テキストデータ加工部20に送信される。なお、放送テキスト化装置10は、既存の装置であるので詳しい構成の説明は省略する。
テキストデータ加工部20は、放送テキスト化装置10によってテキストデータ化された放送テキストデータ(時刻情報を含む)を取得してこの放送テキストデータを加工する機能を有する。特に限定されるものではないが、本実施形態では、テキストデータ加工部20と放送用データ配信部30とは、CPU(中央処理装置)や記憶装置を備えた一つのサーバ装置(コンピュータ)によって構成される。
【0024】
また、テキストデータ加工部20は、放送テキストデータから抽出した文字列にタグを付与するタグ付け処理を行うためのタグ付け処理部21、放送テキスト化装置10から取得したテキストデータ(放送文)から指標となるワードを抽出し、辞書データベース(以下、本文中及び図1において「データベース」を「DB」と記す)を参照して指標データ(確定ワード)を決定する指標データ抽出部22、プログラム記憶部23、辞書DB24、放送テキスト化装置10から取得したテキストデータ(放送文)を記憶する受信テキスト記憶部25、指標データ抽出部22により抽出された指標データを付加した放送テキストデータを記憶する指標付きデータ記憶部26、及び外部装置等と接続されるI/F27等の機能部を備えており、これらの機能部はバス28により接続されている。なお、上記テキストデータ加工部20は、放送テキスト化装置10に設けられていても良い。
【0025】
本実施形態では、サーバ(コンピュータ)を構成するCPUを、放送テキストデータから抽出した文字列にタグを付与するタグ付け処理を行うためのタグ付け処理部21や指標データ抽出部22として機能させるプログラムが、ROM(リードオンリメモリ)のようなプログラム記憶部23に格納されている。タグとは、文字列の性質や種類を示し分類の際の指標となるものである。
辞書DB24は、文字列とタグとの対応関係を規定する辞書データが格納されている。
本実施形態では、図1に示すように、路線名辞書データ41、駅名辞書データ42、事象辞書データ43、状態辞書データ44、用語辞書データ45が辞書DB24に格納されている。なお、辞書DB24に格納される辞書データはここに例示したものに限定されない。これらのうちの一部のみであってもよいし、これら以外の辞書データを含んでいてもよい。
【0026】
上記路線名辞書データ41は、音声放送において読み上げられることが想定されるすべての路線の路線名を示す文字列を、当該文字列の分類指標となるタグ(この場合には「路線名タグ」)と対応付けて記憶している。
また、駅名辞書データ42は、音声放送において読み上げられることが想定されるすべての駅の駅名を示す文字列を、当該文字列の分類指標となるタグ(この場合には「駅名タグ」)と対応付けて記憶している。
【0027】
事象辞書データ43は、事故やトラブルの発生等、列車の運転見合わせや遅延等を引き起こす原因として想定される事柄を示す文字列を、当該文字列の分類指標となるタグ(この場合には「事象タグ」)と対応付けて記憶している。
状態辞書データ44は、運転見合わせや運転再開、列車の運行遅延等、上記事象によって引き起こされる列車の運行状況を示す文字列を、当該文字列の分類指標となるタグ(この場合には「状態タグ」)と対応付けて記憶するものである。
また、用語辞書データ45は、音声放送において読み上げられることが想定される例えば車両やパンタグラフ、ドア、ブレーキ、踏切、信号機等の用語を示す文字列を、当該文字列の分類指標となるタグ(この場合には「用語タグ」)と対応付けて記憶している。
【0028】
タグ付け処理部21がタグ付けする文字列は、基本的には放送テキストデータに含まれる文字列(単語、文節)と確定ワード(代表ワード)である。ただし、放送テキストデータに含まれる文字列は、放送を担当する読み手等によって、同じ意味の言葉でも複数の異なる言い回しで表現されることがある。特に、「事象」や「状態」については、各種の表現が想定される。
このため、辞書データは、同様の意味を有し言い回しの異なる複数の文字列である類似文字列(類似ワード)について1つの確定ワードを対応付け、これらの類似文字列及び確定ワードについて同じタグを付与するようにしている。
【0029】
図2には、一例として事象辞書データ43と用語辞書データ45の構成例が示されている。
例えば、「事象」に関しては、線路上に障害物があったような場合、放送テキストデータ上の文言としては「接触」「衝突」「衝撃」といった言い回しが想定される。また、車両に何らかの問題が発生した場合、放送テキストデータ上の文言としては「不具合」「故障」「支障」といった言い回しが想定される。そこで、本実施形態の事象辞書データ43では、図2に示すように、これらの類似ワードに対して、「故障」や「接触」が確定ワードとして対応付けられ、いずれの場合も事象タグが付与される。
【0030】
一方、「用語」に関しては、線路上に動物が侵入したような場合、放送テキストデータ上の文言としては「犬」「鹿」「熊」といった言い回しが想定される。また、踏切が故障した車が立ち往生している場合、放送テキストデータ上の文言としては「車」「自動車」「トラック」といった言い回しが想定される。そこで、本実施形態の事象辞書データ43では、図2に示すように、これらの類似ワードに対して、「動物」や「車」が確定ワードとして対応付けられ、いずれの場合も用語タグが付与される。
【0031】
なお、複数の文字列の組み合わせが「車両不具合」のように「用語」と「事象」所定の組み合わせである場合に、その組み合わせからなる文字列に対して所定の確定ワードを対応付けて、複数の文字列の組み合わせによる検索にも対応できるようにしても良い。
以上、図2に示す事象辞書データ43と用語辞書データ45を例にとって説明したが、複数の類似ワードを1つの確定ワードと対応付ける点は、状態辞書データ44等、他の辞書でも同様である。
また、確定ワードに予め優先順位を付け、1つの放送テキストデータ中に複数の確定ワードに対応する文字列がある場合には、確定ワードの優先順位に従ってタグを付与するようにしても良い。
【0032】
タグ付け処理部21は、放送テキストデータから所定の文字列を抽出し、上記のような辞書データを用いて、抽出した文字列に、当該文字列の性質に応じた分類を行うための分類指標となるタグを適宜付与する。そして、タグを付与した放送テキストデータおよび各タグに対応する確定ワードを、指標付きデータ記憶部26に記憶する。
本実施形態では、タグ付け処理部21は、タグとして「路線名タグ」、「駅名タグ」、「事象タグ」、「状態タグ」、「用語タグ」をそれぞれ対応する文字列に付与する。さらに、上記タグの他、辞書データを用いずに、「列車番号タグ」、「方向タグ」、「時刻タグ」等を付与するようにしている。
なお、タグとしてどのような項目を用意するかはここに例示したものに限定されない。さらに多くの項目をタグとして設けてもよいし、タグを付与する要素を上記例示よりも少なくしてもよい。例えば「駅名タグ」、「状態タグ」に関して省略するようにしてもよく、その場合、辞書データベース24内の駅名辞書データ42、状態辞書データ44は不要となる。
【0033】
次に、辞書データを用いたタグ付けの仕方について具体的に説明する。
辞書データを用いてタグ付けを行う場合、タグ付け処理部21は、まず1つ目の辞書データ(例えば、路線名辞書データ41)を参照しつつ、放送テキストデータ中に路線名辞書データ41に登録されている文字列があるか否かを文頭から順次検索する。
そして、路線名辞書データ41に登録されている文字列があった場合には、これに路線名タグを付与する。
【0034】
放送テキストデータの末尾まで検索が完了したら、同様に、次の辞書データ(例えば、駅名辞書データ42)を参照しつつ、放送テキストデータ中に駅名辞書データ42に登録されている文字列があるか否かを文頭から順次検索する。そして、駅名辞書データ42に登録されている文字列があった場合には、これに駅名タグを付与する。
また、タグ付け処理部21は、同様にして、すべての辞書データについて、順次検索を行い、適宜タグ付け処理を行う。
なお、本実施形態では「列車番号」、「時刻」については特に辞書を用意していないため、1つの放送テキストデータ中に「列車番号」、「時刻」に該当する文字列が複数ある場合には、タグ付け処理部21は、「列車番号」に該当するすべての文字列に「列車番号タグ」を付与し、「時刻」に該当するすべての文字列に「時刻タグ」を付与する。
【0035】
上記指標付きデータ記憶部26に格納された指標データは、放送用データ配信部30に送られる。
放送用データ配信部30は、テキストデータ加工部20の指標付きデータ記憶部26に格納された指標データとしての確定ワードに基づいて送信するデータを決定し、配信する機能を有しており、日本語の表示用文例(案内文テキストデータ)を送信する表示用文例データ送信部31、英文の表示用文例データ送信部32、対応する文例(案内文)の英文音声データを送信する英文音声データ送信部33、データベースの中から文例を抽出する文例抽出処理部34、表示用文例(日本語)DB35、英文の表示用&音声データDB36、送信するデータを決定する際に参照される送信データ決定テーブル記憶部37及び外部装置との間でネットワークNを介してデータの送受信を行う通信部38等の機能部を備えており、これらはバス39により接続されている。
【0036】
表示用文例(日本語)DB35には、図3(B)に示すように、数千種類(例えば約140文例×30路線)の文例(案内文)がIDコードと対応して格納されている。また、送信データ決定テーブル記憶部37には、図3(A)に示すように、指標となる1又は2以上の文字列の組と対応して文例(案内文)のIDコードが格納されている。
本実施形態では、サーバを構成するCPUを、表示用文例データ送信部31、英文の表示用文例データ送信部32、対応する文例の英文音声データ送信部33、文例抽出処理部34として機能させるプログラムがプログラム記憶部23に格納されている。放送用データ配信部30は、テキストデータ加工部20を構成するサーバとは異なるサーバによって構成しても良い。異なるサーバによって構成した場合には、各プログラムはそれぞれのサーバのプログラム記憶部(ROM)に格納される。
【0037】
本実施形態では、放送用データ配信部30が、テキストデータ加工部20により抽出された検索用のワード(指標データ)を使用して、端末装置Tへ送信する複数の日本語の文例候補を決定して送信するとともに、端末装置Tから要求(選択)に応じて英文の表示用文例データおよび英文音声データを送信する機能を備えている。
また、放送用データ配信部30は、テキストデータ加工部20がリアルタイムで放送テキスト化装置10から受信した放送テキストを受け取って自動的に端末装置Tへ送信する機能を備えている。
なお、放送用データ配信部30は、放送テキストデータの送信を行う場合、放送テキストデータの全文をそのまま送信するのではなく、放送テキストデータのうち、タグが付与された重要な情報のみを表示させて、情報の要点を分かりやすく端的に示すようにしてもよい。
また、放送テキストデータのままの類似文字列ではなく、当該類似文字列と対応付けられた確定ワードをもって表示させるようにしてもよい。
【0038】
次に、上記放送用データ配信部30からのデータの提供を受ける本実施形態における端末装置Tの機能および操作方法について説明する。
図4図6には端末装置の表示部に表示される表示画面の構成例が示されている。このうち、図4は放送用データ配信部30から配信された放送テキストおよび当該放送テキストに対応した英文放送のための文例候補を表示する画面(放送配信ページ)の構成例が、図5はその他の定型文のリストを表示する画面(定型文選択ページ)の構成例が、さらに図6には路線選択を行う際に表示する画面(路線選択ページ)の構成例が、それぞれ示されている。路線選択ページを設けているのは、同様な内容の文例について路線ごとに文例が用意されているためである。
【0039】
図4に示されているように、放送配信ページにおいては、画面の左上に、選択設定されている路線名を表示する路線表示欄SLCが、右上に、表示時の日時を表示する日時表示欄DDCが、その下には選択されている路線での最新放送の配信時刻の表示欄NBCが、その左には放送数および現在表示中の放送の時系列位置を表示する表示欄BTCが設けられている。また、上記表示欄NBC,BTCの下には、現在表示中の放送の配信時刻を中心に前後の配信放送の時刻を順に表示する配信時刻時系列表示欄DTCが設けられている。
【0040】
また、上記配信時刻時系列表示欄DTCの下には、放送本文を表示する放送本文表示欄SDC、その下には放送本文表示欄SDCに表示されている放送分に対応した英文放送のための文例候補を複数同時に表示可能な文例候補表示欄SCCが設けられている。
そして、文例候補表示欄SCCの各文例表示行の右側位置には、表示されている文例(日本語)に対応する英文を表示させる指令を与えるための「+英文」なる文字が記されたボタンTVBと、その英文を音声で出力させる指令を与えるためのスピーカの記号が付されたボタンBSBが設けられており、このボタンにタッチすると対応する指令が入力されるようになっている。なお、文例候補表示欄SCCの右端には、スクロールバーが設けられており、これを操作することで隠れている文例候補を表示させることができるようになっている。
【0041】
さらに、上記文例候補表示欄SCCの下には、表示切替ボタンを並べて配置した操作メニュー欄WMCが設けられている。この操作メニュー欄WMCの符号ESBが付されている表示切替ボタンは、路線に関係のないその他の定型文のリストを表示させるためのボタンであって、この表示切替ボタンESBにタッチすると、図5に示すような、その他の定型文のリストが、「運転見合わせ」や「列車遅延」の発生時によく使われる文例と、「よく使う異常時の放送文」とに、分けて表示される。そして、このリストの各文例表示行の右側には、図4の文例候補表示欄SCCと同様に、英文を表示させる指令を与えるための英文表示ボタンTVBと、英文を音声で出力させる指令を与えるための音声出力指令ボタンBSBが設けられている。
【0042】
上記音声出力指令ボタンBSBがタッチされると、端末装置は、音声合成機能により放送用データ配信部30が受信した音声データを音声信号に変換してスピーカを駆動して音声を出力するように構成されている。操作者が列車に乗務している車掌の場合、乗務員室に設けられているマイクを端末装置のスピーカに近づけると、車内放送システムによって端末装置から出力された音声をそのまま車内放送として流すことができる。
なお、車載のマイクのケーブルの端部のプラグを引き抜いて、端末装置に設けられている音声出力端子(イヤホンジャック)に変換用接続ケーブルを差し込んで、端末装置から出力される音声信号を直接車内放送システムに供給して車内放送として流すように構成しても良い。
【0043】
また、端末装置の表示画面(図4)の操作メニュー欄WMCに設けられている符号LSBが付されている表示切替ボタンにタッチすると、図6に示すような、選択可能な路線名のリストが表示される。そして、各路線名が付されたボタンには、チェックボックスが付記されており、このチェックボックスにタッチすることで、最大で5路線まで選択できるようになっている。
さらに、操作メニュー欄WMC設けられている符号NBBが付されている表示切替ボタンにタッチすると、放送用データ配信部30が受信した最新の放送文が、上記放送本文表示欄SDCに表示されるように構成されている。
また、操作メニュー欄WMCの右側位置には、左矢印と右矢印の記号が付されたボタンが設けられており、これらのボタンにタッチすることで、上記放送本文表示欄SDCに表示されている放送文の1回前または1回後に受信した放送文が表示されるように構成されている。
【0044】
次に、図7から図9を参照しつつ、本実施形態の異常時放送外国語化システム100における放送テキストへのタグ付け処理、英語により記述された案内文の検索、送信処理について説明する。
図7及び図8は、異常時放送外国語化システム100を構成するテキストデータ加工部20のタグ付け処理部21が行うタグ付け処理を示すフローチャートである。
タグ付け処理部21は、図7に示すように、先ず放送テキスト化装置10から放送テキストデータを取得して、当該放送テキストデータについて順次冒頭から各辞書データに登録されているものと合致する文字列があるか否かを検索する(ステップS1)。
【0045】
具体的には、先ず放送テキストデータ内に路線名辞書データ41に登録されている文字列と合致するものがあるか検索する(ステップS2)。このとき、タグ付け処理部21は、データの冒頭から末尾までを検索して、合致する文字列がある場合(YES)には、当該文字列に路線名タグを付与する(ステップS3)。なお、合致する文字列がない場合(ステップS2;NO)には、路線名タグをブランクとする(ステップS4)。
次に、タグ付け処理部21は、放送テキストデータ内に駅名辞書データ42に登録されている文字列と合致するものがあるか冒頭から末尾まで検索する(ステップS5)。そして、合致する文字列がある場合(ステップS5;YES)には、当該文字列に駅名タグを付与する(ステップS6)。なお、合致する文字列がない場合(ステップS5;NO)には、駅名タグをブランクとする(ステップS7)。
【0046】
同様にして、タグ付け処理部21は、放送テキストデータ内に事象辞書データ43に登録されている文字列と合致するものがあるか冒頭から末尾まで検索する(ステップS8)。そして、合致する文字列がある場合(ステップS8;YES)には、当該文字列に事象タグを付与する(ステップS9)。また、合致する文字列がない場合(ステップS8;NO)には、事象タグをブランクとする(ステップS10)。
【0047】
同様に、タグ付け処理部21は、放送テキストデータ内に状態辞書データ44に登録されている文字列と合致するものがあるか検索する(ステップS11)。そして、合致する文字列がある場合(ステップS11;YES)には、当該文字列に状態タグを付与する(ステップS12)。また、合致する文字列がない場合(ステップS11;NO)には、状態タグをブランクとする(ステップS13)。
次に、タグ付け処理部21は、図8に示すように、放送テキストデータ内に用語辞書データ45に登録されている文字列と合致するものがあるか検索する(ステップS14)。そして、合致する文字列がある場合(ステップS14;YES)には、当該文字列に用語タグを付与する(ステップS15)。また、合致する文字列がない場合(ステップS14;NO)には、用語タグをブランクとする(ステップS16)。
【0048】
さらに、タグ付け処理部21は、放送テキストデータ内に列車番号に該当する文字列があるか否かを判断する(ステップS17)。具体的には、例えば数字とアルファベット1文字との組み合わせからなる文字列があるか否かを判断し、あると判断した場合(ステップS17;YES)には、該当する文字列に列車番号タグを付与する(ステップS18)。なお、合致する文字列がない場合(ステップS17;NO)には、列車番号タグをブランクとする(ステップS19)。
その後、タグ付け処理部21は、放送テキストデータ内に時刻に該当する文字列があるか否かを判断する(ステップS20)。具体的には、時刻を示す数字や「時」「分」等の文字からなる文字列があるか否かを判断し、あると判断した場合(ステップS20;YES)には、該当する文字列に時刻タグを付与する(ステップS21)。また、合致する文字列がない場合(ステップS20;NO)には、時刻タグをブランクとする(ステップS22)。
【0049】
図9には、放送用データ配信部30の文例抽出処理部34が行う案内文の検索、送信処理の具体的な手順の一例が示されている。
文例抽出処理部34は、図9に示すように、先ず、受信テキスト記憶部25を参照して最新の放送テキストデータがあるか否か判定する(ステップS41)。ここで、最新の放送テキストデータがある(YES)と判定すると、ステップS42へ進み、最新の放送テキストデータおよび受信履歴(受信時刻のリスト)を読み出し、ネットワークNを介してシステムに登録されている全端末装置もしくは所定のパスワードを用いてアクセスしている端末装置へ送信する。ステップS41で、最新の放送テキストデータがない(NO)と判定すると、ステップS43へ移行して、端末装置より路線選択情報を受信しているか判定する。
【0050】
そして、端末装置より路線選択情報を受信している(YES)と判定すると、ステップS44へ進み、路線選択情報に対応して路線に関する放送テキストデータを指標付きデータ記憶部26より読み出す。また、端末装置より路線選択情報を受信していない(NO)と判定すると、ステップS45へ進み、全部の路線に関する放送テキストデータを指標付きデータ記憶部26より読み出す。
次に、ステップS46へ移行して、端末装置より時刻を指定した放送テキストの送信要求を受信したか判定する。ここで、時刻を指定した放送テキストの送信要求を受信した(YES)と判定すると、ステップS47へ進み、路線選択情報に対応して路線に関する指定された時刻の放送テキストデータを指標付きデータ記憶部26より読み出す。また、ステップS46で時刻を指定した放送テキストの送信要求を受信しない(NO)と判定すると、ステップS47をスキップしてステップS48へ進む。
【0051】
ステップS48では、送信文例決定用テーブル記憶部37より文例決定用テーブル(図3(A)参照)を読み出して、ステップS44又はステップS47で読み出した放送テキストデータに付記されているタグに対応した確定ワードの条件に合致するものを検索する。そして、条件に合致するものがあるか判定する(ステップS49)。条件に合致するものがある(YES)と判定したときはステップS50へ進み、当該テーブルより案内文のIDを取得して該IDを用いて表示用文例(日本語)DB35より読み出して、当該要求元の端末装置へ送信する。また、ステップS49で条件に合致するものがない(NO)と判定すると、ステップS50をスキップしてステップS51へ進む。
【0052】
ステップS51では、端末装置において選択された日本語の表示用文例に対応する英語の案内文(表示用英文)の送信要求があるか判定する。そして、英語の案内文の送信要求がある(YES)と判定すると、ステップS52へ進んで、英語の案内文(表示用英文)および音声データを、表示用&音声データ(英語)DB36より読み出し、データ要求元の端末装置へ送信する。
次に、端末装置より、その他の定型文の送信要求があるか否か判定する(ステップS53)。そして、その他の定型文の送信要求がある(YES)と判定すると、ステップS54へ進んで、その他の定型文の日本語と英語の案内文を、表示用文例(日本語)DB35および表示用&音声データ(英語)DB36より読み出し、要求元の端末装置へ送信する。
その後、端末装置より、最新の放送テキストの送信要求があるか否か判定し(ステップS55)、最新の放送テキストの送信要求がある(YES)と判定すると、ステップS42へ移行して、最新の放送テキストデータおよび受信履歴(受信時刻のリスト)を読み出して、要求元の端末装置へ送信する。
【0053】
以上、本発明の実施形態について説明したが、本発明は、かかる実施形態に限定されず、その要旨を逸脱しない範囲で、種々変形が可能であることは言うまでもない。例えば、前記実施形態では、端末装置からの要求に応じて英文の案内文を送信する際に、当該英文案内文に対応する音声データも送信すると説明したが、端末装置からの個別の要求に応じて英文の案内文と音声データと別々に送信するように構成しても良い。
なお、異常時放送外国語化プログラムは、ブラウザの機能を利用して実現するように構成されたものでも、専用のアプリケーションプログラムとして構成されたものであってもよい。
【0054】
また、前記実施形態では、日本語案内文を原案内文とし、それを英語等の他の言語の放送分に翻訳したものを送信可能にしているが、同一の内容の案内文を複数の言語で記載した文例およびそれに対応する音声データを記憶したデータベースを設けて、複数の言語の中のいずれか言語の案内文を原案内文として選択可能とし、それを任意の他の言語の放送分に翻訳したものを送信可能に構成してもよい。
さらに、前記実施形態では、本発明を鉄道事業の社員用の端末装置に外国語による車内放送を支援するシステムとして構成した場合を例としたが、例えば列車利用者の有するスマートホンその他の携帯端末や駅構内等に設置された案内装置に外国語による案内文を提供するシステムやバス等の他の交通機関におけるサービスとしても利用することができる。
【符号の説明】
【0055】
100 異常時放送外国語化システム
20 テキストデータ加工部
21 タグ付け処理部(分類指標付与手段)
22 指標データ抽出部
24 辞書データベース
30 放送用データ配信部
31 表示用文例データ送信部
33 英文音声データ送信部
34 文例抽出処理部
図1
図2
図3
図4
図5
図6
図7
図8
図9