(58)【調査した分野】(Int.Cl.,DB名)
前記検出部によって検出された前記空白時間に関する情報と、当該空白時間の経過後に出力されることが予定されている所定の音声情報の再生時間、及び当該所定の音声情報の再生内容を通知する通知情報を生成する生成部、
をさらに備えたことを特徴とする請求項1〜11のいずれか一つに記載の決定装置。
【発明を実施するための形態】
【0010】
以下に、本願に係る決定装置、決定方法、及び決定プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る決定装置、決定方法、及び決定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.決定処理の概念〕
まず、
図1を用いて、決定装置100が実行する決定処理の概念について説明する。
図1は、実施形態に係る決定装置100が発揮する作用効果の一例を説明するための図である。
図1に示す決定処理システム1は、決定装置100と、マイクロホン20Aと、マイクロホン20Bと、出力装置30とを含む。なお、決定処理システム1に含まれる各装置は、図示した数に限られない。
【0012】
実施形態に係る決定装置100は、例えばサーバ装置やクラウドシステム等、単数または複数の情報処理装置により実現される。決定装置100は、例えば列車運行を行う事業者等によって管理され、駅の構内における音声の入出力を制御する。また、決定装置100は、移動通信網や各種有線ケーブルや無線LAN(Local Area Network)等のネットワークN(
図2参照)を介して、所定の外部装置から音声情報(例えば、列車運行を伝達するための自動音声)を取得することや、音声の入力に用いられる入力装置(
図1の例では、マイクロホン20Aやマイクロホン20B)や音声を出力する出力装置30等と通信することが可能である。
【0013】
マイクロホン20Aやマイクロホン20Bは、駅員によって利用される音声の入力装置である。マイクロホン20Aやマイクロホン20Bは、駅員が発声した音声の入力を受け付け、受け付けた音声に基づいて生成された音声情報を決定装置100に送信する。なお、以下では、マイクロホン20Aやマイクロホン20Bを区別する必要のない場合には、「マイクロホン20」と総称する。
【0014】
出力装置30は、駅のホームに設置されるスピーカー等の音声出力装置である。なお、出力装置30は、特定のホームにのみ指向性を有する指向性スピーカーであってもよい。また、マイクロホン20や出力装置30には、所定の増幅器や音声調整装置等の情報機器が接続されていてもよい。
【0015】
図1の例において、決定装置100は、列車の運行が記載されたスケジュール情報に基づいて、列車の発着を知らせる自動音声アナウンス(以下、「自動音声」と表記する)の入出力を制御する。なお、自動音声の内容は、列車の発着を知らせるためのものに限られず、ホームでの歩行を注意喚起するものや、喫煙の禁止を喚起するものや、宣伝情報等も含まれる。また、決定装置100は、マイクロホン20を介して駅員が入力するアナウンスの入出力を制御する。実施形態において、入出力の制御とは、音声の入力の受け付けや、出力装置30への音声信号の送信や、出力装置30において音声情報が出力(再生)される際の出力(再生)の態様の決定等の処理を含む。
【0016】
このように、決定装置100が入出力を制御する駅のホームでは、様々な音声が出力装置30から出力されるため、音声の衝突が発生する場合がある。具体的には、列車の到着を知らせる自動音声が出力されるタイミングと同時に、駅員がマイクロホン20を介して乗客に注意喚起を行う場合がある。この場合、いずれかの音声の出力が中断されるか、もしくは、音声が混同して出力される可能性がある。このため、乗客に伝達されるべき情報が損なわれるか、あるいは、聞き辛い音声が再生されることになり、いずれにしても、乗客にとって望ましい状況とはいえない。そこで、決定装置100は、以下に説明する決定処理により、状況に応じて適切に音声の衝突を回避しつつ、伝達する音声情報の内容を保持することを可能とする。以下、
図1を用いて、実施形態に係る決定処理の概要を流れに沿って説明する。
【0017】
図1では、決定装置100が音声の入出力を制御する駅のホームにおける、7時00分00秒の時点の音声の衝突状況を例示している。例えば、マイクロホン20Aは、駅員Aから、「いつもご利用ありがとうございます。構内は禁煙ですので、おタバコはご遠慮ください。」といった内容の、ホームの乗客に対するマナーへの注意喚起のアナウンス(以下、「音声情報61」と称する)を受け付ける。また、列車の運行のスケジュール情報に基づき、「まもなく1番線に渋谷行きの電車が参ります。」といった内容の、運行に関する自動音声アナウンス(以下、「音声情報62」と称する)が出力されようとしている。また、マイクロホン20Bは、駅員Bから、「お客様、お下がりください!」といった内容の、ホームの乗客に対する危険回避のためのアナウンス(以下、「音声情報63」と称する)を受け付ける。
【0018】
決定装置100は、これらの音声情報を取得する(ステップS11)。決定装置100は、取得した音声情報を音声情報記憶部121に格納する。なお、決定装置100は、必ずしも音声情報をリアルタイムに取得することを要しない。例えば、決定装置100は、音声情報62等の自動音声に関しては予め取得しておいてもよい。
【0019】
そして、決定装置100は、取得した各音声情報に対して優先度を付与する(ステップS12)。具体的には、決定装置100は、1から10までの数値によって示される優先度であって、数値が小さいほど優先の度合いが高くなるような優先度を各音声情報に付与する。
【0020】
実施形態では、決定装置100は、例えば、入力時に音声情報にタグ付けされた優先度に基づいて、音声情報に優先度を付与する。実施形態において、マイクロホン20は、音声を受け付ける際に、「通常時」に流すアナウンスであるか、「緊急時」に流すアナウンスであるかの選択を受け付けることが可能であるものとする。例えば、マイクロホン20は、マイクロホン20に備えられたボタンのうち、一のボタンを押下されて音声を受け付けた場合には「通常時」アナウンスのタグ付けを行う。また、マイクロホン20は、マイクロホン20に備えられたボタンのうち、他のボタンを押下されて音声を受け付けた場合には「緊急時」アナウンスのタグ付けを行う。これにより、マイクロホン20は、音声情報を決定装置100に送信する際に、優先度のタグ付けを行うことができる。
【0021】
図1の例では、駅員Aは、マイクロホン20Aに備えられたボタンのうち、「通常時」アナウンスのタグ付けが行われるボタンを押下して音声の入力を行ったものとする。この場合、決定装置100は、例えば「3」という優先度を音声情報61にタグ付けする。また、駅員Bは、マイクロホン20Bに備えられたボタンのうち、「緊急時」アナウンスのタグ付けが行われるボタンを押下して音声の入力を行ったものとする。この場合、決定装置100は、例えば「1」という優先度を音声情報63にタグ付けする。なお、優先度は、マイクロホン20に備えられたボタン等によって選択されるのではなく、マイクロホン20の個体そのものに予め設定されていてもよい。
【0022】
また、決定装置100は、列車の運行を知らせるための自動音声については、例えば、予め運行管理者によって設定された優先度を付与する。決定装置100は、例えば、列車の運行を知らせるための自動音声である音声情報62に対して「2」という優先度を付与する。
【0023】
そして、決定装置100は、7時00分00秒の時点で、出力すべき音声情報が3つ取得されたことから、音声の衝突が発生したことを検知する。この場合、決定装置100は、3つの音声情報を順番に出力させることができるような処理を行う。まず、決定装置100は、取得した音声情報のうち、最も優先度の高い音声情報を優先的に出力させることを決定する。このとき、決定装置100は、最も優先度の高い音声情報以外の音声情報であって、録音されていない音声情報について、一時的に録音を行う。
図1の例では、音声情報62は、自動音声であり予め録音されたものであるため、決定装置100が録音を新たに行うことを要しない。一方、音声情報61は、録音された音声情報ではない。このため、決定装置100は、音声情報63と比較して優先度の低いアナウンスである音声情報61を、一時的に出力情報記憶部125に格納する(ステップS13)。
【0024】
決定装置100は、出力が衝突している3つの音声情報のうち、最も優先度の高い音声情報63を出力することを決定する。この場合、決定装置100は、自動音声である音声情報62が出力される予定(スケジュール)に関わらず、音声情報63を出力させる。これは、緊急時に駅員から発せられるアナウンス等は、スケジュールに割り込んででも優先して出力されるよう設定されていることを意味する。このため、決定装置100は、衝突した音声情報のうち、最も優先度の高い割り込みアナウンス(音声情報63)を優先して出力させる(ステップS14)。
【0025】
音声情報63の出力の後、決定装置100は、各音声情報が衝突しない時間帯である空白時間を検出する処理を行う(ステップS15)。具体的には、決定装置100は、出力情報記憶部125に予め保持されている、列車のスケジュール情報を参照する。そして、決定装置100は、音声情報63の出力が終了した後、次の自動音声が出力されるタイミング迄の空白時間を検出する。
【0026】
このとき、決定装置100は、検出された空白時間と、各音声情報に付与された優先度とに基づいて、音声情報を出力する態様を決定する。音声情報を出力する態様とは、音声情報を出力する順番、及び、音声情報が出力される際の再生に関する態様を含む。再生に関する態様とは、再生の速度や、音声情報のうち再生される箇所の選択を含む。
【0027】
まず、決定装置100は、出力を待つこととなった音声情報(以下、「待ち音声」と称する場合がある)を、優先度に基づいて順序付ける。
図1の例では、決定装置100は、待ち音声のうち、優先度の高い音声情報62を音声情報61よりも上位に順位付ける。
【0028】
そして、決定装置100は、音声情報62の再生に掛かる時間である再生時間を参照する。そして、決定装置100は、検出される空白時間が、参照した再生時間よりも長い場合には、音声情報62を出力することを決定する。
【0029】
なお、決定装置100は、検出される空白時間が再生時間よりも短い場合であっても、音声情報62を出力することができる場合がある。例えば、決定装置100は、各音声情報について、音声情報を短縮した場合の再生時間(以下、「短縮再生時間」と称する)に関する情報を保持するものとする。短縮再生時間とは、例えば、音声情報のうち省略できる箇所を省略した場合の再生時間であったり、音声情報を若干速く(例えば、通常の1.3倍速などで)再生した場合の再生時間であったりする。
【0030】
すなわち、決定装置100は、検出された空白時間が、音声情報61に割り込まれた音声情報62の再生時間よりも短い場合であって、かつ、空白時間が短縮再生時間よりも長い場合には、音声情報62を出力可能な態様に変更することを決定する(ステップS16)。具体的には、決定装置100は、音声情報62の一部箇所を省略して出力させたり、音声情報62の再生速度を早くして出力させたりするよう、出力の態様を決定する。
【0031】
このようにして、決定装置100は、空白時間の長さに合わせて音声情報62(自動音声)を出力させる(ステップS17)。音声情報62を出力させた後、決定装置100は、さらに空白時間を検出する(ステップS18)。そして、決定装置100は、音声情報61を出力可能な空白時間が検出されるか否かに応じて、待ち音声(音声情報61)の出力タイミングを決定する(ステップS19)。そして、決定装置100は、音声情報62の場合と同様に、空白時間の長さに合わせて、音声情報61を出力させる(ステップS20)。
【0032】
上述のように、実施形態に係る決定装置100は、音声情報を取得し、取得した音声情報に優先度を付与する。そして、決定装置100は、音声情報の出力にあたり、各音声情報が衝突しない時間帯である空白時間を検出する。さらに、決定装置100は、検出された空白時間と、付与した優先度とに基づいて、音声情報を出力する態様を決定する。これにより、決定装置100は、状況に応じて適切に音声の衝突を回避しつつ、伝達する情報の内容を保持することを可能とする。以下、図を用いて、決定処理を実現する決定装置100の機能構成及び作用効果の一例を説明する。
【0033】
〔2.機能構成の一例〕
まず、
図2を用いて、実施形態に係る決定装置100の構成について説明する。
図2は、実施形態に係る情報処理装置が有する機能構成の一例を説明する図である。
図2に示すように、決定装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、決定装置100は、決定装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0034】
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、マイクロホン20や出力装置30との間で、種々の情報の送受信を行う。
【0035】
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、
図2に示すように、音声情報記憶部121と、出力情報記憶部125とを有する。以下、
図3乃至
図6を用いて、音声情報記憶部121、及び出力情報記憶部125に登録される情報の一例を説明する。
【0036】
音声情報記憶部121には、音声情報に関する情報が記憶される。
図2に示すように、音声情報記憶部121は、データテーブルとして、自動音声テーブル122と、アナウンステーブル123とを有する。以下、各データテーブルについて順に説明する。
【0037】
自動音声テーブル122は、音声情報のうち、自動音声に関する情報を記憶する。
図3は、実施形態に係る自動音声テーブル122の一例を示す図である。
図3に示すように、自動音声テーブル122は、「自動音声種別」、「日程」、「自動音声ID」、「伝達内容」、「優先度」、「出力タイミング」、「再生時間」、「短縮再生時間」といった項目を有する。
【0038】
「自動音声種別」は、自動音声の種別を示す。自動音声の種別とは、例えば、自動音声が列車の発着等を知らせる運行案内であるか、ホームに所在する乗客等への注意喚起であるか、あるいは宣伝等の広告情報であるかといった、自動音声のカテゴリを示す。なお、自動音声は、自動音声種別に応じた優先度が付与されてもよい。「日程」は、自動音声の再生が予定されている日程を示す。
【0039】
「自動音声ID」は、各々の自動音声を識別する識別情報を示す。「伝達内容」は、具体的な自動音声の伝達内容を示す。「優先度」は、自動音声に付与された優先度を示す。「出力タイミング」は、自動音声の出力が予定されている具体的な時間を示す。なお、自動音声には、運行案内等のように時間によって出力が予定されているものと、注意喚起や広告情報のように、具体的な時間によっては出力が予定されていないものとがある。
【0040】
「再生時間」は、自動音声の基本的な再生時間を示す。「短縮再生時間」は、自動音声を短縮して再生する場合の再生時間を示す。
【0041】
次に、アナウンステーブル123について説明する。アナウンステーブル123は、音声情報のうち、駅員等がマイクロホン20を介して入力したアナウンスに関する情報を記憶する。
図4は、実施形態に係るアナウンステーブル123の一例を示す図である。
図4に示すように、アナウンステーブル123は、「入力装置ID」、「アナウンス種別」、「アナウンスID」、「取得日時」、「伝達内容」、「優先度」、「録音時間」、「短縮再生時間」といった項目を有する。
【0042】
「入力装置ID」は、アナウンスに係る音声情報が入力された装置を識別する識別情報を示す。「アナウンス種別」は、アナウンスの種別を示す。なお、上述のように、アナウンス種別は、マイクロホン20に入力される際の選択操作によって設定されてもよいし、マイクロホン20ごとに予め設定されていてもよい。なお、通常アナウンスとは、通常時と設定されて入力されたアナウンスを示す。緊急アナウンスとは、緊急時と設定されて入力されたアナウンスを示す。録音アナウンスとは、即時的に出力させるアナウンスではなく、駅員等が宣伝などを予め録音するために入力を行ったアナウンスである。「アナウンスID」は、アナウンスに係る音声情報を識別する識別情報を示す。
【0043】
「取得日時」は、アナウンスが取得された日時を示す。「伝達内容」は、アナウンスの内容を示す。なお、アナウンスの内容は、例えば入力のタイミングにおいて、マイクロホン20に備えられた機能によって駅員が自らタグ付けした内容であってもよいし、アナウンスの音声を解析し、解析された内容(例えば、テキストデータの内容等)から自動的に付与されてもよい。
【0044】
「優先度」は、アナウンスに係る音声情報の優先度を示す。「録音時間」は、アナウンスが録音された時間、すなわち、アナウンスに係る音声情報の再生時間を示す。「短縮再生時間」は、アナウンスに係る音声情報を短縮して再生する場合の再生時間を示す。
【0045】
次に、出力情報記憶部125について説明する。出力情報記憶部125には、自動音声が出力されるスケジュールや、出力待ちとなった音声情報が記憶される。
図2に示すように、出力情報記憶部125は、データテーブルとして、スケジュールテーブル126と、出力待ちテーブル127とを有する。以下、各データテーブルについて順に説明する。
【0046】
スケジュールテーブル126は、自動音声のスケジュールを記憶する。
図5は、実施形態に係るスケジュールテーブル126の一例を示す図である。
図5に示すように、スケジュールテーブル126は、「音声出力スケジュール」、「自動音声ID」、「再生時間」、「空白時間」といった項目を有する。
【0047】
「音声出力スケジュール」は、自動音声が出力される予定時刻を示す。「自動音声ID」は、自動音声を識別する識別情報を示す。「再生時間」は、自動音声の再生時間を示す。「空白時間」は、スケジュールにおいて、一の自動音声の再生が終了した後に次の自動音声の再生が開始されるまでの時間であって、出力装置30において出力が空白となる時間を示す。なお、空白時間は、割り込みアナウンス等によって自動音声の出力が遅延した場合等には、適宜、遅れた時間に応じて更新されてもよい。
【0048】
出力待ちテーブル127は、出力を待機している待ち音声に関する情報を記憶する。
図6は、実施形態に係る出力待ちテーブル127の一例を示す図である。
図6に示すように、出力待ちテーブル127は、「音声衝突日時」、「待ち音声ID」、「優先度」、「再生時間」、「出力態様」といった項目を有する。
【0049】
「音声衝突日時」は、音声情報の衝突が発生した日時を示す。「待ち音声ID」は、音声情報の衝突が発声した時点で、出力されずに出力を待っている状態となっている音声情報を識別する識別情報を示す。なお、待ち音声IDとして示す識別情報は、
図3の自動音声IDや、
図4のアナウンスIDと共通するものとする。「優先度」は、待ち音声に付与されている優先度を示す。「再生時間」は、待ち音声の再生時間を示す。「出力態様」は、待ち音声が出力される場合に予定されている出力態様を示す。待ち音声は、空白時間が検出されるのを待って再生されたり、本来のスケジュールから遅れて再生されたりすることになるため、通常よりも早く再生が終わるような態様で出力されてもよい。具体的には、出力態様は、音声情報の一部を再生することで再生時間を短縮したり、再生速度を速くして再生時間を短縮したりしてもよい。例えば、決定装置100は、待ち音声の合計の再生時間と検出された空白時間との長さを比較して、空白時間の方が短ければ、待ち音声の出力態様を短く再生できるよう決定することで、待ち音声を極力早く出力させるよう調整する。
【0050】
図2に戻って説明を続ける。制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等によって、決定装置100内部の記憶装置に記憶されている各種プログラム(例えば、実施形態に係る決定プログラム)が、RAM等の記憶領域を作業領域として実行されることにより実現される。
図2に示す例では、制御部130は、取得部131と、付与部132と、検出部133と、決定部134と、送信部135(以下、総称して各処理部131〜135と記載する場合がある。)を有する。
【0051】
なお、制御部130が有する各処理部131〜135の接続関係は、
図2に示した接続関係に限られず、他の接続関係であってもよい。また、各処理部131〜135は、以下に説明するような決定処理の機能・作用(例えば
図1)を実現・実行するものであるが、これらは説明のために整理した機能単位であり、実際のハードウェア要素やソフトウェアモジュールとの一致は問わない。すなわち、以下の決定処理の機能・作用を実現・実行することができるのであれば、決定装置100は、任意の機能単位で案内処理を実現・実行して良い。
【0052】
〔3.決定処理における作用効果の一例〕
以下、
図7及び
図8に示すフローチャートを用いて、各処理部131〜135が実行・実現する決定処理の内容について説明する。
図7は、実施形態に係る決定処理の一例を示すフローチャート(1)である。なお、
図7では、アナウンス等の自動音声以外の音声情報が衝突した場合の決定処理の処理手順の一例を示している。
【0053】
まず、取得部131は、音声情報を取得したか否かを判定する(ステップS101)。なお、取得部131は、マイクロホン20等の入力装置を介して、駅員等の話者から音声の入力を受け付けることで音声情報を取得する。取得部131は、音声情報を取得していない場合(ステップS101;No)、取得するまで待機する。取得部131が音声情報を取得した場合(ステップS101;Yes)、付与部132は、取得した音声情報に優先度を付与する。例えば、付与部132は、マイクロホン20等における設定(「通常時」や「緊急時」の選択など)に基づいて、音声情報に優先度を付与する(ステップS102)。
【0054】
このとき、検出部133は、音声情報を取得した場合に、音声の衝突が発生したか否かを判定する(ステップS103)。なお、検出部133は、何らかの音声情報が現時点で出力されている場合のみを衝突として判定するのではなく、例えば、数秒後に自動音声が出力される予定になっている状況を衝突として判定してもよい。
【0055】
音声の衝突が発生していない場合には(ステップS103;No)、取得部131は、音声情報を取得する処理を継続する。なお、
図7での図示は省略しているが、決定部134は、音声の衝突が発生しない場合、ステップS101で取得した音声情報をそのまま出力装置30に出力するよう決定してもよい。
【0056】
音声の衝突が発生した場合には(ステップS103;Yes)、取得部131は、衝突した音声情報のうち、録音されていない音声が存在するか否かを判定する(ステップS104)。録音されていない音声が存在する場合(ステップS104;Yes)、取得部131は、録音されていない音声を録音する(ステップS105)。例えば、取得部131は、複数の話者から別々に入力された二以上の音声情報であって、付与部132によって優先度が付与された音声情報を取得した場合には、最も優先度の高い音声情報以外を一時的に録音する。言い換えれば、取得部131は、取得した音声情報を音声情報記憶部121に格納する。なお、衝突した音声情報が録音されているものであれば(ステップS104;No)、取得部131は、音声情報を録音することを要しない。
【0057】
そして、決定部134は、衝突した音声情報のうち、最も優先度の高い音声を出力させることを決定する(ステップS106)。続けて、決定部134は、待ち音声の順番を変更する(ステップS107)。すなわち、決定部134は、最も順位の高い(優先度の高い)音声情報を出力させた後に、次に順位の高い待ち音声を、待ち音声の最上位に変更する。
【0058】
そして、検出部133は、待ち音声を出力可能な空白時間を検出したか否かを判定する(ステップS108)。なお、待ち音声を出力可能な空白時間とは、例えば、待ち音声を短縮した場合に待ち音声を再生できるような、待ち音声の短縮再生時間よりも長い空白時間をいう。出力可能な空白時間を検出しない場合(ステップS108;No)、検出部133は、空白時間を検出するまで待機する。一方、出力可能な空白時間を検出した場合(ステップS108;Yes)、さらに検出部133は、検出された空白時間が、次に出力予定の音声情報と比較して長いか否かを判定する(ステップS109)。
【0059】
検出された空白時間が次に出力予定の音声情報と比較して長い場合(ステップS109;Yes)、決定部134は、出力予定の音声情報を出力させることを決定する(ステップS110)。一方、検出された空白時間が次に出力予定の音声情報と比較して長くない場合(ステップS109;No)、決定部134は、空白時間に適合するよう出力態様を決定する(ステップS111)。
【0060】
例えば、決定部134は、空白時間の長さに合わせて、出力する音声情報の再生速度を決定する。あるいは、決定部134は、空白時間の長さに合わせて、音声情報における再生箇所を選択し、選択された再生箇所のみを出力するよう決定する。
【0061】
そして、決定部134は、決定した態様で、出力予定の音声情報を出力させる(ステップS112)。すなわち、送信部135は、決定部134によって決定された態様で、音声情報を出力装置30に送信する。
【0062】
ここで、送信部135が音声情報を出力装置30に送信した後に、決定部134は、さらに待ち音声が存在するか否かを判定する(ステップS113)。さらに待ち音声が存在する場合(ステップS113;Yes)、決定部134は、待ち音声の順番を変更する(ステップS107)。一方、待ち音声が存在しない場合(ステップS113;No)、決定部134は、ステップS103以降で発生した処理を終了する。
【0063】
次に、
図8を用いて、各処理部131〜135が実行・実現する決定処理の内容について説明する。
図8は、実施形態に係る決定処理の一例を示すフローチャート(2)である。なお、
図8では、自動音声とアナウンス等の音声情報とが衝突した場合の決定処理の処理手順の一例を示している。
【0064】
図8の例の場合、取得部131は、自動音声に係る音声情報、及び自動音声を出力させる(再生する)ためのスケジュール情報を予め保持する。決定部134は、出力情報記憶部125に保持されているスケジュール情報を参照し、自動音声を再生するタイミングが到来したか否かを判定する(ステップS201)。自動音声を再生するタイミングが到来していない場合(ステップS201;No)、決定部134は、タイミングが到来するまで待機する。
【0065】
一方、自動音声を再生するタイミングが到来した場合(ステップS201;Yes)、決定部134は、自動音声を再生させる(ステップS202)。取得部131は、自動音声の再生中に新たな音声情報を取得したか否かを判定する(ステップS203)。具体的には、取得部131は、新たな音声情報として、マイクロホン20を介したアナウンス等の音声情報の入力が受け付けられたか否かを判定する。すなわち、取得部131は、音声の衝突が発生したか否かを判定する。自動音声の再生中に新たな音声情報を取得しない場合(ステップS203;No)、決定部134は、次の自動音声を再生するタイミングが到来するまで待機する。
【0066】
一方、自動音声の再生中に新たな音声情報を取得した場合(ステップS203;Yes)、付与部132は、新たな音声情報に優先度を付与する。そして、決定部134は、再生中の自動音声よりも取得した音声情報の方の優先度が高いか否かを判定する(ステップS204)。
【0067】
再生中の自動音声よりも取得した音声情報の方の優先度が高い場合(ステップS204;Yes)、決定部134は、自動音声の現時点における再生箇所を記憶するとともに、自動音声の再生を停止する(ステップS205)。そして、決定部134は、取得した音声を出力装置30に出力させることを決定する(ステップS206)。
【0068】
このことは、付与部132によって所定の閾値よりも高い優先度が音声情報に付与された場合には、決定部134は、空白時間に関わらず、当該音声情報を優先的に出力させるよう決定することを意味する。また、このことは、自動音声よりも優先度の高い音声情報が取得された場合には、決定部134は、スケジュールに関わらず、優先度の高い音声情報を出力させるよう決定することを意味する。具体的には、決定部134は、自動音声よりも優先度の高いような、危険回避のための緊急時のアナウンスが入力された場合には、自動音声の再生中や、空白時間が短い(次の自動音声が出力されるまでの時間の数秒前など)場合であっても、当該アナウンスを割り込ませて出力する。
【0069】
ステップS205で示したように、決定部134は、自動音声よりも優先度の高い音声情報を出力することを決定した場合に、自動音声を含む他の音声情報が出力されている途中である場合には、当該優先度の高い音声情報を優先的に出力させるとともに、当該他の音声情報の出力を停止させることを決定する。そして、決定部134は、音声の停止した箇所を記憶する。これにより、決定部134は、衝突の発生した音声情報を再び再生させる場合に、停止した箇所、もしくは停止した箇所の近傍から再生を開始することができる。なお、停止した箇所の近傍とは、例えば、停止箇所から数秒間だけ前の箇所である。すなわち、決定部134は、停止した音声情報を再び再生する場合、停止した箇所からではなく、数秒間前から再生させるように出力態様を決定してもよい。
【0070】
その後、決定部134は、取得した音声情報の出力が終了したか否かを判定する(ステップS207)。取得した音声情報の出力が終了していない場合(ステップS207;No)、決定部134は、優先度の高い音声情報を出力し続ける。一方、取得した音声情報の出力が終了した場合(ステップS207;Yes)、検出部133、停止させた自動音声を再び再生させるための空白時間を検出したか否かを判定する(ステップS208)。
【0071】
検出部133は、例えば、スケジュールに基づいて出力されるタイミングが予め設定された音声情報である自動音声が取得部131によって取得されている場合、当該自動音声が出力されるタイミングを示したスケジュール情報を参照する。そして、検出部133は、自動音声に設定されたスケジュールに基づいて、空白時間を検出する。具体的には、検出部133は、現在時刻と、
図5で示したようなスケジュールテーブル126に記載された空白時間とを参照して、再生が停止された自動音声を再び再生させるための空白時間を検出する。なお、この過程において、検出部133は、スケジュールテーブル126に記憶された情報を適宜更新してもよい。例えば、検出部133は、緊急のアナウンスが割り込んだことによって、自動音声を出力させるタイミングに遅れが生じた場合には、遅れた時間に応じて音声出力スケジュールを適宜更新する。
【0072】
出力可能な空白時間を検出しない場合(ステップS208;No)、検出部133は、空白時間を検出するまで待機する。一方、出力可能な空白時間を検出した場合(ステップS208;Yes)、さらに検出部133は、検出された空白時間が、所定時間(例えば、停止した自動音声の元々の再生時間や、停止した自動音声の残りの再生時間)と比較して長いか否かを判定する(ステップS209)。
【0073】
検出された空白時間が所定時間と比較して長い場合(ステップS209;Yes)、具体的には、検出された空白時間が停止した自動音声の元々の再生時間よりも長い場合、決定部134は、停止した自動音声を最初から再生するよう態様を決定する(ステップS210)。これは、停止した箇所から自動音声を再生するよりも、可能であれば、自動音声を最初から再生する方が、伝達すべき情報を確実に乗客に伝えることができるからである。
【0074】
なお、決定部134は、検出された空白時間が停止した自動音声の元々の再生時間よりも長い場合であっても、必ずしも最初から自動音声を再生することを要しない。例えば、本来、自動音声を再生するタイミングから所定時間(例えば、数十秒)以上経過していた場合において、運行情報等のタイミングが詳細に設定されている自動音声については、素早く再生を終了した方が望ましい場合がある。すなわち、決定部134は、例えば
図3に示した自動音声種別に応じて、自動音声の出力態様を決定してもよい。具体的には、決定部134は、運行案内に係る自動音声については、自動音声を再生するタイミングから所定時間以上経過していた場合、最初から再び自動音声を再生することをせず、停止箇所から再生させるよう決定してもよい。あるいは、決定部134は、注意喚起や広告情報等の自動音声については、自動音声を再生するタイミングから所定時間以上経過していた場合であっても、最初から再び自動音声を再生するよう、出力態様を決定してもよい。
【0075】
なお、検出された空白時間が、所定時間(例えば、停止した自動音声の元々の再生時間や、停止した自動音声の残りの再生時間)と比較して長くなかった場合(ステップS209;No)、決定部134は、自動音声を出力する態様を決定する(ステップS211)。例えば、検出された空白時間が、停止した自動音声の最初からの再生時間よりも短いものの、停止した自動音声の残りの再生時間よりも長い場合、決定部134は、優先度の高い音声情報の出力が終了した後に、自動音声の出力を停止させた再生箇所の近傍から、自動音声を再び出力させることを決定する。
【0076】
あるいは、決定部134は、検出された空白時間が、停止した自動音声の残りの再生時間と比較しても長くないものの、自動音声の出力態様(例えば、自動音声の再生速度や、再生箇所)の調整によって、自動音声を再生可能である場合には、調整した態様で出力することを決定する。このようにして、決定部134は、決定した態様で、停止させた自動音声を再び出力させる(ステップS212)。
【0077】
一方、新たに取得した音声情報が、自動音声よりも優先度が低い場合(ステップS204;No)、取得部131は、取得した音声情報を一時的に録音する(ステップS221)。
【0078】
この場合、決定部134は、自動音声の再生を継続させる(ステップS222)。そして、決定部134は、自動音声の再生が終了したか否かを判定する(ステップS223)。自動音声の再生が終了していない場合(ステップS223;No)、決定部134は、自動音声を再生し続ける。一方、自動音声の再生が終了した場合(ステップS223;Yes)、検出部133は、録音しておいた音声情報を再生させるための空白時間を検出したか否かを判定する(ステップS224)。
【0079】
具体的には、検出部133は、スケジュール情報を参照して空白時間を検出する。空白時間を検出しない場合(ステップS224;No)、検出部133は、検出するまで待機する。空白時間を検出した場合(ステップS224;Yes)、さらに検出部133は、検出された空白時間が所定時間(例えば、取得した音声情報の録音時間)よりも長いか否かを判定する(ステップS225)。検出された空白時間が所定時間よりも長い場合(ステップS225;Yes)、決定部134は、取得した音声情報を通常の速度で再生するよう態様を決定する(ステップS226)。
【0080】
一方、検出された空白時間が所定時間よりも長くない場合(ステップS225;No)、決定部134は、空白時間に適合するよう、取得した音声情報の出力態様を決定する(ステップS227)。そして、決定部134は、決定した態様で取得した音声情報を出力させる(ステップS228)。このあと、送信部135は、決定部134の決定した態様に関する情報と、音声情報とを出力装置30に送信する。
【0081】
〔4.変形例〕
上述した実施形態に係る決定装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の決定装置100の他の実施形態について説明する。なお、以下では、実施形態と同様の点については適宜説明を省略する。
【0082】
〔4−1.通知情報の生成〕
決定装置100は、自動音声等のスケジュールや空白時間、録音されたアナウンス等の情報を話者(例えば、駅員)に通知するための通知情報を生成する構成を有していてもよい。例えば、変形例に係る決定装置200の構成例を
図9に示す。
図9は、変形例に係る決定装置200が有する機能構成の一例を説明する図である。決定装置200は、決定装置100に対して、生成部136を更に有する。
【0083】
生成部136は、検出部133によって検出された空白時間に関する情報と、空白時間の経過後に出力されることが予定されている所定の音声情報の再生時間、及び所定の音声情報の再生内容を通知する通知情報を生成する。
【0084】
例えば、生成部136が生成する通知情報は、駅員がマイクロホン20を利用してアナウンスを行おうとする際に、例えばマイクロホン20や、マイクロホン20の近傍に設置された情報機器に表示される。具体的には、通知情報は、次に自動音声が出力されるまでの空白時間の長さ(例えば、自動音声が出力される迄の残り秒数など)や、次に出力される自動音声にタグ付けされた情報であって、自動音声の伝達内容を示す情報や、自動音声の再生時間の長さ等を含む。なお、通知情報が含む情報は、自動音声に係る情報に限らず、例えば、一時的に録音されて待ち音声となっている音声情報に係る情報を含んでもよい。
【0085】
すなわち、駅員は、通知情報を確認することで、自動音声とアナウンスが衝突してしまうことを回避できる。また、駅員は、自身が行おうとするアナウンスが、次に出力される自動音声の内容と重複することを認識できる。すなわち、生成部136が生成する通知情報によって、自動音声や、録音された音声情報との衝突が発生することを防止できる。
【0086】
〔4−2.出力態様のバリエーション〕
上記実施形態では、決定部134は、音声情報の速度を調整したり、再生箇所を調整したりして、出力態様を決定する例を示した。ここで、決定部134は、さらに異なる手法の出力態様を採用してもよい。
【0087】
例えば、取得部131は、文節ごとに優先順位の付与された自動音声を取得する。そして、決定部134は、音声情報に含まれる文節であって予め再生順位が設定された文節の中から、再生順位の高い順に文節を抽出し、抽出した文節を組み合わせて出力するよう、出力態様を決定する。なお、文節は、例えば自動音声を作成する者によって任意に設定されてもよい。具体的には、取得部131は、「まもなく1番線に渋谷行きの電車が参ります。」という内容の自動音声であって、「1番線に」、「渋谷行き」、「参ります」といった文節の優先度が比較的高く、「まもなく」、「の電車が」という文節の優先度が比較的低い自動音声を取得する。この場合、決定部134は、例えば空白時間が所定時間よりも短い場合に、優先度の低い文節を省略した自動音声を出力させるよう決定する。この例では、決定部134は、「まもなく」及び「の電車が」という文節を省略し、「1番線に渋谷行き参ります。」という内容で、自動音声を出力させるよう決定する。
【0088】
このように、決定部134は、文節ごとの優先度に応じて、再生箇所を決定してもよい。これにより、決定部134は、再生時間を短くするとともに、伝達内容を損なわないように音声情報を出力させることができる。なお、省略する文節は、必ずしも予め設定されていることを要さない。例えば、決定部134は、自動音声に対して機械学習処理を行い、省略されたとしても意味を損なわない箇所について、優先度を自動的に低く設定するなどの処理を行ってもよい。
【0089】
また、決定部134は、自動音声が示す全体の占有割合に基づいて、音声を短縮して再生するか否か等を判定してもよい。
図1のような駅のホームを例に挙げると、朝や夕方などの時間帯には、時間帯において自動音声が占める占有割合が高くなると想定される。言い換えれば、朝や夕方などの時間帯には、全体的に空白時間が短くなる傾向になると想定される。このため、決定部134は、例えば、自動音声が占める占有割合が多い時間帯では、全体の音声を短縮して再生するよう決定してもよい。これにより、決定部134は、少しでも空白時間を多く確保できるようになるため、全体として、音声情報が衝突することを防止することができる。
【0090】
〔4−3.決定処理の応用〕
上記実施形態では、駅のホームにおいて音声情報の衝突を防止する例を示した。しかし、上記実施形態で示した決定処理は、様々な状況に応用可能である。
【0091】
例えば、実施形態に係る決定処理は、複数人が参加する会議等にも利用することができる。例えば会議では、話者はマイクロホンを用いて発話し、発話された音声を参加者がイヤホンやスピーカー等で聞くことになる。例えば、決定装置100は、議長のマイクロホンに最も高い優先度を付与し、その他の話者が発話した場合には、各々の話者の優先度に応じて、優先度の高い音声を順に出力させるよう態様を決定する。また、決定装置100は、各々の話者の優先度を動的に変化させてもよい。例えば、決定装置100は、発話の回数に応じて優先度を動的に変化させて付与してもよい。例えば、決定装置100は、発話の多い話者の優先度を、徐々に低くしていき、一人の話者に発話が集中しないような調整を行ってもよい。
【0092】
また、実施形態に係る決定処理は、オンライン上で行われる複数人が参加する通話等に利用されてもよい。実施形態に係る決定処理によれば、複数の話者が同時に端末装置に音声を入力した場合であっても、発話された内容が順に出力される。すなわち、実施形態に係る決定処理によれば、音声の衝突が防止されるため、参加者は、音声を聞き取りやすくなる。また、実施形態に係る決定処理によれば、話者が発話した内容が録音されるため、話者は、発話するタイミングを待たなくとも発話を行うことができる。なお、話者は、自ら優先度を選択するようにしてもよい。
【0093】
また、実施形態に係る決定処理は、例えば、IoT(Internet of Things)機器や、スマートデバイス、ロボット等の発話処理に利用されてもよい。例えば、ロボットの発話に利用される場合、ロボットは、定期的に発話する自動音声として、優先度の低い定期メンテナンスの情報等を保持する。また、ロボットは、緊急時に発話する自動音声として、優先度の高い通知情報(故障の知らせなど)を保持する。そして、ロボットは、例えば何らかの会話の途中において、定期メンテナンスの情報を発話するタイミングが到来したとしても、会話の方の優先度が高いのであれば、定期メンテナンスの情報を発話するタイミングを遅らせる。一方、ロボットは、何らかの会話の途中であっても、故障等の優先度の高い情報が割り込んだ場合、会話を中断して故障の通知を発話する。
【0094】
また、実施形態に係る決定処理は、例えば、家庭内で利用される自動アナウンスに応用されてもよい。例えば、実施形態に係る決定処理が家庭内で利用される自動アナウンスに応用される場合、料理が焦げているといった緊急な状況をアナウンスする場合の優先度を高く設定する。また、あと数時間以内で荷物が届くといった、緊急でないアナウンスの優先度を低く設定する。そして、実施形態に係る決定処理によれば、例えば2つのアナウンスが衝突した場合であっても、緊急性を有するアナウンスが自動的に選択され、優先的に出力されることになる。
【0095】
また、実施形態に係る決定処理は、例えば、カーナビアプリ等のナビソフトウェアに利用されてもよい。例えば、実施形態に係る決定処理がカーナビアプリで利用される場合、次の交差点を右折するとか、ガソリンが切れるおそれがあるなど、緊急な状況をアナウンスする場合の優先度を高く設定する。また、付近に美味しいレストランがあるなど、緊急でないアナウンスの優先度を低く設定する。この場合、ある地点を通った際に2つのアナウンスが出力される設定になっていたとしても、実施形態に係る決定処理によれば、次の交差点を右折するといった緊急な状況をアナウンスする音声が優先的に出力される。
【0096】
また、実施形態に係る決定処理では、例えば、空港等の比較的広い場所において、伝達する内容が全体に対するものであるか、あるいは、個人的なものであるかに応じて、優先度が設定されてもよい。例えば、乗客全体に対するアナウンスには高い優先度が設定され、個人に通知されるべきアナウンスには比較的低い優先度が設定されてもよい。
【0097】
〔5.他の実施形態〕
なお、上記実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、本出願における機能構成、データ構造、フローチャートに示す処理の順序や内容などは例示に過ぎず、各要素の有無、その配置や処理実行などの順序、具体的内容などは適宜変更可能である。例えば、上述した決定処理は、上記実施形態で例示したように決定装置100が実現する以外にも、クラウドシステムにおける装置、方法やプログラムとして実現することもできる。
【0098】
また、決定装置100を構成する各処理部131〜135や、決定装置200を構成する各処理部131〜136を、さらにそれぞれ独立した装置で実現する構成も一般的である。同様に、外部のプラットフォーム等をAPI(アプリケーション・プログラム・インタフェース)やネットワークコンピューティング(いわゆるクラウドなど)で呼び出すことで、上記実施形態で示した各手段を実現するなど、本発明の構成は柔軟に変更できる。さらに、本発明に関する手段などの各要素は、コンピュータの演算制御部に限らず物理的な電子回路など他の情報処理機構で実現してもよい。
【0099】
〔6.効果〕
上述したように、決定装置100は、音声情報を取得する。また、決定装置100は、取得された音声情報に優先度を付与する。また、決定装置100は、音声情報の出力にあたり、各音声情報が衝突しない時間帯である空白時間を検出する。また、決定装置100は、検出された空白時間と、付与された優先度とに基づいて、音声情報を出力する態様を決定する。これにより、決定装置100は、状況に応じて適切に音声の衝突を回避しつつ、伝達する情報の内容を保持することができる。
【0100】
また、決定装置100は、空白時間の長さに合わせて、出力する音声情報の再生速度を決定する。これにより、決定装置100は、出力すべき音声情報よりも空白時間が短い場合であっても、音声情報を衝突させることなく出力させることができる。
【0101】
また、決定装置100は、空白時間の長さに合わせて、音声情報における再生箇所を選択し、選択された再生箇所のみを出力するよう決定する。これにより、決定装置100は、出力すべき音声情報よりも空白時間が短い場合であっても、音声情報を衝突させることなく出力させることができる。
【0102】
また、決定装置100は、音声情報に含まれる文節であって予め再生順位が設定された文節の中から、再生順位の高い順に文節を抽出し、抽出した文節を組み合わせて出力するよう決定する。これにより、決定装置100は、出力すべき音声情報よりも空白時間が短い場合であっても、音声情報を衝突させることなく、また、伝達する内容を損なうことなく、音声情報を出力させることができる。
【0103】
また、決定装置100は、所定の閾値よりも高い優先度が音声情報に付与された場合には、空白時間に関わらず、音声情報を優先的に出力させるよう決定する。これにより、決定装置100は、音声が衝突する事態が発生した場合であっても、他の音声情報と衝突させることなく、緊急なアナウンスなどの即時性を有する内容を優先的に出力させることができる。
【0104】
また、決定装置100は、スケジュールに基づいて出力されるタイミングが予め設定された音声情報である自動音声を取得する。また、決定装置100は、自動音声に設定されたスケジュールに基づいて、空白時間を検出する。これにより、決定装置100は、空白時間を的確に把握することができるので、取得した音声情報を出力する態様を適切に決定することができる。
【0105】
また、決定装置100は、自動音声よりも優先度の高い音声情報が取得された場合には、スケジュールに関わらず、優先度の高い音声情報を出力させるよう決定する。これにより、決定装置100は、緊急なアナウンスなどの即時性を有する内容が、音声の衝突によって聞き辛くなるような状況を発生させないようにすることができる。
【0106】
また、決定装置100は、自動音声よりも優先度の高い音声情報を出力することを決定した場合に、他の音声情報が出力されている途中である場合には、優先度の高い音声情報を優先的に出力させるとともに、他の音声情報の出力を停止させることを決定する。これにより、決定装置100は、緊急なアナウンスなどの即時性を有する内容が、衝突によって聞き辛くなるような状況を発生させないようにすることができる。
【0107】
また、決定装置100は、他の音声情報の出力を停止させた場合には、優先度の高い音声情報の出力が終了した後に、他の音声情報の出力を停止させた再生箇所の近傍から、もしくは、他の音声情報の最初から、他の音声情報を再び出力させることを決定する。これにより、決定装置100は、緊急なアナウンスなどの割り込みがあった場合でも、割り込まれた自動音声等について、本来伝達すべき内容を損なわずに出力させることができる。
【0108】
また、決定装置100は、入力装置を介して話者から音声の入力を受け付けることで音声情報を取得する。また、決定装置100は、入力装置における設定に基づいて、音声情報に優先度を付与する。これにより、決定装置100は、自動音声ではなく不規則に取得される音声情報についても、適切に優先度を付与することができる。
【0109】
また、決定装置100は、話者から入力された音声情報であって、優先度が付与された音声情報を記憶部120に格納する。また、決定装置100は、空白時間が検出された場合に、優先度に基づいて、記憶部120に格納された音声情報を出力する態様を決定する。このように、決定装置100は、一時的に音声を録音することによって、音声の衝突が発生した場合であっても、適切な順番で音声情報を出力させることができる。
【0110】
また、決定装置100は、複数の話者から別々に入力された二以上の音声情報であって、優先度が付与された音声情報を取得した場合には、最も優先度の高い音声情報以外を記憶部に格納する。また、決定装置100は、二以上の音声情報のうち、最も優先度の高い音声情報を出力させるとともに、最も優先度の高い音声情報の出力が終了した後に、記憶部に格納された音声情報のいずれかを出力させるよう決定する。このように、決定装置100は、優先度の高い音声情報については即時的に出力し、残りの音声情報を録音するようにしてもよい。これにより、決定装置100は、適切な順番で音声情報を出力させることができる。
【0111】
また、決定装置200は、検出された空白時間に関する情報と、空白時間の経過後に出力されることが予定されている所定の音声情報の再生時間、及び所定の音声情報の再生内容を通知する通知情報を生成する。これにより、決定装置200は、重複した内容のアナウンス等を話者が行うことを事前に防止できるので、自動音声や録音された音声情報との衝突が発生することを回避できる。
【0112】
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0113】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0114】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0115】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。