(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024054666
(43)【公開日】2024-04-17
(54)【発明の名称】情報処理装置、情報処理方法、及び、情報処理プログラム
(51)【国際特許分類】
H04M 3/493 20060101AFI20240410BHJP
H04M 11/00 20060101ALI20240410BHJP
G10L 15/00 20130101ALI20240410BHJP
【FI】
H04M3/493
H04M11/00 302
G10L15/00 200A
【審査請求】有
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022161046
(22)【出願日】2022-10-05
(11)【特許番号】
(45)【特許公報発行日】2024-01-22
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 1.鈴木巧が、 ウェブサイトの掲載日 令和4年6月30日ウェブサイトアドレスhttps://qiita.com/TA-933/items//b9cc7f924fcb5914c89fで公開されているQiita株式会社のウェブサイトにて、鈴木巧が発明した音声の一斉配信方法を、「Amazon Connectで音声をふきこみ、ふきこんだ音声で一斉発信してみた」のタイトルで、公開した。 2.日本放送協会が、令和4年7月20日に放送したおはよう日本という番組にて、鈴木巧が発明した災害時の高齢者支援方法について公開した。 3.鈴木巧は、開催日令和4年9月14日-令和4年9月30日デジタル社会実現ツアー2022 地域が創る「デジタル田園都市」のベストプラクティスにて、鈴木巧が発明したシン・オートコールを公開した。
(71)【出願人】
【識別番号】399040405
【氏名又は名称】東日本電信電話株式会社
(74)【代理人】
【識別番号】100083806
【弁理士】
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100101247
【弁理士】
【氏名又は名称】高橋 俊一
(74)【代理人】
【識別番号】100095500
【弁理士】
【氏名又は名称】伊藤 正和
(74)【代理人】
【識別番号】100098327
【弁理士】
【氏名又は名称】高松 俊雄
(72)【発明者】
【氏名】鈴木 巧
【テーマコード(参考)】
5K201
【Fターム(参考)】
5K201AA05
5K201BA06
5K201BA12
5K201BC19
5K201BD04
5K201CA01
5K201CA09
5K201CB05
5K201CC01
5K201CC04
5K201CC10
5K201DC05
5K201EC06
5K201ED01
5K201ED05
5K201EF03
5K201EF10
(57)【要約】
【課題】従来のオートコールにおいて、情報の連絡を自動かつ双方向で簡便に実施可能な技術を提供する。
【解決手段】情報処理装置10は、電話番号と配信情報を受け付ける受付部101と、各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信する発信部103と、前記音声応答を記憶する記憶部102と、前記音声応答に基づく応答結果を出力する出力部104と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
電話番号と配信情報を受け付ける受付部と、
各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信する発信部と、
前記音声応答を記憶する記憶部と、
前記音声応答に基づく応答結果を出力する出力部と、
を備える情報処理装置。
【請求項2】
前記発信部は、
前記音声応答を前記音声応答の内容に適合する型の定型応答に変換する請求項1に記載の情報処理装置。
【請求項3】
前記発信部は、
前記音声応答をテキストデータに変換する請求項1に記載の情報処理装置。
【請求項4】
前記発信部は、
前記音声応答を前記記憶部に録音し、前記音声応答のテキストデータを変更可能に前記記憶部に記憶させる請求項3に記載の情報処理装置。
【請求項5】
前記受付部は、前記配信情報を音声で受け付け、
前記出力部は、
前記応答結果を音声で出力する請求項1に記載の情報処理装置。
【請求項6】
前記発信部は、
前記配信情報を肉声音声で配信するか、疑似音声で配信するかを、配信先の電話番号毎に選択する請求項1に記載の情報処理装置。
【請求項7】
前記発信部は、前記配信情報を文字で一斉配信し、前記文字の配信情報に対する文字応答を受信し、
前記記憶部は、前記文字応答を記憶し、
前記出力部は、
前記文字応答に基づく応答結果を出力する請求項1に記載の情報処理装置。
【請求項8】
情報処理装置で行う情報処理方法において、
電話番号と配信情報を受け付け、
各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信し、
前記音声応答を記憶部に記憶し、
前記音声応答に基づく応答結果を出力する、
情報処理方法。
【請求項9】
請求項1乃至7のいずれかに記載の情報処理装置としてコンピュータを機能させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び、情報処理プログラムに関する。
【背景技術】
【0002】
従来、電話連絡は個別に行われていた。例えば、地域コミュニティにおける防災、防犯、みまもり等の連絡手段として電話は重要な位置を占めており、防災訓練において参加者は自ら電話をかけて安否情報を連絡していた(非特許文献1参照)。
【0003】
人が電話をかける場合はその行為に人手がかかるので、自動で電話をかける仕組みとしてオートコールというシステムが存在する。例えば、ユーザへの案内等を行うための、自動音声によるメッセージサービスと、SMS(Short Message Service)等の電話番号を宛先とするメッセージサービスと、を組み合わせたシステムであって、通話終了後に、呼出し時間、通話時間、切断理由(通話切断、無応答等)といった自動メッセージ実行結果のデータが記録されるシステムが、従来、知られていた(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【非特許文献1】“川崎市総合防災訓練・防災フェアで171認知啓発活動を実施”、公益財団法人日本公衆電話会、[online]、[令和4年9月8日検索]、<URL: https://www.pcom.or.jp/topics/ntt/kana2022-23.html>
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来のオートコールは、自動で電話をかけるインターフェースがウェブブラウザ等であり、ウェブブラウザの画面操作等に習熟を要するため、オートコールの使用者は自治体等職員に限定されていた。また、電話を受ける側は、ダイヤル操作が中心であるため、スマートフォン等の機器操作や画面操作等が苦手な人(高齢者等)や指先等が不自由な人には不便であった。
【0007】
本発明は、上記に鑑みてなされたものであり、従来のオートコールにおいて、情報の連絡を自動かつ双方向で簡便に実施可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様の情報処理装置は、電話番号と配信情報を受け付ける受付部と、各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信する発信部と、前記音声応答を記憶する記憶部と、前記音声応答に基づく応答結果を出力する出力部と、を備える。
【0009】
本発明の一態様の情報処理方法は、電話番号と配信情報を受け付け、各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信し、前記音声応答を記憶部に記憶し、前記音声応答に基づく応答結果を出力する。
【0010】
本発明の一態様の情報処理プログラムは、上記情報処理装置としてコンピュータを機能させる。
【発明の効果】
【0011】
本発明によれば、従来のオートコールにおいて、情報の連絡を自動かつ双方向で簡便に実施可能な技術を提供できる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、シン・オートコールシステムの構成を示す図である。
【
図2】
図2は、シン・オートコールシステムの全体処理の流れの例を示すシーケンス図である。
【
図3】
図3は、情報処理装置の実装例を示す図である。
【
図4】
図4は、定型発話により応答できる仕組みを説明するための参照図である。
【
図5】
図5は、自由発話により応答できる仕組みを説明するための参照図である。
【
図6】
図6は、肉声を一斉配信できる仕組みを説明するための参照図である。
【
図7】
図7は、電話で一斉発信/結果確認できる仕組みを説明するための参照図である。
【
図9】
図9は、架電状況タブの画面例を示す図である。
【
図10】
図10は、情報処理装置のハードウェア構成例を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明を実施する一実施形態について図面を用いて説明する。
【0014】
[発明の概要]
上記課題欄で説明した通り、従来のオートコールは、ウェブブラウザ等のインターフェースを介していたため、ダイヤル操作を行う人には不向きであった。
【0015】
そこで、本発明は、ウェブブラウザ等のインターフェースを介するオートコールにおいて、発信者、受信者ともに、ウェブブラウザ等のインターフェースを介さずとも、電話で情報の受発信を行う技術を開示する。
【0016】
すなわち、本発明は、(1)電話=“声”を使った連絡手段を「ユニバーサルなインターフェース」として位置付け、声にこだわり機能実装を行う。また、(2)自動で電話をかけることにのみ力点を置かず、人手で行う部分と自動化する部分を整理した機能実装を行う。また、(3)電話をかける、結果を確認する手段として、従来のウェブブラウザに加え、電話=“声”により確認可能な仕組みを実装する。
【0017】
また、上記課題欄で説明した課題以外に、従来のオートコールは、電話に出たか否かに関するログを取得するに留まり、電話を受けた人が能動的に切断したことや最後まで聞いたこと等を判別できない、という課題もあった。
【0018】
そこで、本発明は、(4)ダイヤル操作に加え、「はい」、「いいえ」等の定型発話、「私は無事です」等の自由発話で応答できる仕組みを実装する。また、(5)電話応答した際の挙動(応答、切断、n問目の質問まで回答等)を詳細に取得する仕組みを実装する。
【0019】
上記のコンセプトに則り、本発明では、“令和の自動電話”として、新たなオートコールとして、「シン・オートコール」を開示する。具体的には、シン・オートコールシステムにおいて、音声一斉配信、並びに、音声による応答及びその応答のテキスト化を行う技術を開示する。
【0020】
一例として、防災対策と訓練、特殊詐欺対策と訓練等において、電話による音声でのコミュニケーションにより避難等の情報通知や安否確認等の登録を行い、レポートにより登録情報の確認を行う。
【0021】
応答する側もダイヤル操作に限らず、声(「はい」、「いいえ」等の定型発話、自由発話等)で応答を登録し、その音声応答の結果を可視聴化することで、声にフォーカスしてデジタル化を実現する。
【0022】
また、音声に限らず、SMS、電子メール、チャット、SNS(Social Networking Service)等によるテキストでのコミュニケーションを音声と組み合わせて行い、テキストで応答を登録し、そのテキスト応答の結果を可視化する。
【0023】
なお、シン・オートコールのシンは、「新時代の」「親しみやすい」「真の課題解決をめざし」「お客さまと共に(シンクロし)」「信念をもって内製する取り組み」を意味する。シン・オートコールは、従来と同様に単に「オートコール」と表現してもよい。
【0024】
[シン・オートコールシステムの構成]
図1は、本実施形態に係るシン・オートコールシステム1の構成を示す図である。シン・オートコールシステム1は、情報処理装置10と、端末装置20と、複数の電話端末30と、を備える。
【0025】
端末装置20とは、汎用パソコンであるが、電話機能を備えた黒電話と呼ばれる固定電話機、携帯電話機、スマートフォン等を含む。電話端末30とは、固定電話機31、スマートフォン32等である。以降、シン・オートコールシステム1を防災訓練に適用した場合を例に説明する。
【0026】
[情報処理装置の機能]
情報処理装置10は、従来のオートコール装置を改良したシン・オートコール装置であり、例えばクラウド上のサーバ装置である。情報処理装置10は、
図1に示したように、受付部101と、記憶部102と、発信部103と、出力部104と、を備える。
【0027】
受付部101は、宛先の電話番号を受け付ける宛先番号受付機能と、宛先への配信情報を受け付ける配信情報受付機能と、を備える。例えば、受付部101は、端末装置20から、訓練参加者が備える固定電話機31やスマートフォン32の電話番号を受け付け、訓練で配信する配信内容を示したテキストデータや音声データを受け付ける。
【0028】
記憶部102は、受付部101が受け付けた宛先電話番号と配信情報を記憶する機能を備える。また、記憶部102は、発信部103が電話端末から受信した配信情報に対する応答を記憶する機能を備える。例えば、記憶部102は、固定電話機31から受信した音声データに対する音声応答を記憶し、スマートフォン32から受信した音声データに対する音声応答やテキストデータに対するテキスト応答を記憶する。
【0029】
発信部103は、電話端末30に対して自動発信する自動発信機能と、複数の電話端末30に対して配信情報を音声(例えば、模擬音声、肉声音声)やテキストで一斉配信する一斉配信機能と、音声の配信情報に対する音声応答を音声認識する音声認識機能と、音声応答をテキストに変換する音声変換機能と、を備える。
【0030】
具体的には、発信部103は、複数の固定電話機31や複数のスマートフォン32に自動発信して配信情報を音声で一斉配信し、応答した固定電話機31又はスマートフォン32から音声の配信情報に対する音声応答を受信して記憶部102に登録する。
【0031】
また、具体的には、発信部103は、複数のスマートフォン32に自動発信して配信情報をテキスト(文字)で一斉配信し、応答したスマートフォン32からテキストの配信情報に対するテキスト応答(文字応答)を受信して記憶部102に登録する。
【0032】
出力部104は、発信部103が電話端末30から受信した応答に基づく応答結果を出力する機能を備える。例えば、出力部104は、固定電話機31やスマートフォン32からの音声応答を端末装置20で再生したり、その音声応答をテキストに変換したテキスト応答に基づく応答結果を端末装置20のモニタ(表示装置)に出力したりする。また、出力部104は、スマートフォン32からのテキスト応答に基づく応答結果を端末装置20のモニタに表示する。
【0033】
なお、出力部104は、電話端末30から受信した応答をそのまま応答結果として出力してもよいし、その応答を加工処理したものを応答結果として出力してもよい。例えば、出力部104は、応答内容が「はい」や「いいえ」である場合には、それぞれの総人数を算出して出力し、応答内容が自由発話や自由文章である場合には、その自由発話や自由文章をそのまま出力する。
【0034】
[シン・オートコールシステムの全体動作]
次に、
図2を参照してシン・オートコールシステム1の全体動作を説明する。
図2は、シン・オートコールシステム1の全体処理の流れの例を示すシーケンス図である。この動作例は、市区村町の町単位で行うリモート型の防災訓練である。
【0035】
ステップS1;
まず、訓練設定者は、端末装置20を用いて、訓練参加者の固定電話機31やスマートフォン32の電話番号を情報処理装置10に登録する。また、訓練設定者は、端末装置20を用いて、配信用のテキスト文や読み上げ文を作成して情報処理装置10に登録する。
【0036】
このとき、訓練設定者は、固定電話機31やスマートフォン32の電話番号に、訓練参加者の居住地域若しくは居所を関連付けて情報処理装置10に登録してもよい。その場合、情報処理装置10は、発信を行う訓練対象となる電話番号の選択を、居住地域若しくは居所に基づいて受け付けることができる。
【0037】
一例として、電話番号に「A町」「B町」等の住所を関連付けて登録し、情報処理装置10が「A町」を入力として受け付けたときに、住所が「A町」と関連付けられている電話番号を発信の対象として選択し登録してよい。
【0038】
また、訓練設定者は、その読み上げ文を端末装置20のマイクに発声し、発声による肉声音声を情報処理装置10に録音してもよい。さらに、情報処理装置10は、録音された肉声音声の音声認識処理を行ってテキスト化し、テキスト化した肉声音声のテキストデータを情報処理装置10に登録してもよい。
【0039】
一例として、自治体等の職員の他、自治会の長、消防団等のコミュニティのリーダーが訓練設定者として、スマートフォン若しくは固定電話を端末装置20として用い、配信する肉声音声を情報処理装置10に録音してよい。この例では、訓練設定者のシステム操作の習熟度が低くても配信する音声を簡便に登録できる。
【0040】
また、訓練設定者は、情報処理装置10に、電話番号、配信文、若しくは、配信音声を登録するのに先だって、ユーザ名若しくはパスワードによる認証処理を行ってもよい。当該認証処理は、訓練設定者の固定電話の電話番号若しくはスマートフォンの電話番号が、情報処理装置10に予め登録された電話番号と一致するかどうかを、情報処理装置10が判定することで行ってもよい。当該認証処理において、ユーザ名若しくはパスワードの不一致、又は、予め登録された電話番号との不一致により失敗した場合に、端末装置20と情報処理装置10との間の通信接続を中止してもよい。
【0041】
ステップS2;
次に、情報処理装置10の受付部101は、端末装置20から送信された訓練参加者の固定電話機31やスマートフォン40の電話番号、配信用のテキスト文、読み上げ文、読み上げ文の肉声音声を訓練参加者の町IDに関連付けて記憶部102に記憶させる。
【0042】
配信用のテキスト文等は、全ての町で共通していてもよいし、各町に固有の事情(例えば、避難所が町毎に異なる)があることを考慮して1つ又は複数の町毎に異なっていてもよい。
【0043】
訓練参加者等の配信の対象者を複数の区分に分類することが望ましいことがある。情報処理装置10は、訓練参加者等の配信の対象者を認識する情報に、複数の分類の区分を示す識別情報に関連付けて記憶部102に記憶させてもよい。一例として、対象者を識別する情報は固定電話機31若しくはスマートフォン32の電話番号であり、分類の区分は、対象者の居住地域若しくは所在地域毎の警戒レベルである。
【0044】
ステップS3;
次に、A町で訓練を開始する。
【0045】
訓練の開始は、例えば、端末装置20から情報処理装置10に訓練開始に対応する信号を送信することで行ってもよい。当該信号の送信は、端末装置20に表示された「発信」等の表示を備えたボタン型のインターフェース表示をクリックすることに対応して、端末装置20から情報処理装置10に送信することができる。
【0046】
また、訓練設定者の端末装置20(スマートフォン、固定電話等)と情報処理装置10との間の音声通話を介して、配信する肉声音声の情報処理装置10への録音に続けて、訓練設定者の音声を情報処理装置10で受信し、受信した音声を認識して訓練開始を示す「訓練開始」等の予め定めた言葉であると情報処理装置10が判定したときに訓練を開始することができる。
【0047】
また、訓練設定者の端末装置20(スマートフォン、固定電話等)と情報処理装置10との間の音声通話を介して、配信する肉声音声の情報処理装置10への録音に続けて、情報処理装置10が「訓練を開始しますか」「発信しますか」等の音声を端末装置20に送信し、訓練設定者の応答を情報処理装置10が受信し、受信した音声を認識して「はい」その他の肯定を示す予め定めた言葉であると情報処理装置10が判定したときに訓練を開始することができる。
【0048】
A町で訓練が開始されると、情報処理装置10の発信部103は、A町に対応する全ての電話番号を記憶部102から読み出し、読み出した電話番号の各固定電話機31や各スマートフォン32に対して自動発信を行う。
【0049】
続いて、情報処理装置10の発信部103は、A町に対応する配信用の読み上げ文をAI(Artificial Intellignece)により読み上げ、そのAIによる模擬音声を自動発信先の固定電話機31やスマートフォン32に一斉配信する。
【0050】
例えば、情報処理装置10の発信部103は、「避難指示が出ています。避難できますか?」という模擬音声を一斉配信する。このとき、発信部103は、読み上げ文の模擬音声に代えて、読み上げ文の肉声音声を再生してもよい。また、発信部103は、模擬音声を再生するか、肉声音声を再生するかを、情報処理装置10に予め登録しておき選択してもよい。このような再生音声の種別登録は、通知先の電話番号毎に登録してもよい。これにより訓練者等の特性に応じた案内が可能となる。
【0051】
ステップS4;
次に、各訓練参加者は、情報処理装置10からの模擬音声又は肉声音声に対し、固定電話機31やスマートフォン32のボタン操作ではなく、それぞれの固定電話機31の電話口で発話することで応答する。例えば、訓練参加者は、「はい」、「いいえ」、自由発話(「もう一度」、「私は〇〇に避難しています」等)といった音声により応答する。
【0052】
ステップS5;
次に、情報処理装置10の発信部103は、各固定電話機31や各スマートフォン32から各訓練参加者の音声応答をそれぞれ受信して記憶部102に記憶させる。また、発信部103は、音声認識機能により各訓練参加者の音声応答をそれぞれ認識し、認識した音声応答を音声変換機能によりテキストに変換して記憶部102に記憶させる。
【0053】
発信部103は、受信した音声応答が予め登録された応答と一致していると判断したときに、応答結果に対応する識別コードその他の情報を記憶部102に記憶させてもよい。これにより、予め、肯定に対する「はい」「はいはい」「わかった」「できる」「んだ」その他の応答等を、予め登録しておくことができるので、方言を含めた自然な発話に対応することができる。
【0054】
以上説明した電話による音声でのコミュニケーションにより、各訓練参加者の音声応答(テキストに変換した音声応答を含む)が情報処理装置10内に登録される。
【0055】
ステップS6;
次に、情報処理装置10の発信部103は、ステップS3で読み出していた電話番号のスマートフォン32に対して自動発信を行う。続いて、発信部103は、A町に対応する配信用のテキスト文をSMSで自動発信先のスマートフォン32の訓練参加者に一斉配信する。例えば、発信部103は、「避難所はこちらです。http://***//***」というテキスト文を一斉配信する。
【0056】
ここで、発信部103は、テキスト文の一斉配信の結果を受領し、スマートフォン40による受領が確認できない「未達」等の結果を判定し、受領が確認できない電話番号を抽出し、抽出した電話番号に対してステップS3~ステップS5の発信、応答の受領、登録を行ってもよい。
【0057】
ステップS7;
次に、各訓練参加者は、情報処理装置10からのSMSによるテキスト文に対し、それぞれのスマートフォン32のSMS用のテキスト文で応答する。例えば、訓練参加者は、「はい」、「いいえ」、自由文章(「指定先の避難所に避難しました」等)といったテキストにより応答する。
【0058】
ステップS8;
次に、情報処理装置10の発信部103は、各スマートフォン32から各訓練参加者のテキスト応答をそれぞれ受信して記憶部102に記憶させる。また、発信部103は、一斉配信していたテキスト文に対する開封通知の有無も記憶部102に記憶させる。
【0059】
ここで、発信部103は、スマートフォン32からの応答を受信していない電話番号を抽出し、抽出した電話番号に対してステップS3~ステップS5の発信、応答の受領、登録を行ってもよい。
【0060】
以上説明したSMSによるテキストでのコミュニケーションにより、各訓練参加者のテキスト応答や開封通知の有無が情報処理装置10内に登録される。なお、ステップS6~ステップS8は、ステップS3~ステップS5よりも前又は同時に実行してもよい。また、ステップS3~ステップS8は、B町やC町等、他の町で訓練が開始される毎に繰り返し実行される。
【0061】
ステップS9;
最後に、A町で訓練が終了すると、情報処理装置10の出力部104は、固定電話機31及びスマートフォン32による各訓練参加者の音声応答(テキストに変換した音声応答を含む)、テキスト応答、開封通知の有無に基づく応答結果を端末装置20に出力する。
【0062】
例えば、情報処理装置10の出力部104は、町毎に、訓練参加者数の参加者数、訓練の処理状況、訓練参加者の応答状況を含む応答結果レポートを出力する。応答状況については、出力部104は、練参加者数が「はい」又は「いいえ」と応答したそれぞれの総人数、未応答であった総人数を算出する。
【0063】
出力部104が出力する応答結果レポートは、警戒レベル等の訓練参加者の分類の区分毎に、訓練参加者数の参加者数、訓練の処理状況、訓練参加者の応答状況その他の結果を表示してもよい。
【0064】
端末装置20に対する応答結果レポートは、情報処理装置10と端末装置20との間の音声通話を介して、情報処理装置10がAIにより音声で読み上げてもよい。読み上げる項目、順序、その他の条件は、予め情報処理装置10に登録しておいてもよい。情報処理装置10による読み上げは、情報処理装置10と端末装置20との間の音声通話を介して、端末装置20から「結果教えて」その他の音声を、情報処理装置10が受信することに基づいてもよい。
【0065】
また、情報処理装置10の出力部104は、音声応答をテキストに変換した自由発話やテキスト応答の自由文章をそのまま訓練参加者IDに関連付けて端末装置20のモニタに出力してもよい。これらにより、訓練設定者は、各町で実施したそれぞれの訓練結果を確認できる。
【0066】
また、情報処理装置10の出力部104は、各訓練参加者の音声応答を端末装置20で再生してもよい。このとき、出力部104が出力する応答結果レポートにおいて、自由発話が音声応答をテキスト変換したものであることを表示してもよい。また、当該表示に隣接して訓練参加者の音声応答を端末装置20で再生するためのアイコンその他のインターフェースを配置してもよい。また、情報処理装置10は、訓練設定者の入力を受け付けて、自由発話を変換したテキストを修正してもよい。
【0067】
これにより、訓練設定者は、各訓練参加者の録音音声を聞き直すことができ、訓練参加者の音声応答、特に音声認識を行いテキストに変換した音声応答を正しく編集できる。この処理は、音声の誤認識に対応するために有用である。
【0068】
[情報処理装置の実装例]
次に、
図3を参照して情報処理装置10の実装例を説明する。
図3は、情報処理装置10の実装例を示す図である。
【0069】
情報処理装置10を利用する関係者は、「情報の発信者」と「情報の受信者」とに大別される。情報の発信者は、自治体等の職員、自治会の長、消防団等のコミュニティのリーダー等がなり得る。情報の受信者は、主には地域住民であるが、情報の発信者たる自治体等の職員、自治会長、消防団等もなり得る。
【0070】
本実施形態は、発信者、受信者ともに、ウェブブラウザ等のインターフェースを介さずとも、電話のみで情報の受発信ができることが特徴である。
図3では、ウェブブラウザ等のインターフェースに係る従来の機能はやや省略し、主には電話のみで情報を受発信する実装例を示している。なお、電話の受発信等の基本的な機能は、既存するクラウドの諸機能を組み合わせ、それらを制御するためのプログラムを開発した。
【0071】
例えば、受付部101及び出力部104は、ウェブブラウザ等のテキストベースで情報の一斉配信及び応答の結果確認を行うため、テキスト受付部41と、ユーザ認証部42と、テキスト保存部43と、テキスト処理部44と、を備える。
【0072】
また、受付部101及び出力部104は、音声ベースで情報の一斉配信及び応答の結果確認を行うため、音声受付部45と、音声処理部46と、を備える。
【0073】
また、受付部101及び出力部104は、音声ベースで情報の一斉配信及び応答の結果確認を行うため、特に肉声音声を配信するため、音声受付部47と、音声処理部48と、を備える。
【0074】
例えば、記憶部102は、データ管理部51と、音声保存部52と、を備える。
【0075】
例えば、発信部103は、データ処理部61と、音声対話AI部62と、音声テキスト変換部63と、音声処理部64と、音声発信部65と、を備える。
【0076】
[定型発話により応答できる仕組み]
次に、「はい」「いいえ」等の定型発話により応答できる仕組みを説明する。
図4は、定型発話により応答できる仕組みを説明するための参照図である。定型発話を認識させる仕組みは、
図3に示した発信部103の音声対話AI部62を活用して実現する。
【0077】
まず、音声発信部65は、固定電話機31に電話をかける(ステップS101)。
【0078】
次に、固定電話機31の受信者は、例えば「んだ」と発話する(ステップS102)。
【0079】
次に、音声発信部65は、受信者の発話を受信すると、音声対話AI部62が、受信者の発話内容を認識する(ステップS103)。
【0080】
このとき、音声対話AI部62は、プログラム上で‘yes’となる値を、「はい」「はいはい」「わかった」「できる」「んだ」等の発話されるであろう言葉と紐付けている。同様に、音声対話AI部62は、プログラム上で‘no’となる値を、「いいえ」「ちがう」「わからなかった」「ちゃう」等の発話されるであろう言葉と紐付けている。それ故、音声対話AI部62は、「んだ」という発話を‘yes’に定型化する。なお、これら許容される定型発話は、自由に定義可能である。
【0081】
その後、音声対話AI部62は、‘yes’=「はい」と認識しました等、定型発話の認識結果を音声発信部65に返答し(ステップS104)、その認識結果をデータ処理部61に渡す(ステップS105)。
【0082】
最後に、データ処理部61は、渡された定型発話の認識結果をデータ管理部51に書き込む(ステップS106)。このとき、音声発信部65は、音声処理部64を介して、受信者の発話内容をそのままデータ管理部51に登録してもよい。
【0083】
その結果、データ管理部51には、受信者の名前、連絡手段(電話、SMS等)、回答の有無、定型発話内容、折り返しの有無、SMS発信の有無、最終処理時刻等が書き込まれる。情報の発信者は、これら受信者による定型発話等の応答結果を端末装置20の管理画面上で確認することができる。
【0084】
以上より、受信者の発話内容を定型化するので、方言を含めた自然な発話に対応することができ、受信者はダイヤル操作なしで応答することができる。
【0085】
[自由発話により応答できる仕組み]
次に、自由発話により応答できる仕組みを説明する。
図5は、自由発話により応答できる仕組みを説明するための参照図である。自由発話を認識させる仕組みは、
図3に示した発信部103の音声テキスト変換部63を活用して実現する。
【0086】
まず、音声発信部65は、固定電話機31に電話をかける(ステップS201)。
【0087】
次に、固定電話機31の受信者は、例えば「今私は家にいます。特に怪我はしていません。大丈夫です」と発話する(ステップS202)。
【0088】
次に、音声発信部65は、受信者の発話を受信すると、音声テキスト変換部63が、受信者の発話内容を認識してテキストに変換する(ステップS203)。
【0089】
最後に、音声テキスト変換部63は、テキスト化された受信者の自由発話をデータ処理部61に渡し(ステップS204)、データ処理部61は、そのテキスト化された自由発話をデータ管理部51に書き込む(ステップS205)。その結果、データ管理部51には、テキスト化された受信者の自由発話が書き込まれる。
【0090】
このとき、音声テキスト変換部63による自由発話の認識精度が100%でなく、受信者による音声の発話内容とテキストの発話内容とが一致しない可能性がある。そこで、音声処理部64は、受信者の自由発話を再生可能にデータ管理部51に録音する。また、データ管理部51は、書き込まれたテキストの発話内容を手動で事後的に補正可能・変更可能に記憶する。これにより、情報の発信者は、録音された受信者の発話内容を元に正しい発話内容のテキスト文に修正することができる。
【0091】
以上より、受信者の発話をテキストに変換するので、受信者は自由発話により応答できる。また、避難者名簿等に基づき人手で所在確認等行なっていた業務を自動化・省力化することができる。
【0092】
[肉声を一斉配信できる仕組み]
次に、肉声を一斉配信できる仕組みを説明する。
図6は、肉声を一斉配信できる仕組みを説明するための参照図である。肉声を一斉配信できる仕組みは、
図3に示した受付部101及び出力部104の音声受付部47等を活用して実現する。
【0093】
まず、情報の発信者は、情報処理装置10に電話機で電話をかけ、ガイダンスに従って一斉配信したい音声をふきこむ(ステップS301)。
【0094】
次に、音声受付部47は、発信者の肉声音声を受信する(ステップS302)。
【0095】
次に、音声処理部48は、受信した肉声音声を音声ファイルに加工し(ステップS303)、加工した音声ファイルを音声保存部52に保存する(ステップS304)。例えば、音声処理部48は、パーサーライブラリとしてEBMLを使用し、μ-law変換ライブラリとしてFFmpegを使用して、音声ファイルを保存する。
【0096】
次に、音声発信部65は、固定電話機31に電話をかける(ステップS305)。このとき、音声発信部65は、発信者による音声のふきこみ後に電話を即座にかけるか、一定時間経過後にかけるか、所定の契機をタイミングにかけるかどうかを、選択可能である。他例えば、音声発信部65は、音声のふきこみ後、情報発信者との間で「発信しますか?」→「はい」等の音声でのやりとりと通じて一斉発信する。ウェブブラウザは介さない。
【0097】
次に、音声発信部65は、音声保存部52から肉声音声の音声ファイルを取得し(ステップS306)、取得した音声ファイルを再生することで、ふきこまれた肉声を再生する(ステップS307)。
【0098】
最後に、音声発信部65は、音声処理部64を介して、固定電話機31の受信者による応答結果をデータ管理部51に書き込む(ステップS308)。
【0099】
以上より、情報発信者の電話機を通じて肉声を受信し、受信した肉声の音声ファイルを保存し、保存した音声ファイルを情報受信者の電話機に対して再生するので、自治会長等が自身の地区の住民に対して、電話機のみで、肉声を一斉発信することができる。特に、緊急時に、AIにより疑似音声で読み上げるよりも、緊迫感をもたせて情報伝達する際に有効である。
【0100】
[電話で一斉発信/結果確認できる仕組み]
次に、電話で一斉発信/結果確認できる仕組みを説明する。
図7は、電話で一斉発信/結果確認できる仕組みを説明するための参照図である。電話で一斉発信/結果確認できる仕組みは、
図3に示した受付部101及び出力部104の音声受付部45等を活用して実現する。
【0101】
まず、自治会長等一定の権限のある者等、情報発信者は、情報処理装置10に電話機で電話をかける(ステップS401)。
【0102】
次に、音声受付部45は、情報発信者からの電話を受け付け(ステップS402)、音声処理部46が、情報発信者との間で行う「応答結果を見たい」「一斉配信したい」等の音声でのやりとりに基づき、情報受信者の応答結果を確認するか、新たに情報を一斉発信するか等の処理分岐を行う(ステップS403)。
【0103】
情報受信者の応答結果を確認する場合には、音声処理部46は、データ管理部51から過去の応答結果を取得し(ステップS404)、音声受付部45を介して、取得した過去の応答結果をAIにより音声で読み上げる(ステップS405)。例えば、「1丁目の応答状況をお伝えします…」等と読み上げる。
【0104】
情報を一斉発信する場合には、音声処理部46は、情報発信者の音声データを音声発信部65に渡し(ステップS406)、音声発信部65は、固定電話機31に電話をかけて当該音声データを一斉配信する(ステップS407)。その後、音声発信部65は、音声処理部64を介して、固定電話機31の受信者による応答結果をデータ管理部51に書き込む(ステップS408)。
【0105】
なお、ステップS404とステップS406は、共に実行してもよいし、いずれか一方のみを実行してもよい。各ステップを共に実行する場合には、その処理順は、同時に実行してもよいし、所定の一方を先に実行してよい。
【0106】
以上より、データ管理部51に蓄積された応答結果を音声で読み上げるので、パソコンやスマートフォン等の習熟不要で結果確認を行うことができる。また、上記定型発話認識の仕組みで説明した音声対話AI部62やその他の音声対話AIを活用すれば、「結果教えて」「未応答者に発信して」等、声で操作指示することができる。
【0107】
その結果、自治会長等が情報処理装置10を簡便に利用でき、自助・共助の一助として活用することが期待できる。また、端末装置20の管理画面等に何らかのトラブルがあった場合(インターネットの不具合等)でも、情報を一斉発信することができる。
【0108】
[管理画面]
図8は、端末装置20に表示される管理画面の例を示す図である。管理画面21には、発信タブ、架電状況タブ、電話番号タブ、スクリプトタブ、その他スクリプトタブ、結果一覧タブ、応答状況クリアタブが、いずれかのタブを選択可能に表示される。
【0109】
図8では、発信タブT1の画面例が示されている。発信タブT1の画面には、情報発信可否欄C11、情報発信ボタンC12、発信対象者等選択欄C13、地図表示欄C14が表示される。
【0110】
情報発信可否欄C11内には、情報発信を行うか否かを指定するためのスライドボタンが表示される。初期表示は「停止」の位置にある。情報発信者は、情報発信を行う場合にはスライドボタンを「発信」位置にスライドさせ、全ての処理が終了した後には「停止」位置にスライドさせる。
【0111】
情報発信ボタンC12は、登録した電話番号宛に対して情報を一斉発信するためのボタンである。情報発信ボタンC12が押されると「発信してよろしいですか?」の確認画面がポップアップされ、その確認画面内で「はい」を押すことで情報が一斉配信される。
【0112】
発信対象者等選択欄C13は、警戒レベル(レベル1、レベル2、レベル3等)、地区(1区(雪沢)、2区(嶋部)、3区(越戸内、寺前、中島)等)、発信対象者(一般住民、要支援者、支援者、区長、職員等)を選択するための欄である。
【0113】
警戒レベルは選択必須であり、地区及び発信対象者はそれぞれ1つ以上選択される。地区や発信対象者が複数選択された場合、架電の優先順は任意である。例えば、1区の区長を最優先に架電してもよいし、2区の一般住民を最優先に架電してもよい。
【0114】
地図表示欄C14には、発信対象エリアの地図が表示される。発信対象者等選択欄C13で所望の地区が選択されると、選択された地区が発信対象地区として丸印(〇印)Mで囲われる。
【0115】
図9は、架電状況タブT2の画面例を示す図である。架電状況タブT2の画面には、登録者数欄C21、処理状況欄C22、応答状況欄C23、更新ボタンC24が表示される。
【0116】
登録者数欄C21には、各区の登録者数(登録番号数)が表示される。
【0117】
処理状況欄C22には、各区の処理状況が表示される。例えば、初期状態を示す「未発報」、発信処理中を示す「架電中」、発信処理完了を示す「完了」、発信処理中断を示す「緊急停止」が表示される。
【0118】
応答状況欄C23には、各区の警戒レベル毎の応答状況が一覧表示される。具体的には、未発信の処理数、未応答数、「はい」の応答数、「いいえ」の応答数が表示される。時間経過とともに
図9右上のように推移する。未発数が、未応、はい、いいえのいずれかに振り分けられるように推移する。また、応答状況にはリンク先が付与されており、応答状況を押すとリンク先で詳細状況の画面が表示される。
【0119】
更新ボタンC24は、画面の情報を最新に更新するためのボタンである。更新ボタンC24を随時押すことで、ほぼリアルタイムに処理状況、応答状況が表示される。
【0120】
(変形例)
本実施形態に係るシン・オートコールシステム1は、電話やSMS以外に、電子メール、チャット、SNS等にも適応可能である。
【0121】
(変形例)
本実施形態に係るシン・オートコールシステム1は、防災訓練以外に、特殊詐欺対策訓練等にも適用可能である。また、訓練以外に、防災や特殊詐欺等が実際に発生した時にも適用可能である。防災訓練には、防護訓練、避難誘導訓練、救急救命訓練等が含まれる。シン・オートコールシステム1が配信する配信情報とは、安否確認情報、避難誘導情報、詐欺発生警告情報等である。
【0122】
[実施形態の効果]
本実施形態によれば、情報処理装置10が、電話番号と配信情報を受け付ける受付部101と、各電話番号の電話端末に自動発信して前記配信情報を音声で一斉配信し、応答した電話端末から前記音声の配信情報に対する音声応答を受信する発信部103と、前記音声応答を記憶する記憶部102と、前記音声応答に基づく応答結果を出力する出力部104と、を備えるので、電話での情報連絡を自動かつ双方向で簡便に実施可能な技術を提供できる。
【0123】
本実施形態により、音声というユニバーサルなインターフェースを用いた機能を実装した情報処理装置10により、メッセージを音声で伝えたり結果を音声で確認したりすることの可能な「令和の自動電話」(シン・オートコール)を提供することができる。
【0124】
[その他]
本発明は、上記実施形態に限定されない。本発明は、本発明の要旨の範囲内で数々の変形が可能である。
【0125】
上記説明した本実施形態の情報処理装置10は、例えば、
図10に示すように、CPU901と、メモリ902と、ストレージ903と、通信装置904と、入力装置905と、出力装置906と、を備えた汎用的なコンピュータシステムを用いて実現できる。メモリ902及びストレージ903は、記憶装置である。当該コンピュータシステムにおいて、CPU901がメモリ902上にロードされた所定のプログラムを実行することにより、情報処理装置10の各機能が実現される。
【0126】
情報処理装置10は、1つのコンピュータで実装されてもよい。情報処理装置10は、複数のコンピュータで実装されてもよい。情報処理装置10は、コンピュータに実装される仮想マシンであってもよい。情報処理装置10用のプログラムは、HDD、SSD、USBメモリ、CD、DVD等のコンピュータ読取り可能な記録媒体に記憶できる。コンピュータ読取り可能な記録媒体とは、例えば、非一時的な記録媒体である。情報処理装置10用のプログラムは、通信ネットワークを介して配信することもできる。
【符号の説明】
【0127】
1:シン・オートコールシステム
10:情報処理装置(シン・オートコール装置)
20:端末装置
30:電話端末
31:固定電話機
32:スマートフォン
101:受付部
102:記憶部
103:発信部
104:出力部
41:テキスト受付部
42:ユーザ認証部
43:テキスト保存部
44:テキスト処理部
45:音声受付部
46:音声処理部
47:音声受付部
48:音声処理部
51:データ管理部
52:音声保存部
61:データ処理部
62:音声対話AI部
63:音声テキスト変換部
64:音声処理部
65:音声発信部
901:CPU
902:メモリ
903:ストレージ
904:通信装置
905:入力装置
906:出力装置
【手続補正書】
【提出日】2023-08-30
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する発信部と、
前記音声応答を記憶する前記記憶部と、
前記音声応答に基づく応答結果を出力する出力部と、を備え、
前記発信部は、
前記音声応答を前記音声応答の内容に適合する型の定型応答に変換する情報処理装置。
【請求項2】
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する発信部と、
前記音声応答を記憶する前記記憶部と、
前記音声応答に基づく応答結果を出力する出力部と、を備え、
前記発信部は、
前記音声応答を前記記憶部に録音し、前記音声応答をテキストデータに変換し、前記音声応答のテキストデータを変更可能に前記記憶部に記憶させる情報処理装置。
【請求項3】
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する発信部と、
前記音声応答を記憶する前記記憶部と、
前記音声応答に基づく応答結果を出力する出力部と、を備え、
前記発信部は、
前記配信情報を肉声音声で配信するか、疑似音声で配信するかを、配信先の電話番号毎に選択する情報処理装置。
【請求項4】
前記発信部は、前記配信情報を文字で一斉配信し、前記文字の配信情報に対する文字応答を受信し、
前記記憶部は、前記文字応答を記憶し、
前記出力部は、
前記文字応答に基づく応答結果を出力する請求項1乃至3のいずれかに記載の情報処理装置。
【請求項5】
情報処理装置で行う情報処理方法において、
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する第1のステップと、
前記音声応答を前記記憶部に記憶する第2のステップと、
前記音声応答に基づく応答結果を出力する第3のステップと、を行い、
前記第1のステップでは、
前記音声応答を前記音声応答の内容に適合する型の定型応答に変換する情報処理方法。
【請求項6】
情報処理装置で行う情報処理方法において、
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する第1のステップと、
前記音声応答を前記記憶部に記憶する第2のステップと、
前記音声応答に基づく応答結果を出力する第3のステップと、を行い、
前記第1のステップでは、
前記音声応答を前記記憶部に録音し、前記音声応答をテキストデータに変換し、前記音声応答のテキストデータを変更可能に前記記憶部に記憶させる情報処理方法。
【請求項7】
情報処理装置で行う情報処理方法において、
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する第1のステップと、
前記音声応答を前記記憶部に記憶する第2のステップと、
前記音声応答に基づく応答結果を出力する第3のステップと、を行い、
前記第1のステップでは、
前記配信情報を肉声音声で配信するか、疑似音声で配信するかを、配信先の電話番号毎に選択する情報処理方法。
【請求項8】
請求項1乃至3のいずれかに記載の情報処理装置としてコンピュータを機能させる情報処理プログラム。
【手続補正書】
【提出日】2023-12-05
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する発信部と、
前記音声応答を記憶する前記記憶部と、
前記音声応答に基づく応答結果を出力する出力部と、を備え、
前記発信部は、
前記配信情報を肉声音声で配信するか、疑似音声で配信するかを、配信先の電話番号毎に選択する情報処理装置。
【請求項2】
前記発信部は、前記配信情報を文字で一斉配信し、前記文字の配信情報に対する文字応答を受信し、
前記記憶部は、前記文字応答を記憶し、
前記出力部は、
前記文字応答に基づく応答結果を出力する請求項1に記載の情報処理装置。
【請求項3】
情報処理装置で行う情報処理方法において、
音声での発信命令に基づき、記憶部に予め記憶された電話番号の発信先電話端末に自動発信し、前記記憶部に予め記憶された音声での配信情報を音声で一斉配信し、応答した発信先電話端末から前記配信情報に対する音声応答を受信する第1のステップと、
前記音声応答を前記記憶部に記憶する第2のステップと、
前記音声応答に基づく応答結果を出力する第3のステップと、を行い、
前記第1のステップでは、
前記配信情報を肉声音声で配信するか、疑似音声で配信するかを、配信先の電話番号毎に選択する情報処理方法。
【請求項4】
請求項1又は2に記載の情報処理装置としてコンピュータを機能させる情報処理プログラム。