(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023069721
(43)【公開日】2023-05-18
(54)【発明の名称】情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造
(51)【国際特許分類】
G06F 16/687 20190101AFI20230511BHJP
G06Q 50/30 20120101ALI20230511BHJP
G01C 21/26 20060101ALI20230511BHJP
G10L 15/00 20130101ALI20230511BHJP
G16Y 10/40 20200101ALI20230511BHJP
G16Y 20/10 20200101ALI20230511BHJP
G16Y 20/20 20200101ALI20230511BHJP
G16Y 40/20 20200101ALI20230511BHJP
G16Y 40/30 20200101ALI20230511BHJP
【FI】
G06F16/687
G06Q50/30
G01C21/26 C
G10L15/00 200T
G16Y10/40
G16Y20/10
G16Y20/20
G16Y40/20
G16Y40/30
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021181801
(22)【出願日】2021-11-08
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】110001025
【氏名又は名称】弁理士法人レクスト国際特許事務所
(72)【発明者】
【氏名】宮部 航太朗
【テーマコード(参考)】
2F129
5B175
5L049
【Fターム(参考)】
2F129AA03
2F129BB03
2F129CC03
2F129CC15
2F129CC28
2F129DD13
2F129DD21
2F129DD40
2F129EE02
2F129EE43
2F129EE69
2F129EE78
2F129EE91
2F129FF12
2F129FF20
2F129FF60
2F129FF62
2F129HH02
2F129HH12
2F129HH35
5B175DA03
5B175DA05
5B175FA01
5B175GA04
5L049CC42
(57)【要約】
【課題】移動中に興味を持った対象についての情報を容易に検索可能とする情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造を提供する。
【解決手段】
ユーザの発話によって入力された入力音声を取得する音声取得部と、ユーザによって発話がなされた発話位置を取得する発話位置取得部と、地図データを取得する地図データ取得部と、発話位置及び地図データに基づいて1又は複数の地名もしくは地物を特定する特定部と、入力音声に基づいて生成される第1のワードと、特定部によって特定された1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成部と、を有することを特徴とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ユーザの発話によって入力された入力音声を取得する音声取得部と、
前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得部と、
地図データを取得する地図データ取得部と、
前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定部と、
前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記発話位置における基準方角を取得する方角取得部を有し、
前記特定部は、前記入力音声から前記基準方角に対する方位を示す言葉を特定し、前記基準方角及び前記方位を示す言葉に基づいて前記1又は複数の地名もしくは地物を特定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記方角取得部は、前記ユーザが乗っている車両の前方の方角を前記基準方角として取得することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記方角取得部は、前記ユーザが移動している方角を前記基準方角として取得することを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記特定部は、前記入力音声から固有名詞が示すものを特定し、前記発話位置から前記固有名詞が示すものに向かう方角を基準方角として特定し、前記入力音声から前記基準方角に対する方位を示す言葉を特定し、前記基準方角及び前記方位を示す言葉に基づいて前記1又は複数の地名もしくは地物を特定することを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記特定部は、前記入力音声から普通名詞が示すものを特定し、前記入力音声から前記普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を特定し、
前記検索ワード生成部は、前記普通名詞が示すもの及び前記連体修飾語、連体修飾句又は連体修飾節を示す言葉に基づいて、前記第1のワードを生成することを特徴とする請求項1乃至5のいずれか1つに記載の情報処理装置。
【請求項7】
前記特定部は、前記普通名詞が示すものの属性に応じて決まる距離範囲に基づいて前記1又は複数の地名もしくは地物を特定することを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記地物は、鉄道路線又は道路路線を含むことを特徴とする請求項1乃至7のいずれか1つに記載の情報処理装置。
【請求項9】
情報処理装置が実行する情報処理方法であって、
ユーザの発話によって入力された入力音声を取得する音声取得ステップと、
前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、
地図データを取得する地図データ取得ステップと、
前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、
前記入力音声に基づいて生成される第1のワードと、前記特定ステップによって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、
を有することを特徴とする情報処理方法。
【請求項10】
コンピュータに実行させるためのプログラムであって、
ユーザの発話によって入力された入力音声を取得する音声取得ステップと、
前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、
地図データを取得する地図データ取得ステップと、
前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、
前記入力音声に基づいて生成される第1のワードと、前記特定ステップによって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、
を前記コンピュータに実行させることを特徴とするプログラム。
【請求項11】
請求項10に記載のプログラムを格納した記録媒体。
【請求項12】
特定部と、検索ワード生成部と、を有する情報処理装置に用いられるデータ構造であって、
ユーザの発話によって入力される入力音声と、
前記ユーザによって前記発話がなされた発話位置と、を含み、
前記特定部が、前記発話位置及び地図データに基づいて1又は複数の地名もしくは地物を特定する処理と、
前記検索ワード生成部が、前記入力音声に基づいて生成される第1のワードと、前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する処理と、
に用いられることを特徴とするデータ構造。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造に関する。
【背景技術】
【0002】
車両等での移動中にユーザから入力される音声を認識して、認識した内容に対する回答を行うナビゲーション装置が知られている。例えば、特許文献1には、ユーザから「左の建物は何?」といった音声入力があった場合に、音声認識の結果と自車位置と自車の進行方向と地図データベースとに基づいて自車の左に存在する施設を検索し、その施設の名称を音声で案内するナビゲーション装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のナビゲーション装置においては、例えば、上記検索結果として自車の左に存在する建物が複数ヒットした場合、当該ヒットした全ての建物が候補としてユーザに案内される。そのため、ユーザには、自身が質問した対象の建物とは関連性の低い建物まで案内されてしまい、自身の知りたい情報が検索結果に埋もれてしまうことが問題の1つとして挙げられる。
【0005】
また、特許文献1に記載のナビゲーション装置において、ユーザが興味を持った対象の建物が上記地図データベースに登録されていない場合、当該対象についての情報を得ることができないという問題が挙げられる。
【0006】
本発明は、上記した点に鑑みてなされたものであり、移動中に興味を持った対象についての情報を容易に検索可能とする情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造を提供することを目的とする。
【課題を解決するための手段】
【0007】
請求項1に記載の情報処理装置は、ユーザの発話によって入力された入力音声を取得する音声取得部と、前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得部と、地図データを取得する地図データ取得部と、前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定部と、前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成部と、を有することを特徴とする。
【0008】
請求項9に記載の情報処理方法は、情報処理装置が実行する情報処理方法であって、ユーザの発話によって入力された入力音声を取得する音声取得ステップと、前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、地図データを取得する地図データ取得ステップと、前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、を有することを特徴とする。
【0009】
請求項10に記載のプログラムは、コンピュータに実行させるためのプログラムであって、ユーザの発話によって入力された入力音声を取得する音声取得ステップと、前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、地図データを取得する地図データ取得ステップと、前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、を前記コンピュータに実行させることを特徴とする。
【0010】
請求項11に記載の記録媒体は、上記プログラムが記録されている記録媒体である。
【0011】
請求項12に記載のデータ構造は、特定部と、検索ワード生成部と、を有する情報処理装置に用いられるデータ構造であって、ユーザの発話によって入力される入力音声と、前記ユーザによって前記発話がなされた発話位置と、を含み、前記特定部が、前記発話位置及び地図データに基づいて1又は複数の地名もしくは地物を特定する処理と、前記検索ワード生成部が、前記入力音声に基づいて生成される第1のワードと、前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する処理と、に用いられることを特徴とする。
【図面の簡単な説明】
【0012】
【
図1】実施例1に係る車両の前席部分の構成及び車両の前方風景を示す図である。
【
図2】実施例1に係る情報処理装置の構成の一例を示すブロック図である。
【
図3】実施例1に係る地図上の発話位置に対応付けられた検索ワードの態様を示す図である。
【
図4】実施例1に係る情報処理装置の制御ルーチンを示すフローチャートである。
【
図5】実施例1に係る情報処理装置の制御サブルーチンを示すフローチャートである。
【
図6】実施例2に係る車両の前席部分の構成及び車両の前方風景を示す図である。
【
図7】実施例2に係る情報処理装置の構成の一例を示すブロック図である。
【
図8】実施例2に係る情報処理装置による地名特定の方法の一例を示す図である。
【
図9】実施例2に係るジャンルごとに分類された名詞の例とそれに対応する距離範囲を示す表である。
【
図10】実施例2に係る方位の表現例とそれに対応する角度範囲を示す表である。
【
図11】実施例2に係る情報処理装置の制御サブルーチンを示すフローチャートである。
【
図12】実施例3に係る車両の前席部分の構成及び車両の前方風景を示す図である。
【
図13】実施例3に係る情報処理装置による地名特定の方法の一例を示す図である。
【
図14】実施例3に係る方位の表現例とそれに対応する角度範囲を示す表である。
【
図15】実施例3に係る情報処理装置の制御サブルーチンを示すフローチャートである。
【
図16】実施例4に係る情報処理装置による地物特定の方法の一例を示す図である。
【
図17】実施例4に係る情報処理装置の制御サブルーチンを示すフローチャートである。
【
図18】実施例5に係る情報処理装置による地物特定の方法の一例を示す図である。
【
図19】実施例5に係る情報処理装置の制御サブルーチンを示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明の実施例について図面を参照して具体的に説明する。なお、図面において同一の構成要素については同一の符号を付け、重複する構成要素の説明は省略する。
【実施例0014】
図1は、実施例1に係る移動体としての車両Mの前席部分及び車両Mの前方風景を示す図である。車載装置10は、車両M内に設置されたマイク12、GPS受信機13、タッチパネルディスプレイ14及びスピーカー15の各々に接続されており、これらを制御する制御部を含む。車載装置10は、例えば、車両Mの前席のダッシュボードDB内の中央部に配置されている。
【0015】
マイク12は、車内の音、例えば車両Mの運転者が発した音声を受けて電気信号に変換する音声入力装置である。本実施例において、マイク12は、ダッシュボードDB上に配されている。
【0016】
GPS受信機13は、GPS(Global Positioning System)衛星からの信号(GPS信号)を受信する受信機である。GPS受信機13は、受信したGPS信号を車載装置10に送信する。本実施例において、GPS受信機13は、ダッシュボードDB上に配されている。
【0017】
タッチパネルディスプレイ14は、車載装置10の制御に基づいて画面表示を行うディスプレイと、車両Mの搭乗者からの入力操作を受け付けるタッチパネルとが組み合わされている表示装置である。タッチパネルディスプレイ14には、例えば、地図に車両Mの現在の位置が重畳されたナビゲーション画像が表示される。本実施例において、タッチパネルディスプレイ14は、ダッシュボードDBの中央部に配されている。
【0018】
スピーカー15は、車載装置10の制御に基づいて音声を出力する音声出力装置である。本実施例において、スピーカー15は、2つのAピラーAPの各々にそれぞれ設けられている。
【0019】
上記した車両Mの前席部分における車載装置10、マイク12、GPS受信機13、タッチパネルディスプレイ14及びスピーカー15の各々の位置は例示に過ぎず、これらは他の位置に配されていてもよい。
【0020】
図1においては、車両Mでの移動中に、当該車両Mの進行方向の右前方に行列ができているラーメン屋が車両M内から見えている様子を示している。
図1において、車両Mの搭乗者(例えば運転者)は、例えば、行列ができているラーメン屋がどのようなラーメン屋であるか知りたいという興味を持ったことをして、マイク12に向けて「あの行列ができているラーメン屋ってどんなお店?」という質問を投げかけている。
【0021】
本実施例において、車載装置10は、車載装置10のユーザ、例えば車両Mの運転者からの質問を音声認識可能に構成されている。すなわち、車載装置10は、車両Mの運転者の発話によって入力された音声を文字列からなるテキストに変換する。車載装置10は、変換されたテキストから所定の種類のテキストを抽出し、当該抽出したテキストを用いて文字列としての第1のワードを生成する。
【0022】
また、本実施例において、車載装置10は、車両Mの搭乗者の発話によって音声入力された際の車両Mの位置、すなわち発話位置を取得可能に構成されている。車載装置10は、発話位置と地図データとに基づいて地図上の発話位置の地名を特定し、当該特定した地名を用いて文字列としての第2のワードを生成する。
【0023】
本実施例において、車載装置10は、上記した第1のワードと第2のワードとを組み合わせて、ユーザが興味を持った対象TAについて検索するための検索ワードを生成し、当該検索ワードを地図上の発話位置に対応付けて登録する。
【0024】
図2は、実施例1に係る車載装置10の構成の一例を示すブロック図である。本実施例において、車載装置10は、システムバス16を介して、制御部17と、通信部18と、入力部19と、出力部21と、大容量記憶装置22とが協働する装置である。
【0025】
制御部17は、CPU(Central Processing Unit)17A、ROM(Read Only Memory)17B、RAM(Random Access Memory)17C等により構成され、コンピュータとして機能する。そして、CPU17Aが、ROM17Bや大容量記憶装置22に記憶されている各種プログラムを読み出し実行することにより各種機能を実現する。
【0026】
各種プログラムは、例えば、他のサーバ装置等からネットワークを介して取得されるようにしてもよいし、記録媒体に記録されて各種ドライブ装置を介して読み込まれるようにしてもよい。すなわち、大容量記憶装置22に記憶される各種プログラム(後述する車載装置10における処理を実行するためのプログラムを含む)は、ネットワークを介して伝送可能であるし、また、コンピュータ読み取り可能な記録媒体に記録して譲渡することが可能である。
【0027】
通信部18は、制御部17の指示に従って外部機器とデータの送受信を行う通信装置である。通信部18は、例えば、ネットワークに接続するためのNIC(Network Interface Card)である。
【0028】
本実施例において、制御部17は、通信部18を介してGoogle(登録商標)やYahoo!(登録商標)等の検索エンジンとして機能するサーバコンピュータと通信可能に接続される。車載装置10とサーバコンピュータとは、例えば、TCP/IP等の通信プロトコルを用いて相互にデータの送受信が可能になっている。車載装置10とネットワークとの接続は、例えば、3G(3rd Generation)、4G(4th Generation)又は5G(5th Generation)等の移動体通信、Wi-Fi(登録商標)等の無線通信によりなされ得る。
【0029】
入力部19は、車載装置10の制御部17と、マイク12、GPS受信機13、タッチパネルディスプレイ14とを通信可能に接続されているインタフェース部である。本実施例において、制御部17は、マイク12から入力された車両Mの運転者の音声を入力部19を介して取得する音声取得部として機能する。
【0030】
また、本実施例において、制御部17は、車両Mの搭乗者の発話による音声入力がなされた際の、GPS受信機13からのGPS信号に基づく車両Mの位置、すなわち上記した発話位置を入力部19を介して取得する発話位置取得部として機能する。
【0031】
出力部21は、タッチパネルディスプレイ14及びスピーカー15と通信可能に接続されているインタフェース部である。制御部17は、出力部21を介して、タッチパネルディスプレイ14に映像または画像信号を送信して表示をさせたり、スピーカー15に音声信号を送信して音を出力させたりすることが可能である。
【0032】
大容量記憶装置22は、例えば、ハードディスク装置、SSD(solid state drive)、フラッシュメモリ等により構成されており、オペレーティングシステムや、端末用のソフトウェア等の各種プログラムを記憶する記憶デバイスである。
【0033】
大容量記憶装置22の音声認識用データベース(以下、音声認識用DBと称する)22Aは、入力音声の音声認識で用いるための言語モデルや発音辞書等が格納されているデータベースである。制御部17は、ユーザから音声が入力された際に、音声認識用DB22Aを参照して音声認識を実行し、当該音声を文字列からなるテキストに変換する。
【0034】
大容量記憶装置22の地図情報データベース(以下、地図情報DBと称する)22Bは、地図情報が格納されているデータベースである。制御部17は、上記した発話位置と地図情報DB22Bに格納されている地図情報とを参照して、地図上の地名や地物を特定する。すなわち、本実施例において、制御部17は、地図情報(地図データ)を取得する地図データ取得部である。
【0035】
以下に、本実施例において制御部17が実行する検索ワードの生成処理の一例について説明する。
【0036】
[テキストの抽出]
まず、テキストの抽出について説明する。本実施例において、制御部17は、車両Mの搭乗者から入力された音声を、上記した音声認識用DB22Aを用いて文字列からなるテキストに変換する。具体的には、制御部17は、車両Mの運転者から入力された「あの行列ができているラーメン屋ってどんなお店?」との音声を音声認識してテキストに変換する。
【0037】
そして、制御部17は、変換されたテキストから普通名詞と当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉とを抽出する。具体的には、制御部17は、音声認識によってテキスト変換された「あの行列ができているラーメン屋ってどんなお店?」との文字列から、一般名称を表す普通名詞である「ラーメン屋」と、「ラーメン屋」に係る連体修飾節を示す言葉である「あの行列ができている」とを抽出する。
【0038】
[第1のワードの生成]
次に、第1のワードの生成について説明する。本実施例において、制御部17は、抽出した普通名詞が示すものと当該普通名詞に係る連体修飾節を示す言葉とを第1のワードとする。
【0039】
本実施例において、制御部17は、普通名詞や当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉に、「これ、それ、あれ、どれ」や「この、その、あの、どの」といったいわゆる「こそあど言葉」がある場合に、これを含めずに第1のワードとする。すなわち、本実施例において、制御部17は、「ラーメン屋」及び「行列ができている」を第1のワードとする。
【0040】
[第2のワードの生成]
次に、第2のワードの生成について説明する。本実施例において、制御部17は、車両Mの搭乗者の発話位置と、地図情報DB22Bに格納されている地図情報とに基づいて、当該発話位置の地名を特定する。すなわち、制御部17は、車両Mの搭乗者の発話位置及び地図データに基づいて地名を特定する特定部として機能する。
【0041】
本実施例において、制御部17は、地図上における発話位置の住所を特定する。具体的には、制御部17は、例えば「新宿区△△町○丁目×番□号」のように、地図上の発話位置の住所を特定する。本実施例において、制御部17は、特定した発話位置の住所の町名までを示す言葉を第2のワードとする。すなわち、本実施例において、制御部17は、「新宿区△△町」を第2のワードとする。
【0042】
[検索ワードの生成]
次に、検索ワードの生成について説明する。制御部17は、それぞれ生成された第1のワードと第2のワードとを組み合わせて検索ワードを生成する。すなわち、制御部17は、第1のワード及び第2のワードを用いて検索ワードを生成する検索ワード生成部である。
【0043】
具体的には、制御部17は、第1のワードである「行列ができている」、「ラーメン屋」と、第2のワードである「新宿区△△町」とを間にスペースを入れて組み合わせて、「行列ができている ラーメン屋 新宿区△△町」という1つの文字列を生成する。これにより、制御部17は、検索サイトの検索窓に入力することが可能な検索ワードを生成することができる。
【0044】
以下に、
図3を参照して、上記した検索ワードが登録される際の態様の一例について説明する。
図3は、タッチパネルディスプレイ14に表示される発話位置周辺の地図を示す図である。
【0045】
本実施例において、制御部17は、検索ワードを生成した後に当該検索ワードを地図上の発話位置に対応付けて登録する。具体的には、制御部17は、
図3に示すように、発話位置UPを地図に重畳させる態様で表示させ、当該発話位置UPに対応付けるように検索ワード(「行列ができている ラーメン屋 新宿区△△町」)を吹き出し表示させる。
【0046】
例えば、車両Mの搭乗者によってタッチパネルディスプレイ14に表示されている吹き出し表示がタッチされた場合、制御部17は、Google(登録商標)やYahoo!(登録商標)等の検索サイトに接続する。そして、制御部17は、起動した検索サイトの検索窓に検索ワードを入力して検索を実行する。
【0047】
タッチパネルディスプレイ14上には、検索ワードによる検索の結果として、当該検索ワードと関連性の高いWebページや画像などの情報が優先して表示される。これにより、車両Mの搭乗者は、自身が興味を持った対象TAと直接的又は間接的に関連性のある情報を得ることができる。
【0048】
すなわち、本実施例において、「あの行列ができているラーメン屋ってどんなお店?」と質問した車両Mの運転者は、タッチパネルディスプレイ14上に表示された吹き出し表示(「行列ができている ラーメン屋 新宿区△△町」)をタッチすることにより、例えば、新宿区△△町において人気のラーメン店を紹介しているサイトを見つけることができ、そこから対象TAであるラーメン屋の情報、例えば名前、ラーメンの種類等の情報を取得することができる。
【0049】
以下に、本実施例における車載装置10の具体的な動作について説明する。
図4は、車載装置10の制御部17において実行される検索ワード生成ルーチンRT1を示すフローチャートである。
【0050】
以下の説明においては、上記にて説明したのと同様に、ユーザから「あの行列が出来ているラーメン屋ってどんなお店?」という音声が入力されたとして説明する。
【0051】
制御部17は、例えば、車載装置10に電源が投入されたことをして検索ワード生成ルーチンRT1を開始する。なお、検索ワード生成ルーチンRT1は、車載装置10の電源が入っている限り制御部17によって繰り返し実行される。
【0052】
まず、制御部17は、検索ワード生成操作を受け付けたか否かを判定する(ステップS101)。例えば、制御部17は、ユーザによって車載装置10のウェイクワードを呼ぶことや「メモして!」などの所定の音声入力がなされたことをして、検索ワード生成処理の開始のための操作がなされたと判定する。制御部17は、検索ワード生成操作を受け付けていないと判定すると(ステップS101:NO)、検索ワード生成ルーチンRT1を終了する。
【0053】
制御部17は、検索ワード生成操作を受け付けたと判定すると(ステップS101:YES)、車両Mの搭乗者からの発話による音声入力を受け付ける(ステップS102)。例えば、制御部17は、上記したように、車両Mでの移動中にマイク12を介して車両Mの運転者からの発話による音声を取得する。なお、ステップS102において、一定時間内に車両Mの搭乗者からの音声入力がない場合は、検索ワード生成ルーチンRT1を終了するようにしてもよい。
【0054】
制御部17は、ステップS102の後に、大容量記憶装置22の音声認識用DB22Aを用いて、入力された音声に対して音声認識を実施し、当該音声をテキストに変換する(ステップS103)。本実施例において、制御部17は、ユーザによって入力された「あの行列ができているラーメン屋ってどんなお店?」との音声を文字列からなるテキストに変換する。
【0055】
制御部17は、ステップS103の後に、音声認識結果としてのテキストから普通名詞を抽出する(ステップS104)。本実施例において、制御部17は、普通名詞を示す「ラーメン屋」を抽出する。
【0056】
制御部17は、ステップS104の後に、音声認識結果としてのテキストから普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を抽出する(ステップS105)。本実施例において、制御部17は、「ラーメン屋」に係る連体修飾節を示す「行列ができている」との言葉を抽出する。
【0057】
制御部17は、ステップS105の後に、ステップS104及びS105にて抽出した普通名詞及び当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を用いて第1のワードを生成する(ステップS106)。本実施例において、制御部17は、上記したように、普通名詞を示す「ラーメン屋」と、「ラーメン屋」に係る連体修飾節を示す「行列ができている」とを第1のワードとする。
【0058】
制御部17は、ステップS106において第1のワードを生成した後に、発話位置及び地図情報に基づいて地名を特定し、当該特定した地名に基づいて第2のワードを生成する(ステップS107)。制御部17は、第2のワードとして「新宿区△△町」を生成する。
【0059】
制御部17は、ステップS106において生成した第1のワードと、ステップS107において生成した第2のワードとを用いて文字列としての検索ワードを生成し、発話位置に対応付けて登録する(ステップS108)。
【0060】
具体的には、制御部17は、上記したように、第1のワードである「行列ができている」及び「ラーメン屋」と、第2のワードである「新宿区△△町」とを間にスペースを入れて組み合わせて、1の検索ワードである「行列ができている ラーメン屋 新宿区△△町」を生成する。
【0061】
そして、制御部17は、検索ワードを生成した後に、当該検索ワードを地図上の発話位置に対応付けて登録する。具体的には、制御部17は、
図3のタッチパネルディスプレイ14に示すように、発話位置UPに対応付けるように「行列ができている ラーメン屋 新宿区△△町」を吹き出し表示させる。制御部17は、ステップS108の後に検索ワード生成ルーチンRT1を終了する。
【0062】
図5は、上記したステップS107において制御部17によって実行される第2のワード生成サブルーチンRT2を示すフローチャートである。
【0063】
まず、制御部17は、車両Mの搭乗者の発話位置と地図データとを取得する(ステップS201)。具体的には、制御部17は、上記したように、発話による音声入力がなされた際にGPS受信機13から受信したGPS信号に基づいて発話位置を取得する。また、制御部17は、大容量記憶装置22の地図情報DB22Bから地図情報を取得する。
【0064】
制御部17は、ステップS201の後に、ステップS201において取得した発話位置及び地図情報に基づいて、発話位置の住所を特定する(ステップS202)。具体的には、制御部17は、上記したように、地図上における発話位置の住所である「新宿区△△町○丁目×番□号」を特定する。
【0065】
制御部17は、ステップS202において特定した住所に基づいて、地名を特定する(ステップS203)。すなわち、制御部17は、発話位置の住所である「新宿区△△町○丁目×番□号」を地名として特定する。
【0066】
制御部17は、特定した地名に基づいて第2のワードを生成する(ステップS204)。本実施例において、制御部17は、上記したように、ステップS203において特定した地名としての発話位置の住所のうち、町名までを示す言葉である「新宿区△△町」を第2のワードとする。制御部17は、ステップS204の後に第2のワード生成サブルーチンRT2を終了する。
【0067】
本実施例によれば、上記した検索ワード生成ルーチンRT1及び第2のワード生成サブルーチンRT2により、車両Mの搭乗者からの発話による音声入力によって検索ワードが自動的に生成される。そのため、車両Mの搭乗者は、自身が興味を持った対象TAについて検索を行いたいときに、自分で検索ワードを考えて検索窓に当該検索ワードを入力する手間を省くことができる。
【0068】
そして、生成された検索ワードは、地図上の発話位置に対応付けられる態様でタッチパネルディスプレイ14上に表示される。そのため、車両Mの搭乗者は、いつでも検索ワードについて簡単に検索を行うことができ、検索ワードと関連性の高い情報を得ることができる。従って、本実施例によれば、車載装置10のユーザが移動中に興味を持った対象についての情報を好きなタイミングで容易に取得することができる。
【0069】
なお、本実施例において、制御部17は、第1のワードの生成時(ステップS106)において、抽出された普通名詞を示す「ラーメン屋」及び当該普通名詞に係る連体修飾節を示す「行列ができている」を第1のワードとするとしたが、この限りではなく、当該抽出された言葉に対して適宜加工を加えてもよい。
【0070】
例えば、制御部17は、「ラーメン屋」に係る連体修飾節である「行列ができている」との言葉を、単に「行列」との言葉としてもよい。すなわち、制御部17は、「ラーメン屋」及び「行列」を第1のワードとしてもよい。
【0071】
また、本実施例において、制御部17は、第2のワードの生成時(ステップS204)において、特定した発話位置の住所のうち町名までを第2のワードとするとしたが、この限りではなく、適宜変更してもよい。
【0072】
例えば、制御部17は、発話位置の住所が「新宿区△△町○丁目×番□号」である場合に、「新宿区△△町○丁目」までを第2のワードとしてもよく、また、「新宿区△△町○丁目×番」までを第2のワードとしてもよい。すなわち、制御部17は、第2のワードに採用する住所の絞り度合いを自由に変更可能であってもよい。
【0073】
本実施例において、制御部17は、ユーザの発話内容から普通名詞を抽出するとしたがこれに限られず、対象を一意に特定できないような名詞を抽出してもよい。当該名詞は、例えば、複数店舗展開している会社の商号や屋号、ブランド名等である。
【0074】
具体的には、例えば、ユーザの発話内容が「あの行列ができている『ラーメン○○』ってどんなお店?」である場合に、ラーメン店の名前である「ラーメン○○」を抽出し、発話位置の住所と組み合わせて検索ワードとしてもよい。例えば、複数店舗を有するラーメン屋の場合は、ラーメン店の名前だけでは店舗が1つに特定できないため、上記検索ワードを生成することが有効である。
【0075】
本実施例において、制御部17は、タッチパネルディスプレイ14に地図上の発話位置に対応付けて登録した検索ワードを吹き出し表示させ、ユーザが当該吹き出し表示をタッチすることで検索がなされるとしたが、この限りではない。
【0076】
例えば、検索ワードが地図上の発話位置に対応付けて記憶されてさえすれば、制御部17は、検索ワードそのものを表示しなくてもよい。例えば、上記した吹き出し表示は、「行列ができている」、または「ラーメン屋」など、検索ワードの一部のみを含むようにしてもよいし、音声入力されたユーザの発話の全文を含むようにしてもよいし、発話された日時を含むようにしてもよい。
【0077】
また、例えば、制御部17は、ステップS108において検索ワードを生成した後にそのまま検索サイトを起動させ、当該生成した検索ワードを検索サイトの検索窓に入力して検索をかけるようにしてもよい。これにより、ユーザによって音声入力がなされた際に自動的に検索ワードの生成及び検索操作がなされるため、ユーザ自身の手で検索操作をする手間を省くことができる。
【0078】
また、制御部17は、検索ワードによる検索結果をスピーカー15を介して音声で出力してもよい。すなわち、ユーザがタッチパネルディスプレイ14を注視しなくても検索結果がユーザに報知されるようにしてもよい。
【0079】
なお、制御部17によってなされる入力音声の音声認識は、AIによってなされてもよい。例えば、ユーザの発話によって入力された音声を、発話辞書や言語モデルを学習させた学習モデルを有するAIに入力し、その出力としての文字列からなるテキストを取得する態様としてもよい。
【0080】
本実施例においては、上記した検索ワードの生成処理を、移動体としての車両Mに搭載されている車載装置10が実行する例を示したが、当該処理を実行可能な装置構成であればこれに限られない。例えば、車載装置10の各々の構成を、スマートフォンやタブレット端末等の、車両と共に移動可能な持ち運び可能な通信端末に適用してもよい。
【0081】
また、例えば、上記した検索ワードの生成処理は、車載装置10の代わりに車載装置10と通信可能なサーバ装置によって実行されてもよく、車載装置10が当該処理の結果をサーバ装置から受け取る態様としてもよい。
【0082】
具体的には、例えば、車両Mの搭乗者からマイク12に入力された音声及び発話位置を車載装置10からサーバ装置に送信し、当該サーバ装置において検索ワードの生成処理がなされるようにしてもよい。そして、車載装置10が、サーバ装置から送信される、地図上の発話位置に対応付けて登録された検索ワードを示す情報を、車載装置10のタッチパネルディスプレイ14に表示させるようにしてもよい。
【0083】
また、サーバ装置から送信される、地図上の発話位置に対応付けて登録された検索ワードを示す情報を、スマートフォンやタブレット端末等の、車両と共に移動可能な持ち運び可能な通信端末で閲覧可能に構成されていてもよい。
【0084】
また、ユーザは、スマートフォンやタブレット端末等の、車両と共に移動可能な持ち運び可能な通信端末に音声入力し、当該通信端末から音声及び発話位置をサーバ装置に送信し、当該サーバ装置において検索ワードの生成処理がなされるようにしてもよい。そして、車載装置10が、地図上の発話位置に対応付けて登録された検索ワードを示す情報を受信し、当該情報をタッチパネルディスプレイ14に表示させるようにしてもよい。
次に、実施例2について説明する。実施例2では、車載装置10の構成の一部とユーザからの発話内容に伴う制御部17による地名の特定方法とが実施例1と異なっており、それ以外の点は実施例1と同様である。
本実施例において、車載装置10は、実施例1と同様に、車両Mの搭乗者からの入力音声から普通名詞及び当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を抽出し、当該普通名詞と連体修飾語、連体修飾句又は連体修飾節を示す言葉とに基づいて第1のワードを生成する。
また、本実施例において、車載装置10は、抽出した連体修飾語、連体修飾句又は連体修飾節を示す言葉と上記した発話位置と地図データとに基づいて地名を特定し、当該地名に基づいて第2のワードを生成する。車載装置10は、生成された第1のワードと第2のワードとを組み合わせて検索ワードを生成し、地図上の発話位置に対応付けて登録する。
本実施例において、車載装置10の大容量記憶装置22は、範囲設定用DB22Cを有している。範囲設定用DB22Cは、上記した第2のワードの生成時において、制御部17が地名を特定するために用いるデータベースである。
本実施例において、制御部17は、車両Mの移動中の、発話位置における車両Mの進行方向と地図情報DB22Bに格納されている地図データとに基づいて、車両Mの前方の方角(すなわち進行方向)をユーザが向いている方角としてとみなし、基準方角として取得する。言い換えれば、制御部17は、ユーザが向いている方角を基準方角として取得する方角取得部である。
以下に、本実施例において制御部17が実行する検索ワードの生成処理の一例について説明する。以下の説明においては、上記にて説明したのと同様に、ユーザから「右前の煙突みたいなものって何?」という音声が入力されたとして説明する。
具体的には、制御部17は、音声認識によってテキスト変換された「右前の煙突みたいなものって何?」との文字列から、普通名詞を示す「煙突」と、「煙突」に係る連体修飾句を示す「右前の」とを抽出する。なお、本実施例において、「右前の煙突みたいなものって何?」のうち「もの」との表現は形式名詞に当たるため、制御部17は、「もの」を抽出せずに普通名詞を示す「煙突」を抽出する。
この距離範囲Dは、例えば、普通名詞によって示されるものがどれくらいの距離から視認できるか否かによって決定されてもよい。例えば、普通名詞によって示される物が建物であれる場合、高さが高いほど遠くから視認できるので距離範囲Dは大きくなる。
距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「店」、「屋台」、「移動販売車」などの高さが数mほどの動産や不動産である場合、距離範囲Dは100mである。
また、距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「ビル」、「煙突」、「フェリー」などの高さが数十~数百mほどの動産や不動産である場合、距離範囲Dは1kmである。
また、距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「展示会」、「コンサート」、「お祭り」などの屋内外で実施されるイベントである場合、距離範囲Dは300mである。
また、距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「花火大会」やアドバルーン等遠くから視認できる物が付随するイベントである場合、距離範囲Dは3kmである。
本実施例においては、入力音声において普通名詞が示すものが「煙突」であるため、制御部17は、距離範囲TB1を参照して「煙突」に対応する距離範囲Dが1kmであると特定する。
なお、遠くから視認できるものは、近寄る前に発話される可能性が高いので、距離範囲Dの最低距離を定めても良い。例えば、普通名詞が示すものがビルや煙突、フェリー等である場合は、最低距離を1kmとして距離範囲Dを1kmから3kmとしてもよい。
角度範囲TB2において、例えば、制御部17は、入力音声において普通名詞を修飾する言葉に「前の…」との自身の向く基準方角に対する方位を示す表現を特定した場合、角度範囲θが自身の向く方角を基準(0°)として当該基準から左に45°(-45°)から右に45°までの範囲であると特定する。
また、角度範囲TB2において、例えば、制御部17は、入力音声において普通名詞を修飾する言葉に「左の…」との自身の向く基準方角に対する方位を示す表現を特定した場合、角度範囲θが自身の向く方角を基準(0°)として225°から315°までの範囲であると特定する。
本実施例においては、制御部17は、上記したように、普通名詞を示す「煙突」に係る連体修飾句を示す「右前の」との言葉が、車両Mの搭乗者が向いている基準方角に対する方位を示す表現であると特定する。これにより、制御部17は、角度範囲TB2を参照して、「右前の」に対応する角度範囲θが自身の向く方角を基準(0°)として0°から45°までの範囲であると特定する。
制御部17は、特定した距離範囲D及び角度範囲θに基づいて、範囲Rを地図上に形成する。具体的には、制御部17は、発話位置から自身の向く方角に距離範囲Dだけ延ばしたものを第1の辺とし、発話位置から当該第1の辺を角度範囲θだけずらしたものを第2の辺とし、第1の辺の終点と第2の辺の終点とを直線で繋ぐことで、三角形状の範囲Rを形成する。
本実施例において、制御部17は、特定した地名を第2のワードとする。すなわち、本実施例において、制御部17は、「新宿区△△町」及び「新宿区×○町」を第2のワードとする。
制御部17は、生成した第2のワードが複数ある場合に、OR検索+AND検索としての検索ワードを生成する。具体的には、制御部17は、第2のワードである「新宿区△△町」及び「新宿区×○町」のそれぞれと、第1のワードである「煙突」とを含めるように、「(新宿区△△町 OR 新宿区×○町) 煙突」という検索ワードを生成する。
制御部17によって生成された上記検索ワードは、実施例1と同様に、地図上の発話位置に対応付けられて登録される。車両Mの搭乗者は、例えば、実施例1と同様に、タッチパネルディスプレイ14上に表示される「(新宿区△△町 OR 新宿区×○町) 煙突」との吹き出し表示をタッチすることにより、上記検索ワードによる検索結果を得ることができる。
制御部17は、ステップS201にて発話位置及び地図データを取得した後に、上記した普通名詞が示すものの属性に基づいて距離範囲Dを特定し、上記した方位を示す表現に基づいて角度範囲θを特定する(ステップS301)。
制御部17は、ステップS302の後に、範囲R内にある地名を特定する(ステップS303)。すなわち、本実施例において、制御部17は、範囲R内にある「新宿区△△町」及び「新宿区×○町」を地名として特定する。
制御部17は、ステップS303において特定された地名に基づいて第2のワードを生成する(ステップS304)。すなわち、本実施例において、制御部17は、「新宿区△△町」及び「新宿区×○町」を第2のワードとする。制御部17は、ステップS304の後に第2のワード生成サブルーチンRT3を終了する。
本実施例によれば、実施例1と同様に、生成された検索ワードが地図上の発話位置に対応付けられる態様で登録されるため、車両Mの搭乗者等のユーザは、いつでも検索ワードについて検索を行うことができる。
また、本実施例によれば、制御部17は、入力音声における普通名詞が示すものの属性に基づく距離範囲と、入力音声における自身の向く基準方角に対する方位を示す表現に基づく角度範囲とを用いて、地名を特定するための範囲を設定する。
これにより、制御部17は、例えば、ユーザから自身が興味を持った対象TAまでの距離が離れているような場合に、当該対象TAが位置すると想定される地域に的を絞った検索ワードを生成することができる。そのため、ユーザは、検索ワードと関連性の高い情報、すなわち対象TAと直接的又は間接的に関連性の有る情報を取得することができる。
なお、本実施例において、距離範囲TB1及び角度範囲TB2にそれぞれ示した距離範囲及び角度範囲は、一例に過ぎず、その範囲を適宜変更してもよい。また、例えば、上記した距離範囲については、名詞が示すものの属性に関わらず一定の距離範囲としてもよく、制御部17は、当該一定の距離範囲と角度範囲TB2とに基づいて範囲Rを形成してもよい。
また、本実施例において、制御部17は、地図上において三角形状の範囲Rを形成するとしたが、その形状はこれに限られない。例えば、制御部17は、上記した第1の辺と第2の辺とを定めた際に、第1の辺の終点と第2の辺の終点とを外側に凸の曲線で繋いでもよい。すなわち、範囲Rは、扇形状の態様であってもよい。
本実施例において、実施例1と同様にスマホやタブレットなどの通信端末であってもよい。このとき、制御部17は、ユーザが移動している方角を当該ユーザが向いている方角として取得する。
本実施例において、制御部17は、OR検索+AND検索としての「(新宿区△△町 OR 新宿区×○町) 煙突」との検索ワードを生成するとしたが、検索ワードの態様はこれに限られない。例えば、制御部17は、単に「新宿区△△町 煙突」及び「新宿区×○町 煙突」との検索ワードを生成して発話位置に登録し、ユーザにより好ましい方を選択させる態様としてもよい。