IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ パイオニア株式会社の特許一覧

特開2023-69721情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造
<>
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図1
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図2
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図3
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図4
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図5
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図6
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図7
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図8
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図9
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図10
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図11
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図12
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図13
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図14
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図15
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図16
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図17
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図18
  • 特開-情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023069721
(43)【公開日】2023-05-18
(54)【発明の名称】情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造
(51)【国際特許分類】
   G06F 16/687 20190101AFI20230511BHJP
   G06Q 50/30 20120101ALI20230511BHJP
   G01C 21/26 20060101ALI20230511BHJP
   G10L 15/00 20130101ALI20230511BHJP
   G16Y 10/40 20200101ALI20230511BHJP
   G16Y 20/10 20200101ALI20230511BHJP
   G16Y 20/20 20200101ALI20230511BHJP
   G16Y 40/20 20200101ALI20230511BHJP
   G16Y 40/30 20200101ALI20230511BHJP
【FI】
G06F16/687
G06Q50/30
G01C21/26 C
G10L15/00 200T
G16Y10/40
G16Y20/10
G16Y20/20
G16Y40/20
G16Y40/30
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021181801
(22)【出願日】2021-11-08
(71)【出願人】
【識別番号】000005016
【氏名又は名称】パイオニア株式会社
(74)【代理人】
【識別番号】110001025
【氏名又は名称】弁理士法人レクスト国際特許事務所
(72)【発明者】
【氏名】宮部 航太朗
【テーマコード(参考)】
2F129
5B175
5L049
【Fターム(参考)】
2F129AA03
2F129BB03
2F129CC03
2F129CC15
2F129CC28
2F129DD13
2F129DD21
2F129DD40
2F129EE02
2F129EE43
2F129EE69
2F129EE78
2F129EE91
2F129FF12
2F129FF20
2F129FF60
2F129FF62
2F129HH02
2F129HH12
2F129HH35
5B175DA03
5B175DA05
5B175FA01
5B175GA04
5L049CC42
(57)【要約】
【課題】移動中に興味を持った対象についての情報を容易に検索可能とする情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造を提供する。
【解決手段】
ユーザの発話によって入力された入力音声を取得する音声取得部と、ユーザによって発話がなされた発話位置を取得する発話位置取得部と、地図データを取得する地図データ取得部と、発話位置及び地図データに基づいて1又は複数の地名もしくは地物を特定する特定部と、入力音声に基づいて生成される第1のワードと、特定部によって特定された1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成部と、を有することを特徴とする。
【選択図】図1
【特許請求の範囲】
【請求項1】
ユーザの発話によって入力された入力音声を取得する音声取得部と、
前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得部と、
地図データを取得する地図データ取得部と、
前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定部と、
前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成部と、
を有することを特徴とする情報処理装置。
【請求項2】
前記発話位置における基準方角を取得する方角取得部を有し、
前記特定部は、前記入力音声から前記基準方角に対する方位を示す言葉を特定し、前記基準方角及び前記方位を示す言葉に基づいて前記1又は複数の地名もしくは地物を特定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記方角取得部は、前記ユーザが乗っている車両の前方の方角を前記基準方角として取得することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記方角取得部は、前記ユーザが移動している方角を前記基準方角として取得することを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記特定部は、前記入力音声から固有名詞が示すものを特定し、前記発話位置から前記固有名詞が示すものに向かう方角を基準方角として特定し、前記入力音声から前記基準方角に対する方位を示す言葉を特定し、前記基準方角及び前記方位を示す言葉に基づいて前記1又は複数の地名もしくは地物を特定することを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記特定部は、前記入力音声から普通名詞が示すものを特定し、前記入力音声から前記普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を特定し、
前記検索ワード生成部は、前記普通名詞が示すもの及び前記連体修飾語、連体修飾句又は連体修飾節を示す言葉に基づいて、前記第1のワードを生成することを特徴とする請求項1乃至5のいずれか1つに記載の情報処理装置。
【請求項7】
前記特定部は、前記普通名詞が示すものの属性に応じて決まる距離範囲に基づいて前記1又は複数の地名もしくは地物を特定することを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記地物は、鉄道路線又は道路路線を含むことを特徴とする請求項1乃至7のいずれか1つに記載の情報処理装置。
【請求項9】
情報処理装置が実行する情報処理方法であって、
ユーザの発話によって入力された入力音声を取得する音声取得ステップと、
前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、
地図データを取得する地図データ取得ステップと、
前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、
前記入力音声に基づいて生成される第1のワードと、前記特定ステップによって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、
を有することを特徴とする情報処理方法。
【請求項10】
コンピュータに実行させるためのプログラムであって、
ユーザの発話によって入力された入力音声を取得する音声取得ステップと、
前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、
地図データを取得する地図データ取得ステップと、
前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、
前記入力音声に基づいて生成される第1のワードと、前記特定ステップによって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、
を前記コンピュータに実行させることを特徴とするプログラム。
【請求項11】
請求項10に記載のプログラムを格納した記録媒体。
【請求項12】
特定部と、検索ワード生成部と、を有する情報処理装置に用いられるデータ構造であって、
ユーザの発話によって入力される入力音声と、
前記ユーザによって前記発話がなされた発話位置と、を含み、
前記特定部が、前記発話位置及び地図データに基づいて1又は複数の地名もしくは地物を特定する処理と、
前記検索ワード生成部が、前記入力音声に基づいて生成される第1のワードと、前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する処理と、
に用いられることを特徴とするデータ構造。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造に関する。
【背景技術】
【0002】
車両等での移動中にユーザから入力される音声を認識して、認識した内容に対する回答を行うナビゲーション装置が知られている。例えば、特許文献1には、ユーザから「左の建物は何?」といった音声入力があった場合に、音声認識の結果と自車位置と自車の進行方向と地図データベースとに基づいて自車の左に存在する施設を検索し、その施設の名称を音声で案内するナビゲーション装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2001-133283号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載のナビゲーション装置においては、例えば、上記検索結果として自車の左に存在する建物が複数ヒットした場合、当該ヒットした全ての建物が候補としてユーザに案内される。そのため、ユーザには、自身が質問した対象の建物とは関連性の低い建物まで案内されてしまい、自身の知りたい情報が検索結果に埋もれてしまうことが問題の1つとして挙げられる。
【0005】
また、特許文献1に記載のナビゲーション装置において、ユーザが興味を持った対象の建物が上記地図データベースに登録されていない場合、当該対象についての情報を得ることができないという問題が挙げられる。
【0006】
本発明は、上記した点に鑑みてなされたものであり、移動中に興味を持った対象についての情報を容易に検索可能とする情報処理装置、情報処理方法、プログラム、記録媒体及びデータ構造を提供することを目的とする。
【課題を解決するための手段】
【0007】
請求項1に記載の情報処理装置は、ユーザの発話によって入力された入力音声を取得する音声取得部と、前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得部と、地図データを取得する地図データ取得部と、前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定部と、前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成部と、を有することを特徴とする。
【0008】
請求項9に記載の情報処理方法は、情報処理装置が実行する情報処理方法であって、ユーザの発話によって入力された入力音声を取得する音声取得ステップと、前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、地図データを取得する地図データ取得ステップと、前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、を有することを特徴とする。
【0009】
請求項10に記載のプログラムは、コンピュータに実行させるためのプログラムであって、ユーザの発話によって入力された入力音声を取得する音声取得ステップと、前記ユーザによって前記発話がなされた発話位置を取得する発話位置取得ステップと、地図データを取得する地図データ取得ステップと、前記発話位置及び前記地図データに基づいて1又は複数の地名もしくは地物を特定する特定ステップと、前記入力音声に基づいて生成される第1のワードと、前記特定部によって特定された前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する検索ワード生成ステップと、を前記コンピュータに実行させることを特徴とする。
【0010】
請求項11に記載の記録媒体は、上記プログラムが記録されている記録媒体である。
【0011】
請求項12に記載のデータ構造は、特定部と、検索ワード生成部と、を有する情報処理装置に用いられるデータ構造であって、ユーザの発話によって入力される入力音声と、前記ユーザによって前記発話がなされた発話位置と、を含み、前記特定部が、前記発話位置及び地図データに基づいて1又は複数の地名もしくは地物を特定する処理と、前記検索ワード生成部が、前記入力音声に基づいて生成される第1のワードと、前記1又は複数の地名もしくは地物に基づいて生成される第2のワードとを含む検索ワードを生成する処理と、に用いられることを特徴とする。
【図面の簡単な説明】
【0012】
図1】実施例1に係る車両の前席部分の構成及び車両の前方風景を示す図である。
図2】実施例1に係る情報処理装置の構成の一例を示すブロック図である。
図3】実施例1に係る地図上の発話位置に対応付けられた検索ワードの態様を示す図である。
図4】実施例1に係る情報処理装置の制御ルーチンを示すフローチャートである。
図5】実施例1に係る情報処理装置の制御サブルーチンを示すフローチャートである。
図6】実施例2に係る車両の前席部分の構成及び車両の前方風景を示す図である。
図7】実施例2に係る情報処理装置の構成の一例を示すブロック図である。
図8】実施例2に係る情報処理装置による地名特定の方法の一例を示す図である。
図9】実施例2に係るジャンルごとに分類された名詞の例とそれに対応する距離範囲を示す表である。
図10】実施例2に係る方位の表現例とそれに対応する角度範囲を示す表である。
図11】実施例2に係る情報処理装置の制御サブルーチンを示すフローチャートである。
図12】実施例3に係る車両の前席部分の構成及び車両の前方風景を示す図である。
図13】実施例3に係る情報処理装置による地名特定の方法の一例を示す図である。
図14】実施例3に係る方位の表現例とそれに対応する角度範囲を示す表である。
図15】実施例3に係る情報処理装置の制御サブルーチンを示すフローチャートである。
図16】実施例4に係る情報処理装置による地物特定の方法の一例を示す図である。
図17】実施例4に係る情報処理装置の制御サブルーチンを示すフローチャートである。
図18】実施例5に係る情報処理装置による地物特定の方法の一例を示す図である。
図19】実施例5に係る情報処理装置の制御サブルーチンを示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明の実施例について図面を参照して具体的に説明する。なお、図面において同一の構成要素については同一の符号を付け、重複する構成要素の説明は省略する。
【実施例0014】
図1は、実施例1に係る移動体としての車両Mの前席部分及び車両Mの前方風景を示す図である。車載装置10は、車両M内に設置されたマイク12、GPS受信機13、タッチパネルディスプレイ14及びスピーカー15の各々に接続されており、これらを制御する制御部を含む。車載装置10は、例えば、車両Mの前席のダッシュボードDB内の中央部に配置されている。
【0015】
マイク12は、車内の音、例えば車両Mの運転者が発した音声を受けて電気信号に変換する音声入力装置である。本実施例において、マイク12は、ダッシュボードDB上に配されている。
【0016】
GPS受信機13は、GPS(Global Positioning System)衛星からの信号(GPS信号)を受信する受信機である。GPS受信機13は、受信したGPS信号を車載装置10に送信する。本実施例において、GPS受信機13は、ダッシュボードDB上に配されている。
【0017】
タッチパネルディスプレイ14は、車載装置10の制御に基づいて画面表示を行うディスプレイと、車両Mの搭乗者からの入力操作を受け付けるタッチパネルとが組み合わされている表示装置である。タッチパネルディスプレイ14には、例えば、地図に車両Mの現在の位置が重畳されたナビゲーション画像が表示される。本実施例において、タッチパネルディスプレイ14は、ダッシュボードDBの中央部に配されている。
【0018】
スピーカー15は、車載装置10の制御に基づいて音声を出力する音声出力装置である。本実施例において、スピーカー15は、2つのAピラーAPの各々にそれぞれ設けられている。
【0019】
上記した車両Mの前席部分における車載装置10、マイク12、GPS受信機13、タッチパネルディスプレイ14及びスピーカー15の各々の位置は例示に過ぎず、これらは他の位置に配されていてもよい。
【0020】
図1においては、車両Mでの移動中に、当該車両Mの進行方向の右前方に行列ができているラーメン屋が車両M内から見えている様子を示している。図1において、車両Mの搭乗者(例えば運転者)は、例えば、行列ができているラーメン屋がどのようなラーメン屋であるか知りたいという興味を持ったことをして、マイク12に向けて「あの行列ができているラーメン屋ってどんなお店?」という質問を投げかけている。
【0021】
本実施例において、車載装置10は、車載装置10のユーザ、例えば車両Mの運転者からの質問を音声認識可能に構成されている。すなわち、車載装置10は、車両Mの運転者の発話によって入力された音声を文字列からなるテキストに変換する。車載装置10は、変換されたテキストから所定の種類のテキストを抽出し、当該抽出したテキストを用いて文字列としての第1のワードを生成する。
【0022】
また、本実施例において、車載装置10は、車両Mの搭乗者の発話によって音声入力された際の車両Mの位置、すなわち発話位置を取得可能に構成されている。車載装置10は、発話位置と地図データとに基づいて地図上の発話位置の地名を特定し、当該特定した地名を用いて文字列としての第2のワードを生成する。
【0023】
本実施例において、車載装置10は、上記した第1のワードと第2のワードとを組み合わせて、ユーザが興味を持った対象TAについて検索するための検索ワードを生成し、当該検索ワードを地図上の発話位置に対応付けて登録する。
【0024】
図2は、実施例1に係る車載装置10の構成の一例を示すブロック図である。本実施例において、車載装置10は、システムバス16を介して、制御部17と、通信部18と、入力部19と、出力部21と、大容量記憶装置22とが協働する装置である。
【0025】
制御部17は、CPU(Central Processing Unit)17A、ROM(Read Only Memory)17B、RAM(Random Access Memory)17C等により構成され、コンピュータとして機能する。そして、CPU17Aが、ROM17Bや大容量記憶装置22に記憶されている各種プログラムを読み出し実行することにより各種機能を実現する。
【0026】
各種プログラムは、例えば、他のサーバ装置等からネットワークを介して取得されるようにしてもよいし、記録媒体に記録されて各種ドライブ装置を介して読み込まれるようにしてもよい。すなわち、大容量記憶装置22に記憶される各種プログラム(後述する車載装置10における処理を実行するためのプログラムを含む)は、ネットワークを介して伝送可能であるし、また、コンピュータ読み取り可能な記録媒体に記録して譲渡することが可能である。
【0027】
通信部18は、制御部17の指示に従って外部機器とデータの送受信を行う通信装置である。通信部18は、例えば、ネットワークに接続するためのNIC(Network Interface Card)である。
【0028】
本実施例において、制御部17は、通信部18を介してGoogle(登録商標)やYahoo!(登録商標)等の検索エンジンとして機能するサーバコンピュータと通信可能に接続される。車載装置10とサーバコンピュータとは、例えば、TCP/IP等の通信プロトコルを用いて相互にデータの送受信が可能になっている。車載装置10とネットワークとの接続は、例えば、3G(3rd Generation)、4G(4th Generation)又は5G(5th Generation)等の移動体通信、Wi-Fi(登録商標)等の無線通信によりなされ得る。
【0029】
入力部19は、車載装置10の制御部17と、マイク12、GPS受信機13、タッチパネルディスプレイ14とを通信可能に接続されているインタフェース部である。本実施例において、制御部17は、マイク12から入力された車両Mの運転者の音声を入力部19を介して取得する音声取得部として機能する。
【0030】
また、本実施例において、制御部17は、車両Mの搭乗者の発話による音声入力がなされた際の、GPS受信機13からのGPS信号に基づく車両Mの位置、すなわち上記した発話位置を入力部19を介して取得する発話位置取得部として機能する。
【0031】
出力部21は、タッチパネルディスプレイ14及びスピーカー15と通信可能に接続されているインタフェース部である。制御部17は、出力部21を介して、タッチパネルディスプレイ14に映像または画像信号を送信して表示をさせたり、スピーカー15に音声信号を送信して音を出力させたりすることが可能である。
【0032】
大容量記憶装置22は、例えば、ハードディスク装置、SSD(solid state drive)、フラッシュメモリ等により構成されており、オペレーティングシステムや、端末用のソフトウェア等の各種プログラムを記憶する記憶デバイスである。
【0033】
大容量記憶装置22の音声認識用データベース(以下、音声認識用DBと称する)22Aは、入力音声の音声認識で用いるための言語モデルや発音辞書等が格納されているデータベースである。制御部17は、ユーザから音声が入力された際に、音声認識用DB22Aを参照して音声認識を実行し、当該音声を文字列からなるテキストに変換する。
【0034】
大容量記憶装置22の地図情報データベース(以下、地図情報DBと称する)22Bは、地図情報が格納されているデータベースである。制御部17は、上記した発話位置と地図情報DB22Bに格納されている地図情報とを参照して、地図上の地名や地物を特定する。すなわち、本実施例において、制御部17は、地図情報(地図データ)を取得する地図データ取得部である。
【0035】
以下に、本実施例において制御部17が実行する検索ワードの生成処理の一例について説明する。
【0036】
[テキストの抽出]
まず、テキストの抽出について説明する。本実施例において、制御部17は、車両Mの搭乗者から入力された音声を、上記した音声認識用DB22Aを用いて文字列からなるテキストに変換する。具体的には、制御部17は、車両Mの運転者から入力された「あの行列ができているラーメン屋ってどんなお店?」との音声を音声認識してテキストに変換する。
【0037】
そして、制御部17は、変換されたテキストから普通名詞と当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉とを抽出する。具体的には、制御部17は、音声認識によってテキスト変換された「あの行列ができているラーメン屋ってどんなお店?」との文字列から、一般名称を表す普通名詞である「ラーメン屋」と、「ラーメン屋」に係る連体修飾節を示す言葉である「あの行列ができている」とを抽出する。
【0038】
[第1のワードの生成]
次に、第1のワードの生成について説明する。本実施例において、制御部17は、抽出した普通名詞が示すものと当該普通名詞に係る連体修飾節を示す言葉とを第1のワードとする。
【0039】
本実施例において、制御部17は、普通名詞や当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉に、「これ、それ、あれ、どれ」や「この、その、あの、どの」といったいわゆる「こそあど言葉」がある場合に、これを含めずに第1のワードとする。すなわち、本実施例において、制御部17は、「ラーメン屋」及び「行列ができている」を第1のワードとする。
【0040】
[第2のワードの生成]
次に、第2のワードの生成について説明する。本実施例において、制御部17は、車両Mの搭乗者の発話位置と、地図情報DB22Bに格納されている地図情報とに基づいて、当該発話位置の地名を特定する。すなわち、制御部17は、車両Mの搭乗者の発話位置及び地図データに基づいて地名を特定する特定部として機能する。
【0041】
本実施例において、制御部17は、地図上における発話位置の住所を特定する。具体的には、制御部17は、例えば「新宿区△△町○丁目×番□号」のように、地図上の発話位置の住所を特定する。本実施例において、制御部17は、特定した発話位置の住所の町名までを示す言葉を第2のワードとする。すなわち、本実施例において、制御部17は、「新宿区△△町」を第2のワードとする。
【0042】
[検索ワードの生成]
次に、検索ワードの生成について説明する。制御部17は、それぞれ生成された第1のワードと第2のワードとを組み合わせて検索ワードを生成する。すなわち、制御部17は、第1のワード及び第2のワードを用いて検索ワードを生成する検索ワード生成部である。
【0043】
具体的には、制御部17は、第1のワードである「行列ができている」、「ラーメン屋」と、第2のワードである「新宿区△△町」とを間にスペースを入れて組み合わせて、「行列ができている ラーメン屋 新宿区△△町」という1つの文字列を生成する。これにより、制御部17は、検索サイトの検索窓に入力することが可能な検索ワードを生成することができる。
【0044】
以下に、図3を参照して、上記した検索ワードが登録される際の態様の一例について説明する。図3は、タッチパネルディスプレイ14に表示される発話位置周辺の地図を示す図である。
【0045】
本実施例において、制御部17は、検索ワードを生成した後に当該検索ワードを地図上の発話位置に対応付けて登録する。具体的には、制御部17は、図3に示すように、発話位置UPを地図に重畳させる態様で表示させ、当該発話位置UPに対応付けるように検索ワード(「行列ができている ラーメン屋 新宿区△△町」)を吹き出し表示させる。
【0046】
例えば、車両Mの搭乗者によってタッチパネルディスプレイ14に表示されている吹き出し表示がタッチされた場合、制御部17は、Google(登録商標)やYahoo!(登録商標)等の検索サイトに接続する。そして、制御部17は、起動した検索サイトの検索窓に検索ワードを入力して検索を実行する。
【0047】
タッチパネルディスプレイ14上には、検索ワードによる検索の結果として、当該検索ワードと関連性の高いWebページや画像などの情報が優先して表示される。これにより、車両Mの搭乗者は、自身が興味を持った対象TAと直接的又は間接的に関連性のある情報を得ることができる。
【0048】
すなわち、本実施例において、「あの行列ができているラーメン屋ってどんなお店?」と質問した車両Mの運転者は、タッチパネルディスプレイ14上に表示された吹き出し表示(「行列ができている ラーメン屋 新宿区△△町」)をタッチすることにより、例えば、新宿区△△町において人気のラーメン店を紹介しているサイトを見つけることができ、そこから対象TAであるラーメン屋の情報、例えば名前、ラーメンの種類等の情報を取得することができる。
【0049】
以下に、本実施例における車載装置10の具体的な動作について説明する。図4は、車載装置10の制御部17において実行される検索ワード生成ルーチンRT1を示すフローチャートである。
【0050】
以下の説明においては、上記にて説明したのと同様に、ユーザから「あの行列が出来ているラーメン屋ってどんなお店?」という音声が入力されたとして説明する。
【0051】
制御部17は、例えば、車載装置10に電源が投入されたことをして検索ワード生成ルーチンRT1を開始する。なお、検索ワード生成ルーチンRT1は、車載装置10の電源が入っている限り制御部17によって繰り返し実行される。
【0052】
まず、制御部17は、検索ワード生成操作を受け付けたか否かを判定する(ステップS101)。例えば、制御部17は、ユーザによって車載装置10のウェイクワードを呼ぶことや「メモして!」などの所定の音声入力がなされたことをして、検索ワード生成処理の開始のための操作がなされたと判定する。制御部17は、検索ワード生成操作を受け付けていないと判定すると(ステップS101:NO)、検索ワード生成ルーチンRT1を終了する。
【0053】
制御部17は、検索ワード生成操作を受け付けたと判定すると(ステップS101:YES)、車両Mの搭乗者からの発話による音声入力を受け付ける(ステップS102)。例えば、制御部17は、上記したように、車両Mでの移動中にマイク12を介して車両Mの運転者からの発話による音声を取得する。なお、ステップS102において、一定時間内に車両Mの搭乗者からの音声入力がない場合は、検索ワード生成ルーチンRT1を終了するようにしてもよい。
【0054】
制御部17は、ステップS102の後に、大容量記憶装置22の音声認識用DB22Aを用いて、入力された音声に対して音声認識を実施し、当該音声をテキストに変換する(ステップS103)。本実施例において、制御部17は、ユーザによって入力された「あの行列ができているラーメン屋ってどんなお店?」との音声を文字列からなるテキストに変換する。
【0055】
制御部17は、ステップS103の後に、音声認識結果としてのテキストから普通名詞を抽出する(ステップS104)。本実施例において、制御部17は、普通名詞を示す「ラーメン屋」を抽出する。
【0056】
制御部17は、ステップS104の後に、音声認識結果としてのテキストから普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を抽出する(ステップS105)。本実施例において、制御部17は、「ラーメン屋」に係る連体修飾節を示す「行列ができている」との言葉を抽出する。
【0057】
制御部17は、ステップS105の後に、ステップS104及びS105にて抽出した普通名詞及び当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を用いて第1のワードを生成する(ステップS106)。本実施例において、制御部17は、上記したように、普通名詞を示す「ラーメン屋」と、「ラーメン屋」に係る連体修飾節を示す「行列ができている」とを第1のワードとする。
【0058】
制御部17は、ステップS106において第1のワードを生成した後に、発話位置及び地図情報に基づいて地名を特定し、当該特定した地名に基づいて第2のワードを生成する(ステップS107)。制御部17は、第2のワードとして「新宿区△△町」を生成する。
【0059】
制御部17は、ステップS106において生成した第1のワードと、ステップS107において生成した第2のワードとを用いて文字列としての検索ワードを生成し、発話位置に対応付けて登録する(ステップS108)。
【0060】
具体的には、制御部17は、上記したように、第1のワードである「行列ができている」及び「ラーメン屋」と、第2のワードである「新宿区△△町」とを間にスペースを入れて組み合わせて、1の検索ワードである「行列ができている ラーメン屋 新宿区△△町」を生成する。
【0061】
そして、制御部17は、検索ワードを生成した後に、当該検索ワードを地図上の発話位置に対応付けて登録する。具体的には、制御部17は、図3のタッチパネルディスプレイ14に示すように、発話位置UPに対応付けるように「行列ができている ラーメン屋 新宿区△△町」を吹き出し表示させる。制御部17は、ステップS108の後に検索ワード生成ルーチンRT1を終了する。
【0062】
図5は、上記したステップS107において制御部17によって実行される第2のワード生成サブルーチンRT2を示すフローチャートである。
【0063】
まず、制御部17は、車両Mの搭乗者の発話位置と地図データとを取得する(ステップS201)。具体的には、制御部17は、上記したように、発話による音声入力がなされた際にGPS受信機13から受信したGPS信号に基づいて発話位置を取得する。また、制御部17は、大容量記憶装置22の地図情報DB22Bから地図情報を取得する。
【0064】
制御部17は、ステップS201の後に、ステップS201において取得した発話位置及び地図情報に基づいて、発話位置の住所を特定する(ステップS202)。具体的には、制御部17は、上記したように、地図上における発話位置の住所である「新宿区△△町○丁目×番□号」を特定する。
【0065】
制御部17は、ステップS202において特定した住所に基づいて、地名を特定する(ステップS203)。すなわち、制御部17は、発話位置の住所である「新宿区△△町○丁目×番□号」を地名として特定する。
【0066】
制御部17は、特定した地名に基づいて第2のワードを生成する(ステップS204)。本実施例において、制御部17は、上記したように、ステップS203において特定した地名としての発話位置の住所のうち、町名までを示す言葉である「新宿区△△町」を第2のワードとする。制御部17は、ステップS204の後に第2のワード生成サブルーチンRT2を終了する。
【0067】
本実施例によれば、上記した検索ワード生成ルーチンRT1及び第2のワード生成サブルーチンRT2により、車両Mの搭乗者からの発話による音声入力によって検索ワードが自動的に生成される。そのため、車両Mの搭乗者は、自身が興味を持った対象TAについて検索を行いたいときに、自分で検索ワードを考えて検索窓に当該検索ワードを入力する手間を省くことができる。
【0068】
そして、生成された検索ワードは、地図上の発話位置に対応付けられる態様でタッチパネルディスプレイ14上に表示される。そのため、車両Mの搭乗者は、いつでも検索ワードについて簡単に検索を行うことができ、検索ワードと関連性の高い情報を得ることができる。従って、本実施例によれば、車載装置10のユーザが移動中に興味を持った対象についての情報を好きなタイミングで容易に取得することができる。
【0069】
なお、本実施例において、制御部17は、第1のワードの生成時(ステップS106)において、抽出された普通名詞を示す「ラーメン屋」及び当該普通名詞に係る連体修飾節を示す「行列ができている」を第1のワードとするとしたが、この限りではなく、当該抽出された言葉に対して適宜加工を加えてもよい。
【0070】
例えば、制御部17は、「ラーメン屋」に係る連体修飾節である「行列ができている」との言葉を、単に「行列」との言葉としてもよい。すなわち、制御部17は、「ラーメン屋」及び「行列」を第1のワードとしてもよい。
【0071】
また、本実施例において、制御部17は、第2のワードの生成時(ステップS204)において、特定した発話位置の住所のうち町名までを第2のワードとするとしたが、この限りではなく、適宜変更してもよい。
【0072】
例えば、制御部17は、発話位置の住所が「新宿区△△町○丁目×番□号」である場合に、「新宿区△△町○丁目」までを第2のワードとしてもよく、また、「新宿区△△町○丁目×番」までを第2のワードとしてもよい。すなわち、制御部17は、第2のワードに採用する住所の絞り度合いを自由に変更可能であってもよい。
【0073】
本実施例において、制御部17は、ユーザの発話内容から普通名詞を抽出するとしたがこれに限られず、対象を一意に特定できないような名詞を抽出してもよい。当該名詞は、例えば、複数店舗展開している会社の商号や屋号、ブランド名等である。
【0074】
具体的には、例えば、ユーザの発話内容が「あの行列ができている『ラーメン○○』ってどんなお店?」である場合に、ラーメン店の名前である「ラーメン○○」を抽出し、発話位置の住所と組み合わせて検索ワードとしてもよい。例えば、複数店舗を有するラーメン屋の場合は、ラーメン店の名前だけでは店舗が1つに特定できないため、上記検索ワードを生成することが有効である。
【0075】
本実施例において、制御部17は、タッチパネルディスプレイ14に地図上の発話位置に対応付けて登録した検索ワードを吹き出し表示させ、ユーザが当該吹き出し表示をタッチすることで検索がなされるとしたが、この限りではない。
【0076】
例えば、検索ワードが地図上の発話位置に対応付けて記憶されてさえすれば、制御部17は、検索ワードそのものを表示しなくてもよい。例えば、上記した吹き出し表示は、「行列ができている」、または「ラーメン屋」など、検索ワードの一部のみを含むようにしてもよいし、音声入力されたユーザの発話の全文を含むようにしてもよいし、発話された日時を含むようにしてもよい。
【0077】
また、例えば、制御部17は、ステップS108において検索ワードを生成した後にそのまま検索サイトを起動させ、当該生成した検索ワードを検索サイトの検索窓に入力して検索をかけるようにしてもよい。これにより、ユーザによって音声入力がなされた際に自動的に検索ワードの生成及び検索操作がなされるため、ユーザ自身の手で検索操作をする手間を省くことができる。
【0078】
また、制御部17は、検索ワードによる検索結果をスピーカー15を介して音声で出力してもよい。すなわち、ユーザがタッチパネルディスプレイ14を注視しなくても検索結果がユーザに報知されるようにしてもよい。
【0079】
なお、制御部17によってなされる入力音声の音声認識は、AIによってなされてもよい。例えば、ユーザの発話によって入力された音声を、発話辞書や言語モデルを学習させた学習モデルを有するAIに入力し、その出力としての文字列からなるテキストを取得する態様としてもよい。
【0080】
本実施例においては、上記した検索ワードの生成処理を、移動体としての車両Mに搭載されている車載装置10が実行する例を示したが、当該処理を実行可能な装置構成であればこれに限られない。例えば、車載装置10の各々の構成を、スマートフォンやタブレット端末等の、車両と共に移動可能な持ち運び可能な通信端末に適用してもよい。
【0081】
また、例えば、上記した検索ワードの生成処理は、車載装置10の代わりに車載装置10と通信可能なサーバ装置によって実行されてもよく、車載装置10が当該処理の結果をサーバ装置から受け取る態様としてもよい。
【0082】
具体的には、例えば、車両Mの搭乗者からマイク12に入力された音声及び発話位置を車載装置10からサーバ装置に送信し、当該サーバ装置において検索ワードの生成処理がなされるようにしてもよい。そして、車載装置10が、サーバ装置から送信される、地図上の発話位置に対応付けて登録された検索ワードを示す情報を、車載装置10のタッチパネルディスプレイ14に表示させるようにしてもよい。
【0083】
また、サーバ装置から送信される、地図上の発話位置に対応付けて登録された検索ワードを示す情報を、スマートフォンやタブレット端末等の、車両と共に移動可能な持ち運び可能な通信端末で閲覧可能に構成されていてもよい。
【0084】
また、ユーザは、スマートフォンやタブレット端末等の、車両と共に移動可能な持ち運び可能な通信端末に音声入力し、当該通信端末から音声及び発話位置をサーバ装置に送信し、当該サーバ装置において検索ワードの生成処理がなされるようにしてもよい。そして、車載装置10が、地図上の発話位置に対応付けて登録された検索ワードを示す情報を受信し、当該情報をタッチパネルディスプレイ14に表示させるようにしてもよい。
【実施例0085】
次に、実施例2について説明する。実施例2では、車載装置10の構成の一部とユーザからの発話内容に伴う制御部17による地名の特定方法とが実施例1と異なっており、それ以外の点は実施例1と同様である。
【0086】
図6は、実施例2に係る車両Mの前席部分の構成及び車両Mの前方風景を示す図である。図6においては、車両Mでの移動中に、当該車両Mの進行方向の右前方に上下方向に伸長する筒状の建造物が車両M内から見えている様子を示している。
【0087】
図6において、車両Mの運転者は、車両M内から見えている建造物がどのようなものであるか興味を持ったことをして、マイク12に向けて「右前の煙突みたいなものって何?」という質問を投げかけている。
【0088】
本実施例において、車載装置10は、実施例1と同様に、車両Mの搭乗者からの入力音声から普通名詞及び当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を抽出し、当該普通名詞と連体修飾語、連体修飾句又は連体修飾節を示す言葉とに基づいて第1のワードを生成する。
【0089】
また、本実施例において、車載装置10は、抽出した連体修飾語、連体修飾句又は連体修飾節を示す言葉と上記した発話位置と地図データとに基づいて地名を特定し、当該地名に基づいて第2のワードを生成する。車載装置10は、生成された第1のワードと第2のワードとを組み合わせて検索ワードを生成し、地図上の発話位置に対応付けて登録する。
【0090】
図7は、実施例2に係る車載装置10の構成の一例を示すブロック図である。図7においては、実施例1にて示した車載装置10の構成と異なる点について説明する。
【0091】
本実施例において、車載装置10の大容量記憶装置22は、範囲設定用DB22Cを有している。範囲設定用DB22Cは、上記した第2のワードの生成時において、制御部17が地名を特定するために用いるデータベースである。
【0092】
本実施例において、制御部17は、車両Mの移動中の、発話位置における車両Mの進行方向と地図情報DB22Bに格納されている地図データとに基づいて、車両Mの前方の方角(すなわち進行方向)をユーザが向いている方角としてとみなし、基準方角として取得する。言い換えれば、制御部17は、ユーザが向いている方角を基準方角として取得する方角取得部である。
【0093】
以下に、本実施例において制御部17が実行する検索ワードの生成処理の一例について説明する。以下の説明においては、上記にて説明したのと同様に、ユーザから「右前の煙突みたいなものって何?」という音声が入力されたとして説明する。
【0094】
[テキストの抽出]
まず、テキストの抽出について説明する。制御部17は、実施例1と同様に、音声認識によって変換されたテキストから普通名詞と当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉とを抽出する。
【0095】
具体的には、制御部17は、音声認識によってテキスト変換された「右前の煙突みたいなものって何?」との文字列から、普通名詞を示す「煙突」と、「煙突」に係る連体修飾句を示す「右前の」とを抽出する。なお、本実施例において、「右前の煙突みたいなものって何?」のうち「もの」との表現は形式名詞に当たるため、制御部17は、「もの」を抽出せずに普通名詞を示す「煙突」を抽出する。
【0096】
[第1のワードの生成]
次に、第1のワードの生成について説明する。本実施例において、制御部17は、「煙突」に係る連体修飾句を示す「右前の」との言葉が、方位を示す表現であると特定する。本実施例において、制御部17は、普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉から方位を示す表現が特定される場合に、当該表現を含めずに第1のワードを生成する。すなわち、本実施例において、制御部17は、普通名詞を示す「煙突」のみを第1のワードとする。
【0097】
[第2のワードの生成]
次に、図8を用いて第2のワードの生成について説明する。図8は、実施例2における制御部17による地名特定の方法の一例を示す図である。図8において、1の町名が示す町の境界を一点鎖線で示している。また、図8において、車両Mの位置を車両Mの搭乗者が発話した発話位置としている。車両Mの位置には、車両Mの搭乗者によって入力された音声を示す言葉を吹き出し表示している。
【0098】
本実施例において、制御部17は、図8に示すように、地図上において発話位置を起点とした三角形状の範囲R(図中二点鎖線)を設定し、当該範囲R内に一部又は全部が入っている地名を特定する。そして、制御部17は、特定した地名に基づいて第2のワードを生成する。本実施例において、上記した範囲Rは、普通名詞が示すものの属性に基づいて決まる距離範囲Dと、上記した方位を示す表現に基づいて決まる角度範囲θとを用いて設定される。
【0099】
ここで、図9及び図10を参照して、距離範囲D及び角度範囲θについて説明する。
【0100】
図9は、本実施例におけるジャンルごとに分類された普通名詞が示すものの例とそれに対応する距離範囲Dを示す距離範囲TB1である。制御部17は、距離範囲TB1を参照して、普通名詞が示すものの属性に対応する距離範囲Dを特定する。
【0101】
この距離範囲Dは、例えば、普通名詞によって示されるものがどれくらいの距離から視認できるか否かによって決定されてもよい。例えば、普通名詞によって示される物が建物であれる場合、高さが高いほど遠くから視認できるので距離範囲Dは大きくなる。
【0102】
距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「店」、「屋台」、「移動販売車」などの高さが数mほどの動産や不動産である場合、距離範囲Dは100mである。
【0103】
また、距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「ビル」、「煙突」、「フェリー」などの高さが数十~数百mほどの動産や不動産である場合、距離範囲Dは1kmである。
【0104】
また、距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「展示会」、「コンサート」、「お祭り」などの屋内外で実施されるイベントである場合、距離範囲Dは300mである。
【0105】
また、距離範囲TB1において、例えば、入力音声において普通名詞が示すものが「花火大会」やアドバルーン等遠くから視認できる物が付随するイベントである場合、距離範囲Dは3kmである。
【0106】
本実施例においては、入力音声において普通名詞が示すものが「煙突」であるため、制御部17は、距離範囲TB1を参照して「煙突」に対応する距離範囲Dが1kmであると特定する。
【0107】
なお、遠くから視認できるものは、近寄る前に発話される可能性が高いので、距離範囲Dの最低距離を定めても良い。例えば、普通名詞が示すものがビルや煙突、フェリー等である場合は、最低距離を1kmとして距離範囲Dを1kmから3kmとしてもよい。
【0108】
図10は、本実施例における方位を示す表現例とそれに対応する角度範囲を示す角度範囲TB2である。制御部17は、角度範囲TB2を参照して、方位を示す表現に対応する角度範囲θを特定する。
【0109】
角度範囲TB2において、例えば、制御部17は、入力音声において普通名詞を修飾する言葉に「前の…」との自身の向く基準方角に対する方位を示す表現を特定した場合、角度範囲θが自身の向く方角を基準(0°)として当該基準から左に45°(-45°)から右に45°までの範囲であると特定する。
【0110】
また、角度範囲TB2において、例えば、制御部17は、入力音声において普通名詞を修飾する言葉に「左の…」との自身の向く基準方角に対する方位を示す表現を特定した場合、角度範囲θが自身の向く方角を基準(0°)として225°から315°までの範囲であると特定する。
【0111】
本実施例においては、制御部17は、上記したように、普通名詞を示す「煙突」に係る連体修飾句を示す「右前の」との言葉が、車両Mの搭乗者が向いている基準方角に対する方位を示す表現であると特定する。これにより、制御部17は、角度範囲TB2を参照して、「右前の」に対応する角度範囲θが自身の向く方角を基準(0°)として0°から45°までの範囲であると特定する。
【0112】
再び図8を参照する。上記したように、制御部17は、「右前の煙突みたいなものって何?」との入力音声を取得した際に、普通名詞を示す「煙突」との言葉から、距離範囲TB1に基づいて、距離範囲Dが1kmであると特定する。また、制御部17は、普通名詞に係る連体修飾句を示す「右前の」との言葉から、角度範囲TB2に基づいて角度範囲θが0°から45°までの範囲であると特定する。
【0113】
制御部17は、特定した距離範囲D及び角度範囲θに基づいて、範囲Rを地図上に形成する。具体的には、制御部17は、発話位置から自身の向く方角に距離範囲Dだけ延ばしたものを第1の辺とし、発話位置から当該第1の辺を角度範囲θだけずらしたものを第2の辺とし、第1の辺の終点と第2の辺の終点とを直線で繋ぐことで、三角形状の範囲Rを形成する。
【0114】
そして、制御部17は、範囲R内に一部又は全部が入っている地名を特定する。具体的には、制御部17は、図8に示すように、「新宿区△△町」及び「新宿区×○町」を地名として特定する。
【0115】
本実施例において、制御部17は、特定した地名を第2のワードとする。すなわち、本実施例において、制御部17は、「新宿区△△町」及び「新宿区×○町」を第2のワードとする。
【0116】
[検索ワードの生成]
次に、検索ワードの生成について説明する。制御部17は、実施例1と同様に、それぞれ生成された第1のワードと第2のワードとを組み合わせて検索ワードを生成する。
【0117】
制御部17は、生成した第2のワードが複数ある場合に、OR検索+AND検索としての検索ワードを生成する。具体的には、制御部17は、第2のワードである「新宿区△△町」及び「新宿区×○町」のそれぞれと、第1のワードである「煙突」とを含めるように、「(新宿区△△町 OR 新宿区×○町) 煙突」という検索ワードを生成する。
【0118】
制御部17によって生成された上記検索ワードは、実施例1と同様に、地図上の発話位置に対応付けられて登録される。車両Mの搭乗者は、例えば、実施例1と同様に、タッチパネルディスプレイ14上に表示される「(新宿区△△町 OR 新宿区×○町) 煙突」との吹き出し表示をタッチすることにより、上記検索ワードによる検索結果を得ることができる。
【0119】
以下に、本実施例における車載装置10の制御部17において実行される第2のワード生成処理について説明する。図11は、車載装置10の制御部17において実行される第2のワード生成サブルーチンRT3を示すフローチャートである。なお、実施例1と同様の処理を行うステップS201については説明を省略する。
【0120】
制御部17は、ステップS201にて発話位置及び地図データを取得した後に、上記した普通名詞が示すものの属性に基づいて距離範囲Dを特定し、上記した方位を示す表現に基づいて角度範囲θを特定する(ステップS301)。
【0121】
制御部17は、ステップS301の後に、特定した距離範囲D及び角度範囲θを用いて地図上において範囲Rを形成する(ステップS302)。具体的には、図8に示すように、発話位置を起点とする三角形状の範囲Rを形成する。
【0122】
制御部17は、ステップS302の後に、範囲R内にある地名を特定する(ステップS303)。すなわち、本実施例において、制御部17は、範囲R内にある「新宿区△△町」及び「新宿区×○町」を地名として特定する。
【0123】
制御部17は、ステップS303において特定された地名に基づいて第2のワードを生成する(ステップS304)。すなわち、本実施例において、制御部17は、「新宿区△△町」及び「新宿区×○町」を第2のワードとする。制御部17は、ステップS304の後に第2のワード生成サブルーチンRT3を終了する。
【0124】
本実施例によれば、実施例1と同様に、生成された検索ワードが地図上の発話位置に対応付けられる態様で登録されるため、車両Mの搭乗者等のユーザは、いつでも検索ワードについて検索を行うことができる。
【0125】
また、本実施例によれば、制御部17は、入力音声における普通名詞が示すものの属性に基づく距離範囲と、入力音声における自身の向く基準方角に対する方位を示す表現に基づく角度範囲とを用いて、地名を特定するための範囲を設定する。
【0126】
これにより、制御部17は、例えば、ユーザから自身が興味を持った対象TAまでの距離が離れているような場合に、当該対象TAが位置すると想定される地域に的を絞った検索ワードを生成することができる。そのため、ユーザは、検索ワードと関連性の高い情報、すなわち対象TAと直接的又は間接的に関連性の有る情報を取得することができる。
【0127】
従って、本実施例によれば、ユーザが移動中に興味を持った対象についての情報を好きなタイミングで容易に取得することができる。
【0128】
なお、本実施例において、距離範囲TB1及び角度範囲TB2にそれぞれ示した距離範囲及び角度範囲は、一例に過ぎず、その範囲を適宜変更してもよい。また、例えば、上記した距離範囲については、名詞が示すものの属性に関わらず一定の距離範囲としてもよく、制御部17は、当該一定の距離範囲と角度範囲TB2とに基づいて範囲Rを形成してもよい。
【0129】
また、本実施例において、制御部17は、地図上において三角形状の範囲Rを形成するとしたが、その形状はこれに限られない。例えば、制御部17は、上記した第1の辺と第2の辺とを定めた際に、第1の辺の終点と第2の辺の終点とを外側に凸の曲線で繋いでもよい。すなわち、範囲Rは、扇形状の態様であってもよい。
【0130】
本実施例において、実施例1と同様にスマホやタブレットなどの通信端末であってもよい。このとき、制御部17は、ユーザが移動している方角を当該ユーザが向いている方角として取得する。
【0131】
本実施例において、制御部17は、OR検索+AND検索としての「(新宿区△△町 OR 新宿区×○町) 煙突」との検索ワードを生成するとしたが、検索ワードの態様はこれに限られない。例えば、制御部17は、単に「新宿区△△町 煙突」及び「新宿区×○町 煙突」との検索ワードを生成して発話位置に登録し、ユーザにより好ましい方を選択させる態様としてもよい。
【実施例0132】
次に、実施例3について説明する。実施例3では、ユーザからの発話内容に伴う制御部17による地名の特定方法が実施例2と異なっており、それ以外の点は実施例2と同様である。
【0133】
図12は、実施例3に係る車両Mの前席部分の構成及び車両Mの前方風景を示す図である。図12においては、車両Mでの移動中に、当該車両Mの進行方向の左前方に○×タワーが車両Mから見えており、当該○×タワーの右方に雲のようなオブジェを備えるビルが見えている様子を示している。
【0134】
図12において、車両Mの運転者は、雲のようなオブジェを備えるビルがどのようなものであるか興味を持ったことをして、マイク12に向けて「○×タワーの右にある雲のようなオブジェがあるビルって何?」という質問を投げかけている。
【0135】
本実施例において、車載装置10は、実施例2と同様に、車両Mの搭乗者からの入力音声から普通名詞及び当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉を抽出し、当該普通名詞と連体修飾語、連体修飾句又は連体修飾節を示す言葉とに基づいて第1のワードを生成する。
【0136】
また、本実施例において、車載装置10は、抽出した連体修飾語、連体修飾句又は連体修飾節を示す言葉と上記した発話位置と地図データとに基づいて地名を特定し、当該地名に基づいて第2のワードを生成する。車載装置10は、実施例2と同様に、生成された第1のワードと第2のワードとを組み合わせて検索ワードを生成し、地図上の発話位置に対応付けて登録する。
【0137】
以下に、本実施例において制御部17が実行する検索ワードの生成処理の一例について説明する。以下の説明においては、上記にて説明したのと同様に、ユーザから「○×タワーの右にある雲のようなオブジェがあるビルって何?」という音声が入力されたとして説明する。
【0138】
[テキストの抽出]
まず、テキストの抽出について説明する。制御部17は、実施例2と同様に、音声認識によって変換されたテキストから普通名詞と当該普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉とを抽出する。
【0139】
具体的には、制御部17は、音声認識によってテキスト変換された「○×タワーの右にある雲のようなオブジェがあるビルって何?」との文字列から、普通名詞を示す「ビル」と、「ビル」に係る連体修飾句を示す「○×タワーの右にある雲ようなのオブジェがある」とを抽出する。
【0140】
[第1のワードの生成]
次に、第1のワードの生成について説明する。本実施例において、制御部17は、「ビル」に係る連体修飾節の「○×タワーの右にある」との言葉が、「○×タワー」という固有名詞を含み、かつ発話位置から当該固有名詞が示すもの(○×タワー)に向かう方角を基準方角とした場合の、当該基準方角に対する方位を示す表現であると特定する。
【0141】
本実施例において、制御部17は、普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉から、固有名詞及び発話位置から固有名詞に向かう方角に対する方位を示す表現が特定される場合に、当該表現を含めずに第1のワードを生成する。すなわち、本実施例において、制御部17は、普通名詞を示す「ビル」及び当該「ビル」に係る連体修飾節を示す「雲のようなオブジェがある」を第1のワードとする。
【0142】
[第2のワードの生成]
次に、図13を用いて第2のワードの生成について説明する。図13は、実施例3における制御部17による地名特定の方法の一例を示す図である。図13において、1の町名が示す町の境界を一点鎖線で示している。また、図13において、車両Mの位置を車両Mの搭乗者が発話した発話位置としている。
【0143】
本実施例において、制御部17は、入力音声の普通名詞に係る連体修飾語、連体修飾句又は連体修飾節を示す言葉から、固有名詞が示すもの及び発話位置から固有名詞が示すものに向かう方角に対する方位を特定する。
【0144】
なお、本実施例において、固有名詞が示すものは、車両Mの搭乗者が対象TAとの位置関係を表す際の、目印となる地物としてのランドマークである。本実施例において、ランドマークは、予め地図情報にその名称及び位置が登録されているものとする。
【0145】
本実施例において、制御部17は、実施例2と同様に、発話位置を起点とした三角形状で囲まれる範囲R(図中二点鎖線)を設定し、地図上において範囲R内に一部又は全部が入っている地名を特定する。そして、制御部17は、特定した地名に基づいて第2のワードを生成する。
【0146】
本実施例において、所定の範囲Rは、普通名詞が示すものの属性に基づいて決まる距離範囲Dと、発話位置から固有名詞が示すもの(ランドマーク)に向かう方角に対する方位を示す表現に基づいて決まる角度範囲θとを用いて設定される。距離範囲Dについては、実施例2と同様の方法で決定される。
【0147】
ここで、図14を参照して、角度範囲θについて説明する。図14は、発話位置からランドマーク(以下、LMとも称する)に向かう方角に対する方位を示す表現例とそれに対応する角度範囲θを示す角度範囲TB3である。
【0148】
角度範囲TB3において、例えば、入力音声において普通名詞を修飾する言葉から「LMの奥にある…」や「LMを超えた先の…」との言葉が特定される場合、角度範囲θは、右回りを正として、発話位置からLMに向かう方角を基準(0°)として当該基準から左に45°(-45°)から右に45°までの範囲である。
【0149】
また、角度範囲TB3において、例えば、入力音声において普通名詞を修飾する言葉から「LMの左にある…」との言葉が特定される場合、角度範囲θは、発話位置からLMに向かう方角を基準(0°)として315°から360°までの範囲である。
【0150】
本実施例においては、制御部17は、「○×タワーの右にある」との言葉が、発話位置から「○×タワー」に向かう方角に対する方位を示す表現であると特定する。これにより、制御部17は、角度範囲TB3を参照して、「LMの右にある」に対応する角度範囲θが発話位置からLMに向かう方角を基準(0°)として0°から45°までの範囲であると特定する。
【0151】
再び図13を参照する。制御部17は、「○×タワーの右にある雲のようなオブジェがあるビルって何?」との入力音声を取得した際に、普通名詞を示す「ビル」との言葉から、図9に示した距離範囲TB1に基づいて、距離範囲Dが1kmであると特定する。また、制御部17は、普通名詞に係る連体修飾節を示す「○×タワーの右にある」との言葉から、角度範囲TB3に基づいて角度範囲θが0°から45°までの範囲であると特定する。
【0152】
制御部17は、特定した距離範囲D及び角度範囲θに基づいて、上記した範囲Rを地図上に形成する。そして、制御部17は、地図上において範囲R内にある地名を特定する。具体的には、制御部17は、図13に示すように、「新宿区△△町」、「新宿区×○町」及び「新宿区△□町」を地名として特定する。
【0153】
本実施例において、制御部17は、実施例2と同様に、特定した地名を第2のワードとする。すなわち、本実施例において、制御部17は、「新宿区△△町」、「新宿区×○町」及び「新宿区△□町」を第2のワードとする。
【0154】
[検索ワードの生成]
次に、検索ワードの生成について説明する。制御部17は、実施例2と同様に、それぞれ生成された第1のワードと第2のワードとを組み合わせて、OR検索+AND検索としての検索ワードを生成する。
【0155】
具体的には、制御部17は、第2のワードである「新宿区△△町」、「新宿区×○町」又は「新宿区△□町」と、第1のワードである「雲のようなオブジェがある」及び「ビル」とを含めるように、「(新宿区△△町 OR 新宿区×○町 OR 新宿区△□町) 雲のようなオブジェがある ビル」という検索ワードを生成する。制御部17によって生成された上記検索ワードは、実施例1及び2と同様に、地図上の発話位置に対応付けられて登録される。
以下に、本実施例における車載装置10の制御部17において実行される第2のワード生成処理について説明する。図15は、車載装置10の制御部17において実行される第2のワード生成サブルーチンRT4を示すフローチャートである。なお、実施例1と同様の処理を行うステップS201については説明を省略する。
【0156】
制御部17は、ステップS201において発話位置及び地図データを取得した後に、地図データに基づいて固有名詞が示すもの(ランドマーク)の位置を特定する(ステップS401)。そして、制御部17は、ステップS401の後に、上記固有名詞が示すものの位置に基づいて、発話位置から固有名詞が示すものに向かう方角を基準方角として特定する(ステップS402)。
【0157】
制御部17は、ステップS402の後に、普通名詞が示すものの属性に基づいて距離範囲Dを特定し、上記した発話位置から固有名詞が示すものに向かう基準方角に対する方位を示す表現に基づいて角度範囲θを特定する(ステップS403)。
【0158】
制御部17は、ステップS403の後に、特定した距離範囲D及び角度範囲θを用いて地図上において範囲Rを形成する(ステップS404)。具体的には、図13に示すように、発話位置を起点とする三角形状の範囲Rを形成する。
【0159】
制御部17は、ステップS404の後に、範囲R内にある地名を特定する(ステップS405)。すなわち、本実施例において、制御部17は、範囲R内にある「新宿区△△町」、「新宿区×○町」及び「新宿区△□町」を地名として特定する。
【0160】
制御部17は、ステップS405において特定された地名に基づいて第2のワードを生成する(ステップS406)。すなわち、本実施例において、制御部17は、「新宿区△△町」、「新宿区×○町」及び「新宿区△□町」を第2のワードとする。制御部17は、ステップS406の後に第2のワード生成サブルーチンRT4を終了する。
【0161】
本実施例によれば、実施例2と同様に、生成された検索ワードが地図上の発話位置に対応付けられる態様で登録されるため、車両Mの搭乗者等のユーザは、いつでも検索ワードについて検索を行うことができる。
【0162】
また、本実施例によれば、制御部17は、ユーザからの発話による入力音声から、ランドマークとしての固有名詞が示すものを特定し、且つ発話位置から当該ランドマークに向かう方角に対する方位を示す表現を特定することによって、第2のワード生成のための1又は複数の地名を特定することができる。
【0163】
そのため、制御部17は、例えば、ユーザから自身が興味を持った対象TAまでの距離があるような場合に、目印となる地物(ランドマーク)を参照しつつ、対象TAが位置すると想定される地域に的を絞った検索ワードを生成することができる。
【0164】
そのため、ユーザは、検索ワードと関連性の高い情報、すなわち対象TAと直接的又は間接的に関連性の有る情報を取得することができる。従って、本実施例によれば、ユーザが移動中に興味を持った対象についての情報を好きなタイミングで容易に取得することができる。
【0165】
なお、本実施例において、制御部17は、入力音声から固有名詞が示すもの及び発話位置から固有名詞が示すものに向かう方角に対する方位を示す表現を特定した際に、当該表現を第1のワードに含めないとしたが、これに限られない。
【0166】
例えば、制御部17は、固有名詞が示すものを第1のワードに含めてもよい。具体的には、制御部17は、固有名詞としての「○×タワー」を第1のワードに含め、OR検索+AND検索としての「(新宿区△△町 OR 新宿区×○町 OR 新宿区△□町) 雲のようなオブジェがある ビル ○×タワー」との検索ワードを生成してもよい。
【実施例0167】
次に、実施例4について説明する。実施例4では、制御部17が第2のワードを生成するために特定するものが実施例1と異なっており、それ以外の点、例えば車載装置10の各々の構成や第1のワードの生成方法等は実施例1と同様である。
【0168】
本実施例において、制御部17は、車両Mの搭乗者による発話によって音声入力された発話位置と、地図データとに基づいて、当該発話位置周辺の地物を特定する。本実施例において、制御部17は、特定した地物に基づいて第2のワードを生成する。
【0169】
以下、本実施例における検索ワードの生成処理の一例について説明する。なお、テキストの抽出及び第1のワードの生成処理については、実施例1と同様であるため省略する。以下の説明においては、実施例1と同様に、ユーザから「あの行列ができているラーメン屋ってどんな店?」という音声が入力されたとして説明する。
【0170】
[第2のワードの生成]
以下に、本実施例において、第2のワードの生成についてのうち、実施例1と異なる部分について説明する。図16は、実施例3における制御部17による地物特定の方法の一例を示す図である。図16において、1の町名が示す町の境界を一点鎖線で示している。また、図16において、車両Mの位置を車両Mの搭乗者が発話した発話位置としている。
【0171】
制御部17は、車両Mの搭乗者が「あの行列ができているラーメン屋ってどんなお店?」と発話した発話位置と、地図情報DB22Bに格納されている地図情報とに基づいて、当該発話位置の周辺に位置する地物を特定する。
【0172】
具体的には、制御部17は、例えば、発話位置及び地図情報に基づいて、発話位置の周辺にある最寄り駅やバス停、鉄道路線又は道路路線等の交通インフラに関連する施設の名称を特定する。本実施例において、制御部17は、図16に示すように、発話位置の最寄り駅である「○△駅」を特定している。本実施例において、制御部17は、特定した発話位置の最寄り駅である「○△駅」を第2のワードとする。
【0173】
[検索ワードの生成]
制御部17は、生成した第1のワードである「行列ができている」及び「ラーメン屋」と、第2のワードである「○△駅」とを間にスペースを入れて組み合わせて、1の検索ワードである「行列ができている ラーメン屋 ○△駅」を生成する。そして、制御部17は、生成した検索ワードを発話位置に対応付けて登録する。
【0174】
以下に、本実施例における車載装置10の制御部17において実行される第2のワード生成処理について説明する。図17は、車載装置10の制御部17において実行される第2のワード生成サブルーチンRT5を示すフローチャートである。なお、実施例1と同様の処理を行うステップS201については説明を省略する。
【0175】
制御部17は、発話位置及び地図データを取得(ステップS201)した後に、発話位置及び地図情報に基づいて、発話位置周辺に位置する地物を特定する(ステップS501)。具体的には、制御部17は、上記したように、地図上における発話位置の最寄り駅である「○△駅」を特定する。
【0176】
制御部17は、ステップS501において特定した地物を用いて第2のワードを生成する(ステップS502)。本実施例において、制御部17は、上記したように、ステップS501において特定した発話位置周辺の地物を示す言葉である「○△駅」を第2のワードとする。制御部17は、ステップS502の後に第2のワード生成サブルーチンRT5を終了する。
【0177】
本実施例によれば、実施例1と同様に、生成された検索ワードが地図上の発話位置に対応付けられる態様で登録されるため、車両Mの搭乗者等のユーザは、いつでも検索ワードについて検索を行うことができる。
【0178】
また、本実施例によれば、制御部17は、発話位置周辺に位置する地物を特定し、当該地物を第2のワードとし、当該第2のワードを用いて検索ワードを生成する。そのため、本実施例によれば、例えば、ネット上に「○△駅の近くのラーメン屋にはいつも行列ができる」等の交通インフラに関連づけてお店を紹介するような記事がある場合に、このような記事を効率良く検索することができる。
【0179】
なお、本実施例において、制御部17が発話位置周辺に位置する地物を特定するとしたが、その数は複数であってもよい。例えば、制御部17は、上記した「○△駅」と当該「○△駅」を通る電車の路線名を特定し、その両方を第2のワードとしてもよい。このとき、実施例2で説明したように、OR検索+AND検索として検索ワードを生成してもよい。
【0180】
また、制御部17は、発話位置周辺に位置する地物を予め複数特定し、発話位置に最も近い地物を第2のワードとしてもよい。また、地物が示すものの属性ごとに第2のワードとする優先順位が定められていてもよく、例えば、発話位置の近くの駅名を最優先として第2のワードとしてもよい。
【0181】
本実施例において、制御部17は、発話位置周辺の地物を特定するとしたがこれに限られず、発話位置の道路路線を地物として特定してもよい。例えば、車両Mが環状七号線を走行している際に、当該車両Mの搭乗者から「あの行列ができているラーメン屋ってどんなお店?」との発話がなされた際に、制御部17は、「環状七号線」を特定して第2のワードとしてもよい。
【0182】
そして、制御部17は、「行列ができている ラーメン屋 環状七号線」との検索ワードを作成してもよい。これにより、ユーザは、例えば、環状七号線沿いにあるラーメン店を紹介しているネット記事等の情報を取得できる。
【0183】
なお、制御部17が特定する地物は、上記した交通インフラに関連した施設のほか、湖や海岸等の自然物であってもよく、これを検索ワードに含めてもよい。これにより、例えば、ネット上に「××海岸沿いの有名レストランが…」といった記事がある場合においても、このような記事を効率良く検索することができる。
【実施例0184】
次に、実施例5について説明する。実施例5では、制御部17が第2のワードを生成するために特定するものが実施例2と異なっており、それ以外の点、例えば車載装置10の各々の構成や第1のワードの生成方法等は実施例2と同様である。
【0185】
本実施例において、制御部17は、車両Mの搭乗者による発話によって音声入力された音声と、当該発話による発話位置と、地図データとに基づいて、当該発話位置周辺の地物を特定する。本実施例において、制御部17は、特定した地物に基づいて第2のワードを生成する。
【0186】
以下、本実施例における検索ワードの生成処理の一例について説明する。なお、テキストの抽出及び第1のワードの生成処理については、実施例2と同様であるため省略する。以下の説明においては、実施例2と同様に、ユーザから「右前の煙突みたいなものって何?」という音声が入力されたとして説明する。
【0187】
[第2のワードの生成]
以下に、本実施例において、第2のワードの生成についてのうち、実施例2と異なる部分について説明する。
【0188】
図18は、実施例3における制御部17による地物特定の方法の一例を示す図である。図18において、1の町名が示す町の境界を一点鎖線で示している。また、図18において、車両Mの位置を車両Mの搭乗者が発話した発話位置としている。
【0189】
本実施例において、制御部17は、実施例2と同様に、発話位置を起点とした三角形状で囲まれる範囲R(図中二点鎖線)を設定し、地図上において範囲R内にある地物を特定する。そして、制御部17は、特定した地物に基づいて第2のワードを生成する。所定の範囲Rは、実施例2と同様に、普通名詞が示すものの属性に基づいて決まる距離範囲Dと、上記した方位を示す表現に基づいて決まる角度範囲θとを用いて設定される。
【0190】
制御部17は、実施例2と同様に、「右前の煙突みたいなものって何?」との入力音声を取得した際に、普通名詞を示す「煙突」との言葉から、距離範囲TB1に基づいて、距離範囲Dが1kmであると特定する。また、制御部17は、普通名詞に係る連体修飾句を示す「右前の」との言葉から、角度範囲TB2に基づいて角度範囲θが0°から45°までの範囲であると特定する。
【0191】
制御部17は、特定した距離範囲D及び角度範囲θに基づいて、上記した範囲Rを設定する。そして、制御部17は、地図上において設定した範囲R内にある地物を特定する。具体的には、制御部17は、図18に示すように、地図上の範囲R内にある道路路線である「国道▽号線」を地物として特定する。
【0192】
本実施例において、制御部17は、特定した地物を第2のワードとする。すなわち、本実施例において、制御部17は、「国道▽号線」を第2のワードとする。
【0193】
[検索ワードの生成]
制御部17は、生成した第1のワードである「煙突」と、第2のワードである「国道▽号線」とを間にスペースを入れて組み合わせて、1の検索ワードである「煙突 国道▽号線」との検索ワードを生成する。そして、制御部17は、生成した検索ワードを発話位置に対応付けて登録する。
【0194】
以下に、本実施例における車載装置10の制御部17において実行される第2のワード生成処理について説明する。図19は、車載装置10の制御部17において実行される第2のワード生成サブルーチンRT6を示すフローチャートである。なお、実施例2と同様の処理を行うステップS301~S303については説明を省略する。
【0195】
制御部17は、ステップS303において地図上に範囲Rを形成した後に、範囲R内にある地物を特定する(ステップS601)。すなわち、本実施例において、制御部17は、範囲R内にある「国道▽号線」を地物として特定する。
【0196】
制御部17は、ステップS601において特定された地物に基づいて第2のワードを生成する(ステップS602)。すなわち、本実施例において、制御部17は、「国道▽号線」を第2のワードとする。制御部17は、ステップS602の後に第2のワード生成サブルーチンRT6を終了する。
【0197】
本実施例によれば、実施例1と同様に、生成された検索ワードが地図上の発話位置に対応付けられる態様で登録されるため、車両Mの搭乗者等のユーザは、いつでも検索ワードについて検索を行うことができる。
【0198】
また、本実施例によれば、制御部17は、発話位置から所定範囲内に位置する地物を特定し、当該地物を第2のワードとし、当該第2のワードを用いて検索ワードを生成する。そのため、本実施例によれば、例えば、実施例4にて示したように、ネット上に交通インフラに関連づけて施設を紹介するような記事がある場合に、このような記事を効率良く検索することができる。
【0199】
なお、本実施例において、制御部17が発話位置からの範囲R内に位置する地物を特定するとしたが、その数は複数であってもよい。例えば、制御部17は、上記した「国道▽号線」と当該「国道▽号線」と交わる他の道路路線名を特定し、その両方を第2のワードとしてもよい。このとき、実施例2で説明したように、OR検索+AND検索として検索ワードを生成してもよい。
【0200】
実施例4及び5において、制御部17は、地物として道路路線や鉄道路線を特定した際に、当該道路路線や鉄道路線の通称や愛称、別称等を用いて第2のワードを生成してもよい。例えば、制御部17は、「環状七号線」をその通称である「環七」としてもよく、「東武伊勢崎線」をその愛称である「東武スカイツリーライン」として第2のワードを生成してもよい。
【0201】
また、制御部17は、車両Mの搭乗者の発話位置が示す地名と、そのとき車両Mが走行している国道名とに基づいて、道路愛称を特定しても良い。例えば、制御部17は、車両Mが国道246号線を走行中に外苑にて発話がなされた際には「青山通り」を特定する。また、車両Mが国道246号線を走行中に三軒茶屋にて発話がなされた際には「玉川通り」を特定する。制御部17は、特定したこれらの道路愛称を第2のワードとしてもよい。
【0202】
なお、実施例5において、制御部17が発話位置からの範囲Rにある地物を特定し、当該地物に基づいて第2のワードを生成するとしたが、これを実施例3の構成に適用してもよい。すなわち、制御部17が、普通名詞が示すものの属性と、発話位置から固有名詞が示すものに向かう方角に対する方位を示す表現とに基づいて上記した範囲Rを形成し、当該範囲Rに入る地物を特定してもよい。
【0203】
なお、実施例1~5において、制御部17は、実施例1~3では地名を、実施例4及び5では地物を特定して第2のワードを生成するとしたが、当該地名と地物とを含めて第2のワードを生成してもよい。
【0204】
例えば、制御部17は、実施例1にて地名として特定した「新宿区△△町」と、実施例4にて地物として特定した「○△駅」とを含めて第2のワードを生成し、「行列ができている ラーメン屋 新宿区△△町 ○△駅」との検索ワードを生成してもよい。
【0205】
上記した実施例1~5において示した制御ルーチンは例示に過ぎず、用途または使用条件等に応じて適宜選択及び変更可能である。
【符号の説明】
【0206】
10 車載装置
12 マイク
13 GPS受信機
14 タッチパネルディスプレイ
15 スピーカー
16 システムバス
17 制御部
18 通信部
19 入力部
21 出力部
22 大容量記憶装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19