特許7434117 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧

特許7434117対話装置、方法、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-02-09

(45)【発行日】2024-02-20

(54)【発明の名称】対話装置、方法、及びプログラム

(51)【国際特許分類】

G06F 16/9038 20190101AFI20240213BHJP

【ＦＩ】

G06F16/9038

【請求項の数】 12

(21)【出願番号】P 2020152168

(22)【出願日】2020-09-10

(65)【公開番号】P2022046231

(43)【公開日】2022-03-23

【審査請求日】2022-08-26

(73)【特許権者】

【識別番号】000003078

【氏名又は名称】株式会社東芝

(74)【代理人】

【識別番号】110003708

【氏名又は名称】弁理士法人鈴榮特許綜合事務所

(72)【発明者】

【氏名】小林優佳

(72)【発明者】

【氏名】岩田憲治

(72)【発明者】

【氏名】吉田尚水

【審査官】長由紀子

(56)【参考文献】

【文献】米国特許出願公開第２０１８／０１０１６１６（ＵＳ，Ａ１）

【文献】特開２０２０－００４２１７（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１０／０１６９３０４（ＵＳ，Ａ１）

【文献】中国特許出願公開第１１１０４６１４１（ＣＮ，Ａ）

【文献】西崎博光中川聖一，キーワードの音声入力によるニュース音声の検索法，情報処理学会研究報告，日本，社団法人情報処理学会，1999年12月21日，第99巻第108号，pp.91-96

【文献】増村亮外３名，ＷＷＷを利用した有効な検索クエリ構成による言語モデル教師なし適応効果，日本音響学会２００９年秋季研究発表会講演論文集ＣＤ－ＲＯＭ［ＣＤ－ＲＯＭ］，社団法人日本音響学会，2009年09月08日，pp.51-54

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－９５８

(57)【特許請求の範囲】

【請求項1】

複数のデータベースのうち、ユーザが指示した１つのデータベースを指定する指定部と、
前記ユーザが入力したテキスト情報を取得する取得部と、
前記テキスト情報から検索に必要な検索キーワードを抽出する抽出部と、
前記検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索する検索部と、
前記指定されたデータベースにおいて前記検索キーワードに合致したデータ件数である第１の検索件数が０件であり、かつ前記他のデータベースにおいて前記検索キーワードに合致したデータ件数である第２の検索件数が１件以上である場合、前記指定されたデータベースとは異なるデータベースを前記ユーザに問い合わせる応答を生成する生成部と、
前記生成された応答を前記ユーザに出力する出力部と、
を具備する対話装置。

【請求項2】

前記生成部は、前記第１の検索件数が０件であり、かつ前記第２の検索件数が０件である場合、前記検索キーワードとは異なるキーワードを問い合わせる応答を生成する、
請求項１に記載の対話装置。

【請求項3】

前記生成部は、前記第１の検索件数が０件であり、かつ前記第２の検索件数が１件以上である場合、前記第２の検索件数を回答する応答を生成する、
請求項１又は請求項２に記載の対話装置。

【請求項4】

前記生成部は、前記第１の検索件数が１件以上であり、かつ閾値以下である場合、前記第１の検索件数を回答する応答を生成する、
請求項１から請求項３のいずれか１項に記載の対話装置。

【請求項5】

前記生成部は、前記第１の検索件数が１件以上であり、かつ閾値より大きい場合、前記第１の検索件数の絞り込みに必要な絞込キーワードを問い合わせる応答を生成する、
請求項１から請求項４のいずれか１項に記載の対話装置。

【請求項6】

前記複数のデータベースはそれぞれ、前記検索キーワードに関連する複数のデータ項目が定義されたデータテーブルを含み、
前記対話装置は、
前記複数のデータベースに含まれるそれぞれのデータテーブルにおいて、前記複数のデータ項目それぞれの平均情報量を計算し、かつ前記複数のデータベースそれぞれに設定される重み付けを用いて、前記複数のデータ項目それぞれの平均情報量について加重平均を計算する計算部と、
前記複数のデータ項目のうち、前記平均情報量の加重平均が最も大きいデータ項目を前記絞込キーワードとして決定する決定部と、
をさらに具備する請求項５に記載の対話装置。

【請求項7】

前記ユーザが入力した音声情報を音声認識してテキスト情報に変換する認識部と、
をさらに具備し、
前記抽出部は、前記変換されたテキスト情報から複数の検索キーワードを抽出し、
前記検索部は、前記複数の検索キーワードを用いて、前記指定されたデータベースと、前記他のデータベースとを検索し、
前記生成部は、前記指定されたデータベースにおける前記複数の検索キーワードの検索件数が０件であり、かつ前記他のデータベースにおける前記複数の検索キーワードの検索件数が１件以上である場合、前記複数の検索キーワードのうち、前記他のデータベースにおける検索件数の総和が最も大きい検索キーワードを正解キーワードとして、前記他のデータベースにおける前記正解キーワードの検索件数を回答する応答を生成する、
請求項１から請求項６のいずれか１項に記載の対話装置。

【請求項8】

複数のデータベースのうち、１つのデータベースを指定する指定部と、
ユーザが入力した音声情報を音声認識してテキスト情報に変換する認識部と、
前記変換されたテキスト情報から複数の検索キーワードを抽出する抽出部と、
前記複数の検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索する検索部と、
前記指定されたデータベースにおける前記複数の検索キーワードの検索件数が０件であり、かつ前記他のデータベースにおける前記複数の検索キーワードの検索件数が１件以上である場合、前記複数の検索キーワードのうち、前記他のデータベースにおける検索件数の総和が最も大きい検索キーワードを正解キーワードとして、前記他のデータベースにおける前記正解キーワードの検索件数を回答する応答を生成する生成部と、
前記生成された応答を前記ユーザに出力する出力部と、
を具備する対話装置。

【請求項9】

複数のデータベースのうち、ユーザが指示した１つのデータベースを指定し、
前記ユーザが入力したテキスト情報を取得し、
前記テキスト情報から検索に必要な検索キーワードを抽出し、
前記検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索し、
前記指定されたデータベースにおいて前記検索キーワードに合致したデータ件数である第１の検索件数が０件であり、かつ前記他のデータベースにおいて前記検索キーワードに合致したデータ件数である第２の検索件数が１件以上である場合、前記指定されたデータベースとは異なるデータベースを前記ユーザに問い合わせる応答を生成し、
前記生成された応答を前記ユーザに出力する、
対話方法。

【請求項10】

複数のデータベースのうち、１つのデータベースを指定し、
ユーザが入力した音声情報を音声認識してテキスト情報に変換し、
前記変換されたテキスト情報から複数の検索キーワードを抽出し、
前記複数の検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索し、
前記指定されたデータベースにおける前記複数の検索キーワードの検索件数が０件であり、かつ前記他のデータベースにおける前記複数の検索キーワードの検索件数が１件以上である場合、前記複数の検索キーワードのうち、前記他のデータベースにおける検索件数の総和が最も大きい検索キーワードを正解キーワードとして、前記他のデータベースにおける前記正解キーワードの検索件数を回答する応答を生成し、
前記生成された応答を前記ユーザに出力する、
対話方法。

【請求項11】

コンピュータに、
複数のデータベースのうち、ユーザが指示した１つのデータベースを指定する指定機能と、
前記ユーザが入力したテキスト情報を取得する取得機能と、
前記テキスト情報から検索に必要な検索キーワードを抽出する抽出機能と、
前記検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索する検索機能と、
前記指定されたデータベースにおいて前記検索キーワードに合致したデータ件数である第１の検索件数が０件であり、かつ前記他のデータベースにおいて前記検索キーワードに合致したデータ件数である第２の検索件数が１件以上である場合、前記指定されたデータベースとは異なるデータベースを前記ユーザに問い合わせる応答を生成する生成機能と、
前記生成された応答を前記ユーザに出力する出力機能と、
を実現させる対話プログラム。

【請求項12】

コンピュータに、
複数のデータベースのうち、１つのデータベースを指定する指定機能と、
ユーザが入力した音声情報を音声認識してテキスト情報に変換する認識機能と、
前記変換されたテキスト情報から複数の検索キーワードを抽出する抽出機能と、
前記複数の検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索する検索機能と、
前記指定されたデータベースにおける前記複数の検索キーワードの検索件数が０件であり、かつ前記他のデータベースにおける前記複数の検索キーワードの検索件数が１件以上である場合、前記複数の検索キーワードのうち、前記他のデータベースにおける検索件数の総和が最も大きい検索キーワードを正解キーワードとして、前記他のデータベースにおける前記正解キーワードの検索件数を回答する応答を生成する生成機能と、
前記生成された応答を前記ユーザに出力する出力機能と、
を実現させる対話プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明の実施形態は、対話装置、方法、及びプログラムに関する。

【背景技術】

【0002】

一般的に、対話装置はユーザが入力した自然文等のテキスト情報から、検索に必要な検索キーワードを抽出し、抽出した検索キーワードを用いてデータベースを検索し、検索した結果に応じてユーザに応答を出力する。検索対象となるデータベースは、１つ以上のデータベースであり、例えば複数のデータベース機能を統合した１つのデータベースや、互いに独立した複数のデータベースを含む。具体的には、対話装置はユーザ等が指定した１つ以上のデータベースを検索する。

【0003】

第一に、指定された１つのデータベースを対話装置が検索する場合、指定されていない他のデータベースでの検索結果を考慮した応答を出力することができない。例えば、ある検索キーワードによる特定のデータベースでの検索件数が０件である場合、対話装置は更なる検索を行うことができず、続けて検索件数の絞り込みに用いるべき他の検索キーワードや他のデータベースを提示することができない。第二に、指定された複数のデータベースを対話装置が検索する場合、複数のデータベースから得られた複数の検索結果のうち、どの検索結果を優先的に利用して応答を出力するかを決定することができない。したがって、指定された１つのデータベースにおける検索結果を優先的に利用しつつ、当該検索結果と、指定されていない他のデータベースにおける検索結果とを統合した応答を出力する対話装置が望まれる。

【先行技術文献】

【特許文献】

【0004】

【文献】特許第６５８０７３７号

【発明の概要】

【発明が解決しようとする課題】

【0005】

本発明が解決しようとする課題は、柔軟な対話を進めることである。

【課題を解決するための手段】

【0006】

本実施形態に係る対話装置は、指定部と、取得部と、抽出部と、検索部と、生成部と、出力部とを含む。指定部は、複数のデータベースのうち、１つのデータベースを指定する。取得部は、ユーザが入力したテキスト情報を取得する。抽出部は、前記テキスト情報から検索に必要な検索キーワードを抽出する。検索部は、前記検索キーワードを用いて、前記指定されたデータベースと、前記複数のデータベースのうち前記指定されたデータベース以外の他のデータベースとを検索する。生成部は、前記指定されたデータベースにおいて前記検索キーワードに合致したデータ件数である第１の検索件数と、前記他のデータベースにおいて前記検索キーワードに合致したデータ件数である第２の検索件数とに応じて応答を生成する。出力部は、前記生成された応答を前記ユーザに出力する。

【図面の簡単な説明】

【0007】

【図1】第１の実施形態に係る対話装置の構成例を示すブロック図。

【図2】第１の実施形態に係る対話装置の動作例を示すフロー図。

【図3】絞込キーワードの決定に関する詳細を示すフロー図。

【図4】複数のデータベースに格納されるデータテーブルの一例を示す図。

【図5】複数のデータベースそれぞれのデータ件数の一例を示す図。

【図6】第２の実施形態に係る対話装置の構成例を示すブロック図。

【図7】第２の実施形態に係る対話装置の動作例を示すフロー図。

【発明を実施するための形態】

【0008】

以下、図面を参照しながら本実施形態に係る対話装置、方法、及びプログラムについて説明する。以下の実施形態では、同一の参照符号を付した部分は同様の動作を行うものとして、重複する説明を適宜、省略する。以下、一実施形態について図面を用いて説明する。

【0009】

（第１の実施形態）
第１の実施形態に係る対話装置１の構成例について図１を参照して説明する。
対話装置１は、ユーザが入力した自然文等のテキスト情報から、検索に必要な検索キーワードを抽出し、抽出した検索キーワードを用いて複数のデータベース２を検索し、検索した結果に応じてユーザに応答を出力する装置である。具体的には、対話装置１はタスク指向型の対話装置であり、サーバ等に実装されることで対話専用のハードウェアとして実装されてもよいし、又はアプリケーションプログラム等のソフトウェアとして実装されてもよい。本実施形態において、対話装置１は、処理回路１１、メモリ１２、表示装置１３、入力インタフェース１４、及び通信インタフェース１５を含む。各構成部は、バスを通じて互いに通信可能に接続される。なお、各構成部は個々のハードウェアにより実装されなくともよい。例えば、各構成部のうち少なくとも２つが１つのハードウェアにより実装されてもよい。

【0010】

また、対話装置１は複数のデータベース２とネットワークを介して通信可能に接続される。なお、対話装置１、データベース２、及びネットワークを含むシステム全体は、対話システム１００とも呼ぶ。

【0011】

処理回路１１は、対話装置１の動作を制御する。処理回路１１は、ハードウェアとしてＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＦＰＵ（Floating Point Unit）等のプロセッサを有する。処理回路１１は、プロセッサを介してメモリ１２に展開されたプログラムを実行することで、各プログラムに対応する各部（指定部１１１、取得部１１２、抽出部１１３、検索部１１４、判定部１１５、生成部１１６、出力部１１７、計算部１１８、決定部１１９）を実行する。なお、各部は単独のプロセッサから成る処理回路により実装されなくともよい。例えば、各部は複数のプロセッサを組み合わせた処理回路により実装されてもよい。

【0012】

指定部１１１は、複数のデータベースのうち、１つのデータベースを指定する。
取得部１１２は、ユーザが入力したテキスト情報を取得する。
抽出部１１３は、テキスト情報から検索に必要な検索キーワードを抽出する。
検索部１１４は、検索キーワードを用いて、指定されたデータベースと、複数のデータベースのうち指定されたデータベース以外の他のデータベースとを検索する。
判定部１１５は、各種命題の真偽を判定する。
生成部１１６は、指定されたデータベースにおいて検索キーワードに合致したデータ件数である第１の検索件数と、他のデータベースにおいて検索キーワードに合致したデータ件数である第２の検索件数とに応じて応答を生成する。
出力部１１７は、生成された応答をユーザに出力する。
計算部１１８は、複数のデータベースに含まれるそれぞれのデータテーブルにおいて、複数のデータ項目それぞれの平均情報量を計算する。また、計算部１１８は、複数のデータベースそれぞれに設定される重み付けを用いて、複数のデータ項目それぞれの平均情報量について加重平均を計算する。
決定部１１９は、複数のデータ項目のうち、平均情報量の加重平均が最も大きいデータ項目を絞込キーワードとして決定する。

【0013】

メモリ１２は、処理回路１１が使用するデータやプログラム等の情報を記憶する。メモリ１２は、ハードウェアとしてＲＡＭ（Random Access Memory）等の半導体メモリ素子を有する。なお、メモリ１２は、磁気ディスク（フロッピー（登録商標）ディスク、ハードディスク）、光磁気ディスク（ＭＯ）、光学ディスク（ＣＤ、ＤＶＤ、Ｂｌｕ－ｒａｙ（登録商標））、フラッシュメモリ（ＵＳＢフラッシュメモリ、メモリカード、ＳＳＤ）、磁気テープ等の外部記憶装置との間で情報を読み書きする駆動装置であってもよい。なお、メモリ１２の記憶領域は、対話装置１内部にあってもよいし、外部記憶装置にあってもよい。

【0014】

表示装置１３は、処理回路１１が生成したデータやメモリ１２に格納されるデータ等の情報を表示する。表示装置１３として、例えば、ブラウン管（ＣＲＴ：Cathode Ray Tube）ディスプレイ、液晶ディスプレイ（ＬＣＤ：Liquid Crystal Display）、プラズマディスプレイ、有機ＥＬディスプレイ（ＯＥＬＤ：Organic Electro-Luminescence Display）、及びタブレット端末等のディスプレイが使用可能である。

【0015】

入力インタフェース１４は、対話装置１を利用するユーザからの入力を受け付け、受け付けた入力を電気信号に変換して処理回路１１に出力する。入力インタフェース１４として、マウス、キーボード、トラックボール、スイッチ、ボタン、ジョイスティック、タッチパッド、タッチパネルディスプレイ、マイク等の物理的な操作部品が使用可能である。なお、入力インタフェース１４は、対話装置１とは別体である外部の入力装置から入力を受け付け、受け付けた入力を電気信号に変換して処理回路１１に出力する装置であってもよい。

【0016】

通信インタフェース１５は、データベース２との間でネットワークを介してデータを送受信する。通信インタフェース１５と外部装置との間では任意の通信規格が使用可能である。

【0017】

データベース２は、各種データを格納する。データベース２は、例えばサーバに格納されるデータファイルとして実装されてもよい。本実施形態において、データベース２は、複数のリレーショナルデータベース（ＲＤＢ）を含み、複数のデータベース２はそれぞれ、検索キーワードに関連する複数のデータ項目が定義されたデータテーブルを含むものとする。データベース２は、例えばデータベースＡ、データベースＢ、及びデータベースＣを含む。また、データベース２はＳＱＬ（Structured Query Language）等のデータベース言語に則したクエリにより検索されるものとする。

【0018】

第１の実施形態に係る対話装置の動作例について図２を参照して説明する。
ステップＳ１０１において、指定部１１１は、複数のデータベース２のうち、１つのデータベースを指定する。例えば、対話装置１はユーザがキーボード等の入力インタフェース１４を介して入力した指示を受け付けて、当該指示に対応するデータベースを指定する。他にも、対話装置１は、デフォルトのデータベースを指定してもよいし、ユーザのプロフィール等に応じて自動でデータベースを指定してもよい。すなわち、データベースの指定方法としては、任意の方法が適用可能である。なお、対話が終了するまでは一度指定されたデータベースを保持して再度問い合わせないものとする。

【0019】

ステップＳ１０２において、取得部１１２は、ユーザが入力したテキスト情報を取得する。例えば、対話装置１はユーザがキーボード（キー入力）、タッチパッド及びタッチパネルディスプレイ（手書き認識による入力）、ヘッドセット及びＡＩスピーカー等のマイク（音声認識による入力）等の入力インタフェース１４を介して入力したテキスト情報を取得する。取得されたテキスト情報は、メモリ１２に格納される。

【0020】

ステップＳ１０３において、抽出部１１３は、テキスト情報から検索に必要な検索キーワードを抽出する。検索キーワードの抽出には、第一の抽出方法としては、抽出対象となる複数のキーワードを含むリストを用意しておき、取得されたテキスト情報に当該リスト上のいずれかのキーワードが含まれていれば、該当するキーワードを抽出してもよい。第一の抽出方法は、例えば「抵抗器」「コンデンサ」「トランジスタ」のような複数のキーワードを用意しておき、取得されたテキスト情報が「抵抗器を探して」であれば、当該複数のキーワードのうち「抵抗器」がテキスト情報に含まれるため、「抵抗器」を抽出する。

【0021】

第二の抽出方法としては、抽出対象となるキーワードを含む複数の文章のリストを用意しておき、取得されたに当該リスト上のいずれかの文章が含まれていれば、当該文章に含まれるキーワードを抽出してもよい。第二の抽出方法は、例えば「〇〇を探して」「△△を検索して」「□□はありますか」のような複数の文章を用意しておき、取得されたテキスト情報が「抵抗器を探して」であれば、〇〇の部分に対応する「抵抗器」を抽出する。

【0022】

第三の抽出方法としては、抽出対象となるキーワードが含まれる文章と、当該文章のうち抽出対象となるキーワード（ラベル）との組を大量に用意しておき、当該組を学習データとして用いて機械学習モデルを作成し、当該機械学習モデルによって抽出してもよい。第三の抽出方法は、例えば「抵抗器を探して」という文章と、当該文章に対するラベルである「抵抗器」との組、「コンデンサを検索して」という文章と、当該文章に対するラベルである「コンデンサ」との組、「トランジスタはありますか」という文章と、当該文章に対するラベルである「トランジスタ」との組、のように複数の組を学習データとして用意し、学習用モデルに文章とラベルとの関係を学習させることで機械学習モデルを作成する。当該機械学習モデルを用いて、取得されたテキスト情報が「抵抗器を探して」であれば、学習した文章とラベルとの関係に基づいて「抵抗器」を抽出する。すなわち、検索キーワードの抽出方法としては任意の方法が適用可能である。抽出された検索キーワードは、メモリ１２に格納される。

【0023】

ステップＳ１０４において、検索部１１４は、検索キーワードを用いて、指定されたデータベースと、複数のデータベース２のうち指定されたデータベース以外の他のデータベースとを検索する。例えば、対話装置１は、抽出された検索キーワードに基づいてＳＱＬに基づくクエリを作成し、複数のデータベース２を検索する。クエリは、例えば「select * from databaseA where name = %抵抗器%」のように検索キーワードを含む命令文である。複数の検索結果は、検索されたデータベースごとに対応付けられてメモリ１２に格納される。本実施形態において、検索結果はデータベース２において検索キーワードに合致したデータ件数であるとする。

【0024】

ステップＳ１０５において、判定部１１５は、指定されたデータベースにおいて検索キーワードに合致したデータ件数（第１の検索件数）が、０件であるか否かを判定する。０件であると判定された場合（ステップＳ１０５のＹｅｓ）、ステップＳ１０６に進む。０件でない、すなわち１件以上であると判定された場合（ステップＳ１０５のＮｏ）、ステップＳ１０９に進む。

【0025】

ステップＳ１０６において、判定部１１５は、指定されていない他のデータベースにおいて検索キーワードに合致したデータ件数（第２の検索件数）が、０件であるか否かを判定する。０件であると判定された場合（ステップＳ１０６のＹｅｓ）、ステップＳ１０７に進む。０件でない、すなわち１件以上であると判定された場合（ステップＳ１０６のＮｏ）、ステップＳ１０８に進む。

【0026】

ステップＳ１０７において、生成部１１６は、検索キーワードとは異なるキーワードを問い合わせる応答を生成する。本ステップまでに、当該検索キーワードでは指定されたデータベース、及び他のデータベースにおいて更なる検索を行えないことが判明しているため、対話装置１は「reject()」コマンドを生成する。本コマンドは、当該検索キーワードを受け付けられないことを示し、異なるキーワードを問い合わせる応答の一例である。生成された応答は、メモリ１２に格納される。

【0027】

ステップＳ１０８において、生成部１１６は、指定されたデータベースとは異なるデータベースを問い合わせる応答を生成する。本ステップまでに、指定されたデータベースとは異なる他のデータベースを検索すればデータが見つかることが判明しているため、対話装置１は「request(db)」コマンドを生成する。本コマンドは、新たに指定される他のデータベースを問い合わせる応答の一例である。生成された応答は、メモリ１２に格納される。あるいは、対話装置１は他のデータベースでの検索件数を回答する応答を生成してもよい。

【0028】

ステップＳ１０９において、判定部１１５は、指定されたデータベースにおいて検索キーワードに合致したデータ件数（第１の検索件数）が、閾値以下であるか否かを判定する。当該閾値は、ユーザが入力インタフェース１４を介して入力した任意の値に設定されてもよいし、メモリ１２にあらかじめ格納されている任意の値に設定されてもよい。閾値以下であると判定された場合（ステップＳ１０９のＹｅｓ）、ステップＳ１１０に進む。閾値以下でない、すなわち閾値より大きいと判定された場合（ステップＳ１０９のＮｏ）、ステップＳ１１１に進む。

【0029】

ステップＳ１１０において、生成部１１６は、指定されたデータベースでの検索件数を回答する応答を生成する。本ステップまでに、指定されたデータベースでの検索件数が閾値以下であることが判明しているため、対話装置１は「offer(contents)」コマンドを生成する。本コマンドは、指定されたデータベースでの検索件数を回答する応答の一例である。生成された応答は、メモリ１２に格納される。

【0030】

ステップＳ１１１において、生成部１１６は、指定されたデータベースでの検索件数の絞り込みに必要な絞込キーワードを問い合わせる応答を生成する。本ステップまでに、指定されたデータベースでの検索件数が閾値より大きいことが判明しているため、対話装置１は「request(slot)」コマンドを生成する。本コマンドは、検索件数を絞り込むためのデータ項目（スロットとも呼ぶ）を問い合わせる応答の一例である。生成された応答は、メモリ１２に格納される。なお、絞込キーワードは、問い合わせる対象となるデータ項目に相当し、当該絞込キーワードの決定に関する詳細なフローは、図３に後述する。

【0031】

ステップＳ１１２において、出力部１１７は、生成された応答をユーザに出力する。対話装置１は、例えば生成されたコマンドを表示装置１３に出力する。なお、生成された応答は機械が理解できる形式の情報（コマンド）であるため、対話装置１は人間が理解できる形式の情報（テキスト情報）に変換して出力してもよい。応答の変換には、第一の変換手法としては、「$name$の検索結果は$count$件です」のような複数の定型文をメモリ１２に用意しておき、$name$に検索キーワードを、$count$に検索件数を埋め込むことで変換してもよい。第二の変換手法としては、あらかじめ検索キーワード、検索件数、及び生成される文章の組を大量に用意し、当該組を学習データとして用いて機械学習モデルを生成して、当該機械学習モデルによって出力してもよい。すなわち、変換方法としては任意の方法が適用可能である。その後、対話装置１は、テキスト情報に変換した応答を表示装置１３に出力する。なお、ユーザは、表示装置１３に出力された応答を見るため、応答はユーザに対して出力されるともいえる。

【0032】

例えば、対話装置１はステップＳ１０７において生成された「reject()」コマンドをメモリ１２から取得し、「検索できませんでした。他のキーワードで検索してください」のような応答文に変換して表示装置１３に出力する。また、対話装置１はステップＳ１０８において生成された「request(db)」コマンドをメモリ１２から取得し、「東京事業所のデータベースでは検索できませんでした。他の事業所のデータベースを指定してください」のような応答文に変換して表示装置１３に出力する。また、対話装置１はステップＳ１１０において生成された「offer(contents)」コマンドをメモリ１２から取得し、「検索結果は１０件です」のような応答文に変換して表示装置１３に出力する、また、対話装置１はステップＳ１１１において生成された「request(slot)」コマンドをメモリ１２から取得し、「〇〇（データ項目）を教えてください」のような応答文に変換して表示装置１３に出力する。なお、slotには対話装置１が問い合わせるデータ項目が入り、例えばslotが電圧（voltage）であれば、request(voltage)コマンドとなる。この場合、対話装置１はrequest(voltage)コマンドをメモリ１２から取得し、「電圧はいくつですか」のような応答文に変換して表示装置１３に出力する。

【0033】

なお、本動作例に示した各ステップは、適宜順番の変更が可能である。例えば、ステップＳ１０１はステップＳ１０４より前のどの段階にあってもよい。また、ステップＳ１０５及びステップＳ１０６は互いに順番を入れ替えてもよい。

【0034】

絞込キーワードの決定に関する詳細について図３を参照して説明する。
ステップＳ２０１において、計算部１１８は、複数のデータベース２に含まれるそれぞれのデータテーブルにおいて、複数のデータ項目それぞれのデータ件数を計算する。具体的には、対話装置１は指定されたデータベース及び指定されていない他のデータベースにおける複数のデータ項目それぞれにおいて、各データ項目の値ごとのデータ件数を計算する。

【0035】

例えば、複数のデータベース２に図４に示すデータテーブル２００が格納されているとする。データテーブル２００は、電気部品に関するデータを格納し、データ項目として「部品ＩＤ」、「部品名」、及び「型番」を含む。部品ＩＤは、個々のレコードに割り当てられる連番であり、０００１から１ずつ増加した値が割り当てられる。部品名は、電気部品の名称であり、データ値として「抵抗器」、「コンデンサ」、及び「トランジスタ」を含む。型番は、各電気部品に固有の識別番号であり、データ値として「ＡＢＣ」、「ＤＥＦ」、及び「ＧＨＩ」を含む。なお、同一の部品名であっても、型番が異なる場合もある。さらに、同一の型番であっても、部品名が異なる場合もある。また、同一のレコードが重複する場合もある。このように、データテーブル２００には、部品名と型番とが対応付けられたレコード（データ）が複数格納されている。

【0036】

対話装置１は、「部品名」において「抵抗器」を持つデータ件数、「コンデンサ」を持つデータ件数、「トランジスタ」を持つデータ件数をそれぞれ計算する。同様に、対話装置１は「型番」において「ＡＢＣ」を持つデータ件数、「ＤＥＦ」を持つデータ件数、「ＧＨＩ」を持つデータ件数をそれぞれ計算する。同様に、対話装置１は複数のデータベース２に含まれるそれぞれのデータテーブルにおいて計算する。計算結果として、複数のデータベース２それぞれのデータ件数は図５に示す集計データテーブル３００のように表される。

【0037】

ステップＳ２０２において、計算部１１８は、複数のデータベース２に含まれるそれぞれのデータテーブルにおいて、複数のデータ項目それぞれの平均情報量を計算する。各データ項目の平均情報量は、各データ項目における各データ値の件数の偏りを反映しており、平均情報量が高いほど、各データ値の件数の偏りが小さく均等であることを示す。このような性質から、平均情報量がより高いデータ項目はより多くの情報を含むため、検索件数の絞り込みに有用である。

【0038】

例えば、集計データテーブル３００について複数のデータ項目それぞれの平均情報量を計算する場合を考える。平均情報量は以下の式により算出される。

【0039】

【数1】

Ｈ（Ｓ_ｊ）はデータ項目（スロット）Ｓ_ｊにおける平均情報量を表す。各データ項目Ｓ_ｊは、複数の値Ｖ_ｉを有する。Ｐ（Ｖ_ｉ）は、値Ｖ_ｉに関するデータ件数を、データ項目Ｓ_ｊに含まれる全てのデータ件数で除算して得られた数値である。

【0040】

集計データテーブル３００において、数式（１）に基づいて複数のデータベース２ごとの各データ項目の平均情報量は以下のように求められる。
Ｈ_Ａ（Ｐ_部品名）＝０．４７７、Ｈ_Ａ（Ｐ_型番）＝０．４３９
Ｈ_Ｂ（Ｐ_部品名）＝０．１８５、Ｈ_Ｂ（Ｐ_型番）＝０．４６１
Ｈ_Ｃ（Ｐ_部品名）＝０．３４６、Ｈ_Ｃ（Ｐ_型番）＝０．４１５
なお、Ｈ_Ａ（Ｐ_部品名）は、データベースＡのデータ項目「部品名」に関する平均情報量を表す。

【0041】

ステップＳ２０３において、計算部１１８は、複数のデータベース２それぞれに設定される重み付けを用いて、複数のデータ項目それぞれの平均情報量について加重平均を計算する。具体的には、対話装置１は指定されたデータベースについて設定される重み付けを、他のデータベースに設定される重み付けよりも大きい値に設定する。

【0042】

例えば、集計データテーブル３００の各データ項目の平均情報量について加重平均を計算する場合を考える。平均情報量の加重平均は以下の式により算出される。

【0043】

【数2】

Ｈ_allは平均情報量の加重平均を表す。Ｗ_ｉは複数のデータベース２ごとに設定される重み付けである。Ｗ_ｉは複数の値を有し、各値の総和は１とする。

【0044】

集計データテーブル３００において、数式（２）に基づいて各データ項目の平均情報量の加重平均は以下のように求められる。なお、複数のデータベース２のうち、指定されたデータベースはデータベースＡであり、指定されていない他のデータベースはデータベースＢ、及びデータベースＣであるとする。
Ｈ_all(Ｐ_部品名)＝3/5*Ｈ_Ａ（Ｐ_部品名）+1/5*Ｈ_Ｂ（Ｐ_部品名）+1/5*Ｈ_Ｃ（Ｐ_部品名）＝０．３９２
Ｈ_all（Ｐ_型番）＝3/5*Ｈ_Ａ（Ｐ_型番）+1/5*Ｈ_Ｂ（Ｐ_型番）+1/5*Ｈ_Ｃ（Ｐ_型番）＝０．４３９
なお、データベースＡの重み付けＷ_Ａ＝3/5、データベースＢの重み付けＷ_Ｂ＝1/5、データベースＣの重み付けＷ_Ｃ＝1/5と設定している。

【0045】

ステップＳ２０４において、決定部１１９は、複数のデータ項目のうち、平均情報量の加重平均が最も大きいデータ項目を絞込キーワードとして決定する。各データ項目の平均情報量は、各データ値のデータ件数が均等であるほど大きいため、平均情報量がより大きいデータ項目では、ユーザが探すデータが含まれる確率が高い。上記の例では、Ｈ_all（Ｐ_型番）がＨ_all(Ｐ_部品名)よりも大きいので、対話装置１はデータ項目「型番」を絞込キーワードとして決定する。なお、絞込キーワードは対話装置１が問い合わせるデータ項目（スロット）としてステップＳ１１２で用いられる。

【0046】

以上示した説明した第１の実施形態によれば、ユーザが指定したデータベースでの検索結果を重視しつつ、他のデータベースでの検索結果を考慮した応答を生成する。これにより、指定されたデータベースの検索件数が０件であっても、他のデータベースでの検索結果を考慮して柔軟な対話を進めることができる。また、指定されたデータベースの検索件数が１件以上かつ閾値よりも大きい場合、絞込キーワードとして問い合わせるデータ項目を、指定されたデータベースの検索結果を優先的に利用しつつ、さらに他のデータベースの検索結果を考慮して決定することができる。

【0047】

（第２の実施形態）
第２の実施形態に係る対話装置の構成例について、図６を参照して説明する。第２の実施形態において、対話装置１はユーザが発話した音声情報から抽出された複数の検索キーワードのうち、最もユーザの発話内容に近い検索キーワード（正解キーワード）を決定する。なお、第２の実施形態に係る対話装置１の構成は、第１の実施形態の構成に加えて、処理回路１１に認識部１２０を有する。

【0048】

認識部１２０は、音声情報を音声認識してテキスト情報に変換する。

【0049】

第２の実施形態に係る対話装置の動作例について、図７を参照して説明する。
ステップＳ３０１において、指定部１１１は、複数のデータベースのうち、１つのデータベースを指定する。ステップＳ３０１はステップＳ１０１と同様である。

【0050】

ステップＳ３０２において、認識部１２０は、ユーザが音声により入力した音声情報を音声認識して、テキスト情報に変換する。具体的には、対話装置１はユーザがマイク等の入力インタフェース１４を介して入力した音声情報を音声認識する。音声情報は、ユーザの発話を反映した音声信号であり、一定期間における音の振幅や周波数の時間変化に関する波形情報である。テキスト情報への変換には、一般的な音声認識処理に用いられている既存の技術が適用されればよく、例えば、音響モデルや言語モデルによる音声認識であってもよい。本実施形態において、対話装置１は音声認識の信頼度に応じて、複数の変換候補を含むテキスト情報に変換する。

【0051】

ステップＳ３０３において、取得部１１２は、変換されたテキスト情報を取得する。取得されたテキスト情報は、メモリ１２に格納される。

【0052】

ステップＳ３０４において、抽出部１１３は、変換されたテキスト情報から複数の検索キーワードを抽出する。具体的には、対話装置１は、複数の変換候補を含むテキスト情報から各変換候補に対応する検索キーワードをそれぞれ抽出する。抽出された複数の検索キーワードは、メモリ１２に格納される。

【0053】

ステップＳ３０５において、検索部１１４は、複数の検索キーワードを用いて、指定されたデータベースと、指定されていない他のデータベースとを検索する。ステップＳ３０５は、ステップＳ１０４と同様である。

【0054】

ステップＳ３０６において、判定部１１５は、指定されたデータベースにおいて複数の検索キーワードに合致したデータ件数が、０件であるか否かを判定する。０件であると判定された場合（ステップＳ３０６のＹｅｓ）、ステップＳ３０７に進む。０件でない、すなわち１件以上であると判定された場合（ステップＳ３０６のＮｏ）、ステップＳ３１０に進む。

【0055】

ステップＳ３０７において、判定部１１５は、指定されていない他のデータベースにおいて複数の検索キーワードに合致したデータ件数が、０件であるか否かを判定する。０件であると判定された場合（ステップＳ３０７のＹｅｓ）、ステップＳ３０８に進む。０件でない、すなわち１件以上であると判定された場合（ステップＳ３０７のＮｏ）、ステップＳ３０９に進む。

【0056】

ステップＳ３０８において、生成部１１６は、複数の検索キーワードとは異なるキーワードを問い合わせる応答を生成する。本ステップまでに、当該複数の検索キーワードでは指定されたデータベース、及び他のデータベースにおいて更なる検索を行えないことが判明しているため、対話装置１は「reject()」コマンドを生成する。本コマンドは、当該複数の検索キーワードを受け付けられないことを示し、異なるキーワードを問い合わせる応答の一例である。生成された応答は、メモリ１２に格納される。

【0057】

ステップＳ３０９において、生成部１１６は、複数の検索キーワードのうち、他のデータベースでの検索件数の総和が最も大きい検索キーワードを正解キーワードとして、他のデータベースにおける正解キーワードの検索件数を回答する応答を生成する。本ステップまでに、指定されたデータベースでの検索件数が０件であり、他のデータベースでの検索件数が１件以上であることが判明しているため、対話装置１は「offer(contents)」コマンドを生成する。本コマンドは、他のデータベースにおける正解キーワードの検索件数を回答する応答の一例である。生成された応答は、メモリ１２に格納される。

【0058】

ステップＳ３１０において、生成部１１６は、複数の検索キーワードのうち、指定されたデータベースでの検索件数が１件以上である検索キーワードを正解キーワードとして、当該正解キーワードの検索件数を回答する応答を生成する。本ステップまでに、指定されたデータベースでの検索件数が１件以上であることが判明しているため、対話装置１は「offer(contents)」コマンドを生成する。本コマンドは、指定されたデータベースにおける正解キーワードの検索件数を回答する応答の一例である。生成された応答は、メモリ１２に格納される。

【0059】

なお、Ｓ３１０において、正解キーワードに該当する検索キーワードが複数存在する場合、当該複数の検索キーワードのうち、音声認識の信頼度が最も大きい検索キーワードを正解キーワードとしてもよい。あるいは、当該複数の検索キーワードのうち、指定されたデータベースでの検索件数が最も大きい検索キーワードを正解キーワードとしてもよい。もちろん、複数の検索キーワードのうち１つの検索キーワードについて、指定されたデータベースにおいて１件以上の検索件数が得られた場合は、当該検索キーワードを正解キーワードとすればよい。

【0060】

ステップＳ３１１において、出力部１１７は、生成された応答をユーザに出力する。ステップＳ３１１はステップＳ１１２と同様である。

【0061】

以上、第２の実施形態に係る対話装置１の動作の概略を説明した。ここで、具体例としてユーザがデータベースＡを指定し、対話装置１が複数の検索キーワードを用いて、指定されたデータベースＡと、指定されていない他のデータベースとしてデータベースＢ、及びデータベースＣとを検索する場合を考える。

【0062】

例えば、音声認識の結果、音声認識の信頼度が高い順にユーザの発話文として「ＡＢＣを探して」、「ＡＢＥを探して」、「ＡＢＰを探して」の３つの候補が得られたとする。対話装置１は各候補から複数の検索キーワードとして「ＡＢＣ」、「ＡＢＥ」、「ＡＢＰ」を抽出する。続いて、当該複数の検索キーワードを用いて各データベースを検索した結果が以下のようであるとする。

【0063】

select * from database A where code like %ABC% -> 0
select * from database B where code like %ABC% -> 0
select * from database C where code like %ABC% -> 0
select * from database A where code like %ABE% -> 0
select * from database B where code like %ABE% -> 10
select * from database C where code like %ABE% -> 0
select * from database A where code like %ABP% -> 0
select * from database B where code like %ABP% -> 10
select * from database C where code like %ABP% -> 20
例えば、検索結果「select * from database A where code like %ABC% -> 0」は、「データベースＡにおいて型番（code）として「ＡＢＣ」を含むデータ件数が０件である」ことを示す。

【0064】

上記検索結果から、指定されたデータベースＡにおける各検索キーワードの検索件数の総和と、他のデータベースＢ、及びデータベースＣにおける各検索キーワードの検索件数の総和が以下のように求められる。

【0065】

count_A(ABC)=0, count_B+C(ABC)=0
count_A(ABE)=0, count_B+C(ABE)=10
count_A(ABP)=0, count_B+C(ABP)=30
例えば、「count_A(ABC)=0」は、データベースＡにおける「ＡＢＣ」の検索結果が０件であることを示す。「count_B+C(ABC)=0」は、データベースＢおよびデータベースＣにおける「ＡＢＣ」の検索結果が０件であることを示す。

【0066】

上記の検索結果より、指定されたデータベースＡにおいて複数の検索キーワード「ＡＢＣ」、「ＡＢＥ」、「ＡＢＰ」の検索件数が０件であり、他のデータベースＢ、及びデータベースＣにおいて当該複数の検索キーワードの検索件数が１件以上であることが分かる。したがって、ステップＳ３０９に相当する処理が行われる。ここで、複数の検索キーワードのうち、他のデータベースＢ、及びデータベースＣにおける検索件数の総和が最も大きい検索キーワードは「ＡＢＰ」であることから、対話装置１は「ＡＢＰ」を正解キーワードとして決定する。最後に、「ＡＢＰ」の他のデータベースＢ、及びデータベースＣにおける検索件数を回答する以下のような応答が生成され、表示装置１３に出力される。「ＡＢＰで検索しましたが、見つかりませんでした。データベースＢでは１０件、データベースＣでは２０件見つかりました」。

【0067】

以上説明した第２の実施形態によれば、複数の検索キーワードのうち、ユーザが指定したデータベースの検索結果からは正解キーワードを決定できない場合であっても、他のデータベースの検索結果を利用することにより正解キーワードを決定することができる。すなわち、第１の実施形態と同様、柔軟な対話を進めることができる。

【0068】

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、各省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

【符号の説明】

【0069】

１・・・対話装置、２・・・データベース、１１・・・処理回路、１２・・・メモリ、１３・・・表示装置、１４・・・入力インタフェース、１５・・・通信インタフェース、１１１・・・指定部、１１２・・・取得部、１１３・・・抽出部、１１４・・・検索部、１１５・・・判定部、１１６・・・生成部、１１７・・・出力部、１１８・・・計算部、１１９・・・決定部、１２０・・・認識部、１００・・・対話システム、２００・・・データテーブル、３００・・・集計データテーブル

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版