IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧

特許7434125文書検索装置、文書検索方法、及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-09
(45)【発行日】2024-02-20
(54)【発明の名称】文書検索装置、文書検索方法、及びプログラム
(51)【国際特許分類】
   G06F 16/36 20190101AFI20240213BHJP
【FI】
G06F16/36
【請求項の数】 11
(21)【出願番号】P 2020155216
(22)【出願日】2020-09-16
(65)【公開番号】P2022049150
(43)【公開日】2022-03-29
【審査請求日】2022-08-26
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(72)【発明者】
【氏名】藤井 寛子
【審査官】早川 学
(56)【参考文献】
【文献】特開2007-310663(JP,A)
【文献】特開2016-126567(JP,A)
【文献】特開2015-118498(JP,A)
【文献】特開平10-003480(JP,A)
【文献】特開2019-149145(JP,A)
【文献】川村晋太郎,共起情報を利用した不具合事象の同義表現獲得,情報処理学会研究報告 自然言語処理(NL) [online] ,情報処理学会,2019年08月30日,Vol.2019-NL-241,No.2,pp.1-6,[検索日:2019.08.30], Internet<URL:https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=198843&file_id=1&file_no=1>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
イベントに関するイベントテキストを取得する第1の取得部と、
前記イベントテキストから動詞、動作を表す名詞、又は動作を表す名詞を含むフレーズを前記イベントの現象を表す表現である現象表現として取得する第2の取得部と、
前記現象表現と意味的に類似する表現である類義表現を取得する第3の取得部と、
前記現象表現と前記類義表現とを含む複数の表現の中からユーザにより選択された1つの表現と共起する表現である少なくとも1つの共起表現を取得する第4の取得部と、
前記選択された表現と前記少なくとも1つの共起表現の中から前記ユーザにより選択された1つの共起表現とを検索語として用いて検索を行い、複数の文書を含む予め用意された文書情報から前記イベントに関連する文書である関連イベント文書を取得する第5の取得部と、
前記関連イベント文書を出力する出力部と、
を備える文書検索装置。
【請求項2】
前記選択された表現と前記少なくとも1つの共起表現との間の文書内の距離を算出する第1の算出部をさらに備え、
前記出力部は、前記第1の算出部により算出された距離の小さい順に前記少なくとも1つの共起表現を表示する、
請求項1に記載の文書検索装置。
【請求項3】
前記関連イベント文書のそれぞれにおける前記現象表現と前記1つの共起表現との間の距離を算出する第2の算出部をさらに備え、
前記出力部は、前記第2の算出部により算出された距離の値が小さい順に前記関連イベント文書を表示する、
請求項1又は2に記載の文書検索装置。
【請求項4】
前記現象表現と意味的に類似する、ユーザにより入力された表現を取得する第1の入力部と、
前記第2の取得部により取得された現象表現及び前記入力された表現を関連付けて、前記第3の取得部が類義表現を取得するために参照する類義表現情報に登録する第1の登録部と、
をさらに備える請求項1乃至3のいずれか1項に記載の文書検索装置。
【請求項5】
前記関連イベント文書の中からユーザにより選択された文書を取得する第2の入力部と、
前記選択された文書及び前記イベントテキストを互いに関連付けて関連イベント情報に登録する第2の登録部と、
をさらに備える請求項1乃至4のいずれか1項に記載の文書検索装置。
【請求項6】
前記出力部は、前記イベントテキストと前記第5の取得部により取得された関連イベント文書とが前記関連イベント情報において関連付けられている場合に、当該関連イベント文書を上位に表示する、
請求項5に記載の文書検索装置。
【請求項7】
前記現象表現は、動作を表す単語又はフレーズである、請求項1乃至6のいずれか1項に記載の文書検索装置。
【請求項8】
前記少なくとも1つの共起表現は、動作を表す名詞以外の名詞である、請求項1乃至7のいずれか1項に記載の文書検索装置。
【請求項9】
前記イベントはトラブル事象である、請求項1乃至8のいずれか1項に記載の文書検索装置。
【請求項10】
文書検索装置により実行される文書検索方法であって、
イベントに関するイベントテキストを取得することと、
前記イベントテキストから動詞、動作を表す名詞、又は動作を表す名詞を含むフレーズを前記イベントの現象を表す表現である現象表現として取得することと、
前記現象表現と意味的に類似する表現である類義表現を取得することと、
前記現象表現と前記類義表現とを含む複数の表現の中からユーザにより選択された1つの表現と共起する表現である少なくとも1つの共起表現を取得することと、
前記選択された表現と前記少なくとも1つの共起表現の中から前記ユーザにより選択された1つの共起表現とを検索語として用いて検索を行い、複数の文書を含む予め用意された文書情報から前記イベントに関連する文書である関連イベント文書を取得することと、
前記関連イベント文書を出力することと、
を備える文書検索方法。
【請求項11】
コンピュータを、
イベントに関するイベントテキストを取得する手段、
前記イベントテキストから動詞、動作を表す名詞、又は動作を表す名詞を含むフレーズを前記イベントの現象を表す表現である現象表現として取得する手段、
前記現象表現と意味的に類似する表現である類義表現を取得する手段、
前記現象表現と前記類義表現とを含む複数の表現の中からユーザにより選択された1つの表現と共起する表現である少なくとも1つの共起表現を取得する手段、
前記選択された表現と前記少なくとも1つの共起表現の中から前記ユーザにより選択された1つの共起表現とを検索語として用いて検索を行い、複数の文書を含む予め用意された文書情報から前記イベントに関連する文書である関連イベント文書を取得する手段、及び
前記関連イベント文書を出力する手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、文書検索技術に関する。
【背景技術】
【0002】
火力発電所、水力発電所、原子力発電所、ビル空調管理システム、上下水道管理システムなどの製品設計では、設計者が既存製品で生じた過去のトラブルを把握し、同じトラブルを繰り返さないようにすることが重要である。特に上記のような製品の場合、耐用年数が長いため、一人の設計者が関わる製品設計の数は限られている。したがって、過去のトラブルやその対策は、ベテラン設計者の知見に頼るところが大きく、若手設計者への指導という形で継承できなければ、必要な知見が失われてしまうリスクがある。このため、近年では、過去に生じたトラブルの現象、原因、及び対策(以下、不適合事例と呼ぶ)をデータベース化しておき、新規な製品の設計を行う際に、新規な製品に類似する既存製品に生じた不適合事例を参照する仕組みが導入されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2013-182289号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明が解決しようとする課題は、不適合事例に関する知見などの蓄積された情報を有効に活用することができる技術を提供することである。
【課題を解決するための手段】
【0005】
一実施形態に係る文書検索装置は、イベントに関するイベントテキストを取得する第1の取得部と、前記イベントテキストから前記イベントの現象を表す表現である現象表現を取得する第2の取得部と、前記現象表現と意味的に類似する表現である類義表現を取得する第3の取得部と、前記現象表現と前記類義表現とを含む複数の表現の中から選択された表現と共起する表現である少なくとも1つの共起表現を取得する第4の取得部と、前記選択された表現と前記少なくとも1つの共起表現のうちの1つとを検索語として用いて検索を行い、複数の文書を含む予め用意された文書情報から前記イベントに関連する文書である関連イベント文書を取得する第5の取得部と、前記関連イベント文書を出力する出力部と、を備える。
【図面の簡単な説明】
【0006】
図1図1は、第1の実施形態に係る文書検索システムを示す図である。
図2図2は、図1に示した不適合事例文書格納部に格納される不適合事例文書情報を示す図である。
図3図3は、図2に示した不適合事例文書を示す図である。
図4図4は、図1に示した類義表現格納部に格納される類義表現情報の一例を示す図である。
図5図5は、図1に示した共起表現格納部に格納される共起表現情報の一例を示す図である。
図6図6は、図1に示したイベント格納部に格納される情報の一例を示す図である。
図7図7は、図1の文書検索サーバにより実行される処理の手順を示すフローチャートである。
図8図8は、図1の文書検索サーバの動作を説明する図である。
図9図9は、図1の文書検索サーバの動作を説明する図である。
図10図10は、図1の文書検索サーバの動作を説明する図である。
図11図11は、図1の文書検索サーバの動作を説明する図である。
図12図12は、図1の文書検索サーバの動作を説明する図である。
図13図13は、図1の文書検索サーバの動作を説明する図である。
図14図14は、第2の実施形態に係る文書検索システムを示す図である。
図15図15は、第3の実施形態に係る文書検索システムを示す図である。
図16図16は、第4の実施形態に係る文書検索システムを示す図である。
図17図17は、第4の実施形態に係る検索画面の一例を示す図である。
図18図18は、図17に示した類義表現格納部に格納されるユーザ登録類義表現情報の一例を示す図である。
図19図19は、第5の実施形態に係る文書検索システムを示す図である。
図20図20は、第5の実施形態に係る検索画面の一例を示す図である。
図21図21は、図19に示した関連イベント格納部に格納される関連イベント情報の一例を示す図である。
図22図22は、第6の実施形態に係る文書検索システムを示す図である。
図23図23は、各実施形態に係る文書検索サーバを実現するコンピュータのハードウェア構成例を示す図である。
【発明を実施するための形態】
【0007】
以下、図面を参照しながら実施形態を説明する。重複する説明を避けるために、全図を通して同様の部分には同様の符号を付している。
【0008】
(第1の実施形態)
図1は、第1の実施形態に係る文書検索システム100を概略的に示している。図1に示すように、文書検索システム100は、文書検索サーバ110及びユーザ端末150を備える。文書検索サーバ110はインターネットなどのネットワーク160を介してユーザ端末150と通信する。文書検索サーバ110の後述する文書検索機能は、Webアプリケーションとしてユーザに提供される。ユーザは、ユーザ端末150に搭載されたWebブラウザを用いて文書検索機能を利用する。ユーザ端末150は、例えばデスクトップパソコン又はスマートフォンのような、入力装置とディスプレイ装置とを備えるコンピュータであり得る。
【0009】
文書検索サーバ110は、ユーザが製品を設計、製造又は運用する際に、他の製品で過去に発生した不適合事例を記載した文書を検索するためのものである。製品は、火力発電所、水力発電所、原子力発電所、ビル空調管理システム、又は上下水道管理システムであってよいが、これらに限定されない。不適合事例は、トラブルなどの望ましくない事象に関する、現象、原因、対策などを含む。文書検索サーバ110は、テキスト取得部112、表現取得部114、選択部124、関連文書取得部126、表示部(出力部ともいう)128、不適合事例文書格納部130、類義表現格納部132、共起表現格納部134、及びイベント格納部136を備える。
【0010】
テキスト取得部112は、検索元となるイベントテキストを取得する。イベントテキストは、トラブル事象などのイベントに関するテキストである。具体的には、イベントテキストは、不適合事例文書の中でトラブル事象を表す記述部分に相当する。イベントテキストはイベントの対象及び現象を表す表現を含み得る。例えば、イベントテキストは、製品が不適合となった原因又は結果(例えば製品にトラブルが発生した原因又は結果)を記載したテキストであってよい。イベントテキストは「何(イベントの対象)がどうした(イベントの現象)」の形式で記載され得る。
【0011】
表現取得部114は、テキスト取得部112により取得されたイベントテキストに基づいて、イベントに関連する文書の検索に用いる表現を取得する。表現取得部114は、現象表現取得部116、類義表現取得部118、選択部120、及び共起表現取得部122を備える。
【0012】
現象表現取得部116は、テキスト取得部112により取得されたイベントテキストから現象表現を取得する。例えば、現象表現取得部116は、イベントテキストに対して形態素解析を含む自然言語処理を行うことにより現象表現を取得する。現象表現はイベントの現象を表す表現である。現象表現は動作を表す単語又はフレーズであってよい。例えば、現象表現は、動詞、動作を表す名詞、又は動作を表す名詞を含むフレーズであってよいが、これらに限定されない。
【0013】
類義表現取得部118は、現象表現取得部116により取得された現象表現と意味的に類似する表現である類義表現を取得する。例えば、類義表現取得部118は、現象表現を用いて類義表現格納部132に格納されている類義表現情報を参照することにより類義表現を取得する。類義表現情報については後述する。類義表現は動作を表す単語又はフレーズであってよい。例えば、類義表現は、動詞、動作を表す名詞、又は動作を表す名詞を含むフレーズであってよいが、これらに限定されない。
【0014】
選択部120は、現象表現取得部116により取得された現象表現と類義表現取得部118により取得された類義表現とを含む複数の表現の中から1つの表現を選択する。選択部120は、ユーザからの入力に基づいて選択を行ってよい。
【0015】
共起表現取得部122は、選択部120により選択された表現と共起する表現である共起表現を取得する。例えば、共起表現取得部122は、選択された表現を用いて共起表現格納部134に格納されている共起表現情報を参照することにより共起表現を取得する。共起表現情報については後述する。ある表現(例えば単語)と共起する表現とは、ある表現とともに使用される(例えば同一文内に出現する)確率の高い単語を指す。共起表現は、イベントの対象となり得る表現である。共起表現は、動作を表す名詞以外の名詞であってよいが、これに限定されない。本実施形態では、共起表現は、製品、部品、材料などを示す名詞である。
【0016】
選択部124は、共起表現取得部122により取得された少なくとも1つの共起表現のうちの1つを選択する。具体的には、選択部124は、1つの共起表現が共起表現取得部122により取得された場合には、その共起表現を選択し、複数の共起表現が共起表現取得部122により取得された場合には、それらの共起表現の中から1つの共起表現を選択する。選択部124は、ユーザからの入力に基づいて選択を行ってよい。
【0017】
関連文書取得部126は、選択部120により選択された表現と選択部124により選択された共起表現とを検索語として用いてイベント格納部136を参照して文書検索を行い、イベントに関連する文書である関連イベント文書を取得する。例えば、関連文書取得部126は、検索語を用いてイベント格納部136に格納されているイベント情報に対して検索を行い、検索語にマッチする文書を関連イベント文書として取得する。イベント情報については後述する。イベント格納部136が関連文書取得部126により参照されるデータベースを形成する。
【0018】
表示部128は、ユーザが操作するためのインタフェース画面に情報を表示する。例えば、表示部128は、テキスト取得部112により取得されたイベントテキスト、現象表現取得部116により取得された現象表現、類義表現取得部118により取得された類義表現、共起表現取得部122により取得された共起表現、及び関連文書取得部126により取得された文書をインタフェース画面に表示する。インタフェース画面は、ユーザ端末150のディスプレイ装置に表示される。
【0019】
図2は、不適合事例文書格納部130に格納されている文書情報の一例を示している。図2に示す文書情報200は、識別番号202、製品名204、及び不適合事例文書206を互いに関連付けて含む。識別番号202は文書情報200のエントリを識別する識別情報である。例えば、識別番号が1011である不適合事例文書は、製品Aに関する不適合事例を記載した文書である。不適合事例文書格納部130への文書の登録は別のシステム(図示せず)により実施される。
【0020】
図3は、不適合事例文書の一例を示している。図3に示す不適合事例文書300は、図2に示される識別番号が1011である不適合事例文書である。不適合事例文書300は、5つの項目、具体的には、題名302、現象304、原因306、対策308、製品名310についての記載を含む。
【0021】
図4は、類義表現格納部132に格納されている類義表現情報の一例である類義表現辞書400を示している。図4に示すように、類義表現辞書400は、識別番号402、現象表現404、及び類義表現406を互いに関連付けて含む。識別番号402は類義表現辞書400のエントリを識別する識別情報である。類義表現406は、現象表現404と意味的に類似する表現を示す。図4の例では、各現象表現に1つの類義表現が関連付けられているが、類義表現406は2以上の類義表現を含んでよい。例えば現象表現取得部116が表現「揺れ」を現象表現として取得した場合、類義表現取得部118は表現「振動」を類義表現として取得する。
【0022】
類義表現辞書400は、現象表現と類義表現との間の類似度を含んでよい。類似度は表現同士が類似している度合いを指す。表示部128は、類似度に従って類義表現を表示してよい。例えば、表示部128は、類似度の大きい順に上から下へ類義表現を後述する表示領域906(図9)に表示する。
【0023】
現象表現は、例えば、不適合事例文書に含まれるテキストを形態素解析し、動詞、動作を表す名詞、又は動作を表す名詞を含むフレーズを抽出することにより得られる。現象表現と意味的に類似する表現は、Zhao et al., “Ngram2vec: Learning Improved Word Representations from Ngram Co-occurrence Statistics”, Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing, pp.244-253, 2017などの公知の手法により得られる。当該文献は、単語埋め込みをn-gram(連続するn個の単語;以下、フレーズともいう)に拡張した手法を教示する。なお、単語埋め込みとは、対象語の前後に配置される単語の並びをその単語の文脈とみなし、意味的に類似した単語がベクトル空間上で近くに配置されるよう、ニューラルネットワークを用いて単語のベクトル表現(埋め込みベクトル)を学習する手法である。上記文献に教示される手法によりフレーズのベクトル表現を学習し、ベクトル間の類似度を使ってフレーズ間の類似度を推定する。例えば、コサイン類似度の値が予め決められた閾値を超える場合にフレーズ同士が類似していると判定する。上述のようにして得られた現象表現と類義表現との組を人手で精査し、判定誤りと判断された組を除外したものを類義表現格納部132に格納するようにしてよい。
【0024】
図5は、共起表現格納部134に格納されている共起表現情報の一例である共起表現辞書500を示している。図5に示すように、共起表現辞書500は、識別番号502、現象表現504、及び共起表現506を互いに関連付けて含む。共起表現506は1以上の共起表現を含む。例えば選択部120が表現「溶断」を選択した場合、共起表現取得部122は表現「ヒューズ」、「シール」などを共起表現として取得する。
【0025】
図6は、イベント格納部136に格納されるイベント情報の一例を示している。イベント情報は、不適合事例文書格納部130に格納されている文書情報に含まれる不適合事例文書から抽出されたイベントに関する情報である。不適合事例文書からのイベントの抽出は、例えば、不適合事例文書中の各文に対し係り受け解析を含む自然言語処理を行い、主部と述部を含む「(主部)が(述部)」という形式の部分を抽出することにより行われる。述部をトラブル現象を表す動詞に限定してもよい。
【0026】
図6に示すイベント情報600は、識別番号602、識別番号604、識別番号606、製品名608、イベント内容610を互いに関連付けて含む。識別番号602は、イベント情報600のエントリを識別する識別情報である。識別番号604は、抽出元の不適合事例文書に関連付けられた識別番号(図2に示した識別番号202に対応する)である。識別番号606は、各イベントを識別する識別情報である。本実施形態では、識別番号606は、イベント内容610に示されるイベントテキストが抽出元の不適合事例文書において登場する順番を示す。製品名608は抽出元の不適合事例文書に関連付けられた製品名(図2に示した製品名204に対応する)である。イベント内容610はイベントテキストである。イベント内容610はイベントテキストを含む文であってもよい。
【0027】
例えば、識別番号602が1~4であるエントリは、識別番号604が1011である不適合事例文書(図3に示す不適合事例文書300)から抽出された情報である。イベントテキスト「回転機器架台の揺れ」は識別番号604が1011である不適合事例文書において1番目に登場するイベントテキストであり、識別番号606が1となっている。
【0028】
例えば、関連文書取得部126は、検索語「架台」、「揺れ」でイベント格納部136に格納されるイベント情報600に対する検索を行い、「架台」及び「揺れ」がイベント内容610に含まれるエントリ(識別番号602が3であるエントリ)を得る。
【0029】
図7は、文書検索サーバ110により実行される処理の手順例を概略的に示している。
【0030】
図7のステップS701において、テキスト取得部112は、イベントに関する記載を含むイベントテキストを取得する。例えば、テキスト取得部112は、インタフェース画面においてユーザにより選択されたテキスト「溶接面が破断し」をイベントテキストとして取得する。
【0031】
ステップS702において、現象表現取得部116は、テキスト取得部112により取得されたイベントテキストから現象表現を取得する。例えば、現象表現取得部116は、イベントテキスト「溶接面が破断し」から、動詞である「破断し」を現象表現として取得する。
【0032】
ステップS703において、類義表現取得部118は、現象表現取得部116により取得された現象表現と意味的に類似する類義表現を取得する。例えば、類義表現取得部118は、類義表現格納部132に格納されている類義表現辞書400において現象表現「破断し」に関連付けられている類義表現を取得する。例えば、類義表現取得部118は、「溶断し」、「変形し」などの表現を類義表現として取得する。
【0033】
ステップS704において、選択部120は、現象表現取得部116により取得された現象表現と類義表現取得部118により取得された類義表現とを含む複数の表現の中から1つの表現を選択する。例えば、選択部120はユーザの入力に基づいて複数の表現の中から1つの表現を選択する。例えば、ユーザがインタフェース画面において表現「溶断し」を選択すると、選択部120は表現「溶断し」を選択する。
【0034】
ステップS705において、共起表現取得部122は、選択部120により選択された表現と共起する表現である共起表現を取得する。具体的には、共起表現取得部122は、共起表現格納部134に格納されている共起表現辞書500において表現「溶断し」に関連付けられている共起表現を取得する。例えば、共起表現取得部122は、「ヒューズ」、「シール」、「AC/DC」などの表現を共起表現として取得する。
【0035】
ステップS706において、選択部124は、共起表現取得部122により取得された共起表現の中から1つの共起表現を選択する。例えば、選択部124はユーザの入力に基づいて共起表現の中から1つの共起表現を選択する。例えば、ユーザがインタフェース画面において共起表現「ヒューズ」を選択すると、選択部124は共起表現「ヒューズ」を選択する。
【0036】
ステップS707において、関連文書取得部126は、選択部120により選択された表現と選択部124により選択された共起表現とを検索語として用いて文書検索を行い、検索結果として少なくとも1つの関連イベント文書を取得する。例えば、関連文書取得部126は、イベント格納部136を参照し、選択部120により選択された表現「溶断し」と選択部124により選択された表現「ヒューズ」との組み合わせを含むイベントテキストを関連イベント文書として取得する。
【0037】
ステップS708において、表示部128は、関連文書取得部126により取得された関連イベント文書を出力する。例えば、表示部128は、関連イベント文書をユーザ端末150上で表示するために、関連イベント文書をユーザ端末150に送信する。
【0038】
図8から図13を参照して、文書検索サーバ110の動作を具体例に沿って説明する。
【0039】
図8は、文書検索機能における初期インタフェース画面の一例を概略的に示している。図8に示す画面800は、表示領域802、検索クエリ入力欄804、検索ボタン806、及び表示領域808を備える。
【0040】
表示領域802は、不適合事例文書格納部130に新規に登録された不適合事例文書の題名を一覧で表示する。例えば、不適合事例文書格納部130に一定期間内(例えば1週間以内)に登録された不適合事例文書の題名が表示領域802に表示される。表示領域802に表示された題名がユーザにより選択される(例えばクリックされる)と、表示内容が関連イベント文書を検索するための画面に切り替わる。
【0041】
検索クエリ入力欄804は、不適合事例文書の検索に用いる検索語を入力するための欄である。検索ボタン806は、不適合事例文書の検索を実行することを指示するためのボタンである。表示領域808は、検索クエリ入力欄804に入力された検索語を用いた検索の結果を表示する。検索クエリ入力欄804に検索語が入力された状態で検索ボタン806がクリックされると、不適合事例文書格納部130に対する検索が実行され、検索結果が表示領域808に表示される。表示領域808に表示された題名がクリックされると、表示内容が関連イベント文書を検索するための画面に切り替わる。
【0042】
図9は、関連イベント文書を検索するための画面の一例を示している。図9に示す検索画面900は、表示領域902、904、906、908、910を含む。
【0043】
表示領域902は、不適合事例文書を表示する。表示領域902は、ユーザが表示領域902に表示されたイベントテキストのうちの1つを選択できるように構成されている。表示領域902から選択されたイベントテキストがテキスト取得部112により取得されたイベントテキストに相当する。表示領域904は、テキスト取得部112により取得されたイベントテキストを表示する。表示領域906は、現象表現取得部116により取得された現象表現及び類義表現取得部118により取得された類義表現を表示する。表示領域906は、ユーザが表現のうちの1つを選択できるように構成されている。表示領域908は、共起表現取得部122により取得された共起表現を表示する。表示領域908は、ユーザが表現のうちの1つを選択できるように構成されている。表示領域910は、関連文書取得部126により取得された関連イベント文書を表示する。表示領域910は、関連イベント文書を表示する部分912と、関連イベント文書の抽出元である不適合事例文書の内容を表示するためのアイコン914と、を含む。
【0044】
表示領域902及び表示領域910の部分912は、製品別に色分けされる。或いは、表示領域902及び表示領域910の部分912に製品名が記載されてもよい。このようにすることで、ユーザは、検索された関連イベント文書がどの製品に関連するものであるかを認識でき、ユーザが担当する製品との関連性を把握しやすくなる。
【0045】
検索画面900は図8の表示領域802に表示された題名「△△からの空気漏洩」がクリックされた後の画面であり、題名「△△からの空気漏洩」に対応する不適合事例文書が表示領域902に表示されている。ユーザによる選択の前にはイベントテキストのうちの任意の1つが自動的に選択される。この例では、表示領域902には「溶接面が破断し」及び「空気が漏れた」という2つのイベントテキストが含まれており、最後に位置するイベントテキスト「空気が漏れた」が選択される。これにより、イベントテキスト「空気が漏れた」が表示領域904に表示される。
【0046】
現象表現取得部116はイベントテキストから動詞である「漏れた」を現象表現として抽出する。表示領域904において現象表現「漏れた」が太字で示されている。類義表現取得部118は、類義表現格納部132に格納される類義表現辞書400から表現「溢れた」、「溜まった」、「こぼれた」、「流れた」、「リークした」を類義表現として取得する。これにより、表現「漏れた」、「溢れた」、「溜まった」、「こぼれた」、「流れた」、「リークした」が表示領域906に表示される。表示領域906において、現象表現である「漏れた」が一番上に表示されている。
【0047】
ユーザによる選択の前には、選択部120は、表示領域906に表示された表現のうちの任意の1つを自動的に選択する。この例では、選択部120は現象表現「漏れた」を選択する。共起表現取得部122は、共起表現格納部134に格納される共起表現情報から表現「水」、「油」、「ガス」を共起表現として取得する。これにより、表現「水」、「油」、「ガス」が表示領域908に表示される。
【0048】
ユーザによる選択の前には、選択部124は、表示領域908に表示された表現のうちの任意の1つを自動的に選択する。この例では、選択部124は表現「水」を選択する。関連文書取得部126は、表現「漏れた」及び表現「水」を検索語として用いてイベント格納部136に対して検索を行う。検索により得られた不適合事例文書が表示領域910に表示される。
【0049】
検索画面900においてイベントテキスト「溶接面が破断し」がクリックされると、表示内容が図10に示すように更新される。図10に示す検索画面1000では、イベントテキスト「溶接面が破断し」が表示領域904に表示される。現象表現取得部116が表現「破断し」を現象表現として取得し、類義表現取得部118が表現「溶断し」、「変形し」、「析出し」、「摩耗し」、「断線し」を類義表現として取得する。これにより、表示領域906には、表現「破断し」、「溶断し」、「変形し」、「析出し」、「摩耗し」、「断線し」が表示される。ユーザによる選択の前には、選択部120は現象表現である表現「破断し」を選択する。共起表現取得部122は、表現「配管」、「ネジ」を共起表現として取得する。ユーザによる選択の前には、選択部124は表現「配管」を選択し、関連文書取得部126は表現「配管」、「破断し」を検索語として用いて文書検索を行い、検索結果が表示領域910に表示される。
【0050】
検索画面1000において類義表現「溶断し」がユーザによりクリックされると、表示内容が図11に示すように更新される。図11に示す検索画面1100では、「溶断し」の共起表現として表現「ヒューズ」、「シール」、「AC/DC」、「回路」が表示領域908に表示される。ユーザによる選択の前には、選択部120は表現「ヒューズ」を選択する。関連文書取得部126は表現「ヒューズ」、「溶断し」を検索語として用いて文書検索を行い、検索結果が表示領域910に表示される。アイコン914がマウスオーバされると、図12に示す検索画面1200のように関連イベント文書に対応する不適合事例文書の内容1202が表示される。関連イベント文書に対応する不適合事例文書は、関連文書取得部126によって不適合事例文書格納部130から取得される。これにより、不適合が生じた原因及びその対策を閲覧することが可能となる。
【0051】
検索画面1100において表現「断線し」がユーザによりクリックされると、共起表現取得部122は、表現「断線し」の共起表現として表現「○○」、「ケーブル」、「端子」を取得し、表示部128は、表現「○○」、「ケーブル」、「端子」を表示領域908に表示する。表示領域908に表示された表現「ケーブル」がユーザによりクリックされると、表示内容が図13に示すように更新される。図13に示す検索画面1300では、関連文書取得部126が表現「ケーブル」、「断線し」を検索語として用いて文書検索を行った結果が表示領域910に表示される。
【0052】
以上のように、文書検索サーバ110は、イベントに関するイベントテキストを取得し、イベントテキストからイベントの現象を表す現象表現を取得し、現象表現と意味的に類似する類義表現を取得し、現象表現と類義表現とを含む複数の表現の中から選択された表現と共起する少なくとも1つの共起表現を取得し、選択された表現と少なくとも1つの共起表現のうちの1つとを検索語として用いて検索を行って予め用意された複数の不適合事例文書から関連イベント文書を取得し、関連イベント文書を表示する。これにより、ユーザが担当する製品と類似する製品に関する不適合事例やユーザが担当する製品と関連すると思われる不適合事例を記載した文書を容易に得ることが可能になる。文書中の表現が異なるために通常の検索(例えばユーザがキーワード又はテキストを入力することで行う検索)では得られない文書が得られる。ユーザは、検索により得られた文書を参照することで、自身が担当する製品において生じ得るトラブル及びその対策を把握できる。ユーザが担当する製品に生じ得るトラブルを回避することが可能となる。このように、第1の実施形態によれば、蓄積された知見を有効に活用することができる。
【0053】
(第2の実施形態)
図14は、第2の実施形態に係る文書検索システム1400を概略的に示している。図14に示すように、文書検索システム1400は、文書検索サーバ1410及びユーザ端末150を備える。文書検索サーバ1410は、テキスト取得部112、表現取得部1412、選択部124、関連文書取得部126、表示部128、不適合事例文書格納部130、類義表現格納部132、共起表現格納部134、及びイベント格納部136を備える。表現取得部1412は、現象表現取得部116、類義表現取得部118、選択部120、共起表現取得部122、及び算出部1414を備える。すなわち、表現取得部1412は、図1に示した表現取得部114に算出部1414を追加したものである。
【0054】
算出部1414は、共起表現取得部122により取得された共起表現のそれぞれについて表示に関する優先度を算出する。例えば、算出部1414は、選択部120により選択された表現と共起表現のそれぞれとの共起度を算出し、より大きい共起度を有する共起表現により高い優先度を付与する。共起度とは、ある表現(単語)と別の表現(単語)がどのくらい同一文又は文書中に同時に出願しやすいかを示す指標である。また、算出部1414は、選択された表現及び共起表現の両方を含むイベント文書をイベント格納部136から検索し、イベント文書それぞれにおける選択された表現と共起表現との距離(例えば選択された表現と共起表現との間にある文字数)を求め、これら距離の平均値を算出し、距離の平均値が小さいほど優先度が高くなるように、算出した距離の平均値から優先度を算出する処理を共起表現ごとに行う。
【0055】
表示部128は、優先度の高い順に共起表現を表示領域に表示する。例えば、表示部128は、優先度の高い順に左から右へ表示領域908(図9)に共起表現を表示する。ユーザによる選択の前には、選択部124は優先度の最も高い共起表現を選択する。
【0056】
第2の実施形態では、算出部1414は、選択部120により選択された表現と共起表現取得部122により取得された共起表現との間の共起度又は距離を算出し、表示部128は、算出部1414により算出された共起度又は距離に基づいた順番で共起表現を表示する。ユーザによる選択の前には共起表現取得部122により取得された共起表現のうちの距離が最も小さい共起表現が選択され、選択された共起表現を用いて文書検索が実行される。距離が小さい共起表現はユーザが担当する製品との関連がある可能性が高い。よって、ユーザが共起表現を選択する手間を軽減できる可能性がある。
【0057】
(第3の実施形態)
図15は、第3の実施形態に係る文書検索システム1500を概略的に示している。図15に示すように、文書検索システム1500は、文書検索サーバ1510及びユーザ端末150を備える。文書検索サーバ1510は、テキスト取得部112、表現取得部1412、選択部124、関連文書取得部126、表示部128、不適合事例文書格納部130、類義表現格納部132、共起表現格納部134、及びイベント格納部136を備える。関連文書取得部126は算出部1512を備える。
【0058】
算出部1512は、関連文書取得部126により取得された関連イベント文書のそれぞれについて表示に関する優先度を算出する。例えば、算出部1512は、関連イベント文書における検索に用いた2つの表現間の距離(例えば表現間にある文字数)を算出し、距離が小さいほど優先度が高くなるように、求めた距離から優先度を算出する処理を関連イベント文書ごとに行う。
【0059】
図9の例では、検索は表現「水」、「漏れた」を用いて実行され、2つの関連イベント文書が表示領域910に表示されている。表示領域910の一番上にある関連イベント文書では、表現「水」と表現「漏れた」との間に「が」が存在する。よって、表現間の距離は1である。表示領域910の上から二番目にある関連イベント文書についても、表現間の距離は1である。このため、2つの関連イベント文書は同じ優先度となる。
【0060】
表示部128は、優先度の高い順に関連イベント文書を表示領域に表示する。例えば、表示部128は、優先度の高い順に上から下へ表示領域910(図9)に関連イベント文書を表示する。
【0061】
第3の実施形態では、算出部1512は、関連文書取得部126により取得された関連イベント文書のそれぞれについて検索に用いた2つの表現間の距離を算出し、表示部128は、距離に基づく順番で関連イベント文書を表示する。表示部128は、距離がより小さい関連イベント文書をより上位に表示する。距離が小さい関連イベント文書はユーザが担当する製品との関連がある可能性が高い。よって、ユーザが担当する製品との関連性が高い関連イベント文書がユーザの目に付きやすい位置に表示される。
【0062】
(第4の実施形態)
図16は、第4の実施形態に係る文書検索システム1600を概略的に示している。図16に示すように、文書検索システム1600は、文書検索サーバ1610及びユーザ端末150を備える。文書検索サーバ1610は、テキスト取得部112、表現取得部1412、選択部124、関連文書取得部126、表示部128、不適合事例文書格納部130、類義表現格納部132、共起表現格納部134、イベント格納部136、入力部1612、及び登録部1614を備える。すなわち、文書検索サーバ1610は、図15に示した文書検索サーバ1510に入力部1612及び登録部1614を追加したものである。
【0063】
類義表現格納部132は、第1の実施形態で説明した類義表現情報に加えて、ユーザ登録類義表現情報を格納する。類義表現取得部118は、類義表現を取得するために、類義表現情報(例えば図4に示される類義表現辞書400)及びユーザ登録類義表現情報(例えば図18に示されるユーザ登録類義表現辞書1800)の両方を参照する。
【0064】
入力部1612は、ユーザにより入力された、現象表現取得部116により取得された現象表現と意味的に類似する表現を取得する。登録部1614は、現象表現取得部116により取得された現象表現とユーザにより入力された表現とを互いに関連付けて類義表現格納部132に登録する。具体的には、登録部1614は、現象表現取得部116により取得された現象表現とユーザにより入力された表現とを互いに関連付けた情報をユーザ登録類義表現情報に追加する。
【0065】
図17は、第4の実施形態に係る検索画面の一例を示している。図17に示す検索画面1700は、表示領域902、904、906、908、910、類義表現入力欄1702、及び登録ボタン1704を含む。類義表現入力欄1702は、表示領域904に表示される現象表現(この例では「破断し」)と意味的に類似する表現を入力するための欄である。登録ボタン1704は、類義表現の登録を実行することを指示するためのボタンである。類義表現入力欄1702に表現(この例では「折損し」)が入力された状態で登録ボタン1704がクリックされると、類義表現の登録が実行される。類義表現が登録されると、登録された類義表現が表示領域906に追加される。
【0066】
図18は、類義表現格納部132に格納されているユーザ登録類義表現情報の一例であるユーザ登録類義表現辞書1800を示している。図18に示すように、ユーザ登録類義表現辞書1800は、識別番号1802、現象表現1804、及び類義表現1806を互いに関連付けて含む。識別番号1802はユーザ登録類義表現辞書1800のエントリを識別する識別情報である。類義表現1806は、1以上の類義表現を含む。表現「漏洩」と意味的に類似する表現として「滲出」、「流出」などが登録されている。
【0067】
第4の実施形態では、ユーザが現象表現取得部116により取得された現象表現と意味的に類似する表現を類義表現格納部132に登録することが可能となる。これにより、文書検索の網羅性が向上する。
【0068】
(第5の実施形態)
図19は、第5の実施形態に係る文書検索システム1900を概略的に示している。図19に示すように、文書検索システム1900は、文書検索サーバ1910及びユーザ端末150を備える。文書検索サーバ1910は、テキスト取得部112、表現取得部1412、選択部124、関連文書取得部126、表示部128、不適合事例文書格納部130、類義表現格納部132、共起表現格納部134、イベント格納部136、入力部1612、登録部1614、入力部1912、登録部1914、及び関連イベント格納部1916を備える。すなわち、文書検索サーバ1910は、図16に示した文書検索サーバ1610に入力部1912、登録部1914、及び関連イベント格納部1916を追加したものである。
【0069】
入力部1912は、関連文書取得部126により取得された関連イベント文書の中からユーザにより選択された、テキスト取得部112により取得されたイベントテキストとの関連がある関連イベント文書を取得する。登録部1914は、入力部1912により取得された関連イベント文書とテキスト取得部112により取得されたイベントテキストとを互いに関連付けて関連イベント格納部1916に登録する。
【0070】
図20は、第5の実施形態に係る検索画面の一例を示している。図20に示す検索画面2000は、表示領域902、904、906、908、910、類義表現入力欄1702、登録ボタン1704、登録ボタン2002、表示領域2004、及び削除ボタン2006を含む。
【0071】
登録ボタン2002は、関連イベント文書を登録することを指示するためのボタンである。表示領域904に表示されたイベントテキストとトラブル構造が似ているとユーザが判断した関連イベント文書が表示領域910にある場合、ユーザはその関連イベント文書の横にある登録ボタン2002をクリックする。入力部1912は、ユーザにより選択された関連イベント文書とイベントテキストとを入力として受け取る。登録部1914は、関連イベント文書及びイベントテキストを互いに関連付けた情報を関連イベント格納部1916に格納される関連イベント情報に追加する。表示部128は、検索画面を更新し、新たに登録された関連イベント文書を表示領域2004に表示する。
【0072】
削除ボタン2006は、関連イベント文書を削除するためのボタンである。ユーザが関連イベント文書の横にある削除ボタン2006をクリックすると、その関連イベント文書が関連イベント格納部1916から削除される。
【0073】
図21は、関連イベント格納部1916に格納される関連イベント情報の一例を示している。図21に示す関連イベント情報2100は、識別番号2102、2104、2106、2110、2112、及びイベントテキスト2108、2114を含む。識別番号2102は、関連イベント情報のエントリを識別する識別情報である。識別番号2104は、イベントテキスト2108が含まれる不適合事例文書に関連付けられた識別番号を示す。識別番号2104は、図2に示した識別番号202及び図6に示した識別番号640に相当する。識別番号2106は、各イベントを識別する識別情報である。本実施形態では、識別番号2106は、イベントテキスト2108が不適合事例文書において登場する順番を示す。イベントテキスト2108は、入力部1912により取得されたイベントテキストを示す。識別番号2110は、イベントテキスト2114を含む不適合事例文書に割り当てられた識別番号を示す。識別番号2110は、図2に示した識別番号202及び図6に示した識別番号640に相当する。識別番号2112は、各イベントを識別する識別情報である。本実施形態では、識別番号2112は、イベントテキスト2114が不適合事例文書において登場する順番を示す。イベントテキスト2114は、入力部1912により取得された関連イベント文書から抽出されたイベントテキストを示す。
【0074】
第5の実施形態では、関連文書取得部126は、イベント格納部136及び関連イベント格納部1916に対して検索を行う。不適合事例文書格納部130、イベント格納部136、及び関連イベント格納部1916が関連文書取得部126により参照されるデータベースを形成する。関連文書取得部126は、テキスト取得部112により取得されたイベントテキストを用いて関連イベント格納部1916に格納される関連イベント情報を参照し、イベントテキストに関連付けられている関連イベント文書を取得する。例えば、イベントテキスト「溶接面が破断し」がテキスト取得部112により取得された場合、関連文書取得部126は、図21に示す関連イベント情報2100を参照し、識別番号2110が2939である不適合事例文書及び識別番号2110が4001である不適合事例文書を取得する。表示部128は、これらの不適合事例文書を、例えば図20に示す表示領域2004に、表示する。このように、イベントテキストと関連するとユーザが判断した文書を画面に明示することにより、ユーザがイベントテキストと関連のあるトラブルを把握しやすくなる。また、他のユーザが登録した関連イベント文書を表示領域2004に表示してもよい。これにより、ユーザが他の製品とユーザが担当する製品のトラブルの関連や注意点に気づきやすくなる。
【0075】
(第6の実施形態)
図22は、第6の実施形態に係る文書検索システム2200を概略的に示している。図22に示すように、文書検索システム2200は、文書検索サーバ2210及びユーザ端末150を備える。文書検索サーバ2210は、テキスト取得部112、表現取得部1412、選択部124、関連文書取得部126、表示部128、不適合事例文書格納部130、類義表現格納部132、共起表現格納部134、イベント格納部136、入力部1612、登録部1614、入力部1912、登録部1914、及び関連イベント格納部1916を備える。関連文書取得部126は、算出部1512及び順位判定部2212を備える。
【0076】
順位判定部2212は、関連イベント格納部1916に格納される関連イベント情報に基づいて、関連文書取得部126がイベント格納部136を参照することにより取得した関連イベント文書の順位を決定する。関連イベント格納部1916に格納されている関連イベント文書はユーザがイベントテキストに関連すると明示的に示したものである。テキスト取得部112により取得されたイベントテキストと関連文書取得部126がイベント格納部136を参照することにより取得した関連イベント文書とが関連イベント情報において関連付けられている場合には、順位判定部2212は、その関連イベント文書が上位に表示されるように順位を決定する。表示部128は、順位判定部2212により決定された順位に従って関連イベント文書を表示する。
【0077】
第6の実施形態では、テキスト取得部112により取得されたイベントテキストと関連文書取得部126がイベント格納部136を参照することにより取得された関連イベント文書とが関連イベント情報において関連付けられている場合には、その関連イベント文書が上位に表示される。これにより、ユーザは自身が担当する製品との関連の高い不適合事例文書に気づきやすくなる。
【0078】
各実施形態で説明した処理の少なくとも一部は、CPU(Central Processing Unit)などの回路によりプログラムを実行することにより実現されてよい。
【0079】
図23は、コンピュータ2400のハードウェア構成例を概略的に示している。図23に示すように、コンピュータ2400は、CPU2402、RAM(Random Access Memory)2404、プログラムメモリ2406、ストレージデバイス2408、及び通信インタフェース2410を備える。
【0080】
CPU2402は、汎用回路の一例である。RAM2404はワーキングメモリとしてCPU2402により使用される。RAM2404はSDRAM(Synchronous Dynamic Random Access Memory)などの揮発性メモリを含む。プログラムメモリ2406は、文書検索プログラムなど、CPU2402により実行されるプログラムを記憶する。プログラムはコンピュータ実行可能命令を含む。プログラムメモリ2406として、例えば、ROM(Read-Only Memory)が使用される。CPU2402は、プログラムメモリ2406に記憶されたプログラムをRAM2404に展開し、プログラムを解釈及び実行する。文書検索プログラムは、CPU2402により実行されたときに、各実施形態に係る文書検索サーバに関して説明した処理をCPU2402に実行させる。
【0081】
文書検索プログラムなどのプログラムは、コンピュータで読み取り可能な記憶媒体に記憶された状態でコンピュータ2400に提供されてよい。この場合、例えば、コンピュータ2400は、記憶媒体からデータを読み出すドライブを備え、記憶媒体からプログラムを取得する。記憶媒体の例は、磁気ディスク、光ディスク(CD-ROM、CD-R、DVD-ROM、DVD-Rなど)、光磁気ディスク(MOなど)、半導体メモリを含む。また、プログラムをネットワーク上のサーバに格納し、コンピュータ2400がサーバからプログラムをダウンロードするようにしてもよい。
【0082】
ストレージデバイス2408は、不適合事例文書情報、類義表現情報、共起表現情報などのデータを記憶する。ストレージデバイス2408は、ハードディスクドライブ(HDD)又はソリッドステートドライブ(SSD)などの不揮発性メモリを含む。ストレージデバイス2408の一部領域がプログラムメモリ2406として使用されてもよい。
【0083】
通信インタフェース2410は、ユーザ端末150などの外部装置と通信するためのインタフェースである。通信インタフェース2410は、有線LAN(Local Area Network)モジュールなどの有線通信モジュールを含む。代替として、通信インタフェース2410は無線通信モジュールを含んでもよい。
【0084】
なお、各実施形態で説明した処理の少なくとも一部は、ASIC(Application Specific Integrated Circuit)又はFPGA(Field Programmable Gate Array)などの専用回路で実施されてもよい。
【0085】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0086】
100,1400,1500,1600,1900,2200…文書検索システム、110,1410,1510,1610,1910,221…文書検索サーバ、112…テキスト取得部、114,1412…表現取得部、116…現象表現取得部、118…類義表現取得部、120…選択部、122…共起表現取得部、124…選択部、126…関連文書取得部、128…表示部、130…不適合事例文書格納部、132…類義表現格納部、134…共起表現格納部、136…イベント格納部、150…ユーザ端末、160…ネットワーク、1414,1512…算出部、1612,1912…入力部、1614,1914…登録部、1916…関連イベント格納部、2212…順位判定部、2400…コンピュータ、2402…CPU、2404…RAM、2406…プログラムメモリ、2408…ストレージデバイス、2410…通信インタフェース。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23