(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022012229
(43)【公開日】2022-01-17
(54)【発明の名称】検索結果表示方法
(51)【国際特許分類】
G06F 16/338 20190101AFI20220107BHJP
【FI】
G06F16/338
【審査請求】未請求
【請求項の数】2
【出願形態】OL
(21)【出願番号】P 2020113905
(22)【出願日】2020-07-01
(71)【出願人】
【識別番号】306012444
【氏名又は名称】木村情報技術株式会社
(74)【代理人】
【識別番号】100114661
【弁理士】
【氏名又は名称】内野 美洋
(72)【発明者】
【氏名】三坂 隆太
(72)【発明者】
【氏名】渡辺 信幸
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175JC07
(57)【要約】
【課題】検索作業の効率を向上させること。
【解決手段】本発明では、検索されたテキストデータをキーワードの文字数(N1)以下の所定の文字数(N2)毎に分割して複数の分割領域データを生成し、各分割領域データとキーワードとの編集距離を求め、最も編集距離が小さくなる分割領域データの前方側に所定の文字数(N3)だけずらした前方側分割領域データを、前方側分割領域データとキーワードとの編集距離が増大するまで繰り返し生成し、最も編集距離が小さくなる分割領域データの後方側に所定の文字数(N4)だけずらした後方側分割領域データを、後方側分割領域データとキーワードとの編集距離が増大するまで繰り返し生成し、キーワードとの編集距離が増大する直前の前方側分割領域データから後方側分割領域データまでの範囲が含まれるように検索されたテキストデータを画面に表示することにした。
【選択図】
図2
【特許請求の範囲】
【請求項1】
複数のテキストデータの中からキーワードを用いて検索されたテキストデータを画面に表示する検索結果表示方法において、
検索されたテキストデータをキーワードの文字数(N1)以下の所定の文字数(N2)毎に分割して複数の分割領域データを生成し、
各分割領域データとキーワードとの編集距離を求め、
最も編集距離が小さくなる分割領域データの前方側に所定の文字数(N3)だけずらした前方側分割領域データを、前方側分割領域データとキーワードとの編集距離が増大するまで繰り返し生成し、
最も編集距離が小さくなる分割領域データの後方側に所定の文字数(N4)だけずらした後方側分割領域データを、後方側分割領域データとキーワードとの編集距離が増大するまで繰り返し生成し、
キーワードとの編集距離が増大する直前の前方側分割領域データから後方側分割領域データまでの範囲が含まれるように検索されたテキストデータを画面に表示することを特徴とする検索結果表示方法。
【請求項2】
前記分割領域データを前方側又は後方側にずらして前方側分割領域データ又は後方側分割領域データを生成する際の所定の文字数(N3又はN4)をキーワードの文字数(N1)以下の複数としたことを特徴とする請求項1に記載の検索結果表示方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のテキストデータの中からキーワードを用いて検索されたテキストデータを画面に表示する検索結果表示方法に関するものである。
【背景技術】
【0002】
近年、インターネットの普及や記憶媒体の大容量化によって、大量のテキストデータが蓄積されており、その中から所望するテキストデータをキーワードを用いて検索することができるようになっている。
【0003】
そして、検索によって抽出された複数のテキストデータの見出しが検索結果として一覧表示され、その中から選択した一つのテキストデータを画面上に表示させることができるようになっている(たとえば、特許文献1参照。)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来においては、検索されたテキストデータを画面に表示する場合に、テキストデータの先頭部分から表示するようにしている。
【0006】
そのため、検索されたテキストデータのどの部分に検索で用いたキーワードが含まれているのかが不明であり、テキストデータを先頭からキーワードが出現するまでスクロールさせて探す必要があり、検索に手間や時間がかかって検索作業の効率を低下させていた。
【課題を解決するための手段】
【0007】
そこで、請求項1に係る本発明では、複数のテキストデータの中からキーワードを用いて検索されたテキストデータを画面に表示する検索結果表示方法において、検索されたテキストデータをキーワードの文字数(N1)以下の所定の文字数(N2)毎に分割して複数の分割領域データを生成し、各分割領域データとキーワードとの編集距離を求め、最も編集距離が小さくなる分割領域データの前方側に所定の文字数(N3)だけずらした前方側分割領域データを、前方側分割領域データとキーワードとの編集距離が増大するまで繰り返し生成し、最も編集距離が小さくなる分割領域データの後方側に所定の文字数(N4)だけずらした後方側分割領域データを、後方側分割領域データとキーワードとの編集距離が増大するまで繰り返し生成し、キーワードとの編集距離が増大する直前の前方側分割領域データから後方側分割領域データまでの範囲が含まれるように検索されたテキストデータを画面に表示することにした。
【0008】
また、請求項2に係る本発明では、前記請求項1に係る本発明において、前記分割領域データを前方側又は後方側にずらして前方側分割領域データ又は後方側分割領域データを生成する際の所定の文字数(N3又はN4)をキーワードの文字数(N1)以下の複数とすることにした。
【発明の効果】
【0009】
そして、本発明では、以下に記載する効果を奏する。
【0010】
すなわち、本発明では、検索されたテキストデータにおいてキーワードが掲載されている部分を画面に表示させることができるので、所望のテキストデータの必要な部分を直ちに注目することができ、検索作業の効率を向上させることができる。
【図面の簡単な説明】
【0011】
【
図1】本発明に係る検索結果表示方法を示す説明図。
【発明を実施するための形態】
【0012】
以下に、本発明に係る検索結果表示方法の具体的な構成について、図面を参照しながら説明する。
【0013】
本発明に係る検索結果表示方法は、コンピューターを用いて記憶媒体に蓄積されている複数のテキストデータの中からキーワードによって検索されたテキストデータを画面に表示する方法である。記憶媒体は検索を行うコンピューターからアクセス可能であればよく、コンピューターに内蔵された記憶媒体やコンピューターに直接接続された記憶媒体でもよく、また、インターネットを介してコンピューターに接続された記憶媒体でもよい。また、本発明に係る検索結果表示方法を実行するプログラムは、検索を行うコンピューターに格納されている場合に限られず、インターネットを介して提供されるものであってもよく、また、検索を実行するプログラムとは別個独立したプログラムであってもよい。
【0014】
本発明に係る検索結果表示方法では、
図1に示すように、キーワードを用いた検索を行うと(S1)、その検索結果としてキーワードを含んだ又はキーワードと関連性の強いテキストデータがいくつか抽出され、抽出されたテキストデータのタイトル等が一覧表示される(S2)。
【0015】
この検索結果一覧の中から所望のテキストデータを選択すると(S3)、そのテキストデータの中でキーワードが掲載されている部分を探索し(S4)、それを表示箇所として画面に表示する(S5)。
【0016】
本発明に係る検索結果表示方法では、テキストデータの中からキーワードが掲載されている表示箇所を探索するために、
図2及び
図3に示す表示箇所探索方法を用いている。
【0017】
図2及び
図3に示すように、表示箇所探索方法では、まず、検索され選択されたテキストデータ1を読み込む(S4-1、
図3(a))。テキストデータ1には、途中にキーワード2が含まれている。
【0018】
次に、読み込んだテキストデータ1をキーワード2の文字数(これを「N1」とする。)以下の所定の文字数(これを「N2」とする)毎に分割して複数の分割領域データ3-1~3-16を生成する(S4-2、
図3(b))。なお、模式的に示した
図3では、N1を16文字、N2を8文字としている。文字数は、読みで表現した場合には音数となる。
【0019】
分割領域データ3-1~3-16の文字数(N2)は、キーワード2の文字数(N1)以下であればよいが、小さすぎると実行速度に影響するため、キーワード2の文字数(N1)の半分が好ましい。
【0020】
次に、各分割領域データ3-1~3-16とキーワード2との編集距離(レーベンシュタイン距離:二つの文字列の異なり程度を示す値)を求め(S4-3)、その中で最も編集距離が小さくなる分割領域データ3-6を検出する(S4-4、
図3(c))。
【0021】
次に、最も編集距離が小さくなる分割領域データ3-6の前方側に所定の文字数(N3)だけずらした前方側分割領域データ4-1~4-4を、前方側分割領域データ4-1~4-4とキーワード2との編集距離が増大するまで繰り返し生成する(S4-5、
図3(d)~(g))。なお、模式的に示した
図3では、N3を2文字としている。
【0022】
前方側にずらす文字数(N3)は、1文字でもよいが、小さすぎると実行速度に影響するため、キーワード2の文字数(N1)以下の複数が好ましい。
【0023】
模式的に示した
図3では、最も編集距離が小さくなる分割領域データ3-6の前方側に2文字ずらし(分割領域データ3-6の末尾2文字(N3)を削除するとともに、分割領域データ3-6の先頭にその直前の分割領域データ3-5の末尾2文字(N3)をそのまま追加する。)て前方側分割領域データ4-1を生成し、その前方側分割領域データ4-1とキーワード2との編集距離を算出し、直前に最も小さくなった編集距離(分割領域データ3-6とキーワード2との編集距離)と比較する(
図3(d))。これを編集距離が増大するまで繰り返し行う(
図3(e)~(g))。
【0024】
これにより、分割領域データ3-6の前方側において、編集距離が増大し始める前方側分割領域データ4-4が検出され、その直前の前方側分割領域データ4-3が分割領域データ3-6の前方側で最も編集距離が小さくなることが検出される。
【0025】
次に、最も編集距離が小さくなる分割領域データ3-6の後方側に所定の文字数(N4)だけずらした後方側分割領域データ5-1~5-2を、後方側分割領域データ5-1~5-2とキーワード2との編集距離が増大するまで繰り返し生成する(S4-6、
図3(h)~(i))。なお、模式的に示した
図3では、N4を2文字としている。
【0026】
後方側にずらす文字数(N4)は、1文字でもよいが、小さすぎると実行速度に影響するため、キーワード2の文字数(N1)以下の複数が好ましい。なお、前方側にずらす文字数(N3)と後方側にずらす文字数(N4)は、同一であっても、異なっていてもよい。
【0027】
模式的に示した
図3では、最も編集距離が小さくなる分割領域データ3-6の後方側に2文字ずらし(分割領域データ3-6の先頭2文字(N4)を削除するとともに、分割領域データ3-6の末尾にその直後の分割領域データ3-7の先頭2文字(N4)をそのまま追加する。)て後方側分割領域データ5-1を生成し、その後方側分割領域データ5-1とキーワード2との編集距離を算出し、直前に最も小さくなった編集距離(分割領域データ3-6とキーワード2との編集距離)と比較する(
図3(h))。これを編集距離が増大するまで繰り返し行う(
図3(i))。
【0028】
これにより、分割領域データ3-6の後方側において、編集距離が増大し始める後方側分割領域データ5-2が検出され、その直前の後方側分割領域データ5-1が分割領域データ3-6の後方側で最も編集距離が小さくなることが検出される。
【0029】
なお、前方側探索(S4-5)と後方側探索(S4-6)は、いずれを先に行ってもよい。
【0030】
以上に説明した表示箇所探索方法を行うことで、表示箇所としては、分割領域データ3-6の前方側で最も編集距離が小さくなる前方側分割領域データ4-3から、分割領域データ3-6の後方側で最も編集距離が小さくなる後方側分割領域データ5-1までの範囲が探索される。
【0031】
そして、本発明に係る検索結果表示方法では、その表示箇所(前方側分割領域データ4-3から後方側分割領域データ5-1の範囲)が含まれるように検索されたテキストデータ1を画面に表示するようにしている。
【0032】
以上に説明したように、複数のテキストデータ1の中からキーワード2を用いて検索されたテキストデータ1を画面に表示する上記の検索結果表示方法は、検索されたテキストデータ1をキーワード2の文字数(N1)以下の所定の文字数(N2)毎に分割して複数の分割領域データ3-1~3-16を生成し、各分割領域データ3-1~3-16とキーワード2との編集距離を求め、最も編集距離が小さくなる分割領域データ3-6の前方側に所定の文字数(N3)だけずらした前方側分割領域データ4-1~4-4を、前方側分割領域データ4-1~4-4とキーワード2との編集距離が増大するまで繰り返し生成し、最も編集距離が小さくなる分割領域データ3-6の後方側に所定の文字数(N4)だけずらした後方側分割領域データ5-1~5-2を、後方側分割領域データ5-1~5-2とキーワード2との編集距離が増大するまで繰り返し生成し、キーワード2との編集距離が増大する直前の前方側分割領域データ4-3から後方側分割領域データ5-1までの範囲が含まれるように検索されたテキストデータ1を画面に表示する構成となっている。
【0033】
そのため、上記構成の検索結果表示方法では、検索されたテキストデータ1においてキーワード2が掲載されている部分を画面に表示させることができるので、所望のテキストデータ1の必要な部分を直ちに注目することができ、検索作業の効率を向上させることができる。
【0034】
また、上記検索結果表示方法は、分割領域データ3-6を前方側又は後方側にずらして前方側分割領域データ4-1~4-4又は後方側分割領域データ5-1~5-2を生成する際の所定の文字数(N3又はN4)をキーワード2の文字数(N1)以下の複数とする構成となっている。
【0035】
そのため、上記構成の検索結果表示方法では、より迅速に検索されたテキストデータ1においてキーワード2が掲載されている部分を画面に表示させることができるので、検索作業の効率をより一層向上させることができる。
【符号の説明】
【0036】
1 テキストデータ
2 キーワード
3-1~3-16 分割領域データ
4-1~4-4 前方側分割領域データ
5-1~5-2 後方側分割領域データ