(58)【調査した分野】(Int.Cl.,DB名)
前記重要度計算部は、検索対象の前記文書に含まれる各文に対して、当該文に含まれる単語の当該文書全体における出現数に基づき、重要度を算出する、請求項1に記載の装置。
前記重要度修正部は、前記重要度計算部により算出された各文の重要度に対して、検索対象の前記文書中における当該文の位置が前方であるほど大きい重み付けを行って修正する、請求項1または請求項2に記載の装置。
前記検索キー取得部は、検索対象の前記文書に含まれる一の文の一部または全部を指定することによって特定された部分を検索キーとして取得する、請求項1または請求項2に記載の装置。
前記重要度計算部は、検索対象の前記文書に含まれる単語に関するtf-idf(term frequency-inverse document frequency)に基づいて、当該文書に含まれる各文の重要度を算出する、請求項1に記載の装置。
前記検索結果処理部は、前記抽出部により抽出された各文の重要度に対して、前記位置の情報に基づき、前記文書中における当該文の位置が前方であるほど大きい重み付けを行って得られた値に基づき、当該抽出部により抽出された文の表示順を決定する、請求項6に記載の装置。
【発明を実施するための形態】
【0016】
以下、添付図面を参照して、本発明の実施形態について詳細に説明する。
【0017】
<装置構成>
図1は、本実施形態が適用される情報処理装置の機能構成の一例を示す図である。本実施形態が適用される情報処理装置は、電子文書を閲覧するための装置であり、パーソナルコンピュータや、タブレット型情報端末装置、いわゆるスマートフォン等の携帯型情報端末装置等を用いることができる。
図1に示す情報処理装置は、処理部100と、記憶部200と、表示部300と、入力操作部400とを備える。処理部100は、処理対象である電子文書に対する処理を行う。本実施形態における処理部100の具体的な機能については後述する。記憶部200は、処理部100による処理の対象である電子文書を記憶する。また、処理部100の処理により得られたデータを記憶する。
【0018】
表示部300は、液晶ディスプレイ等の表示装置で実現され、処理部100の制御により、処理対象である電子文書を表示する。また、表示部300は、処理部100により行われた処理の結果を表示する。
【0019】
入力操作部400は、使用者が入力操作を行うための操作デバイスである。具体的には、入力操作部400としては、マウス等のポインティング・デバイスやキーボード等が用いられる。また、表示部300の表示画面に重ねて設けられたタッチ・パネルを入力操作部400として用いることもできる。
【0020】
図1に示すように、処理部100は、使用者による入力操作を受け付けるための受け付け部110と、処理手段としての文書処理部120、重要度計算部130および検索結果処理部140と、表示部300の表示を制御する表示制御部150とを備える。
【0021】
受け付け部110は、入力操作部400を用いて行われた入力を受け付ける。本実施形態では、例えば、電子文書を指定して表示部300に表示させる指示、検索キーによる検索やその他の各種の処理の実行指示等が入力され、受け付け部110により受け付けられる。また、受け付け部110は、入力操作部400を用いて行われた検索キー(キーワード)の入力も受け付ける。すなわち、受け付け部110は、検索キーを取得する検索キー取得部としても機能する。検索キーの入力は、例えば、キーボードを打鍵する操作や、表示部300に表示された電子文書中の適当な範囲(文字列)をポインティング・デバイスにより指定する操作により行われる。
【0022】
文書処理部120は、受け付け部110により受け付けた指示やデータに基づいて、各種の処理を実行する。例えば、文書処理部120は、指定された電子文書を記憶部200から読み出し、表示部300に表示させる。また、文書処理部120は、重要度計算部130に、記憶部200から読み出した電子文書に含まれる各文の重要度を計算させる。また、文書処理部120は、入力された検索キー(文字列)に基づいて、記憶部200から読み出した電子文書に含まれる文のうち、検索キーを含む文を抽出する抽出部としても機能する。このとき、文書処理部120は、抽出した文の相対的な位置の情報(検索キーを含む文のうちで何番目の文かを示す情報、以下、位置情報)も取得する。また、文書処理部120は、抽出した文を検索結果処理部140に送り、処理を実行させる。
【0023】
重要度計算部130は、処理対象の電子文書に含まれる各文に関して、各々の文に含まれる単語の出現数に基づき、その電子文書における各文の重要度を計算する。算出される文の重要度は、記憶部200に格納され保持される。そして、検索キーに基づく文の検索が行われた場合に、検索結果を出力する処理において用いられる。この文の重要度の計算は、計算量が多く、計算を行う際の負荷が大きい。そこで、検索の実行指示を受け付けてから行うのではなく、文書処理部120により電子文書が読み出された際、検索の実行指示を待たずにバックグラウンドで計算を行っても良い。また、本実施形態の情報処理装置がインターネット等のネットワークに接続可能である場合は、ネットワーク上のサーバに計算を依頼し、計算結果を取得するようにしても良い。重要度計算部130による文の重要度の計算方法の詳細については後述する。
【0024】
検索結果処理部140は、文書処理部120により検索キーに基づいて抽出された文に関する、重要度計算部130により計算された重要度を修正する重要度修正部として機能する。本実施形態では、検索結果処理部140は、文書処理部120が文を抽出した際に取得した文の位置情報に基づいて、その文の重要度の値を変更する。検索結果処理部140による処理の詳細については後述する。
【0025】
表示制御部150は、表示部300の表示を制御する。具体的には、例えば、表示制御部150は、文書処理部120から取得した表示対象の電子文書を表示部300に表示させる。また、表示制御部150は、電子文書を表示部300に表示させた状態で受け付け部110が受け付けた指示に基づき、表示内容のページ送りやスクロール等の表示制御を行う。また、表示制御部150は、検索結果処理部140による処理の結果に基づいて、文書処理部120により抽出された文を、検索結果として表示部300に表示させる検索結果出力部としても機能する。表示制御部150による検索結果の表示制御の詳細については後述する。
【0026】
<文の重要度の計算>
次に、重要度計算部130による文の重要度の計算について詳細に説明する。上述したように本実施形態では、単語の出現数に基づいて、電子文書における各文の重要度が計算される。具体的には、重要度計算部130は、まず、tf−idfと呼ばれる既存のアルゴリズムを用いて電子文書に存在する各単語の重みを求める。tf−idfは、tf(term frequency)という指標と、idf(inverse document frequency)という指標の2つの指標を用いて求められる。ここで、tfとは、電子文書中における各単語の出現頻度を示す指標である。これは、電子文書中に高い頻度で出現する単語は重要な単語であるという考えに基づいている。また、idfとは、電子文書中において、ある単語が含まれる文の数を示す指標である。これは、多くの文で使用されている単語よりも、少ない文で使用されている単語の方が、その文の特徴をよく表すという考えに基づいている。
【0027】
本実施形態において、重要度計算部130は、電子文書に存在する各単語について順次着目する。そして、着目した単語に関して、上記のtf−idfに基づく値(以下、tf−idf値)を求める。これにより、電子文中に存在する単語ごとのtf−idf値が求まる。
【0028】
次に、重要度計算部130は、上記のように求めた電子文書中の各単語の重要度(tf−idf値)に基づいて、電子文書中の各文の関連性を特定する。具体的には、電子文書を、その電子文書に含まれる各文をノードとするグラフで表現する。そして、グラフにおける各ノード間のエッジに、そのエッジの属性として、そのエッジの両端のノードに対応する二つの文の間の関連性を表す値(以下、関連度)を付与する。具体例を挙げて、さらに説明する。
【0029】
ここでは、s1:「A cat is sitting on a mat.」、s2:「A dog is sitting on a mat.」、s3:「A cat and a dog are sitting on a mat.」という三つの文(s1〜s3)からなる文書を例として、各文の関連度の求め方について説明する。まず、これらの文に含まれる単語の集合(ワード空間)を求める。なお、上記の文における「A(a)」、「is」、「on」「are」等の単語は、いわゆるストップ・ワードとして、ワード空間から除外する。ストップ・ワードとされる単語は、本実施形態が適用されるシステムの仕様等に応じて適宜設定される。
【0030】
図2は、上記のs1〜s3の文における関連度を説明する図である。
図2に示すように、s1〜s3から得られるワード空間には、[cat,sitting,mat,dog]の四つの単語が含まれる。そして、各文(s1〜s3)を構成する単語のうち、ワード空間に含まれる各単語にポイントを付与し、各文(s1〜s3)のスコアを求める。このとき、実際には、各単語に対してその単語のtf−idf値がポイントとして与えられるが、ここでは簡単のため、一つの単語ごとに1ポイントを付与することにする。例えば、s1では、ワード空間に含まれる単語のうち「cat」が一つ、「sitting」が一つ、「mat」が一つ存在し、各々の単語に1ポイントずつが付与されるので、s1のスコアv1は、
図2に示すように、v1:(cat:1,sitting:1,mat:1,dog:0)となる。同様に、s2のスコアv2は、v2:(cat:0,sitting:1,mat:1,dog:1)となり、s3のスコアv3は、v3:(cat:1,sitting:1,mat:1,dog:1)となる。
【0031】
次に、上記のスコア(v1〜v3)に基づき、各文の関連度を求める。上記の例では三つの文(s1〜s3)が存在するので、s1とs2との間の関連度、s1とs3との間の関連度、s2とs3との間の関連度が、それぞれ求まる。s1とs2との間の関連度について、具体的に考える。s1には、三つの単語(「cat」、「sitting」、「mat」)が存在し、このうち二つの単語(「sitting」、「mat」)がs2と共通している。一方、s2には、三つの単語(「sitting」、「mat」、「dog」)が存在し、このうち二つの単語(「sitting」、「mat」)がs1と共通している。そこで、s1とs2との間の関連度(v1:v2)を、二つの文(s1、s2)における単語の総数に対する、共通する単語の数の割合で表し、(2+2)/(3+3)≒0.66とする。
【0032】
また、s1とs3との間の関連度(v1:v3)について考えると、s1には、三つの単語(「cat」、「sitting」、「mat」)が存在し、その全てがs3と共通している。一方、s3には、四つの単語(「cat」、「sitting」、「mat」、「dog」)が存在し、このうち三つの単語(「cat」、「sitting」、「mat」)がs1と共通している。したがって、s1とs3との間の関連度(v1:v3)は、(3+3)/(3+4)≒0.86となる。同様に、s2とs3との間の関連度(v2:v3)は、(3+3)/(3+4)≒0.86となる。
【0033】
電子文書を表すグラフにおいて、各文(s1〜s3)に対応するノードs1〜ノードs3の間にそれぞれ張られたエッジには、上記のようにして算出された各文の間の関連度が属性として付与される。
図2を参照すると、ノードs1とノードs2との間のエッジには、値「0.66」が付与されており、ノードs1とノードs3との間のエッジには、値「0.86」が付与されており、ノードs2とノードs3との間のエッジには、値「0.86」が付与されている。なお、上述したように、上記の例では、各文におけるワード空間に含まれる単語ごとに1ポイントを与えて各文のスコアおよび関連度を計算したが、実際には、各単語に対してtf−idf値がポイントとして付与される。したがって、各文のスコアおよび関連度についても、実際には、各単語のtf−idf値を用いて計算が行われる。
【0034】
次に、重要度計算部130は、上記のようにして求めた各文の間の関連度に基づき、各文に対して固有ベクトル中心性(Eigenvector centrality)に基づいて各文の重要度を計算する。重要度計算部130は、まず、上記のようにして各文の間の関連度を付与された電子文書を表すグラフに基づき、隣接行列を作成する。
【0035】
図3は、
図2に示したグラフに基づく隣接行列を示す図である。
図3において、行列Aの各要素のうち、
図2に示したグラフの各エッジに対応する要素には、各々のエッジに付与された関連度の値が記載されている。重要度計算部130は、このような行列Aに関して、最大固有値に対応する固有ベクトルを計算し、算出された固有ベクトルの要素(値)を各文の重要度の値とする。また、重要度計算部130は、この固有ベクトルの要素(値)の大きさの順に各文の重要度に基づく順位付け(ranking)を行う。行列Aのような電子文書を表すグラフに基づく隣接行列の最大固有値および固有ベクトルを計算する手法としては、既存の手法を用いることができる。
【0036】
以上のように、本実施形態における文の重要度の計算は、処理対象である電子文書に含まれる情報のみに基づいて(すなわち閉じた環境において)行われる処理である。算出された電子文書における各文の重要度は、記憶部200に格納される。
【0037】
<文の検索処理>
次に、文書処理部120による文の検索処理について説明する。本実施形態において、文書処理部120は、受け付け部110により受け付けた検索キー(キーワード)に基づき、その検索キーを含む文を処理対象の電子文書中から抽出する。また、文書処理部120は、抽出した文の位置情報を取得する。
【0038】
図4は、本実施形態による文の抽出を説明する図である。
図4に示す電子文書Dは、最初の文である「文1」から最後の文である「文N」まで、N個の文で構成される。また、文nは、電子文書Dにおいて、検索キーを含む文のうちで最初に出現する文である。すなわち、文nよりも前にある文には検索キーは含まれておらず、抽出対象外となる。また、文n+aは、検索キーを含み、文nよりも後方に位置する文である。文n+kは、検索キーを含む最後の文である。
図4においては、文n+kよりも後の文が示されていないが、検索キーを含まない文が後続する場合もある。
【0039】
次に、文書処理部120は、検索キーに基づいて抽出した文nから文n+kまでの各文の位置情報[n,n+k]を正規化する。すなわち、[n,n+k]の値が[0,1]となるように位置情報を変換する。これにより、具体的な文n+aの位置x(n+a)は、x(n+a)=a×(1/k)で表されることになる。
【0040】
<文の位置情報に基づく重要度の修正>
次に、検索結果処理部140による文の重要度の修正について説明する。本実施形態において、検索結果処理部140は、文書処理部120により抽出された文の重要度を記憶部200から読み出す。そして、検索結果処理部140は、文書処理部120により取得された検索キーを含む各文の位置情報に基づいて、該当する各文の重要度を修正する。
【0041】
図5は、検索結果処理部140による修正前の各文の重要度の例を示す図である。
図5において、横軸は、文書処理部120により抽出された各文の位置情報を示す。すなわち、値「0」の地点(グラフの左端)が、検索キーを含む最初の文であり、値「1」の地点(グラフの右端)が、検索キーを含む最後の文である。また、縦軸は、[0,1]における各文の重要度を示す。
【0042】
本実施形態では、文の重要度の修正処理として、(1)前方にある文ほど大きい重みを付与する処理、または(2)検索キーの特定に用いられた文に近い位置にある文ほど大きい重みを付与する処理を行う。前者は、「前方にある文ほど重要度が高い」という仮定(仮定1)に基づいている。また、後者は、「検索キーの特定に用いられた文に近い位置にある文ほど重要度が高い」という仮定(仮定2)に基づいている。
【0043】
仮定1について説明する。電子文書中の特定の語句(登場人物や場所等)についての情報を得たい場合を考える。電子文書の内容が小説等の物語である場合、物語の鍵となるような語句については、最初にその語句が登場した文等、前方に位置する文で紹介的な説明がなされる場合が多い。また、電子文書の内容が論文である場合、論旨の鍵となる語句については、最初にその語句が登場した文において定義的な記載がなされる場合が多い。そのため、特定の語句を含む文のうち、前方にある文ほど、その語句についての説明や定義が記載された重要度の高い文である可能性が大きいという仮定が成り立つ。そこで、文の重要度に対する修正処理として、仮定1に基づく重み付けを行う。
【0044】
図6は、仮定1に基づく重み付けの例を示す図である。
図6において、横軸は、
図5に示したグラフと同様に、文書処理部120により抽出された各文の位置情報を示す。また、縦軸は、各文に付与される重み値を示す。
図6に示す例では、左方の文(電子文書において前方に出現する文)ほど、重み値が大きくなっている。また、図示の例において、重み値の最大値は「1」である。なお、仮定1に基づく重み付けは、前方の文ほど付与される重み値が大きくなっていれば良く、具体的な文ごとの重みの値は、電子文書の種類等に応じて適宜設定される。すなわち、
図6に示すグラフの曲線自体は例示に過ぎない。
【0045】
検索結果処理部140は、文書処理部120により抽出された各文について、記憶部200から読み出した重要度の値と、
図6に示す例のように定義された重み値とに基づいて、検索結果の出力に反映させる最終的な重要度の値を計算する。具体的には、例えば文n+aについて、記憶部200から読み出した重要度の値をs(n+a)とし、
図6のように定義される重み値をb(n+a)とすると、最終的な重要度の値W(n+a)は、次式W(n+a)=s(n+a)+s(n+a)×b(n+a)により求める。なお、この重み付けの計算式は例示に過ぎず、この計算式に限定するものではない。実際には、電子文書の内容等に応じて適宜に計算式を設定することができる。
【0046】
次に、仮定2について説明する。電子文書の閲覧者が電子文書中のある文を読んだときに、その文中の語句について、その文の近辺においてどのような記載があるかを参照したい場合がある。例えば、ある語句について少し前にどのような記載があったかを確認したい場合や、ある語句が現在読んでいる文を含む特定の範囲(章や節など)でどのように説明されているかを知りたい場合等である。そのため、上記の仮定1とは別に、特定の語句を含む文のうち、特定の文に近い位置にある文ほど、閲覧者が読みたいと欲する重要度の高い文である可能性が大きいという仮定が成り立つ。そこで、文の重要度に対する修正処理として、仮定2に基づく重み付けを行う。
【0047】
図7は、仮定2に基づく重み付けの例を示す図である。
図7において、横軸は、
図5に示したグラフと同様に、文書処理部120により抽出された各文の位置情報を示す。また、縦軸は、各文に付与される重み値を示す。
図7に示す例では、特定された文(文n+a)に近い位置の文ほど、重み値が大きくなっている。また、図示の例において、重み値の最大値は「1」である。なお、仮定2に基づく重み付けは、特定された文に近い位置の文ほど付与される重み値が大きくなっていれば良く、具体的な文ごとの重みの値は、電子文書の種類等に応じて適宜設定される。すなわち、
図7に示すグラフの曲線自体は例示に過ぎない。
【0048】
検索結果処理部140は、文書処理部120により抽出された各文について、記憶部200から読み出した重要度の値と、
図7に示す例のように定義された重み値とに基づいて、検索結果の出力に反映させる最終的な重要度の値を計算する。具体的な計算方法は、
図6を参照して説明した仮定1の場合と同様である。
【0049】
上記のように、仮定1と仮定2とは、各文の重要度に付与される重みの根拠が異なっている。そのため、仮定1に基づく重要度の修正と、仮定2に基づく重要度の修正は、通常は別個に用いられる。実際の運用においては、例えば、受け付け部110が検索の実行指示を受け付ける際に、どちらの修正を行うかについての選択指示を受け付け、この選択指示に応じて修正方法を切り替えるようにすれば良い。また、原則的に仮定1に基づく修正を行い、特に指示を受け付けた場合にのみ仮定2に基づく修正を行うようにしても良い。
【0050】
ところで、仮定2に基づく重み付けは、上記のように、最初に特定された文の位置に基づいて決定される。言い換えれば、最初に特定された文が異なると、
図7に示したグラフの形状が変わる。したがって、仮定2に基づく重要度の修正を行う場合、まず一つの文を特定する必要がある。具体的には、受け付け部110が検索キーの指定を受け付ける際に、特定の文に含まれる語句を検索キーとして受け付けるようにする。例えば、処理対象の電子文書が表示部300に表示された状態で、表示されている文の特定の範囲(文の一部または全部)の指定を受け付け、指定された範囲の文字列を検索キーとして受け付けると共に、指定された文字列を含む文を特定するようなインターフェイスを考えることができる。
【0051】
一方、仮定1に基づく重み付けは、検索キーを含む各文の位置にのみ基づいており、
図6に示したグラフは変動することがない。すなわち、指定された検索キーがいずれの文に含まれる語句であるかは問わない。そこで、例えば、キーボード等のデバイスを用いて、電子文書中の文とは関係なく入力された文字列を、検索キーとして受け付けても良い。
【0052】
以上のようにして、文書処理部120により抽出された各文の位置情報に基づいて、各文の重要度が修正された。ここで、検索結果処理部140により重要度が修正されることにより、重要度計算部130により付与された各文の重要度に基づく順位も変更される場合がある。変更後の順位は、検索キーを含む各文の位置を反映させたものとなっている。
【0053】
<検索結果の出力>
表示制御部150は、検索結果処理部140により修正された重要度(修正重要度)に基づく順位にしたがって、文書処理部120により抽出された文(検索キーを含む文)を表示部300に表示させる。具体的には、例えば、表示部300の表示画面に検索結果を表示するための領域を形成し、この領域に、修正後の順位の上位から順に、文を表示させる。
【0054】
図8および
図9は、表示制御部150により制御された表示部300の表示画面の例を示す図である。
図8を参照すると、表示部300の表示画面310には、処理対象の電子文書が表示されている。これは、受け付け部110により受け付けた表示指示に従って、文書処理部120が記憶部200から読み出した電子文書を表示したものである。表示画面310には、指定された検索キーを表示するための検索キー表示領域311が形成されている。
図8に示す検索キー表示領域311には、検索処理の実行中であることを示す「Search」の文字と検索キー「Watson」が表示されている。また、
図8に示す例において、検索キー「Watson」は、表示画面310に表示されている電子文書のうち、本文(タイトルの「THE ADVENTURES OF SHERLOK HOLMES」を除いた部分)の10行目にある文字列「Watson」を指定して入力されたものである。
図8に示す表示例において、指定された文字列「Watson」は、反転表示されており、指定された箇所が視覚的に識別できるように表示制御されている。
【0055】
文書処理部120による検索が完了し、抽出された検索キー「Watson」を含む各文に関して、検索結果処理部140において修正重要度に基づく順位が決定されると、決定された順位にしたがって検索結果が表示される。
図9を参照すると、表示部300の表示画面310に、新たに検索結果表示領域312が形成されている。そして、この検索結果表示領域312に、修正後の重要度に基づく順位が上位の文が表示されている。
図9に示す検索結果表示領域312には、二つの文が表示されているが、表示される文の数は図示の例に限られず、検索結果表示領域312のサイズと表示される文の長さに応じて定まる。また、検索結果表示領域312の表示内容をスクロールしたり更新したりすることにより、修正後の重要度に基づく順位が下位の文を表示可能とすることができる。なお、
図9に示す例では、検索キー「Watson」を含む文の検索が完了しているので、検索キー表示領域311には、「Search」の文字に代わり、検索処理が済んだことを示す「Find about」の文字が表示されている。
【0056】
上記の例では、表示部300の表示画面310に表示された電子文書中の文字列を指定して検索キーを指定することとしたが、キーボード等を用いて検索キーとなる文字列を直接入力しても良い。ただし、この場合は、特定の文に含まれる文字列を検索キーとして指定するのではないため、「前方にある文ほど重要度が高い」という仮定(仮定1)に基づく重要度の修正のみが適用可能となる。
【0057】
<処理部の動作>
図10は、上記のように構成された情報処理装置により検索キーに基づく文の検索を行う際の処理部100の動作を説明するフローチャートである。ここでは、検索処理の実行指示が行われる前に、バックグラウンド等にて、重要度計算部130による電子文書の各文の重要度の計算が完了しているものとする。検索処理が行われる場合、まず、受け付け部110が、検索キーの入力を受け付ける(ステップ1001)。次に、受け付けた検索キーに基づいて、文書処理部120が、この検索キーを含む文を処理対象の電子文書から抽出する。また、文書処理部120は、抽出した文の位置情報を取得する(ステップ1002)。
【0058】
次に、検索結果処理部140が、文書処理部120により取得された位置情報に基づいて、文書処理部120により抽出された文の重要度を修正する(ステップ1003)。そして、修正した重要度に基づき、文書処理部120により抽出された各文の順位付けを行う(ステップ1004)。この後、表示制御部150が、ステップ1004で決定された順位(表示順)にしたがって、各文を表示部300に表示させる(ステップ1005)。
【0059】
<ハードウェア構成例>
図11は、本実施形態の情報処理装置を構成するのに好適なハードウェア構成例を示す図である。ここでは、コンピュータに適用する場合について説明する。
図11に示すコンピュータは、演算手段であるCPU(Central Processing Unit)10aと、主記憶手段であるメモリ10cを備える。また、外部デバイスとして、磁気ディスク装置(HDD:Hard Disk Drive)10g、ネットワーク・インターフェイス10f、ディスプレイ装置を含む表示機構10d、音声機構10h、キーボードやマウス等の入力デバイス10i等を備える。
【0060】
図11に示す構成例では、メモリ10cおよび表示機構10dは、システム・コントローラ10bを介してCPU10aに接続されている。また、ネットワーク・インターフェイス10f、磁気ディスク装置10g、音声機構10hおよび入力デバイス10iは、I/Oコントローラ10eを介してシステム・コントローラ10bと接続されている。各構成要素は、システム・バスや入出力バス等の各種のバスによって接続される。
【0061】
なお、
図11は、本実施形態が適用されるのに好適なコンピュータのハードウェア構成を例示するに過ぎない。本実施形態は、電子文書を表示して閲覧可能とし、検索キーに基づく文の検索を行うことが可能な情報処理装置に広く適用できるものであり、図示の構成においてのみ本実施例が実現されるのではない。
【0062】
図11において、磁気ディスク装置10gにはOSのプログラムやアプリケーション・プログラムが格納されている。そして、これらのプログラムがメモリ10cに読み込まれてCPU10aに実行されることにより、本実施形態における処理部100の各機能が実現される。また、記憶部200は、メモリ10cや磁気ディスク装置10g等の記憶手段により実現される。また、表示部300は、表示機構10dにより構成される。また、入力操作部400は、入力デバイス10iに相当する。
【0063】
なお、上記の構成例では、処理対象である電子文書を予め装置内の記憶部200に格納しておき、文書処理部120が読み出すこととしたが、外部記憶装置に保持されている電子文書を取得し、処理対象としても良い。この場合、例えば
図11に示すネットワーク・インターフェイス10fを介して、ネットワーク上に設けられた外部記憶装置から閲覧しようとする電子文書を取得することができる。その他、上記の実施形態に、種々の変更または改良を加えたものも、本発明の技術的範囲に含まれる。