(58)【調査した分野】(Int.Cl.,DB名)
前記表示制御手段を、前記ワード選択受付手段によりネットワークグラフに表示されたワードの選択を受け付けた場合、当該ワードを含む文章の原文を表示する手段として機能させるための請求項2に記載のプログラム。
前記作成手段により作成されるネットワークグラフにおけるノードは、当該ノードに表示されるワードの品詞により色が異なることを特徴とする請求項1乃至5のいずれか1項に記載のプログラム。
前記作成手段により作成されるネットワークグラフにおけるノードは、当該ノードに表示されるワードの評価極性により色が異なることを特徴とする請求項1乃至5のいずれか1項に記載のプログラム。
文章を解析することで得られるワードが表示されたノードと、ワードとワードの係り受け関係を示しノード間をつなぐエッジとから構成されるネットワークグラフであって、末端のノードから他の末端のノードまでを繋ぐエッジ数が所定の数を超える場合には、当該所定の数に収まるように末端のノードを削除したネットワークグラフを作成する作成手段と、
前記作成手段により作成されたネットワークグラフを表示する表示制御手段と、を備え、
前記作成手段は、前記ノードに対して表示し続ける旨の指示がなされている場合は、末端のノードから他の末端のノードまでを繋ぐエッジ数が所定の数を超える場合であっても、当該表示し続ける旨の指示がなされているノードは削除しないことを特徴とする情報処理装置。
【発明を実施するための形態】
【0018】
以下、図面を参照して、本発明の実施形態を詳細に説明する。
【0019】
図1は、本発明の実施形態におけるテキスト絞り込みシステムが備える機能構成を示す図である。テキスト絞り込みシステム100は、データベース110と分析処理部120と、集計部130とWEBアプリケーションサーバー140と、ユーザにより操作されるクライアント端末150とを備える。
【0020】
ユーザは、クライアント端末150を介してWEBアプリケーションサーバー140に対して指示を出すことが可能である。そして、WEBアプリケーションサーバー140は、クライアント端末150から受信した指示に基づき、各種データをクライアント端末150に送信する。クライアント端末150は、受信した各種データを表示部に表示する。
【0021】
なお、本発明のテキスト絞り込みシステムにおけるデータベース110、分析処理部120、集計部130、WEBアプリケーションサーバー140、クライアント端末150がそれぞれ備える機能は、それぞれ別の端末が備えていても、ひとつの端末が全ての機能を備えていてもいずれであっても良い。すなわち、テキスト絞り込みシステムが全体としてひとつの装置(情報処理装置)であっても良いし、複数の端末(情報処理装置)に分かれたシステムであっても良い。
【0022】
データベース110は、大規模テキスト(文書)を格納するテキストデータ111と、テキストの形態素解析、係り受け解析結果である単語もしくは連結単語の頻度情報と係り受け情報を格納する分析結果データ112とを備える。連結単語とは単語を結合したものであり、以下、単語もしくは連結単語のことを総じてワードと呼ぶ。
【0023】
図2は、クライアント端末150、WEBアプリケーションサーバー140に適用可能な情報処理装置のハードウエア構成を示す図である。
【0024】
以下、
図2を用いて、
図1に示したテキスト絞り込みシステムにおける情報処理装置のハードウエア構成の一例について説明する。
【0025】
図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な各種プログラム等が記憶されている。
【0026】
202はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
【0027】
また、205は入力コントローラで、入力装置209等からの入力を制御する。206はビデオコントローラで、液晶ディスプレイ等のディスプレイ装置210への表示を制御する。なお、ディスプレイ装置は、液晶ディスプレイに限られず、CRTディスプレイなどであっても良い。これらは必要に応じてクライアントが使用するものである。
【0028】
207はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶するハードディスク(HD)や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
【0029】
208は通信I/Fコントローラで、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
【0030】
なお、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ装置210上での表示を可能としている。また、CPU201は、ディスプレイ装置210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0031】
ハードウエア上で動作する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。
【0032】
なお、全ての装置がこれらの構成を備えているわけではなく、必要なものを備えていればよい。
【0033】
図3は、テキストデータ111の一例を示す図である。テキストデータ111は、データを一意に識別するidと作成された日時と、テキストのタイトルと本文とURLと、テキストデータの収集を行った媒体や収集に用いた検索キーなどをタグとして保持する。タグはテキストデータを収集するときに複数もしくはタグなしでも自由に設定することができる。例えば、ネット上のSNSからカメラに関するテキストデータを収集した場合は「SNS、カメラ」といったようにタグを設定する。タグを設定することで、分析に用いるデータの絞り込みを行う。
【0034】
テキストデータの収集にあたっては、専用のデータ収集APIが存在するものについては、定期的(バッチ処理、差分処理)にAPIを実行してデータ収集し、検索キーワードや媒体名(SNSの名称など)などをタグとして登録する。
【0035】
例えば、Tweitter APIを用いて“キヤノン,カメラ”という検索ワードで収集したデータは、[キヤノン,カメラ,twetter]というタグ(リスト)を付けて、タイトルは空欄でDBに格納するということになる。
【0036】
また、WEB上のデータでデータ収集APIが存在しないものについては、該当ページのRSSやHTML・XML解析などを行い定期的にデータ収集し、媒体名(サイト名やブログ名など)などをタグとしてDBに格納する。
【0037】
例えば、ニュースのまとめサイトのRSSから収集したデータは、「ニュース記事」というタグを付け、タイトルとURLをあわせてDBに格納する。
【0038】
図4は、分析結果データ112の一例を示す図である。例として
図3のid=1のデータの分析結果例を示す。分析結果データ112はテキストデータ111のどのデータの分析結果なのかを示すidと、分析処理部によって抽出された係り受け関係と係り受け関係頻度と、名詞情報と名詞情報頻度と、形容詞情報と形容詞情報頻度と、動詞情報と動詞情報頻度とを保持する。形容詞情報と動詞情報は、テキストから取得した原文とともに、その形態素の終止形を保持する。形容詞と動詞において終止形を保持するのは、形態素の活用における表現のばらつきを集約し、同形態素の頻度をまとめるためである。分析処理部の詳細については後述する。
【0039】
次に
図5を用いて、分析処理部120における分析処理について説明する。
図5に示す処理によれば、分析処理部120はテキストデータ111からテキスト本文を取得し分析を実行し、分析結果を集計して分析結果データ112への登録または更新を行う。なお、テキストデータ取得時には分析が未実行の差分データのみを取得し、分析処理は30分間隔などで定期的に自動実行されるものとする。
【0040】
ステップS501では、テキストデータ111からテキスト本文を取得し1文ごとに分割する。文と文の切れ目は句点や全角スペース、閉じ括弧などで判断する。
【0041】
そして、ステップS501で分割した各文に対してステップS503〜ステップS506の処理を繰り返し実行する(ステップS502)。
【0042】
ステップS503では、形態素解析・係り受け解析を実行し、文を文節、形態素に分割する。そして、形態素の品詞と終止形、および、文節間の係り受け情報を取得する。
【0043】
ここで、
図7を用いて、「高かったけどすごく良いので、この商品を買いました。」という文の解析例を示す。なお、形態素解析・係り受け解析については既存技術を用いて実現することが可能であるため、ここでの詳細な説明は省略する。
【0044】
図7に示すように、「高かったけどすごく良いので、この商品を買いました。」という文が、「高かったけど」、「すごく」、「良いので」、「この」、「商品を」、「買いました。」という6つの文節に分割されている。
【0045】
さらに例えば「高かったけど」という文節は、「高かっ」、「た」、「けど」という3つの形態素に分割され、それぞれの品詞は形容詞、助動詞、接続助詞であり、それぞれの終止形は「高い」、「た」、「けど」であることを示している。
【0046】
また、「高かったけど」の係り受け先の文節は「良いので」であることを示している。
【0047】
なお、「買いました。」の係り受け先の文節は「なし」となっているが、これは係り受け先の文節が無いことを示している。
【0048】
他の文節についても同様に解析された結果を示しているが、詳細の説明は省略する。
【0049】
次に、ステップS503で取得した各文節に対してステップS505〜S506の処理を繰り返し実行する(ステップS504)。
【0050】
ステップS505では、各文節に対して形態素の連結処理を実行する。
【0051】
ここで、ステップS505の形態素の連結処理について、
図6のフローチャートを用いて説明する。
【0052】
まず、文節中の形態素を順次走査し、各形態素に対してステップS602〜S604の処理を実行する。
【0053】
ステップS602では、形態素の品詞を識別し形容詞または動詞であればステップS603の形容詞・動詞の連結処理へ、名詞であればステップS604の名詞の連結処理を行い、上記以外の品詞ならば文節中の次の形態素の処理へ移る。
【0054】
ステップS603では、処理対象の形態素の後ろに続く形態素の品詞が形容詞または動詞、または格助詞を除く助詞であれば形態素の連結を繰り返し実行し、文節の終端もしくは連結条件を満たさなければ本フローチャートの処理を終える。
【0055】
ステップS604では、処理対象の形態素の後ろに続く形態素の品詞が名詞であれば形態素の連結を繰り返し実行し、文節の終端もしくは連結条件を満たさなければ本フローチャートの処理を終える。
図5の説明に戻る。
【0056】
ステップS506ではステップS103、ステップ105で取得した形態素の終止形と連結語、係り受けの頻度を集計し、一覧を作成し、分析結果データ112へ登録・更新を行う。
そして、
図5のフローチャートの処理を終了する。
【0057】
集計部130は、ユーザがWEBアプリケーションサーバー140に対する指示により指定した日時やタグを用いて、データベース110からユーザが要望する分析結果データ112を取得し、集計結果をWEBアプリケーションサーバー140に返す。
【0058】
次に、WEBアプリケーションサーバー140がテキスト絞り込みシステム100のユーザに提示する画面(クライアント端末150に表示する画面)とユーザによる操作方法について説明する。
【0059】
図8はユーザが情報を絞り込むための検索ワードを探索し、また、絞り込んだ情報を閲覧する全体画面の一例である。
【0060】
当該全体画面には、読み込む分析結果を選択するためのタグや日時を設定する分析設定ボタン200と、係り受けと名詞と、形容詞と動詞のランキング表300(ワードが一覧表示された領域)と、リアルタイムに操作できるネットワークグラフ400と、ネットワークグラフから選択した検索ワードで絞り込んだ情報(当該ワードを含む文書の原文)を提示する絞り込み結果表示欄500とが含まれている。
分析設定ボタン200について、
図9を用いて説明する。
【0061】
ユーザにより分析設定ボタン200が押下されると、
図8に示す画面上などに
図9で示すモーダルウィンドウ900が表示される。
【0062】
モーダルウィンドウ900においてユーザから日時やタグの選択がなされ、読み込みボタンが押下されることで、集計部130がデータベース110からユーザが要望する分析結果(選択された日時やタグにより特定される結果)とワードの上昇度とを取得する。そして、取得した分析結果を集計した集計結果をWEBアプリケーションサーバー140に返す。
上昇度と集計結果の説明については後述する。
【0063】
そして、WEBアプリケーションサーバー140は、集計部130から取得した情報から、ランキング表300に提示する内容と、ネットワークグラフ400に描画するグラフ構造データを作成する。
【0064】
ランキング表300に提示する内容とネットワークグラフ400の作成についての説明は後述する。
【0065】
なお、読み込みボタンを押下もしくはモーダルウィンドウ900以外の場所をマウスの左クリックなどで選択されるとモーダルウィンドウ900は閉じるものとする。
【0066】
次に
図10を用いて、上昇度と集計結果の一例を説明する。集計結果は、集計部130が分析結果データ112から取得した情報を集計し、係り受け関係、名詞情報、形容詞情報、動詞情報、それぞれのワードとその頻度と上昇度などの情報である。
【0067】
上昇度はユーザがモーダルウィンドウ900で指定した期間と比較期間とのワードの出現頻度(出現回数)の比を計算することで、比較期間と比べて、指定された期間でのワードがどれだけ多く出現しているかを表す指数である。なお、比較期間は全期間や前月、前週や前日などである。
【0068】
上昇度の計算式例を
図20に示すが、これに限定されるものではなく、他の計算方法によって算出することも可能である。
【0069】
ランキング表300は、集計部130から取得した集計結果を用いて、係り受けと名詞と形容詞と動詞のそれぞれについて、頻度もしくは上昇度順にワードを提示した一覧表である。
図11を用いてランキング表300について説明する。
【0070】
図11では形容詞のランキング表の例についての図であるが、係り受けや名詞、動詞のランキング表についても同様の構成である。
【0071】
まず、ランキング表300の表示内容について説明する。ランキング表300にはワードを表示するワード欄(
図11の例では、「良い」「欲しい」「高い」などが表示されている)とワードの出現頻度を表示する頻度欄(
図11の例では、「良い」は317、「欲しい」は256、などの値が表示されている)と、ワードの上昇度を表示する上昇度欄(
図11の例では、「良い」は水平の矢印(横向き矢印)、「欲しい」は上向きの矢印、「高い」は下向きの矢印で表示されている)を備える。
【0072】
形容詞と動詞のランキング表300のワード欄には、あらかじめ単語の終止形を表示し、連結語が存在すれば必要に応じて連結語の情報を表示する。形容詞と動詞のランキング表300における連結語の表示についての説明は後述する。
【0073】
係り受けや名詞のランキング表300のワード欄には当初から連結語の情報を表示する。上昇度欄には上昇度の値により矢印などの画像を表示することで、比較期間との比をより分かりやすく提示する。例えば、上昇度が0〜1の値をとり、1に近いほど指定期間の単語または連結語の頻度が多いとする場合、上昇度が0.4未満は下向き矢印、上昇度が0.4以上0.7未満は横向き矢印、上昇度が0.7以上は上向き矢印を表示する。
【0074】
次に、ランキング表300の機能について説明する。ランキング表300には頻度が上位のワード情報を数件程度表示する。表示しきれないワード情報はページネーションで順次閲覧できるページネーションボタン320と、全体の中で何件目をランキング表300に表示しているかの情報を表示する件数表示310と、全てのワードを頻度もしくは上昇度の昇順または降順でソートしてランキング表300の表示内容を並び替えるソートボタン330と、ランキング表300内のワードを検索する検索窓340を備える。
【0075】
また、ランキング表300のワード欄がマウスの左クリックなどで選択されると、当該選択されたワードが、
図14に示すネットワークグラフ400のノードとして追加される。
【0076】
ただし、ランキング表300が形容詞または動詞の場合、ワードが選択されると、選択されたワードと紐づく連結語の情報が
図12に示すように表示され、さらにワードが選択されることでネットワークグラフ400のノードとして追加される。
【0077】
図12は
図11のワード欄の「良い」が選択されたときの例である。なお、
図12の表内がマウスの右クリックなどで選択されると元の表示に戻るものとする。
【0078】
ネットワークグラフ400とワード選択によるネットワークグラフ400へのノード追加処理についての詳細は後述する。
【0079】
次に、ネットワークグラフ400について説明する。ネットワークグラフ400は集計部130から取得した集計結果をもとに、ワードをノード、係り受け関係があるワードのノード間にエッジを付けたグラフである。
【0080】
ワードや、係り受け関係が持つ情報によってノードの大きさや色と、エッジの色と太さを決定する。
【0081】
例えば、ワードの出現頻度が高い場合にはノードの円の直径を大きくするといったように、ワードの出現頻度によってノードの円の直径を決定する。また、品詞の種類によってノードの色を決定する。また、当該エッジによりつながれるワード同士係り受け関係の頻度によってエッジの太さを決定する(例えば頻度が高ければ太くする)。なお、係り受け関係の順序を考慮し、エッジに方向を付けた有効グラフで表示してもよい。
【0082】
次に、
図13を用いてランキング表300のワードが選択された場合の処理について説明する。
【0083】
ステップS1301では、集計結果から選択されたワードの情報を取得する。
【0084】
ステップS1302では、ステップS1301で取得した情報に基づき、係り受け関係が存在するか否かを判断する。
【0085】
係り受け関係が存在する場合(ステップS1302:YES)は、処理をステップS1303に移行する。
【0086】
係り受け関係が存在しない場合(ステップS1302:NO)は、処理をステップS1304に移行する。
【0087】
ステップS1303では、既定回数の係り受け関係においてステップS1303の処理を実行し、集計結果の情報をもとにネットワークグラフ400へノードとエッジを表示する。
【0088】
係り受け関係が存在しない場合(S1304)は、選択ワードをノードとして表示する。
既定回数とは、表示するノードやエッジが多くなり過ぎないように、係り受け頻度の多い順などであらかじめ表示するエッジの数を制限するための閾値である。
図14はワード選択時の既定回数を3としたとき、
図12の形容詞のランキング表から「良いので」を選択した場合のネットワークグラフ400での表示例である。
【0089】
図14に示すように、「良いので」というノードから3つのエッジが伸び、それぞれ「すごく」、「買いました」、「高かったけど」のノードにつながっている。
【0090】
次にネットワークグラフ400におけるユーザ操作の受け付けと、それに対応する機能について説明する。
【0091】
機能は大きく分けて3つあり、ノードとエッジの追加・削除機能と、ノードのピン止め機能と、ノードの検索ワードの追加・削除機能である。以下、各機能について図を用いて説明する
まず、ノードとエッジの追加・削除機能について説明する。
【0092】
ユーザにより、例えばノードをマウスの左クリックなどで選択されるといった操作を受け付けると、選択されたノードのワードを取得し、
図13のフローチャートで示すワード選択時の処理を実行する。
【0093】
図13に示す処理により、ノードとエッジが既定回数だけ追加表示されるとともに、選択ノードから既定距離以上離れたノードとエッジをネットワークグラフ400から自動削除する。
【0094】
既定距離とは、ネットワークグラフ400に表示するエッジやノードが多くなり過ぎないように、エッジ1つ分を距離1としたときの閾値である。また、ノードやエッジの位置はネットワークグラフ400の表示枠に合わせて自動補正される。
【0095】
以後、この操作(ユーザがノードをマウスの左クリックなどで選択する操作など、ノードとエッジを追加するための所定の操作)をクリック操作と呼ぶ。
【0096】
既定回数と既定距離をそれぞれ3としたときのクリック操作の例について説明する。
【0097】
図14の「すごく」というノードをクリック操作したときの例が
図15である。
【0098】
「すごく」と係り受け関係にある「評判」と「綺麗」というノードとそれに繋がるエッジが追加表示され、全体の位置が自動補正されている。
【0099】
さらに、
図15のノード「綺麗」をクリック操作したときの例が
図16である。
【0100】
「綺麗」と係り受け関係にある「写真」と「撮れる」というノードとそれに繋がるエッジが追加表示され、既定距離以上離れている「買いました」と「高かったけど」というノードとそれに繋がるエッジが自動削除され、全体の位置が自動補正されている。すなわち、末端のノードから他の末端のノードまでを繋ぐエッジ数が所定の数を超える場合には、当該所定の数に収まるように末端のノードを削除したネットワークグラフが作成される。
次に、ノードのピン止め機能について説明する。
【0101】
ピン止め機能とは、ユーザにより、例えばノードをマウスの右クリックなどで選択されるといった操作を受け付けることでピン止めを行うことができる機能である。
【0102】
ピン止めを行うと、既定距離以上離れてもピン止めをしたノードと新たに選択するノード間に存在するエッジとノードは自動削除されなくなる。
【0103】
すなわち、末端のノードから他の末端のノードまでを繋ぐエッジ数が所定の数を超える場合であっても、当該末端のノードに対して表示し続ける旨の指示(ピン止め操作)がなされている場合、当該ノードは削除せずにネットワークグラフが作成される。
【0104】
ピン止めしたノードにはノードの上部にピン止めアイコンが表示され、再度選択することでピン止めをキャンセルすることができる。
【0105】
以後、この操作(ユーザがノードをマウスの右クリックなどで選択する操作など、ノードをピン止めするための所定の操作)をピン止め操作と呼ぶ。
【0106】
既定回数と既定距離をそれぞれ3としたときのピン止め操作の例について説明する。
【0107】
図15の「買いました」というノードをピン止め操作したあとに「綺麗」というノードをクリック操作したときの例が
図17であり、「買いました」というノードの上部にはピン止めアイコン410が表示される。また、
図16に示すネットワークグラフとは異なり、「綺麗」と「買いました」の間に存在するエッジとノードとは自動削除されず表示されたままとなっている。
【0108】
次に、ノードの検索ワード追加・削除機能について説明する。
【0109】
ユーザにより、例えばノードをマウスの左ダブルクリックなどで選択されるといった操作を受け付けると、選択されたノードのワードが検索ワードとして登録される。
【0110】
そして、登録された検索ワードを用いてテキストデータ111を検索し、検索結果を絞り込み結果表示欄500に表示する。
【0111】
検索ワードには複数のワードを登録することができ、検索ワードに登録されているノードの下部には検索ワード登録アイコン(
図18の420)が表示され、再度選択することで登録を削除することができる。また、既定距離などの制限で選択ノードがネットワークグラフ400から消去されると、自動的に登録検索ワードから該当ワードが削除される。以後、この操作(ユーザがノードをマウスの左ダブルクリックなどで選択するなど、検索ワード登録のための所定の操作)を検索操作と呼ぶ。
【0112】
検索操作の例について説明する。
図17において「綺麗」と「撮れる」と「買いました」というノードを検索操作したときのネットワークグラフの例が
図18であり、「綺麗」と「撮れる」と「買いました」というノードの下部に検索ワード登録アイコン420が表示される。そして、登録された検索ワードとモーダルウィンドウ900でユーザが指定した期間とタグを用いてテキストデータ111から「綺麗」と「撮れる」と「買いました」というワードがテキスト本文またはタイトルに存在するテキストデータを取得し、絞り込み結果表示欄500(
図19)に一覧表示される。
【0113】
次に
図19を用いて絞り込み結果表示欄500について説明する。
【0114】
絞り込み結果表示欄500は、テキストデータ111のタイトルを表示するタイトル欄と、テキスト本文を表示するテキスト欄と、タグを表示するタグ欄を備える。タイトル欄では、検索ワードと一致するワードが存在すれば、そのワードを強調表示する。また、URLが存在する場合はタイトルにURLのリンクを付けて表示する。
【0115】
強調表示の一例としては、例えば一致するワードにハイライトを付けて表示するなどである。テキスト欄では、表示するテキストが長くなり過ぎないように制限をかけるとともに、検索ワードと一致するワードが分かるように強調して表示する。
【0116】
例えば、検索ワードを含む文をのみをテキスト本文から抜き出し、検索ワードと一致するワードにハイライトを付けて表示するなどである。
【0117】
また、モーダルウィンドウ900でユーザが指定した期間を表示する指定期間表示510と、全検索結果の中で何件目を絞り込み結果表示欄500に表示しているかの情報を表示する件数表示520と、表示しきれなかった検索結果をページネーションで順次閲覧できるページネーションボタン530と、モーダルウィンドウ900でユーザが指定したタグや、テキストのタイトルで並び替えを行うソートボタン540と、絞り込み結果表示欄500内を検索する検索窓550を備える。
【0118】
この絞り込み結果表示欄500を用いることで、ユーザは、大規模テキストから意図した情報または興味ある情報を確認することができ、情報を検索するコストを少なくして大規模テキストから情報を取得することができる。
【0119】
以上説明したように、本発明によれば、テキスト絞り込みシステム100のユーザは、モーダルウィンドウ900を介して設定をすることでシステムの利用が可能になり、ランキング表300とネットワークグラフ400と絞り込み結果表示欄500を相互に確認し操作することで、自身が望む情報を取得するための検索ワードを発見することができ、大規模テキストから該当する情報を効率的に発見することができるようになる。
【0120】
また、上記の説明では、ネットワークグラフ400におけるノードの色付け例を、品詞の種類としたが、ワードが持つネガティブ要素やポジティブ要素などの評価極性を考慮した色付けを行い提示することで、情報が肯定的な内容なのかもしく否定的な内容なのかを判断に役立てることができる。
【0121】
他に、テキストデータ111において、テキストデータを作成した人物の年齢や性別などのユーザ属性を保持しておくことで、絞り込み結果表示欄500に当該ユーザ属性を表示し、年齢別または性別などの情報でまとめて提示することができる。
【0122】
なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。
【0123】
また、本発明におけるプログラムは、
図5、
図6、
図13の処理をコンピュータに実行させるプログラムである。なお、本発明におけるプログラムは、
図5、
図6、
図13の各処理ごとのプログラムであってもよい。
【0124】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
【0125】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
【0126】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
【0127】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0128】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0129】
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0130】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。