【文献】
松永 聡彦,北村 美穂子,村田 稔樹,改版文書翻訳システムにおける文脈を考慮した文対応付け手法,電子情報通信学会技術研究報告 Vol.103 No.280,日本,社団法人電子情報通信学会,2003年 8月22日,第103巻第280号【ISSN】0913-5685,p.43-p.48
(58)【調査した分野】(Int.Cl.,DB名)
文書における所定の範囲内の文章から、文ごとに前記文を識別する文識別情報と前記文が属する見出しを識別する見出し識別情報とを前記文に対応付けた、文章情報を生成する文章情報生成部と、
前記文章情報を記憶する文章情報記憶部と、
前記文章情報記憶部に記憶された、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、文同士の関連値であって、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる前記関連値を計算し、前記第1の文章情報に含まれる第1の文識別情報と前記第2の文章情報に含まれる第2の文識別情報と前記関連値とを対応付けた関連値情報を生成する関連値情報生成部と、
前記関連値情報を記憶する関連値情報記憶部と、
前記第1の文を表示させるための第1の文章表示領域と前記第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する表示制御部と、
前記文章情報記憶部に記憶された前記第1の文を文単位で指定可能に前記第1の文章表示領域に記憶させ、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における前記第2の文識別情報を抽出し、前記第2の文識別情報に対応付けられた前記見出し識別情報が示す文および前記第2の文識別情報が識別する文を前記文章情報記憶部から読み込み、前記見出し識別情報が示す文を見出しとするとともに前記第2の文識別情報が識別する文を前記候補文として、前記見出しおよび前記候補文を前記候補文表示領域に記憶させるトレース管理部と、
を備えることを特徴とするトレース支援装置。
前記トレース管理部は、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報が含まれる関連値情報における、前記第2の文識別情報および関連値を、前記関連値が大きな順に所定数分抽出する
ことを特徴とする請求項1に記載のトレース支援装置。
前記トレース管理部は、前記第2の文において、前記候補文よりも前の文および前記候補文よりも後の文またはいずれか一方の文を、前記候補文表示領域にさらに記憶させる
ことを特徴とする請求項1または請求項2に記載のトレース支援装置。
前記表示制御部は、前記候補文表示領域および前記対応付文表示領域と前記第2の文を表示させるための第2の文章表示領域とを、相互切り替え可能に前記表示記憶領域内にさらに設定し、
前記トレース管理部は、前記候補文表示領域および前記対応付文表示領域が前記表示記憶領域内に設定されている場合に、前記候補文表示領域における前記候補文または前記対応付文表示領域における前記対応付文が指定されることに応じて、前記候補文表示領域および前記対応付文表示領域から前記第2の文章表示領域に切り替えて、前記候補文または前記対応付文を含む前記第2の文を前記第2の文章表示領域に記憶させる一方、
前記第2の文章表示領域が前記表示記憶領域内に設定されている場合に、前記第2の文章表示領域における一文が任意に指定されることに応じて、前記第2の文章表示領域から前記前記候補文表示領域および前記対応付文表示領域に切り替えて、前記候補文を前記候補文表示領域に記憶させるとともに前記対応付文を前記対応付文表示領域に記憶させる
ことを特徴とする請求項4に記載のトレース支援装置。
文章情報生成部が、文書における所定の範囲内の文章から、文ごとに前記文を識別する文識別情報と前記文が属する見出しを識別する見出し識別情報とを前記文に対応付けた、文章情報を生成し、前記文章情報を文章情報記憶部に記憶させる文章情報生成ステップと、
関連値情報生成部が、前記文章情報記憶部に記憶された、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、文同士の関連値であって、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる前記関連値を計算し、前記第1の文章情報に含まれる第1の文識別情報と前記第2の文章情報に含まれる第2の文識別情報と前記関連値とを対応付けた関連値情報を生成し、前記関連値情報を関連値情報記憶部に記憶させる関連値情報生成ステップと、
表示制御部が、前記第1の文を表示させるための第1の文章表示領域と前記第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する表示領域設定ステップと、
トレース管理部が、前記文章情報記憶部に記憶された前記第1の文を文単位で指定可能に前記第1の文章表示領域に記憶させ、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における前記第2の文識別情報を抽出し、前記第2の文識別情報に対応付けられた前記見出し識別情報が示す文および前記第2の文識別情報が識別する文を前記文章情報記憶部から読み込み、前記見出し識別情報が示す文を見出しとするとともに前記第2の文識別情報が識別する文を前記候補文として、前記見出しおよび前記候補文を前記候補文表示領域に記憶させるトレース管理ステップと、
を有することを特徴とするトレース支援方法。
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1記載のトレーサビリティ装置は、ドキュメント単位での対応付けを行う装置であり、ドキュメント間の文の対応関係を利用者に提示することができない。また、特許文献2記載の文書検索装置は、文書検索において、文書間の関連度情報に基づいて、関連度が高い文書の情報を表示させる装置である。よって、この文書検索装置も、ドキュメント単位での関連性を取得する装置であるため、ドキュメント間の文の対応関係を利用者に提示することができない。
つまり、これら従来技術では、ドキュメント間の文の対応関係を把握するために、利用者がドキュメントの内容を詳しく見比べる必要がある。
【0006】
したがって、従来、一連のドキュメントにおける文のトレーサビリティを向上させる技術が望まれていた。
そこで、本発明は、上記事情に鑑みてなされたものであり、ドキュメント間の文単位での高いトレーサビリティを実現する、トレース支援装置、トレース支援システム、トレース支援方法、およびトレース支援プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
[1]上記の課題を解決するため、本発明の一態様であるトレース支援装置は、文書における所定の範囲内の文章から、文ごとに前記文を識別する文識別情報と前記文が属する見出しを識別する見出し識別情報とを前記文に対応付けた、文章情報を生成する文章情報生成部と、前記文章情報を記憶する文章情報記憶部と、前記文章情報記憶部に記憶された、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、文同士の関連値
であって、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる前記関連値を計算し、前記第1の文章情報に含まれる第1の文識別情報と前記第2の文章情報に含まれる第2の文識別情報と前記関連値とを対応付けた関連値情報を生成する関連値情報生成部と、前記関連値情報を記憶する関連値情報記憶部と、前記第1の文を表示させるための第1の文章表示領域と前記第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する表示制御部と、前記文章情報記憶部に記憶された前記第1の文を文単位で指定可能に前記第1の文章表示領域に記憶させ、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における前記第2の文識別情報を抽出し、前記第2の文識別情報に対応付けられた前記見出し識別情報が示す文および前記第2の文識別情報が識別する文を前記文章情報記憶部から読み込み、前記見出し識別情報が示す文を見出しとするとともに前記第2の文識別情報が識別する文を前記候補文として、前記見出しおよび前記候補文を前記候補文表示領域に記憶させるトレース管理部と、を備えることを特徴とする。
【0008】
[2]上記[1]に記載のトレース支援装置において、前記トレース管理部は、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報が含まれる関連値情報における、前記第2の文識別情報および関連値を、前記関連値が大きな順に所定数分抽出することを特徴とする。
[3]上記[1]または[2]に記載のトレース支援装置において、前記トレース管理部は、前記第2の文において、前記候補文よりも前の文および前記候補文よりも後の文またはいずれか一方の文を、前記候補文表示領域にさらに記憶させることを特徴とする。
[4]上記[1]から[3]までのいずれか一項に記載のトレース支援装置において、前記表示制御部は、前記第2の文における対応付文を表示させるための対応付文表示領域を、前記表示記憶領域内にさらに設定し、前記トレース管理部は、前記候補文を選択可能に前記候補文表示領域に記憶させ、前記候補文が選択された場合に、前記候補文を前記対応付文表示領域に記憶させるとともに、前記候補文表示領域から前記候補文を削除することを特徴とする。
[5]上記[4]に記載のトレース支援装置において、前記表示制御部は、前記候補文表示領域および前記対応付文表示領域と前記第2の文を表示させるための第2の文章表示領域とを、相互切り替え可能に前記表示記憶領域内にさらに設定し、前記トレース管理部は、前記候補文表示領域および前記対応付文表示領域が前記表示記憶領域内に設定されている場合に、前記候補文表示領域における前記候補文または前記対応付文表示領域における前記対応付文が指定されることに応じて、前記候補文表示領域および前記対応付文表示領域から前記第2の文章表示領域に切り替えて、前記候補文または前記対応付文を含む前記第2の文を前記第2の文章表示領域に記憶させる一方、前記第2の文章表示領域が前記表示記憶領域内に設定されている場合に、前記第2の文章表示領域における一文が任意に指定されることに応じて、前記第2の文章表示領域から前記前記候補文表示領域および前記対応付文表示領域に切り替えて、前記候補文を前記候補文表示領域に記憶させるとともに前記対応付文を前記対応付文表示領域に記憶させることを特徴とする。
【0009】
[6]上記の課題を解決するため、本発明の一態様であるトレース支援システムは、トレース支援装置と表示装置とを含むトレース支援システムにおいて、前記トレース支援装置は、文書における所定の範囲内の文章から、文ごとに前記文を識別する文識別情報と前記文が属する見出しを識別する見出し識別情報とを前記文に対応付けた、文章情報を生成する文章情報生成部と、前記文章情報を記憶する文章情報記憶部と、前記文章情報記憶部に記憶された、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、文同士の関連値
であって、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる前記関連値を計算し、前記第1の文章情報に含まれる第1の文識別情報と前記第2の文章情報に含まれる第2の文識別情報と前記関連値とを対応付けた関連値情報を生成する関連値情報生成部と、前記関連値情報を記憶する関連値情報記憶部と、前記第1の文を表示させるための第1の文章表示領域と前記第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する表示制御部と、前記文章情報記憶部に記憶された前記第1の文を文単位で指定可能に前記第1の文章表示領域に記憶させ、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における前記第2の文識別情報を抽出し、前記第2の文識別情報に対応付けられた前記見出し識別情報が示す文および前記第2の文識別情報が識別する文を前記文章情報記憶部から読み込み、前記見出し識別情報が示す文を見出しとするとともに前記第2の文識別情報が識別する文を前記候補文として、前記見出しおよび前記候補文を前記候補文表示領域に記憶させるトレース管理部と、を備え、前記表示装置は、前記表示記憶領域に記憶された情報を取り込んで表示する表示部を備えることを特徴とする。
【0010】
[7]上記の課題を解決するため、本発明の一態様であるトレース支援方法は、文章情報生成部が、文書における所定の範囲内の文章から、文ごとに前記文を識別する文識別情報と前記文が属する見出しを識別する見出し識別情報とを前記文に対応付けた、文章情報を生成し、前記文章情報を文章情報記憶部に記憶させる文章情報生成ステップと、関連値情報生成部が、前記文章情報記憶部に記憶された、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、文同士の関連値
であって、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる前記関連値を計算し、前記第1の文章情報に含まれる第1の文識別情報と前記第2の文章情報に含まれる第2の文識別情報と前記関連値とを対応付けた関連値情報を生成し、前記関連値情報を関連値情報記憶部に記憶させる関連値情報生成ステップと、表示制御部が、前記第1の文を表示させるための第1の文章表示領域と前記第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する表示領域設定ステップと、トレース管理部が、前記文章情報記憶部に記憶された前記第1の文を文単位で指定可能に前記第1の文章表示領域に記憶させ、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における前記第2の文識別情報を抽出し、前記第2の文識別情報に対応付けられた前記見出し識別情報が示す文および前記第2の文識別情報が識別する文を前記文章情報記憶部から読み込み、前記見出し識別情報が示す文を見出しとするとともに前記第2の文識別情報が識別する文を前記候補文として、前記見出しおよび前記候補文を前記候補文表示領域に記憶させるトレース管理ステップと、を有することを特徴とする。
【0011】
[8]上記の課題を解決するため、本発明の一態様であるトレース支援プログラムは、文章情報記憶部および関連値情報記憶部を備えるコンピュータを、文書における所定の範囲内の文章から、文ごとに前記文を識別する文識別情報と前記文が属する見出しを識別する見出し識別情報とを前記文に対応付けた、文章情報を生成し、前記文章情報を前記文章情報記憶部に記憶させる文章情報生成部と、前記文章情報記憶部に記憶された、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、文同士の関連値
であって、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる前記関連値を計算し、前記第1の文章情報に含まれる第1の文識別情報と前記第2の文章情報に含まれる第2の文識別情報と前記関連値とを対応付けた関連値情報を生成し、前記関連値情報を前記関連値情報記憶部に記憶させる関連値情報生成部と、前記第1の文を表示させるための第1の文章表示領域と前記第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する表示制御部と、前記文章情報記憶部に記憶された前記第1の文を文単位で指定可能に前記第1の文章表示領域に記憶させ、前記第1の文章表示領域から一文が任意に指定された場合に、前記関連値情報記憶部から、前記一文に対応付けられた前記第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における前記第2の文識別情報を抽出し、前記第2の文識別情報に対応付けられた前記見出し識別情報が示す文および前記第2の文識別情報が識別する文を前記文章情報記憶部から読み込み、前記見出し識別情報が示す文を見出しとするとともに前記第2の文識別情報が識別する文を前記候補文として、前記見出しおよび前記候補文を前記候補文表示領域に記憶させるトレース管理部と、として機能させる。
【発明の効果】
【0012】
本発明によれば、ドキュメント間の文単位での高いトレーサビリティを実現することができる。
【発明を実施するための形態】
【0014】
以下、本発明を実施するための形態について、図面を参照して詳細に説明する。
[1 構成]
図1は、本発明の一実施形態であるトレース支援システムの機能構成を示すブロック図である。同図に示すように、トレース支援システム1は、トレース支援装置10と表示装置20とケーブル30とを備える。
【0015】
トレース支援装置10は、二つの文書(第1の文書および第2の文書)を取り込み、文書ごとに、各文をその属性とともに識別可能に管理する。文書(ドキュメント)は、文章を含むデータである。文章は、一つまたは複数の文を有する。文は、文字列であり、文字、記号、または文字および記号の組み合わせである。文書は、例えば、テキストデータ、Hyper Text Markup Language(HTML)等のマークアップ言語で記述されたデータである。
【0016】
また、トレース支援装置10は、第1の文書の文(第1の文)と第2の文書の文(第2の文)との全ての組み合わせについて、文同士の関連値を計算し、全ての関連値を管理する。
【0017】
トレース支援装置10は、第1の文書の各文を指定可能に表示装置20に表示させる。そして、利用者によって所望の文が指定された場合、その文に対応する関連値のうち、所定レベルを超える関連度(類似度)を示す関連値に対応付けられた第2の文を候補文として選定する。そして、トレース支援装置10は、候補文を選択可能に表示装置20に表示させる。また、トレース支援装置10は、候補文が属する見出しと、候補文よりも前の文および候補文よりも後の文またはいずれか一方の文とを、候補文に対応付けて表示装置20に表示させる。
【0018】
また、トレース支援装置10は、利用者によって候補文が選択された場合、現在指定されている第1の文書における所望の文に、選択された候補文を対応付け、この対応関係を管理する。
【0019】
図1に示すとおり、トレース支援装置10は、文書取得部11と、文章情報生成部12と、文章情報記憶部13と、関連値情報生成部14と、関連値情報記憶部15と、表示制御部16と、トレース管理部17と、対応付情報記憶部18と、操作部19とを備える。
【0020】
操作部19は、利用者による操作に応じてトレース支援装置10に所望の指示情報や入力データを供給する入力装置である。操作部19は、例えば、マウス等のポインティングデバイス、キーボード、タッチパネルにより実現される。
【0021】
文書取得部11は、文書を取り込む。例えば、文書取得部11は、ネットワーク等の通信線を介して文書を取り込む。または、文書取得部11は、文書が記録された記録媒体を介して文書を取り込む。または、文書取得部11は、操作部19が操作されることにより操作部19から供給される文書を取り込む。そして、文書取得部11は、取り込んだ文書を文章情報生成部12に供給する。
【0022】
文章情報生成部12は、文書取得部11から供給される文書を取り込む。そして、文章情報生成部12は、文書における所定の範囲内の文章から、文ごとに文の属性を示すとともに文を識別する識別情報をその文に対応付けた、文章情報を生成し、この文章情報を文章情報記憶部13に供給する。所定範囲内の文章は、文書全体における文章、または、操作部19が操作されることにより所望に指定される範囲の文章である。文の属性は、文書におけるその文の位置付けを示す情報であり、例えば、文が見出し(ヘッドライン)であるか否か、その文が見出しでない場合にどの見出しに対応付けられるかを示す情報である。見出しは、例えば、章、節、項を示す情報である。文章情報の具体例については、後述する。
【0023】
文章情報記憶部13は、文章情報生成部12から供給される文章情報を文書ごとに記憶する。文章情報記憶部13は、例えば、磁気ハードディスク装置または半導体記憶装置により実現される。
【0024】
トレース支援装置10は、第1の文書を文書取得部11に取得させ、文章情報生成部12に第1の文書についての第1の文章情報を生成させ、この第1の文章情報を文章情報記憶部13に記憶させる。また、トレース支援装置10は、第2の文書を文書取得部11に取得させ、文章情報生成部12に第2の文書についての第2の文章情報を生成させ、この第2の文章情報を文章情報記憶部13に記憶させる。
【0025】
関連値情報生成部14は、文章情報記憶部13に記憶された、第1の文章情報に含まれる第1の文と、第2の文章情報に含まれる第2の文との、全ての組み合わせによる文同士の関連値を計算する。そして、関連値情報生成部14は、第1の文章情報に含まれる第1の文識別情報と、第2の文章情報に含まれる第2の文識別情報と、文同士の関連値とを対応付けた関連値情報を生成し、この関連値情報を関連値情報記憶部15に供給する。関連値情報の具体例については、後述する。
【0026】
関連値情報記憶部15は、関連値情報生成部14から供給される関連値情報を記憶する。関連値情報記憶部15は、例えば、磁気ハードディスク装置または半導体記憶装置により実現される。
【0027】
表示制御部16は、表示装置20に画像を表示させるための画像記憶部(不図示)を備える。画像記憶部は、例えば、フレームメモリ等の画像メモリにより実現される。表示制御部16は、第1の文章表示領域と、候補文表示領域と、対応付文表示領域とに区分される1画像フレーム分の表示記憶領域を、画像記憶部に設ける。また、表示制御部16は、候補文表示領域および対応付文表示領域を合わせた表示領域と同一の表示領域を有する第2の文章表示領域を、候補文表示領域および対応付文表示領域を合わせた表示領域と相互切り替え可能に、画像記憶部に設ける。
【0028】
第1の文章表示領域は、第1の文章情報に含まれる第1の文を表示装置20に表示させるための領域である。候補文表示領域は、第2の文章情報に含まれる第2の文における候補文と、この候補文が属する見出しと、その候補文よりも前の文および候補文よりも後の文またはいずれか一方の文とを、表示装置20に表示させるための領域である。対応付文表示領域は、操作部19が操作されることにより選択された候補文を対応付文として表示させるための領域である。
【0029】
また、表示制御部16は、操作部19の操作に応じて指定される表示記憶領域上の位置に、カーソル(ポインタ)の図形データ(以下、カーソルという。)を記憶させる。
【0030】
トレース管理部17は、文章情報記憶部13に記憶された第1の文を文単位で指定可能に、表示制御部16の第1の文章表示領域に記憶させる。例えば、トレース管理部17は、文章情報記憶部13に記憶された第1の文における各文を、操作部19の操作に応じて指定可能に、表示制御部16の第1の文章表示領域に記憶させる。
【0031】
トレース管理部17は、操作部19が操作されることにより第1の文章表示領域に記憶された一文(所望の一つの文)が指定されたことを検出すると、関連値情報記憶部15から、その一文に対応付けられた第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における、一組または複数組の第2の文識別情報および関連値を抽出する。操作部19によって一文が指定されるとは、例えば、第1の文章表示領域においてカーソルの一部または全部が一文に重なった状態で、マウスの選択ボタンがクリックされることである。そして、トレース管理部17は、一組または複数組の第2の文識別情報および関連値を、関連値が大きな順(関連度が高い順)に順位付けする。ただし、関連値が同一であるものについては、第2の文書における文の並び順に順位付けする。
【0032】
また、トレース管理部17は、指定された一文に含まれる文字(記号を含む。)の属性を変更したり、文字に装飾を付加したりして、第1の文章表示領域に記憶された一文を更新する。文字の属性は、例えば、文字色、書体、文字の大きさ、背景色である。装飾は、例えば、下線、枠である。
【0033】
そして、トレース管理部17は、抽出した第2の文識別情報に対応する属性に応じた文(見出し)と、その第2の文識別情報が示す文(候補文)と、第2の文において候補文よりも前の文(前部参照文)および候補文よりも後の文(後部参照文)またはいずれか一方の文とを、文章情報記憶部13から読み込む。この、文章情報記憶部13から読み込む文を参照文と呼ぶ。前部参照文は、候補文の直前にある一つまたは複数(例えば二つ)の文である。同様に、後部参照文は、候補文の直後にある一つまたは複数(例えば二つ)の文である。
【0034】
そして、トレース管理部17は、見出しと、候補文と、参照文と、選択ボタンの図形データ(以下、選択ボタンという。)と、順位と、関連値とを、表示制御部16の候補文表示領域に記憶させる。選択ボタンは、カーソルによって候補文を選択させるためのウィジェット(Widget)である。選択ボタンは、例えば、チェックボックス、ラジオボタン、またはトグルボタンである。ただし、トレース管理部17は、候補文に含まれる文字(記号を含む。)の属性を変更したり、文字に装飾を付加したりして、候補文表示領域に記憶させる。
【0035】
トレース管理部17は、操作部19が操作されることにより候補文表示領域に記憶された候補文が選択されたことを検出すると、候補文を対応付文として表示制御部16の対応付文表示領域に記憶させるとともに、その候補文に対応する、見出しと参照文と選択ボタンと順位と関連値とを対応付文表示領域に記憶させる。ただし、トレース管理部17は、対応付文に含まれる文字(記号を含む。)の属性を変更したり、文字に装飾を付加したりして、対応付文表示領域に記憶させる。候補文表示領域に記憶された候補文が選択されるとは、候補文表示領域において候補文に対応付けられた選択ボタンにカーソルの一部または全部が重なった状態で、マウスの選択ボタンがクリックされることである。そして、トレース管理部17は、候補文表示領域から対応付文である候補文と、この候補文に対応する、見出しと参照文と選択ボタンと順位と関連値とを削除する。
【0036】
そして、トレース管理部17は、表示制御部16の第1の文章表示領域に記憶された第1の文において指定されている一文に対応付けられた文識別情報(第1の文識別情報)と、対応付文に対応付けられた文識別情報(第2の文識別情報)とを対応づけた対応付情報を生成し、この対応付情報を対応付情報記憶部18に供給する。
【0037】
トレース管理部17は、候補文表示領域および対応付文表示領域が表示制御部16の表示記憶領域内に設定されている場合に、候補文表示領域における候補文または対応付文表示領域における対応付文が指定されることに応じて、候補文表示領域および対応付文表示領域から第2の文章表示領域に切り替える。そして、トレース管理部17は、指定された候補文または対応付文を含む第2の文を第2の文章表示領域に記憶させる。候補文表示領域における候補文が指定されるとは、例えば、候補文表示領域においてカーソルの一部または全部が候補文に重なった状態で、マウスの選択ボタンがクリックされることである。同様に、対応付文表示領域における対応付文が指定されるとは、例えば、対応付文表示領域においてカーソルの一部または全部が対応付文に重なった状態で、マウスの選択ボタンがクリックされることである。そして、トレース管理部17は、候補文または対応付文に対応する選択ボタン、順位、および関連値を、候補文または対応付文に対応付けて第2の文章表示領域に記憶させる。ただし、トレース管理部17は、対応付文に対応する選択ボタンに、この選択ボタンが選択されたことを示すチェックマークを付加して記憶させる。また、トレース管理部17は、候補文および対応付文を除く各文に、選択ボタンを対応付けて第2の文章表示領域に記憶させる。
【0038】
また、トレース管理部17は、第2の文章表示領域が表示制御部16の表示記憶領域内に設定されている場合に、操作部19が操作されることにより第2の文章表示領域に記憶された文が選択されたことを検出すると、その文を対応付文として対応付文表示領域に記憶させる。ただし、トレース管理部17は、対応付文に含まれる文字(記号を含む。)の属性を変更したり、文字に装飾を付加したりして、対応付文表示領域に記憶させる。第2の文章表示領域に記憶された文が選択されるとは、第2の文章表示領域において文に対応付けられた選択ボタンにカーソルの一部または全部が重なった状態で、マウスの選択ボタンがクリックされることである。そして、トレース管理部17は、チェックマークをクリックされた選択ボタンに付加して第2の文章表示領域に記憶させる。
【0039】
また、トレース管理部17は、第2の文章表示領域が表示制御部16の表示記憶領域内に設定されている場合に、第2の文章表示領域における一文が任意に指定されることに応じて、第2の文章表示領域から前記候補文表示領域および対応付文表示領域に切り替えて、候補文を候補文表示領域に記憶させるとともに対応付文を対応付文表示領域に記憶させる。第2の文章表示領域における一文が任意に指定されるとは、例えば、第2の文章表示領域においてカーソルの一部または全部が一文に重なった状態で、マウスの選択ボタンがクリックされることである。
【0040】
対応付情報記憶部18は、トレース管理部17から供給される対応付情報を記憶する。対応付情報記憶部18は、例えば、磁気ハードディスク装置または半導体記憶装置により実現される。
【0041】
表示装置20は、表示部21を備える。表示装置20は、ディスプレイ装置であり、例えば、液晶表示装置により実現される。表示装置20は、トレース支援装置10の表示制御部16からケーブル30を通して供給される表示データを取り込み、この表示データを表示部21に供給する。表示データは、表示制御部16の画像記憶部に記憶された表示記憶領域のデータである。表示部21は、表示データを取り込んで表示する。表示部21は、例えば、液晶表示パネルにより実現される。
【0042】
ケーブル30は、トレース支援装置10が出力する表示データを表示装置20に供給する信号ケーブルである。
【0043】
[2 データ構成]
図2は、文章情報記憶部13が記憶する文章情報のデータ構成を示す図である。同図に示すように、文章情報は、「
文管理情報」と「文」とを対応付けたデータテーブルである。「文管理情報」は、対応する文の属性を示すとともに文を識別する情報である。具体的に、「
文管理情報」は、「文識別情報」および「見出し識別情報」を有する。「文識別情報」は、対応する文を識別する情報である。「見出し識別情報」は、対応する文が属する文(上位の文)、言い換えると、対応する文が属する見出しの文識別情報である。「文」は、文書における所定の範囲内の文章に含まれる一つの文である。
【0044】
図3は、関連値情報記憶部15が記憶する関連値情報のデータ構成を示す図である。同図に示すように、関連値情報は、第1の文章情報に含まれる第1の文と第2の文章情報に含まれる第2の文との、全ての組み合わせによる文同士の「関連値」を、第1の文の「第1の文識別情報」および第2の文の「第2の文識別情報」に対応付けたデータテーブルである。同図において、行方向の文識別情報が第1の文の「第1の文識別情報」であり、列方向の文識別情報が第2の文の「第2の文識別情報」である。
【0045】
図4は、対応付情報記憶部18が記憶する対応付情報のデータ構成を示す図である。同図に示すように、対応付情報は、第1の文章情報に含まれる所望の一文に対応付けられた第1の文識別情報と、第2の文章情報に含まれる対応付文に対応付けられた第2の文識別情報とを対応付けたデータテーブルである。
【0046】
[3 表示記憶領域]
図5は、表示制御部16の画像記憶部に設けられる表示記憶領域を模式的に示す図である。同図において、1画像フレームに対応する表示記憶領域5aは、第1の文章表示領域51と、候補文表示領域52と、対応付文表示領域53とに区分される。
また、表示記憶領域5bは、表示記憶領域5aにおいて、候補文表示領域52および対応付文表示領域53を第2の文章表示領域54に切り替えたものである。
【0047】
図6は、表示記憶領域における第1の文章表示領域に記憶された表示データを示す図である。同図において、第1の文章表示領域6は、第1の文章情報に含まれる第1の文を記憶する。同図に示すように、第1の文章表示領域6は、文ごとに改行して表示されるように、第1の文を記憶する。なお、第1の文章表示領域6は、見出しを除く文が改行せずに表示されるように、第1の文を記憶してもよい。また、同図において、指定された一文61は、その文字の属性が、他の文の文字の属性と異なっている。
【0048】
図7は、表示記憶領域における候補文表示領域に展開された表示データを示す図である。同図において、候補文表示領域7は、候補文71と、見出し72と、前部参照文73と、後部参照文74と、選択ボタン75と、順位76と、関連値77とを記憶する。候補文71は、第2の文章情報に含まれる第2の文における候補文である。候補文71は、その文字の属性が、他の文の文字の属性と異なっている。見出し72は、候補文71が属する見出しである。前部参照文73は、第2の文書において候補文71よりも前にある参照文である。後部参照文74は、第2の文書において候補文71よりも後にある参照文である。選択ボタン75は、候補文71を選択させるためのチェックボックスである。順位76は、トレース管理部17が選定した候補文の関連値に応じた順位である。関連値77は、第1の文章表示領域6に記憶された、指定された一文61と候補文71との関連値である。
【0049】
図8は、表示記憶領域における対応付文表示領域に展開された表示データを示す図である。同図において、対応付文表示領域8は、対応付文81と、見出し82と、前部参照文83と、後部参照文84と、選択ボタン85と、順位86と、関連値87とを記憶する。対応付文81は、トレース管理部17が対応付けした対応付文である。対応付文81は、その文字の属性が、他の文の文字の属性と異なっている。見出し82、前部参照文83、後部参照文84、選択ボタン85、順位86、および関連値87は、
図7に示した、見出し72、前部参照文73、後部参照文74、選択ボタン75、順位76、および関連値77と同一のデータである。選択ボタン75には、対応付けがされたことを示すチェックマークMが記憶されている。
【0050】
図9は、表示記憶領域における第2の文章表示領域に記憶された表示データを示す図である。同図において、第2の文章表示領域9は、第2の文章情報に含まれる第2の文を記憶する。同図に示すように、第2の文章表示領域9は、文ごとに改行して表示されるように、第2の文を記憶する。なお、第2の文章表示領域9は、見出しを除く文が改行せずに表示されるように、第2の文を記憶してもよい。
また、候補文表示領域に候補文が記憶されている場合、その候補文に該当する文91の文字の属性が、他の文の文字の属性と異なる。また、第2の文章表示領域9は、候補文に対応付けられた、順位92、関連値93、および選択ボタン94を文91に対応付けて記憶する。
また、対応付文表示領域に対応付文が記憶されている場合、その対応付文に該当する文95の文字の属性が、他の文の文字の属性と異なる。また、第2の文章表示領域9は、対応付文に対応付けられた、順位96、関連値97、選択ボタン98、およびチェックマークMを文95に対応付けて記憶する。
また、第2の文章表示領域9は、候補文および対応付文を除く各文に、選択ボタンを対応付けて記憶する。
【0051】
[4 処理]
[4−1.文章情報生成処理]
文章情報生成部12は、文書取得部11から取得した文書における所定の範囲内の文章を、文ごとに区分する。例えば、文章情報生成部12は、文章から改行コードおよび句点コードを検出することによって文の区切りを判断し、文章を文ごとに区分する。
次に、文章情報生成部12は、文を識別する文識別情報を各文に対応付ける。
【0052】
次に、文章情報生成部12は、文ごとに、この文が見出しであるか否かを判定する。例えば、文章情報生成部12は、“第 章”、“第 節”等の見出しのテンプレートをあらかじめ記憶しておき、文と各テンプレートとを比較して一致する場合に、その文が見出しであると判定する。または、文書がマークアップ言語により記述されたデータである場合、文章情報生成部12は、文のタグ解析を実行することにより、その文が見出しであるか否かを判定する。
【0053】
次に、文章情報生成部12は、見出しでないと判定した文(本文)に、この本文が属する見出しに対応する文識別情報を見出し識別情報として本文に対応付けることにより、文章情報を生成する。すなわち、文章情報生成部12は、文書における所定の範囲内の文章から、文ごとにこの文を識別する文識別情報とその文が属する見出しを識別する見出し識別情報とをその文に対応付けた、文章情報を生成する。
【0054】
[4−2.関連値計算処理]
関連値情報生成部14は、第1の文章情報に含まれる第1の文と第2の文章情報に含まれる第2の文との全ての組み合わせによる文同士の関連値を、例えば、単語の出現頻度および逆文書頻度(Term Frequency−Inverse Document Frequency;TF−IDF)法によって計算する。すなわち、関連値情報生成部14が計算する関連値は、対象となる二つの文それぞれに出現する単語の出現確率が似ているほど、また、特徴的な単語が二つの文に共通に含まれる割合が高いほど、大きな値となる。
【0055】
具体的に、関連値情報生成部14は、例えば形態素解析処理を実行することによって文を単語に分解する。次に、関連値情報生成部14は、公知のTF−IDF法を適用し、文に出現する単語の出現頻度を計算し、また、その文における単語の重要度を計算する。関連値情報生成部14は、対象となる二つの文において、単語の出現頻度が近いほど大きく、重要度が強い単語が共通に含まれるほど大きい値となる関連値を求める。
【0056】
以上説明したとおり、本発明の一実施形態であるトレース支援装置10は、第1の文書および第2の文書それぞれについて、文書における所定の範囲内の文章から、文ごとにこの文を識別する文識別情報とその文が属する見出しを識別する見出し識別情報とをその文に対応付けた、文章情報を生成する。
そして、トレース支援装置10は、第1の文書に対応する第1の文章情報に含まれる第1の文と第2の文書に対応する第2の文章情報に含まれる第2の文との、全ての組み合わせによる文同士の関連値を計算する。そして、トレース支援装置10は、第1の文章情報に含まれる第1の文識別情報と第2の文章情報に含まれる第2の文識別情報と関連値とを対応付けた関連値情報を生成する。
【0057】
すなわち、本実施形態であるトレース支援装置10は、文同士の関連度を取得するようにした。
【0058】
そして、トレース支援装置10は、第1の文を表示させるための第1の文章表示領域と、第2の文における候補文を表示させるための候補文表示領域とを、表示記憶領域内に設定する。
そして、トレース支援装置10は、第1の文を文単位で指定可能に第1の文章表示領域に記憶させ、第1の文章表示領域から一文が任意に指定された場合に、一文に対応付けられた第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における第2の文識別情報を抽出する。そして、トレース支援装置10は、第2の文識別情報に対応付けられた見出し識別情報が示す文および第2の文識別情報が識別する文を取得する。そして、トレース支援装置10は、見出し識別情報が示す文を見出しとするとともに第2の文識別情報が識別する文を候補文として、見出しおよび候補文を候補文表示領域に記憶させる。
【0059】
すなわち、本実施形態であるトレース支援装置10は、第1の文書において任意に指定された一文に対して、一定レベルを超える関連度を有する、言い換えると類似する候補文を表示させるようにした。
このように構成したことにより、第1の文書において所望に指定した一文に類似する文を第2の文書から探す作業(トレース)の作業効率を高くすることができる。
【0060】
さらに、トレース支援装置10は、第2の文において、候補文よりも前の文およびこの候補文よりも後の文またはいずれか一方の文を、候補文表示領域にさらに記憶させる。
このように構成したことにより、候補文の前後関係を利用者に提示することができるため、文のトレーサビリティを更に向上させることができる。
【0061】
さらに、トレース支援装置10は、第2の文における対応付文を表示させるための対応付文表示領域を、表示記憶領域内にさらに設定し、候補文を選択可能に候補文表示領域に記憶させ、候補文が選択された場合に、候補文を対応付文表示領域に記憶させるとともに、候補文表示領域から候補文を削除する。
このように構成したことにより、提示された候補文を確認した利用者によって直接、所望の一文と候補文とを対応付けることができ、精度が高いトレースを行うことができる。
【0062】
さらに、トレース支援装置10は、候補文表示領域および対応付文表示領域と第2の文を表示させるための第2の文章表示領域とを、相互切り替え可能に表示記憶領域内にさらに設定する。そして、トレース支援装置10は、候補文表示領域および対応付文表示領域が表示記憶領域内に設定されている場合に、候補文表示領域における候補文または対応付文表示領域における対応付文が指定されることに応じて、候補文表示領域および対応付文表示領域から第2の文章表示領域に切り替えて、候補文または対応付文を含む第2の文を第2の文章表示領域に記憶させる。一方、トレース支援装置10は、第2の文章表示領域が表示記憶領域内に設定されている場合に、第2の文章表示領域における一文が任意に指定されることに応じて、第2の文章表示領域から前記候補文表示領域および対応付文表示領域に切り替えて、候補文を候補文表示領域に記憶させるとともに対応付文を対応付文表示領域に記憶させる。
このように構成したことにより、候補文と第2の文との相互切り替え表示、または候補文および対応付文と第2の文との相互切り替え表示を実現することができ、利用者によるトレースの作業性を向上させることができる。
【0063】
したがって、本実施形態によれば、文書間の文単位での高いトレーサビリティを実現することができる。
【0064】
なお、本実施形態では、トレース支援装置10のトレース管理部17が、第1の文章表示領域に記憶された一文が指定されたことを検出すると、関連値情報記憶部15から、その一文に対応付けられた第1の文識別情報と閾値を超える関連値とがともに含まれる関連値情報における、一組または複数組の第2の文識別情報および関連値を抽出する例とした。これ以外にも、トレース管理部17が、第1の文章表示領域に記憶された一文が指定されたことを検出すると、関連値情報記憶部15から、その一文に対応付けられた第1の文識別情報が含まれる関連値情報における、一組または複数組の第2の文識別情報および関連値を、関連値が大きな順(関連度が高い順)に所定数分(例えば、10個)抽出するようにしてもよい。
【0065】
また、本実施形態では、トレース支援装置10が、二つの文書(第1の文書および第2の文書)を取り込む例とした。これ以外にも、トレース支援装置10が、単一の文書において第1の範囲内の文章と第2の範囲内の文章とについて、第1の範囲内の文章から指定された一文に対する候補文を、第2の範囲内の文章から選定するようにしてもよい。この場合、第1の範囲と第2の範囲とは、部分的に重複してもよいし、重複しなくてもよい。また、一方の範囲に他方の範囲が含まれてもよい。
【0066】
また、上述した実施形態であるトレース支援装置10の一部の機能をコンピュータで実現するようにしてもよい。この場合、その機能を実現するためのトレース支援プログラムをコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたトレース支援プログラムをコンピュータシステムに読み込ませて、このコンピュータシステムが実行することによって実現してもよい。なお、このコンピュータシステムとは、オペレーティング・システム(Operating System;OS)や周辺装置のハードウェアを含むものである。また、コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに備えられる磁気ハードディスクやソリッドステートドライブ等の記憶装置のことをいう。さらに、コンピュータ読み取り可能な記録媒体とは、インターネット等のコンピュータネットワーク、および電話回線や携帯電話網を介してプログラムを送信する場合の通信回線のように、短時間の間、動的にプログラムを保持するもの、さらには、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持するものを含んでもよい。また上記のトレース支援プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
【0067】
以上、本発明の実施の形態について図面を参照して詳述したが、具体的な構成はその実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。