【文献】
          高橋  勇  外5名,“Webサイトからの剽窃レポート発見支援システム”,電子情報通信学会論文誌  (J90−D),日本,社団法人電子情報通信学会,2007年11月  1日,第J90−D巻,第11号,p.2989−2999
        
      
    (58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0013】
  以下に添付図面を参照して、この発明に係る引用判定支援装置および引用判定支援プログラムの実施の形態を詳細に説明する。まず、本実施の形態の構成を説明した後、本実施の形態の処理内容について説明し、最後に本実施の形態に対する変形例について説明する。ただし、本実施の形態によって本発明が限定されるものではない。
 
【0014】
〔実施の形態1〕
  まず実施の形態1について説明する。この形態は、論文データのうち、第三者の文献を引用する可能性が高い構成部分を自動的に選定して判定範囲とする形態である。
 
【0015】
  図1は、実施の形態1に係る引用判定支援装置を含むシステム構成を機能概念的に示すブロック図である。引用判定支援装置100は、
図1に示すように、インターネット130等の任意のネットワークを介して、WEBサイト131やファイルサーバ133に対して通信可能に接続されている。なお、これらWEBサイト131やファイルサーバ133は従来と同様に構成することができるので、その詳細な説明を省略する。
 
【0016】
(構成)
  引用判定支援装置100は、
図1に示すように、記憶部101及び制御部102をバスにて接続して構成されると共に、入力装置103及び表示装置104とを備えている。
 
【0017】
  記憶部101は、引用判定支援装置100の制御に必要な各種のプログラム及びデータを格納する記憶手段であり、例えばハードディスクドライブ装置(HDD)やメモリ等の記憶媒体にて構成されている。特に、記憶部101には、図示しない記録媒体に格納され図示しない読み取り装置にて読み取られた引用判定支援プログラムがインストールされている。この記憶部101には、文献データ記憶部101a、文献リスト記憶部101b、及び論文データ記憶部101cが設けられている。
 
【0018】
  文献データ記憶部101aは、論文データの引用元となりうる文献データを記憶するものである。本実施の形態では、文献データが、引用判定支援装置100に備えた文献データ記憶部101aに記憶されると共に、WEBサイト131及びファイルサーバ133にも保存されているものとする。
 
【0019】
  文献リスト記憶部101bは、文献データ記憶部101aに記録された文献データおよびインターネット上の文献データの文献名、URL(Uniform  Resource  Locator)やフォルダ名等の保存場所、ファイル名、作成者、作成年月日等の書誌情報の一覧を記憶するものである。
 
【0020】
  論文データ記憶部101cは、引用判定の対象となる論文データを、論文データの作成者である学生を識別するための学籍簿番号と対応づけて記憶するものである。この論文データ記憶部101cには、今回引用判定の対象となる論文データを学生の端末から受信して格納しておく他、過去に提出されて引用判定を行った全ての論文データがその作成者である学生の学籍簿番号と対応づけられて格納されている。
 
【0021】
  制御部102は、引用判定支援装置100の制御を行う制御手段であり、機能概念的に、判定範囲特定部102a、比較範囲特定部102b、類似度算出部102c、文献引用判定部102d、適法性判定部102e、参照情報取得部102f、入力制御部102g、及び出力制御部102hを備える。この制御部102の具体的構成は任意であるが、例えば、OS(Operating System)などの制御プログラム、各種の処理手順などを規定した組み込みプログラム、所要データを格納するための内部メモリ、及び、これらのプログラムを実行するCPU(Central Processing Unit)を備えて構成される。
 
【0022】
  判定範囲特定部102aは、論文データ記憶部101cに保存されている論文データの中から、文献データの引用の有無の判定範囲を特定する判定範囲特定手段である。
 
【0023】
  比較範囲特定部102bは、論文データの判定範囲との比較範囲となる文献データ等を特定する比較範囲特定手段である。
 
【0024】
  類似度算出部102cは、判定範囲特定部102aによって特定された判定範囲の記述内容を検索キーとして、比較範囲特定部102bによって特定された文献データや過去の論文データ(以下、「文献データ等」という)の比較範囲を検索し、相互の類似度を算出する類似度算出手段である。
 
【0025】
  文献引用判定部102dは、類似度算出部102cによって算出された類似度が所定の閾値以上である場合に、論文データの判定範囲が比較範囲の文献データ等を引用していると判定する文献引用判定手段である。
 
【0026】
  適法性判定部102eは、文献引用判定部102dによって、論文データの判定範囲が比較範囲の文献データ等を引用していると判定された場合に、判定範囲における文献データ等の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段である。
 
【0027】
  参照情報取得部102fは、論文データの判定範囲が比較範囲の文献データ等を引用していると判定された場合に、文献データ等を参照するための参照情報として、文献データ等の名称や題名、URLやフォルダ名等を、文献データ等の属性等から取得する参照情報取得手段である。
 
【0028】
  入力制御部102gは、入力装置103から操作入力されることによるイベントを受付けたり、操作入力の入力制御を行う入力制御手段である。
 
【0029】
  出力制御部102hは、表示装置104に対する各種画面の表示制御を行う出力制御手段である。この出力制御部102hは、判定範囲の表示や文献データ等の比較範囲を引用している論文データの判定範囲と上記参照情報を示す引用判定画面(後述)を表示装置104に表示する。
 
【0030】
  入力装置103は、キーボードやマウス等のポインティングデバイスの如き入力手段である。
 
【0031】
  表示装置104は、モニタの如き出力手段である。
 
【0032】
(処理)
  次に、以上のように構成された実施の形態1の引用判定支援装置100で実行される引用判定支援処理について説明する。
図2は、実施の形態1の引用判定支援処理の手順を示すフローチャートである。
 
【0033】
  利用者が入力装置103を介して所定方法で引用判定支援処理の実行を指示すると、まず、引用判定画面が出力制御部102hによって表示装置104に表示される。
図3は、引用判定画面の一例を示す模式図である。この画面で、「簡易」ボタンをクリックすると判定範囲の特定が行われる。なお、引用判定画面の「詳細」ボタンをクリックすると、文献データ記憶部101aの文献データ等を管理する検索データベース、言語、引用文献データの生成期間、キーワード、作成者などの検索のための各種設定を行う画面(図示せず)が表示される。
 
【0034】
  判定範囲を特定するため、判定範囲特定部102aは、作成された論文データを論文データ記憶部101cから読み出す(ステップS11)。そして、判定範囲特定部102aは、公知の手法で論文データの構成の構造解析を行い(ステップS12)、論文を構成する導入部分(「はじめに」の構成部分等)、本文部分、最終部分等(「最後に」、「謝辞」の構成部分等)の構成部分を得る。そして、本文部分が論文データの主要部分であり、第三者の文献を引用する可能性が高い構成部分であることから、判定範囲特定部102aは、構造解析により得られた構成部分の中から、本文部分を判定範囲として特定する(ステップS13)。
 
【0035】
  図4は、論文データ中で判定範囲として特定される本文の部分の一例を示す説明図である。
図4に示すようなレポートの場合、回答欄に記載された内容が本文に相当する構成部分であるため、判定範囲特定部102aは、この回答欄の記載内容を判定範囲として特定することになる。このように判定範囲が特定されると、出力制御部102hは、
図5に示すように、特定された判定範囲の内容を引用判定画面の判定範囲欄に表示する。
 
【0036】
  図2に戻り、判定範囲の特定が終了したら、
図5に示す引用判定画面において利用者は「検索実行」ボタンをクリックする。この「検索実行」ボタンがクリックされると入力制御部102gはそのイベントを受信し、これにより比較範囲特定部102bによる比較範囲の特定処理が行われる(ステップS14)。
 
【0037】
  図6は、比較範囲の特定処理の手順を示すフローチャートである。比較範囲特定部102bは、まず、論文データ記憶部101cに格納されている過去に提出された全ての論文データを読み出す(ステップS21)。次に、比較範囲特定部102bは、文献リスト記憶部101bに保存されている文献リストに記載されている全ての文献データを文献データ記憶部101aおよびインターネット130上から読み出す(ステップS22)。そして、比較範囲特定部102bは、読み出した全ての論文データと取得した文献データ(文献データ等)とを比較範囲として特定する(ステップS23)。
 
【0038】
  図2に戻り、比較範囲の特定が終了したら、類似度算出部102cは、特定された判定範囲の記述内容を検索キーとして特定された比較範囲のデータを検索し(ステップS15)、比較範囲の記述内容の類似度を算出する(ステップS16)。類似度算出部102cは、具体的には、公知の検索技術を利用した検索プログラムや検索エンジン、またはこれらの検索プログラムや検索エンジンに対して検索キーを指定して検索指示を実行させる。ここでは、類似度の算出ロジックとして、例えば、論文データの判定範囲の記述内容、文献データの記述内容をそれぞれ構文解析し、各単語や文節の一致度を数値化する等の公知のロジックを用いる。そして、文献引用判定部102dは、算出された類似度が所定の閾値以上であるか否かを判断することにより、判定範囲が比較範囲の文献を引用しているか否かを判断する(ステップS17)。
 
【0039】
  そして、算出された類似度が所定の閾値より小さい場合には(ステップS17,No)、判定範囲は比較範囲の文献データ等を引用していないと判断し、処理を終了する。ここで、所定の閾値は、引用判定の求める精度に応じて任意に定めることができる。
 
【0040】
  一方、算出された類似度が所定の閾値以上である場合には(ステップS17,Yes)、判定範囲は比較範囲の文献データ等を引用していると判断し、次に、適法性判定部102eがこの引用が適法な引用か否かを判断する(ステップS18)。ここで、引用が「適法」とは、当該引用が著作権法上適法であること、あるいは利用者が予め設定した要件を具備していること等を含む概念である。具体的には、適法性判定部102eは、判定範囲における文献データ等の引用箇所の下方近傍に書籍名の表示がある場合、引用箇所の直前直後に引用を示す括弧「」の表示がある場合、引用部分であることを示すため引用箇所を他の部分のフォントと異なるフォントで表示している場合には、引用箇所が著作権法に基づいて適法に引用されたものであると判断する。この他にも、文献データ等の引用箇所の下方近傍に、引用の適法性を肯定するような所定表示(例えば、作者名、著者名、あるいは出版社名)がある場合に、当該引用箇所は適法に引用されたものであると判断するようにしてもよい。
 
【0041】
  そして、判定範囲の引用が適法な引用であると判断された場合には(ステップS18,Yes)、処理を終了する。
 
【0042】
  一方、判定範囲の引用が適法な引用でないと判断された場合には(ステップS18,No)、参照情報取得部102fは、文献データ等(引用された文献データ若しくは引用された論文データ)を参照するための参照情報(文献データ等のファイル名や題名、URLやフォルダ名等)、文献データの属性等若しくは引用された論文データの属性等から取得する(ステップS19)。そして、出力制御部102hは、文献データ等を判定範囲内で引用している箇所を引用判定画面に明示するとともに参照情報を表示する(ステップS20)。
 
【0043】
  以上のステップS15からS20までの処理は、特定された比較範囲のデータの全てについて繰り返し実行される(ステップS20a,No)。ステップS15からS20までの処理が特定された比較範囲のデータの全てについて実行された場合には(ステップS20a,Yes)、処理を終了する。
 
【0044】
  本実施の形態では、出力制御部102hは、まず判定範囲内で引用している箇所を変色、反転等で強調表示を行う。
図7は、引用判定画面において判定範囲内で引用箇所が強調表示されている状態を示す模式図である。なお、
図7において太字かつ下線が付されている部分が、強調表示された部分、すなわち引用箇所の部分である。
 
【0045】
  そして、利用者がこの引用箇所を入力装置103を介して指示すると、かかる指示を入力制御部102gで受け付けて、出力制御部102hは、指示された箇所に参照情報を表示するように制御している。
 
【0046】
  図8は、引用判定画面において参照情報が表示された状態を示す模式図である。
図8の例では、インターネット130上の文献データが引用された場合を示しており、その参照情報として文献データのURLが表示されている。本実施の形態では、ユーザは、このURLを入力装置103のポインティングデバイスでクリックしたときに、出力制御部102h、当該URLの示すWEBページにアクセスして引用元の文献データ等を表示するように構成している。これにより、論文データの引用判定を行う教授などは引用元の文献データを容易に取得することが可能となる。
 
【0047】
(効果)
  このように実施の形態1の引用判定支援装置100では、論文データの判定範囲と比較範囲の文献データ等を自動的に限定して類似度判定を行なうので、汎用的な類似算出などの判定アルゴリズムを利用して引用判定を行うことができる。このため、本実施の形態によれば、開発工程および製造コストの増大を防止しつつ判定の精度を向上させることができる。
 
【0048】
  また、実施の形態1の引用判定支援装置100では、判定範囲特定部102aによって論文データを構成する構成部分の中から、無断で引用されやすい本文部分を判定範囲として特定しているので、判定の精度をより向上させることができる。
 
【0049】
  また、実施の形態1の引用判定支援装置100では、判定範囲が比較範囲を引用していると判定された場合に、適法性判定部102eによって判定範囲における比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定しているので、文献データ等の引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の精度を向上させることができる。
 
【0050】
  また、実施の形態1の引用判定支援装置100では、参照情報取得部102fによって、比較範囲を含む文献データを参照するための参照情報を、当該文献データに基づいて取得し、文献データの比較範囲を引用している判定対象データの判定範囲に加えて取得された参照情報を出力することで、文献データを容易に参照することができる。
 
【0051】
〔実施の形態2〕
  次に、実施の形態2について説明する。この形態は、過去に不正な引用行為を行った学生や成績が低い学生の論文データを判定対象として選択する形態である。ただし、実施の形態2に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0052】
(構成)
  
図9は、実施の形態2に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置900は、記憶部101に履歴データ記憶部101dを備えると共に、制御部102に判定範囲特定部102iを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
 
【0053】
  履歴データ記憶部101dは、過去に生成された論文データに関する履歴データを記憶するメモリ、HDDなどの記憶媒体である。
図10は、履歴データの一例を示す説明図である。履歴データは、過去に生成された全ての論文データに対し、論文データの作成日付と、論文データの作成者である学生を一意に識別するための学籍簿番号と、論文データにおける不正な引用行為の有無を示す不正引用の有無と、学生の成績(A,B,C,Dであり、Aが最も優秀で、次いで優秀度合いはB,C,Dの順になる)とを対応づけたデータである。ここでは、過去に不正な引用を行った学生の論文データに対しては、不正引用の有無に「有」が設定されている。なお、過去の論文データ自体は、実施の形態1と同様に、学籍簿番号に対応づけられて論文データ記憶部101cに格納されている。
 
【0054】
  判定範囲特定部102iは、この履歴データを参照して、不正な引用を行う確率が高い者として、不正引用の有無が「有」の学籍簿番号と、成績がC以下(すなわち、CおよびD)の学籍簿番号を取得して、取得した学籍簿番号の学生が提出した論文データを、提出された複数の論文データ(論文データ記憶部101cに保存されている)の中から判定対象として選択する。また、判定範囲特定部102iは、判定対象として選択された論文データの構成部分の中から、実施の形態1と同様に、本文部分を判定範囲として特定する。
 
【0055】
(処理)
  次に、以上のように構成された実施の形態2の引用判定支援装置900による引用判定支援処理について説明する。
図11は、実施の形態2の引用判定支援処理の手順を示すフローチャートである。
 
【0056】
  表示装置104に表示されている実施の形態1と同様の
図3に示す引用判定画面において利用者が簡易ボタンをクリックすると、まず、判定範囲特定部102iによって判定対象の特定処理が行われる(ステップS31)。かかる判定対象の特定処理の詳細については後述する。
 
【0057】
  この判定対象の特定処理が完了すると、判定対象となった学生の論文データに対して、実施の形態1と同様に判定範囲の特定が行われ(ステップS32,33)、以降は実施の形態1と同様の処理で引用判定が行われる(ステップS34からS40a)。
 
【0058】
  次に、ステップS31における判定対象の特定処理について詳細に説明する。
図12は、実施の形態2の判定対象の特定処理の手順を示すフローチャートである。
 
【0059】
  まず、判定範囲特定部102iは、作成された論文データと当該論文データに対応する学籍簿番号とを論文データ記憶部101cから読み出す(ステップS41)。次に、判定範囲特定部102iは、履歴データ記憶部101dに記憶されている履歴データを参照して、読み出した学籍簿番号に対応する不正引用の有無と成績とを読み出す(ステップS42)。
 
【0060】
  そして、判定範囲特定部102iは、履歴データから読み出した不正利用の有無が「有」であるか否かを判断する(ステップS43)。そして、不正利用の有無が「有」の場合には(ステップS43,Yes)、この学籍簿番号の学生が作成した論文データ、すなわち、ステップS41で読み出した論文データを判定対象として特定する(ステップS45)。
 
【0061】
  一方、ステップS43において、不正利用の有無が「無」の場合には(ステップS43,No)、判定範囲特定部102iは、さらに、履歴データから読み出した成績がC以下、すなわち、CまたはDであるか否かを判断する(ステップS44)。
 
【0062】
  そして、成績がCまたはDである場合には(ステップS44,Yes)、この学籍簿番号の学生が作成した論文データを判定対象として特定する(ステップS45)。
 
【0063】
  一方、ステップS44において成績がCより高い(すなわち、AまたはBである場合)には(ステップS44,No)、ステップS41で読み出した論文データを判定対象としない。
 
【0064】
  引用判定すべき作成された論文データが複数存在する場合には、このステップS41からS45までの処理を当該複数の論文データに対して行って、判定対象の論文データを特定する。
 
【0065】
(効果)
  このように実施の形態2の引用判定支援装置900では、履歴データから過去に不正な引用行為が有った旨を示す不正引用の有無の「有」に対応する学籍簿番号、成績は所定値であるC以下の学籍簿番号の学生が作成した論文データを、複数の論文データの中から判定対象として選択しているので、不正な引用を行う確率が高い者の論文データを判定対象とすることができ、判定の精度をより向上させることができると共に、不正引用の確率が高い論文データのみに判定対象を限定することで判定処理負荷を低減して判定効率を高めることができる。
 
【0066】
  なお、本実施の形態では、判定範囲特定部102iが履歴データから過去に不正な引用行為が有った旨を示す不正引用の有無の判断、成績が所定値以下であるかの判断を両方行っているが、一方のみの判断で判定対象の論文データを特定するように構成してもよい。
 
【0067】
〔実施の形態3〕
  次に、実施の形態3について説明する。この形態は、引用元の文献が単語を修正された上で論文に不正引用された場合の対策として、当該単語を修正前の単語に変換した上で類似度判定を行う形態である。ただし、実施の形態3に係る構成及び処理は、特に説明する場合を除いては実施の形態2に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態2で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0068】
(構成)
  
図13は、実施の形態3に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1300は、記憶部101に辞書記憶部101eを備えると共に、制御部102に判定範囲特定部102j及び単語変換部102kを備えている点において、実施の形態2に係る引用判定支援装置900と異なる。
 
【0069】
  辞書記憶部101eは、論文データの技術分野における専門用語とその専門用語と関連して使用され得る一または複数の用語を対応づけて登録した専門辞書を記憶するHDDやメモリ等の記憶媒体である。
図14は、専門辞書の一例を示す説明図である。専門辞書は、
図14に示すように、文献データ等に含まれる得る用語に対して、第1候補用語、第2候補用語など、関連して使用され得る用語が対応づけられている。この専門辞書は、後述する単語変換部102kによって論文データ中の単語を修正する際に使用される。
 
【0070】
  判定範囲特定部102jは、単語変換部102kよる変換が行われた論文データを判定対象として選択するものである。また、判定範囲特定部102jは、判定対象として選択された論文データの構成部分の中から、実施の形態1と同様に、本文部分を判定範囲として特定する。
 
【0071】
  単語変換部102kは、論文データに含まれる単語を、専門辞書の該当する用語の第1候補用語、第2候補用語等に変換するものである。
 
【0072】
(処理)
  次に、以上のように構成された実施の形態3の引用判定支援装置1300による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理は、
図11で説明した実施の形態2の引用判定支援処理と同様に行われる。本実施の形態では、
図11のステップS31における判定対象の特定処理が実施の形態2と異なっている。
 
【0073】
  図15は、実施の形態3の判定対象の特定の手順を示すフローチャートである。まず、判定範囲特定部102jは、作成された論文データを論文データ記憶部101cから読み出す(ステップS51)。そして、判定範囲特定部102jは、読み出した論文データの内容を公知の手法で形態素解析を行って、形態素に分割する(ステップS52)。
 
【0074】
  次に、単語変換部102kは、得られた形態素の単語を検索キーとして専門辞書を検索して、専門辞書の用語として登録されている単語に対して、当該単語を専門辞書の用語に対応する第1候補用語に変換する(ステップS53)。なお、2回目以降の単語変換の場合には、第n候補用語(nは2以上の整数)に変換する。
 
【0075】
  そして、論文データの全ての単語に対して単語変換の処理が終了したか否かを判断し(ステップS54)、終了していなければ(ステップS54,No)、このステップS53の単語変換の処理を繰り返し行う。
 
【0076】
  一方、論文データの全ての単語に対して単語変換の処理が終了した場合には(ステップS54,Yes)、単語変換部102kは、変換された単語の論文データを修正版論文データとして論文データ記憶部101cに保存する(ステップS55)。
 
【0077】
  そして、単語変換部102kは、専門辞書の全ての候補用語に変換したか否かを判断する(ステップS56)。そして、まだ全ての候補用語に変換していない場合には(ステップS56,No)、単語変換部102kは、専門辞書の用語として次の候補用語(第n+1候補用語)を選択し(ステップS57)、ステップS53からS55までの処理を繰り返す。これにより、論文データの一の単語につき、複数の候補用語に変換された複数の修正版論文データが得られ、論文データ記憶部101cに保存されることになる。
 
【0078】
  ステップS56において、専門辞書の全ての候補用語に変換したと判断した場合には(ステップS56,Yes)、判定範囲特定部102jは、得られた複数の修正版論文データを判定対象として特定する(ステップS58)。
 
【0079】
  引用判定支援処理は、このように判定対象として特定された複数の修正版論文データに対して行われることになる。
 
【0080】
(効果)
  このように実施の形態3の引用判定支援装置1300では、論文データに含まれる単語を、専門辞書に登録された用語に変換し、変換が行われた論文データを、判定対象としているので、文献データをそのまま利用せず修正した上で不正に引用した場合でも、引用か否かを判定することができ、判定の精度をより向上させることができる。
 
【0081】
〔実施の形態4〕
  次に、実施の形態4について説明する。この形態は、学生の過去の論文データの相互間で、類似度を算出する形態である。ただし、実施の形態4に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0082】
(構成)
  
図16は、実施の形態4に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1600は、制御部102に、比較範囲特定部102l、類似度算出部102m、及び文献引用判定部102nを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
 
【0083】
  類似度算出部102mは、実施の形態1と同様の機能の他、論文データ記憶部101cに記憶された学生の過去の論文データの相互間で、類似度を算出するものである。類似度の算出は、実施の形態1と同様に公知の手法を用いる。
 
【0084】
  文献引用判定部102nは、実施の形態1と同様の機能の他、類似度算出部102mにより算出された類似度が所定の第2閾値以上である場合に、複数の過去の論文データの相互間において引用が有る旨の判定を行うものである。ここで、第2閾値は、任意に定めることができ、上述した閾値と同一の値、異なる値のいずれであってもよい。
 
【0085】
  比較範囲特定部102lは、文献引用判定部102nにより相互間において引用有りと判定された複数の過去の論文データを比較範囲として特定するものである。
 
【0086】
(処理)
  次に、以上のように構成された実施の形態4の引用判定支援装置1600による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については
図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、
図2における比較判定処理(ステップS14)の手順が実施の形態1と異なっている。
 
【0087】
  図17は、実施の形態4の比較判定処理の手順を示すフローチャートである。比較範囲特定部102lは、まず、論文データ記憶部101cに格納されている過去に提出された全ての論文データの中から2つの論文データを抽出する(ステップS61)。次に、類似度算出部102mは、抽出された2つの論文データの記述内容の類似度を算出する(ステップS62)。ここで、類似度の算出は、まず、2つの論文データのうち一の論文データの中の一部の範囲の記述と他方の論文データの記述内容とを比較し、次に、一の論文データの一部の範囲を変更しながら他方の論文データの記述内容とを比較するような処理を繰り返し行いながら部分ごとの類似度を算出し、これらの部分的な比較結果の類似度の平均値等を論文データ全体同士の類似度として求めるように構成すればよい。ただし、類似度の算出の手法はこれに限定されるものではない。
 
【0088】
  そして、比較範囲特定部102lは、全ての過去の論文データについて、このような類似度の算出処理を行ったか否かを判断し(ステップS63)、全ての過去の論文データに行っていなければ(ステップS63,No)、ステップS61およびS62の処理を繰り返し実行する。
 
【0089】
  一方、全ての過去の論文データに対して類似度の算出処理が完了した場合には(ステップS63,Yes)、文献引用判定部102nは、類似度が予め定められた第2閾値以上である複数の論文データがある場合には、これらの複数の論文データは相互間で引用箇所があるという引用有りの判断をおこなって、これらの複数の論文データを選択する(ステップS64)。そして、比較範囲特定部102lは、この選択された複数の論文データを比較範囲として特定する(ステップS65)。従って、互いに引用している過去の論文データが比較範囲となり、判定対象の論文データの引用判定が行われることになる。
 
【0090】
(効果)
  このように実施の形態4にかかる引用判定支援装置1600では、相互間で引用している過去の論文データを比較範囲として、判定対象の論文データの引用判定を行うので、引用している可能性の高いものを比較範囲とすることができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができると共に、不正引用の確率が高い論文データのみに判定対象を限定することで判定処理負荷を低減して判定効率を高めることができる。
 
【0091】
  なお、本実施の形態では、類似度が第2閾値以上であるものを、過去の論文データ相互間で引用していると判定しているが、さらに、適法性判定部102eによって、この引用が適法であるか否かを判断し、不適法である場合にのみ比較範囲として特定するように構成してもよい。
 
【0092】
〔実施の形態5〕
  次に、実施の形態5について説明する。この形態は、論文の課題文をキーワードとして判定対象を自動的に抽出する形態である。ただし、実施の形態5に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0093】
(構成)
  
図18は、実施の形態5に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置1800は、制御部102に課題抽出部102p及び比較範囲特定部102qを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
 
【0094】
  課題抽出部102pは、判定対象となった論文データの構造解析を行って、論文データの記述内容から、論文の課題文を抽出するものである。具体的には、課題抽出部102pは、構造解析の結果得られた論文の見出しや構造等により、課題文を特定して抽出する。
 
【0095】
  比較範囲特定部102qは、課題抽出部102pで抽出された課題文を検索キーとしてインターネット130上のWEBサイト131やファイルサーバ133等から該当するWEBページを検索し、検索結果として出力されたURL等で指定される文献データを比較範囲として特定するものである。検索には、公知の検索エンジンなどを利用することができる。この場合には、比較範囲特定部102qは、公知の検索エンジンのAPI(Application  Programing  Interface)を利用して検索キーを指定した検索依頼コマンド等を検索エンジンのWEBサイトに送出して検索結果を受信するように構成すればよい。
 
【0096】
(処理)
  次に、以上のように構成された実施の形態5の引用判定支援装置1800による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については
図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、
図2における比較判定処理(ステップS14)の手順が実施の形態1と異なっている。
 
【0097】
  図19は、実施の形態5の比較範囲特定処理の手順を示すフローチャートである。まず、課題抽出部102pは、判定対象となった論文データに構造解析を行って、課題文を抽出する(ステップS81)。次に、比較範囲特定部102qは、抽出された課題文を検索キーとして、インターネット130上のWEBサイト131やファイルサーバ133等から該当するWEBページを検索する(ステップS82)。そして、比較範囲特定部102qは、検索結果としての検索されたWEBページのURLで指定された引用文献データを比較範囲として特定する(ステップS83)。
 
【0098】
(効果)
  このように実施の形態5の引用判定支援装置1800では、論文データにおける課題文に基づいて引用文献の比較範囲を決定しているので、論文の内容に即して適切な引用文献の比較範囲を定めることができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができる。
 
【0099】
〔実施の形態6〕
  次に、実施の形態6について説明する。この形態は、論文における比較対象の文字数が検索ロジックの文字制限数を超える場合の対応ロジックを含んだ形態である。ただし、実施の形態6に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0100】
(構成)
  
図20は、実施の形態6に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置2000は、制御部102に類似度算出部102rを備える点において、実施の形態1に係る引用判定支援装置100と異なる。
 
【0101】
  類似度算出部102rは、公知の検索技術(検索エンジン等)を利用して、判定範囲特定部102aで特定された判定範囲の記述内容を検索キーとして、比較範囲特定部102bで特定した比較範囲の中から検索する。この際、検索キーの文字数が、予め定められた制限文字数(例えば、32文字)を超えている場合には、制限文字数を含み、検索キーの文字数が制限文字数を超えている旨のエラーメッセージが検索エンジン等から通知される。このような場合には、類似度算出部102rは、検索キーとして制限文字数以内の文字を判定範囲の先頭から指定して、比較範囲の中から検索を行い、検索結果をメモリ等に保存しておく。そして、類似度算出部102rは、判定範囲の中で次の制限文字数分の文字列を検索キーとして同様に比較範囲の中から検索を行う。このようにして、類似度算出部102rは、順次、制限文字数分だけ判定範囲の記述内容の文字列を移動させながら検索キーを指定し、複数回の検索を行って、その検索結果をメモリ等に保存する。類似度算出部102rは、複数の検索結果の中から最も出現頻度の高い検索結果を、類似度算出の対象となる比較範囲とし、判定範囲との類似度の算出を行う。なお、出現頻度が所定数以上の検索結果を類似度算出の対象とするように構成してもよい。
 
【0102】
(処理)
  次に、以上のように構成された実施の形態6の引用判定支援装置2000による引用判定支援処理について説明する。本実施の形態の引用判定の全体処理については
図2を用いて説明した実施の形態1における引用判定支援処理の手順と同様である。本実施の形態では、
図2における類似度算出部が行う検索処理(ステップS15)の手順が実施の形態1と異なっている。
 
【0103】
  図21は、実施の形態6の類似度算出における検索処理の手順を示すフローチャートである。まず、類似度算出部102rは、判定範囲の記述内容検索キーとして比較範囲のデータを検索する(ステップS91)。そして、類似度算出部102rは、検索キーが制限文字数を超えた旨のエラー通知を受信したか否かを判断する(ステップS92)。
 
【0104】
  そして、検索キーが制限文字数を超えた旨のエラー通知を受信しなかった場合には(ステップS92,No)、類似度算出部102rは、検索結果を選択し(ステップS100)、この検索結果の比較範囲が類似度算出の対象となり、実施の形態1と同様に、判定範囲との類似度が算出される。
 
【0105】
  一方、ステップS92において、検索キーが制限文字数を超えた旨のエラー通知を受信した場合には(ステップS92,Yes)、類似度算出部102rは、受信したエラー通知の中から制限文字数を取得する(ステップS93)。
 
【0106】
  そして、類似度算出部102rは、判定範囲の先頭から、制限文字数分の範囲の文字列を検索キーと指定し(ステップS94)、この検索キーで比較範囲のデータを検索する(ステップS95)。類似度算出部102rは、その検索結果をメモリに記憶する(ステップS96)。
 
【0107】
  そして、類似度算出部102rは、判定範囲の検索キーとして最終文字列まで到達したか否かを判断し(ステップS97)、まだ到達していない場合には(ステップS97,No)、判定範囲の中で次の制限文字数分の文字列を検索キーに指定して(ステップS98)、ステップS95およびS96の処理を繰り返し実行する。なお、このように制限文字数分の文字列を指定する場合の具体的な方法は任意であるが、一例としては、制限文字数分を一単位として移動させる方法(例えば、制限文字数=32文字の場合において、初回は1文字目から32文字目までの文字列を検索キーとし、2回目は33文字目からから64文字目までの文字列を検索キーとし、以下同様に検索キーの指定を行う方法)、一文字単位で移動させる方法(例えば、制限文字数=32文字の場合において、初回は1文字目から32文字目までの文字列を検索キーとし、2回目は2文字目からから33文字目までの文字列を検索キーとし、以下同様に検索キーの指定を行う方法)、あるいは任意の文字数毎に移動させる方法(例えば、制限文字数=32文字の場合であって、任意の文字数=10文字とする場合において、初回は1文字目から32文字目までの文字列を検索キーとし、2回目は11文字目から42文字目までの文字列を検索キーとし、以下同様に検索キーの指定を行う方法)を採用することができる。
 
【0108】
  一方、ステップS97において、判定範囲の検索キーとして最終文字列まで到達した場合には(ステップS97,Yes)、メモリに保存された検索結果の中で、最も出現頻度の高い検索結果を選択し(ステップS99)、選択された比較範囲が類似度算出の対象となり、判定範囲との類似度が算出される。
 
【0109】
(効果)
  このように実施の形態6の引用判定支援装置2000では、検索キーが制限文字数を超えた場合には、判定範囲の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての判定範囲の文字列をずらしながら複数回の検索を行っているので、検索キーの制限文字数にかかわらず、引用判定の精度を向上させることができる。
 
【0110】
〔実施の形態7〕
  次に、実施の形態7について説明する。この形態は、適法性判定手段が、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定する形態である。ただし、実施の形態7に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0111】
(構成)
  
図24は、実施の形態7に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、制御部102に引用形式設定部102sを備えると共に、記憶部101に引用形式データベース(以下、「データベース」を「DB」と略記する)101fを備えている。
 
【0112】
  引用形式設定部102sは、引用の適法性が判定される際の基準となる引用形式を設定する引用形式設定手段である。
 
【0113】
  引用形式DB101fは、論文データを分類する種別と、所定の引用形式とを、相互に関連付けて格納する引用形式格納手段である。
図25は、引用形式DB101fに格納される情報を示した表である。
図25に示したように、引用形式DB101fはデータ項目として「種別」「引用形式」「適法文書格納場所」を備え、これらに対応する情報が相互に関連付けて格納されている。項目「種別」に対応して格納される情報は、論文データの種別を特定するための情報であり、
図25に例示したように、「法律」や「工学」といった論文のテーマに応じた分野を特定する情報を格納することができる。項目「引用形式」に対応して格納される情報は、適法な引用形式を特定するための情報であり、
図25に例示したように、「『』」や「””」等を格納することができる。項目「適法文書格納場所」に対応して格納される情報は、適法とみなす文書の格納場所を特定するための情報であり、例えば
図25に示したように、「Z:¥quotaion¥law¥」や「Z:¥quotaion¥eng¥」等、文書の格納先となるフォルダ名等を格納することができる。なお、「適法とみなす文書」としては、例えば当該文書が引用された場合には適法とみなされる文書が該当する。この引用形式DB101fに格納される情報の格納方法や格納タイミングは任意で、例えば予め入力装置103を介して引用形式DB101fに格納することができ、あるいは後述する引用形式設定処理において引用形式DB101fに格納することができる。
 
【0114】
(処理−引用判定支援処理)
  次に、以上のように構成された実施の形態7の引用判定支援装置100で実行される引用判定支援処理について説明する。
図26は、実施の形態7の引用判定支援処理の手順を示すフローチャートである。なお、ステップSA2及びステップSA9を除くステップSA1からステップSA13までの各処理は、実施の形態1において
図2を参照して説明したステップS11からステップS20aまでの各処理と同様であるので、詳細な説明は省略する。
 
【0115】
  ステップSA1において論文データの読み出しを行った後(ステップSA1)、引用形式設定部102sは引用形式の設定を行う(ステップSA2)。
 
【0116】
  ここで、引用形式設定処理について説明する。引用形式設定処理は、論文データにおける引用の適法性が判定される際の基準となる、引用形式を設定するための処理である。
図27は、引用形式設定処理の手順を示すフローチャートである。
 
【0117】
  図27に示すように、引用形式設定処理が起動されると、出力制御部102hは、引用形式設定入力画面を表示装置104に出力表示させる(ステップSB1)。
図28は、引用形式設定入力画面を例示した図である。
図28に示したように、引用形式設定入力画面には、例えば論文データの種別を選択する「種別」メニュー、適法な引用形式を入力する「引用形式」ボックス、適法とみなす文書の格納場所を指定する「適法文書格納場所」ボックス、引用形式設定入力画面における入力内容の確定指示を行うための確定ボタン、引用形式設定の終了指示を行うための終了ボタン等が表示される。
 
【0118】
  そして、引用形式設定部102sは、入力装置103を介した終了ボタンの押下により引用形式設定処理の終了指示がされた場合(ステップSB2、Yes)、引用形式設定処理を終了してメインルーチンに戻る。一方、終了ボタンが押下されず、引用形式設定処理の終了指示がされない場合(ステップSB2、No)、引用形式判定部は、入力装置103を介して「種別」メニューから論文データの種別(例えば、「法律」や「工学」等)が選択されるまで待機し(ステップSB3、No)、論文データの種別が選択された場合(ステップSB3、Yes)、当該選択された種別をRAM等に一時記憶する(ステップSB4)。
 
【0119】
  続いて、引用形式設定部102sは、入力装置103を介した確定ボタンの押下により入力内容の確定指示がされるまで待機し(ステップSB5、No)、入力内容の確定指示がされた場合(ステップSB5、Yes)、その時点で「引用形式」ボックスに入力されている引用形式(例えば、「『』」や「””」等)、及び「適法文書格納場所」で指定されている文書の格納場所(例えば、「Z:¥quotaion¥law¥」等)を取得し、ステップSB4でRAM等に一時記憶した種別と対応付けて、引用形式DB101fに格納する(ステップSB6)。その後、ステップSB2に戻り、終了指示がされたか否かの判定を行う(ステップSB2)。
 
【0120】
  図26に示す引用判定支援処理に戻り、ステップSA8において、ステップSA7で類似度算出部102cによって算出された類似度が所定の閾値以上である場合(ステップSA8,Yes)、判定範囲は比較範囲の文献データ等を引用していると判断し、適法性判定部102eは当該引用が適法な引用か否かを判定するための適法性判定処理を実行する(ステップSA9)。
 
【0121】
(処理−適法性判定処理)
  ここで、適法性判定処理について説明する。
図29は、適法性判定処理の手順を示すフローチャートである。適法性判定処理が起動されると、適法性判定部102eは、判定対象の論文データの種別を特定する(ステップSC1)。例えば、種別入力画面(図示省略)を表示装置104に出力表示させ、入力装置103を介して判定対象の論文データの種別の入力を受け付けることができる。
 
【0122】
  次に、ステップSC1で特定した種別に基づいて引用形式DB101fを参照し、当該種別に対応する適法な引用形式、及び適法とみなす文書の格納場所を、引用形式DB101fから取得する(ステップSC2)。
 
【0123】
  そして、ステップSA8で比較範囲の文献データ等を引用していると判断した引用が、ステップSC2で取得した適法な引用形式に準拠した引用か否かを判定する(ステップSC3)。例えば、引用部分の前後に、適法な引用形式「『』」が用いられている場合や、引用部分自体や引用部分の直後に当該引用部分の引用元を示す参考文献情報への参照番号が付記されている場合、あるいは当該引用部分が適法とみなす文書の格納場所に格納されている文書からの引用である場合、適法な引用形式に準拠した引用と判定する。
 
【0124】
  その結果、適法な引用形式に準拠していないと判定した場合(ステップSC3、No)、適法性判定部102eは、当該引用部分が不適法である旨の表示を表示装置104に出力表示をさせる(ステップSC4)。例えば、
図7に示した引用判定画面において、当該引用部分の表示を白黒反転させた表示とする。
 
【0125】
  一方、適法な引用形式に準拠していると判定した場合(ステップSC3、Yes)、又はステップSC4の処理の後、適法性判定部102eは比較範囲の文献データ等を引用していると判断した部分の全てについて適法性判定を行ったか否かを判定する(ステップSC5)。
 
【0126】
  その結果、引用部分の全てについて適法性判定を行っていないと判定した場合(ステップSC5、No)、適法性判定部102eは、適法性判定を行っていない他の引用部分について、適法な引用形式に準拠した引用か否かの判定を行う(ステップSC3)。一方、引用部分の全てについて適法性判定を行ったと判定した場合(ステップSC5、Yes)、適法性判定部102eは適法性判定処理を終了し、メインルーチンに戻る。
 
【0127】
(効果)
  このように実施の形態7の引用判定支援装置100では、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定するので、予め設定した引用形式に基づき、引用の適法性を容易に判定することができる。
 
【0128】
  また、論文データの種別に対応する引用形式を引用形式DB101fから取得し、当該取得した引用形式に引用が合致するか否かを判定するので、論文データの種別毎に異なる引用形式に基づき、引用の適法性を判定することができる。
 
【0129】
〔実施の形態8〕
  次に、実施の形態8について説明する。この形態は、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出する形態である。ただし、実施の形態8に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0130】
(構成)
  
図30は、実施の形態8に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、制御部102に引用割合算出部102tを備えると共に、記憶部101に引用割合DB101gを備えている。
 
【0131】
  引用割合算出部102tは、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出する引用割合算出手段である。
 
【0132】
  引用割合DB101gは、判定対象データを一意に識別する判定対象データ情報と、引用割合算出部102tが算出した引用割合とを、相互に関連付けて格納する引用割合格納手段である。
図31は、引用割合DB101gに格納される情報を例示した表である。
図31に示すように、引用割合DB101gはデータ項目として「論文データ情報」「文献データ情報」「引用割合」を備え、これらに対応する情報が相互に関連付けて格納されている。項目「論文データ情報」に格納される情報は、判定対象である論文データを一意に識別する判定対象データ情報であり、
図31に示したように、例えば論文作成者の学籍簿番号及び論文作成日を含む識別番号が格納される。項目「文献データ情報」に格納される情報は、引用元である文献データを一意に識別する文献データ情報であり、
図31に示したように、例えば文献データの文献情報が格納される。項目「引用割合」に格納される情報は、引用割合算出部102tが算出した引用割合を特定する情報であり、
図31に示したように、例えば論文データにおける各文献データからの個別の引用割合及び当該個別の引用割合の合計値を百分率で示した数値が格納される。なお、引用割合の具体的内容については後述する。これらの情報は、次に述べる引用判定支援処理において引用割合DB101gに格納される。
 
【0133】
(処理)
  次に、以上のように構成された実施の形態8の引用判定支援装置100で実行される処理について説明する。実施の形態8の引用判定支援装置100が実行する処理は、引用判定支援処理及びリスト表示処理に大別される。
 
【0134】
(処理−引用判定支援処理)
  まず、引用判定支援処理について説明する。
図32は、実施の形態8の引用判定支援処理の手順を示すフローチャートである。なお、ステップSD1からステップSD11までの各処理は、実施の形態1において
図2を参照して説明したステップS11からステップS20aまでの各処理と同様であるので、詳細な説明は省略する。
 
【0135】
  ステップSD11において、特定された比較範囲のデータの全てについてステップSD5からSD10までの処理が全て終了したと判定した場合(ステップSD11、Yes)、引用割合算出部102tは、判定範囲の記述内容のうち、比較範囲から引用された記述内容が占める引用割合を算出する(ステップSD12)。引用割合の具体的な内容は任意であり、例えば、判定範囲の文字数に対する引用部分の文字数の百分率を、引用割合として算出する。
 
【0136】
  そして、出力制御部102hは、引用割合算出部102tが算出した引用割合を表示装置104に出力表示させると共に、当該算出した引用割合を、判定対象の論文データを特定する論文データ情報に対応付けて引用割合DB101gに格納する(ステップSD13)。複数の文献データからの引用がある場合には、各文献データから引用された記述内容が占める個別の引用割合と、当該個別の引用割合の合計値とを算出し、引用割合DB101gに格納する。
 
【0137】
  図33は、引用割合を出力表示した場合の引用判定画面を例示した図である。
図33の例では、判定範囲の文字数に対する引用部分の文字数の百分率として算出された引用割合を引用判定画面の右上部に表示する。なお、判定範囲の記述内容が複数の文献データから引用されている場合、
図33に示したように各文献データからの引用割合の合計値と各文献データからの個別の引用割合とを共に表示させてもよく、各文献データからの引用割合の合計値のみを表示させてもよい。
 
【0138】
(処理−リスト表示処理)
  次に、リスト表示処理について説明する。このリスト表示処理は、各論文データの引用割合に基づく順序で論文データ情報を出力する処理である。
図34は、リスト表示処理の手順を示すフローチャートである。このリスト表示処理の実行タイミングは任意で、例えば、入力装置103を介してリスト表示処理の実行指示が入力された場合に起動される。
 
【0139】
  リスト表示処理が起動されると、出力制御部102hは、全ての論文データ情報及び対応する引用割合の合計値を引用割合DB101gから取得する(ステップSE1)。続いて、出力制御部102hは、取得した論文データ情報を、対応する引用割合の合計値の降順でソートし、表示装置104に出力表示させる(ステップSE2)。
図35は、引用割合の合計値の降順で論文データ情報のリストを表示する判定結果画面を示す図である。
図35に示すように、引用割合の降順で論文データ情報が画面表示される。この際、各論文データ情報について文献データ毎の個別の引用割合を併せて表示させてもよい。
 
【0140】
(効果)
  このように実施の形態8の引用判定支援装置100では、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出及び出力するので、引用の適法性の判断材料を提示することができる。
 
【0141】
  また、複数の論文データについて引用割合を算出し、各論文データについての引用割合に基づく順序で論文データ情報を出力するので、複数の論文データにおける引用の適法性を引用割合に基づいて比較するための判断材料を提示することができる。
 
【0142】
〔実施の形態9〕
  次に、実施の形態9について説明する。この形態は、引用箇所の引用元である文献データを特定する引用元情報が、判定対象データに含まれているか否かを判定する形態である。ただし、実施の形態9に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0143】
(構成)
  
図36は、実施の形態9に係る引用判定支援装置の機能的構成を示すブロック図である。この引用判定支援装置100は、記憶部101に出力態様DB101hを備えている。
 
【0144】
  出力態様DB101hは、判定範囲の類似度と、表示装置104による出力態様とを、相互に対応付けて格納する出力態様情報格納手段である。
図37は、出力態様DB101hに格納される情報を例示した表である。
図37に示したように、出力態様DB101hはデータ項目として「類似度S[%]」「出力態様」を備え、これらに対応する情報が相互に関連付けて格納されている。項目「類似度S[%]」に対応して格納される情報は、判定範囲の類似度を特定する情報であり、引用判定の基準となる類似度の範囲を特定する情報(
図37では「0≦S<20」「20≦S<80」等)が格納される。なお、
図37では類似度の範囲を三段階に区分しているが、二段階、あるいは四段階以上に区分してもよい。項目「出力態様」に対応して格納される情報は、表示装置104による出力態様を特定するための情報であり、類似度に応じて出力させるべき態様を特定する情報が格納される。
図37の例では、類似度が20%未満の場合は引用の可能性が低いと考えられることから文字の出力態様を「通常」とし、類似度が20%以上80%未満の場合は引用の可能性があることから文字の出力態様を「太字」とし、類似度が80%以上の場合は引用の可能性が高いことから文字の出力態様を「反転」としている。また、項目「出力態様」には、文字色や文字の背景色を特定する色情報、文字のフォントを特定するフォント情報等を格納してもよい。この出力態様DB101hに格納される情報の格納方法や格納タイミングは任意で、例えば予め入力装置103を介して出力態様DB101hに格納することができる。
 
【0145】
(処理)
  次に、以上のように構成された実施の形態9の引用判定支援装置100で実行される引用判定支援処理について説明する。
図38は、実施の形態9の引用判定支援処理の手順を示すフローチャートである。なお、ステップSF1、ステップSF5、ステップSF8、ステップSF9、ステップSF12、及びステップSF15からステップSF17は、それぞれ実施の形態1において
図2を参照して説明したステップS11、ステップS14、ステップS15、ステップS16、ステップS18、ステップS19からステップS20aの各処理と同様であるので、詳細な説明は省略する。
 
【0146】
  ステップSF1において論文データの読み出しを行った後(ステップSF1)、出力制御部102hは論文データを表示装置104に出力表示させる(ステップSF2)。
図39は、表示装置104上の引用判定画面に表示された論文データを示す図である。
図39に示した例では、出力制御部102hは引用判定画面上に、論文データ表示エリア105、範囲設定スライダ106、全体ビュー107、文献データ表示エリア108を表示させる。論文データ表示エリア105は、判定対象の論文データを表示させる領域である。範囲設定スライダ106は、判定対象の論文データにおける判定範囲を設定するものであり、上側の範囲設定スライダ106aと下側の範囲設定スライダ106bとに挟まれた領域が判定範囲として設定される。全体ビュー107は、判定対象の論文データの全体における、論文データ表示エリア105の表示範囲、判定範囲、及び引用部分の概略位置を表示させる領域である。文献データ表示エリア108は、引用された文献データの内容を表示させる領域である。
図39に示したように、ステップSF2では、論文データ表示エリア105に論文データの内容が表示されると共に、論文データ表示エリア105の表示範囲が長方形の枠線として全体ビュー107に表示される。
 
【0147】
  図38に戻り、判定範囲特定部102aは、入力装置103を介して判定範囲の指示入力がされたか否かを判定し(ステップSF3)、判定範囲の指示入力がされたと判定した場合(ステップSF3、Yes)、当該指示入力により指示された範囲を判定範囲として特定する(ステップSF4)。
図39に示した例では、判定対象の論文データのうち、上側と下側との範囲設定スライダ106によって挟まれた範囲を判定範囲として特定する。また、出力制御部102hは、
図39に例示したように、判定範囲外の領域を全体ビュー107において斜線ハッチングで表示させる。
 
【0148】
  図38に戻り、ステップSF5において比較範囲が特定された後、文献引用判定部102dは、入力装置103を介して類似度の閾値が入力されたか否かを判定し(ステップSF6)、類似度の閾値が入力されたと判定した場合(ステップSF6、Yes)、文献引用判定部102dは当該入力された閾値を引用判定における類似度の閾値として設定する(ステップSF7)。なお、閾値の入力方法は任意であり、例えば閾値の入力ボックスを引用判定画面に表示させ(図示省略)、入力装置103を介して当該入力ボックスに入力された数値を閾値として設定することができる。あるいは、閾値の設定スライダを引用判定画面に表示させ(図示省略)、入力装置103を介して位置変更された設定スライダの位置に対応する値を閾値として設定することができる。
 
【0149】
  ステップSF9において類似度算出部102cが類似度を算出した後(ステップSF9)、出力制御部102hは、当該算出された類似度に対応する出力態様を出力態様DB101hから取得し(ステップSF10)、当該取得した出力態様に基づいて判定範囲を表示装置104に出力表示させる(ステップSF11)。
図39の例では、論文データ表示エリア105における文字が、算出された類似度に対応して
図37に例示した出力態様DB101hから取得された出力態様に基づいて表示されている。すなわち、類似度が20%未満の部分は通常の表示、類似度が20%以上80%未満の部分は太字表示、類似度が80%以上の部分は反転表示される。また、類似度が20%以上の部分については、全体ビュー107において交差線によるハッチングで表示される。これにより、論文データ全体において引用の可能性がある部分が占める範囲を、ユーザが概略的に把握することが可能となる。
 
【0150】
  図38に戻り、ステップSF12において、適法性判定部102eによって判定範囲の引用が適法な引用でないと判定された場合(ステップSF12、No)、適法性判定部102eは、適法でないと判定された引用箇所の引用元である文献データを特定する引用元情報が、判定対象の論文データに含まれているか否かを判定する(ステップSF13)。引用元情報の具体的な内容は任意で、例えば、引用元文献の著者名、発表年、タイトル、掲載雑誌、巻数、所在ペ―ジ等の情報を引用元情報とすることができる。また、引用元情報が含まれているか否かの判定基準は任意で、例えば、引用箇所の直後に引用元情報が記載されているか否か、あるいは、引用箇所の直後に記載された注番号に対応して論文データの末尾に引用情報が記載されているか否かを基準として判定を行うことができる。
 
【0151】
  その結果、引用元情報が判定対象の論文データに含まれていると判定した場合(ステップSF13、Yes)、出力制御部102hは、当該引用元情報を表示装置104に出力表示させる(ステップSF14)。引用元情報を表示装置104に出力表示させる方法や手順は任意で、例えば適法な引用でないと判定された引用部分に対応する引用元情報を表示させる旨の指示入力が入力装置103を介してされた場合、当該引用部分に対応する引用元情報を表示させる。また、適法な引用でないと判定された引用部分が複数個所存在する場合は、入力装置103を介した指示入力により複数の引用部分の中から選択された引用部分に対応する引用元情報を表示させる。
図40は、引用元情報が表示された引用判定画面を示す図である。
図40に示したように、引用判定画面の論文データ表示エリア105において、指定された引用部分に対応する引用元情報(表示されている論文データの最下部の「○○○○,△△△△,「××××××」,□□誌,第○巻,△頁−□頁」部分)が強調表示される(
図40では反転表示)。
 
【0152】
  このように引用元情報を表示した後(ステップSF14)、又はステップSF13で引用元情報が論文データに含まれていないと判定した場合(ステップSF13、No)、参照情報取得部102fは参照情報を取得する(ステップSF15)。
 
【0153】
(効果)
  このように実施の形態9の引用判定支援装置100では、引用箇所の引用元である文献データを特定する引用元情報が論文データに含まれているか否かを判定するので、引用元情報の有無に基づいて引用の適法性を判定する際の判断材料を取得できる。
 
【0154】
  また、論文データの中から、入力装置103を介して指定された範囲を判定範囲として特定するので、引用判定を行う対象を限定することができ、判定処理に伴う負荷を低減することができる。
 
【0155】
  また、類似度が入力装置103を介して入力された所定の閾値以上である場合に、判定範囲が比較範囲を引用していると判定するので、判定の目的に合わせて最適な閾値を設定し、当該閾値に基づく判定を行わせることができる。
 
【0156】
  また、類似度算出部102cにて算出された類似度に対応する出力態様を出力態様DB101hから取得し、当該取得した出力態様にて判定範囲を出力するので、ユーザが類似度を把握し易い態様で判定範囲を出力することができる。
 
【0157】
〔実施の形態10〕
  次に、実施の形態10について説明する。この形態は、文献データを特定する引用元情報が判定対象データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定する形態である。ただし、実施の形態10に係る構成及び処理は、特に説明する場合を除いては実施の形態1に係る構成及び処理と同じであるものとし、同一の構成及び処理については、実施の形態1で使用したものと同一の名称又は符号を必要に応じて用いることで、その説明を省略する。
 
【0158】
(処理−引用判定支援処理)
  本実施の形態10の引用判定支援装置100で実行される引用判定支援処理について説明する。
図41は、実施の形態10の引用判定支援処理の手順を示すフローチャートである。なお、ステップSG11を除くステップSG1からステップSG12までの各処理は、実施の形態1において
図2を参照して説明したステップS11からステップS20aの各処理と同様であるので、詳細な説明は省略する。
 
【0159】
  ステップSG10において、文献データ等を判定範囲内で引用している箇所を引用判定画面に明示するとともに参照情報を表示した後(ステップSG10)、比較範囲特定部102bは、引用されていた文献データを文献データ記憶部101aに記憶させると共に、当該文献データの書誌情報(例えば、著者名、発表年、タイトル、掲載雑誌、URL等)、及び当該文献データの保存場所(例えばフォルダ名)を文献リスト記憶部101bに記憶させる(ステップSG11)。その後、ステップSG5からステップSG11までの処理が、特定された比較範囲のデータの全てについて実行されたか否かを判定する(ステップSG12)。
 
【0160】
(処理−比較範囲特定処理)
  ここで、引用判定支援処理のステップSG4で実行される比較範囲特定処理について説明する。
図42は、実施の形態10の比較判定処理の手順を示すフローチャートである。なお、ステップSH5からステップSH7までの各処理は、実施の形態1において
図6を参照して説明したステップS21からステップS23までの各処理と同様であるので、詳細な説明は省略する。
 
【0161】
  比較範囲特定処理が起動されると、比較範囲特定部102bは、引用判定支援処理のステップSG2で行われた論文データの構造解析の結果に基づき、論文データにおいて引用されている文献データを特定する引用元情報が、当該論文データに含まれているか否かを判定する(ステップSH1)。
 
【0162】
  その結果、引用元情報が含まれていた場合(ステップSH1、Yes)、比較範囲特定部102bは文献リスト記憶部101bを参照し、引用元情報に対応する書誌情報が当該文献リスト記憶部101bに記憶されているか否かを判定する(ステップSH2)。その結果、書誌情報が文献リスト記憶部101bに記憶されていた場合(ステップSH2、Yes)、比較範囲特定部102bは、当該書誌情報に対応付けて記憶されている保存場所に保存されている文献データを文献データ記憶部101aから読み出し(ステップSH3)、当該読出した文献データを、比較範囲として特定する(SH4)。
 
【0163】
  一方、ステップSH1において引用元情報が論文データに含まれていないと判定した場合(ステップSH1、No)、あるいはステップSH2において引用元情報に対応する書誌情報が文献リスト記憶部101bに記憶されていないと判定した場合(ステップSH2、No)、比較範囲特定部102bは、論文データ記憶部101cに格納されている過去に提出された全ての論文データを読み出す(ステップSH5)。
 
【0164】
  ステップSH4又はステップSH7の処理の後、比較範囲特定部102bは比較範囲特定処理を終了し、メインルーチンに戻る。
 
【0165】
(効果)
  このように実施の形態10の引用判定支援装置100では、判定範囲において引用されていると文献引用判定部102dによって判定された文献データを文献データ記憶部101aに記憶させる。また、文献データを特定する引用元情報が論文データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶部101aに格納されていると判定した場合、当該文献データを比較範囲として特定する。これにより、既に文献データ記憶部101aに記憶されている文献データに比較範囲を限定することができ、比較範囲のデータから判定範囲の内容を検索する際の負荷を低減することができる。
 
【0166】
〔実施の形態6に対する変形例1〕
  以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
 
【0167】
  実施の形態6では、類似度算出部102rにおいて、検索キーの文字列が制限文字数を超えた場合の処理を行っているが、予め検索キーとして指定する文字列が制限文字数を超えないように処理することもできる。
 
【0168】
  すなわち、類似度算出部102rにおいて、判定範囲を形態素解析などを利用したテキストマイニング処理により解析して制限文字数以下の文字列の単語に分割し、所定数以上出現する単語を検索キーと指定して、単語ごとに比較範囲の中から複数回検索する。そして、類似度算出部102rは、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果の比較範囲を、判定範囲の記述内容との相互の類似度を算出する比較範囲の対象として決定するように構成すればよい。
 
【0169】
  このような変形例1における類似度算出処理について説明する。
図22は、変形例1の類似度算出処理の手順を示すフローチャートである。
 
【0170】
  まず、類似度算出部102rは、判定範囲の記述内容のデータに対して形態素解析等のテキストマイニング処理を施して、制限文字数以内の文字数の単語に分割する(ステップS111)。そして、類似度算出部102rは、単語ごとの出現頻度を算出し(ステップS112)、出現頻度の高い順に単語をソートする(ステップS113)。そして、類似度算出部102rは、最も出現頻度の高い単語を検索キーとして指定する(ステップS114)。
 
【0171】
  次に、類似度算出部102rは、指定された検索キーで比較範囲を検索し(ステップS115)、その検索結果をメモリに記憶する(ステップS116)。
 
【0172】
  次に、類似度算出部102rは、出現頻度が所定数以上の全ての単語につき検索の処理を行ったか否かを判断する(ステップS117)。そして、類似度算出部102rは、出現頻度が所定数以上の全ての単語に対してまだ検索処理を行っていないと判断した場合には(ステップS117,No)、次に出現頻度の高い単語を検索キーとして指定し(ステップS118)、ステップS115およびS116の検索処理を繰り返し実行する。
 
【0173】
  一方、ステップS117において、類似度算出部102rは、出現頻度が所定数以上の全ての単語に対して検索処理が完了したと判断した場合には(ステップS117,Yes)、メモリに記憶された複数の検索結果の中で最も出現頻度の高い検索結果としての比較範囲を選択する(ステップS119)。これにより、選択された比較範囲が類似度算出の対象となり、判定範囲との類似度が算出される。
 
【0174】
  このように実施の形態6の変形例1によれば、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。また、判定範囲の記述内容の中から予め制限文字数以下の単語を検索キーとして検索を行うこともでき、この場合には、検索キーの制限文字数にかかわらず、引用判定の精度を向上させることができる。
 
【0175】
  なお、本変形例の処理を、実施の形態6と同様に、検索エンジン等から検索キーの文字数が制限文字数を超えている旨のエラー通知を受信したときのみに実行するように、類似度算出部102rを構成してもよい。
 
【0176】
〔実施の形態5および6に対する変形例2〕
  実施の形態6では、類似度算出部102rにおいて、判定範囲と比較範囲の類似度を算出する際に、検索キーが制限文字数を超えた場合の処理をおこなっていたが、かかる処理を、実施の形態5における比較範囲特定部102qの処理に適用することもできる。
 
【0177】
  すなわち、論文データから抽出した課題文を検索キーにしてWEBページを検索しているが、課題文が制限文字数を超えるような長い文章の場合には、検索エンジン等から実施の形態6で説明したエラー通知が送信される。このため、比較範囲特定部102qにおいて、検索キーが制限文字数を超える旨のエラー通知を受信した場合には、実施の形態6の類似度算出部102rと同様に、抽出された課題文の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての課題文の文字列をずらしながら複数回の検索を行う。そして、検索結果として出力された複数のURLの中から最も出現頻度の高いURLで指定された引用文献データを比較範囲と決定するように比較範囲特定部102qを構成すればよい。
 
【0178】
  図23は、変形例2の比較範囲特定処理の手順を示すフローチャートである。まず、課題抽出部102pは、判定対象となった論文データに構造解析を行って、課題文を抽出する(ステップS131)。次に、比較範囲特定部102qは、抽出された課題文を検索キーとして、インターネット130上のWEBサイト131やファイルサーバ133等から該当するWEBページを検索する(ステップS132)。
 
【0179】
  そして、比較範囲特定部102qは、検索キーが制限文字数を超えた旨のエラー通知を受信したか否かを判断する(ステップS133)。
 
【0180】
  そして、検索キーが制限文字数を超えた旨のエラー通知を受信しなかった場合には(ステップS133,No)、比較範囲特定部102qは、検索結果のURLを選択し(ステップS141)、実施の形態5と同様に、この検索結果のURLで指定された引用文献データが比較範囲として特定されることになる。
 
【0181】
  一方、ステップS133において、検索キーが制限文字数を超えた旨のエラー通知を受信した場合には(ステップS133,Yes)、比較範囲特定部102qは、受信したエラー通知の中から制限文字数を取得する(ステップS134)。
 
【0182】
  そして、比較範囲特定部102qは、課題文の先頭から、制限文字数分の範囲の文字列を検索キーと指定し(ステップS135)、この検索キーでWEBページを検索する(ステップS136)。比較範囲特定部102qは、その検索結果であるURLをメモリに記憶する(ステップS137)。
 
【0183】
  そして、比較範囲特定部102qは、課題文の検索キーとして最終文字列まで到達したか否かを判断し(ステップS138)、まだ到達していない場合には(ステップS138,No)、課題文の中で次の制限文字数分の文字列を検索キーに指定して(ステップS139)、ステップS136およびS137の処理を繰り返し実行する。
 
【0184】
  一方、ステップS138において、課題文の検索キーとして最終文字列まで到達した場合には(ステップS138,Yes)、メモリに保存された検索結果のURLの中で、最も出現頻度の高い検索結果のURLを選択し(ステップS140)、選択されたWEBページのURLで指定された引用文献データが比較範囲として特定されることになる。
 
【0185】
  従って、この変形例2によれば、検索キーが制限文字数を超えた場合には、課題文の中で制限文字数分の文字列で検索キーを指定して、検索キーとしての課題文の文字列をずらしながら複数回の検索を行っているので、検索キーの制限文字数にかかわらず、論文データの内容に即した適切な引用文献データの比較範囲を特定することができ、引用判定の精度をより向上させることができる。
 
【0186】
〔実施の形態5および6に対する変形例3〕
  さらに、実施の形態5の比較範囲特定部102qを、上記変形例1で説明したような処理、すなわち、予め検索キーとして指定する文字列が制限文字数を超えないように、課題文を単語に分割して検索キーとして指定して検索を行うように構成してもよい。
 
【0187】
〔実施の形態7に対する変形例〕
  上述の実施の形態7では、類似度算出部102cによって算出された類似度が所定の閾値以上と判定された部分について引用の適法性の判定を行っているが、判定対象の論文データ全体について引用の適法性判定を行うように構成してもよい。例えば、判定対象の論文データに、当該論文データの種別に対応する引用形式の記号(例えば「『』」、「””」等)が含まれている場合、当該論文データにおける引用は適法である旨の判定をするように構成してもよい。また、当該判定結果に基づく出力態様で、論文データのファイル名を表示装置104に出力表示させてもよい。例えば、引用が不適法と判定された論文データのファイル名を白黒反転表示させ、適法と判定された論文データのファイル名と識別可能としてもよい。
 
【0188】
〔実施の形態1から10に対するその他の変形例〕
  上記各実施の形態にかかる引用判定支援装置の判定範囲特定部102a、102i、102jに自動参照の機能を組み込み、起動時に自動的に論文データ記憶部101cから、所望の論文データを利用者に選択させて選択された論文データを読み込むように構成してもよい。
  また、上記実施の形態にかかる引用判定支援装置の比較範囲特定部102b、102l、102qを、比較範囲となる記憶部やWEBサイト等を一つに限定せず、WEBサイト、図書館検索データベース、ローカルサーバ、これらを任意に組み合わせたものから横断的に比較範囲を特定するように構成してもよい。
 
【0189】
  また、以上説明した実施の形態では、判定対象データとして学生が作成した論文データをあげて説明したが、これに限定されるものではなく、文章が記述されたあらゆるデータを判定対象データとすることができる。
 
【0190】
  また、判定範囲の記述内容が複数の文献データから引用されている場合には、出力制御部102hが、文献データ毎に異なる出力態様(例えば、異なる色彩や字体等)で各引用部分を表示装置104に出力表示させるように構成してもよい。また、各文献データからの引用割合に応じて異なる表示態様で、各引用部分を表示させてもよい。
 
【0191】
  また、発明が解決しようとする課題や発明の効果は、前記した内容に限定されるものではなく、本発明によって、前記に記載されていない課題を解決したり、前記に記載されていない効果を奏することもでき、また、記載されている課題の一部のみを解決したり、記載されている効果の一部のみを奏することがある。
 
【0192】
  実施の形態1から10および上記変形例の引用判定支援装置で実行される引用判定支援プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital  Versatile  Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
 
【0193】
(付記)
  付記1に記載の引用判定支援装置は、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段とを備えたことを特徴とする。
 
【0194】
  また、付記2に記載の引用判定支援装置は、付記1に記載の引用判定支援装置において、前記適法性判定手段は、前記引用箇所の引用元である前記文献データを特定する引用元情報が、前記判定対象データに含まれているか否かを判定することを特徴とする。
 
【0195】
  また、付記3に記載の引用判定支援装置は、付記1又は2に記載の引用判定支援装置において、前記適法性判定手段は、前記判定範囲において前記類似度が所定の閾値以上である場合に、当該判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における前記比較範囲の引用が適法な引用であるか否かを判定することを特徴とする。
 
【0196】
  また、付記4に記載の引用判定支援装置は、付記3に記載の引用判定支援装置において、前記判定対象データの種別と、前記所定の引用形式とを、相互に関連付けて格納する引用形式格納手段を備え、前記適法性判定手段は、前記判定対象データの種別を特定し、当該特定した種別に対応する前記引用形式を前記引用形式格納手段から取得し、当該取得した引用形式に前記判定範囲における前記比較範囲の引用が合致するか否かを判定することを特徴とする。
 
【0197】
  また、付記5に記載の引用判定支援装置は、付記1から4のいずれか一項に記載の引用判定支援装置において、前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該比較範囲を含む前記文献データを参照するための参照情報を、当該文献データに基づいて取得する参照情報取得手段を備え、前記出力手段は、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲に加えて、前記参照情報取得手段にて取得された前記参照情報を出力することを特徴とする。
 
【0198】
  また、付記6に記載の引用判定支援装置は、付記1から5のいずれか一項に記載の引用判定支援装置において、前記判定範囲特定手段は、前記判定対象データを構成する構成部分の中から、所定の構成部分を前記判定範囲として特定することを特徴とする。
 
【0199】
  また、付記7に記載の引用判定支援装置は、付記1から6のいずれか一項に記載の引用判定支援装置において、過去に生成された前記判定対象データの作成者を一意に識別するための作成者識別情報に対して、前記判定対象データにおける不正な引用行為の有無を示す情報、又は前記作成者の成績を対応づけて記憶する履歴記憶手段を備え、判定対象となり得る前記判定対象データが複数存在する場合において、前記判定範囲特定手段は、前記不正な引用行為が有った旨を示す情報に対応する前記作成者識別情報を前記履歴記憶手段から取得し、又は所定値より低い前記作成者の成績に対応する前記作成者識別情報を前記履歴記憶手段から取得し、当該取得した作成者識別情報にて識別される作成者が作成した前記判定対象データを、前記複数の判定対象データの中から前記判定対象として選択することを特徴とする。
 
【0200】
  また、付記8に記載の引用判定支援装置は、付記1から7のいずれか一項に記載の引用判定支援装置において、前記文献データに含まれ得る単語に対して、当該単語を修正する際に用いられ得る単語を対応づけて記憶する辞書記憶手段と、前記判定対象データに含まれる単語を、前記辞書記憶手段にて記憶された単語に変換する単語変換手段とを備え、前記判定範囲特定手段は、前記単語変換手段による変換が行われた前記判定対象データを、前記判定対象とすることを特徴とする。
 
【0201】
  また、付記9に記載の引用判定支援装置は、付記1から8のいずれか一項に記載の引用判定支援装置において、当該引用判定支援装置に対する操作入力を受け付ける入力手段を備え、前記判定範囲特定手段は、前記判定対象データの中から、前記入力手段を介して指定された範囲を前記判定範囲として特定することを特徴とする。
 
【0202】
  また、付記10に記載の引用判定支援装置は、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段とを備え、前記類似度算出手段は、さらに、前記判定対象データ記憶手段に記憶された前記複数の判定対象データの相互間において、前記類似度を算出し、前記文献引用判定手段は、さらに、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定することを特徴とする。
 
【0203】
  また、付記11に記載の引用判定支援装置は、付記1から10のいずれか一項に記載の引用判定支援装置において、前記判定対象データの記述内容に基づいて、当該判定対象データの中から、当該判定対象データの課題を示す課題情報を抽出する課題抽出手段を備え、前記比較範囲特定手段は、前記課題抽出手段にて抽出された前記課題情報を検索キーとして前記文献データを検索し、当該検索された文献データを前記比較対象として特定することを特徴とする。
 
【0204】
  また、付記12に記載の引用判定支援装置は、付記1から11のいずれか一項に記載の引用判定支援装置において、前記判定範囲において引用されていると前記文献引用判定手段によって判定された前記文献データを記憶する文献データ記憶手段を備え、前記比較範囲特定手段は、前記判定対象データにおいて引用されている前記文献データを特定する引用元情報が当該判定対象データに含まれているか否かを判定し、当該引用元情報が当該判定対象データに含まれていると判定した場合、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されているか否かを判定し、当該引用元情報に基づいて特定される前記文献データが前記文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定することを特徴とする。
 
【0205】
  また、付記13に記載の引用判定支援装置は、付記1から12のいずれか一項に記載の引用判定支援装置において、前記類似度算出手段は、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を検索キーとして、前記比較範囲特定手段にて特定された前記比較範囲の中から検索した場合であって、前記検索キーの文字数が、予め定められた制限文字数を超えている場合に、前記検索キーとして前記制限文字数以内の文字を前記判定範囲の中から順次指定して、前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。
 
【0206】
  また、付記14に記載の引用判定支援装置は、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援装置であって、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段とを備え、前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。
 
【0207】
  また、付記15に記載の引用判定支援装置は、付記1から14のいずれか一つに記載の引用判定支援装置において、前記所定の閾値の入力を受け付ける入力手段を備え、
  前記文献引用判定手段は、前記類似度が前記入力手段を介して入力された所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定することを特徴とする。
 
【0208】
  また、付記16に記載の引用判定支援装置は、付記1から15のいずれか一つに記載の引用判定支援装置において、前記判定範囲の記述内容の内、前記比較範囲から引用された記述内容が占める引用割合を算出する引用割合算出手段を備え、前記出力手段は、前記引用割合を出力することを特徴とする。
 
【0209】
  また、付記17に記載の引用判定支援装置は、付記16に記載の引用判定支援装置において、前記引用割合算出手段は、複数の前記判定対象データについて前記引用割合を算出し、前記出力手段は、前記複数の判定対象データを一意に識別する判定対象データ情報を、当該各判定対象データについて前記引用割合算出手段が算出した前記引用割合に基づく順序で出力することを特徴とする。
 
【0210】
  また、付記18に記載の引用判定支援装置は、付記1から17のいずれか一項に記載の引用判定支援装置において、前記判定範囲の前記類似度と、前記出力手段による出力態様とを、相互に対応付けて格納する出力態様情報格納手段を備え、前記出力手段は、前記類似度算出手段にて算出された前記類似度に対応する前記出力態様を前記出力態様情報格納手段から取得し、当該取得した出力態様にて前記判定範囲を出力することを特徴とする。
 
【0211】
  また、付記19に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、前記文献引用判定手段にて前記判定範囲が前記比較範囲を引用していると判定された場合に、当該判定範囲における当該比較範囲の引用箇所およびその近傍箇所に基づいて、当該引用が適法な引用であるか否かを判定する適法性判定手段と、して機能させることを特徴とする。
 
【0212】
  また、付記20に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、前記類似度算出手段は、過去に生成された複数の判定対象データを記憶する判定対象データ記憶手段に記憶された当該複数の判定対象データの相互間において、前記類似度を算出し、前記文献引用判定手段は、前記類似度算出手段にて算出された前記類似度が所定の第2閾値以上である場合に、前記複数の判定対象データの相互間において引用していると判定し、前記比較範囲特定手段は、前記複数の判定対象データの相互間において引用ありと判定された複数の判定対象データを前記比較範囲として特定することを特徴とする。
  また、付記21に記載の引用判定支援プログラムは、判定対象となる判定対象データの中で、文献データが引用されているか否かを判定するための引用判定支援プログラムであって、コンピュータを、前記判定対象データの中から、前記文献データの引用の有無の判定範囲を特定する判定範囲特定手段と、前記文献データの中から、前記判定対象データとの比較範囲を特定する比較範囲特定手段と、前記判定範囲特定手段にて特定された前記判定範囲の記述内容を、前記比較範囲特定手段にて特定された前記比較範囲の中から検索し、前記判定範囲の記述内容と前記比較範囲の記述内容の相互の類似度を算出する類似度算出手段と、前記類似度算出手段にて算出された前記類似度が所定の閾値以上である場合に、前記判定範囲が前記比較範囲を引用していると判定する文献引用判定手段と、前記文献データの前記比較範囲を引用している前記判定対象データの前記判定範囲を出力する出力手段と、して機能させる引用判定支援プログラムであり、前記類似度算出手段は、前記判定範囲を解析して所定数以上出現する単語を検索キーとして、前記単語ごとに前記比較範囲特定手段にて特定された前記比較範囲の中から複数回検索し、複数回の検索結果の中で出現頻度が所定の値より大きい検索結果を、前記判定範囲の記述内容との相互の類似度を算出する前記比較範囲の対象とすることを特徴とする。
 
【0213】
(付記の効果)
  この付記1に記載の引用判定支援装置によれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
  また、引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の適法性を容易に判別することができる。
 
【0214】
  また、付記2に記載の引用判定支援装置によれば、引用箇所の引用元である文献データを特定する引用元情報が判定対象データに含まれているか否かを判定するので、引用元情報の有無に基づいて引用の適法性を判定する際の判断材料を取得できる。
 
【0215】
  また、付記3に記載の引用判定支援装置によれば、判定範囲が所定の引用形式に合致するか否かを判定し、当該判定結果に基づいて、当該判定範囲における比較範囲の引用が適法な引用であるか否かを判定するので、予め設定した引用形式に基づき、引用の適法性を容易に判定することができる。
 
【0216】
  また、付記4に記載の引用判定支援装置によれば、判定対象データの種別に対応する引用形式を引用形式格納手段から取得し、当該取得した引用形式に引用が合致するか否かを判定するので、判定対象データの種別毎に異なる引用形式に基づき、引用の適法性を判定することができる。
 
【0217】
  また、付記5に記載の引用判定支援装置によれば、文献データの引用文献を自動的に特定し、この引用文献を判定対象データの判定範囲に加えた上で引用判定を行なうので、引用文献を不正に引用している場合にはこれを容易に検知することができるという効果を奏する。
 
【0218】
  また、付記6に記載の引用判定支援装置によれば、判定対象データの構成部分の中で無断で引用されやすい箇所を判定範囲に設定することができ、判定の精度をより向上させることができるという効果を奏する。
 
【0219】
  また、付記7に記載の引用判定支援装置によれば、不正な引用を行う確率が高い者の判定対象データを自動的に判定対象に設定することができ、不正が再発する可能性を加味した上で判定を行なうことができ、判定の精度をより向上させることができるという効果を奏する。
 
【0220】
  また、付記8に記載の引用判定支援装置によれば、文献データをそのまま利用せずに修正した上で不正に引用した場合でも、引用か否かを判定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
 
【0221】
  また、付記9に記載の引用判定支援装置によれば、判定対象データの中から、入力手段を介して指定された範囲を判定範囲として特定するので、引用判定を行う対象を限定することができ、判定処理に伴う負荷を低減することができる。
 
【0222】
  また、付記10に記載の引用判定支援装置によれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
  また、他人の文献データを引用している可能性の高い文献データを自動的に比較範囲に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
 
【0223】
  また、付記11に記載の引用判定支援装置によれば、判定対象データの記述内容に即した適切な比較範囲を自動的に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
 
【0224】
  また、付記12に記載の引用判定支援装置によれば、判定範囲において引用されていると文献引用判定手段によって判定された文献データを文献データ記憶手段に記憶させる。また、文献データを特定する引用元情報が判定対象データに含まれている場合において、当該引用元情報に基づいて特定される文献データが文献データ記憶手段に格納されていると判定した場合、当該文献データを比較範囲として特定する。これにより、既に文献データ記憶手段に記憶されている文献データに比較範囲を限定することができ、比較範囲のデータから判定範囲の内容を検索する際の負荷を低減することができる。
 
【0225】
  また、付記13に記載の引用判定支援装置によれば、判定対象になる論文データが検索キーの制限文字数を超えている場合であっても、検索を実行することが可能になる。また、論文データの各部を順次検索対象としつつ、最終的には論文データ全体を実質的に検索範囲に含めることができるので、引用判定の精度を向上させることができるという効果を奏する。
 
【0226】
  また、付記14に記載の引用判定支援装置によれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
  また、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。
 
【0227】
  また、付記15に記載の引用判定支援装置によれば、類似度が入力手段を介して入力された所定の閾値以上である場合に、判定範囲が比較範囲を引用していると判定するので、判定の目的に合わせて最適な閾値を設定し、当該閾値に基づく判定を行わせることができる。
 
【0228】
  また、付記16に記載の引用判定支援装置によれば、判定範囲の記述内容の内、比較範囲から引用された記述内容が占める引用割合を算出及び出力するので、引用の適法性の判断材料を提示することができる。
 
【0229】
  また、付記17に記載の引用判定支援装置によれば、複数の判定対象データについて引用割合を算出し、各判定対象データについての引用割合に基づく順序で判定対象データ情報を出力するので、複数の判定対象データにおける引用の適法性を引用割合に基づいて比較するための判断材料を提示することができる。
 
【0230】
  また、付記18に記載の引用判定支援装置によれば、類似度算出手段にて算出された類似度に対応する出力態様を出力態様情報格納手段から取得し、当該取得した出力態様にて判定範囲を出力するので、ユーザが類似度を把握し易い態様で判定範囲を出力することができる。
 
【0231】
  また、付記19に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。
  また、引用が著作権法で規定する適法な引用か否かを容易に判断することができ、判定の適法性を容易に判別することができる。
 
【0232】
  また、付記20に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。また、他人の文献データを引用している可能性の高い文献データを自動的に比較範囲に設定することができ、開発工程および製造コストの増大を防止しつつ判定の精度をより向上させることができるという効果を奏する。
  また、付記21に記載の引用判定支援プログラムによれば、判定範囲と比較範囲を自動的に限定した上で類似度の判定を行なうので、汎用的な判定アルゴリズムを利用して開発工程および製造コストの増大を防止しつつ、判定の精度を向上させることができるという効果を奏する。また、出現頻度の高い検索結果を自動的に特定し、この検索結果を、類似度算出に用いる比較範囲として自動的に設定するので、判定範囲にマッチする比較範囲を自動的に抽出して引用判定を行なうことができ、引用判定の精度を一層向上させることができる。