特許第6554306号(P6554306)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エヌ・ティ・ティ・コミュニケーションズ株式会社の特許一覧

特許6554306情報処理システム、情報処理方法、およびコンピュータプログラム
<>
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000007
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000008
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000009
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000010
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000011
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000012
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000013
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000014
  • 特許6554306-情報処理システム、情報処理方法、およびコンピュータプログラム 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6554306
(24)【登録日】2019年7月12日
(45)【発行日】2019年7月31日
(54)【発明の名称】情報処理システム、情報処理方法、およびコンピュータプログラム
(51)【国際特許分類】
   G06F 16/30 20190101AFI20190722BHJP
   G06Q 40/06 20120101ALI20190722BHJP
【FI】
   G06F16/30
   G06Q40/06
【請求項の数】8
【全頁数】19
(21)【出願番号】特願2015-76960(P2015-76960)
(22)【出願日】2015年4月3日
(65)【公開番号】特開2016-197332(P2016-197332A)
(43)【公開日】2016年11月24日
【審査請求日】2018年1月29日
(73)【特許権者】
【識別番号】399035766
【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社
(74)【代理人】
【識別番号】110001634
【氏名又は名称】特許業務法人 志賀国際特許事務所
(72)【発明者】
【氏名】泉谷 知範
(72)【発明者】
【氏名】齋藤 邦子
(72)【発明者】
【氏名】戸田 晋行
(72)【発明者】
【氏名】高橋 司
【審査官】 早川 学
(56)【参考文献】
【文献】 特開2003−162639(JP,A)
【文献】 国際公開第2009/096523(WO,A1)
【文献】 特開2011−141833(JP,A)
【文献】 渡邊隼史、外3名,ブログ上の単語出現頻度と株価の関係性の定量評価,人工知能学 金融情報学研究会(SIG−FIN) 第12回研究会 [online],人工知能学会,2014年 1月22日,pp.39-43,[検索日:2017.11.07], Internet<URL:http://sigfin.org/?plugin=attach&refer=SIG-FIN-012-10&openfile=SIG-FIN-012-10.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/30
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
時系列に値が変動する項目の識別情報である項目識別情報と、少なくとも1つ以上の文が含まれる文書の識別情報である文書識別情報と、前記文書に含まれる予め指定された評価表現である指定語の数を示す指定語数とが対応付けられた情報テーブルを参照し、特定の前記項目識別情報に対応する前記指定語数を前記情報テーブルから取得する指定語数取得部と、
前記項目識別情報に対応する値の時系列変動を取得し、前記特定の項目識別情報に対応付けられ且つ入力された検索語を含む前記文書識別情報の数を前記情報テーブルから抽出し、前記抽出した検索語を含む文書識別情報の数の時系列情報と前記時系列変動との相関度を取得する相関度取得部と、
前記相関度取得部により取得された相関度と、前記指定語数取得部により取得された指定語数とに基づいて、前記検索語と前記項目識別情報との関連度を示す指標値を取得する指標値取得部と、
を備える情報処理システム。
【請求項2】
前記指標値取得部は、前記検索語が前記時系列変動に与える影響を示す指標値を取得する、
請求項1記載の情報処理システム。
【請求項3】
前記情報テーブルには、前記文書識別情報に対応付けられた文である文情報と、前記文情報ごとの指定語数と、前記文書識別情報に対応付けられた日付が記憶され、
前記相関度取得部は、前記文書識別情報に対応付けられた日付に基づいて日ごとに前記検索語を含む前記文書識別情報の数を取得し、前記文書識別情報の数が閾値以上である日付と前記時系列変動の値の変動値が所定値以上である日付との合致度に基づく値を前記文書識別情報の数と前記時系列変動との相関度として取得する、
請求項1または請求項2記載の情報処理システム。
【請求項4】
前記相関度取得部は、前記文書識別情報の数が閾値以上である日付と前記時系列変動の値の変動値が所定値以上である日付とのうち一方または両方の日付をずらして合致度に基づく値を前記文書識別情報の数と前記時系列変動との相関度として取得する、
請求項3項記載の情報処理システム。
【請求項5】
前記相関度取得部は、前記文書識別情報の数の取得の対象となった日付より前の日付に対応づけられた前記文書識別情報の数に基づいて前記閾値を取得する、
請求項3又は請求項4記載の情報処理システム。
【請求項6】
前記指定語は、肯定的な表現を示す肯定語、または否定的な表現を示す否定語であり、
前記指標値取得部は、
前記指定語が肯定語である場合は、前記相関度取得部により取得された相関度、および前記指定語数取得部により取得された肯定語数に基づいて、前記検索語と前記項目識別情報との肯定的な意味を持つ関連度を示す指標値を取得し、
前記指定語が否定語である場合は、前記相関度取得部により取得された相関度、および前記指定語数取得部により取得された否定語数に基づいて、前記検索語と前記項目識別情報との否定的な意味を持つ関連度を示す指標値を取得する、
請求項1から請求項5のうちいずれか一項記載の情報処理システム。
【請求項7】
コンピュータが、
時系列に値が変動する項目の識別情報である項目識別情報と、少なくとも1つ以上の文が含まれる文書の識別情報である文書識別情報と、前記文書に含まれる予め指定された評価表現である指定語の数を示す指定語数とが対応付けられた情報テーブルを参照し、特定の前記項目識別情報に対応する前記指定語数を前記情報テーブルから取得する指定語数取得ステップと、
前記項目識別情報に対応する値の時系列変動を取得し、前記特定の項目識別情報に対応付けられ且つ入力された検索語を含む前記文書識別情報の数を前記情報テーブルから抽出し、前記抽出した検索語を含む文書識別情報の数の時系列情報と前記時系列変動との相関度を取得する相関度取得ステップと、
前記相関度取得ステップにより取得された相関度と、前記指定語数取得ステップにより取得された指定語数とに基づいて、前記検索語と前記項目識別情報との関連度を示す指標値を取得する指標値取得ステップと、
を有する情報処理方法。
【請求項8】
コンピュータに、
時系列に値が変動する項目の識別情報である項目識別情報と、少なくとも1つ以上の文が含まれる文書の識別情報である文書識別情報と、前記文書に含まれる予め指定された評価表現である指定語の数を示す指定語数とが対応付けられた情報テーブルを参照し、特定の前記項目識別情報に対応する前記指定語数を前記情報テーブルから取得する指定語数取得ステップと、
前記項目識別情報に対応する値の時系列変動を取得し、前記特定の項目識別情報に対応付けられ且つ入力された検索語を含む前記文書識別情報の数を前記情報テーブルから抽出し、前記抽出した検索語を含む文書識別情報の数の時系列情報と前記時系列変動との相関度を取得する相関度取得ステップと、
前記相関度取得ステップにより取得された相関度と、前記指定語数取得ステップにより取得された指定語数とに基づいて、前記検索語と前記項目識別情報との関連度を示す指標値を取得する指標値取得ステップと、
を実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、およびコンピュータプログラムに関する。
【背景技術】
【0002】
従来、ユーザから入力されたキーワードを受け付け、個々の文書を閲覧することなく多様性を考慮した情報提示を実現する情報検索装置が提案されている(例えば特許文献1参照)。この情報検索装置は、検索クエリの使用頻度が大きいと判定した場合には、検索クエリを含む検索ログから算出された統計情報を利用して、検索クエリに対して1つ以上の追加のキーワードを含む絞り込みクエリを特定する。情報検索装置は、特定した絞り込みクエリを利用してユーザが望むと想定される情報を生成する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2014−99062号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の装置では、利用者にとって利用価値が高い情報を提供できない場合があった。
上記事情に鑑み、本発明は、利用者にとってより利用価値が高い情報を提供可能な技術の提供を目的としている。
【課題を解決するための手段】
【0005】
本発明の一態様は、時系列に値が変動する項目の識別情報である項目識別情報と、少なくとも1つ以上の文が含まれる文書の識別情報である文書識別情報と、前記文書に含まれる予め指定された評価表現である指定語の数を示す指定語数とが対応付けられた情報テーブルを参照し、特定の前記項目識別情報に対応する前記指定語数を前記情報テーブルから取得する指定語数取得部と、前記項目識別情報に対応する値の時系列変動を取得し、前記特定の項目識別情報に対応付けられ且つ入力された検索語を含む前記文書識別情報の数を前記情報テーブルから抽出し、前記抽出した検索語を含む文書識別情報の数の時系列情報と前記時系列変動との相関度を取得する相関度取得部と、前記相関度取得部により取得された相関度と、前記指定語数取得部により取得された指定語数とに基づいて、前記検索語と前記項目識別情報との関連度を示す指標値を取得する指標値取得部と、を備える情報処理システムである。
【0006】
本発明の一態様は、上記の情報処理システムであって、前記指標値取得部は、前記検索語が前記時系列変動に与える影響を示す指標値を取得する。
【0007】
本発明の一態様は、上記の情報処理システムであって、前記情報テーブルには、前記文書識別情報に対応付けられた文である文情報と、前記文情報ごとの指定語数と、前記文書識別情報に対応付けられた日付が記憶され、前記相関度取得部は、前記文書識別情報に対応付けられた日付に基づいて日ごとに前記検索語を含む前記文書識別情報の数を取得し、前記文書識別情報の数が閾値以上である日付と前記時系列変動の値の変動値が所定値以上である日付との合致度に基づく値を前記文書識別情報の数と前記時系列変動との相関度として取得する。
【0008】
本発明の一態様は、上記の情報処理システムであって、前記相関度取得部は、前記文書識別情報の数が閾値以上である日付と前記時系列変動の値の変動値が所定値以上である日付とのうち一方または両方の日付をずらして合致度に基づく値を前記文書識別情報の数と前記時系列変動との相関度として取得する。
【0009】
本発明の一態様は、上記の情報処理システムであって、前記相関度取得部は、前記文書識別情報の数の取得の対象となった日付より前の日付に対応づけられた前記文書識別情報の数に基づいて前記閾値を取得する。
【0010】
本発明の一態様は、上記の情報処理システムであって、前記指定語は、肯定的な表現を示す肯定語、または否定的な表現を示す否定語であり、前記指標値取得部は、前記指定語が肯定語である場合は、前記相関度取得部により取得された相関度、および前記指定語数取得部により取得された肯定語数に基づいて、前記検索語と前記項目識別情報との肯定的な意味を持つ関連度を示す指標値を取得し、前記指定語が否定語である場合は、前記相関度取得部により取得された相関度、および前記指定語数取得部により取得された否定語数に基づいて、前記検索語と前記項目識別情報との否定的な意味を持つ関連度を示す指標値を取得する。
【0011】
本発明の一態様は、コンピュータが、時系列に値が変動する項目の識別情報である項目識別情報と、少なくとも1つ以上の文が含まれる文書の識別情報である文書識別情報と、前記文書に含まれる予め指定された評価表現である指定語の数を示す指定語数とが対応付けられた情報テーブルを参照し、特定の前記項目識別情報に対応する前記指定語数を前記情報テーブルから取得する指定語数取得ステップと、前記項目識別情報に対応する値の時系列変動を取得し、前記特定の項目識別情報に対応付けられ且つ入力された検索語を含む前記文書識別情報の数を前記情報テーブルから抽出し、前記抽出した検索語を含む文書識別情報の数の時系列情報と前記時系列変動との相関度を取得する相関度取得ステップと、前記相関度取得ステップにより取得された相関度と、前記指定語数取得ステップにより取得された指定語数とに基づいて、前記検索語と前記項目識別情報との関連度を示す指標値を取得する指標値取得ステップと、を有する情報処理方法である。
【0012】
本発明の一態様は、コンピュータに、時系列に値が変動する項目の識別情報である項目識別情報と、少なくとも1つ以上の文が含まれる文書の識別情報である文書識別情報と、前記文書に含まれる予め指定された評価表現である指定語の数を示す指定語数とが対応付けられた情報テーブルを参照し、特定の前記項目識別情報に対応する前記指定語数を前記情報テーブルから取得する指定語数取得ステップと、前記項目識別情報に対応する値の時系列変動を取得し、前記特定の項目識別情報に対応付けられ且つ入力された検索語を含む前記文書識別情報の数を前記情報テーブルから抽出し、前記抽出した検索語を含む文書識別情報の数の時系列情報と前記時系列変動との相関度を取得する相関度取得ステップと、前記相関度取得ステップにより取得された相関度と、前記指定語数取得ステップにより取得された指定語数とに基づいて、前記検索語と前記項目識別情報との関連度を示す指標値を取得する指標値取得ステップと、を実行させるためのコンピュータプログラムである。
【発明の効果】
【0013】
本発明により、利用者にとってより利用価値が高い情報を提供することができる。
【図面の簡単な説明】
【0014】
図1】情報処理システム10が実行する処理の概要を説明するための図である。
図2】第1の実施形態における情報処理システム10の機能構成を示す概略ブロック図である。
図3】アイテムセンテンス記憶部24に記憶されているアイテムセンテンステーブル25の一例を示す図である。
図4】情報処理システム10により実行される処理の流れを示すフローチャートである。
図5】ステップS112の処理詳細の流れを示すフローチャートである。
図6】時系列相関スコアの算出について説明するための概念図である。
図7】第2の実施形態の情報処理システム10Aの機能構成について説明するための図である。
図8】アイテム関連語リスト記憶部46に記憶される情報の一例を示す図である。
図9】情報登録部40により実行される処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0015】
以下、図面を参照し、本発明の情報処理システム、情報処理方法、およびコンピュータプログラムの実施形態について説明する。
【0016】
(第1実施形態)
図1は、情報処理システム10が実行する処理の概要を説明するための図である。情報処理システム10は、例えば検索語として「オリンピック」が入力された場合、ニュースや、ブログ等のテキスト情報を基に構築されたデータベースを検索する。情報処理システム10は、検索した結果に基づいて、所定のアイテム(項目)と検索語との関係を示す関連指数を算出する。アイテムとは商品名や、株式銘柄など検索結果の出力に期待するものを指す。本実施形態では、一例として検索語に関連する株式銘柄を検索する場合について説明する。
【0017】
また、情報処理システム10は、検索語が所定の株式銘柄に対して肯定的な意味を持つと判断されることを示すポジティブスコア(Pスコア)、または検索語が所定の株式銘柄に対して否定的な意味を持つと判断されることを示すネガティブスコア(Nスコア)を算出する。株式銘柄の場合、肯定的な意味を持つとは、文書内で肯定的に該当銘柄が言及されていたり、該当銘柄の言及のある記事数が株価の上昇傾向と相関していたりすることであり、否定的な意味を持つとは、文書内で否定的に該当銘柄が言及されていたり、該当銘柄の言及のある記事数が株価の下落傾向と相関していたりすることである。情報処理システム10は、算出した関連指数、Pスコア、またはNスコアを株式銘柄に関する付帯情報や、検索に用いられた文書等と共に出力する。なお、ポジティブスコア(Pスコア)は、検索語が所定の株式銘柄に対して肯定的に影響することを示す指標値であってもよい。ネガティブスコア(Nスコア)は、検索語が所定の株式銘柄に対して否定的に影響することを示す指標値であってもよい。
【0018】
情報処理システム10は、ネットワーク等の通信網を介して外部端末100から関連を調べたい語を含む検索要求を取得する。情報処理システム10は、自装置が備えるアイテムセンテンス記憶部24(後述)とアイテム時系列記憶部26(後述)とに蓄積されている情報を検索し、関連を調べたい語に関連が高い株式銘柄(アイテム)のリスト(出力アイテムリスト)を生成し、外部端末100に送信する。
【0019】
関連の高さは、検索スコア、ポジティブ語スコア、ネガティブ語スコア、ポジティブ時系列相関スコア、ネガティブ時系列相関スコアの5種類のスコアにより表される。情報処理システム10の処理結果は、5種類のスコアのうち一つを用いても良いし、複数種類のスコアを組み合わせ、スコアの重み付け和等により新たに値を算出してもよい。なお、5種類のスコアの詳細については後述する。
【0020】
図2は、第1の実施形態における情報処理システム10の機能構成を示す概略ブロック図である。情報処理システム10は、ネットワークNWを介して外部端末100に接続される。情報処理システム10は、1台または複数台の情報処理装置によって構成される。例えば、情報処理システム10が1台の情報処理装置で構成される場合、情報処理装置は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、情報処理プログラムを実行する。情報処理プログラムの実行によって、情報処理装置は、要求受信部12と、制御部(指標値取得部)14と、検索スコア取得部16と、ポジネガスコア取得部(指定語数取得部)18と、時系列相関スコア取得部(相関度取得部)20と、応答部22と、アイテムセンテンス記憶部24と、アイテム時系列記憶部26とを備える装置として機能する。なお、情報処理システム10の全てまたは一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。また、情報処理システム10は、専用のハードウェアによって実現されてもよい。情報処理プログラムは、コンピュータ読み取り可能な記憶媒体に記憶されても良い。コンピュータ読み取り可能な記憶媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD−ROM、半導体記憶装置(例えばSSD:Solid State Drive)等の可搬媒体、コンピュータシステムに内蔵されるハードディスクや半導体記憶装置等の記憶装置である。情報処理プログラムは、電気通信回線を介して提供されてもよい。なお、本実施形態において取得とは、情報処理システム10、または情報処理装置の上述した機能部が、例えばネットワーク等の通信網を介して他のシステムや、他の装置、他の機能部等から情報を取得することを含む。本実施形態において取得とは、情報処理システム10、または情報処理装置の上述した機能部が、予め登録された情報テーブルから該当する情報を取得することを含む。更に本実施形態において取得とは、情報処理システム10または情報処理装置が、取得した情報または保持している情報に基づいて演算処理を行うことを含む。
【0021】
要求受信部12は、外部端末100から関連を調べたい語(検索語)を含む検索要求を取得して制御部14に出力する。検索要求には、例えば検索語、検索対象ドキュメント種別(ニュースや、ブログ、その他企業に関する文書等、またはこれらの組み合わせ)、スコア計算方法(検索スコア取得部16、ポジネガスコア取得部18、または時系列相関スコア取得部20により算出された算出結果のうち最終的にどの算出結果を出力するか、または算出結果に基づく統合スコアを算出するかを指定)が含まれる。
【0022】
また、検索要求には、出力銘柄リストソート順(検索スコア、ポジティブ語スコア、ネガティブ語スコア、ポジティブ時系列相関スコア、ネガティブ時系列相関スコアのどのスコアに基づいてソートするかを指定)、出力フォーマット等が含まれる。検索要求には検索語(この語と関連するアイテムを検索することが目的である)が含まれる。検索要求には、その他、対象データの種別(ニュースや、ブログ、決算資料、企業Webサイト、その他銘柄に関するテキストデータ)、検索対象を含めることができる。また、検索要求には、検索スコア取得部16、ポジネガスコア取得部18、または時系列相関スコア取得部20で使用されるパラメータ(後述)、出力する情報に関する指示等を含めることができる。
【0023】
アイテムセンテンス記憶部24には、アイテムセンテンステーブル(情報テーブル)25が格納されている。アイテムセンテンステーブル25は、ニュースや、ブログ、その他記事等のテキストデータ(以下「ドキュメント(文書)」という。)に基づいて作成される。アイテムセンテンステーブル25の各レコードは、文書を分割した単位であるセンテンス(文)を登録単位としている。図3は、アイテムセンテンス記憶部24に記憶されているアイテムセンテンステーブル25の一例を示す図である。各センテンスに対応付けられて、レコードのID、データの種別、ドキュメントに対応付けられた(閲覧可能となった)日付、センテンスに関連する株式銘柄の銘柄コード、センテンスを含む記事ID、記事のリンク先、文書内におけるセンテンスの記事番号、センテンスの本文テキスト、検索用インデクス、ポジティブ語数、およびネガティブ語数が対応付けられて記憶されている。ポジティブ語数とは、センテンス内に存在する事前に設定された肯定的な表現を示す語の数である。ネガティブ語数とは、センテンス内に存在する事前に設定された否定的な表現を示す語の数である。
【0024】
アイテムセンテンステーブル25は、ドキュメントの集まりを入力データとして、例えば以下の手順で事前に作成され、アイテムセンテンス記憶部24に格納される。なお、アイテムセンテンステーブル25は、情報処理システム10により以下の手順で作成されてもよいし、後述する第2の実施形態の情報登録部40により作成されてもよい。
(1)センテンスは、句点やピリオド、または連続した改行等を区切り文字としてドキュメントを分割することで作成される。
(2)各センテンスに対して、公知のテキスト解析法を適用し、品詞情報が付与された形態素等の更に細かい単位に分割しリストを作成する。以下、この単位を「単語」という。「単語」は、言語学における単語や形態素と同一である必要はない。テキスト解析手法として、例えば下記参考文献1に記載された形態素解析JTAG等の公知の技術を用いることができる。また、本処理において助詞、助動詞、指示代名詞等の検索には有用でないと判断した単語はリストから削除してもよい。
[参考文献1]今村賢治、他2名、「テキストからの知識抽出の基盤となる日本語基本解析技術」,NTT技術ジャーナル,vоl.20、No.6、p.20-23、2008年
(3)上記(2)で作成された単語を用いて、検索用のインデクスを作成する。
(4)センテンス、または単語のリストに対して評価語抽出手法を適用し、各単語に評価語ラベルを付与する。例えば肯定的な単語であるか否か、または否定的な単語であるか否かに基づいて、例えば「ポジティブ」「ネガティブ」の2種類のラベルを付与する。本処理は、例えば下記参考文献2に記載された公知の評価表現抽出手法等を用いることができる。以下、評価語ラベルとして「ポジティブ」「ネガティブ」の2種類を仮定して説明を行う。
[参考文献2]浅野久子,他3名,「Web上の口コミを分析する評判情報インデクシング技術」,NTT技術ジャーナル,vоl.20、No.6、p.12-15、2008年
(5)上記(4)で付与されたラベル種別およびセンテンスごと、ラベル種別ごとに集計し、アイテムセンテンス記憶部24に上述した処理結果を記憶させる。
(6)銘柄コードは、センテンスに関連する銘柄を特定するコードであり、アイテムセンテンス記憶部24に格納されたコードテーブルに基づいて指定される。なお、コードテーブルには、銘柄と銘柄を特定するコードとが対応付けられている。例えばセンテンスにある銘柄が含まれている場合、該当するセンテンスにある銘柄コードが対応付けられる。
【0025】
アイテム時系列記憶部26には、株式銘柄に対応する株価の変動が時系列に対応付けられたアイテム時系列情報(時系列変動)が記憶されている。アイテムが商品名である場合、該当商品の日ごとの売上数等である。
【0026】
制御部14は、取得した検索要求を解析し、アイテムセンテンス記憶部24から解析結果に対応する情報を抽出する。制御部14は、検索スコア取得部16、ポジネガスコア取得部18、または時系列相関スコア取得部20に抽出した情報を出力する。制御部14は、検索スコア取得部16、ポジネガスコア取得部18、または時系列相関スコア取得部20により算出された算出結果に基づいて、種々の情報間の相関度を算出する。また、制御部14は、時系列相関スコア取得部20により算出された相関度、およびポジネガスコア取得部18により算出された算出結果に基づいて、検索語と株式銘柄がどれだけ肯定的な意味における関連性、または否定的な意味における関連性を持っているかを示す指標値を算出する。
【0027】
検索スコア取得部16は、制御部14により抽出された情報に基づいて、検索結果をスコアとして算出する。ポジネガスコア取得部18は、制御部14により抽出された情報に含まれるポジティブな表現を表す語の数、またはネガティブな表現を表す語の数に基づいて、株式銘柄ごとにポジティブ語スコアまたはネガティブ語スコアを算出する。時系列相関スコア取得部20は、アイテム時系列情報を取得する。時系列相関スコア取得部20は、アイテム時系列情報、およびアイテムセンテンステーブル25に含まれる情報に基づいて、検索語を含むドキュメントの数の時系列情報(検索語時系列情報)とアイテム時系列情報との相関度を算出する。応答部22は、制御部14から取得した情報を外部端末100にネットワークNWを介して送信する。
【0028】
図4は、情報処理システム10により実行される処理の流れを示すフローチャートである。まず、制御部14が、要求受信部12から検索要求を取得するまで待機する(ステップS100)。検索要求を取得すると、制御部14は、取得した検索要求を解析し(ステップS102)、アイテムセンテンス記憶部24から解析結果に対応する情報を抽出する(ステップS104)。次に、制御部14は、抽出された情報に基づいて、同一の銘柄コードを含むレコードを抽出する(ステップS106)。
【0029】
次に、ステップS108からステップS112の処理では、ステップS106で抽出された同一の銘柄コードごとに各処理を実行する。検索スコア取得部16が、ステップS106で抽出されたレコードに対応するセンテンス数に基づいて、銘柄コードの検索スコアを算出する(ステップS108)。検索スコアは、検索語が含まれ、且つ同一の銘柄コードが対応付けられたセンテンス数に基づいて算出される。なお、検索スコアは、図1で示した関連指数に相当する。
【0030】
検索スコアとして上記センテンス数を用いることができるが、例えば抽出されたセンテンス数の平均値が1/λ、標準偏差が1/λの指数分布に従うと仮定し、指数分布の累積分布関数を用いて検索スコアの値が0から100の間の値を満たすように、例えば式(1)を用いて算出してもよい。
【数1】

ここでλは実定数であり、検索スコア取得部16の記憶領域に事前に設定値として保存しておく。なお、式(1)代えて、その他の累積分布関数を用いてもよい。また、検索スコア取得部16は、単純にセンテンス数をカウントする代わりに、センテンス数に対して重み付けを行ってもよい。例えば検索スコア取得部16は、センテンスに対応付けられた日付が検索スコアの算出時に近いセンテンスほど大きな重みをかけて和をとるようにしてもよい。また、ニュースやブログなど種別の異なる文書からのセンテンス情報がアイテムセンテンステーブルに含まれる場合、種別ごとに別々に検索スコアを算出し、予め決められた重みを用いて種別ごとの検索スコアの重みづけ和として最終的な検索スコアを決定してもよい。
【0031】
次に、ポジネガスコア取得部18が、ステップS106で抽出された同一の銘柄のレコードのセンテンスに含まれるポジティブ語数、およびネガティブ語数に基づいて、ポジティブ語スコアTp、およびネガティブ語スコアTnを算出する(ステップS110)。ポジティブ語スコアTpは、銘柄コードごとにポジティブ語数を加算したカウント数Cpに基づいて算出される。また、ネガティブ語スコアTnは、銘柄コードごとにネガティブ語数を加算したカウント数Cnに基づいて算出される。ポジティブ語スコアTp、またはネガティブ語スコアTnは、それぞれCp、Cnの値をそのまま用いてもよいが、検索スコアと同様に前述した式(1)等の関数を用いて正規化された数値を算出してもよい。
【0032】
次に、時系列相関スコア取得部20が、時系列相関スコア(ポジティブスコア、およびネガティブスコア)を算出する(ステップS112)。時系列相関スコア、ポジティブスコア、およびネガティブスコアの算出手法の詳細については後述する。次に、制御部14は、ステップS108からステップS112で算出された算出結果を整形する(ステップS114)。例えば制御部14は、検索要求で出力する複数銘柄コードのソート順が指定されている場合には、算出された各スコアに基づいて銘柄リストをソートして、所定のフォーマットに整形する。所定のフォーマットとは、JSON形式や、XML形式、CSV形式等の検索要求で指定された形式である。次に、応答部22は、ステップS114で制御部14により整形された所定のフォーマットの銘柄リストを外部端末100に送信する(ステップS116)。これにより外部端末100には、情報処理システム10により生成された銘柄リストが表示される。銘柄リストには、銘柄コード(銘柄名)、検索スコア、ポジティブ語スコア、ネガティブ語スコア、後述する時系列相関スコア、後述するポジティブスコア、後述するネガティブスコア、検索されたドキュメント名、URL等の文書の情報リスト、順位のうち全部、または一部が含まれる。
【0033】
[時系列相関スコア、ポジティブスコア、およびネガティブスコアの算出手法]
時系列相関スコア取得部20は、アイテムセンテンス記憶部24から抽出された情報に基づいて取得された検索語時系列情報と、アイテム時系列記憶部26に記憶されたアイテム時系列情報と、に基づいて時系列相関スコアを算出する。検索語時系列情報とは、制御部14によりアイテムセンテンステーブル25から抽出されたアイテムの時系列変動を示した情報である。検索語時系列情報とは、例えば検索語の日ごとの出現頻度の配列(後述の「ドキュメントカウント値時系列情報」)等である。
【0034】
時系列相関スコアとは、検索語時系列情報と、アイテム時系列情報との関連度を示す度合である。また、時系列相関スコアには、例えばポジティブ時系列相関スコアSpおよびネガティブ時系列相関スコアSnが含まれる。ポジティブ時系列相関スコアSpとは、検索語時系列情報と、アイテム時系列情報との関連度において肯定的な関連を示すスコアである。ネガティブ時系列相関スコアSnとは、検索語時系列情報と、アイテム時系列情報との関連度において否定的な関連を示すスコアである。
【0035】
一般的に、時系列相関スコアを求めるとき、単純に検索語時系列情報と、アイテム時系列情報とのピアソンの積率相関係数を求める場合がある。この場合、検索語の日ごとの出現頻度の全体的な傾向の類似性を示すが、例えば検索語が多量に出現した日、またはその直後に株価が上昇した場合、または下落した場合が考慮された時系列相関スコアにはならない。
【0036】
また、他の方法として、例えば下記参考文献3に記載された株価と記事等のテキストデータの関連性に基づいて銘柄にスコアを付与する技術がある。この方法では、文書に含まれる各単語の株価変動に対する寄与度に基づき各単語にスコアを付与している。本手法により時系列相関スコアを算出する場合、すべての単語に関して主成分解析や、回帰分析等の統計解析結果を事前に算出して保持する必要があり、記事が追加される度に再計算が必要となる。このため、必要となる銘柄コード等のアイテムに対して直接スコアを付与するものでないため、銘柄コード間の比較に本手法を用いることができない場合がある。
[参考文献3]敷地琢哉,和泉潔,「複数のテキスト情報を用いた株式市場動向の分析」,人口知能学会研究会資料,SIG-FIN-013-09、2014年
【0037】
本実施形態では以下の手法により、時系列相関スコア取得部20が時系列相関スコアを算出する。ここでは、アイテムは株式の銘柄コードを表すものとする。また、アイテムセンテンス記憶部24に蓄積される情報は、日付と文書を含むニュース記事から作成されたものとする。また、アイテム時系列記憶部26に記憶される情報は、株式の株式コードごとに蓄積された日ごとの株価(終値など)である。アイテムは、株式の銘柄コードに限らず、アイテムに対応する値が日ごとに変動するアイテムであればよい。また、アイテム時系列記憶部26に記憶される情報は、アイテムセンテンステーブルの日付(または時刻)情報の単位と同一の単位を持つ時系列データであればよい。
【0038】
図5は、ステップS112の処理詳細の流れを示すフローチャートである。図6は、時系列相関スコアの算出について説明するための概念図である。
【0039】
まず、時系列相関スコア取得部20は、ステップS110でポジティブ語スコアTp、およびネガティブ語スコアTnが算出された銘柄コードに対応する株価を抽出する(ステップS150)。この場合、時系列相関スコア取得部20は、初期設定された期間Ds日(以下、「株価相関値計算期間」という。)、および期間Dsの直前の営業日の株価を抽出する。なお、時系列相関スコア取得部20は、アイテム時系列記憶部26に記憶されているすべての銘柄コードの株価を抽出してもよい。また、株価相関値計算期間は、外部端末100から送信された検索要求に含まれる情報に基づいて設定されてもよい。なお、株価相関値計算期間は、例えば検索要求発出日の前日から遡った1年間である。
【0040】
次に、時系列相関スコア取得部20は、抽出された株価に基づいて株価上昇日集合Gp、および株価下落日集合Gnの2種類の日付集合を算出する(ステップS152)。株価上昇日集合Gpは、前日(または前市場営業日)に比べてs+%以上上昇した日である。株価下落日集合Gnは、前日(または前市場営業日)に比べてs−%以上下落した日である。時系列相関スコア取得部20は、s+、およびs−の値として、例えば2%等と設定する。株式市場全体の変動の影響を取り除くため、時系列相関スコア取得部20は、s+%、およびs−%の設定値として、株式市場の指標(例えば日経平均やTOPIX等)の上昇率、下落率を動的に加算するようにしてもよい。
【0041】
時系列相関スコア取得部20は、制御部14にて取得した検索結果に基づき、対象の株式銘柄についてドキュメント出現日Wpの集合を算出する(ステップS154)。時系列相関スコア取得部20は、アイテムセンテンス記憶部24からS104にて取得された検索語を含むセンテンスについて、センテンスに対応付けられているドキュメントの異なり数を日ごとに算出する。単純に日ごとのセンテンス数を用いてもよい。時系列相関スコア取得部20は、株価相関値計算期間Dsとその直前Dw日を合わせたDs+Dw日分の銘柄コードに対応するドキュメントの数を日ごとに算出する。以下、時系列相関スコア取得部20により算出されたドキュメントの数(またはセンテンスの数)を「ドキュメントカウント値時系列情報」という。また、時系列相関スコア取得部20は、株価相関値計算期間Dsにおいて閾値Θを超える日付で構成されるドキュメント出現日集合Wpを算出する。
【0042】
Θの値については、予め設定された値を用いてもよいが、時期により記事数が変わる場合の影響を取り除くために、以下のような方法で動的に決定してもよい。すなわち、時系列相関スコア取得部20は、株価相関値計算期間の各日付について、株価相関値計算期間前の過去Dw日(例えば図6のDw日)のドキュメントカウント値に含まれるドキュメント数(センテンス数)に基づいて閾値Θを求める。例えば図6の「X」に示す日が閾値Θを超える日付に該当するかを判定する場合、図中「過去Dw#日」に基づいて閾値Θが決定される。このようにドキュメントの数(センテンス数)を算出する対象の日の直前の過去日をDw日として閾値を算出することで、適切にドキュメント出現日集合Wpを算出することができる。
【0043】
閾値Θは、例えば過去Dw日間のドキュメントカウント値の平均をμ、標準偏差をσとして、式(2)を用いて算出することができる。ここで、αの値は、事前に設定される値であり、例えばα=1.0である。
【数2】
【0044】
時系列相関スコア取得部20は、ドキュメント出現日集合Wpと株価上昇日集合Gpとの合致度に基づいてポジティブ時系列相関スコアSpを算出する(ステップS156)。また、時系列相関スコア取得部20は、ドキュメント出現日集合Wpと株価下落日集合Gnとの合致度に基づいてネガティブ時系列相関スコアSnを算出する(ステップS158)。時系列相関スコア取得部20は、例えば式(3)示すようにダイス係数等の数式を用いて、ポジティブ時系列相関スコアSp、およびネガティブ時系列相関スコアSnを算出する。
【数3】
ここで、Gxは、株価上昇日集合Gpまたは株価下落日集合Gnを示す。Sxは、Gxに対応したポジティブ時系列相関スコアSp、またはネガティブ時系列相関スコアSnを示す。絶対値記号は各集合の要素数を表す。Gx∩Wpは、GxとWpが共通して含む日付からなる集合である。
【0045】
時系列相関スコア取得部20は、アイテム時系列情報に対してドキュメントが影響を与えるタイムラグを適用したスコアを算出するか否かを判定する(ステップS160)。何日分のラグを適用するかを予め設定して、S160を省略してもよい。上述した式(3)は、ドキュメント出現日と株価(時系列)が、上昇した日または下落した日の共通した割合が高い銘柄と検索語のペアに対して高いスコアを与えるものである。ドキュメント出現日の1日後や2日後に株価が変動した銘柄と検索語のペアに興味がある場合には、例えば外部端末100から送信される指示に基づいて、時系列相関スコア取得部20が日付のタイムラグを適用したスコアを算出する。
【0046】
タイムラグを適用したスコアを算出すると判定された場合、時系列相関スコア取得部20は、日付のタイムラグを適用したポジティブ時系列相関スコアSp、またはネガティブ時系列相関スコアSnを算出する(ステップS162)。具体的には時系列相関スコア取得部20は、i日前のドキュメント出現日と株価上昇日/下落日の共通部分に注目したスコアを算出する。時系列相関スコア取得部20は、i=1、2、…nに対してドキュメント出現日集合Wpに含まれる各日付をi日後にずらした新たなドキュメント出現日集合Wpiを作成する。時系列相関スコア取得部20は、各Wpiに対して上述した式(3)を適用して、ポジティブ時系列相関スコアSpi、またはネガティブ時系列相関スコアSniを算出する。
【0047】
そして、時系列相関スコア取得部20は、式(4)を用いて重み付け和を実行し、最終的なポジティブ時系列相関スコアSpi、またはネガティブ時系列相関スコアSniを算出する。
【数4】

ここで、Sx’は、ポジティブ時系列相関スコアSpまたはネガティブ時系列相関スコアSnを表し、SxiはSpiまたはSniのいずれかを表している。Sp0=Sp、Sn0=Snとする。また、wは、予め設定された値である。なお、ドキュメント出現日集合Wpiの作成に代えて、株価上昇日集合Gpまたは株価下落日集合Gnに含まれる各日付をi日前にずらした株価上昇日集合Gpiまたは株価下落日集合Gniを作成してもよい。
【0048】
次に、制御部14は、ポジティブスコアIp、およびネガティブスコアInを算出する(ステップS164)。制御部14は、検索スコア取得部16、ポジネガスコア取得部18、および時系列相関スコア取得部20から銘柄ごとの算出結果を取得する。制御部14は、検索スコア取得部16から検索スコアのリストを取得する。制御部14は、ポジネガスコア取得部18からポジティブ語スコアとネガティブ語スコアのリストを取得する。制御部14は、時系列相関スコア取得部20からポジティブ時系列相関スコアとネガティブ時系列相関スコアのリストを取得する。
【0049】
制御部14は、ポジネガスコア取得部18と時系列相関スコア取得部20の結果を統合して、ポジティブ、ネガティブそれぞれについて指標を一つに統合する。ポジティブ語カウント数Cpとポジティブ時系列相関スコアSpを統合し、ポジティブスコアIpを算出する。制御部14は、ネガティブ語カウント数Cnとネガティブ時系列相関スコアSnを統合し、ネガティブスコアInを算出する。制御部14は、例えば式(5)を用いて算出された換算カウント数を用いて、この換算カウント数をカウント数とみなすことで、例えば式(1)を適用し、ポジティブスコアIp(Pスコア)およびネガティブスコアIn(Nスコア)を算出する。
【数5】
ここで、Cxは、ポジティブ語カウント数Cpまたはネガティブ語カウント数Cnを表す。βは、予め設定されたパラメータであり、例えばβ=1.0または2.0等の値である。
【0050】
以上説明した第1の実施形態の情報処理システム10によれば、時系列相関スコア取得部20により算出された検索語の出現度と株価の変動との相関度と、ポジネガスコア取得部18により算出されたポジティブ語数(またはネガティブ語数)とに基づいて算出された、検索語と株式銘柄等アイテムの関連の強さを示す指標値を、指定された、ポジティブ、ネガティブ等、複数の種類の意味合いや文脈に対してそれぞれ算出するため、利用者にとって利用価値が高い情報を提供することができる。
【0051】
(第2実施形態)
以下、第2の実施形態について説明する。第2の実施形態は、情報登録部40が記事プロバイダ60、および時系列データプロバイダ70から各スコアを算出するための情報を取得し、アイテムセンテンス記憶部24またはアイテム時系列記憶部26に記憶させる点で第1の実施形態とは異なる。以下、この相違点を中心に説明する。
【0052】
図7は、第2の実施形態の情報処理システム10Aの機能構成について説明するための図である。外部端末100は、ネットワークNWを介してユーザ端末110、120、および130と通信可能に接続されている。第2の実施形態では、例えば外部端末100がユーザ端末110、120、または130から検索要求を受け付け、受け付けた検索要求を要求受信部12に送信する。また、外部端末100が、応答部22から情報処理システム10Aにより処理された処理結果を取得する。外部端末100は、取得した処理結果を、処理結果を含む所定の画像に生成してユーザ端末110、120、または130に送信する。
【0053】
情報処理システム10Aは、第1の実施形態の情報処理システム10の機能構成に加え、更に情報登録部40を備える。情報登録部40は、アイテムセンテンス登録部42と、アイテム抽出部44と、アイテム関連語リスト記憶部46と、アイテム時系列情報登録部48とを備える。
【0054】
アイテムセンテンス登録部42は、記事を作成または収集して配信する外部の記事プロバイダ60からネットワークNWを介してテキストで記述された記事(ニュースや、ブログ等)のドキュメントを取得する。アイテムセンテンス登録部42は、取得したドキュメントから必要情報を抽出し、センテンス単位でアイテムセンテンス記憶部24に抽出した必要情報を記憶させる。必要情報とは、例えば日付や、URL等の記事へのリンク、タイトル、記事本文等である。
【0055】
アイテム抽出部44は、アイテムセンテンス登録部により取得されたドキュメントにおいて、後述するアイテム関連語リスト記憶部46に記憶されている1つまたは複数の関連語(以下、「アイテム関連語」という。)がドキュメントに含まれているか否かを判定する。アイテム抽出部44は、判定した結果に基づいて各ドキュメントに含まれるアイテムをリスト化したアイテムリストを出力する。この処理は、通常使用される文字列検索技術を用いてもよいし、ドキュメントを形態素解析して得られる形態素に基づいて生成した検索インデクスを利用してもよい。例えば文字列検索技術として、UNIX(登録商標)系のコンピュータで標準的に使用されるgrepコマンドを用いてもよい。
【0056】
アイテムとして、例えば株式銘柄を考えた場合、銘柄名が一般名詞や地名などの別の固有名詞と同一の文字列として表現される場合がある。このような場合にアイテムの誤抽出を避けるために、ドキュメントに含まれる単語や形態素に対して、「組織名」、「地名」、「人名」、「日付」等のラベルを付与する手法である固有表現抽出を適用し、アイテムの関連語が「組織名」とラベル付けされた場合のみ、アイテム抽出部44がアイテムを抽出してもよい。固有表現抽出については、例えば上記参考文献1や、下記参考文献4にあるような公知の技術を用いることができる。
[参考文献4]磯崎秀樹、賀沢秀人、「固有表現抽出のためのSVMの高速化」、情報処理学会論文誌、vol.44.No.3、p.970-979、2003年
【0057】
アイテム関連語リスト記憶部46には、アイテム名(銘柄)と、アイテム名に関連する関連語とが対応付けられて記憶される。図8は、アイテム関連語リスト記憶部46に記憶される情報の一例を示す図である。例えばアイテム名が社名の場合、社名の略称や、社名に対応する会社が提供している商品またはサービス等がアイテム関連語として記憶されている。
【0058】
アイテム時系列情報登録部48は、アイテムに関する時系列データを作成または収集して配信する外部の時系列データプロバイダ70からネットワークNWを介して時系列データを取得する。例えばアイテムが株式銘柄の場合、時系列データは、各銘柄の所定時間ごと、または所定時期ごとの株価を含む情報である。
【0059】
図9は、情報登録部40により実行される処理の流れを示すフローチャートである。まず、アイテムセンテンス登録部42は、記事プロバイダ60からドキュメントリストを取得し、取得したドキュメントリストを読み込む(ステップS200)。次に、アイテムセンテンス登録部42は、読み込んだドキュメントリストにドキュメントが含まれているか否かを判定する(ステップS202)。ドキュメントが含まれていない場合、本フローチャートの処理は終了する。
【0060】
ドキュメントリストにドキュメントが含まれている場合、アイテム抽出部44が、ドキュメントから関連するアイテムを抽出し、アイテムリストを生成する(ステップS204)。次に、アイテム抽出部44は、アイテムリストの生成が1件以上存在するか否かを判定する(ステップS206)。生成されたアイテムリストが存在しない場合、本フローチャートの処理は終了する。
【0061】
アイテムリストの生成が1件以上存在する場合、アイテムセンテンス登録部42は、ピリオドや、句点、連続する改行に基づいてドキュメントをセンテンス単位に分割する(ステップS208)。
【0062】
次に、アイテムセンテンス登録部42は、分割したセンテンスごとにステップS210からステップS214の処理を実行する。アイテムセンテンス登録部42は、公知の形態素解析技術を用いてセンテンスを「単語」に分割し、各単語をキーとする検索インデクスを生成する(ステップS210)。アイテム抽出部44が、ステップS204で検索インデクスを生成した場合は、アイテム抽出部44により生成された検索インデクスを用いてもよい。
【0063】
次に、アイテムセンテンス登録部42は、ポジティブ語およびネガティブ語の抽出を行い、ポジティブ表現およびネガティブ表現を示す形態素または単語の数をそれぞれ算出する(ステップS212)。アイテムセンテンス登録部42は、例えば事前に用意されたポジティブ表現(例えば「美しい」「向上」・・・)のリストなどに基づいて、ポジティブ表現またはネガティブ表現を抽出してもよいし、参考文献2に記載されているような公知の評価表現抽出技術を用いてもよい。このとき、アイテムセンテンス登録部42は、例えば抽出したポジティブ表現またはネガティブ表現の数をアイテムセンテンス記憶部24に登録してもよい。次に、アイテムセンテンス登録部42は、アイテムセンテンステーブル25と同様のリストを生成し、アイテムセンテンス記憶部24に生成したリストを登録する(ステップS214)。これにより本フローチャートの処理は終了する。
【0064】
上述した情報登録部40により実行される処理では、同じドキュメントに含まれるセンテンスに対しては常に同じアイテムリストが割り当てられるという方法である。しかしながら、ドキュメントの前半と後半とで全く異なる銘柄についての記述となっている場合がある。この場合であっても、以下の方法により各センテンスに対するアイテムリストを絞ることができる。
【0065】
(1)各センテンスにおいて、センテンスの中にアイテム関連語が含まれないアイテムはアイテムリストから除外した一時アイテムリストを生成する(各センテンス中にアイテム関連語が含まれるアイテムのみを残す。)
(2)上記(1)を各ドキュメント内のセンテンスに適用した後、各センテンスにおいて、その前後nlレコードのセンテンスについて一時アイテムリストを結合し、重複を排除したものを新たなアイテムリストとして登録する(前後nlレコード以内に含まれるアイテムのみを使用する)。なお、nlは事前に設定しておく。また、アイテムセンテンス登録部42は、事前に設定された保存期間(例えば1年間)を経過したセンテンスを削除する処理を、定期的または登録処理時に実行してもよい。
【0066】
以上説明した第2の実施形態の情報処理システム10Aは、アイテムセンテンス登録部42が、記事プロバイダ60から取得したドキュメントリストに基づいて、形態素解析、およびポジティブ語およびネガティブ語の抽出等を行ってアイテムセンテンステーブル25と同様のリストを生成する。この結果、情報処理システム10が指標値を算出するために用いる情報を適切に生成することができる。
【0067】
なお、本実施形態では、一例としてアイテムを株式銘柄として説明したが、アイテムは株式銘柄に限られない。アイテムは、例えばアイテムに付与された値が時系列に変動するものであればよい。例えばアイテムは、価格が変動する商品や、サービス、または指標であってもよい。アイテムは、例えば石油や、先物取引の銘柄、為替、各種有価証券、物価の上昇率、テレビ番組の視聴率、商品の売上等であってもよい。
【0068】
上述した実施形態における情報処理システム10の機能をコンピュータで実現するようにしても良い。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
【0069】
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
【符号の説明】
【0070】
10…情報処理システム、12…要求受信部、14…制御部、16…検索スコア取得部、
18…ポジネガスコア取得部、20…時系列相関スコア取得部、22…応答部、24…アイテムセンテンス記憶部、26…アイテム時系列記憶部、40…情報登録部、42…アイテムセンテンス登録部、44…アイテム抽出部、46…アイテム関連語リスト記憶部、48…アイテム時系列情報登録部
図1
図2
図3
図4
図5
図6
図7
図8
図9