IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

<>
  • 特許-抽出プログラム、抽出方法及び抽出装置 図1
  • 特許-抽出プログラム、抽出方法及び抽出装置 図2
  • 特許-抽出プログラム、抽出方法及び抽出装置 図3
  • 特許-抽出プログラム、抽出方法及び抽出装置 図4
  • 特許-抽出プログラム、抽出方法及び抽出装置 図5
  • 特許-抽出プログラム、抽出方法及び抽出装置 図6
  • 特許-抽出プログラム、抽出方法及び抽出装置 図7
  • 特許-抽出プログラム、抽出方法及び抽出装置 図8
  • 特許-抽出プログラム、抽出方法及び抽出装置 図9
  • 特許-抽出プログラム、抽出方法及び抽出装置 図10
  • 特許-抽出プログラム、抽出方法及び抽出装置 図11
  • 特許-抽出プログラム、抽出方法及び抽出装置 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-04-25
(45)【発行日】2023-05-08
(54)【発明の名称】抽出プログラム、抽出方法及び抽出装置
(51)【国際特許分類】
   G06Q 30/0241 20230101AFI20230426BHJP
   G06F 16/20 20190101ALI20230426BHJP
【FI】
G06Q30/0241 392
G06F16/20
【請求項の数】 7
(21)【出願番号】P 2019037041
(22)【出願日】2019-02-28
(65)【公開番号】P2020140581
(43)【公開日】2020-09-03
【審査請求日】2021-12-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】浅井 達哉
(72)【発明者】
【氏名】後藤 啓介
(72)【発明者】
【氏名】岩下 洋哲
(72)【発明者】
【氏名】大堀 耕太郎
【審査官】西村 直史
(56)【参考文献】
【文献】特開2017-068875(JP,A)
【文献】特開2014-081878(JP,A)
【文献】特開2017-174176(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/20
(57)【特許請求の範囲】
【請求項1】
データに含まれる複数の項目値に関する条件の組み合わせを生成し、
前記データを学習したモデルを用いて、前記組み合わせごとの、前記データにおける共起性の度合いである指標値を計算し、
前記条件又は前記指標値に基づいて、前記組み合わせの中から特定の組み合わせを抽出し、
前記特定の組み合わせのうち、第1の条件と他の条件との組み合わせである第1の組み合わせの指標値が第1の基準を超え、前記第1の条件のみの指標値が第2の基準を超えない場合、前記第1の組み合わせを他の組み合わせと比べて強調した上で、前記特定の組み合わせの一覧を表示する
処理をコンピュータに実行させることを特徴とする抽出プログラム。
【請求項2】
前記生成する処理は、目的変数と前記目的変数に対応する1つ以上の説明変数に関する条件との組み合わせを生成し、
前記計算する処理は、前記組み合わせごとに、前記条件が満たされることに対する前記目的変数の尤度を、前記指標値として計算する
ことを特徴とする請求項1に記載の抽出プログラム。
【請求項3】
前記抽出する処理は、前記組み合わせの中から、前記指標値が所定値以上である組み合わせを抽出することを特徴とする請求項1又は2に記載の抽出プログラム。
【請求項4】
前記生成する処理は、前記条件のうち、前記データと合致する回数が所定値以上である条件の組み合わせを生成する
ことを特徴とする請求項1からのいずれか1項に記載の抽出プログラム。
【請求項5】
前記生成する処理は、時間経過により増加するデータに含まれる複数の項目値に関する条件の組み合わせを生成する
ことを特徴とする請求項1からのいずれか1項に記載の抽出プログラム。
【請求項6】
データに含まれる複数の項目値に関する条件の組み合わせを生成し、
前記データを学習したモデルを用いて、前記組み合わせごとの、前記データにおける共起性の度合いである指標値を計算し、
前記条件又は前記指標値に基づいて、前記組み合わせの中から特定の組み合わせを抽出し、
前記特定の組み合わせのうち、第1の条件と他の条件との組み合わせである第1の組み合わせの指標値が第1の基準を超え、前記第1の条件のみの指標値が第2の基準を超えない場合、前記第1の組み合わせを他の組み合わせと比べて強調した上で、前記特定の組み合わせの一覧を表示する
処理をコンピュータが実行することを特徴とする抽出方法。
【請求項7】
データに含まれる複数の項目値に関する条件の組み合わせを生成する生成部と、
前記データを学習したモデルを用いて、前記組み合わせごとの、前記データにおける共起性の度合いである指標値を計算する計算部と、
前記条件又は前記指標値に基づいて、前記組み合わせの中から特定の組み合わせを抽出する抽出部と、
前記抽出部によって抽出された前記特定の組み合わせのうち、第1の条件と他の条件との組み合わせである第1の組み合わせの指標値が第1の基準を超え、前記第1の条件のみの指標値が第2の基準を超えない場合、前記第1の組み合わせを他の組み合わせと比べて強調した上で、前記抽出部によって抽出された前記特定の組み合わせの一覧を表示する出力部と、
を有することを特徴とする抽出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、抽出プログラム、抽出方法及び抽出装置に関する。
【背景技術】
【0002】
従来、広告出稿の最適化を図る技術が知られている。特にデジタルマーケティングにおいては、ログデータの分析結果に基づき、最適化のための施策の立案や実施が行われる場合がある。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2015-028732号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の技術では、施策の立案及び実施を効率化することが困難な場合があるという問題がある。例えば、ログデータの項目値それぞれの重要度をロジスティクス回帰等の手法で計算し、さらに重要度に基づき複数の項目値を組み合わせて分析を行う場合を考える。この場合、組み合わせの数は膨大になるため、従来の技術では、全ての組み合わせを考慮した分析を行うことは難しい。このため、従来の技術では、ログデータの分析結果を、施策の立案及び実施の効率化につなげることが困難な場合がある。
【0005】
1つの側面では、施策の立案及び実施を効率化することを目的とする。
【課題を解決するための手段】
【0006】
1つの態様において、抽出プログラムは、データに含まれる複数の項目値に関する条件の組み合わせを生成する処理をコンピュータに実行させる。また、抽出プログラムは、データを学習したモデルを用いて、組み合わせごとの、データにおける共起性の度合いである指標値を計算する処理をコンピュータに実行させる。また、抽出プログラムは、条件又は指標値に基づいて、組み合わせの中から特定の組み合わせを抽出する処理をコンピュータに実行させる。
【発明の効果】
【0007】
1つの側面では、施策の立案及び実施を効率化することができる。
【図面の簡単な説明】
【0008】
図1図1は、実施例に係る抽出装置の機能構成の一例を示す図である。
図2図2は、ログデータの一例を示す図である。
図3図3は、仮説情報の一例を示す図である。
図4図4は、変数情報の一例を示す図である。
図5図5は、変数とデータの関係を説明する説明図である。
図6図6は、仮説の生成を説明する説明図である。
図7図7は、仮説の生成を説明する説明図である。
図8図8は、仮説の生成を説明する説明図である。
図9図9は、生成された仮説の一例を示す説明図である。
図10図10は、ロジスティック回帰による重要度の計算を説明する説明図である。
図11図11は、抽出処理の流れを示すフローチャートである。
図12図12は、ハードウェア構成例を説明する図である。
【発明を実施するための形態】
【0009】
以下に、本発明に係る抽出プログラム、抽出方法及び抽出装置の実施例を図面に基づいて詳細に説明する。なお、この実施例により本発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
【実施例1】
【0010】
[機能構成]
図1を用いて、実施例に係る抽出装置の機能構成について説明する。図1は、実施例に係る抽出装置の機能構成の一例を示す図である。図1に示すように、抽出装置10は、通信部11、入力部12、出力部13、記憶部14及び制御部15を有する。
【0011】
通信部11は、他の装置との間でデータの通信を行うためのインタフェースである。例えば、通信部11はNIC(Network Interface Card)であり、インターネットを介してデータの通信を行う。
【0012】
入力部12は、ユーザが情報を入力するための装置である。例えば、入力部12は、マウス及びキーボードである。また、出力部13は、画面を表示するディスプレイ等である。また、入力部12及び出力部13は、タッチパネルディスプレイであってもよい。
【0013】
記憶部14は、データや制御部15が実行するプログラム等を記憶する記憶装置の一例であり、例えばハードディスクやメモリ等である。記憶部14は、ログデータ141、仮説情報142及び変数情報143を記憶する。
【0014】
ログデータ141は、項目値として、目的変数及び目的変数に対する複数の説明変数を持つデータである。図2は、ログデータの一例を示す図である。図2に示すように、ログデータ141は、キーとして日時を持つ。このように、ログデータ141は、キーとして日時を持ち、さらに時間の経過にともないデータが増加していく時系列データであってもよい。
【0015】
実施例において、ログデータ141は、所定の日時に収集された、Web上に出稿した広告に関する情報と、当該情報に対して行われた施策とを対応付けたデータであるものとする。
【0016】
ログデータ141は、有効な施策を導出するためのモデルを訓練するための訓練データとして利用される場合がある。このため、例えば、ログデータ141における施策は、熟練した立案者によって立案されたものであってもよい。また、ログデータ141は、実施した施策が成功したケースのデータを集めたものであってもよい。
【0017】
図2に示すように、ログデータ141は、説明変数として「クリック数」、「曜日」、「時間帯」、「直前」、「残予算」を有する。また、ログデータ141は、目的変数として「広告価格」を有する。目的変数「広告価格」は、施策が、広告価格を上げるものであるか、広告価格を維持するものであるか、広告価格を下げるものであるかを表す。
【0018】
例えば、図2の1行目には、休日の午後に、ある広告のクリック数が100回であり、当該広告の残予算が10,000円であったという情報が、2019/6/5の10:00に収集されたことが示されている。さらに、図2の1行目には、当該広告に対しては、広告価格を下げる施策が行われたことが示されている。
【0019】
仮説情報142は、目的変数と目的変数に対応する1つ以上の説明変数に関する条件との組み合わせと、重要度とを対応付けた情報である。ここで、重要度は指標値の一例である。図3は、仮説情報の一例を示す図である。以降の説明では、仮説情報142における組み合わせを、仮説と呼ぶ場合がある。また、重要度の計算方法については後に説明する。
【0020】
例えば、図3の1行目には、「残り予算が存在∧クリック数≧100∧曜日=休日である場合に、広告価格を上げる」という仮説の重要度が0.85であることが示されている。
【0021】
また、仮説は、説明変数と目的変数とを区別せずに、複数の項目値に関する条件の組み合わせということができる。その場合、図3の1行目の仮説は、「残り予算が存在∧クリック数≧100∧曜日=休日∧広告価格が上げ」のように表されてもよい。
【0022】
変数情報143は、変数ごとの重要度である。図4は、変数情報の一例を示す図である。例えば、図4の1行目には、変数「残予算」の重要度が0.91であることが示されている。変数ごとの重要度は、仮説の重要度と同じ方法で計算されたものであってもよいし、仮説の重要度とは異なる方法で計算されたものであってもよい。例えば、変数ごとの重要度は、ロジスティック回帰等の既知の手法により計算されたものであってもよい。
【0023】
制御部15は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)等によって、内部の記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。また、制御部15は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されるようにしてもよい。制御部15は、生成部151、計算部152及び抽出部153を有する。
【0024】
生成部151は、データに含まれる複数の項目値に関する条件の組み合わせ、すなわち仮説を生成する。生成部151は、ログデータ141のような、説明変数と目的変数を持つデータから仮説を生成することができる。この場合、生成部151は、目的変数と目的変数に対応する1つ以上の説明変数に関する条件との組み合わせを仮説として生成する。
【0025】
また、生成部151は、時間経過により増加するデータに含まれる複数の項目値に関する条件の組み合わせを生成する。例えば、生成部151は、ログデータ141のような、時間経過とともにデータが追加されていく時系列データから組み合わせを生成することができる。
【0026】
図5から図9を用いて、生成部151による生成の方法を説明する。図5は、変数とデータの関係を説明する説明図である。ここで、図5に示すように、ログデータ141の各説明変数に関する条件には、A、B、C及びDの4つがあるものとする。また、Aの否定をA(Aの直上に-)のように表す。例えば、Aが「残り予算が存在」という条件を表している場合、Aは、「残り予算が存在しない」という条件を表す。また、例えば、Bが「クリック数≧100」という条件を表している場合、Bは、「クリック数<100」という条件を表す。
【0027】
また、P、P、P、P、N、N、Nは、ログデータ141に含まれるデータであって、目的変数と説明変数の条件とを対応付けたデータを表す。ここでは、Pは目的変数の値が「上げ」であるデータを表し、Pは目的変数の値が「下げ」であるデータを表すものとする(ただし、i及びjは任意の整数)。なお、図2に示すように、ログデータ141において、目的変数の値には「上げ」、「下げ」の他に「価格維持」が存在するが、ここでは、目的変数の値が「上げ」又は「下げ」の2種類であるものとして説明する。また、以降説明では、「上げ」を+、「下げ」を-と表現する場合がある。
【0028】
まず、図6に示すように、生成部151は、P、P、P、P、N、N、Nに含まれる説明変数のそれぞれについて、取り得る値の組み合わせを網羅的に列挙する。図6は、仮説の生成を説明する説明図である。ここで、取り得る値は、*(使用しない)、1(使用する)、0(条件の否定を使用する)である。
【0029】
なお、生成部151は、組み合わせる説明変数の数が所定の数以下となるように制限してもよい。例えば、生成部151は、A~Dの4つの説明変数の場合、組み合わせる説明変数の数を2以下とするように制限してもよい。この場合、生成部151は、4つの説明変数のうち*(使用しない)とするものを少なくとも2つ組み合わせる。説明変数の数が増加すると(例えば1000個)、組み合わせの数は爆発的に増加する。このため、制限により、列挙する組み合わせの数の増加を事前に抑止できる。
【0030】
そして、生成部151は、列挙した組み合わせがP、P、P、P、N、N、Nのいずれであるかを分類し、また、特定の条件を満たす有効な組み合わせであるか否かを判定する。例えば、特定の条件は、説明変数の条件が、ログデータ141のデータに合致する回数が所定値以上であることである。この場合、生成部151は、条件のうち、データと合致する回数が所定値以上である条件の組み合わせを生成することができる。
【0031】
図6の例では、生成部151は、A~Dの4つの説明変数の全てが*である組み合わせC01、Cである組み合わせC04、CD(C及びDが1、かつA及びBが*)である組み合わせC09等を列挙する。
【0032】
図6に示すように、生成部151は、P、P、P、P、N、N、Nの説明変数を基に、組み合わせC01~C09のそれぞれに該当するデータを列挙する。例えば、生成部151は、組み合わせC02に該当するデータとして、P、N、Nを列挙する。この場合、組み合わせC02について列挙されたデータには、目的変数が+であるデータ(P)と目的変数が-であるデータ(N、N)とが混在している。このため、組み合わせC02は、目的変数が+であるか-であるかを正しく説明する仮説としての可能性が低い。その結果、生成部151は、組み合わせC02を有効な仮説として採用しない。
【0033】
一方、生成部151は、組み合わせC08に該当するデータとして、N、Nを列挙する。この場合、組み合わせC08について列挙されたデータには、目的変数が-であるデータ(N、N)のみが存在する。このため、生成部151は、組み合わせC08を有効な仮説として採用する。
【0034】
また、生成部151は、異なる目的変数が混在している場合であっても、混在の割り合いに応じて組み合わせを有効な仮説として採用してもよい。例えば、ある組み合わせに対応するデータの例えば80%以上の目的変数が+であれば、生成部151は当該組み合わせを有効な仮説として採用するようにしてもよい。
【0035】
また、生成部151は、ある組み合わせの特殊ケースに該当する組み合わせを仮説から除外する。例えば、図6の組み合わせC05及びC06は、組み合わせC04の特殊ケースである。これは、組み合わせC05及びC06が、組み合わせC04にリテラルを付加したものに過ぎないからである。
【0036】
そして、生成部151は、図7に示す組み合わせを仮説として採用する。すなわち、生成部151は、組み合わせC01、C02、C03、C04a、C07、C08、C09を仮説として採用する。なお、組み合わせC04aは、Cを満たす組み合わせのうち、C04の特殊ケースを省略したものである。
【0037】
図7は、仮説の生成を説明する説明図である。図7は、図5及び図6の内容をカルノー図で表したものである。図7に示すように、生成部151は、A(B、C、Dは*(使用しない))の組み合わせ(S31)、A(B、C、Dは*(使用しない))の組み合わせ(S32)…の順に組み合わせを変更して有効な組み合わせを検討する(S31~S35…)。
【0038】
ここで、S33のCの組み合わせには、目的変数が+であるデータ(P、P、P)が該当する。すなわち、S33では、+のクラスに分類されるデータ(P、P、P)の数又は割合が所定の値以上である。よって、生成部151は、S33のCの組み合わせを+のクラスに分類する有効な組み合わせ(仮説)と判定する。なお、以下の処理では、Cにリテラルを加える組み合わせは除外する。
【0039】
次に、生成部151は、3つの説明変数を*(使用しない)とする全ての組み合わせの検討後に、2つの説明変数を*(使用しない)とする組み合わせの検討を開始する(S34)。ここで、S35のABの組み合わせでは、目的変数が+である訓練データ(P、P)が該当する。すなわち、S35では、+のクラスに分類される訓練データ(P、P)の数又は割合が所定の値以上である。よって、生成部151は、S35のABの組み合わせを+のクラスに分類する有効な組み合わせ(仮説)と判定する。
【0040】
図9は、生成された仮説の一例を示す説明図である。図9に示すように、生成部151は、P、P、P、P、N、N、Nから、分類結果が+又は-となる仮説H1~H11を生成し、生成した仮説を仮説情報142として記憶部14に格納する。
【0041】
仮説H1~H11のそれぞれは、各データの分類結果が+又は-となることについて正しく説明していることを要件とする独立した仮説である。よって、仮説H2と、仮説H6のように、相互には矛盾した仮説が存在する場合がある。
【0042】
計算部152は、データを学習したモデルを用いて、組み合わせごとの、データにおける共起性の度合いである重要度を計算する。例えば、計算部152は、各仮説の重要度をロジスティック回帰により計算する。図10は、ロジスティック回帰による重要度の計算を説明する説明図である。計算部152は、図10に示すモデル式にログデータ141を適用し、最適な係数β~β11を計算する。計算部152は、仮説情報142の重要度を計算した係数で更新する。
【0043】
このとき、各仮説の重要度は、ログデータ141における共起性が大きいほど大きくなる指標値である。また、重要度は、各説明変数の条件が満たされるときの目的変数の尤もらしさということができる。このため、計算部152は、組み合わせごとに、条件が満たされることに対する目的変数の尤度を、重要度として計算する。
【0044】
抽出部153は、条件又は重要度に基づいて、組み合わせの中から特定の組み合わせを抽出する。つまり、抽出部153は、重要度を基に、特に重要と考えられる仮説を仮説情報142から抽出する。例えば、抽出部153は、組み合わせの中から、重要度が所定値以上である組み合わせを抽出する。
【0045】
また、抽出部153によって抽出された仮説及び各仮説の重要度は、ディスプレイ等の表示装置として機能する出力部13によって一覧で表示される。このとき、出力部13は、変数単独では重要ではないが、他の変数と組み合わせた場合に重要になるような変数に関する条件を強調して表示する。
【0046】
出力部13は、第1の条件と他の条件との組み合わせである第1の組み合わせの重要度が第1の基準を超え、第1の条件のみの重要度が第2の基準を超えない場合、第1の組み合わせを他の組み合わせと比べて強調表示する。
【0047】
例えば、第1の基準が「仮説の重要度が0.5以上」であるとする。また、第2の基準が「変数の重要度が0.1以下」であるとする。このとき、図3より、「残り予算なし∧時間帯=午前の場合に価格を下げる」という仮説の重要度は0.78であり、第1の基準を超えている。また、図4より、変数「時間帯」の重要度は0.03であり、第2の基準を超えていない。このため、例えば、出力部13は、「時間帯=午前」の部分を、フォントやスタイルの変更、及びマーキング等により強調して表示する。
【0048】
図11を用いて、抽出装置10による処理の流れを説明する。図11は、抽出処理の流れを示すフローチャートである。図11に示すように、まず、抽出装置10は、目的変数及び所定数の説明変数の条件の組み合わせを列挙し、仮説を生成する(ステップS11)。例えば、抽出装置10は、列挙した組み合わせのうち、特定の条件を満たさない組み合わせや、ある組み合わせの特殊ケースである組み合わせを仮説に含めないようにする。
【0049】
次に、抽出装置10は、仮説ごとの重要度を計算する(ステップS12)。そして、抽出装置10は、仮説と重要度を一覧表示するとともに、単独での重要度が所定値以下である変数についての条件を強調表示する(ステップS13)。
【0050】
[効果]
これまで説明してきたように、抽出装置10は、データに含まれる複数の項目値に関する条件の組み合わせを生成する。抽出装置10は、データを学習したモデルを用いて、組み合わせごとの、データにおける共起性の度合いである重要度を計算する。抽出装置10は、条件又は重要度に基づいて、組み合わせの中から特定の組み合わせを抽出する。このように、抽出装置10は、複数の項目値を組み合わせた条件ごとの重要度の評価を行うことができる。このため、実施例によれば、項目値の組み合わせにより発生する膨大な数の仮説を評価し、施策の立案及び実施を効率化することができる。
【0051】
抽出装置10は、目的変数と目的変数に対応する1つ以上の説明変数に関する条件との組み合わせを生成する。抽出装置10は、組み合わせごとに、条件が満たされることに対する目的変数の尤度を、重要度として計算する。このため、実施例によれば、説明変数から目的変数を推定するためのモデルに基づく仮説の評価が可能になる。
【0052】
抽出装置10は、組み合わせの中から、重要度が所定値以上である組み合わせを抽出する。このように、抽出装置10は、各組み合わせについて網羅的に重要度を計算した上で、重要と考えられる組み合わせを抽出する。これにより、抽出装置10は、施策立案において特に重要な仮説を提供することができる。
【0053】
抽出装置10は、抽出部によって抽出された組み合わせのうち、第1の条件と他の条件との組み合わせである第1の組み合わせの重要度が第1の基準を超え、第1の条件のみの重要度が第2の基準を超えない場合、第1の組み合わせを他の組み合わせと比べて強調した上で、抽出部によって抽出された組み合わせの一覧を表示する。単独での重要度が大きくない変数を含む仮説は、人間にとっては特に発見が困難である。実施例によれば、そのような仮説を、発見が困難なものであることを示しつつ提示することができる。
【0054】
抽出装置10は、条件のうち、データと合致する回数が所定値以上である条件の組み合わせを生成する。このように、抽出装置10は、あらかじめ重要でないと考えられる条件を除外しておくことで、計算を効率化することができる。
【0055】
抽出装置10は、時間経過により増加するデータに含まれる複数の項目値に関する条件の組み合わせを生成する。このため、抽出装置10は、データが少ないうちから仮説の抽出を行うことができる。
【0056】
なお、上記の実施例では、目的変数が、広告価格を上げるか、現状維持にするか、又は下げるか、を表すものである場合について説明した。一方で、目的変数は、各広告のCV(conversion:コンバージョン)が発生したか否かを表すものであってもよい。この場合、図6等の例と同様に、目的変数を二値で表すことができる。
【0057】
[システム]
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値等は、あくまで一例であり、任意に変更することができる。
【0058】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
【0059】
[ハードウェア]
図12は、ハードウェア構成例を説明する図である。図12に示すように、抽出装置10は、通信インタフェース10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図12に示した各部は、バス等で相互に接続される。
【0060】
通信インタフェース10aは、ネットワークインタフェースカード等であり、他のサーバとの通信を行う。HDD10bは、図1に示した機能を動作させるプログラムやDBを記憶する。
【0061】
プロセッサ10dは、図1に示した各処理部と同様の処理を実行するプログラムをHDD10b等から読み出してメモリ10cに展開することで、図1等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、抽出装置10が有する各処理部と同様の機能を実行する。具体的には、プロセッサ10dは、生成部151、計算部152、抽出部153と同様の機能を有するプログラムをHDD10b等から読み出す。そして、プロセッサ10dは、生成部151、計算部152、抽出部153等と同様の処理を実行するプロセスを実行する。プロセッサ10dは、例えば、CPU、MPU、ASIC等のハードウェア回路である。
【0062】
このように抽出装置10は、プログラムを読み出して実行することで分類方法を実行する情報処理装置として動作する。また、抽出装置10は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、抽出装置10によって実行されることに限定されるものではない。例えば、他のコンピュータ又はサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
【0063】
このプログラムは、インターネット等のネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD-ROM、MO(Magneto-Optical disk)、DVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。
【符号の説明】
【0064】
10 抽出装置
11 通信部
12 入力部
13 出力部
14 記憶部
15 制御部
141 ログデータ
142 仮説情報
143 変数情報
151 生成部
152 計算部
153 抽出部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12