(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025164368
(43)【公開日】2025-10-30
(54)【発明の名称】情報処理装置、分析方法、及び分析プログラム
(51)【国際特許分類】
G06F 16/38 20190101AFI20251023BHJP
【FI】
G06F16/38
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2024068300
(22)【出願日】2024-04-19
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】吉永 直生
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175DA01
5B175FB03
(57)【要約】
【課題】様々なコンテンツの活用を支援する。
【解決手段】情報処理装置は、対象となるコンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを言語モデルを用いて抽出する抽出部と、抽出部の抽出結果に基づき、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、上記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析部と、を備える。分析部による関連付けの結果は、対象としたコンテンツに記述されている事項を根拠とした意思決定に利用することも可能である。
【選択図】
図1
【特許請求の範囲】
【請求項1】
機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出手段と、
前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出手段の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析手段と、を備える情報処理装置。
【請求項2】
前記抽出手段は、前記言語モデルを用いて、
前記複数のコンテンツの1つである第1のコンテンツに前件として記述されている事項を抽出し、
前記複数のコンテンツのうち、抽出された前記事項が後件として記述されている第2のコンテンツを抽出し、
前記第2のコンテンツに前件として記述されている事項を前記第1の事項として抽出し、
前記第1のコンテンツに後件として記述されている事項を前記第2の事項として抽出する、請求項1に記載の情報処理装置。
【請求項3】
前記抽出手段は、前記言語モデルを用いて、
前記複数のコンテンツの1つである第1のコンテンツに後件として記述されている事項を抽出し、
前記複数のコンテンツのうち、抽出された前記事項が前件として記述されている第2のコンテンツを抽出し、
前記第2のコンテンツに後件として記述されている事項を前記第2の事項として抽出し、
前記第1のコンテンツに前件として記述されている事項を前記第1の事項として抽出する、請求項1に記載の情報処理装置。
【請求項4】
前記抽出手段は、前記言語モデルを用いて、前記複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出し、
前記分析手段は、抽出された前記事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を前記仲介事項として、抽出された前記事項の中から前記第1の事項と前記第2の事項とを特定し、特定した前記第1の事項と前記第2の事項とを関連付ける、請求項1に記載の情報処理装置。
【請求項5】
前記抽出手段は、前記言語モデルを用いて、
前記複数のコンテンツのうち、他のコンテンツに前件として記述されている事項が後件として記述されているコンテンツを抽出し、
抽出された前記コンテンツに前件として記述されている事項を前記第1の事項として抽出し、
抽出された前記コンテンツに後件として記載されている事項が前件として記述されている前記コンテンツに後件として記載されている事項を前記第2の事項として抽出する、請求項1に記載の情報処理装置。
【請求項6】
前記抽出手段は、前記言語モデルを用いて、
前記複数のコンテンツのうち、他のコンテンツに後件として記述されている事項が前件として記述されているコンテンツを抽出し、
抽出された前記コンテンツに後件として記述されている事項を前記第2の事項として抽出し、
抽出された前記コンテンツに前件として記載されている事項が後件として記述されている前記コンテンツに前件として記載されている事項を前記第1の事項として抽出する、請求項1に記載の情報処理装置。
【請求項7】
前記第1の事項が前件として記述されていると共に前記仲介事項が後件として記述されているコンテンツから抽出された、前記第1の事項と前記仲介事項との関係性を示す第1の関係性情報と、前記仲介事項が前件として記述されていると共に前記第2の事項が後件として記述されているコンテンツから抽出された、前記仲介事項と前記第2の事項との関係性を示す第2の関係性情報と、を用いて、前記第1の事項と前記第2の事項との関係性を推論する推論手段を備える、請求項1から6の何れか1項に記載の情報処理装置。
【請求項8】
前記分析手段による関連付けの結果に基づき、前記複数のコンテンツに記述されている各事項の論理的な関係性を示すロジックモデルを生成するモデル生成手段を備える、請求項1から6の何れか1項に記載の情報処理装置。
【請求項9】
質問の入力を受け付ける受付手段と、
前記ロジックモデルを用いて前記質問に対する回答を生成する回答生成手段と、
前記回答を提示する提示手段と、を備える請求項8に記載の情報処理装置。
【請求項10】
少なくとも1つのプロセッサが、
機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出処理と、
前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出処理における抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析処理と、を含む分析方法。
【請求項11】
コンピュータを、
機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出手段、および
前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出手段の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析手段、として機能させる分析プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、分析方法、及び分析プログラムに関する。
【背景技術】
【0002】
各種文書の活用を促進するための分析技術が知られている。その一例として、特許文献1に記載の文書処理装置が挙げられる。この文書処理装置は、関連元文書の種類に応じたルールに基づいて当該関連元文書から語句を抽出し、抽出した語句から関連先文書の検索条件を生成し、該検索条件を満たす関連先文書と関連元文書との関連を記憶する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に記載の文書処理装置は、「日報」、「週報」、「法律」、「法令」等の所定の種類に分類される文書において、特定の箇所に関連先文書の検索に利用できる語句が記載されることを利用して関連性を分析するものである。このため、特許文献1に記載の文書処理装置には、分析対象が限定的であるという点で改善の余地がある。
【0005】
例えば、ある文書Xに「Aという条件を満たす場合、Bという事象が発生する」との記載があり、他の文書Yに「Bという事象が発生するときには、Cという事象も発生する」との記載があるとする。これらの文書は、何れもBという事象について言及している点で関連性があるといえる。しかし、文書Xにおいて、その種類に応じた特定の箇所にBという事象が記載されていない限り、特許文献1に記載の文書処理装置ではこれらの文書を関連付けることはできない。また、特許文献1に記載の文書処理装置では文書以外のコンテンツ(例えば画像)の関連付けを行うこともできない。
【0006】
本開示は、このような点に鑑みてなされたものであり、その一例示的目的は、様々なコンテンツの活用を支援することを可能にする技術を提供することにある。
【課題を解決するための手段】
【0007】
本開示の一例示的側面に係る情報処理装置は、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出手段と、前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出手段の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析手段と、を備える。
【0008】
本開示の一例示的側面に係る分析方法は、少なくとも1つのプロセッサが、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出処理と、前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出処理における抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析処理と、を含む。
【0009】
本開示の一例示的側面に係る分析プログラムは、コンピュータを、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出手段、および前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出手段の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析手段、として機能させる。
【発明の効果】
【0010】
本開示の一例示的側面によれば、様々なコンテンツの活用を支援することが可能になるという一例示的効果を奏する。
【図面の簡単な説明】
【0011】
【
図1】本開示に係る情報処理装置の構成を示すブロック図である。
【
図2】本開示に係る分析方法の流れを示すフロー図である。
【
図3】本開示に係る他の情報処理装置の構成を示すブロック図である。
【
図4】文書の記載事項の抽出と関連付けの例を示す図である。
【
図6】
図3に示す情報処理装置が実行する処理の流れを示すフロー図である。
【
図7】質問の受け付けと回答の提示における処理の流れを示すフロー図である。
【
図8】文書の記載事項の抽出と関連付けの他の例を示す図である。
【
図9】文書の記載事項の抽出と関連付けのさらに他の例を示す図である。
【
図10】
図3に示す情報処理装置が実行する処理の他の例を示すフロー図である。
【
図11】文書の記載事項の抽出と関連付けのさらに他の例を示す図である。
【
図12】
図3に示す情報処理装置が実行する処理のさらに他の例を示すフロー図である。
【
図13】文書の記載事項の抽出と関連付けのさらに他の例を示す図である。
【
図14】本開示に係る情報処理装置として機能するコンピュータの構成を示すブロック図である。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態を例示する。ただし、本発明は、以下に示す各例示的実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。例えば、以下に示す各例示的実施形態において採用される技術(物又は方法の一部又は全部)を適宜組み合わせることにより得られる実施形態についても、本発明の範疇に含まれ得る。また、以下に示す各例示的実施形態において採用される技術の一部を適宜省略することにより得られる実施形態についても、本発明の範疇に含まれ得る。また、以下に示す各例示的実施形態において言及する効果は、その例示的実施形態において期待される効果の一例であり、本発明の外延を規定するものではない。すなわち、以下に示す各例示的実施形態において言及する効果を奏さない実施形態についても、本発明の範疇に含まれ得る。
【0013】
〔第1の例示的実施形態〕
本発明の実施形態の一例である第1の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する各例示的実施形態の基本となる形態である。なお、本例示的実施形態において採用する各技術の適用範囲は、本例示的実施形態に限定されない。すなわち、本例示的実施形態において採用する各技術は、特段の技術的支障が生じない範囲で、本開示に含まれる他の例示的実施形態においても採用可能である。また、本例示的実施形態を説明するために参照する図面に示される各技術的も、特段の技術的支障が生じない範囲で、本開示に含まれる他の例示的実施形態においても採用可能である。
【0014】
(情報処理装置1の構成)
本例示的実施形態に係る情報処理装置1の構成について、
図1を参照して説明する。
図1は、情報処理装置1の構成を示すブロック図である。
図1に示すように、情報処理装置1は、抽出部101と分析部102とを備えている。
【0015】
抽出部101は、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する。
【0016】
上記「前件として記載されている事項」は、「後件として記載されている事項」と対になる事項であり、「前件として記載されている事項」が成立すれば、「後件として記載されている事項」も成立するという関係にある。上記「前件」は、例えば「条件」、「前提」、あるいは「入力」等と言い換えることができ、上記「後件」は、例えば「結果」、「帰結」、「結論」、あるいは「出力」等と言い換えることができる。
【0017】
また、上記「コンテンツ」は、上述の前件に相当する事項と後件に相当する事項を含むものであればよい。例えば、上記「コンテンツ」は、文書すなわちテキスト形式のコンテンツであってもよいし、画像形式のコンテンツであってもよく、テキストと画像の両方を含むコンテンツであってもよい。
【0018】
また、上記「言語モデル」は、上述のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出できるように機械学習されたものであればよい。例えば、対象となるコンテンツがテキストデータである場合、上記言語モデルとして、文におけるその構成要素(単語など)の並びや、文章における文と文の並びを機械学習したモデルを適用してもよい。また、例えば、対象となるコンテンツが画像データである場合、上記言語モデルとして、画像データと、その画像データにより表される対象において前件に相当する事項および/または後件に相当する事項との関係を機械学習したモデルを適用してもよい。また、画像データから前件に相当する事項および/または後件に相当する事項を抽出するモデルと、テキストデータから前件に相当する事項および/または後件に相当する事項を抽出するモデルとを組み合わせたものを上記言語モデルとして適用することもできる。
【0019】
また、抽出部101は、対象となるコンテンツがテキスト以外の形式である場合に、当該コンテンツをテキスト形式に変換した上で上述の抽出を行ってもよい。例えば、抽出部101は、対象となるコンテンツが画像データである場合に、その画像データにより表される対象を示すテキストを生成する生成モデルを用いてテキストデータを生成してもよい。そして、抽出部101は、言語モデルを用いて当該テキストデータから前件に相当する事項および/または後件に相当する事項を抽出してもよい。また、例えば、抽出部101は、対象となるコンテンツが音声データである場合に、その音声データをテキストデータに変換した上で、言語モデルを用いて当該テキストデータから前件に相当する事項および/または後件に相当する事項を抽出してもよい。なお、コンテンツをテキスト形式に変換する処理は、情報処理装置1に抽出部101とは別のブロックを設けて当該ブロックに行わせるようにしてもよいし、情報処理装置1以外の他の装置に行わせてもよい。
【0020】
分析部102は、抽出部101の抽出結果に基づき、仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける。ここで、「仲介事項」とは、対象となる複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を意味する。
【0021】
以上のように、本例示的実施形態に係る情報処理装置1においては、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出部101と、上記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、抽出部101の抽出結果に基づき、上記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、上記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析部102と、を備える、という構成が採用されている。
【0022】
ここで、上記第1の事項が前件として記述されているコンテンツにおいては、仲介事項は後件として記述されている。つまり、当該コンテンツによれば、第1の事項が成り立てば、仲介事項が成り立つという関係にある。
【0023】
一方、上記第2の事項が後件として記述されているコンテンツにおいては、仲介事項は前件として記述されている。つまり、当該コンテンツによれば、仲介事項が成り立てば、第2の事項が成り立つという関係にある。
【0024】
したがって、上記2つのコンテンツによれば、第1の事項が成り立てば仲介事項が成り立ち、仲介事項が成り立てば第2の事項が成り立つという関係があるといえる。そして、この関係から、第1の事項が成り立てば第2の事項が成り立つ、という関係があるということもできる。分析部102は、このような関係にある第1の事項と第2の事項を抽出することができる。このように、異なるコンテンツに記述されている事項を関連付けることは、新たな知見を生み出し、コンテンツの活用を促進することにつながる。
【0025】
また、抽出部101による抽出には言語モデルが用いられるから、対象となるコンテンツは特定の種類の文書に限られず、様々なコンテンツを対象とすることが可能である。以上のように、情報処理装置1によれば、様々なコンテンツの活用を支援することが可能になるという効果が得られる。
【0026】
なお、分析部102による分析結果すなわち第1の事項と第2の事項の関連付けの結果は、様々な用途で利用することができる。例えば、情報処理装置1は、第1の事項と第2の事項の関連付けの結果を情報処理装置1のユーザに提示してもよく、これによりユーザに新たな知見を与えることが可能になる。また、第1の事項と第2の事項の関連付けの結果は、対象としたコンテンツに記述されている事項を根拠とした意思決定に利用することも可能である。例えば、第1の事項が「食品Aを毎日50g以上摂取すること」であり、第2の事項が「生涯収入が増加すること」であったとする。この場合、これらの事項が関連付けられることにより、各コンテンツに記述されている事項を根拠として、食品Aを毎日50g以上摂取する、という意思決定を行うことができる。
【0027】
また、情報処理装置1は、第1の事項と第2の事項の関連付けの結果に基づき、第1の事項が記述されているコンテンツと、第2の事項が記述されているコンテンツの少なくとも何れかをユーザに提示してもよい。これにより、ユーザは、コンテンツにおいて第1の事項/第2の事項が記述されている文脈を踏まえて、より的確な意思決定を行うことが可能になる。また、詳細は例示的実施形態2で説明するが、第1の事項と第2の事項の関連付けの結果は、ユーザからの質問に対する、コンテンツの内容に応じた回答の生成に利用することもできる。
【0028】
(分析プログラム)
上述の情報処理装置1の機能は、プログラムによって実現することもできる。本例示的実施形態に係る分析プログラムは、コンピュータを、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出手段、および前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出手段の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析手段、として機能させる。この分析プログラムによれば、様々なコンテンツの活用を支援することが可能になるという効果が得られる。
【0029】
(分析方法の流れ)
本例示的実施形態に係る分析方法の流れについて、
図2を参照して説明する。
図2は、分析方法の流れを示すフロー図である。なお、この分析方法における各ステップの実行主体は、情報処理装置1が備えるプロセッサであってもよいし、他の装置が備えるプロセッサであってもよく、各ステップの実行主体がそれぞれ異なる装置に設けられたプロセッサであってもよい。
【0030】
S1(抽出処理)では、少なくとも1つのプロセッサが、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する。
【0031】
S2(分析処理)では、少なくとも1つのプロセッサが、S1における抽出結果に基づき、仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、上記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける。上述のとおり、仲介事項は、上記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項である。
【0032】
以上のように、本例示的実施形態に係る分析方法においては、少なくとも1つのプロセッサが、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出処理と、上記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、上記抽出処理における抽出結果に基づき、上記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析処理と、を含む、という構成が採用されている。このため、本実施形態に係る分析方法によれば、様々なコンテンツの活用を支援することが可能になるという効果が得られる。
【0033】
〔第2の例示的実施形態〕
本発明の実施形態の一例である第2の例示的実施形態について、図面を参照して詳細に説明する。上述した例示的実施形態にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。なお、本例示的実施形態において採用する各技術の適用範囲は、本例示的実施形態に限定されない。すなわち、本例示的実施形態において採用する各技術は、特段の技術的支障が生じない範囲で、本開示に含まれる他の例示的実施形態においても採用可能である。また、本例示的実施形態を説明するために参照する各図面に示される各技術は、特段の技術的支障が生じない範囲で、本開示に含まれる他の例示的実施形態においても採用可能である。
【0034】
(情報処理装置1Aの構成)
本例示的実施形態に係る情報処理装置1Aの構成を
図3に基づいて説明する。
図3は、情報処理装置1Aの構成を示すブロック図である。情報処理装置1Aは、コンテンツの活用を支援する機能を備えた装置である。情報処理装置1Aは、コンテンツの活用支援を主な機能とする装置であってもよいし、他の機能も備えた汎用的な装置であってもよい。また、情報処理装置1Aは、据え置き型の装置であってもよいし、携帯型の装置であってもよい。
【0035】
図示のように、情報処理装置1Aは、情報処理装置1Aの各部を統括して制御する制御部10Aと、情報処理装置1Aが使用する各種データを記憶する記憶部11Aを備えている。また、情報処理装置1Aは、情報処理装置1Aが他の装置と通信するための通信部12A、情報処理装置1Aに対する入力を受け付ける入力部13A、および情報処理装置1Aがデータを出力するための出力部14Aを備えている。そして、制御部10Aには、抽出部101A、分析部102A、モデル生成部103A、推論部104A、受付部105A、回答生成部106A、および提示部107Aが含まれている。また、記憶部11Aには言語モデル111Aとロジックモデル112Aが記憶されている。なお、モデル生成部103A、推論部104A、受付部105A、回答生成部106A、およびロジックモデル112Aの詳細は後述する。
【0036】
抽出部101Aは、例示的実施形態1の抽出部101と同様に、機械学習済みの言語モデルである言語モデル111Aを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する。
【0037】
以下では、対象となるコンテンツがテキスト形式の文書である例を説明する。当該文書は、例えば学術論文等であってもよいし、商品やサービス等を紹介するウェブページやユーザレビュー等から抽出したテキストであってもよいし、SNS(Social Networking Service)等に投稿されたメッセージ等であってもよい。また、対象となるコンテンツを特定の分野のコンテンツに限定してもよい。例えば、対象となるコンテンツを医療分野の論文に限定することにより、医療分野の専門技術的な知見について分析することができる。また、例えば、対象となるコンテンツをヘルスケア関連の文書に限定することにより、情報処理装置1Aをヘルスケアに利用することもできる。なお、例示的実施形態1で説明したとおり、対象となるコンテンツはテキスト形式の文書に限られず、任意の形式の任意のコンテンツを分析対象とすることが可能である。このため、以下の説明における「文書」は、任意の形式の任意の「コンテンツ」に読み替えることができる。
【0038】
言語モデル111Aは、例示的実施形態1で説明した言語モデルと同様に、分析の対象となるコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出できるように機械学習されたものであればよい。上述のように、本例示的実施形態において分析の対象となるコンテンツはテキスト形式の文書であるから、言語モデル111Aとしては、文におけるその構成要素(単語など)の並びや、文章における文と文の並びを機械学習したモデルを適用すればよい。
【0039】
なお、情報処理装置1Aは、必ずしも言語モデル111Aを備えている必要はなく、情報処理装置1Aの外部の装置に記憶された言語モデル111Aを利用してもよい。この場合、抽出部101Aは、言語モデル111Aを備えた外部の装置に対して、文書の前件および/または後件として記述されている事項の抽出を指示し、当該装置が言語モデル111Aを用いて抽出した事項を当該装置から取得する。
【0040】
分析部102Aは、例示的実施形態1の分析部102と同様に、分析の対象となる複数のコンテンツ(本例示的実施形態では文書)のうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、抽出部101の抽出結果に基づき、上記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、上記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける。
【0041】
提示部107Aは、コンテンツの活用を支援するための各種情報を情報処理装置1Aのユーザに提示する。例えば、提示部107Aは、ロジックモデル112Aをユーザに提示する。例えば、提示部107Aは、出力部14Aに情報を出力させることにより提示してもよいし、ユーザの所持する端末装置等に情報を出力させることにより提示してもよい。また、提示の態様は特に限定されない。例えば、提示部107Aは、ロジックモデル112Aのように画像により提示することが好ましい情報を提示する場合には、当該情報を表示出力させればよい。また、提示部107Aは、他の情報を提示する場合には、当該情報を表示出力させてもよいし、音声出力させてもよいし、印字出力させてもよい。
【0042】
以上のように、本例示的実施形態に係る情報処理装置1Aにおいては、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツ(本例示的実施形態では文書)から、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出部101Aと、上記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、抽出部101の抽出結果に基づき、上記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、上記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析部102Aと、を備える、という構成が採用されている。よって、様々なコンテンツの活用を支援することが可能になるという効果が得られる。
【0043】
(抽出と関連付けの例1:前件の抽出から開始)
抽出部101Aによる抽出と分析部102Aによる関連付けについて、
図4に示す具体例に基づいて説明する。
図4は、抽出部101Aと分析部102Aによる、文書の記載事項の抽出と関連付けの例を示す図である。なお、
図4に例示する各文書の記載事項は、抽出部101Aと分析部102Aによる抽出と関連付けについて説明するためのものであり、その内容が正しいか否かはここでは問題としない。これは後述する他の例についても同様である。
【0044】
図4の例では、DB(Data Base:データベース)に記録されている文書D1~D4が分析の対象となるコンテンツである。なお、同図では簡単のため対象となる文書を4つのみ示しているが、対象となる文書の数は複数であればよく、特に限定されない。また、対象となる文書は、必ずしも1つのDBに記録されている必要はなく、複数のDBあるいは複数の記憶装置に分散して記録されている文書を分析の対象とすることもできる。
【0045】
図4の例では、抽出部101Aは、DBに記録されている文書D1~D4を1つずつ読み出し、読み出した文書から、その文書に前件として記述されている事項を抽出する。
図4には、文書D1からの抽出について示している。図示のように、文書D1には、前件として「一日当たりの歩数が増える」との事項M11が記述されていると共に、この前件に対応する後件として「健康寿命が延びる」との事項M12が記述されている。
【0046】
抽出部101Aは、文書に前件として記述されている事項を抽出することを指示するプロンプトを、DBから読み出した文書と共に言語モデル111Aに入力することにより、当該文書から、当該文書に前件として記述されている事項を抽出させる。例えば、抽出部101Aは、
図4に示すように、「この文書に前件として記述されている事項を抽出して下さい」という定型のプロンプトP11と文書D1とを言語モデル111Aに入力してもよい。これにより、図示のように、文書D1から事項M11を抽出することができる。なお、抽出された事項M11はテキストデータである。また、抽出部101Aは、1つの文書から、当該文書に前件として記述されている事項を複数抽出してもよい。
【0047】
次に、抽出部101Aは、以上のようにして抽出した事項が後件として記述されている文書を抽出する。例えば、抽出部101Aは、
図4に示すように、「この事項が後件として記述されている文書を抽出して下さい」という定型のプロンプトP12と事項M11とを言語モデル111Aに入力してもよい。また、抽出部101Aは、抽出候補としてDBに記録されている文書D1~D4を指定すればよい。これにより、
図4の例では、文書D4が抽出されている。文書D4には、前件として「毎日の歩数を記録する」との事項M41が記述されていると共に、この前件に対応する後件として「一日当たりの歩数が増える」との事項M42が記述されている。
【0048】
ここで、
図4の例における事項M42と事項M11は同一である。しかし、抽出部101Aは、言語モデル111Aを用いて抽出を行うため、仮に表現に差異があったとしても、事項M11と内容的に一致する記述があれば、その記述を含む文書を抽出することが可能である。なお、文書D1から前件として記述されている事項が複数抽出された場合、抽出部101Aは、抽出された各事項について、当該事項が後件として記述されている文書の抽出を試みる。また、抽出部101Aは、該当する文書が抽出されなかった場合には、DBから他の文書を読み出し、当該他の文書から、その文書に前件として記述されている事項を抽出する。
【0049】
次に、抽出部101Aは、以上のようにして抽出した文書D4と、文書D4に前件として記述されている事項を抽出することを指示するプロンプトP13とを言語モデル111Aに入力することにより、文書D4に前件として記述されている事項を抽出させる。これにより、図示のように、文書D4から事項M41を抽出することができる。
【0050】
また、抽出部101Aは、文書D1と、文書D1に後件として記述されている事項を抽出することを指示するプロンプトP14を言語モデル111Aに入力することにより、文書D1に後件として記述されている事項を抽出させる。これにより、図示のように、文書D1から事項M12を抽出することができる。
【0051】
分析部102Aは、以上のようにして文書D4から抽出された事項M41と、文書D1から抽出された事項M12とを関連付ける。これにより、「毎日の歩数を記録する」ことにより「健康寿命が延びる」という知見が導かれる。なお、
図4の例における「仲介事項」は事項M11およびM42である。
【0052】
以上のように、抽出部101Aは、言語モデル111Aを用いて、(1)分析の対象となる複数のコンテンツの1つである第1のコンテンツ(
図4の例では文書D1)に前件として記述されている事項(
図4の例では事項M11)を抽出し、(2)複数のコンテンツのうち、抽出された上記事項が後件として記述されている第2のコンテンツ(
図4の例では文書D4)を抽出し、(3)第2のコンテンツに前件として記述されている事項(
図4の例では事項M41)を第1の事項として抽出し、(4)第1のコンテンツに後件として記述されている事項(
図4の例ではM12)を第2の事項として抽出してもよい。これにより、複数のコンテンツのそれぞれに記述されている事項を論理的に関連付けて新たな知見を導き出すことが可能になるという効果が得られる。
【0053】
(ロジックモデルについて)
モデル生成部103Aは、分析部102Aによる以上のような関連付けの結果に基づき、分析対象となる複数のコンテンツ(本例示的実施形態では文書)に記述されている各事項の論理的な関係性を示すモデルであるロジックモデルを生成する。情報処理装置1Aは、モデル生成部103Aを備えていることにより、情報処理装置1の奏する効果に加えて、分析対象となる複数のコンテンツに記述されている各事項を、それら論理的な関係性に基づいてモデル化することができるという効果が得られる。
【0054】
生成されたロジックモデルは、ロジックモデル112Aとして記憶部11Aに記憶される。以下では、ロジックモデル112Aについて
図5に基づいて説明する。
図5は、ロジックモデル112Aの例を示す図である。なお、
図5では、ロジックモデル112Aをグラフ形式で表しているが、ロジックモデル112Aは、各事項の論理的な関係性を示すものであればよく、必ずしもグラフ形式とする必要はない。
【0055】
図5に示すロジックモデル112A-1は、モデル生成部103Aが生成するロジックモデル112Aの一例である。ロジックモデル112A-1では、分析の対象となる複数のコンテンツ(本例示的実施形態では文書)から抽出された第1の事項および第2の事項がノードとして示されている。ロジックモデル112A-1は、各ノードの論理的な関係性を示すものであり、ロジックグラフと表現することもできる。なお、上述のとおり、第1の事項とは、仲介事項が後件として記述されているコンテンツに前件として記述されている事項であり、第2の事項は、仲介事項が前件として記述されているコンテンツに後件として記述されている事項である。
【0056】
また、ロジックモデル112A-1では、ノード間の関連性つまりコンテンツの記載事項間の関連性が矢印のエッジと破線のエッジで表されている。矢印のエッジで接続されているノードは前件と後件の関係にあり、矢印の根元側のノードが前件、矢印の先端側が後件に対応する。例えば、ロジックモデル112A-1では、
図4に示した事項M41に対応するノードと事項M42に対応するノードとが矢印のエッジで接続されている。これらのノードのうち事項M41に対応する方が矢印の根元側であり、事項M42に対応する方が矢印の先端側である。このことは、事項M41が前件、事項M42が後件であることを示している。これらのノードの関係性は、事項M41と事項M42を記述している文書4D(
図4参照)から特定される。なお、
図4には、文書D4から事項M42を抽出する点について記載していないが、抽出部101Aは、
図4に示すプロンプトP14と文書D4を言語モデル111Aに入力することにより、事項M42を抽出することができる。つまり、抽出部101Aは、ロジックモデル112A-1を生成するために仲介事項の抽出を行ってもよい。
【0057】
一方、破線のエッジは分析部102Aによる関連付けに基づくものであり、破線のエッジで接続される各ノードは仲介事項を示している。具体的には、事項M42、M11、M21に対応するノードが仲介事項である。なお、事項M21およびM22は、
図4に示す文書D2から抽出された事項(前者が前件、後者が後件)である。
【0058】
このように、ロジックモデル112A-1では、仲介事項のノードを介して、異なる文書の記載事項の論理的な関係性が示されている。よって、ロジックモデル112Aを情報処理装置1Aのユーザに提示することにより、当該関係性を当該ユーザに認識させることができる。ロジックモデル112A-1の提示は提示部107Aに行わせればよい。また、提示部107Aは、ロジックモデル112A-1を提示する際には、各文書に記載されている事項に関連付けて、当該事項の抽出元の文書についても提示してもよい。例えば、
図5の例であれば、提示部107Aは、事項M41、M42のノードまたはこれらのノードを接続するエッジに対応付けて、それらの事項が文書D4から抽出されたことを示す情報を提示してもよい。
【0059】
モデル生成部103Aは、分析部102Aによる関連付けの対象となった各事項すなわち上述の第1の事項および第2の事項をそれぞれノードとし、それらの関連性をエッジで表すことによりロジックモデル112A-1を生成することができる。また、
図5に示すように、モデル生成部103Aは、仲介事項についてもロジックモデル112A-1のノードに含めてもよい。
【0060】
また、モデル生成部103Aは、ロジックモデル112Aにおいて、3つ以上の文書における記載事項を関連付けることも可能である。例えば、
図4および
図5の例における文書D3において、「健康寿命が延びる」こと(以下、事項M31と呼ぶ)が前件として記述されており、この前件に対応する後件として「地域社会の基盤が強化される」こと(以下、事項M32と呼ぶ)が記述されていたとする。
【0061】
この場合、抽出部101Aは、文書D3から事項M31を抽出すると共に、文書D1~D4の中から、事項M31が後件として記述されている文書の抽出を試みる。この試行により、文書D1が抽出される。そして、抽出部101Aは、文書D1に前件として記述されている事項M11を抽出すると共に、文書D3に後件として記述されている事項M32を抽出する。これにより、分析部102Aは、事項M11とM32とを関連付けることができる。また、事項M11は、事項M41と関連付けられている。よって、モデル生成部103Aは、分析部102Aによる上述の関連付けに基づき、事項M41が成立すれば事項M42およびM11(およびM21)が成立し、事項M11が成立すれば事項M12およびM31が成立し、事項M31が成立すれば事項M32が成立する、という論理的な関係性を示すロジックモデル112Aを生成する。
【0062】
また、モデル生成部103Aは、ロジックモデル112Aを更新することもできる。例えば、
図5に示すロジックモデル112A-1を生成した後、新たな文書D7についての分析が行われ、事項M22を仲介事項として、事項M21と文書D7に記載されている事項M72とが関連付けられたとする。この場合、モデル生成部103Aは、ロジックモデル112A-1に、事項M72に対応するノードと、事項M72に対応する前件として文書D7に記載されている事項M71に対応するノードをそれぞれ追加する。そして、モデル生成部103Aは、事項M71に対応するノードと事項M22に対応するノードとを破線のエッジで接続すると共に、事項M71に対応するノードと事項M72に対応するノードとを矢印のエッジで接続する。これにより、ロジックモデル112A-1が更新される。
【0063】
(関係性情報について)
また、提示部107Aは、各文書に記載されている事項に関連付けて、それら事項の関係性を示す関係性情報を提示してもよい。関係性情報は、抽出部101Aにより抽出させればよい。例えば、抽出部101Aは、文書から前件として記述されている事項を抽出する際に、抽出する事項とその事項に対応する後件として記述されている事項との関係性を示す記述を抽出することを求めるプロンプトを言語モデル111Aに入力してもよい。このようにして抽出された記述を関係性情報として利用することができる。
【0064】
例えば、
図4の例における文書D1に、一日あたりの歩数の増加量と健康寿命が延びる程度との関係を示す数式が記述されていた場合、抽出部101Aはこの数式を関係性情報として抽出することが可能である。そして、提示部107Aは、抽出された数式を関係性情報として提示することができる。例えば、提示部107Aは、抽出された数式を、事項M11に対応するノードとM12に対応するノードとを接続するエッジに対応付けて表示させてもよい。
【0065】
推論部104Aは、上述の関係性情報を用いて、第1の事項と第2の事項との関係性を推論する。これについて、
図5に示すロジックモデル112A-2に基づいて説明する。ロジックモデル112A-2には、文書D5に前件として記載されている事項M51、文書D5に後件として記載されている事項M52、文書D6に前件として記載されている事項M61、および文書D6に後件として記載されている事項M62、に対応するノードがそれぞれ含まれている。このうち、事項M52とM61が仲介事項であり、これらの事項を介して事項M51とM62が関連付けられている。
【0066】
また、ロジックモデル112A-2では、事項M51に対応するノードと事項M52に対応するノードとを接続するエッジには、これらの事項の関係性を示す関連性情報RI1が対応付けられている。同様に、事項M61に対応するノードと事項M62に対応するノードとを接続するエッジには、これらの事項の関係性を示す関連性情報RI2が対応付けられている。
【0067】
関連性情報RI1は、文書D5から抽出された情報であり、適正体重の維持期間と体重管理のための投資額との関係を示す数式である。この数式によれば、適正体重の維持期間は、体重管理のための投資額に比例しており、その比例定数はaである。また、関連性情報RI2は、文書D6から抽出された情報であり、医療費の低減率と適正体重の維持期間との関係を示す数式である。この数式によれば、医療費の低減率は、適正体重の維持期間に比例しており、その比例定数はbである。
【0068】
推論部104Aは、これらの関連性情報を用いて事項M51(上述の第1の事項に相当)と、事項M62(上述の第2の事項に相当)との関係性を推論する。具体的には、推論部104Aは、関連性情報RI1と関連性情報RI2から、体重管理のための投資額と、医療費の低減率の関係が、「(体重管理のための投資額)=(医療費の低減率)/a・b」との数式で表されると推論する。
【0069】
また、推論部104Aは、上記の推論結果に基づき、体重管理のための投資額がある値であったときの医療費の低減率を推論することや、体重管理のための投資額の変化量がある値であったときの医療費の低減率の変化量を推論することも可能である。このように、推論部104Aは、上記の推論結果に基づいて各種のシミュレーションを行うことも可能である。なお、推論部104Aによる推論結果は、ロジックモデル112Aと関連付けて記録しておけばよい。
【0070】
以上のように、情報処理装置1Aは、第1の事項(ロジックモデル112A-2の例ではM51)が前件として記述されていると共に前記仲介事項が後件として記述されているコンテンツから抽出された、第1の事項と仲介事項との関係性を示す第1の関係性情報(ロジックモデル112A-2の例ではRI1)と、仲介事項が前件として記述されていると共に第2の事項(ロジックモデル112A-2の例ではM62)が後件として記述されているコンテンツから抽出された、仲介事項と前記第2の事項との関係性を示す第2の関係性情報(ロジックモデル112A-2の例ではRI2)と、を用いて、第1の事項と第2の事項との関係性を推論する推論部104Aを備えている。これにより、情報処理装置1の奏する効果に加えて、第1の事項と第2の事項との関係性についての分析結果も得ることができるという効果が得られる。また、この分析結果を利用することにより、推論結果に基づいて各種のシミュレーションを行うことも可能になる。
【0071】
なお、推論部104Aは、3つ以上の文書のそれぞれに記載されている事項の関係性についても同様にして推論することが可能である。また、関係性情報が数式である場合、推論部104Aは、式変形により関連性を推定することができる。この場合、抽出部101Aは、関連性情報を文書から抽出する際のプロンプトに、数式を抽出することを明示的に指示する文を含めてもよい。
【0072】
また、関係性情報は、数式に限られず、例えばテキストであってもよい。この場合、推論部104Aは、第1の事項と、第2の事項と、各関係性情報(上述した第1の関係性情報と第2の関係性情報)とを言語モデル111Aに入力して、それらの関係性情報から導かれる第1の事項と第2の事項との関係性を推論させてもよい。例えば、第1の関連性情報として抽出されたテキストが「適正体重の維持期間は体重管理のための投資額に比例する」というものであり、第2の関連性情報として抽出されたテキストが「医療費の低減率は適正体重の維持期間に比例する」というものであったとする。この場合、抽出部101Aは、これらのテキストを言語モデル111Aに入力することにより、例えば「適正体重の維持期間は医療費の低減率に比例する」との推論結果を得ることが可能である。
【0073】
(質問の受け付けと回答の生成について)
以下では、受付部105Aと回答生成部106Aについて説明する。受付部105Aは、ユーザからの質問の入力を受け付ける。例えば、受付部105Aは、通信部12Aを介して質問の入力を受け付けてもよいし、入力部13Aを介して質問の入力を受け付けてもよい。また、質問はテキストで入力されてもよいし、音声で入力されてもよい。後者の場合、受付部105Aは、入力された音声をテキストに変換した上で処理すればよい。
【0074】
回答生成部106Aは、ロジックモデル112Aを用いて上記質問に対する回答を生成する。回答の生成方法は特に限定されない。例えば、回答生成部106Aは、言語モデル111Aを用いて回答を生成してもよい。この場合、回答生成部106Aは、受付部105Aが受け付けた質問と、ロジックモデル112Aとを含み、ロジックモデル112Aに基づいて質問に対する回答を生成するように指示するプロンプトを生成してもよい。回答生成部106Aは、このようなプロンプトを言語モデル111Aに入力することにより、ロジックモデル112Aに基づく回答を生成することができる。
【0075】
また、回答生成部106Aは、ロジックモデル112A自体を言語モデル111Aに入力する代わりに、ロジックモデル112Aに含まれている事項のうち、ユーザの質問に関連する事項を検出し、検出した事項を言語モデル111Aに入力してもよい。この例については、
図7に基づいて後述する。
【0076】
回答生成部106Aが生成した回答は提示部107Aによりユーザに提示される。なお、質問の入力者と、回答の提示対象者とは同一人物であってもよいし、異なる人物であってもよい。また、回答はテキストを表示出力させる形式で提示されてもよいし、音声出力の形式で提示されてもよい。
【0077】
以上のように、情報処理装置1Aは、質問の入力を受け付ける受付部105Aと、ロジックモデル112Aを用いて上記質問に対する回答を生成する回答生成部106Aと、生成された回答を提示する提示部107Aと、を備える。これにより、情報処理装置1の奏する効果に加えて、ユーザからの質問に対して、分析の対象とした各コンテンツにおける記載事項の論理的な関係性に基づく回答を返すことが可能になるという効果が得られる。
【0078】
例えば、
図5のロジックモデル112A-1が生成され、記憶部11Aに記録されている場合に、受付部105Aが「健康寿命を延ばすためにはどうしたらいい?」との質問を受け付けたとする。ここで、ロジックモデル112A-1では「健康寿命」に関するM12の事項に対してM41の事項が関連付けられている。このため、回答生成部106Aは、ロジックモデル112A-1を用いることにより、M41の事項を含む回答(例えば、「毎日の歩数を記録することが有効です。」等)を生成することができる。
【0079】
また、例えば、
図5のロジックモデル112A-2が生成され、記憶部11Aに記録されている場合に、受付部105Aが「体重管理のためにフィットネスクラブに毎週通うことにした場合に期待できる効果は?」との質問を受け付けたとする。ここで、ロジックモデル112A-2では「体重管理」に関するM51の事項に対してM62の事項が関連付けられている。このため、回答生成部106Aは、ロジックモデル112A-2を用いることにより、M62の事項を含む回答(例えば、「医療費の低減が期待できます。」等)を生成することができる。
【0080】
また、回答生成部106Aは、推論部104Aによる推論の結果を考慮して回答を生成してもよい。この場合、例えば、回答生成部106Aは、「フィットネスクラブに1年間通ったときの投資額をx円とした場合、期待できる医療費の低減額はy円です。」等の回答を生成することも可能である。
【0081】
また、回答生成部106Aは、ユーザの属性を示す属性情報を考慮した回答を生成してもよい。なお、ここで「ユーザ」とは、質問者または回答の提示対象者である。考慮の対象とする属性は任意であり、例えば、ユーザの年齢、性別、職業、性格、過去の行動履歴などを示す属性情報を用いてもよい。また、ユーザの属性情報は、予め入力させておいてもよいし、受付部105Aが受け付けた質問の一部を属性情報として利用してもよい。
【0082】
例えば、回答生成部106Aは、ユーザの職業を示す属性情報を用いて、その職業に応じた内容の回答を生成してもよい。具体例を挙げれば、「お勧めの副業を教えて」との質問が入力された場合に、回答生成部106Aは、入力された当該質問とロジックモデル112Aを含み、ユーザの職業を示すプロンプトを生成して言語モデル111Aに入力してもよい。これにより、ロジックモデル112Aに基づき、かつ、ユーザの職業に応じた副業を示す回答を生成することが可能である。
【0083】
(処理の流れ:分析方法)
情報処理装置1Aが実行する処理の流れを
図6に基づいて説明する。
図6は、情報処理装置1Aが実行する処理の流れを示すフロー図である。
図6のフローには、本例示的実施形態に係る分析方法の各ステップが含まれている。
【0084】
S11では、抽出部101Aが、分析対象である複数の文書の中から1つの文書を選択する。選択の方法は任意であるが、選択済みの文書は再度選択しないようにする。なお、選択候補となる文書は予め指定しておけばよい。例えば、
図4の例のように、特定のDBを指定しておいてもよい。この場合、S11において、抽出部101Aは、指定されたDBに記録された文書の中から1つの文書を選択する。
【0085】
S12(抽出処理)では、抽出部101Aは、S11で取得された文書(上述した第1のコンテンツに相当)から、当該文書において前件として記述されている事項を、言語モデル111Aを用いて抽出する。
【0086】
S13では、抽出部101Aは、分析対象である複数の文書の中から、S12で抽出された事項が後件として記述されている文書(上述した第2のコンテンツに相当)を、言語モデル111Aを用いて抽出する。なお、分析対象である複数の文書の中に、S12で抽出された事項が後件として記述されている文書すなわち第2のコンテンツが存在しない場合、S13~S16の処理を行うことなくS17の処理に進む。
【0087】
S14(抽出処理)では、抽出部101Aは、S13で抽出した文書すなわち第2のコンテンツに前件として記述されている事項を第1の事項として抽出する。上述のように、第1の事項の抽出にも言語モデル111Aが用いられる。
【0088】
S15(抽出処理)では、抽出部101Aは、S11で選択された文書すなわち第1のコンテンツに後件として記述されている事項を第2の事項として抽出する。上述のように、第2の事項の抽出にも言語モデル111Aが用いられる。なお、S15の処理はS14よりも先に行うようにしてもよいし、S14と並行して行うようにしてもよい。
【0089】
S16(分析処理)では、分析部102Aが、文書の記載事項の関連付けを行う。具体的には、分析部102Aは、仲介事項が後件として記述されている文書すなわち第2のコンテンツに前件として記述されている第1の事項(S14で抽出されたもの)と、その仲介事項が前件として記述されている文書すなわち第1のコンテンツに後件として記述されている第2の事項(S15で抽出されたもの)とを関連付ける。なお、S16の処理は、後述するS17より後で行うようにしてもよい。
【0090】
S17では、抽出部101Aは、分析対象である複数の文書の全てについて、S11以降の処理を実施済みであるか否かを判定する。S17でNOと判定された場合にはS11に戻り、抽出部101Aは、次に処理する文書を選択する。一方、S17でYESと判定された場合にはS18に進む。
【0091】
S18では、モデル生成部103Aが、S16の関連付けの結果に基づいて、分析対象となる複数の文書に記述されている各事項の論理的な関係性を示すロジックモデル112Aを生成する。なお、既にロジックモデル112Aが生成されている場合、モデル生成部103Aは、既存のロジックモデル112Aを更新する。
【0092】
S19では、提示部107Aが、S18で生成または更新されたロジックモデル112Aを表示装置(情報処理装置1Aが備えているものであってもよいし、他の装置が備えているものであってもよい)に表示させる。これにより、
図6の処理は終了する。
【0093】
(処理の流れ:質問の受け付けと回答の提示)
情報処理装置1Aが質問の受け付けと回答の提示を行う際の処理の流れを
図7に基づいて説明する。
図7は、質問の受け付けと回答の提示における処理の流れを示すフロー図である。
【0094】
S21では、受付部105Aが、ユーザからの質問の入力を受け付ける。質問をどのようにして受け付けるかは特に限定されない。例えば、受付部105Aは、通信部12Aを介して質問の入力を受け付けてもよいし、入力部13Aを介して質問の入力を受け付けてもよい。
【0095】
S22では、回答生成部106Aが、ロジックモデル112Aから、S21で受け付けられた質問に関連する事項を検出する。例えば、回答生成部106Aは、受け付けられた質問とロジックモデル112Aを含み、当該質問に関連する事項をロジックモデル112Aから選択するように指示するプロンプトを生成し、生成したプロンプトを言語モデル111Aに入力してもよい。これにより、回答生成部106Aは、言語モデル111Aの出力に基づき、S21で受け付けられた質問に関連する事項を検出することができる。また、回答生成部106Aは、ロジックモデル112Aにおいて、上記のようにして検出された事項に関連付けられている事項についても、上記質問に関連する事項として検出する。
【0096】
例えば、
図5に示すロジックモデル112A-1が記憶部11Aに記憶されている場合に、「高血圧と診断されたので生活習慣を見直そうと思っているが、よい方法はないか?」との質問を受け付けたとする。この場合、回答生成部106Aは、上述のような検索により、当該質問に関連する事項として、事項M22をロジックモデル112A-1から検出することができる。そして、回答生成部106Aは、ロジックモデル112A-1において、事項M22に関連付けられている事項M21、M11、M42、M41についても当該質問に関連する事項として検出することができる。なお、仲介事項は検出対象から外すようにしてもよく、その場合、事項M21に関連する事項としては、事項M41のみが検出される。
【0097】
S23では、回答生成部106Aは、S22で検出した事項に関連する、推論部104Aの推論結果を取得する。推論部104Aによる推論は事前に(例えば
図6のフローにおけるS16の後などに)行っておいてもよいし、S22の後、S23の前に行うようにしてもよい。また、回答生成部106Aは、推論部104Aの推論結果に加えて、S22で検出した事項に関連する関連性情報についても取得するようにしてもよい。関連性情報の抽出についても推論部104Aによる推論と同様に事前に行っておいてもよいし、S22の後、S23の前に行うようにしてもよい。
【0098】
S24では、回答生成部106Aは、S21で受け付けられた質問に対する回答を生成する。より詳細には、回答生成部106Aは、S21で受け付けられた質問と、S22で検出された事項と、S23で取得された推論結果とを含み、当該事項および当該推論結果に基づいて質問に対する回答を生成するように指示するプロンプトを生成してもよい。そして、回答生成部106Aは、このようなプロンプトを言語モデル111Aに入力することにより、質問に対する回答を生成することができる。また、回答生成部106Aは、S23で関連性情報を取得していた場合、取得した関連性情報についてもプロンプトに含めてもよい。
【0099】
S25では、提示部107Aが、S24で生成された回答をユーザに提示する。これにより
図7の処理は終了する。なお、S25の後、S21に戻って追加の質問を受け付けるようにしてもよい。
【0100】
また、分析の対象となる文書からの記載事項の抽出および関連付けは、質問の受け付け後に行うようにしてもよい。この場合、抽出部101Aは、受け付けた質問において問われている事項を、分析の対象となる文書から検索し、検索により得られた事項を上述の第1または第2の事項として、当該第1または第2の事項に関連する第2または第1の事項を抽出する。これにより、回答生成部106Aは、抽出された第2または第1の事項に基づく回答を生成することができる。
【0101】
例えば、「高血圧と診断されたので生活習慣を見直そうと思っているが、よい方法はないか?」との質問を受け付けたとする。このように、方策や条件等の「前件」について問う質問を受け付けた場合、抽出部101Aは、「高血圧」が後件として記述されている文書の抽出を試み、これにより文書D2を抽出する。そして、抽出部101Aは、文書D2に後件として記載されている「高血圧が改善」という事項M22を抽出し、これを第2の事項とする。次に、抽出部101Aは、文書D2に事項M22に対応する前件として記述されている事項M21が、後件として記述されている文書の抽出を試み、これにより文書D4を検出する。そして、抽出部101Aは、文書D4に前件として記述されている「毎日の歩数を記録する」という事項M41を、第1の事項として抽出する。これにより、分析部102Aは、事項M41と事項M22とを関連付けることができ、回答生成部106Aは、この関連付けに基づいた回答(例えば、「毎日の歩数を記録する」ことを勧める回答)を生成することができる。
【0102】
また、例えば、「体重管理のためにフィットネスクラブに毎週通うことにした場合に期待できる効果は?」との質問を受け付けたとする。このように、効果や結果等の「後件」について問う質問を受け付けた場合、抽出部101Aは、「体重管理」が前件として記述されている文書の抽出を試み、これにより文書D5を抽出する。そして、抽出部101Aは、文書D5に前件として記載されている「体重管理のための投資額」という事項M51を抽出し、これを第1の事項とする。次に、抽出部101Aは、文書D5に事項M51に対応する後件として記述されている事項M52が、前件として記述されている文書の抽出を試み、これにより文書D6を検出する。そして、抽出部101Aは、文書D6に後件として記述されている「医療費の低減率」という事項M62を、第2の事項として抽出する。これにより、分析部102Aは、事項M41と事項M22とを関連付けることができ、回答生成部106Aは、この関連付けに基づいた回答(例えば、「医療費の低減」が期待できる旨の回答)を生成することができる。
【0103】
(抽出と関連付けの例2:後件の抽出から開始)
図4の例では、DBに記録されている文書D1~D4の中から1つずつ文書を選択した後、選択した文書に前件として記述されている事項を抽出しているが、選択した文書に後件として記述されている事項を抽出するようにしてもよい。これについて
図8に基づいて説明する。
図8は、文書の記載事項の抽出と関連付けの他の例を示す図である。なお、文書D1~D4の記載事項は
図4の例と同じであるから記載事項についての説明は繰り返さない。
【0104】
図8の例では、抽出部101Aは、DBに記録されている文書D1~D4を1つずつ読み出し、読み出した文書から、その文書に後件として記述されている事項を抽出する。例えば、抽出部101Aは、
図8に示すように、「この文書に後件として記述されている事項を抽出して下さい」という定型のプロンプトP21と文書D4とを言語モデル111Aに入力してもよい。これにより、図示のように、文書D4から事項M42を抽出することができる。なお、抽出部101Aは、1つの文書から、後件として記述されている事項を複数抽出してもよい。
【0105】
次に、抽出部101Aは、以上のようにして抽出した事項が前件として記述されている文書を抽出する。例えば、抽出部101Aは、
図8に示すように、「この事項が前件として記述されている文書を抽出して下さい」という定型のプロンプトP22と事項M42とを言語モデル111Aに入力してもよい。また、抽出部101Aは、抽出候補としてDBに記録されている文書D1~D4を指定すればよい。これにより、
図8の例では、文書D1が抽出されている。なお、文書D4から前件として記述されている事項が複数抽出された場合、抽出部101Aは、抽出された各事項について、当該事項が前件として記述されている文書の抽出を試みる。また、抽出部101Aは、該当する文書が抽出されなかった場合には、DBから他の文書を読み出し、当該他の文書から、その文書に後件として記述されている事項を抽出する。
【0106】
次に、抽出部101Aは、以上のようにして抽出した文書D1と、文書D1に後件として記述されている事項を抽出することを指示するプロンプトP23を言語モデル111Aに入力することにより、文書D1に後件として記述されている事項を抽出させる。これにより、図示のように、文書D1から事項M12を抽出することができる。
【0107】
また、抽出部101Aは、文書D4と、文書D4に前件として記述されている事項を抽出することを指示するプロンプトP24を言語モデル111Aに入力することにより、文書D4に前件として記述されている事項を抽出させる。これにより、図示のように、文書D4から事項M41を抽出することができる。
【0108】
分析部102Aは、以上のようにして文書D4から抽出された事項M41と、文書D1から抽出された事項M12とを関連付ける。これにより、
図4の例と同様に、「毎日の歩数を記録する」ことにより「健康寿命が延びる」という知見が導かれる。
【0109】
以上のように、抽出部101Aは、言語モデル111Aを用いて、(1)分析の対象となる複数のコンテンツの1つである第1のコンテンツ(
図8の例では文書D4)に後件として記述されている事項(
図8の例では事項M42)を抽出し、(2)複数のコンテンツのうち、抽出された上記事項が前件として記述されている第2のコンテンツ(
図8の例では文書D1)を抽出し、(3)第2のコンテンツに後件として記述されている事項を第2の事項(
図8の例では事項M12)として抽出し、(4)第1のコンテンツに前件として記述されている事項(
図8の例では事項M11)を第1の事項として抽出する。これにより、複数のコンテンツのそれぞれに記述されている事項を論理的に関連付けて新たな知見を導き出すことが可能になるという効果が得られる。
【0110】
図8のように後件の抽出から開始する場合も、処理の流れは
図6と同様である。ただし、後件の抽出から開始する場合、S12では、選択された文書において「後件」として記述されている事項が抽出され、S13では、S12で抽出された事項が「前件」として記述されている文書が抽出される。そして、S14では、S13で抽出された文書に「後件」として記述されている事項が「第2の事項」として抽出され、S15では、S11で選択された文書において「前件」として記述されている事項が「第1の事項」として抽出される。
【0111】
(抽出と関連付けの例3:各文書から前件および後件を抽出)
また、抽出部101Aは、言語モデル111Aを用いて、分析の対象となる複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出してもよい。この場合、分析部102Aは、抽出された事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項として、抽出された事項の中から第1の事項と前記第2の事項とを特定し、特定した第1の事項と第2の事項とを関連付ければよい。このような処理によっても、複数のコンテンツのそれぞれに記述されている事項を論理的に関連付けて新たな知見を導き出すことが可能になるという効果が得られる。
【0112】
上記の処理について
図9に基づいて説明する。
図9は、文書の記載事項の抽出と関連付けのさらに他の例を示す図である。
図9の例では、抽出部101Aは、DBに記録されている文書D1~D4を1つずつ読み出し、読み出した文書から、その文書に前件として記述されている事項と、後件として記述されている事項をそれぞれ抽出する。例えば、抽出部101Aは、
図9に示すように、「この文書に前件として記述されている事項と、それに対応する後件として記述されている事項とをそれぞれ抽出して下さい」という定型のプロンプトP31と読み出した文書とを言語モデル111Aに入力する処理を、文書D1~D4のそれぞれについて行うようにしてもよい。これにより、図示のように、文書D1~D4のそれぞれにおいて前件として記述されている事項と後件として記述されている事項とを抽出することができる。
【0113】
そして、分析部102Aが、以上のようにして抽出された事項のうち、第1の事項と前記第2の事項とを特定し、特定した第1の事項と第2の事項とを関連付ける。上述のように、第1の事項は仲介事項が後件として記述されているコンテンツに前件として記述されている事項であり、第2の事項は仲介事項が前件として記述されているコンテンツに後件として記述されている事項である。このため、分析部102Aは、抽出部101Aが抽出した事項の中から仲介事項を特定し、特定した仲介事項が後件として記述されているコンテンツに前件として記述されている事項を第1の事項とし、特定した仲介事項が前件として記述されているコンテンツに後件として記述されている事項を第2の事項として、これらを関連付けてもよい。
【0114】
なお、仲介事項の特定方法は特に限定されず、例えば言語モデル111Aに行わせるようにしてもよい。この場合、分析部102Aは、抽出部101Aが抽出した事項のうち、内容が同様である事項を抽出するように指示するプロンプトを生成して言語モデル111Aに入力すればよい。そして、分析部102Aは、抽出された事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を、仲介事項と特定することができる。
【0115】
図9の例では、事項M42と事項M11の内容が同一であるからこれらが仲介事項として特定される。そして、この仲介事項を介して、文書D4から抽出された事項M41と、文書D1から抽出された事項M12とが関連付けられる。これにより、
図4の例と同様に、「毎日の歩数を記録する」ことにより「健康寿命が延びる」という知見が導かれる。
【0116】
(処理の流れ:
図9に対応する分析方法)
図9に基づいて説明したように、分析の対象となる複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出した上で、各事項の関連付けを行うようにしてもよい。この場合に情報処理装置1Aが実行する処理の流れを
図10に基づいて説明する。
図10は、情報処理装置1Aが実行する処理の他の例を示すフロー図である。
図10のフローにも、
図6のフローと同様に、本例示的実施形態に係る分析方法の各ステップが含まれている。
【0117】
なお、
図10のS31、S33の処理は、
図6のS11、S17とそれぞれ同様の処理であるからここでは説明を繰り返さない。また、
図10のフローにはロジックモデル112Aの生成および提示の処理が含まれていないが、
図10のフローにもロジックモデル112Aの生成および提示の処理を含めてもよい。
【0118】
S32(抽出処理)では、抽出部101Aは、言語モデル111Aを用いて、S31で取得された文書から、当該文書において前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出する。なお、抽出部101Aは、1つの文書から、前件として記述されている事項と後件として記述されている事項を複数組抽出してもよい。
【0119】
S34では、分析部102Aが、S31~S33の処理の繰り返しにより抽出された、分析対象である複数の文書の記述事項の中から仲介事項を特定する。なお、分析部102Aは、複数の仲介事項を特定してもよい。また、抽出された記載事項の中に仲介事項が存在しなかった場合には、
図10の処理は終了する。
【0120】
S35(分析処理)では、分析部102Aは、文書の記載事項の関連付けを行う。具体的には、分析部102Aは、S34で特定された仲介事項が後件として記述されている文書に前件として記述されている第1の事項と、その仲介事項が前件として記述されている文書に後件として記述されている第2の事項とを関連付ける。これにより、
図10の処理は終了する。なお、S34で仲介事項が複数特定された場合には、S35では各仲介事項について関連付けが行われる。
【0121】
(抽出と関連付けの例4:仲介事項が記述されている文書を抽出する例1)
また、抽出部101Aは、言語モデル111Aを用いて、(1)複数のコンテンツのうち、他のコンテンツに前件として記述されている事項が後件として記述されているコンテンツすなわち仲介事項が記述されている第2のコンテンツを抽出し、(2)抽出されたコンテンツに前件として記述されている事項を第1の事項として抽出し、(3)抽出されたコンテンツに後件として記載されている事項が前件として記述されているコンテンツすなわち仲介事項が記述されている第1のコンテンツに後件として記載されている事項を第2の事項として抽出してもよい。このような処理によっても、複数のコンテンツのそれぞれに記述されている事項を論理的に関連付けて新たな知見を導き出すことが可能になるという効果が得られる。
【0122】
上記の処理について
図11に基づいて説明する。
図11は、文書の記載事項の抽出と関連付けのさらに他の例を示す図である。
図11の例では、抽出部101Aは、DBに記録されている文書D1~D4を1つずつ読み出し、読み出した文書に前件として記述されている事項が後件として記述されている文書を抽出する。例えば、抽出部101Aは、
図11に示すように、「この文書に前件として記述されている事項が後件として記述されている文書を、DBに記録されている文書の中から抽出して下さい」という定型のプロンプトP41と読み出した文書とを言語モデル111Aに入力してもよい。これにより、図示のように、読み出された文書が文書D1である場合に、文書D1において前件として記述されている事項M11と同じ内容の事項M42が後件として記述されている文書D4を抽出することができる。事項M11およびM42は仲介事項であるから、この例における文書D4は上述の第2のコンテンツに相当し、文書D1は上述の第1のコンテンツに相当する。
【0123】
次に、抽出部101Aは、抽出した文書D4すなわち第2のコンテンツに前件として記述されている事項を第1の事項として抽出すると共に、DBから読み出した文書D1すなわち第1のコンテンツに後件として記載されている事項を第2の事項として抽出する。
【0124】
より詳細には、抽出部101Aは、図示のように、抽出した文書D4と、文書D4に前件として記述されている事項を抽出することを指示するプロンプトP42を言語モデル111Aに入力することにより、文書D4に前件として記述されている事項を抽出させる。これにより、図示のように、文書D4に記述されている事項M41を第1の事項として抽出することができる。
【0125】
また、抽出部101Aは、図示のように、読み出した文書D1と、文書D1に後件として記述されている事項を抽出することを指示するプロンプトP43を言語モデル111Aに入力することにより、文書D1に後件として記述されている事項を抽出させる。これにより、図示のように、文書D1に記述されている事項M12を第2の事項として抽出することができる。
【0126】
分析部102Aが、以上のようにして文書D4から抽出された事項M41と、文書D1から抽出された事項M12とを関連付ける。これにより、
図4等の例と同様に、「毎日の歩数を記録する」ことにより「健康寿命が延びる」という知見が導かれる。
【0127】
(処理の流れ:
図11に対応する分析方法)
図11に基づいて説明したように、言語モデル111Aを用いて仲介事項が記述されている文書を抽出した上で第1および第2の事項を抽出し、各事項の関連付けを行うようにしてもよい。この場合に情報処理装置1Aが実行する処理の流れを
図12に基づいて説明する。
図12は、情報処理装置1Aが実行する処理の他の例を示すフロー図である。
図12のフローにも、
図6のフローと同様に、本例示的実施形態に係る分析方法の各ステップが含まれている。
【0128】
なお、
図12のフローと
図6のフローは、後者におけるS12およびS13の処理がS42の処理の処理に代わっている点を除けば同様であるから、ここではS42を中心に説明する。また、
図12のフローにはロジックモデル112Aの生成および提示の処理が含まれていないが、
図12のフローにもロジックモデル112Aの生成および提示の処理を含めてもよい。
【0129】
S42(抽出処理)では、抽出部101Aは、言語モデル111Aを用いて、分析の対象となる複数の文書の中から、S41で選択された文書に前件として記述されている事項が後件として記述されている文書すなわち第2のコンテンツを抽出する。なお、抽出部101Aは、S42において、複数の文書を抽出してもよい。
【0130】
S43(抽出処理)では、抽出部101Aは、S42で抽出した文書すなわち第2のコンテンツに前件として記述されている事項を第1の事項として抽出する。また、S44(抽出処理)では、抽出部101Aは、S41で選択された文書すなわち第1のコンテンツに後件として記述されている事項を第2の事項として抽出する。そして、S45(分析処理)では、分析部102Aが、S43で抽出された第1の事項と、S44で抽出された第2の事項とを関連付けする。
【0131】
(抽出と関連付けの例5:仲介事項が記述されている文書を抽出する例2)
また、抽出部101Aは、言語モデル111Aを用いて、(1)複数のコンテンツのうち、他のコンテンツに後件として記述されている事項が前件として記述されているコンテンツすなわち仲介事項が記述されている第1のコンテンツを抽出し、(2)抽出されたコンテンツに後件として記述されている事項を第2の事項として抽出し、(3)抽出されたコンテンツに前件として記載されている事項が後件として記述されているコンテンツすなわち仲介事項が記述されている第2のコンテンツに前件として記載されている事項を第1の事項として抽出してもよい。このような処理によっても、複数のコンテンツのそれぞれに記述されている事項を論理的に関連付けて新たな知見を導き出すことが可能になるという効果が得られる。
【0132】
上記の処理について
図13に基づいて説明する。
図13は、文書の記載事項の抽出と関連付けのさらに他の例を示す図である。
図13の例では、抽出部101Aは、DBに記録されている文書D1~D4を1つずつ読み出し、読み出した文書に後件として記述されている事項が前件として記述されている文書を抽出する。例えば、抽出部101Aは、
図13に示すように、「この文書に後件として記述されている事項が前件として記述されている文書を、DBに記録されている文書の中から抽出して下さい」という定型のプロンプトP51と読み出した文書とを言語モデル111Aに入力してもよい。これにより、図示のように、読み出された文書が文書D4である場合に、文書D4において後件として記述されている事項M42と同じ内容の事項M11が前件として記述されている文書D1を抽出することができる。事項M42およびM11は仲介事項であるから、この例における文書D1は上述の第1のコンテンツに相当し、文書D4は上述の第2のコンテンツに相当する。
【0133】
次に、抽出部101Aは、抽出した文書D1すなわち第1のコンテンツに後件として記述されている事項を第2の事項として抽出すると共に、DBから読み出した文書D4すなわち第2のコンテンツに前件として記載されている事項を第1の事項として抽出する。
【0134】
より詳細には、抽出部101Aは、図示のように、抽出した文書D1と、文書D1に後件として記述されている事項を抽出することを指示するプロンプトP52を言語モデル111Aに入力することにより、文書D1に後件として記述されている事項を抽出させる。これにより、図示のように、文書D1に記述されている事項M12を第2の事項として抽出することができる。
【0135】
また、抽出部101Aは、図示のように、読み出した文書D4と、文書D4に前件として記述されている事項を抽出することを指示するプロンプトP53を言語モデル111Aに入力することにより、文書D4に前件として記述されている事項を抽出させる。これにより、図示のように、文書D4に記述されている事項M41を第1の事項として抽出することができる。
【0136】
分析部102Aは、以上のようにして文書D4から抽出された事項M41と、文書D1から抽出された事項M12とを関連付ける。これにより、
図4等の例と同様に、「毎日の歩数を記録する」ことにより「健康寿命が延びる」という知見が導かれる。
【0137】
図13の例における処理(分析方法)の流れは、
図11の例における処理の流れ(
図12参照)と同様である。ただし、
図13の例における処理では、S42において、選択された文書において「後件」として記述されている事項が「前件」として記述されている文書が抽出され、S43において、S42で抽出された文書において「後件」として記述されている事項が「第2の事項」として抽出され、S44において、S41で選択された文書において「前件」として記述されている事項が「第1の事項」として抽出される。
【0138】
〔文書の検索装置としての利用について〕
情報処理装置1Aは、文書の検索装置として利用することもできる。この場合、ユーザは、検索対象を示す情報を情報処理装置1Aに入力する。検索対象を示す情報は、例えば、ユーザが検索したい文書に関連する記述を含む文書であってもよいし、検索対象を示す文(テキストデータ)等であってもよい。
【0139】
例えば、ユーザが検索対象を示す情報として文書を入力したとする。この場合、抽出部101Aは、入力された文書に前件または後件として記述されている事項を仲介事項として、検索の対象となる複数の文書の中から当該仲介事項が記述されている文書を抽出する。そして、提示部107Aは、抽出部101Aが抽出した文書をユーザに提示する。
【0140】
文書の抽出には、
図4、
図8、
図9、
図11、または
図13に記載されている方法を適用することができる。例えば、
図4に記載されている方法を適用する場合、抽出部101Aは、入力された文書に前件として記述されている事項を抽出し、抽出した事項が後件として記述されている文書を抽出する。また、
図8に記載されている方法を適用する場合、抽出部101Aは、入力された文書に後件として記述されている事項を抽出し、抽出した事項が前件として記述されている文書を抽出する。
【0141】
また、
図9に記載されている方法を適用する場合、抽出部101Aは、入力された文書に前件として記載されている事項と、後件として記述されている事項を抽出する。また、抽出部101Aは、検索の対象となる複数の文書からも、それらの文書に前件として記載されている事項と、後件として記述されている事項をそれぞれ抽出する。そして、抽出部101Aは、検索の対象となる複数の文書の中から、入力された文書に前件として記載されている事項が後件として記述されている文書と、入力された文書に後件として記述されている事項が前件として記述されている文書の少なくとも何れかを抽出する。
【0142】
また、
図11に記載されている方法を適用する場合、抽出部101Aは、入力された文書に前件として記述されている事項が後件として記述されている文書を、検索の対象となる複数の文書の中から抽出する。同様に、
図13に記載されている方法を適用する場合、抽出部101Aは、入力された文書に後件として記述されている事項が前件として記述されている文書を、検索の対象となる複数の文書の中から抽出する。
【0143】
また、ユーザが検索対象を示すテキストを入力したとする。この場合、抽出部101Aは、検索の対象となる複数の文書の中から、入力されたテキストに示される事項が前件または後件として記述されている文書を抽出する。そして、抽出部101Aは、抽出した文書において、上記テキストに示される事項に対応する前件または後件として記載されている事項を仲介事項として、当該仲介事項が記述されている文書を抽出する。
【0144】
例えば、上記テキストが「サプリメントsを摂取することにより期待される効果は?」というユーザの質問を示すものであったとする。このように、効果や結果等の「後件」について問う質問を受け付けた場合、抽出部101Aは、「サプリメントsを摂取する」という事項が前件として記述されている文書を抽出する。そして、抽出部101Aは、抽出した文書において、上記事項に対応する後件として記載されている事項(例えば、「睡眠の質が改善する」等)を仲介事項として、当該仲介事項が前件として記述されている文書を抽出する。これにより、例えば、睡眠の質が改善すれば、仕事の能率が上がる等の記述がある文書が抽出される。したがって、このような文書を提示部107Aがユーザに提示することにより、サプリメントsを摂取することにより仕事の能率が上がることが期待できる、という知見を与えることができる。
【0145】
また、例えば、方策や条件等の「前件」について問う質問を受け付けた場合、抽出部101Aは、上記テキストに示される事項が後件として記述されている文書を抽出してもよい。そして、抽出部101Aは、抽出した文書において、上記事項に対応する前件として記載されている事項を仲介事項として、当該仲介事項が後件として記述されている文書を抽出してもよい。
【0146】
以上のように、情報処理装置1Aは、対象となる複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とし、当該仲介事項が後件として記述されているコンテンツを第1のコンテンツとし、当該仲介事項が前件として記述されているコンテンツを第2のコンテンツとするとき、機械学習済みの言語モデル111Aを用いて第1のコンテンツおよび第2のコンテンツの少なくとも何れかを抽出する抽出部101Aと、抽出部101Aにより抽出されたコンテンツを提示する提示部107Aと、を備える。よって、様々なコンテンツの活用を支援することが可能になるという効果が得られる。
【0147】
なお、上記構成における「対象となる複数のコンテンツ」には、検索対象のコンテンツの他、ユーザが検索のために入力したコンテンツが含まれていてもよい。この場合、ユーザが検索のために入力したコンテンツは、第1または第2のコンテンツとなる。そして、ユーザが検索のために入力したコンテンツが第1のコンテンツとなる場合、抽出部101Aは検索対象のコンテンツの中から第2のコンテンツを抽出する。一方、ユーザが検索のために入力したコンテンツが第2のコンテンツとなる場合、抽出部101Aは検索対象のコンテンツの中から第1のコンテンツを抽出する。
【0148】
〔変形例〕
上述の例示的実施形態で説明した各処理の実行主体は任意であり、上述の例に限られない。例えば、相互に通信可能な複数の装置により、情報処理装置1、1Aと同様の機能を有するシステムを構築することができる。また、
図6、
図7、
図10、
図12に示すフローチャートに示される各処理の実行主体は、1つの装置(プロセッサと言い換えることもできる)としてもよいし、複数の装置(同じくプロセッサと言い換えることもできる)としてもよい。
【0149】
〔ソフトウェアによる実現例〕
情報処理装置1,1Aの一部又は全部の機能は、集積回路(ICチップ)等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。
【0150】
後者の場合、情報処理装置1または1Aは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例(以下、コンピュータCと記載する)を
図14に示す。
図14は、情報処理装置1または1Aとして機能するコンピュータCのハードウェア構成を示すブロック図である。
【0151】
コンピュータCは、少なくとも1つのプロセッサC1と、少なくとも1つのメモリC2と、を備えている。メモリC2には、コンピュータCを情報処理装置1または1Aとして動作させるためのプログラム(分析プログラム)Pが記録されている。コンピュータCにおいて、プロセッサC1は、プログラムPをメモリC2から読み取って実行することにより、情報処理装置1または1Aの各機能が実現される。
【0152】
プロセッサC1としては、例えば、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、DSP(Digital Signal Processor)、MPU(Micro Processing Unit)、FPU(Floating point number Processing Unit)、PPU(Physics Processing Unit)、TPU(Tensor Processing Unit)、量子プロセッサ、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリC2としては、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又は、これらの組み合わせなどを用いることができる。
【0153】
なお、コンピュータCは、プログラムPを実行時に展開したり、各種データを一時的に記憶したりするためのRAM(Random Access Memory)を更に備えていてもよい。また、コンピュータCは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータCは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。
【0154】
また、プログラムPは、コンピュータCが読み取り可能な、一時的でない有形の記録媒体Mに記録することができる。このような記録媒体Mとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータCは、このような記録媒体Mを介してプログラムPを取得することができる。また、プログラムPは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータCは、このような伝送媒体を介してプログラムPを取得することもできる。
【0155】
また、情報処理装置1または1Aの上記各機能は、単一のコンピュータに設けられた単一のプロセッサが実現してもよいし、単一のコンピュータに設けられた複数のプロセッサが協働して実現してもよいし、複数のコンピュータの各々に設けられた複数のプロセッサが協働して実現してもよい。また、情報処理装置1または1Aに上記各機能を実現させるためのプログラムは、単一のコンピュータに設けられた単一のメモリに記憶されていてもよいし、単一のコンピュータに設けられた複数のメモリに分散して記憶されていてもよいし、複数のコンピュータの各々に設けられた複数のメモリに分散して記憶されていてもよい。
【0156】
〔付記事項1〕
本開示には、以下の各付記に記載の技術が含まれる。ただし、本発明は、以下の各付記に記載の技術に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。
【0157】
〔付記事項A〕
(付記A1)
機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出部と、前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出部の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析部と、を備える情報処理装置。
【0158】
(付記A2)
前記抽出部は、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに前件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が後件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに前件として記述されている事項を前記第1の事項として抽出し、前記第1のコンテンツに後件として記述されている事項を前記第2の事項として抽出する、付記A1に記載の情報処理装置。
【0159】
(付記A3)
前記抽出部は、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに後件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が前件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに後件として記述されている事項を前記第2の事項として抽出し、前記第1のコンテンツに前件として記述されている事項を前記第1の事項として抽出する、付記A1に記載の情報処理装置。
【0160】
(付記A4)
前記抽出部は、前記言語モデルを用いて、前記複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出し、前記分析部は、抽出された前記事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を前記仲介事項として、抽出された前記事項の中から前記第1の事項と前記第2の事項とを特定し、特定した前記第1の事項と前記第2の事項とを関連付ける、付記A1に記載の情報処理装置。
【0161】
(付記A5)
前記抽出部は、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに前件として記述されている事項が後件として記述されているコンテンツを抽出し、抽出された前記コンテンツに前件として記述されている事項を前記第1の事項として抽出し、抽出された前記コンテンツに後件として記載されている事項が前件として記述されている前記コンテンツに後件として記載されている事項を前記第2の事項として抽出する、付記A1に記載の情報処理装置。
【0162】
(付記A6)
前記抽出部は、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに後件として記述されている事項が前件として記述されているコンテンツを抽出し、抽出された前記コンテンツに後件として記述されている事項を前記第2の事項として抽出し、抽出された前記コンテンツに前件として記載されている事項が後件として記述されている前記コンテンツに前件として記載されている事項を前記第1の事項として抽出する、付記A1に記載の情報処理装置。
【0163】
(付記A7)
前記第1の事項が前件として記述されていると共に前記仲介事項が後件として記述されているコンテンツから抽出された、前記第1の事項と前記仲介事項との関係性を示す第1の関係性情報と、前記仲介事項が前件として記述されていると共に前記第2の事項が後件として記述されているコンテンツから抽出された、前記仲介事項と前記第2の事項との関係性を示す第2の関係性情報と、を用いて、前記第1の事項と前記第2の事項との関係性を推論する推論部を備える、付記A1からA6の何れかに記載の情報処理装置。
【0164】
(付記A8)
前記分析部による関連付けの結果に基づき、前記複数のコンテンツに記述されている各事項の論理的な関係性を示すロジックモデルを生成するモデル生成部を備える、付記A1からA7の何れかに記載の情報処理装置。
【0165】
(付記A9)
質問の入力を受け付ける受付部と、前記ロジックモデルを用いて前記質問に対する回答を生成する回答生成部と、前記回答を提示する提示部と、を備える付記A8に記載の情報処理装置。
【0166】
〔付記事項B〕
(付記B1)
少なくとも1つのプロセッサが、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出処理と、前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出処理における抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析処理と、を含む分析方法。
【0167】
(付記B2)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに前件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が後件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに前件として記述されている事項を前記第1の事項として抽出し、前記第1のコンテンツに後件として記述されている事項を前記第2の事項として抽出する、付記B1に記載の分析方法。
【0168】
(付記B3)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに後件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が前件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに後件として記述されている事項を前記第2の事項として抽出し、前記第1のコンテンツに前件として記述されている事項を前記第1の事項として抽出する、付記B1に記載の分析方法。
【0169】
(付記B4)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出し、前記分析処理では、前記少なくとも1つのプロセッサは、抽出された前記事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を前記仲介事項として、抽出された前記事項の中から前記第1の事項と前記第2の事項とを特定し、特定した前記第1の事項と前記第2の事項とを関連付ける、付記B1に記載の分析方法。
【0170】
(付記B5)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに前件として記述されている事項が後件として記述されているコンテンツを抽出し、抽出された前記コンテンツに前件として記述されている事項を前記第1の事項として抽出し、抽出された前記コンテンツに後件として記載されている事項が前件として記述されている前記コンテンツに後件として記載されている事項を前記第2の事項として抽出する、付記B1に記載の分析方法。
【0171】
(付記B6)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに後件として記述されている事項が前件として記述されているコンテンツを抽出し、抽出された前記コンテンツに後件として記述されている事項を前記第2の事項として抽出し、抽出された前記コンテンツに前件として記載されている事項が後件として記述されている前記コンテンツに前件として記載されている事項を前記第1の事項として抽出する、付記B1に記載の分析方法。
【0172】
(付記B7)
前記少なくとも1つのプロセッサが、前記第1の事項が前件として記述されていると共に前記仲介事項が後件として記述されているコンテンツから抽出された、前記第1の事項と前記仲介事項との関係性を示す第1の関係性情報と、前記仲介事項が前件として記述されていると共に前記第2の事項が後件として記述されているコンテンツから抽出された、前記仲介事項と前記第2の事項との関係性を示す第2の関係性情報と、を用いて、前記第1の事項と前記第2の事項との関係性を推論する推論処理を含む、付記B1からB6の何れかに記載の分析方法。
【0173】
(付記B8)
前記少なくとも1つのプロセッサが、前記分析処理による関連付けの結果に基づき、前記複数のコンテンツに記述されている各事項の論理的な関係性を示すロジックモデルを生成するモデル生成処理を含む、付記B1からB7の何れかに記載の分析方法。
【0174】
(付記B9)
前記少なくとも1つのプロセッサが質問の入力を受け付ける受付処理と、前記少なくとも1つのプロセッサが前記ロジックモデルを用いて前記質問に対する回答を生成する回答生成処理と、前記少なくとも1つのプロセッサが前記回答を提示する提示処理と、を含む付記B8に記載の分析方法。
【0175】
〔付記事項C〕
(付記C1)
コンピュータを、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出手段、および前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出手段の抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析手段、として機能させる分析プログラム。
【0176】
(付記C2)
前記抽出手段は、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに前件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が後件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに前件として記述されている事項を前記第1の事項として抽出し、前記第1のコンテンツに後件として記述されている事項を前記第2の事項として抽出する、付記C1に記載の分析プログラム。
【0177】
(付記C3)
前記抽出手段は、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに後件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が前件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに後件として記述されている事項を前記第2の事項として抽出し、前記第1のコンテンツに前件として記述されている事項を前記第1の事項として抽出する、付記C1に記載の分析プログラム。
【0178】
(付記C4)
前記抽出手段は、前記言語モデルを用いて、前記複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出し、前記分析手段は、抽出された前記事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を前記仲介事項として、抽出された前記事項の中から前記第1の事項と前記第2の事項とを特定し、特定した前記第1の事項と前記第2の事項とを関連付ける、付記C1に記載の分析プログラム。
【0179】
(付記C5)
前記抽出手段は、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに前件として記述されている事項が後件として記述されているコンテンツを抽出し、抽出された前記コンテンツに前件として記述されている事項を前記第1の事項として抽出し、抽出された前記コンテンツに後件として記載されている事項が前件として記述されている前記コンテンツに後件として記載されている事項を前記第2の事項として抽出する、付記C1に記載の分析プログラム。
【0180】
(付記C6)
前記抽出手段は、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに後件として記述されている事項が前件として記述されているコンテンツを抽出し、抽出された前記コンテンツに後件として記述されている事項を前記第2の事項として抽出し、抽出された前記コンテンツに前件として記載されている事項が後件として記述されている前記コンテンツに前件として記載されている事項を前記第1の事項として抽出する、付記C1に記載の分析プログラム。
【0181】
(付記C7)
前記コンピュータを、前記第1の事項が前件として記述されていると共に前記仲介事項が後件として記述されているコンテンツから抽出された、前記第1の事項と前記仲介事項との関係性を示す第1の関係性情報と、前記仲介事項が前件として記述されていると共に前記第2の事項が後件として記述されているコンテンツから抽出された、前記仲介事項と前記第2の事項との関係性を示す第2の関係性情報と、を用いて、前記第1の事項と前記第2の事項との関係性を推論する推論手段として機能させる、付記C1からC6の何れかに記載の分析プログラム。
【0182】
(付記C8)
前記コンピュータを、前記分析手段による関連付けの結果に基づき、前記複数のコンテンツに記述されている各事項の論理的な関係性を示すロジックモデルを生成するモデル生成手段として機能させる、付記C1からC7の何れかに記載の分析プログラム。
【0183】
(付記C9)
前記コンピュータを、質問の入力を受け付ける受付手段、前記ロジックモデルを用いて前記質問に対する回答を生成する回答生成手段、および前記回答を提示する提示手段、として機能させる、付記C8に記載の分析プログラム。
【0184】
〔付記事項D〕
(付記D1)
少なくとも1つのプロセッサを備え、前記少なくとも1つのプロセッサは、機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出処理と、前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出処理における抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析処理と、を実行する情報処理装置。
【0185】
なお、前記情報処理装置は、更にメモリを備えていてもよい。また、前記メモリには、前記各処理を前記少なくとも1つのプロセッサに実行させるためのプログラムが記憶されていてもよい。
【0186】
(付記D2)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに前件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が後件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに前件として記述されている事項を前記第1の事項として抽出し、前記第1のコンテンツに後件として記述されている事項を前記第2の事項として抽出する、付記D1に記載の情報処理装置。
【0187】
(付記D3)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツの1つである第1のコンテンツに後件として記述されている事項を抽出し、前記複数のコンテンツのうち、抽出された前記事項が前件として記述されている第2のコンテンツを抽出し、前記第2のコンテンツに後件として記述されている事項を前記第2の事項として抽出し、前記第1のコンテンツに前件として記述されている事項を前記第1の事項として抽出する、付記D1に記載の情報処理装置。
【0188】
(付記D4)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツのそれぞれから、当該コンテンツに前件として記述されている事項と、当該事項に対応する後件として記述されている事項とをそれぞれ抽出し、前記分析処理では、前記少なくとも1つのプロセッサは、抽出された前記事項のうち、あるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を前記仲介事項として、抽出された前記事項の中から前記第1の事項と前記第2の事項とを特定し、特定した前記第1の事項と前記第2の事項とを関連付ける、付記D1に記載の情報処理装置。
【0189】
(付記D5)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに前件として記述されている事項が後件として記述されているコンテンツを抽出し、抽出された前記コンテンツに前件として記述されている事項を前記第1の事項として抽出し、抽出された前記コンテンツに後件として記載されている事項が前件として記述されている前記コンテンツに後件として記載されている事項を前記第2の事項として抽出する、付記D1に記載の情報処理装置。
【0190】
(付記D6)
前記抽出処理では、前記少なくとも1つのプロセッサは、前記言語モデルを用いて、前記複数のコンテンツのうち、他のコンテンツに後件として記述されている事項が前件として記述されているコンテンツを抽出し、抽出された前記コンテンツに後件として記述されている事項を前記第2の事項として抽出し、抽出された前記コンテンツに前件として記載されている事項が後件として記述されている前記コンテンツに前件として記載されている事項を前記第1の事項として抽出する、付記D1に記載の情報処理装置。
【0191】
(付記D7)
前記少なくとも1つのプロセッサは、前記第1の事項が前件として記述されていると共に前記仲介事項が後件として記述されているコンテンツから抽出された、前記第1の事項と前記仲介事項との関係性を示す第1の関係性情報と、前記仲介事項が前件として記述されていると共に前記第2の事項が後件として記述されているコンテンツから抽出された、前記仲介事項と前記第2の事項との関係性を示す第2の関係性情報と、を用いて、前記第1の事項と前記第2の事項との関係性を推論する推論処理を実行する、付記D1からD6の何れかに記載の情報処理装置。
【0192】
(付記D8)
前記少なくとも1つのプロセッサは、前記分析処理による関連付けの結果に基づき、前記複数のコンテンツに記述されている各事項の論理的な関係性を示すロジックモデルを生成するモデル生成処理を実行する、付記D1からD7の何れかに記載の情報処理装置。
【0193】
(付記D9)
前記少なくとも1つのプロセッサは、質問の入力を受け付ける受付処理と、前記ロジックモデルを用いて前記質問に対する回答を生成する回答生成処理と、前記回答を提示する提示処理と、を実行する付記D8に記載の情報処理装置。
【0194】
〔付記事項E〕
機械学習済みの言語モデルを用いて、対象となる複数のコンテンツから、当該コンテンツに前件として記述されている事項と、後件として記述されている事項の少なくとも何れかを抽出する抽出処理と、前記複数のコンテンツのうちのあるコンテンツには前件として記述されている一方で、他のコンテンツには後件として記述されている事項を仲介事項とするとき、前記抽出処理における抽出結果に基づき、前記仲介事項が後件として記述されているコンテンツに前件として記述されている第1の事項と、前記仲介事項が前件として記述されているコンテンツに後件として記述されている第2の事項と関連付ける分析処理と、をコンピュータに実行させる分析プログラム、を記録した一時的でない記録媒体。
【符号の説明】
【0195】
1 情報処理装置
101 抽出部(抽出手段)
102 分析部(分析手段)
1A 情報処理装置
101A 抽出部(抽出手段)
102A 分析部(分析手段)
103A モデル生成部(モデル生成手段)
104A 推論部(推論手段)
105A 受付部(受付手段)
106A 回答生成部(回答生成手段)
107A 提示部(提示手段)
111A 言語モデル
112A ロジックモデル