IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

<>
  • 特開-情報処理の方法、及び電子デバイス 図1
  • 特開-情報処理の方法、及び電子デバイス 図2
  • 特開-情報処理の方法、及び電子デバイス 図3
  • 特開-情報処理の方法、及び電子デバイス 図4
  • 特開-情報処理の方法、及び電子デバイス 図5
  • 特開-情報処理の方法、及び電子デバイス 図6
  • 特開-情報処理の方法、及び電子デバイス 図7
  • 特開-情報処理の方法、及び電子デバイス 図8
  • 特開-情報処理の方法、及び電子デバイス 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024022531
(43)【公開日】2024-02-16
(54)【発明の名称】情報処理の方法、及び電子デバイス
(51)【国際特許分類】
   G06F 40/35 20200101AFI20240208BHJP
【FI】
G06F40/35
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023125813
(22)【出願日】2023-08-01
(31)【優先権主張番号】202210940329.0
(32)【優先日】2022-08-05
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】フェン ルー
(72)【発明者】
【氏名】リン アディ
(57)【要約】      (修正有)
【課題】ターゲット対象の因果関係を掘り起こす情報処理方法及び電子デバイスを提供する。
【解決手段】方法は、ターゲット対象に関する非構造化テキストセットに基づいて、ターゲット対象の1グループのターゲット要素を決定する。各ターゲット要素は、ターゲット対象の1つの態様を表す。方法はまた、テキストセット内のテキストを分析することによって、原因事象と結果事象を含む因果事象ペアを決定することと、因果事象ペアに基づいて、ターゲット要素セットのうちの第1要素とターゲット対象の第2要素との第1因果関係を決定することと、を含む。
【選択図】図8
【特許請求の範囲】
【請求項1】
ターゲット対象に関する非構造化テキストセットに基づいて、前記ターゲット対象の1グループのターゲット要素を決定し、各ターゲット要素は前記ターゲット対象の1つの態様を表すことと、
テキストセット内のテキストを分析することによって、原因事象と結果事象を含む因果事象ペアを決定することと、
前記因果事象ペアに基づいて、ターゲット要素セットの第1要素と前記ターゲット対象の第2要素との第1因果関係を決定することと、
を備える情報処理の方法。
【請求項2】
因果関係に合致する少なくとも1つの参照センテンスを前記テキストセットの前記テキストから決定することと、
前記少なくとも1つの参照センテンスに基づいて、前記第1因果関係を反映するターゲットセンテンスを決定することと、
をさらに備える請求項1に記載の方法。
【請求項3】
因果関係に合致する少なくとも1つの参照センテンスを前記テキストセットの前記テキストから決定することと、
前記少なくとも1つの参照センテンスの数に基づいて、前記第1要素が前記第2要素に及ぼす影響の程度、または前記第2要素が前記第1要素に及ぼす影響の程度を示す前記第1因果関係の因果強度を決定することと、
をさらに備える請求項1に記載の方法。
【請求項4】
前記第2要素は、
前記ターゲット要素セットにおける前記第1要素以外の要素、前記ターゲット対象の第1事前定義要素、前記ターゲット対象の関心要素の少なくとも1つを含む、
請求項1に記載の方法。
【請求項5】
前記テキストセットは、前記ターゲット対象に対する情報収集シート内のオープン質問への回答からなり、
前記情報収集シートは、前記第1事前定義要素に対するクローズド質問を含む、
請求項4に記載の方法。
【請求項6】
前記ターゲット対象の第2事前定義要素が前記ターゲット対象の関心要素に影響を与えることを示す第2因果関係を決定することと、
前記テキストセットに基づいて、前記第2因果関係を反映する第2ターゲットセンテンスを決定することと、
をさらに備える請求項1に記載の方法。
【請求項7】
前記第1因果関係を決定することは、
前記原因事象が前記第1要素に関連し、前記結果事象が前記第2要素に関連していると判定された場合、前記第1要素が前記第2要素に影響を与えていると前記第1因果関係を判定することと、
前記原因事象が前記第2要素に関連し、前記結果事象が前記第1要素に関連していると判定された場合、前記第2要素が前記第1要素に影響を与えていると前記第1因果関係を判定することと、
のうちの少なくとも1つを含む、請求項1に記載の方法。
【請求項8】
前記原因事象または前記結果事象うちの1つの事象について、
前記事象を表す前記テキストは、前記第1要素を表す単語を含む、
前記事象を表す前記テキストは、前記第1要素を表す単語と意味的に一致する、
のうちの少なくとも1つに基づいて、前記第1要素に関与していると決定されることをさらに含む、
請求項7に記載の方法。
【請求項9】
前記因果事象ペアを決定することは、
前記因果事象ペアは、前記テキストセット内の前記テキストに基づいて、自己訓練された自然言語処理モデルに従って決定されること、
を含む、請求項1に記載の方法。
【請求項10】
前記第1要素を表す要素と、前記第2要素を表す要素と、が関連付けられて提示されることをさらに備える、
請求項1に記載の方法。
【請求項11】
関連して提示される、前記第1要素を表す要素と前記第2要素を表す要素は、
前記第1要素を表す第1ノードおよび前記第2要素を表す第2ノードを提示し、および
前記第1ノードと前記第2ノードと接続するエッジ、
を含む、請求項10に記載の方法。
【請求項12】
前記エッジに関連して、前記第1因果関係を反映したターゲットセンテンスをさらに備える、請求項11に記載の方法。
【請求項13】
前記エッジの目立つ度合いは、前記第1要素が前記第2要素に与える影響の度合い、または前記第2要素が前記第1要素に与える影響の度合いを示す前記第1因果関係の因果強度に関連していることを特徴とする、
請求項11に記載の方法。
【請求項14】
少なくとも1つの処理回路であって、前記少なくとも1つの処理回路は、
ターゲット対象に関する非構造化テキストセットに基づいて、前記ターゲット対象の1グループのターゲット要素を決定し、各ターゲット要素は前記ターゲット対象の1つの態様を表し、
テキストセット内のテキストを分析することによって、原因事象と結果事象を含む因果事象ペアを決定し、
前記因果事象ペアに基づいて、ターゲット要素セットの第1要素と前記ターゲット対象の第2要素との第1因果関係を決定する、
ように構成される電子デバイス。
【請求項15】
前記少なくとも1つの処理回路は、さらに、
因果関係に合致する少なくとも1つの参照センテンスを前記テキストセットの前記テキストから決定し、
前記少なくとも1つの参照センテンスに基づいて、前記第1因果関係を反映するターゲットセンテンスを決定する、
ように構成されることを特徴とする、請求項14に記載の電子デバイス。
【請求項16】
前記少なくとも1つの処理回路は、さらに、
因果関係に合致する少なくとも1つの参照センテンスを前記テキストセットの前記テキストから決定し、
前記少なくとも1つの参照センテンスの数に基づいて、前記第1要素が前記第2要素に及ぼす影響の程度、または前記第2要素が前記第1要素に及ぼす影響の程度を示す前記第1因果関係の因果強度を決定する、
ように構成されることを特徴とする、請求項14に記載の電子デバイス。
【請求項17】
前記第2要素は、
前記ターゲット要素セットにおける第1要素以外の要素、前記ターゲット対象の第1事前定義要素、および前記ターゲット対象の関心要素のうちの少なくとも1つを含む、
請求項14に記載の電子デバイス。
【請求項18】
前記テキストセットは、前記ターゲット対象に対する情報収集シート内のオープン質問への回答からなり、
前記情報収集シートは、前記第1事前定義要素に対するクローズド質問を含む、
請求項17に記載の電子デバイス。
【請求項19】
前記少なくとも1つの処理回路は、さらに、
前記ターゲット対象の第2事前定義要素が前記ターゲット対象の関心要素に影響を与えることを示す第2因果関係を決定し、
前記テキストセットに基づいて、前記第2因果関係を反映する第2ターゲットセンテンスを決定する、
のように構成されることを特徴とする、請求項14に記載の電子デバイス。
【請求項20】
ターゲット対象に関する非構造化テキストセットに基づいて、前記ターゲット対象の1グループのターゲット要素を決定し、各ターゲット要素は前記ターゲット対象の1つの態様を表すことと、
テキストセット内のテキストを分析することによって、原因事象と結果事象を含む因果事象ペアを決定することと、
前記因果事象ペアに基づいて、ターゲット要素セットの第1要素と前記ターゲット対象の第2要素との第1因果関係を決定することと、
を備える情報処理の方法を実施するためにプロセッサによって実行可能なコンピュータープログラムを格納したコンピューター読み取り可能メモリー。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の例示的な実施形態は、概してコンピューターの分野に関するものであり、特に、情報処理のための方法およびデバイスに関するものである。
【背景技術】
【0002】
非構造化テキストを使用すると、製品、サービス、組織などの対象に対するコメントを提供できる。例えば、ユーザーのコメントは、製品の購入ページやサービスの展示ページに表示されることが多い。別の例として、アンケートには、回答者(Respondent)がテキストコメントを提供するためのオープン質問を含める。このような構造化されていないテキストには、説明対象に関する豊富な情報が含まれている、こうした情報を読み解き、活用していきたい。
【発明の概要】
【課題を解決するための手段】
【0003】
本開示の第1の態様では、情報処理の方法を提供する。この方法は、ターゲット対象に関する非構造化テキストセットに基づいて、ターゲット対象の1グループのターゲット要素を決定することを含み、各ターゲット要素は、ターゲット対象の1つの態様を表す、テキストセット内のテキストを分析することによって、原因事象と結果事象を含む因果事象ペアを決定することと、因果事象ペアに基づいて、ターゲット要素セットの第1要素とターゲット対象の第2要素との第1因果関係を決定する。
【0004】
本開示の第2の態様では、電子デバイスを提供する。電子デバイスは、少なくとも1つの処理回路を含む。少なくとも1つの処理回路は、ターゲット対象に関する非構造化テキストセットに基づいて、各ターゲット対象の1つの態様を表すターゲット対象の1グループのターゲット要素を決定するように構成され、各ターゲット要素は、ターゲット対象に関する非構造化テキストセットに基づいて、ターゲット対象に関する1グループのターゲット要素を決定するように構成される、テキストセット内のテキストを分析することによって、原因事象と結果事象を含む因果事象ペアを決定することと、因果事象ペアに基づいて、ターゲット要素セットの第1要素とターゲット対象の第2要素との第1因果関係を決定する。
【0005】
第2の態様のいくつかの実施形態では、少なくとも1つの処理回路は、因果関係に合致する少なくとも1つの参照センテンスをテキストセットのテキストから決定する。そして、少なくとも1つの参照センテンスに基づいて、第1因果関係を反映するターゲットセンテンスを決定する。
【0006】
第2の態様のいくつかの実施形態では、少なくとも1つの処理回路は、因果関係に合致する少なくとも1つの参照センテンスをテキストセットのテキストから決定する。そして、少なくとも1つの参照センテンスの数に基づいて、第1要素が第2要素に及ぼす影響の程度、または第2要素が第1要素に及ぼす影響の程度を示す第1因果関係の因果強度を決定する。
【0007】
第2の態様のいくつかの実施形態では、第2要素は、ターゲット要素セットにおける第1要素以外の要素、ターゲット対象の第1事前定義要素、およびターゲット対象の関心要素のうちの少なくとも1つを含む。
【0008】
第2の態様のいくつかの実施形態では、テキストセットは、ターゲット対象に対する情報収集シート内のオープン質問への回答から得られ、情報収集シートは、第1事前定義要素に対するクローズド質問を含む。
【0009】
第2の態様のいくつかの実施形態では、少なくとも1つの処理回路は、ターゲット対象の第2事前定義要素がターゲット対象の関心要素に影響を与えることを示す第2因果関係を決定する、ターゲット対象の第2事前定義要素がターゲット対象の関心要素に影響を与えることを示す第2因果関係を決定するようテキストセットに基づいて、第2因果関係を反映する第2ターゲットセンテンスを決定する。
【0010】
第2の態様のいくつかの実施形態では、第1因果関係を決定することは、原因事象が第1要素に関連し、結果事象が第2要素に関連していると決定された場合、第1因果関係は、第1要素が第2要素に影響していると決定し、原因事象が第2要素に関連しており、結果事象が第1要素に関連していると決定された場合、第2要素が第1要素に影響していると決定する、のうちの1つを含む。
【0011】
第2の態様のいくつかの実施形態では、少なくとも1つの処理回路は、原因事象または結果事象のうちの1つの事象について、事象を表すテキストが第1要素を表す単語を含み、事象を表すテキストが第1要素を表す単語と意味的に一致するという決定の少なくとも1つに基づいて、事象が第1要素に関係していると決定する。
【0012】
第2の態様のいくつかの実施形態では、因果事件のペアを決定することは、テキストセットのテキストに基づいて、自己訓練された自然言語処理モデルに従って、因果事件のペアを決定することを含む。
【0013】
第2の態様のいくつかの実施形態では、少なくとも1つの処理回路は、第1要素を表す要素と第2要素を表す要素を関連付けて提示する。
【0014】
第2の態様のいくつかの実施形態では、第1要素の要素および第2要素を表す要素を関連して提示することは、第1要素を表す第1ノードおよび第2要素を表す第2ノードを提示することと、第2要素を表す第2ノードを提示することと、および、第1ノードと第2ノードとを接続するエッジを提示することと、を含む。
【0015】
第2の態様のいくつかの実施形態では、少なくとも1つの処理回路は、エッジに関連して、第1因果関係を反映するターゲットセンテンスを提示する。
【0016】
第2の態様のいくつかの実施形態では、エッジの目立つ程度は、第1要素が第2要素に及ぼす影響の程度、または第2要素が第1要素に及ぼす影響の程度を示す第1因果関係の因果強度に関連する。
【0017】
本開示の第3の態様では、電子デバイスを提供する。電子デバイスは、少なくとも1つの処理ユニットを含む、そして、少なくとも1つの処理ユニットに結合され、少なくとも1つの処理ユニットによる実行のための命令を格納する少なくとも1つのメモリーを含む。命令は、少なくとも1つの処理ユニットによって実行されるときに、電子デバイスに第1の態様を実行させる方法である。
【0018】
本開示の第4の態様では、コンピューター読み取り可能メモリーを提供する。コンピューター読み取り可能メモリーは、第1の態様の方法を実施するためにプロセッサによって実行可能なコンピュータープログラムを記憶する。
【0019】
本開示の内容に記載されたものは、本開示の実施形態の重要な特徴または重要な特徴を限定することを意図しているものではなく、本開示の範囲を限定するためにも使用されていないことが理解されるべきである。本開示の他の特徴は、以下の説明によって容易に理解される。
【図面の簡単な説明】
【0020】
添付図に関連し、以下の詳細な説明を参照すると、本開示の実施形態の上記特徴および他の特徴、利点、態様は、より明らかになる。図面において、同一又は類似の符号は、同一又は類似の要素を表す。
【0021】
図1図1は、本開示の実施形態が実施される例示的環境の概略図である。
図2図2は、本開示のいくつかの実施形態に従った情報収集シートの一例の概略図である。
図3図3は、本開示のいくつかの実施形態に従ったターゲット要素を決定するプロセスのフローチャートである。
図4図4は、本開示のいくつかの実施形態によるキーワードグループ化の概略図である。
図5図5は、本開示のいくつかの実施形態による因果関係抽出のアーキテクチャの概略図である。
図6図6は、本開示のいくつかの実施形態による因果関係セットの例である。
図7図7は、本開示のいくつかの実施形態による因果関係を表すグラフ(graph)の例である。
図8図8は、本開示のいくつかの実施形態による情報処理のプロセスのフローチャートである。
図9図9は、本開示の複数の実施形態を実施するデバイスのブロック図である。
【発明を実施するための形態】
【0022】
以下、添付図面を参照して、本開示の実施形態についてより詳しく説明する。本開示のいくつかの実施形態が添付図に示されているが、本開示は様々な形態で実施されることができ、本文に記載された実施形態に限定されるものとして解釈されるべきではなく、むしろ、本開示をより完全かつ完全に理解するためにこれらの実施形態を提供することが理解されるべきである。本開示の図面および実施形態は、例示的な動作のためにのみ使用され、本開示の保護の範囲を制限するために使用されるものではないことが理解されるべきである。
【0023】
本開示の実施形態の説明では、用語「含む」およびそれに類する用語は、オープン含む(開放性包含)、すなわち「含むが、限定されない」と理解されるべきである。用語「ベース」は、「少なくとも部分的にベース」と理解されるべきである。用語「1つの実施形態」または「本実施形態」は、「少なくとも1つの実施形態」と理解されるべきである。用語「いくつかの実施形態」は、「少なくともいくつかの実施形態」と理解されるべきである。以下に、他の明示的な定義と暗黙的な定義を含めることもできる。
【0024】
本文で使用される用語「回路」は、ハードウェア回路、および/またはハードウェア回路とソフトウェアとの組み合わせを意味する。例えば、回路は、アナログおよび/またはデジタルハードウェア回路とソフトウェア/ファームウェアとの組み合わせであってもよい。別の例として、回路は、(複数の)デジタル信号プロセッサと、ソフトウェアと、デバイスが様々な機能を実行するために動作することを可能にするために一緒に動作する(複数の)メモリーとを含むソフトウェアを有するハードウェアプロセッサの任意の部分とする。さらに別の例では、回路は、動作のためにソフトウェア/ファームウェアを必要とするが、動作のために必要でない場合には、ソフトウェアが存在しなくてもよいマイクロプロセッサまたはその一部のようなハードウェア回路および/またはプロセッサであってもよい。本文で使用される、「回路」という用語は、ハードウェア回路またはプロセッサのみ、またはハードウェア回路またはプロセッサの一部、ならびにそれら(またはそれら)に付随するソフトウェアおよび/またはファームウェアの実装をも含む。
【0025】
本文で使用される、「モデル」という用語は、訓練データから対応する入力と出力との間の関連付けを学習することができ、訓練の完了後に所与の入力に対して対応する出力を生成する。モデルの生成は、機械学習技術に基づく。ディープラーニングは、入力を処理し、対応する出力を提供するために複数層の処理ユニットを使用する機械学習アルゴリズムである。本文では、「モデル」を「機械学習モデル」、「機械学習ネットワーク」、または「ネットワーク」と呼ぶこともでき、これらの用語は本文で交換可能に使用される。モデルはさらに、異なるタイプの処理ユニットまたはネットワークを含む。
【0026】
前述のように、対象に関する非構造化テキストには、その対象に関する豊富な情報が含まれる。こうした情報を読み解き、利用することが期待される。一方、因果関係は、対象の様々な要素間の因果関係を掘り起こすために、様々な分野で広く利用される。従来は、ターゲット対象の既知の要素間の因果関係を求めることができた。しかしながら、従来のシナリオでは、非構造化テキストに含まれる暗黙的要素を掘り起こさず、そのような暗黙的要素と対象の他の要素との因果関係を明らかにすることもできなかった。この結果、対象に関する因果関係の掘り起こしは包括的ではない。
【0027】
本開示の実施形態は、情報処理のための態様を提案する。ターゲット対象に関する非構造化テキストセットに基づいて、ターゲット対象の1グループのターゲット要素を決定する。各ターゲット要素は、ターゲット対象の1つの態様を表す。テキストセット内のテキストを分析することにより、原因事象と結果事象を含む因果事象ペアを決定する。因果事象ペアに基づいて、ターゲット要素セットのうちの第1要素とターゲット対象の第2要素との第1因果関係を決定する。
【0028】
このシナリオでは、ターゲット対象に関するテキストから暗黙的な要素が抽出される。さらに、暗黙的要素に関する因果関係がテキストに基づいて決定される。このようにして、異なる暗黙的要素間、または暗黙的要素と既知の要素との因果関係を明らかにする。したがって、本発明は、ターゲット対象の因果関係の掘り起こしを改善するのに役立つので、ターゲット対象の改善を促進する。
【0029】
<サンプル環境>
図1は、本開示の実施形態が実施される例示的な環境100の概略図である。環境100において、コンピューティングデバイス110は、ターゲット対象に関するテキストセット105を受信するか、または、コンピューティングデバイス110は、オリジナルデータからテキストセット105を抽出する。テキストセット105は、総称して、または個別にテキスト101とも呼ばれる複数のテキスト101-1、101-2、・・・を含む。ターゲット対象には、有形対象、無形対象、およびそれらの組み合わせを含める。例えば、ターゲット対象は、生活用品、食品などの製品であってもよい。別の例として、ターゲット対象は、クラウドコンピューティングサービス、クラウドストレージサービスなどのサービスであってもよい。別の例として、対象となるのは、航空便、レストラン、ホテルなど、サービスや物品を提供する実体であってもよい。ターゲット対象には、会社などの組織構造を指定することもできる。
【0030】
テキスト101は、ターゲット対象のユーザーによるターゲット対象の説明であってもよい。テキスト101は、リンゴがおいしい、リンゴがおいしくないなどの感情的なセンテンスを含む。テキスト101は、例えば私はリンゴを食べましたなどの感情を持たないセンテンスを含む。テキスト101は、ターゲット対象に対する評価(evaluation)、コメント(comments)、レビュー(reviews)、査定(assessment)、アドバイス、感想等であってもよい。テキスト101は、ターゲット対象に影響を与える要素に関する情報を含む。テキストセット105内の個々のテキスト101は、異なるユーザーによって提供されるか、または異なる時間に同じユーザーによって提供される。
【0031】
いくつかの実施形態では、テキスト101は、ターゲット対象の表示ページにおけるユーザーの評価であってもよい。例えば、展示ページはショッピングアプリ(アプリ)、サービス提供アプリ、口コミアプリなどから生まれ得る。
【0032】
いくつかの実施形態では、図1に示すように、テキスト101は、ターゲット対象のための情報収集シート150から生成されてもよい。なお、本文で用いられるように、「情報収集シート」は、ターゲット対象に関する記述(例えば、評価、感想等)を収集するためのものであり、例えば、電子アンケート、コメント等であってもよい。情報収集シート150は、ターゲット対象に関するオープン質問を含む。コンピューティングデバイス110は、情報収集シート中のオープン質問に対する回答をテキスト101として収集する。
【0033】
図2は、情報収集シート150の一例を示している。この例では、あるフライトのための情報収集シート150は、オープン質問230を含む。ユーザーはテキストボックスを通じて、その便の評価などを提供できる。情報収集シート150の回答セット250は表形式で示される。回答セット250の各行は、同じ回答者からの回答レコードを表す。各回答レコードにおいて、列258はオープン質問230への回答である。テキスト101は、列258内のテキストであってもよい。
【0034】
図1を引き続き参照する。コンピューティングデバイス110は、テキストセット105に基づいて、ターゲット要素102のセットとも総称される、または単にターゲット要素102と呼ばれる、ターゲット対象の1グループのターゲット要素102-1、102-2、・・・を決定する。このようなターゲット要素102は、非構造化テキストから決定されるので、「暗黙的要素」または「抽出された要素」とも呼ばれる。ターゲット要素は、非構造化要素と見なす。
【0035】
いくつかの実施形態では、図1に示されるように、コンピューティングデバイス110はまた、1グループの事前定義要素103とも総称されるか、別途事前定義要素103とも呼ばれる、ターゲット対象の事前定義要素103-1、103-2、・・・を受信または決定する。本文で使用される「事前定義要素」という用語は、測定基準(criterion)が所定の選択肢(例えば、所定の数値、カテゴリ、星など)を有する要素を意味する。事前定義要素に対して、ユーザーは、事前定義選択肢の中から1つの選択肢を選択して、その事前定義要素の観点からターゲット対象を評価または記述する。事前定義要素は、定量的で、高度に組織化さる。事前定義要素の記述(例えば、評価、アセスメント)はオープンではなく、あらかじめ決められたオプションを持つアーキテクチャに準拠する必要がある。したがって、事前定義要素は、構造化された要素とも見なす。
【0036】
事前定義要素には、数値要素またはカテゴリ要素を含めることもできる。数値要素の所定の選択肢には、所定の数値や星などが含まれる。カテゴリ要素の所定のオプションは、例えば、キャビンのクラス等の所定のクラスを含む。
【0037】
いくつかの実施形態では、図1に示されるように、コンピューティングデバイス110は、ターゲット対象の関心要素を受信または決定することもできる。ここで使用されるように、「関心要素」とは、ターゲット対象が特に注目される側面を意味する。関心要素は、ターゲット対象の性能、サービス、機能、全体的な性能、全体的な評価、または満足度を含む。
【0038】
ターゲット対象の要素セット130は、ターゲット要素102と、任意の事前定義要素103および関心要素104を含む。本文では、ターゲット要素、事前定義要素、および関心要素は、総称して、または単独で「要素」とも呼ばれる。
【0039】
いくつかの実施形態では、図1に示すように、事前定義要素103は、情報収集シート150から得られることがある。情報収集シート150は、事前定義要素103に関するクローズド質問を含む。「クローズド質問」とは、答えがあらかじめ決められた選択肢の中から選択される問題である。図2の例では、情報収集シート150は、事前定義要素「Seat comfort(座席の快適性)」に関するクローズド質問210-1と、事前定義要素「Cabin service(キャビンサービス)」に関するクローズド質問210-2と、事前定義要素「Food beverage(フードビバレッジ)」に関するクローズド質問210-3と、事前定義要素「Entertainment(エンターテイメント)」に関するクローズド質問210-4と、事前定義要素「Ground service(グラウンドサービス)」に関するクローズド質問210-5と、事前定義要素「Value for money(お値打ち感)」に関するクローズド質問210-6を含む。クローズド質問210-1~210-6は、クローズド質問210とも総称されるか、単独で呼ばれる。各クローズド質問210は、ユーザーが選択するための5つのスコアを有する。回答セット250において、列252~257は、それぞれ、クローズド質問210-1~210-6に対するユーザーの回答である。
【0040】
関心要素104は、情報収集シート150からも得られる。図2の例では、情報収集シート150は、ターゲット対象の全体的な満足度に関するクローズド質問220を含む。回答セット250において、列251は、クローズド質問220に対するユーザーの回答である。したがって、この例では、ターゲット対象の関心要素は「Overall satisfaction(全体的な満足度)」である。
【0041】
図2の例では、ターゲット対象は航空便である。別の例として、ターゲット対象は、ある商品であってもよい。事前定義要素は、当該商品の外観、品質、価格、特徴などの要素を含む。関心要素は、例えば、商品のブランド価値であってもよい。さらに別の例として、ターゲット対象は企業であってもよい。事前定義要素には、従業員の給与、勤務地、勤務時間、昇進経路などが含まれる。関心要素としては、例えば、従業員満足度や従業員の留任意欲などが挙げられる。
【0042】
図1を引き続き参照する。ターゲット要素102は、非構造化テキストに暗黙的に含まれる要素である。ターゲット要素102とターゲット対象の他の要素との因果関係を明らかにすることが望ましい。例えば、ターゲット要素102が他のターゲット要素、事前定義要素103、または関心要素104と因果関係を有するか否かを決定することが望ましい。
【0043】
このターゲットのために、コンピューティングデバイス110は、テキストセット105内のテキストに基づいて、ターゲット要素102と他の要素との因果関係を決定する。いくつかの実施形態では、テキスト入力を処理する因果関係モデルを利用する。モデルは、テキストセット105内のテキストに基づいて、ターゲット要素102およびターゲット要素102に関連する因果関係を決定する。
【0044】
いくつかの実施形態では、コンピューティングデバイス110は、ファイルセット105内のテキスト101を分析することによって、因果事象ペア120とも総称されるか、または個別に因果事象ペア120とも呼ばれる1つまたは複数の因果事象ペア120-1、120-2、・・・を決定する。因果事象の各ペアは、原因事象および対応する結果事象を含む。例えば、因果事象ペア120-1は、原因事象121-1と結果事象122-1を含み、因果事象ペア120-2は、原因事象121-2と結果事象122-2を含む。原因事象121-1、121-2、・・・は、原因事象121とも総称されるか、単独で呼ばれ、結果事象122-1、122-2、・・・は、結果事象122とも総称されるか、単独で呼ばれる。
【0045】
コンピューティングデバイス110は、原因事象121と結果事象122を要素セット130内の要素と整合(マッチング)させて因果関係セット160を生成する。因果関係セット160は、少なくとも、あるターゲット要素102とターゲット対象の別の要素(例えば、別のターゲット要素、事前定義要素、関心要素)との因果関係を含む。いくつかの実施形態では、因果関係セット160は、事前定義要素103と関心要素104との因果関係も含む。コンピューティングデバイス110は、そのような因果関係を、他のデバイスから受信するか、または適切な方法を使用して自ら決定するなど、任意の適切な方法で取得する。本開示の実施形態は、この点において限定されない。
【0046】
環境100において、コンピューティングデバイス110は、端末デバイスまたはサービスエンドデバイスを含む、任意のタイプのコンピューティングデバイスであってもよい。端末デバイスは、モバイルハンドセット、デスクトップコンピューター、ラップトップコンピューター、ラップトップコンピューター、ネットブックコンピューター、タブレットコンピューター、メディアコンピューター、マルチメディアタブレット、パーソナル通信システム(PCS)デバイス、パーソナルナビゲーションデバイス、パーソナルデジタルアシスタント(PDA)、オーディオ/ビデオプレーヤ、デジタルカメラ/ビデオカメラ、測位デバイス、テレビ受像機、ラジオ放送受信機、電子書籍デバイス、ゲームデバイス、またはこれらのデバイスの部品および周エッジ機器を含む上記の任意の組み合わせを含む、任意のタイプのモバイル端末、固定端末または携帯端末とする。サービス側デバイスは、例えば、メインフレーム、エッジコンピューティングノード、クラウド環境内のコンピューティングデバイスなどのコンピューティングシステム/サーバーを含む。
【0047】
環境100の構造および機能は、例示的なターゲットのためにのみ記述され、本開示の範囲に対するいかなる制限も暗示しないことが理解されるべきである。図1には1つのコンピューティングデバイス110が別々に示されるが、いくつかの実施形態では、本文で説明される様々な動作は、複数のコンピューティングデバイスによって実装されてもよい。ターゲット要素および因果関係は別個に示されるが、ターゲット要素および対応する因果関係は、テキストセット105に基づいて同じモデルによって決定されてもよい。
【0048】
さらに、図2に示す情報収集シートは、本開示の範囲を制限することを意図しない例示的なものにすぎない。図2に示されるオープン質問、クローズド質問、およびその数は例示的なものにすぎない。本開示の実施形態では、情報収集シートは、任意の適切な数のオープン質問及びクローズド質問を有する。さらに、例として英語が挙げられるが、本開示の実施形態は、任意の言語のテキストおよび情報収集シートを処理するために使用されてもよい。
【0049】
<ターゲット要素の抽出>
図1を参照して上述したように、ターゲット対象に関連する潜在的な因果関係を掘り起こすためには、非構造化テキストから暗黙的な要素を抽出する必要がある。以下に、プロセスの例を説明する。図3は、本開示のいくつかの実施形態によるターゲット要素の決定するプロセス300のフローチャートである。プロセス300のコンピューティングデバイス110において実施する。説明を容易にするために、プロセス300は、図1を参照して説明する。
【0050】
ブロック310において、コンピューティングデバイス110は、ターゲット対象のための非構造化テキストセット105から複数のキーワードを抽出する。抽出されたキーワードは、任意の適切な数の単語分割を有する。キーワードは、「flight」、「seat」、「service」などの1つの単語キーワードと、「cabin crew」、「flight attendant」などの2つの単語キーワードを含む、任意の適切なキーワード抽出アルゴリズムを活用できる、例えば、TF-IDF, KP-Miner, SBKE, RAKE, TextRank, YAKE, KeyBERT等を使用するが、これらに限定されない。
【0051】
いくつかの実施形態では、キーワード抽出アルゴリズムを適用する前に、テキストセット105内のテキスト101を前処理することができ、例えば、固有表現およびストップワード(stop words)を除去する。固有表現は、例えば、人名、機関名、地名等であり、ターゲット対象のいずれの態様も記述しない。英語の場合、ストップワードは、例えば、「a」、「an」、「the」、「and」などである。中国語テキストの場合、ストップワードは、例えば、「一」、「一つ」、「と」、「但し」などである。あるいは、いくつかの実施形態では、テキスト101は、キーワード抽出アルゴリズムによって前処理されてもよい。
【0052】
いくつかの実施形態では、キーワード抽出アルゴリズムを用いて、テキストセット105からキーワードとして名詞を抽出する。これにより、ターゲット対象のアスペクトの他の属性を記述できない単語が抽出されることを回避する。これにより、後続処理の難易度を効果的に低減する。
【0053】
いくつかの実施形態では、コンピューティングデバイス110は、テキストセット105における各単語の出現回数(すなわち、単語の頻度)に基づいてキーワードを抽出する。具体的には、コンピューティングデバイス110は、テキストセット105のテキスト101から候補語を抽出する。テキストセット105における候補語の出現回数が閾値回数より大きい場合には、その候補語をキーワードの1つと判定する。テキストセット105における候補語の出現回数が閾値回数未満であれば、候補語を削除する。
【0054】
例えば、キーワード抽出アルゴリズムを使用して、各回答レコードの列258から候補語を抽出する。抽出された候補語毎に、テキストセット105全体における候補語の出現回数を算出する。そして、出現回数が閾値回数より大きい候補語をキーワードと判定し、出現回数が閾値回数より小さい候補語を削除する。このような実施形態では、予め抽出された候補語をフィルタリングすることにより、重要でないワードがターゲット要素の決定に干渉することを回避する。
【0055】
あるいは、いくつかの実施形態では、コンピューティングデバイス110は、テキストセット105内のテキスト101の意味に基づいてキーワードを抽出する。例えば、意味解析により感情を有するセンテンスを決定し、そのようなセンテンス中の感情に関連する名詞をキーワードとする。
【0056】
ブロック320において、コンピューティングデバイス110は、複数のキーワードのうちの少なくとも一部を、複数のキーワードの意味に基づいてグループ化する。いくつかの実施形態では、すべてのキーワードをグループ化する。いくつかの実施形態では、キーワードは、予備的なグループ化の結果に基づいてフィルタリングされ、フィルタリングされたキーワードはグループ化されてもよい。
【0057】
コンピューティングデバイス110は、クラスタを利用して、抽出された複数のキーワードをグループ化する。そのため、キーワードごとに意味を表すワードベクトルを生成する。ワードベクトルは、word2vector、GloVeなど、任意の適切な方法を使用して生成する。本開示の実施形態は、この点において限定されない。
【0058】
複数のキーワードは、ワードベクトルに基づいてクラスタリングされて、複数のクラスタを決定することができ、各クラスタは少なくとも1つのキーワードを含む。クラスタリングアルゴリズムは、キーワードの意味的類似性に基づいて、これらのキーワードを独立した重ならないクラスタに分割する。任意の適切なクラスタリングアルゴリズム、例えば、K平均値(K-Means)、密度に基づいてノイズにロバストな空間クラスタリングアルゴリズム(Density-Based Spatial Clustering of Applications with Noise、DBSCAN)、ガウス混合モデルなどを採用する。
【0059】
いくつかの実施形態では、キーワードは、各クラスタの品質に基づいてフィルタリングされてもよい。クラスタの品質は、そのクラスタ内のキーワードが意味的にどの程度集まっているかを表す。例えば、クラスタ内のキーワードの二乗距離の和をクラスタの品質として用いる。代替的にまたは追加的に、シルエット係数(Silhouette coefficient)をクラスタの品質として使用することもできる。
【0060】
クラスタリングによって得られた各クラスタの品質を決定する。いくつかの実施形態では、品質が閾値品質より低いクラスタ内のキーワードを除去して、残りのキーワードを決定する。残りのキーワードは、残りのキーワードの意味に基づいてグループ化される。例えば、残りのキーワードをクラスタリングする。得られた同一クラスタ内のキーワードをキーワードセットと見なす。あるいは、いくつかの実施形態では、閾値品質より低い品質を有するクラスタを除去し、閾値品質より高い品質を有する他のクラスタを保持する。予約されたクラスタでは、同じクラスタ内のキーワードはキーワードセットとして扱われる。このような実施形態では、残りのキーワードを再グループ化する必要はない。
【0061】
図4は、キーワードグループ化の一例を示す図である。グループ化された結果は、回答セット250内の列258内のテキストを処理することによって得られる。図4において、キーワードグループ410、キーワードグループ420、キーワードグループ430、キーワードグループ440、キーワードグループ460、およびキーワードグループ470は、クラスタリングによって決定される。各キーワードグループは、1つ以上のキーワードを含む。
【0062】
引き続き図3を参照する。ブロック330において、コンピューティングデバイス110は、グループ化の結果に基づいて、キーワードセットに対応するターゲット要素102を決定する。ターゲット要素102は、ターゲット対象の一態様を表す。同じキーワードセットは類似した意味を持つので、ターゲット対象の同じアスペクトを表す。このことから、キーワードセットは、1つのターゲット要素102に対応する。
【0063】
キーワードセットに対応するターゲット要素102の名前または識別は、キーワードセットに基づいて決定される。一例として、キーワードセットのいずれかを用いて、対応するターゲット要素を表す。別の例として、キーワードセットからなるクラスタの中心を決定し、その中心に最も近い意味的特徴を有するキーワードで対応するターゲット要素を表す。さらなる例として、ターゲット要素は、キーワードセットによって説明されるターゲット対象の態様(例えば、サービスまたはパフォーマンス)によって表される。
【0064】
図4の例では、キーワードグループ410に対応するターゲット要素は、「Tv service TV(テレビサービス)」である。キーワードグループ420に対応するターゲット要素は「boarding procedure(搭乗手続き)」である。キーワードグループ430に対応するターゲット要素は「luggage service(ラゲッジサービス)」である。キーワードグループ440に対応するターゲット要素は、「movie service(ムービーサービス)」である。キーワードグループ460に対応するターゲット要素は、「time delay(時間遅延)」である。キーワードグループ470に対応するターゲット要素は「legroom(レッグルーム)」である。
【0065】
いくつかの実施形態では、事前定義要素と同一または類似した1つまたは複数のキーワードセットを除去する。この場合、コンピューティングデバイス110は、除去されていないキーワードグループに対応するターゲット要素を決定する。例えば、キーワードセットごとに、コンピューティングデバイス110は、キーワードセットが意味的にターゲット対象の事前定義要素に類似しているか否かを判定する。キーワードセットが、意味的に定義された要素のいずれとも類似していない場合、キーワードセットに基づいてターゲット要素を決定する。キーワードセットが、意味的に事前定義要素と類似している場合、キーワードセットを削除する。
【0066】
一例として、列258内のテキストを処理することにより、キーワード「food(食べ物)」、「meal(食事)」、「drink(飲み物)」、「snack(スナック)」のセットを得る。キーワードセットは、図2の事前定義要素「food and beverage」と意味的に類似している。したがって、キーワードセットは、それに対応するターゲット要素を決定することなく除去される。
【0067】
上記のプロセス300により、オープンテキストコメントまたはコメントから、ターゲット対象の要素が抽出される。このようにして、このような非構造化テキストに含まれる情報を解析することは、ターゲット対象に影響を与える新たな要素を発見する。プロセス300が例示的であることを理解すべきである。本開示の実施形態では、任意の適切な方法を使用して、テキストから暗黙的要素を抽出する。
【0068】
<因果関係抽出>
図1を参照して説明したように、コンピューティングデバイス110は、ターゲット要素102に加えて、原因事象121と結果事象122を含む因果事象ペア120をテキストセット105から抽出する。さらに、コンピューティングデバイス110は、原因事象および結果事象を、要素セット130内の要素とマッチングさせて、2つの要素の間の因果関係を決定する。
【0069】
図5は、本開示のいくつかの実施形態による因果関係抽出のアーキテクチャ500の概略図を示す。図5に示すように、言語変換モジュール501は、テキスト101をターゲット言語のテキストに変換する。言語変換モジュール501は、任意の適切な方法で実装されてもよい。言語変換モジュール501は、例えば、アプリケーションプログラミングインターフェース(API)を翻訳することによって実現する。
【0070】
テキストセット105が異なる言語のテキストを含む場合、またはテキスト101がターゲット言語と異なる場合には、言語変換モジュール501を使用して、テキスト101を同じターゲット言語に変換する。いくつかの実施形態では、言語変換モジュール501は使用されなくてもよいことを理解されたい。例えば、テキスト101が全てターゲット言語である場合や、事象ペア抽出モジュール503が複数言語のテキストを扱う場合には、言語変換モジュール501を用いなくてもよい。
【0071】
ターゲット言語を有するテキスト101は、事象ペア抽出モジュール502に供給され得る。事象ペア抽出モジュール502は、テキスト101を解析することにより、原因事象511と結果事象512を含む因果事象ペア510を決定する。因果事象ペア510は、図1に示される因果事象ペア120の例であることが理解される。さらに、因果事象ペア510は1つしか示されていないが、事象ペア抽出モジュール502は、因果事象ペアを任意の数を抽出する。
【0072】
事象ペア抽出モジュール502は、因果事象ペア510を決定するために任意の適切な方法を使用する。例えば、規則テンプレートを使用して、テキスト101内の因果事象ペア510を抽出する。別の例として、因果事象ペア510は、シーケンスマーキングタスクとしてモデル化されたモデルを使用して抽出する。この例では、テキスト101は単語または文字のシーケンスとして表現され、同じ長さのラベルのシーケンスがモデルによって出力され、そのラベルのシーケンスによって、原因事象および結果事象のテキスト内での位置が識別される。このようなモデルはエンドツーエンドで訓練される。
【0073】
いくつかの実施形態では、事象ペア抽出モジュール502は、自己訓練自然言語処理(NLP)モデルに従って、テキストセット105内のテキスト101に基づいて因果事象ペア510を決定する。NLPモデルは、自然言語のテキストから因果事象ペアを抽出するように構成される。このNLPモデルは、少量のタグ付きデータ上と大量のタグなしデータ上で同時に訓練される。このNLPモデルの訓練は大量のタグ付きデータに依存せず、タグなしデータからの情報を十分に利用してモデルの性能を向上させる。
【0074】
一例として、NLPモデルは、言語特徴付けモデル、条件付き空港モデル、および雑音適応(adaptation)レイヤを含む。言語特徴付けモデルは、テキスト101のワードベクトルを生成するために使用され、任意の適切なネットワーク構造で実施する。例えば、この言語特徴付けモデルは、変換器からの双方向エンコーダ表現(Bidirectional Encoder Representations from Transformers、BERT)モデルであってもよい。条件は、空港モデルとともに、ラベル付けされていないデータのラベル付けに使用さ雑音適応層は、各単語のワードベクトルからその単語の雑音行列を生成するために使用される。
【0075】
テンプレートマッチングやシーケンスマーキングのタスクモデルと比較して、自己訓練のNLPモデルは高い精度と高い汎化能力を持っている。このようなモデルを因果事象ペア抽出に用いることにより、因果事象ペアをより正確かつ網羅的に抽出する。
【0076】
要素整合モジュール503は、因果事象ペア510に基づいて、要素521と要素522との因果関係520を決定する。図5の例では、因果関係520は、要素521が要素522に影響する。要素521および要素522のうちの少なくとも1つは、ターゲット要素102である。要素整合モジュール503が、原因事象511が要素521に関与し、結果事象512が要素522に関与していると判定した場合、因果関係520は、要素521が要素522に影響を与えていると判定する。
【0077】
いくつかの実施形態では、事象要素に関係するか否かは、正確なマッチングによって決定されてもよい。ある事象を表すテキストに、ある要素を表す単語が含まれていれば、その事象がその要素に関連していると判断する。例えば、要素整合モジュール503は、原因事象511を表すテキストが要素521を表す単語を含む場合、原因事象511が要素521に関連していると判定する。結果事象512を表すテキストが要素522を表す言葉を含む場合、要素整合モジュール503は、結果事象512が要素522を含むと判定する。
【0078】
事象を表すテキストは、テキストセット105から取得する。例えば、事象ペア抽出モジュール502は、事象ペア抽出を実行する際に因果事象ペアを表すテキストを決定し、そこから原因事象を表すテキストと結果事象を表すテキストを決定する。要素を表す言葉は、要素の名称または名称の一部であってもよく、例えば、ターゲット要素「leg room」の場合、要素を表す言葉は、leg roomまたはlegであってもよい。
【0079】
代替的に又は追加的に、要素を表す言葉は、その要素に意味的に近い語であってもよい。ターゲット要素102の場合、ターゲット要素102を表す言葉は、プロセス300においてターゲット要素を決定するために使用されるキーワードグループ内のキーワードとする。例えば、ターゲット要素「luggage service」の場合、その要素を表す言葉は、キーワードグループ430内のワード「bag」、「luggage」、「baggage」、および「hand luggage」であってもよい。事前定義要素103または関心要素104の場合、その要素に意味的に近い単語は、任意の適切な方法で決定される。本開示の実施形態は、この点において限定されない。
【0080】
代替的にまたは追加的に、いくつかの実施形態では、ファジィマッチングの方法を使用して、事象要素に関係するか否かを判定する。ある事象を表すテキストと、ある要素を表す単語とが意味的に一致する場合、その事象が要素に関連していると判断する。例えば、要素整合モジュール503は、原因事象511を表すテキストが要素521を表す意味と一致する場合、要素整合モジュール503は、原因事象511が要素521に関連していると判定する。結果事象512を表すテキストが、要素522を表す意味と一致する場合、要素整合モジュール503は、結果事象512が要素522に関係していると判定する。
【0081】
要素整合モジュール503は、任意の適切なファジィマッチング方法を使用する。例えば、事象を表すテキストと、要素を表す単語と、符号化のために言語特徴付けモデル(例えば、BERT)に入力して、事象の埋め込みベクトルと要素の埋め込みベクトルを生成する。2つの埋め込みベクトルの差が閾値差より小さい場合、事象を表すテキストがその要素を表す意味と一致すると判定する。したがって、事象がその要素に関与していると判断する。また、ジャカード類似度は、事象を表すテキストと要素を表す言葉と意味的に一致するかどうかを決定するために利用される。
【0082】
上記では、要素整合モジュール503の動作例について説明した。本開示の一実施形態による事象ペア抽出が要素と一致することをより明確に理解するために、いくつかの例を以下に説明する。図6は、本開示のいくつかの実施形態による因果関係セット160の例を示す。
【0083】
概して、因果関係セット160は、図2を参照して説明した、関心要素「Overall satisfaction」、事前定義要素「Value for money」、事前定義要素「Entertainment」、事前定義要素「Seat comfort」、事前定義要素「Cabin service」、事前定義要素「Food beverage」、事前定義要素「Ground service」に関する。上述したように、それぞれの事前定義要素と関心要素「Overall satisfaction」との因果関係601、602、603、604、605、および606は、任意の適切な因果関係モデルを用いて得られる。
【0084】
因果関係セット160は、図4を参照して説明したように、抽出されたターゲット要素「Movie service」、「Leg room」、「Time delay」、「Boarding service」、「Luggage service」にも関する。因果時間抽出と要素マッチングにより、これらのターゲット要素に関する因果関係611、612、613、614、615を決定する。
【0085】
一例として、テキストセット105内のテキスト「Extra luggage weight leads to that we are unable to check in together(追加の荷物重量オーバーのせいで一緒にチェックインできない)」を分析することにより、原因事象「extra luggage weight(追加の荷物重量)」と結果事象「unable to check in together(一緒にチェックインできない)」を含む因果事象ペアを特定する。原因事象「extra luggage weight」がターゲット要素「Luggage service」に一致し、結果事象「unable to check in together」はターゲット要素「Boarding service」にマッチする。したがって、ターゲット要素「Luggage service」がターゲット要素「Boarding service」に影響を与える因果関係615を決定する。
【0086】
別の例として、テキストセット105内のテキスト「The 3-3-3 seats and plenty of leg room make the seats quite spacious(3-3-3の座席と足元の余裕のおかげで座席がすごく広い)」を解析することにより、原因事象「plenty of leg room(足元の余裕)」と結果事象「the seats quite spacious(座席がすごく広い)」を含む因果事象ペアを特定する。原因事象「plenty of leg room」がターゲット要素「Leg room」と一致し、結果事象「theシーツquite spaciousは、事前定義要素「Seat comfort」に一致する。したがって、ターゲット要素「Leg room」が事前定義要素「Seat comfort」に影響を与える因果関係612を決定する。
【0087】
同様に、テキストセット105内のテキスト「Chaotic boarding process causes a delay(登録プロセスの混乱による遅延)」を分析することにより、ターゲット要素「Boarding service」がターゲット要素「Time delay」に影響を与える因果関係614を決定する。テキストセット105内のテキスト「Delay makes me unsatisfied with the flight(遅延は私をフライトに満足させない)」を分析することにより、ターゲット要素「Time delay」が関心要素「Overall satisfaction」に影響を与える因果関係613を決定する。
【0088】
テキストセット105内のテキストに応じて、場合によっては、1つの因果事象ペアに基づいて複数の因果関係を決定する。因果事象ペアの原因事象または結果事象が2つ以上の要素に関与する場合、複数の因果関係は、因果事象ペアに基づいて決定される。例えば、テキストセット105内のテキスト「Newly released tv shows and movies improved entertainment(新たに発表されたテレビショーや映画が娯楽を向上させた)」を分析することにより、原因事象「Newly released tv shows and movies(新たに発表されたテレビショーや映画)」や結果事象「entertainment(娯楽)」を特定する。原因事象には、ターゲット要素である「Movie service」と「TV service」の2つの要素が関与しているため、2つの因果関係を特定する。具体的には、ターゲット要素「Movie service」が事前定義要素「Entertainment」に影響を与える因果関係611と、ターゲット要素「TV service」が事前定義要素「Entertainment」に影響を与える因果関係616を決定する。
【0089】
図6に示された因果関係セット160は、本開示の範囲を限定することを意図しない例示的なものにすぎない。因果関係セット160は、任意の数の要素を含む。いくつかの実施形態では、因果関係160は、事前定義要素および関心要素に関係することなく、ターゲット要素のみに関係する。また、図6を参照して説明した上記の例では、因果事象ペアは、1つのセンテンスに基づいて決定されるが、これは例示的なものに過ぎない。複数の異なるセンテンスから同一の因果事象ペアを抽出する。
【0090】
以上、因果事象ペア抽出と要素整合の例について説明した。本開示の実施形態では、テキストから暗黙的要素がマイニングされ、テキストから因果事象ペアが抽出され、ターゲット要素に一致する因果事象ペアに基づいて、ターゲット要素に関連する因果関係を決定する。一方、このようにしてターゲット対象に関する因果関係を掘り起こし、補完した。一方、暗黙的な要素と因果事象ペアは、ターゲット対象に関するテキストから生成されるため、より正確な因果関係が得られる。
【0091】
引き続き図5を参照する。いくつかの実施形態では、コンピューティングデバイス110は、因果関係520の因果強度531を決定することもできる。因果強度531は、要素521が要素522に与える影響の程度を示す。因果関係520の因果強度531は、因果関係520と一致する参照センテンスの数に基づいて決定する。
【0092】
因果関係520に合致する参照センテンスは、因果関係520を意味的に表現するセンテンスであってもよい。例えば、参照センテンスは、対応する因果事象ペア510が抽出されたセンテンスを含む。例えば、図6に示す因果関係611の場合、参照センテンスは、「Newly released tv shows and movies improved entertainment」を含む。因果関係612について、参照センテンスは、「The 3-3-3 seats and plenty of leg room make the seats quite spacious」を含む。
【0093】
いくつかの実施形態では、コンピューティングデバイス110は、因果関係520を反映するターゲットセンテンス532を決定することもできる。コンピューティングデバイス110はさらに、因果関係520に合致する少なくとも1つの参照センテンスに基づいてターゲットセンテンス532を決定する。いくつかの実施形態では、参照センテンスのうちの1つまたは複数のセンテンスをターゲットセンテンス532として選択する。例えば、「Chaotic boarding process causes a delay」というセンテンスを因果関係614のターゲットセンテンスとして使用する。代替的にまたは追加的に、適切な自然言語処理方法を用いて、参照センテンスをターゲットセンテンス532に融合する。
【0094】
因果関係を個別に示すのは、直感的でわかりやすいものではないターゲットセンテンスを用いて因果関係を解釈することができ、要素521が要素522にどのように影響を与えるかを直感的に感じる。ターゲットセンテンスは因果関係の証拠にもなる。これにより、要素を調整してターゲット対象を改善する。
【0095】
いくつかの実施形態では、コンピューティングデバイス110は、事前定義要素103と関心要素104との因果関係を反映するターゲットセンテンスを決定する。この因果関係に合致する参照センテンスをテキストセット105のテキストから決定し、参照センテンスに基づいてターゲットセンテンスを決定する。たとえば、1つ以上の参照センテンスをターゲットセンテンスとして指定し、複数の参照センテンスを結合してターゲットセンテンスにする。
【0096】
一例として、事前定義要素103と関心要素104の両方を含むセンテンスをテキストセット105から抽出する。センテンス中の因果トリガ語(例えば、理由で、原因、だからなど)が、事前定義要素103が原因事象に関与し、関心要素104が結果事象に関与していることを示している場合、センテンスを参照センテンスと判定する。図6に示されるように、事前定義要素「Seat comfort」と関心要素「Overall satisfaction」との因果関係603について、ターゲットセンテンスの一例は、「Comfortable seating and the latest entertainment make this flight one of the highlights of our trip」である。
【0097】
因果関係の判定と同様に、複数の因果関係を反映したセンテンス言が存在する可能性がある。たとえば、「Comfortable seating and the latest entertainment make this flight one of the highlights of our trip」というセンテンスの原因事象には、2つの要素がある。これにより、因果関係602のターゲットセンテンスとしても、因果関係603のターゲットセンテンスとしても機能する。
【0098】
事前定義要素103と関心要素104との因果関係を個別に提示することは、直感的で分かりやすいものではない可能性がある。このようにして、事前定義要素103と関心要素104との因果関係を説明する。
【0099】
図5に示されたアーキテクチャにおける様々なモジュールは、本開示の範囲を制限することを意図せずに例示的なものにすぎないことを理解されたい。図5を参照して説明された動作および機能は、同じモジュールまたはモデルによって実装されてもよい。
【0100】
また、別個に記載されるが、ターゲット要素の決定と因果関係の抽出を同一のモジュールまたはモデルで実現する。このようなモジュールまたはモデルは、テキストセットに基づいて、ターゲット要素およびターゲット要素に関連する因果関係を決定するように構成される。言い換えれば、このようなモジュールまたはモデルに自然言語のテキストセットを入力して、ターゲット要素と、ターゲット要素に関連する因果関係を含む因果関係セットを得る。
【0101】
<因果関係セットの提示>
因果関係セット160は、コンピューティングデバイス110または他の適切なディスプレイデバイスにおいて提示されてもよい。そのために、要素521を表す要素と要素522を表す要素と関連付けて提示する。いくつかの実施形態では、因果関係セット160内の因果関係は表で提示されてもよい。たとえば、表内の2つの関連するセルは、それぞれ要素521と要素522を表す。
【0102】
いくつかの実施形態では、因果関係セット160内の因果関係は、画像の形で提示されてもよい。図7は、本開示のいくつかの実施形態による因果関係を表す画像700の例を示す。画像700は、図6の因果関係セット160を表すために使用される。
【0103】
画像700中の各ノードは、因果関係集合の各要素をそれぞれ表す。例えば、ノード701は、関心要素「Overall satisfaction」を表し、ノード702は、事前定義要素「Sear comfort」を表し、ノード703は、ターゲット要素「Leg room」を表す。2つのノードを結ぶ方向を持つエッジは、対応する要素間の因果関係を表す。例えば、ノード702からノード701に向けられたエッジ711は、事前定義要素「Sear comfort」が、関心要素「Overall satisfaction」に影響を与えることを示す。別の例として、ノード703からノード702に向けられたエッジ712は、ターゲット要素「Leg room」が、事前定義要素「Sear comfort」に影響を与えることを示す。
【0104】
いくつかの実施形態では、エッジの目立つ程度(例えば、色、太さなど)は、対応する因果関係の強さに関係する。例えば、エッジ713はエッジ714より太く、これは、ターゲット要素「Boarding service」とターゲット要素「Time delay」との因果関係が、ターゲット要素「Luggage service」とターゲット要素「Boarding service」との因果関係より強いことを意味する。別の例として、エッジ712はエッジ713より太く、これは、ターゲット要素「Leg room」と事前定義要素「Sear comfort」との因果関係が、ターゲット要素「Boarding service」とターゲット要素「Time delay」との因果関係より強いことを意味する。このような実施形態では、因果関係の強さを視覚的に示す。
【0105】
いくつかの実施形態では、対応する因果関係を反映するターゲットセンテンスが、画像700中のエッジに関連して表示されてもよい。図7には、テキストボックス720-1、720-2、720-3、720-4、720-5、および720-6が示されており、これらは、単独でまたは総称してテキストボックス720とも呼ばれる。ターゲット要素に関する因果関係を反映したターゲットセンテンスをテキストボックス720に提示する。例えば、「Boarding service」と「Time delay」との因果関係を反映した「Chaotic boarding process causes a delay」のようなターゲットセンテンスをテキストボックス720-1に提示する。別の例として、「Newly released tv shows and movies improved entertainment」は、テキストボックス720-5およびテキストボックス720-6に表示される。別の例として、「The 3-3-3 seats and plenty of leg room make the seats quite spacious」のように、ターゲット要素「Leg room」と事前定義要素「Seat comfort」との因果関係を反映するターゲット要素をテキストボックス720-4に提示する。
【0106】
事前定義要素と関心要素との因果関係について、その因果関係を反映したターゲットセンテンスがテキストセット105内に存在する場合には、そのようなターゲットセンテンスを提示する。図7には、テキストボックス730-1およびテキストボックス730-2も示されており、これらは、単独または総称してテキストボックス730とも呼ばれる。たとえば、テキストボックス730-1とテキストボックス730-2に「Comfortable seating and the latest entertainment make this flight one of the highlights of our trip」というセンテンスを表現できる。
【0107】
テキストボックス720のレンダリングは動的であってもよい。例えば、テキストボックス720は、エッジ713へのクリックまたは選択の検出に回答して提示される。このような実施形態では、ターゲットセンテンスを表示することにより、ターゲット対象に関心を持つユーザーに関連する因果関係を直感的に理解させる。これにより、ユーザーが改善対象とする施策を特定するのに役立つ。
【0108】
<例示プロセス>
図8は、本開示のいくつかの実施形態による情報処理のプロセス800のフローチャートである。プロセス800は、コンピューティングデバイス110において実施する。説明を容易にするために、プロセス800は、図1を参照して説明する。
【0109】
ブロック810において、コンピューティングデバイス110は、ターゲット対象に関する非構造化テキスト105のセットに基づいて、ターゲット対象の1グループのターゲット要素102を決定し、各ターゲット要素102は、ターゲット対象の一態様を表す。ブロック810において、コンピューティングデバイス110は、任意の適切な方法を使用してターゲット要素102を決定する。例えば、コンピューティングデバイス110は、上述したプロセス300を実行して、テキストセット105からターゲット要素102を抽出する。
【0110】
ブロック820において、コンピューティングデバイス110は、テキストセット105内のテキストを分析することによって、原因事象および結果事象を含む因果事象ペアを決定する。いくつかの実施形態では、コンピューティングデバイス110は、テキストセット101内のテキストに基づいて、自己訓練された自然言語処理モデルに従って因果事象ペアを決定する。
【0111】
ブロック830において、コンピューティングデバイス110は、因果事象ペアに基づいて、1グループのターゲット要素のうちの第1要素とターゲット対象の第2要素との第1因果関係を決定する。第1要素は、いずれかのターゲット要素であってもよく、第2要素は、他のターゲット要素、ターゲット対象の事前定義要素、または関心要素の少なくとも1つであってもよい。
【0112】
いくつかの実施形態では、テキストセット105は、ターゲット対象に対する情報収集シート150内のオープン質問に対する回答から得られ、情報収集シート150は、事前定義要素に対するクローズド質問を含む。
【0113】
いくつかの実施形態では、原因事象が第1要素に関連し、結果事象が第2要素に関連すると判定された場合、第1因果関係は、第1要素が第2要素に影響を与えると判定する。あるいは、原因事象が第2要素に関連し、結果事象が第1要素関連に関連すると判定された場合、第1因果関係は、第2要素が第1要素に影響を与えるものと判定する。
【0114】
いくつかの実施形態では、原因事象または結果事象のうちの1つについて、事象を表すテキストが第1要素を表す単語を含むこと、事象を表すテキストが第1要素を表す単語と意味的に一致することの少なくとも1つの決定に基づいて、事象が第1要素を含むことを決定する。
【0115】
いくつかの実施形態では、プロセス800はさらに、追加のステップを含む。コンピューティングデバイス110は、テキストセット105のテキストから、因果事象ペアの関係に合致する少なくとも1つの参照センテンスを決定する、少なくとも1つの参照センテンスに基づいて、第1因果関係を反映するターゲットセンテンスを決定する。
【0116】
いくつかの実施形態では、コンピューティングデバイス110は、因果関係にある事象ペアに一致する少なくとも1つの参照センテンスをテキストセット105のテキストから決定する、そして、少なくとも1つの参照センテンスの数に基づいて、第1因果関係の因果強度を決定する。因果強度は、第1要素が第2要素に及ぼす影響の程度、または第2要素が第1要素に及ぼす影響の程度を示す。
【0117】
いくつかの実施形態では、コンピューティングデバイス110は、ターゲット対象の第2事前定義要素がターゲット対象の関心要素に影響を与えることを示す第2因果関係を決定する、テキストセットに基づいて、第2因果関係を反映する第2ターゲットセンテンスを決定する。
【0118】
いくつかの実施形態では、コンピューティングデバイス110は、第1要素を表す要素と第2要素を表す要素と関連付けて提示する。
【0119】
いくつかの実施形態では、第1要素の要素と第2要素を表す要素と関連付けて提示するために、コンピューティングデバイス110は、第1要素を表す第1ノードと第2要素を表す第2ノードを提示し、第1ノードと第2ノードと接続するエッジを提示する。
【0120】
いくつかの実施形態では、コンピューティングデバイス110は、エッジに関連して、第1因果関係を反映するターゲットセンテンスを提示する。
【0121】
いくつかの実施形態では、コンピューティングデバイス110は、エッジの目立つ程度が第1因果関係の因果強度に関連していてもよい。因果強度は、第1要素が第2要素に及ぼす影響の程度、または第2要素が第1要素に及ぼす影響の程度を示す。
【0122】
<サンプルデバイス>
図9は、本開示の1つまたは複数の実施形態が実施され得るコンピューティングデバイス900を示すブロック図である。図9に示されるコンピューティングデバイス900は単なる例示であり、本文に記載する実施形態の機能および範囲のいかなる制限も構成すべきではないことが理解されるべきである。図9に示すコンピューティングデバイス900は、図1のコンピューティングデバイス110を実装するために使用する。
【0123】
図9に示すように、コンピューティングデバイス900は、汎用コンピューティングデバイスの形態である。コンピューティングデバイス900の構成要素は、限定されるわけではないが、1つ以上のプロセッサまたは処理ユニット910、メモリー920、記憶デバイス930、1つ以上の通信ユニット940、1つ以上の入力デバイス950、および1つ以上の出力デバイス960を含む。処理ユニット910は、実際のプロセッサまたは仮想のプロセッサであってもよく、メモリー920に格納されたプログラムに従って様々な処理を実行する。マルチプロセッサシステムでは、コンピューティングデバイス900の並列処理能力を向上させるために、複数の処理ユニットが計算機実行可能命令を並列に実行する。
【0124】
コンピューティングデバイス900は、一般に、複数のコンピューターメモリーを含む。そのような媒体は、揮発性媒体および不揮発性媒体、取り外し可能媒体および取り外し不可能媒体を含むがこれらに限定されない、コンピューティングデバイス900がアクセス可能な任意のアクセス可能媒体とする。メモリー920は、揮発性メモリー(例えば、レジスタ、キャッシュ、ランダムアクセスメモリー(RAM))、不揮発性メモリー(例えば、読出し専用メモリー(ROM)、電気的消去可能プログラマブル読出し専用メモリー(EEPROM)、フラッシュメモリー)、またはこれらの何らかの組み合わせであってもよい。記憶デバイス930は、取り外し可能または取り外し不可能な媒体とすることができ、フラッシュドライブ、磁気ディスク、または、情報および/またはデータ(例えば、トレーニングのためのトレーニングデータ)を記憶するために使用することができ、コンピューティングデバイス900内でアクセスする任意の他の媒体のような機械読み取り可能メモリーを含む。
【0125】
コンピューティングデバイス900は、さらに、取り外し可能/非取り外し可能な揮発性/不揮発性メモリーを含む。図9には示されていないが、取り外し可能な不揮発性ディスク(例えば、「フロッピーディスク」)からの読み取りまたは書き込みのためのディスクドライブと、取り外し可能な不揮発性光ディスクからの読み取りまたは書き込みのための光ディスクドライブを備える。これらの場合、各ドライブは、1つまたは複数のデータ媒体インターフェースによってバス(図示せず)に接続されてもよい。メモリー920は、本開示の様々な実施形態の様々な方法または動作を実行するように構成された1つまたは複数のプログラムモジュールを有するコンピュータープログラム製品925を含む。
【0126】
通信ユニット940は、通信媒体を介した他のコンピューティングデバイスとの通信を実現する。さらに、コンピューティングデバイス900のコンポーネントの機能は、単一のコンピューティングクラスタまたは通信接続を介して通信可能な複数のコンピューターマシンで実装されてもよい。したがって、コンピューティングデバイス900は、1つまたは複数の他のサーバー、ネットワークパーソナルコンピューター(PC)、または別のネットワークノードとの論理接続を使用して、ネットワーク環境で動作する。
【0127】
入力デバイス950は、マウス、キーボード、トラックボールなどの1つまたは複数の入力デバイスとする。出力デバイス960は、ディスプレイ、スピーカ、プリンタなどの1つまたは複数の出力デバイスとする。コンピューティングデバイス900はまた、必要に応じて、通信ユニット940を介して、記憶デバイス、表示デバイスなどの1つ以上の外部デバイス(図示せず)と通信することができ、ユーザーがコンピューティングデバイス900と対話することを可能にする1つ以上のデバイスと通信することができ、またはコンピューティングデバイス900が1つ以上の他のコンピューティングデバイスと通信することを可能にする任意のデバイス(例えば、ネットワークカード、モデムなど)と通信する。このような通信は、入力/出力(I/O)インターフェース(図示せず)を介して実行する。
【0128】
本開示の例示的なインプリメンテーションによれば、上述した方法を実施するためにプロセッサによって実行されるコンピューター実行可能命令を格納するコンピューター読み取り可能メモリーを提供する。本開示の例示的なインプリメンテーションによれば、非過渡的なコンピューター読み取り可能メモリー上に有形的に格納され、上述した方法を実施するためにプロセッサによって実行されるコンピューター実行可能命令を含むコンピュータープログラム製品も提供される。
【0129】
本開示の様々な態様は、本開示に従って実現される方法、デバイス、設備、およびコンピュータープログラム製品のフローチャートおよび/またはブロック図を参照してここで説明する。フローチャートおよび/またはブロック図の各ブロック、ならびにフローチャートおよび/またはブロック図の各ブロックの組み合わせは、コンピューター読み取り可能なプログラム命令によって実装されてもよいことを理解されたい。
【0130】
これらのコンピューター読み取り可能プログラム命令は、汎用コンピューター、専用コンピューター、または他のプログラマブルデータ処理デバイスの処理ユニットに提供されて、これらの命令がコンピューターまたは他のプログラマブルデータ処理デバイスの処理ユニットを介して実行されるときに、フローチャートおよび/またはブロック図中の1つまたは複数のブロックに規定された機能/動作を実現する手段を生成するような機械を製造する。これらのコンピューター読み取り可能プログラム命令は、コンピューター、プログラマブルデータ処理デバイス、および/または他のデバイスを特定の方法で動作させるコンピューター読み取り可能メモリーに記憶することもでき、それにより、命令が記憶されたコンピューター読み取り可能メモリーは、フローチャートおよび/またはブロック図中の1つまたは複数のブロックに規定された機能/動作の様々な態様を実装する命令製造物品を含む。
【0131】
コンピューター読み取り可能プログラム命令は、コンピューター、他のプログラマブルデータ処理デバイス、または他のデバイスにロードされて、コンピューター、他のプログラマブルデータ処理デバイス、または他のデバイス上で実行される命令が、フローチャートおよび/またはブロック図中の1つまたは複数のブロックに規定された機能/動作を実施するように、コンピューター実装プロセスを生成するために、コンピューター、他のプログラマブルデータ処理デバイス、または他のデバイス上で実行される一連の動作ステップが実行されるように、コンピューター、他のプログラマブルデータ処理デバイス、または他のデバイス上で実行されるプロセスを生成する。
【0132】
フローチャートおよびブロック図は、本開示の複数の実施形態に従って、システム、方法、およびコンピュータープログラム製品の可能な実施形態のアーキテクチャ、機能、および動作を示している。この点で、フローチャートまたはブロック図中の各ブロックは、所定の論理機能を実装するための1つまたは複数の実行可能命令を含むモジュール、プログラムセグメントまたは命令の一部を表す。代替としてのいくつかの実装では、ブロックに示された機能は、図に示されたものとは異なる順序で発生することもある。例えば、2つの連続したブロックは、実際には実質的に並列に実行されてもよく、関係する機能に応じて逆の順序で実行されてもよい場合がある。ブロック図および/またはフローチャート中の各ブロック、および/またはブロック図および/またはフローチャート中のブロックの組み合わせは、所定の機能または動作を実行する専用ハードウェアベースのシステムで実装されてもよく、または専用ハードウェアとコンピューター命令との組み合わせで実装されてもよい。
【0133】
以上、本開示の実施形態について説明したが、上記の説明は例示的なものであり、網羅的なものではなく、開示された実施形態に限定されるものでもない。説明された各実施形態の範囲および精神から逸脱することなく、多くの修正および変更は当業者にとって自明である。本文で使用される用語の選択は、本文で開示された各実施形態を、本文で開示された各実施形態の原理、実際の適用、または市場における技術の改良を最もよく説明するか、または当技術分野の他の通常の技術者が理解できるようにすることを意図している。
図1
図2
図3
図4
図5
図6
図7
図8
図9
【外国語明細書】