(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024030229
(43)【公開日】2024-03-07
(54)【発明の名称】情報処理装置、プログラム、及び情報処理方法
(51)【国際特許分類】
G06F 16/35 20190101AFI20240229BHJP
G06F 40/216 20200101ALI20240229BHJP
【FI】
G06F16/35
G06F40/216
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022132932
(22)【出願日】2022-08-24
(71)【出願人】
【識別番号】501440684
【氏名又は名称】ソフトバンク株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】西田 昌市
【テーマコード(参考)】
5B091
5B175
【Fターム(参考)】
5B091AA15
5B091AB17
5B091CA01
5B091CC01
5B091CC05
5B175DA01
5B175FA03
(57)【要約】 (修正有)
【課題】顧客対応ログ分類の分析を支援する情報処理装置及び方法を提供する。
【解決手段】情報処理装置100は、複数の分類カテゴリ毎に、キーワードと分類重み付けとの対応付けが複数登録された分類データを記憶する分類データ記憶部、キーワードと重要性重み付けとの対応付けが複数登録された重要性データを記憶する重要性データ記憶部、テキストデータについて、スライディングウィンドウに含まれるキーワードに対応する分類重み付けと重要性重み付けに基づいてウィンドウ分類スコア及びウィンドウ重要性スコアを算出するウィンドウスコア算出部並びにテキストデータについて、ウィンドウスコア算出部がスライディングウィンドウをずらしながら算出した複数のウィンドウ分類スコアのうち最も高いウィンドウ分類スコア及びウィンドウ重要性スコアをテキストデータのテキスト分類スコア及びテキスト重要性スコアとして特定するテキストスコア特定部を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
複数の分類カテゴリ毎に、キーワードと前記キーワードと前記分類カテゴリとの関連度を示す分類重み付けとの対応付けが複数登録された分類データを記憶する分類データ記憶部と、
キーワードと前記キーワードの重要性を示す重要性重み付けとの対応付けが複数登録された重要性データを記憶する重要性データ記憶部と、
テキストデータを取得するテキストデータ取得部と、
前記テキストデータ取得部が取得した前記テキストデータについて、予め定められたトークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付け及び前記重要性重み付けに基づいて前記スライディングウィンドウのウィンドウ分類スコア及びウィンドウ重要性スコアを算出するウィンドウスコア算出部と、
前記テキストデータについて、前記ウィンドウスコア算出部が前記スライディングウィンドウをずらしながら算出した複数の前記ウィンドウ分類スコアのうち最も高い前記ウィンドウ分類スコア及び複数の前記ウィンドウ重要性スコアのうち最も高い前記ウィンドウ重要性スコアを前記テキストデータのテキスト分類スコア及びテキスト重要性スコアとして特定するテキストスコア特定部と
を備える情報処理装置。
【請求項2】
前記ウィンドウスコア算出部は、前記スライディングウィンドウに含まれるキーワードに対応する前記分類重み付けを加算することに基づいて前記ウィンドウ分類スコアを算出し、前記スライディングウィンドウに含まれるキーワードに対応する前記重要性重み付けを加算することに基づいて前記ウィンドウ重要性スコアを算出する、請求項1に記載の情報処理装置。
【請求項3】
前記分類データは、複数のキーワードの共起に対して前記分類重み付けを対応付け可能に構成されており、
前記ウィンドウスコア算出部は、前記スライディングウィンドウに前記共起が含まれる場合に、前記共起に対応する分類重み付けを加算する、請求項2に記載の情報処理装置。
【請求項4】
前記重要性データは、複数のキーワードの共起に対して前重要性重み付けを対応付け可能に構成されており、
前記ウィンドウスコア算出部は、前記スライディングウィンドウに前記共起が含まれる場合に、前記共起に対応する重要性重み付けを加算する、請求項2に記載の情報処理装置。
【請求項5】
前記分類データは、前記キーワードに対してプラスの分類重み付け及びマイナスの分類重み付けのいずれも対応付け可能に構成されている、請求項2に記載の情報処理装置。
【請求項6】
前記重要性データは、前記キーワードに対してプラスの重要性重み付け及びマイナスの重要性重み付けのいずれも対応付け可能に構成されている、請求項2に記載の情報処理装置。
【請求項7】
前記テキストスコア特定部によって特定された前記テキスト重要性スコアが予め定められた閾値より高い前記テキストデータをインシデントに関連するテキストデータとして特定するテキストデータ特定部
を更に備える、請求項1に記載の情報処理装置。
【請求項8】
前記テキストデータの重要性を打ち消す打ち消しワードが登録された打ち消しデータを記憶する打ち消しデータ記憶部
を更に備え、
前記テキストデータ特定部は、前記テキスト重要性スコアが前記予め定められた閾値より高い前記テキストデータのうち、前記打ち消しキーワードを含まない前記テキストデータを特定する、請求項7に記載の情報処理装置。
【請求項9】
前記打ち消しデータは、複数のキーワードの共起を登録可能に構成されている、請求項8に記載の情報処理装置。
【請求項10】
前記ウィンドウスコア算出部は、ウィンドウ分類スコアに対して設定されたウィンドウ分類トークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付けに基づいて前記ウィンドウ分類スコアを算出し、前記ウィンドウ分類トークン数とは異なる、ウィンドウ重要性スコアに対して設定されたウィンドウ重要性トークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付けに基づいて前記ウィンドウ重要性スコアを算出する、請求項1に記載の情報処理装置。
【請求項11】
コンピュータを、請求項1から10のいずれか一項に記載の情報処理装置として機能させるためのプログラム。
【請求項12】
コンピュータによって実行される情報処理方法であって、
複数の分類カテゴリ毎に、キーワードと前記キーワードと前記分類カテゴリとの関連度を示す分類重み付けとの対応付けが複数登録された分類データを記憶する分類データ記憶段階と、
キーワードと前記キーワードの重要性を示す重要性重み付けとの対応付けが複数登録された重要性データを記憶する重要性データ記憶段階と、
テキストデータを取得するテキストデータ取得段階と、
前記テキストデータ取得段階において取得した前記テキストデータについて、予め定められたトークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付け及び前記重要性重み付けに基づいて前記スライディングウィンドウのウィンドウ分類スコア及びウィンドウ重要性スコアを算出するウィンドウスコア算出段階と、
前記テキストデータについて、前記スライディングウィンドウをずらしながら算出した複数の前記ウィンドウ分類スコアのうち最も高い前記ウィンドウ分類スコア及び複数の前記ウィンドウ重要性スコアのうち最も高い前記ウィンドウ重要性スコアを前記テキストデータのテキスト分類スコア及びテキスト重要性スコアとして特定するテキストスコア特定段階と
を備える情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、プログラム、及び情報処理方法に関する。
【背景技術】
【0002】
特許文献1には、電話によるカスタマーサポート業務等において、お客からの質問等に対して迅速かつ適切な対応を実現するのに好適なテキスト分類技術について記載されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2018-206238号公報
【発明の概要】
【課題を解決するための手段】
【0003】
本発明の一実施態様によれば、情報処理装置が提供される。前記情報処理装置は、複数の分類カテゴリ毎に、キーワードと前記キーワードと前記分類カテゴリとの関連度を示す分類重み付けとの対応付けが複数登録された分類データを記憶する分類データ記憶部を備えてよい。前記情報処理装置は、キーワードと前記キーワードの重要性を示す重要性重み付けとの対応付けが複数登録された重要性データを記憶する重要性データ記憶部を備えてよい。前記情報処理装置は、テキストデータを取得するテキストデータ取得部を備えてよい。前記情報処理装置は、前記テキストデータ取得部が取得した前記テキストデータについて、予め定められたトークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付け及び前記重要性重み付けに基づいて前記スライディングウィンドウのウィンドウ分類スコア及びウィンドウ重要性スコアを算出するウィンドウスコア算出部を備えてよい。前記情報処理装置は、前記テキストデータについて、前記ウィンドウスコア算出部が前記スライディングウィンドウをずらしながら算出した複数の前記ウィンドウ分類スコアのうち最も高い前記ウィンドウ分類スコア及び複数の前記ウィンドウ重要性スコアのうち最も高い前記ウィンドウ重要性スコアを前記テキストデータのテキスト分類スコア及びテキスト重要性スコアとして特定するテキストスコア特定部を備えてよい。
【0004】
前記情報処理装置において、前記ウィンドウスコア算出部は、前記スライディングウィンドウに含まれるキーワードに対応する前記分類重み付けを加算することに基づいて前記ウィンドウ分類スコアを算出し、前記スライディングウィンドウに含まれるキーワードに対応する前記重要性重み付けを加算することに基づいて前記ウィンドウ重要性スコアを算出してよい。前記分類データは、複数のキーワードの共起に対して前記分類重み付けを対応付け可能に構成されていてよく、前記ウィンドウスコア算出部は、前記スライディングウィンドウに前記共起が含まれる場合に、前記共起に対応する分類重み付けを加算してよい。
【0005】
前記いずれかの情報処理装置において、前記重要性データは、複数のキーワードの共起に対して前重要性重み付けを対応付け可能に構成されていてよく、前記ウィンドウスコア算出部は、前記スライディングウィンドウに前記共起が含まれる場合に、前記共起に対応する重要性重み付けを加算してよい。
【0006】
前記いずれかの情報処理装置において、前記分類データは、前記キーワードに対してプラスの分類重み付け及びマイナスの分類重み付けのいずれも対応付け可能に構成されていてよい。
【0007】
前記いずれかの情報処理装置において、前記重要性データは、前記キーワードに対してプラスの重要性重み付け及びマイナスの重要性重み付けのいずれも対応付け可能に構成されていてよい。
【0008】
前記いずれかの情報処理装置は、前記テキストスコア特定部によって特定された前記テキスト重要性スコアが予め定められた閾値より高い前記テキストデータをインシデントに関連するテキストデータとして特定するテキストデータ特定部を更に備えてよい。前記情報処理装置は、前記テキストデータの重要性を打ち消す打ち消しワードが登録された打ち消しデータを記憶する打ち消しデータ記憶部を更に備えてよく、前記テキストデータ特定部は、前記テキスト重要性スコアが前記予め定められた閾値より高い前記テキストデータのうち、前記打ち消しキーワードを含まない前記テキストデータを特定してよい。前記打ち消しデータは、複数のキーワードの共起を登録可能に構成されていてよい。
【0009】
前記いずれかの情報処理装置において、前記ウィンドウスコア算出部は、ウィンドウ分類スコアに対して設定されたウィンドウ分類トークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付けに基づいて前記ウィンドウ分類スコアを算出し、前記ウィンドウ分類トークン数とは異なる、ウィンドウ重要性スコアに対して設定されたウィンドウ重要性トークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付けに基づいて前記ウィンドウ重要性スコアを算出してよい。
【0010】
本発明の一実施態様によれば、コンピュータを、前記情報処理装置として機能させるためのプログラムが提供される。
【0011】
本発明の一実施態様によれば、コンピュータによって実行される情報処理方法が提供される。前記情報処理方法は、複数の分類カテゴリ毎に、キーワードと前記キーワードと前記分類カテゴリとの関連度を示す分類重み付けとの対応付けが複数登録された分類データを記憶する分類データ記憶段階を備えてよい。前記情報処理方法は、キーワードと前記キーワードの重要性を示す重要性重み付けとの対応付けが複数登録された重要性データを記憶する重要性データ記憶段階を備えてよい。前記情報処理方法は、テキストデータを取得するテキストデータ取得段階を備えてよい。前記情報処理方法は、前記テキストデータ取得段階において取得した前記テキストデータについて、予め定められたトークン数に対応するスライディングウィンドウに含まれるキーワードに対応する前記分類重み付け及び前記重要性重み付けに基づいて前記スライディングウィンドウのウィンドウ分類スコア及びウィンドウ重要性スコアを算出するウィンドウスコア算出段階を備えてよい。前記情報処理方法は、前記テキストデータについて、前記スライディングウィンドウをずらしながら算出した複数の前記ウィンドウ分類スコアのうち最も高い前記ウィンドウ分類スコア及び複数の前記ウィンドウ重要性スコアのうち最も高い前記ウィンドウ重要性スコアを前記テキストデータのテキスト分類スコア及びテキスト重要性スコアとして特定するテキストスコア特定段階を備えてよい。
【0012】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0013】
【
図2】スライディングウィンドウについて説明するための説明図である。
【
図3】情報処理装置100の機能構成の一例を概略的に示す。
【
図4】情報処理装置100による処理の流れの一例を概略的に示す。
【
図5】情報処理装置100による処理の流れの一例を概略的に示す。
【
図6】情報処理装置100として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。
【発明を実施するための形態】
【0014】
カスタマーサポート等では、膨大な数の顧客対応が行われており、膨大な数の顧客対応ログが生成されている。顧客対応ログを分析することは、業務内容や顧客対応を改善する上で非常に重要となる。しかし、膨大な数の顧客対応ログに対して、どのようなカテゴリに分類されるかという分類の分析や、マネージメントが管理すべきインシデントや、ビジネスインパクトの大きいインシデントを把握する重要性の分析を、人手で行うのは、マンパワーの問題や、正確性の問題などによって、困難性が高い。それに対して、本実施形態に係る情報処理装置100は、分類の分析及び重要性の分析を支援する。
【0015】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0016】
図1は、情報処理装置100の一例を概略的に示す。情報処理装置100は、例えば、複数のドキュメント210の入力を受け付けて、複数のドキュメント210を分析した結果である複数の分析結果310を出力する。
【0017】
ドキュメント210は、例えば、インシデントを発見する対象となるものであれば、どのようなものであってもよい。ドキュメント210は、例えば、顧客対応ログであってよい。例えば、ドキュメント210は、顧客との間の入電会話ログであったり、チャット等のメッセージログであったりしてよい。また、例えば、ドキュメント210は、一企業における社員からのメッセージであったり、パートナー企業からのメッセージであったりしてよい。ドキュメント210は、自然文であり、長文の場合もあれば、短文の場合もある。ドキュメント210は、テキストデータの一例であってよい。本実施形態では、ドキュメント210が顧客対応ログである場合を主に例に挙げて説明する。
【0018】
情報処理装置100は、分析エンジン102及び辞書104を有してよい。分析エンジン102は、辞書104を用いてドキュメント210を分析して、ドキュメント210の分類カテゴリ、ドキュメント210がその分類カテゴリである尤度を示す分類スコア、及びドキュメント210の重要性の高さを示す重要性スコアを含む分析結果310を出力する。
【0019】
辞書104は、分類辞書、重要性辞書、及びシノニムを含んでよい。分類辞書には、複数の分類カテゴリ毎に、キーワードと、キーワードと分類カテゴリとの関連度を示す分類重み付けとの対応付けが複数登録される。重要性辞書には、キーワードと、キーワードの重要性を示す重要性重み付けとの対応付けが複数登録される。分類辞書は、分類データの一例であってよい。重要性辞書は、重要性データの一例であってよい。
【0020】
シノニムは、同義語や表記の揺れ等、キーワードでマッチするために、同じワードとして認識すべき語群を1つのグループとして扱う辞書機能であってよい。シノニムによって、同義語を一元管理することができる。具体例として、「誤り」、「間違え」、「過誤」がシノニムとして登録される。
【0021】
分析エンジン102は、対象となるドキュメント210について、スライディングウィンドウを用いて、ドキュメント210の分類カテゴリ、ドキュメント210の分類スコア、及びドキュメント210の重要性スコアを算出する。
【0022】
スライディングウィンドウとは、自然言語処理を用いてテキストを分析するための技術である。ドキュメント全体をウィンドウに分割し、各ウィンドウを1トークンずつスライドさせながら、スコア計算を行う。ここで、1トークンは、1形態素に相当する。
【0023】
分析エンジン102は、例えば、対象となるドキュメント210に対して形態素解析を行って、ドキュメント210をトークン化する。分析エンジン102は、スライディングウィンドウを1トークンずつずらしながら、キーワードとマッチングさせる。分析エンジン102は、キーワードとマッチした場合に、そのキーワードの重み付けの合計を元に、スコアを算出する。
【0024】
例えば、分析エンジン102は、対象となるドキュメント210について、ドキュメント210の開始位置に配置したスライディングウィンドウに含まれる分類辞書のキーワードに対応する分類重み付けに基づいてスライディングウィンドウのウィンドウ分類スコアを算出する。スライディングウィンドウに、異なる分類カテゴリのキーワードが含まれる場合、分析エンジン102は、分類カテゴリ毎に、ウィンドウ分類スコアを算出する。分析エンジン102は、スライディングウィンドウをずらしながらウィンドウ分類スコアを算出していき、最も高いウィンドウ分類スコアを、ドキュメント210の分類スコアとして特定する。また、分析エンジン102は、最も高いウィンドウ分類スコアに対応する分類カテゴリを、ドキュメント210の分類カテゴリとして特定する。
【0025】
また、分析エンジン102は、対象となるドキュメント210について、ドキュメント210の開始位置に配置したスライディングウィンドウに含まれる重要性辞書のキーワードに対応する重要性重み付けに基づいてスライディングウィンドウのウィンドウ重要性スコアを算出する。分析エンジン102は、スライディングウィンドウをずらしながらウィンドウ重要性スコアを算出していき、最も高いウィンドウ重要性スコアを、ドキュメント210の重要性スコアとして特定する。
【0026】
分類カテゴリは、任意に設定されてよい。分類カテゴリの例として、不正決済、PL問題、情報事故、及び知得不正等が挙げられる。
【0027】
具体例として、不正決済に対して、不正(重み付け3.0)、不正請求(重み付け3.0)、及び勝手(重み付け2.0)等が登録される。また、PL問題に対して、やけど(重み付け3.0)、消費者センター(重み付け3.0)、及び熱(重み付け2.0)等が登録される。また、情報事故に対して、覚えない(重み付け3.0)、誤配信(重み付け3.0)、及び個人情報(重み付け3.0)等が登録される。また、知得不正に対して、改ざん(重み付け3.0)、勝手(重み付け3.0)及び代筆(重み付け3.0)等が登録される。
【0028】
図1に示す例では、1つ目のドキュメント210に対して、複数の分類カテゴリのうち、分類スコアが最も高かった「情報事故」と、分類スコアである0.94と、重要性スコアである0.68とが出力されている。情報処理装置100による出力結果によって、複数のドキュメント210のそれぞれが、どの分類カテゴリに属するものであるのかと、その確からしさとを把握可能にでき、かつ、複数のドキュメント210の重要性の差を容易に把握可能にすることができる。これにより、例えば、重要性が高い順に改善に取り組む等の対応を可能とすることができる。
【0029】
分類辞書は、2つのキーワードの共起に対して分類重み付けを対応付け可能に構成されてよい。重要性辞書は、2つのキーワードの共起に対して分類重み付けを対応付け可能に構成されてよい。
【0030】
共起とは、スライディングウィンドウや、ドキュメントのスコープ(キーワードマッチングや共起におけるスコアリングの対象となる範囲)の中で、あるワードとあるワードが同時に出現することである。例えば、「子供」と「まとめて支払い」のキーワードを共起登録した場合、この2つのワードが同じスコープ内に出願する場合に、スコアリングの対象となる。「子供」と「まとめて支払い」が単独で登録されておらず、共起でのみ登録されている場合、「子供」と「まとめて支払い」が単独で出現する場合、スコアリングの対象とならない。
【0031】
図2は、スライディングウィンドウについて説明するための説明図である。ここでは、対象となるドキュメント210が40個のトークンから構成されており、スライディングウィンドウのサイズが20トークンに設定されている場合を例に挙げて説明する。
【0032】
分析エンジン102は、まず、ドキュメント210の1~20トークンに対応する位置にスライディングウィンドウ400を配置して、キーワードが含まれる分類カテゴリ毎にウィンドウ分類スコアを算出するとともに、ウィンドウ重要性スコアを算出する。
【0033】
分析エンジン102は、スライディングウィンドウ400に含まれるキーワードに対応する分類重み付けを加算する事に基づいてウィンドウ分類スコアを算出し、スライディングウィンドウ400に含まれるキーワードに対応する重要性重み付けを加算することに基づいてウィンドウ重要性スコアを算出してよい。算出方法としては、任意の方法が用いられてよい。
【0034】
分析エンジン102は、例えば、重み付けの合計を関数処理し、-1から1の間の値に変換することによって、スコアを算出する。例えば、分析エンジン102は、下記数式1に示すように、双曲線関数のハイパボリックタンジェントを用いことによって、スコアを算出する。引数として、キーワードにマッチした重み付けの合計に比例係数のスケール因子(scalingFactor)を乗算した数字を用いて算出する。
【0035】
【0036】
例えば、スケール因子が0.3であり、スライディングウィンドウ内に重み付けが3.0のキーワードが3つ含まれている場合、スコアは、tanh((3+3+3)×0.3)=tanh(2.7)=0.99100745367812となる。なお、スケール因子は、0.3に限らず、任意に設定されてよく、また、変更可能であってよい。
【0037】
次に、分析エンジン102は、スライディングウィンドウ400を1トークンずらして、2~21トークンに対応する位置に配置して、ウィンドウ分類スコア及びウィンドウ重要性スコアを算出する。次に、分析エンジン102は、スライディングウィンドウ400を1トークンずらして、3~22トークンに対応する位置に配置して、ウィンドウ分類スコア及びウィンドウ重要性スコアを算出する。このように、分析エンジン102は、スライディングウィンドウ400を1トークンずらしながら、ウィンドウ分類スコア及びウィンドウ重要性スコアを算出していく。分析エンジン102は、分析エンジン102は、最後の21~40トークンにスライディングウィンドウ400を配置してウィンドウ分類スコア及びウィンドウ重要性スコアを算出した後、最も高いウィンドウ分類スコアと、対応する分類カテゴリを特定して、ドキュメント210の分類カテゴリ及び分類スコアとし、最も高いウィンドウ重要性スコアを特定して、ドキュメント210の重要性スコアとする。
【0038】
図3は、情報処理装置100の機能構成の一例を概略的に示す。情報処理装置100は、記憶部110、登録部120、テキストデータ取得部130、分析部140、及び出力制御部150を備える。
【0039】
記憶部110は、分類データ記憶部112、重要性データ記憶部114、シノニムデータ記憶部116、及び打ち消しデータ記憶部118を有する。記憶部110は、これらの全てを有さずに、一部のみを有してもよい。
【0040】
分類データ記憶部112は、複数の分類カテゴリ毎に、キーワードと分類重み付けとの対応付けが複数登録された分類データを記憶する。分類重み付けは、キーワードと分類カテゴリとの関連度を示す。重要性データ記憶部114は、キーワードと、キーワードの重要性を示す重要性重み付けとの対応付けが複数登録された重要性キーワードを記憶する。シノニムデータ記憶部116は、同じキーワードとして取り扱う複数のキーワードのグループが複数登録されたシノニムデータを記憶する。打ち消しデータ記憶部118は、テキストデータの重要性を打ち消す打ち消しワードが登録された打ち消しデータを記憶する。
【0041】
登録部120は、各種登録を実行する。登録部120は、情報処理装置100の管理者や、情報処理装置100のサービスを利用するユーザからの入力に応じて、各種登録を実行してよい。登録部120は、情報処理装置100が備える入力デバイスを介した入力を受け付けてよく、他の装置から送信された入力を受け付けてもよい。
【0042】
登録部120は、例えば、分類データ記憶部112が記憶する分類データに対する、キーワードと分類重み付けとの対応付けの登録を実行する。具体例として、登録部120は、「知得不正」の分類カテゴリに対して、「改ざん」というキーワードと、「改ざん」と「知得不正」との関連度を示す分類重み付けである3.0とを対応付けて登録する。
【0043】
分類データは、キーワードに対してプラスの分類重み付け及びマイナスの分類重み付けのいずれも対応付け可能に構成されていてよい。また、分類データは、複数のキーワードの共起に対して分類重み付けを対応付け可能に構成されていてもよく、登録部120は、複数のキーワードの共起と分類重み付けとを対応付けて登録してよい。具体例として、登録部120は、「不正決済」の分類カテゴリに対して、「子供」と「まとめて支払い」との共起と、分類重み付けである1.0とを対応付けて登録する。
【0044】
登録部120は、例えば、重要性データ記憶部114が記憶する重要性データに対する、キーワードと重要性重み付けとの対応付けの登録を実行する。具体例として、登録部120は、「怒り」というキーワードと、重要性重み付けである2.0とを対応付けて登録する。
【0045】
重要性データは、キーワードに対してプラスの重要性重み付け及びマイナスの重要性重み付けのいずれも対応付け可能に構成されていてよい。また、重要性データは、複数のキーワードの共起に対して重要性重み付けを対応付け可能に構成されていてもよく、登録部120は、複数のキーワードの共起と重要性重み付けとを対応付けて登録してよい。
【0046】
登録部120は、例えば、シノニムデータ記憶部116が記憶するシノニムデータに対する、同じキーワードとして取り扱う複数のキーワードのグループの登録を実行する。具体例として、登録部120は、「誤り」、「間違え」、「過誤」のグループを登録する。
【0047】
登録部120は、例えば、打ち消しデータ記憶部118が記憶する打ち消しデータに対する、打ち消しワードの登録を実行する。具体例として、登録部120は、「勘違い」を登録する。
【0048】
打ち消しデータは、複数のキーワードの共起を登録可能に構成されていてもよく、登録部120は、複数のキーワードの共起を打ち消しデータに登録してよい。具体例として、登録部120は、「お客様」及び「勘違い」の共起を打ち消しデータに登録する。
【0049】
テキストデータ取得部130は、分析対象となるテキストデータを取得する。テキストデータ取得部130は、複数のテキストデータを含む顧客対応ログ等からテキストデータを取得する。テキストデータ取得部130は、分析の対象となり得る任意のデータから、テキストデータを取得してよい。
【0050】
分析部140は、テキストデータ取得部130が取得したテキストデータを分析する。分析部140は、テキストデータ取得部130が取得したテキストデータに対して形態素解析を実行することによって、テキストデータをトークン化してよい。分析部140は、トークン化したテキストデータを対象に分析を実行してよい。なお、形態素解析は、分析部140が実行してなくてもよい。例えば、テキストデータ取得部130が、トークン化されたテキストデータを取得してもよい。
【0051】
分析部140は、ウィンドウスコア算出部142、テキストスコア特定部144、及びテキストデータ特定部146を有する。
【0052】
ウィンドウスコア算出部142は、トークン化されたテキストデータについて、スライディングウィンドウに含まれるキーワードに対応する分類重み付け及び重要性重み付けに基づいてスライディングウィンドウのウィンドウ分類スコア及びウィンドウ重要性スコアを算出する。ウィンドウスコア算出部142は、予め定められたトークン数に対応するスライディングウィンドウを用いてよい。
【0053】
ウィンドウスコア算出部142は、トークン化されたテキストデータの開始位置にスライディングウィンドウを配置し、スライディングウィンドウに含まれる、分類データ内のキーワードに対応する分類重み付けを加算することに基づいて、当該スライディングウィンドウのウィンドウ分類スコアを算出してよい。ウィンドウスコア算出部142は、スライディングウィンドウに、複数の分類カテゴリのキーワードが含まれる場合、複数の分類カテゴリのそれぞれについて、ウィンドウ分類スコアを算出してよい。ウィンドウスコア算出部142は、スライディングウィンドウを1トークンずつずらしながら、ウィンドウ分類スコアを算出していく。
【0054】
ウィンドウスコア算出部142は、分類データに複数のキーワードの共起が含まれる場合であって、スライディングウィンドウに、分類データ内のいずれかの共起が含まれる場合、当該共起に対応する分類重み付けを加算してよい。
【0055】
ウィンドウスコア算出部142は、分類重み付けを加算した値が大きいほど、スコアが高くなる任意の計算手法を用いて、ウィンドウ分類スコアを算出してよい。ウィンドウスコア算出部142は、例えば、分類重み付けの合計を関数処理して、-1から1の間の値に変換することによって、ウィンドウ分類スコアを算出してよい。具体例として、ウィンドウスコア算出部142は、ハイパボリックタンジェントを用いて、ウィンドウ分類スコアを算出する。また、ウィンドウスコア算出部142は、例えば、分類重み付けを単に加算することによってウィンドウ分類スコアを算出する。
【0056】
ウィンドウスコア算出部142は、トークン化されたテキストデータの開始位置にスライディングウィンドウを配置し、スライディングウィンドウに含まれる、重要性データ内のキーワードに対応する重要性重み付けを加算することに基づいて、当該スライディングウィンドウのウィンドウ重要性スコアを算出してよい。ウィンドウスコア算出部142は、スライディングウィンドウを1トークンずつずらしながら、ウィンドウ重要性スコアを算出していく。
【0057】
ウィンドウスコア算出部142は、重要性データに複数のキーワードの共起が含まれる場合であって、スライディングウィンドウに、重要性データ内のいずれかの共起が含まれる場合、当該共起に対応する重要性重み付けを加算してよい。
【0058】
ウィンドウスコア算出部142は、重要性重み付けを加算した値が大きいほど、スコアが高くなる任意の計算手法を用いて、ウィンドウ重要性スコアを算出してよい。ウィンドウスコア算出部142は、例えば、重要性重み付けの合計を関数処理して、-1から1の間の値に変換することによって、ウィンドウ重要性スコアを算出してよい。具体例として、ウィンドウスコア算出部142は、ハイパボリックタンジェントを用いて、ウィンドウ重要性スコアを算出する。また、ウィンドウスコア算出部142は、例えば、重要性重み付けを単に加算することによってウィンドウ重要性スコアを算出する。
【0059】
ウィンドウ分類スコアを算出するときに用いるスライディングウィンドウのサイズと、ウィンドウ重要性スコアを算出する時に用いるスライディングウィンドウのサイズとは、同じであってよい。この場合、ウィンドウスコア算出部142は、スライディングウィンドウをずらすごとに、ウィンドウ分類スコア及びウィンドウ重要性スコアの両方を算出していってよい。
【0060】
ウィンドウ分類スコアを算出するときに用いるスライディングウィンドウのサイズと、ウィンドウ重要性スコアを算出する時に用いるスライディングウィンドウのサイズとは、異なってもよい。この場合、ウィンドウ分類スコアに対するスライディングウィンドウと、ウィンドウ重要性スコアに対応するスライディングウィンドウとが、別々に設定されてよい。ウィンドウスコア算出部142は、ウィンドウ分類スコアに対して設定されたウィンドウ分類トークン数に対応するスライディングウィンドウに含まれるキーワードに対応する分類重み付けに基づいてウィンドウ分類スコアを算出し、ウィンドウ分類トークン数とは異なる、ウィンドウ重要性スコアに対して設定されたウィンドウ重要性トークン数に対応するスライディングウィンドウに含まれるキーワードに対応する分類重み付けに基づいてウィンドウ重要性スコアを算出してよい。スライディングウィンドウのサイズを、ウィンドウ分類スコア及びウィンドウ重要性スコアのそれぞれの適正に応じたトークン数に設定することによって、テキストデータの分類精度と、テキストデータの重要性の判定精度とを向上させることができる。
【0061】
テキストスコア特定部144は、テキストデータについて、ウィンドウスコア算出部142がスライディングウィンドウをずらしながら算出した複数のウィンドウ分類スコアのうち最も高いウィンドウ分類スコアを、テキストデータのテキスト分類スコアとして特定する。テキストスコア特定部144は、1つのテキストデータについて、1つの分類カテゴリ及びテキスト分類スコアを特定してよい。また、テキストスコア特定部144は、1つのテキストデータについて、複数の分類カテゴリ及びテキスト分類スコアを特定してもよい。例えば、あるテキストデータについて、分類カテゴリ「情報事故」及びテキスト分類スコア「0.94」と、分類カテゴリ「不正決済」及びテキスト分類スコア「0.68」とが特定される。これにより、当該テキストデータは、情報事故に関する可能性が高いが、不正決済に関する可能性もある程度高いことを把握可能にできる。
【0062】
テキストスコア特定部144は、テキストデータが、打ち消しデータ記憶部118内の打ち消しワードを含む場合に、特定した当該テキストデータのテキスト重要性スコアを低減してもよい。テキストスコア特定部144は、テキストデータが、打ち消しデータ記憶部118内の打ち消しワードを含む場合に、特定した当該テキストデータのテキスト重要性スコアを無効にしてもよい。これにより、例えば、テキストデータの大部分が、インシデントの可能性を示すキーワードを含んでいる場合であっても、テキストデータの一部が、それを打ち消す内容であった場合に、当該テキストデータがインシデントではなかったものとして取り扱うことを可能にできる。具体例として、テキストデータの大部分が顧客の怒りを表しているが、テキストデータの最後の部分が、それが顧客の勘違いであったことを示す場合に、当該テキストデータのテキスト重要性スコアを低減したり、無効にしたりする。
【0063】
テキストスコア特定部144は、テキストデータについて、ウィンドウスコア算出部142がスライディングウィンドウをずらしながら算出した複数のウィンドウ重要性スコアのうち最も高いウィンドウ重要性スコアを、テキストデータのテキスト重要性スコアとして特定する。
【0064】
テキストデータ特定部146は、テキストスコア特定部144によって特定されたテキスト重要性スコアが予め定められた閾値より高いテキストデータを、インシデントに関連するテキストデータとして特定する。これにより、例えば、膨大な数のテキストデータが入力された場合に、その中から、インシデントに関連する可能性が高く、何らかの対応をとる可能性が高いテキストデータを把握可能にできる。
【0065】
テキストデータ特定部146は、テキスト重要性スコアが予め定められた閾値より高いテキストデータのうち、打ち消しデータ記憶部118の打ち消しデータに含まれる打ち消しワードを含まないテキストデータを特定するようにしてもよい。すなわち、テキストデータ特定部146は、テキスト重要性スコアが予め定められた閾値より高いテキストデータであっても、打ち消しデータに含まれる打ち消しワードを含むテキストデータは特定しないようにしてよい。これにより、テキスト重要性スコアは高いものの、そのテキストデータがインシデントではないことを示唆する内容を含むものである場合には、インシデントに関連しないものとして取り扱うことができる。
【0066】
出力制御部150は、分析部140による分析結果を出力するよう制御する。例えば、出力制御部150は、分析部140による分析結果を、情報処理装置100が備えるディスプレイに表示出力させる。例えば、出力制御部150は、分析部140による分析結果を、他の装置に対して送信するよう制御する。
【0067】
出力制御部150は、例えば、テキストスコア特定部144によって特定された、テキストデータの分類カテゴリと、テキスト分類スコアと、テキスト重要性スコアとを出力するよう制御する。出力制御部150は、例えば、1つのテキストデータについて、1つの分類カテゴリと、当該分類カテゴリのテキスト分類スコアとを出力するよう制御する。また、出力制御部150は、例えば、1つのテキストデータについて、テキスト分類スコアが高い順に特定した予め定められた数の分類カテゴリ及びテキスト分類スコアを出力するよう制御する。また、出力制御部150は、例えば、予め定められた閾値より高いテキスト分類スコアと、当該分類テキストスコアに対応する分類カテゴリとを出力するよう制御する。
【0068】
出力制御部150は、テキストデータ特定部146によって特定されたテキストデータと、当該テキストデータの分類カテゴリ、テキスト分類スコア、及びテキスト重要性スコアとを出力するよう制御する。
【0069】
図4は、情報処理装置100による処理の流れの一例を概略的に示す。ここでは、複数のテキストデータを順次分析する場合であって、ウィンドウ分類スコア及びウィンドウ重要性スコアの算出に、同じサイズのスライディングウィンドウを用いる場合の処理の流れについて説明する。
【0070】
ステップ(ステップをSと省略して記載する場合がある。)102では、テキストデータ取得部130が、テキストデータを取得する。S104では、ウィンドウスコア算出部142が、S102においてテキストデータ取得部130が取得したテキストデータをトークン化し、トークン化したテキストデータの開始位置にスライディングウィンドウを配置して、ウィンドウ分類スコアを算出する。S106では、ウィンドウスコア算出部142が、ウィンドウ重要性スコアを算出する。
【0071】
S108では、ウィンドウスコア算出部142が、スライディングウィンドウがテキストデータの終了位置に到達しているか否かを判定する。到達していない場合、S110に進み、到達した場合、S112に進む。S110では、ウィンドウスコア算出部142が、スライディングウィンドウを1トークンの分、移動させる。
【0072】
S112では、テキストスコア特定部144が、テキスト分類スコア及びテキスト重要性スコアを特定する。対象となる全テキストデータについて分析が終了していない場合(S114でNO)、S102に戻って、テキストデータ取得部130が次のテキストデータを取得し、全テキストデータについて分析が終了した場合(S114でYES)、処理を終了する。
【0073】
図5は、情報処理装置100による処理の流れの一例を概略的に示す。ここでは、
図4に示す処理の流れに加えて、打ち消しワードの有無も判定する場合について説明する。
【0074】
S202では、テキストデータ取得部130が、テキストデータを取得する。S204では、ウィンドウスコア算出部142が、S202においてテキストデータ取得部130が取得したテキストデータをトークン化し、トークン化したテキストデータの開始位置にスライディングウィンドウを配置して、ウィンドウ分類スコアを算出する。S206では、ウィンドウスコア算出部142が、ウィンドウ重要性スコアを算出する。
【0075】
S208では、ウィンドウスコア算出部142が、スライディングウィンドウ内に、打ち消しデータ記憶部118に記憶されている打ち消しデータ内の打ち消しワードが有るか否かを判定し、有ると判定した場合、その旨を記録する。
【0076】
S210では、ウィンドウスコア算出部142が、スライディングウィンドウがテキストデータの終了位置に到達しているか否かを判定する。到達していない場合、S212に進み、到達した場合、S214に進む。S212では、ウィンドウスコア算出部142が、スライディングウィンドウを1トークンの分、移動させる。
【0077】
S214では、テキストスコア特定部144が、テキスト分類スコア及びテキスト重要性スコアを特定する。対象となる全テキストデータについて分析が終了していない場合(S216でNO)、S202に戻って、テキストデータ取得部130が次のテキストデータを取得し、全テキストデータについて分析が終了した場合(S216でYES)、処理を終了する。
【0078】
図5に示す処理後、例えば、テキストデータ特定部146が、テキスト重要性スコアが予め定められた閾値より高いテキストデータのうち、打ち消しキーワードを含まないテキストデータを特定する。
【0079】
図6は、情報処理装置100として機能するコンピュータ1200のハードウェア構成の一例を概略的に示す。コンピュータ1200にインストールされたプログラムは、コンピュータ1200を、本実施形態に係る装置の1又は複数の「部」として機能させ、又はコンピュータ1200に、本実施形態に係る装置に関連付けられるオペレーション又は当該1又は複数の「部」を実行させることができ、及び/又はコンピュータ1200に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ1200に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、CPU1212によって実行されてよい。
【0080】
本実施形態によるコンピュータ1200は、CPU1212、RAM1214、及びグラフィックコントローラ1216を含み、それらはホストコントローラ1210によって相互に接続されている。コンピュータ1200はまた、通信インタフェース1222、記憶装置1224、DVDドライブ1226、及びICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ1220を介してホストコントローラ1210に接続されている。DVDドライブ1226は、DVD-ROMドライブ及びDVD-RAMドライブ等であってよい。記憶装置1224は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ1200はまた、ROM1230及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ1240を介して入出力コントローラ1220に接続されている。
【0081】
CPU1212は、ROM1230及びRAM1214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ1216は、RAM1214内に提供されるフレームバッファ等又はそれ自体の中に、CPU1212によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス1218上に表示されるようにする。
【0082】
通信インタフェース1222は、ネットワークを介して他の電子デバイスと通信する。記憶装置1224は、コンピュータ1200内のCPU1212によって使用されるプログラム及びデータを格納する。DVDドライブ1226は、プログラム又はデータをDVD-ROM1227等から読み取り、記憶装置1224に提供する。ICカードドライブは、プログラム及びデータをICカードから読み取り、及び/又はプログラム及びデータをICカードに書き込む。
【0083】
ROM1230はその中に、アクティブ化時にコンピュータ1200によって実行されるブートプログラム等、及び/又はコンピュータ1200のハードウェアに依存するプログラムを格納する。入出力チップ1240はまた、様々な入出力ユニットをUSBポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ1220に接続してよい。
【0084】
プログラムは、DVD-ROM1227又はICカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置1224、RAM1214、又はROM1230にインストールされ、CPU1212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ1200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ1200の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。
【0085】
例えば、通信がコンピュータ1200及び外部デバイス間で実行される場合、CPU1212は、RAM1214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース1222に対し、通信処理を命令してよい。通信インタフェース1222は、CPU1212の制御の下、RAM1214、記憶装置1224、DVD-ROM1227、又はICカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。
【0086】
また、CPU1212は、記憶装置1224、DVDドライブ1226(DVD-ROM1227)、ICカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がRAM1214に読み取られるようにし、RAM1214上のデータに対し様々なタイプの処理を実行してよい。CPU1212は次に、処理されたデータを外部記録媒体にライトバックしてよい。
【0087】
様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU1212は、RAM1214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM1214に対しライトバックする。また、CPU1212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU1212は、当該複数のエントリの中から、第1の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0088】
上で説明したプログラム又はソフトウエアモジュールは、コンピュータ1200上又はコンピュータ1200近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はRAMのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ1200に提供する。
【0089】
本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び/又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び/又はアナログハードウェア回路を含んでよく、集積回路(IC)及び/又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ(FPGA)、及びプログラマブルロジックアレイ(PLA)等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。
【0090】
コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROM又はフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(登録商標)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0091】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、及び「C」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。
【0092】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0093】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0094】
特許請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0095】
100 情報処理装置、102 分析エンジン、104 辞書、110 記憶部、112 分類データ記憶部、114 重要性データ記憶部、116 シノニムデータ記憶部、118 打ち消しデータ記憶部、120 登録部、130 テキストデータ取得部、140 分析部、142 ウィンドウスコア算出部、144 テキストスコア特定部、146 テキストデータ特定部、150 出力制御部、210 ドキュメント、310 分析結果、400 スライディングウィンドウ、1200 コンピュータ、1210 ホストコントローラ、1212 CPU、1214 RAM、1216 グラフィックコントローラ、1218 ディスプレイデバイス、1220 入出力コントローラ、1222 通信インタフェース、1224 記憶装置、1230 ROM、1240 入出力チップ