特許7388791 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社Ｇｏｄｏｔの特許一覧

特許7388791情報処理システム、情報処理方法及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3
4
5A
5B
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2023-11-20

(45)【発行日】2023-11-29

(54)【発明の名称】情報処理システム、情報処理方法及び情報処理プログラム

(51)【国際特許分類】

H04L 51/212 20220101AFI20231121BHJP

【ＦＩ】

H04L51/212

【請求項の数】 6

(21)【出願番号】P 2023132015

(22)【出願日】2023-08-14

【審査請求日】2023-09-12

【早期審査対象出願】

(73)【特許権者】

【識別番号】522325919

【氏名又は名称】株式会社Ｇｏｄｏｔ

(74)【代理人】

【識別番号】100079108

【弁理士】

【氏名又は名称】稲葉良幸

(74)【代理人】

【識別番号】100109346

【弁理士】

【氏名又は名称】大貫敏史

(74)【代理人】

【識別番号】100117189

【弁理士】

【氏名又は名称】江口昭彦

(74)【代理人】

【識別番号】100134120

【弁理士】

【氏名又は名称】内藤和彦

(72)【発明者】

【氏名】森山健

(72)【発明者】

【氏名】鬼澤綾

(72)【発明者】

【氏名】住本芽衣

【審査官】岩田玲彦

(56)【参考文献】

【文献】特開２００５－２３５２０６（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｌ５１／２１２

(57)【特許請求の範囲】

【請求項1】

フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する第１抽出部と、
フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第２ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する第２抽出部と、
前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する生成部と、を備え、
前記基準情報は、前記フィルタリング対象のコンテンツの情報量に対する該コンテンツに含まれる第３行動変容手法（第３ＢＣＴ）の成分の情報量の比率に関する含有率情報、前記第３ＢＣＴの成分の情報量に対する特定のＢＣＴの成分の情報量の比率に関する構成比情報、及び、前記特定のＢＣＴに関するＢＣＴ情報の少なくとも一つを含む、
情報処理システム。

【請求項2】

前記第１ＢＣＴ成分情報は、前記第１コンテンツの情報量に対する前記第１ＢＣＴの成分の情報量の比率に関する第１含有率情報、及び、前記第１ＢＣＴの成分に対応する情報量に対する前記特定のＢＣＴの成分の情報量の比率に関する第１構成比情報の少なくとも一つを含み、
前記第２ＢＣＴ成分情報は、前記第１コンテンツの情報量に対する前記第２ＢＣＴの成分の情報量の比率に関する第２含有率情報、及び、前記第２ＢＣＴの成分に対応する情報量に対する前記特定のＢＣＴの成分の情報量の比率に関する第２構成比情報の少なくとも一つを含む、
請求項１記載の情報処理システム。

【請求項3】

コンテンツを取得する取得部と、
前記モデルに基づいて、前記取得されたコンテンツが前記フィルタリング対象のコンテンツであるか否かを判断して、判断結果に基づいてフィルタリングを行うフィルタ部と、
を更に備える請求項１又は請求項２記載の情報処理システム。

【請求項4】

前記第１コンテンツは、迷惑メッセージであり、
前記第２コンテンツは、迷惑メッセージ以外の通常メッセージであり、
前記コンテンツは、ユーザに対して発信されたメッセージである、
請求項３記載の情報処理システム。

【請求項5】

情報処理装置が、
フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する工程と、
フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第２ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する工程と、
前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する工程と、
を有し、
前記基準情報は、前記フィルタリング対象のコンテンツの情報量に対する該コンテンツに含まれる第３行動変容手法（第３ＢＣＴ）の成分の情報量の比率に関する含有率情報、前記第３ＢＣＴの成分の情報量に対する特定のＢＣＴの成分の情報量の比率に関する構成比情報、及び、前記特定のＢＣＴに関するＢＣＴ情報の少なくとも一つを含む、情報処理方法。

【請求項6】

コンピュータに、
フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する工程と、
フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第２ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する工程と、
前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する工程と、を実行させ、
前記基準情報は、前記フィルタリング対象のコンテンツの情報量に対する該コンテンツに含まれる第３行動変容手法（第３ＢＣＴ）の成分の情報量の比率に関する含有率情報、前記第３ＢＣＴの成分の情報量に対する特定のＢＣＴの成分の情報量の比率に関する構成比情報、及び、前記特定のＢＣＴに関するＢＣＴ情報の少なくとも一つを含む、情報処理プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理システム、情報処理方法及び情報処理プログラムに関する。

【背景技術】

【0002】

従来、機械学習に基づくモデルを用いて種々の情報をフィルタリングすることが知られている。例えば、特許文献１には、ベイジアンフィルタにおける学習用データを学習型スパムフィルタとして管理し、当該学習型スパムフィルタを用いて迷惑メッセージを判定することが記載されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特許５６７６７０９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、例えば、特許文献１に記載の従来の迷惑メッセージのフィルタにおいては、迷惑メッセージではないメールが誤って迷惑メッセージと判断されたり（偽陽性）、迷惑メッセージが誤ってフィルタをすり抜けたり（偽陰性）する恐れがある。このような問題は、迷惑メッセージのフィルタだけでなく、種々のコンテンツのフィルタにも生じる恐れがある。

【0005】

そこで、コンテンツのフィルタリングの精度を向上可能な情報処理システム、情報処理方法及び情報処理プログラムを提供することを目的の一つとする。

【課題を解決するための手段】

【0006】

本発明の一態様に係る情報処理システムは、フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する第１抽出部と、フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第２ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する第２抽出部と、前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する生成部と、を備える。

【0007】

本発明の他の態様に係る情報処理方法は、情報処理装置が、フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する工程と、フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第２ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する工程と、前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する工程と、を有する。

【0008】

本発明の他の態様に係る情報処理プログラムは、コンピュータに、フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する工程と、フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第２ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する工程と、前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する工程と、を実行させる。

【発明の効果】

【0009】

本発明によれば、コンテンツのフィルタリングの精度を向上できる。

【図面の簡単な説明】

【0010】

【図1】図１は、本実施形態に係るＢＣＴの分類の一例を示す図である。

【図2A】図２Ａは、従来技術に係るフィルタリング用のモデルの生成の概念図である。

【図2B】図２Ｂは、本実施形態に係るフィルタリング用のモデルの生成の概念図である。

【図3】図３は、本実施形態に係る情報処理システム内の各情報処理装置のハードウェア構成の一例を示す図である。

【図4】図４は、本実施形態に係る情報処理システムの機能構成の一例を示す図である。

【図5A】図５Ａは、本実施形態に係る第１ＢＣＴ成分情報の一例を示す図である。

【図5B】図５Ｂは、本実施形態に係る第２ＢＣＴ成分情報の一例を示す図である。

【図6】図６は、本実施形態に係る生成装置の動作の一例を示すフローチャートである。

【図7】図７は、本実施形態に係るフィルタ装置の動作の一例を示すフローチャートである。

【発明を実施するための形態】

【0011】

添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。

【0012】

（概要）
本実施形態に係る情報処理システムにおいては、情報処理装置は、フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（第１ＢＣＴ）の成分に関する情報（以下、「第１ＢＣＴ成分情報」という）を抽出する。情報処理装置は、フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（第１ＢＣＴ）の成分に関する情報（以下、「第２ＢＣＴ成分情報」という）を抽出する。情報処理装置は、当該第１ＢＣＴ成分情報及び当該第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる情報（以下、「基準情報」という）を推定し、該基準情報に基づくモデルを生成する。なお、抽出は、エンコード等と言い換えることもできる。

【0013】

本実施形態において、行動変容手法（ＢＣＴ：behavior change technique）とは、行動変容に作用する（働きかける）手法又は方法である。例えば、ＢＣＴＴｖ１（Michie S, Richardson M, Johnston M, et al.: The behavior change technique taxonomy (v1) of 93 hierarchically clustered techniques: building an international consensus for the reporting of behavior change interventions. Ann Behav Med 2013; 46: 81～95.）によると１６グループの９３個のＢＣＴが規定されている。なお、ＢＣＴの規定はＢＣＴＴｖ１に限られず、行動変容の手法を包括的に網羅する限り、どのように規定されてもよい。また、本実施形態に係るＢＣＴは、一以上のＢＣＴを含むグループ（以下、「ＢＣＴグループ」という）を含み、ＢＣＴグループとＢＣＴとは相互に言い換えられてもよい。

【0014】

図１は、本実施形態に係るＢＣＴの分類の一例を示す図である。一以上のＢＣＴは所定の分類法に従って分類される。図１に示すように、ＢＣＴＴｖ１には、「１．Goals and planning」、「２．Feedback and monitoring」、「３．Social support」、「４．Shaping knowledge」、「５．Natural consequences」、「６．Comparison of behaviour」、「７．Associations」、「８．Repetition and substitution」、「９．Comparison of outcomes」、「１０．Reward and threat」、「１１．Regulation」、「１２．Antecedents」、「１３．Identity」、「１４．Scheduled consequences」、「１５．Self-belief」及び「１６．Covert learning」という１６個のＢＣＴグループが規定されている。

【0015】

ＢＣＴＴｖ１において、図１に示される１６個のＢＣＴグループにはそれぞれ一以上のＢＣＴが属する。例えば、ＢＣＴグループ「５．Natural consequences」には、例えば、「５．５．Anticipated regret」等のＢＣＴが属する。また、ＢＣＴグループ「１０．Reward and threat」には、例えば、「１０．１１．Future punishment」等のＢＣＴが属する。図示しないが、他のグループについても一以上のＢＣＴが属する。

【0016】

また、各ＢＣＴは成分を有し、あるコンテンツに含まれる各ＢＣＴの度合いが成分値として示されてもよい。また、同ＢＣＴグループに属する各ＢＣＴの成分値の合計はＢＣＴグループの成分値として示されてもよい。

【0017】

図２Ａ及び図２Ｂは、従来技術及び本実施形態に係るフィルタリング用のモデルの生成の概念図である。なお、図２Ｂでは、フィルタリング対象のコンテンツが、迷惑メッセージ（spam and/or junk message）であり、フィルタリング対象であると判断された第１コンテンツが、迷惑メッセージであり、フィルタリング対象であると判断されていない第２コンテンツが、迷惑メッセージではないメッセージ（以下、「通常メッセージ」という）であるものとする。しかし、図２Ｂは、一例にすぎず、フィルタリング対象のコンテンツ及び第１コンテンツは迷惑メッセージに限られないし、第２コンテンツは通常メッセージに限られない。

【0018】

ここで、迷惑メッセージとは、ユーザ（例えば、メッセージの読み手）により良い意思決定のための判断材料を提供することはせずに、迅速に行動しないことの損失を誇張したり、ユーザの劣等感を煽るような文言で心理的な負担をかけることでユーザの健全な意思決定を阻害したりするように、意図的に設計されたメッセージである。迷惑メッセージは、例えば、電子メール、ショートメッセージ、「いかがでしたでしょうかサイト」と呼ばれるステルス・マーケティングサイト等の種々の媒体によって発信される情報であればよい。また、迷惑メッセージは、テキストデータ、画像データ及び音声データの少なくとも一つであってもよい。

【0019】

また、迷惑メッセージは、特定のＢＣＴの成分を過剰に含む情報ともいえる。当該特定のＢＣＴは、例えば、スラッジ、脅し及び煽りの少なくとも一つの系統に属するＢＣＴ（例えば、図１の「５．５．Anticipated regret」及び／又は「１０．１１．Future punishment」等）であってもよい。スラッジとは、企業や詐欺集団等が私利私欲のために、ユーザにとって不利な方向に行動を誘導したり、ユーザにとって有利な行動を阻害したりすること示す。例えば、迷惑メッセージの文脈においては、スラッジは、詐欺サイトにクレジットカード番号を入力することを促したり、架空の料金請求に対して現金振り込みをする前に家族に相談する心理的猶予を与えなかったりすることであってもよい。

【0020】

例えば、図２Ａに示すように、従来技術の一例では、迷惑メッセージとしてアノテーションされた教師データとした機械学習により、ベイズ推定に基づく判断基準が生成され、当該判断基準に基づくフィルタリング用のモデルが生成される。ベイズ推定に基づく判断基準は、条件付き確率を使って迷惑メッセージである確率を推定し、予め設定された閾値を超えると迷惑メッセージであると判定するというものである。なお、「アノテーション」は、タグ付け又はラベル付け等と言い換えられてもよい。

【0021】

迷惑メッセージとしてアノテーションされた教師データに基づく従来の他のフィルタ技術としては、ニューラルネットワークやランダムフォレスト等も知られている。また、予め設定したリスト（例えば、ブラックリスト、リアルタイムブラックリスト、レピュテーションリスト等）に基づくブロック技術も知られている。しかしながら、生成ＡＩを活用した迷惑メッセージの個別化や巧妙化が進むにつれて、上記フィルタ技術やブロック技術を用いたモデルによると、偽陽性や偽陰性の確率が高まり、フィルタリングの精度が低下する恐れがある。

【0022】

一方、図２Ｂに示すように、本実施形態に係る情報処理システムでは、迷惑メッセージとしてアノテーションされた第１教師データに含まれる第１ＢＣＴの成分に関する第１ＢＣＴ成分情報が抽出され、通常メッセージとしてアノテーションされた第２教師データに含まれる第２ＢＣＴの成分に関する第２ＢＣＴ成分情報が抽出される。当該第１ＢＣＴ成分情報及び当該第２ＢＣＴ成分情報の差分の分析により、迷惑メッセージであるか否かの判断基準となる基準情報が推定され、該基準情報に基づく迷惑メッセージのフィルタリング用のモデルが生成される。

【0023】

このように、本実施形態に係る情報処理システムでは、フィルタリング対象であると判断された第１コンテンツ（例えば、迷惑メッセージとしてアノテーションされた第１教師データ）から第１ＢＣＴ成分情報が抽出され、フィルタリング対象ではないと判断された第２コンテンツ（例えば、通常メッセージとしてアノテーションされた第２教師データ）から第２ＢＣＴ成分情報が抽出される。また、抽出された第１ＢＣＴ成分情報及び第２ＢＣＴ成分情報の比較に基づいて、フィルタリング対象のコンテンツ（例えば、迷惑メッセージ）であるか否かの判断基準としての基準情報が推定され、当該基準情報に基づくモデルが生成される。したがって、従来基準と比較して、偽陽性や偽陰性の確率が少ない判断基準に基づくモデルを生成することができ、この結果、フィルタリングの精度を向上できる。

【0024】

（構成）
次に、本実施形態に係る情報処理システム１の構成を説明する。なお、情報処理システム１は、単一の情報処理装置を含んで構成されてもよいし、複数の情報処理装置を含んで構成されてもよい。例えば、情報処理システム１は、後述する機能構成の一部を実装する複数の情報処理装置で構成され、有線及び／又は無線のネットワークによって接続される当該複数の装置によって後述する機能構成が実現されてもよい。

【0025】

図３は、本実施形態に係る情報処理システムを構成する各情報処理装置のハードウェア構成の一例を示す図である。情報処理システム１内の各情報処理装置（例えば、後述する生成装置１０及びフィルタ装置２０）は、演算装置に相当するＣＰＵ（Central Processing Unit）等のプロセッサ１１と、記憶装置１２と、通信装置１３と、入出力装置１４とを有する。これらの各構成は、バスを介して相互にデータ送受信可能に接続される。

【0026】

プロセッサ１１は、例えば、ＣＰＵであり、情報処理システム１内の各情報処理装置を制御する。プロセッサ１１は、プログラムを記憶装置１２から読み出して実行することで、本実施形態で説明する各種の処理を実行してもよい。情報処理システム１内の各情報処理装置は、１又は複数のプロセッサ１１を備えていてもよい。また、当該各装置は、コンピュータと呼ばれてもよい。

【0027】

記憶装置１２は、例えば、メモリ、ＨＤＤ（Hard Disk Drive）及び／又はＳＳＤ（Solid State Drive）等のストレージから構成される。記憶装置１２は、プロセッサ１１による処理の実行に必要な各種情報（例えば、プロセッサ１１によって実行される情報処理プログラム等）を記憶してもよい。

【0028】

通信装置１３は、ネットワークを介して通信を行う装置であり、例えば、ネットワークカード、通信モジュール、チップ、アンテナ等を含んでもよい。通信装置１３は、ネットワークを介して各種情報を送信する送信部、及び／又は、ネットワークを介して各種情報を受信する受信部を含んでもよい。

【0029】

入出力装置１４は、例えば、キーボード、タッチパネル、マウス及び／又はマイク等の入力部と、例えば、ディスプレイ及び／又はスピーカ等の出力部とを含む。入力部は、ユーザからの各種情報の入力を受け付ける。また、出力部は、ユーザに対する各種情報を表示する表示部を含んでもよい。

【0030】

以上説明したハードウェア構成は一例に過ぎない。情報処理システム１内の各情報処理装置は、図４に記載したハードウェアの一部が省略されていてもよいし、図４に記載されていないハードウェアを備えていてもよい。また、図４に示すハードウェアが１又は複数のチップにより構成されていてもよい。また、情報処理装置が複数の装置で構成される場合、各装置がこれらのハードウェアの少なくとも一部を備えてもよい。

【0031】

図４は、本実施形態に係る情報処理システムの機能構成の一例を示す図である。図４に示すように情報処理システム１は、上記モデル（例えば、図２Ｂ）を生成する情報処理装置（以下、「生成装置」という）１０と、コンテンツを取得し、取得したコンテンツを当該モデルに基づいてフィルタリングする情報処理装置（以下、フィルタ装置）２０と、を含んで構成される。なお、生成装置１０及びフィルタ装置２０は、同一の情報処理装置として構成されてもよいし、別体の情報処理装置として構成されてもよい。

【0032】

なお、図４は例示にすぎず、生成装置１０及びフィルタ装置２０がそれぞれ不図示の機能構成を備えてもよいことは勿論である。各機能構成の機能は、図３に示すプロセッサ１１等のハードウェアに情報処理プログラムを読み込ませることにより、プロセッサ１１の制御のもとで記憶装置１２、通信装置１３及び入出力装置１４の少なくとも一つを動作させることにより実現される。

【0033】

図４に示すように、生成装置１０は、格納部１０１、第１抽出部１０２、第２抽出部１０３及び生成部１０４を備える。

【0034】

格納部１０１は、フィルタリング対象であると判断された第１コンテンツと、フィルタリング対象であると判断されていない第２コンテンツとを格納する。具体的には、格納部１０１は、フィルタリング対象であるとアノテーションされた第１教師データ（例えば、迷惑メッセージとしてアノテーションされた教師データ）を第１コンテンツとして格納してもよい。また、格納部１０１は、フィルタリング対象ではないとアノテーションされた第２教師データ（例えば、通常メッセージとしてアノテーションされた教師データ）を第２コンテンツとして格納してもよい。

【0035】

また、格納部１０１は、生成部１０４によって生成されるモデルを格納してもよい。なお、格納部１０１は、生成部１０４によって生成されるモデルに基づいて蒸留されたモデルを格納してもよい。

【0036】

第１抽出部１０２は、フィルタリング対象であると判断された第１コンテンツに含まれる第１ＢＣＴの成分に関する第１ＢＣＴ成分情報を抽出する。具体的には、第１抽出部１０２は、当該第１コンテンツ（例えば、フィルタリング対象としてアノテーションされた第１教師データ）を用いた機械学習により第１ＢＣＴ成分情報を抽出してもよい。

【0037】

当該第１ＢＣＴ成分情報は、当該第１コンテンツに含まれる第１ＢＣＴの成分の平均に基づく固定値を示す成分表であってもよいし、又は、当該第１コンテンツに含まれる第１ＢＣＴの成分の分布を示してもよい。また、当該第１ＢＣＴ成分情報は、当該第１コンテンツの情報量に対する当該第１ＢＣＴの成分の情報量の比率に関する情報（以下、「第１含有率情報」という）、及び、当該第１ＢＣＴの成分に対応する情報量に対する特定のＢＣＴの成分の情報量の比率に関する情報（以下、「第１構成比情報」という）の少なくとも一つを含んでもよい。

【0038】

図５Ａは、本実施形態に係る第１ＢＣＴ成分情報の一例を示す図である。例えば、図５Ａでは、迷惑メッセージとしてアノテーションされた第１教師データから抽出された第１ＢＣＴ成分情報の一例が示される。また、図５Ａでは、第１ＢＣＴ成分情報が、当該第１教師データの成分の平均に基づく固定値を示す成分表であるものとするが、上記の通り、当該第１教師データの成分の分布を示してもよい。

【0039】

例えば、図５Ａでは、第１ＢＣＴ成分情報は、迷惑メールとしてアノテーションされた第１教師データの情報量を１００％とすると、脅し系ＢＣＴの成分の情報量が５０％であり、煽り系ＢＣＴの成分の情報量が４０％であり、その他のＢＣＴの成分の情報量が５％であり、いずれのＢＣＴにも属さない（ＢＣＴなし）情報量が５％であることを示す。この場合、第１教師データに含まれる第１ＢＣＴ（ここでは、脅し系のＢＣＴ、煽り系のＢＣＴ及びその他のＢＣＴ）の成分の情報量は９５％であるので、第１含有率情報は、９５／１００を示してもよい。また、第１ＢＣＴの成分の情報量が９５％であり、特定のＢＣＴ（ここでは、脅し系のＢＣＴ、煽り系のＢＣＴ）の成分の情報量は９０％（＝４０％＋５０％）であるので、第１構成比情報は９０／９５を示してもよい。

【0040】

第２抽出部１０３は、フィルタリング対象であると判断されていない第２コンテンツに含まれる第２ＢＣＴの成分に関する第２ＢＣＴ成分情報を抽出する。具体的には、第２抽出部１０３は、当該第２コンテンツ（例えば、フィルタリング対象外としてアノテーションされた第２教師データ）を用いた機械学習により第２ＢＣＴ成分情報を抽出してもよい。

【0041】

当該第２ＢＣＴ成分情報は、当該第２コンテンツに含まれる第２ＢＣＴの成分の平均に基づく固定値を示す成分表であってもよいし、又は、当該第２コンテンツに含まれる第２ＢＣＴの成分の分布を示してもよい。また、当該第２ＢＣＴ成分情報は、当該第２コンテンツの情報量に対する当該第２ＢＣＴの成分の情報量の比率に関する情報（以下、「第２含有率情報」という）、及び、当該第２ＢＣＴの成分に対応する情報量に対する特定のＢＣＴの成分の情報量の比率に関する情報（以下、「第２構成比情報」という）の少なくとも一つを含んでもよい。

【0042】

図５Ｂは、本実施形態に係る第２ＢＣＴ成分情報の一例を示す図である。例えば、図５Ｂでは、通常メッセージとしてアノテーションされた第２教師データから抽出された第２ＢＣＴ成分情報の一例が示される。また、図５Ｂでは、第２ＢＣＴ成分情報が、当該第２教師データの成分の平均に基づく固定値を示す成分表であるものとするが、上記の通り、当該第２教師データの成分の分布を示してもよい。

【0043】

例えば、図５Ｂでは、第２ＢＣＴ成分情報は、通常メールとしてアノテーションされた第２教師データの情報量を１００％とすると、いずれのＢＣＴにも属さない（ＢＣＴなし）情報量が７０％であり、比較系ＢＣＴの情報量が１０％であり、計画系ＢＣＴの情報量が１０％であり、その他のＢＣＴの情報量が１０％であることを示す。この場合、第２教師データに含まれる第２ＢＣＴ（ここでは、比較系のＢＣＴ、計画系のＢＣＴ及びその他のＢＣＴ）の成分に対応する情報量は３０％であるので、第２含有率情報は、３０／１００を示してもよい。また、第２ＢＣＴの成分に対応する情報量が３０％であり、特定のＢＣＴ（ここでは、脅し系のＢＣＴ、煽り系のＢＣＴ）の成分に対応する情報量は０％であるので、第２構成比情報は０を示してもよい。

【0044】

生成部１０４は、第１ＢＣＴ成分情報及び第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する。当該基準情報は、フィルタリング対象のコンテンツの情報量に対する当該コンテンツに含まれる第３行動変容手法（第３ＢＣＴ）の成分の情報量の比率に関する情報（以下、「含有率情報」という）、該第３ＢＣＴの成分の情報量に対する特定のＢＣＴの成分の情報量の比率に関する情報（以下、「構成比情報」という）、及び、当該特定のＢＣＴに関する情報（以下、「ＢＣＴ情報」という）の少なくとも一つを含んでもよい。

【0045】

具体的には、生成部１０４は、第１含有率情報及び第２含有率情報に基づいて、フィルタリング対象のコンテンツの情報量に対する当該コンテンツに含まれる第３ＢＣＴの成分の情報量の比率に関する含有率情報を推定してもよい。例えば、図５Ａ及び５Ｂで説明したように、第１含有率情報が９５／１００であり、第２含有率情報が３０／１００である場合、生成部１０４は、フィルタリング対象のコンテンツ（すなわち、迷惑メッセージ）であるかの判断基準となる含有率情報を５０／１００と推定してもよい。

【0046】

また、生成部１０４は、第１構成比情報及び第２構成比情報に基づいて、第３ＢＣＴの成分の情報量に対する特定のＢＣＴの成分の情報量の比率に関する構成比情報を推定してもよい。例えば、図５Ａ及び５Ｂで説明したように、第１構成比情報が９０／９５であり、第２構成比情報が０である場合、生成部１０４は、フィルタリング対象のコンテンツ（すなわち、迷惑メッセージ）であるかの判断基準となる構成比情報を４０／５０と推定してもよい。

【0047】

また、生成部１０４は、第１ＢＣＴ成分情報及び第２ＢＣＴ成分情報に基づいて、特定のＢＣＴを示すＢＣＴ情報を推定してもよい。例えば、図５Ａ及び５Ｂに示されるように、第１ＢＣＴ成分情報は、脅し系ＢＣＴ及び煽り系ＢＣＴの成分の割合が、通常メッセージに多く含まれる比較系ＢＣＴ及び計画系ＢＣＴの成分の割合と比べて多い。生成部１０４は、第１ＢＣＴ成分情報及び第２ＢＣＴ成分情報の比較に基づいて、フィルタリング対象のコンテンツ（すなわち、迷惑メッセージ）に含まれる傾向のある特定のＢＣＴを示すＢＣＴ情報を推定してもよい。

【0048】

図４に示すように、フィルタ装置２０は、取得部２０１、フィルタ部２０２及び出力部２０３を備える。

【0049】

取得部２０１は、コンテンツを取得する。具体的には、取得部２０１は、フィルタリング対象であるか否かの判断対象となるコンテンツ（例えば、迷惑メッセージであるか否かの判断対象となる対象メッセージ）を取得する。

【0050】

フィルタ部２０２は、生成装置１０で生成されたモデルに基づいて、取得部２０１によって取得されたコンテンツがフィルタリング対象のコンテンツであるか否かを判断して、判断結果に基づいてフィルタリングを行う。なお、フィルタ部２０２は、生成部１０４によって生成されたモデルそのものを用いてもよいし、当該モデルを蒸留したモデルを用いてもよい。上記の通り、当該モデルは、含有率情報及び構成比情報の少なくとも一つを判断基準として用いてもよい。

【0051】

具体的には、フィルタ部２０２は、取得部２０１によって取得されたコンテンツの情報量に対する当該コンテンツに含まれるＢＣＴの情報量の比率と、上記含有率情報に基づくモデルを用いて、フィルタリング対象のコンテンツであるか否かを判断してもよい。例えば、当該モデルでは、取得部２０１によって取得されたコンテンツの情報量に対する当該コンテンツに含まれるＢＣＴの情報量の比率が、上記含有率情報が示す値（例えば、５０／１００）を超えるか否か、又は、当該含有率情報が示す値からどの程度乖離するかによって、フィルタリング対象のコンテンツであるか否かが判断されてもよい。

【0052】

また、フィルタ部２０２は、取得部２０１によって取得されたコンテンツに含まれるＢＣＴの情報量に対する特定のＢＣＴの成分の情報量の比率と、上記構成比情報に基づくモデルを用いて、フィルタリング対象のコンテンツであるか否かを判断してもよい。例えば、当該モデルでは、取得部２０１によって取得されたコンテンツに含まれるＢＣＴの情報量に対する特定のＢＣＴの成分の比率が、上記構成比情報が示す値（例えば、４０／５０）を超えるか否か、又は、当該構成比情報が示す値からどの程度乖離するかによって、フィルタリング対象のコンテンツであるか否かが判断されてもよい。

【0053】

また、フィルタ部２０２は、取得部２０１によって取得されたコンテンツに含まれるＢＣＴの情報量に対する特定のＢＣＴの成分の情報量の比率と、上記含有率情報及び構成比情報に基づくモデルを用いて、フィルタリング対象のコンテンツであるか否かを判断してもよい。

【0054】

出力部２０３は、フィルタ部２０２によるフィルタリングの結果に関する情報（以下、「フィルタリング情報」という）を出力する。なお、フィルタリング情報は、生成装置１０にフィードバックされてもよい。例えば、フィルタ部２０２によってフィルタリング対象のコンテンツとしてフィルタリングされたコンテンツが、フィルタリング対象外とされるべきコンテンツである場合（すなわち、偽陽性の場合）、当該フィルタリングされたコンテンツがフィルタリング対象外としてアノテーションされ、第２教師データとして生成装置１０にフィードバックされてもよい。一方、フィルタ部２０２によってフィルタリング対象のコンテンツとしてフィルタリングされなかったコンテンツが、フィルタリング対象とされるべきコンテンツである場合（すなわち、偽陰性の場合）、当該フィルタリングされなかったコンテンツがフィルタリング対象としてアノテーションされ、第２教師データとして生成装置１０にフィードバックされてもよい。これにより、生成装置１０で生成されるモデルに基づくフィルタリングの精度を更に向上できる。
（動作）
次に、本実施形態に係る情報処理システム１の動作を説明する。なお、図６及び図７に示す生成装置１０及びフィルタ装置２０の動作は一例にすぎず、図示するものに限られない。例えば、一部のステップが削除及び／又は追加されてもよいし、一部のステップ（例えば、図６ステップＳ１０１及びＳ１０２）の順番が入れ替えて実行されてもよいし、又は、並行して実行されてもよい。

【0055】

図６は、本実施形態に係る生成装置１０の動作の一例を示すフローチャートである。図６に示すように、生成装置１０は、フィルタリングの対象であると判断された第１コンテンツに含まれる第１ＢＣＴの成分に関する第１ＢＣＴ成分情報を抽出する（ステップＳ１０１）。例えば、図２Ｂ及び５Ａで説明したように、生成装置１０は、迷惑メールとしてアノテーションされた第１教師データを用いた機械学習により、第１ＢＣＴ成分情報を抽出してもよい。

【0056】

生成装置１０は、フィルタリングの対象であると判断されていない第２コンテンツに含まれる第２ＢＣＴの成分に関する第２ＢＣＴ成分情報を抽出する（ステップＳ１０２）。例えば、図２Ｂ及び５Ｂで説明したように、生成装置１０は、通常メールとしてアノテーションされた第２教師データを用いた機械学習により、第２ＢＣＴ成分情報を抽出してもよい。

【0057】

生成装置１０は、ステップＳ１０１で抽出された第１ＢＣＴ成分情報及びステップＳ１０２で抽出された第２ＢＣＴ成分情報に基づいて、フィルタリングの対象のコンテンツであるか否かの判断基準となる基準情報を推定する（ステップＳ１０３）。具体的には、図２Ｂ、５Ａ及び５Ｂで説明したように、生成装置１０は、第１ＢＣＴ成分情報及び第２ＢＣＴ成分情報の差分を分析して、当該判断基準となる基準情報を推定してもよい。生成装置１０は、ステップＳ１０３で推定された基準情報に基づくモデルを生成する（ステップＳ１０４）。

【0058】

図７は、本実施形態に係るフィルタ装置２０の動作の一例を示すフローチャートである。図７に示すように、フィルタ装置２０は、フィルタリング対象であるか否かの判断対象となるコンテンツを取得する（ステップＳ２０１）。例えば、フィルタ装置２０は、迷惑メッセージであるか否かの判断対象となる対象メッセージを取得する。

【0059】

フィルタ装置２０は、生成装置１０で生成されたモデルに基づいて、ステップＳ２０１で取得されたコンテンツがフィルタリング対象のコンテンツであるか否かを判断して、判断結果に基づいてフィルタリングを行う（ステップＳ２０２）。例えば、フィルタ装置２０は、当該モデルに基づいて、対象メッセージが迷惑メッセージであるか否かを判断して、判断結果に基づいてフィルタリングを行う。

【0060】

フィルタ装置２０は、ステップＳ２０２におけるフィルタリングの結果に関するフィルタリング情報を出力する（ステップＳ２０３）。

【0061】

以上のように、本実施形態に係る情報処理システム１では、生成装置１０は、フィルタリング対象であると判断された第１コンテンツから抽出された第１ＢＣＴ成分情報と、フィルタリング対象ではないと判断された第２コンテンツから抽出された第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツ（例えば、迷惑メッセージ）であるか否かの判断基準としての基準情報が推定され、当該基準情報に基づくモデルが生成される。したがって、従来基準と比較して、偽陽性や偽陰性の確率が少ない判断基準に基づくフィルタリング用のモデルを生成できる。

【0062】

また、本実施形態に係る情報処理システム１では、生成装置１０によって生成された上記モデルに基づいて、取得されたコンテンツがフィルタリング対象のコンテンツであるか否かを判断して、判断結果に基づいてフィルタリングを行う。したがって、フィルタリングの精度を向上できる。

【0063】

（その他の実施形態）
上記実施形態では、フィルタリング対象のコンテンツとして迷惑メッセージを例示したが、フィルタリング対象のコンテンツは上記に限られない。フィルタリング対象のコンテンツは、例えば、キャッチコピー、広告、プロンプトエンジニアリングによって設計されたコンテンツ等、顕著な傾向を示すＢＣＴを含む確率が高い第１コンテンツと当該顕著な傾向を示すＢＣＴを含む確率が少ない第２コンテンツの組み合わせが存在すれば、どのようなコンテンツをフィルタリング対象とすることの可能である。例えば、上記第１コンテンツ及び第２コンテンツの組み合わせは、キャッチコピーの文章が上手いか下手か、広告のバランスが良いか悪いか、又は、プロンプトエンジニアリングにより設計されたコンテンツが適切か適切でないか等によって定められてもよい。

【0064】

また、フィルタリング対象のコンテンツは、「特定の行動を促そうとするコンテンツ」であってもよい。例えば、生成装置１０は、自分より弱い立場の相手に高圧的なメールで行動を促そうとしていないかを判断するモデルを生成し、フィルタ装置は、当該モデルに基づいて対象コンテンツが自分より弱い立場の相手に高圧的なメールで行動を促そうとしていないかを判断してもよい。このようなモデルは、セクシャルハラスメント（セクハラ）、パワーハラスメント（パワハラ）、下請けいじめの有無の判断に用いることができる。

【0065】

また、特定のＢＣＴは、フィルタリング対象であると判断されたコンテンツが、フィルタリング対象ではないと判断されたコンテンツよりも顕著に含むと想定されるＢＣＴであれば、どのようなＢＣＴであってもよい。例えば、文章が上手いと判断されるコンテンツをフィルタリング対象とする場合、特定のＢＣＴは、例えば、対象行動の客観的視点を提示する系統のＢＣＴであってもよいがこれに限られない。また、バランスが良いと判断されるコンテンツをフィルタリング対象とする場合、特定のＢＣＴは、例えば、新しい見方を提示する系統のＢＣＴであってもよいがこれに限られない。また、プロンプトエンジニアリングにより設計され、適切であると判断されたコンテンツをフィルタリング対象とする場合、特定のＢＣＴは、例えば、フィードバックを与える系統のＢＣＴであってもよいがこれに限られない。

【0066】

また、本実施形態における、第１ＢＣＴ、第２ＢＣＴ及び第３ＢＣＴに付された番号は、３種類のＢＣＴを区別するために付されており、順番を示すものではない。したがって、各ＢＣＴが区別される限り、第１、第２及び第３の番号が適宜入れ替えられてもよい。

【0067】

以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態で説明したフローチャート、シーケンス、実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。

【符号の説明】

【0068】

１…情報処理システム、１０…生成装置、２０…フィルタ装置、１１…プロセッサ、１２…記憶装置、１３…通信装置、１４…入出力装置、１０１…格納部、１０２…第１抽出部、１０３…第２抽出部、１０４…生成部、２０１…取得部、２０２…フィルタ部、２０３…出力部

【要約】

【課題】コンテンツのフィルタリングの精度を向上させること。
【解決手段】情報処理システム１は、フィルタリング対象であると判断された第１コンテンツに含まれる第１行動変容手法（ＢＣＴ）の成分に関する第１ＢＣＴ成分情報を抽出する第１抽出部と、フィルタリング対象であると判断されていない第２コンテンツに含まれる第２行動変容手法（ＢＣＴ）の成分に関する第２ＢＣＴ成分情報を抽出する第２抽出部と、前記第１ＢＣＴ成分情報及び前記第２ＢＣＴ成分情報に基づいて、フィルタリング対象のコンテンツであるか否かの判断基準となる基準情報を推定し、該基準情報に基づくモデルを生成する生成部と、を備える。
【選択図】図２Ｂ