(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024118360
(43)【公開日】2024-08-30
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06Q 30/0251 20230101AFI20240823BHJP
【FI】
G06Q30/0251
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023024735
(22)【出願日】2023-02-20
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】中村 征良
(72)【発明者】
【氏名】齋藤 裕也
(72)【発明者】
【氏名】香田 夏輝
【テーマコード(参考)】
5L030
5L049
【Fターム(参考)】
5L030BB08
5L049BB08
(57)【要約】
【課題】固定観念を示す情報が配信コンテンツに含まれるか否かを推定する技術を提供する。
【解決手段】本願に係る情報処理装置は、配信されるコンテンツの情報を示すコンテンツ情報を取得する取得部と、コンテンツ情報と、コンテンツ情報に含まれるステレオタイプを示す情報を示すステレオタイプ情報と、の関係を含む学習情報を学習して生成されたモデルを示す判定モデルによって、コンテンツ情報にステレオタイプが含まれるか否かを判定する判定部と、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
配信されるコンテンツの情報を示すコンテンツ情報を取得する取得部と、
前記コンテンツ情報と、前記コンテンツ情報に含まれるステレオタイプを示す情報を示すステレオタイプ情報と、の関係を含む学習情報を学習して生成されたモデルを示す判定モデルによって、前記コンテンツ情報にステレオタイプが含まれるか否かを判定する判定部と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記学習情報は、前記コンテンツ情報と、前記コンテンツ情報に付随する付随コンテンツの情報を示す付随コンテンツ情報と、前記コンテンツに対するユーザのアクションの情報を示すアクション情報と、前記ステレオタイプ情報と、の関係を含み、
前記学習情報に含まれる前記ステレオタイプ情報は、前記付随コンテンツ情報及び前記アクション情報の少なくともいずれかに含まれるステレオタイプを示す情報である
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記コンテンツ情報と当該コンテンツ情報に対応する前記アクション情報とを紐づけて複数収集する収集部と、
収集した前記コンテンツ情報に付随する前記付随コンテンツ情報と前記アクション情報の少なくともいずれかにステレオタイプが含まれるか否かを推定する推定部と、
前記コンテンツ情報と、前記付随コンテンツ情報と、前記アクション情報と、推定されたステレオタイプの情報を示す前記ステレオタイプ情報と、の関係を含む学習情報を学習させた前記判定モデルを生成する学習部と、
を備えることを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記推定部は、前記コンテンツ情報に付随する前記付随コンテンツ情報及び前記アクション情報を内容に基づいて複数の属性に分類し、各々の前記属性に分類された前記付随コンテンツ情報及び前記アクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれるか否かを推定する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記推定部は、各々の前記属性に分類された前記付随コンテンツ情報及び前記アクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれる可能性の指標であるスコアの情報を示すスコア情報を推定し、
前記学習情報は、前記コンテンツ情報と、前記付随コンテンツ情報と、前記アクション情報と、前記ステレオタイプ情報と、前記スコア情報と、の関係を含む
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
情報処理装置が実行する情報処理方法であって、
配信されるコンテンツの情報を示すコンテンツ情報を取得する取得工程と、
前記コンテンツ情報と、前記コンテンツ情報に含まれるステレオタイプを示す情報を示すステレオタイプ情報と、の関係を含む学習情報を学習して生成されたモデルを示す判定モデルによって、前記コンテンツ情報にステレオタイプが含まれるか否かを判定する判定工程と、
を含むことを特徴とする情報処理方法。
【請求項7】
配信されるコンテンツの情報を示すコンテンツ情報を取得する取得手順と、
前記コンテンツ情報と、前記コンテンツ情報に含まれるステレオタイプを示す情報を示すステレオタイプ情報と、の関係を含む学習情報を学習して生成されたモデルを示す判定モデルによって、前記コンテンツ情報にステレオタイプが含まれるか否かを判定する判定手順と、
をコンピュータに実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
【背景技術】
【0002】
情報の配信先となる利用者の属性を示す属性情報を配信先情報として予め登録しておき、配信先となる利用者の属性情報と対応する広告を選択的に配信するターゲティング配信が行われている。
【0003】
例えば、広告と属性情報との見かけ上の関連性の程度、及び複数の広告と属性情報との平均的な関連性の程度に基づいて、広告と属性情報との真の関連性を算出する技術が開示されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、近年、人種や、国籍、性別、身体的特徴等に対する固定観念等の類型化された観念であるステレオタイプを撤廃させようという流れが世界的に起こっている。このような問題意識に対応して、広告やニュース等の配信情報もステレオタイプに偏らない仕組みが求められる。しかしながら、単に配信情報をランダマイズしてしまうと、ステレオタイプを含まない配信情報までランダマイズされてしまい、ターゲティング配信ができなくなってしまう。
【0006】
本願は、上記に鑑みてなされたものであって、固定観念を示す情報が配信コンテンツに含まれるか否かを推定する技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る情報処理装置は、配信されるコンテンツの情報を示すコンテンツ情報を取得する取得部と、前記コンテンツ情報と、前記コンテンツ情報に含まれるステレオタイプを示す情報を示すステレオタイプ情報と、の関係を含む学習情報を学習して生成されたモデルを示す判定モデルによって、前記コンテンツ情報にステレオタイプが含まれるか否かを判定する判定部と、を備えることを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、固定観念を示す情報が配信コンテンツに含まれるか否かを推定することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報処理の概要を示す図である。
【
図2】
図2は、実施形態に係る情報処理システムの構成例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【
図4】
図4は、学習情報記憶部の一例を示す図である。
【
図5】
図5は、実施形態に係る情報処理の流れの一例を示すフローチャートである。
【
図6】
図6は、実施形態に係る情報処理の流れの別の一例を示すフローチャートである。
【
図7】
図7は、ハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法及びプログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及びプログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
[実施形態]
〔1.情報処理の概要〕
まず、
図1を参照し、実施形態に係る情報処理装置1を有する情報処理システム100による情報処理の概要について説明する。
図1は、実施形態に係る情報処理の概要を示す図である。
図1に示すように、情報処理システム100は、情報処理装置1、配信サーバ2、事業者端末3-1、3-2、及び利用者端末4を有する。情報処理装置1、配信サーバ2、事業者端末3-1、3-2、及び利用者端末4は、ネットワークN(例えば、
図2参照)を介して有線又は無線により通信可能に接続される。
【0012】
なお、
図1に示す情報処理システム100には、複数の事業者M1及び各々の事業者M1によって利用される複数台の事業者端末3-1や、複数の事業者M2及び各々の事業者M2によって利用される複数台の事業者端末3-2や、複数のユーザU(利用者)及び各々のユーザUによって利用される複数台の利用者端末4が含まれてもよい。
【0013】
情報処理装置1は、各種の情報処理を行うサーバ装置(コンピュータ)である。情報処理装置1は、クラウドシステム等により実現されてもよい。情報処理装置1は、情報処理システム100の各装置から取得した各種の情報を用いて、各種の処理を実行する。情報処理装置1は、例えば、利用者端末4に配信されるコンテンツの情報を示すコンテンツ情報及びコンテンツに対するユーザUのアクションの情報を示すアクション情報を収集し、当該コンテンツ情報に固定観念を示す情報、すなわちステレオタイプが含まれるか否かを推定する。また、情報処理装置1は、例えば、新たに配信対象となるコンテンツの情報を示すコンテンツ情報を取得し、当該コンテンツ情報にステレオタイプが含まれているか否かを判定する。
【0014】
配信サーバ2は、ユーザUに対して広告又はニュース等の各種のコンテンツを配信するサーバ装置である。配信サーバ2は、クラウドシステム等により実現されてもよい。また、情報処理装置1と、配信サーバ2とは、同一のサーバ装置やクラウドシステム等により実現されてもよい。配信サーバ2は、コンテンツの配信の依頼元が利用する依頼元装置から各種のコンテンツの配信の依頼を受け付け、依頼を受け付けたコンテンツを配信する。配信サーバ2は、事業者端末3-1からコンテンツの配信の依頼を受け付け、依頼されたコンテンツを利用者端末4に配信する。
【0015】
また、配信サーバ2は、コンテンツに対して行われたユーザUのアクションの情報を示すアクション情報を取得する。配信サーバ2は、コンテンツの配信履歴、利用者端末4へ配信されたコンテンツ及び当該コンテンツに対するユーザUのアクションの履歴を示すアクション履歴を保持している。アクション履歴は、例えば、配信されたコンテンツへのユーザUによるアクセス履歴や、クリック操作等の各種の操作を含むユーザUの操作履歴、コンテンツに対して投稿されたユーザUの投稿情報等を含む。
【0016】
事業者端末3-1は、事業者M1(オペレータ)によって使用される情報処理端末(コンピュータ)である。事業者M1は、広告又はニュース等のコンテンツを作成、提供する事業者、あるいは当該事業者に代行してコンテンツを取り扱う事業者等である。事業者M1は、事業者端末3-1を操作して、配信サーバ2にアクセスし、広告又はニュース等のコンテンツの配信を依頼する。
【0017】
事業者端末3-2は、事業者M2(オペレータ)によって使用される情報処理端末(コンピュータ)である。事業者M2は、広告又はニュース等のコンテンツを作成、提供する事業者、当該事業者に代行してコンテンツを取り扱う事業者、あるいは事業者に対して取り扱うコンテンツの課題や改善点等に関する提案を行う事業者等である。なお、事業者端末3-1と事業者端末3-2とは、重複してもよい。
【0018】
事業者端末3-1、3-2の典型例としては、ノート型PC(Personal Computer)又はデスクトップPCが想定されるが、スマートフォン、タブレット型端末、携帯電話機、又はPDA(Personal Digital Assistant)等により実現されてもよい。また、事業者端末3-1は、無線LAN(Local Area Network)等の近距離無線通信を介してネットワークNに接続し、配信サーバ2及び情報処理装置1と通信を行うことができる。
【0019】
利用者端末4は、ユーザUによって使用される情報処理端末(コンピュータ)である。ユーザUは、広告又はニュース等のコンテンツが配信され、コンテンツに対してアクセス、クリック、投稿等を行う利用者である。ユーザUは、利用者端末4を操作することで、広告又はニュース等の各種のコンテンツを閲覧したり、コンテンツに対して投稿したりするための各種の行動を行う。
【0020】
利用者端末4の典型例としては、スマートフォンが想定されるが、タブレット型端末、ノート型PC、デスクトップPC、携帯電話機、又はPDA等により実現されてもよい。また、利用者端末4は、LTE(Long Term Evolution)、4G(4th Generation)、5G(5th Generation:第5世代移動通信システム)等の無線通信網や、Bluetooth(登録商標)、無線LAN等の近距離無線通信を介してネットワークNに接続し、任意のサーバ装置と通信を行うことができる。
【0021】
図1に示すように、まず、事業者M1が利用する事業者端末3-1は、広告又はニュース等のコンテンツの配信を依頼する処理を行う(ステップS1)。例えば、事業者端末3-1は、事業者M1の操作に応じてコンテンツの配信を配信サーバ2に依頼し、配信サーバ2は、事業者端末3-1からの依頼に応じて事業者M1のコンテンツを利用者端末4への配信対象に追加する。
【0022】
利用者端末4には、広告又はニュース等のコンテンツが配信される(ステップS2)。
例えば、配信サーバ2は、ユーザUが利用する利用者端末4からの要求に応じて、要求されたコンテンツを利用者端末4に配信する。例えば、配信サーバ2は、利用者端末4からの広告の要求に応じて、要求された広告を利用者端末4に配信する。ここで、要求には、利用者端末4に紐づいたユーザUの属性情報や、サイトの閲覧履歴情報、購入履歴情報、広告情報を表示するニュースサイト、動画サイト、SNS(Social Networking Service)、ショッピングサイト等任意の表示媒体に関する情報等が含まれる。
【0023】
ユーザUは、配信されたコンテンツに対してアクションを行う。アクションとは、配信されたコンテンツに対するユーザUの行動を示し、例えば、配信されたコンテンツへのアクセス行動、閲覧行動、クリック操作等の操作行動、コンテンツに対する投稿行動等を含む。配信サーバ2は、コンテンツに対して行われたユーザUのアクションを示すアクション情報を取得する(ステップS3)。
【0024】
また、情報処理装置1は、配信サーバ2からコンテンツ情報及びアクション情報を収集する(ステップS4)。コンテンツ情報は、配信サーバ2から利用者端末4に配信されるコンテンツの情報である。コンテンツ情報は、コンテンツに付随する付随コンテンツの情報を示す付随コンテンツ情報を含む。例えば、コンテンツがニュースである場合、付随コンテンツは、コメントのテキストデータを含む。例えば、コンテンツが広告である場合、付随コンテンツは、広告に含まれる文字列のテキストデータを含む。情報処理装置1は、事業者端末3-1又は利用者端末4から各種情報を収集してもよい。所定のコンテンツ情報と当該コンテンツ情報に対応するアクション情報とを紐づけて複数収集する。
【0025】
次いで、情報処理装置1は、収集したコンテンツ情報に付随する付随コンテンツ情報とアクション情報の少なくともいずれかにステレオタイプが含まれるか否かを推定する(ステップS5)。具体的には、情報処理装置1は、まず、コンテンツ情報から付随コンテンツ情報を抽出する。情報処理装置1は、次いで、付随コンテンツ情報及びアクション情報を、内容に基づいて複数の属性に分類する。属性とは、例えば、人種や、国籍、出身又は居住地域、性別、年齢、血液型、身体的特徴、職業等を含む。
【0026】
情報処理装置1は、次いで、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りを推定する。情報処理装置1は、例えば、公知のWord2Vec等の自然言語処理における単語の分散表現(単語ベクトル)を用いて付随コンテンツ情報及びアクション情報の偏りを推定する。分散表現とは、文字・単語をベクトル空間に埋め込み、その空間上のひとつの点として捉えることであり、単語埋め込み(Word Embedding)とも呼ばれる。情報処理装置1は、例えば、コンテンツ情報に対応する複数の付随コンテンツ情報及びアクション情報に含まれる文字及び単語を各々の点としてベクトル空間に埋め込み、ベクトル空間上における点の分散の偏りを算出する。情報処理装置1は、次いで、この偏りの度合いに基づいて、コンテンツ情報にステレオタイプが含まれるか否かを推定する。例えば、分類した属性のうちいずれかの属性に所定の閾値を超える偏りが生じている場合、当該属性の付随コンテンツ情報及びアクション情報がステレオタイプであると推定する。
【0027】
情報処理装置1は、各々の属性に分類された付随コンテンツ情報及びアクション情報の数に基づいて偏りを推定してもよい。すなわち、情報処理装置1は、分類した属性のうちいずれかの属性に分類した付随コンテンツ情報及びアクション情報の数が所定の閾値を超えた場合、当該属性の付随コンテンツ情報及びアクション情報がステレオタイプであると推定する。情報処理装置1は、また、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれる可能性の指標であるスコアの情報を示すスコア情報を推定してもよい。
【0028】
情報処理装置1は、モデル学習を実施する(ステップS6)。具体的には、情報処理装置1は、コンテンツ情報と、付随コンテンツ情報と、アクション情報と、コンテンツ情報に含まれると推定されたステレオタイプの情報を示すステレオタイプ情報と、スコア情報と、の関係を含む学習情報を学習させ、判定モデルを生成する。判定モデルは、例えば、コンテンツ情報及び付随コンテンツ情報を入力することで、ステレオタイプ情報及びスコア情報が出力される。
【0029】
事業者M2が利用する事業者端末3-2は、広告又はニュース等の新たに用意したコンテンツにステレオタイプが含まれているか否かの判定を依頼する処理を行う(ステップS7)。情報処理装置1は、事業者M2が判定を依頼するコンテンツの情報を示すコンテンツ情報を取得する。
【0030】
次いで、情報処理装置1は、取得したコンテンツ情報にステレオタイプが含まれるか否かを学習情報に基づいて判定する(ステップS8)。具体的には、情報処理装置1は、まず、コンテンツ情報から付随コンテンツ情報を抽出する。情報処理装置1は、コンテンツ情報及び付随コンテンツ情報をモデルに入力し、出力として、ステレオタイプ情報及びスコア情報を得る。
【0031】
次いで、情報処理装置1は、判定したコンテンツのステレオタイプ情報及びスコア情報を事業者M2に提示するための判定結果情報を、ネットワークN(
図2参照)を介して、事業者M2の事業者端末3-2に提供する(ステップS9)。そして、事業者M2の事業者端末3-2は、判定結果情報を表示することとなる。
【0032】
〔2.情報処理システムの構成〕
次に、
図2を用いて、実施形態に係る情報処理装置1を有する情報処理システム100の構成について説明する。
図2は、実施形態に係る情報処理システム100の構成例を示す図である。
図2に示すように、情報処理システム100は、情報処理装置1と、配信サーバ2と、事業者端末3-1、3-2と、利用者端末4と、を有する。
【0033】
情報処理装置1、配信サーバ2、事業者端末3-1、3-2、及び利用者端末4は、ネットワークNを介して有線又は無線により通信可能に接続される。ネットワークNは、例えば、LANや、インターネット等のWAN(Wide Area Network)である。なお、ネットワークNは、例えば、4G又は5G等の移動体通信システム等を含む構成であるが、かかる例に限定されない。また、
図2に示す情報処理システム100に含まれる各装置の数は図示したものに限られない。例えば、
図2では、図示の簡略化のため、事業者端末3-1、3-2及び利用者端末4を1台ずつのみ示したが、これはあくまでも例示であって限定されるものではなく、それぞれ2台以上であってもよい。
【0034】
〔3.情報処理装置の構成〕
次に、
図3を用いて、実施形態に係る情報処理装置1の構成について説明する。
図3は、実施形態に係る情報処理装置1の構成例を示す図である。
図3に示すように、情報処理装置1は、通信部10と、制御部20と、記憶部30と、を備える。なお、情報処理装置1は、情報処理装置1を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0035】
通信部10は、例えば、NIC(Network Interface Card)等によって実現される。通信部10は、ネットワークN(
図2参照)と有線又は無線で接続され、配信サーバ2、事業者端末3-1、3-2、及び利用者端末4との間で情報の送受信を行う。
【0036】
制御部20は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置1内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部20は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
図3に示すように、制御部20は、収集部21と、推定部22と、学習部23と、取得部24と、判定部25と、提供部26と、有する。
【0037】
収集部21は、コンテンツ情報と、当該コンテンツ情報に対応するアクション情報とを紐づけて複数収集する。コンテンツ情報は、配信サーバ2によってユーザUが操作する利用者端末4に配信されるコンテンツの情報を含む。コンテンツ情報は、コンテンツに付随する付随コンテンツの情報を示す付随コンテンツ情報を含む。アクション情報は、1つのコンテンツに対して複数のユーザUによって行われた各々のアクションの情報を含む。収集部21は、収集したコンテンツ情報を、後述のコンテンツ情報記憶部31に蓄積して記憶させる。収集部21は、収集したアクション情報を、後述のアクション情報記憶部32に蓄積して記憶させる。この際、収集部21は、アクション情報がいずれのコンテンツ情報に対応するアクション情報であるかを識別するための識別番号等の識別情報とともに各情報を記憶させる。
【0038】
推定部22は、収集部21が収集したコンテンツ情報について、対応する付随コンテンツ及びアクション情報に基づいて、コンテンツ情報にステレオタイプが含まれるか否かを推定する。推定部22は、収集したコンテンツ情報に付随する付随コンテンツ情報とアクション情報の少なくともいずれかにステレオタイプが含まれるか否かを推定する。推定部22は、コンテンツ情報から付随コンテンツ情報を抽出する。推定部22は、付随コンテンツ情報及びアクション情報を、内容に基づいて複数の属性に分類する。ここで、属性は、後述の属性情報記憶部33に記憶された属性情報から参照されてもよい。
【0039】
推定部22は、例えば、自然言語処理における単語の分散表現を用いて、付随コンテンツ情報及びアクション情報に含まれる文字及び単語を各々の点としてベクトル空間に埋め込む。推定部22は、ベクトル空間上における点の偏りを算出し、この偏りの度合いに基づいて、コンテンツ情報にステレオタイプが含まれるか否かを推定する。推定部22は、分類した属性のうちいずれかの属性に所定の閾値を超える偏りが生じている場合、当該属性の付随コンテンツ情報及びアクション情報がステレオタイプであると推定してもよい。推定部22は、各々の属性に分類した属性のうちいずれかの属性に分類した付随コンテンツ情報及びアクション情報の数が所定の閾値を超えた場合、当該属性の付随コンテンツ情報及びアクション情報がステレオタイプであると推定してもよい。推定部22は、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれる可能性の指標であるスコアの情報を示すスコア情報を推定してもよい。
【0040】
学習部23は、コンテンツ情報と、付随コンテンツ情報と、アクション情報と、コンテンツ情報に含まれると推定されたステレオタイプの情報を示すステレオタイプ情報と、スコア情報と、を対応づけ、学習情報として、後述の学習情報記憶部34に蓄積して記憶させる。学習情報に含まれるステレオタイプ情報は、付随コンテンツ情報及びアクション情報の少なくともいずれかに含まれるステレオタイプを示す情報である。ステレオタイプ情報は、付随コンテンツ情報及びアクション情報のいずれにもステレオタイプが含まれない、という情報を含んでもよい。学習部23は、コンテンツ情報と、ステレオタイプ情報と、の関係を含む学習情報を学習させ、判定モデルを生成する。学習部23は、コンテンツ情報と、付随コンテンツ情報と、アクション情報と、ステレオタイプ情報と、スコア情報と、の関係を含む学習情報を学習させ、判定モデルを生成する。判定モデルは、例えば、コンテンツ情報及び付随コンテンツ情報を入力することで、ステレオタイプ情報及びスコア情報を出力する。
【0041】
取得部24は、事業者M2が利用する事業者端末3-2から送信されたコンテンツ情報を取得する。取得部24は、当該コンテンツ情報にステレオタイプが含まれているか否かの判定を依頼する処理が事業者端末3-2によって行われた場合、当該コンテンツ情報を、ネットワークN(
図2参照)及び通信部10を介して取得する。コンテンツ情報は、例えば、事業者M2が新たに作成し、配信サーバ2に配信依頼をする前のコンテンツの情報を含む。
【0042】
判定部25は、取得部24が取得したコンテンツ情報にステレオタイプが含まれるか否かを判定モデルによって判定する。判定部25は、まず、コンテンツ情報から付随コンテンツ情報を抽出する。次いで、判定部25は、コンテンツ情報及び付随コンテンツ情報を判定モデルに入力し、出力として、ステレオタイプ情報及びスコア情報を得る。
【0043】
提供部26は、判定部25によって判定されたコンテンツのステレオタイプ情報及びスコア情報を提示するための判定結果情報を、ネットワークN(
図2参照)を介して、事業者M2の事業者端末3-2に送信することで、コンテンツのステレオタイプ情報及びスコア情報を提示するための判定結果情報を事業者M2に提供する。
【0044】
記憶部30は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、光ディスク等の記憶装置によって実現される。
図3に示すように、記憶部30は、コンテンツ情報記憶部31と、アクション情報記憶部32と、属性情報記憶部33と、学習情報記憶部34と、を有する。
【0045】
コンテンツ情報記憶部31には、収集部21が収集したコンテンツ情報が記憶される。コンテンツ情報は、コンテンツに付随する付随コンテンツの情報を示す付随コンテンツ情報を含む。
【0046】
アクション情報記憶部32には、収集部21が収集したアクション情報が記憶される。ここで、コンテンツ情報記憶部31に記憶されたコンテンツ情報と、アクション情報記憶部32に記憶されたアクション情報とは、紐づけられて各々に記憶されている。すなわち、アクション情報がいずれのコンテンツ情報に対応するアクション情報であるかを識別するための識別番号等の識別情報とともに各情報が記憶されている。
【0047】
属性情報記憶部33には、属性情報が記憶される。ここで、属性情報は、例えば、人種や、国籍、出身又は居住地域、性別、年齢、血液型、身体的特徴、職業等を示す文字列の情報を含む。また、属性情報は、1つの属性を意味する複数種類の文字列の情報を含んでもよい。
【0048】
学習情報記憶部34には、学習情報が記憶される。学習情報は、コンテンツ情報にステレオタイプが含まれるか否かを判定する判定モデルを学習させるために蓄積された情報である。学習情報は、少なくとも、コンテンツ情報と、コンテンツ情報に含まれると推定されたステレオタイプの情報を示すステレオタイプ情報と、を少なくとも含み、互いが対応つけられている。実施形態の学習情報は、コンテンツ情報と、付随コンテンツ情報と、アクション情報と、ステレオタイプ情報と、スコア情報と、を含み、互いが対応つけられている。
【0049】
図4は、学習情報記憶部34の一例を示す図である。
図4に示す例では、学習情報記憶部34は、「コンテンツ情報」、「付随コンテンツ情報」、「アクション情報」、「ステレオタイプ情報」及び「スコア情報」といった項目を有する。
【0050】
「コンテンツ情報」は、配信される広告又はニュース等の各種のコンテンツの情報を示す。「コンテンツ情報」は、コンテンツを識別するための識別情報、及び当該コンテンツに含まれる文字列のテキストデータを含む。「コンテンツ情報」は、当該コンテンツのレイアウトデータや、当該コンテンツに含まれる画像データ及び映像データ、当該コンテンツを提供する配信元を示す配信元情報を含んでもよい。
【0051】
「付随コンテンツ情報」は、「コンテンツ情報」に含まれる付随コンテンツの情報を示す。「付随コンテンツ情報」は、「コンテンツ情報」から抽出された当該コンテンツに含まれるテキストデータを含む。「付随コンテンツ情報」は、公知の画像認識技術を用いて「コンテンツ情報」に含まれる画像データ及び映像データから抽出された人物、物体、建造物、風景等の種類を示す文字列のテキストデータを含んでもよい。
【0052】
「アクション情報」は、コンテンツに対して行われたユーザUのアクションの情報を示す。「アクション情報」は、ユーザUの利用者端末4による、配信されたコンテンツへのアクセス行動、閲覧行動、クリック操作等の操作行動、コンテンツに対する投稿行動等の情報を含む。
【0053】
「ステレオタイプ情報」は、「コンテンツ情報」に含まれるステレオタイプを示す情報を示す。より詳しくは、「ステレオタイプ情報」は、「付随コンテンツ情報」及び「アクション情報」の少なくともいずれかに含まれるステレオタイプを示す情報を示す。
【0054】
「スコア情報」は、「コンテンツ情報」にステレオタイプが含まれる可能性の指標であるスコアの情報を示す。「スコア情報」は、スコアが高いほど、「コンテンツ情報」にステレオタイプが含まれる可能性が高いことを示す。「コンテンツ情報」にステレオタイプが含まれない場合、「スコア情報」のスコアはゼロとなる。
【0055】
例えば、
図4に示す例において、「コンテンツ情報#1」から「付随コンテンツ情報#1」が抽出され、この「付随コンテンツ情報#1」及び「コンテンツ情報#1」に対するユーザUの「アクション情報#1」の少なくともいずれかに含まれると判定されたステレオタイプは「ステレオタイプ情報#1」に示すとおりであり、「コンテンツ情報#1」にステレオタイプが含まれる可能性の指標であるスコアは「スコア情報#1」に示すとおりである。
【0056】
ここで、
図4に示す例では、「コンテンツ情報#1」、「付随コンテンツ情報#1」、「アクション情報#1」、「ステレオタイプ情報#1」及び「スコア情報#1」といった抽象的な値を用いて図示するが、「コンテンツ情報#1」、「付随コンテンツ情報#1」、「アクション情報#1」、「ステレオタイプ情報#1」及び「スコア情報#1」には、具体的な文字列や数値等の情報が記憶されているものとする。なお、学習情報記憶部34は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
【0057】
〔4.情報処理装置の処理フロー〕
次に、
図5及び
図6を用いて、実施形態に係る情報処理装置1による処理手順について説明する。
図5は、実施形態に係る情報処理の流れの一例を示すフローチャートである。
図5に示す処理は、コンテンツ情報にステレオタイプが含まれるか否かを判定する判定モデルを学習させるための学習情報を蓄積させるための処理である。
【0058】
図5に示すように、まず、情報処理装置1は、コンテンツ情報と、配信されたコンテンツに対するユーザUのアクション情報と、を取得する(ステップS101)。具体的には、通信部10が、コンテンツを配信する配信サーバ2からネットワークNを介してコンテンツ情報及びアクション情報を受信する。収集部21は、コンテンツ情報と、当該コンテンツ情報に対応するアクション情報とを紐づけて複数収集する。ここで、アクション情報は、1つのコンテンツに対して複数のユーザUによって行われた各々のアクションの情報を含む。
【0059】
次いで、情報処理装置1は、コンテンツ情報に付随する付随コンテンツ情報及びアクション情報を、内容に基づいて複数の属性に分類する(ステップS102)。具体的には、推定部22が、コンテンツ情報から付随コンテンツ情報を抽出し、付随コンテンツ情報及びアクション情報を、内容に基づいて複数の属性に分類する。
【0060】
次いで、情報処理装置1は、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りの度合いに基づいて、ステレオタイプ及びスコアを推定する(ステップS103)。具体的には、推定部22が、例えば、自然言語処理における単語の分散表現を用いて、付随コンテンツ情報及びアクション情報に含まれる文字及び単語を各々の点としてベクトル空間に埋め込み、ベクトル空間上における点の分散の偏りを算出し、この偏りの度合いに基づいて、コンテンツ情報にステレオタイプが含まれるか否かを推定する。偏りは、例えば、分類した属性のうちいずれかの属性に所定の閾値を超えることであってもよい。また、偏りは、例えば、各々の属性に分類した属性のうちいずれかの属性に分類した付随コンテンツ情報及びアクション情報の数が所定の閾値を超えることであってもよい。また、推定部22が、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれる可能性の指標であるスコアの情報を示すスコア情報を推定する。
【0061】
次いで、情報処理装置1は、コンテンツ情報、付随コンテンツ情報、アクション情報、
ステレオタイプ情報、及びスコア情報を対応付けて、学習情報に蓄積する(ステップS104)。具体的には、学習部23が、これら情報を対応づけ、学習情報として、学習情報記憶部34に蓄積して記憶させる。
【0062】
学習部23は、学習情報に含まれる各々の情報の関係を学習させ、判定モデルを生成する。判定モデルは、例えば、コンテンツ情報及び付随コンテンツ情報を入力することで、ステレオタイプ情報及びスコア情報を出力することができる。学習部23は、学習情報に新たな情報が蓄積されることで、判定モデルを更新させる。
【0063】
図6は、実施形態に係る情報処理の流れの別の一例を示すフローチャートである。
図6に示す処理は、
図5に示す処理によって生成、更新された判定モデルが用いられる。
【0064】
図6に示すように、まず、情報処理装置1は、コンテンツ情報を取得する(ステップS111)。具体的には、例えば、当該コンテンツ情報にステレオタイプが含まれているか否かの判定を依頼する処理が事業者端末3-2によって行われた場合、取得部24が、事業者M2が利用する事業者端末3-2から送信されたコンテンツ情報を取得する。
【0065】
次いで、情報処理装置1は、学習情報によって、コンテンツ情報にステレオタイプ情報が含まれるか否かを判定する(ステップS112)。具体的には、判定部25が、コンテンツ情報から付随コンテンツ情報を抽出し、コンテンツ情報及び付随コンテンツ情報を、学習情報で学習させた判定モデルに入力し、出力として、ステレオタイプ情報及びスコア情報を得る。すなわち、判定部25は、取得部24が取得したコンテンツ情報にステレオタイプが含まれるか否かを判定モデルによって判定する。
【0066】
次いで、情報処理装置1は、判定結果を提供する(ステップS113)。具体的には、提供部26が、判定されたコンテンツのステレオタイプ情報及びスコア情報を提示するための判定結果情報を、通信部10及びネットワークNを介して事業者M2の事業者端末3-2に送信することで、コンテンツのステレオタイプ情報及びスコア情報を提示するための判定結果情報を事業者M2に提供する。
【0067】
〔5.変形例〕
上記では、情報処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、情報処理の変形例について説明する。
【0068】
例えば、上記実施形態では、情報処理システム100に、各種のコンテンツを配信するとともに当該コンテンツに対するユーザUのアクション情報を取得する機能を備える配信サーバ2が含まれる例について説明したが、実施形態は、これに限定されるものではない。例えば、情報処理装置1は、アクション情報を取得する機能を備えていてもよい。このような場合、情報処理装置1は、配信サーバ2を介さず、利用者端末4からアクション情報を取得して蓄積してもよい。
【0069】
また、例えば、情報処理装置1は、各種のコンテンツを配信する機能を備えていてもよい。このような場合、情報処理装置1は、配信サーバ2を介さず、利用者端末4に各種のコンテンツを配信してもよい。情報処理装置1が各種のコンテンツを配信する構成やアクション情報を取得する構成を有する場合、情報処理システム100は、配信サーバ2を有さずともよい。情報処理装置1が配信サーバ2と同一のサーバ装置やクラウドシステム等により実現される場合、例えば、ステレオタイプが含まれると推定したコンテンツを配信対象から除外したり、スコアに応じて当該コンテンツの配信頻度を下げたりする調整機能を備えていてもよい。
【0070】
また、上記実施形態において、情報処理装置1が実行している処理の一部又は全部は、実際には、事業者端末3-2が実行してもよい。例えば、スタンドアローン(Stand-alone)で(事業者端末3-2単体で)処理が完結してもよい。この場合、事業者端末3-2に、上記の実施形態における情報処理装置1の機能が備わっているものとする。また、上記の実施形態では、事業者端末3-2は情報処理装置1と連携しているため、事業者M2から見れば、情報処理装置1の処理も事業者端末3-2が実行しているように見える。すなわち、他の観点では、事業者端末3-2は、情報処理装置1を備えているともいえる。
【0071】
また、上記実施形態における情報処理装置1の制御部20の内部構成は、
図3に示した構成に限られず、上述した情報処理を行う構成であれば他の構成であってもよい。また、制御部20が有する各処理部の接続関係は、
図3に示した接続関係に限られず、他の接続関係であってもよい。
【0072】
〔6.効果〕
上述したように、情報処理装置1は、固定観念を示す情報、すなわちステレオタイプが配信コンテンツに含まれるか否かを推定することができる。例えば、情報処理装置1は、配信されるコンテンツの情報を示すコンテンツ情報と、コンテンツ情報に含まれるステレオタイプを示す情報を示すステレオタイプ情報と、の関係を含む学習情報を学習して生成されたモデルを示す判定モデルによって、コンテンツ情報にステレオタイプが含まれるか否かを判定できる。例えば、学習情報は、コンテンツ情報と、コンテンツ情報に付随する付随コンテンツの情報を示す付随コンテンツ情報と、コンテンツに対するユーザUのアクションの情報を示すアクション情報と、ステレオタイプ情報と、の関係を含む。この場合、学習情報に含まれるステレオタイプ情報は、付随コンテンツ情報及びアクション情報の少なくともいずれかに含まれるステレオタイプを示す情報である。
【0073】
また、情報処理装置1は、配信コンテンツにステレオタイプが含まれるか否かの判定結果を提示するための判定結果情報を生成し、事業者M2に提供することができる。事業者M2は、配信コンテンツに対して判定されたステレオタイプ情報及びスコア情報を確認することで、配信コンテンツのステレオタイプに関する良否を判断することができる。したがって、事業者M2は、例えば、コンテンツを配信する前に、ステレオタイプが含まれるか否かを判定でき、ステレオタイプを避けることができる。また、例えば、判定結果に基づいてステレオタイプの偏りの程度を調整することで、ターゲティング配信を行いつつもレピュテーションリスクを抑制することが可能である。
【0074】
また、情報処理装置1は、コンテンツ情報と当該コンテンツ情報に対応するアクション情報とを紐づけて複数収集し、収集したコンテンツ情報に付随する付随コンテンツ情報とアクション情報の少なくともいずれかにステレオタイプが含まれるか否かを推定することができる。また、情報処理装置1は、コンテンツ情報と、付随コンテンツ情報と、アクション情報と、推定されたステレオタイプの情報を示すステレオタイプ情報と、の関係を含む学習情報を学習させた判定モデルを生成することができる。
【0075】
また、情報処理装置1は、コンテンツ情報に付随する付随コンテンツ情報及びアクション情報を内容に基づいて複数の属性に分類し、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれるか否かを推定することができる。また、情報処理装置1は、各々の属性に分類された付随コンテンツ情報及びアクション情報の偏りの度合いに基づいて、当該コンテンツ情報にステレオタイプが含まれる可能性の指標であるスコアの情報を示すスコア情報を推定することができる。この場合、学習情報は、コンテンツ情報と、付随コンテンツ情報と、アクション情報と、ステレオタイプ情報と、スコア情報と、の関係を含む。このように、情報処理装置1は、配信されているコンテンツに基づいて、ステレオタイプを判定する判定モデルを生成、更新するため、時間とともに変化するステレオタイプにも対応することができる。
【0076】
〔7.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置1は、例えば
図7に示すような構成のコンピュータ80によって実現される。
図7は、ハードウェア構成の一例を示す図である。コンピュータ80は、CPU81、RAM82、ROM(Read Only Memory)83、HDD84、通信インターフェイス(I/F)85、入出力インターフェイス(I/F)86、及びメディアインターフェイス(I/F)87を有する。
【0077】
CPU81は、ROM83又はHDD84に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM83は、コンピュータ80の起動時にCPU81によって実行されるブートプログラムや、コンピュータ80のハードウェアに依存するプログラム等を記憶する。
【0078】
HDD84は、CPU81によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス85は、ネットワークN(
図2参照)を介して他の機器からデータを受信してCPU81へ送り、CPU81が生成したデータを、ネットワークNを介して他の機器に送信する。
【0079】
CPU81は、入出力インターフェイス86を介して、ディスプレイやプリンタ等の出力装置、及び、キーボード又はマウス等の入力装置を制御する。CPU81は、入出力インターフェイス86を介して、入力装置からデータを取得する。また、CPU81は、入出力インターフェイス86を介して生成したデータを出力装置に出力する。
【0080】
メディアインターフェイス87は、記録媒体88に記憶されたプログラム又はデータを読み取り、RAM82を介してCPU81に提供する。CPU81は、かかるプログラムを、メディアインターフェイス87を介して記録媒体88からRAM82上にロードし、ロードしたプログラムを実行する。記録媒体88は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、又は半導体メモリ等である。
【0081】
例えば、コンピュータ80が実施形態に係る情報処理装置1として機能する場合、コンピュータ80のCPU81は、RAM82上にロードされたプログラムを実行することにより、制御部20の機能を実現する。また、HDD84には、記憶部30内のデータが記憶される。コンピュータ80のCPU81は、これらのプログラムを記録媒体88から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0082】
〔8.その他〕
以上、本願の実施形態を説明したが、これら実施形態の内容により本発明が限定されるものではない。また、前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述した構成要素は適宜組み合わせることが可能である。さらに、前述した実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換又は変更を行うことができる。
【0083】
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0084】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
【0085】
例えば、上述した情報処理装置1は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティング等で呼び出して実現する等、構成は柔軟に変更できる。
【0086】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0087】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」等に読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0088】
1 情報処理装置
2 配信サーバ
3-1、3-2 事業者端末
4 利用者端末
10 通信部
20 制御部
21 収集部
22 推定部
23 学習部
24 取得部
25 判定部
26 提供部
30 記憶部
31 コンテンツ情報記憶部
32 アクション情報記憶部
33 属性情報記憶部
34 学習情報記憶部
100 情報処理システム