(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023076694
(43)【公開日】2023-06-01
(54)【発明の名称】抽出装置、抽出方法及び抽出プログラム
(51)【国際特許分類】
G06Q 30/0241 20230101AFI20230525BHJP
G06F 16/383 20190101ALI20230525BHJP
G06F 40/279 20200101ALI20230525BHJP
【FI】
G06Q30/0241
G06F16/383
G06F40/279
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2023062340
(22)【出願日】2023-04-06
(62)【分割の表示】P 2019149987の分割
【原出願日】2019-08-19
(71)【出願人】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】栗田 民夫
(72)【発明者】
【氏名】北久保 理絵子
(72)【発明者】
【氏名】米村 寛子
(72)【発明者】
【氏名】櫃本 優
(72)【発明者】
【氏名】浅野 俊策
(57)【要約】
【課題】発生した事象から、コンテンツに用いられることが想定されるキーワードを把握する。
【解決手段】本願に係る抽出装置は、所定の期間に発生する事象を示す事象情報(例えば、利用者の閲覧回数が所定の閾値以上であるコンテンツに関する情報)を取得する取得部と、取得部により取得された事象情報に基づいて、事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する抽出部とを備えることを特徴とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
所定の期間に発生する事象を示す事象情報を取得する取得部と、
前記取得部により取得された事象情報に基づいて、前記事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する抽出部と
を備えることを特徴とする抽出装置。
【請求項2】
前記抽出部は、
前記事象の属性に紐付けられた情報に対応するキーワードを抽出する
ことを特徴とする請求項1に記載の抽出装置。
【請求項3】
前記取得部は、
前記事象情報として、前記所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得する
ことを特徴とする請求項1または2に記載の抽出装置。
【請求項4】
前記取得部は、
前記事象情報として、前記所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する
ことを特徴とする請求項1から3のいずれか一つに記載の抽出装置。
【請求項5】
前記取得部は、
前記事象情報として、前記所定の期間に開催されるイベントを示す情報を取得する
ことを特徴とする請求項1から4のいずれか一つに記載の抽出装置。
【請求項6】
前記取得部は、
前記事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する
ことを特徴とする請求項1から5のいずれか一つに記載の抽出装置。
【請求項7】
前記取得部は、
前記事象情報として、前記配信対象のコンテンツのうち、前記所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得する
ことを特徴とする請求項1から6のいずれか一つに記載の抽出装置。
【請求項8】
前記取得部は、
前記事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、前記所定の期間において配信不可と判定されたコンテンツに関する情報を取得し、
前記抽出部は、
前記取得部により取得されたコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する
ことを特徴とする請求項1から7のいずれか一つに記載の抽出装置。
【請求項9】
前記抽出部は、
前記審査において配信不可と判定された事由であるキーワードを抽出する
ことを特徴とする請求項8に記載の抽出装置。
【請求項10】
前記抽出部は、
配信不可と判定された前記コンテンツのうち、前記提供主が提供するコンテンツと属性が類似するコンテンツからキーワードを抽出する
ことを特徴とする請求項8または9に記載の抽出装置。
【請求項11】
前記提供主のうち、前記事象と所定の関連性を有する提供主を特定する特定部と、
前記抽出部により抽出されたキーワードと、前記特定部により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する判定部
をさらに備えることを特徴とする請求項1から10のいずれか一つに記載の抽出装置。
【請求項12】
前記特定部は、
前記提供主のうち、前記事象の属性と関連するコンテンツを提供する提供主を特定する
ことを特徴とする請求項11に記載の抽出装置。
【請求項13】
前記判定部は、
前記コンテンツのうち、前記キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定する
ことを特徴とする請求項11または12に記載の抽出装置。
【請求項14】
抽出装置が実行する抽出方法であって、
所定の期間に発生する事象を示す事象情報を取得する取得工程と、
前記取得工程により取得された事象情報に基づいて、前記事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する抽出工程と
を含むことを特徴とする抽出方法。
【請求項15】
所定の期間に発生する事象を示す事象情報を取得する取得手順と、
前記取得手順により取得された事象情報に基づいて、前記事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する抽出手順と
をコンピュータに実行させるための抽出プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、抽出装置、抽出方法及び抽出プログラムに関する。
【背景技術】
【0002】
近年、コンテンツを自動的に検査する技術が知られている。このような技術の一例として、誇張表現の禁止や、下品な言葉の禁止などといった方針を広告が順守しているかを自動的に検査し、検査の結果を用いて広告を承認するかどうかを決定する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した従来技術では、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握できるとは限らない。
【0005】
例えば、上述した従来技術では、誇張表現や、下品な言葉などといった、単に公序良俗に反する単語が含まれているか否かを検査しているに過ぎない。したがって、上述した従来技術では、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握できるとは限らない。
【0006】
本願は、上記に鑑みてなされたものであって、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る抽出装置は、所定の期間に発生する事象を示す事象情報を取得する取得部と、前記取得部により取得された事象情報に基づいて、前記事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する抽出部とを備えることを特徴とする。
【発明の効果】
【0008】
実施形態の一態様によれば、発生した事象から、コンテンツに用いられることが想定されるキーワードを把握することができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る抽出処理の一例を示す図である。
【
図2】
図2は、実施形態にかかる抽出処理システムの構成例を示す図である。
【
図3】
図3は、実施形態に係る抽出装置の構成例を示す図である。
【
図4】
図4は、実施形態に係る提供主情報記憶部の一例を示す図である。
【
図5】
図5は、実施形態に係る事象情報記憶部の一例を示す図である。
【
図6】
図6は、実施形態に係る抽出処理の手順の一例を示すフローチャートである。
【
図7】
図7は、抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.実施形態〕
図1を用いて、本実施形態の抽出装置等により実現される抽出処理を説明する。
図1は、実施形態に係る抽出処理の一例を示す図である。実施形態にかかる抽出処理は、
図1に示す抽出装置100によって行われる。
【0012】
図1の説明に先立って、
図2を用いて、実施形態にかかる抽出処理システム1について説明する。
図2は、実施形態にかかる抽出処理システムの構成例を示す図である。実施形態にかかる抽出処理システム1は、
図2に示すように、提供主端末10と、外部装置20と、抽出装置100とを含む。提供主端末10、外部装置20、抽出装置100は、ネットワークNを介して有線または無線により通信可能に接続される。なお、
図2に示す抽出処理システム1には、複数台の提供主端末10や、複数台の外部装置20や、複数台の抽出装置100が含まれてよい。
【0013】
提供主端末10は、広告の提供主(広告主)によって利用される情報処理装置である。例えば、提供主端末10は、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等である。なお、
図1に示す例において、提供主端末10は、利用者によって利用されるノート型PCである場合を示す。提供主端末10は、提供主の操作に応じて広告を抽出装置100に入稿(提供)する。なお、
図1に示す例において、提供主端末10は、提供主によって利用されるノート型PCである場合を示す。
【0014】
外部装置20は、各種コンテンツを利用者に配信する情報処理装置である。なお、外部装置20が配信するコンテンツは、例えば、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピング(電子商取引)サイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、施設予約サイト、SNS(Social Networking Service)サイト、ウェブブログなどに関するコンテンツであってもよい。また、外部装置20が配信するコンテンツは、例えば、利用者が利用する端末装置にインストールされた各種アプリケーション(以下、「アプリ」と記載する場合がある)に関するコンテンツであってもよい。具体的には、ポータルアプリ、ニュースアプリ、オークションサイト、天気予報アプリ、ショッピングアプリ、ファイナンス(株価)アプリ、路線検索アプリ、地図提供アプリ、旅行アプリ、飲食店紹介アプリ、施設予約アプリ、SNSアプリ、ブログ閲覧アプリ等に関するコンテンツであってもよい。
【0015】
抽出装置100は、広告を利用者に配信する情報処理装置である。例えば、抽出装置100は、提供主端末10から提供される広告に関する情報を管理する。そして、抽出装置100は、利用者が利用する端末装置から送信される広告配信要求(例えば、外部装置20が配信するコンテンツ上で表示される広告の配信要求)に応じて、広告を当該端末装置に配信する。なお、抽出装置100は、抽出装置100の管理者によって定められたガイドラインに違反しているか否か等に基づいて審査が行われ、配信が許可された広告を配信するものとする。ここで、広告の審査は、抽出装置100が行ってもよく、抽出装置100の管理者と所定の関係を有する外部の情報処理装置によって行われてもよい。
【0016】
また、抽出装置100は、外部装置20が配信するコンテンツにおいて利用者が入力した検索クエリやコメントなどに関する入力情報や、利用者のコンテンツの閲覧履歴などの情報を取得する。
【0017】
以下、
図1を用いて、抽出装置100が行う抽出処理について説明する。なお、以下の説明では、提供主端末10を利用する提供主に応じて、提供主端末10を提供主端末10-1~10-N(Nは任意の自然数)として説明する。例えば、提供主端末10は、提供主ID「U1」により識別される提供主(提供主U1)により使用される提供主端末10である。また、以下では、提供主端末10-1~10-Nについて、特に区別なく説明する場合には、提供主端末10と記載する。
【0018】
まず、抽出装置100は、提供主端末10から提供主に関する提供主情報を取得する(ステップS1)。例えば、
図1の例において、抽出装置100は、各提供主から提供される広告に関する広告情報を取得する。具体的には、抽出装置100は、広告情報として、広告に関連する画像(広告画像)や、テキスト情報などを取得する。そして、抽出装置100は、広告情報と、広告の属性(広告対象)とを提供主情報として、提供主に対応付けて記憶部に格納する。
【0019】
なお、抽出装置100は、提供主情報に含まれる属性として、提供主の業種や、提供主が扱う商材、提供主が提供するサービスなどを示す情報を取得してもよい。
【0020】
続いて、抽出装置100は、外部装置20から所定の期間に発生する事象を示す事象情報を取得する(ステップS2)。なお、
図1の例では、抽出装置100が、外部装置20が配信するコンテンツのうち、所定の期間(例えば、直近の24時間、1日、3日など)における利用者の閲覧回数が所定の閾値以上であるコンテンツC1(ニュースコンテンツ)に関する情報(例えば、画像情報、テキスト情報)を、事象情報として取得したものとする。
【0021】
続いて、抽出装置100は、事象情報に基づいて事象の属性を特定し、特定した属性に紐付けられた情報に対応するキーワードを抽出する(ステップS3)。例えば、
図1の例において、抽出装置100は、形態素解析等の自然言語処理技術を適宜用いてコンテンツC1のテキスト情報を解析することにより、コンテンツC1が示す事象の属性「災害」を特定したものとする。この場合、抽出装置100は、属性「災害」に紐付けられた情報に対応するキーワードをコンテンツC1に関する情報から抽出する。具体的には、抽出装置100は、属性「災害」に紐付けられた「被災地」や「災害の種類」などといった概念を示す文字列(例えば、普通名詞や固有名詞など)をキーワードとして、コンテンツC1のテキスト情報から抽出する。ここで、
図1の例では、抽出装置100が、被災地を示す「地域A」、並びに、災害の種類を示す「大雨」及び「土砂災害」をキーワードとして、コンテンツC1のテキスト情報から抽出したものとする。
【0022】
なお、
図1の例において、抽出装置100によるキーワードの抽出処理は、事象の属性と、当該属性に紐付く情報とが設定されたルールベースで実現されてもよく、各種モデルを用いて実現されてもよい。
【0023】
続いて、抽出装置100は、事象の属性に関連する広告を提供する提供主を特定する(ステップS4)。例えば、
図1の例において、抽出装置100は、コンテンツC1が示す事象の属性「災害」に紐付けられた属性(広告対象)に属する広告を提供する提供主を特定する。ここで、
図1の例において、抽出装置100は、属性「災害」に対し、属性「インフラ」、「医療」及び「防災グッズ」が紐付けられているものとする。この場合、抽出装置100は、属性「防災グッズ」に属する広告を提供する提供主U1を、コンテンツC1が示す事象の属性「災害」に関連する広告を提供する提供主と特定する。
【0024】
なお、
図1の例において、抽出装置100による提供主の特定処理は、事象の属性と、当該属性に紐付く広告の属性とが設定されたルールベースで実現されてもよい。
【0025】
続いて、抽出装置100は、配信対象の広告が、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する(ステップS5)。例えば、
図1の例において、抽出装置100は、提供主U1が提供する広告のうち、ステップS3において抽出したキーワードを含む広告を、配信を許可するか否かの審査(再審査)の対象、若しくは、配信停止の対象と判定する。
【0026】
なお、抽出装置100は、抽出したキーワードのうち所定数(例えば、抽出したキーワードの半数)以上を含む広告を所定の審査の対象、若しくは、配信停止の対象と判定してもよい。また、抽出装置100は、抽出したキーワードのうち、特定のキーワード(例えば、地名や人名などの固有名詞)を含む広告を所定の審査の対象、若しくは、配信停止の対象と判定してもよい。
【0027】
また、抽出装置100は、再審査の対象となった広告に含まれる文字列を学習したモデルを用いて、キーワードの抽出処理を実現してもよい。例えば、抽出装置100は、再審査において配信不可と判定された事由である文字列の分散表現と、事象情報が入力された際にモデルが出力するキーワードの分散表現とが類似するように学習されたモデルを用いて、キーワードの抽出処理を実現する。
【0028】
コンテンツの提供主は、利用者への訴求効果を高めることを目的として、利用者の関心を集めやすい時事的なワードを広告に用いることが想定される。これに対し、実施形態に係る抽出装置100は、直近の期間に発生した事象に関連するキーワードを抽出するため、提供主がコンテンツに用いることが想定される時事的なキーワードを把握することができる。これにより、実施形態に係る抽出装置100は、例えば、自然災害や訃報などといった、接触した利用者の感情が否定的になると推定される時事的な事象に関連するワードが用いられたコンテンツを特定できるため、公序良俗の観点からコンテンツの質を担保することを可能とする。
【0029】
〔2.抽出装置の構成〕
次に、
図3を用いて、抽出装置100の構成について説明する。
図3は、実施形態に係る抽出装置の構成例を示す図である。
図3に示すように、抽出装置100は、通信部110と、記憶部120と、制御部130とを有する。
【0030】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、提供主端末10、外部装置20等との間で情報の送受信を行う。
【0031】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
図3に示すように、記憶部120は、提供主情報記憶部121と、事象情報記憶部122とを有する。
【0032】
(提供主情報記憶部121について)
提供主情報記憶部121は、提供主に関する提供主情報を記憶する。ここで、
図4を用いて、提供主情報記憶部121が記憶する提供主情報の一例を説明する。
図4は、実施形態に係る提供主情報記憶部の一例を示す図である。
図4の例において、提供主情報記憶部121は、「提供主ID」、「属性」、「広告情報」といった項目を有する。
【0033】
「提供主ID」は、提供主を識別するための識別情報を示す。「属性」は、広告の属性(広告対象)を示す。なお、「属性」の項目には、提供主の業種や、提供主が扱う商材、提供主が提供するサービスなどを示す情報が格納されてもよい。「広告情報」は、提供主が提供した広告に関する情報を示す。なお、
図4に示す例では、「広告情報」に「広告情報#1」といった概念的な情報が格納される例を示したが、実際には、広告に含まれるテキスト情報、静止画像や動画像等若しくはこれらの所在を示すURL(Uniform Resource Locator)、格納場所を示すファイルパス名などが格納される。
【0034】
すなわち、
図4では、提供主ID「U1」によって識別される提供主が属性「防災グッズ」、広告情報が「広告情報#1」である広告を提供する例を示す。
【0035】
(事象情報記憶部122について)
事象情報記憶部122は、発生した事象を示す事象情報を記憶する。ここで、
図5を用いて、事象情報記憶部122が記憶する情報の一例を説明する。
図5は、実施形態に係る事象情報記憶部の一例を示す図である。
図5の例では、事象情報記憶部122は、「事象ID」、「日時」、「事象情報」、「属性」、「キーワード」といった項目を有する。
【0036】
「事象ID」は、事象を識別するための識別情報を示す。「日時」は、事象情報が取得された日時を示す。「事象情報」は、発生した事象を示す情報であり、例えば、利用者の閲覧回数が所定の閾値以上となったコンテンツに関する情報や、利用者の入力回数が所定の閾値以上となった検索クエリに関する情報を記憶する。なお、
図5では、「事象情報」に「コンテンツ情報#1」といった概念的な情報が格納される例を示したが、実際には、事象を示すテキスト情報、静止画像や動画像等若しくはこれらの所在を示すURL、格納場所を示すファイルパス名などが格納される。「属性」は、事象の属性を示す。「キーワード」は、事象に関連するキーワードを示す。
【0037】
すなわち、
図5では、事象情報「コンテンツ情報#1」が日時「日時#1」に取得され、当該事象情報が示す事象が事象ID「M1」によって識別され、当該事象の属性が「災害」、キーワードが「地域A、大雨、・・・」である例を示す。
【0038】
(制御部130について)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、抽出装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。実施形態に係る制御部130は、
図3に示すように、取得部131と、抽出部132と、特定部133と、判定部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。
【0039】
(取得部131について)
取得部131は、所定の期間に発生する事象を示す事象情報を取得する。例えば、
図1の例において、直近の24時間、1日、3日内に発生する事象を示す事象情報を取得し、事象情報記憶部122に格納する。
【0040】
また、取得部131は、事象情報として、所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得してもよい。例えば、
図1の例において、取得部131は、外部装置20から取得した入力情報に基づき、入力回数が所定の割合上昇した検索クエリを示すテキスト情報を取得する。
【0041】
また、取得部131は、事象情報として、所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得してもよい。例えば、
図1の例において、取得部131は、外部装置20から取得した利用者のコンテンツの閲覧履歴に基づき、閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する。
【0042】
また、取得部131は、事象情報として、所定の期間に開催されるイベントを示す情報を取得してもよい。例えば、取得部131は、所定数以上の動員が想定されるコンサートや、舞台公演、スポーツなどの、現時点から所定の期間未来に開催されるイベントを示す情報を取得する。
【0043】
また、取得部131は、事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得してもよい。例えば、取得部131は、自然災害や、訃報、戦争、事故などといった、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する。
【0044】
また、取得部131は、事象情報として、配信対象のコンテンツのうち、所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得してもよい。例えば、取得部131は、配信対象の広告のうち、インプレッション数や、CTR(Click Through Rate)が所定の閾値以上である広告を示す広告情報を取得する。
【0045】
また、取得部131は、事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、所定の期間において配信不可と判定されたコンテンツに関する情報を取得してもよい。例えば、取得部131は、所定の期間に抽出装置100の管理者によって定められたガイドラインに違反しているか否か等に基づいて審査が行われ、配信不可と判定された広告を示す広告情報を取得する。
【0046】
(抽出部132について)
抽出部132は、取得部131により取得された事象情報に基づいて、事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する。例えば、抽出部132は、提供主が自身のコンテンツに用いることが想定されるキーワードを、事象情報から抽出する。例えば、
図1の例において、抽出部132は、形態素解析等の自然言語処理技術を適宜用いてコンテンツC1のテキスト情報を解析することにより、コンテンツC1が示す事象の属性「災害」を特定し、特定した属性に対応するキーワードをコンテンツC1に関する情報から抽出する。
【0047】
また、抽出部132は、事象の属性に紐付けられた情報に対応するキーワードを抽出してもよい。例えば、
図1の例において、抽出部132は、コンテンツC1が示す事象の属性「災害」に紐付けられた情報に対応するキーワードをコンテンツC1に関する情報から抽出する。
【0048】
また、抽出部132は、取得部131により取得されたコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出してもよい。例えば、抽出部132は、所定の期間において配信不可と判定された広告に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワード、若しくは、出現回数が割合所定の割合上昇したキーワードを抽出する。
【0049】
また、抽出部132は、審査において配信不可と判定された事由であるキーワードを抽出してもよい。例えば、抽出部132は、所定の期間において配信不可と判定された広告に含まれるキーワードであって、配信不可と判定された事由であるキーワードを抽出する。
【0050】
また、抽出部132は、配信不可と判定されたコンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツからキーワードを抽出してもよい。例えば、抽出部132は、所定の期間において配信不可と判定されたコンテンツのうち、提供主が提供する広告と属性が類似するコンテンツからキーワードを抽出する。
【0051】
(特定部133について)
特定部133は、提供主のうち、事象と所定の関連性を有する提供主を特定する。例えば、
図1の例において、特定部133は、コンテンツC1が示す事象の属性「災害」に紐付けられた属性に属する広告を提供する提供主U1を特定する。
【0052】
また、特定部133は、提供主のうち、事象の属性と関連するコンテンツを提供する提供主を特定してもよい。例えば、
図1の例において、特定部133は、コンテンツC1が示す事象の属性「災害」と関連する属性「防災グッズ」に属する広告を提供する提供主U1を特定する。
【0053】
(判定部134について)
判定部134は、抽出部132により抽出されたキーワードと、特定部133により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する。例えば、
図1の例において、判定部134は、コンテンツC1に関する情報から抽出したキーワードに基づいて、提供主U1が提供する広告を、配信を許可するか否かの審査(再審査)の対象、若しくは、配信停止の対象とするか否かを判定する。
【0054】
また、判定部134は、コンテンツのうち、キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定してもよい。例えば、
図1の例において、判定部134は、提供主U1が提供する広告のうち、コンテンツC1に関する情報から抽出したキーワードを含む広告を、配信を許可するか否かの審査(再審査)の対象、若しくは、配信停止の対象と判定する。
【0055】
〔3.抽出処理のフロー〕
ここで、
図6を用いて、実施形態に係る抽出装置100の抽出処理の手順について説明する。
図6は、実施形態に係る抽出処理の手順の一例を示すフローチャートである。
【0056】
図6に示すように、抽出装置100は、所定の期間に発生する事象を示す事象情報を取得する(ステップS101)。例えば、
図1の例において、抽出装置100は、直近の期間内における利用者の閲覧回数が所定の閾値以上であるコンテンツC1に関する情報を事象情報として取得する。
【0057】
続いて、抽出装置100は、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する(ステップS102)。例えば、抽出装置100は、提供主がコンテンツに用いることが想定される時事的なキーワードを、事象情報から抽出する。続いて、抽出装置100は、事象と所定の関連性を有する提供主を特定する(ステップS103)。例えば、
図1の例において、抽出装置100は、事象の属性に紐付けられた属性に属する広告を提供する提供主を特定する。
【0058】
続いて、抽出装置100は、配信対象のコンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する(ステップS104)。例えば、
図1の例において、抽出装置100は、特定した提供主が提供する広告のうち、抽出したキーワードを含む広告を、配信を許可するか否かの審査の対象、若しくは、配信停止の対象と判定する。
【0059】
〔4.変形例〕
上述の実施形態は一例を示したものであり、種々の変更及び応用が可能である。
【0060】
〔4-1.提供主が提供するコンテンツについて〕
上述の実施形態では、判定部134が、事象情報から抽出されたキーワードと、事象の属性と関連する広告に関する情報とに基づいて、当該広告が、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する例を示したが、判定部134の判定対象は広告に限定されない。例えば、判定部134は、事象情報から抽出されたキーワードと、事象の属性と関連する各種コンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定してもよい。
【0061】
〔4-2.事象と関連性を有する提供主の特定処理について〕
上述の実施形態では、特定部133が、事象の属性と関連するコンテンツを提供する提供主を特定する例を示したが、特定部133の機能はこのような構成に限定されない。例えば、抽出部132により、利用者の関心度が極めて高い事象を示す事象情報(例えば、閲覧数が平均よりも所定の閾値以上高いコンテンツに関する情報)からキーワードが抽出された場合、特定部133は、当該事象の属性に関連するコンテンツを提供する提供主だけでなく、当該事象の属性に関連しないコンテンツを提供する提供主も特定してよい。
【0062】
〔5.効果〕
上述してきたように、実施形態に係る抽出装置100は、取得部131と、抽出部132と、特定部133と、判定部134とを有する。取得部131は、所定の期間に発生する事象を示す事象情報を取得する。抽出部132は、取得部131により取得された事象情報に基づいて、事象に関連するキーワードであって、配信対象のコンテンツの提供主との関係性が所定の条件を満たすキーワードを抽出する。また、抽出部132は、事象の属性に紐付けられた情報に対応するキーワードを抽出する。特定部133は、提供主のうち、事象と所定の関連性を有する提供主を特定する。判定部134は、抽出部132により抽出されたキーワードと、特定部133により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する。
【0063】
これにより、実施形態に係る抽出装置100は、直近の期間に発生した事象に関連するキーワードを抽出するため、提供主がコンテンツに用いることが想定されるキーワードを把握することができる。
【0064】
また、実施形態に係る抽出装置100において、例えば、取得部131は、事象情報として、所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得する。また、取得部131は、事象情報として、所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する。また、取得部131は、事象情報として、所定の期間に開催されるイベントを示す情報を取得する。また、取得部131は、事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する。また、取得部131は、事象情報として、配信対象のコンテンツのうち、所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得する。また、取得部131は、事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、所定の期間において配信不可と判定されたコンテンツに関する情報を取得する。そして、抽出部132は、取得部131により取得されたコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する。また、抽出部132は、審査において配信不可と判定された事由であるキーワードを抽出する。また、抽出部132は、配信不可と判定されたコンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツからキーワードを抽出する。
【0065】
これにより、実施形態に係る抽出装置100は、各種の事象情報からキーワードを抽出するため、提供主がコンテンツに用いることが想定されるキーワードを幅広く把握することができる。
【0066】
また、実施形態に係る抽出装置100において、例えば、特定部133は、提供主のうち、事象の属性と関連するコンテンツを提供する提供主を特定する。また、判定部134は、コンテンツのうち、キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定する。
【0067】
これにより、実施形態に係る抽出装置100は、キーワードが悪用される場合でも、事象の属性や抽出したキーワードに応じて提供主を特定し、特定した提供主が提供するコンテンツを判定対象とできるため、コンテンツの質を担保することを可能とする。
【0068】
〔6.ハードウェア構成〕
また、上述してきた各実施形態に係る抽出装置100は、例えば、
図7に示すような構成のコンピュータ1000によって実現される。以下、抽出装置100を例に挙げて説明する。
図7は、抽出装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、ROM1200、RAM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0069】
CPU1100は、ROM1200又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1200は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0070】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(実施形態のネットワークNに対応する)を介して他の機器からデータを受信してCPU1100へ送り、また、通信網500を介してCPU1100が生成したデータを他の機器へ送信する。
【0071】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0072】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1300を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1300上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0073】
例えば、コンピュータ1000が抽出装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1300上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、抽出装置100の記憶装置内の各データが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
【0074】
〔7.その他〕
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0075】
また、上述した抽出装置100は、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0076】
また、特許請求の範囲に記載した「部」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0077】
10 提供主端末
20 外部装置
100 抽出装置
110 通信部
120 記憶部
121 提供主情報記憶部
122 事象情報記憶部
130 制御部
131 取得部
132 抽出部
133 特定部
134 判定部
【手続補正書】
【提出日】2023-05-02
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
所定の期間に発生する事象を示す事象情報を取得する取得部と、
前記取得部により取得された事象情報に基づいて、前記事象の属性を特定し、特定した属性に紐付けられた概念を示すキーワードを抽出する抽出部と
を備えることを特徴とする抽出装置。
【請求項2】
前記取得部は、
前記事象情報として、前記所定の期間における入力回数が所定の閾値以上である検索クエリを示す情報を取得する
ことを特徴とする請求項1に記載の抽出装置。
【請求項3】
前記取得部は、
前記事象情報として、前記所定の期間における閲覧回数が所定の閾値以上であるコンテンツを示す情報を取得する
ことを特徴とする請求項1または2に記載の抽出装置。
【請求項4】
前記取得部は、
前記事象情報として、前記所定の期間に開催されるイベントを示す情報を取得する
ことを特徴とする請求項1から3のいずれか一つに記載の抽出装置。
【請求項5】
前記取得部は、
前記事象のうち、接触した利用者の感情が否定的になると推定される事象を示す事象情報を取得する
ことを特徴とする請求項1から4のいずれか一つに記載の抽出装置。
【請求項6】
前記取得部は、
前記事象情報として、配信対象のコンテンツのうち、前記所定の期間における表示回数が所定の閾値以上であるコンテンツを示す情報を取得する
ことを特徴とする請求項1から5のいずれか一つに記載の抽出装置。
【請求項7】
前記取得部は、
前記事象情報として、配信対象とするか否かの審査が行われたコンテンツであって、前記所定の期間において配信不可と判定されたコンテンツに関する情報を取得し、
前記抽出部は、
前記取得部により取得されたコンテンツに関する情報に含まれるキーワードのうち、出現回数が所定の閾値以上であるキーワードを抽出する
ことを特徴とする請求項1から6のいずれか一つに記載の抽出装置。
【請求項8】
前記抽出部は、
前記審査において配信不可と判定された事由であるキーワードを抽出する
ことを特徴とする請求項7に記載の抽出装置。
【請求項9】
前記抽出部は、
配信不可と判定された前記コンテンツのうち、提供主が提供するコンテンツと属性が類似するコンテンツからキーワードを抽出する
ことを特徴とする請求項7または8に記載の抽出装置。
【請求項10】
配信対象のコンテンツの提供主のうち、前記事象と所定の関連性を有する提供主を特定する特定部と、
前記抽出部により抽出されたキーワードと、前記特定部により特定された提供主が提供するコンテンツに関する情報とに基づいて、当該コンテンツが、所定の審査の対象、若しくは、配信停止の対象となるか否かを判定する判定部
をさらに備えることを特徴とする請求項1から9のいずれか一つに記載の抽出装置。
【請求項11】
前記特定部は、
配信対象のコンテンツの提供主のうち、前記事象の属性と関連するコンテンツを提供する提供主を特定する
ことを特徴とする請求項10に記載の抽出装置。
【請求項12】
前記判定部は、
前記コンテンツのうち、前記キーワードを含むコンテンツを所定の審査の対象、若しくは、配信停止の対象と判定する
ことを特徴とする請求項10または11に記載の抽出装置。
【請求項13】
抽出装置が実行する抽出方法であって、
所定の期間に発生する事象を示す事象情報を取得する取得工程と、
前記取得工程により取得された事象情報に基づいて、前記事象の属性を特定し、特定した属性に紐付けられた概念を示すキーワードを抽出する抽出工程と
を含むことを特徴とする抽出方法。
【請求項14】
所定の期間に発生する事象を示す事象情報を取得する取得手順と、
前記取得手順により取得された事象情報に基づいて、前記事象の属性を特定し、特定した属性に紐付けられた概念を示すキーワードを抽出する抽出手順と
をコンピュータに実行させるための抽出プログラム。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0007
【補正方法】変更
【補正の内容】
【0007】
本願に係る抽出装置は、所定の期間に発生する事象を示す事象情報を取得する取得部と、前記取得部により取得された事象情報に基づいて、前記事象の属性を特定し、特定した属性に紐付けられた概念を示すキーワードを抽出する抽出部とを備えることを特徴とする。