(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6341899
(24)【登録日】2018年5月25日
(45)【発行日】2018年6月13日
(54)【発明の名称】広告システム及び広告配信方法
(51)【国際特許分類】
G06F 17/30 20060101AFI20180604BHJP
G06Q 30/02 20120101ALI20180604BHJP
【FI】
G06F17/30 340B
G06Q30/02 380
【請求項の数】6
【全頁数】10
(21)【出願番号】特願2015-223283(P2015-223283)
(22)【出願日】2015年11月13日
(65)【公開番号】特開2017-91376(P2017-91376A)
(43)【公開日】2017年5月25日
【審査請求日】2016年10月25日
(73)【特許権者】
【識別番号】311012169
【氏名又は名称】NECパーソナルコンピュータ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】特許業務法人酒井国際特許事務所
(74)【代理人】
【識別番号】100084250
【弁理士】
【氏名又は名称】丸山 隆夫
(72)【発明者】
【氏名】白川 貴久
【審査官】
後藤 昂彦
(56)【参考文献】
【文献】
米国特許出願公開第2012/0030025(US,A1)
【文献】
特開2010−055597(JP,A)
【文献】
特開2014−137757(JP,A)
【文献】
特開2015−164008(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06Q 30/02
(57)【特許請求の範囲】
【請求項1】
広告サーバと複数のユーザ端末とを含む広告システムであって、
前記広告サーバは、
インターネットないしクラウド上の情報発信から取得した少なくとも文字情報を含むサンプルタイムラインの中で出現する単語の頻度を示す第1の頻度辞書と、
前記第1の頻度辞書に基づいて前記タイムラインに関わる情報発信者が属するユーザセグメントを定義する第1の解析手段と、
前記第1の頻度辞書の通時的な変化に基づいて流行の兆候がある単語を商品定義キーワードとして取得する第2の解析手段と、
前記商品定義キーワードに基づいて広告情報を取得する広告情報取得手段と、
を有し、
前記ユーザ端末は、
当該ユーザ端末のユーザの、当該ユーザ端末を用いた情報消費に応じて生成される第2の頻度辞書と、
前記第1の解析手段により定義されたユーザセグメントと前記第2の頻度辞書との関連の強度に応じて、前記広告情報取得手段が取得した広告を表示のために選択する広告選択手段と、
を有する
ことを特徴とする、広告システム。
【請求項2】
前記広告サーバは、
前記ユーザセグメントの個々のセグメントに対して、中心的なユーザを定義する第3の解析手段を備え、
前記第2の解析手段が対象にする第1の頻度辞書が、前記中心的なユーザの情報発信履歴に関するものに限定される
ことを特徴とする、請求項1に記載の広告システム。
【請求項3】
前記広告サーバは、
インターネットないしクラウド上の情報発信から前記タイムラインを取得し、前記第1の頻度辞書を生成する第1の頻度辞書生成手段を、さらに備えることを特徴とする、請求項1又は2に記載の広告システム。
【請求項4】
前記第1の解析手段は、前記第1の頻度辞書において特徴的に高頻度で現れる単語をセグメント定義キーワード群として取得し、
前記広告選択手段は、前記第2の頻度辞書と他の頻度辞書との比較において前記第2の頻度辞書において特徴的に高頻度で現れる単語群と、前記セグメント定義キーワード群とをマッチングさせ、マッチングすると判断される場合に、広告を選択する
ことを特徴とする、請求項1から3のいずれか1項に記載の広告システム。
【請求項5】
前記第2の解析手段は、前記第1の頻度辞書において直近で出現頻度が増加した単語を検出し、商品定義キーワードとして取得する
ことを特徴とする、請求項1から4のいずれか1項に記載の広告システム。
【請求項6】
広告サーバと複数のユーザ端末とを含む広告システムにおける広告配信方法であって、
前記広告サーバにて、
インターネットないしクラウド上の情報発信から取得した少なくとも文字情報を含むサンプルタイムラインの中で出現する単語の頻度を示す第1の頻度辞書に基づいて前記タイムラインに関わる情報発信者が属するユーザセグメントを定義する第1の解析工程と、
前記第1の頻度辞書の通時的な変化に基づいて流行の兆候を解析して流行の兆候がある単語を商品定義キーワードとして取得する第2の解析工程と、
前記商品定義キーワードに基づいて広告情報を取得する広告情報取得工程と、
前記ユーザ端末にて、
当該ユーザ端末のユーザの、当該ユーザ端末を用いた情報消費に応じて生成される第2の頻度辞書と、前記第1の解析工程により定義されたユーザセグメントとの関連の強度に応じて、前記広告情報取得工程にて取得した広告を表示のために選択する広告選択工程と、
を含むことを特徴とする、広告配信方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、広告システム及び広告配信方法に関し、特に、流行の兆候を把握し、効率的に広告を配信するための技術に関する。
【背景技術】
【0002】
いわゆるオンライン広告の技術分野においては、広告の受け取り手の嗜好や興味にマッチさせた広告を打つことが、従来行われている(例えば、特許文献1)。特許文献1では、ローカルストレージに保存された属性を利用して、より適切なターゲット広告を決定するための技術について記載がある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2014−085812号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本明細書においては、所定の嗜好や興味を持つユーザの集団を「ユーザセグメント」と呼ぶ。ユーザセグメントは、広告を配信する対象となる。ユーザセグメントは、例えば、「ビール好き」「プロ野球チームAのファンである」「30代男性」などと定義される。
【0005】
従来の広告配信技術においては、不特定多数のユーザ群の中から「30代男性」「A県在住男性」などによりユーザを抽出し、抽出されたユーザの集団(ユーザセグメント)に対して、広告を配信する。実際には、ユーザに対する個人情報をアンケート等で得て、上述のようなユーザセグメント毎の興味関心を分析し、広告したい商品に興味をもつ可能性の高いユーザセグメントに対して広告を配信するのが常であった。
【0006】
しかしながら、従来の広告配信技術においては、ユーザセグメントの特定はできていても、そのユーザセグメントでどのような商品の需要が今後発生するかという予測は困難であった。
【0007】
例えば、「流行に敏感なハイティーン女子」と名付けうるようなユーザセグメントを想定すると、このユーザセグメントでどのような商品群が流行するかの予測は難しい。当該ユーザセグメントの各ユーザは、ソーシャル・ネットワーキング・サービス(以下、「SNS」と呼ぶ)やウェブログで情報を発信している場合があり、これらの文字情報からキーワードを抜き出すと、どのような商品群が流行しているかが把握される場合がある。しかしながら、すでに流行している物品を後追いで広告しても、すでに流行遅れとなる可能性がある。
【0008】
本発明は、上述したような課題に鑑みてなされたものであって、流行の兆候を早期に発見して、流行を受容する可能性が高いユーザセグメントへ効率的に広告を配信することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成する本発明の一態様は、広告サーバと複数のユーザ端末とを含む広告システムであって、前記広告サーバは、インターネットないしクラウド上の情報発信から取得した少なくとも文字情報を含むサンプルタイムラインの中で出現する単語の頻度を示す第1の頻度辞書と、前記第1の頻度辞書に基づいて前記タイムラインに関わる情報発信者が属するユーザセグメントを定義する第1の解析手段と、前記第1の頻度辞書の通時的な変化に基づいて流行の兆候がある単語を商品定義キーワードとして取得する第2の解析手段と、前記商品定義キーワードに基づいて広告情報を取得する広告情報取得手段と、を有し、前記ユーザ端末は、当該ユーザ端末のユーザの、当該ユーザ端末を用いた情報消費に応じて生成される第2の頻度辞書と、前記第1の解析手段により定義されたユーザセグメントと前記第2の頻度辞書との関連の強度に応じて、前記広告情報取得手段が取得した広告を表示のために選択する広告選択手段と、を有することを特徴とする、広告システムである。
【発明の効果】
【0010】
本発明によれば、流行の兆候を早期に発見して、流行を受容する可能性が高いユーザセグメントへ効率的に広告を配信することが可能となる。
【図面の簡単な説明】
【0011】
【
図1】本発明の第1の実施形態の概略構成を示す概念図である。
【
図2】上記実施形態の機能構成を示すブロック図である。
【
図3】上記実施形態の広告サーバ10の処理の手順を示すフローチャート図である。
【
図4】上記実施形態のユーザ端末20の処理の手順を示すフローチャート図である。
【
図5】本発明の第2の実施形態の機能構成を示すブロック図である。
【
図6】上記実施形態の広告サーバ10の処理の手順を示すフローチャート図である。
【発明を実施するための形態】
【0012】
<第1の実施形態>
図1に、本実施形態の概略構成を示す。図示のように、本実施形態に係る広告システム1は、広告サーバ10と、ユーザ端末20と、広告情報提供サーバ30とを含む。ユーザ端末20は複数である。
【0013】
本実施形態における広告配信の概略を述べる。
図1において、広告サーバ10は、インターネットないしクラウド上のSNSやウェブログでパブリックあるいは特定の閲覧者内で情報発信されている情報(好ましくは、文字情報)を、検索エンジンによるクロールなどにより随時取得している。
【0014】
取得する情報は、好ましくは、時系列上に発話が集積される態様であることが好ましく、本明細書ではこのような情報を以下、「タイムライン」と呼ぶ。広告サーバ10は、タイムラインを解析し、これに含まれる単語の頻度を示す頻度辞書を生成する。頻度辞書は、ユーザセグメントの把握に用いられるとともに、当該ユーザセグメントにおいてどのような流行が発生する兆候があるか、すなわち流行の兆候がある単語を検出するために用いる。
【0015】
流行の兆候がある単語に基づいて、広告サーバ10は、広告情報提供サーバ30から、これから流行しそうな商品アイテムの広告情報を取得する。広告情報は、把握したユーザセグメントの情報と共にユーザ端末20へ配信される。ユーザ端末20の各々では、各ユーザの興味辞書とユーザセグメント情報とのマッチングが行われ、マッチングする場合に、広告が表示される。
【0016】
図2に、より詳細な本実施形態の機能構成を示す。図示のように、広告サーバ10には、広告サーバ10のコンピュータリソースを用いたソフトウェアプログラムによる情報処理により、ユーザセグメント解析手段11、流行解析手段12、単語頻度辞書生成手段13、単語頻度辞書14、広告情報取得手段15が構成される。同様に、ユーザ端末20には、ユーザ端末20のコンピュータリソースを用いたソフトウェアプログラムによる情報処理により、広告選択手段21、表示手段22、ユーザ興味辞書23、興味辞書生成手段24が構成される。
【0017】
以下、各手段の動作の詳細について、
図3及び
図4を参照しながら説明する。
図3は広告サーバ10の処理の手順を示すフローチャート図であり、
図4はユーザ端末20の処理の手順を示すフローチャート図である。
【0018】
図3において、広告サーバ10は、まず、所望の発信者が発信するインターネットないしクラウド上のSNSやウェブログなどのタイムラインを取得する(S101)。ここで取得する所望の発信者のタイムラインを「サンプルタイムライン」と呼ぶ。所望の発信者の選定は、本実施形態においては広告サーバ10のオペレータが行う。
【0019】
本実施形態においては、「アーリー・アダプター」と呼ばれる、商品、サービス、ライフスタイル等を比較的早期に取り入れ、ブームや流行の初期をかたちづくるユーザ層に属する発信者を所望の発信者に想定している。また、アーリー・アダプターに追随するユーザセグメントへの流行の伝播、影響力も重要である。したがって、所望の発信者(サンプルタイムライン)の選定にあたっては、タイムラインの被リンク数(トラックバックの総数や、SNSにおける読者数の多さなど)を指標に用いる。なお、所望の発信者(サンプルタイムライン)の選定を、広告サーバ10で補助することもできる。例えば、多数の発信者のSNSやウェブログをクロールないし監視し、それらの中から被リンク数(トラックバックの総数や、SNSにおける読者数の多さなど)を指標に所望の発信者を広告サーバ10で候補として表示することができる。
【0020】
次に、単語頻度辞書生成手段13が、サンプルタイムラインを解析して、サンプルタイムラインに出現する単語の頻度辞書(単語頻度辞書14)を生成する(S102)。具体的には、タイムラインを形態素解析することにより、名詞のみを取り出し、各々の名詞の頻度情報を得る。また、これら名詞がどのような形容詞と共に用いられているかを解析し、当該名詞にポジティブな意味合いを持たせたかあるいはネガティブな意味合いを持たせたかを解析する。
【0021】
以上の解析結果を、単語頻度辞書14とする。同一ユーザセグメントに属すと思われる所望の発信者を複数選定し、サンプルタイムラインを複数とする場合には、それに応じて、複数の単語頻度辞書14を複数のサンプルタイムラインを統合的に扱って、単一の単語頻度辞書を生成するようにするとよい。
【0022】
ある所望の発信者とは別のユーザセグメントに属すると思われる別の所望の発信者の頻度辞書とを比較することにより、サンプルタイムラインに係る単語頻度辞書14に含まれる単語の特徴として各単語のベクトルの偏りを得る。複数のアーリーアダプタユーザ同士を比較するようにしてもよいし、最も異なる特性のユーザセグメントとの比較としてもよい。
【0023】
また、対象となるユーザセグメントが非常に特殊な場合は、発信者を特定しない、例えばランダムに選んだ発信者のタイムラインから頻度辞書を生成し、これを対比頻度辞書とする。対比頻度辞書は、既存のコーパスを処理前に取得してもよい。単語時頻度辞書14と対比頻度辞書とを比較することにより、サンプルタイムラインに係る単語頻度辞書14に含まれる単語の特徴として各単語のベクトルの偏りを得る方法でもよい。
【0024】
このように求めたベクトルの偏りを得る処理は、ユーザセグメント解析手段11が行い、
図3の頻度辞書の傾向の解析(S103)がこの処理にあたる。ユーザセグメント解析手段11は、この偏りを特徴づける単語群を、セグメント定義キーワード群として取得する(S104)。例えば、対比頻度辞書と比較して、有意に出現頻度が高い単語を、セグメント定義キーワード群とする。頻度が高い単語だけでなく、有意に出現頻度が低い単語も用いてもよい。その場合は照合時に高低を区別して用いる。
【0025】
次に、流行解析手段12は、単語頻度辞書14の通時的な変化を解析する(S105)。この解析は、例えば、「フォロワー」と呼ばれる特定の「アーリーアダプタ」の発信する商品、サービス、ライフスタイルを追従・模倣するユーザ層の発信者のタイムラインから頻度情報と比較し、直近のサンプルタイムラインで出現頻度が急上昇した単語を、流行の兆候がある単語と認識して、これを商品定義キーワードとして取得する(S106)。流行の兆候がある単語は1つでも、複数でもよい。フォロワーはオペレータが選定してもよいし、アーリーアダプタのSNS上のフォロワーの平均値などを用いてもよい。
【0026】
次に、広告情報取得手段15は、商品定義キーワード群と合致するような広告情報を、広告情報提供サーバ30から取得する(S107)。広告情報提供サーバ30が有する広告情報データベースには、商品及びその広告と、その商品を定義づけるキーワード(例えば、「秋物」とか「かわいい」など、商品を形容する言葉など)が商品説明文として、もしくはタグ付けされて記憶されており、広告情報提供サーバ30は、商品定義キーワード群との一致数や類似度の高低に応じて広告情報を提供する。
当然、商品定義キーワード群により広告情報を習得する際に、類似語辞書などを使い、表記の揺れによる不適合を解消してもよい。
【0027】
次に、広告サーバ10は、S104で取得したセグメント定義キーワード群と、S107で取得した広告情報とを、各ユーザ端末20へ配信する。なお、この配信においては、セグメント定義キーワード群へのポインタ、広告情報へのポインタの送信をすることとしてもよい。広告情報には広告そのものを含んでもよいが、広告IDの配信にとどめておき、ユーザ端末20からIDに基づく参照を受け付けるようにしてよい。セグメント定義キーワード群についても同様のことが言える。
【0028】
次に
図4を参照する。複数のユーザ端末20の各々においては、広告選択手段21が広告サーバ10から受信したセグメント定義キーワード群とユーザ端末20のユーザのユーザ興味辞書23とのマッチングを行う(S201)。ユーザ興味辞書23は、興味辞書生成手段24により生成され、好ましくは、ユーザによるユーザ端末20の操作履歴であるアクティビティ(例えば、ユーザ端末20上でのウェブサイトやニュース記事の閲覧、情報の検索履歴、動画や音楽の再生履歴などの情報消費)に基づいて生成される。ユーザによるユーザ端末20の操作履歴により作成されるユーザ興味辞書23は、ユーザの好む情報を反映している。
【0029】
興味辞書生成手段24によるユーザ興味辞書23の生成の態様は、より詳細には、ユーザ端末20のユーザが消費した、自然言語が記載されたウェブサイトの内容やニュース記事、あるいはユーザが再生した動画や音楽を特定する情報、情報を検索する際に用いたキーワードの履歴などから、形態素解析をすることにより単語を取り出し、辞書に集積する。これを繰り返すことにより各々の単語についての頻度情報を得るものである。なお、ユーザ端末20のユーザは、ユーザ興味辞書23の生成にあたって、インターネット上に何かを発信する必要はない。
【0030】
本実施形態においては、マッチングの際には、ユーザ端末20のユーザのユーザ興味辞書23と、他にあらかじめ用意された他のユーザ等の興味辞書との比較によって、ユーザ興味辞書23を特徴づける単語(高頻度で現れる単語)をあらかじめ用意しておき、これとセグメント定義キーワード群とのマッチングをする。
【0031】
S201の結果、マッチングしない場合は、そのユーザ端末20における処理を終了する(S202)。マッチングする場合、次に、広告表示を行う(S203)。表示手段22は、広告サーバ10から取得した広告を、広告表示領域に表示する(S203)。
【0032】
なお、ユーザ興味辞書23の生成においては、興味辞書生成手段24が、ユーザ端末20のユーザが自身の利用するSNS等のタイムラインでした発話に基づいて、ユーザ興味辞書23を豊富化してもよい。
【0033】
上述した本実施形態によると、流行が発生する兆候を、アーリー・アダプターとなり得る流行に敏感な層が発信するタイムラインに着目して把握し、この層と関連が強いユーザ層に向けて、把握した流行の兆候との関連が強い広告を配信する。流行の把握から配信まではすべて自動的な情報処理で行われる。したがって、いち早く流行発生の兆候をつかみ広告配信までがつながるので、効率的な広告配信が可能となる。
【0034】
また、本実施形態によれば、ユーザ興味辞書23は、ニュース記事の消費等により自動的に生成されるため、ユーザが何かを発信する必要がない。
【0035】
<第2の実施形態>
本実施形態は、第1の実施形態の構成に加え、中心的ユーザ解析手段16を備え(
図5参照)、上述の「サンプルタイムライン」をオペレータによらず広告サーバ10が自動的に抽出し、流行の兆候がある単語の発見につなげるものである。本実施形態によれば、流行の兆候の発見が第1の実施形態よりも早期に的確に実現する。
【0036】
図5に本実施形態の機能構成を、
図6に広告サーバ10における処理の流れを示す。ユーザ端末20側の処理など、第1の実施形態と同様の構成・処理については説明を省略する。中心的ユーザ解析手段16は、ユーザセグメント解析手段11と流行解析手段12に次ぐ第3の解析手段であって、多数のタイムラインから生成された頻度辞書やタイムライン間の関係に基づいてユーザクラスタにおける中心的ユーザを特定する。
【0037】
図6において、広告サーバ10は、インターネット上のウェブログやSNS、短文投稿サイトなどから、タイムラインを多数取り込む(S201)。例えば、あるドメインのタイムラインをすべて入力する。次に、第1の実施形態で説明したような形態素解析等を行い、ユーザごとの発言内容(タイムライン)に基づく頻度辞書を作成する(S202)。
【0038】
次に、ユーザセグメント解析手段11は、S201で取得したタイムラインに基づいてユーザのクラスタリングを行う(S203)。なお、ユーザとタイムラインとは一対一で紐付けられることとする。S203は、例えば、特定単位時間内の発言からなる頻度辞書の類似性やSNS上のフォロー関係などの情報からクラスタリングできる。
【0039】
ユーザセグメント解析手段11は、さらに、ユーザ間のフォロー関係を分析する(S204)。例えば、SNSにおいては、サービスの名前空間内にソーシャル・ネットワークが形成されており、ミューチュアルリンクや一方向リンクなどでユーザ同士がつながっているが、リンク間関係が密になっているところを抽出する。
【0040】
ユーザセグメント解析手段11は、S203でクラスタリングで得られたユーザクラスタと、S204での分析結果とを用いて、ユーザセグメントを抽出する。そして、抽出したユーザセグメントに属するユーザのタイムラインから生成した頻度辞書と、他のクラスタに属す頻度辞書の比較に基づいて、セグメント定義キーワード群を取得する(S205)。他のクラスタと同様に高頻度の単語は弱まり、ユニークな単語の頻度が強調される。
【0041】
また、S205における、セグメント定義キーワード群の取得は、セグメントごとに行ってもよい。また、他のセグメントと重複する語句は省いてもよい。
【0042】
次に、中心的ユーザ解析手段16が、各セグメントに属すユーザから、被リンク数(トラックバックの総数や、SNSにおける読者数の多さなど)を指標に用いて、中心的ユーザ(第1の実施形態で言う「所望の発信者」)を発見・特定する(S206)。S206は、セグメントごとに行ってもよい。
【0043】
次に、中心的ユーザ(所望の発信者)の発言内容を「サンプルタイムライン」として、流行の兆候の解析(S207)を行う。以降の処理は、
図3を参照しながら説明した第1の実施形態と同様であるが、既に他のクラスタとの比較による頻度辞書の補正が済んでいると言える。
【0044】
上述の本実施形態によれば、中心的ユーザ(所望の発信者)の発見・特定が自動的に行われ、有意なクラスタリングがされているので、流行の兆候の発見が第1の実施形態よりも早期に的確に実現する。
【符号の説明】
【0045】
1 広告システム
10 広告サーバ
11 ユーザセグメント解析手段
12 流行解析手段
13 単語頻度辞書生成手段
14 単語頻度辞書
15 広告情報取得手段
16 中心的ユーザ解析手段
20 ユーザ端末
21 広告選択手段
22 表示手段
23 ユーザ興味辞書
24 興味辞書生成手段
30 広告情報提供サーバ