(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-07
(45)【発行日】2022-11-15
(54)【発明の名称】TVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラム
(51)【国際特許分類】
G06Q 30/02 20120101AFI20221108BHJP
G06F 16/783 20190101ALI20221108BHJP
【FI】
G06Q30/02
G06Q30/02 380
G06F16/783
(21)【出願番号】P 2019141406
(22)【出願日】2019-07-31
【審査請求日】2021-07-27
【早期審査対象出願】
(73)【特許権者】
【識別番号】522166220
【氏名又は名称】ノバセル株式会社
(74)【代理人】
【識別番号】110003605
【氏名又は名称】弁理士法人六本木通り特許事務所
(72)【発明者】
【氏名】古谷 文弥
(72)【発明者】
【氏名】松原 敦
(72)【発明者】
【氏名】石渡 高志
【審査官】久宗 義明
(56)【参考文献】
【文献】特開2014-007659(JP,A)
【文献】特開2007-058853(JP,A)
【文献】特開2001-297106(JP,A)
【文献】特開2018-147437(JP,A)
【文献】米国特許出願公開第2017/0318329(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/783
(57)【特許請求の範囲】
【請求項1】
現在又は過去の1又は複数のTVCMの中から他の企業によるTVCMを抽出可能とするためのデータの生成方法であって、
コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、
前記コンピュータが、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、
前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、
前記コンピュータが、前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データ
に関連づけて検索可能に記憶するステップと
を含むことを特徴とする方法。
【請求項2】
前記メタタグは、descriptionメタタグ又はkeywordsメタタグを含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記メタタグは、OGP又はtwitterのdescriptionタグを含むことを特徴とする請求項1に記載の方法。
【請求項4】
前記入力は、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名をキーワードとして行うことを特徴とする請求項1から3のいずれかに記載の方法。
【請求項5】
前記取得は、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのメタタグ又はタイトルタグ、又は前記ウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列の取得であることを特徴とする請求項1から4のいずれかに記載の方法。
【請求項6】
前記取得は、前記検索結果からさらに所定の1又は複数のウェブサイトを除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が所有可能なドメイン又は国別コードトップレベルドメインの二階層下又は一階層下の法人が所有可能なドメインが同一のウェブサイトのいずれかに対して行うことを特徴とする請求項5に記載の方法。
【請求項7】
コンピュータに、現在又は過去の1又は複数のTVCMの中から他の企業によるTVCMを抽出可能とするためのデータの生成方法を実行させるためのプログラムであって、前記生成方法は、
前記コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、
前記コンピュータが、読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、
前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、
前記コンピュータが、前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データ
に関連づけて検索可能に記憶するステップと
を含むことを特徴とするプログラム。
【請求項8】
現在又は過去の1又は複数のTVCMの中から他の企業によるTVCMを抽出可能とするためのデータの生成装置であって、
前記現在又は過去の1又は複数のTVCMの各放映データを読み出し、
読み出された放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力して、検索結果から前記検索エンジンにおける広告として表示された結果を除外して表示されるウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得し、
前記1又は複数の文字列の少なくとも一部であって、前記キーワードを含まない少なくとも一部を前記放映データ
に関連づけて検索可能に記憶することを特徴とする生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、TVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラムに関する。
【背景技術】
【0002】
TVで放映されるCM(以下「TVCM」と呼ぶ。)について、いつどのようなCMが放映されたかについてのデータが有益である場面があり、自社でTVCMの利用を検討している場面はその一つである。TVCMの制作に当たって過去のTVCMが参考となり、また、放映日時の決定においても参考となるからである。このことは、TVCMの利用を検討している企業を顧客として広告代理店としてサービスを提供する企業においても同様である。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、起用されたタレント、放映された日時等であれば現在又は過去のTVCMを参考とすることは容易であるものの、競合企業等の自社事業に関連性を有する企業はどのようなTVCMを放映しているのかという視点に立ったとき、困難が生じる。すなわち、そのようなTVCMを効率的に現在又は過去の放映データから特定する手法がないのである。競合企業の企業名が明らかであれば、当該企業によるTVCMの特定は容易であるが、自社事業又は顧客事業に関連性を有する企業であって、TVCMの放映経験のある企業を広く認識していることは稀である。
【0004】
本発明は、このような問題点に鑑みてなされたものであり、その目的は、現在又は過去のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成装置、生成方法及びそのためのプログラムに関する。
【課題を解決するための手段】
【0005】
このような目的を達成するために、本発明の第1の態様は、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成方法であって、コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、前記コンピュータが、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、前記コンピュータが、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶するステップとを含むことを特徴とする。
【0006】
また、本発明の第2の態様は、第1の態様において、前記メタタグは、descriptionメタタグ又はkeywordsメタタグを含むことを特徴とする。
【0007】
また、本発明の第3の態様は、第1の態様において、前記メタタグは、OGP又はtwitterのdescriptionタグを含むことを特徴とする。
【0008】
また、本発明の第4の態様は、第1の態様において、前記1又は複数の文字列は、前記メタタグ又はタイトルタグのcontent属性の記載に対する解析によって抽出される1又は複数の名詞の少なくとも一部であることを特徴とする。
【0009】
また、本発明の第5の態様は、第1から第4のいずれかの態様において、前記1又は複数の文字列の少なくとも一部は、前記キーワードを含まないことを特徴とする。
【0010】
また、本発明の第6の態様は、第1から第5のいずれかの態様において、前記入力は、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名をキーワードとして行うことを特徴とする。
【0011】
また、本発明の第7の態様は、第1から第6のいずれかの態様において、前記入力は、前記放映データに含まれるサービス名又はブランド名をキーワードとして行い、前記サービス名又はブランド名は、インターネットサービスのサービス名又はブランド名であることを特徴とする。
【0012】
また、本発明の第8の態様は、第1から第7のいずれかの態様において、前記取得は、前記検索結果からさらに所定の1又は複数のウェブサイトを除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が所有可能なドメイン又は国別コードトップレベルドメインの二階層下又は一階層下の法人が所有可能なドメインが同一のウェブサイトのいずれかに対して行うことを特徴とする。
【0013】
また、本発明の第9の態様は、第8の態様において、前記所定の1又は複数のウェブサイトは、ECサイト、求人サイト及び事典サイト又は辞書サイトの少なくともいずれかを含むことを特徴とする。
【0014】
また、本発明の第10の態様は、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータ構造であって、第1から第9のいずれかの態様の生成方法によって生成されるデータ構造である。
【0015】
また、第11の態様において、コンピュータに、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成方法を実行させるためのプログラムであって、前記生成方法は、前記コンピュータが、前記現在又は過去の1又は複数のTVCMの各放映データを読み出すステップと、前記コンピュータが、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力するステップと、前記コンピュータが、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得するステップと、前記コンピュータが、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶するステップとを含むことを特徴とする。
【0016】
また、第12の態様において、現在又は過去の1又は複数のTVCMの中から第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能とするためのデータの生成装置であって、前記現在又は過去の1又は複数のTVCMの各放映データを読み出し、放映データに含まれるCM識別子ごとに、前記放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力して、検索結果から前記検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトと一般トップレベルドメインの一階層下の法人が保有可能なドメイン又は国別コードトップレベルドメインの二階層下若しくは一階層下の法人が保有可能なドメインが同一のウェブサイトのいずれかのメタタグ又はタイトルタグに記載された1又は複数の文字列を取得し、前記1又は複数の文字列の少なくとも一部を前記放映データに関連づけて記憶することを特徴とする。
【発明の効果】
【0017】
本発明の一態様によれば、現在又は過去の1又は複数のTVCMの放映データに、CM識別子ごとに、放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして得られた検索エンジンの検索結果を用いて当該放映データを放映した企業又はその事業に関連性を有する企業又はその事業を紐づける文字列を取得して、当該放映データに関連づけて記憶することによって、第1の企業又はその事業に関連性を有する第2の企業によるTVCMを抽出可能なデータが生成可能となる。
【図面の簡単な説明】
【0018】
【
図1】本発明の一実施形態にかかる生成装置を示す図である。
【
図2】本発明の一実施形態にかかる生成方法の流れを示す図である。
【
図3】本発明の一実施形態にかかるウェブサイトのソースコードの一部を示す図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施形態を詳細に説明する。
【0020】
図1に、本発明の一実施形態にかかる生成装置を示す。生成装置100は、現在又は過去の1又は複数のTVCMの放映データが記憶されたデータベース110から各放映データを読み出すことができ、また、インターネットなどのIPネットワーク上で検索エンジンを提供するサーバ120と通信することができる。
【0021】
データベース110に記憶された各放映データは、CMを識別するCM識別子と、CMを放映する会社名と、CMの対象である商品、サービス又はブランド(以下「商品等」と呼ぶ。)の名称とを含む。CMは、同一の商品等を対象とするものであっても異なるバージョンのものが複数存在することがあり、その場合には異なるCM識別子が付与されることがある。会社名と商品等の名称については、いずれか一方のみが含まれることもあり、また、これらの正式名称の略称が用いられることもある。また、放映データには、放映開始日時、放映終了日時、CMの秒数、出演したタレント名、使用された曲名、使用された曲のアーティスト名などをさらに含んでもよい。
【0022】
装置100は、通信インターフェースなどの通信部101と、プロセッサ、CPU等の処理部102と、メモリ、ハードディスク等の記憶装置又は記憶媒体を含む記憶部103とを備え、各処理を行うためのプログラムを実行することによって構成することができ、1又は複数の装置ないしサーバを含むことがある。また、当該プログラムは、1又は複数のプログラムを含むことがあり、また、コンピュータ読み取り可能な記憶媒体に記録して非一過性のプログラムプロダクトとすることができる。当該プログラムは、記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶しておき、処理部102において実行することができる。
【0023】
以下では、装置100がデータベース110から放映データを読み出すものとして説明を行うが、データベース110に記憶された放映データは、装置100の記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶しておいてもよい。
【0024】
まず、装置100は、現在又は過去の1又は複数のTVCMの各放映データを読み出す(S201)。次に、装置100は、放映データに含まれるCM識別子ごとに、当該放映データに含まれる会社名及び商品名、サービス名又はブランド名の少なくとも一方をキーワードとして検索エンジンに入力する(S202)。
【0025】
検索エンジンへのキーワードの入力は、一例として、装置100が、ウェブブラウザを操作して当該検索エンジンの入力欄にキーワードの入力を行うことで実行することができる。装置100は、記憶部103又は装置100からアクセス可能な記憶装置又は記憶媒体に記憶されたウェブブラウザを操作可能であり、必要に応じてウェブブラウザを操作するためのライブラリを用いて書かれたコードを実行することによって当該ウェブブラウザを操作可能とすることができる。ウェブブラウザの例としては、Chrome(登録商標)が挙げられる。検索エンジンへのキーワードの入力は、ヘッドレスでウェブブラウザを操作してもよい。検索エンジンへのキーワードの入力及び検索結果の受信は、ウェブブラウザの操作によってではなく、HTTP又はHTTPSプロトコルに従ったデータの送受信によって行うこともできる。当該データの送受信に用いることのできるライブラリの例として、curl(商標)が挙げられる。
【0026】
次いで、装置100は、検索エンジンの検索結果から、当該検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトのメタタグに記載された1又は複数の文字列を取得する(S203)。また、メタタグではなく、タイトルタグに記載された文字列の取得を行うことも考えられる。メタタグ又はタイトルタグの記載をウェブサイトのhtmlファイルから取得するためのライブラリの例としては、Beautiful Soup(商標)が挙げられる。
【0027】
メタタグの例としては、descriptionメタタグ又はkeywordsメタタグを挙げることができる。これらのメタタグは、当該ウェブサイトの公開者が自社又は自社の事業に関連性を有すると考える単語又は表現を記載し、検索エンジンの検索結果において自社又は自社の事業に関連性を有する他社のウェブサイトと比較されるように、あるいは当該他社のウェブサイトよりも上位に表示されるようにするためのものであるから、ここに記載された文字列が共通する会社同士又は商品等同士は、互いに競合企業であり、少なくとも自社又はその事業に関連性を有する企業又はその事業であると評価することができることを発明者らは見出した。メタタグの例としては他に、OGPのdescriptionタグ、twitter(登録商標)のdescriptionタグなどを含むことができる。文字列取得のさらなる詳細は、その一例を後述する。
【0028】
そして、装置100は、取得した1又は複数の文字列の少なくとも一部を当該CM識別子の放映データに関連づけて記憶する(S204)。記憶は、データベース110にて行うことができ、又は記憶部103若しくは装置100からアクセス可能な記憶装置若しくは記憶媒体にて行ってもよい。また、記憶される1又は複数の文字列の少なくとも一部は、入力されたキーワードを含まないようにしてもよい。キーワードとして使用された会社名又は商品等の名称は、個別の会社又は商品等を表すものであり、そうした単語を除くことで、会社同士又は商品等同士に関連性があることをより表す文字列を抽出可能となるからである。
【0029】
このように、現在又は過去の1又は複数のTVCMの放映データにCM識別子ごとに上記1又は複数の文字列の少なくとも一部を関連づけて記憶することで、当該放映データの中から第1の企業若しくは法人又はその事業に関連性を有する第2の企業又は法人によるTVCMを抽出可能なデータが生成される。
【0030】
TVCMの放映データは、購入可能なものも存在する。そして、CMの内容を表す分類コードが放映データに含まれるものがある。たとえば、「食品」「調味料」「ソース」などのように大中小の分類でCMの内容を特定されることがある。しかしながら、たとえば、現在さまざまなインターネットサービスが生まれ、こうしたサービスを提供する企業によるTVCMも増加しているが、分類というものの性質上次々と生まれる多様なインターネットサービスに適切に付与することが困難である。実際、現状では「パソコン・AV」「その他」「Webサイト」という分類が様々なインターネットサービスに纏めて付与され、関連性を有する商品等を区別するための分類としての機能を果たし得ていない。本発明は、こうしたインターネット上で提供されるサービスであるインターネットサービスのように、変化が速く、適切な分類化が困難な商品等において特に有益性が高い。
【0031】
本実施形態にかかる生成方法により生成されたデータを用いて現在又は過去のTVCMを抽出することを考える。生成されたデータをデータベースとして、
図3に示した「ハコベル」を例に「シェアリング」の文字列で当該データベースを検索した場合、「シェアリング」の文字列が関連付けて記憶された1又は複数の放映データが取得され、それらの含まれる会社名、商品等の名称、放送日時、タレント名等の少なくとも一部をユーザーの表示画面に表示することができる。
【0032】
なお、上述の説明では、装置100は、検索エンジンの検索結果から、当該検索エンジンにおける広告として表示された結果を除外して1つ目に表示されるウェブサイトを対象としたが、1つ目に表示されるウェブサイトと「com」などの一般トップレベルドメイン(gTLD)の一階層下の企業又は法人が保有可能なドメイン又は「jp」などの国別コードトップレベルドメイン(ccTLD)の二階層下又は一階層下の企業又は法人が保有可能なドメインが同一のウェブサイトを対象としてもよい。ccTLDの場合、「abc.co.jp」のような二階層下のドメインのほかに「abc.jp」のような一階層下のドメインを企業又は法人が保有可能なことがある。キーワードとして会社名及び商品等の名称が入力された場合、当該商品等の公式サイトのメタタグ又はタイトルタグをスクレイピングすることが高い正確性を与えるものと考えられるところ、必ずしも1つ目に表示されるものではなく、同一ドメインのウェブサイトを対象としても本発明の精神から逸脱するものではない。
【0033】
また、検索結果から「amazon.com(登録商標)」などのECサイトを除外して対象とするウェブサイトを決定することが好ましい。こうしたECサイトが検索結果の上位に表示されることがあるからである。同様に「wikipedia(登録商標).org」などの事典サイト又は辞書サイトについても、除外することが好ましい。また、求人サイトについても検索結果の上位に表示されることがあり、除外することが好ましい。
【0034】
また、「××のみに基づいて」、「××のみに応じて」、「××のみの場合」というように「のみ」との記載がなければ、本明細書においては、付加的な情報も考慮し得ることが想定されていることに留意されたい。また、一例として、「aの場合にbする」という記載は、明示した場合を除き、「aの場合に常にbする」ことを必ずしも意味しないことに留意されたい。
【0035】
また、念のため、なんらかの方法、プログラム、端末、装置、サーバ又はシステム(以下「方法等」)において、本明細書で記述された動作と異なる動作を行う側面があるとしても、本発明の各態様は、本明細書で記述された動作のいずれかと同一の動作を対象とするものであり、本明細書で記述された動作と異なる動作が存在することは、当該方法等を本発明の各態様の範囲外とするものではないことを付言する。
【0036】
文字列取得の詳細
図3に、出願人が提供するサービスである「ハコベル(登録商標)」のサービス名を検索エンジン「グーグル(登録商標)」で検索し、広告を除外して1つ目に表示されたウェブサイトである当該サービスの公式ウェブサイトのソースコードの一部を示す。
【0037】
タイトルタグから文字列を取得する場合には、タイトルタグのcontent属性の記載に対して形態素解析を行い、名詞に該当する1又は複数の文字列を抽出することができる。
図3の例では、「物流」「シェリング」「プラットフォーム」などの文字列を取得することができる。このことは、descriptionメタタグ、OGPのdescriptionタグなどについても同様である。keywordsメタタグについても同様に形態素解析による文字列の取得を行ってもよいが、content属性の記載がカンマで区切られていることから、カンマで分割して1又は複数の文字列を取得するかたちの解析をしてもよい。
【符号の説明】
【0038】
100 装置
101 通信部
102 処理部
103 記憶部
110 データベース
120 検索エンジンサーバ