IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ネイバー コーポレーションの特許一覧

特開2024-65031仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム
<>
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図1
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図2
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図3
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図4
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図5
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図6
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図7
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図8
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図9
  • 特開-仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024065031
(43)【公開日】2024-05-14
(54)【発明の名称】仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラム
(51)【国際特許分類】
   G06F 40/216 20200101AFI20240507BHJP
   G06Q 30/0251 20230101ALI20240507BHJP
   G06F 40/151 20200101ALI20240507BHJP
【FI】
G06F40/216
G06Q30/0251
G06F40/151
【審査請求】有
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2023180031
(22)【出願日】2023-10-19
(31)【優先権主張番号】10-2022-0141263
(32)【優先日】2022-10-28
(33)【優先権主張国・地域又は機関】KR
(71)【出願人】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】パク・ヨンハ
(72)【発明者】
【氏名】パク・ソヒョン
【テーマコード(参考)】
5B109
5L030
5L049
【Fターム(参考)】
5B109QA01
5B109TA11
5B109VC03
5L030BB08
5L049BB08
(57)【要約】
【課題】仮名結合を利用してデータを拡張および活用するための方法、システム、およびコンピュータプログラムを提供する。
【解決手段】仮名結合を利用してデータを拡張および活用するための方法は、顧客会社の自社の情報と前記顧客会社以外の他社の情報を仮名処理して結合した仮名結合データを受信する段階、前記仮名結合データをモデリングすることによってデータ推定のための解釈モデルを生成する段階、前記解釈モデルにより、前記顧客会社のターゲット情報を利用して他社情報を推定する段階、および前記顧客会社と関連するサービスに対して、前記推定された他社情報を提供する段階を含む。
【選択図】図3
【特許請求の範囲】
【請求項1】
コンピュータシステム上で実行される他社データ提供方法であって、
前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、
前記他社データ提供方法は、
前記少なくとも1つのプロセッサにより、顧客会社の自社情報と、前記顧客会社以外の他社の情報を仮名処理して結合した仮名結合データを受信する段階、
前記少なくとも1つのプロセッサにより、前記仮名結合データをモデリングすることによってデータ推定のための解析モデルを生成する段階、
前記少なくとも1つのプロセッサにより、前記解析モデルにより、前記顧客のターゲット情報を利用して他社情報を推定する段階、および
前記少なくとも1つのプロセッサにより、前記顧客会社と関連するサービスに対して、前記推定された他社情報を提供する段階
を含む、他社データ提供方法。
【請求項2】
前記生成する段階は、
前記仮名結合データを匿名処理して非識別化する段階
を含む、請求項1に記載の他社データ提供方法。
【請求項3】
前記生成する段階は、
前記仮名結合データを平滑化(smoothing)する過程、および前記仮名結合データにエラー(error)を追加する過程のうちの少なくとも1つによって前記仮名結合データを非識別化する段階
を含む、請求項1に記載の他社データ提供方法。
【請求項4】
前記生成する段階は、
前記仮名結合データをテーブル形式で要約する方式、または項目同士の間の類似度を利用して前記仮名結合データを要約する方式、またはロジスティック回帰モデル(Logistic regression model)やディープラーニングモデル(deep learning model)を利用して前記仮名結合データをモデリングする方式によって前記解釈モデルを生成すること
を特徴とする、請求項1~3のうちのいずれか一項に記載の他社データ提供方法。
【請求項5】
前記生成する段階は、
前記解析モデルの生成が完了した後、前記仮名結合データを削除する段階
を含む、請求項1~3のうちのいずれか一項に記載の他社データ提供方法。
【請求項6】
前記提供する段階は、
前記顧客を対象に、前記ターゲット情報と前記推定された他社情報を連結した形態の拡張データを提供する段階
を含む、請求項1~3のうちのいずれか一項に記載の他社データ提供方法。
【請求項7】
前記提供する段階は、
前記ターゲット情報と前記推定された他社情報を前記顧客会社に対する広告ターゲティングに利用する段階
を含む、請求項1~3のうちのいずれか一項に記載の他社のデータ提供方法。
【請求項8】
前記推定する段階は、
前記解析モデルを利用して、前記顧客会社のターゲット顧客の自社データから他社データを推定し、
前記提供する段階は、
前記自社データと前記他社データを連結した拡張データを、前記ターゲット顧客に対する広告ターゲティングオプションとして定義する段階
を含む、請求項1~3のうちのいずれか一項に記載の他社のデータ提供方法。
【請求項9】
前記受信する段階は、
外部結合専門機関から、仮名結合キーが削除された形態の仮名結合データを受信する段階
を含むことを特徴とする、請求項1~3のうちのいずれか一項に記載の他社データ提供方法。
【請求項10】
前記受信する段階は、
前記顧客の仮名データと前記顧客会社によって情報活用のための対象企業として選択された少なくとも1つの他社の仮名データを結合した前記仮名結合データを受信する段階
を含むことを特徴とする、請求項1~3のうちのいずれか一項に記載の他社データ提供方法。
【請求項11】
請求項1~3のうちのいずれか一項に記載の他社データ提供方法を前記コンピュータ装置に実行させるためのコンピュータプログラム。
【請求項12】
コンピュータシステムであって、
メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
顧客会社の自社情報と前記顧客会社以外の他社の情報を仮名処理して結合した仮名結合データを受信する過程、
前記仮名結合データをモデリングすることにより、データ推定のための解析モデルを生成する過程、
前記解析モデルにより、前記顧客会社のターゲット情報を利用して他社情報を推定する過程、および
前記顧客会社と関連するサービスに対して、前記推定された他社情報を提供する過程
を処理する、コンピュータシステム。
【請求項13】
前記少なくとも1つのプロセッサは、
前記仮名結合データを匿名化して非識別化すること
を特徴とする、請求項12に記載のコンピュータシステム。
【請求項14】
前記少なくとも1つのプロセッサは、
前記仮名結合データを平滑化する過程、および前記仮名結合データにエラーを追加する過程の少なくとも1つによって前記仮名結合データを非識別化すること
を特徴とする、請求項12に記載のコンピュータシステム。
【請求項15】
前記少なくとも1つのプロセッサは、
前記仮名結合データをテーブル形式で要約する方式、または項目同士の間の類似度を利用して前記仮名結合データを要約する方式、またはロジスティック回帰モデルやディープラーニングモデルを利用して前記仮名結合データをモデリングする方式によって前記解釈モデルを生成すること
を特徴とする、請求項12~14のうちのいずれか一項に記載のコンピュータシステム。
【請求項16】
前記少なくとも1つのプロセッサは、
前記解析モデルの生成が完了した後、前記仮名結合データを削除すること
を特徴とする、請求項12~14のうちのいずれか一項に記載のコンピュータシステム。
【請求項17】
前記少なくとも1つのプロセッサは、
前記顧客を対象に、前記ターゲット情報と前記推定された他社情報を連結した形態で拡張データを提供すること
を特徴とする、請求項12~14のうちのいずれか一項に記載のコンピュータシステム。
【請求項18】
前記少なくとも1つのプロセッサは、
前記ターゲット情報と前記推定された他社情報を、前記顧客会社に対する広告ターゲティングに利用すること
を特徴とする、請求項12~14のうちのいずれか一項に記載のコンピュータシステム。
【請求項19】
前記少なくとも1つのプロセッサは、
前記解析モデルを利用して、前記顧客会社のターゲット顧客の自社データから他社データを推定し、
前記自社データと前記他社データを連結した拡張データを、前記ターゲット顧客に対する広告ターゲティングオプションとして定義すること
を特徴とする、請求項12~14のうちのいずれか一項に記載のコンピュータシステム。
【請求項20】
前記少なくとも1つのプロセッサは、
外部結合専門機関から、前記顧客会社の仮名データと前記顧客会社によって情報活用のための対象企業として選択された少なくとも1つの他社の仮名データを結合した前記仮名結合データを受信すること
を特徴とする、請求項12~14のうちのいずれか一項に記載のコンピュータシステム。
【発明の詳細な説明】
【技術分野】
【0001】
以下の説明は、他社データを活用する技術に関する。
【背景技術】
【0002】
企業は、自社の顧客に対する理解のもとで、広告露出ターゲットを設定したり、個人化されたカスタマイズ広告を提供したりする。
【0003】
ターゲット広告を提供する技術の一例として、特許文献1(公開日2008年1月22日)には、ユーザのプロフィールを使用して選好広告を選択する技術が開示されている。
【0004】
企業のほとんどは、自社の顧客に関する情報が十分でないため、他社の情報を併用しながら顧客に対する理解を深めている。
【0005】
他社情報を確保する方法として、サードパーティークッキーを利用して自社データ(1社データ)と3社データを連結して活用する方法、顧客の同意のもとに提供を受けたデータ(2社データ)を活用する方法などがある。
【0006】
しかしながら、近年の個人情報保護の強化により、クッキーを利用したサードパーティーデータの活用が難しくなりながら、顧客データの確保にも困難が生じ始めた。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】韓国公開特許第10-2008-7001722号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
仮名結合によって個人のプライバシーを保護しながらも、継続的かつ合法的に他社データを活用できるようにする。
【0009】
仮名結合データを利用して自社データから他社データを推定するモデルを構築することにより、最新情報を推定できるようにする。
【0010】
仮名結合データで構築されたモデルによって他社データを推定することで、活用したいデータを拡張できるようにする。
【0011】
自社データだけでなく、仮名結合基盤のモデルによって推定された他社データとの結合により、広告執行や個人化推薦などターゲティングの高度化に活用できるようにする。
【課題を解決するための手段】
【0012】
コンピュータシステムが実行する他社データ提供方法であって、前記コンピュータシステムは、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記他社データ提供方法は、前記少なくとも1つのプロセッサにより、顧客会社の自社の情報と前記顧客会社でない他社の情報を仮名処理して結合した仮名結合データを受信する段階、前記少なくとも1つのプロセッサにより、前記仮名結合データをモデリングすることによってデータ推定のための解釈モデルを生成する段階、前記少なくとも1つのプロセッサにより、前記解釈モデルにより、前記顧客会社のターゲット情報を利用して他社情報を推定する段階、および前記少なくとも1つのプロセッサにより、前記顧客会社と関連するサービスに対して、前記推定された他社情報を提供する段階を含む、他社データ提供方法を提供する。
【0013】
一側面によると、前記生成する段階は、前記仮名結合データを匿名処理して非識別化する段階を含んでよい。
【0014】
他の側面によると、前記生成する段階は、前記仮名結合データを平滑化(smoothing)する過程、および前記仮名結合データにエラー(error)を追加する過程の少なくとも1つによって前記仮名結合データを非識別化する段階を含んでよい。
【0015】
また他の側面によると、前記生成する段階は、前記仮名結合データをテーブル形態で要約する方式、または項目同士の間の類似度を利用して前記仮名結合データを要約する方式、またはロジスティック回帰モデル(Logistic regression model)やディープラーニングモデル(deep learning model)を利用して前記仮名結合データをモデリングする方式によって前記解釈モデルを生成してよい。
【0016】
また他の側面によると、前記生成する段階は、前記解析モデルの生成が完了した後、前記仮名結合データを削除する段階を含んでよい。
【0017】
また他の側面によると、前記提供する段階は、前記顧客会社を対象に、前記ターゲット情報と前記推定された他社情報を連結した形態の拡張データを提供する段階を含んでよい。
【0018】
また他の側面によると、前記提供する段階は、前記ターゲット情報と前記推定された他社情報を、前記顧客会社に対する広告ターゲティングに利用する段階を含んでよい。
【0019】
また他の側面によると、前記推定する段階は、前記解釈モデルを利用して前記顧客会社のターゲット顧客の自社データから前記他社のデータを推定し、前記提供する段階は、前記自社データと前記他社のデータを連結した拡張データを、前記ターゲット顧客に対する広告ターゲティングオプションとして定義する段階を含んでよい。
【0020】
また他の側面によると、前記受信する段階は、外部結合専門機関から仮名結合キーが削除された形式の仮名結合データを受信してよい。
【0021】
さらに他の側面によると、前記受信する段階は、前記顧客会社の仮名データと、前記顧客会社によって情報活用のための対象企業として選択された少なくとも1つの他社の仮名データを結合した前記仮名結合データを受信してよい。
【0022】
前記他社データ提供方法をコンピュータに実行させるためにコンピュータ読み取り可能な記録媒体に記録される、コンピュータプログラムを提供する。
【0023】
コンピュータシステムであって、メモリに含まれるコンピュータ読み取り可能な命令を実行するように構成された少なくとも1つのプロセッサを含み、前記少なくとも1つのプロセッサは、顧客会社の自社の情報と前記顧客会社でない他社の情報を仮名処理して結合した仮名結合データを受信する過程、前記仮名結合データをモデリングすることによってデータ推定のための解釈モデルを生成する過程、前記解釈モデルにより、前記顧客会社のターゲット情報を利用して他社情報を推定する過程、および前記顧客会社と関連するサービスに対して、前記推定された他社情報を提供する過程を処理する、コンピュータシステムを提供する。
【発明の効果】
【0024】
本発明の実施形態によると、仮名結合によって個人のプライバシーを保護しながらも、継続的かつ合法的に他社データを推定して活用することができる。
【0025】
本発明の実施形態によると、仮名結合データを利用して自社データから他社データを推定するモデルを構築することにより、モデルの正確性を確保することができ、データの最新性を保証することができる。
【0026】
本発明の実施形態によると、仮名結合データで構築されたモデルにより、データのつながりを利用して他社のデータを推定することにより、活用しようとするデータを拡張することができる。
【0027】
本発明の実施形態によると、自社データだけでなく、仮名結合基盤のモデルによって推定された他社データとの結合により、広告執行や個人化推薦などのターゲティングの高度化に活用することができる。
【図面の簡単な説明】
【0028】
図1】本発明の一実施形態における、ネットワーク環境の一例を示した図である。
図2】本発明の一実施形態における、コンピュータシステムの例を示したブロック図である。
図3】本発明の一実施形態における、コンピュータシステムが実行することができる他社データ提供方法の一例を示したフローチャートである。
図4】本発明の一実施形態における、各社のデータの仮名処理過程を説明するための例示図である。
図5】本発明の一実施形態における、各社の仮名データを結合した仮名結合データを説明するための例示図である。
図6】本発明の一実施形態における、各社の仮名データを結合した仮名結合データを説明するための例示図である。
図7】本発明の一実施形態における、解析モデルを構築するために取り扱う問題の例を示した図である。
図8】本発明の一実施形態における、RNNを利用したエンコーダ-デコーダの構造例を示した図である。
図9】本発明の一実施形態における、解析モデルを利用したデータ拡張過程を説明するための例示図である。
図10】本発明の一実施形態における、解析モデルを利用したデータ拡張過程を説明するための例示図である。
【発明を実施するための形態】
【0029】
以下、本発明の実施形態について、添付の図面を参照しながら詳しく説明する。
【0030】
本発明の実施形態は、他社データを活用する技術に関する。
【0031】
本明細書で具体的に開示する事項を含む実施形態は、仮名結合によって個人のプライバシーを保護しながらも、継続的かつ合法的に他社データを推定し、活用可能なプラットフォームを提供することができる。
【0032】
本発明の実施形態に係る他社データ提供システムは、少なくとも1つのコンピュータシステムによって実現されてよく、本発明の実施形態に係る他社データ提供方法は、他社データ提供システムに含まれる少なくとも1つのコンピュータシステムによって実行されてよい。このとき、コンピュータシステムにおいては、本発明の一実施形態に係るコンピュータプログラムがインストールされて実行されてよく、コンピュータシステムは、実行されたコンピュータプログラムの制御にしたがって本発明の実施形態に係る他社データ提供方法を実行してよい。上述したコンピュータプログラムは、コンピュータシステムと結合し、他社データ提供方法をコンピュータに実行させるために、コンピュータ読み取り可能な記録媒体に記録されてよい。
【0033】
図1は、本発明の一実施形態における、ネットワーク環境の例を示した図である。図1のネットワーク環境は、複数の電子機器110、120、130、140、複数のサーバ150、160、およびネットワーク170を含む例を示している。このような図1は、発明の説明のための一例に過ぎず、電子機器の数やサーバの数が図1のように限定されることはない。また、図1のネットワーク環境は、本実施形態に適用可能な環境のうちの一例を説明したものに過ぎず、本実施形態に適用可能な環境が図1のネットワーク環境に限定されることはない。
【0034】
複数の電子機器110、120、130、140は、コンピュータ装置によって実現される固定端末や移動端末であってよい。複数の電子機器110、120、130、140の例としては、スマートフォン、携帯電話、ナビゲーション、PC(personal computer)、ノート型PC、デジタル放送用端末、PDA(Personal Digital Assistant)、PMP(Portable Multimedia Player)、タブレットなどがある。一例として、図1では、電子機器110の例としてスマートフォンを示しているが、本発明の実施形態において、電子機器110は、実質的に無線または有線通信方式を利用し、ネットワーク170を介して他の電子機器120、130、140および/またはサーバ150、160と通信することのできる多様な物理的なコンピュータ装置のうちの1つを意味してよい。
【0035】
通信方式が限定されることはなく、ネットワーク170が含むことのできる通信網(一例として、移動通信網、有線インターネット、無線インターネット、放送網)を利用する通信方式だけではなく、機器同士の間の近距離無線通信が含まれてもよい。例えば、ネットワーク170は、PAN(personal area network)、LAN(local area network)、CAN(campus area network)、MAN(metropolitan area network)、WAN(wide area network)、BBN(broadband network)、インターネットなどのネットワークのうちの1つ以上の任意のネットワークを含んでよい。さらに、ネットワーク170は、バスネットワーク、スターネットワーク、リングネットワーク、メッシュネットワーク、スター-バスネットワーク、ツリーまたは階層的ネットワークなどを含むネットワークトポロジのうちの任意の1つ以上を含んでもよいが、これらに限定されることはない。
【0036】
サーバ150、160それぞれは、複数の電子機器110、120、130、140とネットワーク170を介して通信して命令、コード、ファイル、コンテンツ、サービスなどを提供する1つ以上のコンピュータ装置によって実現されてよい。例えば、サーバ150は、ネットワーク170を介して接続した複数の電子機器110、120、130、140に第1サービスを提供するシステムであってよく、サーバ160も、ネットワーク170を介して接続した複数の電子機器110、120、130、140に第2サービスを提供するシステムであってよい。より具体的な例として、サーバ150は、複数の電子機器110、120、130、140にインストールされて実行されるコンピュータプログラムであるアプリケーションを通じて、このアプリケーションが目的とするサービス(一例として、顧客データプラットフォームサービスなど)を第1サービスとして複数の電子機器110、120、130、140に提供してよい。他の例として、サーバ160は、上述したアプリケーションのインストールおよび実行のためのファイルを複数の電子機器110、120、130、140に配布するサービスを第2サービスとして提供してよい。
【0037】
図2は、本発明の一実施形態における、コンピュータシステムの例を示したブロック図である。上述した複数の電子機器110、120、130、140それぞれやサーバ150、160それぞれは、図2に示したコンピュータシステム200によって実現されてよい。
【0038】
このようなコンピュータシステム200は、図2に示すように、メモリ210、プロセッサ220、通信インタフェース230、および入力/出力インタフェース240を含んでよい。
【0039】
メモリ210は、コンピュータ読み取り可能な記録媒体であって、RAM(random access memory)、ROM(read only memory)、およびディスクドライブのような永続的大容量記録装置を含んでよい。ここで、ROMやディスクドライブのような永続的大容量記録装置は、メモリ210とは区分される別の永続的記録装置としてコンピュータシステム200に含まれてもよい。また、メモリ210には、オペレーティングシステムと、少なくとも1つのプログラムコードが記録されてよい。このようなソフトウェア構成要素は、メモリ210とは別のコンピュータ読み取り可能な記録媒体からメモリ210にロードされてよい。このような別のコンピュータ読み取り可能な記録媒体は、フロッピー(登録商標)ドライブ、ディスク、テープ、DVD/CD-ROMドライブ、メモリカードなどのコンピュータ読み取り可能な記録媒体を含んでよい。他の実施形態において、ソフトウェア構成要素は、コンピュータ読み取り可能な記録媒体ではない通信インタフェース230を通じてメモリ210にロードされてもよい。例えば、ソフトウェア構成要素は、ネットワーク170を介して受信されるファイルによってインストールされるコンピュータプログラムに基づいてコンピュータシステム200のメモリ210にロードされてよい。
【0040】
プロセッサ220は、基本的な算術、ロジック、および入出力演算を実行することにより、コンピュータプログラムの命令を処理するように構成されてよい。命令は、メモリ210または通信インタフェース230によって、プロセッサ220に提供されてよい。例えば、プロセッサ220は、メモリ210のような記録装置に記録されたプログラムコードにしたがって受信される命令を実行するように構成されてよい。
【0041】
通信インタフェース230は、ネットワーク170を介してコンピュータシステム200が他の装置(一例として、上述した記録装置)と互いに通信するための機能を提供してよい。一例として、コンピュータシステム200のプロセッサ220がメモリ210のような記録装置に記録されたプログラムコードにしたがって生成した要求や命令、データ、ファイルなどが、通信インタフェース230の制御にしたがってネットワーク170を介して他の装置に伝達されてよい。これとは逆に、他の装置からの信号や命令、データ、ファイルなどが、ネットワーク170を経てコンピュータシステム200の通信インタフェース230を通じてコンピュータシステム200に受信されてよい。通信インタフェース230を通じて受信された信号や命令、データなどは、プロセッサ220やメモリ210に伝達されてよく、ファイルなどは、コンピュータシステム200がさらに含むことのできる記録媒体(上述した永続的記録装置)に記録されてよい。
【0042】
入力/出力インタフェース240は、入力/出力装置250とのインタフェースのための手段であってよい。例えば、入力装置は、マイク、キーボード、またはマウスなどの装置を、出力装置は、ディスプレイ、スピーカのような装置を含んでよい。他の例として、入力/出力インタフェース240は、タッチスクリーンのように入力と出力のための機能が1つに統合された装置とのインタフェースのための手段であってもよい。入力/出力装置250は、コンピュータシステム200と1つの装置で構成されてもよい。
【0043】
また、他の実施形態において、コンピュータシステム200は、図2の構成要素よりも少ないか多くの構成要素を含んでもよい。しかし、大部分の従来技術の構成要素を明確に図に示す必要はない。例えば、コンピュータシステム200は、上述した入力/出力装置250のうちの少なくとも一部を含むように実現されてもよいし、トランシーバ、データベースなどのような他の構成要素をさらに含んでもよい。
【0044】
以下では、仮名結合を利用してデータを拡張および活用するための方法およびシステムの具体的な実施形態について説明する。
【0045】
企業が他社の情報を活用するためには、顧客の同意を得た上で提供を受けたり、サードパーティークッキーやデータの類似性を利用して異なる企業のデータをマッチングする方法を活用している。
【0046】
本実施形態は、仮名結合を利用して合法的なデータで解釈モデルを構築する方法であって、互いに異なる企業のデータを継続的に推定して活用する技術に関する。
【0047】
本実施例に係るコンピュータシステム200は、クライアント(client)を対象に、クライアント上にインストールされた専用アプリケーションやコンピュータシステム200と関連するウェブ/モバイルサイトへの接続によって顧客データプラットフォームサービスを提供してよい。
【0048】
このようなプロセッサ220は、以下で説明する他社データ提供方法に含まれる段階を実行するようにコンピュータシステム200を制御してよい。例えば、プロセッサ220およびプロセッサ220の構成要素は、メモリ210が含むオペレーティングシステムのコードと、少なくとも1つのプログラムのコードによる命令(instruction)を実行するように実現されてよい。
【0049】
プロセッサ220は、コンピュータシステム200の制御に関連する命令がロードされたメモリ210から必要な命令を読み取ってよい。この場合、前記読み取られた命令は、プロセッサ220が以下で説明する他社データ提供方法を実行するように制御するための命令を含んでよい。
【0050】
以下で説明する他社データ提供方法に含まれる段階は、図に示した順序とは異なるように実行されてもよいし、段階の一部が省略されたり、追加の過程をさらに含んでもよい。
【0051】
他社データ提供方法に含まれる段階は、サーバ150で実行されてよいが、実施形態によっては、段階の少なくとも一部がクライアントまたは他のサーバ(例えば、サーバ160など)で実行されることも可能である。
【0052】
図3は、本発明の一実施形態における、コンピュータシステムが実行することができる方法の一例を示したフローチャートである。
【0053】
本実施形態に係るコンピュータシステム200によって実現されるサーバ150は、企業を対象としたサービス形態として、サービスを利用する顧客会社のデータ(すなわち、顧客会社の自社の顧客情報)と顧客会社以外の他社のデータ(例えば、サーバ150の顧客情報、サーバ150と連動可能な提携会社の顧客情報など)を連結した形態で広告やマーケティングなどに活用することができる顧客データプラットフォーム(customer data platform)を提供する。
【0054】
図3を参照すると、段階310で、プロセッサ220は、顧客会社の自社の情報と顧客会社以外の他社の情報を仮名処理して結合した仮名結合データをモデリングすることにより、データ推定のための解釈モデルを生成してよい。一例として、顧客会社は、サーバ150上の顧客データプラットフォームから活用しようとする少なくとも1つの対象企業を選択した後、解釈モデルの構築を要請してよい。これにより、プロセッサ220は、顧客会社と顧客会社が選択した対象企業で仮名処理して提供するデータに対して、第3の機関(政府が指定した外部結合専門機関)に仮名情報の結合を要請してよい。プロセッサ220は、結合専門機関から、顧客会社の仮名データと対象企業の仮名データが結合された仮名結合データを受信してよい。プロセッサ220は、仮名結合データを利用して、データ推定のための解釈モデルとして、顧客会社データを入力として他社(対象企業)データを推定するモデル、他社データを入力として顧客会社データを推定するモデルなどを構築してよい。顧客会社と対象企業との間の仮名結合データをモデリングする方法としては、テーブル形式で仮名結合データを要約する方法、項目同士の間の類似度を利用して仮名結合データを要約する方法、ロジスティック回帰モデル(Logistic regression model)を利用して仮名結合データを要約する方法、ディープラーニングモデル(deep learning model)を利用して仮名結合データを要約する方法などが活用されてよい。プロセッサ220は、解析モデルを構築した後、結合専門機関から受け取った仮名結合データを削除してよい。
【0055】
段階320で、プロセッサ220は、顧客会社からターゲット情報が与えられた場合、段階310で構築した解析モデルによって、顧客会社のターゲット情報を利用して他社情報を推定してよい。すなわち、プロセッサ220は、顧客会社のターゲット情報を解析モデルの入力として、解析モデルによって顧客会社のターゲット情報に対応する他社情報を予測してよい。例えば、A社(顧客会社)の自社顧客の商品購入履歴とB社(対象企業)の自社顧客の検索履歴を結合した仮名結合データによって解釈モデルを構築したと仮定するとき、A社の自社顧客に対してA社の商品購入履歴からB社の検索履歴を推定してよい。
【0056】
段階330で、プロセッサ220は、顧客会社を対象に、顧客会社のターゲット情報と解釈モデルによってターゲット情報として推定された他社情報を連結した拡張データを提供してよい。プロセッサ220は、顧客会社の自社の全顧客または顧客会社によって選定された自社の顧客グループを対象に、顧客会社データと顧客会社データとして推定された他社データを連結した形態の、拡張されたデータを提供してよい。
【0057】
プロセッサ220は、顧客を対象としたサービスに、当該顧客の拡張データを活用してよい。一例として、プロセッサ220は、顧客会社と関連する広告ターゲティング、個人化推薦、マーケティングなどに、当該顧客会社の拡張データを活用してよい。顧客会社が自社顧客を対象に広告を提供しようとする場合、顧客会社のターゲット顧客を解釈モデルで推定した他社データとして解釈して広告ターゲティングオプションを定義してよい。例えば、検索サービスを提供するサーバ150が広告プラットフォームと連携する環境において、解釈モデルを利用して顧客会社のターゲット顧客履歴から履歴検索履歴を推定し、推定された検索履歴を含む拡張データを広告ターゲティングオプションとして定義してよい。このとき、広告プラットフォームでは、顧客会社のターゲット顧客を対象に、他社情報の推定によって拡張されたデータで定義されたターゲティングオプションによって広告を執行してよい。
【0058】
図4は、本発明の一実施形態における、各社のデータの仮名処理過程を説明するための例示図である。
【0059】
図4は、A社の仮名データとB社の仮名データを示している。
【0060】
各企業では、活用の目的に応じて自社顧客のデータを項目化する。例えば、A社の仮名データは、A社の顧客別セグメント情報を含んでよく、B社の仮名データは、B社の顧客別広告ターゲティング情報を含んでよい。
【0061】
各社では、両社が共通して保有するユーザ識別子(例えば、ID、クッキーなど)レベルで顧客データを構成する。このとき、仮名データを構成するにあたり、ユーザ識別情報を仮名処理するために、ユーザ識別情報とソルト(salt)やハッシュ(hash)などを利用して仮名結合キーを生成してよい。追加情報を使用せずには特定の個人が識別されないように、ユーザ情報を仮名処理してよい。
【0062】
図5~6は、本発明の一実施形態における、各社の仮名データを結合した仮名結合データを説明するための例示図である。
【0063】
図5は、図4のA社の仮名データとB社の仮名データを結合した仮名結合の例を示している。仮名情報の結合は、政府が指定した外部結合専門機関で行われ、サーバ150は、結合専門機関から、A社の仮名データとB社の仮名データが結合された仮名結合データを受け取ってよい。
【0064】
図5は、A社の仮名データとB社の仮名データを内部結合(inner join)の形態で仮名結合した結果を示している。結合専門機関では、A社とB社が共通して保有する顧客(仮名結合キー)に対して、両社のデータを結合してよい。
【0065】
データ活用機関のデータが仮名結合に使用される場合、データ活用機関のデータに左外部結合(left join)する形態の仮名結合も可能である。
【0066】
図6を参照すると、結合専門機関では、A社の仮名データとB社の仮名データの結合が完了すると、結合データから仮名結合キーを削除してサーバ150に提供してよい。すなわち、サーバ150は、仮名結合キーが削除された形態の仮名結合データを受け取って活用してよい。
【0067】
以下では、仮名結合データを利用して解析モデルを構築する過程について説明する。
【0068】
図7は、本発明の一実施形態における、解析モデルを構築するために取り扱う問題例を示した図である。
【0069】
解析モデルを構築するためには、A社の仮名データとB社の仮名データを結合した仮名結合データが図7に示すようなものであると仮定した場合、A社の任意のアイテムユーザ群をB社のアイテムユーザ情報として類推できるかどうかの問題について取り扱う。
【0070】
A社のアイテムがA、...、Aであり、B社のアイテムがB、...、Bであるとき、ユーザUは[Ai1、...、Ain、Bi1、...、Bim]と定義してよい。
【0071】
一例として、プロセッサ220は、テーブル形式で仮名結合データを要約する方法によって解析モデルを構築してよい。
【0072】
情報が損失されることなく最もシンプルに原本を要約する方法として、
【数1】

の形式を挙げることができる。この場合、すべての組み合わせを記録するために、B社の情報が与えられたときにA社の情報を正確に復元する。ただし、ユーザ数が1人の組み合わせの場合には個人が特定される可能性があるため、これを防ぐために、ユーザ数が1人である場合に対する処理が必要となる。
【0073】
1人に特定されるデータを他のグループと併合して処理する方法が使用されてよく、各グループ内の均質性は最大限に維持しながらも、グループ同士の間の距離は遠ざかる方向で進行する。併合によるデータ情報の損失を最小限に抑えるために、各アイテムの重要度が反映された距離を使用したり、重要度が低い一部のアイテムに対して非識別化処理する方法などが採択されてよい。
【0074】
他の例として、プロセッサ220は、項目同士の間の類似度を利用して仮名結合データを要約する方法によって解釈モデルを構築してよい。
【0075】
A社のアイテムとB社のアイテムの関係行列を加工し、これをB社のユーザ情報と組み合わせてA社のユーザ情報を推測するために活用してよい。数式(1)によると、Sはアイテム同士の間の対応情報であってユーザ識別子情報がないため、比較的安全なデータであると言える。しかし、実際にはB-1が存在しないため、すぐに使用することができない方法でもある。
【0076】
【数2】
【0077】
これを簡単な推薦システムの1つであるアイテム基盤の協業フィルタリングの形態に変形することが可能である。ユーザが以前に消費したアイテムと類似するアイテムに高い点数を付与する方法である。類似度は、コサイン(cosine)類似度、ジャカード(Jaccard)類似度などはもちろん、多様な適用が可能である。KNN(k-nearest neighbor)を使用するなどの変形も可能である。
【0078】
Sは、A社とB社のアイテムの類似度行列であって、数式(2)のように定義してよい。
【0079】
【数3】
【0080】
A社のアイテムに対するユーザの消費スコアは、数式(3)のように定義してよい。
【0081】
【数4】
【0082】
他の例として、プロセッサ220は、ロジスティック回帰モデルを利用して仮名結合データを要約する方法によって解釈モデルを構築してよい。
【0083】
同時分布(joint distribution)が周辺分布(marginal distribution)の積であると仮定するとき、以下のようにすべての結合に対する分布を簡単に得ることができる。
【0084】
個別アイテムのロジスティック回帰モデル:
【数5】
【0085】
すべての項目の組み合わせに対する同時分布は、数式(4)のように定義してよい。
【0086】
【数6】
・・・(4)
【0087】
この概念を拡張することで、2つのアイテムの条件を1つのイベントと見なして
【数7】

を推定できるようになる。さらに、主要アイテムのすべての組み合わせにモデルを生成して、残りのアイテムの分布を推定する方法も検討することができる。
【0088】
また他の例として、プロセッサ220は、ディープラーニングモデルを利用して仮名結合データを要約する方法によって解析モデルを構築してよい。
【0089】
図8は、本発明の一実施形態における、RNN(recurrent neural network)を利用したエンコーダ-デコーダの構造例を示した図である。
【0090】
入力されたシーケンスから他のドメインのシーケンスを出力するモデルであるSeq2Seq(sequence-to-sequence)方法を利用する。図8を参照すると、入力シーケンス(x、x、x)と出力シーケンス(y、y)をそれぞれA社のアイテムとB社のアイテムとして構成すると、A社のアイテムを入力したときにB社アイテムに通訳(解釈)する役割をするようになる。
【0091】
ただし、このようなモデリング方法に限定されてはならず、仮名結合データの要約が可能なモデリング方法であればすべて適用可能である。
【0092】
クッキーやデータの類似性を利用するだけのマッチング方式のモデリングは正確度が低い反面、仮名情報の結合を利用して解釈モデルを構築することにより、個人情報保護法上で最も正確に結合する方法でモデルの正確度を確保することができる。
【0093】
さらに、プロセッサ220は、解析モデルの結果物に対する非識別化処理を実行してよい。一例として、プロセッサ220は、解釈モデルを構築する過程において仮名結合データを匿名処理することにより、モデル結果物の再識別の可能性を事前に排除してよい。他の例として、プロセッサ220は、仮名結合データを変形なく使用しても解析モデルによる推定結果物から個人が特定できないように、モデリング過程において平滑化(smoothing)過程を経たり、エラー(error)を追加したりする方法によって非識別化を処理してよい。
【0094】
また、プロセッサ220は、再識別の可能性の検証によって匿名性を保証してよい。例えば、プロセッサ220は、自社が保有している全データを入力として利用して推定された結果に、同じ属性を有するロー(row)がk個以上であるかを確認するk匿名性を適用してよい。
【0095】
図9~10は、本発明の一実施形態における、解析モデルを利用したデータ拡張過程を説明するための例示図である。
【0096】
図9を参照すると、プロセッサ220は、A社とB社の仮名結合データによってモデリングされた解析モデル90により、A社のターゲット情報(A)を利用してB社の情報(N)を推定してよい。
【0097】
すべての企業のデータは固定的ではなく変化し続けるものであるが、解析モデル90を利用することで、企業が保有する入力データの変動にともなって解析モデル90の推定結果物も変化するため、最新の情報を推定することができる。また、仮名結合データを実際に保有せずに仮名結合データで構築された解析モデル90を利用することにより、継続的に統合されたデータを活用することができる。
【0098】
プロセッサ220は、顧客会社であるA社情報(A)を利用してA社の他社であるB社情報(N)を推定して、A社データを拡張してよい。図10に示すように、A社の拡張されたデータは、A社の全顧客を対象にしたA社データと解析モデル90によって推定されたB社情報を連結した形態で構成されてよい。
【0099】
A社がA社のVIP顧客を対象に広告を執行しようとする場合、図10の拡張データにおいて、AはA社のVIP状況(VIPであれば1、VIPでなければ0)項目であり、NはB社の広告ターゲティングオプション項目であるとすると、Aが1であるユーザ(A社のVIPグループ)の特徴をNで表現してよい。このような特徴の組み合わせ(ターゲティングオプションの組み合わせ)によって広告を執行すれば、ターゲティングしようとするA社のVIPグループを対象に広告を執行することができる。
【0100】
B社が広告プラットフォーム企業であると仮定するとき、B社の広告プラットフォームにはA社のVIP顧客に関する情報がないため、A社のVIPを対象に広告を執行することができず、A社のデータを利用して分析した顧客の特性としては解像度の低いターゲティングだけが可能となる。例えば、VIPの主な年齢が30代で女性であれば、30代&女性という広範囲の条件にターゲティングされた広告が執行される。
【0101】
この半面、本実施形態によると、B社の広告プラットフォームで、A社のデータだけでなくA社のデータとして推定されたB社のデータをともに利用することにより、実際のA社のVIP顧客の特性をB社のデータで表現することができ、より正確かつ精密なターゲティングによってA社の顧客にたどり着くことが可能となる。本実施形態では、30代&女性というA社のデータを利用してB社の履歴を推定することができ、これにより、より具体的なターゲティングオプションを定義することができる。
【0102】
このように、本発明の実施形態によると、仮名結合によって個人のプライバシーを保護しながらも、継続的かつ合法的に他社データを推定して活用することができる。また、本発明の実施形態によると、仮名結合データを利用して自社データから他社データを推定するモデルを構築することにより、モデルの正確性を確保することができ、データの最新性を保証することができる。また、本発明の実施形態によると、仮名結合データで構築されたモデルによってデータ同士の間のつながりを利用して他社データを推定することにより、活用しようとするデータを拡張することができる。さらに、本発明の実施形態によると、自社データだけでなく、仮名結合ベースのモデルによって推定された他社データと結合することにより、広告執行や個人化推薦などターゲティングの高度化に活用することができる。
【0103】
上述した装置は、ハードウェア構成要素、ソフトウェア構成要素、および/またはハードウェア構成要素とソフトウェア構成要素との組み合わせによって実現されてよい。例えば、実施形態で説明された装置および構成要素は、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ、マイクロコンピュータ、FPGA(field programmable gate array)、PLU(programmable logic unit)、マイクロプロセッサ、または命令を実行して応答することができる様々な装置のように、1つ以上の汎用コンピュータまたは特殊目的コンピュータを利用して実現されてよい。処理装置は、オペレーティングシステム(OS)およびOS上で実行される1つ以上のソフトウェアアプリケーションを実行してよい。また、処理装置は、ソフトウェアの実行に応答し、データにアクセスし、データを記録、操作、処理、および生成してもよい。理解の便宜のために、1つの処理装置が使用されるとして説明される場合もあるが、当業者であれば、処理装置が複数個の処理要素および/または複数種類の処理要素を含んでもよいことが理解できるであろう。例えば、処理装置は、複数個のプロセッサまたは1つのプロセッサおよび1つのコントローラを含んでよい。また、並列プロセッサのような、他の処理構成も可能である。
【0104】
ソフトウェアは、コンピュータプログラム、コード、命令、またはこれらのうちの1つ以上の組み合わせを含んでもよく、思うままに動作するように処理装置を構成したり、独立的または集合的に処理装置に命令したりしてよい。ソフトウェアおよび/またはデータは、処理装置に基づいて解釈されたり、処理装置に命令またはデータを提供したりするために、いかなる種類の機械、コンポーネント、物理装置、仮想装置(virtual equipmet)、コンピュータ記録媒体または装置に具現化されてよい。ソフトウェアは、ネットワークによって接続されたコンピュータシステム上に分散され、分散された状態で記録されても実行されてもよい。ソフトウェアおよびデータは、1つ以上のコンピュータ読み取り可能な記録媒体に記録されてよい。
【0105】
実施形態に係る方法は、多様なコンピュータ手段によって実行可能なプログラム命令の形態で実現されてコンピュータ読み取り可能な媒体に記録されてよい。このとき、媒体は、コンピュータによって実行可能なプログラムを継続して記録するものであってもよいし、実行またはダウンロードのために一時的に記録するものであってもよい。また、媒体は、単一または複数のハードウェアが結合した形態の多様な記録手段または格納手段であってよく、あるコンピュータシステムに直接接続させる媒体はもちろん、ネットワーク上に分散して存在するものであってもよい。媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク、および磁気テープのような磁気媒体、CD-ROM、DVDのような光媒体、フロプティカルディスク(floptical disk)のような光磁気媒体、およびROM、RAM、フラッシュメモリなどのようなプログラム命令が記録されるように構成されたものが挙げられる。また、他の媒体の例として、アプリケーションを流通するアプリストアや、その他の多様なソフトウェアを供給したり流通したりするサイト、サーバなどで管理する記録媒体や格納媒体も含まれる。
【0106】
以上のように、実施形態を、限定された実施形態および図面に基づいて説明したが、当業者であれば、上述した記載から多様な修正および変形が可能であろう。例えば、説明された技術が、説明された方法とは異なる順序で実行されたり、かつ/あるいは、説明されたシステム、構造、装置、回路などの構成要素が、説明された方法とは異なる形態で結合されたりまたは組み合わされたり、他の構成要素または均等物によって対置されたり置換されたとしても、適切な結果を達成することができる。
【0107】
したがって、異なる実施形態であっても、特許請求の範囲と均等なものであれば、添付の特許請求の範囲に属する。
【符号の説明】
【0108】
110、120、130、140:電子機器
150、160:サーバ
170:ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10