IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アウー インテリジェンス, インコーポレイテッドの特許一覧

<>
  • 特開-情報匿名化の行動ベクトル化法 図1
  • 特開-情報匿名化の行動ベクトル化法 図2
  • 特開-情報匿名化の行動ベクトル化法 図3
  • 特開-情報匿名化の行動ベクトル化法 図4
  • 特開-情報匿名化の行動ベクトル化法 図5
  • 特開-情報匿名化の行動ベクトル化法 図6
  • 特開-情報匿名化の行動ベクトル化法 図7
  • 特開-情報匿名化の行動ベクトル化法 図8
  • 特開-情報匿名化の行動ベクトル化法 図9
  • 特開-情報匿名化の行動ベクトル化法 図10
  • 特開-情報匿名化の行動ベクトル化法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022163669
(43)【公開日】2022-10-26
(54)【発明の名称】情報匿名化の行動ベクトル化法
(51)【国際特許分類】
   G06F 16/906 20190101AFI20221019BHJP
   G06Q 30/02 20120101ALI20221019BHJP
   G06N 20/00 20190101ALI20221019BHJP
【FI】
G06F16/906
G06Q30/02 300
G06N20/00
【審査請求】有
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2021100155
(22)【出願日】2021-06-16
(31)【優先権主張番号】110113471
(32)【優先日】2021-04-14
(33)【優先権主張国・地域又は機関】TW
(71)【出願人】
【識別番号】521190325
【氏名又は名称】アウー インテリジェンス, インコーポレイテッド
【氏名又は名称原語表記】Awoo Intelligence, Inc.
【住所又は居所原語表記】14F., No.96, Sec. 2, Zhongshan N. Rd., Zhongshan Dist., Taipei City 104, Taiwan
(74)【代理人】
【識別番号】100137095
【弁理士】
【氏名又は名称】江部 武史
(74)【代理人】
【識別番号】100091627
【弁理士】
【氏名又は名称】朝比 一夫
(72)【発明者】
【氏名】クオ ミン リン
(72)【発明者】
【氏名】チェン ウェイ リー
(72)【発明者】
【氏名】シュ ウ リン
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175BA01
5B175FA01
5B175FA03
5B175FB04
5L049BB01
(57)【要約】
【課題】情報匿名化の行動ベクトル化法を提供する。
【解決手段】ネットユーザーのネット上での閲覧足跡、リンクのパス、トリガーしたイベント、クリック、操作行動等のデータをサーバー、クライアント端末、エッジ端末等のうちの1つを選択するか任意で変換演算及び統合を行い、統合後のデータをベクトルに変換し、且つこのベクトルは前記ネットユーザーのネットの使用及び行動の輪郭を表す。また、ベクトルにより高速にクラスタリング分類を行ってこれと相似するグループを検索することにより、ネットユーザーを高速に識別する。本サーバーは教師あり学習を基底とし、予め定義したネット行動のトレーニングを行い、且つさらに半教師あり学習または教師なし学習により未定義のネット行動の修正を行うことで、ネットユーザーの輪郭の描写にさらに適合させる。
【選択図】図1
【特許請求の範囲】
【請求項1】
サーバーがデータプロバイダーデバイスと情報リンクし、前記データプロバイダーデバイスがパスベクトル学習データ及びベクトルクラスタリング学習データを前記サーバーに提供すると共に伝送するデータプロバイダーがデータを提供するステップと、
前記サーバーが前記パスベクトル学習データ及び前記ベクトルクラスタリング学習データを受信した後、前記サーバーのベクトル化モジュールが前記パスベクトル学習データを過去のデータとして第一機械学習を行い、また、前記サーバーのクラスタリング/分類モジュールが前記ベクトルクラスタリング学習データを過去のデータとして第二機械学習を行うモデルトレーニングステップと、
前項のステップを受けて、前記第一機械学習及び前記第二機械学習トレーニングが完了した後、前記サーバーがクライアントデバイスのパスデータをキャプチャーし、前記パスデータを前記ベクトル化モジュールに伝送するクライアントパスデータをキャプチャーするステップと、
前項のステップを受けて、前記ベクトル化モジュールが前記第一機械学習の結果に基づいて前記パスデータのデータベクトル化動作を行い、前記パスデータをベクトル化データに変換し、前記ベクトル化モジュールが前記ベクトル化データを前記クラスタリング/分類モジュールに伝送するパスデータベクトル化ステップと、
前項のステップを受けて、前記クラスタリング/分類モジュールが前記第二機械学習の結果に基づいて前記ベクトル化データのクラスタリング動作を行い、前記ベクトル化データにクラスタリング結果を付与し、最後に前記クラスタリング結果を前記サーバーに保存するベクトル化クラスタリングステップと、を含むことを特徴とする情報匿名化の行動ベクトル化法。
【請求項2】
前記パスベクトル学習データは少なくとも複数の過去のパスデータ及び過去のベクトルデータであり、且つ前記過去のベクトルデータは前記過去のパスデータのウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類のデータまたはそれらの組み合わせデータであることを特徴とする請求項1に記載の情報匿名化の行動ベクトル化法。
【請求項3】
前記ベクトルクラスタリング学習データは少なくとも複数の前記過去のベクトルデータ及び過去のクラスタリングデータであり、且つ前記過去のクラスタリングデータは複数の前記過去のベクトルデータに対応していることを特徴とする請求項2に記載の情報匿名化の行動ベクトル化法。
【請求項4】
前記第一機械学習及び前記第二機械学習は主に教師あり学習、半教師あり学習、強化学習、教師なし学習、自己教師あり学習、及びヒューリスティックアルゴリズムのうちの何れか1種類またはそれらの組み合わせを採用していることを特徴とする請求項1に記載の情報匿名化の行動ベクトル化法。
【請求項5】
前記パスデータはウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類またはそれらの組み合わせデータであることを特徴とする請求項1に記載の情報匿名化の行動ベクトル化法。
【請求項6】
前記データベクトル化動作は一次元データを二次元ベクトルマトリクス、三次元ベクトルマトリクス、或いは多次元ベクトルマトリクスのうちの何れか1種類に変換することを特徴とする請求項1に記載の情報匿名化の行動ベクトル化法。
【請求項7】
前記クライアントパスデータをキャプチャーするステップ及び前記パスデータベクトル化ステップにおいて、前記サーバーがまず前記第一機械学習の結果を前記クライアントデバイスに伝送し、前記クライアントデバイスが前記パスデータを前記ベクトル化データに変換し、前記ベクトル化データを前記サーバーに伝送することを特徴とする請求項1に記載の情報匿名化の行動ベクトル化法。
【請求項8】
主にデータ処理モジュールと、データストレージモジュールと、ベクトル化モジュールと、クラスタリング/分類モジュールとを含むサーバーであって、前記データ処理モジュールは前記サーバーを作動させ、前記データストレージモジュールは前記サーバーが受信及び演算したデータを主に保存するサーバーと、
前記サーバーと情報リンクし、パスベクトル学習データ及びベクトルクラスタリング学習データを前記サーバーに提供するデータプロバイダーデバイスと、
前記サーバーと情報リンクするクライアントデバイスであって、前記サーバーは前記クライアントデバイスのパスデータをキャプチャーするクライアントデバイスと、を備え、
前記ベクトル化モジュールは前記パスベクトル学習データを過去のデータとして第一機械学習を行い、前記第一機械学習トレーニングが完了した後、前記パスデータのデータベクトル化動作を行い、且つベクトル化データに変換し、
前記クラスタリング/分類モジュールは前記ベクトルクラスタリング学習データを過去のデータとして第二機械学習を行い、前記第二機械学習トレーニングが完了した後、前記ベクトル化データのクラスタリング動作を行い、且つ前記ベクトル化データにクラスタリング結果を付与し、最後に前記クラスタリング結果を前記データストレージモジュールに保存することを特徴とする情報匿名化の行動ベクトル化システム。
【請求項9】
前記パスベクトル学習データは少なくとも複数の過去のパスデータ及び過去のベクトルデータであり、且つ前記過去のベクトルデータは前記過去のパスデータのウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類のデータまたはそれらの組み合わせデータであることを特徴とする請求項8に記載の情報匿名化の行動ベクトル化システム。
【請求項10】
前記ベクトルクラスタリング学習データは少なくとも複数の前記過去のベクトルデータ及び過去の分類クラスタリングデータであり、前記過去のクラスタリングデータは複数の前記過去のベクトルデータに対応していることを特徴とする請求項9に記載の情報匿名化の行動ベクトル化システム。
【請求項11】
前記第一機械学習及び前記第二機械学習は主に教師あり学習、半教師あり学習、強化学習、教師なし学習、自己教師あり学習、及びヒューリスティックアルゴリズムのうちの何れか1種類またはそれらの組み合わせを採用していることを特徴とする請求項8に記載の情報匿名化の行動ベクトル化システム。
【請求項12】
前記パスデータはウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類またはそれらの組み合わせデータであることを特徴とする請求項8に記載の情報匿名化の行動ベクトル化システム。
【請求項13】
前記データベクトル化動作は一次元データを二次元ベクトルマトリクス、三次元ベクトルマトリクス、或いは多次元ベクトルマトリクスのうちの何れか1種類に変換することを特徴とする請求項8に記載の情報匿名化の行動ベクトル化システム。
【請求項14】
前記サーバーは少なくとも1つのエッジサーバーと情報リンクし、前記エッジサーバーは前記サーバーを補助し、エッジ演算機能により前記サーバーの演算機能を高めていることを特徴とする請求項8に記載の情報匿名化の行動ベクトル化システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットユーザーの情報を匿名化し、ベクトル化形式を組み合わせてネットユーザーを示し、ネットユーザーの行動のベクトル化及びクラスタリングを行う情報匿名化の行動ベクトル化法に関する。
【背景技術】
【0002】
ネット情報化時代を迎えて、ユーザーのデータを様々な方面から取得可能になっており、昔のように有用な情報ソースを必死に捜索する必要がなくなった。
【0003】
しかしながら、このような便利な検索方式にも多くの危険が潜んでいる。例えば、個人情報保護問題である。特に氏名、電話番号、メールアドレス、住所等個人を特定可能な情報を有している場合、ユーザーが不注意や事故によりインターネットに流出すると悪意を持った人間に不正利用される場合がある。このため、多くのネットユーザーは自分を守るために個人情報及び基本データを公開しないようにしている。しかし、広告業者やインターネットマーケティング業者にとっては、ネットユーザーの個人情報や基本データを取得できなければ、マーケティング効率が明らかに大きく低下し、例えば、精確な広告投下率が低下し、同類の客グループに対し精確にマーケティング等を行えなくなった。このため、他人の個人情報を侵害せずにネットユーザーを分析し、且つ分析後のネットユーザー情報を後続の作業に使用することが越えなければならない技術的障壁となっている。従来の特許文献では、例えば、下記特許文献1の「個人化インターネットマーケティング方法」という記載があり、顧客が辿った経路を分析し、且つ高速にクラスタリングすることで近似するグループを検索する。また、例えば、下記特許文献2の「個人化消費メッセージ生成方法及び管理システム」という記載があり、顧客が辿った経路を利用して高速にクラスタリングを行い、且つ近似するグループを検索し、さらにディープラーニング等の機械学習を利用してシステムを改善している。なお、他の先行技術として以下を参照する。
(1)「ネットの顧客行動の分析及び結果を標示するシステム及びその方法」(下記特許文献3参照)
(2)「スマートマーケティング広告分類システム」(下記特許文献4参照)
(3)「Cryptographic anonymization for Zero-Knowledge Advertising Methods, Apparatus, and System」(下記特許文献5参照)
(4)「Ecosystem method of aggregation and search and related techniques」(下記特許文献6参照)
(5)「情報検索システム」(下記特許文献7参照)
(6)「情報処理装置及び情報処理プログラム」(下記特許文献8参照)
【先行技術文献】
【特許文献】
【0004】
【特許文献1】台湾特許出願公開第611362B号明細書
【特許文献2】中国特許出願公開第109583920A号明細書
【特許文献3】台湾特許出願公開第202020771A号明細書
【特許文献4】台湾特許出願公開第202025039A号明細書
【特許文献5】米国特許出願公開第20200160388A1号明細書
【特許文献6】米国特許出願公開第20140122493A1号明細書
【特許文献7】日本特許出願公開第2019219764号明細書
【特許文献8】日本特許出願公開第2020184198号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来技術から分かるように、マーケティング端末またはネットの顧客行動分析端末は個人情報問題を解決するため、まず顧客のネット、ウェブサイト上での閲覧パスを収集し、この閲覧パスを分析することで分類及びクラスタリングを行い、最後に分類及びクラスタリング結果に基づいて広告の投下やマーケティング等を実施する。しかしながら、ネットユーザーが使用するパスは多元的であり、ウェブサイト停留時間、クリック行動、操作、イベントのトリガー等にわずかな違いがあっても分析結果が変わることがある。さらには、機械学習のみを使用してパスの学習分析を行う場合、パスが未定義の状況が発生しやすく分析結果の信頼が失われ、価値がなくなった。最後に、パスをより明確にしてネットユーザーを示す、或いはパスによりネットユーザーを描写することが、解決が待たれる問題であった。
【0006】
そこで、本発明者は上記の欠点が改善可能と考え、鋭意検討を重ねた結果、合理的設計で上記の課題を効果的に改善する本発明の提案に至った。
【0007】
本発明は前記技術的課題に鑑みて開発されたものであり、情報を匿名化し、ベクトル化によりネットユーザーのパスを変換し、クラスタリングする情報匿名化の行動ベクトル化法を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するために、本発明のある態様の情報匿名化の行動ベクトル化法は、主にサーバーによりネットユーザーのネット上での閲覧の足跡、経由した経路、履歴、イベントのトリガー、クリック操作等の個人情報に属しないデータをキャプチャーし、且つこの大量のデータをスタックして統合する。その後、ベクトルマトリクスに変換し、このベクトルマトリクスをネットユーザーの輪郭、特徴、識別コード、消費の特徴等のネットユーザーを示すデータとする。また、サーバーはベクトルマトリクスを高速にクラスタリング及び分類することで、これと相似するグループを検索し、ネットユーザーを高速に識別する。また、ベクトル変換並びにクラスタリング及び分類は全てデータ提供端末により、まず過去にネットユーザーがネットで使用したパスを予め定義及び分類し、サーバーが教師あり学習を基底とした機械学習によりトレーニングを行い、機械学習が完了した後、キャプチャーしたデータをスタックしてベクトル化し、且つベクトル化した後のベクトルマトリクスを分類する。前述のベクトル化はさらに、例えば、ブラウザ、ウェブページ、モバイルデバイス、ウェアラブルデバイス、車載用品、IOTデバイス、POS等、或いはEdge Serverから1つを選択するか、任意の組み合わせのクライアント端末で変換演算及び集約 (Aggregation)を行い、サーバーが省エネでコストを節約するようにし、且つ後続の高速分類を実施する。本サーバーは教師あり学習を基底とし、予め定義したネット行動のトレーニングを行い、半教師あり学習や教師なし学習をもう1つの基底とし、連続的行動からその関連度を推論してトレーニングを行う。半教師あり学習や教師なし学習により、ネットユーザーが行う操作や使用について未定義のネット行動をさらにフィードバックし、モデルを再学習して修正し、ネットユーザーの輪郭の描写にさらに適合させる。
【0009】
本発明の他の特徴については、本明細書及び添付図面の記載により明らかにする。
【図面の簡単な説明】
【0010】
図1】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略構成図である。
図2】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示すフローチャートである。
図3】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(一)である。
図4】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(二)である。
図5】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(三)である。
図6】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(四)である。
図7】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(五)である。
図8】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(六)である。
図9】本発明の一実施形態に係る情報匿名化の行動ベクトル化法を示す概略図(七)である。
図10】本発明の他の実施形態に係る情報匿名化の行動ベクトル化法を示すフローチャートである。
図11】本発明のさらなる他の実施形態に係る情報匿名化の行動ベクトル化法を示すブロック図である。
【発明を実施するための形態】
【0011】
以下、本開示の実施形態について図面を用いて説明する。なお、本開示は、下記の実施形態に何ら限定されることはなく、本開示の技術的範囲に属する限り種々の形態を採りうる。
【0012】
次に、図1を参照しながら、本発明の情報匿名化の行動ベクトル化システム1を詳しく説明する。本発明に係る情報匿名化の行動ベクトル化システム1はサーバー11と、データプロバイダーデバイス12と、クライアントデバイス13と、を備えている。
【0013】
(1)サーバー11は主にデータプロバイダーデバイス12及びクライアントデバイス13との情報リンクを完成し、サーバー11がデータプロバイダーデバイス12から提供された学習トレーニングサンプルを受信すると共にこれに基づいて機械学習モデルを構築する。このモデルは主にクライアントデバイス13がネットで使用したパスをキャプチャーし、スタック及びベクトル化を行い、さらにベクトル化した後のデータのクラスタリング及び分類を行う。
(2)データプロバイダーデバイス12は検索エンジンデータベース或いはデジタルデータベースであり、サーバー11が必要な学習トレーニングサンプルを取得可能にするデバイスであれば全て実施可能である。
(3)クライアントデバイス13は携帯電話、タブレット端末、パソコンのうちの何れか1種類であり、サーバー11にとって必要な被測定サンプルを取得可能にするデバイスであれば全て実施可能である。また、クライアントデバイス13はユーザー端末により操作され、ユーザー端末はクライアントデバイス13によりインターネットを使用し、サーバー11によりクライアントデバイス13が使用したインターネットのパスをキャプチャーする。ユーザー端末とは主にネットユーザーを指すが、ただしこの限りではない。
(4)サーバー11は主にデータ処理モジュール111と、データストレージモジュール112と、ベクトル化モジュール113と、分類及びクラスタリングモジュール114と、を備え、それぞれ情報リンクしている。データ処理モジュール111はサーバー11を作動させ、これと情報リンクしている各モジュールを作動するように駆動するために用いられている。データ処理モジュール111は論理演算、演算結果一時保存、命令実行一時保存等の機能を有しているCPU等であるが、ただしこの限りではない。
(5)データストレージモジュール112は電子データを保存するためのSSD(Solid State DiskまたはSolid State Drive)、HDD(Hard Disk Drive)、SRAM(Static Random Access Memory)、或いはDRAM(Dynamic Random Access Memory)等である。データストレージモジュール112は主にデータプロバイダーデバイス12が伝送するパスベクトル学習データ及びベクトルクラスタリング学習データ、クライアントデバイス13が伝送するパスデータ、及びサーバー11が演算及び処理するデータを保存している。
(6)ベクトル化モジュール113は主にデータプロバイダーデバイス12から提供されたパスベクトル学習データに対しトレーニング学習を行い、トレーニング学習が完了した後、ベクトル化モジュール113はクライアントデバイス13から伝送されたパスデータをベクトル化データに変換する。ベクトル化モジュール113のトレーニング学習は主に教師あり学習(Supervised Learning)、半教師あり学習(Semi-Supervised Learning)、強化学習(Reinforcement Learning)、教師なし学習(Unsupervised Learning)、自己教師あり学習(Self-Supervised Learning)、或いはヒューリスティックアルゴリズム(Heuristic Algorithms)等の機械学習(Machine Learning)を用いるが、ただしこの限りではない。また、前記パスベクトル学習データは複数の過去のパスデータ及び過去のベクトルデータであり、過去のパスデータ及びパスデータはウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類またはそれらの組み合わせデータであり、但し、インターネットに残る行動の痕跡データであれば全て実施可能である。過去のベクトルデータは主に過去のパスデータに対応し、且つベクトル化モジュール113がトレーニング学習を行うために提供される。また、前記ベクトル化データは二次元マトリクスベクトル、三次元マトリクスベクトル、或いは多次元マトリクスベクトルのうちの何れか1種類であり、ベクトル化モジュール113は主にパスデータ中の各一次元データをスタックしてベクトル化データに変換する。例えば、ネットクライアントデバイスAがウェブサイトAにおける停留時間が5分30秒であり、3種類の商品をクリックし、且つ3種類の商品に各々リンクしている他の外部ウェブサイトがさらにウェブサイトAにリンクし、ウェブサイトAに設けられている広告A、B、Cを各々15秒視聴した場合、ベクトル化モジュール113はネットクライアントデバイスAのマトリクスを〔0.33、3、0.45〕(〔総停留時間、クリックした商品数、広告視聴時間〕)に設定する。以上は例示にすぎず、これに限定するものではない。ベクトル化モジュール113がパスデータをベクトル化データに変換した後、データストレージモジュール112に保存するか、或いは後続のクラスタリング/分類モジュール114に伝送する。
(7)クラスタリング/分類モジュール114は主にデータプロバイダーデバイス12から提供されたベクトルクラスタリング学習データに対しトレーニング学習を行い、トレーニング学習の完了後にクラスタリング/分類モジュール114はベクトル化モジュール113から伝送されたベクトル化データにクラスタリング結果を付与する。クラスタリング/分類モジュール114はベクトル化モジュール113から伝送されたベクトル化データをクラスタリング及び分類する。クラスタリング/分類モジュール114のトレーニング学習は主に教師あり学習(Supervised Learning)、半教師あり学習(Semi-Supervised Learning)、強化学習(Reinforcement Learning)、教師なし学習(Unsupervised Learning)、自己教師あり学習(Self-Supervised Learning)、或いはヒューリスティックアルゴリズム(Heuristic Algorithms)等の機械学習(Machine Learning)を用いるが、ただしこの限りではない。また、前記ベクトルクラスタリング学習データは主に複数の前記過去のベクトルデータ及び過去のクラスタリングデータであり、過去のクラスタリングデータは前述の過去のネットユーザー端末を示す複数の過去のベクトルデータを含み、クラスタリング/分類モジュール114にトレーニング学習を行わせるために提供する。また、前記クラスタリング結果はネットユーザー端末ベクトルデータを示す複数のグループまたは集合を含む。
【0014】
次に、図1図2を参照しながら、本発明の実施ステップをさらに説明する。
(1)データプロバイダーがデータを提供するステップS1
図3を参照すれば、サーバー11はデータプロバイダーデバイス12から伝送されたパスベクトル学習データD1及びベクトルクラスタリング学習データD2を受信し、データ処理モジュール111はパスベクトル学習データD1をベクトル化モジュール113に伝送し、ベクトルクラスタリング学習データD2をクラスタリング/分類モジュール114に伝送してトレーニング学習を行う。パスベクトル学習データD1は主に複数の過去のパスデータ及び過去のベクトルデータであり、過去のパスデータはウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類またはそれらの組み合わせデータであるが、但しインターネットに残る行動の痕跡データであれば全て実施可能である。また、ベクトルクラスタリング学習データD2は主に複数の前記過去のベクトルデータ及び過去のクラスタリングデータであり、過去のクラスタリングデータは過去のネットユーザー端末を示す複数の過去のベクトルデータを含むが、ただしこの限りではない。
(2)モデルトレーニングステップS2
前項のステップを受けて、ベクトル化モジュール113がデータプロバイダーデバイス12から伝送されたパスベクトル学習データD1を受信した後、及びクラスタリング/分類モジュール114がベクトルクラスタリング学習データD2を受信した後、ベクトル化モジュール113がパスベクトル学習データD1を過去のデータとして第一機械学習を行い、クラスタリング/分類モジュール114がベクトルクラスタリング学習データD2を過去のデータとして第二機械学習を行う。第一機械学習及び第二機械学習は主に教師あり学習(Supervised Learning)、半教師あり学習(Semi-Supervised Learning)、強化学習(Reinforcement Learning)、教師なし学習(Unsupervised Learning)、自己教師あり学習(Self-Supervised Learning)、或いはヒューリスティックアルゴリズム(Heuristic Algorithms)等の機械学習(Machine Learning)を用いるが、ただしこの限りではない。
(3)クライアントパスデータをキャプチャーするステップS3
前項のステップを受けて、図4を参照すれば、前述の第一機械学習及び第二機械学習のトレーニング学習が完了した後、データ処理モジュール111がクライアントデバイス13のパスデータD3をキャプチャーし、パスデータD3をベクトル化モジュール113に伝送して後続の作業を行う。前記パスデータD3はウェブサイトでのイベントのトリガー、ウェブサイトクリックイベント、ウェブサイト行動操作、ウェブサイト停留時間のうちの何れか1種類またはそれらの組み合わせデータであるが、但しクライアントデバイス13はインターネットに残る行動の痕跡データであれば全て実施可能である。例えば、ネットクライアントデバイスBのウェブサイトAでの停留時間が10分23秒であり、5種類の商品をクリックし、5種類の商品に各々リンクしている他の外部ウェブサイトがさらにウェブサイトAにリンクし、ウェブサイトAに設けられている広告A、B、Cを各々20秒視聴し、最後に2種類の商品を検索してウェブサイトAを閉じた場合、サーバー11はネットクライアントデバイスBの停留時間、クリックした商品数、視聴広告数、広告視聴時間、及び商品検索回数等をキャプチャーするが、但しキャプチャーする範囲にはネットクライアントデバイスBに保存された個人情報や基本データは含まれない。サーバー11はキャプチャーした数値をベクトル化モジュール113に伝送する。以上は例示にすぎず、これに限定するものではない。
(4)パスデータベクトル化ステップS4
図5図6を参照すれば、ベクトル化モジュール113はパスデータD3を受信した後、第一機械学習の結果に基づいてデータベクトル化動作を行い、パスデータD3をベクトル化データD4に変換する。前記データベクトル化動作は主に一次元データを二次元ベクトルマトリクス、三次元ベクトルマトリクス、或いは多次元ベクトルマトリクスのうちの何れか1種類に変換する。例えば、クライアントパスデータをキャプチャーするステップS3から続く例では、ベクトル化モジュール113はネットクライアントデバイスBがウェブサイトAに停留する時間である10分23秒(計623秒、英語のA)をベクトル化データC1のaの部分に変換し、且つaの設定を0.623に戻す。ベクトル化データC1のbの部分はクリックした商品数(英語のX)に商品検索回数(英語のY)を加算したものであり、且つ7に設定する。マトリクスC1のcの部分は視聴広告数(英語のα)に広告視聴時間(英語のβ)を乗算したものであり、且つ0.6に設定し、ベクトルマトリクスC1を設定すると共に成形した後に図6に示す三次元空間分布に類似する。C1~C6は全て異なるネットクライアントデバイスBを示す。以上の変換過程は例示にすぎず、実際の動作では機械学習の結果によりパスデータD3をベクトルデータに変換するが、この例の変換に制限しない。ベクトル化モジュール113は最後に生成されたベクトル化データD4をデータストレージモジュール112に保存するか、後続のクラスタリング/分類モジュール114に伝送する。
(5)ベクトル化クラスタリングステップS5
前項のステップを受けて、図7乃至図9を参照すれば、クラスタリング/分類モジュール114はベクトル化データD4を受信した後、第二機械学習の結果に基づいてクラスタリング動作を行い、ベクトル化データD4にクラスタリング結果を付与する。前記クラスタリング結果はネットユーザー端末ベクトルデータを示す複数のグループまたは集合を含む。例えば、パスデータベクトル化ステップS4に続く例では、接線tはクラスタリング/分類モジュール114を示し、あるクラスタリングトレーニングのテーマでは、C1~C6は2つの部分に分割し、C1~C3はGroup1に属し、C4~C6はGroup2に属する。C1~C6が全てベクトル形式であるため、高速に分類可能であり、同じ状況でクラスタリング/分類モジュール114はトレーニングテーマの違いにより、接線tが傾斜率及び方向が相違し、クラスタリング結果に違いが生じる。以上はクラスタリング過程の例にすぎず、実際の動作では機械学習の結果によりベクトルデータにクラスタリング結果を付与し、この例の変換に制限しない。最後に、クラスタリング/分類モジュール114は前記クラスタリング結果をデータストレージモジュール112に保存する。
【0015】
図10に示すように、パスデータベクトル化ステップS4の後に続いてモデル修正ステップS6を実行する。ベクトル化モジュール113がパスデータD3を受信した後、第一機械学習の結果に基づいてデータベクトル化動作を行う。しかしながら、クライアントデバイス13から伝送されたパスデータD3が過去のパスデータに出現したことがない、或いは非常に少ないデータである場合、ベクトル化モジュール113はそのパスデータに基づいて、第一機械学習の結果を修正し、後続のベクトル化データD4をクライアントデバイス13にさらに適合させる。
【0016】
また、クライアントパスデータをキャプチャーするステップS3及びパスデータベクトル化ステップS4では、サーバー11はさらにまず第一機械学習の結果をクライアントデバイス13に伝送する。クライアントデバイス13は第一機械学習の結果を受信した後、クライアントデバイス13のパスデータD3を即時キャプチャーすると共にベクトル化データD4に変換し、ベクトル化データD4をサーバー11に伝送する。
【0017】
図11に示すように、サーバー11は少なくとも1つのエッジサーバー14と情報リンクし、エッジサーバー14は主にサーバー11のエッジコンピューティング(Edge computing)機能を提供する。前記エッジサーバー14は携帯電話、タブレット端末、パソコン、中央処理コンピューター等のうちの1つであるが、サーバー11の演算機能を分散可能なものであれば全て実施可能である。また、前記エッジコンピューティング(Edge computing)は本来完全に中心ノードで処理する大型のデータを分解し、より小さく管理の容易なデータに分割し、これをエッジノードに分散させて処理する。エッジノードはクライアントデバイス13により接近するため、データ処理及び伝送速度が速くなり、遅延も減少する。
【0018】
以上を総合すると、本発明は機械学習を基底とすることを主とし、ネットユーザーの個人情報を取得せずにネットユーザーがネット上で移動したパスをベクトル化すると共にクラスタリングを行い、且つクラスタリング結果に基づいてネットユーザーを識別し、後続の処理に使用する。これにより、本発明を実施することで、情報を匿名化し、ベクトル化によりネットユーザーのパスを変換し、クラスタリングを行う情報匿名化の行動ベクトル化法の目的を確実に達成する。
【0019】
本発明は、その精神又は主要な特徴から逸脱することなく、他のいろいろな形態で実施することができる。そのため、上述の実施形態はあらゆる点で単なる例示に過ぎず、限定的に解釈してはならない。本発明の範囲は特許請求の範囲によって示すものであって、明細書本文には何ら拘束されない。更に、特許請求の範囲の均等範囲に属する変形や変更は、すべて本発明の範囲内のものである。
【符号の説明】
【0020】
1 情報匿名化の行動ベクトル化システム
11 サーバー
12 データプロバイダーデバイス
111 データ処理モジュール
112 データストレージモジュール
113 ベクトル化モジュール
114 クラスタリング/分類モジュール
13 クライアントデバイス
14 エッジサーバー
D1 パスベクトル学習データ
D2 ベクトルクラスタリング学習データ
D3 パスデータ
D4 ベクトル化データ
S1 データプロバイダーがデータを提供する
S2 モデルトレーニング
S3 クライアントパスデータをキャプチャーする
S4 パスデータベクトル化
S5 ベクトル化クラスタリング
S6 モデル修正
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11