IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社アスコンの特許一覧 ▶ 方正株式会社の特許一覧

<>
  • 特許-サービス提供システム及びユーザ側設備 図1
  • 特許-サービス提供システム及びユーザ側設備 図2
  • 特許-サービス提供システム及びユーザ側設備 図3
  • 特許-サービス提供システム及びユーザ側設備 図4
  • 特許-サービス提供システム及びユーザ側設備 図5
  • 特許-サービス提供システム及びユーザ側設備 図6
  • 特許-サービス提供システム及びユーザ側設備 図7
  • 特許-サービス提供システム及びユーザ側設備 図8
  • 特許-サービス提供システム及びユーザ側設備 図9
  • 特許-サービス提供システム及びユーザ側設備 図10
  • 特許-サービス提供システム及びユーザ側設備 図11
  • 特許-サービス提供システム及びユーザ側設備 図12
  • 特許-サービス提供システム及びユーザ側設備 図13
  • 特許-サービス提供システム及びユーザ側設備 図14
  • 特許-サービス提供システム及びユーザ側設備 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-28
(45)【発行日】2024-03-07
(54)【発明の名称】サービス提供システム及びユーザ側設備
(51)【国際特許分類】
   G06Q 30/0241 20230101AFI20240229BHJP
   G06N 20/00 20190101ALI20240229BHJP
   G06Q 10/04 20230101ALI20240229BHJP
   G06Q 30/0242 20230101ALI20240229BHJP
【FI】
G06Q30/0241 444
G06N20/00 130
G06Q10/04
G06Q30/0242
【請求項の数】 4
(21)【出願番号】P 2018113529
(22)【出願日】2018-06-14
(65)【公開番号】P2019215778
(43)【公開日】2019-12-19
【審査請求日】2021-06-14
【審判番号】
【審判請求日】2023-03-27
(73)【特許権者】
【識別番号】500403620
【氏名又は名称】株式会社アスコン
(73)【特許権者】
【識別番号】515200940
【氏名又は名称】HOUSEI株式会社
(74)【代理人】
【識別番号】100142365
【弁理士】
【氏名又は名称】白井 宏紀
(72)【発明者】
【氏名】中原 貴裕
(72)【発明者】
【氏名】管 祥紅
【合議体】
【審判長】伏本 正典
【審判官】渡邊 聡
【審判官】松田 直也
(56)【参考文献】
【文献】特開2004-110417(JP,A)
【文献】特開2018-77615(JP,A)
【文献】特開2016-48417(JP,A)
【文献】国際公開第2017/135332(WO,A1)
【文献】国際公開第2016/199549(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N20/00
G06Q10/04
G06Q30/02
(57)【特許請求の範囲】
【請求項1】
少なくとも価格データをビッグデータとして蓄積してそのビッグデータを利用したサービスを提供するサービス提供システムであって、
広告に掲載される価格データを提供者から受付けるデータ受付け手段と、
前記データ受付け手段により受付けられた価格データと、価格変動の要因となる変動要因データとをビッグデータとして蓄積するビッグデータ蓄積手段と、
前記ビッグデータ蓄積手段により蓄積された前記価格データと前記変動要因データとに基づいて機械学習手段が機械学習を行ったAIモデルを用いて価格変動を予測し、該予測を反映したサービスを提供するサービス提供手段と、
前記データ受付け手段が受付けた価格データを広告対象に反映した広告作成に関するサービスを、当該価格データの提供者に提供する広告関連サービス提供手段と、を備え、
前記提供者が前記広告関連サービス提供手段によるサービスを享受するために提供した価格データを前記ビッグデータ蓄積手段が蓄積して当該ビッグデータに基づいて前記機械学習手段が機械学習を行ったAIモデルを用いたサービスを前記サービス提供手段が提供する、サービス提供システム。
【請求項2】
前記ビッグデータ蓄積手段により蓄積されたビッグデータに基づいて前記機械学習手段が最適化された広告を作成するための機械学習を行った学習結果を反映させて広告を作成する広告作成手段をさらに備え、
前記サービス提供手段は、前記広告作成手段により作成された広告を提供する、請求項1に記載のサービス提供システム。
【請求項3】
前記広告作成手段により作成された広告の効果を測定する広告効果測定手段をさらに備え、
前記最適化された広告を作成するための機械学習は、前記広告効果測定手段による測定結果に従ってエージェントに報酬が与えられ、該エージェントが前記報酬の累積を最大化する方策を学習する強化学習である、請求項2に記載のサービス提供システム。
【請求項4】
前記広告作成手段により作成された広告の効果を測定する広告効果測定手段をさらに備え、
前記最適化された広告を作成するための機械学習は、前記ビッグデータ蓄積手段により蓄積された前記価格データと価格変動の要因となる変動要因データとに基づいて予測された価格を入力情報とし、且つ、前記広告効果測定手段により所定レベル以上の効果が測定された広告内容を正解情報とする訓練データを生成し、該訓練データを用いて教師あり学習を行い、回帰問題として入力を正解に写像する関数を学習する教師あり学習である、請求項2に記載のサービス提供システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、価格変動予測を反映させたサービスを提供するサービス提供システム及びユーザ側設備に関する。詳しくは、少なくとも価格データをビッグデータとして蓄積してそのビッグデータを利用したサービスを提供するサービス提供システム、及び、少なくとも価格データをビッグデータとして蓄積してそのビッグデータを利用したサービスを提供するサービス提供システム側にネット接続可能なユーザ側設備に関する。
【背景技術】
【0002】
この種のサービス提供システム及びユーザ側設備として、各種取引価格の変動に関する市場情報を情報提供者から提供してもらい、その情報に基づいて価格の変動を予測するものがある(例えば特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2001―22849号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載のものでは、情報提供者からの情報が集まりにくく、情報提供のためのインセンティブを情報提供者に与えるために有償で情報提供してもらう方法を取らざるを得ず、経費が嵩むという欠点があった。
【0007】
本発明は、かかる実情に鑑み考え出されたものであり、その目的は、経費を極力抑えることのできるサービス提供システム及びユーザ側設備を提供することである。
【課題を解決するための手段】
【0008】
本発明のある局面では、少なくとも価格データをビッグデータとして蓄積してそのビッグデータを利用したサービスを提供するサービス提供システムであって、
広告に掲載される価格データを提供者から受付けるデータ受付け手段と、
前記データ受付け手段により受付けられた価格データと、価格変動の要因となる変動要因データとをビッグデータとして蓄積するビッグデータ蓄積手段と、
前記ビッグデータ蓄積手段により蓄積された前記価格データと前記変動要因データとに基づいて機械学習手段が機械学習を行ったAIモデルを用いて価格変動を予測し、該予測を反映したサービスを提供するサービス提供手段と、
前記データ受付け手段が受付けた価格データを広告対象に反映した広告作成に関するサービスを、当該価格データの提供者に提供する広告関連サービス提供手段と、を備え、
前記提供者が前記広告関連サービス提供手段によるサービスを享受するために提供した価格データを前記ビッグデータ蓄積手段が蓄積して当該ビッグデータに基づいて前記機械学習手段が機械学習を行ったAIモデルを用いたサービスを前記サービス提供手段が提供する。
【0009】
このような構成によれば、価格データの提供者は、データ受付け手段が受付けた価格データを反映した広告作成に関するサービスを受けることができるため、価格データを提供するためのインセンティブが与えられ、自ら率先して価格データを提供する傾向が生じる。
【0011】
好ましくは、前記ビッグデータ蓄積手段により蓄積されたビッグデータに基づいて前記機械学習手段が最適化された広告を作成するための機械学習を行った学習結果を反映させて広告を作成する広告作成手段をさらに備え、
前記サービス提供手段は、前記広告作成手段により作成された広告を提供するようにしてもよい。
【0012】
好ましくは、前記広告作成手段により作成された広告の効果を測定する広告効果測定手段をさらに備え、
前記最適化された広告を作成するための機械学習は、前記広告効果測定手段による測定結果に従ってエージェントに報酬が与えられ、該エージェントが前記報酬の累積を最大化する方策を学習する強化学習であってもよい。
【0013】
好ましくは、前記広告作成手段により作成された広告の効果を測定する広告効果測定手段をさらに備え、
前記最適化された広告を作成するための機械学習は、前記ビッグデータ蓄積手段により蓄積された前記価格データと価格変動の要因となる変動要因データとに基づいて予測された価格を入力情報とし、且つ、前記広告効果測定手段により所定レベル以上の効果が測定された広告内容を正解情報とする訓練データを生成し、該訓練データを用いて教師あり学習を行い、回帰問題として入力を正解に写像する関数を学習する教師あり学習であってもよい。
【図面の簡単な説明】
【0025】
図1】サービス提供システムの全体構成を示す図である。
図2】サービス提供システム及び広告関連サービス提供システムのハードウェア構成を示す図である。
図3】ユーザ端末のハードウェア構成を示す図である。
図4】(A)は広告主のユーザ端末の処理を示すフローチャートであり、(B)は広告効果測定処理を示すフローチャートであり、(C)はビッグデータ機械学習処理のメインルーチンを示すフローチャートである。
図5】(A)は価格変動予測用機械学習のサブルーチンプログラムを示すフローチャートであり、(B)は最適化広告生成用機械学習のサブルーチンプログラムを示すフローチャートである。
図6】(A)は最適化広告生成用教師あり学習のサブルーチンプログラムを示すフローチャートであり、(B)は最適化広告生成用強化学習のサブルーチンプログラムを示すフローチャートである。
図7】価格変動予測処理のフローチャートである。
図8】校正用機械学習手段の全体構成を示す図である。
図9】チラシ校正箇所判別処理のメインルーチンを示すフローチャートである。
図10】チラシ校正箇所判別処理の流れを説明する説明図であり、(A)はチラシを示す図、(B)はチラシ上の複数の値組を単一値組毎に識別する図、(C)は単一値組を切り出した図、(D)は商品画像と文字画像とを分離した図、(E)は文字画像をOCRでテキストデータにして作成したAIデータと原稿データとを対比して不一致箇所を出力する図である。
図11】(A)は参照格納部選定処理のサブルーチンプログラムを示すフローチャートであり、(B)は単一値組識別処理のサブルーチンプログラムを示すフローチャートであり、(C)は商品画像識別処理のサブルーチンプログラムを示すフローチャートであり、(D)は対象商品画像抽出処理のサブルーチンプログラムを示すフローチャートである。
図12】(A)は対応ラベル抽出処理のサブルーチンプログラムを示す図であり、(B)は文字位置識別処理のサブルーチンプログラムを示すフローチャートであり、(C)はOCRによるAIデータ作成処理のサブルーチンプログラムを示すフローチャートであり、(D)は単語分類処理のサブルーチンプログラムを示すフローチャートである。
図13】(A)はクローラ収集データと原稿データとの対比処理のサブルーチンプログラムを示すフローチャートであり、(B)はAIデータと原稿データとの対比処理のサブルーチンプログラムを示すフローチャートであり、(C)は価格データの記憶処理のサブルーチンプログラムを示すフローチャートである。
図14】広告作成会社のユーザ端末の処理を示すフローチャートである。
図15】(A)は実践段階での訓練データによる学習処理のサブルーチンプログラムを示すフローチャートであり、(B)は実践段階での訓練データによる学習済み格納部にグルーピングされて格納されている学習済みモデルを示す図である。
【発明を実施するための形態】
【0026】
本実施の形態におけるサービス提供システム、広告関連サービス提供システム、ユーザ側設備及びユーザ側広告設備を図面に基づいて詳細に説明する。以下には、データベースをDB、人工知能をAIと記載する。本実施の形態におけるサービス提供システムはAIによる機械学習を利用したものであり、その全体システム構成を図1に基づいて説明する。
【0027】
このサービス提供システムは、ビッグデータを利用した訓練データにより機械学習手段34が機械学習を行い、それによって生成された学習済みモデル50に対してビッグデータを入力し、価格変動予測及びその価格変動予測に基づいた先物取引を行い、さらには最適化された広告を生成して広告主39や広告作成会社31に提供(送信)する機能を有している。
【0028】
収集したビッグデータを入力してビッグデータDB36に蓄積する方法は、広告作成会社31から提供されるチラシ27及びそれを作成するための原稿データ24の入力、クローラ37がネット上を巡回して集めたデータ(例えば、天候,自然災害,株価,為替レート,金利,景気動向,所得変動,地政学的リスク等)の入力、広告主30から提供される広告効果測定用のデータ(例えば、POSデータ,チラシクーポンの利用数,チラシの問合わせ数等)の入力、の3つの方法を採用している。
【0029】
広告主30から広告作成の依頼を受けた広告作成会社31は、広告の一例としてのチラシ27作成用の原稿データ24を作成すると共に、その原稿データ24に基づいたチラシ27を作成する。この原稿データ24及びチラシ27のデータが広告関連サービス提供手段35に入力されることにより、広告関連サービス提供手段35は、原稿データ24及びチラシ27のデータのマッチングをAIにより行い、原稿データ24と相違しているチラシ27部分を見つけ出して広告校正箇所として広告作成会社31に提供する。
【0030】
広告作成会社31は、広告校正箇所が提供されることにより、チラシ27及びその原稿データ24を広告関連サービス提供手段35へ提供するためのインセンティブを得ることとなり、自ら率先してチラシ27及びその原稿データ24を広告関連サービス提供手段35へ提供することとなる。このようにして広告作成会社31から提供された広告に関するデータ、特に商品毎の価格を含む商品データ(品名・容量・価格・販売制限数等)が価格データ41としてビッグデータDB36に蓄積される。
【0031】
このサービス提供システムには、広告効果測定手段38が設けられている。広告効果測定手段38は、広告主30から提供された効果データ(例えば、POSデータ,チラシクーポンの利用数,チラシの問合わせ数等)に基づいて広告効果の測定が行われ、その効果測定結果が広告主30に提供される。その結果、広告主30は、効果データを提供するためのインセンティブを得ることとなり、自ら率先して効果データを提供することとなる。その提供された効果データ42がビッグデータDB36に蓄積される。
【0032】
クローラ37は、定期的にネット上を巡回して、価格変動予測や最適化された広告の作成に必要となる各種データを収集する。その収集データがクローラ収集データ40としてビッグデータDB36に蓄積される。
【0033】
機械学習手段34が例えば教師あり学習を行う場合には、ビッグデータDB36に蓄積されている各種データから抽出した入力情報(ベクトルx)と正解情報yとからなる大量のデータセットを訓練データとして機械学習手段34に入力する。機械学習手段34はその訓練データに基づいて教師あり学習を行い、学習済みモデル50を生成する。教師あり学習の場合、入力xを正解yに写像する関数ci(x)(ci:x→y)を学習するものであるため、学習済みモデルは関数ciを含むものとなる。なお、機械学習手段34が行う機械学習は、教師あり学習に限定されるものではなく、モデル推定やパターンマイニング(データマイニング)等の教師なし学習、教師あり学習と教師なし学習との中間的手法である半教師あり学習や強化学習や深層学習等、どのようなものであってもよい。
【0034】
生成された学習済みモデル50に対しビッグデータDB36から抽出された入力データを入力することにより、教師あり学習の回帰問題として例えば価格変動予測が可能となる。この予測結果をクラウドサービスとしてユーザ(例えば広告主30や広告作成会社31等)に提供する。さらには、この価格変動の予測結果を活用した各種サービス(例えば先物取引等)を提供してもよい。
【0035】
次に、図2を参照して、サービス提供システム及び広告関連サービス提供システムのハードウェア構成を説明する。サービス提供システム及び広告関連サービス提供システムによってもたらされるサービスは、クラウド43からインターネット経由でユーザ(広告主30や広告作成会社31等)に提供される。そのために、多数のサーバ14が設置されたデータセンタ44が設けられており、広告主30や広告作成会社31等に設置されている端末(パーソナルコンピュータやスマートフォン等)とデータセンタ44とがインターネット経由で情報通信可能に接続されている。
【0036】
サーバ14は、制御中枢としてのCPU(Central Processing Unit)10、CPU10のワークエリアとして機能するRAM(Random Access Memory)9、データやプログラムを記憶しているROM(Read Only Memory)11、HDD(hard disk drive)12などの記憶手段、ディスプレイ、キーボード等の入力操作部7、通信部5、表示部6、インタフェース8、バス13、その他種々のハードウェアによって構成される。
【0037】
サーバ14は、ノイマン型の一般的なコンピュータを用いているが、ニューラル・ネット・プロセッサー(NNP)を用いてもよい。NNPのチップ上には本物のニューロンをモデルにした「人工ニューロン」が多数搭載されており、各ニューロンはネットワークでそれぞれ連携し合う。また、「量子アニーリング方式」を採用した量子コンピュータを用いてもよい。これにより、機械学習における最適化計算の所要時間を大幅に短縮できる。
【0038】
図3に、ユーザ端末74のハードウェア構成を示している。広告主30が運営する複数の店舗73(図面上では1つしか示していない)には、広告主30が取り扱う商品が陳列されて販売されている。この各店舗73には、POS(Point Of Sale)システムが設置されており、商品毎の価格、販売個数、販売日時はもとより、販売時点の天候、顧客の年齢層、性別、購入商品、ポイント管理等のPOSデータが収集されて、各店舗73のユーザ端末74に蓄積される。
【0039】
広告主30の各ユーザ端末74は社内LAN(Local Area Network)84によって接続されている。その社内LAN84にインターネット等を介して各店舗73のユーザ端末74が接続されている。各店舗73のユーザ端末74に蓄積されたPOSデータがインターネット及び社内LAN84を経由して広告主30のユーザ端末74へ送信される。広告主30のユーザ端末74は、送信されてきたPOSデータを集計し、広告効果を測定するための効果データとして定期的にデータセンタ44へ送信する。
【0040】
広告作成会社31の各ユーザ端末74も社内LAN84によって接続されている。その社内LAN84がインターネット等によりデータセンタ44に接続されている。広告作成会社31のユーザ端末74は、チラシ作製用の原稿データをデータセンタ44に送信すると共に、その原稿データに基づいて作成したチラシのデータをデータセンタ44に送信する。
【0041】
各店舗73のユーザ端末74、広告主30のユーザ端末74及び広告作成会社31のユーザ端末74のハードウェア構成を図3に示す。このハードウェア構成は、図2に示したサーバ14のハードウェア構成と同じであり、ここでは説明の繰り返しを省略する。
【0042】
次に、図4(A)を参照して、広告主30のユーザ端末74の処理を説明する。ステップS(以下単に「S」という)150により、各店舗73のユーザ端末74からPOSデータを受信したか否か判定される。受信していなければ制御がS152へ進むが、受信した場合にはS151により、受信したPOSデータを分類して効果データとして格納する処理がなされる。次に、S152により、効果データをデータセンタ44に送信する時期が来たか否か判定される。未だ時期が来ていない場合には制御がS155へ進むが、時期が来た場合には、格納されている効果データをデータセンタ44のサーバ14へ送信する処理がなされる(S153a)。サーバ14では、広告効果測定処理のS153bにより、その送信されてきた効果データを受信してビッグデータDB36に効果データ42として格納する。
【0043】
次に、広告主30のユーザ端末74は、S154により、格納されている効果データを消去する。次に、S155により、最適化広告または価格変動予測を受信したか否か判定し、受信していない場合は制御がS150へ戻る。一方、後述するS48により最適化広告がサーバ14から送信されて来れば、S155によりYESと判定され、S156によりその受信した最適化広告を格納した後、制御がS150に戻る。また、後述するS58により価格変動予測がサーバ14から送信されて来れば、S155によりYESと判定され、S156によりその受信した価格変動予測を格納した後、制御がS150に戻る。
【0044】
次に、図4(B)を参照して、前述の広告効果測定手段38による広告効果測定処理の内容を説明する。S1により、単一値組識別処理により区分けされた値組各々をgjとする処理が行われる。ここに、jは訓練データ中のj番目の事例であり、1,2,3,・・・,Jの値を取る。Jは値組の総数である。値組とは、チラシにおける「商品画像+価格及び商品名などの文字画像」で構成されるものである(図10(B)の値組99a、99b,99c,99d参照)。また「単一値組識別処理」とは、チラシ上に掲載された複数の値組を単一値組毎に区分けして識別する処理であり、図11(B)に基づいて後述する。
【0045】
次に、S2において、jに初期値「1」がセットされる。次にS3において、gjに関する効果データ42がビッグデータDB36から読み出される。この段階では、j=1となっているために、g1の値組に関する効果データが読み出されることとなる。例えば、g1が広告主Aの商品鶏むね肉の値組(図10(B)(C)の値組99d参照)であった場合には、広告主Aから送られてきた鶏むね肉の効果データ(POSデータ,チラシクーポンの利用数,チラシの問合わせ数等)が読み出される。
【0046】
次にS4において、広告主から送られてきた販売個数、売上、チラシクーポンの利用数、チラシの問合わせ数を、それぞれの標準値で除した値が算出される。この標準値とは、例えばg1(鶏むね肉)の場合にその広告主Aにおけるg1(鶏むね肉)の販売個数、売上、チラシクーポンの利用数、チラシの問合わせ数についての現在までの平均値のことである。
【0047】
次にS5において、算出された各値の合計によってgjについての広告効果点数tjを算出する処理が行われる。S6において、gjについての広告効果(tj)が広告効果測定手段38から出力されて該当する広告主30へ提供される。
【0048】
S7により、現時点のjに1を加算し、S8において、jがJを超えたか否か判定される。未だに超えていない場合には制御がS3へ戻る。このS3→S4→S5→S6→S7→S8→S3のループを巡回する度にS7によりjが「1」加算され、jが1,2,3,・・・と歩進される。値組gjも、g1,g2,g3,・・・と更新されることとなる。そして、jが値組の総数Jを超えた段階でS8によりYESと判定され、この広告効果測定処理がリターンする。
【0049】
次に、機械学習手段34によるビッグデータ機械学習処理を、図4(C)に基づいて説明する。S9により価格変動予測用機械学習が行われ、S10により最適化広告生成用機械学習が行われる。
【0050】
S9の価格変動予測用機械学習のサブルーチンプログラムのフローチャートを図5(A)に基づいて説明する。S15において、各商品種類をkjと定義する処理が行われる。ここに、jは全商品種類中のj番目の商品種類であり、1,2,3,・・・,Jの値を取る。Jは商品種類の総数である。
【0051】
次に、S16において、jに初期値1がセットされる。S17において、商品種類kjについて、過去のクローラ収集データをベクトルxji、そのときの価格を正解情報yjiとするデータセットからなる訓練データ{(xji,yji)}が生成される。ここに、iは、訓練データ中のi番目の事例であり、1,2,3,・・・,Iの値を取る。Iは訓練データの総数である。
【0052】
次に、S18において、訓練データ{(xji,yji)}を用いて教師あり学習を行い、回帰問題として入力xを正解yに写像する関数cj(x)(cj:x→y)を学習する処理が行われる。
【0053】
S19により、現時点のjに1を加算し、S20において、jがJを超えたか否か判定される。未だに超えていない場合には制御がS17へ戻る。このS17→S18→S19→S20→S17のループを巡回する度にS19によりjが「1」加算され、jが1,2,3,・・・と歩進される。商品種類kjも、k1,k2,k3,・・・と更新されることとなる。そして、jが商品種類の総数Jを超えた段階でS20によりYESと判定され、この価格変動予測用機械学習がリターンする。
【0054】
次に、S10の最適化広告生成用機械学習のサブルーチンプログラムのフローチャートを図5(B)に基づいて説明する。S25において、学習対象の各商品種類をkjと定義する処理が行われる。ここに、jは全商品種類中のj番目の商品種類であり、1,2,3,・・・,Jの値を取る。Jは商品種類の総数である。次に、S26によりjに初期値「1」がセットされる。S27において、商品種類kjは教師あり学習を終了しているか否か判定される。この段階では、j=1のため、商品種類k1が教師あり学習を終了しているか否か判定される。未だ教師あり学習が終了していない場合にはS28により最適化広告生成用教師あり学習が行われる。
【0055】
一方、既に教師あり学習が終了している場合にはS29により最適化広告生成用教強化学習が行われる。つまり、最適化広告生成用機械学習では、最初に教師あり学習が行われ、教師あり学習が終了した商品種類については強化学習が行われるのである。これにより最適化広告生成用機械学習の効率化が可能となる。強化学習とは、ある環境の状態に置かれたエージェントが、行動を選択したときに与えられる報酬をもとに、初期状態からゴールまでの累積報酬を最大化するような方策を獲得する仕組みのことである。強化学習ではAIの一種であるソフトウェアエージェント(以下「エージェント」という)と環境が相互作用することで学習を進めていく。ここにエージェントとはAIの一種であり、ユーザやソフトウェアなどと通信しながら自らがある程度の判断能力を持って自律的にふるまい永続的に活動するソフトウェアのことである。エージェントが環境に対して或る行為aを行うことによりその環境の状態sが変化し或る目的状態に達することにより報酬rがエージェントに与えられる。エージェントは、この報酬rを最大化することを目的として状態sを入力として行為aを出力する関数を学習する。
【0056】
強化学習は次の単純なステップを繰り返すことで時間が進行していく。
1 エージェントは環境から受け取った観測o(あるいは直接、環境の状態s)を受け取り、方策πに基いて環境に行為aを返す。
2 環境はエージェントから受け取った行為aと現在の状態sに基いて、次の状態s′に変化し、その遷移に基いて次の観測o′と、報酬rと呼ばれる直前の行動の良し悪しを示す1つの数(スカラー量)をエージェントに返す。
3 時間の進行:t←t+1
ここで←は代入操作を表す。
【0057】
S28またはS29のステップの実行後に制御がS30に進み、現時点のjに1を加算し、S31において、jがJを超えたか否か判定される。未だに超えていない場合には制御がS27へ戻る。このS27→S28またはS29→S30→S31→S27のループを巡回する度にS30によりjが「1」加算され、jが1,2,3,・・・と歩進される。商品種類kjも、k1,k2,k3,・・・と更新されることとなる。そして、jが商品種類の総数Jを超えた段階でS31によりYESと判定され、この最適化広告生成用機械学習がリターンする。
【0058】
次に、S28の最適化広告生成用教師あり学習のサブルーチンプログラムのフローチャートを図6(A)に基づいて説明する。S36において、商品種類kjについて、広告効果測定処理(図4(B)参照)により算出された過去の広告効果点数tjのうち高得点のチラシ27に記載された価格Pjiとそのときの予測価格pjiを全て抽出する処理が行われる。ここに、iは全抽出データ中のi番目の抽出データであり、1,2,3,・・・,Iの値を取る。Iは抽出データの総数である。「高得点のチラシ」とは、具体的には、過去の広告効果点数tjのうち例えば上位10%の広告効果点数となったチラシである。
【0059】
次に、S37において、kjについて、pjiを入力情報(ベクトルxji)、Pjiを正解情報yjiとするデータセットからなる訓練データ{(xji,yji)}が生成される。Pjiは商品種類kjについて高得点のチラシに記載された価格であり(S36参照)、正解情報に相応しいデータである。
【0060】
次に、S38において、{(xji,yji)}を用いて教師あり学習を行い、回帰問題として入力xを正解yに写像する関数cj(x)(cj:x→y)が学習される。商品種類kjの最適化広告生成用教師あり学習を完了した段階で、例えば完了フラグをkjに対応付けて記憶する。この完了フラブが記憶されているか否かを前述のS27で判別することにより、kjが教師あり学習を終了しているか否か判定する。
【0061】
次に、S29の最適化広告生成用強化学習のサブルーチンプログラムのフローチャートを図6(B)に基づいて説明する。S46において、広告主30に提供された最適化広告のチラシ27に掲載された商品種類kjについて、広告効果測定処理(図4(B)参照)により算出された広告効果点数tjに基づいて報酬rを算出する処理が行われる。広告効果点数tjが高得点ほど報酬rが大きくなるように制御される。次に、S47において、TD学習により最適政策πに従った行為aとしての価格Piを求める処理が行われる。TD学習とはTemporal Differelce学習のことであり、モデルフリーの手法を用いてQ値を推定するものである。時間tのときの状態をsとすると一般的に最適政策は、
π(s):Choose a ifQ(s,a
の式で表される。次に、S48において、商品価格をPjとした最適化広告を生成して広告主30や広告作成会社31に送信(提供)する。
【0062】
次に、価格変動予測処理の内容を図7に基づいて説明する。S55において、各商品種類がkjと定義される。ここに、jは全商品種類中のj番目の商品種類であり、1,2,3,・・・,Jの値を取る。Jは商品種類の総数である。S56によりjに初期値「1」がセットされる。S57において、現在の各効果データ42をビッグデータDB36から読み出して関数cj(x)に代入して価格Pjを予測する処理が行われる。ここに、関数cj(x)は前述のS18により学習された価格変動予測用の関数である。
【0063】
次に、予測された価格pjがS58により送信される。この送信は、具体的には、商品種類kjを取り扱っている広告主や広告作成会社へ価格pjを送信することである。なお、S58により逐一送信する代わりに、S58により商品種類kj毎に価格pjを集計し、その集計結果をまとめて広告主や広告作成会社へ送信してもよい。S59により、現時点のjに1を加算し、S60において、jがJを超えたか否か判定される。未だに超えていない場合には制御がS57へ戻る。このS57→S58→S59→S60→S57のループを巡回する度にS59によりjが「1」加算され、jが1,2,3,・・・と歩進される。商品種類kjも、k1,k2,k3,・・・と更新されることとなる。そして、jが商品種類の総数Jを超えた段階でS60によりYESと判定され、この価格変動予測処理がリターンする。
【0064】
次に、広告関連サービス提供手段35がチラシ27の校正箇所を判別するため事前に校正用機械学習手段33が行う機械学習を図8に基づいて説明する。校正用機械学習手段33には、大量のオリジナル商品画像(実物商品の画像)25と当該商品のJANコード等のラベルとが対応付けられた商品特徴学習用データ87が入力され、その商品特徴学習用データ87に基づいて商品特徴学習22が行われる。パッケージ商品の場合にはJANコードが割振られて付されるためJANコードをラベルとして用いて当該商品を識別するが、例えばサーモンの切り身等の非パッケージ商品の場合にはJANコードが割振られていないため、本広告関連サービスの提供を行う主体(業者)が独自に割り振ったハウスコードを商品識別用のラベルとして用いる。
【0065】
校正用機械学習手段33には、大量のチラシ27のデータが入力され、そのチラシ27のデータに基づいて、チラシ特徴学習23、広告値組境界学習3、商品画像識別用学習4、文字位置学習28、OCR学習16及び単語分類学習39が行われる。オリジナル商品画像25とは、チラシ27に掲載されている各種商品の実物の画像データであり、類似商品の画像データも含む。類似商品が多ければ多いほど特徴量の抽出が可能となる。
【0066】
商品特徴学習22は、チラシ上の同じ商品画像でも、映っている角度が異なったり、色が異なったりするものが存在するために、実物の商品の特徴量を学習するものであり、NN(Neural Netwark)またはDNN(Deep Neural Netwark)を用いて商品毎の特徴量を学習する。その学習結果である学習済み商品特徴量20が学習段階学習済み格納部21に格納される。学習済み商品特徴量20は、各商品の特徴量と当該商品のラベル(JANコードまたはハウスコード等)とが対応付けられて格納される。
【0067】
チラシ特徴学習23は、入力されたチラシ27の画像データからチラシの特徴量を学習するものであり、NNまたはDNNを用いて学習する。その学習結果である学習済みチラシ特徴量1が学習段階学習済み格納部21に格納される。
【0068】
広告値組境界学習3、商品画像識別用学習4、文字位置学習28、OCR学習16及び単語分類学習39は、図5(A)及び図6(A)と同様の教師あり学習を用いるが、正解がラベルの識別(classification)問題である。また、大量の画像データからの機械学習のため、人間が特徴抽出して入力ベクトルxとして入力する人為的負担を極力少なくするべく、CNN(Convolutional Neural Network)やRNN(Recurrent Neural Network)さらにはLSTM(Long Short-Term Memory)を用いる。CNNとは、畳み込みニューラルネットワークのことであり、順伝播型人工ディープニューラルネットワークの一種である。画像や動画認識に広く使われているモデルである。RNNとは、再帰型ニューラルネットワークのことであり、自然言語処理の分野で高い成果をあげているアルゴリズムである。LSTMとは、RNNの拡張として1995年に登場した、時系列データ(sequential data)に対するモデル、あるいは構造(architecture)の1種であり、短期記憶を長期に渡って活用することを可能にしたものである。
【0069】
広告値組境界学習3は、チラシに掲載されている複数の値組画像同士の境界を識別して複数の値組画像から単一値組画像を切り出すための機械学習であり、CNN、RNN及びLSTMを用いる。広告値組境界学習3による学習結果である広告値組境界学習済みモデル2が学習段階学習済み格納部21に格納される。
【0070】
商品画像識別用学習4は、切り出された単一値組画像から商品画像を識別するための機械学習であり、CNN等を用いる。単一値組画像中には、商品画像とその商品の価格や商品名などのテキスト画像(文字画像)とが含まれており、このような単一値組画像中の商品画像を識別する機械学習が商品画像識別用学習4である。この商品画像識別用学習4による学習結果である商品画像識別用学習済みモデル18が学習段階学習済み格納部21に格納される。
【0071】
文字位置学習28は、切り出された単一値組画像を基に商品画像に対するテキスト画像(文字画像)の位置を識別するための機械学習であり、CNNを用いる。この文字位置学習28による学習結果である文字位置学習済みモデル19が学習段階学習済み格納部21に格納される。
【0072】
OCR学習16は、チラシ27で使われている文字のフォントの学習、文字の大きさ及び太さが異なるデザインの学習、文字列(1行)の長さが異なるものの学習、文字間が異なるものの学習、及び、行間が異なるものの学習、背景色(ノイズ有り)の学習等を行う機械学習であり、LSTMやCNNを用いる。このOCR学習16による学習結果であるOCR学習済みモデル17が学習段階学習済み格納部21に格納される。
【0073】
単語分類学習39は、OCRにより識別された各文字列の内容が、価格、容量、商品名、メーカ名等のどのカテゴリーのものであるかを識別するための機械学習であり、この単語分類学習39による学習結果である単語分類学習済みモデル32が学習段階学習済み格納部21に格納される。OCR学習済みモデル17及び単語分類学習済みモデル32を利用して後述するようにAIデータが作成される(図12(C)参照)。原稿データ24は、各カテゴリーで項目が分かれているエクセルデータであり(図10(E)の「ラベル、商品名、メータ、値段」等参照)、この単語分類学習済みモデル32を利用することにより、原稿データ24とAIデータとを各項目毎に対比することが可能となる。
【0074】
次に、図9に基づいて、広告関連サービス提供手段35が行うチラシ校正箇所判別処理を説明する。S65において、チラシ画像を受付けたか否か判定される。後述するS183によりチラシの画像データがデータセンタ44に送信されて広告関連サービス提供手段35に入力されれば、S65によりYESと判定される。なお、広告作成会社31は、チラシの画像データを送信する代わりに、本広告関連サービスの提供を行う主体(業者)にチラシ自体を送ってもよい。その場合には、本広告関連サービスの提供を行う主体(業者)がチラシ紙面の画像をスキャンするか、または、パーソナルコンピュータで組版したデータをPDF化して、画像データをサーバ14に送信して広告関連サービス提供手段35に入力する。
【0075】
広告作成会社31から提供されたチラシ27の画像データが広告関連サービス提供手段35に入力されれば、S65によりYESと判定されてS67により原稿データ24を受付けたか否か判定される。後述するS181により広告作成会社31から送信されてきた(提供された)原稿データ24が広告関連サービス提供手段35に入力されれば、S67によりYESと判定されて制御がS68へ進む。
【0076】
一方、S65によりNOと判定された場合またはS67によりNOと判定された場合には、制御がS66へ進み、クローラ処理が行われる。このクローラ処理は、クローラが定期的にネット上を巡回して広告主30のホームページ等で取り扱い商品や営業日時等の情報を収集する処理である。収集された情報は入力された原稿データ24と照合されて相違している箇所が抽出される。例えば、広告主30がドラッグストアA店だった場合に、そのドラッグストアA店のホームページから取り扱い商品(例えば第2類薬品及び第3類薬品)の情報を収集してドラッグストアA店の原稿データ24やチラシ27の画像データと照合する。その結果、原稿データ24やチラシ27の画像データ中に第1類薬品が含まれていた場合に、原稿データ24やチラシ27が間違っていると判定する(図13(A)参照)。
【0077】
S68では参照格納部の選定処理が行われる。本実施の形態では、前述の学習段階学習済み格納部21と実践段階での訓練データによる学習済み格納部29との2種類の学習済みモデルの格納部を備えており、そのどちらの格納部に格納された学習済みモデルを用いるかを、S68で判断する。
【0078】
S69において単一値組識別処理が行われ、S70において商品画像識別処理が行われ、S71において対象商品画像抽出処理が行われ、S72において対応ラベル検索処理が行われ、S73において文字位置識別処理が行われ、S74においてOCRによるAIデータ作成処理が行われ、S75において単語分類識別処理が行われる。これら各処理は後に詳述する。
【0079】
次にS76でMを1減算する処理が行われる。このMは、図11(B)の単一値組識別処理におけるS89で定義される区分け数であり、S65により受付けられたチラシ27に掲載された複数の値組を単一値組毎に区分けした区分け数のことである。
【0080】
次に、S77によりM=0になったか否か判定される。未だ0になっていない場合には制御がS71に戻り、S71→S72→S73→S74→75→S76→S77→S71のループを巡回する。このループを巡回する度にS76によりMが1減算され、M=0になった時点で制御がS78へ移行する。つまり、S65により受付けられたチラシに掲載された複数の値組の数だけS71~S75の処理を繰り返し、全ての値組についてS71~S75の処理が完了した段階でS78の処理へと移行する。
【0081】
S78では、クローラ収集データと原稿データとの対比処理が行われ、S79によりAIデータと原稿データとの対比処理が行われ、S80により校正箇所の出力が行われて校正箇所が依頼人である広告作成会社31へ提供される。次に、S81により価格データの記憶処理が行われ、その後制御がS65に戻る。
【0082】
このチラシ校正箇所判別処理の主要部を図10に基づいて説明する。図10(A)を参照し、広告作成会社31から提供されるチラシ27には複数の値組が掲載されている。図10では、トマトの値組99a、ピーマンの値組99b、国産牛ロースの値組99c、鶏むね肉の値組99dの、4種類が示されている。
【0083】
この複数の値組が掲載されているチラシ27の画像から広告値組境界を判別して単一値組毎の識別を行う(図10(B)参照)。次に、単一値組(商品枠)99dを切り出す(図10(C)参照)。この切り出された単一値組99dの画像を商品画像部分97と文字画像部分98とに分別(分離)する(図10(D)参照)。
【0084】
次に、分別された文字画像部分98をOCRによりテキストデータ化してAIデータを生成し、AIデータと原稿データ24とを対比(マッチング)して不一致箇所(校正箇所)を判別して出力する(図10(E)参照)。
【0085】
次に、S68の参照格納部選定処理のサブルーチンプログラムのフローチャートを図11(A)に基づいて説明する。S83において、受付けたチラシ画像から業態と地域と季節とを割出す処理がなされる。具体的には、チラシに掲載された折込日をOCRで読み取って日付を認識して季節を割出し、チラシに記載された店舗の住所をOCRで読み取って地域を特定し、図12(A)の対応ラベル抽出処理により抽出されたラベル(JANコードやハウスコード等)を用いて商品識別し商品の点数構成を割り出すことで業態を特定する。具体的には、チラシに掲載された複数の商品の種類をJANコードやハウスコード等のラベルから特定し、種類別の商品数(商品の点数構成)を割り出して主にどの種類の商品についてのチラシかを判別することにより、業態を特定する。業態の具体例としては、食品スーパ、GMS(総合スーパ)、ドラッグストア、ホームセンタ(総合ディスカウントストアを含む)、酒ディスカウント、不動産等である。不動産は、新築一戸建て、中古一戸建て、新築マンション、中古マンションを含む。
【0086】
次に、S84において、受付けた業態と地域と季節とに対応する学習済みモデルが実践段階での訓練データによる学習済み格納部29に格納されているか否か判定される。実践段階での訓練データによる学習済み格納部29では、図15(B)に示すように、業態と地域と季節(春、夏、秋、冬)とからなる三次元テーブルにグルーピングされ、グループ毎に学習済みモデルが格納されている。このグループ毎に格納されている学習済みモデルの生成処理を図15(A)に基づいて先に説明する。
【0087】
図15(A)は実践段階での訓練データによる学習処理のフローチャートである。学習段階を終了した各種学習済みモデルは、実際に広告関連サービスを提供する実践段階(図9図13)において活用されるが、その実践段階においても稀に誤りが発生する。これは、実践段階では、特殊な業態や特殊な地域からチラシ27及びその原稿データ24が提供され、学習段階では取り扱っていない特殊な文字フォントや特殊な表現に遭遇する場合があるためであり、このような場合に誤りが生じてしまう。また、季節毎に特殊な表現が用いられる場合もある。ゆえに、業態、地域及び季節の特殊性に対応するために、実践段階において、業態、地域及び季節によりグルーピングし、グループ毎に特化した機械学習を行う。
【0088】
S129において、実践段階で発見された誤りが所定数Rに達したか否か判定され、所定数に達するまで待機する。広告関連サービス提供手段35が広告校正箇所を広告作成会社31に通知し、それに基づいて広告作成会社31がチラシ27を校正しようとした際に、実際には誤っていなかった場合には、通知された校正箇所が実際には誤っていなかった旨の連絡(苦情)が広告関連サービス提供業者に送られてくるため、実践段階での誤りの発見が可能になる。しかし、チラシ27と原稿データ24との不一致箇所を見逃す誤りが生じた場合には、広告校正箇所として広告作成会社31に通知されないため、広告作成会社31からの連絡(苦情)が広告関連サービス提供業者に送られてくことがなく、実践段階での誤りの発見が困難である。この問題を解決する一手段として、チラシ27の誤りを発見した広告主30等に相応の対価を支払うことにより、チラシ27の誤り発見を広告関連サービス提供業者に通知することに対するインセンティブを生じさせることが考えられる。
【0089】
誤りが所定数Rに達した段階で制御がS130に進み、誤りが生じた値組部分を業態と地域と季節からなる三次元テーブルにグルーピングする処理がなされる。この処理は、前述のS83で説明した方法で業態と地域と季節とを特定して行われる。
【0090】
次に、S131において、グループ毎に正解情報yiを作成する。ここに、iは全正解情報中のi番目の正解情報であり、1,2,・・・,Iの値をとる。Iは正解情報の総数である。より具体的には、この正解情報作成処理は、誤りがどの処理段階で発生したか、すなわち、単一値組識別処理、商品画像識別処理、対象商品画像抽出処理、対応ラベル検索処理、文字位置識別処理、単語分類識別処理、あるいはOCRによるAIデータ作成処理のうちのどの処理で誤りが発生したかを割出し、誤りの発生した処理に対応する機械学習用の正解情報yiを作成する。例えば、文字位置識別処理で誤りが発生した場合には、文字位置学習28用の正解情報yiを作成する。
【0091】
次に、S132において、グループ毎に誤った箇所の入力データをxiとする。ここに、iは全入力データ中のi番目の入力データであり、1,2,・・・,Iの値を取る。Iは入力データの総数である。この入力データxiと正解情報yiとのデータセットにより教師あり学習用の訓練データ{(xi,yi)}が生成される。この訓練データ{(xi,yi)}が例えば、文字位置識別処理で誤りが発生した場合に生成されたものの場合には、文字位置学習済みモデル19を再訓練するための訓練データ{(xi,yi)}として用いられる。
【0092】
S133において、1つの事例(i番目の事例)である{(xi,yi)}を異なる事例として複数回(例えば20回)使い回し、その使い回しを全てのiについて行うことにより割り増された訓練データとする処理がなされる。S134において、学習段階で使用された既存訓練データにこの割り増し訓練データを追加したデータをグループの訓練データとして教師あり学習を行い、入力xを正解yに写像する関数c(x)(c:x→y)をグループ毎に学習する処理が行われる。これにより、誤りが発生したグループに対して、その誤りの正解情報yiと誤った箇所の入力データをxiとが複数回(例えば20回)使い回しされた割り増し訓練データにより、当該グループの学習済みモデルが再訓練されるため、実践段階で発生した誤りに基づいて生成された訓練データの影響力を大きくした機械学習を行うことができる利点がある。
【0093】
実践段階で発生した誤りに基づいて生成された訓練データの影響力を大きくした機械学習を行う他の方法としては、S132において生成された訓練データ{(xi,yi)}の個数Iだけ既存訓練データを間引き、間引かれた後の既存訓練データにS132において生成された訓練データ{(xi,yi)}を追加したデータをグループの訓練データとして教師あり学習を行う。このような方法によっても、実践段階で発生した誤りに基づいて生成された訓練データの影響力を大きくした機械学習を行うことができる利点が生じる。
【0094】
次に、S135において、各グループの学習済みモデルを関数c(x)に更新する処理が行われ、その更新された関数c(x)を有する学習済みモデルがグループ毎に分類されて、実践段階での訓練データによる学習済み格納部29に格納される(図15(B)参照)。より具体的には、グループ毎に特化した機械学習が、単一値組識別処理、商品画像識別処理、対象商品画像抽出処理、対応ラベル検索処理、文字位置識別処理、単語分類識別処理、あるいはOCRによるAIデータ作成処理のうち、誤りが発生した処理に用いられる学習済みモデルを再訓練するものであるために、グループ毎に分類されて格納される学習済みモデルは、再訓練されたチラシ特徴学習済みモデル1、広告値組境界学習済みモデル2、商品画像識別用学習済みモデル18、文字位置学習済みモデル19、OCR学習済みモデル17、及び、単語分類学習済みモデル32を含んでいる。
【0095】
図11(A)に戻り、S84によりYESと判定された場合は制御がS86に進み、実践段階での訓練データによる学習済み格納部29が選定される。その結果、実践段階での訓練データで再訓練されて業態と地域と季節との特殊性にも対処できる学習済みモデルを利用しての高度な処理が可能となる。一方、S87によりNOと判定された場合は制御がS85に進み、学習段階学習済み格納部21が選定される。
【0096】
次に、S69の単一値組識別処理のサブルーチンプログラムのフローチャートを図11(B)に基づいて説明する。S85またはS86により選定された学習済み格納部から広告値組境界学習済みモデル2を読み出す処理がS87により行われる。次に、読み出された広告値組境界学習済みモデル2に基づいて、S65により受付けられたチラシ27に掲載された複数の値組を単一値組毎に区分けするための単一値組毎区分け識別がS88により行われる。次に、その区分け識別された区分け数をMとする処理がS89により行われ、この単一値組識別処理がリターンする。
【0097】
次に、S70の商品画像識別処理のサブルーチンプログラムのフローチャートを図11(C)に基づいて説明する。S85またはS86により選定された学習済み格納部から学習済みチラシ特徴量1のデータ及び商品画像識別用学習済みモデル18を読み出す処理がS95により行われる。次に、その読み出された学習済みチラシ特徴量1のデータ及び商品画像識別用学習済みモデル18に基づいて、S65により受付けられたチラシ27に掲載された画像から商品画像を識別する処理がS96により行われる。
【0098】
次に、S71の対象商品画像抽出処理のサブルーチンプログラムのフローチャートを図11(D)に基づいて説明する。S85またはS86により選定された学習済み格納部から商品画像識別用学習済みモデル18を読み出す処理がS98により行われる。次に、読み出された商品画像識別用学習済みモデルに基づいて、S88により区分けされた単一値組画像から対象商品画像を順次抽出する処理が、S99により行われる。
【0099】
次に、S72対応ラベル抽出処理のサブルーチンプログラムのフローチャートを図12(A)に基づいて説明する。S85またはS86により選定された学習済み格納部に格納されている学習済み商品特徴量20のデータと、S99により抽出された対象商品画像とを、比較して類似度の高い商品を選定する処理がS104により行われる。次に、その選定した商品の特徴量に対応して記憶されているラベル(図8参照)を読み出す処理がS105により行われる。
【0100】
次に、S73の文字位置識別処理のサブルーチンプログラムのフローチャートを図12(B)に基づいて説明する。S85またはS86により選定された学習済み格納部に格納されている文字位置学習済みモデル19に基づいて、S88により識別された単一値組画像を商品画像と文字画像とに弁別して文字画像部分を識別する処理がS108により行われる。
【0101】
次に、S74のOCRによるAIデータ作成処理のサブルーチンプログラムのフローチャートを図12(C)に基づいて説明する。S85またはS86により選定された学習済み格納部からOCR学習済みモデル17を読み出す処理がS111により行われる。次に、そのOCR学習済みモデル17を用いて、S108により識別された文字画像部分をOCRでテキストデータにする処理がS112により行われる。次に、S113において単語分類識別処理が行われる。次に、S105により読み出されたラベルと、S113により単語分類されたテキストデータとを対応付けた表(AIデータ)を作成する処理がS114により行われる。
【0102】
次に、S75の単語分類識別処理のサブルーチンプログラムのフローチャートを図12(D)に基づいて説明する。S85またはS86により選定された学習済み格納部から単語分類学習済みモデル32を読み出す処理がS116により行われる。その単語分類学習済みモデル32を用いてテキストデータを単語分類識別する処理がS117により行われる。
【0103】
次に、S78のクローラ収集データと原稿データとの対比処理のサブルーチンプログラムのフローチャートを図13(A)に基づいて説明する。S125において、クローラ収集データと原稿データ24とが対比される。その対比結果両者が一致したか否かの判定がS126により行われる。一致しておればこのクローラ収集データと原稿データとの対比処理がリターンするが、一致していない場合は制御がS127へ進み、不一致箇所の全データ(不一致箇所のデータとラベル)を校正箇所として出力して依頼者である広告作成会社31に提供する処理が行われる。また、クローラ収集データと原稿データとの対比処理に加えてまたはそれに代えて、クローラ収集データとチラシ27のデータとの対比処理を行なうようにしてもよい。
【0104】
次に、S79のAIデータと原稿データ24との対比処理のサブルーチンプログラムのフローチャートを図13(B)に基づいて説明する。S120において、AIデータと原稿データ24とで同一のラベルに対応するデータ同士を対比する処理が行われる。その対比結果両者が一致したか否かの判定がS121により行われる。一致しておれば制御がS123へ進むが、一致していない場合は制御がS122へ進み、不一致箇所のデータとラベルとを校正箇所として記憶する処理が行われた後に制御がS123へ進む。
【0105】
S123では、全てのAIデータの対比が終了したか否か判定され、終了していない場合は制御がS120へ戻る。このS120→S121→S122またはS123→S120のループを巡回することにより、全てのAIデータの対比が終了した場合にはS123によりYESと判定され、制御がS124へ移行し、S122により記憶された全校正箇所(不一致箇所のデータとラベル)を出力して依頼者である広告作成会社31に提供する(送信する)処理が行われる。
【0106】
次にS81で示した価格データの記憶処理のサブルーチンプログラムのフローチャートを図13(C)に基づいて説明する。S128において、校正箇所以外の商品毎の価格を含む商品データ(品名・容量・価格・販売制限数等)を日付と共にビッグデータDB36に記憶する処理が行われる。これにより、例えばS17及びS36においてビッグデータDB36に記憶された価格データ41を読出して利用することが可能となる。
【0107】
次に、図14に基づいて、広告作成会社31のユーザ端末74による制御処理を説明する。S180により、チラシ作製用の原稿データを送信するか否か判定され、未だ送信しない場合には制御がS182へ進む。原稿データが作成されて送信する場合には、S180によりYESと判定されてS181により原稿データがデータセンタ44へ送信される。
【0108】
次に、S182により、チラシを送信するか否か判定され、未だ送信しない場合には制御がS184へ進むが、送信する場合には、S183によりチラシの画像データがデータセンタ44へ送信される。なお、S181による原稿データの送信とS183によるチラシの画像データの送信とを別々に送信するのではなく、同時に送信してもよい。次に、S184により、チラシの校正箇所を受信したか否か判定され、受信していない場合には制御がS180に戻る。一方、データセンタ44のサーバ14からS124により校正箇所が送信されてくれば、S184によりYESと判定され、S185によりその校正箇所が格納される。
【0109】
次に、S186により、その他のデータを受信したか否か判定される。「その他のデータ」とは、例えば、S48によって送信されてくる最適化広告や、S58によって送信されてくる価格変動予測のデータである。
【0110】
以上説明した本実施形態の変形例を以下に列挙する。
(変形例1) 前述の実施の形態では、広告関連サービス提供手段35がチラシ27の校正箇所を発見して広告作成会社31に提供するものを示したが、それに限定されるものではなく、広告主30からの広告依頼に基づいて電子チラシを作成してウェブ上でその電子チラシを検索・閲覧できるようにするサービスであってもよい。
【0111】
(変形例2) 前述の実施の形態では、広告の一例としてチラシ27を示したが、パンフレット等チラシ以外の紙媒体広告であってもよく、さらにはウェブ広告等の紙媒体以外の広告であってもよい。
【0112】
(変形例3) ビッグデータDB36に記憶されるデータを、実践段階での訓練データによる学習済み格納部29と同様に、所定の属性毎(例えば、業態と地域と季節(春、夏、秋、冬)とからなる三次元テーブル)にグルーピングされたデータにしてもよい。そして、機械学習手段34がグループ毎に特化した機械学習を行うようにし、その学習結果である各学習済みモデルを属性毎(例えば、上記三次元テーブル)にグルーピングして格納してもよい。そのグループ毎に特化した学習済みモデル50を用いて、グループ毎に特化した価格変動予測、先物取引、及び最適化された広告の提供を行なうようにしてもよい。
【0113】
(変形例4) 価格変動予測用機械学習として教師あり学習を示したが(図5(A)参照)、それに代えてまたはそれに加えて、価格変動予測がどの程度当たったかにより報酬をエージェントに与える強化学習を用いてもよく、さらにはデータマイニングにより価格変動予測を行ってもよい。
【0114】
(変形例5) 最適化広告生成用強化学習(S29)として、深層強化学習(Deep Q-Network)を採用してもよい。深層強化学習とは、強化学習の関数近似に深層学習(Deep Learning)の技術を適用したものである。強化学習におけるQ学習の最大の特徴は、(s,a)の全ての組からサンプル (s,a,r,s′)が無限回得られるとするなら、それらをどのような順番で与えたとしても必ず最適な価値関数Q(s,a)が得られるという点にある。全ての状態と行動についてテーブル関数Q(s,a)を作成するとなると、処理するデータ量が膨大なものとなるために、Q(s,a)に関数近似を用いる。この関数近似に深層学習の技術を適用したものが深層強化学習である。従って、深層強化学習も強化学習の1種であり、「強化学習」の用語は「深層強化学習」も包含する広い概念である。
【0115】
(変形例6) 前述の広告関連サービス提供手段35では、チラシ27がその原稿データ24と相違している校正すべき箇所を発見して広告作成会社31に通知するものであったが、チラシ27がその原稿データ24と相違している箇所を正しい内容に校正した構成済みチラシのデータを広告作成会社31へ提供するようにしてもよい。
【0116】
(変形例7) 前述の実施形態での最適化された広告は、広告効果が最大となる商品価格Piの広告であったが、それに加えてまたはそれに代えて、売れ筋商品を予測して作成された広告であってもよい。
【0117】
以上説明した実施の形態に開示された主題を説明する。
〔主題1〕
【0118】
価格データをビッグデータとして蓄積してそのビッグデータを利用したサービスを提供するサービス提供システムとして、各種取引価格の変動に関する市場情報を情報提供者から提供してもらい、その情報に基づいて価格の変動を予測するものがある(例えば特開2001―22849号公報)。
【0119】
特許文献1に記載のものでは、情報提供者からの情報が集まりにくく、情報提供のためのインセンティブを情報提供者に与えるために有償で情報提供してもらう方法を取らざるを得ないという欠点があった。
【0120】
本主題1は、かかる実情に鑑み考え出されたものであり、その目的は、情報提供のためのインセンティブを情報提供者に与えることが可能なサービス提供システムを提供することである。
【0121】
この主題1は、例えば以下のような事項として示される。
(事項1)
少なくとも価格データ(例えば、商品毎の価格を含む商品データ(品名・容量・価格・販売制限数等))をビッグデータとして蓄積して(例えば、S128)そのビッグデータを利用したサービスを提供するサービス提供システムであって、
少なくとも価格データ(例えば、商品毎の価格を含む商品データ(品名・容量・価格・販売制限数等))を受付けるデータ受付け手段(例えば、S65、S67)と、
前記データ受付け手段により受付けられた価格データ(例えば、価格データ41)をビッグデータとして蓄積するビッグデータ蓄積手段(例えば、ビッグデータDB36、S128)と、
前記ビッグデータ蓄積手段により蓄積されたビッグデータに基づいて機械学習手段(例えば、機械学習手段34、S9、S10)が機械学習を行った学習結果を反映させたサービス(例えば、価格変動予測、最適化された広告の作成提供、先物取引)を提供するサービス提供手段(例えば、S48、S55)と、
広告作成に関するサービスを提供する広告関連サービス提供手段(例えば、広告関連サービス提供手段35、S65~S80)と、を備え、
前記広告関連サービス提供手段は、前記データ受付け手段が受付けた価格データを反映した広告作成に関するサービス(例えば、S65~S80)を前記価格データの提供者(例えば、広告作成会社31)に提供する、サービス提供システム。
【0122】
このサービス提供システムによれば、情報提供者は、価格データを反映した広告作成に関するサービスが提供されるため、情報提供に対するインセンティブを得て自ら率先して情報を提供しようとする。
【0123】
(事項2)
前記ビッグデータ蓄積手段は、価格変動の要因となる変動要因データ(例えば、クローラ収集データ40としての、天候,自然災害,株価,為替レート,金利,景気動向,所得変動,地政学的リスク)もビッグデータとして蓄積し、
前記ビッグデータ蓄積手段により蓄積された前記価格データと前記変動要因データとに基づいて価格変動を予測する予測手段(例えば、S55~S60)をさらに備え、
前記予測手段は、前記価格データと前記変動要因データとに基づいて前記機械学習手段が機械学習(例えば、S15~S20)を行った学習結果を反映させて前記価格変動を予測し(例えば、S57)、
前記サービス提供手段は、前記予測手段による価格変動の予測を反映したサービスを提供する(例えば、価格変動予測、最適化された広告の作成提供)、事項1に記載のサービス提供システム。
【0124】
このサービス提供システムによれば、情報提供者が価格変動の予測を反映したサービスを受けることができる。
【0125】
(事項3)
前記ビッグデータ蓄積手段により蓄積されたビッグデータに基づいて前記機械学習手段が最適化された広告を作成するための機械学習(例えば、S25~31、S36~S38、S46、S47)を行った学習結果を反映させて広告を作成する広告作成手段(例えば、S48)をさらに備え、
前記サービス提供手段は、前記広告作成手段により作成された広告を提供する(例えば、S48)、事項1または2に記載のサービス提供システム。
【0126】
このサービス提供システムによれば、最適化された広告を作成するための機械学習の結果を反映させて作成された広告を得ることができる。
【0127】
(事項4)
前記広告作成手段により作成された広告の効果を測定する広告効果測定手段(例えば、広告効果測定手段38、S1~S8)をさらに備え、
前記最適化された広告を作成するための機械学習は、前記広告効果測定手段による測定結果に従ってエージェントに報酬が与えられ、該エージェントが前記報酬の累積を最大化する方策を学習する強化学習である(例えば、S46、S47)、事項3に記載のサービス提供システム。
【0128】
このサービス提供システムによれば、強化学習の結果広告効果の高い広告を提供可能となる。
【0129】
(事項5)
前記広告作成手段により作成された広告の効果を測定する広告効果測定手段(例えば、広告効果測定手段38、S1~S8)をさらに備え、
前記最適化された広告を作成するための機械学習は、前記ビッグデータ蓄積手段により蓄積された前記価格データと価格変動の要因となる変動要因データとに基づいて予測手段が予測した価格を入力情報とし、且つ、前記広告効果測定手段により所定レベル以上の効果が測定された広告内容を正解情報とする訓練データ(例えば、{(xji,yji)})を生成し(例えば、S37)、該訓練データを用いて教師あり学習を行い、回帰問題として入力を正解に写像する関数(例えば、cj(x)(cj:x→y))を学習する教師あり学習(例えば、S36~S38)である、事項3に記載のサービス提供システム。
【0130】
このサービス提供システムによれば、教師あり学習の結果広告効果の高い広告を提供可能となる。
【0131】
(事項6)
少なくとも価格データ(例えば、商品毎の価格を含む商品データ(品名・容量・価格・販売制限数等))をビッグデータとして蓄積して(例えば、S128)そのビッグデータを利用したサービスを提供するサービス提供システム側(例えば、データセンタ44側)にネット接続可能なユーザ側設備(例えば、広告主30の社内LAN84に接続されたユーザ端末74、広告作成会社31の社内LAN84に接続されたユーザ端末74)であって、
少なくとも価格データ(例えば、商品毎の価格を含む商品データ(品名・容量・価格・販売制限数等))を前記サービス提供システム側に提供するデータ提供手段(例えば、S181、S183)と、
前記サービス提供システム側に設けられたビッグデータ蓄積手段により、前記データ提供手段により提供された価格データがビッグデータとして蓄積され、該蓄積されたビッグデータに基づいて機械学習手段が機械学習を行った学習結果を反映させたサービス(例えば、最適化された広告、価格変動予測)を前記サービス提供システム側から享受するサービス享受手段(例えば、S155、S187)と、
前記サービス提供システム側に設けられた広告関連サービス提供手段から広告作成に関するサービスを享受する広告関連サービス享受手段(例えば、S184)と、を備え、
前記広告関連サービス享受手段は、前記データ提供手段により提供された価格データを反映した広告作成に関するサービス(例えば、S65~S80)を享受する。
【0132】
このサービス提供システムによれば、価格データの提供者は、データ提供手段が提供した価格データを反映した広告作成に関するサービスを受けることができるため、価格データを提供するためのインセンティブが与えられ、自ら率先して価格データを提供する傾向が生じる。
【0133】
〔主題2〕
広告の校正すべき個所を判別して通知する広告関連サービス提供システムとして、チラシ等の広告をその原稿データと照合し、原稿に従っていない箇所を発見するものがある(例えば特開2004―133734号公報)。
【0134】
しかし、この特許文献に記載のものでは、広告をその原稿データと照合するために人為的作業が必要となるという欠点があった。
【0135】
本主題2は、かかる実情に鑑み考え出されたものであり、その目的は、広告をその原稿データと照合するための人為的作業を極力省くことができる広告関連サービス提供システムを提供することである。
【0136】
この主題2は、例えば以下のような事項として示される。
(事項1)
広告作成に関するサービスを提供する広告関連サービス提供システムであって、
広告(例えば、チラシ27、パンフレット、ウェブ広告等)のデータを受付ける広告データ受付け手段(例えば、S65)と、
前記広告の作成に用いられた原稿データ(例えば、原稿データ2)を受付ける原稿データ受付け手段(例えば、S67)と、
前記広告データ受付け手段により受付けられた広告のデータと前記原稿データ受付け手段により受付けられた原稿データとに基づいて、前記広告と前記原稿データとの整合性を判定して前記広告の校正すべき個所を判別する校正箇所判別手段(例えば、S68~S79)と、を備え、
前記校正箇所判別手段は、前記広告と前記原稿データとの整合性を判定するための機械学習(例えば、チラシ特徴学習23、広告値組境界学習3、商品特徴学習22、商品画像識別用学習4、文字位置学習28、OCR学習16、単語分類学習39)を校正用機械学習手段(例えば、校正用機械学習手段33)が行なった学習結果(例えば、学習済みチラシ特徴量1、広告値組境界学習済みモデル2、学習済み商品特徴量20、商品画像識別用学習済みモデル18、文字位置学習済みモデル19、OCR学習済みモデル17、単語分類学習済みモデル32)を反映させて前記整合性を判定する(例えば、S87、S88、S95、S96、S98、S99、S104、S105、S108、S116、S117、S111、S112、S116、S117)、広告関連サービス提供システム。
【0137】
この広告関連サービス提供システムによれば、校正用機械学習手段が広告と原稿データとの整合性を判定するための機械学習を行なった学習結果を反映させて、広告と原稿データとの整合性が判定されるため、告をその原稿データと照合するための人為的作業を極力省くことができる。
【0138】
(事項2)
前記広告のデータは複数の広告商品のデータ(例えば、図10(B)に示す値組99a、99b、99c、99d)を含んでおり、
前記原稿データは広告対象の複数の商品各々についての広告内容を指定するデータ(例えば、図10(E)に示す標品名、メーカ、値段等)を含み、
前記校正用機械学習手段が行なう機械学習は、前記広告データ受付け手段により受付けられた広告のデータを単一値組毎に区分けして識別するための値組毎区分け識別用機械学習(例えば、チラシ特徴学習23、広告値組境界学習3)含み、
前記校正箇所判別手段は、
前記値組毎区分け識別用機械学習による学習結果を反映させて前記広告のデータを単一値組毎に区分けして識別する値組毎区分け識別処理(例えば、S87~S89)と、
前記値組毎区分け識別処理により識別された単一値組の各々が、前記原稿データにおけるどの部分の広告内容に対応するかを特定する原稿対応部分特定処理(例えば、S95、S96、S98、S99、S104、S105、S108)と、
前記値組毎区分け識別処理により識別された単一値組の各々と、前記原稿対応部分特定処理により特定された広告内容とをマッチングさせて前記整合性を判定する整合性判定処理(例えば、S111~S114、S116、S117、S120~S123)と、を行う、事項1に記載の広告関連サービス提供システム。
【0139】
この広告関連サービス提供システムによれば、単一値組の各々が原稿データにおけるどの部分の広告内容に対応するかが特定され、その特定された広告内容と単一値組の各々とがマッチングされて整合性が判定されるため、正確な整合性の判定が可能となる。
【0140】
(事項3)
前記整合性判定処理は、前記値組毎区分け識別処理により単一値組毎に区分けして識別された各単一値組の文字画像と前記原稿データとの整合性を判定する(例えば、S111~S114、S116、S117、S120~S123)、事項2に記載の広告関連サービス提供システム。
【0141】
この広告関連サービス提供システムによれば、単一値組の文字画像が原稿データと整合しているか否か判定可能となる。
【0142】
(事項4)
前記校正用機械学習手段が行なう機械学習は、前記値組毎区分け識別処理により単一値組毎に区分けして識別された各単一値組の文字画像をテキストデータ化するためのテキストデータ化機械学習(例えば、文字位置学習28、OCR学習16)を含み、
前記整合性判定処理は、前記テキストデータ化機械学習による学習結果を反映させて前記文字画像をテキストデータ化したうえで、該テキストデータと前記原稿データとの整合性を判定する(例えば、S111~S114、S116、S117、S120~S123)、事項3に記載の広告関連サービス提供システム。
【0143】
この広告関連サービス提供システムによれば、文字画像をテキストデータ化したうえで、該テキストデータと原稿データとの整合性が判定され、両データ同士の良好な整合性判定が可能となる。
【0144】
(事項5)
前記校正用機械学習手段が行なう機械学習は、前記広告商品に相当する実際の商品のオリジナル画像のデータに基づいて当該商品の特徴を学習するための商品特徴学習(例えば、商品特徴学習22)をさらに含み、
前記商品特徴学習により学習した商品の特徴と当該商品を識別するための識別情報(例えば、JANコードまたはハウスコード等のラベル)とを対応付けて記憶する対応付け記憶手段(例えば、学習段階学習済み格納部21の学習済み商品特徴量20)をさらに備え、
前記原稿データは、広告対象の複数の商品各々についてその広告内容(例えば、商品名、メーカ、値段等)と当該商品の前記識別情報(例えば、ラベル)とが対応付けられたデータであり(例えば、図10(E))、
前記原稿対応部分特定処理は、広告商品の識別に用いた商品の特徴に対応付けられて前記対応付け記憶手段に記憶されている識別情報(例えば、ラベル)を特定し、該識別情報に対応付けられた広告内容(例えば、商品名、メーカ、値段等)を前記原稿データ(例えば、原稿データ24)から特定する(例えば、S120)、事項2~4のいずれかに記載の広告関連サービス提供システム。
【0145】
この広告関連サービス提供システムによれば、商品を識別するための識別情報に対応付けられた広告内容を原稿データから特定して整合性判定を行うために、原稿データを正確に特定可能となる。
【0146】
(事項6)
前記校正用機械学習手段は、所定の属性毎(例えば、業態、地域、季節(春、夏、秋、冬))にグルーピングされたデータに基づいて機械学習を行うことによりグループ毎に特化した機械学習(例えば、S129~S135)を行い、
前記校正箇所判別手段は、前記校正用機械学習手段による前記グループ毎に特化した機械学習の結果を反映させて前記整合性を判定する(例えば、S84、S86)、事項1~5のいずれかに記載の広告関連サービス提供システム。
【0147】
この広告関連サービス提供システムによれば、所定の属性毎にグルーピングされたグループ毎に特化した機械学習の結果を反映させて整合性判定処理が行われるために、グループの属性にマッチした機械学習の結果を整合性判定処理に活かすことが可能となる。
【0148】
(事項7)
広告作成に関するサービスを提供する広告関連サービス提供システム側(例えば、データセンタ44側)にネット接続可能なユーザ側広告設備(例えば、広告作成会社31の社内LAN84に接続されたユーザ端末74)であって、
広告を前記広告関連サービス提供システム側に提供する広告提供手段(例えば、S183)と、
前記広告の作成に用いられた原稿データを前記広告関連サービス提供システム側に提供する原稿データ提供手段(例えば、S181)と、
前記広告関連サービス提供システム側に設けられた校正箇所判別手段において、前記広告提供手段により提供された広告のデータと前記原稿データ提供手段により提供された原稿データとに基づいて、前記広告と前記原稿データとの整合性が判定されて前記広告の校正すべき個所が判別され、該判別結果に基づいたサービスを前記広告関連サービス提供システム側から享受する享受手段(例えば、S184)と、を備え、
前記校正箇所判別手段は、前記広告と前記原稿データとの整合性を判定するための機械学習を校正用機械学習手段が行なった学習結果(例えば、学習済みチラシ特徴量1、広告値組境界学習済みモデル2、学習済み商品特徴量20、商品画像識別用学習済みモデル18、文字位置学習済みモデル19、OCR学習済みモデル17、単語分類学習済みモデル32)を反映させて前記整合性を判定する(例えば、S87、S88、S95、S96、S98、S99、S104、S105、S108、S116、S117、S111、S112、S116、S117)。
【0149】
このユーザ側広告設備によれば、校正用機械学習手段が行なった学習結果を反映させて広告と原稿データとの整合性が判定されて広告の校正すべき個所が判別され、該判別結果に基づいたサービスを享受することができるため、極力人為的作業が省かれた人件費の削減されたサービスを受けることができる。
【0150】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0151】
1 チラシ特徴学習済みモデル、2 広告値組境界学習済みモデル、3 広告値組境界学習、4 商品画像識別用学習、14 サーバ、16 OCR学習、17 OCR学習済みモデ、18 商品画像識別用学習済みモデル、19 文字位置学習済みモデル、20 学習済み商品特徴、22 商品特徴学習、23 チラシ特徴学習、24 原稿データ、27 チラシ、28 文字位置学習、29 実践段階での訓練データによる学習済み格納部、32 単語分類学習済みモデル、33 広告関連サービス用機械学習、34 機械学習手段、35 広告関連サービス提供手段、50 学習済みモデル。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15