(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-10-21
(45)【発行日】2022-10-31
(54)【発明の名称】データ生成方法、システム、または装置および大衆評価予測AIモデル訓練方法、学習済みモデル、あるいは、大衆評価予測AIシステム、プログラム、またはコンピューティングデバイス
(51)【国際特許分類】
G06Q 50/10 20120101AFI20221024BHJP
【FI】
G06Q50/10
(21)【出願番号】P 2022036716
(22)【出願日】2022-03-10
【審査請求日】2022-03-10
【早期審査対象出願】
(73)【特許権者】
【識別番号】322000476
【氏名又は名称】岩井 一郎
(73)【特許権者】
【識別番号】318015644
【氏名又は名称】宍戸 知行
(74)【代理人】
【識別番号】100125988
【氏名又は名称】宍戸 知行
(72)【発明者】
【氏名】岩井 一郎
(72)【発明者】
【氏名】宍戸 知行
【審査官】永野 一郎
(56)【参考文献】
【文献】特開2003-087824(JP,A)
【文献】特開2005-202826(JP,A)
【文献】米国特許出願公開第2013/0053115(US,A1)
【文献】特開2002-342522(JP,A)
【文献】特開2006-340191(JP,A)
【文献】韓国公開特許第10-2017-0025634(KR,A)
【文献】米国特許出願公開第2013/0339484(US,A1)
【文献】特開2001-325471(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
データ生成方法であって、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理工程と、
前記最頻の評価結果をデータベースに保存する保存工程と、
前記複数人のうち、前記最頻の評価結果に一致する評価結果を最も多く入力した者に懸賞が付与される付与工程と、
を含むデータ生成方法。
【請求項2】
コンピュータが、対象の情報と、対象の評価の選択肢とを提供する提供工程、をさらに含む請求項1に記載の方法。
【請求項3】
前記評価結果は、前記複数人の各人が一般大衆の評価結果であると予想する評価結果であ
って、ここで、前記一般大衆の評価が評価結果のうち最も多く一致した評価結果である、請求項1または2に記載の方法。
【請求項4】
前記最頻の評価結果を大衆評価としてデータベースに登録する登録工程をさらに含む、
請求項3に記載の方法。
【請求項5】
前記入力部はウェブサイトであり、前記ウェブサイトで懸賞付きコンテストが実施され 、前記複数人は複数応募者である、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記懸賞が電子マネーである、請求項5に記載の方法。
【請求項7】
前記対象が顔年齢または肌年齢である、請求項1~
6のいずれか一項に記載の方法。
【請求項8】
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した 評価結果を最頻の評価結果として特定する処理を行う処理部と、
前記最頻の評価結果をデータベースに保存する保存部と、
前記複数人のうち、前記最頻の評価結果に一致する評価結果を最も多く入力した者に懸賞が付与される付与部と、
を含むデータ生成システム。
【請求項9】
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理部と、
前記最頻の評価結果をデータベースに保存する保存部と、
前記複数人のうち、前記最頻の評価結果に一致する評価結果を最も多く入力した者に懸賞が付与される付与部と、
を含むデータ生成装置。
【請求項10】
AIモデル訓練方法であって、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理工程と、
前記最頻の評価結果をデータベースに保存する保存工程と、
前記複数人のうち、前記最頻の評価結果に一致する評価結果を最も多く入力した者に懸賞が付与される付与工程と、
前記最頻の評価結果のデータを
教師データとして、前記対象に対する大衆評価予測AIモデルを訓練する工程
であって、前記大衆評価が前記評価結果のうち最も多く一致した評価結果である工程と、を含むAIモデル訓練方法。
【請求項11】
前記複数人の特性別に前記大衆評価予測AIモデルを訓練する、請求項
10に記載の方 法。
【請求項12】
前記特性が性別および/または年齢層である、請求項
11に記載の方法。
【請求項13】
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理工程と、
前記最頻の評価結果をデータベースに保存する保存工程と、
前記複数人のうち、前記最頻の評価結果に一致する評価結果を最も多く入力した者に懸賞が付与される付与工程と、
前記最頻の評価結果のデータを教師データとして、前記対象に対する大衆評価予測AIモデルを訓練する工程であって、前記大衆評価が前記評価結果のうち最も多く一致した評価結果である工程と、を含む、学習済み大衆評価予測AIモデルの生産方法。
【請求項14】
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
コンピュータが、
前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果として特定した最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示工程と、
を含む方法。
【請求項15】
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
コンピュータが、
前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果として特定した最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示部と、
を含むシステム。
【請求項16】
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
コンピュータが、
前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果として特定した最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示部と、
を含む装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はデータ生成方法、システム、または装置および大衆評価予測AIモデル訓練方法、学習済みモデル、あるいは、大衆評価予測AIシステム、プログラム、またはコンピューティングデバイスに関する。
【背景技術】
【0002】
ディープラーニングを含めたAIを活用したデータ解析が盛んになっている。そのデータはどのようなデータ(what kind)を、どこで(where)、どのように(how)に、どれだけ(how many)集め、そして得られたデータをどのように(how to)使用して解析するのかが重要である(非特許文献1)。
【0003】
データ収集に関しては、例えば、特許文献1の請求項1には、「機械学習の教師データを収集するデータ収集プログラムであって、コンクリート構造物の表面の所定範囲における外観症状の評価の入力を受け付け、前記入力を受け付けた後に撮像された前記所定範囲の画像を取得し、前記評価と前記画像とを対応付けて教師データとする、処理をコンピュータに実行させるためのデータ収集プログラム」が記載されている。また、例えば、特許文献2の請求項9には、「特定の経路制御プロトコルに基づいた経路制御が行われる通信ネットワークから学習用経路情報を収集するデータ収集ステップと、学習用経路情報の画像化を行う画像化ステップと、を含み、画像化された学習用経路情報と当該学習用経路情報が異常経路を含むか否かを示す教師データとを、前記通信ネットワークから収集された判定対象の経路情報が異常経路を含むか否かを判定するためのモデルを生成するために所定の機械学習モデルを学習させる学習データに使用する、学習データ生成方法。」が記載されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2021-139787号公報
【文献】特開2021-197640号公報
【非特許文献】
【0005】
【文献】Deep Learning: A Comprehensive Overview on Techniques, Taxonomy, Applications and Research Directions, Iqbal H. Sarker, SN Computer Science (2021) 2:420
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、非特許文献1、特許文献1及び2では、一般大衆の平均的な評価を効率的に収集する方法は開示されていない。
【0007】
本発明は、例えば、効率的な大衆評価予測データの生成方法、大衆評価予測AIモデルの訓練方法、大衆評価予測を行うシステム等を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の目的を達成するために、本発明は、以下の(1)~(23)を提供する。
【0009】
本発明の第一観点では、以下の(1)~(9)のデータ生成方法が提供される。
(1)データ生成方法であって、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理工程と、
前記最頻の評価結果をデータベースに保存する保存工程と、を含むデータ生成方法。
(2)コンピュータが、対象の情報と、対象の評価の選択肢とを提供する提供工程、をさらに含む(1)に記載の方法。
(3)前記評価結果は、前記複数人の各人が一般大衆の評価結果であると予想する評価結果である、(1)または(2)に記載の方法。
(4)前記最頻の評価結果を大衆評価としてデータベースに登録する登録工程をさらに含む、(1)~(3)のいずれか一項に記載の方法。
(5)前記入力部はウェブサイトであり、前記ウェブサイトで懸賞付きコンテストが実施され、前記複数人は複数応募者である、(1)~(4)のいずれか一項に記載の方法。
(6)前記最頻の評価結果に一致する評価結果を最も多く入力した前記応募者に前記懸賞が付与される付与工程をさらに含む、(5)に記載の方法。
(7)前記懸賞が電子マネーである、(5)または(6)に記載の方法。
(8)前記対象が顔年齢または肌年齢である、(1)~(7)のいずれか一項に記載の方法。
(9)AIモデルの教師データを生成する、(1)~(8)のいずれか一項に記載の方法。
【0010】
本発明の第二の観点では、以下の(10)のデータ生成システムが提供される。
【0011】
(10)コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理部と、
前記最頻の評価結果をデータベースに保存する保存部と、を含むデータ生成システム。
【0012】
本発明の第三の観点では、以下の(11)のデータ生成装置が提供される。
【0013】
(11)コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理部と、
前記最頻の評価結果をデータベースに保存する保存部と、を含むデータ生成装置。
【0014】
本発明の第四の観点では、以下の(12)~(14)のAIモデル訓練方法が提供される。
(12)AIモデル訓練方法であって、
(1)~(11)のいずれか一項の方法、システム、または装置によって生成された前記最頻の評価結果のデータを利用して、前記対象に対する大衆評価予測AIモデルを訓練する工程、を含むAIモデル訓練方法。
(13)前記複数人の特性別に前記大衆評価予測AIモデルを訓練する、(12)に記載の方法。
(14)前記特性が性別および/または年齢層である、(13)に記載の方法。
【0015】
本発明の第五の観点は、以下の(15)~(17)の学習済みモデルを提供する。
(15)対象のデータを入力する入力層と、
ニューラルネットワークからなり入力データを処理する中間層と、
前記対象に対する大衆評価を出力する出力層と、を含み、
(12)~(14)のいずれか一項に記載の方法により訓練された学習済み大衆評価予測AIモデル。
(16)入力された前記対象のデータに対応する大衆評価を出力するよう、コンピュータを機能させるための、(15)に記載の学習済み大衆評価予測AIモデル。
(17)前記対象のデータは肌画像であり、前記大衆評価は肌年齢である、(15)又は(16)に記載の学習済み大衆評価予測AIモデル。
【0016】
本発明の第六~八の観点は、それぞれ、
(18)(15)に記載の学習済み大衆評価予測AIモデルと、
ユーザーの有する対象のデータを入力する入力部と、
前記対象のデータに対する大衆評価を予測する予測部と、
前記予測をユーザーに表示する出力部と、を含む大衆評価予測AIシステム;
(19)(15)に記載の学習済み大衆評価予測AIモデルと、
ユーザーの有する対象のデータを入力する入力部と、
前記対象のデータに対する大衆評価を予測する予測部と、
前記予測をユーザーに表示する出力部と、を含むプログラム;
(20)(15)に記載の学習済み大衆評価予測AIモデルと、
ユーザーの有する対象のデータを入力する入力部と、
前記対象のデータに対する大衆評価を予測する予測部と、
前記予測をユーザーに表示する出力部と、を含むコンピューティングデバイス、である。
【0017】
本発明の第九~十一の観点は、以下の(21)~(23)の方法、システム、または装置を提供する。
【0018】
(21)コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
コンピュータが、最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示工程と、
を含む方法。
(22)コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
コンピュータが、最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示部と、
を含むシステム。
(23)コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
コンピュータが、最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示部と、
を含む装置。
【発明の効果】
【0019】
本発明の一態様によれば、大衆評価データを効率的に集めて、大衆評価予測AIモデルを訓練することができるという効果が生じる。
【図面の簡単な説明】
【0020】
【
図1】本発明の一実施形態のデータ生成システムまたは装置の概略図である。
【
図2】本発明の一実施形態の方法の工程を示すフローチャートである。
【
図3】本発明の一実施形態の方法でのコンテストのウェブサイトの一部を示す図である。
図3Aは「肌年齢コンテスト」のウェブサイトのランディングページの一部である。
図3Bはコンテストの応募者のユーザー登録画面である。
図3Cは肌年齢コンテストで対象の肌画像に対して肌年齢層を評価して選択する図である。
【
図4】本発明の一実施形態の方法でのコンテストの評価結果の解析処理の一部を示す図である。
図4Aは年間、月間、または週間評価数や応募者数の変化をグラフ化したものと、各評価者のポイントの上位(精度高く評価した応募者)を示す図である。
【
図5】本発明の一実施形態の方法での訓練が可能であることを実証する図である。
図5Aは顔年齢予測モデルの訓練での実際の年齢からのずれを評価ロスとして示すグラフである。
図5Bは訓練したモデルのテストデータでの結果を実年齢(True)、予測年齢(Pred)として示したパネルである。
【発明を実施するための形態】
【0021】
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
【0022】
用語と定義
本明細書中では、「ウェブサイト」とは、World Wide Web(WWW)(ワールドワイドウェブ)上にあり、一般に特定のドメイン名の下にある複数のウェブページの集まりをいう。単にサイトと呼ばれることもある。但し、SPA(Single Page Application)としてもデプロイ可能である。インターネット上で閲覧、操作等が可能なサイトであれば、特に限定はされない。また、本明細書中では、アプリ(例、Webアプリやネーティブアプリを含む)もウェブサイトに含まれる。
【0023】
本明細書中では、「懸賞付きコンテスト」は、好ましくはウェブサイト上で行われるコンテスト(コンペティション、プライズと呼ばれることもある)であってもよく、懸賞(例、現金、電子マネー、Amazonギフト券、クーポン、景品、商品、サービス)が付されたものである。コンテストは、勝利または賞を目ざしての競争、競技、競演、コンクールとも称されるが、特に限定はされない。複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として精度は計算可能でもある。本明細書中では、コンテストは結果に応じて順位が決まる。前記最頻の評価結果に一致する評価結果を最も多く入力した応募者(評価者)が懸賞金を得られるようにコンピュータを使用して処理されてもよい。その評価結果をコンピュータによりポイント化して処理することにより実行される場合がある。応募者がモチベーション(例、金銭的利益)を持つ条件下で実施されることが好ましい。
【0024】
本明細書中では、「応募者」は、コンテストに応募した者、サイトのユーザー等のコンテストに参加した者一般を含む。
【0025】
本明細書中では、「対象」とは、評価の対象となる画像、ヒトまたはヒトの特徴、物または物の特徴、事象、事柄、現象等の「物」および/または「概念」を含む。特に断りが無い限り、「対象」には「物」または「人」あるいはその「画像」または「特徴/特性」のデータのいずれも含まれる。本明細書中での「対象」には、カテゴリー等を含む場合もあるが、対象に関する具体的な内容データ(例、個々の画像データ)が複数含まれることを含む場合もある。
【0026】
本明細書中では、「評価」とは、点数、グレード、グループ、実測値、見かけ値、絶対値、相対値、正負の値、正/負等任意の尺度/基準による評価が含まれる。数値の場合には任意に数値の幅を指定して数値範囲のグループを指定することが好ましい。そして、その数値範囲等のグループから任意の評価を選択することにより、評価のポイント化を実行する場合がある。
【0027】
本明細書中では、「大衆評価」とは、例えば、一般大衆の平均的な評価結果を含む。大衆評価は、例えば、大衆が評価した結果に一致すると評価される評価結果であってもよい。大衆評価は、例えば、評価を実施した人のうち大多数の人が選択した結果であってもよい。大衆評価は、例えば、評価結果のうち最も多く一致した評価結果であってもよい。大衆評価は、例えば、任意に定めた基準により複数の応募者が選んだと考えられる評価であってもよく、一般に世間で考えられている実際の一般的評価と完全に一致していない場合があるが、それに相当するものであってもよい。
【0028】
本明細書中では、「統計処理」は、当業者が用いる任意の統計処理(例、平均値、最大値、最小値、中央値、最頻値、分散、平均偏差、平均誤差、合計、正解率、適合率、再現率等を得る処理)が含まれる。
【0029】
本明細書中では、「最頻値」またはモード(英:mode)とは、データや確率分布で頻度(度数、確率)が最大の値のことである。最頻値は一意とは限らず、確率質量関数や確率密度関数が複数の地点で最大となることもある。標本データの最頻値は、その中で最も頻繁に出現する値を意味する。例えば[1,3,6,6,6,6,7,7,12,12,17]という標本群の最頻値は6である。
【0030】
本明細書中では、「精度」は、任意に定める基準であってもよい。任意ではあるが、精度は、ポイント化して評価する。そしてポイントの高いものを精度が高いと評価する場合がある。また、最頻の評価結果に該当するか等を加味して独自に作成した数式で計算する場合がある。
【0031】
本明細書中では、「電子マネー」には、仮想通貨だけでなく現金と交換可能なクーポン(例、Amazonギフト券)等の任意の現金に相当する価値のある金銭手段が含まれる。
【0032】
本明細書中では、「応募者の特性(属性)」は、特に限定されず、例えば、年齢、年齢層、年代、性別、趣味、金融資産、特定の会員、身体的特徴、精神的嗜好等の任意の特性が含まれる。
【0033】
本明細書中では、「顔年齢または肌年齢」とは、個々人の実年齢を指してもよいし、自己または他人(個々のヒト、グループ、または大衆)が考える予想年齢であってもよい。
【0034】
実施形態1:データ生成方法
実施形態1は、
データ生成方法であって、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理工程と、
前記最頻の評価結果をデータベースに保存する保存工程と、を含むデータ生成方法である。
【0035】
使用されるデータベースは特に限定されず、使用可能なものなら任意のものが用いられる。データベースの種類には、階層型、NoSQL、リレーショナルガタ、ネットワーク型等が挙げられる。具体的には、MySQL、SQLite、Amazon Aurora、PostgreSQL、Oracle Database、MongoDB、MariaDB、Microsoft SQL Server等が挙げられるが、これらに限定はされない。また、対象の評価のデータを保存するデータベースと大衆評価を登録するデータベースは同じ(例、
図1のデータベース20)であってもよいし、異なっていてもよい(例、
図1のデータベース50)。どちらにしても特異的なテーブルを個別に用意するので、両者のデータは区別して管理可能である。さらに、本発明では、データベースには一時的または永続的にメモリ等に保存される場合の保存場所も含まれる。
【0036】
入力、処理、登録に用いられる言語は、フレームワークに依存する場合があるが、例えば、Python、Java、JavaScript、PHP等が用いられる。処理部は、例えば、クラウド上のVirtual Private Cloud(VPC)(AWS)、GPC(Google)、Azure(Microsoft)等に設置されてもよい。
【0037】
本データ生成方法は、リアルまたはバーチャルなハードウエア資源上で実行されるソフトウエアとして設置される。
【0038】
ウェブサイトで複数応募者が入力した対象の評価結果のデータをデータベースに送信する工程と、対象に対する前記複数応募者の前記評価を処理部で統計処理する(例、最頻の結果を得る)工程と、前記対象の評価における最頻の評価を大衆評価としてデータベースに保存する工程とを介してAIモデル訓練データを生成する。以下、各工程要素を、
図2を参照しながら詳細に説明する。
【0039】
(I)コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程(S100:対象評価入力と送信)
「応募者(複数人)」はネット上の検索等で本ウェブサイトを見つけることができる。応募者(複数人)は任意のヒトであるのが好ましい。応募者(複数人)は自己のメールアドレスで特定される場合がある。メールアドレスの重複はプログラム的に除去されるようにしてもよい。その他、応募者(複数人)の任意の属性を入力させる形式であってもよい。応募者(複数人)の性別、年齢層、嗜好等の任意の属性で、プロダクトのAIモデルを個別にトレーニングできる点で有利な効果を奏する。応募者(複数人)がAIなどヒトでない場合も想定されるが、ヒト以外の応募者(複数人)を除外する仕組みを設けてもよい。
【0040】
ウェブサイトは好ましくはWebアプリケーションとしてサーバー上にデプロイされる。Webアプリケーションは任意のフロントエンドおよびバックエンドにより構成される。
【0041】
ウェブサイト上ではコンテストが実施される場合がある。「コンテスト」は「懸賞」付きのものが好ましい。懸賞があることでデータの信頼性や数を高めることができるという優れた効果がある。懸賞は任意の懸賞が含まれる。一種類の型の懸賞だけでも良いし、複数型の懸賞を同時に入れることもできる。懸賞の例には、現金、電子マネー、ギフト券、商品、サービス、クーポン等が挙げられる。特に好ましくは、懸賞は現金、電子マネー、ギフト券、クーポン等の現金と等価に交換または使用できるものである。これにより、応募者が正しい評価データを入力し、その数も増加するという優れた効果を奏する。懸賞の受け取り時には、応募者の属性を証明する書類の添付を義務付けるようにしてもよいし、しなくてもよい。その証明書類の添付の義務化は応募者の正しいデータの入力にはポジティブに働く場合もある。
【0042】
「対象」には任意の対象が含まれる。例えば、限定はされないが、特定のカテゴリーの画像、情報、概念等が挙げられる。例えば、顔や皮膚の画像、商品の画像、風景の画像等任意の画像が含まれる。但し、「対象」は「評価」可能なものである必要がある。上記したように、「評価」とは、点数、グレード、グループ、実測値、見かけ値、絶対値、相対値、正負の値、正/負等任意の尺度/基準による評価が含まれる。数値の場合には任意に数値の幅を指定して数値範囲のグループを指定することが好ましい。そして、その数値範囲等のグループから任意の評価を選択することにより、評価のポイント化を実行する場合がある。コンピュータが、対象の情報と、対象の評価の選択肢とを提供する提供工程、をさらに含む場合がある。選択肢を提供することで最頻の評価結果を処理しやすくなるという効果が生じる。
【0043】
特に断りの無い限り、「対象」を評価するとは、「対象に関する複数のデータ」をそれぞれ評価することを指し、対象は同一カテゴリーであることが好ましいが、限定はされない。同一カテゴリーの場合や各カテゴリーの場合のデータ数は、例えば、1、2、3、4、5、10、20、30、50、100、250、500、1000、2500、5000、10000、25000、50000、100000、1000000、5000000、10000000、100000000、または1000000000以上であってもよい。その数値は任意の上記2つの値の間であっても、その値以上、それより大きく、それ以下、またはそれ未満であってもよい。
【0044】
その各データに対する評価を、好ましくは全ての評価者に関して集計処理し、その最頻の結果である評価を各データに対して大衆評価としてデータベース(例、
図1のデータベース50)に登録する。実施例1では、「肌画像(対象)」に関する53個の画像データのそれぞれに対して評価者(6名)の評価を集計し、最頻の結果であった評価(肌年齢グループ)を大衆評価として各データに関してデータベースに登録した。
【0045】
例えば、顔や皮膚の画像が「対象」の場合は、「顔年齢」や「肌年齢」が評価の対象になる場合がある。「顔年齢」や「肌年齢」は特に大衆評価がユーザーにとって有益で知りたい情報になる。調べた範囲では肌の状態(例、うるおい・ハリ・透明度・シミ・シワ・ほうれい線)や肌年齢を知らせるアプリ等は既にいくつか知られているが(例、肌パシャ(資生堂)、SOFINA iP(花王))、大衆評価を元にAIディープラーニングをトレーニングしてアプリとして提供するものではない。つまり、教師データである「大衆評価」を一般から効率的に集めてAIディープラーニングモデルを訓練することには課題が残っている。本発明はその課題に取り組み、そのソリューションを提供することができる。
【0046】
前記評価は、各応募者の個人の評価である場合もある。好ましくは、前記評価が一般大衆の評価であると予想する評価であることにより、これまで実現が難しかった一般大衆のイメージとして各評価者が考えている評価を得ることができるという顕著な効果を奏する。
【0047】
好ましくは、ウェブサイト上で開催される懸賞付きコンテストを行うことで、複数応募者が集まり対象の評価のデータが効率的に得られるという優れた効果がある。
【0048】
また、好ましくは前記複数応募者の前記評価の最頻値が前記対象の大衆評価としてデータベースに登録され、前記大衆評価を精度高く(例えば、精度は評価をポイント化して得られる)予測した前記応募者が前記懸賞を得るという応募者へのインセンティブを提供することで、さらに効率的にデータ収集することができるようになるという顕著な効果がある。
【0049】
また、好ましくは前記懸賞が電子マネーであることにより応募者へのインセンティブが飛躍的に高まる。
【0050】
好ましくは、前記対象が顔年齢または肌年齢であることにより、一般のヒトが知りたい他人からの自己の年齢イメージ等についての情報を得ることができる。また、特に化粧品の分野において、顔年齢および/または肌年齢の他人評価または大衆評価の情報を得ることができる。これは、ユーザーのニーズの観点で有用である。
【0051】
(II)前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理工程(S200:評価統計処理)
「複数人の評価」は、複数人の個人的な自己の評価であってもよいし、大衆が考えるであろうと予測する評価である場合もある。ここで「各評価者が一般大衆の評価であると予想する評価である」場合は、前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する構成と相性が良い。なぜなら、前記大衆評価を精度高く予測した前記応募者が前記懸賞を得るという応募者へのインセンティブが提供可能であるからである。「精度」は各評価をポイント化してその数値に応じてコンピュータ処理される。「精度の高さ」の程度は、最もポイントが高かったものであってもよいし、上位にあるものであってもよい。上位とは、限定はされないが、1位、2位、3位、4位、5位、10位、20位、50位、100位、500位、1000位、10000位以上であってもよい。上記順位の任意の2つの間である場合もある。従って、このようなインセンティブを提供することによって評価の質と数の向上に寄与するという顕著な効果を奏する。
【0052】
最頻の評価結果に係る「統計処理」の内容は、任意であり、限定はされないが、以下のように計算する場合もある。
【0053】
例えば、評価がグレードや年齢層である場合は、複数の応募者の評価の最頻であるグレードや年齢層と同じであった評価を1ポイントとして、各対象画像等について保存し、その合計点数が一番高かったまたは高い順に懸賞を得るようにしてもよい。任意ではあるが、最頻値でない評価をした各対象画像については-0.1等のネガティブポイントを付してもよい。また、任意ではあるが、評価した各対象画像の個数についても0.01ポイントを付すような計算式にしてもよい。例えば以下の式で計算することもできる。
【0054】
式I:
評価得点=(最頻の評価の個数)×1ポイント-(最頻でない評価の個数)×(-0.1ポイント)+(評価した対象の個数)×0.01ポイント
【0055】
最頻の評価結果が複数ある場合は、その各評価に1ポイント付してもよいし、傾斜配分(例、2つの評価が最頻値である場合には0.5ポイントずつに)してもよい。
【0056】
掛け算する各ポイントの重み(例、1ポイント、-0.1ポイント、0.01ポイント)は任意であり、特に限定はされない。
【0057】
このような評価の統計処理により、前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理工程の実行性が向上するという顕著な効果を奏する。
【0058】
(III)前記最頻の評価結果をデータベースに保存する保存工程と前記最頻の評価結果を大衆評価としてデータベースに登録する登録工程(S300:大衆評価保存と登録)
前記最頻の評価結果を大衆評価としてデータベースに登録する。登録工程は上記したコンピュータのハードウエアとソフトウエア資源を利用して通常データをデータベースに登録保存する方法が使用可能である。
【0059】
好ましくは、得られた評価結果をAIモデルの教師データとして使用する。これによりAIモデルのトレーニングが可能となり有用な大衆評価情報を提供することができるようになるという優れた効果がある。
【0060】
なお、本明細書中に記載される方法の工程での処理の順番は特に限定されない。例えば、S100:対象評価入力送信、S200:評価統計処理、およびS300:大衆評価登録は繰り返して行われる場合もあり、S100および/またはS200だけを繰り返す場合もあり、中間的または最終的にS300を行う場合もあるが特に限定はされない。
【0061】
実施形態2:データ生成システムまたは装置
実施形態2は、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理部と、
前記最頻の評価結果をデータベースに保存する保存部と、を含むデータ生成システムまたは装置である。
【0062】
本観点の大衆評価データ生成システムまたは装置では、第一の観点の(1)~(9)の方法を実行するシステムまたは装置が提供される。本システムまたは装置はアプリとして実施される場合があり、好ましくはWebアプリまたは(スマートフォンやタブレット上の)ネーティブアプリである。さらに好ましくはWebアプリとして実施される。
【0063】
大衆評価データ生成装置は、送信部10(
図1)と、処理部30と、保存部40と、データべース20と50を備えるが、これ以外の機能部を有していてもよい。本装置により効率的に大衆評価データが生成される。具体的には、送信部10は、コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベース20に送信する。処理部30が前記評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を実行する。そして、保存部40が前記最頻の評価結果をデータベース20および/または50に保存する。
【0064】
(1)~(9)の方法と(10)のシステムまたは(11)の装置は実施例1により実際にデプロイ可能なことが実証された。
【0065】
実施形態2のデータ生成システムまたは装置では、各部分(例、保存部、データベース、処理部、保存部)は同じクラウドまたはデバイス上等にあってもよいし、なくてもよい。実施形態1の方法で特定される要素や好ましい態様が同等に適用され顕著な効果を生じる。
【0066】
実施形態3:AIモデル訓練方法
実施形態3では、
AIモデル訓練方法であって、
(1)~(11)のいずれか一項の方法、システム、または装置によって生成された前記最頻の評価結果のデータを利用して、前記対象に対する大衆評価予測AIモデルを訓練する工程、を含むAIモデル訓練方法が提供される。
【0067】
(IV)(1)~(11)の方法、システム、または装置によって生成された前記最頻の評価結果のデータを利用して、前記対象に対する大衆評価予測AIモデルを訓練する工程(S400:AIモデル訓練)
上記のようにして、「大衆評価」を質高く効率的に大量に集めることが可能になる。そして、各対象に対する大衆評価を用いて「各対象に対する大衆評価予測AIモデル」を訓練する。
【0068】
AIモデルの例には、限定はされないが、機械学習モデル、ディープラーニングモデル等が挙げられる。教師あり学習の機械学習の例には、線形回帰、ロジスティック回帰、サポートベクターマシン(SVM: Support Vector Machine)、決定木、ニューラルネットワーク(NN: Neural Network)、ナイーブベイズ等が挙げられる。決定木では、ランダムフォレストやXGBoostといったブースティングを使ったモデルも利用可能である。
【0069】
ニューラルネットワークの例には、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、GAN(Generative Adversarial Networks)等が挙げられる。これらディープラーニングモデルも、上記工程で得られた「対象に対する大衆評価」を利用して訓練できるものであれば、特に限定はされず、任意のものが利用訓練可能である。
【0070】
訓練は、好ましくは別のクラウドまたはオンプレミス環境で実行する。クラウド環境の例には、Google ColaboratoryやAWS上のGPU付EC2インスタンスまたはSageMakerが挙げられる。訓練にはGPU、TPU、CPUが利用できるが、限定はされない。機械学習ではScikit-learnが使用できる。また、ディープラーニングフレームワークとして、TensorFlow、Keras、Pytorch、MXNet、Caffe等が使用可能である。
【0071】
第3実施形態の訓練部は別のクラウドVPCやデバイス上に配置されるのが好ましい。例えば、Google ColaboratoryやAWS上のGPU付EC2インスタンスまたはSageMakerを用いて訓練可能である。
【0072】
実施形態3の訓練方法では、好ましくは、前記複数人の特性別に前記大衆評価予測AIモデルを訓練し、さらに好ましくは、前記特性は性別および/または年齢層である。これにより、大衆評価予測AIモデルを大衆の特性により、使用者がより興味を有するグループの思う評価を予測できるという優れた効果を奏する。
【0073】
また、(1)~(11)の方法、システム、または装置を実行/配備する環境と(12)~(14)の訓練方法を実行する環境は同じでもよいし、異なっていてもよい。好ましくは、異なる環境で実行/配備される。
【0074】
訓練は、実施形態1または2で得られた大衆評価データをゼロから使用してトレーニングを実施してもよいし、転移学習を用いてもよい。転移学習では、モデルを時系列に沿ったデータで再度トレーニングして学習効率を高める効果がある。
【0075】
実施形態4:学習済み大衆評価予測AIモデル
実施形態4は、
対象のデータを入力する入力層と、
ニューラルネットワークからなり入力データを処理する中間層と、
前記対象に対する大衆評価を出力する出力層と、を含み、
(12)~(14)のいずれか一項に記載の方法により訓練された学習済み大衆評価予測AIモデル、である。
【0076】
大衆評価予測AIモデルは、好ましくは、機械学習モデルであり、さらに好ましくは、ディープラーニングモデルである。上記した任意の機械学習モデルおよび/またはディープラーニングモデル等が使用可能である。
【0077】
AIモデルは、入力層と、中間層と、出力層を含むが、他の(一又は複数の)層を含んでもよい。
【0078】
入力層には、画像データを入力してもよいし、テキストデータを入力してもよいし、これらを組み合わせた複合的データを入力してもよい。複数の特徴量をデータとして入力することもできる。カテゴリー変数は、One-Hotエンコーディングを用いてデータ化してもよい。
【0079】
中間層(隠れ層)は、入力層から入力されたデータを処理する層である。中間層の数は限定されず、任意の数の中間層が配置される。畳み込みニューラルネットワーク(CNN)、プーリング層、全結合層、ドロップアウト層等の層が任意の数で任意の組み合わせで使用可能である。
【0080】
出力層は、値を回帰してもよいし、カテゴリーを分類してもよい。複数の出力を持つことも可能である。
【0081】
好ましくは、前記複数応募者の特性別に前記大衆評価予測AIモデルを訓練する、さらに好ましくは、前記特性が性別および/または年齢層であることにより、大衆評価予測AIモデルの多様性と特異性がさらに高まる。
【0082】
好ましくは、前記対象のデータは肌画像であり、前記大衆評価は肌年齢である。
【0083】
(1)~(11)の効率的なデータ生成方法、システム、または装置で大衆評価データが得られた場合に、前記大衆評価予測AIモデルが実際に訓練出来て、精度高く予想するモデルが実際に得られることは、実施例2により実証される。教師データに実年齢を使用した場合に、Xceptionモデルを基礎モデルとして画像認識ディープラーニングモデルを構築した一例では、得られた評価ロス(年齢)は4.69歳であった。これにより、本願の(1)~(7)に記載の方法や装置により大衆評価データが得られる場合に、実際のAIモデルが構築可能であることが実証された。
【0084】
実施形態5~7:大衆評価予測AIシステム、プログラム、またはコンピューティングデバイス
実施形態5~7は、
(15)に記載の学習済み大衆評価予測AIモデルと、
ユーザーの有する対象のデータを入力する入力部と、
前記対象のデータに対する大衆評価を予測する予測部と、
前記予測をユーザーに表示する出力部と、を含む大衆評価予測AIシステム、プログラム、またはコンピューティングデバイスである。
【0085】
好ましくは、大衆評価予測AIシステムはアプリの形で提供される。前記アプリはWebアプリでもよいし、ネーティブアプリでもよい。AIモデル、入力部、予測部、出力部は同じシステム内にあってもよいし、各々独立して別のシステムにあってもよい。
【0086】
学習済み大衆評価予測AIモデルや予測部は、前記アプリの内部から提供されてもよいし、API(Application Programming Interface)として外部から提供されていてもよい。前記APIは、好ましくはREST(REpresentational State Transfer)ful APIである。モデルは、予測部で使用される。
【0087】
本発明のプログラムは、本発明の方法およびモデルを実施できる限り、プログラム全体または部分を含む。その言語の例には、特に限定はされないが、Python,Java,Kotlin,Flutter,Swift,C,C#,C++,PHP,Ruby,JavaScript,Scala,Go,R,Perl,Unity,COBOL等が含まれる。
【0088】
コンピューティングデバイスの例には、特に限定はされないが、RAM、ROM、キ
ャッシュ、SSD、ハードディスクが含まれる。また、クラウド上のもの、サーバー上のもの、オンプレミスのコンピュータ上のもの等の任意の形態のコンピューティングデバイスが含まれる。
【0089】
大衆評価予測AIシステムがネーティブアプリの形でスマートフォンやタブレットで提供される場合は、Swift、Java、Kotlin、Flutter等の言語を用いてもよい。
【0090】
(V)ユーザーの有する対象のデータを入力する入力部(S500:ユーザーデータ入力)
「ユーザーの有する対象」は、実施形態1で使用した「対象」と同じであるか代替可能なものである。対象は、上記したように、画像データであっても、概念データであってもよい。例えば、実施形態1で使用した対象が「顔・肌画像」である場合は、ユーザーの有する自己または他人の「顔・肌画像」である。
【0091】
入力には、例えば、スマートフォンやカメラで撮った画像データを用いることができる。入力部は、スマートフォン上のアプリ内の物であってもよいし、ウェブサイト上にデータをアップロードするのに使用されるものであってもよい。ネーティブアプリの場合は、例えば、Swift,Java,Kotlin,Flutterを使用して処理が実行される。Web上に入力する場合は、フロントエンドは、限定はされないが、HTMLやCSS、JavaScriptで構成される。また、フロントエンドフレームワークを用いる場合もあり、その例には、React、Veu.js、Angular、Ember.js、Backbone.js等が含まれる。サーバーサイドと連携して処理したり、データベースに保持したりするために、バックエンドのフレームワーク(例、Django、Laravel、Ruby on Rails、Flask、Node.js)を利用する。
【0092】
(VI)前記対象のデータに対する大衆評価を予測する予測部(S600:大衆評価予測)
予測部は上記(1)実施形態1に記載の方法により訓練された大衆評価予測AIモデルを使用する。予測はトレーニングに使用したと同じ機械学習モデル/フレームワーク(例、線形回帰、ロジスティック回帰、サポートベクターマシン(SVM:Support Vector Machine)、決定木、ニューラルネットワーク(NN:Neural Network)、ナイーブベイズ、TensorFlow、Keras、Pytorch、MXNet、Caffe)を用いてもよい。
【0093】
予測部は、上記学習済みモデルを使用し、システム等の内部から提供されてもよいし、API(Application Programming Interface)として外部から提供されていてもよい。前記APIは、好ましくはRESTful APIである。
【0094】
(7)前記予測をユーザーに表示する出力部(S700:予測結果出力)
前記予想をユーザーに表示する出力部は、スマートフォン上のアプリ内のものであってもよいし、ウェブサイト上にデータを表示するのに使用されるものであってもよい。ネーティブアプリの場合は、例えば、Swift,Java,Kotlin,Flutterを使用して処理が実行される。Web上に表示する場合は、フロントエンドは、限定はされないが、HTMLやCSS、JavaScriptで構成される。また、フロントエンドフレームワークを用いる場合もあり、その例には、React、Veu.js、Angular、Ember.js、Backbone.js等が含まれる。サーバーサイドと連携して処理するためにバックエンドのフレームワーク(例、Django、Laravel、Ruby on Rails、Flask、Node.js)を利用する。
【0095】
この大衆評価予測AIシステム、プログラム、またはコンピューティングデバイス(以下、本システムという場合がある)の一実施形態を、「肌年齢予測アプリ」を例にして具体的に説明する。
【0096】
まず、各ユーザーは自身の肌画像をスマートフォンまたはウェブサイトにアップロードして入力する。次に本システムの予測部は、学習済みの肌年齢予測AIモデルを使用してユーザーが入力した肌画像の肌年齢を予測する。そしてその予測肌年齢をスマートフォンやウェブサイト上のスクリーンに出力して表示する。これにより、ユーザーは自分の肌画像が大衆からどのように思われているか(大衆評価)を得ることができる。
【0097】
実施形態8~10:方法、システム、または装置
実施形態8は、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信工程と、
コンピュータが、最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示工程と、
を含む方法を提供する。
【0098】
実施形態9または10は、
コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部と、
コンピュータが、最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示部と、
を含むシステムまたは装置を提供する。
【0099】
実施形態8~10は、実施形態1~3の方法、システム、装置を実現する別の実施形態である。ユーザー(応募者)の使用するシステムまたは装置の操作を具体化したものである。まず、コンピュータが、複数人によって入力部に入力された対象の評価結果をデータベースに送信する送信部を備える。これにより、各評価者の評価結果をデータベースに送信し、処理を可能とする。
【0100】
そして、コンピュータが、最頻の評価結果に一致する評価結果を最も多く入力した人の端末に懸賞を獲得したことを表示する表示部を備える。この表示部により各ユーザーは評価結果の最終的結果である懸賞を獲得できたかどうかを知ることができる。
【0101】
具体的に「肌年齢」評価のアプリについて説明する。実施例1にあるように、まず、各ユーザー(応募者、評価者)は、スマートフォン上に表示される評価対象の「肌画像」を見て、選択肢で提供される肌年齢層を入力する。その情報はデータベースに送信されて、複数人の結果が統計処理される。そして、最頻の評価結果に一致する評価結果を最も多く入力した人がコンピュータ処理により決定される。その後、コンピュータはその人がサイトにアクセスした場合や、メールを送信することにより、懸賞を付与されたことを通知(表示)する。あるいは、プッシュ通知等により、ユーザーのスマートフォン上にメッセージを通知して懸賞を付与されたことを知らせることもできる。これにより、最頻の評価結果に一致する評価結果を最も多く入力した人は自身が懸賞を得たことを知ることができる。
【0102】
本明細書中で「A~B」という記載は、AおよびBを含む。また、本発明に係る工程等について各実施形態で説明したが、これらの記載に限定されるものではなく、種々の変更を行うことができる。
【0103】
さらに、本発明の方法で実施される工程や装置等の各部を実行する順序は限定されない。
【0104】
以下、実施例を参照して本発明をさらに詳細に説明するが、本発明は以下の実施例に限定はされない。
【実施例】
【0105】
実施例1:肌年齢当てコンテストWebアプリケーション
実施形態1の大衆評価予測AIモデル訓練方法の上記工程(1)~(3)(
図2のS100~S300)の部分が実行可能なことを示す実施例として、Djangoフレームワークを使用して肌年齢当てコンテストWebアプリケーション(以下、「本アプリ」という場合がある)を作成した。本アプリは、Dockerのイメージとして保存した。WebサーバーのNginX,uwsgi等も使用可能である。例えば、Django、NginX、MySQLのDockerイメージを使用して、Docker-composeまたはKubernetesでオーケストレーションしてデプロイし、オンプレミスのコンピュータ上またはクラウド上でも動作させることができる。実施例1は、非公開の環境でオンプレミスのコンピュータ上で本アプリをDockerイメージ由来のコンテナを使用して実行した結果である。フロントエンドはHTML、CSS、SCSS、JavaScriptとそのライブラリーやBootstrapを使用して作成した。バックエンドはPythonベースのDjangoフレームワークで作成した。
【0106】
図3Aはランディングページの上部であり、「肌年齢当てコンテスト」のサイトであることを表示している。また、「肌年齢当て」「コンテスト」「懸賞金」等のキーワードはHTMLのヘッダ部分でGoogle等の検索にヒットしやすいように工夫した。
【0107】
図3Bは、ユーザー登録画面で応募者がコンテストにエントリーするためにその特性(属性)を入力できるようにした。登録にはメールアドレスが必須で、特性としては応募者の性別と年齢層(例、10代、20代、30代、40代、50代、60代、70代以上)を入力させる設定にした。登録は、Djangoのdjango-allauthを利用してユーザー登録とログイン認証等をできるようにした。メールアドレスは重複や間違いが無いようにallauthのメール確認機能を使用した。
【0108】
図3Cは、肌年齢を対象画像(53枚の肌画像)とした(左写真)、肌年齢の予測(一般大衆が考えると予想する肌年齢層)を年齢層の選択肢(10代、20代、30代、40代、50代、60代、70代以上)から選び、「エントリー」ボタンで各応募者(6名)の評価結果を本アプリに入力させた(工程S100)。
【0109】
その結果についてバックエンドのDjangoで以下の統計処理(工程S200)を実行した。
【0110】
図4Aは、スタッフによる解析画面のダッシュボードである。このダッシュボードに年間、月間、または週間の評価数の推移がグラフ表示される。また、各評価者の評価のポイントを、評価した上記肌年齢層の最頻値に従って上記式Iを用いて計算した。各評価者のポイントを上位からリストとして表示した。
【0111】
図4Bは、各肌画像(対象)に関する複数評価者の肌年齢の評価をドーナツチャートとバーグラフで表示し、評価の分布と最頻値となる肌年齢層を示す図である。この画像では20代が最頻値となっている。この処理を全ての対象画像で実行した。そして、その最頻値の評価は、大衆評価としてデータベース(MySQL)に登録した(工程S300)。その大衆評価に基づき各評価者のポイントを上記のように式Iを用いて計算した。
【0112】
図4Cは、得られたポイントの上位から各評価者をリスト表示した評価者リストである。このように定期的にスタッフは解析処理を行うためにダッシュボードを表示して、各評価者のポイントを逐次再計算する。そして、コンテストの終了時に最終的にポイント解析処理を実行し、各評価者の順位を決定する。
【0113】
より一般大衆が予想する評価を正しくし、その評価数を増やすために上記式Iのポイント計算を利用し、高ポイントの応募者にAmazonギフト券での現金等価である電子マネーを懸賞とする。
【0114】
実施例2:顔/肌年齢推定AIモデルの訓練
UTKFace(https://paperswithcode.com/dataset/utkface)の顔画像と実年齢のセットとなったデータセットを用いて、顔/肌年齢推定AIモデルの訓練(学習)を行った。ディープラーニングフレームワークKerasとTensorflowをGoogle Colaboratory上で使用して訓練と予測を実行した。データは訓練用、バリデーション用、テスト用にそれぞれ分けて使用した。使用したのは3種類の既存の画像認識モデルXception(Kerasの公式サイトから利用可能;参考:https://qiita.com/ha9kberry/items/314afb56ee7484c53e6f)、EfficientNetB4(Kerasの公式サイトから利用可能;参考:https://www.acceluniverse.com/blog/developers/2020/03/pythonefficientnet-multi-outpu.html)、EfficientNetV2_M(https://giters.com/GdoongMathew/EfficientNetV2)であり、重み(pre-trained weights)としてimagenet(Kerasの公式サイトから利用可能)とimagenet21k-ft1kを用いた。それぞれのモデルの出力を、最終的には全結合層(Dense(1))として予想年齢を回帰させた。結果を表1に示す。
【表1】
【0115】
Xceptionモデルのトレーニング層を108層までと全層にし、100エポックトレーニングした場合、テスト用データの評価ロスは5.43から4.69まで改善した。この際にはEarly Stoppingをcallbacksに入れて評価が一定エポック改善しない場合は訓練を中止した。エポックを5、10、100として訓練した場合は、それぞれ評価ロスは12.07、4.78、nanとなった。nanとなり途中で止まってしまった場合の評価ロスとバリデーションロスを
図5Aのグラフに示す。10エポック以降バリデーションロスの減少がとまり、過学習が起こっていることが分かる。EarlyStoppingさせたXceptionのモデルを使った実際の年齢と予想年齢の画像解析結果を
図5Bに示す。
図5BのTrueが実年齢を示し、Predが予測年齢を示す。評価ロスと対応するようにある程度の精度で年齢を予測するモデルがトレーニングの結果学習できたことを実証する。
【0116】
モデルをEfficientNetB4とEfficientNetV2_Mに変えて、表1の条件で再度トレーニングを実行した。評価ロスは重みにimagenetを用いた場合それぞれ2.05と2.38になった。これは、モデルにより評価ロスが異なることを示しているが、年齢予想AIモデルがリーズナブルにトレーニングできたことを示す。さらに、重みをimagenet21k-ft1k(https://giters.com/GdoongMathew/EfficientNetV2)にしたところ、100エポックの学習では評価ロスは12.44であり、1000エポックの学習では評価ロスは2.20になった。これは同じモデルでも、初期に与える重みが異なると学習効率が異なることを示している。1000エポック学習後の評価ロスは2.20であることからimagenetの重みを使って100エポック学習した評価ロスと同等な値が学習条件を変えることで達成できたことを示す。これらの結果から年齢データ(本実施例では実際の年齢、本発明の一実施形態では大衆評価顔/肌年齢)が与えられれば、既存の画像認識モデルを利用して予測年齢をある程度の精度で予測できることが分かった、本発明の対象のデータ(好ましくは画像データ)があれば、このようなモデルをいくつかの条件を変えてトレーニングすることにより大衆評価AIモデルが得られる蓋然性が高いことを実証した。
【産業上の利用可能性】
【0117】
本発明の方法、装置、モデル、システム、プログラム、またはコンピューティングデバイスは、大衆評価データを生成したり、それを利用したりして、限定はされないが、各種の大衆評価アプリケーションを実施するのに有用である。
【要約】 (修正有)
【課題】対象に対する大衆評価データを生成して、そのデータを利用して大衆評価AIモデルを訓練し、ユーザーが対象に対する大衆評価の予測結果を得るデータ生成方法、システムまたは装置、大衆評価予測AIモデル訓練方法、学習済みモデル、大衆評価予測AIシステム、プログラム及びコンピューティングデバイスを提供する。
【解決手段】データを生成するデータ生成システムまたは装置は、複数人によって入力部に入力された対象の評価結果をデータベース20に送信する送信部10と、評価結果のうち、前記複数人の各人の評価結果を比較したときに最も多く一致した評価結果を最頻の評価結果として特定する処理を行う処理部30と、最頻の評価結果をデータベース50に保存する保存部40と、を含む。
【選択図】
図1