IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

<>
  • 特開-情報処理装置およびその制御方法 図1
  • 特開-情報処理装置およびその制御方法 図2
  • 特開-情報処理装置およびその制御方法 図3
  • 特開-情報処理装置およびその制御方法 図4
  • 特開-情報処理装置およびその制御方法 図5
  • 特開-情報処理装置およびその制御方法 図6
  • 特開-情報処理装置およびその制御方法 図7
  • 特開-情報処理装置およびその制御方法 図8
  • 特開-情報処理装置およびその制御方法 図9
  • 特開-情報処理装置およびその制御方法 図10
  • 特開-情報処理装置およびその制御方法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025139757
(43)【公開日】2025-09-29
(54)【発明の名称】情報処理装置およびその制御方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20250919BHJP
   G06Q 50/10 20120101ALI20250919BHJP
【FI】
G06N20/00
G06Q50/10
【審査請求】有
【請求項の数】16
【出願形態】OL
(21)【出願番号】P 2024038768
(22)【出願日】2024-03-13
(71)【出願人】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】添田 雄二郎
【テーマコード(参考)】
5L050
【Fターム(参考)】
5L050CC12
(57)【要約】
【課題】学習モデルの公開を制御する。
【解決手段】モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置は、複数の学習モデルそれぞれについて、学習モデルの学習履歴に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を管理する管理手段と、第1の情報と第2の情報の両方に基づいてモデル公開プラットフォームにおける複数の学習モデルそれぞれの公開範囲を決定する決定手段と、を備える。
【選択図】図7
【特許請求の範囲】
【請求項1】
モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置であって、
前記複数の学習モデルそれぞれについて、学習モデルの学習履歴に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を管理する管理手段と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記第1の情報は、学習モデルの学習で使用されたデータセットに関する情報を含み、
前記決定手段は、前記複数の学習モデルそれぞれの学習において特定のデータが使用されているか否かを示す公開基準情報を前記第1の情報に基づいて決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記特定のデータの指定を前記モデル公開プラットフォームの管理者から受け付ける受付手段をさらに備える
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記特定のデータは、倫理的および/または法的に使用が制限されたデータであり、
前記決定手段は、前記特定のデータが使用されている場合に前記公開基準情報として、公開範囲を狭くする限定公開または公開を禁止する非公開を決定し、前記特定のデータが使用されていない場合に前記公開基準情報として、公開範囲の制限を設けない全公開を決定する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記決定手段は、学習モデルの作成に使用された前記第2の情報により特定されるベースモデルに対して前記限定公開または前記非公開と決定されていた場合、該学習モデルに対して前記限定公開または前記非公開と決定する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記モデル公開プラットフォームの管理者により指定されたモデル性能を注目学習モデルが有するか否かを検証する検証手段をさらに備え、
前記決定手段は、前記モデル性能を有する前記注目学習モデルに対して公開範囲を狭くする限定公開または公開を禁止する非公開を決定する
ことを特徴とする請求項2記載の情報処理装置。
【請求項7】
前記決定手段は、注目学習モデルの学習履歴と該注目学習モデルの作成に使用された前記第2の情報により特定されるベースモデルの学習履歴との差分を示す公開基準情報を前記第1の情報に基づいて決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記第1の情報は、学習モデルの学習で使用されたデータセットおよび学習パラメータ、および学習回数を含み、
前記決定手段は、前記注目学習モデルの学習で使用されたデータセットおよび学習パラメータと前記ベースモデルの学習で使用されたデータセットおよび学習パラメータとの差分が所定割合未満であり且つ前記注目学習モデルの学習回数が所定回数未満の場合、前記注目学習モデルに対して公開範囲を狭くする限定公開または公開を禁止する非公開を決定する
ことを特徴とする請求項7に記載の情報処理装置。
【請求項9】
前記決定手段は、学習モデルの作成に使用されたベースモデルに対して前記限定公開または前記非公開と決定されていた場合、該学習モデルに対して前記限定公開または前記非公開と決定する
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記第1の情報は、所与のデータセットに対する学習モデルによる検出結果を含み、
前記決定手段は、注目学習モデルによる検出結果と該注目学習モデルの作成に使用された前記第2の情報により特定されるベースモデルによる検出結果とのIoU(Intersection over Union)を前記注目学習モデルの公開基準情報として決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項11】
前記第1の情報は、それぞれの学習モデルを構成するニューラルネットワーク(NN)の重みを含み、
前記決定手段は、注目学習モデルを構成するNNの重みと該注目学習モデルの作成に使用された前記第2の情報により特定されるベースモデルを構成するNNの重みとの差分の絶対値の総和を前記注目学習モデルの公開基準情報として決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項12】
前記第1の情報は、それぞれの学習モデルの学習時における学習パラメータの学習率と損失の時系列データとを含み、
前記決定手段は、注目学習モデルの前記学習率と前記時系列データとに基づいて算出される学習進捗度を前記注目学習モデルの公開基準情報として決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項13】
モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置であって、
前記複数の学習モデルは、画像から物体検出を行うための物体検出モデルであり、
前記情報処理装置は、
前記モデル公開プラットフォームの管理者により指定されたキーワードと該キーワードに対する正解画像とを関連付けて登録する登録手段と、
前記複数の学習モデルそれぞれについて、学習モデルに前記キーワードを入力して生成される生成画像と前記正解画像との類似度に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を管理する管理手段と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定手段と、
を備えることを特徴とする情報処理装置。
【請求項14】
前記モデル公開プラットフォームの管理者の操作する管理者端末に表示される管理画面を生成する画面生成手段をさらに備え、
前記管理画面は、前記第2の情報に基づいて前記複数の学習モデル間の派生関係と、前記複数の学習モデルそれぞれの公開状態と、をグラフィカルユーザインタフェース(GUI)として表示するよう構成される
ことを特徴とする請求項1乃至13の何れか1項に記載の情報処理装置。
【請求項15】
モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置の制御方法であって、
前記複数の学習モデルそれぞれについて、学習モデルの学習履歴に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を取得する取得工程と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定工程と、
を含むことを特徴とする制御方法。
【請求項16】
請求項15に記載の制御方法をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習モデルおよび学習データの管理技術に関するものである。
【背景技術】
【0002】
近年、機械学習を用いた人工知能(AI)技術が著しい発展を遂げ、画像認識や自動翻訳を含む様々な製品やサービスに応用されている。直近では、生成系AIと呼ばれる、ユーザの入力に基づいて文章や画像等のコンテンツを生成するAIも登場しており注目を集めている。
【0003】
それらのAI技術の多くは、企業や研究機関等が作成した学習モデル(学習済モデル)によって実現されている。ただし、今後は、一般ユーザが自身の用途に合わせて機械学習を実施し、学習モデルを作成することが定着すると考えられる。また、それに合わせて、一般ユーザによる機械学習の実施や学習モデルの公開等が、インターネット経由のサービスを介して普及すると考えられる。ここではそのようなサービスを「学習モデル公開プラットフォーム」と呼称する。
【0004】
学習モデル公開プラットフォームにおいては、他のユーザが公開した学習モデルをダウンロードして利用することができる。そのとき、ダウンロード手数料の一部を報酬としてモデル作成者に支払うことで、ユーザによるプラットフォーム上でのモデル作成を活性化させることも想定される。モデル作成においては、他のユーザが公開した学習モデルを初期モデルとして利用し、自身の用途に合わせて追加学習を行い、得られた学習モデルを公開するといったことが想定される。ただし、公開される学習モデル及び学習で利用されるデータは、倫理を遵守したものであり、著作権や肖像権を侵害していないものである必要がある。
【0005】
特許文献1は、機械学習開始時に学習条件からAI倫理判定を実施し、AI倫理を順守していると判定された場合のみ学習を実行することで、AI倫理を順守した学習モデルの作成を可能とする技術を開示している。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2023-64636号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、学習モデルが満たすべきAI倫理の規約は改定される場合がある。特許文献1に記載の技術では、学習モデルの学習時にその時点での規約を守っていたとしても、規約改定後に作成された学習モデルが規約改定後のAI倫理を遵守していることは担保されない。
【0008】
そのため、特許文献1に記載の技術にしたがって作成された学習モデルを学習モデル公開プラットフォームにおいて公開した後にも問題が生じ得る。すなわち、公開していた学習モデルに加え当該学習モデルを初期モデルとして追加学習し作成された派生モデルも規約改定後のAI倫理を満足していない可能性がある。また、学習モデル公開プラットフォームにおいては、追加学習が不足した派生モデル(初期モデルと実質的に差が無い派生モデル)が公開されるおそれがある。よって、学習モデルの公開だけでなく派生モデルの公開も管理し制御することが課題となっている。
【0009】
本発明は、このような問題に鑑みてなされたものであり、学習モデルの公開を適切に制御する技術を提供することを目的としている。
【課題を解決するための手段】
【0010】
上述の問題点を解決するため、本発明に係る情報処理装置は以下の構成を備える。すなわち、モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置は、
前記複数の学習モデルそれぞれについて、学習モデルの学習履歴に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を管理する管理手段と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定手段と、
を備える。
【発明の効果】
【0011】
本発明によれば、学習モデルの公開を適切に制御する技術を提供することができる。
【図面の簡単な説明】
【0012】
図1】情報処理装置の機能構成を示すブロック図である。
図2】モデルに付与される情報の例を示す図である。
図3】学習データの例を示す図である。
図4】データに付与される情報の例を示す図である。
図5】トレーサビリティ情報の例を示す図である。
図6】公開基準情報の例を示す図である。
図7】情報処理装置における処理のフローチャートである(第1実施形態)。
図8】情報処理装置における処理のフローチャートである(第2実施形態)。
図9】情報処理装置における処理のフローチャートである(第3実施形態)。
図10】情報処理装置における処理のフローチャートである(変形例)。
図11】トレーサビリティ情報の管理画面の例を示す図である。
【発明を実施するための形態】
【0013】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0014】
(第1実施形態)
本発明に係る情報処理装置の第1実施形態として、学習モデルの公開範囲を制御する情報処理装置を例に挙げて以下に説明する。特に、学習データに、倫理的もしくは法的(著作権、肖像権的)に不備のある画像が含まれていた場合に、学習モデルの公開範囲を狭くする(限定公開)または公開を禁止(非公開)する例について説明する。
【0015】
<概要>
本実施形態の情報処理装置は、学習モデル(学習済モデル)の学習に使用したデータに関する情報(学習データID)を、当該学習モデルと関連付けて管理する。また、学習モデルが派生モデルである場合には、使用したベースモデル(初期モデル)に関する情報(初期モデルID)を、当該学習モデルと関連付けて管理する。そして、情報処理装置は、複数の学習モデルにおけるそれぞれの初期モデルIDおよび学習データIDに基づいてトレーサビリティ情報(学習モデルの過去の履歴)を管理し、それぞれの学習モデルの公開範囲をトレーサビリティ情報に基づいて制御する。
【0016】
<用語>
「倫理的に不備のある画像」とは、例えば、暴力や差別を示唆する画像や、性的描写のある画像である。また、「著作権的、肖像権的に不備のある画像」とは、著作権や肖像権を侵害している画像である。例えば、権利者が画像の複製や機械学習等広く公への利用を認めていない画像である。例えば、芸能事務所が公開している所属芸能人の写真やアニメーションのキャラクター画像等がこれに当たる。以下の説明では、「倫理的に不備のある画像」および「著作権的、肖像権的に不備のある画像」を総称して「NG画像」と呼ぶ場合もある。
【0017】
<装置構成>
図1は、情報処理装置11の機能構成を示すブロック図である。情報処理装置11は、「モデル」およびモデルの学習や評価に使用する「データ」を管理する。また、情報処理装置11は、ユーザ(学習モデル公開プラットフォームの利用者)からの要求に応じてモデルの学習やデータの編集を行い、管理者(学習モデル公開プラットフォームの管理者)からの要求に応じてモデル情報の編集(公開判定)を行う。
【0018】
情報処理装置11は、ローカルエリアネットワーク(LAN)やインターネット等の通信ネットワークを介して管理者端末13及びユーザ端末14と通信可能に接続されている。接続のされ方は特に限定されない。例えば、それぞれが別々に、有線で接続されていてもよいし、無線の通信を介して接続されていてもよい。また、図1では、管理者端末とユーザ端末が1台ずつ表記されているがこれに限るものではない。管理者端末13及びユーザ端末14は、パーソナルコンピュータ(PC)、携帯電話、タブレット型端末装置などの情報端末が想定される。
【0019】
情報処理装置11は、制御部10および記憶部12を含む。制御部10は、例えば、中央処理装置(CPU)が記憶部12に格納された各種プログラムを実行することにより実現され得る。また、記憶部12は、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、あるいは、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などの大容量記憶装置である。
【0020】
制御部10は、モデル管理部101、データ管理部102、トレーサビリティ情報管理部103、公開基準情報出力部104、公開判定部105、登録部106、学習・評価部107、表示制御部108、通信制御部109を含む。上述したように、これらの各機能部は、例えばCPUが各種プログラムを実行することにより実現され得る。ただし、一部または全部を特定用途向け集積回路(ASIC)などのハードウェアにより実現してもよい。
【0021】
モデル管理部101は、情報処理装置11に登録されたモデルを管理する。本実施形態において、モデルは、画像から物体検出を行うことを目的とした「物体検出モデル」であることを想定しているが、これに限るものではない。音声認識モデルや自然言語処理モデル、生成系人工知能(AI)モデルであってもよい。
【0022】
図2は、2つのモデルに付与されるモデル情報201,202の例を示す図である。モデル情報は、モデルの属性情報であり、モデルID、ユーザID、初期モデルID、学習データID、タグ、タスク、学習パラメータ、評価データID、評価結果、公開範囲の情報を含んでいる。すなわち、学習履歴である、学習データIDや学習パラメータを含んでいる。
【0023】
モデルIDは、それぞれのモデルを識別するためのモデル固有の識別情報(ID)である。ユーザIDは、それぞれのモデルに対する学習を行ったユーザを識別するためのユーザ固有のIDである。初期モデルIDは、それぞれのモデルを学習する際の初期パラメータとなったモデルを指定するモデルIDである。
【0024】
図2において、モデル情報201では、モデルIDは「m0001」であり、初期モデルIDは「m0000」である。また、モデル情報202では、モデルIDは「m0002」であり、初期モデルIDは「m0001」である。そのため、モデルIDが「m0002」のモデルは、モデルIDが「m0001」のモデルを初期モデルとして学習した結果得られたモデルであるということを示している。
【0025】
学習データIDは、それぞれのモデルを学習するために使用したデータセットを識別するための学習データ固有のIDである。タグは、それぞれのモデルが対象とする物体の情報や、ユーザがモデルを検索するために必要な情報などが記載される。タスクは、それぞれのモデルが対象としている処理の種類(物体検出や画像生成など)が記載される。学習パラメータは、それぞれのモデルの学習時に使用したハイパーパラメータ(学習率や学習回数等)である。評価データIDは、それぞれのモデルを評価する際に使用したデータセットを指定するデータIDである。評価結果は、評価の結果得られた数値などが記載される。公開範囲は、それぞれのモデルの公開範囲(公開が許可された範囲)を示す情報が記載される。例えば、all(全体に公開(全公開))や、非公開、1つ以上のユーザIDが記載される。ユーザIDが記載された場合、記載されたIDを持つユーザのみが当該モデルにアクセス可能となり、それ以外のユーザは当該モデルにアクセス不可能となる。
【0026】
図2に示されるように、モデル情報201,202は、何れも、物体検出モデル用のモデルのモデル情報である。例えば、モデルが他タイプのモデル(音声認識モデル等)の場合、モデル情報に含まれる項目は図2の例とは異なるものとなり得る。
【0027】
データ管理部102は、情報処理装置11に登録されたデータを管理する。本実施形態のデータは、物体検出用の画像データである。
【0028】
図3は、学習データの例を示す図である。学習データは、画像301および真値304を含む。画像301は、ユーザが認識したい被写体(ここでは、人物302と犬303)が映っている画像である。また、物体検出を学習するためには、画像だけでなく、真値としての被写体情報が必要である。被写体情報とは、例えば、画像中の被写体の位置やサイズの情報に対応するBounding Box(BB)情報である。BB305は人物302に対応するBBであり、BB306は犬303に対応するBBである。
【0029】
図4は、データ(画像データセット)に付与されるデータ情報401,402の例を示す図である。データ情報は、データの属性情報であり、データID、ユーザID、タグ、タスク、画像IDの情報を含んでいる。
【0030】
データIDは、それぞれのデータを識別するためのデータ固有のIDである。ユーザIDは、それぞれのデータを作成したユーザを識別するためのユーザ固有のIDである。タグには、それぞれのデータが対象とする物体の情報や、ユーザがデータを検索するために必要な情報などが記載される。タスクは、それぞれのデータが対象としている処理の種類(物体検出や画像生成など)が記載される。画像IDは、データに含まれる1つ以上の画像を識別するための画像固有のIDである。各データには1つ以上の画像IDを含む。
【0031】
図4に示されるように、データ情報401,402は、何れも、物体検出モデル用のモデルに使用されるデータのデータ情報である。例えば、データが他タイプのモデル(音声認識モデル等)に使用されるデータの場合、データ情報に含まれる項目は図4の例とは異なるものとなり得る。
【0032】
データ管理部102は、ユーザからのデータの登録を受け付け、新たにデータセットを登録する。
【0033】
トレーサビリティ情報管理部103は、モデルのトレーサビリティ情報を管理する。ここで、トレーサビリティ情報とは、それぞれモデルが、過去どのような経緯を経て作成されたか(つまりモデルの過去の履歴)を示した情報であり、例えば、モデル情報に基づいて生成される情報である。
【0034】
図5は、トレーサビリティ情報の例を示す図である。図5において、矢印は各モデルの派生関係を示している。例えば、モデル502(モデルIDは「m0002」)は、モデル501(モデルIDは「m0001」)を初期モデルとして、追加学習することにより作成された派生モデルであることを示している。同様に、モデル503はモデル502の派生モデルであり、モデル504はモデル501の派生モデルであることを示している。なお、図5では、モデル501において示される初期モデルIDが「-」と示されているが、これは、当該初期モデルが未学習のモデルであることを示している。
【0035】
このように、トレーサビリティ情報は、それぞれのモデルが過去に編集されてきた記録を示したものであるため、トレーサビリティ情報をたどることによって、当該モデルを作成するために利用された1以上のモデルを特定することが可能となる。例えば、図5に示すトレーサビリティ情報から、モデル502~504は、全てモデル501の派生モデルということができる。さらに、図5の各モデルの学習データIDから各モデルの学習で使用したデータを特定することが出来、モデルとデータの紐づけ関係は図5における点線のように示すことができる。
【0036】
公開基準情報出力部104は、モデルの公開判定の判定基準の1つとして使用される公開基準情報を出力する。詳細は後述するが、公開基準情報は、それぞれのモデルに関して、モデル管理部101から取得したモデル情報とデータ管理部102から取得したデータ情報とに基づいて出力される情報である。
【0037】
図6は、公開基準情報の例を示す図である。例えば、公開基準情報は、それぞれのモデルが、特定の画像(管理者端末13から指定された画像IDを持つ画像)を学習データとして使用しているかを示す情報である。例えば、図5において太字で示す画像ID(「imgAAAA1002」)を有する画像が「NG画像」であり、管理者が管理者端末13を介して当該画像を使用不可画像であると指定したとする。図5から、当該画像を含むデータのデータIDは「d0002」および「d0004」であり、これらのデータを使用するモデルはモデル502とモデル504となる。そのため、公開基準情報は、図6(中央列)に示されるように、モデル501とモデル503に対しては「FALSE」となり、モデル502とモデル504に対しては「TRUE」となる。
【0038】
公開判定部105は、公開基準情報出力部104が出力する公開基準情報(第1の判別結果)とトレーサビリティ情報管理部103が管理するトレーサビリティ情報に基づく判別結果(第2の判別結果)とに基づき、モデルの公開判定を行う。なお、ここでは、図6(右列)に示されるように、トレーサビリティ情報に基づく判別結果は、それぞれのモデルが、「NG画像」を使用して学習されたモデルの派生モデルであるか否かの結果である。例えば、図5を参照すると、モデル503は、モデル502の派生モデルであるため判別結果は「TRUE」となる。
【0039】
そして、公開判定部105は、公開基準情報とトレーサビリティ情報による判別結果に基づき、モデルの公開判定を行う。ここでは、公開基準情報が「TRUE」であるモデル502,504を「非公開」と判定し、公開基準情報が「FALSE」であるがトレーサビリティ情報が「TRUE」であるモデル503を「限定公開(特定の1以上のユーザIDに対する公開)」と判定する。なお、これらの何れにも該当しないモデルは「全公開」と判定する。
【0040】
登録部106は、公開判定部105の判定結果(公開、非公開、限定公開)に基づき、情報処理装置11に登録されている各モデルのモデル情報における公開範囲の値を更新する。
【0041】
学習・評価部107は、情報処理装置11に登録されているモデルやデータに基づいて、モデルの学習や評価を行う。
【0042】
表示制御部108は、管理者端末13及びユーザ端末14からの要求に対する情報処理装置11の結果表示のための制御を行う。例えば、管理者端末13に表示される管理画面(第4実施形態で説明する)の画面生成も行う。通信制御部109は、管理者端末13やユーザ端末との間の情報の送受信を制御する。
【0043】
記憶部12は、上述したCPUが実行する各種プログラムを記憶するほか、モデル、モデル情報、データ、データ情報、トレーサビリティ情報等を記憶する。
【0044】
<装置の動作>
図7は、情報処理装置11における処理のフローチャートである。図7(a)は、モデルを学習し登録する際のフローチャートであり、図7(b)は、モデルの公開範囲を決定/更新する際のフローチャートである。
【0045】
まず、図7(a)を参照し、ユーザがユーザ端末14を操作し、情報処理装置11にデータを登録しモデルを学習する際の処理について説明する。ここでは、新たなデータ(データセット)を登録し、当該データで既に登録されていたモデルの1つを追加学習する状況について説明する。
【0046】
S701では、登録部106は、ユーザ端末14からデータの追加要求を受信すると、データを記憶部12に登録する。登録されたデータには、データ情報401に示されるようなデータ情報が付与されて登録される。データを登録する際には、当該データの公開範囲や、タグ、タスクといった情報を付与することができる。ここでは、ユーザが登録したデータのデータIDを「d0001」とする。
【0047】
S702では、学習・評価部107は、ユーザ端末14から学習実行要求を受信すると、ユーザが登録したデータを用いて、学習を実行する。例えば、ユーザから、モデル(モデルIDは「m0000」)の指定を受け付けて、当該モデルに対してデータ(データIDは「d0001」)を用いて、学習を実行する。なお、モデルIDが「m0000」のモデルは未学習のモデルであり、記憶部12にあらかじめ登録されていることを想定する。
【0048】
物体検出の学習方法に関しては、例えばニューラルネットワーク(NN)を用いた手法が存在する。NNを用いた物体検出の学習方法に関しては、文献Aが詳しい。学習・評価部107は、学習に使用したデータまたは任意のデータを用いて学習されたモデルの評価を行ってもよい。
【0049】
(文献A)Tian et al., "FCOS: Fully Convolutional One-Stage Object Detection", arXiv:1904.01355, 2019年
S703では、登録部106は、ユーザによって学習されたモデルを記憶部12に登録する。モデルを登録する際には、例えば、モデル情報201に示されるようなモデル情報が付与される。なお、ユーザIDは、ユーザ端末14を操作しているユーザのIDである。
【0050】
S704では、トレーサビリティ情報管理部103は、トレーサビリティ情報を更新する。すなわち、図5に示されるように、モデル501(モデルIDは「m0001」)をデータ(データIDは「d0001」)に紐づけて管理する。
【0051】
以上により、ユーザが用意したデータ(データIDは「d0001」)と、当該データによって学習されたモデル501(モデルIDは「m0001」)と、が情報処理装置11に登録される。
【0052】
次に、図7(b)を参照し、モデルの公開範囲を決定/更新する際の処理について説明する。ここでは、管理者が新たにNG画像を指定(登録)した場合の状況について説明する。
【0053】
S711では、登録部106は、管理者端末13からNG画像の登録要求を受付けると、当該NG画像を登録する。例えば、当該NG画像の画像IDを直接受け付けてもよいし、管理者端末13の表示部(不図示)に複数の画像を表示し、NG画像の選択を管理者から受け付けてもよい。ここでは、図5に示される「imgAAAA1002」をNG画像の画像IDとして受け付けて登録する。
【0054】
S712では、データ管理部102は、NG画像の画像IDを含むデータのデータIDを取得する。図5の状況では、「d0002」および「d0004」が取得される。
【0055】
S713では、モデル管理部101は、S712で取得したデータIDを学習データIDに有するモデルIDを取得する。図5の状況では、「m0002」および「m0004」が取得される。
【0056】
S714では、トレーサビリティ情報管理部103は、トレーサビリティ情報を取得する。ここでは、図5に示されるトレーサビリティ情報を取得する。
【0057】
S715では、公開基準情報出力部104は、S713で取得したモデルIDそれぞれに対して公開基準情報を出力する。ここでは、S713で取得したモデルIDに対応するモデル502,504に対して「TRUE」を出力し、他のモデルに対しては「FALSE」を出力する(図6(中央列))。
【0058】
S716では、公開判定部105は、S715で出力した公開基準情報とS714で取得したトレーサビリティ情報とに基づき、記憶部12に記憶されたモデルの公開判定を行う。まず、S714で取得したトレーサビリティ情報に基づいて、各モデルが「NG画像」を使用して学習されたモデルの派生モデルであるか否か(派生モデル情報)を判定する。ここでは、現在注目している注目学習モデルであるモデル503に対して「TRUE」を出力し、他のモデルに対しては「FALSE」を出力する(図6(右列))。そして、それぞれのモデルにおける2つの情報(公開基準情報と派生モデル情報)の両方に基づき、公開判定を行う。
【0059】
S717では、登録部106は、S716における公開判定の結果に基づき各モデルのモデル情報における公開範囲の値の更新を行う。
【0060】
以上説明したとおり第1実施形態によれば、NG画像を学習に使用したモデル及びその派生モデルの公開範囲を効果的に決定することが可能となる。
【0061】
(変形例1-1)
上述した公開判定部105においては、公開基準情報が「FALSE」であり且つ派生モデル情報が「TRUE」であるモデルを限定公開と判定した。ただし、限定公開と判定する前に同モデルのモデル性能検証を実施し、最終的な公開判定結果としてもよい。
【0062】
ここで、モデル性能検証とは、それぞれのモデルが、管理者が指定する性能を有するかどうかの検証である。例えば、モデルが個人認証モデルである場合、管理者端末13で指定した画像に写っている人物(例えば上述のNG画像に含まれる人物)を特定できる性能を有するか否かの検証を行う。
【0063】
そして、公開判定部105は、モデル性能検証の結果が「TRUE」(=人物を特定できる性能を有する)のモデルを「非公開」とし、「FALSE」のモデルを「全公開」または「限定公開」とする。
【0064】
(第2実施形態)
第2実施形態では、学習モデルの公開範囲を制御する他の情報処理装置を例に挙げて以下に説明する。特に、モデルの実行結果により得られる生成画像に基づいて、「限定公開」または「非公開」とする例について説明する。
【0065】
<装置構成>
第2実施形態に係る情報処理装置の機能構成は第1実施形態(図1)と同様であるため詳細な説明は省略する。以下、第1実施形態と動作の異なる機能部に関して主に説明する。また、以下の説明において、モデルは、入力したテキスト情報を基にイラストや写真を生成する「画像生成モデル」とするが、これに限定するものではない。
【0066】
第2実施形態に係る公開基準情報出力部104が出力する公開基準情報は、所与のキーワード(例えば、著作権的に使用不可なアニメーションのキャラクター名)に対する正解画像と生成画像との間の類似度である。ここで、生成画像は、管理者端末13から入力されたキーワードをモデルが実行した際に生成される画像である。なお、キーワードとして、画像に埋め込まれる透かし画像の文字列(ロゴや著作権表示など)を使用してもよい。
【0067】
公開判定部105は、公開基準情報出力部104が出力した公開基準情報とトレーサビリティ情報管理部103が管理するトレーサビリティ情報とに基づき、記憶部12に登録されているモデルに対して公開判定を行う。
【0068】
上述の通り、公開基準情報は、正解画像と生成画像との間の類似度である。そこで、管理者端末13から入力されたキーワードが示す正解画像を予め用意し登録しておく。例えば、入力されたキーワードが「キャラクターA」であった場合、あらかじめキャラクターAの正解画像を用意し登録しておく。
【0069】
そして、公開判定部105に含まれる類似度算出部は、正解画像と生成画像との間の類似度を算出し、類似度が所定閾値を超過した場合、類似度判定を「TRUE」とする。類似度判定が「TRUE」である場合、(登録したNG画像と同一ではないが)学習データに著作権的に使用不可な画像が使用されている可能性が高いことを示している。そこで、公開判定部105は、類似度判定が「TRUE」のモデル及びそのモデルの派生モデルを「非公開」または「限定公開」と判定する。なお、これらの何れにも該当しないモデルは「全公開」と判定する。
【0070】
なお、ここでは、入力されたキーワードの正解画像と生成画像の類似度を判定条件としていたがこれに限るものではない。また、公開判定部105に分類部を設け、生成画像を分類器で処理した分類結果がキーワードと一致するかを判定条件としても良い。
【0071】
<装置の動作>
第2実施形態に係る情報処理装置の処理のうち、モデルを学習し登録する処理は第1実施形態(図7(a))と同様であるため説明は省略する。
【0072】
図8は、第2実施形態におけるモデルの公開範囲を決定/更新する際のフローチャートである。
【0073】
S801では、公開基準情報出力部104は、管理者端末13からキーワードの登録要求を受信すると、当該キーワードを登録する。
【0074】
S802では、公開判定部105は、管理者端末13からS801で登録したキーワードに対応する正解画像の登録要求を受信すると、当該正解画像をキーワードと関連付けて登録する。
【0075】
S803では、トレーサビリティ情報管理部103は、トレーサビリティ情報を取得する。ここでは、図5に示されるトレーサビリティ情報を取得する。なお、第2実施形態では、モデル間の派生情報(図5の矢印)に関してのみ取得するよう構成してもよい。
【0076】
S804では、公開基準情報出力部104は、記憶部12に記憶する公開モデルにS801で登録したキーワードを入力し画像を生成する。そして、キーワードに対する正解画像と生成画像との間の類似度を公開基準情報として出力する。
【0077】
S805では、公開判定部105は、S804で出力した公開基準情報とS803で取得したトレーサビリティ情報とに基づき、記憶部12に記憶されたモデルの公開判定を行う。公開判定部105における公開判定の詳細動作は上述したとおりである。
【0078】
S806では、登録部106は、S805における公開判定の結果に基づき各モデルのモデル情報における公開範囲の値の更新を行う。
【0079】
以上説明したとおり第2実施形態によれば、モデルにNG画像に関するキーワードを入力して得られる生成画像と当該キーワードに対する正解画像との類似度を算出し、類似度に基づいて当該モデル及びその派生モデルの公開範囲を決定する。特に、類似度が所定閾値を超過した場合、モデルの学習においてNG画像と類似の画像が使用された可能性が高いと判定し、当該モデル及びその派生モデルを「非公開」または「限定公開」とする。そのため、登録したNG画像だけでなく当該NG画像と類似の画像を使用したモデル及びその派生モデルの公開範囲を効果的に決定することが可能となる。
【0080】
(第3実施形態)
第3実施形態では、学習モデルの公開範囲を制御する他の情報処理装置を例に挙げて以下に説明する。
【0081】
<概要>
学習モデル公開プラットフォームにおけるモデル公開の課題として、プラットフォーム上で高評価のモデルと実質的に同一性能を有する派生モデルが登録されてしまう場合があることが挙げられる。このような場合、本来は高評価のモデルを作成したユーザに対して支払われるべき報酬が、派生モデルを登録した第三者に支払われてしまうことになる。そのため、高評価のモデルを作成したユーザの公平感・納得感を担保することが求められる。
【0082】
そこで、本実施形態の情報処理装置は、派生モデル(子モデルともいう)を情報処理装置に新規登録した際に、当該派生モデルと初期モデル(親モデルともいう)との間の類似度を確認する。そして、情報処理装置は、派生モデルと初期モデルとの間の類似度が所定閾値より高い場合(初期モデルと実質的に同一の場合)に、派生モデルを「限定公開」または「非公開」とする。
【0083】
<装置構成>
第3実施形態に係る情報処理装置の機能構成は第1実施形態(図1)と同様であるため詳細な説明は省略する。以下、第1実施形態と動作の異なる機能部に関して主に説明する。また、以下の説明において、モデルは、第1実施形態と同様に「物体検出モデル」とするが、これに限定するものではない。
【0084】
第3実施形態のモデル管理部101は、トレーサビリティ情報管理部103が管理するトレーサビリティ情報に基づき、ユーザがユーザ端末14で登録したモデル(子モデル)及びその親モデルのそれぞれのモデル情報を記憶部12から取得する。取得したモデル情報は、公開基準情報出力部104に渡される。
【0085】
公開基準情報出力部104は、親モデルと子モデルのそれぞれのモデル情報から学習履歴(学習データID、学習パラメータ)を取得する。そして、両モデル間で学習データと学習パラメータが同一であるかどうかを判定し、「判定結果」と「子モデルの学習回数」を公開基準情報として出力する。
【0086】
両モデル間の学習データの同一性は、両モデルは学習で使用した学習データの同一性/類似性を判定する。例えば、学習データIDが同一であるかで判定してもよい。また、両モデルそれぞれの学習データに含まれる複数の画像IDの同一性/類似性を判定してもよい。例えば、子モデルの学習データに含まれる複数の画像IDと親モデルの学習データに含まれる複数の画像IDとが所定割合以上(例えば99%以上)重複する場合(差分が所定割合未満の場合)に、両モデルのデータを実質同一とみなしてもよい。
【0087】
また、両モデル間の学習パラメータの同一性は、学習回数を除く学習パラメータを比較し判定する。例えば、モデル性能に影響しない学習パラメータ(学習過程のログデータの保存先等)のみが異なっている場合は、両モデルの学習パラメータは同一とみなしてもよい。
【0088】
公開判定部105は、公開基準情報出力部104が出力した公開基準情報に基づいて、子モデルに対する公開判定を行う。例えば、親モデルと子モデルの学習データと学習パラメータの同一性の判定結果が「TRUE」であり且つ子モデルの学習回数が所定回数未満である場合、子モデルを「非公開」とする。すなわち、この場合には、子モデルは親モデルからほとんど学習が進んでおらず、両モデルは略同一とみなすことができるためである。
【0089】
<装置の動作>
図9は、第3実施形態に係る情報処理装置11における処理のフローチャートである。図9(a)は、モデルを学習し登録する際のフローチャートであり、図9(b)は、モデルの公開範囲を決定/更新する際のフローチャートである。
【0090】
まず、図9(a)を参照し、ユーザがユーザ端末14を操作し、情報処理装置11にデータを登録しモデルを学習する際の処理について説明する。S901~S904は、第1実施形態(図7(a))のS701~S704の同様の処理であるため説明は省略する。
【0091】
S905では、公開判定部105は、図9(b)に示されるモデルの公開判定処理を実行する。すなわち、モデルの登録時に併せて公開判定を行う。これにより、不適切なモデル(親モデルと実質的に同一な子モデル)が公開されてしまうことを防止することができる。
【0092】
S911では、モデル管理部101は、トレーサビリティ情報管理部103からトレーサビリティ情報を取得する。
【0093】
S912では、モデル管理部101は、取得したトレーサビリティ情報から、S903で登録したモデル(子モデル)とその初期モデル(親モデル)のモデル情報を取得する。取得したモデル情報は、公開基準情報出力部104に渡される。
【0094】
S913では、公開基準情報出力部104は、親モデルと子モデルのそれぞれのモデル情報から学習データID、学習パラメータを取得する。そして、両モデルの学習データの同一性の「判定結果」と「子モデルの学習回数」を公開基準情報として出力する。
【0095】
S914では、公開判定部105は、公開基準情報に基づき、子モデルの公開判定を行う。公開判定部105における公開判定の詳細動作は上述したとおりである。
【0096】
S915では、登録部106は、S914における公開判定の結果に基づき子モデルのモデル情報における公開範囲の値の更新を行う。
【0097】
なお、上述の説明では、モデルの新規登録の際に登録モデルの公開判定を併せて実施しているがこれに限るものではない。例えば、任意のタイミングで管理者端末13により任意のモデルを選択して、図9(b)に示す公開判定処理を実施することもできる。このとき、選択されたモデルの公開判定結果が「非公開」や「限定公開」になった場合、トレーサビリティ情報に基づいて、同モデルの派生モデルも「非公開」や「限定公開」としてもよい。
【0098】
以上説明したとおり第3実施形態によれば、子モデルを情報処理装置に新規登録した際に、当該子モデルとその親モデルとの間の一致度を確認し、一致度に基づいて当該子モデルの公開範囲を決定する。特に、一致度が所定閾値を超過した場合、子モデルを「限定公開」または「非公開」とする。そのため、実質的に親モデルと同一である子モデルが公開されてしまうことを防止することが可能となる。
【0099】
(変形例3-1)
上述の説明では、公開基準情報出力部104は、両モデルの学習データの同一性の「判定結果」と「子モデルの学習回数」を公開基準情報として出力したが、他の情報を公開基準情報として出力してもよい。
【0100】
例えば、子モデルのモデル情報における評価データIDが示す評価画像に対して、両モデルそれぞれにより物体検出処理を実施する。そして、子モデルによる検出結果(BB)と親モデルによる検出結果(BB)とのIoU(Intersection over Union)を算出し、IoUの値を公開基準情報として出力してもよい。IoUとは2つの検出結果(BB)間の重なりの割合を表す指標であり、IoUは0以上1以下の値であり、IoUが大きいほどBBがより大きな割合で重なっていることを表す。評価画像が複数ある場合は、それぞれの評価画像に対するIoUの平均値を公開基準情報として出力してもよい。
【0101】
この場合、公開判定部105は、IoUの値(あるいは平均値)が所定値(例えば0.99)を超過している場合、両モデルの類似度は高いと評価する。すなわち、同一画像に写る検出対象に対する検出性能が両モデルで同程度である場合、両モデルは略同一であるとみなすことができる。
【0102】
(変形例3-2)
また、公開基準情報出力部104は、親モデルと子モデルそれぞれのニューラルネットワーク(NN)の重み差分を(層毎・カーネル毎に)算出し、その差分の絶対値の総和を公開基準情報として出力してもよい。
【0103】
この場合、公開判定部105は、算出された総和が所定値未満である場合に、両モデルの類似度は高いと評価する。すなわち、両モデルのNNの重みの差が小さいため、両モデルは略同一とみなすことができる。
【0104】
(変形例3-3)
また、学習・評価部107におけるモデルの学習において、学習時の損失の時系列データを記憶部12に記憶するよう構成してもよい。ここで、損失とは、NNによる予測値と学習データの真値との差分である。
【0105】
そして、公開基準情報出力部104は、モデル情報の学習パラメータの学習率と損失の時系列データとに基づいて、以下の数式(1)から公開基準情報を算出する。
公開基準情報=lr×Σ|∂Loss/∂w| ・・・(1)
【0106】
数式(1)において、lrは学習率、Lossはある時刻における損失、wはモデルのNNの重み、∂は偏微分、||は絶対値、Σは時間累積を表す。すなわち、数式(1)は、損失の勾配の絶対値の時間累積に学習率を乗算した値である。この値が大きいとNNの重みは大きく変化し、小さいと重みは少しだけ変化することになる。すなわち、公開基準情報は、学習がどの程度進んでいるかを示す学習進捗度に相当するものとなる。
【0107】
公開判定部105は、トレーサビリティ情報管理部103が管理するトレーサビリティ情報から、S903で登録されたモデルに親モデルがあるときに、上述の公開基準情報に基づいてモデルの公開判定を行う。算出された公開基準情報が所定値未満である場合は、子モデルにおいて、モデルのNNの重みが親モデルからほとんど変化していないと判断でき、両モデルの類似度は高いと判断することができる。
【0108】
図10は、変形例3-3におけるモデルの公開範囲を決定/更新する際のフローチャートである。モデルを学習し登録する処理は第3実施形態(図9(a))と同様であるため説明は省略する。
【0109】
S1011では、モデル管理部101は、ユーザ端末14を介して新規登録されたモデルのモデル情報を記憶部12から取得する。モデル情報は、公開基準情報出力部104に渡される。
【0110】
S1012では、学習・評価部107は、S903で登録されたモデルにおける学習時の損失の時系列データを記憶部12から取得する。損失の時系列データは、公開基準情報出力部104に渡される。
【0111】
S1013では、公開基準情報出力部104は、数式(1)を使用して公開基準情報を計算する。
【0112】
S1014では、公開判定部105は、トレーサビリティ情報管理部103が管理するトレーサビリティ情報を取得する。
【0113】
S1015では、公開判定部105は、S903で登録されたモデルに親モデルが存在するか否かを確認する。親モデルが存在する場合、S1013で算出された公開基準情報に基づいて、S903で登録されたモデルの公開判定を行う。
【0114】
S1016では、登録部106は、S1015における公開判定の結果に基づいて、S903で登録されたモデルのモデル情報における公開範囲の値の更新を行う。
【0115】
(第4実施形態)
第4実施形態では、学習モデルの公開範囲を制御する他の情報処理装置を例に挙げて以下に説明する。特に、表示制御部108が管理者端末13とユーザ端末14に提供するトレーサビリティ情報を管理するグラフィカルユーザインタフェース(GUI)について説明する。なお、管理者端末13とユーザ端末14はPCにより構成されることを想定するがこれに限るものではない。また、GUI上の色や線種は一例であり、これに限るものではない。
【0116】
<トレーサビリティ情報の管理画面>
図11は、トレーサビリティ情報の管理画面1100の例を示す図である。上述したように、管理画面1100は、表示制御部108により、管理者端末13および/またはユーザ端末14に対して提供される。管理画面1100は、トレーサビリティ情報画面1110および詳細情報画面1120を含む。例えば、詳細情報画面1120には、トレーサビリティ情報画面1110においてユーザが選択したGUI部品の詳細情報が表示される。
【0117】
トレーサビリティ情報画面1110には、矩形で表されたモデル1101~1104が示されており、トレーサビリティ情報(図5)に従ってモデル間の派生関係が矢印で示されている。また、管理画面1100に対して位置を指示するカーソル1105が示されている。カーソル1105は、ユーザが例えばマウス(不図示)を操作することにより移動可能である。また、トレーサビリティ情報画面1110には、各種処理を実行指示するためのボタン1106~1108が配されている。
【0118】
モデル1101~1104には、それぞれのモデルIDと公開範囲が表示されている。ここでは、各モデルを示す矩形内に公開範囲を文字で表示しているが、公開範囲を矩形の色として表示するよう構成してもよい。例えば、公開範囲が「公開(all)」のモデルは青色の矩形、公開範囲が「(特定ユーザへの)限定公開」のモデルは水色の矩形、公開範囲が「非公開」のモデル1104はグレーの矩形等で表示してもよい。
【0119】
モデル間を接続する矢印は、学習モデル間の派生関係を示している。矢印の根元につながるモデルは初期モデルであり矢印の先端につながるモデルは初期モデルをもとに生成された派生モデルである。すなわち、図11では、モデル1102はモデル1101の派生モデル、モデル1103はモデル1102の派生モデル、モデル1104はモデル1101の派生モデルである。モデル1101には対応する初期モデルがなく、未学習のモデル(例えば、NNの重みがランダム値に設定されたモデル)であることを表している。
【0120】
図11では、カーソル1105によりモデル1101が選択されている状態を示している。ここでは、選択されている状態であることを明示するために、モデル1101の矩形は太枠で表示している。また、図11では、モデル1101のモデル情報の内容が詳細情報画面1120に表示されている。
【0121】
モデルを選択した状態で、ユーザが学習ボタン1106に対してマウスボタンの押下(クリック操作)を行うと、学習管理画面(不図示)に遷移し、選択したモデル1101を初期モデルとした学習処理が開始できるようになる。また、モデルを選択した状態で、ユーザが評価ボタン1107に対してクリック操作を行うと、評価管理画面(不図示)に遷移し、選択したモデル1101に対して評価データIDに記載の評価データを用いた評価処理を実行できるようになる。さらに、モデルを選択した状態で、ユーザが公開判定ボタン1108に対してクリック操作を行うと、公開判定管理画面(不図示)に遷移し、選択したモデル1101及びその派生モデルの公開判定処理を実行できるようになる。
【0122】
以上説明したとおり第4実施形態によれば、各モデルの公開状態および各モデル間の派生関係をユーザが容易に把握可能とするGUIを(管理者端末13および/またはユーザ端末14に)提供することができる。また、GUIを介して、ユーザは、各モデルの詳細情報の確認や、各モデルに対する各種処理(学習、評価、公開判定)の実行を、直感的に行えるようになる。
【0123】
本明細書の開示は、以下の情報処理装置、制御方法およびプログラムを含む。
(項目1)
モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置であって、
前記複数の学習モデルそれぞれについて、学習モデルの学習履歴に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を管理する管理手段と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定手段と、
を備えることを特徴とする情報処理装置。
(項目2)
前記第1の情報は、学習モデルの学習で使用されたデータセットに関する情報を含み、
前記決定手段は、前記複数の学習モデルそれぞれの学習において特定のデータが使用されているか否かを示す公開基準情報を前記第1の情報に基づいて決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする項目1に記載の情報処理装置。
(項目3)
前記特定のデータの指定を前記モデル公開プラットフォームの管理者から受け付ける受付手段をさらに備える
ことを特徴とする項目2に記載の情報処理装置。
(項目4)
前記特定のデータは、倫理的および/または法的に使用が制限されたデータであり、
前記決定手段は、前記特定のデータが使用されている場合に前記公開基準情報として、公開範囲を狭くする限定公開または公開を禁止する非公開を決定し、前記特定のデータが使用されていない場合に前記公開基準情報として、公開範囲の制限を設けない全公開を決定する
ことを特徴とする項目2または3に記載の情報処理装置。
(項目5)
前記決定手段は、学習モデルの作成に使用された前記第2の情報により特定されるベースモデルに対して前記限定公開または前記非公開と決定されていた場合、該学習モデルに対して前記限定公開または前記非公開と決定する
ことを特徴とする項目4に記載の情報処理装置。
(項目6)
前記モデル公開プラットフォームの管理者により指定されたモデル性能を注目学習モデルが有するか否かを検証する検証手段をさらに備え、
前記決定手段は、前記モデル性能を有する前記注目学習モデルに対して公開範囲を狭くする限定公開または公開を禁止する非公開を決定する
ことを特徴とする項目2記載の情報処理装置。
(項目7)
前記決定手段は、注目学習モデルの学習履歴と該注目学習モデルの作成に使用された前記第2の情報により特定されるベースモデルの学習履歴との差分を示す公開基準情報を前記第1の情報に基づいて決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする項目1に記載の情報処理装置。
(項目8)
前記第1の情報は、学習モデルの学習で使用されたデータセットおよび学習パラメータ、および学習回数を含み、
前記決定手段は、前記注目学習モデルの学習で使用されたデータセットおよび学習パラメータと前記ベースモデルの学習で使用されたデータセットおよび学習パラメータとの差分が所定割合未満であり且つ前記注目学習モデルの学習回数が所定回数未満の場合、前記注目学習モデルに対して公開範囲を狭くする限定公開または公開を禁止する非公開を決定する
ことを特徴とする項目7に記載の情報処理装置。
(項目9)
前記決定手段は、学習モデルの作成に使用されたベースモデルに対して前記限定公開または前記非公開と決定されていた場合、該学習モデルに対して前記限定公開または前記非公開と決定する
ことを特徴とする項目8に記載の情報処理装置。
(項目10)
前記第1の情報は、所与のデータセットに対する学習モデルによる検出結果を含み、
前記決定手段は、注目学習モデルによる検出結果と該注目学習モデルの作成に使用された前記第2の情報により特定されるベースモデルによる検出結果とのIoU(Intersection over Union)を前記注目学習モデルの公開基準情報として決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする項目1に記載の情報処理装置。
(項目11)
前記第1の情報は、それぞれの学習モデルを構成するニューラルネットワーク(NN)の重みを含み、
前記決定手段は、注目学習モデルを構成するNNの重みと該注目学習モデルの作成に使用された前記第2の情報により特定されるベースモデルを構成するNNの重みとの差分の絶対値の総和を前記注目学習モデルの公開基準情報として決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする項目1に記載の情報処理装置。
(項目12)
前記第1の情報は、それぞれの学習モデルの学習時における学習パラメータの学習率と損失の時系列データとを含み、
前記決定手段は、注目学習モデルの前記学習率と前記時系列データとに基づいて算出される学習進捗度を前記注目学習モデルの公開基準情報として決定し、前記複数の学習モデルそれぞれに対応する前記公開基準情報と前記第2の情報とに基づいて前記複数の学習モデルそれぞれの公開範囲を決定する
ことを特徴とする項目1に記載の情報処理装置。
(項目13)
モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置であって、
前記複数の学習モデルは、画像から物体検出を行うための物体検出モデルであり、
前記情報処理装置は、
前記モデル公開プラットフォームの管理者により指定されたキーワードと該キーワードに対する正解画像とを関連付けて登録する登録手段と、
前記複数の学習モデルそれぞれについて、学習モデルに前記キーワードを入力して生成される生成画像と前記正解画像との類似度に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を管理する管理手段と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定手段と、
を備えることを特徴とする情報処理装置。
(項目14)
前記モデル公開プラットフォームの管理者の操作する管理者端末に表示される管理画面を生成する画面生成手段をさらに備え、
前記管理画面は、前記第2の情報に基づいて前記複数の学習モデル間の派生関係と、前記複数の学習モデルそれぞれの公開状態と、をグラフィカルユーザインタフェース(GUI)として表示するよう構成される
ことを特徴とする項目1乃至13の何れか1項目に記載の情報処理装置。
(項目15)
モデル公開プラットフォームで公開される複数の学習モデルを管理する情報処理装置の制御方法であって、
前記複数の学習モデルそれぞれについて、学習モデルの学習履歴に関する第1の情報と、学習モデルの作成に使用されたベースモデルに関する第2の情報と、を取得する取得工程と、
前記第1の情報と前記第2の情報の両方に基づいて前記モデル公開プラットフォームにおける前記複数の学習モデルそれぞれの公開範囲を決定する決定工程と、
を含むことを特徴とする制御方法。
(項目16)
項目15に記載の制御方法をコンピュータに実行させるためのプログラム。
【0124】
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0125】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0126】
10 制御部; 11 情報処理装置; 12 記憶部; 13 管理者端末; 14 ユーザ端末
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11