特開2024-59179 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-59179機械学習プログラム、機械学習方法および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024059179

(43)【公開日】2024-05-01

(54)【発明の名称】機械学習プログラム、機械学習方法および情報処理装置

(51)【国際特許分類】

G06N 20/00 20190101AFI20240423BHJP

G06N 3/08 20230101ALN20240423BHJP

【ＦＩ】

G06N20/00

G06N3/08

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2022166696

(22)【出願日】2022-10-18

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】梁俊

(72)【発明者】

【氏名】森田一

(57)【要約】

【課題】自然言語モデルと分類モデルとを接続した機械学習モデル全体のパラメータを更新すること。
【解決手段】情報処理装置１００は、機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、自然言語処理モデルから分類モデルに入力される入力データと、分類モデルから出力される出力データとの対応関係を示すプロジェクションマトリックスを取得する。情報処理装置１００は、自然言語処理モデルのパラメータを更新する。情報処理装置１００は、プロジェクションマトリックスを用いて、分類モデルのパラメータを更新する。情報処理装置１００は、機械学習処理のｎ＋１番目のイテレーションにおいて、更新した自然言語処理モデルから更新した分類モデルに入力される入力データと、更新した分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する。
【選択図】図３

【特許請求の範囲】

【請求項1】

自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のｎ＋１番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。

【請求項2】

前記分類モデルへの入力データと、前記プロジェクションマトリックスを基にして、前記分類モデルからの出力データを算出する処理を更にコンピュータに実行させることを特徴とする請求項１に記載の機械学習プログラム。

【請求項3】

前記分類モデルのパラメータを更新する処理は、前記分類モデルに入力データを入力した際に前記分類モデルから出力される出力データと、前記算出された出力データとの誤差を基にして、前記分類モデルのパラメータを更新することを特徴とする請求項２に記載の機械学習プログラム。

【請求項4】

自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のｎ＋１番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理をコンピュータが実行することを特徴とする機械学習方法。

【請求項5】

自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のｎ＋１番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理を実行する制御部を有する情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、機械学習プログラム等に関する。

【背景技術】

【0002】

自然言語処理において、ドメイン適応（Domain Adaptation）と呼ばれる技術がある。たとえば、ドメイン適応は、Sourceドメインと、Targetドメインとのサンプル間のドメインshiftを軽減するという問題に取り組む技術である。

【0003】

図６は、各ドメインのデータ分布の一例を示す図である。図６に示す例では、空間上に、Original ＬＭ domainのデータ１０、Target domainのデータ１１、Target domain downstream taskのデータ１２が含まれる。

【0004】

Original ＬＭ domainのデータ１０は、インターネット上に存在する文のデータに対応する。Target domainのデータ１１は、Target domainのコーパスデータである。Target domain downstream taskのデータ１２は、downstream taskを実行するために選択された文のデータである。

【0005】

以下では、Original ＬＭ domainのデータ１０、Target domainのデータ１１、Target domain downstream taskのデータ１２を用いた、ドメイン適応の従来技術の一例について説明する。

【0006】

図７は、ドメイン適応の従来技術を説明するための図である。たとえば、従来技術によるドメイン適応では、ステップＳ１０、ステップＳ１１、ステップＳ１２の順に、処理を実行する。ドメイン適応を実行する従来の装置を、従来装置と表記する。

【0007】

従来装置は、ステップＳ１０において、Original ＬＭ domainのデータ１０を用いて、第１モデル１０ａ（Pretrained language model）の学習を実行する。第１モデル１０ａは、自然言語処理モデルである。第１モデル１０ａは、ＮＮ（Neural Network）等で実現される。たとえば、第１モデル１０ａに文を入力すると、文に含まれる各単語のベクトルが出力される。

【0008】

従来装置は、ステップＳ１１において、Target domainのデータ１１を用いて、第１モデル１０ａの再学習を実行することで、第２モデル１１ａ（Re-pretrained language model）を得る。

【0009】

従来装置は、ステップＳ１２において、第２モデル１１ａを、NERモデル１２ａに接続し、Target domain downstream taskのデータ１２を用いて、第２モデル１１ａ、NERモデル１２ａに対するFine-tuningを実行する。NERモデル１２ａは、分類モデルである。NERモデル１２ａは、ＮＮ等である。

【0010】

続いて、データ分類で起こす問題の一例について説明する。図８は、データ分類で起こす問題を説明するための図である。図８に示す例では、ドメインを「Electronic medical records domain」および「Disease explanation documents domain」とする。また、クラスを「Person」および「B-Disease」が存在する。文１５を「Behcet's disease is globalized and infectious.」とする。

【0011】

たとえば、文１５と、「Person」に属する文とが類似し、また、文１５と、「B-Disease」に属する文とが類似している場合、文１５をうまく分類することができない。文１５の分類を間違えると、文１５が所属するドメインも間違えることになる。これによって、ドメイン内のデータ分布が分からなくなり、二つのドメイン「Electronic medical records domain」のデータ分布と、「Disease explanation documents domain」のデータ分布の差が分からなくなる。

【0012】

ところで、ドメイン適応を行う場合に、Sourceドメイン側のデータと、Targetドメイン側のデータとの対応関係を示すプロジェクションマトリックス（projection matrix）を学習することができる。Sourceドメイン側のデータ分布と、Targetドメイン側のデータ分布との差（domain data distribution shift）を明らかにすると、プロジェクションマトリックスを適切に学習することができる。

【0013】

二つのドメインデータの分布の差を判断するものとして、Domain discrepancyがある。図９および図１０は、Domain discrepancyによるドメイン適応の一例を示す図である。

【0014】

図９について説明する。たとえば、データ群１０ｓは、クラスＣ_１に属するSourceドメイン側のデータである。データ群１０ｔは、クラスＣ_１に属するTargetドメイン側のデータである。データ群１１ｓは、クラスＣ_２に属するSourceドメイン側のデータである。データ群１１ｔは、クラスＣ_２に属するTargetドメイン側のデータである。

【0015】

データ群１０ｓ，１０ｔ，１１ｓ，１１ｔは、それぞれ類似したデータである。たとえば、データ群１０ｓ，１０ｔ，１１ｓ，１１ｔに対して、Joint MMD方法によるドメイン適応を実行すると、クラスＣ_１、Ｃ_２のデータがうまく分類されない。このように、データをうまく分類できないと、二つのドメインのデータ分布差をうまく計算できず、ドメイン適応を適切に実行できない。

【0016】

図１０について説明する。たとえば、データ群１２ｓは、クラスＣ_１に属するSourceドメイン側のデータである。データ群１２ｔは、クラスＣ_１に属するTargetドメイン側のデータである。データ群１３ｓは、クラスＣ_２に属するSourceドメイン側のデータである。データ群１３ｔは、クラスＣ_２に属するTargetドメイン側のデータである。

【0017】

データ群１２ｓ，１２ｔは、類似したデータである。データ群１３ｓ，１３ｔは、類似したデータである。データ群１２ｓと、データ群１３ｔとは、類似しないデータである。データ群１２ｔと、データ群１３ｓとは、類似しないデータである。たとえば、データ群１２ｓ，１２ｔ，１３ｓ，１３ｔに対して、DJP MMD方法によるドメイン適応を実行すると、クラスＣ_１、Ｃ_２のデータをうまく分類できる。このように、データをうまく分類できると、二つのドメインのデータ分布差をうまく計算でき、ドメイン適応を適切に実行できる。

【0018】

たとえば、DJP MMD方法では、式（１）を用いて、Sourceドメインのデータ分布Ｄ_ｓと、Targetドメインのデータ分布Ｄ_ｔとの距離ｄを計算する。式（１）において、「μ」は、トレードオフパラメータである。

【0019】

【数1】

【0020】

式（１）において、「Ｍ_Ｄ」は、SourceドメインとTargetドメインとのDiscriminabilityを示すものである。たとえば、Ｍ_Ｄは、式（２）によって定義される。

【0021】

【数2】

【0022】

式（２）において、「ｃ」は、Sourceドメインのラベルセットである。「ｃ’」は、Targetドメインのラベルセットである。「Ｘ^ｃ _ｓ，ｉ」は、ｃ－ｔｈクラスにおける、Sourceドメインの特徴ベクトルである。「Ｘ^ｃ _ｔ，ｉ」は、ｃ－ｔｈクラスにおける、Targetドメインの特徴ベクトルである。「ｎ^ｃ _ｓ」は、ｃ－ｔｈクラスのSourceドメインにおける例（example）の数である。「ｎ^ｃ _ｔ」は、ｃ－ｔｈクラスのTargetドメインにおける例（example）の数である。「Ａ」は、プロジェクションマトリックスである。

【0023】

一方、式（１）において、「Ｍ_Ｔ」は、SourceドメインとTargetドメインとのTransferabilityを示すものである。たとえば、Ｍ_Ｔは、式（３）によって定義される。

【0024】

【数3】

【0025】

式（３）において、「Ｘ_ｓ」は、Sourceドメインデータである。「Ｙ_ｓ ^ｃ」は、Sourceドメインラベルである。「Ｘ_ｔ」は、Targetドメインデータである。「Ｙ_ｔ ^ｃ」は、Targetドメインラベルである。

【0026】

式（３）において、「Ｅ」は、式（４）によって定義される。「Ｐ」は、式（５）によって定義される。

【0027】

【数4】

【0028】

【数5】

【0029】

次に、自然言語モデルと、分類モデルとを組み合わせた従来の機械学習モデルに対する機械学習処理の一例について説明する。図１１は、従来の機械学習モデルの機械学習処理を説明するための図である。図１１に示すように、機械学習モデル２５は、自然言語モデル２０と、分類モデル２１とを有する。自然言語モデル２０の出力結果が、分類モデル２１に入力される。

【0030】

自然言語モデル２０は、ＢＥＲＴ（Bidirectional Encoder Representations from Transformers）等の言語モデルである。自然言語モデル２０に、複数の単語を含む文のデータ２０ａを入力すると、自然言語モデル２０から、Ｘ_ｓが出力される。たとえば、Ｘ_ｓは、各単語のベクトル等である。

【0031】

分類モデル２１は、ＦＮＮ（Feedforward Neural Network）等の分類モデルである。分類モデル２１に自然言語モデル２０の出力結果（たとえば、Ｘ_ｓ）を入力すると、分類モデル２１からラベル「Ｙ’_ｓ」が出力される。

【0032】

機械学習モデル２５に対する機械学習処理では、分類モデル２１から出力されるラベル「Ｙ’_ｓ」と、正解ラベル「Ｙ_ｓ」とのＬｏｓｓが小さくなるように、分類モデル２１を訓練（fine-tuning）する。

【0033】

なお、機械学習モデル２５に対する機械学習処理では、自然言語モデル２０のパラメータを固定することで、自然言語モデル２０の出力結果Ｘ_ｓを固定する。分類モデル２１に入力するＸ_ｓと、分類モデル２１から出力される「Ｙ’_ｓ」との関係から、プロジェクションマトリックスＡが学習される。たとえば、プロジェクションマトリックスＡは、JPDA（Joint Probabilistic Data Association）アルゴリズムに基づいて、学習される。

【先行技術文献】

【特許文献】

【0034】

【特許文献1】特表２０２０－５２０５０５号公報

【発明の概要】

【発明が解決しようとする課題】

【0035】

しかしながら、上述した従来技術では、自然言語モデルと分類モデルとを接続した機械学習モデルの訓練を行う場合、機械学習モデルのわずかな層のパラメータしか更新されない。

【0036】

たとえば、図１１に示した機械学習モデル２５では、プロジェクションマトリックスＡを学習するために、Ｘ_ｓの値を固定している。そして、Ｘ_ｓの値を固定するために、自然言語モデル２０のパラメータを固定しており、分類モデル２１のパラメータしか更新されていない。そうすると、分類モデル２１の入力側のドメインのデータ分布と、分類モデル２１の出力側のドメインのデータ分布との差が十分に計算できず、機械学習モデル２５の性能が劣化する。

【0037】

なお、単純に、自然言語モデル２０のパラメータを更新すると、Ｘ_ｓの値が固定されず、プロジェクションマトリックスＡを学習することができなくなる。

【0038】

１つの側面では、本発明は、自然言語モデルと分類モデルとを接続した機械学習モデル全体のパラメータを更新できる機械学習プログラム、機械学習方法および情報処理装置を提供することを目的とする。

【課題を解決するための手段】

【0039】

第１の案では、コンピュータに次の処理を実行させる。コンピュータは、自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、機械学習処理のｎ番目のイテレーションにおけるプロジェクションマトリックスを取得する。プロジェクトマトリックスは、自然言語処理モデルから分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す。コンピュータは、自然言語処理モデルのパラメータを更新する。コンピュータは、プロジェクションマトリックスを用いて、分類モデルのパラメータを更新する。コンピュータは、機械学習処理のｎ＋１番目のイテレーションにおいて、次の処理を実行する。コンピュータは、更新した自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する。

【発明の効果】

【0040】

自然言語モデルと分類モデルとを接続した機械学習モデル全体のパラメータを更新できる。

【図面の簡単な説明】

【0041】

【図1】図１は、本実施例に係る情報処理装置の処理を説明するための図である。

【図2】図２は、本実施例に係る情報処理装置の効果を説明するための図である。

【図3】図３は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。

【図4】図４は、機械学習モデルの機械学習処理の処理手順を示すフローチャートである。

【図5】図５は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

【図6】図６は、各ドメインのデータ分布の一例を示す図である。

【図7】図７は、ドメイン適応の従来技術を説明するための図である。

【図8】図８は、データ分類で起こす問題を説明するための図である。

【図9】図９は、Domain discrepancyによるドメイン適応の一例を示す図（１）である。

【図10】図１０は、Domain discrepancyによるドメイン適応の一例を示す図（２）である。

【図11】図１１は、従来の機械学習モデルの機械学習処理を説明するための図である。

【発明を実施するための形態】

【0042】

以下に、本願の開示する機械学習プログラム、機械学習方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。

【実施例0043】

図１は、本実施例に係る情報処理装置の処理を説明するための図である。図１に示すように、情報処理装置は、機械学習モデル５５を有する。機械学習モデル５５は、自然言語モデル５０と、分類モデル５１とを有する。自然言語モデル５０の出力結果が、分類モデル５１に入力される。

【0044】

自然言語モデル５０は、ＢＥＲＴ等の言語モデルである。自然言語モデル５０に、複数の単語を含む文のデータ５０ａを入力すると、自然言語モデル５０から、Ｘ_ｓが出力される。たとえば、Ｘ_ｓは、文に含まれる各単語のベクトル等である。

【0045】

分類モデル５１は、ＦＮＮ等の分類モデルである。分類モデル５１に自然言語モデル５０の出力結果（たとえば、Ｘ_ｓ）を入力すると、分類モデル５１からラベル「Ｙ’_ｓ」が出力される。

【0046】

情報処理装置は、次のように、機械学習モデル５５の機械学習処理を実行する。情報処理装置は、ｎ番目のiterationにおいて、自然言語モデル５０を訓練する。自然言語モデル５０の訓練は、予め準備した学習データを用いた教師なし学習である。たとえば、教師なし学習で利用する学習データは、Sourceドメインに属する文のデータである。ｎ番目のiterationにおいて訓練した自然言語モデル５０を「自然言語モデル５０－ｎ」と表記する。

【0047】

また、情報処理装置は、ｎ番目のiterationにおいて、分類モデル５１を訓練する。分類モデル５１の訓練は、入力「Ｘ_ｓ」と、正解ラベル「Ｙ_ｓ」とが定義された学習データを用いた教師あり学習である。情報処理装置は、Ｘ_ｓ（自然言語モデル５０－ｎの出力）を、分類モデル５１に入力し、分類モデル５１から出力されるラベル「Ｙ’_ｓ」と、正解ラベル「Ｙ_ｓ」とのＬｏｓｓが小さくなるように、分類モデル５１を訓練する。

【0048】

情報処理装置は、Ｘ_ｓ（自然言語モデル５０－ｎからの出力）と、分類モデル５１の出力Ｙ’_ｓとの対応関係から、プロジェクションマトリックスＡｎを学習する。

【0049】

また、情報処理装置は、予め準備する「Ｘ_ｔ」を用いて、分類モデル５１を訓練する。「Ｘ_ｔ」に対応する正解ラベル「Ｙ_ｔ」は事前準備されないため、プロジェクションマトリックスＡｎと、「Ｙ_ｔ＝Ａ（Ａ^Ｔ）×Ｘ_ｔ」との関係を用いて、正解ラベル「Ｙ_ｔ」を算出する。情報処理装置は、Ｘ_ｔを、分類モデル５１に入力し、分類モデル５１から出力される「Ｙ’_ｔ」と、正解ラベル「Ｙ_ｔ」とのＬｏｓｓが小さくなるように、分類モデル５１を訓練する。ｎ番目のiterationにおいて訓練した分類モデル５１を「分類モデル５１－ｎ」と表記する。

【0050】

上記のｎ番目のiterationにおいて、プロジェクションマトリックスＡｎ、自然言語モデル５０－ｎ、分類モデル５１－ｎの学習が実行される。

【0051】

続いて、情報処理装置は、ｎ＋１番目のiterationにおいて、自然言語モデル５０－ｎを訓練する。ｎ＋１番目のiterationにおいて訓練した自然言語モデル５０を「自然言語モデル５０－ｎ＋１」と表記する。

【0052】

情報処理装置は、ｎ＋１番目のiterationにおいて、分類モデル５１－ｎを訓練する。情報処理装置は、Ｘ_ｓ（自然言語モデル５０－ｎ＋１の出力）を、分類モデル５１－ｎに入力し、分類モデル５１から出力される「Ｙ’_ｓ」と、正解ラベル「Ｙ_ｓ」とのＬｏｓｓが小さくなるように、分類モデル５１－ｎを訓練する。

【0053】

情報処理装置は、Ｘ_ｓ（自然言語モデル５０－ｎ＋１からの出力）と、分類モデル５１－ｎの出力Ｙ’_ｓとの対応関係から、プロジェクションマトリックスＡｎ＋１を学習する。

【0054】

また、情報処理装置は、予め準備する「Ｘ_ｔ」を用いて、分類モデル５１－ｎを訓練する。「Ｘ_ｔ」に対応する正解ラベル「Ｙ_ｔ」は事前準備されないため、プロジェクションマトリックスＡｎ＋１と、「Ｙ_ｔ＝Ａ（Ａ^Ｔ）×Ｘ_ｔ」との関係を用いて、正解ラベル「Ｙ_ｔ」を算出する。情報処理装置は、Ｘ_ｔを、分類モデル５１－ｎに入力し、分類モデル５１－ｎから出力される「Ｙ’_ｔ」と、正解ラベル「Ｙ_ｔ」とのＬｏｓｓが小さくなるように、分類モデル５１－ｎを訓練する。ｎ＋１番目のiterationにおいて訓練した分類モデル５１を「分類モデル５１－ｎ＋１」と表記する。

【0055】

上記のｎ＋１番目のiterationにおいて、プロジェクションマトリックスＡｎ＋１、自然言語モデル５０－ｎ＋１、分類モデル５１－ｎ＋１の学習が実行される。

【0056】

情報処理装置は、ｎ＋１番目以降のiterationについても、上記処理を繰り返し実行することで、iteration毎の自然言語モデル５０、分類モデル５１を訓練する。

【0057】

上記のように、本実施例に係る情報処理装置は、ｎ番目のiterationにおいて、自然言語モデル５０、分類モデル５１を訓練し、分類モデル５１－ｎの入力と出力との関係から、プロジェクションマトリックスＡｎを学習する。情報処理装置は、ｎ＋１番目のiterationにおいて、自然言語モデル５０－ｎ、分類モデル５１－ｎを訓練し、分類モデル５１－ｎ＋１の入力と出力との関係から、プロジェクションマトリックスＡｎ＋１を学習する。これによって、機械学習モデル２５全体のパラメータを更新しつつ、プロジェクションマトリックスＡを学習できる。また、機械学習モデル５５全体を更新できるため、図１１で説明した機械学習モデル２５と比較して、性能を向上させることができる。

【0058】

図２は、本実施例に係る情報処理装置の効果を説明するための図である。図２に示す例では、ドメインを「Electronic medical records domain」および「Disease explanation documents domain」とする。また、クラスを「Person」および「B-Disease」が存在する。文１５を「Behcet's disease is globalized and infectious.」とする。

【0059】

たとえば、文１５と、「Person」に属する文とが類似し、また、文１５と、「B-Disease」に属する文とが類似していても、図１の機械学習処理によって、適切なクラスに分類することができる。上記の機械学習処理によって、文１５の「Behcet's」が患者の名前であることが分かっているとすると、文１５を、機械学習モデル５５に入力することで、クラス「Person」が出力される。すなわち、機械学習モデル２５の性能が向上し、ドメイン適応を適切に実行することができる。

【0060】

次に、図１に示した処理を実行する情報処理装置の構成例について説明する。図３は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。図２に示すように、この情報処理装置１００は、通信部１１０と、入力部１２０と、表示部１３０と、記憶部１４０と、制御部１５０とを有する。

【0061】

通信部１１０は、ネットワークを介して、外部装置等との間でデータ通信を実行する。後述する制御部１５０は、通信部１１０を介して、外部装置との間でデータをやり取りする。

【0062】

入力部１２０は、情報処理装置１００の制御部１５０に各種の情報を入力する入力装置である。入力部１２０は、キーボードやマウス、タッチパネル等に対応する。

【0063】

表示部１３０は、制御部１５０から出力される情報を表示する表示装置である。

【0064】

記憶部１４０は、機械学習モデル５５、自然言語モデル学習データセット１４１、分類モデル学習データセット１４２を有する。記憶部１４０は、メモリなどの記憶装置である。

【0065】

機械学習モデル５５には、自然言語モデル５０と、分類モデル５１とが含まれる。自然言語モデル５０は、ＢＥＲＴ等の言語モデルである。分類モデル５１は、ＦＮＮ等の分類モデルである。

【0066】

自然言語モデル学習データセット１４１には、自然言語モデル５０を訓練するためのデータが含まれる。たとえば、自然言語モデル学習データセットには、Sourceドメインに属する複数の文のデータが含まれる。

【0067】

分類モデル学習データセット１４２には、複数の学習データが含まれる。各学習データには、機械学習モデル５５に入力する入力データと、正解ラベル（Ｙ_ｓ）との組が設定される。また、分類モデル学習データセット１４２には、上記の学習データとは別に、複数のＸ_ｔのデータが設定されていてもよい。

【0068】

制御部１５０は、取得部１５１と、自然言語モデル学習部１５２と、マトリックス計算部１５３と、分類モデル学習部１５４と、推定部１５５とを有する。制御部１５０は、ＣＰＵ（Central Processing Unit）やＧＰＵ（Graphics Processing Unit）等である。

【0069】

取得部１５１は、外部装置等から各種のデータを取得する。たとえば、取得部１５１は、自然言語モデル学習データセット１４１、分類モデル学習データセット１４２等を、外部装置から取得し、記憶部１４０に登録する。

【0070】

自然言語モデル学習部１５２は、自然言語モデル学習データセット１４１を基にして、自然言語モデル５０を訓練する（自然言語モデル５０のパラメータを更新する）。たとえば、自然言語モデル学習部１５２は、文を、自然言語モデル５０に入力し、教師なし学習を実行する。

【0071】

マトリックス計算部１５３は、分類モデル５１に入力されるＸ_ｓと、分類モデル５１から出力されるＹ_ｓとの関係を基にして、プロジェクションマトリックスＡを計算する。

【0072】

分類モデル学習部１５４は、分類モデル学習データセット１４２を基にして、分類モデル５１を訓練する（分類モデル５１のパラメータを更新する）。たとえば、分類モデル学習部１５４は、入力データを、自然言語モデル５０に入力することで得られるＸ_ｓを、分類モデル５１に入力する。分類モデル学習部１５４は、分類モデル５１から出力されるラベル「Ｙ’_ｓ」と、正解ラベル「Ｙ_ｓ」とのＬｏｓｓが小さくなるように、分類モデル５１のパラメータを更新する。

【0073】

また、分類モデル学習部１５４は、「Ｘ_ｔ」を用いて、分類モデル５１を訓練する。分類モデル学習部１５４は、「Ｘ_ｔ」に対応する正解ラベル「Ｙ_ｔ」は事前準備されないため、プロジェクションマトリックスＡと、「Ｙ_ｔ＝Ａ（Ａ^Ｔ）×Ｘ_ｔ」との関係を用いて、正解ラベル「Ｙ_ｔ」を算出する。分類モデル学習部１５４は、Ｘ_ｔを、分類モデル５１に入力し、分類モデル５１から出力される「Ｙ’_ｔ」と、正解ラベル「Ｙ_ｔ」とのＬｏｓｓが小さくなるように、分類モデル５１のパラメータを更新する。

【0074】

推定部１５５は、訓練済みの機械学習モデル５５を基にして、文の属するクラスを推定する。たとえば、推定部１５５は、入力部１２０から、文のデータを取得する。推定部１５５は、取得した文のデータを、機械学習モデル５５に入力し、分類結果を得る。推定部１５５は、分類結果を、表示部１３０に表示させる。

【0075】

次に、本実施例に係る情報処理装置１００の処理手順の一例について説明する。たとえば、上述した自然言語モデル学習部１５２、マトリックス計算部１５３、分類モデル学習部１５４は、図４に示す処理手順によって、機械学習モデル５５の機械学習処理を実行する。

【0076】

図４は、機械学習モデルの機械学習処理の処理手順を示すフローチャートである。図４に示すように、情報処理装置１００は、iteration N＝１に設定する（ステップＳ１０１）。情報処理装置１００の自然言語モデル学習部１５２は、自然言語モデル学習データセット１４１を基にして、自然言語モデル５０を訓練する（ステップＳ１０２）。

【0077】

情報処理装置１００の分類モデル学習部１５４は、分類モデル学習データセット１４２を基にして、分類モデル５１を訓練する（ステップＳ１０３）。

【0078】

情報処理装置１００のマトリックス計算部１５３は、分類モデル５１への入力Ｘ_ｓと、分類モデル５１の出力Ｙ’_ｓとの関係を基にして、プロジェクションマトリックスＡを計算する（ステップＳ１０４）。

【0079】

分類モデル学習部１５４は、分類モデル５１への入力Ｘ_ｔと、プロジェクションマトリックスＡとを基にして、入力Ｘ_ｔと、を算出する（ステップＳ１０５）。分類モデル学習部１５４は、Ｘ_ｔを分類モデル５１を入力した際のラベルＹ’_ｔと、正解ラベルＹ_ｔとのＬｏｓｓが小さくなるように、分類モデル５１を訓練する（ステップＳ１０６）。

【0080】

情報処理装置１００は、機械学習処理を継続する場合には（ステップＳ１０７，Ｙｅｓ）、Ｎに１を加算し（ステップＳ１０８）、ステップＳ１０２に移行する。一方、情報処理装置１００は、機械学習処理を継続しない場合には（ステップＳ１０７，Ｎｏ）、処理を終了する。

【0081】

次に、本実施例に係る情報処理装置１００の効果について説明する。情報処理装置１００は、ｎ番目のiterationにおいて、自然言語モデル５０、分類モデル５１を訓練し、分類モデル５１－ｎの入力と出力との関係から、プロジェクションマトリックスＡｎを学習する。情報処理装置１００は、ｎ＋１番目のiterationにおいて、自然言語モデル５０－ｎ、分類モデル５１－ｎを訓練し、分類モデル５１－ｎ＋１の入力と出力との関係から、プロジェクションマトリックスＡｎ＋１を学習する。これによって、機械学習モデル２５全体のパラメータを更新しつつ、プロジェクションマトリックスＡを学習できる。

【0082】

情報処理装置１００は、プロジェクションマトリックスＡと、「Ｙ_ｔ＝Ａ（Ａ^Ｔ）×Ｘ_ｔ」との関係を用いて、正解ラベル「Ｙ_ｔ」を算出する。これによって、「Ｘ_ｔ」に対応する正解ラベル「Ｙ_ｔ」は事前準備されない場合でも、分類モデル５１を訓練することができる。

【0083】

情報処理装置１００は、「Ｘ_ｔ」を、分類モデル５１に入力し、分類モデル５１から出力される「Ｙ’_ｔ」と、正解ラベル「Ｙ_ｔ」とのＬｏｓｓが小さくなるように、分類モデル５１のパラメータを更新する。これによって、機械学習モデル５５の精度を向上させることができる。

【0084】

次に、上述した情報処理装置１００と同様の機能を実現するコンピュータのハードウェア構成の一例について説明する。図５は、実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。

【0085】

図６に示すように、コンピュータ２００は、各種演算処理を実行するＣＰＵ２０１と、ユーザからのデータの入力を受け付ける入力装置２０２と、ディスプレイ２０３とを有する。また、コンピュータ２００は、有線または無線ネットワークを介して、外部装置等との間でデータの授受を行う通信装置２０４と、インタフェース装置２０５とを有する。また、コンピュータ２００は、各種情報を一時記憶するＲＡＭ２０６と、ハードディスク装置２０７とを有する。そして、各装置２０１～２０７は、バス２０８に接続される。

【0086】

ハードディスク装置２０７は、取得プログラム２０７ａ、自然言語モデル学習プログラム２０７ｂ、マトリックス計算プログラム２０７ｃ、分類モデル学習プログラム２０７ｄ、推定プログラム２０７ｅを有する。また、ＣＰＵ２０１は、各プログラム２０７ａ～２０７ｅを読み出してＲＡＭ２０６に展開する。

【0087】

取得プログラム２０７ａは、取得プロセス２０６ａとして機能する。自然言語モデル学習プログラム２０７ｂは、自然言語モデル学習プロセス２０６ｂとして機能する。マトリックス計算プログラム２０７ｃは、マトリックス計算プロセス２０６ｃとして機能する。分類モデル学習プログラム２０７ｄは、分類モデル学習プロセス２０６ｄとして機能する。推定プログラム２０７ｅは、推定プロセス２０６ｅとして機能する。

【0088】

取得プロセス２０６ａの処理は、取得部１５１の処理に対応する。自然言語モデル学習プロセス２０６ｂの処理は、自然言語モデル学習部１５２の処理に対応する。マトリックス計算プロセス２０６ｃの処理は、マトリックス計算部１５３の処理に対応する。分類モデル学習プロセス２０６ｄの処理は、分類モデル学習部１５４の処理に対応する。推定プロセス２０６ｅの処理は、推定部１５５の処理に対応する。

【0089】

なお、各プログラム２０７ａ～２０７ｅについては、必ずしも最初からハードディスク装置２０７に記憶させておかなくても良い。例えば、コンピュータ２００に挿入されるフレキシブルディスク（ＦＤ）、ＣＤ－ＲＯＭ、ＤＶＤ、光磁気ディスク、ＩＣカードなどの「可搬用の物理媒体」に各プログラムを記憶させておく。そして、コンピュータ２００が各プログラム２０７ａ～２０７ｅを読み出して実行するようにしてもよい。

【0090】

以上の各実施例を含む実施形態に関し、さらに以下の付記を開示する。

【0091】

（付記１）自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のｎ＋１番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。

【0092】

（付記２）前記分類モデルへの入力データと、前記プロジェクションマトリックスを基にして、前記分類モデルからの出力データを算出する処理を更にコンピュータに実行させることを特徴とする付記１に記載の機械学習プログラム。

【0093】

（付記３）前記分類モデルのパラメータを更新する処理は、前記分類モデルに入力データを入力した際に前記分類モデルから出力される出力データと、前記算出された出力データとの誤差を基にして、前記分類モデルのパラメータを更新することを特徴とする付記２に記載の機械学習プログラム。

【0094】

（付記４）自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のｎ＋１番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理をコンピュータが実行することを特徴とする機械学習方法。

【0095】

（付記５）前記分類モデルへの入力データと、前記プロジェクションマトリックスを基にして、前記分類モデルからの出力データを算出する処理を更にコンピュータに実行させることを特徴とする付記４に記載の機械学習方法。

【0096】

（付記６）前記分類モデルのパラメータを更新する処理は、前記分類モデルに入力データを入力した際に前記分類モデルから出力される出力データと、前記算出された出力データとの誤差を基にして、前記分類モデルのパラメータを更新することを特徴とする付記５に記載の機械学習方法。

【0097】

（付記７）自然言語処理モデルと分類モデルとを組み合わせた機械学習モデルの機械学習処理を実行する場合に、
前記機械学習処理のｎ番目のイテレーションにおいて取得されたプロジェクションマトリックスであって、前記自然言語処理モデルから前記分類モデルに入力される入力データと、前記分類モデルから出力される出力データとの対応関係を示す前記プロジェクションマトリックスを取得し、
前記自然言語処理モデルのパラメータを更新し、
前記プロジェクションマトリックスを用いて、前記分類モデルのパラメータを更新し、
前記機械学習処理のｎ＋１番目のイテレーションにおいて、更新した前記自然言語処理モデルから更新した前記分類モデルに入力される入力データと、更新した前記分類モデルから出力される出力データとの対応関係を示す新たなプロジェクションマトリックスを取得する
処理を実行する制御部を有する情報処理装置。

【0098】

（付記８）前記制御部は、前記分類モデルへの入力データと、前記プロジェクションマトリックスを基にして、前記分類モデルからの出力データを算出する処理を更に実行することを特徴とする付記７に記載の情報処理装置。

【0099】

（付記９）前記分類モデルのパラメータを更新する処理は、前記分類モデルに入力データを入力した際に前記分類モデルから出力される出力データと、前記算出された出力データとの誤差を基にして、前記分類モデルのパラメータを更新することを特徴とする付記８に記載の情報処理装置。

【符号の説明】

【0100】

１００情報処理装置
１１０通信部
１２０入力部
１３０表示部
１４０記憶部
１４１自然言語モデル学習データセット
１４２分類モデル学習データセット
１５０制御部
１５１取得部
１５２自然言語モデル学習部
１５３マトリックス計算部
１５４分類モデル学習部
１５５推定部

【図1】