特許7454156 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ファーストアカウンティング株式会社の特許一覧

特許7454156情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-03-13

(45)【発行日】2024-03-22

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06N 3/09 20230101AFI20240314BHJP

【ＦＩ】

G06N3/09

【請求項の数】 7

(21)【出願番号】P 2023579770

(86)(22)【出願日】2023-12-26

(86)【国際出願番号】 JP2023046681

【審査請求日】2023-12-26

【早期審査対象出願】

(73)【特許権者】

【識別番号】516380407

【氏名又は名称】ファーストアカウンティング株式会社

(74)【代理人】

【識別番号】110004222

【氏名又は名称】弁理士法人創光国際特許事務所

(72)【発明者】

【氏名】藤武将人

(72)【発明者】

【氏名】奥村雄輝

【審査官】福西章人

(56)【参考文献】

【文献】国際公開第２０２３／１３２０２９（ＷＯ，Ａ１）

【文献】国際公開第２０２３／１６２２０６（ＷＯ，Ａ１）

【文献】特開２０１９－１８５２４４（ＪＰ，Ａ）

【文献】PEETERS, Ralph et al.，Entity Matching using Large Language Models，arXiv [online]，2023年10月17日，pp.1-9，[検索日 2024.01.30]、インターネット:<URL:https://arxiv.org/pdf/2310.11244v1.pdf>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ４０／００－４０／５８

(57)【特許請求の範囲】

【請求項1】

推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを入力すると、入力された推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルであって、
（１）第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられた第１の学習用データセットに基づいて、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を入力すると、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す情報を出力するタスクである名寄せタスクと、
（２）推定対象の名称と推定対象の説明とが関連付けられた第２の学習用データセットに基づいて、推定対象の説明を入力として前記推定対象の名称を出力するタイトル推論タスクと、
を学習した前記学習済みモデルを記憶する記憶部と、
前記推論用データを取得する取得部と、
取得した前記推論用データを前記学習済みモデルに入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定する判定部と、
前記判定部が判定した結果を出力する出力部と、
を有する情報処理装置。

【請求項2】

前記推論用データ及び前記第１の学習用データセットにおいて関連付けられた第１の名寄せ対象の説明においては、商品である第１の名寄せ対象の詳細を示す情報と、第１の名寄せ対象の金額とを含み、
前記推論用データ及び前記第１の学習用データセットにおいて関連付けられた第２の名寄せ対象の説明においては、商品である第２の名寄せ対象の詳細を示す情報と、第２の名寄せ対象の金額とを含み、
前記第２の学習用データセットにおいて関連付けられた推定対象の説明においては、推定対象の詳細を示す情報を含む、
請求項１に記載の情報処理装置。

【請求項3】

前記学習済みモデルは、汎用的な言語モデルに対して前記第１の学習用データセットに基づく前記名寄せタスクの学習と、前記第２の学習用データセットに基づく前記タイトル推論タスクと、を学習した学習済みモデルである、
請求項１に記載の情報処理装置。

【請求項4】

前記取得部は、前記第１の学習用データセット及び前記第２の学習用データセットを取得し、
前記情報処理装置は、
（１）前記取得部が取得した前記第１の学習用データセットに基づいて前記名寄せタスクと、
（２）前記第２の学習用データセットに基づいて前記タイトル推論タスクと、
を学習させた前記学習済みモデルを生成するとともに、学習させた前記学習済みモデルを前記記憶部に記憶する、学習部をさらに有する、
請求項１に記載の情報処理装置。

【請求項5】

前記学習部は、単一の学習プロセスにおいて、前記第１の学習用データセットに基づく前記名寄せタスクと、前記第２の学習用データセットに基づく前記タイトル推論タスクと、を並行して学習させる、
請求項４に記載の情報処理装置。

【請求項6】

コンピュータが実行する、
推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを取得する取得部と、
記憶部が記憶する学習済みモデルであって、前記推論用データを入力すると、推論用データにおける第１の名寄せ対象と、前記推論用データにおける第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルであって、
（１）第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられた第１の学習用データセットに基づいて、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を入力すると、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す情報を出力するタスクである名寄せタスクと、
（２）推定対象の名称と推定対象の説明とが関連付けられた第２の学習用データセットに基づいて、前記推定対象の説明を入力として前記推定対象の名称を出力するタイトル推論タスクと、
を学習した前記学習済みモデルに、前記推論用データを入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定するステップと、
前記判定するステップにおいて判定された結果を出力するステップと、
を有する情報処理方法。

【請求項7】

コンピュータに、
推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを取得する取得部と、
記憶部が記憶する学習済みモデルであって、前記推論用データを入力すると、推論用データにおける第１の名寄せ対象と、前記推論用データにおける第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルであって、
（１）第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられた第１の学習用データセットに基づいて、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を入力すると、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す情報を出力するタスクである名寄せタスクと、
（２）推定対象の名称と推定対象の説明とが関連付けられた第２の学習用データセットに基づいて、前記推定対象の説明を入力として前記推定対象の名称を出力するタイトル推論タスクと、
を学習した前記学習済みモデルに、前記推論用データを入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定するステップと、
前記判定するステップにおいて判定された結果を出力するステップと、
を実行させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

【背景技術】

【0002】

事前学習済みの言語モデルをファインチューニングした機械学習モデルを用いて名寄せを判定する技術が知られている（例えば非特許文献１）。

【先行技術文献】

【非特許文献】

【0003】

【文献】Yuliang Li, Jinfeng Li, Yoshihiko Suhara, AnHai Doan, and Wang-Chiew Tan. 2020. Deep entity matching with pre-trained language models. Proceedings of the VLDB Endowment, 14(1):50-60. Stephanie Lin, Jacob Hilton, and Owain Evans. 2021. Truthfulqa: Measuring how models mimic human falsehoods. arXiv preprint arXiv:2109.07958.

【発明の概要】

【発明が解決しようとする課題】

【0004】

既存の手法によっては精度を向上させるためにタスク又は名寄せの対象ごとに機械学習モデルを学習させる必要があり、他のタスクや名寄せ対象について名寄せを行う場合に再学習が必要となり、学習コストが大きくなる問題があった。

【0005】

そこで、本発明はこれらの点に鑑みてなされたものであり、汎用性を維持しながら名寄せタスクの判定精度を向上させることを目的とする。

【課題を解決するための手段】

【0006】

本発明の第１の態様の情報処理装置においては、推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを入力すると、入力された推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルであって、（１）第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられた第１の学習用データセットに基づいて、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を入力すると、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す情報を出力するタスクである名寄せタスクと、（２）推定対象の名称と推定対象の説明とが関連付けられた第２の学習用データセットに基づいて、推定対象の説明を入力として前記推定対象の名称を出力するタイトル推論タスクと、を学習した前記学習済みモデルを記憶する記憶部と、前記推論用データを取得する取得部と、取得した前記推論用データを前記学習済みモデルに入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定する判定部と、前記判定部が判定した結果を出力する出力部と、を有する。

【0007】

前記推論用データ及び前記第１の学習用データセットにおいて関連付けられた第１の名寄せ対象の説明においては、商品である第１の名寄せ対象の詳細を示す情報と、第１の名寄せ対象の金額とを含み、前記推論用データ及び前記第１の学習用データセットにおいて関連付けられた第２の名寄せ対象の説明においては、商品である第２の名寄せ対象の詳細を示す情報と、第２の名寄せ対象の金額とを含み、前記第２の学習用データセットにおいて関連付けられた推定対象の説明においては、推定対象の詳細を示す情報を含んでもよい。

【0008】

前記学習済みモデルは、汎用的な言語モデルに対して前記第１の学習用データセットに基づく前記名寄せタスクの学習と、前記第２の学習用データセットに基づく前記タイトル推論タスクと、を学習していてもよい。

【0009】

前記取得部は、前記第１の学習用データセット及び前記第２の学習用データセットを取得し、前記情報処理装置は、（１）前記取得部が取得した前記第１の学習用データセットに基づいて前記名寄せタスクと、（２）前記第２の学習用データセットに基づいて前記タイトル推論タスクと、を学習させた前記学習済みモデルを生成するとともに、学習させた前記学習済みモデルを前記記憶部に記憶する、学習部をさらに有してもよい。

【0010】

前記学習部は、単一の学習プロセスにおいて、前記第１の学習用データセットに基づく前記名寄せタスクと、前記第２の学習用データセットに基づく前記タイトル推論タスクと、を並行して学習させてもよい。

【0011】

本発明の第２の態様の情報処理方法においては、コンピュータが実行する、推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを取得する取得部と、記憶部が記憶する学習済みモデルであって、前記推論用データを入力すると、推論用データにおける第１の名寄せ対象と、前記推論用データにおける第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルであって、（１）第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられた第１の学習用データセットに基づいて、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を入力すると、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す情報を出力するタスクである名寄せタスクと、（２）推定対象の名称と推定対象の説明とが関連付けられた第２の学習用データセットに基づいて、前記推定対象の説明を入力として前記推定対象の名称を出力するタイトル推論タスクと、を学習した前記学習済みモデルに、前記推論用データを入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定するステップと、前記判定するステップにおいて判定された結果を出力するステップと、を有する。

【0012】

本発明の第３の態様のプログラムにおいては、コンピュータに、推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを取得する取得部と、記憶部が記憶する学習済みモデルであって、前記推論用データを入力すると、推論用データにおける第１の名寄せ対象と、前記推論用データにおける第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルであって、（１）第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられた第１の学習用データセットに基づいて、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を入力すると、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す情報を出力するタスクである名寄せタスクと、（２）推定対象の名称と推定対象の説明とが関連付けられた第２の学習用データセットに基づいて、前記推定対象の説明を入力として前記推定対象の名称を出力するタイトル推論タスクと、を学習した前記学習済みモデルに、前記推論用データを入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定するステップと、前記判定するステップにおいて判定された結果を出力するステップと、を実行させる。

【発明の効果】

【0013】

本発明によれば、汎用性を維持しながら名寄せタスクの判定精度を向上させることができる。

【図面の簡単な説明】

【0014】

【図1】情報処理システムＳの概要を説明するための図である。

【図2】学習用データセットの一例を示す図である。

【図3】情報処理装置１の構成を示すブロック図である。

【図4】学習部１３４における学習フローを説明するためのフローチャートである。

【図5】取得部１３１が取得するプロンプトの一例を示す図である。

【図6】情報処理装置１における処理の流れを示すフローチャートである。

【発明を実施するための形態】

【0015】

［情報処理システムＳの概要］
図１は、情報処理システムＳの概要を説明するための図である。図１（ａ）は、情報処理システムＳの構成を示す。情報処理システムＳは、名寄せを行うためのシステムである。名寄せは機械学習モデルが実行するタスクであり、与えられた複数の対象が一致するか否かを判定するタスクである。

【0016】

情報処理装置システムＳが名寄せする対象は、一例として商品又はサービスの名称であるがこれに限られない。情報処理システムＳは、法人名、人名又はこれら以外の名称を対象に名寄せを行ってもよい。情報処理システムＳは、情報処理装置１及び情報端末２を有する。情報処理装置１及び情報端末２はネットワークを介して通信可能に接続される。

【0017】

情報処理装置１は、名寄せを行うための装置である。情報処理装置１は、一例としてサーバである。情報処理装置１は、機械学習モデルを学習させ、名寄せ対象のデータが与えられると、機械学習モデルを用いて与えられたデータにおける対象が一致するか否かを判定する。

【0018】

情報端末２は、情報処理システムＳのユーザが利用する端末である。情報端末２は、一例として、情報処理装置１に学習又は推論に使用するデータセットを送信し、学習又は推論の実行を情報処理装置１に指示し、情報処理装置１から推論結果を受信し、表示部に表示させる。なお、情報処理装置１と情報端末２とは一体に構成されてもよい。すなわち、情報処理装置１が入出力インターフェースを備え、ユーザからの操作を受け付け、推論結果を表示する。

【0019】

図１（ｂ）を参照して情報処理システムＳにおける処理について説明する。情報処理装置１は、事前学習済みモデルＭ１を記憶している。事前学習済みモデルＭ１は、汎用的な言語モデルであり、大量のデータセットに基づいて自然言語処理タスクを実行可能に学習させた学習済みモデルである。情報処理装置１は、事前学習済みモデルＭ１に名寄せタスクとタイトル推論タスクとを学習させ、学習済みモデルＭ２を生成する。

【0020】

名寄せタスクは、名寄せを行う対象の複数の名寄せ対象の名称と、それぞれの名寄せ対象についての説明を示すテキストと、が与えられ、与えられた複数の名寄せ対象が一致するか否かを判定するタスクである。名寄せ対象の名称は、名寄せ対象の商品、自然人、法人等の名称を示す。名寄せ対象の説明は、当該名寄せ対象の性質を示す。例えば、名寄せ対象が商品である場合、名寄せ対象の説明には、当該商品の大きさ、色、機能、製造地、製造者、販売者、型番、動作環境、原材料、セールスポイント、価格等を含む。

【0021】

なお、名寄せ対象が自然人である場合、名寄せ対象の説明は、例えば、生年月日、出身地、出身校、職業、業績等の情報を含む。また、名寄せ対象が法人である場合、名寄せ対象の説明は、法人の住所、従業員数や設立年度等、沿革、役員の構成、売上高等の情報を含む。

【0022】

具体的には、情報処理装置１は、第１の学習用データセットに基づいて、事前学習済みモデルＭ１に名寄せタスクを学習させる。第１の学習用データセットの一例を図２（ａ）に示す。第１の学習用データセットにおいては、第１の学習用データセットにおいては、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明、第２の名寄せ対象の説明及び第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示すラベルが関連付けられている。

【0023】

タイトル推論タスクは、タイトルを推定する対象についての説明を示すテキストが与えられ、与えられたテキストが示す対象のタイトルを生成するタスクである。具体的には、情報処理装置１は、第２の学習用データセットに基づいて、事前学習済みモデルＭ１にタイトル推論タスクを学習させる。第２の学習用データセットの一例を図２（ｂ）に示す。第２の学習用データセットにおいては、推定対象の名称と推定対象の説明とが関連付けられている。

【0024】

第２の学習用データセットにおいては、様々な商品、型番、ブランド、地名又は法人の名称等の固有表現を説明又はタイトルとして含むデータセットに基づいて学習させると特に好適である。タイトル推論タスクを学習させることにより、説明中に使用される、タイトルに影響を与えうる固有表現を学習済みモデルＭ２に学習させることができる。これにより、名寄せの結果に影響を与える本文中の重要な表現をモデルが認識できるようになる。その結果、モデルの汎用性を損なうことなく名寄せタスクの精度が向上するという効果を期待できる。

【0025】

学習済みモデルＭ２は、推論用データＤ１を入力すると、入力された推論用データに対応する判定結果Ｄ２を出力するよう学習されている。推論用データＤ１は、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられている。判定結果Ｄ２は、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを示す。

【0026】

情報処理装置１は、推論用データＤ１を学習済みモデルＭ２に入力し、判定結果Ｄ２を出力させる。

【0027】

情報処理システムＳがこのように構成されることで、汎用性を維持しながら名寄せタスクの判定精度を向上させることができるという効果を奏する。

【0028】

［情報処理装置１の構成］
図３は、情報処理装置１の構成を示すブロック図である。情報処理装置１は、通信部１１、記憶部１２及び制御部１３を有する。制御部１３は、取得部１３１、判定部１３２、出力部１３３及び学習部１３４を有する。

【0029】

通信部１１は、ネットワークを介して他の装置とデータの送受信をするための通信インターフェースである。記憶部１２は、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ＳＳＤ（Solid State Drive）、ハードディスクドライブ等を含む記憶媒体である。記憶部１２は、制御部１３が実行するプログラムを予め記憶している。記憶部１２は、事前学習済みモデルＭ１及び学習済みモデルＭ２を記憶する。

【0030】

制御部１３は、例えばＣＰＵ（Central Processing Unit）等のプロセッサである。制御部１３は、記憶部１２に記憶されたプログラムを実行することにより、取得部１３１、判定部１３２、出力部１３３及び学習部１３４として機能する。

【0031】

取得部１３１は、推論用データＤ１を取得する。取得部１３１は、一例として情報端末２から推論用データＤ１を取得する。取得部１３１は、推論用データＤ１を記憶部１２から取得してもよいし、不図示の外部装置から取得してもよい。取得部１３１は、第１の学習用データセット及び第２の学習用データセットを取得し、学習部１３４に出力してもよい。

【0032】

判定部１３２は、取得した推論用データを学習済みモデルＭ２に入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定する。出力部１３３は、判定部１３２が判定した判定結果Ｄ２を出力する。出力部１３３は、一例として、判定結果Ｄ２を情報端末２の表示部に表示させる。

【0033】

情報処理装置１が名寄せする対象が商品である場合には、商品の金額を含むデータセット基づいて名寄せが行われてもよい。

【0034】

推論用データ及び第１の学習用データセットにおいて関連付けられた第１の名寄せ対象の説明においては、商品である第１の名寄せ対象の詳細を示す情報と、第１の名寄せ対象の金額とを含む。推論用データ及び第１の学習用データセットにおいて関連付けられた第２の名寄せ対象の説明においては、商品である第２の名寄せ対象の詳細を示す情報と、第２の名寄せ対象の金額とを含む。

【0035】

なお、名寄せタスクにおいて商品の金額を含むデータセットを使用する場合であってもタイトル推論タスクにおいては商品の金額を学習に用いなくてもよい。すなわち、第２の学習用データセットにおいて関連付けられた推定対象の説明においては、推定対象の詳細を示す情報を含む。これは、商品の金額が名寄せタスクの結果に与える影響が大きい一方で、商品の金額がタイトル推論タスクの結果に与える影響が相対的に小さいためである。

【0036】

このように名寄せ対象の商品の金額を含む情報に基づいて名寄せを行うことにより、名寄せの精度を向上させることができる。

【0037】

学習部１３４は、取得部１３１が取得した第１の学習用データセット及び第２の学習用データセットに基づいて、事前学習済みモデルＭ１を学習させ、事前学習済みモデルＭ１のパラメータを更新することにより学習済みモデルＭ２を生成し、生成した学習済みモデルＭ２を記憶部１２に記憶させる。なお、学習部１３４は、学習済みモデルＭ２に名寄せタスク又はタイトル推論タスクを追加学習させてもよい。

【0038】

具体的には、学習部１３４は、第１の学習用データセットに基づいて事前学習済みモデルＭ１を学習させる。具体的には、学習部１３４は、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明を事前学習済みモデルＭ１に入力し、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを示す判定結果を出力させる。学習部１３４は、事前学習済みモデルＭ１が出力した判定結果と、第１の学習用データセットに含まれるラベルと、に基づいて損失を計算し、計算した損失に基づいて事前学習済みモデルＭ１のパラメータを更新し、事前学習済みモデルＭ１を学習させる。

【0039】

学習部１３４は、第２の学習用データセットに含まれる推定対象の説明を事前学習済みモデルＭ１に入力し、入力した説明に対応する推定対象の名称を出力させる。学習部１３４は、事前学習済みモデルＭ１が出力した推定対象の名称と、第２の学習用データセットに含まれる教師データとしての推定対象の名称と、のに基づいて損失を計算し、計算した損失に基づいて事前学習済みモデルＭ１のパラメータを更新し、事前学習済みモデルＭ１を学習させる。

【0040】

名寄せタスクの学習とタイトル推論タスクの学習は同時に実行されてもよい。学習部１３４は、単一の学習プロセスにおいて、第１の学習用データセットに基づく名寄せタスクと、第２の学習用データセットに基づくタイトル推論タスクと、を並行して学習させてもよい。図４は、この場合における学習フローを説明するためのフローチャートである。図４に示すフローチャートは、情報処理装置１が情報端末２から学習を開始する指示を取得した時点から開始している。

【0041】

取得部１３１は、第１の学習用データセットを取得する（Ｓ０１）。取得部１３１は、第２の学習用データセットを取得する（Ｓ０２）。学習部１３４は、終了条件を判定する（Ｓ０３）。終了条件は、例えば所定の回数学習を行ったことである。

【0042】

終了条件を満たさない場合（Ｓ０３におけるＮＯ）、学習部１３４は、第１の学習用データセットに基づいて事前学習済みモデルＭ１に名寄せタスクを実行させ、結果を出力させる（Ｓ０４）。学習部１３４は、第２の学習用データセットに基づいて事前学習済みモデルＭ１にタイトル推論タスクを実行させ、結果を出力させる（Ｓ０５）。

【0043】

学習部１３４は、事前学習済みモデルＭ１が名寄せタスクにおいて出力した結果と、第１の学習用データセットにおいて関連付けられたラベルに基づいて損失を計算する（Ｓ０６）。また、学習部１３４は、事前学習済みモデルＭ１がタイトル推論タスクにおいて出力した結果と、第２の学習用データセットにおいて関連付けられた教師データとしての推定対象の名称と、に基づいて損失を計算する（Ｓ０６）。

【0044】

学習部１３４は、計算した損失に基づいて事前学習済みモデルＭ１のパラメータを更新する（Ｓ０７）。一例として、学習部１３４は、計算した損失に基づいてタイトル推論タスクにおける勾配と名寄せタスクにおける勾配とを計算し、タイトル推論タスクにおける勾配と名寄せタスクにおける勾配の平均値に基づいてパラメータを更新する。

【0045】

なお、１ステップ当たりにパラメータをどの程度更新するかは、タイトル推論タスクと名寄せタスクとで異なっていてもよい。すなわち、それぞれの勾配にそれぞれ異なる所定の係数を乗じてパラメータの更新量を算出してもよいし、タイトル推論タスクと名寄せタスクとで異なる学習率が設定されていてもよい。情報処理装置１は、処理をＳ０３に進める。

【0046】

終了条件を満たす場合（Ｓ０３におけるＹＥＳ）、パラメータの更新が完了した事前学習済みモデルＭ１である学習済みモデルＭ２を記憶部１２に記憶させる（Ｓ０８）。そして、情報処理装置１は、処理を終了する。

【0047】

自然言語により記述されたプロンプト（命令）に含まれる推論用データを取得するよう取得部１３１が構成されてもよい。一例として、取得部１３１は、情報端末２にプロンプトを受付けるための画面を表示し、情報端末２から自然言語で記述されたプロンプトを取得する。図５は、取得部１３１が取得するプロンプトの一例を示す。図５に示すようにプロンプトにおいては、実行するタスクの内容の指示（Ｐ１）、第１の名寄せ対象（Ｐ２）、第２の名寄せ対象（Ｐ３）を含む。第１の名寄せ対象（Ｐ２）及び第２の名寄せ対象はそれぞれ、名称（Ｐ２１、Ｐ３１）及び説明（Ｐ２２及びＰ３２）を含む。

【0048】

この場合、学習済みモデルＭ２は、プロンプトを入力として、プロンプトに含まれる実行すべきタスク内容を特定し、特定したタスクの内容が名寄せタスクである場合にプロンプトに含まれる推論用データに基づいて名寄せタスクを実行するよう学習されている。

【0049】

［情報処理装置１における処理の流れ］
図６は、情報処理装置１における処理の流れを示すフローチャートである。図６に示すフローチャートは、情報端末２から推論を行う指示を受付けた時点から開始している。

【0050】

取得部１３１は、推論データを取得する（Ｓ１１）。取得部１３１は、推論データを学習済みモデルＭ２に入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定する（Ｓ１２）。出力部１３３は、学習済みモデルＭ２が出力した判定結果を出力する（Ｓ１３）。一例として、出力部１３３は、学習済みモデルＭ２が出力した判定結果を情報端末２に表示させる。そして、情報処理装置１は処理を終了する。

【0051】

［本実施の形態における効果］
以上説明したとおり、情報処理装置１は、タイトル推論タスクと名寄せタスクを学習させることにより、特定のタスクに特化させることなく、汎用性を維持しながら名寄せタスクの判定精度を向上させることができる。

【0052】

以上、実施の形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。

【符号の説明】

【0053】

１情報処理装置
２情報端末
１１通信部
１２記憶部
１３制御部
１３１取得部
１３２判定部
１３３出力部
１３４学習部

【要約】

推論用のデータセットであって、第１の名寄せ対象の名称、第２の名寄せ対象の名称、第１の名寄せ対象の説明及び第２の名寄せ対象の説明が関連付けられた推論用データを入力すると、第１の名寄せ対象と、第２の名寄せ対象と、が一致するか否かを示す情報を出力する学習済みモデルＭであって、第１の名寄せ対象と第２の名寄せ対象とが一致するか否かを出力するタスクである名寄せタスクと、推定対象の説明を入力として推定対象の名称を出力するタイトル推論タスクと、を学習した学習済みモデルＭを記憶する記憶部１２と、推論用データを取得する取得部１３１と、取得した推論用データを学習済みモデルＭに入力し、推論用データにおける第１の名寄せ対象と、推論用データにおける第２の名寄せ対象と、が一致するか否かを判定する判定部１３２と、判定部１３２が判定した結果を出力する出力部１３３と、を有する情報処理装置１である。

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版