特開2024-145589 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士フイルム株式会社の特許一覧

特開2024-145589情報処理装置、情報処理方法、及び情報処理プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024145589

(43)【公開日】2024-10-15

(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム

(51)【国際特許分類】

G06F 40/289 20200101AFI20241004BHJP

G06F 40/216 20200101ALI20241004BHJP

【ＦＩ】

G06F40/289

G06F40/216

【審査請求】未請求

【請求項の数】13

【出願形態】ＯＬ

(21)【出願番号】P 2023058014

(22)【出願日】2023-03-31

(71)【出願人】

【識別番号】306037311

【氏名又は名称】富士フイルム株式会社

(74)【代理人】

【識別番号】110001519

【氏名又は名称】弁理士法人太陽国際特許事務所

(72)【発明者】

【氏名】三沢翔太郎

(72)【発明者】

【氏名】狩野竜示

(72)【発明者】

【氏名】鑓水大和

(72)【発明者】

【氏名】谷口友紀

(72)【発明者】

【氏名】小野田浩平

(57)【要約】

【課題】文書データを適切な区切り位置で区切ることができる情報処理装置、情報処理方法、及び情報処理プログラムを得る。
【解決手段】情報処理装置は、第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、第１の文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、第１の文字列集合を構成する各文字列の評価値を導出し、導出した評価値に基づいて、第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する。
【選択図】図７

【特許請求の範囲】

【請求項1】

少なくとも一つのプロセッサを備える情報処理装置であって、
前記プロセッサは、
第１の文書データを取得し、
前記第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、
前記第１の文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記第１の文字列集合を構成する各文字列の評価値を導出し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する
情報処理装置。

【請求項2】

前記プロセッサは、
前記第１の文書データをそれぞれ異なる長さで区切ることによって複数の前記第１の文字列集合を生成し、
前記評価値に基づいて、前記複数の前記第１の文字列集合のうちの何れかを前記生成モデルの正解データとして選択する
請求項１に記載の情報処理装置。

【請求項3】

前記プロセッサは、
前記第１の文字列集合の評価値として、前記第１の文字列集合を構成する各文字列の評価値の合計値を導出し、
前記第１の文字列集合に含まれるが前記第２の文書データに含まれない文字列の分量、及び前記第２の文書データに含まれるが前記第１の文字列集合に含まれない文字列の分量の少なくとも一方に応じて、導出した前記第１の文字列集合の評価値を減少させる
請求項２に記載の情報処理装置。

【請求項4】

前記プロセッサは、
前記第１の文書データを区切る処理を、区切る長さを異ならせながら繰り返し行うことによって１つの前記第１の文字列集合を生成し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を重複する箇所がない状態で前記生成モデルの正解データとして選択する
請求項１に記載の情報処理装置。

【請求項5】

前記評価値は、第１の文字列集合を構成する各文字列と、第２の文書データとの一致度が高いほど評価が高くなる値である
請求項１から請求項４の何れか１項に記載の情報処理装置。

【請求項6】

前記評価値は、第１の文字列集合を構成する各文字列が長いほど評価が高くなる値である
請求項１から請求項４の何れか１項に記載の情報処理装置。

【請求項7】

前記プロセッサは、
前記生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する第２の文字列集合を生成し、
前記第２の文字列集合と、前記第１の文字列集合の中から選択した複数の文字列との誤差が最小化されるように前記生成モデルを学習させる
請求項１から請求項４の何れか１項に記載の情報処理装置。

【請求項8】

第１の文書データを取得し、
前記第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、
前記第１の文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記第１の文字列集合を構成する各文字列の評価値を導出し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する
処理を情報処理装置が備えるプロセッサが実行する情報処理方法。

【請求項9】

【請求項10】

少なくとも一つのプロセッサを備える情報処理装置であって、
前記プロセッサは、
第１の文書データを取得し、
文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する文字列集合を生成し、
生成した文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記文字列集合の評価値を、前記生成モデルを強化学習させる際の報酬として導出する
情報処理装置。

【請求項11】

前記プロセッサは、
前記文字列集合と、前記第２の文書データとを用いて、前記文字列集合を構成する各文字列の評価値を導出し、
前記文字列集合の評価値として、前記文字列集合を構成する各文字列の評価値の合計値を導出し、
前記文字列集合に含まれるが前記第２の文書データに含まれない文字列の分量、及び前記第２の文書データに含まれるが前記文字列集合に含まれない文字列の分量の少なくとも一方に応じて、導出した前記文字列集合の評価値を減少させる
請求項１０に記載の情報処理装置。

【請求項12】

第１の文書データを取得し、
文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する文字列集合を生成し、
生成した文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記文字列集合の評価値を、前記生成モデルを強化学習させる際の報酬として導出する
処理を情報処理装置が備えるプロセッサが実行する情報処理方法。

【請求項13】

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

【背景技術】

【0002】

特許文献１には、文書から要約を生成する要約装置において、文書を解析して文書データを生成し、生成した文書データから、重要スコアが高い複数の文を重要文として抽出する技術が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０１９－１２１１３９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

例えば、文書データの文字列に対してユーザがコピー操作を行う際に、ユーザはコピーしたい文字列の範囲を選択することを行う。この際、ユーザが文書データの特定の位置にマウスカーソルを合わせた場合等、ユーザが文書データの特定の箇所を指定した場合、ユーザが所望する文字列の範囲を自動的に選択することができると、ユーザの操作を支援するうえで好ましい。すなわち、文書データをユーザが所望する適切な区切り位置で区切ることが好ましい。

【0005】

しかしながら、特許文献１に記載の技術では、形態素解析及び構文解析等の予め設定されたルールに従って文書データを区切っているため、文書データを適切な区切り位置で区切ることができない場合があった。

【0006】

本開示は、以上の事情を鑑みてなされたものであり、文書データを適切な区切り位置で区切ることができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

本開示の情報処理装置は、少なくとも一つのプロセッサを備える情報処理装置であって、プロセッサは、第１の文書データを取得し、第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、第１の文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、第１の文字列集合を構成する各文字列の評価値を導出し、導出した評価値に基づいて、第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する。

【0008】

また、本開示の情報処理方法は、第１の文書データを取得し、第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、第１の文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、第１の文字列集合を構成する各文字列の評価値を導出し、導出した評価値に基づいて、第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する処理を情報処理装置が備えるプロセッサが実行するものである。

【0009】

また、本開示の情報処理プログラムは、第１の文書データを取得し、第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、第１の文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、第１の文字列集合を構成する各文字列の評価値を導出し、導出した評価値に基づいて、第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する処理を情報処理装置が備えるプロセッサに実行させるためのものである。

【0010】

また、本開示の情報処理装置は、少なくとも一つのプロセッサを備える情報処理装置であって、プロセッサは、第１の文書データを取得し、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して第１の文書データを入力することによって第１の文書データに対応する文字列集合を生成し、生成した文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、文字列集合の評価値を、生成モデルを強化学習させる際の報酬として導出する。

【0011】

また、本開示の情報処理方法は、第１の文書データを取得し、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して第１の文書データを入力することによって第１の文書データに対応する文字列集合を生成し、生成した文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、文字列集合の評価値を、生成モデルを強化学習させる際の報酬として導出する処理を情報処理装置が備えるプロセッサが実行するものである。

【0012】

また、本開示の情報処理プログラムは、第１の文書データを取得し、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して第１の文書データを入力することによって第１の文書データに対応する文字列集合を生成し、生成した文字列集合と、第１の文書データから目的に沿って作成された第２の文書データとを用いて、文字列集合の評価値を、生成モデルを強化学習させる際の報酬として導出する処理を情報処理装置が備えるプロセッサに実行させるためのものである。

【発明の効果】

【0013】

本開示によれば、文書データを適切な区切り位置で区切ることができる。

【図面の簡単な説明】

【0014】

【図1】情報処理装置のハードウェア構成の一例を示すブロック図である。

【図2】生成モデルを説明するための図である。

【図3】変形例に係る生成モデルを説明するための図である。

【図4】第１の文書データ及び第２の文書データの一例を示す図である。

【図5】第１実施形態に係る学習フェーズにおける情報処理装置の機能的な構成の一例を示すブロック図である。

【図6】第１実施形態に係る第１の文字列集合の生成処理を説明するための図である。

【図7】評価値の導出処理を説明するための図である。

【図8】第１実施形態に係る学習処理の一例を示すフローチャートである。

【図9】運用フェーズにおける情報処理装置の機能的な構成の一例を示すブロック図である。

【図10】表示画面の一例を示す図である。

【図11】変形例に係る表示画面の一例を示す図である。

【図12】変形例に係る表示画面の一例を示す図である。

【図13】変形例に係る表示画面の一例を示す図である。

【図14】変形例に係る表示画面の一例を示す図である。

【図15】変形例に係る表示画面の一例を示す図である。

【図16】操作支援処理の一例を示すフローチャートである。

【図17】第２実施形態に係る学習フェーズにおける情報処理装置の機能的な構成の一例を示すブロック図である。

【図18】第２実施形態に係る第１の文字列集合の生成処理を説明するための図である。

【図19】文字列の選択処理を説明するための図である。

【図20】第２実施形態に係る学習処理の一例を示すフローチャートである。

【図21】第３実施形態に係る学習フェーズにおける情報処理装置の機能的な構成の一例を示すブロック図である。

【図22】第３実施形態に係る学習処理の一例を示すフローチャートである。

【図23】変形例に係る文字列集合の提示処理を説明するための図である。

【図24】変換モデルを説明するための図である。

【発明を実施するための形態】

【0015】

以下、図面を参照して、本開示の技術を実施するための形態例を詳細に説明する。

【0016】

［第１実施形態］
まず、図１を参照して、本実施形態に係る情報処理装置１０のハードウェア構成を説明する。情報処理装置１０の例としては、パーソナルコンピュータ又はサーバコンピュータ等のコンピュータが挙げられる。図１に示すように、情報処理装置１０は、ＣＰＵ（Central Processing Unit）２０、メモリ２１、記憶部２２、ディスプレイ２３、入力装置２４、及びネットワークＩ／Ｆ（InterFace）２５を含む。

【0017】

ＣＰＵ２０は、後述する記憶部２２に記憶されるプログラムを実行することにより、後述する機能的な構成を実現する。ＣＰＵ２０は、開示の技術に係るプロセッサの一例である。

【0018】

メモリ２１は、記憶部２２及びＲＡＭ(Random Access Memory)２６を含む。ＲＡＭ２６は、一次記憶用のメモリであり、例えば、ＳＲＡＭ（Static Random Access Memory）又はＤＲＡＭ(Dynamic Random Access Memory)等のＲＡＭである。

【0019】

記憶部２２は、不揮発性のメモリであり、例えば、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、及びフラッシュメモリ等の少なくとも１つによって実現される。記憶媒体としての記憶部２２には、情報処理プログラム３０が記憶される。ＣＰＵ２０は、記憶部２２から情報処理プログラム３０を読み出してからメモリ２１に展開し、展開した情報処理プログラム３０を実行する。

【0020】

また、記憶部２２には、生成モデル３２、文書データ３４、及び文書データ３６が記憶される。文書データ３４は、開示の技術に係る第１の文書データの一例であり、文書データ３６は、開示の技術に係る第２の文書データの一例である。

【0021】

ディスプレイ２３は、各種画面を表示する装置であり、例えば、液晶ディスプレイ又はＥＬ（Electro Luminescence）ディスプレイである。入力装置２４は、ユーザが入力を行うための装置であり、例えば、キーボード、マウス、音声入力用のマイク、接触を含む近接入力用のタッチパッド、ジェスチャー入力用のカメラの少なくともいずれかである。ネットワークＩ／Ｆ２５は、ネットワークに接続するためのインタフェースである。バス２７は、ＣＰＵ２０、メモリ２１、記憶部２２、ディスプレイ２３、入力装置２４、及びネットワークＩ／Ｆ２５を接続する。

【0022】

図２に示すように、生成モデル３２は、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする。本実施形態では、生成モデル３２は、入力の文書データから異なる複数の文字列を抽出することによって文字列集合を出力する場合について説明するが、開示の技術はこの態様に限定されない。例えば、図３に示すように、生成モデル３２は、入力の文書データに対して区切り位置を表す記号（図３の例では＜ＳＥＰ＞）を挿入することによって、区切り位置で区切られた異なる複数の文字列を含む文字列集合を出力してもよい。生成モデル３２は、後述する学習フェーズにおいて、所望の区切り位置で区切られた文字列集合が出力されるように学習される。

【0023】

文書データ３４は、ソースの文書データである。図４に示すように、文書データ３６は、文書データ３４から目的に沿って作成された文書データである。本実施形態では、文書データ３６は、文書データ３４が要約された文書データである。例えば、文書データ３６は、ユーザによって作成される。

【0024】

次に、図５を参照して、学習フェーズにおける情報処理装置１０の機能的な構成について説明する。図５に示すように、情報処理装置１０は、取得部４０、第１生成部４２、導出部４４、選択部４６、第２生成部４８、及び学習部５０を含む。ＣＰＵ２０が情報処理プログラム３０を実行することにより、取得部４０、第１生成部４２、導出部４４、選択部４６、第２生成部４８、及び学習部５０として機能する。

【0025】

取得部４０は、文書データ３４を記憶部２２から取得する。第１生成部４２は、文書データ３４を異なる長さで区切ることによって文字列集合（以下、「第１の文字列集合」という）を生成する。図６に示すように、本実施形態に係る第１生成部４２は、文書データ３４をそれぞれ異なる長さで区切ることによって複数の第１の文字列集合を生成する。具体的には、第１生成部４２は、例えば、１単語ずつ、３単語ずつのように、それぞれ異なる長さの単位で文書データ３４を区切ることによって複数の第１の文字列集合を生成する。すなわち、１つの第１の文字列集合に含まれる文字列同士は重複する部分が含まれない。また、第１の文字列集合Ａに含まれる文字列と第１の文字列集合Ｂに含まれる文字列との間では、重複する部分が含まれるが文字列の長さが異なる。

【0026】

導出部４４は、第１生成部４２により生成された第１の文字列集合と、文書データ３６とを用いて、第１の文字列集合を構成する各文字列の評価値を導出する。具体的には、図７に示すように、導出部４４は、文書データ３６を文単位で分割し、文書データ３６に含まれる各文の第１の文字列集合を構成する文字列に対する一致度の最大値をその文字列の評価値として導出する。すなわち、この評価値は、第１の文字列集合を構成する各文字列と、文書データ３６との一致度が高いほど評価が高くなる値である。この一致度の例としては、編集距離、ＢＬＥＵ（BiLingual Evaluation Understudy）、ＲＯＵＧＥ（Recall-Oriented Understudy for Gisting Evaluation）、又はＢＥＲＴ（Bidirectional Encoder Representations from Transformers）スコア等が挙げられる。そして、導出部４４は、第１の文字列集合の評価値として、第１の文字列集合を構成する各文字列の評価値の合計値を導出する。

【0027】

選択部４６は、導出部４４により導出された評価値に基づいて、第１生成部４２により生成された複数の第１の文字列集合のうちの何れかを生成モデル３２の正解データとして選択する。本実施形態では、選択部４６は、第１生成部４２により生成された複数の第１の文字列集合の中から、導出部４４により導出された評価値が最も大きい文字列集合を生成モデル３２の正解データとして選択する。

【0028】

なお、第１の文字列集合の評価値は、第１の文字列集合を構成する各文字列が長いほど評価が高くなる値であってもよい。例えば、導出部４４は、前述したように導出した第１の文字列集合の評価値を、第１の文字列集合に含まれる文字列の個数で除算することによって第１の文字列集合の新たな評価値を導出してもよい。第１の文字列集合に含まれる文字列の個数は、第１の文字列集合を構成する各文字列が長いほど小さい値となる。このように、導出部４４は、文字列の個数で除算することによって、第１の文字列集合を構成する各文字列が長いほど評価値を大きい値としてもよい。また、導出部４４は、文字列を構成する文字数が多いほど評価値を大きい値としてもよい。また、導出部４４は、基準文字数を設け、文字列を構成する文字数と基準文字数との差分に応じて減点することによって評価値を導出してもよい。また、生成モデル３２を異なる基準文字数ごとに用意していてもよい。この場合、導出部４４は、ユーザの過去の選択履歴における文字数に最も近い基準文字数に対応する生成モデル３２を選択する。この場合の選択履歴における文字数は、平均値又は中央値等の統計値であってもよい。

【0029】

また、第１の文字列集合を構成する各文字列の評価値として、文書データ３６の各文に対する精度及び再現率の少なくとも一方を用いてもよい。ここでいう精度とは、第１の文字列集合を構成する文字列の内容が文書データ３６の文にどの程度網羅されているかを表す指標値である。また、ここでいう再現率とは、文書データ３６の文の内容が第１の文字列集合を構成する文字列にどの程度網羅されているかを表す指標値である。

【0030】

第２生成部４８は、取得部４０により取得された文書データ３４を生成モデル３２に対して入力することによって文書データ３４に対応する文字列集合（以下、「第２の文字列集合」という）を生成する。

【0031】

学習部５０は、第２生成部４８により生成された第２の文字列集合と、選択部４６により選択された第１の文字列集合との誤差が最小化されるように生成モデル３２を学習させる。

【0032】

次に、図８を参照して、学習フェーズにおける情報処理装置１０の作用を説明する。ＣＰＵ２０が情報処理プログラム３０を実行することによって、図８に示す学習処理が実行される。図８に示す学習処理は、例えば、ユーザにより実行開始の指示が入力された場合に実行される。

【0033】

図８のステップＳ１０で、取得部４０は、文書データ３４を記憶部２２から取得する。ステップＳ１２で、第１生成部４２は、前述したように、ステップＳ１０で取得された文書データ３４を異なる長さで区切ることによって第１の文字列集合を生成する。

【0034】

ステップＳ１４で、導出部４４は、前述したように、ステップＳ１２で生成された第１の文字列集合と、文書データ３６とを用いて、第１の文字列集合を構成する各文字列の評価値を導出する。また、導出部４４は、導出した評価値の合計値を第１の文字列集合の評価値として導出する。

【0035】

ステップＳ１６で、選択部４６は、前述したように、ステップＳ１４で導出された評価値に基づいて、ステップＳ１２で生成された複数の第１の文字列集合のうちの何れかを生成モデル３２の正解データとして選択する。

【0036】

ステップＳ１８で、第２生成部４８は、ステップＳ１０で取得された文書データ３４を生成モデル３２に対して入力することによって文書データ３４に対応する第２の文字列集合を生成する。ステップＳ２０で、学習部５０は、ステップＳ１８で生成された第２の文字列集合と、ステップＳ１６で選択された第１の文字列集合との誤差が最小化されるように生成モデル３２を学習させる。ステップＳ２０の処理が終了すると、学習処理が終了する。この学習処理が異なる複数の文書データ３４及び文書データ３６の組み合わせのそれぞれについて実行されることにより、生成モデル３２の精度が向上する。

【0037】

次に、図９を参照して、運用フェーズにおける情報処理装置１０の機能的な構成について説明する。図９に示すように、情報処理装置１０は、第３生成部６０、受付部６２、特定部６４、及び提示部６６を含む。ＣＰＵ２０が情報処理プログラム３０を実行することにより、第３生成部６０、受付部６２、特定部６４、及び提示部６６として機能する。

【0038】

第３生成部６０は、処理対象の文書データを生成モデル３２に対して入力することによって、文字列集合を生成する。処理対象の文書データとは、例えば、ユーザが参照中の文書データである。

【0039】

受付部６２は、ユーザにより指定された文書データ内の位置を受け付ける。ユーザは、例えば、文書データの所定の位置にマウスカーソルを合わせる操作、及び文書データの所定の位置をクリックする操作等を行うことによって、文書データ内の所定の位置を指定する。

【0040】

特定部６４は、第３生成部６０により生成された文字列集合に含まれる文字列の中から、受付部６２により受け付けられた位置に記載されている文字列を特定する。

【0041】

提示部６６は、特定部６４により特定された文字列をユーザに提示する。一例として図１０に示すように、提示部６６は、ディスプレイ２３に表示された文書データにおいて、特定部６４により特定された文字列を範囲選択した状態にすることによって、その文字列をユーザに提示する。これにより、ユーザによるコピー操作の際の文字列を選択する操作の手間を低減することができる。また、この際の文字列は、前述した学習フェーズにより学習された生成モデル３２により生成されるため、適切な区切り位置で区切られたものである。従って、ユーザの操作を効果的に支援することができる。

【0042】

なお、提示部６６は、文書データ上の特定された文字列を、それ以外の文字列に対して相対的に強調される表示を行うことでユーザに提示することを例示したが、開示の技術はこの態様に限定されない。例えば、提示部６６は、特定された文字列をポップアップ表示等のように文書データとは異なる表示枠で表示しても良い。また、提示部６６は、文書データの表示画面と、サマリ文書等の新規文書作成画面とが表示される画面において、文書データの表示画面を指定すると、新規文書作成画面上に特定された文字列が記載されるようにしても良い。例えば、図１１に示すように、文書データを表示する文書データ表示画面と、サマリ文書等の新規文書を作成するための新規文書作成画面を有する表示画面が提示され、文書データ表示画面上でポインタ等による位置の指定を受け付けると、図１２に示すように、提示部６６は、新規文書作成画面上に上記位置に記載された特定された文字列を編集可能な文字列として提示する。図１３に示すように、提示部６６は、ユーザにより入力装置２４を介した確定選択を受け付けることで、選択された文字列を新規文書の一部として保存しても良い。なお、図１２及び図１３の例示では、新規文書作成画面における編集可能な文字列が破線で囲まれた表示態様とし、確定された文字列が破線で囲まれない表示態様としたが、編集可能な文字列と確定された文字列が区別出来れば、表示態様はこの例に限定されない。

【0043】

さらに、生成モデル３２は、複数の異なる区切り位置候補と、その複数の区切り位置候補それぞれの確信度を出力するようにしても良い。例えば、生成モデル３２は、「７／７（水）工場Ａグループ２」の確信度９０％、「７／７（水）」の確信度７０％、「７／７（水）工場Ａ」の確信度５０％を出力しても良い。また、第３生成部６０は、学習用データ生成時における分割する際のシード又は文字列の長さに対する重みづけ等の条件を変えた生成モデル３２を複数有し、生成モデル３２毎に複数の異なる区切り位置候補を出力しても良い。この場合、特定部６４は、ユーザにより指定された位置に応じて、複数の異なる文字列を特定する。提示部６６は、特定部６４により特定された複数の異なる文字列をユーザに提示しても良い。例えば、図１４及び図１５に示すように、提示部６６は、特定された複数の異なる長さの文字列をユーザに提示する。この際に、提示部６６は、最も優先度の高い生成モデル３２が導出した区切り位置候補、又は、最も確信度の高い区切り位置候補に対応する特定された文字列を選択した状態で提示し、マウスのクリック操作等のユーザによる切り替え操作を受け付ける事で、選択中の区切り位置候補とは異なる区切り位置候補に対応する特定された文字列を選択することができるようにしてもよい。なお、文字列を選択することとは、文字列をコピーして、サマリ文書へのペースト操作によりサマリ文書へ反映出来る状態にすること、及びサマリ文書へ編集可能な状態で反映することを含む。図１４及び図１５の例示では、特定された複数の異なる文字列をポップアップウィンドウによって提示する表示態様を示しているが、表示態様はこの例に限定されない。また、図１４及び図１５の例示では、選択中の文字列が破線で囲まれた表示態様としたが、選択中の文字列と非選択中の文字列が区別することが出来れば、表示態様はこの例に限定されない。

【0044】

次に、図１６を参照して、運用フェーズにおける情報処理装置１０の作用を説明する。ＣＰＵ２０が情報処理プログラム３０を実行することによって、図１６に示す操作支援処理が実行される。図１６に示す操作支援処理は、例えば、文書データをダブルクリックする操作等の文書データのファイルが開かれる操作がユーザにより行われた場合に、その文書データを処理対象として実行される。

【0045】

図１６のステップＳ３０で、第３生成部６０は、処理対象の文書データを生成モデル３２に対して入力することによって、文字列集合を生成する。ステップＳ３２で、受付部６２は、ユーザにより指定された文書データ内の位置を受け付ける。

【0046】

ステップＳ３４で、特定部６４は、ステップＳ３０で生成された文字列集合に含まれる文字列の中から、ステップＳ３２で受け付けられた位置に記載されている文字列を特定する。ステップＳ３６で、提示部６６は、前述したように、ステップＳ３４で特定された文字列をユーザに提示する。ステップＳ３６の処理が終了すると、操作支援処理が終了する。

【0047】

以上説明したように、本実施形態によれば、文書データを適切な区切り位置で区切ることができる。この結果、ユーザの操作を効果的に支援することができる。

【0048】

［第２実施形態］
開示の技術の第２実施形態を説明する。なお、本実施形態に係る情報処理装置１０のハードウェア構成は、第１実施形態と同一であるため、説明を省略する。

【0049】

図１７を参照して、学習フェーズにおける情報処理装置１０の機能的な構成について説明する。第１実施形態に係る情報処理装置１０と同一の機能を有する機能部については、同一の符号を付して説明を省略する。図１７に示すように、情報処理装置１０は、取得部４０、第１生成部４２Ａ、導出部４４Ａ、選択部４６Ａ、第２生成部４８、及び学習部５０を含む。ＣＰＵ２０が情報処理プログラム３０を実行することにより、取得部４０、第１生成部４２Ａ、導出部４４Ａ、選択部４６Ａ、第２生成部４８、及び学習部５０として機能する。

【0050】

第１生成部４２Ａは、文書データ３４を異なる長さで区切ることによって第１の文字列集合を生成する。図１８に示すように、本実施形態に係る第１生成部４２Ａは、文書データ３４を区切る処理を、区切る長さを異ならせながら繰り返し行うことによって１つの第１の文字列集合を生成する。具体的には、第１生成部４２Ａは、例えば、１単語ずつ文書データ３４を区切る処理及び３単語ずつ文書データ３４を区切る処理のように、ある長さの単位で文書データ３４を区切る処理を、長さを異ならせながら繰り返し行うことによって１つの第１の文字列集合を生成する。すなわち、１つの第１の文字列集合に含まれる文字列には、重複する部分を含むが長さが異なる文字列が含まれる。

【0051】

導出部４４Ａは、第１生成部４２Ａにより生成された第１の文字列集合と、文書データ３６とを用いて、第１の文字列集合を構成する各文字列の評価値を導出する。この評価値の導出処理は、第１実施形態と同じであるため、説明を省略する。

【0052】

選択部４６Ａは、導出部４４Ａにより導出された評価値に基づいて、第１生成部４２Ａにより生成された第１の文字列集合の中から、複数の文字列を重複する箇所がない状態で生成モデル３２の正解データとして選択する。

【0053】

具体的には、図１９に示すように、まず、選択部４６Ａは、第１生成部４２Ａにより生成された第１の文字列集合の中から、重複する箇所がない複数の文字列の組み合わせを列挙する。図１９では、第１の文字列集合に含まれる文字列は、短・中・長の３段階で区切られた例を示している。図１９における文字列Ａ１、Ａ２は、３段階のうちの最も短い長さで区切られた文字列を示し、文字列Ｂ１は、３段階のうちの中間の長さで区切られた文字列を示し、文字列Ｃ１、Ｃ２は、３段階のうちの最も長い長さで区切られた文字列を示している。また、図１９における各文字列の下の矢印は、その文字列の文書データ３６における記載位置を示し、矢印の長さはその文字列の長さを示している。また、図１９における各文字列の下の矢印の下の数値は、その文字列について導出部４４Ａにより導出された評価値を示している。

【0054】

次に、選択部４６Ａは、列挙した複数の文字列の組み合わせのそれぞれについて、各文字列の評価値の合計値を導出する。そして、選択部４６Ａは、導出した合計値が最も大きい組み合わせの複数の文字列を生成モデル３２の正解データとして選択する。

【0055】

次に、図２０を参照して、学習フェーズにおける情報処理装置１０の作用を説明する。ＣＰＵ２０が情報処理プログラム３０を実行することによって、図２０に示す学習処理が実行される。図２０に示す学習処理は、例えば、ユーザにより実行開始の指示が入力された場合に実行される。図２０における図８と同一の処理を実行するステップについては、同一のステップ番号を付して説明を省略する。

【0056】

図８におけるステップＳ１２、Ｓ１４、Ｓ１６に代えて、図２０におけるステップＳ１２Ａ、Ｓ１４Ａ、Ｓ１６Ａが実行される。ステップＳ１２Ａで、第１生成部４２Ａは、前述したように、文書データ３４を異なる長さで区切ることによって第１の文字列集合を生成する。

【0057】

ステップＳ１４Ａで、導出部４４Ａは、ステップＳ１２Ａで生成された第１の文字列集合と、文書データ３６とを用いて、第１の文字列集合を構成する各文字列の評価値を導出する。ステップＳ１６Ａで、選択部４６Ａは、前述したように、ステップＳ１４Ａで導出された評価値に基づいて、第１生成部４２Ａにより生成された第１の文字列集合の中から、複数の文字列を重複する箇所がない状態で生成モデル３２の正解データとして選択する。

【0058】

運用フェーズにおける情報処理装置１０の機能的な構成及び作用は第１実施形態と同じであるため、説明を省略する。

【0059】

以上説明したように、本実施形態によれば、第１実施形態と同じ効果を得ることができる。

【0060】

［第３実施形態］
開示の技術の第３実施形態を説明する。なお、本実施形態に係る情報処理装置１０のハードウェア構成は、第１実施形態と同一であるため、説明を省略する。本実施形態では、情報処理装置１０は、生成モデル３２を強化学習させる。

【0061】

図２１を参照して、学習フェーズにおける情報処理装置１０の機能的な構成について説明する。第１実施形態に係る情報処理装置１０と同一の機能を有する機能部については、同一の符号を付して説明を省略する。図２１に示すように、情報処理装置１０は、取得部４０、導出部４４Ｂ、第２生成部４８Ａ、及び学習部５０Ａを含む。ＣＰＵ２０が情報処理プログラム３０を実行することにより、取得部４０、導出部４４Ｂ、第２生成部４８Ａ、及び学習部５０Ａとして機能する。

【0062】

第２生成部４８Ａは、取得部４０により取得された文書データ３４を生成モデル３２に対して入力することによって文書データ３４に対応する文字列集合を生成する。

【0063】

導出部４４Ｂは、第２生成部４８Ａにより生成された文字列集合と、文書データ３６とを用いて、文字列集合を構成する各文字列の評価値を導出する。この評価値の導出処理は、第１実施形態と同じであるため、説明を省略する。そして、導出部４４Ｂは、文字列集合の評価値として、文字列集合を構成する各文字列の評価値の合計値を導出する。導出部４４Ｂは、この文字列集合の評価値を、生成モデル３２を強化学習させる際の報酬として導出する。

【0064】

学習部５０Ａは、導出部４４Ｂにより導出された評価値を報酬として、生成モデル３２を強化学習させる。

【0065】

次に、図２２を参照して、学習フェーズにおける情報処理装置１０の作用を説明する。ＣＰＵ２０が情報処理プログラム３０を実行することによって、図２２に示す学習処理が実行される。図２２に示す学習処理は、例えば、ユーザにより実行開始の指示が入力された場合に実行される。

【0066】

図２２のステップＳ４０で、取得部４０は、文書データ３４を記憶部２２から取得する。ステップＳ４２で、第２生成部４８Ａは、ステップＳ４０で取得された文書データ３４を生成モデル３２に対して入力することによって文書データ３４に対応する文字列集合を生成する。

【0067】

ステップＳ４４で、導出部４４Ｂは、第２生成部４８Ａにより生成された文字列集合と、文書データ３６とを用いて、文字列集合を構成する各文字列の評価値を導出する。また、導出部４４Ｂは、導出した評価値の合計値を文字列集合の評価値として導出する。ステップＳ４６で、学習部５０Ａは、ステップＳ４４で導出された評価値を報酬として、生成モデル３２を強化学習させる。ステップＳ４６の処理が終了すると、学習処理が終了する。

【0068】

運用フェーズにおける情報処理装置１０の機能的な構成及び作用は第１実施形態と同じであるため、説明を省略する。

【0069】

以上説明したように、本実施形態によれば、第１実施形態と同じ効果を得ることができる。

【0070】

なお、上記第１実施形態において、導出部４４は、第１の文字列集合に含まれるが文書データ３６に含まれない文字列（以下、「過抽出文字列」という）の分量、及び文書データ３６に含まれるが第１の文字列集合に含まれない文字列（以下、「不足文字列」という）の分量の少なくとも一方に応じて、導出した第１の文字列集合の評価値を減少させてもよい。この場合、例えば、導出部４４は、これらの文字列の分量が多いほど、第１の文字列集合の評価値を大きく減少させる。文字列の分量の例としては、文字列の個数又は文字列の合計文字数等が挙げられる。図７の例では、「7/8(木) 工場Bグループ2/3」が不足文字列に相当し、「7/12(月) 通常運転」が過抽出文字列に相当する。

【0071】

同様に、上記第３実施形態において、導出部４４Ｂは、文字列集合に含まれるが文書データ３６に含まれない過抽出文字列の分量、及び文書データ３６に含まれるが文字列集合に含まれない不足文字列の分量の少なくとも一方に応じて、導出した文字列集合の評価値を減少させてもよい。

【0072】

このように、文書データ３４からの過抽出を完全に排除するのではなく、一部を排除するように生成モデル３２が学習されることによって、文書データを適切な区切り位置で区切ることができる。

【0073】

また、ＣＰＵ２０は、生成モデル３２を用いて、電子カルテ等の医療文書に相当する文書データ３４からサマリの文書データ用の候補文を提示する場合、過抽出文字列の分量が多すぎるとユーザによる候補文の選択を妨げることになるため、過抽出文字列を除くようにしてもよい。

【0074】

また、運用フェーズの変形例として、図２３に示すように、提示部６６は、処理対象の文書データを生成モデル３２に対して入力することによって生成された文字列集合を、処理対象の文書データが要約されたサマリ文書データの候補文としてユーザに提示してもよい。この場合、ユーザは、提示された候補文を選択することによってサマリ文書データを作成することができる。

【0075】

この形態例において、生成モデル３２を複数用意してもよい。例えば、過抽出文字列の分量に応じた文字列集合の評価値の減少幅を異ならせて学習された生成モデル３２を複数用意してもよい。具体的には、例えば、１つ目の生成モデル３２は、過抽出文字列の個数が１個多くなるごとに、５％減少させた評価値に基づいて選択された文字列集合を用いて学習されたモデルである。また、例えば、２つ目の生成モデル３２は、過抽出文字列の個数が１個多くなるごとに、１０％減少させた評価値に基づいて選択された文字列集合を用いて学習されたモデルである。すなわち、生成モデル３２毎に、過抽出への許容度が異なる。

【0076】

この場合、ＣＰＵ２０は、生成モデル３２を用いて提示されたサマリの文書データ用の候補文に対するユーザの選択履歴に応じて、生成モデル３２を切り替えてもよい。例えば、ＣＰＵ２０は、サマリの文書データ用の候補文において、ユーザによる候補文の非選択の度合いが高くなるほど、過抽出への許容度が低い生成モデル３２が使用されるように生成モデル３２を切り替えてもよい。非選択の度合いの例としては、「非選択の文字列の個数／候補文の個数」又は「選択された文字列の個数／候補文の個数」等が挙げられる。

【0077】

また、この場合、ＣＰＵ２０は、ユーザによる候補文の非選択の度合いが一定の度合い以上となった場合、ユーザにより選択された候補文を正解データとして、生成モデル３２を再学習させてもよい。

【0078】

上記第２実施形態において、導出部４４Ａは、文字列の評価値の導出処理において、ＲＯＵＧＥ－Ｆ値等のＦ値を評価値として導出し、Ｐｒｅｃｉｓｉｏｎを罰則としてもよいし、Ｆ値の計算におけるＰｒｅｃｉｓｉｏｎを０以上１未満の倍率とすることによって罰則を低下させてもよい。

【0079】

また、上記各実施形態において、導出部４４、４４Ａ、４４Ｂは、ユーザの過去の操作傾向に応じて、文字列集合に含まれる文字列の評価値を変えてもよい。例えば、導出部４４、４４Ａ、４４Ｂは、ユーザの過去の操作履歴に基づいて、ユーザが文字列を選択する際の長さが長いほど、長い文字列の評価が高くなるように評価値を導出してもよい。この場合のユーザが文字列を選択する際の長さとして、平均値又は中央値等の統計値を用いてもよい。また、ユーザが文字列を選択する際の長さの統計値を基準文字数として、基準文字数との差分に応じて減点することによって評価値を導出しても良い。また、予め基準文字数の異なる複数のモデルを用意し、ユーザが文字列を選択する際の長さの統計値に基づいてモデルを切り替えるとしても良い。

【0080】

また、上記各実施形態において、導出部４４、４４Ａ、４４Ｂは、文字列同士の一致度が一定値以下の場合、その一致度をゼロにしてもよい。

【0081】

また、上記第３実施形態において、図２４に示すように、生成モデル３２の出力を変換モデル３８に対する入力としてもよい。変換モデル３８は、文字列集合を入力とし、入力の文字列集合を文書データ３６と同じ記載形式の文字列の集合に変換した文字列集合を出力とするモデルである。変換モデル３８は、教師データを用いた機械学習によって得られる。この場合、導出部４４Ｂは、変換モデル３８から出力された文字列集合と、文書データ３６とを用いて、文字列集合を構成する各文字列の評価値を導出する。

【0082】

また、上記各実施形態において、例えば、情報処理装置１０の各機能部のような各種の処理を実行する処理部（processing unit）のハードウェア的な構造としては、次に示す各種のプロセッサ（processor）を用いることができる。上記各種のプロセッサには、前述したように、ソフトウェア（プログラム）を実行して各種の処理部として機能する汎用的なプロセッサであるＣＰＵに加えて、ＦＰＧＡ（Field Programmable Gate Array）等の製造後に回路構成を変更可能なプロセッサであるプログラマブルロジックデバイス（Programmable Logic Device：PLD）、ＡＳＩＣ（Application Specific Integrated Circuit）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が含まれる。

【0083】

１つの処理部は、これらの各種のプロセッサのうちの１つで構成されてもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡの組み合わせや、ＣＰＵとＦＰＧＡとの組み合わせ）で構成されてもよい。また、複数の処理部を１つのプロセッサで構成してもよい。

【0084】

複数の処理部を１つのプロセッサで構成する例としては、第１に、クライアント及びサーバ等のコンピュータに代表されるように、１つ以上のＣＰＵとソフトウェアの組み合わせで１つのプロセッサを構成し、このプロセッサが複数の処理部として機能する形態がある。第２に、システムオンチップ（System on Chip：SoC）等に代表されるように、複数の処理部を含むシステム全体の機能を１つのＩＣ（Integrated Circuit）チップで実現するプロセッサを使用する形態がある。このように、各種の処理部は、ハードウェア的な構造として、上記各種のプロセッサの１つ以上を用いて構成される。

【0085】

更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路（circuitry）を用いることができる。

【0086】

また、上記各実施形態では、情報処理プログラム３０が記憶部２２に予め記憶（インストール）されている態様を説明したが、これに限定されない。情報処理プログラム３０は、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＤＶＤ－ＲＯＭ（Digital Versatile Disc Read Only Memory）、及びＵＳＢ（Universal Serial Bus）メモリ等の記録媒体に記録された形態で提供されてもよい。また、情報処理プログラム３０は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。

【0087】

以上の実施形態に関し、更に以下の付記を開示する。
（付記１）
少なくとも一つのプロセッサを備える情報処理装置であって、
前記プロセッサは、
第１の文書データを取得し、
前記第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、
前記第１の文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記第１の文字列集合を構成する各文字列の評価値を導出し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する
情報処理装置。

【0088】

（付記２）
前記プロセッサは、
前記第１の文書データをそれぞれ異なる長さで区切ることによって複数の前記第１の文字列集合を生成し、
前記評価値に基づいて、前記複数の前記第１の文字列集合のうちの何れかを前記生成モデルの正解データとして選択する
付記１に記載の情報処理装置。

【0089】

（付記３）
前記プロセッサは、
前記第１の文字列集合の評価値として、前記第１の文字列集合を構成する各文字列の評価値の合計値を導出し、
前記第１の文字列集合に含まれるが前記第２の文書データに含まれない文字列の分量、及び前記第２の文書データに含まれるが前記第１の文字列集合に含まれない文字列の分量の少なくとも一方に応じて、導出した前記第１の文字列集合の評価値を減少させる
付記２に記載の情報処理装置。

【0090】

（付記４）
前記プロセッサは、
前記第１の文書データを区切る処理を、区切る長さを異ならせながら繰り返し行うことによって１つの前記第１の文字列集合を生成し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を重複する箇所がない状態で前記生成モデルの正解データとして選択する
付記１に記載の情報処理装置。

【0091】

（付記５）
前記評価値は、第１の文字列集合を構成する各文字列と、第２の文書データとの一致度が高いほど評価が高くなる値である
付記１から付記４の何れか１つに記載の情報処理装置。

【0092】

（付記６）
前記評価値は、第１の文字列集合を構成する各文字列が長いほど評価が高くなる値である
付記１から付記５の何れか１つに記載の情報処理装置。

【0093】

（付記７）
前記プロセッサは、
前記生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する第２の文字列集合を生成し、
前記第２の文字列集合と、前記第１の文字列集合の中から選択した複数の文字列との誤差が最小化されるように前記生成モデルを学習させる
付記１から付記６の何れか１つに記載の情報処理装置。

【0094】

（付記８）
第１の文書データを取得し、
前記第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、
前記第１の文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記第１の文字列集合を構成する各文字列の評価値を導出し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する
処理を情報処理装置が備えるプロセッサが実行する情報処理方法。

【0095】

（付記９）
第１の文書データを取得し、
前記第１の文書データを異なる長さで区切ることによって第１の文字列集合を生成し、
前記第１の文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記第１の文字列集合を構成する各文字列の評価値を導出し、
導出した評価値に基づいて、前記第１の文字列集合の中から複数の文字列を、文書データを入力とし、入力の文書データに含まれる複数の文字列を含む第２の文字列集合を出力とする生成モデルの正解データとして選択する
処理を情報処理装置が備えるプロセッサに実行させるための情報処理プログラム。

【0096】

（付記１０）
少なくとも一つのプロセッサを備える情報処理装置であって、
前記プロセッサは、
第１の文書データを取得し、
文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する文字列集合を生成し、
生成した文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記文字列集合の評価値を、前記生成モデルを強化学習させる際の報酬として導出する
情報処理装置。

【0097】

（付記１１）
前記プロセッサは、
前記文字列集合と、前記第２の文書データとを用いて、前記文字列集合を構成する各文字列の評価値を導出し、
前記文字列集合の評価値として、前記文字列集合を構成する各文字列の評価値の合計値を導出し、
前記文字列集合に含まれるが前記第２の文書データに含まれない文字列の分量、及び前記第２の文書データに含まれるが前記文字列集合に含まれない文字列の分量の少なくとも一方に応じて、導出した前記文字列集合の評価値を減少させる
付記１０に記載の情報処理装置。

【0098】

（付記１２）
第１の文書データを取得し、
文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する文字列集合を生成し、
生成した文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記文字列集合の評価値を、前記生成モデルを強化学習させる際の報酬として導出する
処理を情報処理装置が備えるプロセッサが実行する情報処理方法。

【0099】

（付記１３）
第１の文書データを取得し、
文書データを入力とし、入力の文書データに含まれる複数の文字列を含む文字列集合を出力とする生成モデルに対して前記第１の文書データを入力することによって前記第１の文書データに対応する文字列集合を生成し、
生成した文字列集合と、前記第１の文書データから目的に沿って作成された第２の文書データとを用いて、前記文字列集合の評価値を、前記生成モデルを強化学習させる際の報酬として導出する
処理を情報処理装置が備えるプロセッサに実行させるための情報処理プログラム。

【符号の説明】

【0100】

１０情報処理装置
２０ＣＰＵ
２１メモリ
２２記憶部
２３ディスプレイ
２４入力装置
２５ネットワークＩ／Ｆ
２６ＲＡＭ
２７バス
３０情報処理プログラム
３２生成モデル
３４、３６文書データ
３８変換モデル
４０取得部
４２、４２Ａ第１生成部
４４、４４Ａ、４４Ｂ導出部
４６、４６Ａ選択部
４８、４８Ａ第２生成部
５０、５０Ａ学習部
６０第３生成部
６２受付部
６４特定部
６６提示部

【図1】