IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 横山 諒一の特許一覧

特開2024-160621コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム
<>
  • 特開-コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム 図1
  • 特開-コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム 図2
  • 特開-コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム 図3
  • 特開-コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム 図4
  • 特開-コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム 図5
  • 特開-コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024160621
(43)【公開日】2024-11-14
(54)【発明の名称】コンピュータ実装方法、コンピュータシステム及びコンピュータプログラム
(51)【国際特許分類】
   G06F 40/151 20200101AFI20241107BHJP
   G06F 40/216 20200101ALI20241107BHJP
   G06F 40/279 20200101ALI20241107BHJP
   G06F 21/62 20130101ALI20241107BHJP
【FI】
G06F40/151
G06F40/216
G06F40/279
G06F21/62
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023075834
(22)【出願日】2023-05-01
(71)【出願人】
【識別番号】521519102
【氏名又は名称】横山 諒一
(74)【代理人】
【識別番号】100111567
【弁理士】
【氏名又は名称】坂本 寛
(72)【発明者】
【氏名】横山 諒一
【テーマコード(参考)】
5B109
【Fターム(参考)】
5B109TA11
5B109VC03
(57)【要約】
【課題】企業の営業秘密、国家機密、又はプライバシーに関する情報などを含み得る文章であっても、外部システムによる処理サービスを利用可能とする。
【解決手段】開示の方法は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含む。前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成される。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含む。
【選択図】図4
【特許請求の範囲】
【請求項1】
コンピュータが実行するコンピュータ実装方法であって、
第1データに含まれる第1語を第2語に変換することで第2データを生成し、
前記第1語と前記第2語との対応データを記憶装置に保存し、
前記第2データを外部システムへ送信し、
前記外部システムから第3データを受信し、
前記第3データから第4データを生成する、
ことを含み、
前記外部システムは、
受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、
生成された前記第3データを送信する
よう構成され、
前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含む、
コンピュータ実装方法。
【請求項2】
前記第2データを生成することは、
前記第1データに含まれる前記第1語をマスクし、
前記第1語がマスクされた前記第1データを、言語モデルに与えて、マスクされた語を予測する、
ことを含み、
前記第2データに含まれる前記第2語は、前記言語モデルによって予測された語である
請求項1に記載のコンピュータ実装方法。
【請求項3】
前記第1データに含まれる前記第1語をマスクすることは、
マスクすべき語を示す辞書データに基づいて、前記第1データに含まれる語の中から、マスクすべき語を選択し、
選択された語をマスクする、
ことを含む、
請求項2に記載のコンピュータ実装方法。
【請求項4】
マスクされた語を予測することは、
前記第1語がマスクされた前記第1データを、前記言語モデルを用いてマスクされた語を予測する予測システムへ送信し、
前記言語モデルを用いて予測された語を前記第2語として含む前記第2データを、前記予測システムから受信する
ことを含む、
請求項2に記載のコンピュータ実装方法。
【請求項5】
前記外部システムが生成する前記第3データは、前記第2データの要約を含む
請求項1から請求項4のいずれか1項に記載のコンピュータ実装方法。
【請求項6】
コンピュータシステムであって、
第1データに含まれる第1語を第2語に変換することで第2データを生成し、
前記第1語と前記第2語との対応データを記憶装置に保存し、
前記第2データを外部システムへ送信し、
前記外部システムから第3データを受信し、
前記第3データから第4データを生成する、
ことを含む処理を実行するよう構成され、
前記外部システムは、
受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、
生成された前記第3データを送信する
よう構成され、
前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含む、
コンピュータシステム。
【請求項7】
コンピュータに処理を実行させるコンピュータプログラムであって、
前記処理は、
第1データに含まれる第1語を第2語に変換することで第2データを生成し、
前記第1語と前記第2語との対応データを記憶装置に保存し、
前記第2データを外部システムへ送信し、
前記外部システムから第3データを受信し、
前記第3データから第4データを生成する、
ことを含み、
前記外部システムは、
受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、
生成された前記第3データを送信する
よう構成され、
前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含む、
コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、コンピュータ実装方法、コンピュータシステム及びコンピュータプログラムに関する。
【背景技術】
【0002】
特許文献1は、GPT(Generative Pre-trained Transformer)などの言語モデルを用いた文書要約方法を開示している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2023-053867号公報
【発明の概要】
【0004】
GPTなどの言語モデルは、要約・文書生成・翻訳など様々な言語処理への利用が期待されている。
【0005】
しかし、GPTなどの言語モデルは、第三者によって運営・管理されることが多い。このため、GPTなどの言語モデルを利用するには、第三者が運営・管理する外部システムへ文章を送信する必要がある。例えば、第三者が有する外部システムによって、文章の要約を生成する場合、要約の対象となる文章を、その外部システムへ送信する必要がある。
【0006】
しかし、企業の営業秘密、国家機密、又はプライバシーに関する情報などを含む文章を外部へ送信するのは、好ましくない。このような文章については、外部システムによる言語処理などの処理サービスの利用が困難である。
【0007】
したがって、上記のような情報を含み得る文章であっても、外部システムによる処理サービスを利用可能とすることが望まれる。
【0008】
本開示のある側面は、コンピュータが実行するコンピュータ実装方法である。開示の方法は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含み、前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され、前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含む。
【0009】
本開示の他の側面は、コンピュータシステム又はコンピュータプログラムである。更なる詳細は、後述の実施形態として説明される。
【図面の簡単な説明】
【0010】
図1図1は、実施形態に係るコンピュータシステム及び外部システムの構成図である。
図2図2は、実施形態に係るコンピュータシステム(文書作成支援システム)の構成図である。
図3図3は、外部システムの機能ブロック図及びデータフローを示す図である。
図4図4は、コンピュータシステムによる文書作成の手順を示すフローチャートである。
図5図5は、第1データから第4データの例を示す図である。
図6図6は、対応データの例を示す図である。
【発明を実施するための形態】
【0011】
<1.コンピュータ実装方法、コンピュータシステム及びコンピュータプログラムの概要>
【0012】
(1)実施形態に係る方法は、コンピュータが実行するコンピュータ実装方法であり得る。コンピュータ実装方法は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含み得る。
【0013】
前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され得る。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含み得る。
【0014】
実施形態に係る方法によれば、外部へ送信するのが好ましくないデータを外部システムへ送信することなく、外部システムによる処理サービスを利用することができる。
【0015】
(2)前記第2データを生成することは、前記第1データに含まれる前記第1語をマスクし、前記第1語がマスクされた前記第1データを、言語モデルに与えて、マスクされた語を予測する、ことを含み得る。前記第2データに含まれる前記第2語は、前記言語モデルによって予測された語であり得る。
【0016】
(3)前記第1データに含まれる前記第1語をマスクすることは、マスクすべき語を示す辞書データに基づいて、前記第1データに含まれる語の中から、マスクすべき語を選択し、選択された語をマスクする、ことを含み得る。
【0017】
(4)マスクされた語を予測することは、前記第1語がマスクされた前記第1データを、前記言語モデルを用いてマスクされた語を予測する予測システムへ送信し、前記言語モデルを用いて予測された語を前記第2語として含む前記第2データを、前記予測システムから受信することを含み得る。
【0018】
(5)前記外部システムが生成する前記第3データは、前記第2データの要約を含み得る。
【0019】
(6)実施形態に係るシステムは、コンピュータシステムであり得る。実施形態に係るシステムは、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含む処理を実行するよう構成され得る。
【0020】
前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され得る。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含み得る。
【0021】
実施形態に係るプログラムは、コンピュータに処理を実行させるコンピュータプログラムであり得る。前記処理は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含み得る。
【0022】
前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され得る。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含み得る。
【0023】
コンピュータプログラムは、コンピュータ読み取り可能な、非一時的な記憶媒体に格納され得る。
【0024】
<2.コンピュータ実装方法、コンピュータシステム及びコンピュータプログラムの例>
【0025】
図1は、実施形態に係るコンピュータシステム10A,10Bを示している。コンピュータシステム10A,10Bは、文章に関連する処理を実行し得る。実施形態に係るコンピュータシステム10A,10Bは、外部システム100を利用し得る。
【0026】
コンピュータシステム10A,10Bは、それぞれ、例えば、個人又は組織などのユーザの施設50A,50Bに設置され得る。組織は、例えば、企業、国、地方公共団体、専門職事務所、又は医療機関などである。施設50A,50Bは、例えば、住宅、ビル、オフィス、店舗、病院などである。
【0027】
コンピュータシステム10A,10Bは、例えば、サーバコンピュータによって構成され得る。コンピュータシステム10A,10Bは、個人又は組織の施設50A,50B又は個人又は組織が管理する場所に設置されたオンプレミスのコンピュータであってもよいし、個人又は組織が利用するクラウドコンピュータであってもよい。
【0028】
図1では、一例として、コンピュータシステム10Aは、第1の組織の施設50Aに設置され、コンピュータシステム10Bは、第1の組織とは別の第2の組織の施設50Bに設置される。コンピュータシステム10Aは、第1の組織に属する者又は第1の組織に関係する者のみによって使用され得る。コンピュータシステム10Bは、第2の組織に属する者又は第2の組織に関係する者のみによって使用され得る。
【0029】
コンピュータシステム10A,10Bは、ネットワーク30を介して、端末20に接続され得る。ネットワーク30は、例えば、ローカルエリアネットワーク(LAN)を含み得る。LAN30は、例えば、施設50A,50B内のコンピュータネットワークである。端末20は、ユーザによって使用され得る。端末20は、例えば、パーソナルコンピュータ、スマートフォン、又はタブレットである。ユーザは、端末20を操作して、コンピュータシステム10A,10Bを利用し得る。なお、ユーザは、直接、コンピュータシステム10A,10Bを操作してもよい。すなわち、コンピュータシステム10A,10Bは端末20を兼ねてもよい。
【0030】
なお、以下では、複数のコンピュータシステム10A,10Bそれぞれを特に区別しない場合、個々のコンピュータシステム10A,10Bを、「コンピュータシステム10」と呼ぶ。
【0031】
コンピュータシステム10は、プロセッサ11及びプロセッサ11に接続された記憶装置12を備えるコンピュータによって構成され得る。コンピュータシステム10は、1又は複数のコンピュータによって構成され得る。記憶装置12は、例えば、一次記憶装置及び二次記憶装置を備える(後述の記憶装置102も同様)。一次記憶装置は、例えば、RAMである。二次記憶装置は、例えば、ハードディスクドライブ(HDD)又はソリッドステートドライブ(SSD)である。記憶装置12は、プロセッサ11によって実行されるコンピュータプログラム12H(図2参照)を備え得る。プロセッサ11は、記憶装置12に格納されたコンピュータプログラム12Hを読み出して実行する。記憶装置12のコンピュータプログラム12Hは、コンピュータを、実施形態に係るコンピュータシステム10として動作させるための命令を示すプログラムコードを有する。
【0032】
外部システム100は、1又は複数のコンピュータによって構成される。外部システムを構成するコンピュータは、プロセッサ101とプロセッサ101に接続された記憶装置102を備える。記憶装置102は、プロセッサ101によって実行されるコンピュータプログラムを備え得る。プロセッサ101は、記憶装置102に格納されたコンピュータプログラムを読み出して実行する。記憶装置102のコンピュータプログラムは、コンピュータを、実施形態に係る外部システム100として動作させるための命令を示すプログラムコードを有する。
【0033】
また、外部システム100は、言語モデルを用いてマスクされた語を予測する予測システムとして機能し得る。外部システム100の詳細については後述される。
【0034】
図2に示すように、実施形態のコンピュータシステム10は、例えば、文書作成支援システムであり得る。実施形態のコンピュータシステム10は、一例として、初期の文章データ12Cから目的の文章データ12Gを生成し得る。コンピュータシステム10は、例えば、要約文の作成を支援し得る。すなわち、コンピュータシステム10は、初期の文章データ12Cの要約を、目的の文章データ12Gとして生成し得る。なお、コンピュータシステム10は、要約以外のその他の文章の作成を支援してもよい。その他の文章の生成は、例えば、初期の文章データから生成された新たな文章、初期の文章データの様式又は体裁の変換、初期の文章データの翻訳などである。
【0035】
図2に示すように、記憶装置12は、辞書データ12Aを備え得る。辞書データ12A、後述のマスク処理11Cによってマスクされる語を選択するために用いられ得る。辞書データ12Aは、企業の営業秘密、国家機密、又はプライバシーに関する情報など(以下、「機敏情報」という)を示す語を含み得る。文章に含まれる語のうち、辞書データ12Aに含まれる語は、マスク処理によってマスクされる。
【0036】
機敏情報を有する語は、個人又は組織などのユーザが属する専門分野における専門用語又は業界用語を含み得る。辞書データ12Aは、個人又は組織などのユーザによって異なり得る。辞書データ12Aに含まれる語は、ユーザによって登録・編集され得る。コンピュータシステム10は、同一のユーザによって利用され得る複数の辞書データ12Aを有し、用途等に応じて、ユーザが辞書データ12Aを選択して使い分けてもよい。
【0037】
辞書データ12Aは、マスクされるべき特定の語の一覧を有しているだけでなく、マスクされるべき「語の種類」の一覧を有していてもよい。ここでの「語の種類」とは、例えば、人又は組織の名前・地名などの「固有名」、「肩書」、「日時を示す語」、「数量を示す語」、「行為を表す語」である。語の種類は、固有名の認識処理、または、日時を示す語の認識処理、数量を示す語の認識処理、意味解析などの自然言語処理によって認識され得る。例えば、文章中に人名を示す「横山」という語が存在する場合、固有名の認識処理によって、「横山」は「人の名前」であると認識される。この場合、辞書データ12Aに「語の種類」として「人の名前」が登録されていれば、「横山」がマスクされる。つまり、「横山」という語自体が、辞書データ12Aに登録されていなくても、「横山」がマスクされる。
【0038】
記憶装置12は、対応データ12Bを備え得る。対応データは、マスク処理によってマスクされた部分(マスク語)と、マスクされた部分の補完内容(補完語)と、の対応関係を示す。例えば、「横山」という語がマスクされ、そのマスク部分が「佐藤」という語によって補完された場合、対応データ12Bでは、「横山」と「佐藤」とが対応付けて記録される。
【0039】
記憶装置12は、初期データであるオリジナルデータ12C(第1データ)と、コンピュータシステム10によって生成される目的データ12G(第4データ)と、を格納し得る。目的データ12Gは、図2に示すように、例えば、オリジナルデータ12Cの要約である。オリジナルデータ12Cは、文章データを含み得る。オリジナルデータ12Cは、文章データ以外の図形データ・画像データなどを含んでもよい。
【0040】
オリジナルデータ12Cは、機敏情報を示す語(以下、「機敏語」という)を含み得る。以下では、機敏語を含むデータを「機敏データ」と呼ぶ。オリジナルデータ12C(第1データ)は機敏データであり得る。機敏データは、組織のポリシー又は個人情報の保護のため、コンピュータシステム10外への送信が禁止されている、または、ユーザがコンピュータシステム10外への送信を望まない場合がある。
【0041】
実施形態に係るコンピュータシステム10は、機敏データを外部へ送信することなく、外部システム100を利用して、機敏データであるオリジナルデータ12Cに基づく目的データ12Gを生成することができる。なお、目的データ12G(第4データ)も機敏データであり得る。
【0042】
記憶装置12は、初期データ12Cから目的データ12Gが生成されるまでの間に生成される中間データ12D,12E,12Fを格納し得る。中間データ12D,12E,12Fは、例えば、マスクデータ12D、第2データ12E、及び第3データ12Fを含み得る。
【0043】
マスクデータ12Dは、オリジナルデータ12Cに含まれる特定の語をマスクしたものである。すなわち、マスクデータ12Dは、オリジナルデータ12Cの一部をマスクした虫食い文章である。マスクは、前述のように、辞書データ12Aに基づいて行われる。マスクされた語は、機敏語であり得る。機敏語がマスクされていることで、マスクデータ12Dは、非機敏データになる。
【0044】
第2データ12Eは、オリジナルデータである第1データ12Cから生成されたデータである。図2では、第2データ12Eは、補完データ12Eとして示されている。第2データ12Eは、第1データ12Cに含まれる第1語を、第2語に変換することで生成される。第1語は、機敏語であり得る。第1語は、辞書データ12Aに基づいて選択され得る。第2語は、非機敏語であり得る。第2語は辞書データ12Aに基づいて選択されなかった語であり得る。
【0045】
実施形態においては、一例として、第2データ12Eは、第1データ12Cから生成されたマスクデータ12Dに基づいて生成される。この場合、第1語から第2語への変換は、第1データ12Cに含まれる第1語をマスクし、マスクされた語を補完(予測)することで行われ得る。補完(予測)された語が第2語になる。
【0046】
ここでの補完又は予測は、不正確な補完又は不正確な予測であるほうが、機敏情報を隠蔽できるという観点で好ましい。つまり、補完又は予測の処理は、いい加減なものでもよい。また、マスクされる語の数を多くすることで、オリジナルデータにおける文章の意味が分かりにくくなるため、補完又は予測の精度を大きく低下させて、機敏情報を隠蔽することができる。
【0047】
なお、補完又は予測された語(第2語)が、偶然、マスクされた第1語と一致することがあり得るため、第1語と第2語とは、文章全体で完全に一致してなければ、部分的に一致していてもよい。つまり、マスクされた複数の語(第1語)のうち、一部の語(第1語)に対応する第2語は、第1語と同じものであってもよい。一部の語において、第1語と第2語とが偶然共通していても、単なる偶然であれば、その第2語は、機敏情報を示していないため、文章データ全体としては、機敏情報が隠蔽されたものとなる。
【0048】
第2データ12Eにおいては、第1データ12Cに含まれる機敏語である第1語が、非機敏語である第2語に変換される。このため、第2データ12Eは、非機敏データになる。第2データ12Eは、マスクデータ12Dと同様に、機敏語を有しないが、マスクされた語が補完されている。このため、第2データ12Eは、マスクデータ12Dに比べて、文章の意味が分かりやすい。したがって、第2データ12Eに基づく自然言語処理は、マスクデータ12Dに対する自然言語処理に比べて、適切に行われ易くなる。
【0049】
第3データ12Fは、第2データ12Eから生成される。図2において、第3データ12Fは、第2データ12Eである補完データの要約として示されている。非機敏データである第2データ12Eの要約である第3データ12Fも、非機敏データである。
【0050】
プロセッサ11は、コンピュータプログラム12Hの命令に従って、様々な処理11A,11B,11C,11D,11E,11Fを実行可能である。
【0051】
プロセッサ11が実行する処理は、リクエスト送信11Aを含み得る。リクエスト送信11Aは、外部システム100に対して、何らかの処理をリクエストすることである。リクエストは、コンピュータシステム10から外部システム100へ送信される。リクエストは、後述の補完処理のリクエスト、又は、文章加工処理のリクエストを含み得る。プロセッサ11は、リクエストを、外部システム100における処理に用いられるデータとともに、外部システム100へ送信し得る。
【0052】
プロセッサ11が実行する処理は、応答受信11Bを含み得る。応答受信11Bは、前述のリクエストに対する外部システム100の応答を受信することである。応答は、リクエストに基づいて外部システム100が実行した実行結果を含み得る。応答は、後述の補完処理の処理結果の通知、又は、文章加工処理の処理結果の通知を含み得る。応答は、外部システム100における処理によって生成されたデータとともに、外部システム100から送信され得る。プロセッサ11は、生成されたデータを含む応答を外部システム100から受信し得る。
【0053】
プロセッサ11が実行する処理は、マスク処理11Cを含み得る。マスク処理11Cは、第1データ12Cに含まれる語をマスクすることを含む。プロセッサ11は、辞書データ12Aを参照し、第1データ12Cに含まれる語のうち、マスクすべき語を選択する。マスクすべき語は、例えば、辞書データ12Aに含まれる語、又は、辞書データ12Aに含まれる「語の種類」と一致する種類の語である。マスク処理11Cによって、第1データ12Cに含まれる複数の語の一部がマスクされたマスクデータ12Dが生成される。
【0054】
プロセッサ11が実行する処理は、オリジナルデータである第1データ12Cを取得する処理11Dを含み得る。取得処理11Dは、第1データ12Cを外部から取得することである。例えば、プロセッサ11は、取得処理11Dとして、端末20に入力された文章を含む第1データ12Cを、ネットワーク30を介して、受信する。また、プロセッサ11は、取得処理11Dとして、端末20などの他のコンピュータから送信された第1データ12Cを受信する。なお、第1データ12Cは、記憶装置12に予め保存されていてもよい。
【0055】
プロセッサ11が実行する処理は、データ出力処理11Eを含み得る。出力処理11Eは、例えば、記憶装置12に格納されたデータ12A,12B,12C,12D,12E,12F,12Gを、コンピュータシステム10のディスプレイ又は端末20のディスプレイ等に出力することである。出力処理11Eによって、ユーザは、データ12A,12B,12C,12D,12E,12F,12Gを参照することができる。なお、出力処理11Eは、他のコンピュータへのデータ送信であってもよい。
【0056】
プロセッサ11が実行する処理は、データ編集処理11Fを含み得る。編集処理11Fは、例えば、記憶装置12に格納されたデータ12A,12B,12C,12D,12E,12F,12Gを、ユーザが編集する環境をユーザに提示することである。例えば、プロセッサ11は、出力処理11Eによって表示されたデータ12A,12B,12C,12D,12E,12F,12Gに対する編集操作を受け付け、編集後のデータ12A,12B,12C,12D,12E,12F,12Gを記憶装置12に保存することができる。
【0057】
データ編集は、例えば、オリジナルデータ12Cの編集、生成されたマスクデータ12Dの編集、生成された第2データ12Eの編集、生成された第3データ12Fの編集、及び生成された第4データ12Gの編集を含み得る。
【0058】
図3は、外部システム100の構成を示している。外部システム100は、コンピュータシステム10のユーザ又はそのユーザが属する又は関連する組織以外の第三者によって管理され得る。ここで、外部システム100における「外部」とは、コンピュータシステム10の第1データ12Cが送信されるべきでない範囲をいう。「外部」は、典型的には、コンピュータシステム10を有する個人又は組織外の範囲であるが、それに限られない。例えば、ある組織において、情報遮断措置がとられた第1グループと第2グループが存在する場合、第1グループからみて第2グループは、「外部」であり得る。なお、以下では、外部システム100を単に、システム100ということがある。
【0059】
システム100は、一例として、言語モデル120を備え得る。言語モデル120は、一例として、機械学習されたAI言語モデルである。言語モデルは、文章の認識・生成・要約などに用いられる。コンピュータに実装された言語モデルに、ある文章が与えられると、与えられた文章の要約を生成したり、与えられた文章に対する回答を生成したり、新たな文章を生成したりすることができる。
【0060】
言語モデル120は、例えば、Generative Pretrained Transformer(GPT)121である。GPT121は、文章生成モデルである。言語モデル120は、マスク言語モデル(Masked Language Model:MLM)122であってもよい。マスク言語モデルは、マスクされた文章の補完処理(虫食い文章の穴埋め処理)に用いられる。なお、GPT121は、補完処理も可能であるため、GPT121と別にマスク言語モデルを用意する必要はない。
【0061】
GPT121は、大規模なデータセットを用いた、教師なし学習によって、機械学習された言語モデルである。機械学習のためのデータセットは、データベース112に保存される。
【0062】
システム100は、インターフェース111を介して、文章データを受信する。受信する文章データは、例えば、マスクデータ12D又は補完データ12Eである。システム100は、受信した文章データを、言語モデル120に入力する。言語モデル120は、入力された文章データに基づいて、適宜の文章を生成し、出力する。
【0063】
システム100は、生成した文章データを、インターフェース111を介して、送信する。送信する文章データは、例えば、補完データ12E又は補完データ12Eの要約12Fである。
【0064】
インターフェース111は、システム100が外部とのコミュニケーションを実施するための機能であり、例えば、チャットのためのインターフェースとして実装される。チャットのためのインターフェース111は、システム100外部から、文章の入力を受け付け、入力された文章に基づき言語モデル120によって生成された文章を、外部へ出力する。
【0065】
実施形態においては、一例として、コンピュータシステム10は、チャットのためのインターフェース111に対して、文章生成のリクエスト送信11Aを実行するとともに、そのインターフェース111から出力された文章の受信を、リクエストに対する応答受信11Bとして実行する。
【0066】
システム100は、受信したデータを、言語モデル120に与えるほか、データベース112に保存することができる。システム100は、保存されたデータに基づいて、言語モデル120の機械学習をし直して、言語モデル120の機能・性能を向上させることができる。
【0067】
図4は、初期データである第1データ12Cから、目的データである第4データ12Gを生成する手順を示している。なお、図3には、図4に示す手順に従ったデータの流れも示されている。図5及び図6は、図4に示す手順によって生成されるデータの一例を示している。
【0068】
図3に示す手順は、一例として、外部システム100を利用して、プロセッサ11によって実行される。ここでは、一例として、図5に示すオリジナルデータ(原文)12Cから、図5に示す要約12Gが生成される。
【0069】
図4に示すように、プロセッサ11は、まず、マスク処理を実行する(ステップS41)。プロセッサ11は、記憶装置12に保存された第1データ12Cに含まれる語のうち、辞書データ12Aに基づいて選択された語をマスクすることでマスクデータ12Dを生成する。マスクデータ12Dは、第1データ12Cに含まれる語の一部をマスクしたものである。図5に示すマスクデータ12Dでは、マスクされた部分が、「*」で示されている。マスクされていない部分については、マスクデータ12Dと第1データ12Cとは共通している。
【0070】
図5に示すように、マスクデータ12Dは、第1データ12Cと同様の文章の骨格を有しているが、機敏語がマスクされているため、全体として、機敏情報は隠蔽されている。
【0071】
ユーザは、生成されたマスクデータ12Dに対する編集操作を行って、生成されたマスクデータ12Dにおいてマスクされていない語を追加でマスクしたり、マスクを取りやめるため、マスクされた語を元に戻したりしてもよい。編集による追加でのマスクによって、辞書データ12Aによってはマスクされなかった語を、ユーザ判断でマスクすることができる。また、編集によるマスクの取りやめによって、非機敏語にされたマスクを取り除くことができる。編集されたマスクデータ12Dは、保存される。編集された場合には、編集後のマスクデータ12Dが、後述の補完処理に用いられる。
【0072】
プロセッサ11は、マスクデータ12Dに対する補完処理を実行する(ステップS42)。補完処理は、マスクデータ12Dにおいてマスクされた部分を予測する処理(虫食い文章の穴埋め処理)である。
【0073】
図3に示すように、プロセッサ11は、補完処理として、マスクデータ12Dの補完を、マスク部分を予測する予測システムとしての外部システム100に対してリクエストし、外部システム100によって生成された補完データ12Eを受信する。マスクデータ12Dは、機敏語を含まない非機敏データであるため、外部システム100へ送信しても問題ない。
【0074】
外部システム100のインターフェースがチャットインターフェース111である場合、補完のためのリクエストとして、コンピュータシステム10のプロセッサ11は、例えば、図5に示すマスクデータ12Dの文章の前に、「次の文章を穴埋めして下さい。」のようにマスク補完を要求する文章を付加したリクエストメッセージを生成する。
【0075】
プロセッサ11は、生成したリクエストメッセージを、外部システム100のインターフェース111へ送信する。外部システム100は、インターフェース111を介して受信したリクエストメッセージを、言語モデル120に与える。言語モデル120は、リクエストメッセージの意味解析を行い、「次の文章を穴埋めして下さい。」の文章に従って、その文章に続くマスクデータ12Dの文章のマスク補完(穴埋め;マスク部分の語の予測)をした文章(図5の補完データ12E)を出力する。
【0076】
外部システム100は、出力された補完データ(第2データ)12Eを、コンピュータシステム10へ送信する。コンピュータシステム10のプロセッサ11は、送信された補完データ12Eを受信して記憶装置12に保存する。図5に示すように、補完データ12Eは、マスクデータ12Dにおけるマスク部分が適当に予測された語で補完されているため、文章の骨格は、オリジナルデータ12Cと共通するが、機敏情報は隠蔽されたものとなっている。また、補完データ12Eは、マスクデータ12Dに比べて、自然な文章であるため、外部システム100による意味解析に適している。
【0077】
プロセッサ11は、オリジナルデータ12Cと補完データ12Eとに基づいて、対応データ12Bを生成する。対応データ12Bの生成には、必要であればマスクデータ12Dを用いてもよい。図6は、対応データ12Bの一例を示している。図6に示す対応データ12Bは、図5に示す補完データ12Eとマスクデータ12Dとに基づいて生成されたものである。図6において、左側は、第1データ12Cに含まれる語(第1語)の一覧を示しており、右側は、第2データ12Eに含まれる語(第2語)の一覧を示している。対応データ12Bは、第1語と、その第1語がどのような第2語によって変換されているかの対応関係を示している。例えば、オリジナルデータ12Cにおける第1語としての「岸田首相」は、補完データ12Eにおいて第2語としての「田中氏」に変換されている。この場合、対応データ12Bには、第1語としての「岸田首相」と第2語としての「田中氏」とが対応付けて記録されている。
【0078】
プロセッサ11は、対応データ12Bの生成のため、オリジナルデータ12Cと補完データ12Eとを対比し、オリジナルデータ12Cにおける語(第1語)が、補完データ12Eにおけるどの語(第2語)で置き換えられているかを識別する。なお、オリジナルデータ12C及び/又は補完データ12Eにおいて、第1語から第2語に置き換えられている箇所の識別のため、マスクデータ12Dが用いられてもよい。
【0079】
なお、言語モデル120は、マスクデータ12Dを補完する際に、生成される補完データ12Eの文章を自然なものにするため、マスクされた部分以外の文章も変更することがある。この場合、プロセッサ11は、マスクされた部分以外の文章の変更も対応データ12Bに記録し得る。
【0080】
ユーザは、生成された補完データ12Eに対する編集操作を行ってもよい。補完された語(第2語)が、元の第1語と偶然同じである場合、ユーザ編集操作によって、補完された第2語を、別の第2語に変更してもよい。また、補完データ12Eの文章が不自然な場合には、ユーザ編集操作によって、文章を編集してもよい。プロセッサ11は、ユーザ編集後の補完データ12Eの語(第2語)とオリジナルデータ12Cの語(第1語)との対応関係も、対応データ12Bに記録する。
【0081】
プロセッサ11は、生成した対応データ12Bを記憶装置12に保存する(ステップS43)。
【0082】
なお、図4に示す補完処理(ステップS42)を省略して、適宜のアルゴリズム又はユーザ編集操作によって、第1データ12Cから、直接、第2データ12Eを生成してもよい。つまり、第1データ12Cに含まれる第1語は、適宜のアルゴリズム又はユーザ編集操作によって、第2語に変換されてもよい。
【0083】
続いて、図4に示すように、プロセッサ11は、文書加工処理を実行する(ステップS44)。図3に示すように、プロセッサ11は、文章加工処理として、第2データ12Eの文章加工を、外部システム100に対してリクエストし、外部システム100によって生成された第3データ12Fを受信する。第2データ12Eは機敏語を含まない非機敏データであるため、外部システム100へ送信しても問題ない。
【0084】
文章加工が、要約の生成である場合、要約生成のためのリクエストとして、コンピュータシステム10のプロセッサは、例えば、図5に示す補完データ12Eの文章の前に、「次の文章を要約して下さい。」のように文章加工(文章要約)を要求する文章を付加したリクエストメッセージを生成する。
【0085】
プロセッサ11は、要約生成のため、生成したリクエストメッセージを、外部システム100のインターフェース111へ送信する。外部システム100は、インターフェース111を介して受信したリクエストメッセージを、言語モデル120に与える。言語モデル120は、リクエストメッセージの意味解析を行い、「次の文章を要約して下さい。」の文章に従って、その文章に続く第2データ12Eの文章を要約した文章(図5の補完データの要約12F)を出力する。第2データ12Eは、マスクデータ12Dとは異なり自然な文章であるため、言語モデル120は、第2データ12Eの意味解析を適切に行うことができ、その結果、適切な要約を生成できる。
【0086】
外部システム100は、出力された要約(第3データ)12Fを、コンピュータシステム10へ送信する。コンピュータシステム10のプロセッサ11は、送信された要約12Fを受信して記憶装置12に保存する。非機敏データである第2データ12Eを要約した第3データ12Fは、非機敏データであるため、外部システム100とコンピュータシステム10との間でやり取りされても問題ない。
【0087】
ユーザは、生成された要約12Fに対する編集操作を行ってもよい。編集された要約12Fは、記憶装置12に保存される。
【0088】
プロセッサは、第3データ12Fに対する復元処理を実行して第4データ12Gを生成する(ステップS45)。復元処理は、第3データ12Fに含まれる第2語を、第1語に変換する処理である。第2語を第1語に変換する処理は、プロセッサ11が、対応データ12Bを参照して行う。プロセッサ11は、第3データ12Fに含まれる語のうち、対応データ12Bにおいて第2語として含まれる語を識別し、第3データ12Fにおいて第2語として識別された語を、対応データ12Bにおいて第2語に対応付けられた第1語に変換する。例えば、プロセッサ11は、対応データ12Bを参照して、第3データ12Fに含まれる語のうち「田中氏」を第2語の一つとして識別する。対応データ12Bにおいて「田中氏」は「岸田首相」に対応付けられている。したがって、プロセッサ11は、第3データ12Fに含まれる「田中氏」を「岸田首相」に変換する。同様に、プロセッサ11は、第3データ12Fに含まれる各第2語を、対応する第1語に変換することで、第4データ12Gを生成する。
【0089】
プロセッサ11は、復元処理によって生成した第4データ12Gを記憶装置12に保存する。ユーザは、生成された第4データ12Gに対する編集操作を行ってもよい。編集された第4データ12Gは、記憶装置12に保存される。
【0090】
なお、ステップS44の文章加工処理が翻訳である場合、対応データ12Bは、第1語及び第2語の翻訳語を含むのが好ましい。プロセッサ11は、翻訳文である第3データ12Fにおける第2語の翻訳語を、対応データ12Bに含まれる第1語及び第2語の翻訳語を参照し、第1語の翻訳語に変換することで、第4データを生成し得る。
【0091】
プロセッサ11は、第1語の翻訳を、辞書データ12Aから取得し得る。この場合、辞書データ12Aは、マスクすべき語の翻訳語も備えているのが好ましい。プロセッサ11は、第2語の翻訳を、翻訳前の第2データ12Eと翻訳後の第3データ12Fとから取得し得る。プロセッサ11は、翻訳前の第2データ12Eと翻訳後の第3データ12Fとを対比して、第2データ12Eに含まれる第2語に対応する翻訳語を、第3データ12Fから抽出することができる。プロセッサ11は、取得した第1語及び第2の翻訳語を対応データ12Bとして保存し得る。
【0092】
このように、第4データ12Gの生成のため、第3データに含まれる第2語を第1語に変換することは、第2語の翻訳語を第1語の翻訳語に変換することを含み得る。
【0093】
実施形態によれば、機敏データを外部システム100へ送信することなく、外部システム100を利用して、機敏データである第1データ12Cを加工した第4データ12Gを得ることができる。
【0094】
本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。例えば、ステップS41においてマスクされた部分を予測する外部システム100と、ステップS44において要約などの文章加工を行う外部システム100と、は別々のシステムであってもよい。
【符号の説明】
【0095】
10 :コンピュータシステム
10A :コンピュータシステム
10B :コンピュータシステム
11 :プロセッサ
11A :リクエスト送信
11B :応答受信
11C :マスク処理
11D :取得処理
11E :データ出力処理
11F :データ編集処理
12 :記憶装置
12A :辞書データ
12B :対応データ
12C :第1データ
12D :マスクデータ
12E :第2データ
12F :第3データ
12G :第4データ
12H :コンピュータプログラム
20 :端末
30 :ネットワーク
50A :施設
50B :施設
100 :外部システム
101 :プロセッサ
102 :記憶装置
111 :インターフェース
112 :データベース
120 :言語モデル
121 :生成モデル
121 :マスク言語モデル
図1
図2
図3
図4
図5
図6
【手続補正書】
【提出日】2023-05-24
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、コンピュータ実装方法、コンピュータシステム及びコンピュータプログラムに関する。
【背景技術】
【0002】
特許文献1は、GPT(Generative Pre-trained Transformer)などの言語モデルを用いた文書要約方法を開示している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2023-053867号公報
【発明の概要】
【0004】
GPTなどの言語モデルは、要約・文書生成・翻訳など様々な言語処理への利用が期待されている。
【0005】
しかし、GPTなどの言語モデルは、第三者によって運営・管理されることが多い。このため、GPTなどの言語モデルを利用するには、第三者が運営・管理する外部システムへ文章を送信する必要がある。例えば、第三者が有する外部システムによって、文章の要約を生成する場合、要約の対象となる文章を、その外部システムへ送信する必要がある。
【0006】
しかし、企業の営業秘密、国家機密、又はプライバシーに関する情報などを含む文章を外部へ送信するのは、好ましくない。このような文章については、外部システムによる言語処理などの処理サービスの利用が困難である。
【0007】
したがって、上記のような情報を含み得る文章であっても、外部システムによる処理サービスを利用可能とすることが望まれる。
【0008】
本開示のある側面は、コンピュータが実行するコンピュータ実装方法である。開示の方法は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含み、前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され、前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含む。
【0009】
本開示の他の側面は、コンピュータシステム又はコンピュータプログラムである。更なる詳細は、後述の実施形態として説明される。
【図面の簡単な説明】
【0010】
図1図1は、実施形態に係るコンピュータシステム及び外部システムの構成図である。
図2図2は、実施形態に係るコンピュータシステム(文書作成支援システム)の構成図である。
図3図3は、外部システムの機能ブロック図及びデータフローを示す図である。
図4図4は、コンピュータシステムによる文書作成の手順を示すフローチャートである。
図5図5は、第1データから第4データの例を示す図である。
図6図6は、対応データの例を示す図である。
【発明を実施するための形態】
【0011】
<1.コンピュータ実装方法、コンピュータシステム及びコンピュータプログラムの概要>
【0012】
(1)実施形態に係る方法は、コンピュータが実行するコンピュータ実装方法であり得る。コンピュータ実装方法は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含み得る。
【0013】
前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され得る。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含み得る。
【0014】
実施形態に係る方法によれば、外部へ送信するのが好ましくないデータを外部システムへ送信することなく、外部システムによる処理サービスを利用することができる。
【0015】
(2)前記第2データを生成することは、前記第1データに含まれる前記第1語をマスクし、前記第1語がマスクされた前記第1データを、言語モデルに与えて、マスクされた語を予測する、ことを含み得る。前記第2データに含まれる前記第2語は、前記言語モデルによって予測された語であり得る。
【0016】
(3)前記第1データに含まれる前記第1語をマスクすることは、マスクすべき語を示す辞書データに基づいて、前記第1データに含まれる語の中から、マスクすべき語を選択し、選択された語をマスクする、ことを含み得る。
【0017】
(4)マスクされた語を予測することは、前記第1語がマスクされた前記第1データを、前記言語モデルを用いてマスクされた語を予測する予測システムへ送信し、前記言語モデルを用いて予測された語を前記第2語として含む前記第2データを、前記予測システムから受信することを含み得る。
【0018】
(5)前記外部システムが生成する前記第3データは、前記第2データの要約を含み得る。
【0019】
(6)実施形態に係るシステムは、コンピュータシステムであり得る。実施形態に係るシステムは、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含む処理を実行するよう構成され得る。
【0020】
前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され得る。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含み得る。
【0021】
実施形態に係るプログラムは、コンピュータに処理を実行させるコンピュータプログラムであり得る。前記処理は、第1データに含まれる第1語を第2語に変換することで第2データを生成し、前記第1語と前記第2語との対応データを記憶装置に保存し、前記第2データを外部システムへ送信し、前記外部システムから第3データを受信し、前記第3データから第4データを生成する、ことを含み得る。
【0022】
前記外部システムは、受信した前記第2データに基づいて、前記第2語を含む前記第3データを生成し、生成された前記第3データを送信するよう構成され得る。前記第4データを生成することは、前記第3データに含まれる前記第2語を、前記対応データに基づいて、前記第1語に変換することで前記第4データを生成することを含み得る。
【0023】
コンピュータプログラムは、コンピュータ読み取り可能な、非一時的な記憶媒体に格納され得る。
【0024】
<2.コンピュータ実装方法、コンピュータシステム及びコンピュータプログラムの例>
【0025】
図1は、実施形態に係るコンピュータシステム10A,10Bを示している。コンピュータシステム10A,10Bは、文章に関連する処理を実行し得る。実施形態に係るコンピュータシステム10A,10Bは、外部システム100を利用し得る。
【0026】
コンピュータシステム10A,10Bは、それぞれ、例えば、個人又は組織などのユーザの施設50A,50Bに設置され得る。組織は、例えば、企業、国、地方公共団体、専門職事務所、又は医療機関などである。施設50A,50Bは、例えば、住宅、ビル、オフィス、店舗、病院などである。
【0027】
コンピュータシステム10A,10Bは、例えば、サーバコンピュータによって構成され得る。コンピュータシステム10A,10Bは、個人又は組織の施設50A,50B又は個人又は組織が管理する場所に設置されたオンプレミスのコンピュータであってもよいし、個人又は組織が利用するクラウドコンピュータであってもよい。
【0028】
図1では、一例として、コンピュータシステム10Aは、第1の組織の施設50Aに設置され、コンピュータシステム10Bは、第1の組織とは別の第2の組織の施設50Bに設置される。コンピュータシステム10Aは、第1の組織に属する者又は第1の組織に関係する者のみによって使用され得る。コンピュータシステム10Bは、第2の組織に属する者又は第2の組織に関係する者のみによって使用され得る。
【0029】
コンピュータシステム10A,10Bは、ネットワーク30を介して、端末20に接続され得る。ネットワーク30は、例えば、ローカルエリアネットワーク(LAN)を含み得る。LAN30は、例えば、施設50A,50B内のコンピュータネットワークである。端末20は、ユーザによって使用され得る。端末20は、例えば、パーソナルコンピュータ、スマートフォン、又はタブレットである。ユーザは、端末20を操作して、コンピュータシステム10A,10Bを利用し得る。なお、ユーザは、直接、コンピュータシステム10A,10Bを操作してもよい。すなわち、コンピュータシステム10A,10Bは端末20を兼ねてもよい。
【0030】
なお、以下では、複数のコンピュータシステム10A,10Bそれぞれを特に区別しない場合、個々のコンピュータシステム10A,10Bを、「コンピュータシステム10」と呼ぶ。
【0031】
コンピュータシステム10は、プロセッサ11及びプロセッサ11に接続された記憶装置12を備えるコンピュータによって構成され得る。コンピュータシステム10は、1又は複数のコンピュータによって構成され得る。記憶装置12は、例えば、一次記憶装置及び二次記憶装置を備える(後述の記憶装置102も同様)。一次記憶装置は、例えば、RAMである。二次記憶装置は、例えば、ハードディスクドライブ(HDD)又はソリッドステートドライブ(SSD)である。記憶装置12は、プロセッサ11によって実行されるコンピュータプログラム12H(図2参照)を備え得る。プロセッサ11は、記憶装置12に格納されたコンピュータプログラム12Hを読み出して実行する。記憶装置12のコンピュータプログラム12Hは、コンピュータを、実施形態に係るコンピュータシステム10として動作させるための命令を示すプログラムコードを有する。
【0032】
外部システム100は、1又は複数のコンピュータによって構成される。外部システムを構成するコンピュータは、プロセッサ101とプロセッサ101に接続された記憶装置102を備える。記憶装置102は、プロセッサ101によって実行されるコンピュータプログラムを備え得る。プロセッサ101は、記憶装置102に格納されたコンピュータプログラムを読み出して実行する。記憶装置102のコンピュータプログラムは、コンピュータを、実施形態に係る外部システム100として動作させるための命令を示すプログラムコードを有する。
【0033】
また、外部システム100は、言語モデルを用いてマスクされた語を予測する予測システムとして機能し得る。外部システム100の詳細については後述される。
【0034】
図2に示すように、実施形態のコンピュータシステム10は、例えば、文書作成支援システムであり得る。実施形態のコンピュータシステム10は、一例として、初期の文章データ12Cから目的の文章データ12Gを生成し得る。コンピュータシステム10は、例えば、要約文の作成を支援し得る。すなわち、コンピュータシステム10は、初期の文章データ12Cの要約を、目的の文章データ12Gとして生成し得る。なお、コンピュータシステム10は、要約以外のその他の文章の作成を支援してもよい。その他の文章の生成は、例えば、初期の文章データから生成された新たな文章、初期の文章データの様式又は体裁の変換、初期の文章データの翻訳などである。
【0035】
図2に示すように、記憶装置12は、辞書データ12Aを備え得る。辞書データ12A、後述のマスク処理11Cによってマスクされる語を選択するために用いられ得る。辞書データ12Aは、企業の営業秘密、国家機密、又はプライバシーに関する情報など(以下、「機微情報」という)を示す語を含み得る。文章に含まれる語のうち、辞書データ12Aに含まれる語は、マスク処理によってマスクされる。
【0036】
機微情報を有する語は、個人又は組織などのユーザが属する専門分野における専門用語又は業界用語を含み得る。辞書データ12Aは、個人又は組織などのユーザによって異なり得る。辞書データ12Aに含まれる語は、ユーザによって登録・編集され得る。コンピュータシステム10は、同一のユーザによって利用され得る複数の辞書データ12Aを有し、用途等に応じて、ユーザが辞書データ12Aを選択して使い分けてもよい。
【0037】
辞書データ12Aは、マスクされるべき特定の語の一覧を有しているだけでなく、マスクされるべき「語の種類」の一覧を有していてもよい。ここでの「語の種類」とは、例えば、人又は組織の名前・地名などの「固有名」、「肩書」、「日時を示す語」、「数量を示す語」、「行為を表す語」である。語の種類は、固有名の認識処理、または、日時を示す語の認識処理、数量を示す語の認識処理、意味解析などの自然言語処理によって認識され得る。例えば、文章中に人名を示す「横山」という語が存在する場合、固有名の認識処理によって、「横山」は「人の名前」であると認識される。この場合、辞書データ12Aに「語の種類」として「人の名前」が登録されていれば、「横山」がマスクされる。つまり、「横山」という語自体が、辞書データ12Aに登録されていなくても、「横山」がマスクされる。
【0038】
記憶装置12は、対応データ12Bを備え得る。対応データは、マスク処理によってマスクされた部分(マスク語)と、マスクされた部分の補完内容(補完語)と、の対応関係を示す。例えば、「横山」という語がマスクされ、そのマスク部分が「佐藤」という語によって補完された場合、対応データ12Bでは、「横山」と「佐藤」とが対応付けて記録される。
【0039】
記憶装置12は、初期データであるオリジナルデータ12C(第1データ)と、コンピュータシステム10によって生成される目的データ12G(第4データ)と、を格納し得る。目的データ12Gは、図2に示すように、例えば、オリジナルデータ12Cの要約である。オリジナルデータ12Cは、文章データを含み得る。オリジナルデータ12Cは、文章データ以外の図形データ・画像データなどを含んでもよい。
【0040】
オリジナルデータ12Cは、機微情報を示す語(以下、「機微語」という)を含み得る。以下では、機微語を含むデータを「機微データ」と呼ぶ。オリジナルデータ12C(第1データ)は機微データであり得る。機微データは、組織のポリシー又は個人情報の保護のため、コンピュータシステム10外への送信が禁止されている、または、ユーザがコンピュータシステム10外への送信を望まない場合がある。
【0041】
実施形態に係るコンピュータシステム10は、機微データを外部へ送信することなく、外部システム100を利用して、機微データであるオリジナルデータ12Cに基づく目的データ12Gを生成することができる。なお、目的データ12G(第4データ)も機微データであり得る。
【0042】
記憶装置12は、初期データ12Cから目的データ12Gが生成されるまでの間に生成される中間データ12D,12E,12Fを格納し得る。中間データ12D,12E,12Fは、例えば、マスクデータ12D、第2データ12E、及び第3データ12Fを含み得る。
【0043】
マスクデータ12Dは、オリジナルデータ12Cに含まれる特定の語をマスクしたものである。すなわち、マスクデータ12Dは、オリジナルデータ12Cの一部をマスクした虫食い文章である。マスクは、前述のように、辞書データ12Aに基づいて行われる。マスクされた語は、機微語であり得る。機微語がマスクされていることで、マスクデータ12Dは、非機微データになる。
【0044】
第2データ12Eは、オリジナルデータである第1データ12Cから生成されたデータである。図2では、第2データ12Eは、補完データ12Eとして示されている。第2データ12Eは、第1データ12Cに含まれる第1語を、第2語に変換することで生成される。第1語は、機微語であり得る。第1語は、辞書データ12Aに基づいて選択され得る。第2語は、非機微語であり得る。第2語は辞書データ12Aに基づいて選択されなかった語であり得る。
【0045】
実施形態においては、一例として、第2データ12Eは、第1データ12Cから生成されたマスクデータ12Dに基づいて生成される。この場合、第1語から第2語への変換は、第1データ12Cに含まれる第1語をマスクし、マスクされた語を補完(予測)することで行われ得る。補完(予測)された語が第2語になる。
【0046】
ここでの補完又は予測は、不正確な補完又は不正確な予測であるほうが、機微情報を隠蔽できるという観点で好ましい。つまり、補完又は予測の処理は、いい加減なものでもよい。また、マスクされる語の数を多くすることで、オリジナルデータにおける文章の意味が分かりにくくなるため、補完又は予測の精度を大きく低下させて、機微情報を隠蔽することができる。
【0047】
なお、補完又は予測された語(第2語)が、偶然、マスクされた第1語と一致することがあり得るため、第1語と第2語とは、文章全体で完全に一致してなければ、部分的に一致していてもよい。つまり、マスクされた複数の語(第1語)のうち、一部の語(第1語)に対応する第2語は、第1語と同じものであってもよい。一部の語において、第1語と第2語とが偶然共通していても、単なる偶然であれば、その第2語は、機微情報を示していないため、文章データ全体としては、機微情報が隠蔽されたものとなる。
【0048】
第2データ12Eにおいては、第1データ12Cに含まれる機微語である第1語が、非機微語である第2語に変換される。このため、第2データ12Eは、非機微データになる。第2データ12Eは、マスクデータ12Dと同様に、機微語を有しないが、マスクされた語が補完されている。このため、第2データ12Eは、マスクデータ12Dに比べて、文章の意味が分かりやすい。したがって、第2データ12Eに基づく自然言語処理は、マスクデータ12Dに対する自然言語処理に比べて、適切に行われ易くなる。
【0049】
第3データ12Fは、第2データ12Eから生成される。図2において、第3データ12Fは、第2データ12Eである補完データの要約として示されている。非機微データである第2データ12Eの要約である第3データ12Fも、非機微データである。
【0050】
プロセッサ11は、コンピュータプログラム12Hの命令に従って、様々な処理11A,11B,11C,11D,11E,11Fを実行可能である。
【0051】
プロセッサ11が実行する処理は、リクエスト送信11Aを含み得る。リクエスト送信11Aは、外部システム100に対して、何らかの処理をリクエストすることである。リクエストは、コンピュータシステム10から外部システム100へ送信される。リクエストは、後述の補完処理のリクエスト、又は、文章加工処理のリクエストを含み得る。プロセッサ11は、リクエストを、外部システム100における処理に用いられるデータとともに、外部システム100へ送信し得る。
【0052】
プロセッサ11が実行する処理は、応答受信11Bを含み得る。応答受信11Bは、前述のリクエストに対する外部システム100の応答を受信することである。応答は、リクエストに基づいて外部システム100が実行した実行結果を含み得る。応答は、後述の補完処理の処理結果の通知、又は、文章加工処理の処理結果の通知を含み得る。応答は、外部システム100における処理によって生成されたデータとともに、外部システム100から送信され得る。プロセッサ11は、生成されたデータを含む応答を外部システム100から受信し得る。
【0053】
プロセッサ11が実行する処理は、マスク処理11Cを含み得る。マスク処理11Cは、第1データ12Cに含まれる語をマスクすることを含む。プロセッサ11は、辞書データ12Aを参照し、第1データ12Cに含まれる語のうち、マスクすべき語を選択する。マスクすべき語は、例えば、辞書データ12Aに含まれる語、又は、辞書データ12Aに含まれる「語の種類」と一致する種類の語である。マスク処理11Cによって、第1データ12Cに含まれる複数の語の一部がマスクされたマスクデータ12Dが生成される。
【0054】
プロセッサ11が実行する処理は、オリジナルデータである第1データ12Cを取得する処理11Dを含み得る。取得処理11Dは、第1データ12Cを外部から取得することである。例えば、プロセッサ11は、取得処理11Dとして、端末20に入力された文章を含む第1データ12Cを、ネットワーク30を介して、受信する。また、プロセッサ11は、取得処理11Dとして、端末20などの他のコンピュータから送信された第1データ12Cを受信する。なお、第1データ12Cは、記憶装置12に予め保存されていてもよい。
【0055】
プロセッサ11が実行する処理は、データ出力処理11Eを含み得る。出力処理11Eは、例えば、記憶装置12に格納されたデータ12A,12B,12C,12D,12E,12F,12Gを、コンピュータシステム10のディスプレイ又は端末20のディスプレイ等に出力することである。出力処理11Eによって、ユーザは、データ12A,12B,12C,12D,12E,12F,12Gを参照することができる。なお、出力処理11Eは、他のコンピュータへのデータ送信であってもよい。
【0056】
プロセッサ11が実行する処理は、データ編集処理11Fを含み得る。編集処理11Fは、例えば、記憶装置12に格納されたデータ12A,12B,12C,12D,12E,12F,12Gを、ユーザが編集する環境をユーザに提示することである。例えば、プロセッサ11は、出力処理11Eによって表示されたデータ12A,12B,12C,12D,12E,12F,12Gに対する編集操作を受け付け、編集後のデータ12A,12B,12C,12D,12E,12F,12Gを記憶装置12に保存することができる。
【0057】
データ編集は、例えば、オリジナルデータ12Cの編集、生成されたマスクデータ12Dの編集、生成された第2データ12Eの編集、生成された第3データ12Fの編集、及び生成された第4データ12Gの編集を含み得る。
【0058】
図3は、外部システム100の構成を示している。外部システム100は、コンピュータシステム10のユーザ又はそのユーザが属する又は関連する組織以外の第三者によって管理され得る。ここで、外部システム100における「外部」とは、コンピュータシステム10の第1データ12Cが送信されるべきでない範囲をいう。「外部」は、典型的には、コンピュータシステム10を有する個人又は組織外の範囲であるが、それに限られない。例えば、ある組織において、情報遮断措置がとられた第1グループと第2グループが存在する場合、第1グループからみて第2グループは、「外部」であり得る。なお、以下では、外部システム100を単に、システム100ということがある。
【0059】
システム100は、一例として、言語モデル120を備え得る。言語モデル120は、一例として、機械学習されたAI言語モデルである。言語モデルは、文章の認識・生成・要約などに用いられる。コンピュータに実装された言語モデルに、ある文章が与えられると、与えられた文章の要約を生成したり、与えられた文章に対する回答を生成したり、新たな文章を生成したりすることができる。
【0060】
言語モデル120は、例えば、Generative Pretrained Transformer(GPT)121である。GPT121は、文章生成モデルである。言語モデル120は、マスク言語モデル(Masked Language Model:MLM)122であってもよい。マスク言語モデルは、マスクされた文章の補完処理(虫食い文章の穴埋め処理)に用いられる。なお、GPT121は、補完処理も可能であるため、GPT121と別にマスク言語モデルを用意する必要はない。
【0061】
GPT121は、大規模なデータセットを用いた、教師なし学習によって、機械学習された言語モデルである。機械学習のためのデータセットは、データベース112に保存される。
【0062】
システム100は、インターフェース111を介して、文章データを受信する。受信する文章データは、例えば、マスクデータ12D又は補完データ12Eである。システム100は、受信した文章データを、言語モデル120に入力する。言語モデル120は、入力された文章データに基づいて、適宜の文章を生成し、出力する。
【0063】
システム100は、生成した文章データを、インターフェース111を介して、送信する。送信する文章データは、例えば、補完データ12E又は補完データ12Eの要約12Fである。
【0064】
インターフェース111は、システム100が外部とのコミュニケーションを実施するための機能であり、例えば、チャットのためのインターフェースとして実装される。チャットのためのインターフェース111は、システム100外部から、文章の入力を受け付け、入力された文章に基づき言語モデル120によって生成された文章を、外部へ出力する。
【0065】
実施形態においては、一例として、コンピュータシステム10は、チャットのためのインターフェース111に対して、文章生成のリクエスト送信11Aを実行するとともに、そのインターフェース111から出力された文章の受信を、リクエストに対する応答受信11Bとして実行する。
【0066】
システム100は、受信したデータを、言語モデル120に与えるほか、データベース112に保存することができる。システム100は、保存されたデータに基づいて、言語モデル120の機械学習をし直して、言語モデル120の機能・性能を向上させることができる。
【0067】
図4は、初期データである第1データ12Cから、目的データである第4データ12Gを生成する手順を示している。なお、図3には、図4に示す手順に従ったデータの流れも示されている。図5及び図6は、図4に示す手順によって生成されるデータの一例を示している。
【0068】
図3に示す手順は、一例として、外部システム100を利用して、プロセッサ11によって実行される。ここでは、一例として、図5に示すオリジナルデータ(原文)12Cから、図5に示す要約12Gが生成される。
【0069】
図4に示すように、プロセッサ11は、まず、マスク処理を実行する(ステップS41)。プロセッサ11は、記憶装置12に保存された第1データ12Cに含まれる語のうち、辞書データ12Aに基づいて選択された語をマスクすることでマスクデータ12Dを生成する。マスクデータ12Dは、第1データ12Cに含まれる語の一部をマスクしたものである。図5に示すマスクデータ12Dでは、マスクされた部分が、「*」で示されている。マスクされていない部分については、マスクデータ12Dと第1データ12Cとは共通している。
【0070】
図5に示すように、マスクデータ12Dは、第1データ12Cと同様の文章の骨格を有しているが、機微語がマスクされているため、全体として、機微情報は隠蔽されている。
【0071】
ユーザは、生成されたマスクデータ12Dに対する編集操作を行って、生成されたマスクデータ12Dにおいてマスクされていない語を追加でマスクしたり、マスクを取りやめるため、マスクされた語を元に戻したりしてもよい。編集による追加でのマスクによって、辞書データ12Aによってはマスクされなかった語を、ユーザ判断でマスクすることができる。また、編集によるマスクの取りやめによって、非機微語にされたマスクを取り除くことができる。編集されたマスクデータ12Dは、保存される。編集された場合には、編集後のマスクデータ12Dが、後述の補完処理に用いられる。
【0072】
プロセッサ11は、マスクデータ12Dに対する補完処理を実行する(ステップS42)。補完処理は、マスクデータ12Dにおいてマスクされた部分を予測する処理(虫食い文章の穴埋め処理)である。
【0073】
図3に示すように、プロセッサ11は、補完処理として、マスクデータ12Dの補完を、マスク部分を予測する予測システムとしての外部システム100に対してリクエストし、外部システム100によって生成された補完データ12Eを受信する。マスクデータ12Dは、機微語を含まない非機微データであるため、外部システム100へ送信しても問題ない。
【0074】
外部システム100のインターフェースがチャットインターフェース111である場合、補完のためのリクエストとして、コンピュータシステム10のプロセッサ11は、例えば、図5に示すマスクデータ12Dの文章の前に、「次の文章を穴埋めして下さい。」のようにマスク補完を要求する文章を付加したリクエストメッセージを生成する。
【0075】
プロセッサ11は、生成したリクエストメッセージを、外部システム100のインターフェース111へ送信する。外部システム100は、インターフェース111を介して受信したリクエストメッセージを、言語モデル120に与える。言語モデル120は、リクエストメッセージの意味解析を行い、「次の文章を穴埋めして下さい。」の文章に従って、その文章に続くマスクデータ12Dの文章のマスク補完(穴埋め;マスク部分の語の予測)をした文章(図5の補完データ12E)を出力する。
【0076】
外部システム100は、出力された補完データ(第2データ)12Eを、コンピュータシステム10へ送信する。コンピュータシステム10のプロセッサ11は、送信された補完データ12Eを受信して記憶装置12に保存する。図5に示すように、補完データ12Eは、マスクデータ12Dにおけるマスク部分が適当に予測された語で補完されているため、文章の骨格は、オリジナルデータ12Cと共通するが、機微情報は隠蔽されたものとなっている。また、補完データ12Eは、マスクデータ12Dに比べて、自然な文章であるため、外部システム100による意味解析に適している。
【0077】
プロセッサ11は、オリジナルデータ12Cと補完データ12Eとに基づいて、対応データ12Bを生成する。対応データ12Bの生成には、必要であればマスクデータ12Dを用いてもよい。図6は、対応データ12Bの一例を示している。図6に示す対応データ12Bは、図5に示す補完データ12Eとマスクデータ12Dとに基づいて生成されたものである。図6において、左側は、第1データ12Cに含まれる語(第1語)の一覧を示しており、右側は、第2データ12Eに含まれる語(第2語)の一覧を示している。対応データ12Bは、第1語と、その第1語がどのような第2語によって変換されているかの対応関係を示している。例えば、オリジナルデータ12Cにおける第1語としての「岸田首相」は、補完データ12Eにおいて第2語としての「田中氏」に変換されている。この場合、対応データ12Bには、第1語としての「岸田首相」と第2語としての「田中氏」とが対応付けて記録されている。
【0078】
プロセッサ11は、対応データ12Bの生成のため、オリジナルデータ12Cと補完データ12Eとを対比し、オリジナルデータ12Cにおける語(第1語)が、補完データ12Eにおけるどの語(第2語)で置き換えられているかを識別する。なお、オリジナルデータ12C及び/又は補完データ12Eにおいて、第1語から第2語に置き換えられている箇所の識別のため、マスクデータ12Dが用いられてもよい。
【0079】
なお、言語モデル120は、マスクデータ12Dを補完する際に、生成される補完データ12Eの文章を自然なものにするため、マスクされた部分以外の文章も変更することがある。この場合、プロセッサ11は、マスクされた部分以外の文章の変更も対応データ12Bに記録し得る。
【0080】
ユーザは、生成された補完データ12Eに対する編集操作を行ってもよい。補完された語(第2語)が、元の第1語と偶然同じである場合、ユーザ編集操作によって、補完された第2語を、別の第2語に変更してもよい。また、補完データ12Eの文章が不自然な場合には、ユーザ編集操作によって、文章を編集してもよい。プロセッサ11は、ユーザ編集後の補完データ12Eの語(第2語)とオリジナルデータ12Cの語(第1語)との対応関係も、対応データ12Bに記録する。
【0081】
プロセッサ11は、生成した対応データ12Bを記憶装置12に保存する(ステップS43)。
【0082】
なお、図4に示す補完処理(ステップS42)を省略して、適宜のアルゴリズム又はユーザ編集操作によって、第1データ12Cから、直接、第2データ12Eを生成してもよい。つまり、第1データ12Cに含まれる第1語は、適宜のアルゴリズム又はユーザ編集操作によって、第2語に変換されてもよい。
【0083】
続いて、図4に示すように、プロセッサ11は、文書加工処理を実行する(ステップS44)。図3に示すように、プロセッサ11は、文章加工処理として、第2データ12Eの文章加工を、外部システム100に対してリクエストし、外部システム100によって生成された第3データ12Fを受信する。第2データ12Eは機微語を含まない非機微データであるため、外部システム100へ送信しても問題ない。
【0084】
文章加工が、要約の生成である場合、要約生成のためのリクエストとして、コンピュータシステム10のプロセッサは、例えば、図5に示す補完データ12Eの文章の前に、「次の文章を要約して下さい。」のように文章加工(文章要約)を要求する文章を付加したリクエストメッセージを生成する。
【0085】
プロセッサ11は、要約生成のため、生成したリクエストメッセージを、外部システム100のインターフェース111へ送信する。外部システム100は、インターフェース111を介して受信したリクエストメッセージを、言語モデル120に与える。言語モデル120は、リクエストメッセージの意味解析を行い、「次の文章を要約して下さい。」の文章に従って、その文章に続く第2データ12Eの文章を要約した文章(図5の補完データの要約12F)を出力する。第2データ12Eは、マスクデータ12Dとは異なり自然な文章であるため、言語モデル120は、第2データ12Eの意味解析を適切に行うことができ、その結果、適切な要約を生成できる。
【0086】
外部システム100は、出力された要約(第3データ)12Fを、コンピュータシステム10へ送信する。コンピュータシステム10のプロセッサ11は、送信された要約12Fを受信して記憶装置12に保存する。非機微データである第2データ12Eを要約した第3データ12Fは、非機微データであるため、外部システム100とコンピュータシステム10との間でやり取りされても問題ない。
【0087】
ユーザは、生成された要約12Fに対する編集操作を行ってもよい。編集された要約12Fは、記憶装置12に保存される。
【0088】
プロセッサは、第3データ12Fに対する復元処理を実行して第4データ12Gを生成する(ステップS45)。復元処理は、第3データ12Fに含まれる第2語を、第1語に変換する処理である。第2語を第1語に変換する処理は、プロセッサ11が、対応データ12Bを参照して行う。プロセッサ11は、第3データ12Fに含まれる語のうち、対応データ12Bにおいて第2語として含まれる語を識別し、第3データ12Fにおいて第2語として識別された語を、対応データ12Bにおいて第2語に対応付けられた第1語に変換する。例えば、プロセッサ11は、対応データ12Bを参照して、第3データ12Fに含まれる語のうち「田中氏」を第2語の一つとして識別する。対応データ12Bにおいて「田中氏」は「岸田首相」に対応付けられている。したがって、プロセッサ11は、第3データ12Fに含まれる「田中氏」を「岸田首相」に変換する。同様に、プロセッサ11は、第3データ12Fに含まれる各第2語を、対応する第1語に変換することで、第4データ12Gを生成する。
【0089】
プロセッサ11は、復元処理によって生成した第4データ12Gを記憶装置12に保存する。ユーザは、生成された第4データ12Gに対する編集操作を行ってもよい。編集された第4データ12Gは、記憶装置12に保存される。
【0090】
なお、ステップS44の文章加工処理が翻訳である場合、対応データ12Bは、第1語及び第2語の翻訳語を含むのが好ましい。プロセッサ11は、翻訳文である第3データ12Fにおける第2語の翻訳語を、対応データ12Bに含まれる第1語及び第2語の翻訳語を参照し、第1語の翻訳語に変換することで、第4データを生成し得る。
【0091】
プロセッサ11は、第1語の翻訳を、辞書データ12Aから取得し得る。この場合、辞書データ12Aは、マスクすべき語の翻訳語も備えているのが好ましい。プロセッサ11は、第2語の翻訳を、翻訳前の第2データ12Eと翻訳後の第3データ12Fとから取得し得る。プロセッサ11は、翻訳前の第2データ12Eと翻訳後の第3データ12Fとを対比して、第2データ12Eに含まれる第2語に対応する翻訳語を、第3データ12Fから抽出することができる。プロセッサ11は、取得した第1語及び第2の翻訳語を対応データ12Bとして保存し得る。
【0092】
このように、第4データ12Gの生成のため、第3データに含まれる第2語を第1語に変換することは、第2語の翻訳語を第1語の翻訳語に変換することを含み得る。
【0093】
実施形態によれば、機微データを外部システム100へ送信することなく、外部システム100を利用して、機微データである第1データ12Cを加工した第4データ12Gを得ることができる。
【0094】
本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。例えば、ステップS41においてマスクされた部分を予測する外部システム100と、ステップS44において要約などの文章加工を行う外部システム100と、は別々のシステムであってもよい。
【符号の説明】
【0095】
10 :コンピュータシステム
10A :コンピュータシステム
10B :コンピュータシステム
11 :プロセッサ
11A :リクエスト送信
11B :応答受信
11C :マスク処理
11D :取得処理
11E :データ出力処理
11F :データ編集処理
12 :記憶装置
12A :辞書データ
12B :対応データ
12C :第1データ
12D :マスクデータ
12E :第2データ
12F :第3データ
12G :第4データ
12H :コンピュータプログラム
20 :端末
30 :ネットワーク
50A :施設
50B :施設
100 :外部システム
101 :プロセッサ
102 :記憶装置
111 :インターフェース
112 :データベース
120 :言語モデル
121 :生成モデル
121 :マスク言語モデル
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正の内容】
図1
図2
図3
図4
図5
図6