特許7586862 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ソフトバンクモバイル株式会社の特許一覧

特許7586862学習装置、プログラム、及び学習方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-11-11

(45)【発行日】2024-11-19

(54)【発明の名称】学習装置、プログラム、及び学習方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20241112BHJP

G06N 3/00 20230101ALI20241112BHJP

G06F 40/211 20200101ALI20241112BHJP

G06F 40/216 20200101ALI20241112BHJP

【ＦＩ】

G06N20/00

G06N3/00

G06F40/211

G06F40/216

【請求項の数】 5

(21)【出願番号】P 2022113724

(22)【出願日】2022-07-15

(65)【公開番号】P2024011593

(43)【公開日】2024-01-25

【審査請求日】2023-11-01

(73)【特許権者】

【識別番号】501440684

【氏名又は名称】ソフトバンク株式会社

(74)【代理人】

【識別番号】110000877

【氏名又は名称】弁理士法人ＲＹＵＫＡ国際特許事務所

(72)【発明者】

【氏名】石若裕子

(72)【発明者】

【氏名】丹下敦矢

(72)【発明者】

【氏名】吉田智博

【審査官】多賀実

(56)【参考文献】

【文献】特開２００７－０８０１１７（ＪＰ，Ａ）

【文献】Daniel Mitropolsky et al.，"A Biologically Plausible Parser"，arXiv.org [online]，arXiv:2108.02189v1，米国，Cornell University，2021年，[検索日 2024.08.02], インターネット:<URL: https://arxiv.org/abs/2108.02189v1>

【文献】栗田修平ほか，「深層強化学習を用いた意味依存構造解析は自発的に平易優先戦略を学習する」，言語処理学会第２５回年次大会発表論文集 [online]，言語処理学会，2019年03月04日，pp.159-162，[検索日 2019.04.18], インターネット:<URL: http://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/D2-2.pdf>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ４０／２０－４０／５８

(57)【特許請求の範囲】

【請求項1】

学習用文章と前記学習用文章における形態素同士の係り受けとを含む学習用文章データを記憶する記憶部と、
前記記憶部に記憶された複数の前記学習用文章データを用いて、ＡＣ（ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓ）におけるルールを学習する学習実行部と、
を備え、
前記学習実行部は、複数の品詞エージェントに対して、それぞれが文の要素を表す複数の要素エリアによって表される文の係り受けの遷移を環境とし、前記環境における前記品詞エージェントの位置と前記環境におけるＡｓｓｅｍｂｌｙが存在する要素エリアとを状態とし、前記品詞エージェントによる前記複数の要素エリアの遷移を行動とした強化学習を実行することによって、前記ルールを学習する、学習装置。

【請求項2】

前記学習実行部は、前記ＡＣにおけるＦｉｂｅｒルールを学習する、請求項１に記載の学習装置。

【請求項3】

前記学習実行部は、前記品詞エージェントによる行動に対して、前記学習用文章データに含まれる係り受けに基づいて決定した報酬を与えることによって、前記強化学習を実行する、請求項１に記載の学習装置。

【請求項4】

コンピュータを、請求項１から３のいずれか一項に記載の学習装置として機能させるためのプログラム。

【請求項5】

コンピュータによって実行される学習方法であって、
学習用文章と前記学習用文章における形態素同士の係り受けとを含む学習用文章データを用いて、ＡＣ（ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓ）におけるルールを学習する学習実行段階
を備え、
前記学習実行段階は、複数の品詞エージェントに対して、それぞれが文の要素を表す複数の要素エリアによって表される文の係り受けの遷移を環境とし、前記環境における前記品詞エージェントの位置と前記環境におけるＡｓｓｅｍｂｌｙが存在する要素エリアとを状態とし、前記品詞エージェントによる前記複数の要素エリアの遷移を行動とした強化学習を実行することによって、前記ルールを学習する、学習方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習装置、プログラム、及び学習方法に関する。

【背景技術】

【0002】

非特許文献１には、Ａｓｓｅｍｂｌｙを基本とする脳の計算モデルであるＡＣ（ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓ）について記載されている。非特許文献２には、文章から、主語、目的語等の依存関係のラベルを出力する技術が記載されている。
［先行技術文献］
［非特許文献］
［非特許文献１］Christos H. Papadimitriou, Santosh S. Vempala, Daniel Mitropolsky, Michael Collins, and Wolfgang Maass. "Brain computation by assemblies of neurons". Proceedings of the National Academy of Sciences. 2020, 117(25):14464-14472.
［非特許文献２］Daniel Mitropolsky, Michael J. Collins and Christos H. Papadimitriou. "A Biologically Plausible Parser". Transactions of the Association for Computational Linguistics. 2021, 9: 1374-1388

【発明の概要】

【課題を解決するための手段】

【0003】

本発明の一実施態様によれば、学習装置が提供される。前記学習装置は、学習用文章と前記学習用文章における形態素同士の係り受けとを含む学習用文章データを記憶する記憶部を備えてよい。前記学習装置は、前記記憶部に記憶された複数の前記学習用文章データを用いて、ＡＣ（ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓ）におけるルールを学習する学習実行部を備えてよい。

【0004】

前記学習装置において、前記学習実行部は、前記ＡＣにおけるＦｉｂｅｒルールを学習してよい。

【0005】

前記いずれかの学習装置において、前記学習実行部は、強化学習によって前記ルールを学習してよい。前記学習実行部は、複数の品詞エージェントに対して、それぞれが文の要素を表す複数の要素エリアによって表される文の係り受けの遷移を環境とし、前記環境における前記品詞エージェントの位置と前記環境におけるＡｓｓｅｍｂｌｙが存在する要素エリアとを状態とし、前記品詞エージェントによる前記複数の要素エリアの遷移を行動とした強化学習を実行することによって、前記ルールを学習してよい。前記学習実行部は、前記品詞エージェントによる行動に対して、前記学習用文章データに含まれる係り受けに基づいて決定した報酬を与えることによって、前記強化学習を実行してよい。

【0006】

本発明の一実施態様によれば、コンピュータを、前記学習装置として機能させるためのプログラムが提供される。

【0007】

本発明の一実施態様によれば、コンピュータによって実行される学習方法が提供される。前記学習方法は、学習用文章と前記学習用文章における形態素同士の係り受けとを含む学習用文章データを用いて、ＡＣ（ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓ）におけるルールを学習する学習実行段階を備えてよい。

【0008】

なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。

【図面の簡単な説明】

【0009】

【図1】システム１０の一例を概略的に示す。

【図2】ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。

【図3】ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。

【図4】ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。

【図5】ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。

【図6】ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。

【図7】ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。

【図8】学習装置２００による学習について説明するための説明図である。

【図9】学習装置２００の強化学習における報酬について説明するための説明図である。

【図10】学習装置２００の強化学習における報酬について説明するための説明図である。

【図11】各形態素（品詞）毎の各行動毎のＱテーブル７００の一例を概略的に示す。

【図12】学習装置２００の機能構成の一例を概略的に示す。

【図13】学習実行部２０６によるＰｒｏｊｅｃｔｉｏｎのアルゴリズムの一例を示す。

【図14】学習実行部２０６によるＲｅａｄｏｕｔのアルゴリズムの一例を示す。

【図15】学習実行部２０６によるマルチエージェント強化学習のアルゴリズムの一例を示す。

【図16】学習装置２００として機能するコンピュータ１２００のハードウェア構成の一例を概略的に示す。

【発明を実施するための形態】

【0010】

ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓでは、Ａｓｓｅｍｂｌｙを自動で生成することができる。Ｐｒｏｊｅｃｔｉｏｎという、あるＡｒｅａから別のＡｒｅａに新たなＡｓｓｅｍｂｌｙを形成するＯｐｅｒａｔｉｏｎがあり、そのＯｐｅｒａｔｉｏｎを用いた文中の単語間の依存関係をＡｓｓｅｍｂｌｙのＰｒｏｊｅｃｔｉｏｎで取得できるＰａｒｓｅｒがすでに提案されている。

【0011】

このＰａｒｓｅｒでは文の主語、目的語等の依存関係のラベルを出力することができる。このＰａｒｓｅｒは単語の品詞に相当するＡｒｅａを含み、ＬｅｆｔＭｅｄｉａｌＴｅｍｐｏｒａｌＬｏｂｅ（ＭＴＬ）内に存在すると考えられているＬｅｘｉｃｏｎＡｒｅａと、ＳｕｐｅｒｉｏｒＴｅｍｐｏｒａｌＧｙｒｕｓ（ＳＴＧ）に含まれると考えられる主語、目的語等の各依存関係に相当するＡｒｅａ、それらのＡｒｅａをＦｉｂｅｒという複数のＳｙｎａｐｓｅｓで相互に繋がれ、構成される。Ａｒｅａ間ではＦｉｂｅｒを経由してＰｒｏｊｅｃｔｉｏｎが行われ、あるエリアのＡｓｓｅｍｂｌｙから新たなＡｓｓｅｍｂｌｙがＰｒｏｊｅｃｔｉｏｎ先のＡｒｅａに形成される。ＬｅｘｉｃｏｎＡｒｅａからＤｉｓｉｎｈｉｂｉｔされたＦｉｂｅｒＡｒｅａを通してＰｒｏｊｅｃｔｉｏｎが行われ、依存関係を記録していく。

【0012】

日本語の依存関係を正しく出力するのは非常に難しい。例えば、日本語では文中での主語、目的語の出現順序は決まっていないため、出現する品詞の順番のみで依存関係を正しく得ることができないことがある。また、同じ助詞が名詞の後に付与されていてもそれらの名詞は主語、目的語のいずれにもなりうる可能性があり、助詞のみから主語、目的語を判断するのは難しいことがある。上述のＰｒｓｅｒはＴｒｙａｎｄＥｒｒｏｒと言語学に基づき、各時点でどのＦｉｂｅｒをＤｉｓｉｎｈｉｂｉｔ、Ｉｎｈｉｂｉｔするかを表すＦｉｂｅｒルールを手動で設定している。しかし、様々な種類の文の依存関係ラベルを正しく出力できる汎用的なＦｉｂｅｒルールを手動で設定するのは非常に手間がかかり、困難である。

【0013】

そこで、発明者は、まず、簡単な日本語の文のＰａｒｓｅに必要なＢｒａｉｎＡｒｅａを設定し、Ｐｒｏｊｅｃｔｉｏｎを用いた日本語Ｐａｒｓｅｒを構築し、その後、Ｆｉｂｅｒルールを自動で学習するアルゴリズムを編み出した。学習ではＬｅｘｉｃｏｎＢｒａｉｎＡｒｅａ内に品詞の種類ごとにＡｇｅｎｔを用意し、マルチエージェント強化学習を用いて、各ＡｇｅｎｔがＰａｒｓｅ時にどのＦｉｂｅｒを使ってＰｒｏｊｅｃｔｉｏｎを行えば正しく依存関係を出力できるかを学習する。本学習アルゴリズムを用いて、品詞の種類、単語の数の多い、より長い文、文章になった時にも応用できるＰａｒｓｅｒを実現できる可能性が示唆され、他言語のＰａｒｓｅｒの学習にも使えると考えられる。また、本学習アルゴリズム、学習させたモデルにより脳の言語習得の解明にも繋がると考えられる。

【0014】

以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。

【0015】

図１は、システム１０の一例を概略的に示す。システム１０は、解析装置１００及び学習装置２００を備える。解析装置１００は、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓを用いて、入力された文中の単語間の依存関係を解析する装置である。学習装置２００は、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓで用いるルールを学習する装置である。

【0016】

学習装置２００は、学習によって生成したルールを解析装置１００に提供する。解析装置１００は、学習装置２００から取得したルールを用いて、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓを実行してよい。解析装置１００は、例えば、通信端末３０から受信した文章について、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓによって係り受けを解析して、解析結果を通信端末３０に提供する。

【0017】

解析装置１００、学習装置２００、及び通信端末３０は、ネットワーク２０を介して通信してよい。ネットワーク２０は、移動体通信ネットワークを含んでよい。移動体通信ネットワークは、ＬＴＥ（ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）通信方式、５Ｇ（５ｔｈＧｅｎｅｒａｔｉｏｎ）通信方式、３Ｇ（３ｒｄＧｅｎｅｒａｔｉｏｎ）通信方式、及び６Ｇ（６ｔｈＧｅｎｅｒａｔｉｏｎ）通信方式以降の通信方式のいずれに準拠していてもよい。ネットワーク２０は、インターネットを含んでよい。ネットワーク２０は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）を含んでよい。解析装置１００、学習装置２００、及び通信端末３０のそれぞれは、ネットワーク２０に有線接続されても、無線接続されてもよい。

【0018】

なお、解析装置１００と学習装置２００とは一体であってもよい。すなわち、学習装置２００が解析装置１００の機能を更に備えてもよい。

【0019】

図２～図７は、解析装置１００によるＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明するための説明図である。ここでは、英語の係り受けを解析するＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓについて説明する。

【0020】

本例では、「Ｔｈｅｍａｎｓａｗａｗｏｍａｎ」という文章の係り受けを解析する場合を例に挙げる。ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおいては、ＬＥＸ（Ｌｅｘｉｃｏｎ）エリア４０２の他、複数の文の要素のエリアが定義される。文の要素には、主語（Ｓｕｂｊｅｃｔ）、述語（Ｖｅｒｂ）、目的語（Ｏｂｊｅｃｔ）、限定詞（Ｄｅｔｅｒｍｉｎｅｒｓ）、形容詞（Ａｄｊｅｃｔｉｖｅ）、副詞（Ａｄｖｅｒｂ）、及び前置詞（Ｐｒｅｐｏｓｉｔｉｏｎ）等の多数の種類が存在するが、ここでは、「Ｔｈｅｍａｎｓａｗａｗｏｍａｎ」という文章の解析に関係する文の要素である、ＤＥＴ（Ｄｅｔｅｒｍｉｎｅｒｓ）エリア４０４、ＳＵＢＪ（Ｓｕｂｊｅｃｔ）エリア４０６、ＯＢＪ（Ｏｂｊｅｃｔ）エリア４０８、及びＶＥＲＢエリア４１０のみを示している。

【0021】

解析装置１００は、Ｗｏｒｄが入力された場合に、Ｗｏｒｄの品詞に対応するＦｉｂｅｒルール４２０に従って、複数のエリア間のＦｉｂｅｒを経由したＰｒｏｊｅｃｔｉｏｎを行うことによって、Ｗｏｒｄ間の依存関係を解析していく。本例では、Ｆｉｂｅｒルール４２０にプレコマンド及びポストコマンドが含まれる場合を例に挙げて説明するが、Ｆｉｂｅｒルール４２０にポストコマンドは含まれなくてもよい。

【0022】

図２は、初期状態を示す。本例において、初期状態では、ＬＥＸエリア４０２、ＤＥＴエリア４０４、ＳＵＢＪエリア４０６、及びＶＥＲＢエリア４１０がオンにされ、全てのＦｉｂｅｒがオフにされる。図２～図７では、オンになっているエリアの名称に下線を付すことによって、オンになっているエリアとオフになっているエリアとの区別をつけている。また、オンになっているＦｉｂｅｒを実線、オフになっているＦｉｂｅｒを破線とすることによって、区別をつけている。

【0023】

図３では、「ｔｈｅ」が入力された場合について、説明する。入力されたＷｏｒｄを、便宜的にＬＥＸエリア４０２内の右上に示している。

【0024】

「ｔｈｅ」に対しては、プレコマンドによって、ＤＥＴエリア４０４がオンにされ、ＬＥＸエリア４０２とＤＥＴエリア４０４とのＦｉｂｅｒがオンにされる。ＬＥＸエリア４０２内のＡｓｓｅｍｂｌｙとＤＥＴエリア４０４内のＡｓｓｅｍｂｌｙとが接続される。ポストコマンドによって、ＬＥＸエリア４０２とＤＥＴエリア４０４とのＦｉｂｅｒがオフにされる。

【0025】

図４では、「ｍａｎ」が入力された場合について、説明する。「ｍａｎ」に対しては、プレコマンドによって、ＬＥＸエリア４０２とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＤＥＴエリア４０４とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＯＢＪエリア４０８とＶＥＲＢエリア４１０とのＦｉｂｅｒがオンにされる。ＯＢＪエリア４０８がオフであることから、ＬＥＸエリア４０２内のＡｓｓｅｍｂｌｙとＳＵＢＪエリア４０６内のＡｓｓｅｍｂｌｙとが接続され、ＳＵＢＪエリア４０６内のＡｓｓｅｍｂｌｙとＤＥＴエリア４０４内のＡｓｓｅｍｂｌｙとが接続される。ポストコマンドによって、ＤＥＴエリア４０４と、ＬＥＸエリア４０２とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＤＥＴエリア４０４とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＯＢＪエリア４０８とＶＥＲＢエリア４１０とのＦｉｂｅｒがオフにされる。

【0026】

図５では、「ｓａｗ」が入力された場合について、説明する。「ｓａｗ」に対しては、プレコマンドによって、ＬＥＸエリア４０２とＶＥＲＢエリア４１０とのＦｉｂｅｒ、及びＶＥＲＢエリア４１０とＳＵＢＪエリア４０６とのＦｉｂｅｒがオンにされる。ＬＥＸエリア４０２内のＡｓｓｅｍｂｌｙとＶＥＲＢエリア４１０内のＡｓｓｅｍｂｌｙとが接続され、ＶＥＲＢエリア４１０内のＡｓｓｅｍｂｌｙとＳＵＢＪエリア４０６内のＡｓｓｅｍｂｌｙとが接続される。ポストコマンドによって、ＳＵＢＪエリア４０６がオフにされ、ＯＢＪエリア４０８がオンにされ、ＬＥＸエリア４０２とＶＥＲＢエリア４１０とのＦｉｂｅｒがオフにされる。

【0027】

図６は、「ａ」が入力された場合について、説明する。「ａ」に対しては、プレコマンドによって、ＬＥＸエリア４０２と、ＬＥＸエリア４０２とＤＥＴエリア４０４とのＦｉｂｅｒとがオンにされる。ＬＥＸエリア４０２内のＡｓｓｅｍｂｌｙとＤＥＴエリア４０４内のＡｓｓｅｍｂｌｙとが接続される。ポストコマンドによって、ＬＥＸエリア４０２とＤＥＴエリア４０４とのＦｉｂｅｒがオフにされる。

【0028】

図７は、「ｗｏｍａｎ」が入力された場合について、説明する。「ｗｏｍａｎ」に対しては、プレコマンドによって、ＬＥＸエリア４０２とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＤＥＴエリア４０４とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＯＢＪエリア４０８とＶＥＲＢエリア４１０とのＦｉｂｅｒがオンにされる。ＬＥＸエリア４０２内のＡｓｓｅｍｂｌｙとＯＢＪエリア４０８内のＡｓｓｅｍｂｌｙ、ＤＥＴエリア４０４内のＡｓｓｅｍｂｌｙとＯＢＪエリア４０８内のＡｓｓｅｍｂｌｙ、ＯＢＪエリア４０８内のＡｓｓｅｍｂｌｙとＶＥＲＢエリア４１０内のＡｓｓｅｍｂｌｙとが接続される。ポストコマンドによって、ＤＥＴエリア４０４と、ＬＥＸエリア４０２とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＤＥＴエリア４０４とＳＵＢＪエリア４０６とのＦｉｂｅｒ、ＬＥＸエリア４０２とＯＢＪエリア４０８とのＦｉｂｅｒ、ＯＢＪエリア４０８とＶＥＲＢエリア４１０とのＦｉｂｅｒがオフにされる。

【0029】

以上の流れによって、「Ｔｈｅｍａｎｓａｗａｗｏｍａｎ」の係り受けが解析される。英語では、文の要素の依存関係のルールが明確に決まっているため、Ｆｉｂｅｒルール４２０を手動で生成することが可能だが、日本語では、主語、目的語の出現順序が決まっていない等の理由によって、文の要素の依存関係のルールが不明確であり、Ｆｉｂｅｒルール４２０を手動で生成することは困難である。本実施形態に係るシステム１０においては、学習装置２００が、学習によってルールを生成する。

【0030】

図８は、学習装置２００による学習について説明するための説明図である。学習装置２００は、強化学習によって、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおけるＦｉｂｅｒルールを学習してよい。ここでは、プレコマンドを用い、ポストコマンドを用いない場合について説明する。

【0031】

本例において、学習装置２００は、学習アルゴリズムとして、Ｑラーニングを用いる。なお、学習装置２００は、学習アルゴリズムとして、ＤＱＮ（ＤｅｅｐＱ－Ｎｅｔｗｏｒｋ）を用いてもよく、他の学習アルゴリズムを用いてもよい。

【0032】

学習装置２００は、複数の品詞エージェントを含むマルチエージェント５００に対して、それぞれが文の要素を表す複数の要素エリアによって表される文の係り受けの遷移を環境５１０とし、環境５１０における品詞エージェントの位置と、環境５１０におけるＡｓｓｅｍｂｌｙが存在する要素エリアとを状態５２０とし、品詞エージェントによる複数の要素エリアの遷移を行動５３０とした強化学習を実行することによって、Ｆｉｂｅｒルールを学習してよい。

【0033】

学習装置２００は、日本語の学習用文章と、学習用文章における形態素同士の係り受けとを含む学習用文章データを複数用いて、学習を実行する。ここでは、「コーヒーが飲みたい」という学習用文章と、「飲み」「コーヒー」が目的語の関係であり、「飲み」「たい」が助動詞の関係であり、「コーヒー」「が」が格助詞の関係であることを含む学習用文章データと、「私が飲みたい」という学習用文章と、「飲み」「私」が主語の関係であり、「飲み」「たい」が助動詞の関係であり、「私」「が」が格助詞の関係であることを含む学習用文章データとを用いる場合を例として説明する。

【0034】

マルチエージェント５００は、複数の品詞エージェントを含む。図８では、名詞のエージェントであるｎｏｕｎエージェント５０１、動詞のエージェントであるｖｅｒｂエージェント５０２、格助詞のエージェントであるａｄｐエージェント５０３、及び助動詞のエージェントであるａｕｘエージェント５０４を例示している。マルチエージェント５００は、他の品詞のエージェントを含んでもよい。また、マルチエージェント５００は、品詞を各種観点で分類した、より細かいエージェントを含んでもよい。例えば、マルチエージェント５００は、名詞について、人、物、及び場所等で分類した、名詞（人）エージェント、名詞（物）エージェント、名詞（場所）エージェントを含む。例えば、マルチエージェント５００は、動詞について、自動詞エージェント及び他動詞エージェントを含んでよく、さらに、可能動詞エージェント及び補助動詞エージェント等を含んでもよい。

【0035】

図８に示す例において、環境５１０は、ＬＥＸエリア５１１と、「コーヒーが飲みたい」及び「私が飲みたい」の解析に関係するＯＢＪエリア５１２、ＶＥＲＢエリア５１３、ＡＵＸエリア５１４、及びＣＡＳＥエリア５１５を含む。このように、学習装置２００は、複数の文の要素のうち、学習に用いる学習用文章の解析に関係する要素のエリアのみを環境５１０に含めて学習を行ってよい。そして、異なる学習用文章のそれぞれについて、学習を実行して、結果をマージすることによって、最終的なルールを生成してよい。これにより、学習時の計算負荷を適切に低減することができる。なお、学習装置２００は、すべての文の要素のエリアを環境５１０に含めて学習を行ってもよい。なお、学習用文章の解析に関係する要素のエリアは、学習用文章に含まれる係り受けに対応する要素のエリアであってよい。また、学習用文章の解析に関係する要素のエリアは、学習用文章に含まれる係り受けに対応する要素のエリアに加えて、関係しそうな係り受けに対応する要素のエリアを含んでもよい。関係しそうな係り受けは、例えば、学習装置２００のユーザ等によって設定されてよい。なお、学習装置２００は、全ての文の要素のエリアを環境５１０に含めて学習を行ってもよい。

【0036】

学習装置２００は、学習用文章について、マルチエージェント５００の行動５３０が完了する毎に、マルチエージェント５００に報酬５４０を与える。学習装置２００は、マルチエージェント５００の行動５３０が終わった後に、どの文の要素のエリアを遷移してきたかを確認するＲｅａｄｏｕｔの出力と、学習用文章データに含まれる係り受け、すなわち、係り受けの正解とを用いて、マルチエージェント５００のそれぞれに対して報酬５４０を与える。

【0037】

学習装置２００は、下記数式１を用いて、それぞれの品詞エージェントに与える報酬Ｒ_{ＰＯＳ（ＰａｒｔＯｆＳｐｅｅｃｈ）}を計算してよい。

【0038】

【数1】

【0039】

Ｎは、期待されるラベル数（学習用文章データに含まれる正解の係り受けのラベルの数）であり、Ｃは、Ｒａｅｄｏｕｔの出力のうちの、各形態素を含む正解ラベルの数であり、Ｅは、Ｒｅａｄｏｕｔの出力のラベル数のうち、期待されるラベル数を超えたラベル数である。ＣからＥを減算するように構成することによって、誤った係り受けを出力した場合に報酬を小さくすることができ、より適切な学習を実現することができる。

【0040】

図９は、Ｒｅａｄｏｕｔｏｕｔｐｕｔ６１０とその報酬の一例を概略的に示す。ここでは、学習用文章データに含まれる正解の係り受けのラベルが、「飲み」「コーヒー」が目的語の関係であることを示す「"飲み"、"コーヒー"、ＯＢＪ」、「飲み」「たい」が助動詞の関係であることを示す「"飲み"、"たい"、ＡＵＸ」、及び「コーヒー」「が」が格助詞の関係であることを示す「"コーヒー"、"が"、ＣＡＳＥ」の３つであり、Ｒｅａｄｏｕｔｏｕｔｐｕｔ６１０が、「"飲み"、"コーヒー"、ＯＢＪ」及び「"飲み"、"たい"、ＡＵＸ」の２つである場合を例示している。

【0041】

学習用文章データに含まれる正解の係り受けのラベルの数が３つであることから、Ｎ＝３となる。Ｒｅａｄｏｕｔｏｕｔｐｕｔ６１０のラベルの数が２つであって、３つ以下であることから、Ｅ＝０となる。そして、Ｒｅａｄｏｕｔｏｕｔｐｕｔ６１０の２つのラベルが、両方とも学習用文章データに含まれる正解の係り受けのラベルと一致しているので、両方とも正解である。

【0042】

ｎｏｕｎエージェント５０１について、名詞「コーヒー」を含む正解ラベルの数が１つであることから、報酬が１／３となっている。ｖｅｒｂエージェント５０２について、動詞「飲み」を含む正解ラベルの数が２つであることから、報酬が２／３となっている。ａｄｐエージェント５０３について、格助詞「が」を含む正解ラベルがないことから、報酬が０となっている。ａｕｘエージェント５０４について、助動詞「たい」を含む正解ラベルの数が１つであることから、報酬が１／３となっている。

【0043】

図１０は、Ｒｅａｄｏｕｔｏｕｔｐｕｔ６２０とその報酬の一例を概略的に示す。ここでは、学習用文章データに含まれる正解の係り受けのラベルが、「"飲み"、"コーヒー"、ＯＢＪ」、「"飲み"、"たい"、ＡＵＸ」、及び「"コーヒー"、"が"、ＣＡＳＥ」の３つであり、Ｒｅａｄｏｕｔｏｕｔｐｕｔ６２０が、「たい」「コーヒー」が目的語の関係であることを示す「"たい"、"コーヒー"、ＯＢＪ」と、「飲み」「コーヒー」が助動詞の関係であることを示す「"飲み"、"コーヒー"、ＡＵＸ」と、「"コーヒー"、"が"、ＣＡＳＥ」の３つである場合を例示している。

【0044】

学習用文章データに含まれる正解の係り受けのラベルの数が３つであることから、Ｎ＝３となる。Ｒｅａｄｏｕｔｏｕｔｐｕｔ６２０のラベルの数が３つであって、３つ以下であることから、Ｅ＝０となる。そして、Ｒｅａｄｏｕｔｏｕｔｐｕｔ６１０の３つのラベルのうち、「"たい"、"コーヒー"、ＯＢＪ」及び「"飲み"、"コーヒー"、ＡＵＸ」が不正解であり、「"コーヒー"、"が"、ＣＡＳＥ」が正解である。

【0045】

ｎｏｕｎエージェント５０１について、名詞「コーヒー」を含む正解ラベルの数が１つであることから、報酬が１／３となっている。ｖｅｒｂエージェント５０２について、動詞「飲み」を含む正解ラベルがないことから、報酬が０となっている。ａｄｐエージェント５０３について、格助詞「が」を含む正解ラベルの数が１つであることから、報酬が１／３となっている。ａｕｘエージェント５０４について、助動詞「たい」を含む正解ラベルがないことから、報酬が０となっている。

【0046】

図１１は、各形態素（品詞）毎の各行動毎のＱテーブル７００の一例を概略的に示す。ここでは、名詞「コーヒー」のＡＣＴＩＯＮ：ＯＢＪに対応するＱテーブル７００を例示している。横軸は、Ａｓｓｅｍｂｌｙが発火しているエリア、縦軸はエージェントの現在エリアを示す。

【0047】

学習装置２００は、Ｑラーニングを進めることによって、Ｑテーブル７００のＱ値を更新していく。「コーヒーが飲みたい」の学習用文章データで学習を進めていくと、例えば、ＰｒｅｓｅｎｔＡｒｅａ「ＯＢＪ」とＡｓｓｅｍｂｌｙＡｒｅａ「ＯＢＪ、ＣＡＳＥ」とに対応するＱ値、ＰｒｅｓｅｎｔＡｒｅａ「ＯＢＪ」とＡｓｓｅｍｂｌｙＡｒｅａ「ＯＢＪ、ＣＡＳＥ、ＶＥＲＢ、ＡＵＸ」とに対応するＱ値、及び、ＰｒｅｓｅｎｔＡｒｅａ「ＶＥＲＢ」とＡｓｓｅｍｂｌｙＡｒｅａ「ＯＢＪ、ＣＡＳＥ、ＶＥＲＢ」とに対応するＱ値が高まっていく。

【0048】

学習装置２００が、各形態素（品詞）毎の各行動毎のＱテーブルを更新していくことによって、日本語用のＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓのルールを更新していくことができる。

【0049】

図１２は、学習装置２００の機能構成の一例を概略的に示す。学習装置２００は、記憶部２０２、入力受付部２０４、学習実行部２０６、及び結果提供部２０８を備える。

【0050】

記憶部２０２は、各種情報を記憶する。記憶部２０２は、学習用文章と、当該学習用文章における形態素同士の係り受けとを含む学習用文章データを記憶する。学習用文章データに含まれる係り受けは、当該学習用文章の係り受けとして正しいことが確認されているものである。記憶部２０２は、複数の学習用文章データを記憶する。

【0051】

入力受付部２０４は、各種入力を受け付ける。入力受付部２０４は、例えば、学習用文章データに入力を受け付ける。入力受付部２０４は、例えば、学習装置２００のユーザによって学習装置２００に対して入力された学習用文章データを受け付ける。入力受付部２０４は、例えば、学習装置２００の外部の装置から送信された学習用文章データを受け付ける。入力受付部２０４は、受け付けた学習用文章データを記憶部２０２に記憶させる。

【0052】

入力受付部２０４が受け付ける学習用文章データには、学習用文章及び係り受けに加えて、学習用文章を形態素解析することによって得られる、学習用文章に含まれる複数の形態素と、複数の形態素のそれぞれの品詞が含まれてもよい。

【0053】

学習実行部２０６は、記憶部２０２に記憶されている複数の学習用文章データを用いて、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおけるルールを学習する。学習実行部２０６は、学習用文章データに、学習用文章に含まれる複数の形態素のそれぞれの品詞が含まれていない場合、形態素解析を実行して、複数の形態素の品詞を特定してよい。

【0054】

学習実行部２０６は、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおけるＦｉｂｅｒルールを学習してよい。

【0055】

学習実行部２０６は、強化学習によってＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおけるルールを学習してよい。学習実行部２０６は、学習アルゴリズムとして、Ｑラーニングを用いてよい。学習実行部２０６は、学習アルゴリズムとして、ＤＱＮを用いてもよく、他の学習アルゴリズムを用いてもよい。

【0056】

学習実行部２０６は、複数の品詞エージェントに対して、それぞれが文の要素を表す複数の要素エリアによって表される文の係り受けの遷移を環境とし、当該環境における品詞エージェントの位置と当該環境におけるＡｓｓｅｍｂｌｙが存在する要素エリアとを状態とし、品詞エージェントによる複数の要素エリアの遷移を行動とした強化学習を実行することによって、ルールを学習してよい。学習実行部２０６は、品詞エージェントによる行動に対して、学習用文章データに含まれる係り受けに基づいて決定した報酬を与えることによって、強化学習を実行してよい。

【0057】

品詞エージェントの例として、名詞エージェント、動詞エージェント、形容詞エージェント、形容動詞エージェント、助詞エージェント、助動詞エージェント、副詞エージェント、連体詞エージェント、接続詞エージェント、及び感動詞エージェント等が挙げられる。

【0058】

名詞エージェントは、普通名詞エージェント、固有名詞エージェント、数詞エージェント、形式名詞エージェント、及び代名詞エージェント等に分類されてもよい。また、名詞エージェントは、名詞（人）エージェント、名詞（物）エージェント、及び名詞（場所）エージェント等に分類されてもよい。

【0059】

動詞エージェントは、自動詞エージェント、他動詞エージェント、可能動詞エージェント、及び補助動詞エージェント等に分類されてもよい。助詞エージェントは、格助詞エージェント、接続助詞エージェント、副助詞エージェント、及び終助詞エージェント等に分類されてもよい。副詞エージェントは、状態の副詞エージェント、程度の副詞エージェント、及び呼応の副詞エージェント等に分類されてもよい。

【0060】

学習実行部２０６は、例えば、複数の品詞エージェントに対して、複数の要素エリアによって表される文の係り受けの遷移を環境とし、当該環境における品詞エージェントの位置と当該環境におけるＡｓｓｅｍｂｌｙが存在する要素エリアとを状態とし、品詞エージェントによる複数の要素エリアの遷移を行動とし、品詞エージェントによる行動に対して、学習用文章データに含まれる係り受けに基づいて決定した報酬を与えるＱラーニングを実行することによって、各形態素（品詞）毎の各行動毎のＱテーブルを更新する。学習実行部２０６は、更新した複数のＱテーブルから、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおけるＦｉｂｅｒルールを生成してよい。学習実行部２０６は、更新した複数のＱテーブルを、ＡｓｓｅｍｂｌｙＣａｌｃｕｌｕｓにおけるルールとしてもよい。

【0061】

学習実行部２０６が、例えば、「コーヒーが飲みたい」という学習用文章を含む学習用文章データと、「私が飲みたい」という学習用文章を含む学習用文章データを含む学習用文章データとを用いた学習を実行することによって、文章構造は同じであるものの「コーヒー」が目的語となる前者と、「私」が主語となる後者とを区別した係り受けの解析を実現できるようになる。

【0062】

学習実行部２０６が、多数の学習用文章データを用いた学習を実行することによって、係り受けの構造が複雑な日本語であっても、係り受けを適切に解析可能なルールを生成することができる。

【0063】

なお、学習実行部２０６は、学習用文章データの数が多い場合や、考慮する品詞の種類が多い場合等には、ＤＱＮを用いるようにしてよい。これにより、状態行動空間が爆発せずに、学習が収束することができるようになる。

【0064】

また、学習実行部２０６は、複数の文の要素のすべてについて学習するのではなく、文の要素のサブセット毎に学習を実行して、結果をマージするようにしてもよい。例えば、学習実行部２０６は、分類された学習用文章データを用いて、文の要素のサブセット毎にＱラーニングを行うことで、Ｑテーブルを部分的に更新していくことによって、最終的にＱテーブルの全体が更新されるように学習を進めてもよい。これにより、頻度の高い文章を効果的に学習することができ、実用的な係り受けの学習をすることができる。

【0065】

また、学習実行部２０６は、人の会話の文章や、物語の文章等、前後の文章に関係がある文章を用いて学習する場合には、ある文章を学習する場合に、その前の文章も入力して学習するようにしてもよい。これにより、文章の前後間の関係を学習結果に反映することができ、かつ、暗黙の主語を推定することができ、係り受けの解析精度を向上することができる。

【0066】

図１３は、学習実行部２０６によるＰｒｏｊｅｃｔｉｏｎのアルゴリズムの一例を示す。学習実行部２０６は、図１３に例示するアルゴリズムに従って、ある要素エリアから他の要素エリアに対する新たなＡｓｓｅｍｂｌｙを生成してよい。

【0067】

図１４は、学習実行部２０６によるＲｅａｄｏｕｔのアルゴリズムの一例を示す。学習実行部２０６は、図１４に例示するアルゴリズムに従って、上述したＲｅａｄｏｕｔを実現してよい。

【0068】

図１５は、学習実行部２０６によるマルチエージェント強化学習のアルゴリズムの一例を示す。図１５に示す「ｐｒｏｊｅｃｔ」及び「ｒｅａｄｏｕｔ」は、図１３及び図１４で示したアルゴリズムに従って処理であってよい。学習実行部２０６は、図１５に例示するアルゴリズムに従って、学習を実行してよい。

【0069】

図１６は、学習装置２００として機能するコンピュータ１２００のハードウェア構成の一例を概略的に示す。コンピュータ１２００にインストールされたプログラムは、コンピュータ１２００を、本実施形態に係る装置の１又は複数の「部」として機能させ、又はコンピュータ１２００に、本実施形態に係る装置に関連付けられるオペレーション又は当該１又は複数の「部」を実行させることができ、及び／又はコンピュータ１２００に、本実施形態に係るプロセス又は当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ１２００に、本明細書に記載のフローチャート及びブロック図のブロックのうちのいくつか又はすべてに関連付けられた特定のオペレーションを実行させるべく、ＣＰＵ１２１２によって実行されてよい。

【0070】

本実施形態によるコンピュータ１２００は、ＣＰＵ１２１２、ＲＡＭ１２１４、及びグラフィックコントローラ１２１６を含み、それらはホストコントローラ１２１０によって相互に接続されている。コンピュータ１２００はまた、通信インタフェース１２２２、記憶装置１２２４、ＤＶＤドライブ、及びＩＣカードドライブのような入出力ユニットを含み、それらは入出力コントローラ１２２０を介してホストコントローラ１２１０に接続されている。ＤＶＤドライブは、ＤＶＤ－ＲＯＭドライブ及びＤＶＤ－ＲＡＭドライブ等であってよい。記憶装置１２２４は、ハードディスクドライブ及びソリッドステートドライブ等であってよい。コンピュータ１２００はまた、ＲＯＭ１２３０及びキーボードのようなレガシの入出力ユニットを含み、それらは入出力チップ１２４０を介して入出力コントローラ１２２０に接続されている。

【0071】

ＣＰＵ１２１２は、ＲＯＭ１２３０及びＲＡＭ１２１４内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ１２１６は、ＲＡＭ１２１４内に提供されるフレームバッファ等又はそれ自体の中に、ＣＰＵ１２１２によって生成されるイメージデータを取得し、イメージデータがディスプレイデバイス１２１８上に表示されるようにする。

【0072】

通信インタフェース１２２２は、ネットワークを介して他の電子デバイスと通信する。記憶装置１２２４は、コンピュータ１２００内のＣＰＵ１２１２によって使用されるプログラム及びデータを格納する。ＤＶＤドライブは、プログラム又はデータをＤＶＤ－ＲＯＭ等から読み取り、記憶装置１２２４に提供する。ＩＣカードドライブは、プログラム及びデータをＩＣカードから読み取り、及び／又はプログラム及びデータをＩＣカードに書き込む。

【0073】

ＲＯＭ１２３０はその中に、アクティブ化時にコンピュータ１２００によって実行されるブートプログラム等、及び／又はコンピュータ１２００のハードウェアに依存するプログラムを格納する。入出力チップ１２４０はまた、様々な入出力ユニットをＵＳＢポート、パラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ１２２０に接続してよい。

【0074】

プログラムは、ＤＶＤ－ＲＯＭ又はＩＣカードのようなコンピュータ可読記憶媒体によって提供される。プログラムは、コンピュータ可読記憶媒体から読み取られ、コンピュータ可読記憶媒体の例でもある記憶装置１２２４、ＲＡＭ１２１４、又はＲＯＭ１２３０にインストールされ、ＣＰＵ１２１２によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ１２００に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置又は方法が、コンピュータ１２００の使用に従い情報のオペレーション又は処理を実現することによって構成されてよい。

【0075】

例えば、通信がコンピュータ１２００及び外部デバイス間で実行される場合、ＣＰＵ１２１２は、ＲＡＭ１２１４にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース１２２２に対し、通信処理を命令してよい。通信インタフェース１２２２は、ＣＰＵ１２１２の制御の下、ＲＡＭ１２１４、記憶装置１２２４、ＤＶＤ－ＲＯＭ、又はＩＣカードのような記録媒体内に提供される送信バッファ領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、又はネットワークから受信した受信データを記録媒体上に提供される受信バッファ領域等に書き込む。

【0076】

また、ＣＰＵ１２１２は、記憶装置１２２４、ＤＶＤドライブ（ＤＶＤ－ＲＯＭ）、ＩＣカード等のような外部記録媒体に格納されたファイル又はデータベースの全部又は必要な部分がＲＡＭ１２１４に読み取られるようにし、ＲＡＭ１２１４上のデータに対し様々なタイプの処理を実行してよい。ＣＰＵ１２１２は次に、処理されたデータを外部記録媒体にライトバックしてよい。

【0077】

様々なタイプのプログラム、データ、テーブル、及びデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。ＣＰＵ１２１２は、ＲＡＭ１２１４から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプのオペレーション、情報処理、条件判断、条件分岐、無条件分岐、情報の検索／置換等を含む、様々なタイプの処理を実行してよく、結果をＲＡＭ１２１４に対しライトバックする。また、ＣＰＵ１２１２は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第２の属性の属性値に関連付けられた第１の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、ＣＰＵ１２１２は、当該複数のエントリの中から、第１の属性の属性値が指定されている条件に一致するエントリを検索し、当該エントリ内に格納された第２の属性の属性値を読み取り、それにより予め定められた条件を満たす第１の属性に関連付けられた第２の属性の属性値を取得してよい。

【0078】

上で説明したプログラム又はソフトウエアモジュールは、コンピュータ１２００上又はコンピュータ１２００近傍のコンピュータ可読記憶媒体に格納されてよい。また、専用通信ネットワーク又はインターネットに接続されたサーバシステム内に提供されるハードディスク又はＲＡＭのような記録媒体が、コンピュータ可読記憶媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ１２００に提供する。

【0079】

本実施形態におけるフローチャート及びブロック図におけるブロックは、オペレーションが実行されるプロセスの段階又はオペレーションを実行する役割を持つ装置の「部」を表わしてよい。特定の段階及び「部」が、専用回路、コンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、及び／又はコンピュータ可読記憶媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタル及び／又はアナログハードウェア回路を含んでよく、集積回路（ＩＣ）及び／又はディスクリート回路を含んでよい。プログラマブル回路は、例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、及びプログラマブルロジックアレイ（ＰＬＡ）等のような、論理積、論理和、排他的論理和、否定論理積、否定論理和、及び他の論理演算、フリップフロップ、レジスタ、並びにメモリエレメントを含む、再構成可能なハードウェア回路を含んでよい。

【0080】

コンピュータ可読記憶媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読記憶媒体は、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読記憶媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読記憶媒体のより具体的な例としては、フロッピー（登録商標）ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、リードオンリメモリ（ＲＯＭ）、消去可能プログラマブルリードオンリメモリ（ＥＰＲＯＭ又はフラッシュメモリ）、電気的消去可能プログラマブルリードオンリメモリ（ＥＥＰＲＯＭ）、静的ランダムアクセスメモリ（ＳＲＡＭ）、コンパクトディスクリードオンリメモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、ブルーレイ（登録商標）ディスク、メモリスティック、集積回路カード等が含まれてよい。

【0081】

コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、又はＳｍａｌｌｔａｌｋ（登録商標）、ＪＡＶＡ（登録商標）、Ｃ＋＋等のようなオブジェクト指向プログラミング言語、及び「Ｃ」プログラミング言語又は同様のプログラミング言語のような従来の手続型プログラミング言語を含む、１又は複数のプログラミング言語の任意の組み合わせで記述されたソースコード又はオブジェクトコードのいずれかを含んでよい。

【0082】

コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路が、フローチャート又はブロック図で指定されたオペレーションを実行するための手段を生成するために当該コンピュータ可読命令を実行すべく、ローカルに又はローカルエリアネットワーク（ＬＡＮ）、インターネット等のようなワイドエリアネットワーク（ＷＡＮ）を介して、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサ、又はプログラマブル回路に提供されてよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。

【0083】

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更又は改良を加えることが可能であることが当業者に明らかである。その様な変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。

【0084】

特許請求の範囲、明細書、及び図面中において示した装置、システム、プログラム、及び方法における動作、手順、ステップ、及び段階などの各処理の実行順序は、特段「より前に」、「先立って」などと明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、及び図面中の動作フローに関して、便宜上「まず、」、「次に、」などを用いて説明したとしても、この順で実施することが必須であることを意味するものではない。

【符号の説明】

【0085】

１０システム、２０ネットワーク、３０通信端末、１００解析装置、２００学習装置、２０２記憶部、２０４入力受付部、２０６学習実行部、２０８結果提供部、４０２ＬＥＸエリア、４０４ＤＥＴエリア、４０６ＳＵＢＪエリア、４０８ＯＢＪエリア、４１０ＶＥＲＢエリア、４２０Ｆｉｂｅｒルール、５００マルチエージェント、５０１ｎｏｕｎエージェント、５０２ｖｅｒｂエージェント、５０３ａｄｐエージェント、５０４ａｕｘエージェント、５１０環境、５１１ＬＥＸエリア、５１２ＯＢＪエリア、５１３ＶＥＲＢエリア、５１４ＡＵＸエリア、５１５ＣＡＳＥエリア、５２０状態、５３０行動、５４０報酬、６１０Ｒｅａｄｏｕｔｏｕｔｐｕｔ、６２０Ｒｅａｄｏｕｔｏｕｔｐｕｔ、７００Ｑテーブル、１２００コンピュータ、１２１０ホストコントローラ、１２１２ＣＰＵ、１２１４ＲＡＭ、１２１６グラフィックコントローラ、１２１８ディスプレイデバイス、１２２０入出力コントローラ、１２２２通信インタフェース、１２２４記憶装置、１２３０ＲＯＭ、１２４０入出力チップ

【図1】