特開2022-175531 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人　関西大学の特許一覧

特開2022-175531演算装置、演算方法、及び、コンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022175531

(43)【公開日】2022-11-25

(54)【発明の名称】演算装置、演算方法、及び、コンピュータプログラム

(51)【国際特許分類】

G06F 16/28 20190101AFI20221117BHJP

G06Q 50/20 20120101ALI20221117BHJP

G06F 40/216 20200101ALI20221117BHJP

【ＦＩ】

G06F16/28

G06Q50/20 300

G06F40/216

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2021082003

(22)【出願日】2021-05-13

【新規性喪失の例外の表示】特許法第３０条第２項適用申請有り公開の事実１：令和３（２０２１）年２月２１日の関西大学総合情報学部２０２０年度松下研究室卒論発表会（Ｚｏｏｍによるオンライン開催）にて発表公開の事実２：令和３（２０２１）年３月１９日に関西大学総合情報学部２０２０年度松下研究室卒論発表会概要集に掲載公開の事実３：令和３（２０２１）年４月１３日に人工知能学会全国大会（第３５回）アブストラクト（ｈｔｔｐｓ：／／ｃｏｎｆｉｔ．ａｔｌａｓ．ｊｐ／ｇｕｉｄｅ／ｅｖｅｎｔ／ｊｓａｉ２０２１／ｓｕｂｊｅｃｔ／１Ｉ２－ＧＳ－４ａ－０１／ｔａｂｌｅｓ？ｃｒｙｐｔｏＩｄ＝）に掲載

(71)【出願人】

【識別番号】399030060

【氏名又は名称】学校法人関西大学

(74)【代理人】

【識別番号】100111567

【弁理士】

【氏名又は名称】坂本寛

(72)【発明者】

【氏名】山西良典

(72)【発明者】

【氏名】松下光範

(72)【発明者】

【氏名】山本京佳

【テーマコード（参考）】

5B091

5B175

5L049

【Ｆターム（参考）】

5B091AA15

5B091CA01

5B091EA01

5B175FB04

5B175HB03

5L049CC34

(57)【要約】

【課題】異なる２つのカテゴリの間の関連性を指標値という客観的な値で示す演算装置を提供する。
【解決手段】演算装置１０は、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算装置であって、複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ように構成されている。
【選択図】図３

【特許請求の範囲】

【請求項1】

第１のカテゴリに含まれる複数の第１の要素と、前記第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算装置であって、
前記複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、前記複数の第１の要素それぞれについて特定次元で表される第１の特徴量を生成し、
前記複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、前記複数の第２の要素それぞれについて前記特定次元で表される第２の特徴量を生成し、
前記第１の特徴量及び前記第２の特徴量を用いて前記指標値を生成する、ように構成された演算部を備える
演算装置。

【請求項2】

前記指標値を生成することは、行列からなる前記第１の特徴量及び前記第２の特徴量のいずれか一方の特徴量を行列因子分解のためのテンプレートとし、前記テンプレートではない他方の特徴量を前記一方の特徴量で分解することを含む
請求項１に記載の演算装置。

【請求項3】

前記分解することは、前記一方の特徴量を教師データとして前記他方の特徴量に対して半教師ありＮＭＦ（Non-negative Matrix Factorization：非負値行列因子分解）を適用することを含む
請求項２に記載の演算装置。

【請求項4】

前記第１のカテゴリ及び前記第２のカテゴリの少なくとも一方は、人を構成要素として含む組織である
請求項１～３のいずれか一項に記載の演算装置。

【請求項5】

前記第１のカテゴリ及び前記第２のカテゴリの少なくとも一方は、前記人に提供され得るサービスである
請求項４に記載の演算装置。

【請求項6】

前記指標値と、前記第１のカテゴリ及び前記第２のカテゴリのうちの一方のカテゴリに含まれる複数の要素と第３の要素との関連性を示す他の指標値とを対比することによって、前記第１のカテゴリ及び前記第２のカテゴリのうちの他方のカテゴリに含まれる複数の要素と前記第３の要素との適合性を判定する、ように構成されている
請求項１～５のいずれか一項に記載の演算装置。

【請求項7】

前記演算部は、前記指標値を前記他の指標値と対比することによって、前記他方のカテゴリの複数の要素の中から前記第３の要素に適合した要素を判定する、ように構成されている
請求項６に記載の演算装置。

【請求項8】

演算装置で実行される、第１のカテゴリに含まれる複数の第１の要素と、前記第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値の演算方法であって、
前記複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、前記第１の要素について特定次元で表される第１の特徴量を生成し、
前記複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、前記第２の要素について前記特定次元で表される第２の特徴量を生成し、
前記第１の特徴量及び前記第２の特徴量を用いて前記指標値を生成する、ことを含む
演算方法。

【請求項9】

第１のカテゴリに含まれる複数の第１の要素と、前記第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算をコンピュータに実行させるプログラムであって、
前記プログラムは、前記コンピュータに、
前記複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、前記第１の要素について特定次元で表される第１の特徴量を生成し、
前記複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、前記第２の要素について前記特定次元で表される第２の特徴量を生成し、
前記第１の特徴量及び前記第２の特徴量を用いて前記指標値を生成する、ことを実行させる
コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、演算装置、演算方法、及び、コンピュータプログラムに関する。

【背景技術】

【0002】

大学における講義及び研究室など、異なるカテゴリ間の関連性を知りたいという要望がある。例えば、特開２００５－３３２０３７号公報（以下、特許文献１）は、職業職種情報と履修科目ごとの講義内容を示すシラバス情報とを、予め関連付けて記憶しているサーバを用いることによって、職業職種に対する学生の適性を配慮して履修科目の選定を行う履修科目選択支援システムを開示している。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００５－３３２０３７号公報

【発明の概要】

【0004】

しかしながら、特許文献１に開示されたシステムでは、職業職種情報とシラバス情報との関連付けは担当教員が行っており、客観的な関連性ではないおそれがある。そのため、客観的な関連性を知りたいという要望が満たされない場合がある。そこで、本開示は、異なる２つのカテゴリの間の関連性を指標値という客観的な値で示す演算装置、演算方法、及び、コンピュータプログラムを提供することを目的の１つとする。

【0005】

ここで、演算装置は、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算装置であって、複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ように構成された演算部を備える。

【0006】

また、演算方法は、演算装置で実行される、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値の演算方法であって、複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ことを含む。

【0007】

また、コンピュータプログラムは、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算をコンピュータに実行させるプログラムであって、プログラムは、コンピュータに、複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ことを実行させる。

【0008】

更なる詳細は、後述の実施形態として説明される。

【図面の簡単な説明】

【0009】

【図1】図１は、実施の形態に係る演算装置での、指標値の算出について概念的に示した図である。

【図2】図２は、実施の形態に係る演算方法の具体例を表したフローチャートである。

【図3】図３は、演算装置の構成概略図である。

【図4】図４は、言語情報を有するデータから特徴量を生成する処理の一例を説明するための図である。

【図5】図５は、言語情報を有するデータから特徴量を生成する処理の一例を説明するための図である。

【図6】図６は、特徴量から指標値を生成する処理の一例を説明するための図である。

【図7】図７は、指標値のグラフ化の一例を示した図である。

【図8】図８は、指標値のグラフ化の一例を示した図である。

【図9】図９は、講義ごとの興味の度合の入力を受け付ける画面例を表した図である。

【図10】図１０は、適合性の判定の具体例を説明するための図である。

【図11】図１１は、演算装置での分類処理の流れの一例を表したフローチャートである。

【発明を実施するための形態】

【0010】

＜１．演算装置、演算方法、及び、コンピュータプログラムの概要＞

【0011】

（１）ある実施の形態に従う演算装置は、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算装置であって、複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ように構成された演算部を備える。

【0012】

第１のカテゴリ及び第２のカテゴリは、それぞれ、複数の第１の要素及び第２の要素を有する。言語情報を有するデータは、言語化されたデータ、つまり、言語表現されたデータを指す。言語化されたデータは、例えば、言語化可能な情報を含むデータが言語化されることによって得ることもできる。言語化可能な情報を含むデータは、一例として、テキストデータ、音声データ、文字画像を含む画像データ、それらの組み合わせ、などである。

【0013】

第１のカテゴリがＮ個の第１の要素を有し、第２のカテゴリがＰ個の第２の要素を有し、特定次元をＸ次元とすると、第１の特徴量及び第２の特徴量は、それぞれ、一例としてＸ×Ｎの行列、Ｘ×Ｐの行列であってよい。この場合、指標値は、一例として、Ｐ×Ｎの行列であってよい。なお、Ｎは、１以上の整数であり、好ましくは、２以上の整数である。Ｐは、１以上の整数であり、好ましくは２以上の整数である。

【0014】

指標値が生成されることによって、第１のカテゴリに含まれる複数の第１の要素と第２のカテゴリに含まれる複数の第２の要素との間の関連性を指標値という客観的な値で示すことができる。そのため、これら２つのカテゴリそれぞれの要素の間の客観的な関連性を知りたいという要望に応じることができる。

【0015】

（２）好ましくは、指標値を生成することは、行列からなる第１の特徴量及び第２の特徴量のいずれか一方の特徴量を行列因子分解のためのテンプレートとし、テンプレートではない他方の特徴量を一方の特徴量で分解することを含む。これにより、第１の特徴量及び第２の特徴量を用いて、第１のカテゴリと第２のカテゴリとの関連性を示す指標値が得られる。

【0016】

（３）好ましくは、分解することは、一方の特徴量を教師データとして他方の特徴量に対して半教師ありＮＭＦ（Non-negative Matrix Factorization：非負値行列因子分解）を適用することを含む。半教師ありＮＭＦを適用することにより、指標値が容易に生成される。

【0017】

分解することは、半教師ありＮＭＦを適用することの他、教師ありＮＭＦを適用することを含んでもよいし、教師あり独立成分分析を行うことを含んでもよいし、半教師あり独立成分分析を行うことを含んでもよい。これら方法でも、指標値が容易に生成される。

【0018】

（４）好ましくは、第１のカテゴリ及び第２のカテゴリの少なくとも一方は、人を構成要素として含む組織である。人を構成要素として含む組織は、例えば、企業、プロジェクトチーム、大学、学部、学科、研究室、などである。これにより、このような組織と、他のカテゴリとの関連性を示す客観的な指標値を生成することができる。

【0019】

（５）好ましくは、第１のカテゴリ及び第２のカテゴリの少なくとも一方は、人に提供され得るサービスである。サービスは、例えば、製品などの有形の商品、講義（授業）やコンテンツの再生などの無形のサービス、知的財産などの権利、を含む。これにより、人を構成要素として含む組織と、人に提供され得るサービスとの関連性を示す客観的な指標値を生成することができる。

【0020】

（６）好ましくは、指標値と、第１のカテゴリ及び第２のカテゴリのうちの一方のカテゴリに含まれる複数の要素と第３の要素との関連性を示す他の指標値とを対比することによって、第１のカテゴリ及び第２のカテゴリのうちの他方のカテゴリに含まれる複数の要素と第３の要素との適合性を判定する、ように構成されている。

【0021】

指標値の対比は、一例として、一方のカテゴリと他方のカテゴリとの各要素についての指標値の分布（第１の分布）と、一方のカテゴリと第３の要素についての指標値の分布（第２の分布）と、の対比が挙げられる。この場合、適合性の判定は、一例として、第１の分布と第２の分布との類似性を利用することが挙げられる。類似性の算出には、一例として、第１の分布及び第２の分布それぞれを形成する２つのベクトルの、コサイン類似度やユークリッド距離を用いることが挙げられる。この場合、適合性の判定は、例えば、得られた類似性が閾値以上である場合に適合性あり、閾値未満の場合に適合性なし、と判定することが挙げられる。これにより、他方のカテゴリに含まれる複数の要素と第３要素との適合性を客観的に示すことができる。

【0022】

（７）好ましくは、演算部は、指標値を他の指標値と対比することによって、他方のカテゴリの複数の要素の中から第３の要素に適合した要素を判定する、ように構成されている。適合した要素は、一例として、複数の要素のうちの、適合性がある要素、上記の類似性が高いものから順に所定数までの要素、などであってよい。これにより、他方のカテゴリの複数の要素の中から第３の要素に適合した要素を客観的に示すことができる。

【0023】

（８）ある実施の形態に従う演算方法は、演算装置で実行される、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値の演算方法であって、複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ことを含む。これにより、第１のカテゴリに含まれる複数の第１の要素と第２のカテゴリに含まれる複数の第２の要素との間の関連性を指標値という客観的な値で示すことができる。

【0024】

（９）ある実施の形態に従うコンピュータプログラムは、第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算をコンピュータに実行させるプログラムであって、プログラムは、コンピュータに複数の第１の要素それぞれに対応付けられた第１言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、複数の第２の要素それぞれに対応付けられた第２言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成し、第１の特徴量及び第２の特徴量を用いて指標値を生成する、ことを実行させる。これにより、コンピュータを第１のカテゴリに含まれる複数の第１の要素と、第１のカテゴリとは異なる第２のカテゴリに含まれる複数の第２の要素との関連性を示す指標値を算出する演算装置として機能させ、指標値を算出させることができる。

【0025】

＜２．演算装置、演算方法、及び、コンピュータプログラムの例＞

【0026】

図１を参照して、本実施の形態に係る演算装置１０は、異なる２つカテゴリ（第１のカテゴリ、第２のカテゴリ）の関連性を示す指標値を算出する。２つのカテゴリの少なくとも一方は、人を構成要素として含む組織である。人を構成要素として含む組織は、例えば、企業、プロジェクトチーム、大学、学部、学科、研究室、政府、非営利組織、又はその他の団体などである。人を構成要素として含む組織は、先に例示した組織における内部組織であってもよい。また、２つのカテゴリの少なくとも一方は、人に提供され得るサービスである。サービスは、人に提供され得るものであれば有形であっても無形であってもよく、例えば、製品などの有形の商品、講義（授業）やコンテンツの再生などの無形のサービス、知的財産などの権利、を含む。好ましくは、第１のカテゴリと第２のカテゴリとは、共通する単語から得られる値を用いて、それぞれ、第１の特徴量と第２の特徴量とが生成される関係にある。

【0027】

以降の説明では、演算装置１０は、図１に示されたように、大学の教養課程や専門課程で提供される講義と、その大学の研究室との関連性を示す指標値を算出するものとする。すなわち、第１のカテゴリが講義、第２のカテゴリが研究室であるものとする。

【0028】

第１のカテゴリは、複数の第１の要素を有する。第１のカテゴリが講義の場合、第１の要素は、「ハードウェアアーキテクチャ」「コンピュータ言語」「情報デザイン」「政治過程論」「政治学」などの個々の講義に相当する。この例では、第１のカテゴリは、講義１～ＮのＮ個の要素を有する。

【0029】

第２のカテゴリは、複数の第２の要素を有する。第２のカテゴリが研究室の場合、第２の要素は、Ａ研究室、Ｂ研究室などの個々の研究室に相当する。この例では、第２のカテゴリは、研究室１～ＰのＰ個の要素を有する。

【0030】

第１のカテゴリと第２のカテゴリとは、各要素の関連性を考慮する必要がある関係にある。この例では、図１に示されたように、学生Ｔが、受講する講義と所属する研究室との関係を用いることが想定される。例えば、教養課程や専門課程で講義を受けた学生Ｔが、受けた講義との関連性を考慮して、所属する研究室を選択することが想定される。他の例として、学生Ｔが、所属を希望する研究室との関連性を考慮して、教養課程や専門課程で受講する講義を選択することが想定される。このような場面において、演算装置１０で算出される指標値は学生Ｔに提供され、用いられることが想定される。すなわち、演算装置１０の利用者の一例として学生Ｔが想定される。

【0031】

演算装置１０には、第１の要素及び第２の要素それぞれに対応付けられた入力データである第１データ２１，第２データ２２が入力される。演算装置１０は、第１データ２１，第２データ２２を用いて指標値を算出する。第１の要素及び第２の要素それぞれに対応付けられた入力データは、言語化情報を含むデータを指し、一例として、テキストデータ、音声データ、文字画像を含む画像データ、それらの組み合わせ、などを含む。

【0032】

第１のカテゴリが講義である場合、第１データ２１は、例えば、講義ごとに用意されているシラバスが該当する。第２のカテゴリが研究室である場合、第２データ２２は、研究室ごとの、その研究室の卒業研究概要集や、その研究室から発表された論文、その研究室のＷｅｂサイトなどが該当する。

【0033】

演算装置１０は、第１データ２１，第２データ２２から、それぞれ言語化された第１言語情報及び第２言語情報を生成し、第１言語情報及び第２言語情報を用いて第１のカテゴリ及び第２のカテゴリ間の関連性を示す指標値を算出する。第１言語情報及び第２言語情報は、それぞれ、第１データ２１及び第２データ２２を言語化した情報を指し、テキストデータである。

【0034】

本実施の形態に係る演算方法を、図２を用いて説明する。この演算方法は、異なる２つカテゴリである第１のカテゴリ及び第２のカテゴリ間の関連性を示す指標値を算出する方法である。以降の説明では、第１のカテゴリを講義、第２のカテゴリを研究室として、講義１～Ｎと研究室１～Ｐとの関連性を示す指標値を生成するものとする。

【0035】

詳しくは、図２を参照して、初めに、演算装置１０は、第１データ２１及び第２データ２２の入力を受け付ける（ステップＳ１）。この例では、ステップＳ１で、演算装置１０は、講義１～Ｎそれぞれと対応付けられた第１データ２１の入力を受け付け、研究室１～Ｐそれぞれと対応付けられた第２データ２２の入力を受け付ける。第１データ２１及び第２データ２２の入力は、例えば、演算装置１０の管理者（大学のスタッフ）によってなされる。

【0036】

次に、演算装置１０は、第１データ２１から得られた第１言語情報に基づいて、複数の第１の要素それぞれについて特定次元で表される第１の特徴量を生成し、第２データ２２から得られた第２言語情報に基づいて、複数の第２の要素それぞれについて特定次元で表される第２の特徴量を生成する（ステップＳ３）。ここでは、特定次元は、Ｘ次元とする。したがって、この例では、演算装置１０は、講義１～ＮそれぞれＸ次元で表される第１の特徴量Ｆ１、及び、研究室１～ＰそれぞれＸ次元で表される第２の特徴量Ｆ２を生成する。

【0037】

次に、演算装置１０は、第１の特徴量及び第２の特徴量を用いて指標値を生成する（ステップＳ５）。ステップＳ５の具体的な方法については後述する。演算装置１０は、生成した指標値を出力する（ステップＳ７）。出力は、演算装置１０の利用者に対して行われ、この例では、大学生Ｔに対して行われる。出力は、一例として画面表示で行われる。これにより、例えば学生Ｔが受講する講義を選択する際や所属する研究室を選択する際に、指標値を用いることができる。

【0038】

好ましくは、演算装置１０は、ステップＳ５で得られた指標値と、第１のカテゴリと第２のカテゴリとのうちの一方のカテゴリと第３のカテゴリとの関連性を示す他の指標値とを対比し、第１のカテゴリと第２のカテゴリとのうちの他方のカテゴリと第３のカテゴリとの適合性を判定する（ステップＳ９）。判定については後述する。

【0039】

図２の演算方法にて演算処理を実行する演算装置１０は、ネットワーク上のサーバで、ユーザ端末からアクセスされるものである。演算装置１０は、例えば、図３を参照して、プロセッサ１１とメモリ１２とを有するコンピュータで構成される。プロセッサ１１は、例えば、ＣＰＵである。メモリ１２は、フラッシュメモリ、ＥＥＰＲＯＭ、ＲＯＭ、ＲＡＭなどを含む。または、メモリ１２は、一次記憶装置であってもよいし、二次記憶装置であってもよい。

【0040】

メモリ１２は、プロセッサ１１で実行されるコンピュータプログラム１２１を記憶している。プロセッサ１１は、コンピュータプログラム１２１を実行することによって演算処理を実行する。演算処理は、第１のカテゴリと第２のカテゴリとの関連性を示す指標値を生成するための処理を含む。この例では、講義１～Ｎと研究室１～Ｐとの関連性を示す指標値を生成する処理を含む。

【0041】

演算装置１０は、入力装置１７を有する。入力装置１７は、言語情報を有するデータを第１のカテゴリの第１の要素と対応付けて入力し、言語情報を有するデータを第２のカテゴリの第２の要素と対応付けて入力するために用いられる入力部として機能する。この例では、入力装置１７は、講義１～Ｎそれぞれと対応付けられた第１データ２１を入力する。また、入力装置１７は、研究室１～Ｐそれぞれと対応付けられた第２データ２２を入力する。

【0042】

入力装置１７は、例えば、キーボードなどの文字情報を入力する装置、記録媒体の読み出し装置、データが格納された他の装置と通信してデータを入力する通信装置、スキャンデータを入力するスキャナ、音声データを入力するマイク、それらの組み合わせ、などである。

【0043】

メモリ１２は、さらに、データ記憶部１２２を有する。データ記憶部１２２は、入力装置１７が入力したデータを記憶する記憶領域である。この例では、データ記憶部１２２に、第１データ２１及び第２データ２２が記憶されている。

【0044】

プロセッサ１１は、コンピュータプログラム１２１を実行することで演算処理を実行する。演算処理は、特徴量生成処理１１１を含む。特徴量生成処理１１１は、言語情報に基づいて、第１の要素について特定次元で表される第１の特徴量を生成し、言語情報に基づいて、第２の要素について特定次元で表される第２の特徴量を生成することを含む。

【0045】

この例では、特徴量生成処理１１１は、講義１～ＮそれぞれＸ次元で表される第１の特徴量Ｆ１、及び、研究室１～ＰそれぞれＸ次元で表される第２の特徴量Ｆ２を生成することを含む。一例として、第１の特徴量Ｆ１はＮ×Ｘの講義行列で表され、第２の特徴量Ｆ２はＰ×Ｘの研究室行列で表される。

【0046】

この場合、特徴量生成処理１１１は、各データを行列情報化することを含む。行列情報化する方法は特定の方法に限定されない。一例として、プロセッサ１１は、第１データ２１及び第２データ２２それぞれをＢＯＷ（Bag of Words）で表現し、ＢＯＷで表現された非負値行列それぞれに対してＮＭＦ（Non-negative Matrix Factorization）を適用する。ＢＯＷは、文書中に出現する単語をカウントし、出現順序に関わらず出現数を特徴値とする手法である。

【0047】

行列情報化する方法について、具体的に図４、図５を用いて説明する。プロセッサ１１は、第１のカテゴリについて、講義１～Ｎそれぞれに対応付けられた第１データ２１から得られた第１言語情報より、Ｊ種類（Ｊ個）の単語の出現数をカウントし、ＢＯＷで表現した第１の行列Ｖ１１を生成する。ここで、Ｊは、２以上の整数であり、カウントされる単語の種類に応じて決定される。第１の行列Ｖ１１の生成においては、例えば、講義１に対応付けられた第１言語情報（例えば、講義１のシラバス）から、ＢＯＷによってベクトル化されて、講義１のための第１ベクトル（１×Ｊの行列）が生成される。また、講義２に対応付けられた第１言語情報（例えば、講義２のシラバス）から、ＢＯＷによってベクトル化されて、講義２のための第１ベクトル（１×Ｊの行列）が生成される。図４において、Ｎ個の第１のベクトルは、講義１～Ｎを各行とし、Ｊ種類の単語を各列としたＮ×Ｊの行列Ｖ１１によって表される。

【0048】

また、プロセッサ１１は、第２のカテゴリについて、研究室１～Ｐそれぞれに対応付けられた第２データ２２から得られた第２言語情報より、講義１～Ｎと同じＪ種類の単語の出現数をカウントし、ＢＯＷで表現した第２の行列Ｖ１２を生成する。第２の行列Ｖ１２の生成においては、例えば、研究室１に対応付けられた第２言語情報（例えば、研究室１の論文）から、ＢＯＷによってベクトル化されて、研究室１のための第２ベクトル（１×Ｊの行列）が生成される。また、研究室２に対応付けられた第２言語情報（例えば、研究室２の論文）から、ＢＯＷによってベクトル化されて、研究室２のための第２ベクトル（１×Ｊの行列）が生成される。図４において、Ｐ個の第２のベクトルは、研究室１～Ｐを各行とし、Ｊ種類の単語を各列としたＰ×Ｊの行列で表される。

【0049】

プロセッサ１１は、非負値行列である、第１の行列Ｖ１１及び第２の行列Ｖ１２を結合したＢｏＦ（Bag of Features)行列で表現した行列Ｖ１に対して、基底数をＸとして、教師なしＮＭＦ（Non-negative Matrix Factorization：非負値行列因子分解）を適用する。行列Ｖ１は、（Ｎ＋Ｐ）×Ｊの行列である。

【0050】

これにより、プロセッサ１１は、分散表現された特徴量Ｖ２、つまり、Ｘ次元に畳み込まれた行列である特徴量Ｖ２を生成する。特徴量Ｖ２は、（Ｎ＋Ｐ）×Ｘの行列で表される。ここで、基底数Ｘは、２以上の整数であり、予め適宜設定される。好ましくは、Ｘは、Ｊよりも小さい。特徴量Ｖ２は、講義１～Ｎについて第１成分～第Ｎ成分のＸ次元で表される第１の特徴量Ｖ２１と、研究室１～Ｐについて、共通する第１成分～第Ｎ成分のＸ次元で表される第２の特徴量Ｖ２２とからなる。

【0051】

特徴量Ｖ２１，Ｖ２２は、第１データ及び第２データから得られた言語情報のＢＯＷ表現から生成される必要はなく、単語分散表現から生成されてもよい。すなわち、特徴量Ｖ２１，Ｖ２２を得るために行列情報化する方法の他の例として、単語分散表現モデルを用いた方法であってもよい。この場合、メモリ１２は、予め学習されるなどして、単語ごとの単語ベクトルである単語分散表現を有している。この例の場合、メモリ１２は、講義のシラバス等及び研究室の論文等の言語情報に含まれる単語ごとに、Ｘ次元のベクトルを予め記憶している。

【0052】

プロセッサ１１は、講義ごとの文章分散表現を生成する。一例として、プロセッサ１１は、講義のシラバス等（第１言語情報）に含まれる複数の単語それぞれの単語ベクトル（単語分散表現）の平均ベクトルを、その講義の文章分散表現（Ｘ次元ベクトル）とする。Ｎ個の講義の文章分散表現からなる行列は、特徴量Ｖ２１として用いられる。なお、このとき、プロセッサ１１は、後述する指標値生成処理１１２で適用するＮＭＦのために、必要であれば、得られた講義の文章分散表現（Ｘ次元ベクトルを構成する元（Ｘ個の要素）それぞれ）を、さらに、正の数に正規化して、非負行列にする。同様に、プロセッサ１１は、研究室の論文等（第２言語情報）に含まれる複数の単語それぞれの単語ベクトル（単語分散表現）の平均ベクトルを、その研究室の文章分散表現（Ｘ次元ベクトル）とする。Ｐ個の講義の文章分散表現からなる行列は、特徴量Ｖ２２として用いられる。なお、このとき、プロセッサ１１は、後述する指標値生成処理１１２で適用するＮＭＦのために、必要であれば、得られた研究室の文章分散表現（Ｘ次元ベクトルを構成する元（Ｘ個の要素）それぞれ）を、さらに、正の数に正規化して、非負値行列にする。

【0053】

演算処理は、指標値生成処理１１２を含む。指標値生成処理１１２は、第１の特徴量Ｖ２１及び第２の特徴量Ｖ２２を用いて指標値を生成することを含む。指標値は、第１のカテゴリに含まれる複数の第１の要素それぞれと、第２のカテゴリに含まれる第２の要素それぞれとの関係を示す。

【0054】

指標値生成処理１１２は、一例として、第１の特徴量Ｖ２１及び第２の特徴量Ｖ２２のいずれか一方の特徴量Ｖ２２（又は特徴量Ｖ２１）を行列因子分解のためのテンプレートとし、テンプレートではない他方の特徴量Ｖ２１（又は特徴量Ｖ２２）を、テンプレートとした特徴量Ｖ２２（又は特徴量Ｖ２１）で分解することを含む。これにより、第１の特徴量Ｖ２１及び第２の特徴量Ｖ２２を用いて、第１のカテゴリと第２のカテゴリとの関連性を示す指標値が得られる。

【0055】

行列因子分解とは、ある行列を、複数の行列（因子）に分解することをいう。行列因子分解のためのテンプレートとは、分解される因子の一つとして、予め用意された行列である。分解される因子がテンプレートとして固定されていることで、他の因子である行列を容易に求めることができる。

【0056】

好ましくは、第１の特徴量及び第２の特徴量のうち、要素数（行数）の少ない方の特徴量をテンプレートとする。これにより、その逆よりも分解のための演算が容易になる。

【0057】

分解することは、一例として、一方の特徴量を教師データとし、他方の特徴量に対して半教師ありＮＭＦを適用することを含む。指標値Ｖ３を生成する方法の具体例について、図６を用いて説明する。図６に示された方法は、図４、図５によって生成された第１の特徴量Ｖ２１及び第２の特徴量Ｖ２２を用いて指標値Ｖ３を生成する方法の具体例である。

【0058】

プロセッサ１１は、一例として、第１の特徴量Ｖ２１と第２の特徴量Ｖ２２とのうち、第２の特徴量Ｖ２２を転置した行列Ｖ３２をテンプレートとし、第１の特徴量Ｖ２１を転置した行列Ｖ３１を、行列Ｖ３２で分解する。その際、プロセッサ１１は、行列Ｖ３２を教師データとして行列Ｖ３１に対して半教師ありＮＭＦを適用する。

【0059】

具体的には、図６に示されたように、半教師ありＮＭＦによって、行列Ｖ３１が、複数の因子である行列Ｖ３２、指標値Ｖ３、及びノイズ項Ｖ４に分解される。ただし、行列Ｖ３２は、行列因子分解のためのテンプレートである。半教師ありＮＭＦにより、行列Ｖ３２と指標値Ｖ３との積にノイズ項Ｖ４を加えたもので行列Ｖ３１に近い値が得られるような指標値Ｖ３を算出する。ノイズ項Ｖ４は、Ｖ３１－（Ｖ３２×Ｖ３）を示す。このように、半教師ありＮＭＦを適用することにより、プロセッサ１１は、第１カテゴリの第１要素である講義１～Ｎと、第２カテゴリの第２要素である研究室１～Ｐとの関連を示す指標値Ｖ３を容易に生成できる。

【0060】

行列Ｖ３１を行列Ｖ３２で分解して得られる指標値Ｖ３は、一例として、講義１～Ｎを各列とし、研究室１～Ｐを各行とし、各講義と各研究室との関連を表す値を要素としたＰ×Ｎの行列である。これにより、各講義と各研究室との関連が、指標値として得られ、客観的に各講義と各研究室との関連を把握できる。

【0061】

なお、２つの行列のうち一方をテンプレートとして他方を因子分解する方法は、上記の半教師ありＮＭＦを適用する方法に限定されない、他の方法として、教師ありＮＭＦを適用する方法でもよいし、教師あり独立成分分析を行う方法でもよいし、半教師あり独立成分分析を行う方法でもよい。

【0062】

演算処理は、出力処理１１３を含む。出力処理１１３は、指標値から出力用情報を生成し、出力する処理を含む。出力用情報は、一例として、得られた指標値を可視化表現するための情報を含み、可視化表現は、一例としてグラフ化することを含む。

【0063】

グラフ化の一例として、図７に示されたように、得られた指標値Ｖ３のうちのある研究室についての各講義との関連性を示す指標値をグラフ化してもよい。この場合、出力処理１１３は、得られた指標値Ｖ３のうちの指定された研究室についての各講義の指標値からグラフを表示させるための表示データを生成することを含む。図７の例では、研究室Ａについて講義１～１９１（Ｎ＝１９１）それぞれの関連性を表す指標値のグラフＧ１、及び、研究室Ｂについて講義１～１９１（Ｎ＝１９１）それぞれの関連性を表す指標値のグラフＧ２が示されている。

【0064】

視覚化表現して出力されることで、生成された指標値を視覚的に理解することができる。例えば、グラフＧ１，Ｇ２が出力されることによって、研究室Ａ，Ｂについて、それぞれの講義１～１９１の関連性の指標値の分布が視覚的に示される。具体的に、図７のグラフからは、研究室Ａにおいては、講義Ｂ１，Ｂ２，Ｂ３の関連性が高いことがわかる。また、研究室Ｂにおいては、講義Ｂ５，Ｂ６，Ｂ７の関連性が高いことがわかる。また、これらを比較することによって、研究室Ａ，Ｂについて講義１～１９１の関連性の指標値の分布を比較することができる。

【0065】

グラフ化の他の例として、図８に示されたように、指標値Ｖ３全体をグラフ化してもよい。この場合、出力処理１１３は、得られた指標値Ｖ３からグラフを表示させるための表示データを生成することを含む。図８の例では、講義１～１９１（Ｎ＝１９１）、研究室１～４２（Ｐ＝４２）について得られた指標値Ｖ３の各要素を、数値を表す濃淡の色で、横軸を講義、縦軸を研究室とした配置したグラフＧ３が示されている。

【0066】

グラフＧ３が出力されることによって、各講義と各研究室との関連の高低を視覚にて確認することができる。また、グラフＧ３が出力されることによって、講義間で研究室との関連性の傾向を視覚にて比較することができる。また、グラフＧ３が出力されることによって、研究室間で講義との関連性の傾向を視覚にて比較することができる。

【0067】

演算処理は、判定処理１１４を含む。判定処理１１４は、得られた指標値と、第１のカテゴリと第２のカテゴリとのうちの一方のカテゴリと第３のカテゴリとの関連性を示す他の指標値とを対比し、第１のカテゴリと第２のカテゴリとのうちの他方のカテゴリと第３のカテゴリとの適合性を判定することを含む。

【0068】

対比は、一例として、指標値を可視化することで得られた一方のカテゴリと他方のカテゴリとの各要素についての指標値の分布（第１の分布）と、一方のカテゴリと第３のカテゴリとの各要素についての指標値の分布（第２の分布）と、の対比であってよい。

【0069】

この場合、適合性の判定は、一例として、第１の分布と第２の分布との類似性を利用することができる。第１の分布と第２の分布との類似性を算出する手法として様々な手法を採用することが可能であり、例えば、第１の分布及び第２の分布それぞれを形成する２つのベクトルの、コサイン類似度やユークリッド距離を用いることができる。コサイン類似度は２つのベクトルの成す角度の近さを０から１の間の数で表すものであって、１に近いほど類似し、０に近いほど類似していないことを示す。２つのベクトルのユークリッド距離は、小さいほど類似し、大きいほど類似していないことを示す。この手法を用いることで、第１の分布と第２の分布との類似性がコサイン類似度やユークリッド距離として得られる。適合性の判定は、例えば、得られた類似性が閾値以上である場合に適合性あり、閾値未満の場合に適合性なし、と判定することであってよい。

【0070】

好ましくは、判定処理１１４は、指標値Ｖ３と他の指標値と対比することによって、他方のカテゴリの複数の要素の中から第３のカテゴリに対応した要素を判定する。対応した要素は、一例として、複数の要素のうちの、適合性がある要素、上記の類似性が高いものから順に所定数までの要素、などであってよい。

【0071】

具体的には、指標値Ｖ３と他の指標値との対比は、例えば、講義と研究室との関連性の指標値Ｖ３と、学生Ｔの各講義についての興味度合や満足度合を示す指標値との対比であってよい。この場合、プロセッサ１１は、例えば図９の画面４１をディスプレイ１４に表示させて、学生Ｔの各講義についての興味の度合の入力を受け付ける。

【0072】

画面４１は、講義ごとの興味の度合の選択肢４２を含む。プロセッサ１１は、入力装置１７での選択結果、つまり、学生Ｔの講義についての言語情報を有するデータの入力を受け付ける。

【0073】

プロセッサ１１は、画面４１で入力された、学生Ｔの講義についての言語情報を有するデータを用いて、各講義についての興味度合の分布（第２の分布）を生成し、各研究室の講義ごとの関連性を示す指標値の分布（第１の分布）と対比する。プロセッサ１１は、第１の分布と第２の分布との類似性に基づいて、学生Ｔに対する各研究室の適合性を判定することができる。また、プロセッサ１１は、類似性の最も高い研究室や、最も高い研究室から所定数の研究室を、学生Ｔに対応する研究室と判定してもよい。

【0074】

例えば、第２の分布として、学生Ｔの講義１～Ｎについて入力された情報に基づいて図１０のグラフＧ４に表されるような分布が得られた場合、プロセッサ１１は、第１の分布である、指標値Ｖ３から得られた研究室ＡについてのグラフＧ１及び研究室ＢについてのグラフＧ２と比較する。グラフＧ４は、グラフＧ１よりグラフＧ２の方の類似性が高い。この場合、プロセッサ１１は、研究室Ａより研究室Ｂを学生Ｔに対応する研究室と判定する。

【0075】

演算装置１０は、図２の演算方法に加えて、又は、ステップＳ７又はステップＳ９に替えて、指標値を用いた分類を行ってもよい。その場合、演算処理は図３に示されたように、分類処理１１５を含む。分類処理１１５は、得られた指標値に応じて、複数の第３のカテゴリを分類することを含む。上の例の場合、研究室ごとの講義の関連性に応じて研究室を分類することが挙げられる。

【0076】

分類する方法として、一般的なクラスタリング技術を用いることができる。クラスタリングとは、機械学習における教師なし学習の１つであって、データ間の類似度に基づいてデータをグループ分けする手法である。一般的なクラスタリング技術は、例えば、ｋ－ｍｅａｎｓが挙げられる。ｋ－ｍｅａｎｓとは、非階層型クラスタリングのアルゴリズムであって、クラスタの平均を用い、与えられたクラスタ数Ｋ個に分類する技法である。非階層クラスタリングとは、異なる性質のものが混ざり合った集団から、互いに似た性質を持つものを集め、クラスタを作る方法の１つである。

【0077】

プロセッサ１１における分類処理１１５の流れを、図１１を用いて説明する。この例では、分類手法としてｋ－ｍｅａｎｓを用い、研究室１～Ｐを、講義１～Ｎそれぞれとの関連を表す指標値Ｖ３を用いて、３つのグループ（Ｋ＝３）に分類するものとしている。

【0078】

図１１を参照して、初めに、プロセッサ１１は、すべての研究室１～Ｐの初期グループ分けを行う（ステップＳ１０１）。初期グループ分けは、すべての研究室１～Ｐにランダムに第１グループ～第３グループを割り振ることを指す。

【0079】

次に、プロセッサ１１は、各グループに割り振られた研究室１～Ｐの講義１～Ｎそれぞれに対する関連性を示す指標値を用いて、各グループの重心を算出する（ステップＳ１０３）。重心は、一例として、各グループに割り振られた研究室１～Ｐの指標値の平均ベクトルで得られる。

【0080】

次に、プロセッサ１１は、研究室１～Ｐそれぞれの、割り当てられたグループの重心からの距離（第１距離）を参照する（ステップＳ１０５）。このとき、プロセッサ１１は、研究室１～Ｐそれぞれについて、割り当てられていない他のグループの重心からの距離（第２距離）も算出しておく。そして、第１距離よりも第２距離の方が小さい研究室が存在する場合（ステップＳ１０７でＹＥＳ）、プロセッサ１１は、その研究室に割り振るグループを、第２距離となるグループとなるよう再グループ分けを行う（ステップＳ１０９）。

【0081】

プロセッサ１１は、すべての研究室について、振り分けられたグループの重心からの距離が他のグループの重心からの距離よりも短くなるまで、以上のステップＳ１０３～Ｓ１０９を繰り返す（ステップＳ１０７でＮＯ）。これにより、すべての研究室が重心からの距離が最も近くなるグループに振り分けられる。

【0082】

分類処理１１５が行われることによって、あるカテゴリの各要素を、他のカテゴリの各要素への関連性に応じて指定されたグループ数に分類することが可能になる。この例では、研究室１～Ｐを、講義１～Ｎそれぞれへの関連性に応じて３つのグループに分類することができる。この分類結果が出力されることによって、学生Ｔは、例えば、受けた講義との関連性の高い研究室のグループを知ることができる。

【0083】

なお、クラスタリング技術の他の例として、ｋ―Ｓｈａｐｅが挙げられる。ｋ―Ｓｈａｐｅは、時系列データのクラスタリングアルゴリズムの１つであって、時系列データを対象とした形状に着目したクラスタリング手法である。

【0084】

ｋ―Ｓｈａｐｅでも、図１１に示された流れと同様にして研究室１～Ｐが分類される。その処理において、ｋ―Ｓｈａｐｅでは、ｋ－ｍｅａｎｓと異なる手法で距離が算出される。すなわち、ｋ―Ｓｈａｐｅにおいては、ＳｃａｌｉｎｇとＳｈｉｆｔｉｎｇとに対する不変性（Invariances）を踏まえて距離尺度ＳＢＤ（Shape-based distance）を用いてデータ（研究室１～Ｐ）間の距離が計算される。Ｓｃａｌｉｎｇは縦軸に対して拡大（縮小）した際にデータ同士の性質が似ているかどうかを表し、Ｓｈｉｆｔｉｎｇは時間軸（位相）に対してずらした場合にデータ同士の性質が似ているかどうかを表す。距離尺度ＳＢＤにおいては、相互相関を用いて類似性が判定される。距離尺度ＳＢＤにおいては、データを時間軸移動させながら最大の内積を算出し、内積が最大の位置を検出する。距離尺度ＳＢＤは０から２の間の値を取り、０に近いほど２つの時系列データが類似している。

【0085】

ｋ－ｍｅａｎｓとｋ―Ｓｈａｐｅとに上記の違いがあることから、好ましくは、分類処理１１５においては、データが並び順を有さず個々に独立したデータである場合にはｋ－ｍｅａｎｓが用いられ、並び順を有する場合にはｋ―Ｓｈａｐｅが好適に用いられる。並び順を有するデータは、例えば、講義や特許などを難易度などでソートして並べたデータ、などが該当する。

【0086】

＜３．付記＞
本発明を用いることにより、授業（講義）と研究室（研究）の関連性を可視化（数値化）できる。そのため、学生の履修科目と研究室とのミスマッチを減少できる。
尚、本発明は、上記実施形態に限定されるものではなく、様々な変形が可能である。例えば、複数の大学間の授業（講義）と研究室（研究）の関係、企業の事業内容と大学の研究室（研究）や授業（講義）との関係、高校での学習内容と大学の研究室（研究）や授業（講義）との関係など種々の関連性の把握に役立てることができる。そのため、本発明を用いることにより、大学・学部でのカリキュラム設計やブランディングに役立つ。また、高校や塾の進学支援に繋げることもできる。さらに、企業と大学の研究室（研究）とのマッチングに役立つので、大学のシーズの売り込み先の検索や共同研究先の検索などに役立つ。

【符号の説明】

【0087】

１０：演算装置
１１：プロセッサ
１２：メモリ
１４：ディスプレイ
１７：入力装置
２１：第１データ
２２：第２データ
４１：画面
４２：選択肢
１１１：特徴量生成処理
１１２：指標値生成処理
１１３：出力処理
１１４：判定処理
１１５：分類処理
１２１：コンピュータプログラム
１２２：データ記憶部
Ａ：研究室
Ｂ：研究室
Ｂ１：講義
Ｂ２：講義
Ｂ３：講義
Ｂ４：講義
Ｂ５：講義
Ｂ６：講義
Ｂ７：講義
Ｆ１：第１の特徴量
Ｆ２：第２の特徴量
Ｇ１：グラフ
Ｇ２：グラフ
Ｇ３：グラフ
Ｇ４：グラフ
Ｔ：学生
Ｖ１：ベクトル
Ｖ１１：第１のベクトル
Ｖ１２：第２のベクトル
Ｖ２：特徴量
Ｖ２１：第１の特徴量
Ｖ２２：第２の特徴量
Ｖ３：指標値
Ｖ３１：行列
Ｖ３２：行列
Ｖ４：ノイズ項

【図1】