IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-176560制御プログラム、制御装置、及び制御方法
<>
  • 特開-制御プログラム、制御装置、及び制御方法 図1
  • 特開-制御プログラム、制御装置、及び制御方法 図2
  • 特開-制御プログラム、制御装置、及び制御方法 図3
  • 特開-制御プログラム、制御装置、及び制御方法 図4
  • 特開-制御プログラム、制御装置、及び制御方法 図5
  • 特開-制御プログラム、制御装置、及び制御方法 図6
  • 特開-制御プログラム、制御装置、及び制御方法 図7
  • 特開-制御プログラム、制御装置、及び制御方法 図8
  • 特開-制御プログラム、制御装置、及び制御方法 図9
  • 特開-制御プログラム、制御装置、及び制御方法 図10
  • 特開-制御プログラム、制御装置、及び制御方法 図11
  • 特開-制御プログラム、制御装置、及び制御方法 図12
  • 特開-制御プログラム、制御装置、及び制御方法 図13
  • 特開-制御プログラム、制御装置、及び制御方法 図14
  • 特開-制御プログラム、制御装置、及び制御方法 図15
  • 特開-制御プログラム、制御装置、及び制御方法 図16
  • 特開-制御プログラム、制御装置、及び制御方法 図17
  • 特開-制御プログラム、制御装置、及び制御方法 図18
  • 特開-制御プログラム、制御装置、及び制御方法 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024176560
(43)【公開日】2024-12-19
(54)【発明の名称】制御プログラム、制御装置、及び制御方法
(51)【国際特許分類】
   G06F 3/04845 20220101AFI20241212BHJP
【FI】
G06F3/04845
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023095149
(22)【出願日】2023-06-09
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100121083
【弁理士】
【氏名又は名称】青木 宏義
(74)【代理人】
【識別番号】100138391
【弁理士】
【氏名又は名称】天田 昌行
(74)【代理人】
【識別番号】100074099
【弁理士】
【氏名又は名称】大菅 義之
(72)【発明者】
【氏名】松下 京群
【テーマコード(参考)】
5E555
【Fターム(参考)】
5E555AA23
5E555BA02
5E555BB02
5E555BC04
5E555CC26
5E555DB45
5E555DC19
5E555DC21
5E555EA08
5E555EA14
5E555EA19
5E555FA00
(57)【要約】
【課題】単語集合に含まれる複数の単語を表示する際に、表示された単語の配置を制御する。
【解決手段】コンピュータは、単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と第2単語の位置との関係を指定する、指示を受け付ける。コンピュータは、単語間の第1関係と単語間の第2関係との類似度に基づいて、複数の単語のうち第3単語の位置と第4単語の位置との関係が、指示に指定される第1単語の位置と第2単語の位置との関係に応じた所定の関係になるように、第3単語と第4単語とを表示装置に表示させる。第3単語は、第1単語の特徴と複数の単語のうち第1単語以外の単語の特徴との類似度に基づいて、第1単語以外の複数の単語の中から特定される。単語間の第1関係は、第1単語の特徴と第2単語の特徴との関係である。単語間の第2関係は、第3単語の特徴と第4単語の特徴との関係である。
【選択図】図9
【特許請求の範囲】
【請求項1】
単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と、前記複数の単語のうち前記表示装置により表示されている第2単語の位置との関係を指定する、指示を受け付け、
単語間の第1関係と単語間の第2関係との類似度に基づいて、前記複数の単語のうち第3単語の位置と前記複数の単語のうち第4単語の位置との関係が、前記指示に指定される前記第1単語の位置と前記第2単語の位置との関係に応じた所定の関係になるように、前記第3単語と前記第4単語とを前記表示装置に表示させる、
処理をコンピュータに実行させ、
前記第3単語は、前記第1単語の特徴と前記複数の単語のうち前記第1単語以外の単語の特徴との類似度に基づいて、前記第1単語以外の前記複数の単語の中から特定され、
前記単語間の第1関係は、前記第1単語の特徴と前記第2単語の特徴との関係であり、
前記単語間の第2関係は、前記第3単語の特徴と前記第4単語の特徴との関係であることを特徴とする制御プログラム。
【請求項2】
前記第1単語の特徴は、前記第1単語を表す第1ベクトルであり、
前記第2単語の特徴は、前記第2単語を表す第2ベクトルであり、
前記第3単語の特徴は、前記第3単語を表す第3ベクトルであり、
前記第1単語以外の単語の特徴は、前記第1単語以外の単語を表す第4ベクトルであり、
前記第4単語の特徴は、前記第4単語を表す第5ベクトルであり、
前記制御プログラムは、
前記第1ベクトルと前記第2ベクトルとを用いて所定の演算を行うことで、前記単語間の第1関係を表す第6ベクトルを求め、
前記第3ベクトルと前記第5ベクトルとを用いて前記所定の演算を行うことで、前記単語間の第2関係を表す第7ベクトルを求める、
処理を前記コンピュータにさらに実行させることを特徴とする請求項1記載の制御プログラム。
【請求項3】
前記制御プログラムは、
言語モデルを用いて、前記第1単語と前記第2単語との組み合わせと、前記第3単語と前記第4単語との組み合わせとを用いて生成された所定の文の評価値を取得する、
処理を前記コンピュータにさらに実行させ、
前記所定の文の評価値は、前記単語間の第1関係と前記単語間の第2関係との類似度として用いられることを特徴とする請求項1記載の制御プログラム。
【請求項4】
前記制御プログラムは、
前記第2関係を含み、それぞれが前記第3単語の特徴と前記複数の単語のうち前記第3単語以外の単語の特徴との複数の第3関係に基づいて、前記第3単語以外の単語の中から前記第4単語を特定する、
処理を前記コンピュータに実行させることを特徴とする請求項1記載の制御プログラム。
【請求項5】
前記指示は、前記第1単語の位置と前記第2単語の位置との距離が減少するように、前記第1単語の位置と前記第2単語の位置との関係を変更する指示であり、
前記第3単語と前記第4単語とを前記表示装置に表示させる処理は、前記単語間の第1関係と前記単語間の第2関係との類似度が閾値よりも大きい場合、前記第3単語の位置から所定距離の範囲内に前記第4単語が配置されるように、前記第3単語と前記第4単語とを前記表示装置に表示させる処理を含むことを特徴とする請求項1乃至4の何れか1項に記載の制御プログラム。
【請求項6】
単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と、前記複数の単語のうち前記表示装置により表示されている第2単語の位置との関係を指定する、指示を受け付ける受付部と、
単語間の第1関係と単語間の第2関係との類似度に基づいて、前記複数の単語のうち第3単語の位置と前記複数の単語のうち第4単語の位置との関係が、前記指示に指定される前記第1単語の位置と前記第2単語の位置との関係に応じた所定の関係になるように、前記第3単語と前記第4単語とを前記表示装置に表示させる制御部と、
を備え、
前記第3単語は、前記第1単語の特徴と前記複数の単語のうち前記第1単語以外の単語の特徴との類似度に基づいて、前記第1単語以外の前記複数の単語の中から特定され、
前記単語間の第1関係は、前記第1単語の特徴と前記第2単語の特徴との関係であり、
前記単語間の第2関係は、前記第3単語の特徴と前記第4単語の特徴との関係であることを特徴とする制御装置。
【請求項7】
単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と、前記複数の単語のうち前記表示装置により表示されている第2単語の位置との関係を指定する、指示を受け付け、
単語間の第1関係と単語間の第2関係との類似度に基づいて、前記複数の単語のうち第3単語の位置と前記複数の単語のうち第4単語の位置との関係が、前記指示に指定される前記第1単語の位置と前記第2単語の位置との関係に応じた所定の関係になるように、前記第3単語と前記第4単語とを前記表示装置に表示させる、
処理をコンピュータが実行し、
前記第3単語は、前記第1単語の特徴と前記複数の単語のうち前記第1単語以外の単語の特徴との類似度に基づいて、前記第1単語以外の前記複数の単語の中から特定され、
前記単語間の第1関係は、前記第1単語の特徴と前記第2単語の特徴との関係であり、
前記単語間の第2関係は、前記第3単語の特徴と前記第4単語の特徴との関係であることを特徴とする制御方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、単語の表示を制御する制御技術に関する。
【背景技術】
【0002】
テキストデータに含まれる複数の単語を概観するために、ワードクラウドが利用されることがある。ワードクラウドは、表示画面の所定領域内に配置された単語の集合であり、テキストデータ内における出現頻度が高い単語ほど、大きなサイズで表示される。
【0003】
ワードクラウドに関して、Python(登録商標)によりワードクラウドを生成する技術が知られている(例えば、非特許文献1を参照)。単語の分散表現も知られている(例えば、非特許文献2を参照)。言語モデルを用いて単語間の関係の類似性を特定する技術も知られている(例えば、非特許文献3を参照)。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】“GitHub - amueller/word_cloud: A little word cloud generator in Python”、[online]、GitHub、[令和5年2月10日検索]、インターネット<URL:https://github.com/amueller/word_cloud>
【非特許文献2】T. Mikolov et al., “Distributed Representations of Words and Phrases and their Compositionality”, NIPS'13: Proceedings of the 26th International Conference on Neural Information Processing Systems - Volume 2, December 2013, pages 3111-3119.
【非特許文献3】A. Ushio et al., “BERT is to NLP what AlexNet is to CV: Can Pre-Trained Language Models Identify Analogies?”, Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing, August 2021, pages 3609-3624.
【発明の概要】
【発明が解決しようとする課題】
【0005】
プログラム等を用いてワードクラウドを生成する場合、ワードクラウドに含まれる単語の配置が分かりにくいことがある。
【0006】
なお、かかる問題は、ワードクラウドに限らず、様々な単語集合に含まれる複数の単語を表示する場合において生ずるものである。
【0007】
1つの側面において、本発明は、単語集合に含まれる複数の単語を表示する際に、表示された単語の配置を制御することを目的とする。
【課題を解決するための手段】
【0008】
1つの案では、制御プログラムは、以下の処理をコンピュータに実行させる。
【0009】
コンピュータは、単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と第2単語の位置との関係を指定する、指示を受け付ける。コンピュータは、単語間の第1関係と単語間の第2関係との類似度に基づいて、複数の単語のうち第3単語の位置と第4単語の位置との関係が、指示に指定される第1単語の位置と第2単語の位置との関係に応じた所定の関係になるように、第3単語と第4単語とを表示装置に表示させる。
【0010】
第3単語は、第1単語の特徴と複数の単語のうち第1単語以外の単語の特徴との類似度に基づいて、第1単語以外の複数の単語の中から特定される。単語間の第1関係は、第1単語の特徴と第2単語の特徴との関係である。単語間の第2関係は、第3単語の特徴と第4単語の特徴との関係である。
【発明の効果】
【0011】
1つの側面によれば、単語集合に含まれる複数の単語を表示する際に、表示された単語の配置を制御することができる。
【図面の簡単な説明】
【0012】
図1】ワードクラウドを示す図である。
図2】比較対象の2つのワードクラウドを示す図である。
図3】実施形態の制御装置の機能的構成図である。
図4】制御処理のフローチャートである。
図5】制御装置の具体例を示す機能的構成図である。
図6】変更指示に含まれる注目単語及び周辺単語を示す図である。
図7】注目単語と類似する注目単語を示す図である。
図8】周辺単語を示す図である。
図9】変更後のワードクラウドを示す図である。
図10】単語の組み合わせを示す図である。
図11】単語ベクトルを示す図である。
図12】差分ベクトルを示す図である。
図13】注目単語の配置を示す図である。
図14】周辺単語の配置を示す図である。
図15】単語配置制御処理のフローチャートである。
図16】複数の注目単語に共通する周辺単語を示す図である。
図17】注目単語と周辺単語とを区別しない場合に選択される単語を示す図である。
図18】注目単語と周辺単語とを区別した場合に選択される単語を示す図である。
図19】情報処理装置のハードウェア構成図である。
【発明を実施するための形態】
【0013】
以下、図面を参照しながら、実施形態を詳細に説明する。
【0014】
ユーザがワードクラウドに含まれる複数の単語を概観する場合、単語の配置が最適化されていることが望ましい。例えば、関連する単語同士が近くに配置されている方が、単語間の関連性が分かりやすい。
【0015】
図1は、ワードクラウドの例を示している。図1(a)は、「FFF」、「CCC」、「軽い」、及び「でかい」を含むワードクラウドの例を示している。「FFF」及び「CCC」は、PC(Personal Computer)の仮想的な製品名を表す単語であり、「軽い」及び「でかい」は、PCの特徴を表す単語である。なお、図1の例では、「軽い」は「FFF」に対応する特徴であり、「でかい」は、「CCC」に対応する特徴であることとする。
【0016】
図1(a)の例では、「FFF」に関連する「軽い」が、「FFF」の近くに配置されており、「CCC」に関連する「でかい」が、「CCC」の近くに配置されているため、単語間の関連性が分かりやすい。
【0017】
図1(b)は、図1(a)の4個の単語を含む別のワードクラウドの例を示している。図1(b)の例では、「FFF」に関連する「軽い」が、「FFF」の近くに配置されておらず、「CCC」の近くに配置されているため、単語間の関連性が分かりにくい。
【0018】
また、複数のワードクラウドを比較する場合、それらのワードクラウドにおける単語の配置が似ている方が比較しやすい。
【0019】
図2は、比較対象の2つのワードクラウドの例を示している。ワードクラウド201は、「FFF」、「CCC」、「軽い」、及び「でかい」を含み、ワードクラウド202は、「MMM」、「SSS」、「薄い」、及び「軽い」を含む。ワードクラウド202の「MMM」及び「SSS」は、PCの仮想的な製品名を表す単語であり、「薄い」及び「軽い」は、PCの特徴を表す単語である。
【0020】
この例では、ワードクラウド202に含まれる単語の配置と、ワードクラウド201に含まれる単語の配置との間に差異があり、ワードクラウド201とワードクラウド202とのを比較が難しくなる可能性がある。
【0021】
ワードクラウドの生成方法の1つにおいて、ワードクラウドに含まれる単語の位置は、生成のたびにランダム決定される。この場合、一度生成されたワードクラウドに含まれる単語の配置がユーザの意向に沿わない場合は再度ワードクラウドの生成をやり直すことが考えられる。しかし、ワードクラウドの生成を複数回繰り返したとしても、依然として単語の配置が分かりにくかったり、不要な単語が含まれていたりすることがある。したがって、必ずしもユーザが意図するワードクラウドが得られるとは限らない。
【0022】
また、生成されたワードクラウドをユーザが確認しながら、ワードクラウドを生成するプログラム等を修正する場合、ユーザの作業負荷が大きくなる。
【0023】
図3は、実施形態の制御装置の機能的構成例を示している。図3の制御装置301は、受付部311及び制御部312を含む。
【0024】
図4は、図3の制御装置301が行う制御処理の例を示すフローチャートである。まず、受付部311は、単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と第2単語の位置との関係を指定する、指示を受け付ける(ステップ401)。
【0025】
次に、制御部312は、単語間の第1関係と単語間の第2関係との類似度に基づいて、複数の単語のうち第3単語の位置と第4単語の位置との関係が、指示に指定される第1単語の位置と第2単語の位置との関係に応じた所定の関係になるように、第3単語と第4単語とを表示装置に表示させる(ステップ402)。
【0026】
第3単語は、第1単語の特徴と複数の単語のうち第1単語以外の単語の特徴との類似度に基づいて、第1単語以外の複数の単語の中から特定される。単語間の第1関係は、第1単語の特徴と第2単語の特徴との関係である。単語間の第2関係は、第3単語の特徴と第4単語の特徴との関係である。
【0027】
図3の制御装置301によれば、単語集合に含まれる複数の単語を表示する際に、表示された単語の配置を制御することができる。
【0028】
図5は、図3の制御装置301の具体例を示している。図5の制御装置501は、表示制御部511、受付部512、注目単語特定部513、周辺単語特定部514、表示装置515、及び記憶部516を含む。受付部512は、図3の受付部311に対応し、表示制御部511、注目単語特定部513、及び周辺単語特定部514は、図3の制御部312に対応する。
【0029】
記憶部516は、ワードクラウド情報521を記憶する。ワードクラウド情報521は、テキストデータから抽出された複数の単語それぞれの単語情報を含む。テキストデータとしては、様々な文書のテキストの一部又は全部が用いられる。テキストデータは、webページ、論文、書籍等のテキストであってもよい。
【0030】
各単語情報は、単語の文字列、表示形態、及び位置情報を含む。文字列は、単語に含まれる1つ又は複数の文字の列を表す。表示形態は、文字列のサイズ、色、フォント等を表す。位置情報は、ワードクラウドの表示領域内において文字列が配置される位置を表す。ワードクラウド情報521に含まれる複数の単語は、単語集合に対応する。
【0031】
表示制御部511は、ワードクラウドの表示を表示装置515に指示する。表示装置515は、表示制御部511からの指示に基づき、ワードクラウド情報521を用いて、画面上の表示領域内にワードクラウドを表示する。これにより、ユーザは、表示されたワードクラウドに含まれる単語を概観することができる。
【0032】
なお、ワードクラウド情報521に含まれるすべての単語が表示領域内に表示されるとは限らない。例えば、ワードクラウド情報521に含まれる単語の個数に対して表示領域の面積が小さいために、表示領域内にすべての単語を配置することが難しい場合、一部の単語が表示されないこともある。
【0033】
ワードクラウドに含まれる単語の配置を変更したい場合、ユーザは、制御装置501に変更指示522を入力する。受付部512は、ユーザから入力された変更指示522を受け付けて、記憶部516に格納する。
【0034】
変更指示522は、例えば、ワードクラウドに含まれる単語のうち、注目単語WA1の位置と周辺単語WB1の位置との距離が減少するように、注目単語WA1の位置と周辺単語WB1の位置との関係を変更する指示である。注目単語WA1及び周辺単語WB1は、第1単語及び第2単語にそれぞれ対応する。
【0035】
注目単語特定部513は、変更指示522を参照して、注目単語WA1の特徴と、ワードクラウド情報521に含まれる他の単語の特徴との類似度S1を計算する。そして、注目単語特定部513は、類似度S1に基づいて、他の単語の中から、注目単語WA1と類似する注目単語WA2を特定する。
【0036】
注目単語特定部513は、例えば、ワードクラウド情報521に含まれる他の単語のうち、閾値TH1よりも大きな類似度S1を有する単語を、注目単語WA2として特定する。注目単語WA2は、第3単語に対応する。
【0037】
周辺単語特定部514は、単語間の関係R1と単語間の関係R2との類似度S2を計算する。そして、周辺単語特定部514は、類似度S2に基づいて、ワードクラウド情報521に含まれる単語のうち注目単語WA2以外の単語の中から、周辺単語WB2を特定する。関係R1は、注目単語WA1の特徴と周辺単語WB1の特徴との関係である。関係R2は、注目単語WA2の特徴と、ワードクラウド情報521に含まれる他の単語の特徴との関係である。
【0038】
周辺単語特定部514は、例えば、ワードクラウド情報521に含まれる他の単語のうち、閾値TH2よりも大きな類似度S2を有する単語を、周辺単語WB2として特定する。周辺単語WB2は、第4単語に対応する。
【0039】
表示制御部511は、注目単語WA2の位置と周辺単語WB2の位置とが所定の関係になるように、注目単語WA2及び周辺単語WB2の位置を決定し、ワードクラウド情報521に含まれる注目単語WA2及び周辺単語WB2の位置情報を変更する。所定の関係は、例えば、注目単語WA2の位置から所定距離の範囲内に周辺単語WB2が配置されるような関係である。そして、表示制御部511は、ワードクラウドの表示を表示装置515に指示する。
【0040】
表示装置515は、表示制御部511からの指示に基づき、変更後のワードクラウド情報521を用いて、画面上の表示領域内にワードクラウドを表示する。
【0041】
周辺単語WB1を注目単語WA1に近づける変更指示522が入力された場合に、注目単語WA2から所定距離の範囲内に周辺単語WB2を配置することで、変更指示522に合わせて、周辺単語WB2を注目単語WA2に近づけることができる。
【0042】
図6は、変更指示522に含まれる注目単語WA1及び周辺単語WB1の例を示している。図6の表示領域601内には、「FFF」、「速い」、「配送」、及び「大きい」が表示されている。ユーザは、注目単語WA1として「FFF」を選択し、周辺単語WB1として「速い」を選択する。そして、ユーザは、「速い」を「FFF」に近づける変更指示522を入力する。これにより、「速い」の位置がP1からP2に変更される。
【0043】
図7は、注目単語WA1と類似する注目単語WA2の例を示している。注目単語特定部513は、図6の変更指示522に含まれる「FFF」の特徴と、ワードクラウド情報521に含まれる他の単語の特徴との類似度S1を計算する。そして、注目単語特定部513は、類似度S1に基づいて、「FFF」と類似する「CCC」を、注目単語WA2として特定する。「CCC」は、図6の表示領域601内に表示されていなかった単語である。
【0044】
図8は、周辺単語WB2の例を示している。周辺単語特定部514は、単語間の関係R1と単語間の関係R2との類似度S2を計算する。関係R1は、「FFF」の特徴と「速い」の特徴との関係である。関係R2は、「CCC」の特徴と、ワードクラウド情報521に含まれる他の単語の特徴との関係である。そして、周辺単語特定部514は、類似度S2に基づいて、ワードクラウド情報521に含まれる他の単語の中から、「大きい」を周辺単語WB2として特定する。
【0045】
表示制御部511は、「大きい」が「CCC」に近づくように、「大きい」の位置を変更する調整を行う。これにより、「大きい」の位置がP3からP4に変更される。
【0046】
図9は、変更後のワードクラウドの例を示している。表示制御部511は、図6の変更指示522とは無関係の「配送」を非表示にする。これにより、「配送」が表示領域601から削除される。
【0047】
図9のワードクラウドでは、「FFF」に関連する「速い」が、「FFF」の近くに配置されており、「CCC」に関連する「大きい」が、「CCC」の近くに配置されている。さらに、不要な単語である「配送」が削除されているため、単語間の関連性が分かりやすい。なお、上記の例示においては、変更指示522は単語間の距離が減少するように変更する指示としたが、変更指示が単語間の距離を増加させる(遠ざける)指示であって、指示に応じて、指示対象以外の単語間の距離を増加せる調整が実行されてもよい。
【0048】
図5の制御装置501によれば、ユーザから入力された変更指示522に合わせて、ワードクラウド内の単語の配置を適切に制御することができる。ユーザは、変更指示522の代わりに、注目単語WA1の位置と周辺単語WB1の位置との関係を固定する指示を、制御装置501に入力してもよい。
【0049】
単語の特徴としては、例えば、単語を表す単語ベクトルが用いられる。単語ベクトルは、その単語が使用される文脈から生成されるため、使用される文脈が類似している2つの単語の間では、それらの単語ベクトルも類似する。文脈は、文中の他の単語又は文、前後の単語等を表す。
【0050】
単語の特徴として単語ベクトルが用いられる場合、注目単語特定部513は、注目単語WA1の単語ベクトルVA1と、ワードクラウド情報521に含まれる他の単語の単語ベクトルVとのベクトル間類似度を、類似度S1として計算する。ベクトル間類似度としては、コサイン類似度、ベクトル間距離の逆数等を用いることができる。
【0051】
注目単語特定部513は、注目単語WA1の品詞情報等を用いて、単語のフィルタリングを行ってもよい。例えば、注目単語WA1が名詞である場合、名詞以外の単語が類似度計算の対象から除外される。
【0052】
周辺単語特定部514は、例えば、非特許文献2に記載された方法を用いて、単語間の関係R1と単語間の関係R2との類似度S2を計算することができる。この場合、周辺単語特定部514は、注目単語WA1の単語ベクトルVA1と周辺単語WB1の単語ベクトルVB1とを用いて、次式により、関係R1を表す差分ベクトルD1を計算する。
【0053】
D1=VA1-VB1 (1)
【0054】
また、周辺単語特定部514は、注目単語WA2の単語ベクトルVA2とワードクラウド情報521に含まれる他の単語の単語ベクトルVとを用いて、次式により、関係R2を表す差分ベクトルD2を計算する。
【0055】
D2=VA2-V (2)
【0056】
そして、周辺単語特定部514は、差分ベクトルD1と差分ベクトルD2とのベクトル間類似度を、類似度S2として計算する。
【0057】
単語の特徴として単語ベクトルを用いることで、類似度S1及び類似度S2を容易に計算することができる。
【0058】
単語ベクトルVA1は、第1ベクトルの一例である。単語ベクトルVB1は、第2ベクトルの一例である。単語ベクトルVA2は、第3ベクトルの一例である。他の単語の単語ベクトルVは、第4ベクトルの一例である。他の単語の単語ベクトルVのうち、周辺単語WB2の単語ベクトルVは、第5ベクトルの一例である。差分ベクトルD1は、第6ベクトルの一例である。単語ベクトルVA2と周辺単語WB2の単語ベクトルVとの差分を表す差分ベクトルD2は、第7ベクトルの一例である。式(1)及び式(2)の単語ベクトル間の減算は、所定の演算の一例である。
【0059】
周辺単語特定部514は、非特許文献3に記載された方法を用いて類似度S2を計算することもできる。この場合、周辺単語特定部514は、注目単語WA1と周辺単語WB1との組み合わせと、注目単語WA2とワードクラウド情報521に含まれる他の単語との組み合わせとを用いて、所定の文Xを生成する。そして、周辺単語特定部514は、学習済みの機械学習モデルである言語モデルを用いて、文Xの評価値E(X)を計算することで、評価値E(X)を取得し、評価値E(X)を類似度S2として用いる。
【0060】
言語モデルを生成する機械学習では、例えば、あらかじめ用意された複数の文と各文に対する評価値とが、訓練データとして用いられる。
【0061】
図10は、単語の組み合わせの例を示している。C1は、注目単語WA1と周辺単語WB1との組み合わせを表す。「Japan」は、注目単語WA1に対応し、「Tokyo」は、周辺単語WB1に対応する。
【0062】
C2は、注目単語WA2と他の単語との組み合わせを表す。「China」は、注目単語WA2に対応し、「Beijing」、「Paris」、「apple」、及び「go」は、ワードクラウド情報521に含まれる他の単語に対応する。
【0063】
周辺単語特定部514は、C1及びC2を次のようなテンプレートに埋め込んで、文Xを生成する。
【0064】
___ is to ___ as ___ is to ___
【0065】
これにより、次のような文X1~文X4が生成される。
【0066】
X1:
Japan is to Tokyo as China is to Beijing
X2:
Japan is to Tokyo as China is to Paris
X3:
Japan is to Tokyo as China is to apple
X4:
Japan is to Tokyo as China is to go
【0067】
周辺単語特定部514は、言語モデルを用いて文Xi(i=1~4)の評価値E(Xi)を計算する。これにより、次のような評価値E(X1)~評価値E(X4)が得られる。
【0068】
E(X1)=0.9
E(X2)=0.8
E(X3)=0.2
E(X4)=0.1
【0069】
言語モデルを用いて文Xiの評価値E(Xi)を計算することで、高い精度で類似度S2を求めることができる。
【0070】
次に、変更指示522に基づく単語配置制御処理の具体例を説明する。ワードクラウド情報521に含まれる単語としては、「FFF」、「CCC」、「PC」、「速い」、及び「大きい」が用いられる。変更指示522に含まれる注目単語WA1は「FFF」であり、周辺単語WB1は「速い」である。
【0071】
図11は、ワードクラウド情報521に含まれる単語の単語ベクトルの例を示している。単語ベクトル1101は「FFF」の単語ベクトルである。単語ベクトル1102は「CCC」の単語ベクトルである。単語ベクトル1103は「PC」の単語ベクトルである。単語ベクトル1104は「速い」の単語ベクトルである。単語ベクトル1105は「大きい」の単語ベクトルである。
【0072】
この例では、単語ベクトル1101~単語ベクトル1105が2次元ベクトルとして示されているが、単語ベクトル1101~単語ベクトル1105は、N次元ベクトル(Nは3以上の整数)であってもよい。
【0073】
注目単語特定部513は、「FFF」と他の単語との類似度S1として、単語ベクトル1101と他の単語の単語ベクトルとが成す角度の余弦を計算する。例えば、「FFF」と「CCC」との類似度S1としては、単語ベクトル1101と単語ベクトル1102とが成す角度αの余弦であるcos(α)が用いられる。「FFF」と「大きい」との類似度S1としては、単語ベクトル1101と単語ベクトル1105とが成す角度βの余弦であるcos(β)が用いられる。
【0074】
この例では、「CCC」、「PC」、「速い」、及び「大きい」について、次のような類似度S1が計算される。
【0075】
CCC S1=0.98
PC S1=0.91
速い S1=0.2
大きい S1=0.1
【0076】
注目単語特定部513は、「CCC」、「PC」、「速い」、及び「大きい」の中から、類似度S1が大きい順に、以下の条件を満たす単語を注目単語WA2として選択する。
【0077】
条件Q1 類似度S1が閾値TH1よりも大きい。
条件Q2 注目単語の個数が上限値LA以下である。
【0078】
閾値TH1としては0.9が用いられ、上限値LAとしては2が用いられる。この場合、「CCC」の類似度S1が最大であり、かつ、閾値TH1よりも大きいため、最初に「CCC」が注目単語WA2として選択される。これにより、注目単語は「FFF」及び「CCC」となるため、注目単語の個数は2個となる。
【0079】
「PC」の類似度S1は2番目に大きく、かつ、閾値TH1よりも大きい。しかし、「PC」を注目単語WA2として選択すると、注目単語の個数が3個となり、上限値LAを超えるため、「PC」は選択されない。「速い」及び「大きい」の類似度S1は閾値TH1よりも小さいため、「速い」及び「大きい」は選択されない。
【0080】
図12は、単語間の関係を表す差分ベクトルの例を示している。差分ベクトル1201は、「FFF」の単語ベクトル1101と「速い」の単語ベクトル1104との関係R1を表す差分ベクトルである。差分ベクトル1202は、「CCC」の単語ベクトル1102と「大きい」の単語ベクトル1105との関係R2を表す差分ベクトルである。
【0081】
周辺単語特定部514は、関係R2として、「CCC」の単語ベクトル1102と、「FFF」及び「CCC」以外の単語の単語ベクトルとの関係を用いる。そして、周辺単語特定部514は、関係R1と関係R2との類似度S2として、差分ベクトル1201と関係R2を表す差分ベクトルとが成す角度の余弦を計算する。
【0082】
例えば、関係R2として、「CCC」の単語ベクトル1102と「大きい」の単語ベクトル1105との関係が用いられる場合、類似度S2としては、差分ベクトル1201と差分ベクトル1202とが成す角度γの余弦であるcos(γ)が用いられる。
【0083】
この例では、「PC」、「速い」、及び「大きい」について、次のような類似度S2が計算される。
【0084】
大きい S2=0.83
速い S2=0.81
PC S2=0.2
【0085】
周辺単語特定部514は、「PC」、「速い」、及び「大きい」の中から、類似度S2が大きい順に、以下の条件を満たす単語を周辺単語WB2として選択する。
【0086】
条件Q3 類似度S2が閾値TH2よりも大きい。
条件Q4 各注目単語WA2に対する周辺単語WB2の個数が上限値LB以下である。
【0087】
閾値TH2としては0.7が用いられ、上限値LBとしては1が用いられる。この場合、「大きい」の類似度S2が最大であり、かつ、閾値TH2よりも大きいため、最初に「大きい」が周辺単語WB2として選択される。
【0088】
「速い」の類似度S2は2番目に大きく、かつ、閾値TH2よりも大きい。しかし、「速い」を周辺単語WB2として選択すると、「CCC」に対する周辺単語WB2の個数が2個となり、上限値LBを超えるため、「速い」は選択されない。「PC」の類似度S2は閾値TH2よりも小さいため、「PC」は選択されない。
【0089】
周辺単語特定部514は、「CCC」に対する周辺単語と同様にして、「FFF」に対する周辺単語を選択することもできる。この場合も、LB個以下の周辺単語が選択される。
【0090】
図13は、注目単語の配置の例を示している。表示制御部511は、注目単語である「FFF」及び「CCC」が表示領域1301内にまばらに配置されるように、「FFF」及び「CCC」の位置情報を変更する。これにより、「FFF」及び「CCC」が、適切な距離だけ離れた位置に配置される。
【0091】
図14は、周辺単語の配置の例を示している。表示制御部511は、「FFF」に対する周辺単語である「速い」が「FFF」の近くに配置されるように、「速い」の位置情報を変更する。さらに、表示制御部511は、「CCC」に対する周辺単語である「大きい」が「CCC」の近くに配置されるように、「大きい」の位置情報を変更する。
【0092】
このように、ユーザが「FFF」の位置と「速い」の位置との関係を指定するだけで、「FFF」と類似する「CCC」が自動的に抽出され、「FFF」及び「CCC」が適切な位置に配置される。さらに、「FFF」の特徴と「速い」の特徴との関係と類似する関係を、「CCC」との間で有する「大きい」が自動的に抽出され、「速い」及び「大きい」が適切な位置に配置される。
【0093】
変更指示522は、周辺単語WB1を注目単語WA1に近づける指示に限られず、別の変更を表す指示であってもよい。例えば、変更指示522は、周辺単語WB1を注目単語WA1の左側又は右側に移動させる指示であってもよく、周辺単語WB1を注目単語WA1から遠ざける指示であってもよい。
【0094】
図15は、図5の制御装置501が行う単語配置制御処理の例を示すフローチャートである。まず、表示装置515は、ワードクラウド情報521を用いて、画面上の表示領域内にワードクラウドを表示する(ステップ1501)。
【0095】
次に、ユーザは、制御装置501に変更指示522を入力し、受付部512は、入力された変更指示522を受け付ける(ステップ1502)。
【0096】
次に、注目単語特定部513は、変更指示522に含まれる注目単語WA1の特徴と、ワードクラウド情報521に含まれる他の単語の特徴との類似度S1を計算する(ステップ1503)。そして、注目単語特定部513は、類似度S1に基づいて、注目単語WA1と類似する注目単語WA2を特定する(ステップ1504)。
【0097】
次に、周辺単語特定部514は、単語間の関係R1と単語間の関係R2との類似度S2を計算する(ステップ1505)。そして、周辺単語特定部514は、類似度S2に基づいて、ワードクラウド情報521に含まれる単語のうち注目単語WA2以外の単語の中から、周辺単語WB2を特定する(ステップ1506)。
【0098】
次に、表示制御部511は、注目単語WA2の位置と周辺単語WB2の位置とが所定の関係になるように、注目単語WA2及び周辺単語WB2の位置を決定する(ステップ1507)。そして、表示制御部511は、ワードクラウド情報521に含まれる注目単語WA2及び周辺単語WB2の位置情報を変更する。表示制御部511は、必要に応じて、注目単語WA1及び周辺単語WB1の位置情報も変更する。
【0099】
次に、表示制御部511は、ワードクラウドの表示を表示装置515に指示し、表示装置515は、変更後のワードクラウド情報521を用いて、表示領域内にワードクラウドを表示する(ステップ1508)。
【0100】
図16は、複数の注目単語に共通する周辺単語の例を示している。上述した単語配置制御処理の具体例において、「FFF」と類似する注目単語WA2として「CCC」が選択され、かつ、「CCC」に対する周辺単語WB2として「大きい」及び「速い」が選択された場合を想定する。「速い」は、「FFF」及び「CCC」に共通する周辺単語である。
【0101】
この場合、表示制御部511は、表示領域1301内に2つの「速い」を配置する。一方の「速い」は「FFF」の近くに配置され、他方の「速い」は「CCC」の近くに配置される。
【0102】
文字列のサイズを決定する際には、2つの「速い」が区別して扱われる。例えば、「FFF」の近くに配置された「速い」は、「速い-FMV」という単語として扱われる。
【0103】
図17は、注目単語と周辺単語とを区別しない場合に選択される単語の例を示している。注目単語と周辺単語とを区別しないですべての単語を同等に扱う場合、不要な関係の影響がノイズになる可能性がある。
【0104】
図17の例では、商品レビューのテキストデータからPCブランドの評価を概観する目的でワードクラウドが生成された場合を想定している。ユーザは、「FFF」、「速い」、及び「薄い」を選択して、「速い」及び「薄い」を「FFF」に近づける変更指示522を入力する。この場合、以下の条件を満たす単語Wとして、「濃い」が選択される可能性が高くなる。
【0105】
条件Z1 Wの特徴と「遅い」の特徴との関係が、「薄い」の特徴と「速い」の特徴との関係と類似している。
条件Z2 Wの特徴と「CCC」の特徴との関係が、「薄い」の特徴と「FFF」の特徴との関係と類似している。
【0106】
しかし、ユーザの変更指示522は、「薄い」を「速い」に近づけることを意図していないため、「薄い」の特徴と「速い」の特徴との関係は不要な関係である。同様に、Wの特徴と「遅い」の特徴との関係も不要な関係である。
【0107】
図18は、注目単語と周辺単語とを区別した場合に選択される単語の例を示している。この例では、ユーザは、「FFF」を注目単語WA1として選択し、「速い」及び「薄い」を周辺単語WB1として選択して、「速い」及び「薄い」を「FFF」に近づける変更指示522を入力する。この場合、条件Z2のみが用いられ、「厚い」が単語Wとして選択される可能性が高くなる。
【0108】
このように、注目単語と周辺単語とを区別することで、不要な関係の影響を排除して、ユーザの意図に沿った適切な単語を選択することができる。
【0109】
なお、変更指示522に含まれる周辺単語が1つのみである場合は、必ずしも注目単語と周辺単語とを区別する必要はない。ただし、実際には、何れの単語を注目単語に指定するかに応じて、変更後のワードクラウドが変化することがあるため、両者を区別した方が、より適切なワードクラウドが生成される可能性が高い。
【0110】
図3の制御装置301及び図5の制御装置501の構成は一例に過ぎず、制御装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、図5の表示装置515は、制御装置501の外部のユーザ端末装置内に設けられていてもよい。
【0111】
図4及び図15のフローチャートは一例に過ぎず、制御装置の構成又は条件に応じて、一部の処理を省略又は変更してもよい。
【0112】
図1図2図6図9図13図14、及び図16図18に示したワードクラウドは一例に過ぎず、ワードクラウドは、ワードクラウド情報521に含まれる単語に応じて変化する。図10に示した単語の組み合わせは一例に過ぎず、単語の組み合わせは、ワードクラウド情報521に含まれる単語に応じて変化する。図11に示した単語ベクトルと図12に示した差分ベクトルは一例に過ぎず、単語ベクトル及び差分ベクトルは、ワードクラウド情報521に含まれる単語に応じて変化する。
【0113】
式(1)及び式(2)は一例に過ぎず、周辺単語特定部514は、別の計算式を用いて関係R1及び関係R2を表すベクトルを計算してもよい。
【0114】
図19は、図3の制御装置301及び図5の制御装置501として用いられる情報処理装置(コンピュータ)のハードウェア構成例を示している。図19の情報処理装置は、CPU(Central Processing Unit)1901、メモリ1902、入力装置1903、出力装置1904、補助記憶装置1905、媒体駆動装置1906、及びネットワーク接続装置1907を含む。これらの構成要素はハードウェアであり、バス1908により互いに接続されている。
【0115】
メモリ1902は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)等の半導体メモリであり、処理に用いられるプログラム及びデータを記憶する。メモリ1902は、図5の記憶部516として動作してもよい。
【0116】
CPU1901(プロセッサ)は、例えば、メモリ1902を利用してプログラムを実行することにより、図3の受付部311及び制御部312として動作する。CPU1901は、メモリ1902を利用してプログラムを実行することにより、図5の表示制御部511、受付部512、注目単語特定部513、及び周辺単語特定部514としても動作する。
【0117】
入力装置1903は、例えば、キーボード、ポインティングデバイス等であり、ユーザからの指示又は情報の入力に用いられる。出力装置1904は、例えば、表示装置、プリンタ等であり、ユーザへの問い合わせ又は指示、及び処理結果の出力に用いられる。出力装置1904は、図5の表示装置515として動作してもよく、処理結果は、ワードクラウドであってもよい。
【0118】
補助記憶装置1905は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置1905は、ハードディスクドライブ又はSSD(Solid State Drive)であってもよい。情報処理装置は、補助記憶装置1905にプログラム及びデータを格納しておき、それらをメモリ1902にロードして使用することができる。補助記憶装置1905は、図5の記憶部516として動作してもよい。
【0119】
媒体駆動装置1906は、可搬型記録媒体1909を駆動し、その記録内容にアクセスする。可搬型記録媒体1909は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体1909は、CD-ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等であってもよい。ユーザは、可搬型記録媒体1909にプログラム及びデータを格納しておき、それらをメモリ1902にロードして使用することができる。
【0120】
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1902、補助記憶装置1905、又は可搬型記録媒体1909のような、物理的な(非一時的な)記録媒体である。
【0121】
ネットワーク接続装置1907は、WAN(Wide Area Network)、LAN(Local Area Network)等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェース回路である。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置1907を介して受信し、それらをメモリ1902にロードして使用することができる。
【0122】
図5の表示装置515が制御装置501の外部のユーザ端末装置内に設けられている場合、CPU1901は、ネットワーク接続装置1907を介して、ユーザ端末装置から変更指示522を受信する。そして、CPU1901は、ネットワーク接続装置1907を介して、ワードクラウドの表示を指示する制御情報をユーザ端末装置へ送信する。
【0123】
なお、情報処理装置が図19のすべての構成要素を含む必要はなく、情報処理装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、可搬型記録媒体1909又は通信ネットワークを使用しない場合は、媒体駆動装置1906又はネットワーク接続装置1907を省略することができる。
【0124】
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
【0125】
図1乃至図19を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と、前記複数の単語のうち前記表示装置により表示されている第2単語の位置との関係を指定する、指示を受け付け、
単語間の第1関係と単語間の第2関係との類似度に基づいて、前記複数の単語のうち第3単語の位置と前記複数の単語のうち第4単語の位置との関係が、前記指示に指定される前記第1単語の位置と前記第2単語の位置との関係に応じた所定の関係になるように、前記第3単語と前記第4単語とを前記表示装置に表示させる、
処理をコンピュータに実行させ、
前記第3単語は、前記第1単語の特徴と前記複数の単語のうち前記第1単語以外の単語の特徴との類似度に基づいて、前記第1単語以外の前記複数の単語の中から特定され、
前記単語間の第1関係は、前記第1単語の特徴と前記第2単語の特徴との関係であり、
前記単語間の第2関係は、前記第3単語の特徴と前記第4単語の特徴との関係であることを特徴とする制御プログラム。
(付記2)
前記第1単語の特徴は、前記第1単語を表す第1ベクトルであり、
前記第2単語の特徴は、前記第2単語を表す第2ベクトルであり、
前記第3単語の特徴は、前記第3単語を表す第3ベクトルであり、
前記第1単語以外の単語の特徴は、前記第1単語以外の単語を表す第4ベクトルであり、
前記第4単語の特徴は、前記第4単語を表す第5ベクトルであり、
前記制御プログラムは、
前記第1ベクトルと前記第2ベクトルとを用いて所定の演算を行うことで、前記単語間の第1関係を表す第6ベクトルを求め、
前記第3ベクトルと前記第5ベクトルとを用いて前記所定の演算を行うことで、前記単語間の第2関係を表す第7ベクトルを求める、
処理を前記コンピュータにさらに実行させることを特徴とする付記1記載の制御プログラム。
(付記3)
前記制御プログラムは、
言語モデルを用いて、前記第1単語と前記第2単語との組み合わせと、前記第3単語と前記第4単語との組み合わせとを用いて生成された所定の文の評価値を取得する、
処理を前記コンピュータにさらに実行させ、
前記所定の文の評価値は、前記単語間の第1関係と前記単語間の第2関係との類似度として用いられることを特徴とする付記1記載の制御プログラム。
(付記4)
前記制御プログラムは、
前記第2関係を含み、それぞれが前記第3単語の特徴と前記複数の単語のうち前記第3単語以外の単語の特徴との複数の第3関係に基づいて、前記第3単語以外の単語の中から前記第4単語を特定する、
処理を前記コンピュータに実行させることを特徴とする付記1記載の制御プログラム。
(付記5)
前記指示は、前記第1単語の位置と前記第2単語の位置との距離が減少するように、前記第1単語の位置と前記第2単語の位置との関係を変更する指示であり、
前記第3単語と前記第4単語とを前記表示装置に表示させる処理は、前記単語間の第1関係と前記単語間の第2関係との類似度が閾値よりも大きい場合、前記第3単語の位置から所定距離の範囲内に前記第4単語が配置されるように、前記第3単語と前記第4単語とを前記表示装置に表示させる処理を含むことを特徴とする付記1乃至4の何れか1項に記載の制御プログラム。
(付記6)
単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と、前記複数の単語のうち前記表示装置により表示されている第2単語の位置との関係を指定する、指示を受け付ける受付部と、
単語間の第1関係と単語間の第2関係との類似度に基づいて、前記複数の単語のうち第3単語の位置と前記複数の単語のうち第4単語の位置との関係が、前記指示に指定される前記第1単語の位置と前記第2単語の位置との関係に応じた所定の関係になるように、前記第3単語と前記第4単語とを前記表示装置に表示させる制御部と、
を備え、
前記第3単語は、前記第1単語の特徴と前記複数の単語のうち前記第1単語以外の単語の特徴との類似度に基づいて、前記第1単語以外の前記複数の単語の中から特定され、
前記単語間の第1関係は、前記第1単語の特徴と前記第2単語の特徴との関係であり、
前記単語間の第2関係は、前記第3単語の特徴と前記第4単語の特徴との関係であることを特徴とする制御装置。
(付記7)
前記第1単語の特徴は、前記第1単語を表す第1ベクトルであり、
前記第2単語の特徴は、前記第2単語を表す第2ベクトルであり、
前記第3単語の特徴は、前記第3単語を表す第3ベクトルであり、
前記第1単語以外の単語の特徴は、前記第1単語以外の単語を表す第4ベクトルであり、
前記第4単語の特徴は、前記第4単語を表す第5ベクトルであり、
前記制御部は、前記第1ベクトルと前記第2ベクトルとを用いて所定の演算を行うことで、前記単語間の第1関係を表す第6ベクトルを求め、前記第3ベクトルと前記第5ベクトルとを用いて前記所定の演算を行うことで、前記単語間の第2関係を表す第7ベクトルを求めることを特徴とする付記6記載の制御装置。
(付記8)
前記制御部は、言語モデルを用いて、前記第1単語と前記第2単語との組み合わせと、前記第3単語と前記第4単語との組み合わせとを用いて生成された所定の文の評価値を取得し、前記所定の文の評価値を、前記単語間の第1関係と前記単語間の第2関係との類似度として用いることを特徴とする付記6記載の制御装置。
(付記9)
前記制御部は、前記第2関係を含み、それぞれが前記第3単語の特徴と前記複数の単語のうち前記第3単語以外の単語の特徴との複数の第3関係に基づいて、前記第3単語以外の単語の中から前記第4単語を特定することを特徴とする付記6記載の制御装置。
(付記10)
前記指示は、前記第1単語の位置と前記第2単語の位置との距離が減少するように、前記第1単語の位置と前記第2単語の位置との関係を変更する指示であり、
前記制御部は、前記単語間の第1関係と前記単語間の第2関係との類似度が閾値よりも大きい場合、前記第3単語の位置から所定距離の範囲内に前記第4単語が配置されるように、前記第3単語と前記第4単語とを前記表示装置に表示させることを特徴とする付記6乃至9の何れか1項に記載の制御装置。
(付記11)
単語集合に含まれる複数の単語のうち表示装置により表示されている第1単語の位置と、前記複数の単語のうち前記表示装置により表示されている第2単語の位置との関係を指定する、指示を受け付け、
単語間の第1関係と単語間の第2関係との類似度に基づいて、前記複数の単語のうち第3単語の位置と前記複数の単語のうち第4単語の位置との関係が、前記指示に指定される前記第1単語の位置と前記第2単語の位置との関係に応じた所定の関係になるように、前記第3単語と前記第4単語とを前記表示装置に表示させる、
処理をコンピュータが実行し、
前記第3単語は、前記第1単語の特徴と前記複数の単語のうち前記第1単語以外の単語の特徴との類似度に基づいて、前記第1単語以外の前記複数の単語の中から特定され、
前記単語間の第1関係は、前記第1単語の特徴と前記第2単語の特徴との関係であり、
前記単語間の第2関係は、前記第3単語の特徴と前記第4単語の特徴との関係であることを特徴とする制御方法。
(付記12)
前記第1単語の特徴は、前記第1単語を表す第1ベクトルであり、
前記第2単語の特徴は、前記第2単語を表す第2ベクトルであり、
前記第3単語の特徴は、前記第3単語を表す第3ベクトルであり、
前記第1単語以外の単語の特徴は、前記第1単語以外の単語を表す第4ベクトルであり、
前記第4単語の特徴は、前記第4単語を表す第5ベクトルであり、
前記第1ベクトルと前記第2ベクトルとを用いて所定の演算を行うことで、前記単語間の第1関係を表す第6ベクトルを求め、
前記第3ベクトルと前記第5ベクトルとを用いて前記所定の演算を行うことで、前記単語間の第2関係を表す第7ベクトルを求める、
処理を前記コンピュータがさらに実行することを特徴とする付記11記載の制御方法。
(付記13)
言語モデルを用いて、前記第1単語と前記第2単語との組み合わせと、前記第3単語と前記第4単語との組み合わせとを用いて生成された所定の文の評価値を取得する、
処理を前記コンピュータがさらに実行し、
前記所定の文の評価値は、前記単語間の第1関係と前記単語間の第2関係との類似度として用いられることを特徴とする付記11記載の制御方法。
(付記14)
前記第2関係を含み、それぞれが前記第3単語の特徴と前記複数の単語のうち前記第3単語以外の単語の特徴との複数の第3関係に基づいて、前記第3単語以外の単語の中から前記第4単語を特定する、
処理を前記コンピュータが実行することを特徴とする付記11記載の制御方法。
(付記15)
前記指示は、前記第1単語の位置と前記第2単語の位置との距離が減少するように、前記第1単語の位置と前記第2単語の位置との関係を変更する指示であり、
前記第3単語と前記第4単語とを前記表示装置に表示させる処理は、前記単語間の第1関係と前記単語間の第2関係との類似度が閾値よりも大きい場合、前記第3単語の位置から所定距離の範囲内に前記第4単語が配置されるように、前記第3単語と前記第4単語とを前記表示装置に表示させる処理を含むことを特徴とする付記11乃至14の何れか1項に記載の制御方法。
【符号の説明】
【0126】
201、202 ワードクラウド
301、501 制御装置
311、512 受付部
312 制御部
511 表示制御部
513 注目単語特定部
514 周辺単語特定部
515 表示装置
516 記憶部
521 ワードクラウド情報
522 変更指示
601、1301 表示領域
1101~1105 単語ベクトル
1201、1202 差分ベクトル
1901 CPU
1902 メモリ
1903 入力装置
1904 出力装置
1905 補助記憶装置
1906 媒体駆動装置
1907 ネットワーク接続装置
1908 バス
1909 可搬型記録媒体
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19