IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-137499統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置
<>
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図1
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図2
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図3
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図4
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図5
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図6
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図7
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図8
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図9
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図10
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図11
  • 特開-統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024137499
(43)【公開日】2024-10-07
(54)【発明の名称】統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置
(51)【国際特許分類】
   G06F 40/30 20200101AFI20240927BHJP
【FI】
G06F40/30
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2023049034
(22)【出願日】2023-03-24
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人新エネルギー・産業技術総合開発機構、「戦略的イノベーション創造プログラム(SIP)第2期/ビッグデータ・AIを活用したサイバー空間基盤技術/分野間データ連携基盤技術/分野・組織を超えたデータ活用とサービス提供を実現する基盤の研究」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】森脇 康貴
(72)【発明者】
【氏名】野間 唯
(57)【要約】
【課題】統制語彙の作成時における作業者の負担を軽減する。
【解決手段】実施形態の統制語彙作成支援プログラムは、表示する処理と、推定する処理と、配置する処理とをコンピュータに実行させる。表示する処理は、複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて複数の用語を移動可能に表示する。推定する処理は、画面上において動かされた用語と、用語の近傍にある1または複数の用語とに基づいて、画面上の複数の用語の中から動かされた用語と意味的関係性がある用語を推定する。配置する処理は、推定した意味的関係性がある用語を動かされた用語の周囲に配置する。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて前記複数の用語を移動可能に表示し、
前記画面上において動かされた用語と、当該用語の近傍にある1または複数の用語とに基づいて、前記画面上の複数の用語の中から前記動かされた用語と意味的関係性がある用語を推定し、
推定した前記意味的関係性がある用語を前記動かされた用語の周囲に配置する、
処理をコンピュータに実行させることを特徴とする統制語彙作成支援プログラム。
【請求項2】
前記推定する処理は、前記画面上の複数の用語を組み合わせた用語ペアそれぞれの特徴空間上の特徴点を求め、前記動かされた用語と、前記近傍にある1または複数の用語の用語ペアの特徴点の分布に基づき、当該分布に近い特徴点の中から前記動かされた用語を含む用語ペアの特徴点を抽出し、抽出した特徴点に対応する用語ペアにおいて前記動かされた用語と組み合わされた用語を前記意味的関係性がある用語と推定する、
ことを特徴とする請求項1に記載の統制語彙作成支援プログラム。
【請求項3】
前記配置する処理は、前記動かされた用語と、推定した前記意味的関係性がある用語とを直線で結ぶ場合において当該直線に他の用語がかからない位置に、推定した前記意味的関係性がある用語を配置する、
ことを特徴とする請求項1に記載の統制語彙作成支援プログラム。
【請求項4】
前記配置する処理は、推定した前記意味的関係性がある用語を、前記動かされた用語に対応してポップアップ表示する、
ことを特徴とする請求項1に記載の統制語彙作成支援プログラム。
【請求項5】
複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて前記複数の用語を移動可能に表示し、
前記画面上において動かされた用語と、当該用語の近傍にある1または複数の用語とに基づいて、前記画面上の複数の用語の中から前記動かされた用語と意味的関係性がある用語を推定し、
推定した前記意味的関係性がある用語を前記動かされた用語の周囲に配置する、
処理をコンピュータが実行することを特徴とする統制語彙作成支援方法。
【請求項6】
複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて前記複数の用語を移動可能に表示し、
前記画面上において動かされた用語と、当該用語の近傍にある1または複数の用語とに基づいて、前記画面上の複数の用語の中から前記動かされた用語と意味的関係性がある用語を推定し、
推定した前記意味的関係性がある用語を前記動かされた用語の周囲に配置する、
処理を実行する制御部を含むことを特徴とする情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置に関する。
【背景技術】
【0002】
従来、自然言語処理において表記ゆれにより別データとして処理されて検索漏れ等が生じないよう、同義語(例えば「ごみ」と「廃棄物」、「子ども」と「子供」など)、上位語・下位語(例えば上位語の「学校」に対する下位語の「小学校」、「中学校」など)を定義した統制語彙の作成が行われている。
【0003】
このような統制語彙の作成を支援する従来技術としては、複数種類の類似度を要素とする素性ベクトルを用いて対象単語間の意味関係を判定するものや、ペアの言葉を選択し、お互いの言葉がどの程度近傍にあるかを加味したスコアを付けて同義語を判定するものがある。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2011-118526号公報
【特許文献2】米国特許第8762370号明細書
【特許文献3】特開2016-146221号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来技術では、統制語彙の作成を行う作業者が、ある用語に対して、多くの用語の中から同義語、上位語、下位語の対象とする用語を探す作業を行う必要があり、作業者の負担が大きいという問題がある。
【0006】
1つの側面では、統制語彙の作成時における作業者の負担を軽減できる統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
1実施形態では、統制語彙作成支援プログラムは、表示する処理と、推定する処理と、配置する処理とをコンピュータに実行させる。表示する処理は、複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて複数の用語を移動可能に表示する。推定する処理は、画面上において動かされた用語と、用語の近傍にある1または複数の用語とに基づいて、画面上の複数の用語の中から動かされた用語と意味的関係性がある用語を推定する。配置する処理は、推定した意味的関係性がある用語を動かされた用語の周囲に配置する。
【発明の効果】
【0008】
1実施態様によれば、統制語彙の作成時における作業者の負担を軽減できる。
【図面の簡単な説明】
【0009】
図1図1は、2次元可視化画面の一例を説明する説明図である。
図2図2は、2次元可視化画面の操作例を説明する説明図である。
図3図3は、実施形態の概要を説明する説明図である。
図4図4は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。
図5図5は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。
図6図6は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。
図7図7は、特徴量空間を説明する説明図である。
図8図8は、特徴量空間上の確率分布を説明する説明図である。
図9図9は、候補用語の抽出を説明する説明図である。
図10図10は、特徴量関数の値の計算結果の一例を説明する説明図である。
図11図11は、候補用語の表示例を説明する説明図である。
図12図12は、コンピュータ構成の一例を説明する説明図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、実施形態にかかる統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置を説明する。実施形態において同一の機能を有する構成には同一の符号を付し、重複する説明は省略する。なお、以下の実施形態で説明する統制語彙作成支援プログラム、統制語彙作成支援方法および情報処理装置は、一例を示すに過ぎず、実施形態を限定するものではない。また、以下の各実施形態は、矛盾しない範囲内で適宜組みあわせてもよい。
【0011】
実施形態にかかる情報処理装置における統制語彙の作成は、複数の用語を2次元上の任意の座標に配置(表示)して可視化した画面(2次元可視化画面)で行うものとする。図1は、2次元可視化画面の一例を説明する説明図である。
【0012】
図1に示すように、2次元可視化画面G1には、あらかじめ作業者(ユーザ)が用意した複数の用語Wが任意の座標に配置されている。この2次元可視化画面G1では、映る範囲の拡大・縮小を行うことで、多くの用語群を俯瞰するような表示、または、一部の用語群のみの表示などの切り替えが可能となっている。すなわち、2次元可視化画面G1の画面外にも複数の用語Wが存在するものとする。
【0013】
この2次元可視化画面G1において、ユーザは、マウスポインタやカーソル等の操作により、用語W間の意味的関係性(同義語、上位語、下位語等)、すなわち統制語彙の定義を行う用語W同士を近づける。ついで、ユーザは、用語W間に上位語、下位語を定義する上下関係線L1や同義語を定義する同義関係線L2を設定することで統制語彙の定義を行う。
【0014】
図2は、2次元可視化画面G1の操作例を説明する説明図である。図2に示すように、ケースC1の2次元可視化画面G1では、ユーザによるカーソルG10操作をもとに、用語Wを選択した状態で移動させて所望の位置で選択を解除するような操作(例えばドラックアンドドロップ)を行うことで、用語Wを移動することができる。
【0015】
また、ケースC2の2次元可視化画面G1では、ユーザによるカーソルG10の操作により、用語W同士(図示例では、「子供」と「子ども」)を意味的関係性を示す線種の直線(例えば上下関係線L1、同義関係線L2)等で結ぶことで、統制語彙の定義を設定できる。
【0016】
これにより、実施形態にかかる情報処理装置では、ケースC3の2次元可視化画面G1に示すように、用語Wの同義関係や上下関係をグラフ構造で表現できる。なお、実施形態にかかる情報処理装置では、ユーザによる拡大・縮小操作(例えばホイールマウスのスクロール)により、2次元可視化画面G1の映る範囲の拡大・縮小をおこなってもよい。
【0017】
ここで、ユーザは、統制語彙の定義を設定する前に、カーソルG10において、多数の用語Wの中から統制語彙の定義を行う用語Wを見つけた上で、その用語W同士を近づけておくという作業を行うこととなる。
【0018】
この作業負担を軽減するため、実施形態にかかる情報処理装置は、2次元可視化画面G1上においてユーザによるカーソルG10の操作で動かされた用語と、この用語の近傍にある1または複数の用語とに基づいて、2次元可視化画面G1上の複数の用語Wの中から動かされた用語と意味的関係性がある用語を推定する。ついで、実施形態にかかる情報処理装置は、推定した意味的関係性がある用語を動かされた用語の周囲に配置する。
【0019】
図3は、実施形態の概要を説明する説明図である。図3に示すように、ユーザは、2次元可視化画面G1上の「学校」という用語W1に対して、意味的関係性がある他の用語の関連付けを行うものとする(S1)。
【0020】
ここで、ユーザは、2次元可視化画面G1に表示された用語の中から、「学校」という用語W1に対して意味的関係性(例えば「学校」を上位語とした場合の下位語)がある「小学校」という用語W2を見つけ、用語W1の近傍に移動させる(S2)。
【0021】
実施形態にかかる情報処理装置は、このように動かされた用語W2と、この用語の近傍にある用語W1の情報に基づく、用語同士の類似性を表す特徴量関数の値をもとに、複数の用語W(2次元可視化画面G1外にある用語Wも含む)の中から意味的関係性がある候補用語W11~W16を推定する。ついで、実施形態にかかる情報処理装置は、推定した意味的関係性がある候補用語W11~W16を動かされた用語W2の周囲に配置する(S3)。
【0022】
このように、意味的関係性がある候補用語W11~W16が用語W2の周囲に配置されることから、ユーザは、用語W2に対して統制語彙の定義の対象となる候補用語W11~W16を用語W2に近づけておく作業を行う必要がない。すなわち、実施形態にかかる情報処理装置は、統制語彙の作成時における作業者の負担を軽減することができる。
【0023】
図4は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。図4に示すように、情報処理装置1は、通信部10と、入力部20と、表示部30と、記憶部40と、制御部50とを有する。
【0024】
通信部10は、ネットワークを介して外部装置から各種のデータを受信する。通信部10は、通信装置の一例である。たとえば、通信部10は、用語情報41などを外部装置から受信してもよい。
【0025】
入力部20は、情報処理装置1の制御部50に各種の情報を入力する入力装置である。入力部20は、キーボードやマウス、タッチパネル等に対応する。例えば、入力部20は、2次元可視化画面G1におけるカーソルG10の操作等をユーザより受け付ける。
【0026】
表示部30は、制御部50から出力される情報を表示する表示装置である。例えば、表示部30は、制御部50の制御のもと、2次元可視化画面G1の表示を行う。
【0027】
記憶部40は、用語情報41、演算情報42などのデータを格納する。記憶部40は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)などの半導体メモリ素子や、HDD(Hard Disk Drive)などの記憶装置に対応する。
【0028】
用語情報41は、複数の用語Wに関する情報である。例えば、用語情報41は、複数の用語Wそれぞれの文字コード、2次元可視化画面G1上の表記(読み方など)、定義された統制語彙(同義語、上位語、下位語など)である。
【0029】
演算情報42は、統制語彙を作成する処理における演算結果などを示す情報である。具体的には、演算情報42には、複数の用語Wを組み合わせた用語ペアそれぞれの特徴量(特徴量関数の値)などが含まれる(詳細は後述)。
【0030】
制御部50は、可視化処理部51と、特徴量算出部52と、用語推定部53と、用語配置部54とを有する。制御部50は、例えばCPU(Central Processing Unit)やGPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジック等によって実現される。
【0031】
可視化処理部51は、2次元可視化画面G1の表示にかかる処理部である。具体的には、可視化処理部51は、用語情報41に含まれる用語Wを読み出し、2次元に可視化した2次元可視化画面G1上に読み出した用語Wを表示する。ここで、可視化処理部51は、入力部20を介したユーザの指示(例えばドラックアンドドロップ)に基づいて用語Wを移動可能に表示する。
【0032】
特徴量算出部52は、複数の用語Wを組み合わせた用語ペアについて、用語情報41をもとに特徴量関数の値を計算する処理部である。特徴量算出部52が計算する特徴量関数は、用語ペアに関する特徴量を示すものであればいずれであってもよく、例えば、各用語Wのベクトル表現を計算した上で、用語ペアのベクトル同士のコサイン類似度を求めたものであってもよい。また、特徴量関数は、用語ペアの編集距離(レーベンシュタイン距離)であってもよい。
【0033】
用語推定部53は、2次元可視化画面G1上において動かされた用語W2と、この用語W2の近傍にある1または複数の用語W1とに基づいて、2次元可視化画面G1上の複数の用語Wの中から動かされた用語W2と意味的関係性がある候補用語W11~W16を推定する処理部である。
【0034】
用語配置部54は、用語推定部53が推定した用語W2と意味的関係性がある候補用語W11~W16を、用語W2の周囲に配置する処理部である。
【0035】
図5は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。図5に示すように、処理が開始されると、可視化処理部51は、用語情報41に含まれる用語Wを読み出して2次元可視化画面G1を表示し、2次元可視化画面G1上での用語Wの移動をユーザより受け付ける(S10)。
【0036】
ついで、用語推定部53は、2次元可視化画面G1上において動かされた用語W2と、この用語W2の近傍にあるm個の用語W1の用語情報41に基づき候補用語W11~W16を推定する(S11)。なお、mについては、0<m<(全用語数)を満たす整数とする。
【0037】
図6は、実施形態にかかる情報処理装置の動作例を示すフローチャートであり、より具体的には、S11の処理の詳細を示すフローチャートである。
【0038】
図6に示すように、処理が開始されると、特徴量算出部52は、複数の用語Wを組み合わせた全用語ペアについて、特徴量を計算済であるか否かを判定する(S20)。特徴量算出部52は、全用語ペアの特徴量が演算情報42にあり、計算済である場合(S20:Yes)、S21の処理をスキップする。
【0039】
全用語ペアの特徴量が演算情報42になく、計算済でない場合(S20:No)、特徴量算出部52は、全用語ペア(用語i,用語j)について、特徴量関数1、2、…Nの値をそれぞれ計算する(S21)。
【0040】
ここで、i,jは、用語のインデックスであり、0≦i,j<全用語数を満たす整数である。また、Nは、特徴量関数の種類(コサイン類似度、編集距離…)を示し、0<Nを満たす整数である。
【0041】
特徴量算出部52は、全用語ペア(用語i,用語j)の特徴量関数1、2、…Nの値の計算結果を演算情報42として記憶部40に保存する。
【0042】
図7は、特徴量空間を説明する説明図である。図7では、特徴量関数Aの値を横軸、特徴量関数Bの値を縦軸とした2次元の特徴量空間を例示している。図7に示すように、全用語ペアそれぞれの特徴は、特徴量空間上の特徴点P1として表現できる。
【0043】
ついで、用語推定部53は、動かされた用語W2と、その周辺m近傍点(用語W1)の用語情報41を用いて、特徴量空間上の確率分布を推定する(S22)。
【0044】
図8は、特徴量空間上の確率分布を説明する説明図である。図8に示すように、用語推定部53は、動かされた用語W2と、近傍にある1または複数(m:0<m<(全用語数))の用語の用語ペアの特徴点P10の確率分布R1、R2、R3を計算する。なお、確率分布R1、R2、R3は、R1>R2>R3の順に分布確率が高いことを示している。ここで、特徴点P20は、動かされた用語W2を含む用語ペアの特徴点であるが、動かされた用語W2と組み合わされた用語が用語W2の近傍にない用語ペアの特徴点とする。
【0045】
この確率分布R1、R2、R3の計算方法は、パラメトリックに推定する計算方法(最尤推定など)、ノンパラメトリックに推定する計算方法(カーネル推定など)、セミパラメトリックに推定する計算方法(EMアルゴリズムなど)のいずれであってもよい。
【0046】
ついで、用語推定部53は、推定された確率分布R1、R2、R3について、動かされた用語W2を含む特徴点P20のうち、確率分布の値が大きい上位nまでの用語ペアの特徴点を抽出する。ついで、用語推定部53は、抽出した特徴点に対応する用語ペアにおける相方の用語(動かされた用語W2と組み合わされた用語)を順に候補用語として抽出する(S23)。
【0047】
図9は、候補用語の抽出を説明する説明図である。図9に示すように、用語推定部53は、特徴点P20の中から確率分布R1、R2、R3の値が大きい上位3つの特徴点P20a、P20b、P20cを抽出する。そして、用語推定部53は、特徴点P20a、P20b、P20cそれぞれに対応する用語ペアの相方の用語を順に候補用語とする。
【0048】
図10は、特徴量関数の値の計算結果の一例を説明する説明図である。図10における(Example1)、(Example2)は、それぞれ実際に特徴量関数A、Bの値を計算した結果を特徴点P1としてプロットしたものである。ここで、特徴量関数Aは、用語ペアのベクトル同士のコサイン類似とする。特徴量関数Bは、用語ペアの編集距離とする。また、特徴点P10は、作業者が同義関係であるとした用語ペアの特徴点を示す。
【0049】
図10に示すように、特徴空間において、同義関係であるとした用語ペアの特徴点P10の分布は、まとまる傾向がある。したがって、確率分布の値が大きい上位nまでの用語ペアの特徴点を抽出することで、意味的関係性があると推定される用語を精度よく抽出できる。
【0050】
図5に戻り、S11についで、用語配置部54は、用語推定部53が推定した候補用語を2次元可視化画面G1上の用語W2の近くに表示(配置)し(S12)、処理を終了する。
【0051】
図11は,候補用語の表示例を説明する説明図である。図11に示すように、ユーザがカーソルG10を用いて「子ども」の用語W2を、「子ども」、「子」、「児童」、「男の子」の用語W1a~W1dの近くに移動させたものとする。また、用語推定部53は、「お子様」、「女の子」、「赤ちゃん」の順に候補用語W11、W12、W13を推定したものとする。
【0052】
ケースC11に示すように、用語配置部54は、「お子様」、「女の子」、「赤ちゃん」の候補用語W11、W12、W13を動かされた用語W2の周囲に配置する。具体的には、用語配置部54は、用語W2と、候補用語W11、W12、W13とを直線で結ぶ場合においてこの直線に他の用語(例えば用語W1a~W1d)がかからない位置に、候補用語W11、W12,W13を配置する。このように候補用語W11、W12、W13を配置することで、情報処理装置1では、上下関係線L1、同義関係線L2などで用語W2と候補用語W11、W12,W13とを直線で結ぶ場合において、他の用語が邪魔になることがない。
【0053】
また、ケースC12に示すように、用語配置部54は、候補用語W11、W12、W13の「お子様」、「女の子」、「赤ちゃん」を、用語W2に対してポップアップ表示G11してもよい。このポップアップ表示G11により、ユーザは、用語W2に対して意味的関係性があると推定される「お子様」、「女の子」、「赤ちゃん」を容易に確認することができる。
【0054】
以上のように、情報処理装置1は、複数の用語を2次元に可視化した2次元可視化画面G1上において、ユーザの指示に基づいて複数の用語を移動可能に表示する。情報処理装置1は、2次元可視化画面G1上において動かされた用語と、この用語の近傍にある1または複数の用語とに基づいて、2次元可視化画面G1上の複数の用語の中から動かされた用語と意味的関係性がある用語を推定する。情報処理装置1は、推定した意味的関係性がある用語を動かされた用語の周囲に配置する。
【0055】
これにより、情報処理装置1では、ユーザが意味的関係性がある用語同士を近づける作業を行うことで、動かされた用語に対して意味的関係性があると推定される用語が動かされた用語の周囲に配置されることから、意味的関係性がある多くの用語を見つけて近づける作業の負担を軽減できる。
【0056】
また、情報処理装置1は、2次元可視化画面G1上の複数の用語を組み合わせた用語ペアそれぞれの特徴空間上の特徴点P1を求める。情報処理装置1は、動かされた用語と、近傍にある1または複数の用語の用語ペアの特徴点P10の分布に基づき、分布に近い特徴点の中から動かされた用語を含む用語ペアの特徴点P20を抽出する。情報処理装置1は、抽出した特徴点P20に対応する用語ペアにおいて動かされた用語と組み合わされた用語を意味的関係性がある用語と推定する。これにより、情報処理装置1は、意味的関係性がある用語同士を近づける作業を行うことで、動かされた用語に対して意味的関係性がある用語としての特徴が近い用語を精度よく推定することができる。
【0057】
また、情報処理装置1は、動かされた用語と、推定した意味的関係性がある用語とを直線で結ぶ場合においてこの直線に他の用語がかからない位置に、推定した意味的関係性がある用語を配置する。これにより、情報処理装置1では、上下関係線L1、同義関係線L2などで用語同士を直線で結ぶ場合において、他の用語が邪魔になることがない。
【0058】
また、情報処理装置1は、推定した意味的関係性がある用語を、動かされた用語に対応してポップアップ表示する。これにより、ユーザは、動かされた用語に対して意味的関係性があると推定された用語を容易に確認することができる。
【0059】
なお、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0060】
また、情報処理装置1の制御部50で行われる可視化処理部51、特徴量算出部52、用語推定部53および用語配置部54の各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウエア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。また、情報処理装置1で行われる各種処理機能は、クラウドコンピューティングにより、複数のコンピュータが協働して実行してもよい。
【0061】
ところで、上記の実施形態で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の実施形態と同様の機能を有するプログラムを実行するコンピュータ構成(ハードウエア)の一例を説明する。図12は、コンピュータ構成の一例を説明する説明図である。
【0062】
図12に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、データ入力を受け付ける入力装置202と、モニタ203と、スピーカ204とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る媒体読取装置205と、各種装置と接続するためのインタフェース装置206と、有線または無線により外部機器と通信接続するための通信装置207とを有する。また、情報処理装置1は、各種情報を一時記憶するRAM208と、ハードディスク装置209とを有する。また、コンピュータ200内の各部(201~209)は、バス210に接続される。
【0063】
ハードディスク装置209には、上記の実施形態で説明した機能構成(例えば可視化処理部51、特徴量算出部52、用語推定部53および用語配置部54)における各種の処理を実行するためのプログラム211が記憶される。また、ハードディスク装置209には、プログラム211が参照する各種データ212が記憶される。入力装置202は、例えば、操作者から操作情報の入力を受け付ける。モニタ203は、例えば、操作者が操作する各種画面を表示する。インタフェース装置206は、例えば印刷装置等が接続される。通信装置207は、LAN(Local Area Network)等の通信ネットワークと接続され、通信ネットワークを介した外部機器との間で各種情報をやりとりする。
【0064】
CPU201は、ハードディスク装置209に記憶されたプログラム211を読み出して、RAM208に展開して実行することで、上記の機能構成(例えば可視化処理部51、特徴量算出部52、用語推定部53および用語配置部54)に関する各種の処理を行う。なお、プログラム211は、ハードディスク装置209に記憶されていなくてもよい。例えば、コンピュータ200が読み取り可能な記憶媒体に記憶されたプログラム211を読み出して実行するようにしてもよい。コンピュータ200が読み取り可能な記憶媒体は、例えば、CD-ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にこのプログラム211を記憶させておき、コンピュータ200がこれらからプログラム211を読み出して実行するようにしてもよい。
【0065】
以上の実施形態に関し、さらに以下の付記を開示する。
【0066】
(付記1)複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて前記複数の用語を移動可能に表示し、
前記画面上において動かされた用語と、当該用語の近傍にある1または複数の用語とに基づいて、前記画面上の複数の用語の中から前記動かされた用語と意味的関係性がある用語を推定し、
推定した前記意味的関係性がある用語を前記動かされた用語の周囲に配置する、
処理をコンピュータに実行させることを特徴とする統制語彙作成支援プログラム。
【0067】
(付記2)前記推定する処理は、前記画面上の複数の用語を組み合わせた用語ペアそれぞれの特徴空間上の特徴点を求め、前記動かされた用語と、前記近傍にある1または複数の用語の用語ペアの特徴点の分布に基づき、当該分布に近い特徴点の中から前記動かされた用語を含む用語ペアの特徴点を抽出し、抽出した特徴点に対応する用語ペアにおいて前記動かされた用語と組み合わされた用語を前記意味的関係性がある用語と推定する、
ことを特徴とする付記1に記載の統制語彙作成支援プログラム。
【0068】
(付記3)前記配置する処理は、前記動かされた用語と、推定した前記意味的関係性がある用語とを直線で結ぶ場合において当該直線に他の用語がかからない位置に、推定した前記意味的関係性がある用語を配置する、
ことを特徴とする付記1に記載の統制語彙作成支援プログラム。
【0069】
(付記4)前記配置する処理は、推定した前記意味的関係性がある用語を、前記動かされた用語に対応してポップアップ表示する、
ことを特徴とする付記1に記載の統制語彙作成支援プログラム。
【0070】
(付記5)複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて前記複数の用語を移動可能に表示し、
前記画面上において動かされた用語と、当該用語の近傍にある1または複数の用語とに基づいて、前記画面上の複数の用語の中から前記動かされた用語と意味的関係性がある用語を推定し、
推定した前記意味的関係性がある用語を前記動かされた用語の周囲に配置する、
処理をコンピュータが実行することを特徴とする統制語彙作成支援方法。
【0071】
(付記6)前記推定する処理は、前記画面上の複数の用語を組み合わせた用語ペアそれぞれの特徴空間上の特徴点を求め、前記動かされた用語と、前記近傍にある1または複数の用語の用語ペアの特徴点の分布に基づき、当該分布に近い特徴点の中から前記動かされた用語を含む用語ペアの特徴点を抽出し、抽出した特徴点に対応する用語ペアにおいて前記動かされた用語と組み合わされた用語を前記意味的関係性がある用語と推定する、
ことを特徴とする付記5に記載の統制語彙作成支援方法。
【0072】
(付記7)前記配置する処理は、前記動かされた用語と、推定した前記意味的関係性がある用語とを直線で結ぶ場合において当該直線に他の用語がかからない位置に、推定した前記意味的関係性がある用語を配置する、
ことを特徴とする付記5に記載の統制語彙作成支援方法。
【0073】
(付記8)前記配置する処理は、推定した前記意味的関係性がある用語を、前記動かされた用語に対応してポップアップ表示する、
ことを特徴とする付記5に記載の統制語彙作成支援方法。
【0074】
(付記9)複数の用語を2次元に可視化した画面上において、ユーザの指示に基づいて前記複数の用語を移動可能に表示し、
前記画面上において動かされた用語と、当該用語の近傍にある1または複数の用語とに基づいて、前記画面上の複数の用語の中から前記動かされた用語と意味的関係性がある用語を推定し、
推定した前記意味的関係性がある用語を前記動かされた用語の周囲に配置する、
処理を実行する制御部を含むことを特徴とする情報処理装置。
【0075】
(付記10)前記推定する処理は、前記画面上の複数の用語を組み合わせた用語ペアそれぞれの特徴空間上の特徴点を求め、前記動かされた用語と、前記近傍にある1または複数の用語の用語ペアの特徴点の分布に基づき、当該分布に近い特徴点の中から前記動かされた用語を含む用語ペアの特徴点を抽出し、抽出した特徴点に対応する用語ペアにおいて前記動かされた用語と組み合わされた用語を前記意味的関係性がある用語と推定する、
ことを特徴とする付記9に記載の情報処理装置。
【0076】
(付記11)前記配置する処理は、前記動かされた用語と、推定した前記意味的関係性がある用語とを直線で結ぶ場合において当該直線に他の用語がかからない位置に、推定した前記意味的関係性がある用語を配置する、
ことを特徴とする付記9に記載の情報処理装置。
【0077】
(付記12)前記配置する処理は、推定した前記意味的関係性がある用語を、前記動かされた用語に対応してポップアップ表示する、
ことを特徴とする付記9に記載の情報処理装置。
【符号の説明】
【0078】
1…情報処理装置
10…通信部
20…入力部
30…表示部
40…記憶部
41…用語情報
42…演算情報
50…制御部
51…可視化処理部
52…特徴量算出部
53…用語推定部
54…用語配置部
200…コンピュータ
201…CPU
202…入力装置
203…モニタ
204…スピーカ
205…媒体読取装置
206…インタフェース装置
207…通信装置
208…RAM
209…ハードディスク装置
210…バス
211…プログラム
212…各種データ
A…特徴量関数
B…特徴量関数
C1~C3、C11、C12…ケース
G1…2次元可視化画面
G10…カーソル
G11…ポップアップ表示
L1…上下関係線
L2…同義関係線
P1、P10、P20、P20a~P20c…特徴点
R1~R3…確率分布
W、W1、W1a~W1d、W2…用語
W11~W16…候補用語
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12