(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-31
(45)【発行日】2023-08-08
(54)【発明の名称】技術マップ出力装置、技術マップ出力方法、およびプログラム
(51)【国際特許分類】
G06F 16/34 20190101AFI20230801BHJP
G06F 16/35 20190101ALI20230801BHJP
【FI】
G06F16/34
G06F16/35
(21)【出願番号】P 2021167025
(22)【出願日】2021-10-11
(62)【分割の表示】P 2017042627の分割
【原出願日】2017-03-07
【審査請求日】2021-10-12
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年11月1日 http://corp.ird-pat.com/pdf/PPA_leaflet.pdfを通じて発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年11月16日 http://corp.ird-pat.com/PIFC/2016/PPA-201611.pdfを通じて発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月1日 http://www.japio.or.jp/00yearbook/files/2016book/16_3_04.pdfを通じて発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年11月1日 一般財団法人日本特許情報機構発行の「Japio YEAR BOOK 2016」に発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月3日 一般社団法人日本知財学会発行の「日本知財学会 第14回年次学術研究会発表会CD-ROM」に発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年11月9日~11日 一般社団法人発明推進協会、一般財団法人日本特許情報機構、フジサンケイビジネスアイ、産経新聞社主催の「第25回 特許・情報フェア&コンファレンス2016」に出品
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月4日 一般社団法人日本知財学会主催の「日本知財学会 第14回年次学術研究発表会」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月14日 株式会社発明通信社主催の「特許・情報フェア&コンファレンス2016フォローアップセミナー(メキキ・クリエイツ&IRD)」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年11月21日 株式会社アイ・アール・ディー主催の「特許情報分析システムに関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月5日 株式会社アイ・アール・ディー主催の「特許情報分析システムに関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月13日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月15日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月20日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成28年12月22日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成29年2月7日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成29年2月8日、株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成29年2月9日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
【新規性喪失の例外の表示】特許法第30条第2項適用 平成29年2月16日 株式会社アイ・アール・ディー主催の「特許情報分析システムおよび人と人工知能が協調する知財業務に関するセミナー」において文書をもって発表
(73)【特許権者】
【識別番号】502384842
【氏名又は名称】株式会社アイ・アール・ディー
(74)【代理人】
【識別番号】100115749
【氏名又は名称】谷川 英和
(72)【発明者】
【氏名】谷川 英和
(72)【発明者】
【氏名】太田 貴久
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特表2012-528375(JP,A)
【文献】特開2004-220456(JP,A)
【文献】特開2001-092825(JP,A)
【文献】特開2001-282852(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
特許の文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部にアクセスし、前記2以上の各文書情報を解析し、文書情報ごとに、2次元の技術マップを構成する「課題」の項目識別子と「解決手段」の項目識別子とを取得し、
当該「課題」の項目識別子と当該「解決手段」の項目識別子とを、2次元の各軸の2以上の各項目を識別する項目識別子が格納される項目識別子格納部に格納し、前記2以上の各文書情報を、2次元の各次元に対応する少なくとも2つの項目識別子に対応付ける対応決定部と、
前記「課題」と前記「解決手段」の各軸において、2以上の項目識別子を有する軸を構成し、各軸の項目識別子に対応付いている文書情報を用いて技術マップの内容である内容情報を構成し、前記軸と前記内容情報とを有する技術マップを構成する技術マップ構成部と、
前記技術マップを出力する技術マップ出力部と、
前記技術マップ出力部が出力した前記技術マップに対して、項目を追加する項目追加指示を受け付ける編集指示受付部と、
前記項目追加指示に対応する項目を識別する項目識別子を前記項目識別子格納部に追加する軸変更部と、
前記項目追加指示に従って、前記2以上の各文書情報を解析し、前記追加された項目識別子と対応付けられる文書情報を取得し、当該文書情報を識別する文書識別子を前記追加された項目識別子に対応付ける分類変更部とを具備する技術マップ出力装置。
【請求項2】
特許の文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部と、対応決定部と、技術マップ構成部と、技術マップ出力部と、編集指示受付部と、軸変更部と、分類変更部とを用いて実現される、技術マップ出力方法であって、
前記対応決定部が、前記文書情報格納部にアクセスし、前記2以上の各文書情報を解析し、文書情報ごとに、2次元の技術マップを構成する「課題」の項目識別子と「解決手段」の項目識別子とを取得し、
当該「課題」の項目識別子と当該「解決手段」の項目識別子とを、2次元の各軸の2以上の各項目を識別する項目識別子が格納される項目識別子格納部に格納し、前記2以上の各文書情報を、2次元の各次元に対応する少なくとも2つの項目識別子に対応付ける対応決定ステップと、
前記技術マップ構成部が、前記「課題」と前記「解決手段」の各軸において、2以上の項目識別子を有する軸を構成し、各軸の項目識別子に対応付いている文書情報を用いて技術マップの内容である内容情報を構成し、前記軸と前記内容情報とを有する技術マップを構成する技術マップ構成ステップと、
前記技術マップ出力部が、前記技術マップを出力する技術マップ出力ステップと、
前記編集指示受付部が、技術マップ出力ステップで出力された前記技術マップに対して、項目を追加する項目追加指示を受け付ける編集指示受付ステップと、
前記軸変更部が、前記項目追加指示に対応する項目を識別する項目識別子を前記項目識別子格納部に追加する軸変更ステップと、
前記分類変更部が、前記項目追加指示に従って、前記2以上の各文書情報を解析し、前記追加された項目識別子と対応付けられる文書情報を取得し、当該文書情報を識別する文書識別子を前記追加された項目識別子に対応付ける分類変更ステップとを具備する技術マップ出力方法。
【請求項3】
特許の文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部にアクセス可能なコンピュータを、
前記文書情報格納部にアクセスし、前記2以上の各文書情報を解析し、文書情報ごとに、2次元の技術マップを構成する「課題」の項目識別子と「解決手段」の項目識別子とを取得し、
当該「課題」の項目識別子と当該「解決手段」の項目識別子とを、2次元の各軸の2以上の各項目を識別する項目識別子が格納される項目識別子格納部に格納し、前記2以上の各文書情報を、2次元の各次元に対応する少なくとも2つの項目識別子に対応付ける対応決定部と、
前記「課題」と前記「解決手段」の各軸において、2以上の項目識別子を有する軸を構成し、各軸の項目識別子に対応付いている文書情報を用いて技術マップの内容である内容情報を構成し、前記軸と前記内容情報とを有する技術マップを構成する技術マップ構成部と、
前記技術マップを出力する技術マップ出力部と、
前記技術マップ出力部が出力した前記技術マップに対して、項目を追加する項目追加指示を受け付ける編集指示受付部と、
前記項目追加指示に対応する項目を識別する項目識別子を前記項目識別子格納部に追加する軸変更部と、
前記項目追加指示に従って、前記2以上の各文書情報を解析し、前記追加された項目識別子と対応付けられる文書情報を取得し、当該文書情報を識別する文書識別子を前記追加された項目識別子に対応付ける分類変更部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書から自動的に技術マップを出力する技術マップ出力装置において、項目の編集指示を受け付け、編集指示に応じて分類を変更する分類変更処理を行う装置等に関するものである。
【背景技術】
【0002】
特許や論文等の多数の技術文書を分析するために
図25(a)のようなバブルチャートが利用されることがある。このような図を技術マップと呼ぶ。このバブルチャートは、2つの分析の観点を縦と横の2軸にとり、各軸に項目を並べ、各項目の交点にその項目に関する文書の数に基づいた大きさのバブルを配置した図である。例えば、分析対象を特許とし「課題」と「解決手段」を軸とした技術マップを作成することで、どのような技術開発が行われているかを俯瞰することができる。なお、技術マップは必ずしもバブルチャートである必要はなく、
図25(a)のバブルの替わりに文書の数をプロットした図であっても良く、
図25(b)のように項目の交点となるセルに具体的な文書名をプロットした表であっても良い。また、技術マップは、3つの分析の観点をX軸、Y軸、Z軸とした3次元のバブルチャートであっても良い。
【0003】
従来、技術文書から「課題」や「解決手段」が記述されている部分(例えば、特許文書ならば[発明の効果]等)を指定し、複数の技術文書の指定された部分の内容に対してクラスタリングを行い、技術マップを自動的に生成するシステムがあった(例えば、特許文献1参照)。
【0004】
一方、表形式の技術マップにおいて、機械的な文書分類方法にユーザが行った分類結果の修正を反映させて、インタラクティブに文書分類を行う装置等があった(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2007-108867号公報(第1頁、第1図等)
【文献】特開2008-305268号公報(第1頁、第1図等)
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1等のシステムにおいては、一旦、装置が技術マップを出力すると、軸の項目を追加や削除といった技術マップの編集をユーザが行うことができないという課題があった。
【0007】
また、特許文献2等の装置においては、技術マップの各項目に属する文書を変更することはできても、技術マップの項目自体を編集することができないという課題があった。
【課題を解決するための手段】
【0008】
本第一の発明の技術マップ出力装置は、文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部と、2次元以上の各軸の2以上の各項目を識別する項目識別子が格納される項目識別子格納部と、2次元以上の各次元に対応する2以上の項目識別子に対応付けて、1以上の文書識別子が格納される文書識別子格納部と、2以上の各文書情報を解析し、2次元以上の各次元に対応する項目識別子を文書情報ごとに取得し、文書情報を識別する文書識別子を、2次元以上の各次元に対応する2以上の項目識別子に対応付けて文書識別子格納部に蓄積する対応決定部と、2次元以上の各軸の2以上の項目識別子を有する軸を構成し、各軸の項目識別子に対応付いている文書識別子を用いて技術マップの内容である内容情報を構成し、軸と内容情報とを有する技術マップを構成する技術マップ構成部と、技術マップを出力する技術マップ出力部と、技術マップが有する軸の項目を編集する指示である編集指示を受け付ける編集指示受付部と、編集指示に応じて、軸を変更する軸変更部と、軸の変更に応じて、文書識別子格納部の1以上の文書識別子の項目識別子への対応を変更する分類変更部とを具備し、技術マップ構成部は、軸変更部による軸の変更、および分類変更部による分類の変更に応じて、技術マップを変更し、技術マップ出力部は、変更された技術マップを出力する技術マップ出力装置である。
かかる構成により、ユーザは技術マップを編集することができる。
【0009】
また、本第二の発明の技術マップ出力装置は、第一の発明に対して、編集指示は、2以上の項目を一つの項目にする項目統合指示であり、軸変更部は、項目統合指示に従って、2以上の項目識別子を一の項目識別子に変更し、分類変更部は、2以上の各項目に対応する項目識別子に対応付いている2以上の文書識別子を、一の項目識別子に対応づくように変更する技術マップ出力装置である。
かかる構成により、ユーザは技術マップの項目を統合することができる。
【0010】
また、本第三の発明の技術マップ出力装置は、第一の発明に対して、編集指示は、少なくとも一つの項目を削除する項目削除指示であり、軸変更部は、項目削除指示に従って、一つの項目識別子を削除し、分類変更部は、一つの項目識別子に対応付いている1以上の文書識別子を、一つの項目識別子に対応づかないように変更する技術マップ出力装置である。
かかる構成により、ユーザは技術マップの項目を削除することができる。
【0011】
また、本第四の発明の技術マップ出力装置は、第三の発明に対して、分類変更部は、一つの項目識別子に対応付いている1以上の文書識別子で識別される各文書情報を解析し、各文書情報に対応する、一つの項目と同一軸に属する別の項目の項目識別子を取得し、各文書情報の文書識別子に対応付く項目識別子を、取得した項目識別子に変更する技術マップ出力装置である。
かかる構成により、ユーザが削除した項目に属していた技術文書を適切に再配置することができる。
【0012】
また、本第五の発明の技術マップ出力装置は、第一の発明に対して、編集指示は、項目を追加する項目追加指示であり、軸変更部は、項目追加指示に対応する項目を識別する項目識別子を項目識別子格納部に追加し、分類変更部は、2以上の各文書情報を解析し、追加された項目識別子と対応付けられる文書情報を取得し、文書情報を識別する文書識別子を追加された項目識別子に対応付けて文書識別子格納部に蓄積する技術マップ出力装置である。
かかる構成により、ユーザは項目を追加することができる。
【0013】
また、本第六の発明の技術マップ出力装置は、第一の発明に対して、編集指示は、項目の名称を変更する項目名変更指示であり、軸変更部は、項目名変更指示に対応する項目の項目識別子を変更する技術マップ出力装置である。
かかる構成により、ユーザは項目の名称を変更することができる。
【発明の効果】
【0014】
本発明による技術マップ出力装置によれば、ユーザは、技術マップの軸の項目を自由に編集することができる。
【図面の簡単な説明】
【0015】
【
図1】本発明の実施の形態1における技術マップ出力装置のブロック図
【
図2】同実施の形態における技術マップ出力装置の動作を示すフローチャート
【
図3】同実施の形態における対応決定処理の動作を示すフローチャート
【
図4】同実施の形態における技術マップ構成処理の動作を示すフローチャート
【
図5】同実施の形態における項目削除処理の動作を示すフローチャート
【
図6】同実施の形態における項目追加処理の動作を示すフローチャート
【
図7】同実施の形態における文書情報管理表の一例を示す図
【
図8】同実施の形態における項目識別子管理表の一例を示す図
【
図9】同実施の形態における文書識別子管理表の一例を示す図
【
図10】同実施の形態における技術マップの一例を示す図
【
図11】同実施の形態の項目統合処理における項目識別子管理表の一例を示す図
【
図12】同実施の形態の項目統合処理における文書識別子管理表の一例を示す図
【
図13】同実施の形態の項目統合処理における技術マップの一例を示す図
【
図14】同実施の形態の項目削除処理における項目識別子管理表の一例を示す図
【
図15】同実施の形態の項目削除処理における文書識別子管理表の一例を示す図
【
図16】同実施の形態の項目削除処理における技術マップの一例を示す図
【
図17】同実施の形態の項目追加処理における項目識別子管理表の一例を示す図
【
図18】同実施の形態の項目追加処理における文書識別子管理表の一例を示す図
【
図19】同実施の形態の項目追加処理における技術マップの一例を示す図
【
図20】同実施の形態の項目名変更処理における項目識別子管理表の一例を示す図
【
図21】同実施の形態の項目名変更処理における文書識別子管理表の一例を示す図
【
図22】同実施の形態の項目名変更処理における技術マップの一例を示す図
【発明を実施するための形態】
【0016】
以下、技術マップ出力装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0017】
(実施の形態1)
本実施の形態において、2次元以上の各次元の軸の2以上の項目を2以上の特許文書から自動抽出し、軸を構成し、特許文書の分類を行い、特許マップを出力する特許マップ出力装置において、項目の編集指示を受け付け、編集指示に応じて、分類を変更する分類変更処理を行う技術マップ出力装置1について説明する。
【0018】
図1は、本実施の形態における技術マップ出力装置1のブロック図である。
【0019】
技術マップ出力装置1は、格納部11、対応決定部12、技術マップ構成部13、技術マップ出力部14、編集指示受付部15、軸変更部16、分類変更部17を備える。
【0020】
格納部11は、文書情報格納部111、項目識別子格納部112、文書識別子格納部113を備える。
【0021】
文書情報格納部111は、文書を識別する文書識別子に対応する2以上の文書情報が格納される。
【0022】
ここで、文書とは、特許文書や論文といった技術マップ上で分類され得る文書ならば、何でも良い。特許文書とは、特許公開公報でも良く、特許掲載公報でも良く、また、特許出願時の書類でも良く、その形式は問わない。さらに、特許文書や論文以外にも、例えば、製品紹介のウェブページや、製品情報を含む新聞記事、企業のプレスリリースなどでも良い。
【0023】
また、文書識別子とは、文書を識別する記号列である。文書識別子は、文書情報格納部111において文書を一意に定めることができれば、どのような記号列であっても良い。例えば、文書が公開特許公報ならば特許出願番号や特許公開番号、特許掲載公報ならば特許番号を用いることは好適である。また、文書識別子に対応する文書情報の構造は問わない。通常、文書識別子に対応する文書情報は、テキストを含む。さらに、文書情報は、文書の構造に関する情報を含んでも良い。例えば、HTMLなどのマークアップ言語を用いてテキストとその構造を表しても良く、特許文書のように隅付き括弧で文書の構造を表しても良い。また、文書情報は、文書のメタ情報を含んでも良い。メタ情報とは、例えば、特許文書における、出願人、発明者、代理人、出願日、公開日、IPC、FI、Fターム等のテキスト以外の文書に関する情報である。
【0024】
項目識別子格納部112は、2次元以上の各軸の2以上の各項目を識別する項目識別子が格納される。
【0025】
ここで、2次元以上の各軸とは、技術マップの軸となる「観点」である。例えば、
図25(a)の2次元の技術マップの場合、「課題」と「解決手段」が軸となる。さらに、軸の項目とは、技術マップの軸に並ぶ文字列や記号や画像である。例えば、
図25(a)の2次元の技術マップの場合、課題軸の「強風対策」や「雷撃対策」、解決手段軸の「ピッチ制御」や「可変速度制御」が項目である。項目識別子格納部112は、技術マップに表示されない項目の項目識別子を含んでも良い。例えば、
図25(a)の技術マップを出力する技術マップ出力装置1において、項目識別子格納部112は、課題軸の項目として「発電効率」や「製造コスト低減」等の項目識別子を含んでも良い。
【0026】
文書識別子格納部113は、2次元以上の各次元に対応する2以上の項目識別子に対応付けて、1以上の文書識別子が格納される。
【0027】
文書識別子格納部113は、技術マップの内容(例えば、バブルチャートならばバブル、バブルの替わりに件数を表示する件数マップならば件数、
図25(b)のような表ならばセルに含まれる文献のリスト)を生成するために、各次元の各項目に対応する文書の文書識別子が格納される。すなわち、技術マップ出力装置1がバブルチャートの技術マップを出力する場合、例えば、横軸の項目の項目識別子に対応付けられた文書識別子と、縦軸の項目の項目識別子に対応付けられた文書識別子の積集合の大きさがバブルのサイズに反映される。
【0028】
対応決定部12は、2以上の各文書情報を解析し、2次元以上の各次元に対応する項目識別子を文書情報ごとに取得し、文書情報を識別する文書識別子を、2次元以上の各次元に対応する2以上の項目識別子に対応付けて文書識別子格納部113に蓄積する。
【0029】
対応決定部12において、文書情報格納部111に格納されている文書情報を解析し、当該文書情報に対応する項目識別子を取得するアルゴリズムについては問わない。対応決定部12は、項目識別子格納部112の情報を参照して各文書情報に対応する項目識別子を取得しても良く、また、項目識別子格納部112の情報を参照せず、文書情報から項目識別子を生成しても良い。
【0030】
項目識別子格納部112の情報を参照して各文書情報に対応する項目識別子を取得する場合、対応決定部12は、文書情報格納部111に格納された各文書情報と、項目識別子格納部112に格納された各項目識別子を比較し、文書情報と項目識別子の対応を決定する。
【0031】
例えば、項目の名前(項目識別子がそのまま技術マップに出力される場合は項目識別子)が各文書のテキストに現れる回数を算出し、その回数が予め定めた一定値以上の場合に、当該文書の文書識別子と当該項目の項目識別子を対応付けても良く。また、前記テキストに現れる回数が最も多い1の項目の項目識別子に対応付けても良い。また、項目の名前が現れる回数の替わりに、項目の名前を文字または形態素に分割し、各文字または形態素の現れる回数の総和を用いても良い。さらに、前記項目の名前や形態素の現れる回数を算出する際に、シソーラスを用いても良い。具体的には、項目の名前や形態素の上位語または下位語またはその両方をシソーラスから取得し、当該シソーラスから取得した語について、各文書のテキストに現れた回数を用いても良い。
【0032】
また、コーパスを利用して対応付けを行っても良い。例えば、技術マップ出力装置1は、項目識別子格納部112に格納される各項目について、項目の名前(項目識別子がそのまま技術マップに出力される場合は項目識別子)を含む文書群をコーパスから収集し、前記文書群に含まれる各文書をベクトルに変換した上で、前記ベクトルのすべて、もしくは前記文書群の代表となるベクトル(例えば平均ベクトル)を予め記憶しておく。対応決定部12が文書識別子と項目識別子の対応付けを行う際には、文書識別子に対応する文書情報を同様の方法でベクトル化し(以下、文書情報ベクトル)、文書情報ベクトルと各項目の間の類似度を求め、類似度が予め定めた一定値以上の場合に、文書識別子と項目識別子を対応付けても良い。ここで、文書をベクトル化する方法としては、文字や語のn-gram(n≧1)や、文書情報が持つ他の属性を次元、その出現頻度やTF-IDFを値としてベクトル化する方法等がある。また、文書情報ベクトルと項目の間の類似度には、文書情報ベクトルと予め記憶した項目の平均ベクトルとの間のコサイン類似度やピアソンの相関係数、偏差パターン類似度等を用いる方法や、予め記憶した項目のベクトルのうち、文書情報ベクトルと近いベクトルを上位n個取得し、前記取得したベクトルと文書情報ベクトルの間の距離を用いて類似度を算出しても良い(すなわち、k近傍法を用いても良い)。また、文書識別子と項目識別子の対応付けでは、文書識別子を類似度が最も高い1の項目と対応付けても良い。なお、上記ベクトル化の方法、類似度、k近傍法については公知技術であるため説明を省略する。
【0033】
また、例えば、コーパスを利用して対応付けを行う方法としては、コーパスにおいて、項目の名前(項目識別子がそのまま技術マップに出力される場合は項目識別子)を含む文書を正例、そうでない文書を負例として、正例と負例を識別する識別器を学習し、その識別器の出力する結果をそのまま用いても良い(例えば、SVMやRandom Forest)。また、前記正例と負例を用いて、正例である確率等の値(以下、スコア)を出力する識別器(例えば、SVRやRandom Forest)を学習し、文書情報格納部111に格納されている各文書に対し、識別器を適用し、識別器の出力するスコアを用いて対応付けを行っても良い。この際、先のコーパスを用いずに対応付けを行う方法と同様に、文書識別子を、最も高いスコアを達成する識別器に対応する項目識別子に対応付けても良く、また、スコアが予め定めた一定値以上を達成するすべての識別器に対応する項目識別子に対応付けても良い。なお、上記SVM、SVR、Random Forestについては公知技術であるため、説明を省略する。
【0034】
また、項目識別子格納部112の情報を参照せず、文書情報から項目識別子を生成する場合、対応決定部12は、文書情報格納部111に格納された各文書情報のみから項目識別子を生成する。例えば、技術マップ出力装置1に図示しない重要表現取得部と項目集約部を具備させることで項目識別子を生成することができる。ここで、重要表現取得部は、文書情報から各軸に関する表現を取得する機能を有する。例えば、「課題」軸に関する重要表現とは「○○することができる」や「△△を達成する」といった表現である。重要表現抽出部は、例えば、酒井の方法(酒井浩之, 野中尋史, 増山繁, 特許明細書からの技術課題情報の抽出, 人工知能学会論文誌, 第25巻6号I, pp.531-540, 2009.)等を用いて実現することができる。また、項目集約部は、重要表現抽出部が抽出した各表現を短縮し、さらにまとめ上げる機能を有する。例えば、項目集約部は、「使用する資源を減らすことができる」という重要表現を「資源削減」と短くし、さらに、「資源削減」と「再利用性向上」を「リサイクル性」にまとめ上げる。項目集約部は、例えば、野中の方法(Hirofumi Nonaka, Akio Kobayashi, Hiroki Sakaji, Yusuke Suzuki, Hiroyuki Sakai, Shigeru Masuyama, Extraction of the effect and the technology terms from a patent document, Proc. of 40th International Conference on Computers and Industrial Engineering (CIE40), cie214jp-1, Awaji-shima, Japan, (2010).)等を用いて実現することができる。なお、この場合、対応決定部12は、文書情報から生成した項目識別子を項目識別子格納部112へ登録する。
【0035】
技術マップ構成部13は、2次元以上の各軸の2以上の項目識別子を有する軸を構成し、各軸の項目識別子に対応付いている文書識別子を用いて技術マップの内容である内容情報を構成し、軸と内容情報とを有する技術マップを構成する。
【0036】
ここで、内容情報とは、前記技術マップを出力するために必要な情報である。例えば、
図25(a)のような技術マップの場合、バブルを構成するための情報である。具体的には、上記の場合、内容情報は、少なくとも文書数に応じたバブルの半径を含む。ここで、通常、バブルの半径は文書数の大きさに比例して大きくなる。また、
図25(b)のような技術マップの場合、各セルに記述する文献のリストである。また、内容情報は、
図25(a)のバブルと共に、もしくはバブルの替わりに、バブルに含まれる文献の数をプロットするような技術マップの場合は、文書の数を含む。さらに、バブルの替わりに、棒グラフをプロットするならば、棒グラフを構成する情報である。通常、前記棒グラフを構成する情報は、棒グラフの高さを含む。また、通常、棒グラフの高さは、文書数の大きさに比例して高くなる。以上のように、内容情報は、出力する技術マップの形に合わせて、求める情報が異なる。
【0037】
技術マップ構成部13は、後述する軸変更部16による項目識別子格納部112の変更と、後述する分類変更部17による文書識別子格納部113の変更に応じて、技術マップの内容情報を再構成する。この際、技術マップ構成部13は、軸変更部16と分類変更部17が項目識別子格納部112と文書識別子格納部113を変更する前と同様に、出力する技術マップの形に適合した内容情報を構成する。
【0038】
技術マップ出力部14は、技術マップを出力する。技術マップ構成部15が構成した内容情報から技術マップを出力する方法については公知技術であるため説明を省略する。
【0039】
ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
【0040】
技術マップ出力部14は、技術マップ構成部13が内容情報を再構成した場合、再構成された内容情報に基づき、技術マップを再出力する。
【0041】
編集指示受付部15は、技術マップ出力部14が出力した技術マップが有する軸の項目を編集する指示である編集指示を受け付ける。
【0042】
編集指示は、例えば、2以上の項目を一つの項目にする項目統合指示、もしくは少なくとも一つの項目を削除する項目削除指示、項目を追加する項目追加指示、項目の名称を変更する項目名変更指示である。
【0043】
入力手段は、マウスやタッチパネルやテンキーやキーボードやメニュー画面によるもの等、何でも良い。
【0044】
軸変更部16は、編集指示受付部15が受け付けた編集指示に応じて、軸を変更する。
【0045】
軸変更部16は、編集指示受付部15が項目統合指示を受け付けた場合、当該項目統合指示に従って、2以上の項目識別子を一の項目識別子に変更する。例えば、項目統合指示が、統合元となる2以上の項目識別子(以下、統合元項目識別子)と、統合先である一の項目識別子(以下、統合先項目識別子)を含む場合、軸変更部16は、統合元項目識別子を項目識別子格納部112から削除し、新たに統合先項目識別子を項目識別子格納部112に格納する。また、項目統合指示が統合元項目識別子のみを含む場合、軸変更部16は、統合元項目識別子から統合先項目識別子を自動的に生成しても良い。例えば、軸変更部16は、統合元項目識別子を予め定めた接続文字列(例えば「・」)で接続し、接続した識別子を統合先項目識別子としても良い。また、例えば、軸変更部16はシソーラスを用いて、統合元項目識別子の上位語を取得または生成し、統合先項目識別子としても良い。
【0046】
また、軸変更部16は、編集指示受付部15が項目削除指示を受け付けた場合、当該項目削除指示に従って、一つの項目識別子を削除する。例えば、軸変更部16は、項目削除指示で指示された項目識別子を項目識別子格納部112から削除する。
【0047】
また、軸変更部16は、編集指示受付部15が項目追加指示を受け付けた場合、当該項目追加指示に対応する項目を識別する項目識別子を項目識別子格納部112に追加する。例えば、軸変更部16は、項目追加指示で指示された項目識別子を項目識別子格納部112に追加する。
【0048】
また、軸変更部16は、編集指示受付部15が項目名変更指示を受け付けた場合、当該項目名変更指示に対応する項目の項目識別子を変更する。例えば、軸変更部16は、項目識別子格納部112中の、項目名変更指示で指示された項目識別子を変更する。ここで、軸変更部16は、項目識別子が項目の名前を表す場合は、項目識別子そのものを変更する。
【0049】
分類変更部17は、軸の変更に応じて、文書識別子格納部113の1以上の文書識別子のうちの、編集指示に対応する項目に関連する文書識別子の、項目識別子への対応を変更する。
【0050】
ここで、関連する文書識別子とは、通常、編集指示受付部15が受け付けた編集指示によって異なる。編集指示受付部15が受け付けた編集指示が項目統合指示、項目削除指示または項目名変更指示の場合、各編集指示に含まれる項目識別子と、現在対応付けられている文書識別子が関連する文書識別子となる。一方、編集指示受付部15が受け付けた編集指示が項目削除指示の場合、関連する文書識別子は、文書情報格納部111に格納されるすべての文書識別子が関連する文書識別子となる。
【0051】
編集指示受付部15が受け付けた編集指示が項目統合指示の場合、分類変更部17は、例えば、項目統合指示に指示された統合対象である2以上の項目識別子に対応付けられた文書識別子のすべてを文書識別子格納部113から削除し、その後、前記文書識別子のすべてを、統合先の項目識別子に対応付ける。また、例えば、分類変更部17は、目統合指示に指示された統合対象である2以上の項目識別子に対応付けられた文書識別子のすべてを文書識別子格納部113から削除した後、文書情報格納部111に格納されたすべての文書情報に対して、対応決定部12と同様の方法を用いて統合先の項目識別子と対応する文書識別子を決定しても良い。
【0052】
編集指示受付部15が受け付けた編集指示が項目削除指示の場合、分類変更部17は、例えば、項目削除指示に対応する項目識別子(以下、削除対象項目識別子)に対応付いた文書識別子を文書識別子格納部113から削除する。また、例えば、分類変更部17は、前記文書識別子を文書識別子格納部113から削除した後、削除対象項目識別子に対応付いた文書識別子、もしくは文書情報格納部111に格納されたすべての文書識別子について、対応決定部12と同様の方法を用いて、各文書識別子と、削除対象項目識別子以外の項目識別子との対応付けを行っても良い。
【0053】
編集指示受付部15が受け付けた編集指示が項目追加指示の場合、分類変更部17は、例えば、文書情報格納部111に格納されたすべての文書情報に対応する文書識別子について、対応決定部12と同様の方法を用いて、追加した項目識別子との対応付けを行う。ここで、対応決定部12が一の文書識別子に対して一の項目識別子を対応付ける場合、追加した項目識別子と対応付けられた文書識別子については、追加した項目識別子以外の項目識別子との対応は文書識別子格納部113から削除する。
【0054】
編集指示受付部15が受け付けた編集指示が項目名変更指示の場合、分類変更部17は、例えば、項目識別子格納部112と文書識別子格納部113に格納された、項目名変更指示で指示された項目識別子を変更する。
【0055】
格納部11、文書情報格納部111、項目識別子格納部112、文書識別子格納部113は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0056】
格納部11、文書情報格納部111、項目識別子格納部112、文書識別子格納部113に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部11、文書情報格納部111、項目識別子格納部112、文書識別子格納部113で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部11、文書情報格納部111、項目識別子格納部112、文書識別子格納部113で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11、文書情報格納部111、項目識別子格納部112、文書識別子格納部113で記憶されるようになってもよい。
【0057】
対応決定部12、技術マップ構成部13、軸変更部16、分類変更部17は、通常、MPUやメモリ等から実現され得る。対応決定部12、技術マップ構成部13、軸変更部16、分類変更部17の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0058】
技術マップ出力部14は、ディスプレイ等の出力デバイスを含むと考えても含まないと考えても良い。技術マップ出力部14は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0059】
編集指示受付部と15は、マウスやタッチパネル等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0060】
次に、技術マップ出力装置1の動作について
図2のフローチャートを用いて説明する。なお、以下、所定の情報におけるi番目の情報は、「情報[i]」と記載するものとする。
【0061】
本実施の形態では、技術マップ出力装置1は、バブルチャート型の技術マップを出力するものとする。また、項目識別子格納部112ならびに文書識別子格納部113において、項目識別子は技術マップに表示する項目の名前そのものを表すものとする。また、文書識別子格納部113において、一の文書識別子は各軸においてそれぞれ1つの項目識別子と対応付けるものとする。
【0062】
また、本実施の形態では、編集指示受付部15は項目統合指示、項目削除指示、項目追加指示、項目名変更指示の4種類の編集指示を受け付けるものとする。ここで、項目統合指示は、統合の対象とする2以上の項目識別子と、統合した後の一の項目識別子を含む。また、項目削除指示は、削除する一の項目識別子を含む。また、項目追加指示は、追加する一の項目識別子を含む。また、項目名変更指示は、変更対象である一の項目識別子と、変更後の項目識別子(すなわち、変更前の項目識別子と、当該項目識別子を変更した後の項目識別子)を含む。
【0063】
また、本実施の形態では、技術マップ出力装置1は、項目統合指示が指示された場合、統合の対象とする2以上の項目識別子に対応付けられていた文書識別子を、統合した後の一の項目識別子に対応付ける。また、技術マップ出力装置1は、項目削除指示が指示された場合、削除する項目識別子に対応付けられた文書識別子について、削除する項目識別子以外の一の項目識別子に対応付ける。また、技術マップ出力装置1は、項目追加指示を指示された場合、文書情報格納部111に格納されているすべての文書情報について、追加する項目識別子との対応付けを行い、文書情報が追加する項目識別子と対応する場合は、当該文書情報に対応する文書識別子と、項目追加指示が指示される直前に対応付けられていた項目識別子との対応付けを削除し、新たに項目追加指示で指示された項目識別子(追加する項目識別子)と対応付ける。
【0064】
(ステップS201)対応決定部12は、文書情報格納部111に格納されている文書と、項目識別子格納部112に格納されている項目識別子を対応付け、文書識別子格納部113に情報を蓄積する。かかる処理を対応決定処理と呼ぶ。対応決定処理の詳細について、
図3のフローチャートを用いて説明する。
【0065】
(ステップS202)技術マップ構成部13は、文書識別子格納部113に格納されている情報に基づき技術マップを出力するために必要な内容情報を構成する。かかる処理を技術マップ構成処理と呼ぶ。技術マップ構成処理の詳細について、
図4のフローチャートを用いて説明する。
【0066】
(ステップS203)技術マップ出力部14は、技術マップ構成部13が構成した内容情報に基づいて技術マップを出力する。
【0067】
(ステップS204)編集指示受付部15は、ユーザが編集指示を行った場合は、ステップS205へ、そうでない場合は編集指示が行われるまで待機する。
【0068】
(ステップS205)編集指示受付部15は、ステップS204で受け付けた編集指示が項目統合指示の場合は、ステップS206へ進む。そうでない場合はステップS207へ進む。
【0069】
(ステップS206)軸変更部16は、項目統合指示で指示された2以上の項目識別子を結合し一の項目識別子にする。さらに、分類変更部17は、項目統合指示で指示された2以上の項目識別子に対応付けられたすべての文書識別子を、結合した新たな項目識別子に対応づくように文書識別子格納部113の情報を変更する。
【0070】
(ステップS207)編集指示受付部15は、ステップS204で受け付けた編集指示が項目削除指示の場合は、ステップS208へ進む。そうでない場合はステップS209へ進む。
【0071】
(ステップS208)軸変更部16および分類変更部17は、項目削除指示に従って項目識別子格納部112と文書識別子格納部113の情報を変更する。かかる処理を項目削除処理と呼ぶ。項目削除処理の詳細について、
図5のフローチャートを用いて説明する。
【0072】
(ステップS209)編集指示受付部15は、ステップS204で受け付けた編集指示が項目追加指示の場合は、ステップS210へ進む。そうでない場合はステップS211へ進む。
【0073】
(ステップS210)軸変更部16および分類変更部17は、項目追加指示に従って項目識別子格納部112と文書識別子格納部113の情報を変更する。かかる処理を項目追加処理と呼ぶ。項目追加処理の詳細について、
図6のフローチャートを用いて説明する。
【0074】
(ステップS211)編集指示受付部15は、ステップS204で受け付けた編集指示が項目名変更指示の場合は、ステップS212へ進む。そうでない場合はステップS204へ戻る。
【0075】
(ステップS212)軸変更部16は、ステップS204で受け付けた項目名変更指示に基づいて項目識別子格納部112および文書識別子格納部113に格納されている項目識別子を変更する。
【0076】
なお、
図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0077】
次に、ステップS201の対応決定処理の詳細の具体例について、
図3のフローチャートを用いて説明する。
【0078】
(ステップS301)対応決定部12は、カウンタiに1を代入する。
【0079】
(ステップS302)対応決定部12は、項目識別子格納部112にi番目の軸が存在する場合は、ステップS303へ進む。そうでない場合は、上位処理へリターンする。
【0080】
(ステップS303)対応決定部12は、カウンタjに1を代入する。
【0081】
(ステップS304)対応決定部12は、文書情報格納部111にj番目の文書が存在する場合は、ステップS306へ、そうでない場合はステップS305へ進む。
【0082】
(ステップS305)対応決定部12は、カウンタiを1だけ増加させステップS302へ進む。
【0083】
(ステップS306)対応決定部12は、カウンタkに1を代入する。
【0084】
(ステップS307)対応決定部12は、現在の最大スコアを保存するscoreに-∞を代入し、さらに、現在の最大スコアを達成する項目を保存するitemにnullを代入する。ここで、スコアについては、ステップS309にて説明する。
【0085】
(ステップS308)対応決定部12は、i番目の軸のk番目の項目(以下、項目[k])が存在する場合は、ステップS309へ、そうでない場合は、ステップS313へ進む。
【0086】
(ステップS309)対応決定部12は、変数sに文書[j]と項目[k]との間のスコアを代入する。ここで、スコアとは、文書[j]が項目[k]に属するもっともらしさを表すスコアであり、値が大きいほど文書[j]が項目[k]に属することを表す値ならば、どのような値を用いても良い。スコアの具体的な算出方法は後述する。
【0087】
(ステップS310)対応決定部12は、ステップS309で求めたsがscoreより大きい場合、ステップS311へ、そうでない場合は、ステップS312へ進む。
【0088】
(ステップS311)対応決定部12は、scoreにsを代入し、さらにitemに項目[k]を代入する。
【0089】
(ステップS312)対応決定部12は、カウンタkを1だけ増加させ、ステップS308へ戻る。
【0090】
(ステップS313)対応決定部12は、文書[j]に対応する文書識別子と、itemに対応する項目識別子を結びつけ、文書識別子格納部113へ蓄積する。
【0091】
(ステップS314)対応決定部12は、カウンタjを1だけ増加させステップS304へ戻る。
【0092】
図3のフローチャートにおいて、スコアは、値が大きいほど文書と項目が「対応する」と判定されるようなスコアならば、どのようなスコアを用いても良い。
【0093】
例えば、項目を表す文字列(本実施の形態では項目識別子)が文書に現れた回数をスコアにしても良い。また、前記項目を表す文字列を形態素解析し、各形態素の現れた回数の合計をスコアにしても良い。
【0094】
また、例えば、コーパスを用いてスコアを求める方法を学習しても良い。具体的には、項目を表す文字列を含む文書をコーパスから収集し、それらの文書を単語やn-gramのベクトルに変換した上で平均ベクトルを予め求めておく。文書と項目との間のスコアを求める際は、前記平均ベクトルと文書のベクトルの間のコサイン類似度をスコアとする方法がある。また、項目を表す文字列を含む文書を正例、そうでない文書を負例として、正例と負例を識別する識別器を学習し、その識別器の出力するスコアをそのまま用いても良い(例えば、SVRや確率を出力するRandom Forest)。
【0095】
次に、ステップS202の技術マップ構成処理の詳細の具体例について、
図4のフローチャートを用いて説明する。
【0096】
(ステップS401)技術マップ構成部13は、カウンタiに1を代入する。
【0097】
(ステップS402)技術マップ構成部13は、1番目の軸のi番目の項目(以下、項目[i])が存在する場合は、ステップS403へ進む。そうでない場合は、上位処理へリターンする。
【0098】
(ステップS403)技術マップ構成部13は、カウンタjに1を代入する。
【0099】
(ステップS404)技術マップ構成部13は、2番目の軸のj番目の項目(以下、項目[j])が存在する場合は、ステップS405へ、そうでない場合は、ステップS407へ進む。
【0100】
(ステップS405)技術マップ構成部13は、項目[i]と項目「j」の両方に対応付けられている文書をすべて取得し、Dに代入する。
【0101】
(ステップS406)技術マップ構成部13は、Dのサイズに基づいてバブルの半径を計算する。通常、バブルの面積がDのサイズと比例するように半径を決定する。具体的には、Dのサイズが1の場合の半径をIとした場合、Dのサイズがnの場合の半径はI×(nの平方根)となる。
【0102】
(ステップS407)技術マップ構成部13は、iを1だけ増加させステップS402に戻る。
【0103】
なお、
図4のフローチャートは2次元の技術マップを出力するためのものであるが、3次元以上の技術マップを出力する場合も同様である。例えば、3次元の技術マップを出力する場合は、1番目の軸の項目[i]と2番目の軸の項目[j]と3番目の軸の項目[k](i,j,kはそれぞれ1~各軸の最後の項目までのすべての組み合わせ)のすべてに対応付けられている文書をすべて取得しDに代入し、当該Dに基づきバブルの半径を算出する。
【0104】
次に、ステップS208の項目削除処理の詳細の具体例について、
図5のフローチャートを用いて説明する。
【0105】
(ステップS501)分類変更部17は、文書識別子格納部113を走査し、削除対象項目と対応付けられている文書識別子をすべて取得し、Dに代入する。
【0106】
(ステップS502)軸変更部16は、項目識別子格納部112から削除対象項目の項目識別子を削除する。
【0107】
(ステップS503)分類変更部17は、カウンタiに1を代入する。
【0108】
(ステップS504)分類変更部17は、Dにi番目の文書(以下、文書[i])が存在する場合は、ステップS505へ進む。そうでない場合は、上位処理へリターンする。
【0109】
(ステップS505)分類変更部17は、文書[i]と最も高いスコアを達成する項目を対応付け、文書識別子格納部113に蓄積する。本ステップは、通常、
図3の対応決定処理のステップS307からステップS313と同様の処理により最もスコアの高い項目と対応付ける。この際、対象とする軸は削除対象項目と同じ軸であるとする。
【0110】
(ステップS506)分類変更部17は、カウンタiを1だけ増加させ、ステップS504に戻る。
【0111】
次に、ステップS210の項目追加処理の詳細の具体例について、
図6のフローチャートを用いて説明する。
【0112】
(ステップS601)軸変更部16は、項目識別子格納部112に、項目追加指示で指示された項目の項目識別子を追加する。以下、項目追加指示で指示された項目を追加項目と呼ぶ。
【0113】
(ステップS602)分類変更部17は、カウンタiに1を代入する。
【0114】
(ステップS603)分類変更部17は、文書情報格納部111に格納されるi番目の文書(以下、文書[i])が存在する場合は、ステップS604へ進む。そうでない場合は、上位処理へリターンする。
【0115】
(ステップS604)分類変更部17は、追加項目と同じ軸において、文書[i]と現在対応付けられている項目との間のスコアをscoreに代入する。ここで、スコアの求め方は、通常、
図3の対応決定処理と同様の方法を用いる。
【0116】
(ステップS605)分類変更部17は、文書[i]と追加項目との間のスコアをsに代入する。
【0117】
(ステップS606)分類変更部17は、sがscoreより大きい場合、ステップS607へ、そうでない場合、ステップS609へ進む。
【0118】
(ステップS607)分類変更部17は、文書識別子格納部113において、追加項目と同じ軸について、文書[i]と対応付けられている項目を削除する。
【0119】
(ステップS608)分類変更部17は、文書[i]と追加項目を対応付け、文書識別子格納部113に蓄積する。
【0120】
(ステップS609)分類変更部17は、カウンタiを1だけ増加させ、ステップS603へ戻る。
【0121】
以下、本実施の形態における技術マップ出力装置1の具体的な動作について説明する。
【0122】
本具体例において、文書情報格納部111は、
図7に示す文書情報管理表を格納している。文書情報管理表は、2以上の文書に関する情報のレコードを保持している。各レコードは、「ID」、「文書識別子」、「文書情報」の属性を有する。ここで、文書情報管理表ならびに後述する項目識別子管理表、文書識別子管理表に存在する「ID」は説明のためのレコードのIDであり、文書識別子ならびに項目識別子とは別物である。
【0123】
また、本具体例において、項目識別子格納部112は、
図8に示す項目識別子管理表を格納している。項目識別子管理表は、2以上の軸のそれぞれ2以上の項目に関するレコードを保持している。各レコードは、「ID」と「軸」と「項目識別子」の属性を有する。
【0124】
本具体例では、
図7の各文書をもとに、「課題」と「解決手段」を軸としてもつ技術マップを出力し、出力された技術マップの項目を編集する際の動作について説明する。
【0125】
はじめに、対応決定部12は、
図7の各文書と、課題・解決手段の各軸の項目との対応付けを行う(ステップS201)。本具体例では、予めコーパスを用いて各項目識別子を含む文書である確率を出力する識別器(Random Forest)を学習させた。すなわち、「消費電力」、「製造コスト」、「作業容易性」、「構成」、「素材」、「制御方法」のそれぞれを含む文書である確率を出力する合計6つの識別器を学習させた。そして、
図7のID1~6の各文書に対して6つの識別器をそれぞれ適用し(36パターン)、「課題」と「解決手段」のそれぞれで最も高い確率を出力した項目に文書を対応付けた。その結果、
図9のような文書識別子管理表が取得できる。対応決定部12は、
図9の文書識別子管理表を文書識別子格納部113に格納する。
【0126】
次に、技術マップ構成部13は、
図9の文書識別子管理表に基づき技術マップのバブルの半径を算出する(ステップS203)。例えば、「消費電力」と「制御方法」の交点に位置するバブルの場合、「消費電力」に対応付けられた文書群{文献1,文献4,文献5,文献6}と「制御方法」に対応付けられた文書群{文献5,文献6}の積集{文献5,文献6}を求めることで、バブルの半径を算出する。
【0127】
次に、技術マップ出力部14は、技術マップ構成部13が算出したバブルの半径をもとに技術マップ(バブルチャート)を出力する(ステップS204)。この結果、
図10のバブルチャートが出力される。
【0128】
以下、本具体例では、上記の
図10の技術マップに項目統合指示、項目削除指示、項目追加指示、項目名変更指示を行った際の各動作について説明する。
【0129】
(項目統合指示)
例えば、編集指示受付部15が、「課題」軸の「消費電力」と「製造コスト」を統合して、「エコ」にする指示を受け付けたとする(ステップS204,S205)。
【0130】
この場合、軸変更部16は、
図8のID1とID2の項目を統合し、ID7「エコ」を新たに生成する(ステップS206)。その結果、項目識別子格納部112に格納される項目識別子管理表は
図11のように変更される。
【0131】
さらに、分類変更部17は、
図9の「消費電力」と「製造コスト」に対応付けられていた文書のすべてを「エコ」に対応付ける(ステップS206)。その結果、文書識別子格納部113に格納される文書識別子管理表は
図12のように変更される。
【0132】
その後、技術マップ校正処理(ステップS202)を経て最終的に
図13の技術マップが出力される(ステップS203)。
【0133】
(項目削除指示)
また、例えば、編集指示受付部15が、「解決手段」軸の「素材」を削除する指示を受け付けたとする(ステップS204,S207)。
【0134】
この場合、はじめに、分類変更部17は、「素材」に対応付けられた文書を走査する(ステップS501)。その結果、{文献3,文献4}が取得される。
【0135】
次に、軸変更部16は、
図8の項目識別子管理表からID5を削除した、
図14のように項目識別子格納部112を変更する。
【0136】
次に、分類変更部17は、{文献3,文献4}のそれぞれに対して、「素材」の次に高いスコアを達成する「解決手段」軸の項目を探す。この結果、文献3と文献4は共に「構成」に対応付けられる(ステップS503からステップS506)。この結果、文書識別子格納部113は、
図15のように変更される。
【0137】
その後、技術マップ校正処理(ステップS202)を経て最終的に
図16の技術マップが出力される(ステップS203)。
【0138】
(項目追加指示)
また、例えば、編集指示受付部15が、「課題」軸に「電力効率」を追加する指示を受け付けたとする(ステップS204,S209)。
【0139】
この場合、はじめに、軸変更部16は、
図8の項目識別子管理表にID7「電力効率」を追加する(ステップS601)。この結果、項目識別子格納部112は、
図17の項目識別子管理表のように変更される。
【0140】
ここで、技術マップ出力装置1は、項目識別子格納部112を変更すると同時に、コーパスから「電力効率」を含む文書を収集し、他の項目と同様の方法を用いて「電力効率」を含む確率を出力する識別器を学習する。
【0141】
次に、分類変更部17は、
図7のID1からID6のすべての文書に対して、「電力効率」と対応付けられるかをチェックする(ステップS210)。具体的には、各文書に対して、現在対応付けられている「課題」軸の項目(文献1ならば「消費電力」)のスコア(ステップS604)と、「電力効率」のスコア(ステップS605)を比較し、「電力効率」のスコアの方が高い場合(ステップS606)、文書識別子格納部113から、現在対応付けられている項目を削除した上で(ステップS607)、「電力効率」と対応付ける(ステップS608)。本具体例の場合、「電力効率」と対応付けられる文書は文献4のみのため、文書識別子格納部113は、
図18のように変更される。
【0142】
その後、技術マップ校正処理(ステップS202)を経て最終的に
図19の技術マップが出力される(ステップS203)。
【0143】
(項目名変更指示)
また、例えば、編集指示受付部15が、「課題」軸の「作業容易性」を「ユーザビリティ」に変更する指示を受け付けたとする(ステップS204,S211)。
【0144】
この場合、軸変更部16は、
図8の項目識別子管理表のID3「作業容易性」を「ユーザビリティ」に変更する(ステップS212)。この結果、項目識別子格納部112は、
図20の項目識別子管理表のように変更される。項目識別子格納部112の変更に伴い、文書識別子格納部113も
図21のように変更される。
【0145】
その後、技術マップ校正処理(ステップS202)を経て最終的に
図22の技術マップが出力される(ステップS203)。
【0146】
以上、本実施の形態によれば、ユーザは一旦出力された技術マップの項目をインタラクティブに編集することができる。
【0147】
また、本実施の形態によれば、ユーザは、技術マップの編集において、項目の削除等の文書と項目の再対応付けが必要な場合においても、技術マップ出力装置1が自動的に対応付けを行うため、再対応付けの労力を省くことができる。
【0148】
また、本実施の形態によれば、技術マップ出力装置1は、ユーザが編集した項目に関連した文書識別子のみが変更されるため、技術マップのユーザが編集していない部分には変更が加えられない。そのため、ユーザが意図しない技術マップの変更は発生せず、ユーザはスムーズに技術マップを編集することが可能となる。
【0149】
なお、本実施の形態によれば、技術マップ出力装置1は、文書識別子格納部113において、一の文書識別子は各軸において2以上の項目識別子と対応付けても良い。この場合、
図3の対応決定処理において、ステップS307は、scoreに予め定めたスコアの閾値を代入し、ステップS311は、文書[j]と項目[k]の対応付けを行い、さらに、ステップS313は何も行わないように変更される。さらに、
図5の項目削除処理において、ステップS505は、前記変更した対応決定処理を用いてD[i]と削除された項目以外との対応付けを行うように変更しても良い。さらに、
図6の項目追加処理において、ステップS607は、何も行わないように変更する。
【0150】
なお、本実施の形態によれば、編集指示受付部15が編集指示を受け付けるたびに、
図3の対応決定処理を行っても良い。
【0151】
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。
【0152】
なお、本実施の形態における技術マップ出力装置を実現するソフトウェアは、以下のようなプログラムである。つまり、コンピュータがアクセス可能な記憶媒体は、文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部と、2次元以上の各軸の2以上の各項目を識別する項目識別子が格納される項目識別子格納部と、2次元以上の各次元に対応する2以上の項目識別子に対応付けて、1以上の文書識別子が格納される文書識別子格納部とを具備し、上記プログラムは、前記2以上の各文書情報を解析し、2次元以上の各次元に対応する項目識別子を文書情報ごとに取得し、当該文書情報を識別する文書識別子を、2次元以上の各次元に対応する2以上の項目識別子に対応付けて前記文書識別子格納部に蓄積する対応決定部と、前記2次元以上の各軸の2以上の項目識別子を有する軸を構成し、各軸の項目識別子に対応付いている文書識別子を用いて技術マップの内容である内容情報を構成し、前記軸と前記内容情報とを有する技術マップを構成する技術マップ構成部と、前記技術マップを出力する技術マップ出力部と、前記技術マップが有する軸の項目を編集する指示である編集指示を受け付ける編集指示受付部と、前記編集指示に応じて、前記軸を変更する軸変更部と、前記軸の変更に応じて、前記文書識別子格納部の1以上の文書識別子のうちの、編集指示に対応する項目に関連する文書識別子の、項目識別子への対応を変更する分類変更部として機能させ、さらに、前記技術マップ構成部は、前記軸変更部による軸の変更、および前記分類変更部による分類の変更に応じて、技術マップを変更し、前記技術マップ出力部は、前記変更された技術マップを出力するように機能させるためのプログラム、である。
【0153】
図23は、上記プログラムを実行して、上記実施の形態による技術マップ出力装置1等を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
【0154】
図23において、コンピュータシステム3000は、CD-ROMドライブ3005を含むコンピュータ3001と、キーボード3002と、マウス3003と、モニタ3004とを備える。
【0155】
図24は、コンピュータシステム3000の内部構成を示す図である。
図24において、コンピュータ3001は、CD-ROMドライブ3005に加えて、MPU(Micro Processing Unit)3011と、ブートアッププログラム等のプログラムを記憶するためのROM3012と、MPU3011に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM3013と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク3014と、MPU3011、ROM3012等を相互に接続するバス3015とを備える。なお、コンピュータ3001は、LANやWAN等への接続を提供する図示しないネットワークカードを含んでいてもよい。
【0156】
コンピュータシステム3000に、上記実施の形態による技術マップ出力装置1等の機能を実行させるプログラムは、CD-ROM3021に記憶されて、CD-ROMドライブ3005に挿入され、ハードディスク3014に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ3001に送信され、ハードディスク3014に記憶されてもよい。プログラムは実行の際にRAM3013にロードされる。なお、プログラムは、CD-ROM3021、またはネットワークから直接、ロードされてもよい。また、CD-ROM3021に代えて他の記録媒体(例えば、USBメモリ等)を介して、プログラムがコンピュータシステム3000に読み込まれてもよい。
【0157】
プログラムは、コンピュータ3001に、上記実施の形態による技術マップ出力装置1等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能やモジュールを呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム3000がどのように動作するのかについては周知であり、詳細な説明は省略する。
【0158】
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
【0159】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0160】
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0161】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0162】
以上のように、本発明にかかる技術マップ出力装置は、ユーザが容易に編集可能な技術マップを出力できるという効果を有し、技術マップ出力装置等として有用である。
【符号の説明】
【0163】
1 技術マップ出力装置
11 格納部
111 文書情報格納部
112 項目識別子格納部
113 文書識別子格納部
12 対応決定部
13 技術マップ構成部
14 技術マップ出力部
15 編集指示受付部
16 軸変更部
17 分類変更部