IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気通信システム株式会社の特許一覧 ▶ 国立大学法人 香川大学の特許一覧

特許7421187チェックリスト生成装置、チェックリスト生成方法、及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-16
(45)【発行日】2024-01-24
(54)【発明の名称】チェックリスト生成装置、チェックリスト生成方法、及びプログラム
(51)【国際特許分類】
   G06F 40/279 20200101AFI20240117BHJP
   G06F 40/216 20200101ALI20240117BHJP
【FI】
G06F40/279
G06F40/216
【請求項の数】 10
(21)【出願番号】P 2019171268
(22)【出願日】2019-09-20
(65)【公開番号】P2021047779
(43)【公開日】2021-03-25
【審査請求日】2022-08-08
(73)【特許権者】
【識別番号】000232254
【氏名又は名称】日本電気通信システム株式会社
(73)【特許権者】
【識別番号】304028346
【氏名又は名称】国立大学法人 香川大学
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】鎌田 典彦
(72)【発明者】
【氏名】喜田 弘司
【審査官】長 由紀子
(56)【参考文献】
【文献】特開2009-048500(JP,A)
【文献】尾崎 敏司,情報セキュリティに関連するガイドラインのDoc2Vecを用いた文書内容の可視化手法の提案とその評価,情報処理学会 研究報告 コンピュータセキュリティ(CSEC) 2019-CSEC-086 [online],日本,情報処理学会,2019年07月16日,pp.1-7
【文献】伊藤 信治 外3名,公共業務システム開発における法令からの要件の検出/検証手法の提案,情報処理学会研究報告 2012(平成24)年度6 [DVD-ROM] 情報処理学会研究報告 研究報告 ソフトウェア工学(SE) No.179,日本,一般社団法人情報処理学会,2013年03月12日,pp.1-6
【文献】岡田 康裕 外3名,設計品質向上・開発力強化のための設計書チェック 技術とその応用ソリューション“naviQ” ,三菱電機技報,三菱電機エンジニアリング株式会社,2007年07月25日,第81巻 第7号,pp.23-26
【文献】岡田 英彦、旭 敏之,GUIのユーザビリティ・マップの開発,第56回(平成10年前期)全国大会講演論文集(4) インタフェース コンピュータと人間社会,社団法人情報処理学会,1998年03月17日,pp.4-78~4-79
【文献】野口 進祐 外2名,参照情報を利用した文書特徴量抽出方式,電子情報通信学会技術研究報告,第100巻 第91号,日本,社団法人電子情報通信学会,2000年05月19日,pp.49-54
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-58
(57)【特許請求の範囲】
【請求項1】
生成対象のチェックリストのもとになるガイドライン文書を入力する入力部と、
前記入力部で入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出部と、
前記特徴抽出部で抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定部と、
前記対象判定部で判定された前記要件文と前記非要件文との類似度を判定する類似度判定部と、
前記類似度判定部での判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成部と、
を備えた、チェックリスト生成装置。
【請求項2】
前記入力部は、前記ガイドライン文書として、チェックすべき項目がリストアップされたリスト形式ガイドライン文書と、チェックすべき項目の背景又は具体例を含む読み物として記述された読み物形式ガイドライン文書と、を入力し、
前記特徴抽出部は、前記読み物形式ガイドライン文書に含まれる各文章の特徴を抽出し、
前記対象判定部は、前記特徴抽出部で抽出された特徴に基づき、前記読み物形式ガイドライン文書における前記要件文と前記非要件文とを判定し、
前記類似度判定部は、前記リスト形式ガイドライン文書の各項目と、前記対象判定部で判定された前記読み物形式ガイドライン文書の前記要件文及び前記非要件文との類似度を判定し、
前記リスト生成部は、前記類似度判定部での判定結果に基づき、前記リスト形式ガイドライン文書の各項目に前記読み物形式ガイドラインの少なくとも前記非要件文を対応付けて、前記チェックリストを生成する、
請求項1に記載のチェックリスト生成装置。
【請求項3】
前記対象判定部は、前記特徴抽出部で抽出された特徴に基づき、前記読み物形式ガイドライン文書における前記要件文と前記非要件文とを判定し、前記非要件文については、前記項目についての、具体例に該当するか及び背景に該当するか前記特徴抽出部で抽出された特徴に基づき判定し、具体例及び背景の少なくとも1つに該当する場合には、該当することを示すように前記非要件文にタグ付けする
請求項2に記載のチェックリスト生成装置。
【請求項4】
前記リスト生成部は、前記対象判定部でタグ付けされた結果に基づき、前記リスト形式ガイドライン文書の項目に前記読み物形式ガイドラインの前記非要件文を対応付けて、前記チェックリストを生成する、
請求項3に記載のチェックリスト生成装置。
【請求項5】
前記特徴抽出部は、前記リスト形式ガイドライン文書及び前記読み物形式ガイドライン文書と別の文書である参考文献についてのリンク先を、前記リスト形式ガイドライン文書及び前記読み物形式ガイドライン文書から抽出する処理を行う
請求項2から4のいずれか1項に記載のチェックリスト生成装置。
【請求項6】
前記類似度判定部は、前記リンク先に基づき、前記類似度を判定する、
請求項5に記載のチェックリスト生成装置。
【請求項7】
前記リスト生成部は、前記類似度判定部での判定の結果、前記読み物形式ガイドライン文書のいずれの文章とも類似していない前記リスト形式ガイドライン文書の項目も、前記チェックリストに加える、
請求項2から6のいずれか1項に記載のチェックリスト生成装置。
【請求項8】
前記リスト生成部は、前記類似度判定部での判定の結果、前記リスト形式ガイドライン文書のいずれの項目とも類似していない前記読み物形式ガイドライン文書の文章も、前記チェックリストに加える、
請求項2から7のいずれか1項に記載のチェックリスト生成装置。
【請求項9】
コンピュータが、生成対象のチェックリストのもとになるガイドライン文書を入力する入力ステップと、
前記コンピュータが、前記入力ステップで入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出ステップと、
前記コンピュータが、前記特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定ステップと、
前記コンピュータが、前記対象判定ステップで判定された前記要件文と前記非要件文との類似度を判定する類似度判定ステップと、
前記コンピュータが、前記類似度判定ステップでの判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成ステップと、
を備えた、チェックリスト生成方法。
【請求項10】
コンピュータに、
生成対象のチェックリストのもとになるガイドライン文書を入力する入力ステップと、
前記入力ステップで入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定ステップと、
前記対象判定ステップで判定された前記要件文と前記非要件文との類似度を判定する類似度判定ステップと、
前記類似度判定ステップでの判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成ステップと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、チェックリスト生成装置、チェックリスト生成方法、及びプログラムに関する。
【背景技術】
【0002】
特許文献1,2には、セキュリティポリシーに関し、チェック対象である要件がリスト化されたもの(以下、チェックリスト)をデータベースなどに予め登録しておき、対象となる商品や条件に合わせて、必要な要件リストの項目を選択する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2006-172169号公報
【文献】特開2006-172181号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1,2に記載の技術は、チェックを行う要件が1つ1つの項目に分かれている状態であること、即ち、既に人が要件をリスト化(チェックリスト化)していることが前提となっている。
【0005】
つまり、特許文献1,2に記載の技術では、チェックリストの作成、条件で絞り込むための付帯情報の付加や登録作業を人にさせておいたうえで、それを元に単に選択を行っているに過ぎない。このような、人が行っている作業の部分こそが、高い能力が求められ、作業負荷も高く、また抜け漏れミスなどが許されない。よって、特許文献1,2に記載の技術では、これらの点を解決するといった課題が残る。
【0006】
具体的には、要件が文章で書かれたガイドライン文書からチェックリストを得るには次の工程1~5のような作業が必要であり、それぞれの工程において以下に示すような課題がある。
【0007】
[工程1:文章を読む]
例えば、病院で使われる医療機器や、自動車などはIoT(Internet of Things)化等のIT(Information Technology)化が進んでいる。つまり、医療機器や自動車は、ネットワークに接続されて情報の送受がなされており、またその処理にはソフトウェアが使用されている。このような製品のソフトウェアの品質やセキュリティなどを試験する場合に、人が読む必要があるのは、ソフトウェアやセキュリティに関するガイドラインにとどまらず、試験対象製品の関連法規や、その製品が利用される業界のガイドラインなど多岐にわたる。よって、人が読まなければならないガイドラインの量が多すぎ、これを如何にして省力化するかが課題となっている。
【0008】
[工程2:文章の内容を理解する]
工程1で説明した通り、チェックリストを得るには多くのガイドラインを読む必要があり、それに伴い、ガイドラインを理解する工程においても、ガイドラインの理解を如何にして省力化するかが課題となっている。例えば、一般にソフトウェアを開発している人は、他分野である自動車のガイドラインや医療のガイドライン、あるいは他業界の法規などには通じていないため、理解するのが難しいという課題がある。また、ソフトウェアと医療といった、異なる複数の業種、業界に通じた人材、複数の専門知識に長じた人材を、容易に得難いという事情もあり、読むべきガイドラインが多いという課題と相まって、ガイドラインを人が処理しきれないという課題がある。
【0009】
また、そもそも、理解することが難しい分野のガイドラインを、その専門分野の当業者以外がソフトウェア試験やセキュリティ評価に使いやすくする方法の一つが、チェックリスト化である。しかしながら、例えば、医療分野の当業者が、ソフトウェアの試験やセキュリティの評価に使いやすいチェックリストを作成できるわけではない。そのため、医療分野に詳しくないソフトウェア技術者が、医療分野に詳しくないソフトウェア技術者のために、医療機器のソフトウェア試験で使うためのチェックリストを整備するという矛盾が生じる。よって、当業者以外であっても、理解が難しいガイドラインから如何にしてチェックリストを作成できるようにするかも課題となる。
【0010】
[工程3:文章の内容から要件を示す記述と要件以外を示す記述(補足説明、事例、具体例など)を見分ける]
ガイドラインからチェックリストを作成するためには、ガイドラインに書かれた文章を読み、文章を構成している文が、要件を表すのか、あるいは、要件以外の、例えば補足説明、事例、具体例などを表しているのかを見分けて、分類、抽出する必要がある。この工程では、工程1で説明した処理量と人のスループットの問題、工程2で説明した理解の難しさの問題及び人材確保の難しさの問題に加え、人の理解度や状態によって分類や抽出の結果が変わってしまうといった問題がある。さらに、この工程を実施する人の能力やガイドラインの分野への造詣の深さ、体調などによって分類や抽出の結果にばらつきや抜け、漏れ、ミスが生じる恐れもある。よって、工程3に関し、分類、抽出結果の質を如何にして均一に保つか、如何にして抜け、漏れ、ミスを減らすかが課題となる。
【0011】
[工程4:要件を示す記述をチェックリスト化する]
工程4においても、工程1で説明した問題と同様に処理量と人のスループットの問題があり、これを如何にして自動化するかが課題となる。
【0012】
[工程5:チェックリスト利用者の理解を助ける目的で、各要件のみのチェックリストの各項目に対し関連する解説などの記述を付記する]
工程5においても、工程1で説明した課題と同様に処理量と人のスループットの問題があり、これを如何にして自動化するかが課題となる。特にこの工程5では、要件の説明や、解説に相当する文が必ずしも、要件文のそばに配置されているとは限らないため、ある要件に対する説明を、同じ文章の広い範囲から、探し出す必要があり、読むべきガイドラインの量の問題が顕著に表れる。
【0013】
以上のように、文章形式で提供されるガイドライン文書から人がその内容を理解し、試験などの特定のトピックに関する記述を抽出して、分かり易くチェックリスト化する作業を自動化することが求められる。
【0014】
本開示の目的は、ガイドライン文書を人が読む必要なく、そのガイドライン文書をもとに分かり易いチェックリストを生成することが可能なチェックリスト生成装置、チェックリスト生成方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0015】
本開示の第1の態様に係るチェックリスト生成装置は、生成対象のチェックリストのもとになるガイドライン文書を入力する入力部と、前記入力部で入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出部と、前記特徴抽出部で抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定部と、前記対象判定部で判定された前記要件文と前記非要件文との類似度を判定する類似度判定部と、前記類似度判定部での判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成部と、を備えた、ものである。
【0016】
本開示の第2の態様に係るチェックリスト生成方法は、生成対象のチェックリストのもとになるガイドライン文書を入力する入力ステップと、前記入力ステップで入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出ステップと、前記特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定ステップと、前記対象判定ステップで判定された前記要件文と前記非要件文との類似度を判定する類似度判定ステップと、前記類似度判定ステップでの判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成ステップと、を備えた、ものである。
【0017】
本開示の第3の態様に係るプログラムは、コンピュータに、生成対象のチェックリストのもとになるガイドライン文書を入力する入力ステップと、前記入力ステップで入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出ステップと、前記特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定ステップと、前記対象判定ステップで判定された前記要件文と前記非要件文との類似度を判定する類似度判定ステップと、前記類似度判定ステップでの判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成ステップと、を実行させるためのプログラムである。
【発明の効果】
【0018】
本開示により、ガイドライン文書を人が読む必要なく、そのガイドライン文書をもとに分かり易いチェックリストを生成することが可能なチェックリスト生成装置、チェックリスト生成方法、及びプログラムを提供することができる。
【図面の簡単な説明】
【0019】
図1】実施形態1に係るチェックリスト生成装置の一構成例を示すブロック図である。
図2】実施形態2に係るチェックリスト生成装置の一構成例を示すブロック図である。
図3図2のチェックリスト生成装置における処理例を説明するためのフロー図である。
図4図3の処理例で入力されるガイドライン文書中の文章一覧の例を示す図である。
図5図3の処理例で抽出される文章特徴ベクトルの一例を示す図である。
図6図3の処理例で抽出される要件文の文章特徴ベクトルの一例を示す図である。
図7図3の処理例における類似度判定結果の一例を示す図である。
図8図3の処理例において生成されるチェックリストの一例を示す図である。
図9】実施形態3に係るチェックリスト生成装置の一構成例を示すブロック図である。
図10図9のチェックリスト生成装置における処理例を説明するためのフロー図である。
図11図10の処理例で入力されるリスト形式セキュリティガイドライン文書の一覧の例を示す図である。
図12図10の処理例で抽出されるリスト特徴ベクトルの一例を示す図である。
図13】実施形態4に係るチェックリスト生成装置の一構成例を示すブロック図である。
図14図13のチェックリスト生成装置における処理例を説明するためのフロー図である。
図15図14の処理例でタグ付けされた結果の一例を示す図である。
図16図14の処理例において生成されるチェックリストの一例を示す図である。
図17】実施形態5に係るチェックリスト生成装置の一構成例を示すブロック図である。
図18図17のチェックリスト生成装置における処理例を説明するためのフロー図である。
図19図18の処理例において参考文献の参照を確認した結果の一例を示す図である。
図20図18の処理例における類似度判定結果の一例を示す図である。
図21】実施形態6に係るチェックリスト生成装置の一構成例を示すブロック図である。
図22図21のチェックリスト生成装置における処理例を説明するためのフロー図である。
図23図22の処理例において参照される同義語辞書の一例を示す図である。
図24】実施形態7に係るチェックリスト生成装置の一構成例を示すブロック図である。
図25図24のチェックリスト生成装置における処理例を説明するためのフロー図である。
図26図25の処理例において生成される拡張チェックリストの一例を示す図である。
図27】装置のハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0020】
以下、図面を参照して、実施形態について説明する。なお、実施形態において、同一又は同等の要素には、同一の符号を付すことがあり、重複する説明は適宜省略される。
【0021】
<実施形態1>
図1は、実施形態1に係るチェックリスト生成装置の一構成例を示すブロック図である。
図1に示すように、本実施形態に係るチェックリスト生成装置1は、入力部1a、特徴抽出部1b、対象判定部1c、類似度判定部1d、及びリスト生成部1eを備えることができる。
【0022】
入力部1aは、生成対象のチェックリストのもとになるガイドライン文書を入力する。入力の経路は問わず、例えばチェックリスト生成装置1の内部に設けた記憶装置からの入力であっても、チェックリスト生成装置1にネットワークを介して接続されたサーバ装置に設けた記憶装置からの入力であってもよい。
【0023】
特徴抽出部1bは、入力部1aで入力されたガイドライン文書を分析し、ガイドライン文書に含まれる各文章の特徴を抽出する。なお、ここで文章の特徴は、句読点で区切られる文書に限らない。例えば、ガイドライン文書における文章には、箇条書きで記述された項目なども含まれるためである。
【0024】
対象判定部1cは、特徴抽出部1bで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する。特徴抽出部1b及び対象判定部1cにより、文章形式のガイドライン文書を構成する各文を、要件を表す要件文と事例や解説等を表す文などの非要件文(換言すれば解説文)といった形で、各文の役割を見分けて分類することができる。
【0025】
そして、類似度判定部1dは、対象判定部1cで判定された要件文と非要件文との類似度を判定する。リスト生成部1eは、類似度判定部1dでの判定結果に基づき、要件文に非要件文を対応付けたチェックリストを生成する。このように、リスト生成部1eは、上記特徴により分類された文の集合から抽出され、類似度により対応付けられた要件文及び非要件文から自動でチェックリスト(要件のリスト)を生成する。例えば、上記特徴により自動で生成された要件文のみのチェックリストに対し、同時に分類しておいた非要件文のうち、要件文の説明に対応する解説文等の非要件文を対応付けることで、理解し易い解説付きチェックリスト(要件リスト)を、自動で生成する。
【0026】
ここでは、入力部1aで入力されるガイドライン文書が1つであることを前提として説明したが、複数であってもよく、その場合、リスト生成部1eは、入力された複数のガイドライン文書について、要件文に非要件文を対応付けたチェックリストを生成すればよい。
【0027】
また、特徴抽出部1b、対象判定部1c、類似度判定部1d、及びリスト生成部1eは、チェックリスト生成装置1の全体を制御する制御部に含めておくことができる。この制御部は、例えば、CPU(Central Processing Unit)、作業用メモリ、及びプログラムを記憶した不揮発性の記憶装置などによって実現することができる。このプログラムは、チェックリスト生成ソフトウェアとすることができる。また、この制御部は、例えば集積回路(Integrated Circuit)によって実現することもできる。
【0028】
以上に説明したように、本実施形態では、ガイドライン文書をもとにチェックリストを生成するに際し、人がそのガイドライン文書を読む必要がない。また、本実施形態で生成されたチェックリストには要件文に対応付けて非要件文(要件文を分かり易く説明するような文)が含まれるため、本実施形態では、チェック者にとって分かり易いチェックリストが生成できると言える。このように、本実施形態に係るチェックリスト生成装置1によれば、ガイドライン文書を人が読む必要なく、そのガイドライン文書をもとに分かり易いチェックリストを生成することが可能になる。換言すれば、本実施形態によれば、人手によるチェックリストの作成作業を自動化することができ、これにより上述した工程1~5の課題を全て解決することができる。
【0029】
また、本実施形態に係るチェックリスト生成装置1は、その機能の一部を1又は複数の装置(サーバ装置等)に分散して構築することもできる。
【0030】
なお、上述したチェックリストは、設計の分野では、設計要件のリストとして使われるが、製品などの試験やソフトウェアの評価、セキュリティのチェックなどで使う場合は、試験観点のリスト、試験項目のリストなどとして使われる。チェックリストは、ある求められた要件に対し、充足しているか否かを確認する目的で用いられるリストであり、要件リスト、試験観点のリスト、試験項目のリストなど、様々な呼び名が存在するが、いずれのリストも本質的に同じである。よって、チェックリストの生成について言及している特徴は、試験観点のリスト、試験項目のリスト、要件リストなどの生成全般についても同様である。
【0031】
ここで、ガイドライン文書について例を挙げて説明する。ガイドライン文書としては、例えば、公的機関の発行する規定や規格やガイド、開発対象あるいは試験対象の仕様書などが挙げられる。また、セキュリティ用途であれば、ガイドライン文書としては、セキュリティガイドラインや過去の障害事例などとして、文章形式で提供される文書が挙げられる。より具体的には、ガイドライン文書としては、例えば、以下のようなものが挙げられる。
【0032】
・評価をする対象のシステムの仕様書
・システムで使用している技術に関する既知の不具合に関する文書
例:<https://support.microsoft.com/ja-jp/help/4015397>
【0033】
・政府や公的機関が発行する文書
例:NIST(National Institute of Standards and Technology) SP800シリーズ<https://www.ipa.go.jp/security/publications/nist/index.html>、独立行政法人情報処理推進機構(IPA)によって発行された各種ガイド類<https://www.ipa.go.jp/security/vuln/index.html>
【0034】
・業界団体、コンソーシアムが発行するガイドライン
例:一般社団法人重要生活機器連携セキュリティ協議会(CCDS)のガイドライン<https://www.ccds.or.jp/public_document/index.html>
【0035】
・Webなどで開示されている障害事例などの情報
例:<https://www.ipa.go.jp/security/vuln/10threats2019.html>、<https://jvndb.jvn.jp/index.html>
【0036】
これらの例から分かるように、本実施形態で生成されるチェックリストは、ソフトウェア、ハードウェア、機械、などに対する、試験、点検、セキュリティ評価、セキュリティアセスメント、品質試験、審査、監査等のリストとすることができる。さらに、本実施形態で生成されるチェックリストは、食品や農産物に対する品質試験、審査、監査等のリストとすることもでき、また、人などに対する健康診断、問診等のリストとすることもできる。このように、本実施形態は、チェックリストが用いられるような業務全般で、利用されることができる。
【0037】
<実施形態2>
実施形態2について、図2図8を参照しながら、実施形態1との相違点を中心に説明するが、実施形態1で説明した様々な例が適用できる。図2は、実施形態2に係るチェックリスト生成装置の一構成例を示すブロック図である。
【0038】
図2に示すように、本実施形態に係るチェックリスト生成装置10は、文章形式GL入力部11、文章特徴ベクトル生成部12、解説文抽出部13、要件文抽出部14、類似度判定部15、チェックリスト生成部16、及び記憶部17を備えることができる。
【0039】
文章形式GL入力部11は、入力部1aの一例であり、文章形式のセキュリティGL(ガイドライン)文書を入力する。文章形式のセキュリティGL文書は、チェックリストのもとになるガイドラインの文書であり、且つチェックすべき要件、要件の背景や具体例などが読み物として記述された、文章形式のガイドライン文書である。
【0040】
文章特徴ベクトル生成部12は、特徴抽出部1bの一例であり、文章形式GL入力部11で入力された文章形式のセキュリティGL文書を分析し、その文書に含まれる各文章の特徴ベクトルを生成することで、各文章の特徴を抽出する。特徴ベクトルの生成の方法やどのような特徴を示す特徴ベクトルを採用するかは問わず、後段で要件文と解説文(説明や具体例など)とが判別できるような特徴ベクトルを採用しておけばよい。なお、生成される特徴ベクトルの次元数は、2以上であればよく、つまり特徴ベクトルは2つ以上の特徴が表現できればよい。
【0041】
解説文抽出部13及び要件文抽出部14は、対象判定部1cの一例である。解説文抽出部13は、生成された特徴ベクトルに基づき、非チェック対象である非要件の特徴を有する非要件文(この例では解説文)を抽出することで、抽出したものが解説文であると判定する。つまり、解説文抽出部13は、文章特徴ベクトル生成部12で求めた文の特徴を示す特徴ベクトルをもとに、非要件(説明や具体例など)を表す文を抽出する。
【0042】
要件文抽出部14は、生成された特徴ベクトルに基づき、チェック対象となる要件の特徴を有する要件文を抽出することで、抽出したものが要件文であると判定する。つまり、要件文抽出部14は、文章特徴ベクトル生成部12で求めた文の特徴を示す特徴ベクトルをもとに、要件を表す文を抽出する。
【0043】
類似度判定部15は、類似度判定部1dの一例であり、解説文抽出部13で判定された非要件文である解説文と要件文抽出部14で判定された要件文との類似度を判定する。例えば、類似度判定部15は、要件文抽出部14が出力する要件文と解説文抽出部13が出力する解説文との関連性を算出し、算出された結果に基づき類似度を判定する。類似度の判定は、基本的に解説文と要件文との全ての組合せについて行われる。
【0044】
チェックリスト生成部16は、リスト生成部1eの一例であり、類似度判定部15での判定結果に基づき、要件文に解説文を対応付けたチェックリストを生成し、記憶部17に記憶させるように、記憶部17に出力する。
【0045】
記憶部17に記憶されるチェックリストは、類似度判定部15での判定結果から、文章形式セキュリティガイドライン文書から得られた、要件文と解説文とを対応付け、要件文を解説文で補足する形式のチェックリストとなる。生成されるチェックリストにおいて、ある要件文にはその要件文との類似度が一定レベル以上である解説文が対応付けられることになる。1つの要件文に対応付けられる解説文は1つに限ったものではなく、場合によっては、2つ以上の要件文に1つの解説文が対応付けられることがあり、逆に1つの要件文に2つ以上の解説文が対応付けられることもある。
【0046】
なお、本実施形態においても、実施形態1で説明したように入力されるガイドライン文書は複数であってもよく、その場合、チェックリスト生成部16は、入力された複数のガイドライン文書について、要件文に非要件文を対応付けたチェックリストを生成する。生成されるチェックリストでは、例えば、あるガイドライン文書から抽出された要件文のリストと別のガイドライン文書から抽出された非要件文及び/又は要件文とを対応付けることも可能である。
【0047】
チェックリスト生成装置10の処理例について、図3図8を併せて参照しながら説明する。図3は、チェックリスト生成装置10における処理例を説明するためのフロー図である。図4は、図3の処理例で入力されるガイドライン文書中の文章一覧の例を示す図である。図5は、図3の処理例で抽出される文章特徴ベクトルの一例を示す図で、図6は、図3の処理例で抽出される要件文の文章特徴ベクトルの一例を示す図である。また、図7は、図3の処理例における類似度判定結果の一例を示す図で、図8は、図3の処理例において生成されるチェックリストの一例を示す図である。
【0048】
まず、文章形式GL入力部11が、文章形式セキュリティGL文書(以下、文章形式GL)を入力し、文章リストを生成して、文章特徴ベクトル生成部12に出力する(ステップS11)。出力される文章リストは、例えば図4に示す文章一覧のように各文章(F112)に文章ID(F111)が付されたリストとすることができる。
【0049】
次いで、文章特徴ベクトル生成部12が、その文章形式GL中の各文章について特徴ベクトルを生成する(ステップS12)。ここで、文章特徴ベクトル生成部12は、例えば、特徴ベクトルを予め定義しておき、処理対象の文章に対応する数値に変換する。より具体的な例を挙げる。例えば、文章特徴ベクトル生成部12は、あるキーワードを含んでいる場合に「1」に変換し、含んでいない場合に「0」に変換する。また、例えば、文章特徴ベクトル生成部12は、文末が「こと」で終わっている場合に「1」、終わっていない場合に「0」に変換する。
【0050】
例えば、文章特徴ベクトル生成部12は、図4に示す文章リストの各文章を入力し、図5に示す文章特徴ベクトルの一覧のように、文章ID(F121)にその文章IDが示す文章についての文章特徴ベクトル(F122)を関連付けたリストを出力する。
【0051】
次いで、要件文抽出部14、解説文抽出部13が、それぞれ要件文の抽出、解説文の抽出を行う(ステップS13)。なお、要件文の抽出と解説文の抽出は同時並行で行うことができるが、一方の処理後、他方の処理を行うこともできる。
【0052】
例えば、要件文抽出部14は、図5に示す文章特徴ベクトルのリストを入力し、文章特徴ベクトルを要件文とそれ以外の文章とにクラスタリングし、図6に示すような要件文のみのリストを出力する。図6のリストにおいて、データのフィールドは入力される図5のリストと同じであり、レコードは要件文についてのみが残るようにフィルタリングされている。
【0053】
同様に、解説文抽出部13は、図5に示す文章特徴ベクトルのリストを入力し、文章特徴ベクトルを要件文とそれ以外の文章(解説文)とにクラスタリングするか、或いは解説文とそれ以外の文章とにクラスタリングする。なお、前者の処理は要件文以外が解説文であることを前提とする処理であるため、後者の処理を採用する方がより好ましいと言える。そして、解説文抽出部13は、図6と同様の形式の解説文のみのリストを出力する。解説文抽出部13から出力されるリストにおいて、データのフィールドは入力される図5のリストと同じであり、レコードは解説文についてのみが残るようにフィルタリングされている。
【0054】
次いで、類似度判定部15が、要件文抽出部14から出力された要件文のリスト(特徴ベクトルを含む)と解説文抽出部13から出力された解説文のリスト(特徴ベクトルを含む)とを入力する。そして、類似度判定部15が、前者の文章ID(要件に係る文章ID)と後者の文章ID(解説に係る文章ID)の組み合わせ全体に対し、ベクトルの内積を求めるなどして両者の類似度を判定する(ステップS14)。
【0055】
例えば、類似度判定部15は、図7に示すテーブルのように、要件に係る文章ID(T000007等)と解説に係る文章ID(L000001等)との組合せの全てについて、類似度を算出する(類似度を判定する)。
【0056】
次いで、チェックリスト生成部16が、ある類似度以上(この閾値は予め設定されることができる)の要件に係る文章IDと解説に係る文章IDとを対応付けて、チェックリストを生成し、記憶部17に記憶させる(ステップS15)。生成されるチェックリストは、例えば図8に示すように、チェック対象を示すチェックID(F161)に、そのチェックIDが示す要件(チェック項目)を示すリスト(F162)とその項目を解説する解説文である文章(F163)とが関連付けられている。
【0057】
例えば、図7に示すテーブルにおいて、類似度が5200以上となる要件に係る文章IDと解説に係る文章IDとの組合せについて、それらを対応付ける場合について説明する。この例の場合、図7のテーブルからはT000103とL000001とが対応付けられ、T000102とL000002とが対応付けられ、T000022とL000004とが対応付けられる。つまり、図7のテーブルからは合計3つの項目についての要件文及び解説文がチェックリストに含まれるようになる。
【0058】
以上に説明したように、本実施形態に係るチェックリスト生成装置10によれば、実施形態1の効果と同様に、ガイドライン文書を人が読む必要なく、そのガイドライン文書をもとに分かり易いチェックリストを生成することが可能になる。
【0059】
なお、本実施形態では、セキュリティガイドライン文書をもとにチェックリストを生成する例を挙げたが、入力となるガイドライン文書は、実施形態1で説明した通り、セキュリティ向けのガイドライン文書に限らず、一般的なガイドライン文書とすることができる。また、入力となるガイドライン文書は、複数のガイドライン文書であっても構わない。
【0060】
<実施形態3>
実施形態3について、図9図12を参照しながら、その効果も含めた実施形態1,2との相違点を中心に説明する。実施形態3は、実施形態1,2で説明した様々な例が適宜利用できる。図9は、実施形態3に係るチェックリスト生成装置の一構成例を示すブロック図である。
【0061】
図9に示す本実施形態に係るチェックリスト生成装置20は、実施形態1,2で簡単に説明したようにガイドライン文書として複数の文書を用いてチェックリストを生成する。特に、本実施形態では、ガイドライン文書として、リスト形式セキュリティGL文書と読み物形式セキュリティGL文書とから、チェックリストを生成する。なお、リスト形式セキュリティGL文書(以下、リスト形式GL)はチェックすべき項目(要件に相当)がリストアップされたリスト形式ガイドライン文書の一例である。また、読み物形式セキュリティGL文書(以下、文章形式GL)はチェックすべき項目の背景又は具体例を含む読み物として記述された読み物形式ガイドライン文書の一例である。
【0062】
そのため、本実施形態に係るチェックリスト生成装置20は、図9に示すように、文章形式GL入力部21a、リスト形式GL入力部21b、文章特徴ベクトル生成部22a、及びリスト特徴ベクトル生成部22bを備えることができる。また、チェックリスト生成装置20は、要件文抽出部24、類似度判定部25、チェックリスト生成部26、及び記憶部17を備えることができる。
【0063】
文章形式GL入力部21a及びリスト形式GL入力部21bは入力部1aの一例に相当する。リスト形式GL入力部21bは、リスト形式GLを入力してそこに含まれる文章のリストを出力するが、ここでは入力されたリスト形式GLをそのまま出力してもよい。文章形式GL入力部21aは、文章形式GLを入力してそこに含まれる文章のリストを出力する。
【0064】
文章特徴ベクトル生成部22a及びリスト特徴ベクトル生成部22bは、特徴抽出部1bの一例である。文章特徴ベクトル生成部22aは、文章形式GLに含まれる各文章の特徴ベクトルを生成することで、各文章の特徴を抽出する。また、リスト特徴ベクトル生成部22bは、リスト形式GLに含まれる各文章(つまり、チェック対象の各項目)の特徴ベクトルを生成することで、各項目の特徴を抽出する。
【0065】
要件文抽出部24は、対象判定部1cの一例であり、文章特徴ベクトル生成部22aで抽出された特徴に基づき、文章形式GLにおける要件文と非要件文とを判定する。なお、リスト形式GLについては、基本的に非要件文を含まず、要件文が項目として含まれるのみであることを前提として説明している。但し、非要件文を含むリスト形式GLを入力する場合には、要件文抽出部24と同様の処理をリスト形式GLの文章に対して実行する部位を、チェックリスト生成装置20に設けておけばよい。
【0066】
類似度判定部25は、類似度判定部1dの一例であり、リスト形式GLの各項目と、要件文抽出部24で判定された文章形式GLの要件文及び非要件文との類似度を判定する。ここで、類似度判定部25は、リスト特徴ベクトル生成部22bで生成された特徴ベクトルと、文章形式GLの要件文及び非要件文についての特徴ベクトルと、に基づき、類似度を判定することができる。
【0067】
チェックリスト生成部26は、リスト生成部1eの一例であり、類似度判定部25での判定結果に基づき、リスト形式GLの各項目に読み物形式ガイドラインの少なくとも非要件文を対応付けて、チェックリストを生成し、記憶部17に記憶させる。なお、チェックリスト生成部26は、類似度判定部25での判定結果に基づき、リスト形式GLの各項目に文章形式GLの非要件文及び要件文を対応付けて、チェックリストを生成することもできる。
【0068】
チェックリスト生成装置20の処理例について、図10図12を併せて参照しながら説明する。図10は、チェックリスト生成装置20における処理例を説明するためのフロー図である。図11は、図10の処理例で入力されるリスト形式セキュリティガイドライン文書の一覧の例を示す図で、図12は、図10の処理例で抽出されるリスト特徴ベクトルの一例を示す図である。
【0069】
まず、文章形式GL入力部21aが、図3のステップS11と同様に、文章形式GLを入力し、文章リストを生成して、文章特徴ベクトル生成部22aに出力する(ステップS21)。次いで、文章特徴ベクトル生成部22aが、図3のステップS12と同様に、その文章形式GL中の各文章について特徴ベクトルを生成する(ステップS22)。例えば、文章特徴ベクトル生成部22aは、図4に示す文章リストの各文章を入力し、図5に示す文章特徴ベクトルの一覧のように、文章ID(F121)にその文章IDが示す文章についての文章特徴ベクトル(F122)を関連付けたリストを出力する。
【0070】
次いで、要件文抽出部24が要件文の抽出及び非要件文の抽出を行う(ステップS23)。例えば、要件文抽出部24は、図5に示す文章特徴ベクトルのリストを入力し、文章特徴ベクトルを要件文とそれ以外の文章とにクラスタリングし、図6に示すような要件文のみのリストを出力する。同様に、要件文抽出部24は、図2の解説文抽出部13の処理と同様に、図5に示す文章特徴ベクトルのリストを入力し、文章特徴ベクトルを要件文とそれ以外の文章(解説文)とにクラスタリングするか、或いは解説文とそれ以外の文章とにクラスタリングする。そして、要件文抽出部24は、図6と同様の形式の解説文のみのリストを出力する。
【0071】
次いで、リスト形式GL入力部21bがリスト形式GLを入力してそこに含まれる文章のリストを、リスト特徴ベクトル生成部22bに出力する(ステップS24)。出力されるリストは、例えば図11に示すリスト一覧のように各リスト(F21b2)にリストID(F21b1)が付されたリストとすることができる。
【0072】
リスト特徴ベクトル生成部22bは、このようなリストを入力し、リスト形式GLに含まれる各文章(つまり、チェック対象の各項目)の特徴ベクトルを生成する(ステップS25)。例えば、リスト特徴ベクトル生成部22bは、図11に示すリストの各項目を入力し、図12に示すリスト特徴ベクトルの一覧のようなリストを出力する。図12に示すリストは、リストID(F22b1)にそのリストIDが示すリスト(項目)についてのリスト特徴ベクトル(F22b2)を関連付けたリストである。なお、ステップS21~S23の処理と、ステップS24~S25の処理とは、逆の順序で実行してもよいし、同時並行で実行してもよい。
【0073】
次いで、類似度判定部25が、リスト特徴ベクトル生成部22bで生成された各項目の特徴ベクトルのリストと、要件文抽出部24から出力された要件文のリストと非要件文(解説文)のリスト(いずれのリストも特徴ベクトルを含む)とを入力する。そして、類似度判定部15が、前者のリストIDと後者の文章ID(要件又は解説に係る文章ID)の組み合わせ全体に対し、ベクトルの内積を求めるなどして両者の類似度を判定する(ステップS26)。
【0074】
例えば、類似度判定部25は、類似度判定部15と同様に、図7に示すテーブルのように、項目(リスト形式GLの要件文に相当)IDであるリストID(L000001等)と文章ID(T000007等)との組合せの全てについて、類似度を算出する。
【0075】
次いで、チェックリスト生成部26が、ある類似度以上(この閾値は予め設定されることができる)のリストIDと文章IDとを対応付けて、チェックリストを生成し、記憶部17に記憶させる(ステップS27)。なお、このような閾値処理の例については、図3のステップS15で説明した通りである。
【0076】
以上に説明したように、本実施形態に係るチェックリスト生成装置20によれば、実施形態1,2の効果と同様に、ガイドライン文書を人が読む必要なく、そのガイドライン文書をもとに分かり易いチェックリストを生成することが可能になる。さらに、チェックリスト生成装置20では、リスト形式のガイドライン文書に含まれる又はそこから生成した要件文(チェックを行う項目)のみのリストに対して、別の文章形式(読み物形式)のガイドライン文書から抽出した、要件を解説する文を対応付ける。よって、チェックリスト生成装置20によれば、自動で理解が容易な解説付きのチェックリストを、複数のガイドライン文書から生成することができる。特にチェックリスト生成装置20によれば、リスト形式ガイドライン文書の各項目の意味や例を読み物形式ガイドライン文書から補足したチェックリストを生成することができる。
【0077】
<実施形態4>
実施形態4について、図13図16を参照しながら、その効果も含めた実施形態3との相違点を中心に説明する。実施形態4は、実施形態3で説明した様々な例や、さらには実施形態1,2で説明した様々な例が適宜利用できる。図13は、実施形態4に係るチェックリスト生成装置の一構成例を示すブロック図である。
【0078】
図13に示すように、本実施形態に係るチェックリスト生成装置30は、実施形態3に係るチェックリスト生成装置20において、要件文抽出部24、チェックリスト生成部26の代わりにそれぞれタグ付け部34、チェックリスト生成部36を備えたものである。
【0079】
タグ付け部34は、対象判定部1cの一例であり、要件文抽出部24と同様に、文章特徴ベクトル生成部22aで抽出された特徴に基づき、文章形式GLにおける要件文と非要件文とを判定する。さらに、タグ付け部34は、この非要件文として、項目(リスト形式GLにおける項目は要件文を意味する)についての、具体例及び/又は背景を判定し、そのような非要件文にタグ付けを行う。つまり、タグ付け部34は、要件文の前後の文などが、具体例や背景説明に該当するような非要件文であるか、その他の非要件文であるかを判定し、前者についてタグ付けを行う。
【0080】
また、本実施形態におけるチェックリスト生成部36は、タグ付け部34でタグ付けされた結果に基づき、リスト形式GLの項目に文章形式GLの上述の非要件文を対応付けて、チェックリストを生成し、記憶部17に記憶させることが好ましい。
【0081】
チェックリスト生成装置30の処理例について、図14図16を併せて参照しながら説明する。図14は、チェックリスト生成装置30における処理例を説明するためのフロー図である。図15は、図14の処理例でタグ付けされた結果の一例を示す図で、図16は、図14の処理例において生成されるチェックリストの一例を示す図である。
【0082】
まず、本実施形態における処理例は、図10で説明した処理例において、ステップS23の代わりにタグ付け部34によるタグ付けが実行される(ステップS33)。また、この処理に加えて、本実施形態では、チェックリストの生成処理(ステップS37)が図10で説明した例と異なる。それ以外の処理については、基本的に同様であり、図14のステップS31,S32,S34~S36は、それぞれ図10のステップS21,S22,S24~S26に対応している。
【0083】
ステップS33において、タグ付け部34は、要件文の抽出及び非要件文の抽出を行うが、抽出された要件文について、その前後が例及び/又は背景説明であるか、その他であるかを判定する。そして、タグ付け部34は、例えば図15に示すように、文章ID(F341)に、その文章IDが示す要件(チェック項目)の具体例(F342)と背景説明(F343)とが、文章IDを示すタグとして関連付けられている。
【0084】
また、ステップS37において、チェックリスト生成部36が、図10のステップS27と同様に、ある類似度以上(この閾値は予め設定されることができる)のリストIDと文章IDとを対応付けて、チェックリストを生成し、記憶部17に記憶させる。但し、ステップS37では、チェックリスト生成部36が、ある類似度以上の文章IDとリストIDを対応付けチェックリストとし、タグ付け部34からの出力を用いて例及び背景説明もそのチェックリストに追加する。
【0085】
よって、生成されるチェックリストは、例えば図16に示すようになる。つまり、チェックリストの一例では、チェックID(F261)に、そのチェックIDが示す要件(チェック項目)を示すリスト(F262)とその項目を解説する解説文である文章(F263)と例(F264)と背景説明(F265)が関連付けられている。
【0086】
以上に説明したように、本実施形態に係るチェックリスト生成装置30によれば、実施形態3の効果に加え、具体例及び/又は背景説明を追加したチェックリストを生成することができ、さらに理解し易いチェックリストを生成することができる。
【0087】
<実施形態5>
実施形態5について、図17図20を参照しながら、その効果も含めた実施形態3との相違点を中心に説明する。実施形態5は、実施形態3で説明した様々な例や、さらには実施形態1,2,4で説明した様々な例が適宜利用できる。図17は、実施形態5に係るチェックリスト生成装置の一構成例を示すブロック図である。
【0088】
図17に示すように、本実施形態に係るチェックリスト生成装置40は、実施形態3に係るチェックリスト生成装置20において、参考文献の記憶部48を備える。ここで、参考文献とは、入力されるガイドライン文書で参照されている文献を指し、例えばそのガイドライン文書にリンク先が含まれる文献を指すことができる。
【0089】
また、チェックリスト生成装置40は、チェックリスト生成装置20において、文章特徴ベクトル生成部22a、リスト特徴ベクトル生成部22bの代わりに、それぞれ文章特徴ベクトル生成部42a、リスト特徴ベクトル生成部42bを備える。さらに、チェックリスト生成装置40は、チェックリスト生成装置20において、類似度判定部25の代わりに類似度判定部45を備える。
【0090】
そして、本実施形態において、文章特徴ベクトル生成部42a及びリスト特徴ベクトル生成部42bで例示した特徴抽出部1bは、リスト形式GLと文章形式GLとから参照されている、別の文書である参考文献を、特徴の少なくとも1つとして抽出する。つまり、本実施形態において記憶部48に記憶されている参考文献は、リスト形式GLの文と文章形式GLの文の対応関係を表すリンク文書であると言える。
【0091】
そして、本実施形態に係るチェックリスト生成装置40は、チェックリスト生成装置20において、双方の文書における文章のもとになったリンク文書も類似度判定に利用できるようにしたものである。つまり、本実施形態における類似度判定部45は、このような参考文献に基づき、類似度を判定する。例えば、類似度判定部45は、リスト形式GL及び文書形式GLに含まれるリンク先を、記憶部48を参照して検索し、双方のリンク先が一致した場合、双方の文章の類似度が高いと判定することができる。このように、類似度判定部45は、類似度判定部25を、参照文献を用いて類似度を判定するように強化したものである。
【0092】
但し、このような参考文献を直接、類似度の判定に使用しなくても、例えばリスト形式GLの項目の特徴ベクトルと文章形式GLの非要件文や要件文の特徴ベクトルとに顕在化するため、両者を対応させるために利用することができる。
【0093】
チェックリスト生成装置40の処理例について、図18図20を併せて参照しながら説明する。図18は、チェックリスト生成装置40における処理例を説明するためのフロー図である。図19は、図18の処理例において参考文献の参照を確認した結果の一例を示す図で、図20は、図18の処理例における類似度判定結果の一例を示す図である。
【0094】
本実施形態における処理例は、図10で説明した処理例において、ステップS22,S25の代わりに、文献参照を確認する処理を含むような処理を行う(ステップS42,S45)。さらに、本実施形態における処理例は、ステップS26の代わりに参考文献に基づく類似度判定処理を含むように類似度の判定処理を行う(ステップS46)。それ以外の処理については、基本的に同様であり、図18のステップS41,S43,S44,S47は、それぞれ図10のステップS21,S23,S24,S27に対応している。
【0095】
ステップS42,S45では、それぞれ文章特徴ベクトル生成部42a、リスト特徴ベクトル生成部42bが独立してベクトル生成処理を行うに際し、文献を参照しているかを確認し、参照していれば、例えば図19に示すテーブルに追加(マージ)していく。図19に示すテーブルでは、参照ID(F481)に、その参照IDが示す参照タグ(F482)と、その参考文献が含まれる文章ID(F483)及びリストID(F484)とが、関連付けられている。このテーブルは、例えば、類似度判定部45から参照可能なように記憶部48に記憶させておくことができる。
【0096】
ステップS46では、類似度判定部45が、図20に示すテーブルのように、項目(リスト形式GLの要件文に相当)IDであるリストID(L000001等)と文章ID(T000007等)との組合せの全てについて、類似度を算出する(類似度を判定する)。そして、このとき、類似度判定部45は、図19に示すテーブルを参照するなどして、リストIDと文章IDとで同じ参考文献を参照している組合せについては、図20に示すテーブルのように、類似度を加算する。図20では、同じ参考文献を参照している組合せは、リストID(L000004)と文章ID(T000022)との組合せとなり、類似度が100だけ加算されていることが分かる。
【0097】
以上に説明したように、本実施形態に係るチェックリスト生成装置40によれば、実施形態3の効果に加え、参考文献も考慮してチェックリストを生成することができ、より確かなチェックリストを生成することができる。
【0098】
<実施形態6>
実施形態6について、図21図23を参照しながら、その効果も含めた実施形態3との相違点を中心に説明する。実施形態6は、実施形態3で説明した様々な例や、さらには実施形態1,2,4,5で説明した様々な例が適宜利用できる。また、本実施形態の特徴部分は実施形態1にも適用することもできる。図21は、実施形態6に係るチェックリスト生成装置の一構成例を示すブロック図である。
【0099】
図21に示すように、本実施形態に係るチェックリスト生成装置50は、実施形態3に係るチェックリスト生成装置20において、同義語辞書の記憶部58を備える。また、チェックリスト生成装置50は、チェックリスト生成装置20において、文章特徴ベクトル生成部22a、リスト特徴ベクトル生成部22bの代わりに、それぞれ文章特徴ベクトル生成部52a、リスト特徴ベクトル生成部52bを備える。
【0100】
そして、本実施形態において、文章特徴ベクトル生成部42a及びリスト特徴ベクトル生成部42bで例示した特徴抽出部1bは、要件文であるか非要件文であるかの判定に、単語の表記の揺れを吸収する同義語辞書を用いる。これにより、特徴ベクトルの生成処理をより正確なものにするなど、特徴の抽出をより正確なものにすることができる。
【0101】
チェックリスト生成装置50の処理例について、図22及び図23を併せて参照しながら説明する。図22は、チェックリスト生成装置50における処理例を説明するためのフロー図で、図23は、図22の処理例において参照される同義語辞書の一例を示す図である。
【0102】
本実施形態における処理例は、図10で説明した処理例において、ステップS22,S25の代わりに、記憶部58の同義語辞書を参照しながら特徴ベクトルを生成する処理を行う(ステップS52,S55)。それ以外の処理については、基本的に同様であり、図22のステップS51,S53,S54,S56,S57は、それぞれ図10のステップS21,S23,S24,S26,S27に対応している。
【0103】
ステップS42,S45では、それぞれ文章特徴ベクトル生成部42a、リスト特徴ベクトル生成部42bが独立してベクトル生成処理を行うに際し、例えば図23で例示するような、単語の同義語を示す辞書データを参照する。ここで、単語の同義語とは、その単語の下位概念の単語や上位概念の単語等を含むことができる。
【0104】
以上に説明したように、本実施形態に係るチェックリスト生成装置50によれば、実施形態3の効果に加え、同義語も考慮してチェックリストを生成することができ、より確かなチェックリストを生成することができる。
【0105】
<実施形態7>
実施形態7について、図24図26を参照しながら、その効果も含めた実施形態3との相違点を中心に説明する。実施形態7は、実施形態3で説明した様々な例や、さらには実施形態1,2,4,5,6で説明した様々な例が適宜利用できる。図24は、実施形態7に係るチェックリスト生成装置の一構成例を示すブロック図である。
【0106】
図24に示すように、本実施形態に係るチェックリスト生成装置60は、実施形態3に係るチェックリスト生成装置20において、チェックリスト生成部26、記憶部17の代わりにそれぞれ拡張チェックリスト生成部66、記憶部67を備える。
【0107】
拡張チェックリスト生成部66は、類似度判定部25での判定の結果、文章形式GLのいずれの文章とも類似していないリスト形式GLの項目も、チェックリストに加えることが好ましい。
【0108】
また、拡張チェックリスト生成部66は、類似度判定部25での判定の結果、リスト形式GLのいずれの項目とも類似していない文章形式GLの文章も、チェックリストに加えることが好ましい。
【0109】
チェックリスト生成装置60の処理例について、図25及び図26を併せて参照しながら説明する。図25は、チェックリスト生成装置60における処理例を説明するためのフロー図で、図26は、図25の処理例において生成される拡張チェックリストの一例を示す図である。
【0110】
本実施形態における処理例は、図10で説明した処理例において、ステップS27の代わりに、拡張チェックリストを生成する処理を行う(ステップS67)。それ以外の処理については、基本的に同様であり、図25のステップS61~S66は、それぞれ図10のステップS21~S26に対応している。
【0111】
ステップS67では、拡張チェックリスト生成部66が、いずれの文章IDとも類似していないリストID、あるいは、いずれのリストIDとも類似していない文章IDを抽出する。そして、拡張チェックリスト生成部66が、抽出結果に基づき、チェックIDを採番し、チェックリストに加えて拡張チェックリストを生成し、記憶部67に記憶させる。
【0112】
よって、生成される拡張チェックリストは、例えば図26に示すようになる。つまり、拡張チェックリストの一例では、チェックID(F661)に、そのチェックIDが示す要件(チェック項目)を示すリスト(F662)とその項目を解説する解説文である文章(F663)とが関連付けられている。そして、この拡張チェックリストは、ステップS67で類似していないことが抽出された場合には、リスト(F662)か文章(F663)のいずれかの値は空欄のままとすることができる。
【0113】
以上に説明したように、本実施形態に係るチェックリスト生成装置60によれば、実施形態3の効果に加え、類似していない要件文又は非要件文も含めてチェックリストを生成することができ、より安全性を考慮したチェックリストを生成することができる。
【0114】
<他の実施形態>
[a]
各実施形態において、チェックリスト生成装置の機能や、サーバ装置等について説明したが、各装置は、例示した構成例に限ったものではなく、各装置としてこれらの機能が実現できればよい。
【0115】
[b]
各実施形態に係る各装置は、次のようなハードウェア構成を有していてもよい。図27は、装置のハードウェア構成の一例を示す図である。なお、上記他の実施形態[a]についても同様である。
【0116】
図27に示す装置100は、プロセッサ101、メモリ102、及びインタフェース103を有することができる。プロセッサ101は、例えば、マイクロプロセッサ、MPU(Micro Processor Unit)、又はCPUなどであってもよい。プロセッサ101は、複数のプロセッサを含んでもよい。メモリ102は、例えば、揮発性メモリ及び不揮発性メモリの組み合わせによって構成される。各実施形態で説明した各装置における機能は、プロセッサ101がメモリ102に記憶されたプログラムを読み込んで実行することにより実現される。この際、情報の入出力は、入出力インタフェースや他の装置との通信を行う通信インタフェース等のインタフェース103を介して行うことができる。
【0117】
上述の例において、プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)を含む。さらに、この例は、CD-ROM(Read Only Memory)、CD-R、CD-R/Wを含む。さらに、この例は、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0118】
[c]
さらに、上述した各実施形態において、チェックリスト生成装置における処理の手順を例示したように、本開示は、チェックリスト生成方法としての形態も採り得る。このチェックリスト生成方法は、次の入力ステップ、特徴抽出ステップ、対象判定ステップ、類似度判定ステップ、及びリスト生成ステップを備えることができる。入力ステップは、生成対象のチェックリストのもとになるガイドライン文書を入力する。特徴抽出ステップは、入力ステップで入力されたガイドライン文書を分析し、ガイドライン文書に含まれる各文章の特徴を抽出する。対象判定ステップは、特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する。類似度判定ステップは、対象判定ステップで判定された要件文と非要件文との類似度を判定する。リスト生成ステップは、類似度判定ステップでの判定結果に基づき、要件文に非要件文を対応付けたチェックリストを生成する。なお、その他の例については、上述した各実施形態で説明した通りである。また、上記プログラムは、チェックリスト生成装置に搭載されたコンピュータ(制御コンピュータ)に上述した入力ステップ、特徴抽出ステップ、対象判定ステップ、類似度判定ステップ、及びリスト生成ステップを実行させるためのプログラムであると言える。
【0119】
なお、本開示は上記実施形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。また、本開示は、それぞれの実施形態を適宜組み合わせて実施されてもよい。
【0120】
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
<付記>
【0121】
(付記1)
生成対象のチェックリストのもとになるガイドライン文書を入力する入力部と、
前記入力部で入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出部と、
前記特徴抽出部で抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定部と、
前記対象判定部で判定された前記要件文と前記非要件文との類似度を判定する類似度判定部と、
前記類似度判定部での判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成部と、
を備えた、チェックリスト生成装置。
【0122】
(付記2)
前記入力部は、前記ガイドライン文書として、チェックすべき項目がリストアップされたリスト形式ガイドライン文書と、チェックすべき項目の背景又は具体例を含む読み物として記述された読み物形式ガイドライン文書と、を入力し、
前記特徴抽出部は、前記読み物形式ガイドライン文書に含まれる各文章の特徴を抽出し、
前記対象判定部は、前記特徴抽出部で抽出された特徴に基づき、前記読み物形式ガイドライン文書における前記要件文と前記非要件文とを判定し、
前記類似度判定部は、前記リスト形式ガイドライン文書の各項目と、前記対象判定部で判定された前記読み物形式ガイドライン文書の前記要件文及び前記非要件文との類似度を判定し、
前記リスト生成部は、前記類似度判定部での判定結果に基づき、前記リスト形式ガイドライン文書の各項目に前記読み物形式ガイドラインの少なくとも前記非要件文を対応付けて、前記チェックリストを生成する、
付記1に記載のチェックリスト生成装置。
【0123】
(付記3)
前記対象判定部は、前記非要件文として、前記項目についての、具体例及び背景の少なくとも1つを判定し、前記非要件文にタグ付けを行う、
付記2に記載のチェックリスト生成装置。
【0124】
(付記4)
前記リスト生成部は、前記対象判定部でタグ付けされた結果に基づき、前記リスト形式ガイドライン文書の項目に前記読み物形式ガイドラインの前記非要件文を対応付けて、前記チェックリストを生成する、
付記3に記載のチェックリスト生成装置。
【0125】
(付記5)
前記特徴抽出部は、前記リスト形式ガイドライン文書と前記読み物形式ガイドライン文書とから参照されている、別の文書である参考文献を、前記特徴の少なくとも1つとして抽出する、
付記2から4のいずれか1項に記載のチェックリスト生成装置。
【0126】
(付記6)
前記類似度判定部は、前記参考文献に基づき、前記類似度を判定する、
付記5に記載のチェックリスト生成装置。
【0127】
(付記7)
前記リスト生成部は、前記類似度判定部での判定の結果、前記読み物形式ガイドライン文書のいずれの文章とも類似していない前記リスト形式ガイドライン文書の項目も、前記チェックリストに加える、
付記2から6のいずれか1項に記載のチェックリスト生成装置。
【0128】
(付記8)
前記リスト生成部は、前記類似度判定部での判定の結果、前記リスト形式ガイドライン文書のいずれの項目とも類似していない前記読み物形式ガイドライン文書の文章も、前記チェックリストに加える、
付記2から7のいずれか1項に記載のチェックリスト生成装置。
【0129】
(付記9)
前記対象判定部は、前記要件文であるか前記非要件文であるかの判定に、単語の表記の揺れを吸収する同義語辞書を用いる、
付記1から8のいずれか1項に記載のチェックリスト生成装置。
【0130】
(付記10)
生成対象のチェックリストのもとになるガイドライン文書を入力する入力ステップと、
前記入力ステップで入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定ステップと、
前記対象判定ステップで判定された前記要件文と前記非要件文との類似度を判定する類似度判定ステップと、
前記類似度判定ステップでの判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成ステップと、
を備えた、チェックリスト生成方法。
【0131】
(付記11)
コンピュータに、
生成対象のチェックリストのもとになるガイドライン文書を入力する入力ステップと、
前記入力ステップで入力された前記ガイドライン文書を分析し、前記ガイドライン文書に含まれる各文章の特徴を抽出する特徴抽出ステップと、
前記特徴抽出ステップで抽出された特徴に基づき、チェック対象となる要件の特徴を有する要件文と非チェック対象である非要件の特徴を有する非要件文とを判定する対象判定ステップと、
前記対象判定ステップで判定された前記要件文と前記非要件文との類似度を判定する類似度判定ステップと、
前記類似度判定ステップでの判定結果に基づき、前記要件文に前記非要件文を対応付けたチェックリストを生成するリスト生成ステップと、
を実行させるためのプログラム。
【符号の説明】
【0132】
1、10、20、30、40、50、60 チェックリスト生成装置
1a 入力部
1b 特徴抽出部
1c 対象判定部
1d 類似度判定部
1e リスト生成部
11 文章形式GL入力部
12 文章特徴ベクトル生成部
13 解説文抽出部
14、24 要件文抽出部
15、25、45 類似度判定部
16、26、36 チェックリスト生成部
17、48、58、67 記憶部
21a 文章形式GL入力部
21b リスト形式GL入力部
22a、42a、52a 文章特徴ベクトル生成部
22b、42b、52b リスト特徴ベクトル生成部
34 タグ付け部
66 拡張チェックリスト生成部
100 装置
101 プロセッサ
102 メモリ
103 インタフェース
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27