(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-06
(45)【発行日】2022-12-14
(54)【発明の名称】工事関連リスク管理システム、リスク分析用データ生成装置およびリスク情報提供装置
(51)【国際特許分類】
G06F 16/34 20190101AFI20221207BHJP
G06F 16/35 20190101ALI20221207BHJP
G06F 40/216 20200101ALI20221207BHJP
【FI】
G06F16/34
G06F16/35
G06F40/216
(21)【出願番号】P 2019018585
(22)【出願日】2019-02-05
【審査請求日】2022-01-06
(73)【特許権者】
【識別番号】591030237
【氏名又は名称】BIPROGY株式会社
(73)【特許権者】
【識別番号】303057365
【氏名又は名称】株式会社安藤・間
(74)【代理人】
【識別番号】100105784
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】阿世知 暁
(72)【発明者】
【氏名】藤田 勝貫
(72)【発明者】
【氏名】黒台 昌弘
(72)【発明者】
【氏名】清水 穂高
(72)【発明者】
【氏名】辻井 修
【審査官】木村 大吾
(56)【参考文献】
【文献】特開2011-198203(JP,A)
【文献】特開2015-153013(JP,A)
【文献】特開2008-210367(JP,A)
【文献】特開2016-006606(JP,A)
【文献】特開2002-230001(JP,A)
【文献】特開2008-102758(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 10/00-99/00
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
工事の業務内容に応じて分類された複数の文書を形態素解析し、業務分類毎に上記複数の文書からそれぞれ複数の特徴語を抽出する分類別特徴語抽出部と、
上記分類別特徴語抽出部により上記業務分類毎に抽出された複数の特徴語について、各々の特徴語が共に出現する共起状況をもとに、上記複数の特徴語をグループ化する特徴語グループ作成部と、
上記特徴語グループ作成部により作成された複数の特徴語グループの各々に対して、工事において発生し得るリスクを割り付けるリスク割付部と、
上記リスク割付部によりリスクが割り付けられた複数の特徴語グループに関するデータを分析用データとして記憶媒体に記憶させる分析用データ記録部と、
分析対象とする複数の特徴語を指定する特徴語指定部と、
上記分析用データ記録部により上記記憶媒体に記憶された上記分析用データを用いて、上記特徴語指定部により指定された複数の特徴語の少なくとも1つが含まれる特徴語グループを特定し、特定した特徴語グループに割り付けられているリスクを抽出するリスク抽出部とを備えたことを特徴とする工事関連リスク管理システム。
【請求項2】
上記特徴語グループ作成部により作成された複数の特徴語グループの各々に対して、当該特徴語グループに含まれる複数の特徴語に応じた重要度を設定する重要度設定部を更に備え、
上記分析用データ記録部は、上記リスク割付部によりリスクが割り付けられるとともに上記重要度設定部により重要度が設定された複数の特徴語グループに関するデータを上記分析用データとして記憶媒体に記憶させ、
上記リスク抽出部は、上記特徴語指定部により指定された複数の特徴語の少なくとも1つが含まれる特徴語グループが複数特定される場合に、上記重要度に応じた順番に基づいて、特定された複数の特徴語グループに割り付けられているリスクを抽出することを特徴とする請求項1に記載の工事関連リスク管理システム。
【請求項3】
上記特徴語指定部は、分析対象の文書を形態素解析し、上記分析対象の文書から複数の特徴語を抽出することにより、上記複数の特徴語を指定することを特徴とする請求項1または2に記載の工事関連リスク管理システム。
【請求項4】
上記記憶媒体に記憶された上記分析用データを用いて、上記特徴語グループ作成部により作成された特徴語グループに含まれる任意の特徴語をユーザ操作に応じて選択する特徴語選択部と、
上記工事の業務内容に応じて分類された複数の文書の中から、上記特徴語選択部により選択された特徴語が含まれる文書を抽出する文書抽出部と、
上記文書抽出部により抽出された文書の形態素解析を行い、当該文書から複数の特徴語を抽出する第2の分類別特徴語抽出部と、
上記記憶媒体に上記分析用データとして記憶されている複数の特徴語グループの中から、上記第2の分類別特徴語抽出部により抽出された特徴語が属する特徴語グループ以外の特徴語グループであって、上記重要度設定部により設定された重要度が高いものとして所定の条件を満たす特徴語グループを抽出する特徴語グループ抽出部と、
上記記憶媒体に記憶された上記分析用データを用いて、上記特徴語グループ抽出部により抽出された特徴語グループに割り付けられているリスクを抽出する第2のリスク抽出部とを更に備えたことを特徴とする請求項2に記載の工事関連リスク管理システム。
【請求項5】
上記重要度設定部は、上記特徴語グループ作成部により作成された複数の特徴語グループに属する特徴語の各々に対して、当該特徴語に応じた重要度を更に設定することを特徴とする請求項4に記載の工事関連リスク管理システム。
【請求項6】
工事の業務内容に応じて分類された複数の文書を形態素解析し、業務分類毎に上記複数の文書からそれぞれ複数の特徴語を抽出する分類別特徴語抽出部と、
上記分類別特徴語抽出部により上記業務分類毎に抽出された複数の特徴語について、各々の特徴語が共に出現する共起状況をもとに、上記複数の特徴語をグループ化する特徴語グループ作成部と、
上記特徴語グループ作成部により作成された複数の特徴語グループの各々に対して、工事において発生し得るリスクを割り付けるリスク割付部と、
上記リスク割付部によりリスクが割り付けられた複数の特徴語グループに関するデータを分析用データとして記憶媒体に記憶させる分析用データ記録部とを備えたことを特徴とするリスク分析用データ生成装置。
【請求項7】
分析対象とする複数の特徴語を指定する特徴語指定部と、
請求項6に記載のリスク分析用データ生成装置により上記記憶媒体に記憶された上記分析用データを用いて、上記特徴語指定部により指定された複数の特徴語の少なくとも1つが含まれる特徴語グループを特定し、特定した特徴語グループに割り付けられているリスクを抽出するリスク抽出部と、
上記リスク抽出部により抽出されたリスクを提示するリスク提示部とを備えたことを特徴とするリスク情報提供装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、工事関連リスク管理システム、リスク情報提供装置およびリスク情報提供装置に関し、特に、工事において想定されるリスクを工事着手前に洗い出すことを支援するシステムに用いて好適なものである。
【背景技術】
【0002】
現在、建設業の事業者は、平成26年6月に改正・施行された労働安全衛生法により、工事現場での危険性または有害性等の調査を実施し、その結果に基づいて検討した災害防止対策を実施(リスクアセスメント)することにより、労働災害を未然に防ぐことが努力義務事項とされている。リスクアセスメントとは、どの作業にどんなリスクが潜んでいるかの調査(洗い出し)を行い、適切なリスク低減対策を実施することである。
【0003】
ところが、工事のどの段階でどのようなリスク事象が起こり得るか、また、どのような対策がそのリスク事象を防止するのに有効であるか等について、工事着手前に人手によって的確に判断して決定するには多大な労力を要する。そこで、このリスクアセスメントに関する作業を支援するシステムがいくつか提案されている(例えば、特許文献1~6参照)。
【0004】
特許文献1に記載されている安全情報システムでは、過去に発生した複数の労働災害について、労働災害が発生した作業と労働災害の発生状況、発生要因および講じた対策とを対応させて記憶しておく。そして、建設工事でこれから実施する作業データと同じ作業についての、過去に発生した労働災害の発生状況および発生要因を出力する。この安全情報システムによれば、これから実施する作業について、労働災害の発生を防止するための適切な情報が提供される。
【0005】
特許文献2に記載されている労働安全衛生マネージメントシステムは、工事名称と工程とを関連付けたテーブルと、工程と危険有害要因等の危険情報とを関連付けたテーブルとをあらかじめ格納している。システムは、これらのテーブルを参照して、工事の内訳データから、工事名称に対応する工程のうち危険有害要因を有する工程とその危険情報とを自動で抽出し、一覧表示する。この労働安全衛生マネージメントシステムによれば、評価対象工事に関連する危険源評価データを労力や人手をかけずに自動的に生成し、危険源評価表などのリスクアセスメントに必要な情報をユーザに提示することができる。
【0006】
特許文献3に記載の安全管理システムは、対象工事の工事データに含まれる工事内容の名称に対応付けられた作業データが規定されている作業マスタと、作業データに対応するリスク内容が規定されているリスクテーブルとが格納された記憶手段を備え、さらに、対象工事の工事データを記憶手段に取り込むための受信手段と、工事データと作業マスタの作業データとをリンク設定し、リンク設定した作業データに対応したリスク内容をリスクテーブルから抽出する演算手段と、リスク内容を出力する出力手段とを備えている。この安全管理システムによれば、より適切なリスク内容の抽出が可能とされる。
【0007】
特許文献4に記載の労働安全衛生管理システムは、複数の作業のそれぞれと、作業工程およびリスク情報とを対応付けて記述したリスク情報テーブルをあらかじめ格納する。システムは、リスクアセスメントの対象となる工事の工事内訳を取得する工事内訳取得部と、工事内訳に含まれる工種に対応付けて複数の作業の中から何れかを選択するユーザ操作を受け付ける作業選択受付部と、選択された作業に対応する作業工程およびリスク情報の一覧を生成し、対応する工種と対応付けてユーザに提示するリスク情報提示部とを備える。この労働安全衛生管理システムによれば、リスクアセスメントの作業の負担を軽減することができる。
【0008】
特許文献5に記載の安全管理支援装置は、作業内容を認識するための作業内容特定情報を格納する記憶部と、撮像手段により撮像された対象工事の画像情報を取得する取得部と、作業内容特定情報を参照して、取得した画像情報を解析し、作業内容を認識する画像解析部と、認識した作業内容に基づいて、作業内容に関連付けられたリスク情報を表示する表示部とを有する。この安全管理支援装置によれば、画像情報を利用して作業者、作業内容、或いは機械を認識し、これらに対応する安全情報やリスク情報を出力することが可能となる。
【0009】
特許文献6に記載の工事管理システムは、対象工事の複数の作業のそれぞれの内容に関する作業情報を記憶する作業内容情報記憶部と、作業内容情報記憶部に記憶された作業情報に基づき、複数の作業のそれぞれにおけるリスク度を評価するリスク評価部と、複数の作業のそれぞれのリスク度を当該作業の作業エリア情報とともに出力する出力表示装置とを備える。
【0010】
なお、リレーショナルデータベース上の文書情報を、集計処理可能なグルーピング(カテゴリ)情報に変換するシステムが知られている(例えば、特許文献7参照)。特許文献7に記載の文章情報変換システムは、リレーショナルデータベースに格納された文書情報を文書中に含まれる単語に分解する単語抽出部と、分解された単語間の共起データを元に単語をクラスタに分類し、単語クラスタ辞書を作成するクラスタ化辞書作成部と、単語クラスタ辞書を参照し、クラスタグループ中の出現頻度が高いものをそのクラスタグループの特徴単語として抽出する特徴単語抽出部と、単語クラスタ辞書を用い、リレーショナルデータベースの各レコードの文書情報がどのクラスタグループとの距離が近いかを判断し、各レコードに該当クラスタグループの特徴単語を付与する特徴単語付加部とを備える。
【先行技術文献】
【特許文献】
【0011】
【文献】特開平6-44211号公報
【文献】特開2006-59332号公報
【文献】特開2013-228923号公報
【文献】特開2015-52854号公報
【文献】特開2017-33047号公報
【文献】特開2017-146735号公報
【文献】特開2002-259411号公報
【発明の概要】
【発明が解決しようとする課題】
【0012】
上記特許文献1~6に記載のシステムは何れも、工事の作業情報とリスク情報とを関連付けて記録したデータベースを有し、このデータベースを参照することにより、工事内容に応じたリスクの抽出を行うことを基本的な内容とするものである。このようなシステムにおいて、属人性を廃してリスクの洗い出しの精度を上げるためには、あらかじめ用意するデータベースの精度を向上させることが重要となる。
【0013】
本発明は、このような事情に鑑みて成されたものであり、工事内容に応じたリスクの洗い出しの精度を向上させることができるようにすることを目的とする。
【課題を解決するための手段】
【0014】
上記した課題を解決するために、本発明では、工事の業務内容に応じて分類された複数の文書を形態素解析することにより、業務分類毎に複数の文書からそれぞれ複数の特徴語を抽出し、業務分類毎に抽出された複数の特徴語について、各々の特徴語が共に出現する共起状況をもとに、複数の特徴語をグループ化して特徴語グループを作成する。また、当該複数の特徴語グループの各々に対して、工事において発生し得るリスクを割り付けることにより分析用データとし、当該分析用データを記憶媒体に記憶させる。そして、記憶媒体に記憶された分析用データを用いて、分析対象として指定された複数の特徴語の少なくとも1つが含まれる特徴語グループを特定し、特定した特徴語グループに割り付けられているリスクを抽出する。
【発明の効果】
【0015】
上記のように構成した本発明によれば、文書内に含まれる特徴的な単語で、かつ互いに共起関係のある単語どうしの集合が特徴語グループとして作成され、その特徴語グループに対して、工事において発生し得るリスクが割り付けられる。ここで、特徴語グループの作成元とされる複数の文書は、工事の業務内容に応じてあらかじめ分類されており、業務分類毎に特徴語グループが作成される。そのため、特徴語自体がその業務分類の特徴を表す単語となり、そのような特徴語の共起関係に基づく集合から成る特徴語グループは、各業務分類における特徴的な単語で意味的なつながりのある単語の類似集合となる。これにより、ある業務分類に属する工事について分析対象とする特徴語を指定し、その特徴語に応じて特定される特徴語グループに割り付けられたリスクを抽出することにより、その業務分類(工事内容)に応じて発生し得るリスクを適切に抽出することができる。その結果、工事内容に応じたリスクの洗い出しの精度を向上させることができるようになる。
【図面の簡単な説明】
【0016】
【
図1】本実施形態による工事関連リスク管理システムの機能構成例を示すブロック図である。
【
図2】本実施形態の特徴語グループ作成部により作成される特徴語グループを模式的に示す図である。
【
図3】本実施形態によるリスク表データの内容を模式的に示す図である。
【
図4】本実施形態の分析用データ記憶部に記憶される分析用データの内容を模式的に示す図である。
【
図5】第1の変形例に係る工事関連リスク管理システムの機能構成例を示すブロック図である。
【
図6】第2の変形例に係る工事関連リスク管理システムの機能構成例を示すブロック図である。
【
図7】第2の変形例における採点部および特徴語グループ抽出部の処理内容を説明するための図である。
【発明を実施するための形態】
【0017】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本実施形態による工事関連リスク管理システムの機能構成例を示すブロック図である。
図1に示すように、本実施形態の工事関連リスク管理システム100は、学習用データ取得部11、分類別特徴語抽出部12、特徴語グループ作成部13、リスク割付部14、分析用データ記録部15、分析対象データ取得部16、特徴語指定部17、リスク抽出部18およびリスク提示部19を備えている。
【0018】
上記各機能ブロック11~19は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック11~19は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記憶媒体に記憶されたプログラムが動作することによって実現される。
【0019】
工事関連リスク管理システム100は、例えば、インターネットに繋がれたサーバ装置として構成することが可能である。ここで、機能ブロック11~19を1つのサーバ装置が全て備えていることを必須とするものではなく、複数のサーバ装置が機能ブロック11~19を分散して備える構成としてもよい。例えば、後述するように分析用データを生成するための機能ブロック11~15を第1のサーバ装置が備え、リスクの分析を行うための機能ブロック16~19を第2のサーバ装置が備えるようにしてもよい。この場合、第1のサーバ装置は、特許請求の範囲の「リスク分析用データ生成装置」に相当する。また、第2のサーバ装置は、特許請求の範囲の「リスク情報提供装置」に相当する。
【0020】
本実施形態の工事関連リスク管理システム100には、学習用データ記憶部101および分析用データ記憶部102が接続されている。これらのデータ記憶部101,102は、ハードディスクまたは半導体メモリ等の記憶媒体により構成されるものであり、工事関連リスク管理システム100に対して有線または無線により接続されている。あるいは、これらのデータ記憶部101,102は、工事関連リスク管理システム100に対してインターネットを介して接続される構成であってもよい。また、工事関連リスク管理システム100が内部にこれらのデータ記憶部101,102を備える構成としてもよい。
【0021】
学習用データ記憶部101は、工事の業務内容に応じて分類された複数の文書データを記憶している。工事の業務内容(以下、工事内容という)とは、例えば建設会社が行う各種工事の内容を示すものであり、橋梁工事、トンネル工事、鉄塔工事、ダム工事、空港工事、大工工事、左官工事、とび工事、工作物解体工事、くい工事、掘削工事、発破工事、盛土工事、コンクリート工事、地すべり防止工事、地盤改良工事、道路付属物設置工事、発電設備工事、送配電線工事、引込線工事、構内電気設備工事、照明設備工事、電車線工事、信号設備工事、ネオン装置工事、屋外広告工事、アスファルト舗装工事などが挙げられる。なお、ここに挙げた工事内容は一例であり、これらに限定されるものではない。また、ここに挙げた工事内容を全て含むことを必須とするものでもない。
【0022】
複数の文書とは、過去に行った工事に関する工事仕様書や工事報告書などの工事案件文書、工事に関する内容について記述された論文や特許文献、新聞、雑誌、図書その他の文献など、工事に関する情報が記述されたあらゆる文書を含む。ただし、文書の内容として、工事のどの作業においてどんなリスク(災害や事故の他、品質、出来映え、工程、コスト、周辺環境、対住民、などに関するものも含む)が起きる可能性があるかについて記述された文書であることが好ましい。学習用データ記憶部101は、このような複数の文書を、工事内容に応じて分類された状態で記憶している。
図1において、BC1,BC2,・・・は業務分類を示し、D11,D12,・・・,D21,D22,・・・は各業務分類に属する複数の文書を示している。この文書データの分類は、例えば学習用データ記憶部101に各種の文書データを記憶させるシステム設計者が行う。
【0023】
複数の文書の分類の仕方に関しては、いくつかの方法を適用し得る。例えば、上述のように例示した1つ1つの工事内容に対してそれぞれ個別の分類を設定してもよいし、いくつかの類似または関連した工事内容をまとめて1つの分類を設定しても良い。後者の例として、工事中に発生し得るリスクの種類(生態系、水質汚染、騒音発生、振動発生などの大まかな分類)に応じて、いくつかの工事内容をまとめて1つの分類を設定しても良い。すなわち、生態系に関するリスクが発生し得るいくつかの工事内容をまとめて生態系リスクグループを設定し、それらの工事内容に関する文書をこの生態系リスクグループに分類する。水質汚染、騒音発生、振動発生などの他のリスクグループに関する文書についても同様に分類する。なお、1つの工事内容において発生し得るリスクの種類が複数である場合もあり得る。この場合は、その中から代表的なリスクの種類を1つのみ採用して、その採用したリスクグループに1つの文書を分類するようにしてもよいし、1つの文書を複数のリスクグループに分類するようにしてもよい。
【0024】
学習用データ取得部11は、以上のように工事内容に応じて分類された複数の文書データを学習用データ記憶部101から取得する。分類別特徴語抽出部12は、学習用データ取得部11により取得された複数の文書データを用いて、工事内容に応じて分類された複数の文書を形態素解析し、業務分類毎に複数の文書からそれぞれ複数の特徴語を抽出する。特徴語とは、文書の中に現れる単語のうちその文書にとって特徴的な単語をいう。例えば、文書の中で頻出する単語を特徴語として抽出することが可能である。具体的には、形態素解析された各単語の出現回数を計数し、最も多い方から所定数の単語を特徴語として抽出する。または、出現回数が所定数以上の単語を特徴語として抽出するようにしてもよい。
【0025】
特徴語グループ作成部13は、分類別特徴語抽出部12により業務分類毎に抽出された複数の特徴語について、各々の特徴語が共に出現する共起状況をもとに、複数の特徴語をグループ化する。共起状況とは、ある特徴語がある文書中に現れたとき、その文書中に別の特定の特徴語が頻繁に出現する状況をいう。本実施形態では、対象とする文書上で各々の特徴語が共に出現する共起状況をもとに、特徴語間の距離をベクトルの形で算定し、距離を類似度に推定することで、類似する特徴語をグループ化する。この場合、共起関係が強い状況にあるほど、特徴語間で算出される距離のベクトルは短くなる。本実施形態では、特徴語間の距離が所定値以下となる複数の特徴語をまとめて1つの特徴語グループを作成する。
【0026】
なお、1つの業務分類に属する複数の文書からそれぞれ抽出された複数の特徴語のうち、各文書(上記複数の文書の全部または一部)に共通する1つの特徴語に着目した場合、当該各文書においてその着目特徴語と共に抽出されている他の特徴語のうち、当該各文書の一部または全部において共通に抽出されているものが着目特徴語と共起関係にあり、着目特徴語と共に抽出されている頻度が多い他の特徴語ほど共起関係が強い状況にあるものとしてもよい。
【0027】
図2は、特徴語グループ作成部13により作成される特徴語グループを模式的に示す図である。
図2に示すように、特徴語グループ作成部13は、ある1つの業務分類BC1に属する複数の文書から複数の特徴語グループGr11,Gr12,・・・を作成し、別の1つの業務分類BC2に属する複数の文書から複数の特徴語グループGr21,Gr22,・・・を作成する。
図2では、第1の業務分類BC1から作成された1つ目の特徴語グループGr11には複数の特徴語WD1,WD2,・・・が含まれ、第1の業務分類BC1から作成された2つ目の特徴語グループGr12には複数の特徴語WD3,WD4,・・・が含まれることが示されている。同様に、第2の業務分類BC2から作成された1つ目の特徴語グループGr21には複数の特徴語WD5,WD6,・・・が含まれ、第2の業務分類BC2から作成された2つ目の特徴語グループGr22には複数の特徴語WD7,WD8,・・・が含まれることが示されている。
【0028】
リスク割付部14は、特徴語グループ作成部13により作成された複数の特徴語グループの各々に対して、工事において発生し得るリスクを割り付ける。リスクの割り付けは、例えば工事関連リスク管理システム100の設計担当者または運用担当者(以下、単に担当者という)が操作部(図示せず)を操作することによって行う。すなわち、特徴語グループ作成部13により作成された特徴語グループの内容を担当者が確認し、当該特徴語グループの中に含まれる複数の特徴語の中からリスクに関連する特徴語を抽出して、それを特徴語グループに割り付ける。なお、リスクに関連する特徴語が複数含まれている場合は、1つの特徴語グループに対して複数のリスクを割り付けてよい。
【0029】
上述したように、学習用データ取得部11が学習用データ記憶部101から取得する文書データは、工事のどの作業においてどんなリスクが起きる可能性があるかについて記述された文書に関するデータを含んでおり、このような文書から抽出される特徴語の中には、リスクを表した単語(以下、リスクワードという)が含まれる可能性が高い。すなわち、各々の特徴語グループの中にリスクワードが含まれている可能性が高いと言える。そのため、特徴語グループごとにその中に特徴語として含まれているリスクワードを確認することにより、各特徴語グループに対してリスクを適切に割り付けることが可能である。
【0030】
なお、特徴語グループの中にリスクワードが含まれていない場合は、その特徴語グループに含まれている複数の特徴語から類推されるリスクを割り付ける。あるいは、特徴語グループに属する複数の特徴語がどの文書から抽出されたものかを紐付ける情報を設定しておいて、その紐付け情報を用いて抽出元の文書を閲覧できるようにし、抽出元の文書から類推されるリスクを割り付けるようにしてもよい。特徴語グループの中にリスクワードが特徴語として含まれていなくても、特徴語の抽出元の文書内にはリスクワードが含まれている可能性が高いので、抽出元の文書を参照することにより、各特徴語グループに対してリスクを適切に割り付けることが可能である。
【0031】
ここでは、各特徴語グループに対するリスクの割り付けを担当者が行うものとして説明したが、工事関連リスク管理システム100が自動的に行うようにすることも可能である。例えば、各業務分類と、業務分類に属する工事内容に関連する1以上のリスクワードとを関連付けて作成したリスク表データを学習用データ記憶部101に記憶しておき、これを学習用データ取得部11が文書データと共に取得するようにする。そして、リスク割付部14がこのリスク表データを参照することにより、特徴語グループに対するリスクの割り付けを自動的に行うようにすることが可能である。
【0032】
図3は、リスク表データの内容を模式的に示す図である。
図3に示すように、リスク表データは、業務分類およびリスクワードを項目として有するレコードを複数備えて構成されている。
図3の例では、第1の業務分類BC1と、その業務分類BC1に関連する1以上のリスクワードRW1,RW2,・・・とを関連付けて1つのレコードに記憶している。同様に、第2の業務分類BC2と、その業務分類BC2に関連する1以上のリスクワードRW3,RW4,・・・とを関連付けて1つのレコードに記憶している。
【0033】
リスク割付部14は、例えば
図2に示す第1の業務分類BC1に属する1つ目の特徴語グループGr11に対してリスクを割り付ける際に、当該特徴語グループGr11に含まれる複数の特徴語WD1,WD2,・・・と、リスク表データに含まれる第1の業務分類BC1に関連付けられた1以上のリスクワードRW1,RW2,・・・とを照合し、複数の特徴語WD1,WD2,・・・中にリスクワードRW1,RW2,・・・と合致するものがあるかどうかを確認する。そして、特徴語と合致するリスクワードが見つかった場合、そのリスクワードを特徴語グループGr11に対するリスクとして割り付ける。なお、特徴語と合致するリスクワードが見つからなかった場合は、そのことをメッセージとして報知し、上述のように担当者が手動でリスクを割り付けるようにしてよい。
【0034】
また、特徴語グループに対するリスクの自動割り付けを、以下のように行うようにしてもよい。すなわち、分類別特徴語抽出部12が複数の特徴語を抽出する際に使用する複数の文書(学習用データ取得部11が学習用データ記憶部101から取得する文書データ)を、当該文書に記述されている工事内容に対応するリスクがあらかじめ設定されている文書とする。そして、リスク割付部14は、特徴語グループ作成部13により作成された複数の特徴語グループの各々に対して、当該特徴語グループに含まれる複数の特徴語が抽出された文書に対してあらかじめ設定されているリスクを割り付ける。
【0035】
分析用データ記録部15は、リスク割付部14によりリスクが割り付けられた複数の特徴語グループに関するデータを分析用データとして分析用データ記憶部102に記憶させる。
図4は、分析用データ記憶部102に記憶される分析用データの内容を模式的に示す図である。
図4に示すように、分析用データは、特徴語グループ(グループに属する1以上の特徴語を含む)と、当該特徴語グループに割り付けられた1以上のリスクとを関連付けて記録したデータとして構成される。
【0036】
分析対象データ取得部16は、新たな工事をする際に作成される文書データを分析対象のデータとして取得する。ここでいう分析とは、これから行う予定の新たな工事に潜在するリスクの洗い出しである。また、分析対象とする文書は、これから行う工事に関する工事仕様書が典型例であるが、これに限定されるものではない。これから行う予定の工事内容に関する記述が含まれている文書であれば、何れも分析対象のデータとして用いることが可能である。
【0037】
具体的には、新たな工事をする建設会社(工事関連リスク管理システム100のユーザ)の端末からインターネットを介して工事関連リスク管理システム100にアクセスし、分析対象とする文書データを送信する。分析対象データ取得部16は、この建設会社の端末から送信された文書データを取得する。
【0038】
特徴語指定部17は、分析対象とする複数の特徴語を指定する。本実施形態では、特徴語指定部17は、分析対象データ取得部16により取得された分析対象の文書を形態素解析し、分析対象の文書から複数の特徴語を抽出することにより、当該複数の特徴語を指定する。特徴語指定部17による特徴語の抽出処理は、分類別特徴語抽出部12による特徴語の抽出処理と同様でよい。すなわち、特徴語指定部17は、形態素解析された各単語の出現回数を計数し、出現回数が最も多い方から所定数の単語、または、出現回数が所定数以上の単語を特徴語として抽出する。
【0039】
リスク抽出部18は、分析用データ記録部15により分析用データ記憶部102に記憶された分析用データを用いて、特徴語指定部17により指定された複数の特徴語の少なくとも1つが含まれる特徴語グループを特定し、特定した特徴語グループに割り付けられているリスクを抽出する。すなわち、リスク抽出部18は、特徴語指定部17により指定された複数の特徴語のそれぞれが、
図2に示す分析用データにおいてどの特徴語グループに含まれるかを判定し、指定された特徴語の少なくとも1つが含まれている特徴語グループに関連付けて記憶されているリスクを抽出する。ここで、特徴語指定部17により指定された複数の特徴語が含まれる特徴語グループが複数特定される場合があり得る。この場合、リスク抽出部18は、特定された複数の特徴語グループに割り付けられているリスクをそれぞれ抽出する。
【0040】
リスク提示部19は、リスク抽出部18により抽出されたリスクを、工事関連リスク管理システム100のユーザに提示する。すなわち、リスク提示部19は、分析対象とする文書データを送信してきた建設会社の端末に対して、リスク抽出部18により抽出されたリスクを提示する。リスクの提示は、例えば、建設会社の端末のブラウザ画面に対する所定の表示によって行う。これにより、建設会社のユーザが人手によってリスクの洗い出しを行う必要がなく、工事仕様書などの文書データを工事関連リスク管理システム100に提供するだけで、その工事に潜在するリスクの洗い出しを自動で行うことができる。
【0041】
以上詳しく説明したように、本実施形態では、機能ブロック11~15を用いて行う学習時に、工事内容に応じて分類された複数の文書を形態素解析することにより、業務分類毎に複数の文書からそれぞれ複数の特徴語を抽出し、業務分類毎に抽出された複数の特徴語について、各々の特徴語が共に出現する共起状況をもとに、複数の特徴語をグループ化して特徴語グループを作成する。そして、作成した複数の特徴語グループの各々に対して、工事において発生し得るリスクを割り付けることによって分析用データを生成し、分析用データ記憶部102に記憶させる。また、機能ブロック16~19を用いて行う分析時に、分析用データ記憶部102に記憶された分析用データを用いて、分析対象として指定された複数の特徴語が含まれる特徴語グループを特定し、特定した特徴語グループに割り付けられているリスクを抽出してユーザに提示するようにしている。
【0042】
このように構成した本実施形態によれば、文書内に含まれる特徴的な単語で、かつ互いに共起関係のある単語どうしの集合が特徴語グループとして作成され、その特徴語グループに対して、工事において発生し得るリスクが割り付けられる。ここで、特徴語グループの作成元とされる複数の文書は、工事の業務内容に応じてあらかじめ分類されており、業務分類毎に特徴語グループが作成される。そのため、特徴語自体がその業務分類の特徴を表す単語となり、そのような特徴語の共起関係に基づく集合から成る特徴語グループは、各業務分類における特徴的な単語で意味的なつながりのある単語の類似集合となる。これにより、ある業務分類に属する工事について分析対象とする特徴語を指定し、その特徴語に応じて特定される特徴語グループに割り付けられたリスクを抽出することにより、その業務分類(工事内容)に応じて発生し得るリスクを適切に抽出することができ、工事内容に応じたリスクの洗い出しの精度を向上させることができる。
【0043】
<第1の変形例>
図5は、第1の変形例に係る工事関連リスク管理システム200の機能構成例を示すブロック図である。なお、この
図5において、
図1に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
図5に示すように、第1の変形例に係る工事関連リスク管理システム200は、重要度設定部21を更に備えるとともに、分析用データ記録部15およびリスク抽出部18に代えて分析用データ記録部15’およびリスク抽出部18’を備えている。
【0044】
重要度設定部21は、特徴語グループ作成部13により作成された複数の特徴語グループの各々に対して、当該特徴語グループに含まれる複数の特徴語に応じた重要度を設定する。すなわち、重要度設定部21は、
図2に示す第1の業務分類BC1に属する複数の特徴語グループGr11,Gr12,・・・内に含まれる特徴語に応じて、各特徴語グループGr11,Gr12,・・・に対して重要度を設定する。同様に、重要度設定部21は、第2の業務分類BC2に属する複数の特徴語グループGr21,Gr22,・・・内に含まれる特徴語に応じて、各特徴語グループGr21,Gr22,・・・に対して重要度を設定する。
【0045】
各特徴語グループに対する重要度の設定は、リスク割付部14によるリスクの割り付けと同様、工事関連リスク管理システム200の設計担当者または運用担当者が行うようにしてもよいし、工事関連リスク管理システム200が自動的に行うようにしてもよい。自動で行う場合は、例えば、各業務分類と、業務分類に属する工事内容に関連する1以上の重要単語とを関連付けるとともに、当該1以上の重要単語に対して各々重要度を設定した重要単語表データを学習用データ記憶部101に記憶しておき、これを学習用データ取得部11が文書データと共に取得するようにする。そして、重要度設定部21がこの重要単語表データを参照することにより、特徴語グループに対する重要度の設定を行うようにすることが可能である。
【0046】
重要度設定部21は、例えば
図2に示す第1の業務分類BC1に属する1つ目の特徴語グループGr11に対して重要度を設定する際に、当該特徴語グループGr11に含まれる複数の特徴語WD1,WD2,・・・と、重要単語表データに含まれる第1の業務分類BC1に関連付けられた1以上の重要単語とを照合し、複数の特徴語WD1,WD2,・・・中に重要単語と合致するものがあるかどうかを確認する。そして、特徴語と合致する重要単語が見つかった場合、その重要単語に設定されている重要度を特徴語グループGr11に対する重要度として設定する。なお、特徴語と合致する重要単語が複数見つかった場合は、その中で最大の重要度を設定する。
【0047】
分析用データ記録部15’は、リスク割付部14によりリスクが割り付けられるとともに重要度設定部21により重要度が設定された複数の特徴語グループに関するデータを、分析用データとして分析用データ記憶部102に記憶させる。
【0048】
リスク抽出部18’は、特徴語指定部17により指定された複数の特徴語の少なくとも1つが含まれる特徴語グループが複数特定される場合に、重要度に応じた順番に基づいて、特定された複数の特徴語グループに割り付けられているリスクを抽出する。例えば、リスク抽出部18’は、特定された複数の特徴語グループのうち、最も重要度が高い特徴語グループに割り付けられているリスクを抽出する。あるいは、リスク抽出部18’は、特定された複数の特徴語グループに割り付けられている複数のリスクを、重要度が高い順に並び替えて抽出するようにしてもよい。
【0049】
以上のように構成した第1の変形例によれば、分析対象として用いた文書データに記述されている工事内容に関連するリスクとして、特に重要度の高いものを洗い出したり、重要度のランキングを付けた状態で洗い出したりすることができる。これにより、各業務分類(工事内容)に応じて発生し得るリスクを適切に抽出してユーザに提示することができることに加えて、抽出したリスクの重要度もユーザに提示することができる。
【0050】
なお、上記第1の変形例では、
図3に示すリスク表データとは別に重要単語表データを用意し、この重要単語表データを参照することによって特徴語グループに対して重要度を設定するようにしたが、本発明はこれに限定されない。例えば、
図3に示すリスク表データに含まれる各リスクワードに対して重要度を設定しておき、このリスク表データを参照することによって特徴語グループに対して重要度を設定するようにしてもよい。
【0051】
<第2の変形例>
図6は、第2の変形例に係る工事関連リスク管理システム300の機能構成例を示すブロック図である。なお、この
図6において、
図5に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
図6に示すように、第2の変形例に係る工事関連リスク管理システム300は、第2の分類別特徴語抽出部12”、第2のリスク抽出部18”、特徴語選択部31、文書抽出部32、採点部33および特徴語グループ抽出部34を更に備えている。また、第2の変形例に係る工事関連リスク管理システム300は、重要度設定部21に代えて重要度設定部21”を備えている。
【0052】
特徴語選択部31は、分析用データ記憶部102に記憶された分析用データを用いて、特徴語グループ作成部13により作成された特徴語グループに含まれる任意の特徴語をユーザ操作に応じて選択する。特徴語選択部31は、分析用データ記憶部102に分析用データとして記憶されている複数の特徴語グループと、各特徴語グループに含まれる特徴語とを、工事関連リスク管理システム100のユーザが使用する端末のディスプレイに一覧表示させる。そして、当該一覧の中から任意の特徴語を選択するユーザ操作を受け付けて、このユーザ操作により指定された特徴語を選択する。ユーザは、例えば、これから作ろうとする事前検討書などの文書において重要と考える特徴語を選択する。
【0053】
文書抽出部32は、学習用データ取得部11により取得された複数の文書データ(工事の業務内容に応じて分類された複数の文書)の中から、特徴語選択部31により選択された特徴語が含まれる文書を抽出する。特徴語選択部31により複数の特徴語が選択された場合、文書抽出部32は、当該複数の特徴語のうち少なくとも一つが含まれる文書を抽出する。なお、選択された複数の特徴語の全てが含まれる文書を抽出するようにしてもよい。
【0054】
第2の分類別特徴語抽出部12”は、文書抽出部32により抽出された文書の形態素解析を行い、業務分類毎に複数の文書からそれぞれ複数の特徴語を抽出する。この処理は、分類別特徴語抽出部12による処理と同様である。なお、文書抽出部32により抽出される文書は、特徴語選択部31により選択された特徴語が含まれる文書であるから、第2の分類別特徴語抽出部12”により抽出される特徴語の中には上記選択された特徴語が必ず含まれ、それ以外の特徴語が更に含まれる可能性がある。
【0055】
重要度設定部21”は、上述した第1の変形例と同様に、特徴語グループ作成部13により作成された複数の特徴語グループの各々に対して、当該特徴語グループに含まれる複数の特徴語に応じた重要度を設定する。また、重要度設定部21”は、特徴語グループに含まれる複数の特徴語のそれぞれに対しても重要度を設定する。特徴語ごとの重要度は、上述した重要単語表データを参照することにより設定することが可能である。ここで、重要度は、その大きさに応じて決まる値のスコアにより表されているものとする。例えば、重要度を示すスコアは、重要度が高くなるほど値が大きくなり、重要度が低くなるほど値が小さくなるようなスコアが設定されるものとする。
【0056】
採点部33は、分析用データ記憶部102に記憶されている分析用データを参照して、第2の分類別特徴語抽出部12”により抽出された複数の特徴語に設定されている重要度を用いて、文書抽出部32により抽出された文書に対する採点を行う。採点部33は、第2の分類別特徴語抽出部12”により抽出された複数の特徴語に設定されている重要度のスコアの合計を算出することにより、各文書に対する採点をそれぞれ行う。採点部33は、工事関連リスク管理システム100のユーザに対して採点の結果を提示する。
【0057】
この採点は、ユーザがこれから作ろうとする事前検討書などの文書において重要と考えて選択した特徴語が含まれる1つ以上の文書(学習用データ記憶部101に記憶されている既文書)に対するそれぞれの採点である。ユーザは、高い採点が付けられた既文書を確認し、これから作ろうとする文書との親和性あるいは類似性が高いことを確認できた場合は、ユーザが選択した特徴語が妥当性を有していると判断することができる。一方、高い採点が付けられた既文書と、ユーザがこれから作ろうとする文書との親和性あるいは類似性が低いとユーザが判断した場合は、ユーザが選択した特徴語の妥当性が低いことを意味する。これにより、ユーザは、採点部33による採点結果を参考にしながら、適切な特徴語を用いて文書を作成することが可能となる。
【0058】
図7は、採点部33の処理内容を説明するための図である。なお、この
図7は、後述する特徴語グループ抽出部34の処理内容を説明するためにも使用する。ここで、
図7(a)は、分析用データ記憶部102に記憶されている分析用データを説明用に模式的に示したものである。
図7(b)は、文書抽出部32により抽出された1つの文書から第2の分類別特徴語抽出部12”により抽出された特徴語のリストを説明用に模式的に示したものである。
【0059】
図7(a)に示すように、分析用データ記憶部102に記憶されている分析用データは、特徴語グループ作成部13により作成された特徴語グループと、当該特徴語グループに含まれる複数の特徴語と、当該複数の特徴語に対してそれぞれ重要度設定部21”により設定された重要度のスコアとを含んでいる。これに対して、
図7(b)に示すように、第2の分類別特徴語抽出部12”により抽出される特徴語は、
図7(a)に示す複数の特徴語の中の一部である。
【0060】
ここでは、「コンクリート」、「覆工」、「ひび割れ」、「品質」、「発生」の5つの特徴語が第2の分類別特徴語抽出部12”により1つの文書から抽出された例を示している。採点部33は、この5つの特徴語に設定されている重要度のスコアを合計することにより、当該1つの文書に対する採点を行う。採点部33は、このような採点を、文書抽出部32により抽出された複数の文書のそれぞれについて行う。
【0061】
特徴語グループ抽出部34は、分析用データ記憶部102に分析用データとして記憶されている複数の特徴語グループの中から、第2の分類別特徴語抽出部12”により抽出された特徴語が属する特徴語グループ以外の特徴語グループであって、重要度設定部21”により設定された重要度が高いものとして所定の条件を満たす特徴語グループを抽出する。
【0062】
例えば、
図7に示す例の場合、特徴語グループ抽出部34は、
図7(a)に示す分析用データに含まれる複数の特徴語グループの中から、「コンクリート」、「覆工」、「ひび割れ」、「品質」、「発生」の5つの特徴語が属する特徴語グループGr11,Gr13以外の特徴語グループを抽出する。
【0063】
特徴語グループ抽出部34は、さらに、上記のようにして抽出した特徴語グループの中から、重要度設定部21”により設定された重要度に応じて幾つかを選択的に抽出する(抽出対象を絞り込む)。例えば、特徴語グループに対して設定された重要度(
図7では不図示)が高い順にn個の特徴語グループを抽出する。あるいは、特徴語グループに対して設定された重要度が所定の閾値以上の特徴語グループを抽出するようにしてもよい。
【0064】
さらに別の例として、特徴語グループに属する個々の特徴語に対して設定された重要度に応じて特徴語グループを抽出するようにしてもよい。例えば、
図7(a)のように重要度が高い順に複数の特徴語をソートし、上位の方から順に異なる特徴語グループをn個抽出するようにすることが可能である。あるいは、重要度が所定値以上の複数の特徴語を抽出し、当該複数の特徴語に対応する特徴語グループを抽出するようにしてもよい。
【0065】
第2のリスク抽出部18”は、分析用データ記憶部102に記憶された分析用データを用いて、特徴語グループ抽出部34により抽出された特徴語グループに割り付けられているリスクを抽出する。リスク提示部19は、第2のリスク抽出部18”により抽出されたリスクを工事関連リスク管理システム100のユーザに提示する。
【0066】
このように、特徴語グループ抽出部34および第2のリスク抽出部18”を設けることにより、ユーザがこれから作ろうとする文書において重要と考えなかった特徴語(特徴語選択部31により選択されなかった特徴語)に対応する特徴語グループの中から、重要度が高く設定されている特徴語グループを抽出し、その特徴語グループに割り付けられているリスクをユーザに提示することができる。これにより、ユーザが意識していない重要なリスクをユーザに提示して注意喚起をすることができ、文書を作成する際に考慮すべきリスクの抜け漏れを低減することができる。
【0067】
なお、上記第2の変形例では、ユーザが事前検討書などの文書を作成する前に重要と考える特徴語を選択し、当該選択した特徴語を用いて文書を抽出する例について説明したが、これに限定されない。例えば、ユーザが事前検討書などの文書を作成し、当該作成した文書を分析対象データ取得部16が分析対象のデータとして取得する。そして、特徴語指定部17が、分析対象データ取得部16により取得された分析対象の文書を形態素解析することにより、分析対象の文書から複数の特徴語を抽出し、当該抽出した特徴語をもとに採点部33および特徴語グループ抽出部34の処理を行うようにしてもよい。
【0068】
なお、上記実施形態および第1、第2の変形例では、特徴語指定部17が、分析対象データ取得部16により取得された分析対象の文書を形態素解析することによって複数の特徴語を指定する例について説明したが、本発明はこれに限定されない。例えば、工事関連リスク管理システム100(200,300)のユーザが端末から入力する単語を特徴語として指定するようにしてもよい。このようにすれば、これから行う予定の工事に関する工事仕様書がまだ作成されていない段階において、その工事に関連するキーワードを端末から入力するだけで、その工事に関連するリスクの洗い出しを行うことができる。
【0069】
また、上記実施形態および第1、第2の変形例では、リスク抽出部18(18’)が、特徴語指定部17により指定された複数の特徴語のうち少なくとも1つが含まれている1以上の特徴語グループを特定し、当該特定した1以上の特徴語グループに割り付けられているリスクを抽出する例について説明したが、本発明はこれに限定されない。例えば、リスク抽出部18(18’)は、特徴語指定部17により指定された複数の特徴語が全て含まれている1以上の特徴語グループを特定し、当該特定した1以上の特徴語グループに割り付けられているリスクを抽出するようにしてもよい。このようにすれば、分析対象とした文書に対してより関係性の強い特徴語グループに割り付けられているリスクのみを抽出することができ、リスク洗い出しの更なる精度の向上が期待できる。
【0070】
また、上記実施形態および第1、第2の変形例において、新たに作成した施工計画書等を、工事が終了した後で順次学習用データに加えていくようにしてもよい。このようにすることで、自ずとより精度の高い特徴語抽出や、重要度の設定が可能となる。
【0071】
その他、上記実施形態および第1、第2の変形例は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0072】
11 学習用データ取得部
12 分類別特徴語抽出部
12” 第2の分類別特徴語抽出部
13 特徴語グループ作成部
14 リスク割付部
15,15’ 分析用データ記録部
16 分析対象データ取得部
17 特徴語指定部
18,18’ リスク抽出部
18” 第2のリスク抽出部
19 リスク提示部
21 重要度設定部
31 特徴語選択部
32 文書抽出部
33 採点部
34 特徴語グループ抽出部
100,200,300 工事関連リスク管理システム
101 学習用データ記憶部
102 分析用データ記憶部