(58)【調査した分野】(Int.Cl.,DB名)
前記信頼度が信頼度閾値以下である前記分類済みデータ名称に対して、ユーザに当該分類済みデータ名称の各属性名への分類の修正を促すための修正推薦情報を付与する修正推薦情報処理部と、
をさらに含み、
前記データ提供部は、さらに、前記分類済みデータ名称に付与された前記修正推薦情報をユーザに提供する、
ことを特徴とする請求項1に記載のデータ名称分類支援装置。
前記修正情報処理部は、修正された前記分類済みデータ名称に対して、さらに、前記修正処理を実行した時刻である修正時刻、及び、前記修正処理を指示したユーザを示す修正者情報の少なくとも一方を付与し、
前記データ提供部は、さらに、修正された前記分類済みデータ名称に付与された、前記修正時刻及び前記修正者情報の少なくとも一方をユーザに提供する、
ことを特徴とする請求項3に記載のデータ名称分類支援装置。
前記分類修正処理部は、前記修正処理が実行された前記分類済みデータ名称と同一のデータ名称を有する他の分類済みデータ名称に対して、当該修正処理と同内容の修正を行う、
ことを特徴とする請求項3に記載のデータ名称分類支援装置。
前記分類修正処理部は、前記修正処理が実行された前記分類済みデータ名称と類似するデータ名称を有する他の分類済みデータ名称に対して、当該修正処理に対応する内容の修正を行ってよいか否かをユーザに対して問い合わせ、当該ユーザが許可した場合に、当該他の分類済みデータ名称に対して当該修正処理に対応する内容の修正を行う、
ことを特徴とする請求項3に記載のデータ名称分類支援装置。
前記信頼度算出部は、前記分類済みデータ名称に対して前記修正処理が実行された場合に、当該分類済みデータ名称と類似するデータ名称を有する他の分類済みデータ名称の前記信頼度を低下させる、
ことを特徴とする請求項3に記載のデータ名称分類支援装置。
【発明を実施するための形態】
【0023】
以下、本発明の実施形態について説明する。
【0024】
図1に、本実施形態に係るデータ名称分類支援システム10の構成概略図が示されている。データ名称分類支援システム10は、複数のセンサからなるセンサ群12、データ名称分類支援装置としてのサーバ14、及び、ユーザ端末16を含んで構成されている。
【0025】
本実施形態では、センサ群12は、ビル18内の各機器(設備)に設けられる。センサ群12に含まれるセンサは、ビル18内の機器に関する種々のパラメータ、特に、機器の稼働状況を判定するためのパラメータを検出するセンサである。センサ群12に含まれる各センサとしては、例えば、温度センサ、湿度センサ、電圧センサ、電流センサ、圧力センサ、回転数センサ、加速度センサなど、様々な種類のセンサであってよい。
【0026】
各センサは、ビル18内に設けられた複数の機器に設けられる。1つの機器に複数のセンサが設けられてもよい。本実施形態におけるセンサ群12は、数千から数万といった膨大な数のセンサを含んでいるものとする。
【0027】
センサ群12に含まれる各センサは、有線あるいは無線によってビル18の中央監視装置20に接続されており、各センサの検出値は逐次中央監視装置20に送られる。各センサは、検出値を検出した時刻を取得可能であり、各センサは、検出値と、検出時刻を示す検出時刻情報と、自センサ(あるいは自センサが検出した検出値)を識別する情報(データID)とを関連付けて中央監視装置20に送信する。以後、検出値と、検出時刻情報と、データIDとが関連付けられた情報を検出値情報と記載する。このようにして、中央監視装置20には、ビル18に設けられたセンサ群12からの各検出値情報が集約される。なお、検出時刻は、中央監視装置20が取得するようにしてもよい。すなわち、中央監視装置20が各センサから検出値を受信した時刻を検出時刻として取得するようにしてもよい。
【0028】
中央監視装置20は、インターネットあるいはLAN(Local Area Network)などを含む通信回線22を介してサーバ14に通信可能に接続される。中央監視装置20に集約されたセンサ群12からの各検出値情報はサーバ14へ送られる。
【0029】
なお、中央監視装置20はコンピュータであってよく、少なくとも、センサ群12から各検出値情報を受信する受信部と、各検出値情報を記憶する記憶部と、各検出値情報をサーバ14へ送信する送信部と、これらを制御する制御部とを備えていればよい。
【0030】
サーバ14は、サーバとして機能し得る程度の性能を有したコンピュータである。サーバ14は、通信回線22を介して中央監視装置20及びユーザ端末16と通信可能に接続される。サーバ14の詳細については後述する。
【0031】
ユーザ端末16は、ビル18内の機器の稼働状況を分析し、当該機器の運用に関する改善プランなどを提案する者(分析者あるいはプランナ)、あるいは、それらの者を支援する者であってデータ処理を行う者などを含むユーザが利用する端末である。ユーザ端末16は、一般的なコンピュータであってよく、本実施形態ではパーソナルコンピュータである。あるいは、ユーザ端末16は、スマートフォンあるいはタブレット端末のような携帯端末であってもよい。ユーザ端末16は、ネットワークアダプタなどからなる通信部、液晶パネルなどからなる表示部、タッチパネルあるいはボタンなどからなる入力部、メモリなどからなる記憶部、及び、マイクロコンピュータなどからなる制御部を含んで構成される。
【0032】
ユーザは、ユーザ端末16を用いてサーバ14にアクセスして各種情報、特にビル18内の機器の稼働状況を分析するために必要なセンサ群12の検出値を取得することができる。上述の通り、本実施形態ではセンサ群12には数千から数万のセンサが含まれているところ、ユーザは分析内容に応じてセンサ群12の中から適切な複数のセンサの検出値を抽出し、抽出した複数のセンサの抽出値に基づいて分析を行う。
【0033】
図2に、サーバ14の構成概略図が示されている。
【0034】
通信部30は、例えばネットワークアダプタなどから構成される。通信部30は、中央監視装置20及びユーザ端末16と通信するためのものである。具体的には、通信部30は、中央監視装置20からセンサ群12に関する各検出値情報を受信する機能、ユーザ端末16からの接続要求を受信する機能、あるいは、各種情報をユーザ端末16へ送信する機能を有する。
【0035】
記憶部32は、例えば、ハードディスク、ROM(Read Only Memory)、あるいはRAM(Random Access Memory)などから構成される。記憶部32には、サーバ14の各部を動作させるためのデータ名称分類支援プログラムが記憶される。あるいは、記憶部32には、各種制御データ、各種処理データが記憶される。さらに、
図2に示されるように、記憶部32には、検出値DB(データベース)34、データ名称リスト36、辞書DB38、及び、分類結果リスト40が記憶される。
【0036】
検出値DB34には、センサ群12に関する検出値情報群が蓄積記憶される。具体的には、中央監視装置20からセンサ群12に関する各検出値情報を受信する度に、後述の制御部42は、受信した検出値情報を検出値DB34に格納する。これにより、センサ群12に関する検出値情報群が検出値DB34に蓄積記憶される。上述のように、検出値情報には、データID、検出時刻、及び検出値が含まれるから、検出値DB34においては、データID、検出時刻、及び検出値が関連付けられて記憶される。
【0037】
データ名称リスト36は、センサ群12に含まれる各センサの検出値を示すデータ名称群を含むリストである。本実施形態では、センサ毎にデータ名称が付与される。各データ名称は、複数の属性項目に対する複数の属性名から構成される。本実施形態では、各データ名称は、センサが設けられた場所を示す場所、センサの検出対象となる設備(機器)の種別(設備種別)、及び、センサの検出値の種別(信号種別)の3つの属性項目に対する3つの属性名、すなわち、場所名、設備名、及び信号名から構成される。
【0038】
図3に、本実施形態におけるデータ名称リスト36の例が示されている。本実施形態におけるデータ名称リスト36においては、各センサ(あるいはセンサの検出値)に対応する各データ名称が一覧となっている。なお、各データ名称には、それを識別するための識別情報であるデータIDが関連付けられている。
図3に示されたデータ名称リスト36の一番目に示されるように、データ名称の一例としては、「B1F系統1空調機AHU−1SA温度」である。このうち、「B1F」が場所名であり、「系統1空調機AHU−1」が設備名であり、「SA温度」が信号名である。なお、
図3に示されたデータ名称は、データ名称リスト36の一部であり、実際には、データ名称リスト36には、センサ群12の数に応じた膨大な数のデータ名称群が含まれる。
【0039】
各データ名称は、ユーザあるいはセンサを設置した業者など、様々な者(データ名称付与者)によって付与され得る。したがって、データ名称としては様々な名称が付与され得る。例えば、予め、「データ名称は場所名、設備名、及び信号名から構成すること」との決まりを定めておいた上で、各データ名称付与者がその決まりを遵守したとしても、データ名称における場所名、設備名、及び信号名の並び順が異なっていたり、あるいは同じ場所を示すにしても異なる用語が用いられたりすることが想定される。具体的には、例えば「1F」の「空調機」に設けられた「電力」センサの検出値を示すデータ名称に対して、あるデータ名称付与者は「1F空調機電力量」というデータ名称を付与し、他のデータ名称付与者は「空調機電力1階」というデータ名称を付与する場合が想定される。また、データ名称リスト36に同一のデータ名称が含まれる場合もあり得る。
【0040】
辞書情報としての辞書DB38には、データ名称を構成する各属性項目に属する用語(単語)が定義されている。辞書DB38は、後述のデータ名称処理部44(より詳細には分類処理部54)が、データ名称リスト36内の各データ名称を各属性名(本実施形態では場所名、設備名、及び信号名)に分類する際、あるいは、後述の信頼度算出部56が信頼度を算出する際に参照される。
【0041】
図4に、本実施形態における辞書DB38の内容の例が示されている。本実施形態では、各データ名称は場所、設備種別、及び信号種別の各属性項目に対する属性名から構成されるから、本実施形態における辞書DB38には、
図4に示す通り、場所、設備種別、及び信号種別それぞれに属する用語が定義されている。例えば、
図4の辞書DB38は、「B1F」、「1F」、「会議室」、及び「作業室」などの用語が属性項目「場所」に属すことを示し、「系統」、「空調機」、及び「電灯」などの用語が属性項目「設備種別」に属すことを示し、「SA」、「温度」、「状変値」、及び「電力量」などの用語が属性項目「信号種別」に属すことを示している。
【0042】
また、辞書DB38には、用語として、標準用語と、当該標準用語とは異なる用語であるが当該標準用語と同じ意味を表す同義語とが関連付けられて定義されている。同義語は、データ名称が様々なデータ名称付与者により付されることにより生じ得る用語のゆれを吸収するために用いられる。例えば、標準用語「B1F」には、当該標準用語「B1F」と同じ意味を示す同義語「地下1F」、「地下1階」、「B1」などが関連付けられている。
【0043】
なお、辞書DB38は、ユーザなどによって予め作成され記憶部32に記憶されてよい。また、後述のように、辞書DB38には後述のデータ名称処理部44によって新たな用語が追加されることもできる。
【0044】
分類結果リスト40は、データ名称を構成する各属性名を区別して示す分類済みデータ名称のリスト(データベース)である。分類結果リスト40は、後述のデータ名称処理部44により生成されるものである。
図5に、本実施形態における分類結果リスト40の例が示されている。
図5に示されるように、分類結果リスト40においては、データ名称リスト36に含まれていた各データID及び各データ名称に対して、分類された結果得られた各属性名である場所名、設備名、及び信号名が区別されて関連付けられている。当該場所名、設備名、信号名のセットが分類済みデータ名称である。例えば、
図5に示された分類結果リスト40の一番上のレコードを見てみると、データID「D0001」及びデータ名称「B1F系統1空調機AHU−1SA温度」に対して、分類済みデータ名称である場所名「B1F」、設備名「系統1空調機AHU−1」、及び信号名「SA温度」のセットが関連付けられている。
【0045】
なお、分類結果リスト40においては、分類済みデータ名称に対して、信頼度、修正推薦フラグ、修正済みフラグ、修正時刻、及び修正者の各情報が付加されているが、これらの情報の詳細については後述する。
【0046】
制御部42は、例えばCPU(Central Processing Unit)などを含んで構成される。制御部42は、記憶部32に記憶されたデータ名称分類支援プログラムに従ってサーバ14の各部の制御を行う。また、
図2に示されるように、制御部42は、データ名称処理部44、データ抽出部46、データ分析部48、及びデータ提供部50としても機能する。
【0047】
データ名称処理部44は、データ名称リスト36に対して処理を行って分類結果リスト40を生成する。具体的には、データ名称リスト36に含まれる各データ名称について、複数の属性名に分類して分類済みデータ名称を生成する。また、データ名称処理部44は、分類結果リスト40の更新処理を行う。具体的には、分類結果リスト40に含まれる各分類済みデータ名称に付与され得る信頼度、修正推薦フラグ、修正済みフラグ、修正時刻、修正者などの各種情報を更新する処理を行う。データ名称処理部44の詳細については後述する。
【0048】
データ抽出部46は、ユーザから指定された特定の属性名に基づいて、分類結果リスト40の中から、当該特定の属性名に該当する分類済みデータ名称を特定し、特定した分類済みデータ名称に関連付けられたデータIDを抽出する。
【0049】
ユーザは、ユーザ端末16を用いて特定の属性名を指定することができる。ユーザがユーザ端末16を用いてサーバ14にアクセスすると、ユーザ端末16の表示部に属性名指定画面が表示される。
【0050】
図6には、ユーザ端末16の表示部に表示される属性名指定画面の例が示されている。属性名指定画面は、データ名称が有する複数の属性項目の1つである場所に対して、分類結果リスト40に含まれる場所名のいずれかが選択できるようになっている。同様に、設備種別及び信号種別に対しても、分類結果リスト40に含まれる設備名及び信号名のいずれかが選択できるようになっている。
【0051】
当該属性名指定画面にて、ユーザが各属性項目に対する特定の属性名を選択すると、選択された属性名が指定される。
図6の例では、場所として「B1F」が、設備種別として「系統空調機」が、信号種別として「SA温度」が指定されている。なお、ユーザは、必ずしも3つの属性項目に対する属性名を指定する必要はなく、一部の属性項目に対する属性名を指定するようにしてもよい。例えば、場所として「B1F」のみを選択するようにしてもよい。
【0052】
例えば、
図6の例が示すように、ユーザによって、場所名「B1F」、設備名「系統空調機」、信号名「SA温度」が指定された場合、データ抽出部46は、分類結果リスト40から、場所名「B1F」、設備名「系統空調機」、信号名「SA温度」を含む分類済みデータ名称を特定し、当該分類済みデータ名称に関連付けられたデータIDを抽出する。また、例えば、ユーザによって場所名「B1F」のみが指定された場合、データ抽出部46は、設備種別及び信号種別に関係なく、場所名が「B1F」である全ての分類済みデータ名称のデータIDを抽出する。
【0053】
次いで、データ抽出部46は、検出値DB34から抽出したデータIDに対応するセンサの検出値を抽出する。
【0054】
データ分析部48は、データ抽出部46が抽出したセンサの検出値に基づいて、ビル18内の機器の診断あるいは分析を行う。データ分析部48は、ユーザからの指定に基づいて、種々の内容の分析を行うことができる。
【0055】
データ提供部50は、データ分析部48による診断あるいは分析の結果を示す結果情報をユーザ端末16に送信する制御を行う。これにより、結果情報がユーザに提供される。あるいは、詳細は後述するように、データ提供部50は、データ名称処理部44が生成あるいは更新した分類結果リスト40をユーザ端末16に送信してユーザに提供する処理を行う。
【0056】
以下、データ名称処理部44の詳細について説明する。
図2に示される通り、データ名称処理部44は、形態素解析部52、分類処理部54、信頼度算出部56、修正推薦情報処理部58、整列処理部60、分類修正処理部62、及び、修正情報処理部64としての機能を有する。
【0057】
形態素解析部52は、データ名称リスト36に含まれる各データ名称に対して形態素解析を行うことで、各データ名称を各用語に分割する。形態素解析については、既知の技術(例えば、MeCabなどの形態素解析ソフトウェア)を用いて行うことができる。例えば、形態素解析部52は、
図3に示すデータ名称リスト36のうち一番目のレコードのデータ名称「B1F系統1空調機AHU−1SA温度」に対して形態素解析を行うことで、当該データ名称を「B1F」、「系統1」、「空調機」、「AHU−1」、「SA」、及び、「温度」の各用語に分割する。形態素解析部52は、同様にして、その他のデータ名称についても各用語に分割する。
【0058】
分類処理部54は、形態素解析部52の処理結果と、辞書DB38とに基づいて、データ名称リスト36に含まれる各データ名称を複数の属性項目に対する複数の属性名に分類して分類済みデータ名称を生成する分類処理を実行する。本実施形態では、各データ名称は場所名、設備名、及び信号名に分類される。
【0059】
まず、分類処理部54は、形態素解析部52により分割された各用語のうち、辞書DB38に定義されている用語については、辞書DB38の定義に従って当該用語の属性項目を決定する。例えば、データ名称「B1F系統1空調機AHU−1SA温度」の例において、辞書DB38に、「B1F」が場所名であり、「系統」及び「空調機」が設備名であり、「SA」及び「温度」が信号名であることが定義されている場合を考える。この場合、分類処理部54は、辞書DB38に基づいて、「B1F」を属性項目「場所」に属するもの、すなわち場所名とする。同様に、分類処理部54は、「系統」を含む「系統1」、及び「空調機」を設備名とし、「SA」及び「温度」を信号名とする。
【0060】
ここまでの処理で、分類処理部54は、当該データ名称は、場所名、設備名、信号名の順に並ぶものであることが把握できる。次いで、分類処理部54は、データ名称の各属性名の並び順と、残りの用語(すなわち辞書DB38に定義されていない用語)の位置とに基づいて、残りの用語の属性項目を決定する。本例では、残りの用語である「AHU−1」の属性項目を決定する。本例では、「AHU−1」の前に位置する「空調機」が設備名であり、「AHU−1」の後に位置する「SA」が信号名であることが分かっているので、それらの間にある「AHU−1」は、設備名又は信号名のいずれかであることが把握される。したがって、分類処理部54は、「AHU−1」を設備名又は信号名のいずれかに特定する。実際に「AHU−1」は設備名に含まれるべき用語であり、ここでは「AHU−1」が適切に設備名であると特定されたとする。
【0061】
以上の処理により、データ名称の各用語の属性項目が決定される。そして、分類処理部54は、決定された各用語の属性項目に従って、データ名称を複数の属性名に分類する。データ名称「B1F系統1空調機AHU−1SA温度」の例では、「B1F(場所名)系統1(設備名)空調機(設備名)AHU−1(設備名)SA(信号名)温度(信号名)」であるから、これらをまとめて、「B1F」を場所名、「系統1空調機AHU−1」を設備名、「SA温度」を信号名とする。このようにして分類済みデータ名称が生成される。なお、この例では、「系統1」、「空調機」、及び「AHU−1」の3つの用語が1つにまとめられて「系統1空調機AHU−1」が設備名となっているが、これをまとめずに、当該分類済みデータ名称には設備名として「系統1」、「空調機」、及び「AHU−1」の3つの用語を含むとするようにしてもよい。同様に、信号名を「SA」及び「温度」の2つの用語を含むものとしてもよい。もちろん、場所名が複数の用語を含む場合も同様である。
【0062】
分類処理部54は、データ名称リスト36に含まれる各データ名称に対して上述の分類処理を実行し、各データ名称に対する分類済みデータ名称を生成する。これにより、分類結果リスト40が生成される。
【0063】
なお、上述の例では、辞書DB38に含まれていない用語である「AHU−1」が偶然にも適切に設備名に分類されたが、「AHU−1」が信号名に分類されてしまう場合もある。このように、分類処理部54による自動分類処理では、データ名称が必ずしも適切に複数の属性名に分類されない場合もある。
【0064】
信頼度算出部56は、辞書DB38に基づいて、分類結果リスト40に含まれる各分類済みデータ名称について、分類処理部54による分類処理の精度に関する指標である信頼度を算出する。本実施形態では、信頼度算出部56は、形態素解析部52がデータ名称を分割することで得られた用語の数に対する、辞書DB38に定義された用語の数の割合を信頼度として算出する。
【0065】
図7の例に従って具体的に説明する。
図7には、分類結果リスト40の他の例が示されている。ここでは、辞書DB38において、「3F」及び「会議室」が場所名であり、「電灯」が設備名であり、「電力量」が信号名であることが定義されているものとする。まず、データ名称「3F催事用電灯電力量」についてみると、当該データ名称は、形態素解析部52により、「3F」、「催事用」、「電灯」、及び「電力量」の4つの用語に分割されている。その後、分類処理部54により、
図7に示すように、当該データ名称が、場所名「3F催事用」、設備名「電灯」、及び信号名「電力量」に分類されている。ここで、形態素解析部52により分割された4つの用語のうち、辞書DB38に定義された用語は3つ(「3F」、「電灯」、及び「電力量」)であり、辞書DB38に定義されていない用語は1つ(「催事用」)であるから、その割合に応じて、信頼度算出部56は、当該分類済みデータ名称に対する信頼度を3/4、すなわち「75」と算出する。そして、分類結果リスト40において、当該分類済みデータ名称に対して信頼度「75」を関連付ける。
【0066】
図7に示された他の分類済みデータ名称についても同様である。データ名称「3F厨房電灯電力量」については、形態素解析により「3F」、「厨房」、「電灯」、及び「電力量」の4つの用語に分割され、そのうち辞書DB38に定義された用語は3つであるから、信頼度算出部56は、当該分類済みデータ名称に対する信頼度を「75」と算出する。データ名称「3F会議室電灯電力量」については、形態素解析により「3F」、「会議室」、「電灯」、及び「電力量」の4つの用語に分割され、そのうち全ての用語が辞書DB38に定義されているから、信頼度算出部56は、当該分類済みデータ名称に対する信頼度を「100」と算出する。
【0067】
なお、信頼度は、分類済みデータ名称の分類精度に関するあくまで指標であって、必ずしも分類精度を正確に示す値ではない。具体的には、辞書DB38に登録されていない用語が適切な属性項目に分類されている場合は、正確に分類されているにも関わらず信頼度が低くなる。例えば、
図7に示すデータ名称「3F厨房電灯電力量」に対応する分類済みデータ名称については、用語「厨房」が辞書DB38に登録されていないために信頼度が「75」となっているが、「厨房」は場所名に分類されており、これは実際に正しい分類である。逆に、正確に分類されていない場合に信頼度が高くなることはない。辞書DB38に登録された用語は正しい属性項目に分類されるからである。したがって、信頼度は、分類済みデータ名称が正確に分類されている可能性を示す値であるとも言える。
【0068】
修正推薦情報処理部58は、信頼度算出部56により算出された信頼度が、予め定められた信頼度閾値以下の分類済みデータ名称に対して、修正推薦情報としての修正推薦フラグを付与する。当該修正推薦フラグは、ユーザに対して当該分類済みデータ名称の各属性名への分類の手動修正を促すためのものである。信頼度閾値は、例えばユーザなどによって予め定められ記憶部32に記憶されていてよい。本実施形態では、信頼度閾値は「60」に設定されているものとする。すなわち、修正推薦情報処理部58は、分類結果リスト40において、信頼度が「60」以下である分類済みデータ名称に対して修正推薦フラグ項目に対する値「1」を付与し、信頼度が「60」より大きい分類済みデータ名称に対しては修正推薦フラグ項目に対しては値を付与しない。なお、後述のように、同一の分類済みデータ名称に対する信頼度は一定ではなく、種々の処理により変動し得る。したがって、修正推薦情報処理部58は、一度付与した修正推薦フラグを削除する場合もある。
【0069】
整列処理部60は、分類結果リスト40における各レコードの並び順を整列(ソート)する処理を行う。後述のように、分類結果リスト40はユーザに提供されるが、整列処理部60は、分類結果リスト40がユーザに提供されたときに、ユーザがより見やすいよう、具体的には、目的とするデータ名称をより容易に発見できるように、各レコードをソートする。
【0070】
具体的には、整列処理部60は、分類済みデータ名称に基づいてソートを行う。まず、整列処理部60は、データ名称を参照して、分類済みデータ名称が有する複数の属性名の並び順が同じデータ名称をまとめる処理を行う。その上で、分類済みデータ名称に同一の用語を含むレコードを近くにまとめる処理を行う。本実施形態では、整列処理部60は、場所名、設備名、信号名の並び順が同じ分類済みデータ名称を有するレコードをまとめた上で、その中で、場所名、設備名、信号名の少なくとも1つにおいて同じ用語が含まれている分類済みデータ名称を有するレコードが近く位置するようにソートする。ここで、ソートの優先度は、場所名、設備名、信号名の順とする。具体的には、「3F電灯電力量」というデータ名称を有するレコードに対して、「1F電灯電力量」、「3F電灯温度」というデータ名称をそれぞれ有する2つのレコードを考えた場合、場所名が同じである「3F電灯温度」のデータ名称を有するレコードが優先されて、「3F電灯電力量」のデータ名称を有するレコードの近くにまとめられる。
【0071】
分類処理部54により生成され、信頼度算出部56により信頼度が付与され、整列処理部60によりソートされた分類結果リスト40は、データ提供部50によってユーザ端末16に送信される。これにより、複数の分類済みデータ名称と、各分類済みデータ名称についての信頼度がユーザに提供される。好適には、さらに、該当する分類済みデータ名称には修正推薦情報処理部58により修正推薦フラグが付与され、また、整列処理部60によりソートされた分類結果リスト40がデータ提供部50によってユーザ端末16に送信される。
【0072】
本実施形態では、
図7に示すような分類結果リスト40がユーザ端末16の表示部に表示される。ユーザは、分類結果リスト40を参照して、分類処理部54による分類処理が適切に行われているか否かを確認し、必要であれば分類の手動修正を行う。
【0073】
ここで、ユーザには、各分類済みデータ名称に対する信頼度が提供されるから、ユーザは、当該信頼度を参照して、手動修正の対象となる分類済みデータ名称を容易に見つけ出すことができる。もちろん、ユーザ指示によって、整列処理部60が、信頼度が昇順となるように分類結果リスト40に含まれる各レコードをソートすることも可能である。
【0074】
さらに好適には、ユーザには、信頼度が信頼度閾値以下の分類済みデータ名称に付された修正推薦フラグが提供されるから、ユーザは、修正推薦フラグが付された分類済みデータ名称を手動修正の対象として容易に特定することができる。もちろん、ユーザ指示によって、整列処理部60が、修正推薦フラグが付されたレコードをまとめるように分類結果リスト40をソートすることも可能である。
【0075】
分類修正処理部62は、ユーザからの指示(詳しくはユーザ端末16から送信される指示情報)に基づいて、ユーザから指定された分類結果リスト40に含まれる分類済みデータ名称の分類を個別的に修正する修正処理を実行する。例えば、
図7に示された分類結果リスト40の一番上のレコードにおいて、場所名が「3F催事用」となっているが、正しくは「催事用」に用語は設備名に含めるべきものであるとする。したがって、この場合、ユーザは、ユーザ端末16を用いて、修正対象のレコードとしてデータ名称「3F催事用電灯電力量」のレコードを指定し、データIDに対応する分類済みデータ名称を、場所名「3F」、設備名「催事用」及び「電灯」、信号名「電力量」とする修正指示をサーバ14へ送信する。当該修正指示を受けた分類修正処理部62は、当該修正指示に従って、当該分類済みデータ名称の分類を修正する。すなわち、この例では、データ名称「3F催事用電灯電力量」の場所名を「3F催事用」から「3F」へ修正し、設備名を「電灯」から「催事用」及び「電灯」に修正する。
【0076】
上述のように、データ名称リスト36には、同一のデータ名称が含まれている場合がある。その場合、分類処理部54による分類処理によって、当該同一のデータ名称は同じように分類されているはずである。すなわち、当該同一のデータ名称のうちの一方の分類が間違っているならば、他方のデータ名称の分類も同様に間違っているはずである。このことに鑑み、分類修正処理部62は、分類修正の対象として指定された分類済みデータ名称である注目分類済みデータ名称の分類をユーザが手動修正した場合、注目分類済みデータ名称と同一のデータ名称を有する他の分類済みデータ名称の分類を注目分類済みデータ名称と同様に修正する。これにより、同じデータ名称を有する分類済みデータ名称について、ユーザが同様の修正処理を繰り返し行う必要がなくなる。すなわち、ユーザによる手動修正にかかる手間及び時間が低減される。
【0077】
また、分類が修正された注目分類済みデータ名称に類似する他の分類済みデータ名称に対して、注目分類済みデータに対応する(類似する)内容の修正を行うことで、当該他の分類済みデータ名称の分類を好適に修正できる場合がある。ここで、注目分類済みデータ名称に類似する分類済みデータ名称とは、注目分類済みデータ名称との間の類似度が、予め定められた類似度閾値以上である分類済みデータ名称である。類似度は、例えば、データ名称における複数の属性名の並び順が同じであるか否か、あるいは、各属性名における同一の用語が含まれている個数などに基づいて決定される。
【0078】
例えば、
図7に示されたデータ名称「3F催事用電灯電力量」とデータ名称「3F通常用電灯電力量」との関係を考える。上述の通り、データ名称「3F催事用電灯電力量」は場所名「3F催事用」、設備名「電灯」、信号名「電力量」に分類され、データ名称「3F通常用電灯電力量」は場所名「3F通常用」、設備名「電灯」、信号名「電力量」に分類される。ここで、両分類済みデータ名称は、場所名、設備名、信号名の並び順が同じであるし、場所名において「3F」の用語が共通し、説明名及び信号名は完全一致していることから、両分類済みデータ名称は類似していると判定されるものとする。
【0079】
ここで、ユーザ指示により、分類修正処理部62が、「3F催事用電灯電力量」についての注目分類済みデータ名称に対して、場所名「3F」、設備名「催事用」及び「電灯」、信号名「電力量」とする修正、つまり、場所名に含まれる2つ目の用語を設備名とする修正を行った場合、分類修正処理部62は、注目分類済みデータ名称に類似する「3F通常用電灯電力量」についての分類済みデータ名称に対して、当該修正に対応する内容の修正を行うか否かを問い合わせる。本例だと、当該修正に対応する内容の修正とは、場所名の2つ目の用語を設備名とする修正であり、すなわち、場所名に含まれていた「通常用」の用語を設備名とし、場所名「3F」、設備名「通常用」及び「電灯」、信号名「電力量」とする修正である。当該問い合わせに対し、ユーザが許可したならば、分類修正処理部62は、ユーザに問い合わせた通りの内容の修正を実行する。
【0080】
これにより、注目分類済みデータ名称に類似する他の分類済みデータに対するユーザの手動修正にかかる手間及び時間が低減される。なお、注目分類済みデータ名称に類似する他の分類済みデータに対しては、注目分類済みデータ名称に対する修正に対応する内容の修正を行っても、必ずしも適切に分類が修正されない場合があり得る。そのため、分類修正処理部62は、修正案を一旦ユーザに提示した上で、ユーザの許可を待ってから類似する分類済みデータ名称の分類を修正している。
【0081】
また、分類修正処理部62は、ユーザの指示により分類が修正された場合に、修正にかかる用語を辞書DB38に登録してよいか否かをユーザに問い合わせ、ユーザが許可したならば、当該用語を辞書DB38に登録するようにしてもよい。例えば、
図7の例では、「催事用」及び「通常用」の用語を設備種別に属する用語として辞書DB38に登録するようにしてもよい。なお、修正された分類済みデータ名称が複数ある場合は、ユーザが各修正にかかる用語を辞書DB38に登録するか否かを個別的に指定できるようにしてもよい。
【0082】
修正にかかる用語が辞書DB38に登録された結果、修正された分類済みデータ名称の信頼度が変化することになる。
図7に示されたデータ名称「3F催事用電灯電力量」の例では、「催事用」の用語が辞書DB38に登録されたことで、「3F催事用電灯電力量」についての分類済みデータ名称に対する信頼度は「100」となるはずである。したがって、信頼度算出部56は、分類修正処理部62が修正にかかる用語を辞書DB38に追加した場合に、当該修正にかかる分類済みデータ名称の信頼度を再計算するようにしてもよい。
【0083】
また、注目分類済みデータ名称の分類が修正された場合、注目分類済みデータ名称に類似する他の分類済みデータ名称についても、同様に手動修正する必要がある場合が多いと言える。したがって、信頼度算出部56は、注目分類済みデータ名称の分類が修正された場合、注目分類済みデータ名称に類似する他の分類済みデータ名称に対する信頼度を低下させるようにしてもよい。
【0084】
例えば、
図7に示されたデータ名称「3F催事用電灯電力量」とデータ名称「3F厨房用電灯電力量」との関係を考える。「3F催事用電灯電力量」についての分類済みデータ名称と、「3F厨房用電灯電力量」についての分類済みデータ名称は類似していると判定されるものとする。ここで、ユーザ指示により、分類修正処理部62が、「3F催事用電灯電力量」についての分類済みデータ名称に対して修正をした場合、信頼度算出部56は、当該分類済みデータ名称に類似する「3F厨房電灯電力量」についての分類済みデータ名称の信頼度を低下させる。例えば、信頼度を「75」から「60」に低下させる。このようにすることで、修正された注目分類済みデータ名称に類似する分類済みデータ名称について、ユーザにより手動修正を促すことができる。
【0085】
修正情報処理部64は、分類修正処理部62が実行した修正処理に応じて、分類結果リスト40に対して、ユーザによる手動修正処理に関する情報を付与する処理を行う。
【0086】
修正情報処理部64は、分類修正処理部62が修正処理を行った分類済みデータ名称に対して、ユーザ指示による手動修正済みであることを示す修正済み情報としての修正済フラグを付与する。好適には、修正情報処理部64は、さらに、分類修正処理部62が修正処理を行った分類済みデータ名称に対して、修正処理を行った時刻である修正時刻、及び、当該修正処理を指示したユーザを示す情報である修正者情報を付与するようにしてもよい。なお、本実施形態では、修正済フラグと共に修正時刻及び修正者情報の両方が付されているが、修正時刻及び修正者情報はいずれか一方のみが付与されるようにしてもよい。
【0087】
図8に、分類修正処理部62により分類が修正された分類済みデータ名称、及び、当該分類済みデータ名称に修正済フラグ、修正時刻、及び修正者情報が付与された分類結果リスト40が示されている。
図8の分類結果リスト40は、
図7に示す分類結果リスト40について、ユーザがデータ名称「3F催事用電灯電力量」の分類を手動修正し、それにより、当該分類済みデータ名称に修正済フラグ、修正時刻、及び修正者情報が付されたものである。さらに、
図8の分類結果リスト40においては、ユーザがデータ名称「3F催事用電灯電力量」の分類を手動修正したことに伴い、それに類似するデータ名称「3F厨房電灯電力量」についての分類済みデータ名称の信頼度が「75」から「60」に低下させられ、且つ、類似するデータ名称「3F通常用電灯電力量」についての分類が修正されている。さらに、データ名称「3F厨房電灯電力量」についての分類済みデータ名称の信頼度が「75」から「60」に下がったことに伴って、修正推薦情報処理部58により、当該分類済みデータ名称に対して修正推薦フラグが付されている。
【0088】
データ提供部50は、分類修正処理部62により修正され、且つ、修正情報処理部64により修正にかかる各情報が付与された分類結果リスト40をユーザ端末16に送信する。例えば、
図8に示す分類結果リスト40をユーザ端末16に送信する。これにより、修正された分類済みデータ名称に付与された修正済フラグ、修正時刻、修正者情報がユーザに提供される。
【0089】
修正された分類済みデータ名称に付与された修正済フラグをユーザが確認することで、当該ユーザは、修正済フラグが付与された分類済みデータ名称は、過去に他のユーザによって手動修正されたものであることを容易に把握することができる。これにより、当該ユーザは、例えば修正済フラグが付与された分類済みデータ名称を手動修正の対象から外すという判断をすることができる。また、好適には、ユーザは、修正時刻、及び修正者情報も合わせて考慮して、当該分類済みデータ名称を手動修正の対象から外すという判断をすることができる。
【0090】
本実施形態に係るデータ名称分類支援システム10の構成概要は以上の通りである。以下、
図9及び
図10に示されるフローチャートに従って、サーバ14の処理の流れを説明する。
【0091】
図9を参照し、ステップS10において、形態素解析部52は、データ名称リスト36に含まれる各データ名称に対して形態素解析を行い、各データ名称を複数の用語に分割する。さらに、分類処理部54は、分割された各用語と辞書DB38に基づいて、各データ名称を場所名、設備名、及び信号名に分類して分類済みデータ名称を生成する。これにより分類結果リスト40が生成される。
【0092】
ステップS12において、信頼度算出部56は、ステップS10で生成された各分類済みデータ名称について、分類済みデータ名称に含まれる用語の数に対する、辞書DB38に定義された用語の数の割合を信頼度として算出する。
【0093】
ステップS14において、修正推薦情報処理部58は、ステップS12で算出された信頼度が信頼度閾値以下の分類済みデータ名称に対して修正推薦フラグを付与する。
【0094】
ステップS16において、データ提供部50は、ステップS10で生成された分類結果リスト40であって、ステップS12で算出された各分類済みデータ名称に対する信頼度、及び、ステップS14で付与された修正推薦フラグを含む分類結果リスト40をユーザ端末16に送信する。これにより、当該分類結果リスト40がユーザに提示される。
【0095】
次いで、
図10を参照し、ステップS20において、分類修正処理部62は、ユーザ端末16からいずれかの分類済みデータ名称に対する修正指示を受けたか否かを判定する。ユーザから修正指示を受けなかった場合は処理を終了する。ユーザから修正指示を受けた場合はステップS22に進む。
【0096】
ステップS22において、分類修正処理部62は、ユーザからの修正指示に従って、指定の分類済みデータ名称の分類を指示通りに修正する。
【0097】
ステップS24において、分類修正処理部62は、ステップS22で修正した分類済みデータ名称と同一のデータ名称を有する他の分類済みデータ名称の分類を、ステップS22での修正と同じように修正する。
【0098】
ステップS26において、信頼度算出部56は、ステップS22で修正した分類済みデータ名称と類似するデータ名称を有する他の分類済みデータ名称の信頼度を低下させる。
【0099】
ステップS28において、分類修正処理部62は、ステップS22で修正した分類済みデータ名称と類似するデータ名称を有する他の分類済みデータ名称について、ステップS22での修正内容に対応する修正案と共に、当該修正案の内容で修正してよいか否かユーザに問い合わせる。
【0100】
ステップS30において、分類修正処理部62はステップS28の問い合わせに対してユーザが許可したか否かを判断する。ユーザが許可した場合はステップS32に進み、ユーザが許可しなかった場合はステップS32をバイパスしてステップS34に進む。
【0101】
ステップS32において、分類修正処理部62は、ステップS22で修正した分類済みデータ名称と類似するデータ名称を有する他の分類済みデータ名称の分類をステップS28で問い合わせた修正案通りに修正する。
【0102】
ステップS34において、修正情報処理部64は、ステップS22、S24、及びS32で修正した分類済みデータ名称に対して、修正済フラグ、修正時刻、及び修正者情報を付与する。なお、ステップS24及びS32で修正された分類済みデータ名称に付される修正者情報は、ステップS20で修正指示をしたユーザを示すものである。
【0103】
ステップS36において、分類修正処理部62は、ステップS22、S24、及びS32の修正にかかる用語について、ユーザから辞書DB38への登録指示を受けたか否かを判定する。ユーザから登録指示を受けた場合は、ステップS38に進み、ユーザから登録指示を受けなかった場合はステップS38をバイパスしてステップS40に進む。
【0104】
ステップS38において、分類修正処理部62は、ステップS22、S24、及びS32の修正にかかる用語を辞書DB38へ登録する。また、当該用語の辞書DB38への登録に伴って、信頼度算出部56は、ステップS22、S24、及びS32で修正した分類済みデータ名称に対する信頼度を再計算する。
【0105】
ステップS40において、データ提供部50は、ステップS22、S24、及びS32で修正された分類済みデータ名称、ステップS34で付与された修正済フラグ、修正時刻、修正者情報、及び、ステップS38で再計算された信頼度を含む分類結果リスト40をユーザ端末16に送信する。これにより、当該分類結果リスト40がユーザに提示される。
【0106】
ステップS40の後、再度ステップS20に戻り、分類修正処理部62は、ユーザ端末16からいずれかの分類済みデータ名称に対する修正指示を受けたか否かを判定する。ユーザから修正指示を受けなかった場合は処理を終了する。ユーザから修正指示を受けた場合は再度ステップS22〜S40の処理を繰り返す。
【0107】
以上、本発明に係る実施形態を説明したが、本発明は上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない限りにおいて種々の変更が可能である。