IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立化成株式会社の特許一覧

特開2024-157390ナレッジマネジメントシステム、文書分類装置、業務改革支援システム、エキスパートシステム生成装置、文書検索システム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024157390
(43)【公開日】2024-11-07
(54)【発明の名称】ナレッジマネジメントシステム、文書分類装置、業務改革支援システム、エキスパートシステム生成装置、文書検索システム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20241030BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2023071727
(22)【出願日】2023-04-25
(71)【出願人】
【識別番号】000004455
【氏名又は名称】株式会社レゾナック
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】岡野 悠
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC12
5L050CC12
(57)【要約】
【課題】大規模言語モデルを企業内部の技術情報検索に活用すること。
【解決手段】本開示は、プロジェクトの技術分野に係る属性とプロジェクトの顧客の業界に係る属性とを含むプロジェクト属性、及びプロジェクトに参加した社員の識別情報を含むプロジェクトデータを記憶する第1の記憶手段と、社員の識別情報を含む社員データを記憶する第2の記憶手段と、プロジェクトデータの検索条件の入力を受け付け、大規模言語モデルを用いて第1の記憶手段を検索するプロジェクト検索手段と、検索されたプロジェクトデータを出力する第1の出力手段と、検索されたプロジェクトデータに含まれている社員の識別情報に基づいて、大規模言語モデルを用いて第2の記憶手段を検索する社員検索手段と、社員検索手段で検索された社員データを出力する第2の出力手段と、を備えるナレッジマネジメントシステムである。
【選択図】図1
【特許請求の範囲】
【請求項1】
ナレッジマネジメントシステムであって、
プロジェクトの技術分野に係る属性とプロジェクトの顧客の業界に係る属性とを含むプロジェクト属性、及びプロジェクトに参加した社員の識別情報を含むプロジェクトデータを記憶する第1の記憶手段と、
社員の識別情報を含む社員データを記憶する第2の記憶手段と、
プロジェクトデータの検索条件の入力を受け付ける受付手段と、
前記受付手段が受け付けた検索条件に基づいて、大規模言語モデルを用いて前記第1の記憶手段を検索するプロジェクト検索手段と、
前記プロジェクト検索手段で検索されたプロジェクトデータを出力する第1の出力手段と、
前記プロジェクト検索手段で検索されたプロジェクトデータに含まれている社員の識別情報に基づいて、大規模言語モデルを用いて前記第2の記憶手段を検索する社員検索手段と、
前記社員検索手段で検索された社員データを出力する第2の出力手段と、
を備えるナレッジマネジメントシステム。
【請求項2】
データを入出力するディスプレイを有する入出力装置と、
文書の保存及び読み出しを行う設計情報データベースと、
ディスプレイ上に表示または実行されている文書から、大規模言語モデルを用いることでキーワードを取得するキーワード抽出手段と、
課題とその関連語を関連付けた課題一覧表と、該課題一覧表に記載の課題に基づき前記設計情報データベースに格納されている文書を分類する分類手段と、
該分類手段による分類結果の保存及び呼び出しを行う分類結果データベースと、
各業務手順とその成果物及び参考資料のタイトルと格納先アドレスを関連付けて記載した業務プロセステンプレートデータの保存及び呼び出しを行う業務プロセステンプレートデータベースと、
該業務プロセステンプレートデータベースに格納されている業務プロセステンプレートデータを読み込み、業務の誘導や参考資料の提示や成果物管理を含む業務支援を行う業務支援手段と、を有し、蓄積された文書を所定のカテゴリに分類して提示する情報検索システムの文書分類装置において、
前記キーワード抽出手段で抽出したキーワードと、前記課題一覧表に記載の課題及び関連語との比較を行い、一致した課題をユーザに表示する分類カテゴリとする分類カテゴリ決定手段と、
前記ディスプレイ上に表示または実行されている文書のタイトルを取得し、前記業務プロセステンプレートデータの成果物のタイトルと比較を行い、成果物が作成された元の業務手順を検索する文書作成元業務プロセス判別手段と、
課題の検討中の業務手順との関連度を求め分類カテゴリの優先順位を決定する分類カテゴリ優先順位決定手段と、
を備えることを特徴とする情報検索システムの文書分類装置。
【請求項3】
企業にて稼働中のパソコンを含むホストコンピュータ及びデータウェアハウス・統合データベース(DB)とデータ連携すると共に、各種データを含む既存システム、チャネル及び外部情報を入力情報源としてデータ連携し、前記既存システム、前記チャネル、前記外部情報、前記ホストコンピュータ及び前記データウェアハウス・統合DBに散在している多様な情報を、大規模言語モデルが抽出条件に基づいて一元的に集約して気付き情報を抽出し、抽出された気付き情報を可視化することによって前記企業の業務を改善することを特徴とする企業内の既存システムを利用した業務改革支援システム。
【請求項4】
大規模言語モデルを用いたエキスパートシステムを構築するためのエキスパートシステム生成装置であって、
該エキスパートシステムの構築対象となる外部システムから観測される状況とそれに付随する結果とを蓄積する事例獲得手段と、
該蓄積された状況と結果とを自動学習し、該状況から該結果が生じる統計的な傾向を知識として導くルール生成手段と、
該導かれた統計的な傾向から、観測されるある状況に対する結果を自動判断するコンサルティング手段と、を備え、
該事例獲得手段と該ルール生成手段と該コンサルティング手段とを単独で動作させたり、相互に連携させたりすることによって該状況と該結果を更新し、より妥当な知識へと自動的に更新することを特徴とするエキスパートシステム生成装置。
【請求項5】
キーワードを用いて文書を検索する文書検索装置と、
翻訳サービス装置と、
検索の対象となる複数の前記文書を記憶する、文書データベースと、を含む文書検索システムであって、
前記文書検索装置は、
1つ以上のキーワードを入力キーワードとして受け取るキーワード受付手段と、
前記入力キーワードのそれぞれが、大規模言語モデルを用いることで他言語に翻訳された翻訳キーワードを、複数の他言語について取得するキーワード翻訳手段と、
前記入力キーワード及び前記翻訳キーワードのそれぞれについてキーワードスコアを決定するキーワードスコア決定手段と、
前記入力キーワード及び前記翻訳キーワードに基づいて文書を検索し、複数の検索結果文書を取得する文書検索手段と、
前記検索結果文書のそれぞれについて、前記キーワードスコアに基づいて文書スコアを算出する文書スコア算出手段と、
前記検索結果文書のそれぞれと、対応する前記文書スコアとを関連付けて出力する検索結果出力手段と、を備え、
前記翻訳サービス装置は、前記入力キーワードのそれぞれに対応して、順位を有する複数の前記翻訳キーワードを生成し、
前記翻訳サービス装置は、前記翻訳キーワードの掲載順に基づいて前記翻訳キーワードの順位を表し、
前記キーワードスコア決定手段は、前記入力キーワードのそれぞれと、前記翻訳キーワードのそれぞれとのすべての組合せについて、前記順位に基づいて翻訳スコアを決定し、
前記キーワードスコア決定手段は、前記翻訳キーワードのそれぞれについて、関連する前記翻訳スコアのすべてに基づいて前記キーワードスコアを決定し、
前記入力キーワードの前記キーワードスコアは、その入力キーワードに対応する前記翻訳キーワードの前記キーワードスコアのいずれよりも高い、
文書検索システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ナレッジマネジメントシステム、文書分類装置、業務改革支援システム、エキスパートシステム生成装置、及び、文書検索システムに関する。
【背景技術】
【0002】
ChatGPT(登録商標)等の大規模言語モデル(LLM)が知られている。大規模言語モデルは、テキスト分類、感情分析、情報抽出、文章要約、テキスト生成、及び質問応答といった、さまざまな自然言語処理タスクを実現できる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2023-033202号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、大規模言語モデルが企業内部の技術情報検索に活用されていなかった。
【0005】
本開示は、大規模言語モデルを企業内部の技術情報検索に活用する技術を提供する。
【課題を解決するための手段】
【0006】
本開示の一態様は、ナレッジマネジメントシステムであって、プロジェクトの技術分野に係る属性とプロジェクトの顧客の業界に係る属性とを含むプロジェクト属性、及びプロジェクトに参加した社員の識別情報を含むプロジェクトデータを記憶する第1の記憶手段と、社員の識別情報を含む社員データを記憶する第2の記憶手段と、プロジェクトデータの検索条件の入力を受け付ける受付手段と、前記受付手段が受け付けた検索条件に基づいて、大規模言語モデルを用いて前記第1の記憶手段を検索するプロジェクト検索手段と、前記プロジェクト検索手段で検索されたプロジェクトデータを出力する第1の出力手段と、前記プロジェクト検索手段で検索されたプロジェクトデータに含まれている社員の識別情報に基づいて、大規模言語モデルを用いて前記第2の記憶手段を検索する社員検索手段と、前記社員検索手段で検索された社員データを出力する第2の出力手段と、を備える。
【0007】
本開示の一態様は、データを入出力するディスプレイを有する入出力装置と、文書の保存及び読み出しを行う設計情報データベースと、ディスプレイ上に表示または実行されている文書から、大規模言語モデルを用いることでキーワードを取得するキーワード抽出手段と、課題とその関連語を関連付けた課題一覧表と、該課題一覧表に記載の課題に基づき前記設計情報データベースに格納されている文書を分類する分類手段と、該分類手段による分類結果の保存及び呼び出しを行う分類結果データベースと、各業務手順とその成果物及び参考資料のタイトルと格納先アドレスを関連付けて記載した業務プロセステンプレートデータの保存及び呼び出しを行う業務プロセステンプレートデータベースと、該業務プロセステンプレートデータベースに格納されている業務プロセステンプレートデータを読み込み、業務の誘導や参考資料の提示や成果物管理を含む業務支援を行う業務支援手段と、を有し、蓄積された文書を所定のカテゴリに分類して提示する情報検索システムの文書分類装置において、前記キーワード抽出手段で抽出したキーワードと、前記課題一覧表に記載の課題及び関連語との比較を行い、一致した課題をユーザに表示する分類カテゴリとする分類カテゴリ決定手段と、前記ディスプレイ上に表示または実行されている文書のタイトルを取得し、前記業務プロセステンプレートデータの成果物のタイトルと比較を行い、成果物が作成された元の業務手順を検索する文書作成元業務プロセス判別手段と、課題の検討中の業務手順との関連度を求め分類カテゴリの優先順位を決定する分類カテゴリ優先順位決定手段と、を備えることを特徴とする情報検索システムの文書分類装置である。
【0008】
本開示の一態様は、企業にて稼働中のパソコンを含むホストコンピュータ及びデータウェアハウス・統合データベース(DB)とデータ連携すると共に、各種データを含む既存システム、チャネル及び外部情報を入力情報源としてデータ連携し、前記既存システム、前記チャネル、前記外部情報、前記ホストコンピュータ及び前記データウェアハウス・統合DBに散在している多様な情報を、大規模言語モデルが抽出条件に基づいて一元的に集約して気付き情報を抽出し、抽出された気付き情報を可視化することによって前記企業の業務を改善することを特徴とする企業内の既存システムを利用した業務改革支援システムである。
【0009】
本開示の一態様は、大規模言語モデルを用いたエキスパートシステムを構築するためのエキスパートシステム生成装置であって、該エキスパートシステムの構築対象となる外部システムから観測される状況とそれに付随する結果とを蓄積する事例獲得手段と、該蓄積された状況と結果とを自動学習し、該状況から該結果が生じる統計的な傾向を知識として導くルール生成手段と、該導かれた統計的な傾向から、観測されるある状況に対する結果を自動判断するコンサルティング手段と、を備え、該事例獲得手段と該ルール生成手段と該コンサルティング手段とを単独で動作させたり、相互に連携させたりすることによって該状況と該結果を更新し、より妥当な知識へと自動的に更新することを特徴とする。
【0010】
本開示の一態様は、キーワードを用いて文書を検索する文書検索装置と、翻訳サービス装置と、検索の対象となる複数の前記文書を記憶する、文書データベースと、を含む文書検索システムであって、前記文書検索装置は、1つ以上のキーワードを入力キーワードとして受け取るキーワード受付手段と、前記入力キーワードのそれぞれが、大規模言語モデルを用いることで他言語に翻訳された翻訳キーワードを、複数の他言語について取得するキーワード翻訳手段と、前記入力キーワード及び前記翻訳キーワードのそれぞれについてキーワードスコアを決定するキーワードスコア決定手段と、前記入力キーワード及び前記翻訳キーワードに基づいて文書を検索し、複数の検索結果文書を取得する文書検索手段と、前記検索結果文書のそれぞれについて、前記キーワードスコアに基づいて文書スコアを算出する文書スコア算出手段と、前記検索結果文書のそれぞれと、対応する前記文書スコアとを関連付けて出力する検索結果出力手段と、を備え、前記翻訳サービス装置は、前記入力キーワードのそれぞれに対応して、順位を有する複数の前記翻訳キーワードを生成し、前記翻訳サービス装置は、前記翻訳キーワードの掲載順に基づいて前記翻訳キーワードの順位を表し、前記キーワードスコア決定手段は、前記入力キーワードのそれぞれと、前記翻訳キーワードのそれぞれとのすべての組合せについて、前記順位に基づいて翻訳スコアを決定し、前記キーワードスコア決定手段は、前記翻訳キーワードのそれぞれについて、関連する前記翻訳スコアのすべてに基づいて前記キーワードスコアを決定し、前記入力キーワードの前記キーワードスコアは、その入力キーワードに対応する前記翻訳キーワードの前記キーワードスコアのいずれよりも高いことを特徴とする。
【発明の効果】
【0011】
本開示は、大規模言語モデルを企業内部の技術情報検索に活用できる。
【図面の簡単な説明】
【0012】
図1】本発明の一実施形態に係るナレッジマネジメントシステムの全体構成を示す図である。
図2】データベースサーバに記憶されているデータの一例を示す。
図3】プロジェクト登録・編集画面の一例を示す。
図4】プロジェクトテーブル及びプロジェクト属性テーブルのデータ構造の一例を示す。
図5】コンタクト登録・編集画面の一例を示す。
図6】コンタクトテーブル及びコンタクト属性テーブルのデータ構造の一例を示す。
図7】講座一覧画面の一例を示す。
図8】社員テーブル、講座テーブル及び講座申込テーブルのデータ構造の一例を示す。
図9】顧客登録・編集画面の一例を示す。
図10】顧客テーブル及び顧客属性テーブルのデータ構造の一例を示す。
図11】エージェント新規登録・編集画面の一例を示す。
図12】エージェントテーブルのデータ構造を示す。
図13】フォーラム管理テーブルのデータ構造の一例を示す。
図14】コミュニティ管理テーブルのデータ構造の一例を示す。
図15】プロジェクト検索画面の一例を示す。
図16】コンタクトレポート検索画面の一例を示す。
図17】本実施形態のシステム構成を示すブロック図である。
図18】業務プロセステンプレート構成を示す説明図である。
図19】業務プロセスの先行後続関係表示を示す説明図である。
図20】業務プロセステンプレート実行例を示す説明図である。
図21】設計情報の分類処理を示すフロー図である。
図22】設計情報の分類処理を示すフロー図である。
図23】設計情報の分類処理を示すフロー図である。
図24】各文書のタイトルと保存先アドレスを格納した配列例を示す説明図である。
図25】課題一覧表を示す説明図である。
図26】参考資料の例を示す説明図である。
図27】分類結果を示す説明図である。
図28】従来の検索システムを示す説明図である。
図29】成果物登録の例を示す説明図である。
図30】進捗情報表示の例を示す説明図である。
図31】進捗情報登録の例を示す説明図である。
図32】進捗情報登録の例を示す説明図である。
図33】業務プロセステンプレートの編集メニューを示す説明図である。
図34】業務プロセス名の新規追加画面を示す説明図である。
図35】業務プロセス名の編集画面を示す説明図である。
図36】本実施形態で使用するフィルタのテーブル例を示す図である。
図37】Excelからデータを取得する手法(全セル方式)を示す図である。
図38】Excelからデータを取得する手法(指定セル方式)を示す図である。
図39】Wordからデータを取得する手法を示す図である。
図40】本実施形態の基本的な全体構成例を示すブロック図である。
図41】本実施形態に係る企業内の既存システムを利用した業務改革支援システムの構成例を示すブロック図である。
図42】気付き情報構築システムの概念図である。
図43】気付き情報構築システムの構成例及び情報の流れを示す流れブロック図である。
図44】気付き情報構築システムの構成例を示すブロック図である。
図45】入力連携インターフェースの動作例を示すフローチャートである。
図46】気付き情報抽出部の動作例を示すフローチャートである。
図47】出力連携インターフェースの動作例を示すフローチャートである。
図48】気付き情報抽出部の具体例を示す画面図である。
図49】気付き情報の抽出例を示すデータの流れ図である。
図50】本実施形態の動作例の一部を示す作業フロー図である。
図51】本実施形態の動作例の一部を示す作業フロー図である。
図52】本実施形態の動作例の一部を示す作業フロー図である。
図53】本実施形態の動作例の一部を示す作業フロー図である。
図54】本実施形態の動作例における各場面の画面変化を示す画面図の一部である。
図55】本実施形態の動作例における各場面の画面変化を示す画面図の一部である。
図56】本実施形態の動作例における各場面の画面変化を示す画面図の一部である。
図57】本実施形態の動作例における各場面の画面変化を示す画面図の一部である。
図58】本実施形態の動作例における各場面の画面変化を示す画面図の一部である。
図59】本実施形態の動作例における各場面の画面変化を示す画面図の一部である。
図60】本実施形態の将来的展望を示す模式図である。
図61】実施形態のエキスパートシステム生成装置のブロック図である。
図62】コンサルテツリー生成ブロックの機能の説明図である。
図63】ツリーチェックブロックの機能の説明図である。
図64】コンサルティング手段のブロック図である。
図65】決定木生成に関するフローチャートである。
図66】ステップS300の詳細フローチャートである。
図67】ステップS305の詳細フローチャートである。
図68】ステップS3051の詳細フローチャートである。
図69】ステップS30511の詳細フローチャートである。
図70】ステップS3055の詳細フローチャートである。
図71】ステップS3056の詳細フローチャートである。
図72】ステップS30561の詳細フローチャートである。
図73】ステップS400の詳細フローチャートである。
図74】ステップS402の詳細フローチャートである。
図75】ステップS403の詳細フローチャートである。
図76】コンサルティングに関するフローチャートである。
図77】ステップS700の詳細フローチャートである。
図78】ステップS701の詳細フローチャートである。
図79】ステップS702の詳細フローチャートである。
図80】事例編集パネルを示す図である。
図81】生成された決定木を示す表示画面である。
図82】剪定終了後の決定木を示す表示画面である。
図83】汚泥処理による焼却灰のテストピースを焼き締める作業について得られた決定木を示す表示画面である。
図84】エレメントの例外処理を行う前と行った後を示す表示画面である。
図85】日付のエレメントを例外とする前の決定木を示す表示画面の一部である。
図86】日付のエレメントを例外とした後の決定木を示す表示画面の一部である。
図87】回収溶媒精製プラントの模式図である。
図88】文書検索システムの構成を示す図である。
図89図88の文書検索システムにおける文書検索装置の動作を説明するフローチャートである。
図90】入力キーワードと翻訳キーワードとの対応関係の例を示す図である。
図91】翻訳キーワードの順位と、その順位に基づく翻訳スコアとの対応関係の例を示す図である。
図92】各キーワードについての、順位に基づく翻訳スコアと、最終的に各キーワードに対して与えられるキーワードスコアとの対応関係の例を示す図である。
図93】検索結果文書の本文データ中に各キーワードが出現する回数を表す情報の例を示す図である。
図94】検索結果文書に対する文書スコアの算出結果の例を示す図である。
【発明を実施するための形態】
【0013】
以下では、ChatGPT等の大規模言語モデルを、企業内部の技術情報検索で活用する5つの実施形態を説明する。5つの実施形態は、ナレッジマネジメントシステム、技術情報の自動分類、職務・業務の自動化、エキスパートシステム(専門家が持つ知識や経験をソフトウェアに取り込み、自動で判断や診断を行うシステム)としての活用、及び、複数言語への対応である。ただし、企業内部の技術情報検索の活用例はこれらに限定される趣旨ではない。また、大規模言語モデルには、ChatGPTの他、Dolly & Dolly 2.0、BLOOM、PaLM、OPT(いずれも登録商標)等、様々なサービスがある。
【0014】
[第1実施形態]
本実施形態では、ナレッジマネジメントシステムにおける検索エンジンとして大規模言語モデルを用いる実施形態について説明する。ナレッジマネジメントシステムの一例として特開2013-109516を参考に説明する。
【0015】
以下、本発明の一実施形態に係るナレッジマネジメントシステムについて、図面を参照して説明する。
【0016】
図1は、本実施形態に係るナレッジマネジメントシステムの全体構成を示す図である。本システムは、データベースサーバ1001と、認証サーバ1003と、一台以上のユーザ端末装置1005と、管理者端末装置1007とが、互いにネットワーク1009を介して接続されている。
【0017】
データベースサーバ1001、認証サーバ1003、一台以上のユーザ端末装置1005、及び管理者端末装置1007は、いずれも例えば汎用的なコンピュータシステムにより構成され、以下に説明する各データベースサーバ1001、認証サーバ1003及びユーザ端末装置1005、管理者端末装置1007内の個々の構成要素または機能は、例えば、コンピュータプログラムを実行することにより実現される。ユーザ端末装置1005及び管理者端末装置1007は、それぞれ異なるコンピュータ上に実現されてもよいし、同一のコンピュータ上に実現されてもよい。
【0018】
認証サーバ1003は、本システムにアクセスするユーザ及び管理者の認証を行う。例えば、認証サーバ1003は、ユーザ端末装置1005からの認証要求を受けて、ユーザ端末装置1005を使用するユーザの認証を行う。また、認証サーバ1003は、管理者端末装置1007からの認証要求を受けて、管理者端末装置1007を使用する管理者の認証を行う。認証サーバ1003によって認証されたユーザ及び管理者は、それぞれ所与の権限の範囲内でデータベースサーバ1001へアクセスすることができる。
【0019】
ユーザ端末装置1005は、所定の入力装置及び出力装置を有する。ユーザ端末装置1005は、ユーザに対して、データベースサーバ1001のデータへアクセスするための各種インターフェースを提供する。例えば、以下に説明する各登録・編集画面が各ユーザ端末装置1005に表示され、その画面に対してユーザが入力することができる。また、各ユーザ端末装置1005には、以下に説明する各検索画面からの検索要求に対する検索結果が表示される。
【0020】
管理者端末装置1007は、所定の入力装置及び出力装置を有する。管理者端末装置1007は、システム管理者に対して、システム管理のための各種インターフェースを提供する。
【0021】
データベースサーバ1001は、各種データを記憶する。本システムは、顧客から受注したプロジェクトに関するデータと、プロジェクト受注へ向けた営業活動における顧客(見込み客)とのコンタクトに関するデータと、社員に関するデータと、顧客に関するデータと、その他のデータとを主に有している。そして、プロジェクトに関するデータ、コンタクトに関するデータ、社員に関するデータ及び顧客に関するデータが互いに関連づけられている。
【0022】
図2は、データベースサーバ1001に記憶されているデータの一例を示す。データベースサーバ1001は、プロジェクトに関連するデータとしてプロジェクトテーブル1010及びプロジェクト属性テーブル1011を有し、コンタクトに関するデータとしてコンタクトテーブル1014及びコンタクト属性テーブル1015を有し、社員に関するデータとして、社員テーブル1018、講座テーブル1019及び講座申込テーブル1020を有し、顧客に関するデータとして顧客テーブル1024及び顧客属性テーブル1025を有する。データベースサーバ1001は、さらに、その他のデータとして、エージェントに関するエージェントテーブル1028と、フォーラムに関するフォーラム管理テーブル1030及びフォーラムデータ記憶部1031と、コミュニティに関するコミュニティ管理テーブル1034及びコミュニティデータ1035とを有する。データベースサーバ1001は、上記の各データを検索するための検索エンジン1040(大規模言語モデルの適用例)をさらに有する。
【0023】
<プロジェクト関連データ>
図3は、プロジェクト登録・編集画面2000の一例を示す。図4は、プロジェクトテーブル1010及びプロジェクト属性テーブル1011のデータ構造の一例を示す(プロジェクトテーブル1010及びプロジェクト属性テーブル1011は第1の記憶手段の一例)。
【0024】
顧客からプロジェクトを受注すると、そのプロジェクトの開始前または開始後にプロジェクト関連データが、プロジェクト登録・編集画面2000から登録される。ここで入力されたデータがプロジェクトテーブル1010及びプロジェクト属性テーブル1011に保存される。プロジェクト関連データには、プロジェクトの技術分野に係る属性とプロジェクトの顧客の業界に係る属性とを含むプロジェクト属性及びプロジェクトに参加した社員の識別情報が含まれる。プロジェクトテーブル1010及びプロジェクト属性テーブル1011に保存されたデータは、その後、随時プロジェクト登録・編集画面2000から更新することができる。なお、ここで示す入力項目及びデータ項目は一例に過ぎないので、これら以外の入力項目及びデータ項目を有していてもよいし、一部の項目は省略可能である。
【0025】
プロジェクト登録・編集画面2000は、図3に示すように、プロジェクトID2001、顧客名2002、契約ID2003、開始日2004、終了日2005、先方担当者2006、テーマ候補2007、インダストリ2008、メンバー2009、フォーラム名2010、金額2011及びコンタクトID2012の各項目の入力領域を有する。
【0026】
開始日2004、及び終了日2005は、それぞれ、プロジェクトの開始日及び終了日である。登録時には開始予定日及び終了予定日がそれぞれ登録され、その後実際の開始時及び終了日に修正されてもよい。先方担当者2006には、顧客側の担当者に関するデータが設定される。テーマ候補2007には、プロジェクトの技術分野を示すテーマコードが設定される。インダストリ2008には、顧客の業種を示す業種コードが設定される。メンバー2009は、プロジェクトに参加する社員の識別情報(社員ID、氏名等)が入力される。フォーラム名2010には、プロジェクトごとに設定されるフォーラム名が設定される。金額2011はプロジェクトの契約金額である。コンタクトID2012は、後述するコンタクト関連データと関係づけるIDである。
【0027】
図4Aにプロジェクトテーブル1010のデータ構造の一例を、図4Bにプロジェクト属性テーブル1011のデータ構造の一例をそれぞれ示す。プロジェクトテーブル1010及びプロジェクト属性テーブル1011には、顧客から受注したプロジェクトに関するデータが保存される。
【0028】
プロジェクトテーブル1010は、データ項目として、プロジェクトID1100と、契約ID1102と、開始日1103と、終了日1104と、金額1105と、コンタクトID1106とを有する。プロジェクトテーブル1010の各データ項目には、プロジェクト登録・編集画面2000のプロジェクトID2001、顧客名2002、契約ID2003、開始日2004、終了日2005、金額2011及びコンタクトID2012で入力されたデータが保存される。
【0029】
プロジェクト属性テーブル1011は、データ項目として、プロジェクトID1110と、属性ID1111と、属性値ID1112と、属性値1113とを有する。属性ID1111は、各属性の種類を識別するIDである。属性値ID1112は、属性値として予め決められた値が設定される場合に、各属性値に割り当てられたIDである。属性値1113には、ユーザによって自由に入力された属性値が保存される。
【0030】
プロジェクト属性テーブル1011には、プロジェクトID1110により関連づけられる様々なプロジェクトに関連する属性データが保存される。例えば、プロジェクト登録・編集画面2000における、先方担当者2006、テーマ候補2007、インダストリ2008、メンバー2009、及びフォーラム名2010には、それぞれ属性IDが割り当てられていて、それぞれの入力項目に対して入力された値(データ)が属性値ID1112、ないしは属性値1113に保存される。
【0031】
管理者は、管理者端末装置1007からプロジェクト関連データを参照し、必要に応じて修正することができる。例えば、管理者は、プロジェクトの内容をメンバーからヒアリングしたり、提案書を参照したりしてその内容を理解し、テーマ候補2007及びインダストリ2008に設定されているデータが適切でない場合は、それを修正する。これにより、プロジェクト関連データを入力する者の違いによるデータのバラツキをなくし、利用価値の高いデータとすることができる。
【0032】
<コンタクト関連データ>
図5は、コンタクト登録・編集画面2400の一例を示す。図6は、コンタクトテーブル1014及びコンタクト属性テーブル1015のデータ構造の一例を示す。
【0033】
営業活動で顧客(見込み客)とコンタクトがあったときに、そのコンタクトに関するデータがコンタクト登録・編集画面2400から登録される。この画面で入力されたデータがコンタクトテーブル1014及びコンタクト属性テーブル1015に保存される。コンタクト関連データには、見込み客に対する営業活動におけるコンタクトに係るデータが含まれる。コンタクトテーブル1014及びコンタクト属性テーブル1015に保存されたデータは、その後、随時コンタクト登録・編集画面2400から更新することができる。なお、ここで示す入力項目及びデータ項目は一例に過ぎないので、これらの以外の入力項目及びデータ項目を有していてもよいし、一部の項目は省略可能である。
【0034】
コンタクト登録・編集画面2400は、図5に示すように、コンタクトID2401、顧客名2402、案件名2403、コンタクト日2404、コンタクト方法2405、先方担当者2406、報告者2407、同行者2408、引き合い状況2409、コンペ情報2410、営業内容2411、メンバー募集に当たっての求める人材2412及び金額2413の各項目の入力領域を有する。
【0035】
コンタクトID2401は、商品またはサービスなどの所定の一連の営業活動単位に付与される識別情報である。例えば、ある商品またはサービスに関して同一顧客と複数回コンタクトがあったときには、それらの活動は共通のコンタクトIDを有するデータとして登録される。コンタクト方法2405には、個別訪問、セミナーや研究会での出会い、知人の紹介、電話営業などのコンタクトの取り方が設定される。報告者2407及び同行者2408には、コンタクトをした社員の識別情報(氏名、社員ID等)が設定される。引き合い状況2409には、コンタクトをとったきっかけや反応などが設定される。例えば、先方が積極的であるとか、特に反応のないセミナー出席者などへのプッシュとか、既存顧客からの紹介であるなどが登録される。コンペ情報2410は、各コンタクトがコンペ
案件であるか否かを示す。営業内容2411には、コンタクトして行った提案やディスカッションの内容などの具体的な営業内容が設定される。求める人材2412には、このコンタクトからプロジェクトを受注した場合にメンバーとして欲しい人材の条件などが設定される。金額2413は、見込まれる契約金額が設定される。
【0036】
図6Aにコンタクトテーブル1014のデータ構造の一例を、図6Bにコンタクト属性テーブル1015のデータ構造の一例をそれぞれ示す。
【0037】
コンタクトテーブル1014は、データ項目として、コンタクトID1140と、コンタクト日1141と、社員ID1142と、顧客ID1143と、金額1144と、報告者フラグ1145とを有する。
【0038】
コンタクトID1140及びコンタクト日1141には、コンタクト登録・編集画面2400のコンタクトID2401及びコンタクト日2404で設定されたデータが保存される。社員ID1142には、コンタクト登録・編集画面2400の報告者2407または同行者2408で設定された社員の社員IDが保存される。顧客ID1143には顧客名2402で設定された顧客の顧客IDが保存される。金額1144には、金額2413で設定された金額が保存される。報告者フラグ1145は、報告者2407である社員の場合に設定される。
【0039】
コンタクト属性テーブル1015は、コンタクトID1150と、属性ID1151と、属性値ID1152と、属性値1153とを有する。コンタクト属性テーブル1015には、コンタクトID1150により関連づけられる様々なコンタクトに関する属性データが保存される。これは、プロジェクト属性テーブル1011の場合と同様に、コンタクト登録・編集画面2400の、コンタクトテーブル1014に保存されない属性項目を属性ID1151とし、それぞれ入力された値(データ)を属性値ID1152または属性値1153として保存する。
【0040】
管理者は、管理者端末装置1007から上記のコンタクト関連データを参照し、必要に応じて修正することができる。
【0041】
<社員関連データ>
図7は、講座一覧画面2900の一例を示す。図8は、社員テーブル1018、講座テーブル1019及び講座申込テーブル1020のデータ構造の一例を示す。
【0042】
会社内では、社員向けの多くの講座(研修プログラム)が用意されている。本システムでは、社員別の講座の受講申込及び受講状況の管理などを行うことができる。図7の講座一覧画面2900は、各社員が自ら受講する講座の申込、及びその受講状況を確認するための画面である。これ以外に、本システムは、マネージャが部下の社員について受講申込、及びその受講状況を確認するための画面を有していてもよい。
【0043】
講座一覧画面2900には、図7に示すように、講座ID2901、講座名2902、開催日2903、受講対象2904、状況2905、及び受講日2906が表示されている。そして、さらに、講座一覧画面2900には、各講座に対する申込の入力を受け付ける申込領域1907が設けられている。開催日2903には、各講座の開催予定日を示す。複数回予定されていれば、開催日2903にすべての開催日が表示される。状況2905には、社員個人の各講座の受講状況が表示される。受講日2906には、申込が確定した日または受講した日が設定される。申込領域1907に表示されている申込ボタンが押されると、その講座の申込を受け付ける。
【0044】
図8Aに社員テーブル1018のデータ構造の一例を、図8Bに講座テーブル1019のデータ構造の一例を、図8Cに講座申込テーブル1020のデータ構造の一例をそれぞれ示す(第2の記憶手段の一例)。
【0045】
社員テーブル1018は、社員属性を保存するテーブルで、データ項目として、社員ID1180と、所属1181と、役職1182と、入社年次1183と、電子メールアドレス1184とを有する。社員テーブル1018のデータは、予め設定されている。例えば、社員テーブル1018には、社内の他のシステムからデータを取得して設定してもよい。
【0046】
講座テーブル1019は、講座属性を保存するテーブルで、データ項目として、講座ID1190と、講座名1191と、開催日1192と、受講対象1193とを有する。講座テーブル1019には、講座ごとに各項目のデータが予め登録されている。講座一覧画面2900の講座ID2901、講座名2902、開催日2903、受講対象2904は、講座テーブル1019に保存されているデータに基づいて表示される。
【0047】
講座申込テーブル1020は、データ項目として、講座ID1200と、社員ID1201と、状況1202と、受講日1203とを有する。講座申込テーブル1020には、講座一覧画面2900で入力されたデータが保存される。つまり、講座申込テーブル1020には、社員別に、状況1202と、受講日1203のデータが保存される。ここで、状況1202には、例えば、受講済み、申込確定、申込中、未受講及び欠席などが設定される。受講日1203は、申込が確定した受講日である。講座の受講者の確定や受講状況の管理は、図示しない他のシステムで行ってもよいし、社員がマニュアルで行ってもよい。講座申込テーブル1020には、最新の受講状況が設定される。
【0048】
<顧客関連データ>
図9は、顧客登録・編集画面3400の一例を示す。図10は、顧客テーブル1024及び顧客属性テーブル1025のデータ構造の一例を示す。
【0049】
顧客登録・編集画面3400は、図9に示すように、顧客名3401、フリガナ3402、顧客ID3403、組織区分3404、業種コード3405、及び本社所在地3406の各入力項目を有する。組織区分3404には、例えば、会社形態(株式会社、有限会社)などを設定する。業種コード3405には、その顧客の業種を示すコードを設定する。
【0050】
図10Aに顧客テーブル1024のデータ構造の一例を、図10Bに顧客属性テーブル1025のデータ構造の一例を示す。
【0051】
顧客テーブル1024は、データ項目として、顧客ID1240を有する。
【0052】
顧客属性テーブル1025は、データ項目として、顧客ID1250と、属性ID1251と、属性値ID1252と、属性値1253とを有する。顧客属性テーブル1025には、顧客ID1250により関連づけられる様々な顧客に関する属性データが保存される。これは、プロジェクト属性テーブル1011及びコンタクト属性テーブル1015の場合と同様に、顧客登録・編集画面3400の、顧客テーブル1024に保存されない属性項目を属性ID1251とし、それぞれ入力された値(データ)を属性値ID1252または属性値1253として保存する。
【0053】
<エージェント>
図11は、エージェント新規登録・編集画面2800の一例を示す。図12は、エージェントテーブル1028のデータ構造を示す。
【0054】
エージェントは、ユーザの代わりに、ユーザが指定した条件に従って本システム内の所
望のデータを収集してユーザへ提供する。エージェントは、エージェント新規登録・編集画面2800に対してユーザが指定した条件に基づいて生成される。
【0055】
エージェント新規登録画面3800は、図11に示すように、登録者3801、案件名3802、検索対象3803、キーワード3804、報告者orメンバー3805、顧客3806及び送信先3807の各項目の入力領域を有する。登録者3801には、エージェントを登録する社員の識別情報(氏名、社員ID等)が設定される。案件名3802には、このエージェントの名称が設定される。検索対象3803には、エージェントがデータ収集を行う対象が設定される。キーワード3804は、検索を行う際のキーワードである。報告者orメンバー3805は、このエージェントが収集したデータを送信する社員である。顧客3806には、検索対象とする顧客の識別情報(名称、顧客ID等)が設定される。送信先3807には、報告者orメンバー3805のメールアドレスが設定される。
【0056】
図12にエージェントテーブル1028のデータ構造の一例を示す。エージェントテーブル1028は、データ項目として、エージェントID1280と、名称1281と、検索対象1282と、キーワード1283と、社員ID1284と、検索対象顧客ID1285と、送信先Eメールアドレス1286とを有する。エージェント新規登録画面3800で入力されたデータが、それぞれエージェントテーブル1028の対応する項目に格納される。
【0057】
データベースサーバ1001は、エージェントテーブル1028を参照してエージェントを生成する。生成されたエージェントは、例えば1日に1回、データベースサーバ1001内のデータを検索して、それぞれキーワード1283または検索対象顧客ID1285に合致するデータを収集する。そして、エージェントは、収集したデータを送信先Eメールアドレス1286に対して配信する。これにより、エージェントを登録したユーザは、自らが関心を持つ分野のデータを得ることができる。
【0058】
<フォーラム>
図13にフォーラム管理テーブル1030のデータ構造の一例を示す。フォーラム管理テーブル1030は、データ項目として、プロジェクトID1300と、フォーラムID1301と、フォーラム名1302とを有する。フォーラムはプロジェクトごとに設定され、各プロジェクトに参加しているメンバー間での情報交換の場として活用される。従って、プロジェクトID1300によって、各フォーラムが対応付けられているプロジェクトが特定される。図3のプロジェクト登録・編集画面2000でフォーラム名2010が設定されると、フォーラム管理テーブル1030にデータが保存される。
【0059】
フォーラムデータ記憶部1031は、フォーラムID別にフォーラム内の種々のデータを保存する。例えば、フォーラムに参加している社員の社員ID、フォーラムに書き込まれたデータ等がフォーラムID別に保存されている。
【0060】
<コミュニティ>
図14にコミュニティ管理テーブル1034のデータ構造の一例を示す。コミュニティ管理テーブル1034は、データ項目として、コミュニティID1340と、名称1341とを有する。コミュニティは、本システム内で社員同士が様々な話題について議論したり、情報交換したりする場である。
【0061】
コミュニティデータ1035は、コミュニティID別にコミュニティ内の種々のデータを保存する。例えば、コミュニティに参加している社員の社員ID、コミュニティに書き込まれたデータ等がコミュニティID別に保存されている。
【0062】
<データ検索>
本実施形態では、上記した各登録・編集画面によって登録されたデータを、ユーザが各自のユーザ端末装置1005から各種検索画面を使って検索することができる。例えば、プロジェクト関連データ、コンタクトレポート、顧客データ、社員データなどを検索することができる。さらに、いずれかのデータに関して第1の検索を行って得た検索結果に基づいて、別のデータに関する第2の検索を行うことができる。まず、プロジェクト関連データ及びコンタクトレポートの検索について説明する。
【0063】
図15は、プロジェクト検索画面4000の一例を示す。プロジェクト検索画面4000(受付手段の一例)は、プロジェクトデータの検索条件の入力を受け付ける領域を有している。同図の例では、検索条件として、顧客名、データ内の語句、テーマ候補、インダストリ、開始日、終了日及び金額等を設定することができる。プロジェクト検索画面4000で検索要求を受け付けると、検索エンジン1040(ここではプロジェクト検索手段1040aの一例)がここで指定された条件に従ってプロジェクトテーブル1010及びプロジェクト属性テーブル1011を検索し、条件に合致するプロジェクトを抽出する。第1の出力手段1041は、抽出されたプロジェクトに関連するデータを、検索結果として出力する。ここで出力されるプロジェクト関連データには、プロジェクトに参加したメンバーが含まれる。本システムは、さらに、プロジェクトに参加した特定のメンバーの個人情報をさらに出力することができる。例えば、検索エンジン1040(ここでは社員検索手段1040bの一例)は、その特定のメンバーの社員IDをキーにして、社員テーブル1018、講座テーブル1019、及び講座申込テーブル1020を検索して、社員の属性データを取得する。第2の出力手段1042は、取得された社員のデータを、検索結果として出力する。
【0064】
あるいは、検索エンジン1040(ここではプロジェクト検索手段1040aの一例)は、その特定のメンバーの社員IDをキーにして、プロジェクトテーブル1010及びプロジェクト属性テーブル1011、またはコンタクトテーブル1014及びコンタクト属性テーブル1015をさらに検索し、その特定のメンバーが現在または過去に参加したプロジェクトやコンタクトに関するデータを抽出するようにしてもよい。これにより、第1の出力手段1041は、その特定のメンバーが現在または過去に参加したプロジェクトやコンタクトに関するデータがさらに出力される。
【0065】
本システムでは、特にKnowWho検索を行う場合、まず、上記のプロジェクト検索により、知りたい技術分野(テーマ候補)、あるいは業界(インダストリ)に関連するプロジェクトの検索を行う。そして、その検索により抽出されたプロジェクトに関わったメンバーの中には、知りたい技術分野あるいは業界に詳しい人がいると考えられる。このとき、本システムではさらに、特定の社員が有するノウハウなどについて、追加の情報検索が可能である。つまり、本システムでは、プロジェクト検索を介してKnowWho検索を行う。
【0066】
このようなKnowWho検索が行える背景には、プロジェクト関連データの精度の高さがある。つまり、通常のナレッジマネジメントシステムの場合、社員個人が自らの経験、スキルなどについて登録するようになっているが、現実にはこれを徹底させることが難しい。これに対して、本システムの場合、プロジェクト関連データは、本システム以外のシステムでも利用される重要なデータである。そのため、報告者は、好むと好まざるとに関わらず、プロジェクトに関するデータを入力せざるを得ず、かつ、入力したデータを管理者が見直すことによりデータの精度を高めている。従って、本システムでは、プロジェクト関連データの入力が保証され、かつ、その入力されたデータは高い信頼性を有する。これにより、欲しい情報と関連の深いプロジェクトの検索を介して、そのプロジェクトに関わった社員を特定することにより効果的なKnowWho検索を行うことができる。
【0067】
図16は、コンタクトレポート検索画面5000の一例を示す。コンタクトレポート検索画面5000は、同図に示すように、顧客名、データ内の語句、引き合い区分、インダストリ、コンタクト日及び金額等の検索条件の入力を受け付ける領域を有している。コンタクトレポート検索画面5000で検索要求を受け付けると、検索エンジン1040がここで指定された条件に従ってコンタクトテーブル1014及びコンタクト属性テーブル1015を検索し、条件に合致するコンタクトデータを抽出して、そのコンタクトに関連するコンタクトデータが出力される。ここでも、出力されるコンタクトデータには、コンタクトに参加したメンバーが含まれる。本システムは、さらに、検索エンジン1040によって、コンタクトに参加した特定のメンバーの社員属性をさらに検索することができる。例えば、検索エンジン1040は、その特定のメンバーの社員IDをキーにして、社員テーブル1018、講座テーブル1019、及び講座申込テーブル1020を検索して、社員属性を取得する。あるいは、検索エンジン1040は、その特定のメンバーの社員IDをキーにして、プロジェクトテーブル1010及びプロジェクト属性テーブル1011、またはコンタクトテーブル1014及びコンタクト属性テーブル1015をさらに検索し、その特定のメンバーが現在または過去に参加したプロジェクトやコンタクトに関するデータを抽出するようにしてもよい。これにより、その特定のメンバーが現在または過去に参加したプロジェクトやコンタクトに関するデータがさらに出力される。従って、コンタクトレポートの検索によっても、上記のKnowWho検索が可能であり、社内でのナレッジ共有が促進される。
【0068】
また、本実施形態におけるコンタクトデータに代えて、またはこれに加えて、研究開発活動に関するデータを同様なデータ構造で保持するようにしてもよい。この研究開発データは、コンタクトデータと同様に登録及び編集ができ、検索対象とすることもできる。つまり、研究開発データを検索することにより、研究開発における特定の技術あるいはテーマについて多くの知識や経験を持っている社員を検索することができ、研究開発分野における社内でのナレッジ共有を促進することができる。さらに、各研究開発テーマ等とプロジェクトとの関連づけておくことにより、どの研究開発テーマが具体的にどのプロジェクトで活用されているのかも容易に把握することが可能となる。
【0069】
上記した本発明の実施形態は、本発明の説明のための例示であり、本発明の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本発明の要旨を逸脱することなしに、他の様々な態様で本発明を実施することができる。
【0070】
[第2実施形態]
本実施形態では、技術情報の自動分類技術におけるキーワード抽出手段として大規模言語モデルを用いる実施形態について説明する。技術情報の自動分類技術の一例として特開2011-108067(特許第5297351号)を参考に説明する。
【0071】
〔システム構成〕
図17は、本発明の実施形態に係る情報検索システムの構成を示すブロック図である。本実施形態の情報検索システム(文書分類装置の一例)はコンピュータで作動するプログラム上に構築することができ、ユーザがデータを入力し処理結果を表示するキーボード、マウス、ディスプレイ等からなるデータの入出力のための入出力装置151と、各業務手順とその成果物及び参考資料のタイトルと格納先のアドレスとを関連付けて記載した業務プロセステンプレートデータを格納する業務プロセステンプレートデータベース152と、参考資料や検討書や事故情報などの設計情報を格納する設計情報データベース153を有する。
【0072】
また、設計情報データベース153から業務プロセステンプレートデータベース152に格納されている業務プロセステンプレートのデータを読み込み、業務の誘導や参考資料の提示や成果物管理などの業務支援を行う業務支援手段155と、業務プロセステンプレートデータを編集する業務プロセステンプレート編集手段156を備えた業務支援処理装置170を有する。
【0073】
また、設計情報データベース153から呼出されてディスプレイ上に表示または実行されている文書からキーワードを取得するキーワード抽出手段157(大規模言語モデルの適用例)と、キーワード抽出手段157で抽出したキーワードをもとにユーザに表示する設計情報の分類カテゴリとその表示順序を決定する分類カテゴリ決定手段160と、分類カテゴリ優先順位決定手段164と、分類カテゴリ決定手段160で決定した分類カテゴリの設計情報を分類カテゴリ優先順位決定手段164で決定した順序をもとに優先順位が高い分類カテゴリを上位に表示する分類結果表示手段161と、を有する。
【0074】
情報検索システムは、さらに業務支援手段155に読み込まれた設計情報データベース153の参考資料や検討書や事故情報などの設計情報に基づき、ディスプレイ上に表示または実行されている文書が成果物として作成された元の業務手順を判別する文書作成元業務プロセス判別手段158を有する。分類カテゴリ優先順位決定手段164は、課題一覧表162に記載された課題及びその関連語がディスプレイ上に表示または実行されている文書に出現する出現回数と、文書作成元業務プロセス判別手段158で取得した業務手順と検討中の業務手順との距離によって、ユーザに表示する分類カテゴリの優先順位を決定する。
【0075】
また、情報検索システムは、課題とその関連語を記載した課題一覧表162と、課題一覧表162を編集する課題一覧表編集手段163と、設計情報データベース153に格納されている設計情報を課題一覧表162に記載されている課題のカテゴリによって分類する分類手段159と、分類手段159による分類結果を格納する分類結果データベース154を有する。
【0076】
〔業務プロセステンプレート〕
業務プロセステンプレートの構成を図18に示す。業務プロセステンプレートは、一連の業務情報を、順序付けられた複数の業務プロセスの集合で表現するものであり、各業務プロセスはさらに詳細な業務プロセスに分割して表現することができる。すなわち、業務プロセステンプレートは、業務情報を階層構造の業務プロセスの集合で表現するものであり、業務プロセスは1つ1つの業務手順から構成される。図18において業務プロセステンプレートは、以下の三種類のデータから構成される。
【0077】
第1は、共通データ201であり、テンプレートID、テンプレート名称、プロジェクト名称のデータから構成される。テンプレートIDは、ユーザがテンプレートを作成した際にシステムによって付けられるIDである。このテンプレートIDは他のテンプレートIDと重複しないものとする。
【0078】
第2は、単位業務プロセスデータ202であり、業務プロセスID、業務プロセス名称、コメント、担当者、期限、登録作業時間、開始日、終了日、達成率、実績作業時間、実績開始日、実績終了日、先行プロセス、成果物のタイトルと設計情報データベースにおける格納先アドレス、参考資料のタイトルと設計情報データベースにおける格納先アドレスのデータから構成される。
【0079】
業務プロセスIDは、業務プロセスを定義した際にシステムによって付けられるIDであり、他の業務プロセスIDと重複しない。業務プロセス名称は、ユーザが業務プロセスを定義した際に、業務プロセスに付ける名称である。登録作業時間、開始日、終了日は、プロジェクト開始前に計画していた作業時間、開始日、終了日であり、実際に業務を実行した際の作業時間、開始日、終了日が、実績作業時間、実績開始日、実績終了日である。先行プロセスとは、その業務プロセスが実行される前に終了していなければならない業務プロセスを意味し、当該業務プロセスでは、先行プロセスでの成果物を使って検討を行う。業務プロセステンプレートには、先行プロセスの業務プロセスIDが記載される。
【0080】
第3は、プロセス順序/階層データ203であり、前述した単位業務プロセスデータ202について、業務プロセスが実行される順番と、業務プロセス間の親子関係が定義されている。図18の例では、プロセス順序/階層データ203において最上位の業務プロセスとして、業務プロセスIDが1と5の業務プロセスが定義されている。さらに、業務プロセスIDが2の業務プロセスと業務プロセスIDが3の業務プロセスが、業務プロセスIDが1の業務プロセスの下位階層に定義されている。
【0081】
次に、業務支援手段155にこの業務プロセステンプレートを読み込むと、図19のように入出力装置151のディスプレイに業務プロセスが階層状に表示される。図19では、「A機種開発設計」プロジェクトの業務プロセステンプレートを実行した例を示す。最上位階層に「A機種開発設計」、その下の階層に「商品企画」、「構想設計」、「詳細設計」、「試作・試験」、「図面作成」の業務プロセスが表示される。さらに、その下の階層には、さらに詳細な業務プロセスが表示される。
【0082】
また、図示しない工程表示ボタンを押下して矢印表示モードに切替え、ユーザが任意の業務プロセスを選択すると(丸印で表示)、業務プロセスの先行後続の関係が矢印で表示される。本実施形態における業務手順とは、この業務プロセスの先行後続の関係で関連付けられた業務の順序を指す。
【0083】
左向きの矢印は、業務プロセス「熱検討結果報告書作成」302が、ユーザが選択した業務プロセス「強度検討結果報告書作成」303の先行プロセスであることを表している。すなわち「強度検討結果報告書作成」では、上流工程の「熱検討結果報告書作成」302での熱の設計条件を満足する範囲で強度の設計条件を満足する形状を検討することから、先行プロセスとして「熱検討結果報告書作成」が表示されている。
【0084】
また、右矢印の業務プロセス「機構検討」304は、選択した業務プロセス「強度検討結果報告書作成」303の後続プロセスを表している。すなわち後続プロセスとは、その業務プロセスが実行された後に開始されなければならない業務プロセスを意味する。これら先行・後続プロセスの表示は、業務プロセステンプレートデータの単位業務プロセスデータ202の先行プロセスの情報を使って表示を行う。
【0085】
図20に業務支援手段155の処理により表示される画面全体を示す。左フレームには、図19で示した業務プロセス表示領域401がある。右フレームの「Output」タブ402を選択すると、業務プロセスごとに登録された成果物一覧が表示される。図20の例では、「熱検討結果報告書作成」の業務プロセスに、「熱検討結果報告書」がディスプレイ上に表示されている。また、「Reference」タブ403を選択すると業務プロセスごとに関連つけられた参考資料一覧が表示される。参考資料一覧を選択することで設計情報データベースに格納されている成果物や参考資料を参照することができる。404は工程表示ボタンである。
【0086】
〔設計情報の自動的分類〕
本システムでは、定期的に、現在ディスプレイ上に表示または実行されている文書等の設計情報からユーザが検討している課題を特定し、その課題に基づいて設計情報データベース153に蓄積されている設計情報を分類した結果を自動的に提示する。その際の処理を以下に図21図22図23のフロー図を用いて説明する。
【0087】
本実施形態のシステムでは、図17のキーワード抽出手段157によって、図21に示す様に定期的にVBA(Visual Basic(登録商標)for Application)で提供されているgetObject関数などの、起動中の文書の情報を取得する関数を用いて起動中の文書数N、各文書のタイトルと保存先アドレスを取得し、キーワード抽出手段157のメモリ中に図24のようなN行2列の配列を取り、各文書のタイトル801と保存先アドレス802を格納する(S501)。続いて、メモリ中の配列に格納されている保存先アドレスを入力として、テキスト出力プログラムを実行し、起動中の文書からテキスト情報を取得し、テキストファイルとして出力する(S502)。
【0088】
キーワード抽出手段157により、このテキストファイルを入力として形態素解析プログラムを実行し、テキスト情報を単語に分解する(S503)。分解した単語のうち名詞のものだけを抽出し、キーワードとしてメモリ中に格納する(S504)。例えば、「部品の強度を検討する」というテキスト情報の場合は、「部品」、「の」、「強度」、「を」、「検討する」のように分解される。この中から名詞の単語を抽出すると、「部品」「強度」がキーワードとして取得される。
【0089】
次に、分類カテゴリ決定手段160により、取得したキーワードと課題一覧表162に記載の各課題の関連語とをマッチングさせ、課題ごとに関連語の文書における出現回数Xnをカウントする(S505)。課題一覧表162には、図25のように、課題902ごとにその関連語903が関連付けて記載されている。901は課題番号である。
【0090】
Xnが1以上の課題は、現在実行中の業務プロセスでの課題を意味する。例えば、図26に示すような設計情報がディスプレイ上に表示または実行されている場合、「強度」「応力」「耐力」のようなキーワードが抽出される。これらのキーワードと図25の課題一覧表を比較すると、「強度」907の関連語が一致し、「強度」が現在実行中の業務プロセスでの課題となる。
【0091】
次に、文書作成元業務プロセス判別手段158により、図22のフロー図に示すように業務支援手段155にて読み込まれている業務プロセステンプレートデータを取得し(S601)、続いて業務支援手段155により選択されている業務プロセスを取得する(S602)。次に、取得した業務プロセステンプレートデータの単位業務プロセスデータの成果物のタイトル及び参考資料と、メモリ中の配列に格納されている起動中の文書のタイトルが一致するか比較する(S603)。一致した場合、業務プロセステンプレートデータの単位業務プロセスデータの成果物のタイトル及び参考資料と、取得した起動中の文書のタイトルが一致する業務プロセス名を取得する(S604)。
【0092】
業務支援手段にて選択されている業務プロセスから業務プロセステンプレートデータの単位業務プロセスデータの先行プロセスの業務プロセスIDをたどっていき、取得した業務プロセスまでの手順数Ynを取得する(S605)。業務プロセステンプレートデータの単位業務プロセスデータの成果物のタイトルと、起動中の文書のタイトルが一致しない場合は、Yn=0とする。XnとYnを表示されている文書の数Nだけ求める。
【0093】
〔課題についての関連度P〕
続いて、分類カテゴリ優先順位決定手段164により、図23のフロー図に示すように、各課題について、課題と現在実行中の業務プロセスとの関連度Pを算出する(S701)。関連度Pは、式(1)によって求める。この式は、関連語をより多く含み、かつその関連語が現在実行中の業務プロセスにより近い業務プロセスの成果物に含まれるほど、現在実行中の業務プロセスに関連度Pが高い課題であることを意味する。
関連度P=ΣXn×Zn ・・・・・・(1)
Xn:ディスプレイに表示されている文書における課題の関連語の出現回数
Zn:ディスプレイに表示されている文書と現在実行中の業務プロセスの関連度
Yn:表示されている文書が登録されている業務プロセスと、
現在実行中の業務プロセスの関連度
M:テンプレートに定義されている総手順数
Zn=M/(Yn+1):起動中の文書タイトルと業務プロセスの成果物もしくは
参考資料のタイトルが一致する場合
Zn=1:起動中の文書タイトルと業務プロセスの成果物もしくは
参考資料のタイトルが一致しない場合
例えば、製品内の温度分布に関する検討結果を記載した「熱検討結果報告書」がディスプレイ上に表示または実行されている場合、図20の例のように、業務プロセステンプレートデータからこの設計情報が登録された業務プロセスは、「熱検討結果成果報告書作成」であることがわかる。現在検討中の業務プロセスが「強度検討結果成果報告書作成」の場合、図19からわかるとおり、「熱検討結果成果報告書作成」は、「強度検討結果成果報告書作成」の1つ上流の業務プロセスであることから、Ynは1となり、ZnはM/2となる。
【0094】
また、図26のような「強度検討参考資料」が同時にディスプレイ上に表示または実行されている場合、「強度」が課題として抽出される。この「強度検討参考資料」が、現在実行中の業務プロセス「強度検討結果成果報告書作成」の参考資料として登録されているとすると、表示されている文書が登録されている業務プロセスと、現在実行中の業務プロセスとの手順数Ynは0となり、Zn=Mとなる。従って、Xnが同じ場合には「強度」の方が「熱」よりも関連度が高くなる。
【0095】
続いて、設計情報データベース153に蓄積されている設計情報を、課題一覧表162に記載の課題によって予め分類しておき、図27に示す様に、その課題によって分類された結果を関連度の高い順に提示する(S702)。図27は、「強度」1102と「熱」1106によって分類された結果の表示例である。各分類の右横には、式(1)で求めた関連度が表示され、関連度が67と高い課題である「強度」1102が上位に表示される。
【0096】
次に、分類の下位階層には、その課題に分類された設計情報のタイトル1107が表示され、このタイトルを画面上で選択することで、設計情報1108が表示される。
【0097】
〔設計情報についての関連度Q〕
次に、課題ごとに分類された設計情報に対して、業務支援手段155によって選択されている現在実行中の業務プロセスとの関連度Qを求め、その値が高い順に表示し、さらに設計情報ごとに関連度Qを表示する。
関連度Qを求めるには、まず、業務プロセス名称と文書に対して、含まれる単語の出現頻度を成分とした文書ベクトルを生成する。ここで、業務プロセス名称から生成した文書ベクトルをベクトルA、文書から生成した文書ベクトルをベクトルBとすると、式(2)によって設計情報に関する関連度Qが求められる。式(2)によって求められる値が100に近い方が、関連度が高い情報となる。業務プロセス名称の文書ベクトルを生成する際に、業務プロセステンプレートデータの単位業務プロセスデータ202のコメントの情報を加えてもよい。さらに、文書ベクトルの各成分に対し単語の重要度によって重み付けを行ってもよい。
【0098】
【数1】
課題ごとの文書分類の手法を以下に説明する。まず、予め、課題一覧表162に記載の各課題に対して、その課題のカテゴリに分類される複数の代表的な設計情報を関連付けておく。続いて、分類対象となる設計情報と、各課題のカテゴリに対して関連付けられている代表的な設計情報との関連度を式(2)により計算する。関連度が高い設計情報のうち上位K件が含まれる文書カテゴリに、分類対象となる設計情報を振り分ける。Kはシステム管理者によって任意に指定できる数である。
【0099】
この文書分類手法は一例であり、上記の手法に限らず別の手法を用いてもよい。また、図27のように、課題による分類結果をさらに製品名・部品名によって分類しておき、画面上に表示または実行されている設計情報に含まれるキーワードから製品名・部品名を取得し、その製品・部品に関する課題に絞って表示してもよい。
【0100】
〔トレードオフに対する分類表示〕
本システムでは、ユーザが検討している課題に基づいて設計情報データベースに蓄積されている設計情報を分類した結果を提示するのに加えて、課題のトレードオフ(相反関係)となる課題についても、分類して提示する。ある課題に対してのトレードオフとなる課題は、図25において課題一覧表のトレードオフ関係欄904に、課題ごとに割り振られたNoが記載される。例えば、強度907に対するトレードオフとなる課題Noは5(906)であるので、トレードオフとなる検討課題は軽量化905となる。このようにして求めたトレードオフとなる課題について、その分類結果を、図27の1105のように、強度の分類結果の下位階層に表示する。
【0101】
従来は、図28のように、ユーザは検索システムに検索キーワードを入力して(1201)、検索を行い、検索キーワードとの関連度のみに基づいて順序付けられた検索結果(1202)から、必要な設計情報を探していた。これに対して、本実施形態のシステムでは、業務プロセスの情報を入力することなしに、ユーザが検討中の課題での分類カテゴリを、図27のように、実行中の業務プロセスの関連度と共に表示することができる。さらに、分類された設計情報を、実行中の業務プロセスの関連度が高い順に表示し、設計情報ごとに関連度を合わせて表示することができる。これによって、ユーザは、実行中の業務プロセスに関連する情報を、手間をかけることなく効率的に探すことができる。
【0102】
さらに、従来は、ユーザが意識して検索キーワードを指定しなければ、関連する情報を得ることはできなかったのに対して、ユーザが検討中の課題に加えて、ユーザが意識していないトレードオフとなる課題についても、設計情報の分類結果を得ることができる。
【0103】
〔業務支援方法〕
図17に示す業務支援手段155において、業務プロセステンプレートデータを読み込むと、ユーザは図20の業務プロセス表示領域401に表示される業務プロセスに従って業務を行うことで漏れなく業務を進めることができる。さらに、「Reference」タブ403を選択すると業務プロセスごとに関連つけられた参考資料一覧が表示される。一覧から参考資料を選択することで設計情報データベース153に格納されている参考資料を参照することができる。これによって、業務プロセスごとに関連付けられている参考資料を参照しながら、効率良く業務をすすめることができる。
【0104】
また、業務支援手段155では、設計検討報告書などの成果物と進捗情報を業務プロセスごとに登録し管理することができる。登録した成果物は、図20右フレームの「Output」タブ402を選択すると一覧表示される。
【0105】
図29は成果物登録の例を示す.成果物を登録する際は、業務プロセスを選択し、登録ボタン1321を押す。ここで、表示される成果物登録画面1322で、パソコン上に保存されている成果物となるファイルを指定し、タイトルを入力し、登録ボタン1303を押すと、成果物が登録される。登録された成果物は、設計情報データベース153に格納され、入力された成果部のタイトルと、成果物の設計情報データベースにおける格納先アドレスが業務プロセステンプレートに書き込まれる。
【0106】
また、図30のように、特定の業務プロセス上にマウスのカーソル1402をもっていくと、進捗情報表示画面1403で進捗情報が表示される。表示される情報としては、担当者、作業時間、開始日、終了日、達成率、実績作業時間、実績開始日、実績終了日などがある。進捗情報の登録の際は、業務プロセスごとに進捗情報登録画面1503が表示される。
【0107】
図31図32は進捗情報の登録例を示す。進捗情報登録画面1503では、「全般」タブ1501と「詳細」タブ1502で画面を切り替えることができる。「全般」タブ1501を選択して表示される画面では、達成率、実績作業時間、実績開始日、実績終了日などの情報を登録することができる。また、「詳細」タブ1502を選択して表示される画面では、図32のように、期限、基準作業時間、基準開始日、基準終了日などの情報を登録することができる。
【0108】
〔業務プロセステンプレートの編集〕
業務プロセステンプレート編集手段156では、業務プロセス名称や業務プロセスの階層構造について編集することが可能である。
【0109】
図33は業務プロセステンプレートの編集メニューを示す。業務プロセス表示領域1701にて表示される業務プロセスを選択すると、新規業務プロセス作成1702、業務プロセス名編集1703、コピー1704、切り取り1705、貼り付け1706、削除1707などの編集メニューが表示される。
【0110】
新規業務プロセス作成1702に関しては、兄弟プロセス1708、子プロセス1709のサブメニューが存在する。また、貼り付け1706に関しても、さらに、兄弟プロセス1710、子プロセス1711のサブメニューが存在する。
【0111】
兄弟プロセス1708を選択すると、図34の業務プロセス入力画面1801が表示される。業務プロセス入力欄1802に業務プロセス名を入力し、登録ボタン1803を押すことで、選択した業務プロセスの同一階層に入力した業務プロセス名の業務プロセスを追加することができる。子プロセス1709を選択すると、同様に業務プロセス入力画面1801が表示される。業務プロセス入力欄1802に業務プロセス名を入力し、登録ボタン1803を押すことで、選択した業務プロセスの下位階層に入力した業務プロセス名の業務プロセスを追加することができる。
【0112】
業務プロセス名編集1703を選択すると、図35の業務プロセス名編集画面1901が表示され、業務プロセス入力欄1902に既存の業務プロセス名が表示される。この業務プロセス名を変更し、登録ボタン1903を押すことで業務プロセス名を編集することができる。
【0113】
コピー1704を選択すると、選択した業務プロセスをコピーすることができる。コピーした業務プロセスは、貼り付け1706を選択することで、選択した業務プロセスの子プロセスもしくは同一階層のプロセスとして貼り付けることができる。同一階層のプロセスとして貼り付けるか子プロセスとして貼り付けるかは、サブメニューの兄弟プロセス1710、もしくは、子プロセス1711を選択することによって行う。
【0114】
切り取り1705を選択すると業務プロセスを切り取って、貼り付け1706を選択することによって、コピー1704と同様に貼り付けることができる。削除1607を選択することによって、その業務プロセスをテンプレートから削除することができる。
【0115】
[第3実施形態]
本実施形態では、職務・業務の自動化における情報の抽出手段として大規模言語モデルを用いる実施形態について説明する。職務・業務の自動化技術の一例として特開2021-86403を参考に説明する。
【0116】
本実施形態は、業務改善による効率を含めたコストダウンなどの問題点の改善から生まれたものであり、業務によって関連するシステムやデータを利用し、企業内のシステム関連コストの削減や作業効率の改善を通じて問題の解消を図り、会社の業務改革を支援するシステムを提供する。システム関連コストの削減を図るためには、既存の使い慣れている「安定、安心、安全」な既存システムを、できる限り長期間利用し続けることが望ましいので、本実施形態では、既存システムをそのまま利用することをポイントとしている。
【0117】
本実施形態で提案する業務改革支援システムは、個人単位で作成したパソコン内に埋もれた各種データ(Excel、Word、PowerPointなど)、紙ベースで保管された台帳や案件に関する資料を含め、これらの情報資産を集約して活用を図ることができる情報ネットワークを構築することで、会社業務システムの核となるプラットフォームとして、社内システムのデータ群(Excel、Word、PowerPointなど)を集約して管理し、イントラネット・クラウドとして活用する。情報が氾濫する現代社会において、企業内で集められた価値ある情報はデータベース(DB)の中にあり、それを殆どの者は見出すことができていない。本実施形態は、このような状況に鑑みてなされたものである。社内の各種システムに備わるデータ群(Excel、Wordなど)のファイルやデータ集約・管理によるシステムの融合は、新たな業務システムの創生へと繋がることから、例えれば、ヒト人工多能性幹(iPS)細胞が「再生医療」であるように、集積多能性幹(IPS:Integration Pluripotent Stem)システムである業務改革支援システムは、システムにおける業務再生幹であり、既存システム群を活用し、新たなアプリケーションを得るという業務再生を開く画期的なシステムとなる。これまで、社員が業務に使用しているシステムのデータや情報を活用し、新たなアプリケーションとして過去の分析や未来の予測を業務に活用する業務改革を実現する。新たなアプリケーションを得るという画期的な集積多能性幹(IPS)システムは、システムの再生を実現する「幹システム」とも言える。
【0118】
既存システムを利用する本実施形態の業務改革支援システムは、社内の既存システムの情報やデータを活用すると共に、システム管理者の管理の下で運用する。具体的には、「売上を伸ばす」、「粗利を高める」、「経費を下げる」といった目的のために、企業内に散在しているシステムを統合して分析し、更改することで業務の改革支援を図るものである。
【0119】
社内で活用されているシステム群には、活用されないまま蓄積されるだけの既存データ、個人単位で作成したパソコン(コンピュータを含む)内に埋もれた各種データ、紙ベースで保管された台帳や案件に関する資料などがあり、本実施形態は、これらの情報資産を気付き情報として抽出して集約することで、情報の一元化と共有化を図ると共に、情報ネットワークを単なるコミュニケーションのツールとしてではなく、企業戦略の核として位置づける。本実施形態は所謂コックピットシステムであり、これからのプラットフォームの本命であり、各種システムに備わる社内データ群の集約・管理を司るイントラネット・クラウドの先駆けでもある。
【0120】
企業においては、最近、限られた時間の中で単に訪問件数を増やすということ自体が経営受けせず、逆に大事なお客様の先では滞在(営業)時間を増やすことを奨励するようになって来ている。このように、営業担当者等が本来訪問すべき顧客先の情報を導き出すのが、本実施形態における「気付き情報」の抽出である。例えば、従来、地図システムや既存システムと連携することにより、地図への情報可視化で営業担当者等の顧客への訪問件数が増え、訪問の質も向上させているが、本実施形態によれば、例えば地図への情報可視化において、さらに「気付き情報」を与えることができるので、訪問の質を一層向上することができる。そのため、企業の業務改革へと繋がる「気付き情報」の抽出と集約の仕組みが重要となる。
【0121】
企業の業務について、例えば金融機関における環境の変化を説明すると、金融機関は今までは預金を多く集めるだけで良かった。つまり、預金さえ集めていれば融資先は山ほどあり、余った資金は信金中金や日本銀行に預けて運用すれば収益が出ていたが、近年はそのビジネスモデルでは成り立たなくなって来ている。そのため、収益性の低い渉外(営業)活動だけからの脱却が要請されている。収益力増強のため、融資、投信、保険などの取扱い商品を販売する必要があり、渉外(営業員)の行動を変える必要があり、活動がどれだけ収益をもたらしているかを可視化して収益活動に比重を置くことが要請されている。また、企業での、古い評価方法を変える必要がある。今までの評価方法は預金(売上)中心であったが、例えば、収益が年間100万円以上増加している法人を何件増やしたとか、収益が年間10万円以上増加している個人を何件増やしたとか、などの評価方法に変える必要がある。
【0122】
本実施形態で求める業務改革支援システムの気付き情報管理ツールの役割(機能)は、顧客毎の取引金額のランクではなく、収益が分かる仕組みである。例えば、年間の利息収入(粗利)であるとか、手数料収入や雑収入も反映する。目的は1顧客(取引先)当たりの収益性の把握であり、渉外担当者の個人カルテのような取り扱い件数、取引高、収益、順位のデータ表を準備し、項目毎の活動量一覧表、それぞれの数値をグラフ化し、定例集金先は自動登録、ニーズ先等は個別登録する。また、実積数値を平均数値とでスキルグラフに変え、人の強み、弱みの可視化を行う。
【0123】
さらに、本実施形態では査定に活用すべき内容を構成する。日報入力情報は、渉外(営業)担当者毎に日報を入力させ、カルテに収益実績、活動一覧などを集計させ、ファイルをリアルタイムで更新し、上司に開示されることにより、案件の進捗が分かり、営業過程の評価、指導に繋げるようにする。この業務改革支援システムの気付き情報管理ツールとして、勘定系やその他必要な既存システムと連携し、より確実なデータ取得と誤入力防止措置や集計のスピードアップを図る。
【0124】
以下、本発明の実施形態について図面を参照して説明する。
【0125】
既存システム内に散在している顧客に関する様々な情報データのキーワードの例は、例えば以下のものが挙げられる。「融資件数」、「訪問件数」、「面談件数」、「見込み件数」、「成約件数」、「売上目標」、「売上実績」などである。散在している顧客に関する様々な情報やデータから、上記のようなキーワードに関する気付き情報を抽出し、フィルタに収納(紐付け)される。キーワードリスト情報項目から得られた情報を目的毎に評価者と共有するために、図36に示す「共有フィルタ(情報・提案に繋げる)」、「共有フィルタ(増収に繋げる)」、「共有フィルタ(信頼の獲得、ミス防止に繋げる)」などに分類する。この他にも目的毎に共有フィルタを作成し、キーワードを設定することができる。
【0126】
キーワードリストは、Excel/Word等の既存システム内に散在している様々な情報から、気付きに必要な情報を抽出するためのキーワードの一群である。キーワードリストを用いて、Excel/Word等から抽出した情報が「各種データ519」(図40参照)となる。「各種データ519」は、その他の既存システム500の情報のうちの1つとなり、さらにその後に「既存システム500」、「チャネル600」、「外部情報700」が情報源となる。
【0127】
図37は、Excelの全セル情報(図37(A))からデータ(図37(B))を取得する手法を示しており(以下では、「全セル方式」とする)、この全セル方式の手法では全ての文字情報を取得できるが、その文字が何の情報かは分からない。図37の例では、例えば「2019年4月4日」という情報が存在することは分かるが、「報告日」が2019年4月4日ということは分からない。また、全セル方式では、読み込んだだけでは全ての情報の区切りもないので、単純な文字列でしかない。これを解決するため、公知の形態素解析や全文検索エンジンを用いて、意味のある情報にしてから用いる必要がある。「形態素解析」とは、自然言語で書かれた文を言語上の最小単位である形態素に分割し、それぞれの品詞や変化などを割り出すことであり、ITの分野ではコンピュータによる自然言語処理の1つとして、カナ漢字変換や全文検索、機械翻訳などで用いられている。また、「全文検索エンジン」は、データベース等の高速検索を実現するミドルウェア製品として販売されており、大容量のデータより索引情報を抽出し、サーチクラスタを作成し、創成されたクラスタ経由でデータを検索することで、データ元への直接検索と比較し、格段に効率的かつ高速な検索を行うことができる。一例として、「てにおは」で分解して名詞と動詞にし、辞書を用いて精度を上げるようにする。例えば「3月24日に○○社を訪問した。」を形態素解析すると「7/月/24/日/に/○○社/を/訪問/し/た/。」(/で分解)となり、この中の「○○社」「訪問」を名詞として取得することで、該当ファイルがフィルタに合致するか否かを判断する。
【0128】
全セル方式の手法では、ネットワーク内のサーバに共有フォルダを用意し、そのサーバで処理を行う。各自パソコンで文書を作成する際は、各自のパソコンに文書を保存するのではなく、共有フォルダにファイルを保存する。パソコン使用者に意識させることなく、サーバにファイルを保存させる方法は、シンクライアントを利用したり、文書の保存場所を共有フォルダにしか保存できないようにOSに設定したりするなど、公知の手法で行うことができる。
【0129】
図38は、Excelの指定セル情報(図38(A))からデータ(図38(B))を取得する手法を示しており(以下、「指定セル方式」とする)、この指定セル方式では、事前にセル番号とそのセルに何の情報が記載されているかをマスタに登録しており、ファイルを読み込む際にマスタに登録されたセル番号を順次指定して、セルに記載された内容を順次読み込む。図38の例では、報告日の内容はセルN4に記載されているので、セルN4の内容「2019年4月4日」が読み込まれる。同様に、部署の内容はセルB5に記載されているので、セルB5の内容「営業本部営業2課」が読み込まれ、氏名の内容はセルB6に記載されているので、セルB6の内容「斎藤△男」が読み込まれる。図37で説明した全セル方式に比べ、読み込むデータが何の情報かが事前に分かるので、意味のある情報になる。指定セル方式は、何の情報がどのセルに存在するかが決まっていないと利用できないので、定型フォーマットの場合に最適である。なお、Excel/Wordは本実施形態で求める気付き情報の可視化にも使用できる。後記する方法で求める気付き情報を、読み込みと逆の方法でExcel/Wordに書き込みすることで、ユーザがExcel/Wordを開き、文字や表・グラフ化された情報で気付き情報を取得できる。
【0130】
指定セル方式の手法でも、ネットワーク内のサーバに共有フォルダを用意し、そのサーバで処理を行う。パソコン使用者に意識させることなく、サーバにファイルを保存させる方法は、公知のOSを用いて行うことができる。
【0131】
図39はWordからデータを取得する場合を示している。Wordからも、全セル方式の場合と同様に、全ての文字情報を取得できるが、その文字が何の情報かは分からない。また、図39(A)に示すように、読み込んだだけでは全ての情報の区切りもないので、単純な文字列でしかない。これを解決するため、Excelの全セル方式の場合と同様に、公知の形態素解析や全文検索エンジンを用いて、意味のある情報にしてから用いる必要がある。WordにはExcelのようなセルが無いので、特定の情報を取得することはできない。図39(B)の例では、例えば「平成29年1月1日」という情報があることは分かるが、「契約日」としての「平成29年1月1日」という情報であるかは分からない。
【0132】
図40は企業の一例として金融機関の本実施形態に係る業務改革支援システム100の連携関係を示しており、業務改革支援システム100には気付き情報構築システム200が融合して含まれており、データウェアハウス(DWH)・統合データベース(DB)400がデータ連携すると共に、既存システム500、チャネル600及び外部情報700がそれぞれインターフェース(I/F)を介して、業務改革支援システム100とデータ連携している。既に企業内にDWH・統合DB400が構築済みであったり、業務改革支援システム100の導入に合わせて構築したりする場合には、本実施形態とDWH・統合DB400とがデータ連携することにより、DWH・統合DB400を利用している既存システムと本実施形態に係る業務改革支援システム100とで、リアルタイムにデータを使用することが可能になる。
【0133】
企業にて稼働中の既存システム500としては、国際系システム501、為替管理システム502、資金証券システム503、経営管理システム504、事務集中システム、CRM・SFA506、融資稟議システム507、財務分析システム508、担保評価システム510、債券管理システム511、審査システム512、信用格付・自己査定システム513、リスク管理システム514、投信・保険窓口販売システム515、マーケティングシステム516、グループウェア517、契約書システム518、各種データ(Excel、Word、PowerPointなど)519などがある。これら既存システム500と業務改革支援システム100とが、公知の手法でデータ連携する。本実施形態では、この連携にwordやexcel等が関係する。WordやExcelデータを既存システムの1つ(各種データ519)として扱い、気付き情報の情報源として用いると共に、出力先として用いる。チャネル600として、営業店窓口601、ATM(自動現金引き出し預け入れ装置)602、コールセンター603、インターネット604、ダイレクトメール605、電子メール606、SNS(Social Networking Service)607などがある。これらチャネル600と業務改革支援システム100とが、公知の手法でデータ連携する。また、外部情報700として、企業情報701、外部格付情報702、個人信用情報703、登記情報704、統計情報705、不動産情報706、マーケット情報707、コンプライアンス情報708などがある。これら外部情報700と業務改革支援システム100とが、公知の手法でデータ連携する。
【0134】
業務改革支援システム100の構成例は図41であり、全体の制御や演算処理などを行うCPU(MPUやMCUなどを含む)101を含み、CPU101には、プログラム等を格納するROM102、演算処理のデータやパラメータ等を記憶するRAM103、各種データ、情報を格納するデータベース(DB)104が接続されている。業務改革支援システム100は、テンキーやマウス、スキャナなどからデータや指示などを入力するデータ入力部109と、外部からインターフェース111を経てデータや情報を入力する入力部112と、画面(ディスプレイ)若しくはプリンタ等でデータ、情報などを可視化する可視化部113と、インターフェース115を経て外部にデータや情報を出力する出力部114とで構成され、ルータ116を経てインターネット604に接続されている。
【0135】
また、業務改革支援システム100には、入力連携インターフェース(I/F)220及び出力連携インターフェース(I/F)260を含む気付き情報構築部210が、CPU101等と連携して設けられており、入力連携インターフェース220は、DWH・統合DB400、既存システム500、チャネル600及び外部情報700とデータ連携して情報を取込み、出力連携インターフェース260は、DWH・統合DB400及び既存システム500とデータ連携して情報を出力する。
【0136】
図42は気付き情報構築システム200の概念構成を示しており、気付き情報構築システム200は既存システム500、チャネル600及び外部情報700を入力情報源として幅広い情報を集め、富裕層、交渉履歴、登記情報などの抽出条件に基づいて気付き情報を抽出する。抽出条件は、DB104内の気付き情報抽出マスタに登録される。気付き情報の種類としては、提案に繋げる共有の情報、増収に繋がる情報、信頼の獲得、ミス防止等の情報などがある。提案に繋げる共有の情報には、訪問計画、交渉履歴、富裕層、訪問頻度、期日管理、登記情報、ネタ情報、ビジネスマッチング、リレーション、地図上への可視化などがある。また、増収に繋がる情報には、交渉履歴、富裕層、訪問頻度、登記情報、ネタ情報、ビジネスマッチング、リレーションなどがある。信頼の獲得、ミス防止等の情報には、訪問計画、期日管理、地図上へ可視化などがある。気付き情報構築システム200で抽出された気付き情報は担当者等に通知されたり、地図やCRM、Excel/Wordなどに可視化されたりする。
【0137】
気付き情報構築システム200の概略構成及び情報の流れは図43に示すようになっており、気付き情報構築システム200は既存システム500として散在しているCRM506、マーケティングシステム516、グループウェア517等の複数の既存システムから入力連携インターフェース220を介して情報を収集する。入力連携インターフェース220は、情報を取り込むシステム接続インターフェース221と、情報を一元集約記憶装置230に送出する一元集約記憶装置インターフェース222とで構成されている。入力連携インターフェース220は、異なる形式のデータや情報を分析若しくは解析して単純化するものであり、システム接続インターフェース221は接続システムにより変形例を増やすことができ、一元集約記憶装置インターフェース222は単純化した情報を一元集約記憶装置230へ記憶したり、記憶内容を変更したり、記憶内容を削除する機能を有している。
【0138】
入力連携インターフェース220の一元集約記憶装置インターフェース222から送出された情報は、一元集約記憶装置230に入力されて記憶される。一元集約記憶装置230には、訪問計画、交渉履歴などの情報を記憶する顧客部231と、期日管理、キャンペーンなどの日時データを記憶する日時部232と、不動産、路線価などの情報を記憶する住所部233などがある。各情報やデータからキーとなる情報を識別し、この識別されたキー情報と、抽出条件の対象となる情報を、一元集約記憶装置230に記憶する。このキーとなる情報の例が顧客(口座番号)や日時、住所などであり、これらのキー情報は一元集約記憶装置インターフェース222と気付き情報抽出部240(大規模言語モデルの適用例)の設定により決定される。分解された情報は、顧客部231、日時部232、住所部233等の一元集約記憶装置230に別々に記憶されているが、キー情報は、抽出条件で抽出した別々の情報を紐付けして、意味のある気付き情報にするためのものである。
【0139】
一元集約記憶装置230に記憶されたデータや情報は後述する気付き情報抽出部240に読み込まれ、大規模言語モデルが搭載された気付き情報抽出部240は富裕層、交渉履歴、登記情報などの抽出条件に基づいて入力情報源から気付き情報を抽出する。これにより、DWH・統合DB400、既存システム500、チャネル600及び外部情報700に散在している多様な情報を、一元的に集約して気付き情報を抽出できる。
【0140】
気付き情報の抽出は、訪問計画(本来優先して訪問すべき顧客先の抽出)、交渉履歴(提案ネタや潜在ニーズの発掘)、富裕層(預かり資産等、金融商品の提案先)、期日管理(フォロー漏れ回避)、登記情報(住宅ローンやアパートローンなどの肩代わり先)、ビジネスマッチング(取引関係やステークホルダとの繋がり)、リレーション(相続による預金の営業域外流出を阻止)、推進商品情報(個人ローンや投信など商品別の取引有無先)、非対面チャネルや店頭で獲得し易い投信や保険商品、大口振込入出金先と特定ATMユーザ(世帯)、訪問頻度(長期未訪問先のあぶり出し)、直近1ヶ月間資産運用取引先、要注意先(中長期延滞管理先、苦情等管理先)、役員・支店長過去訪問履歴先、不動産担保実査(再評価)予定先・不動産新規物件・分譲地開発情報、他行営業担当者訪問先・他行流出資金先・他行メイン先、インターネット・コールセンター取引ユーザ(高頻度先)、不動産物件複数所有者・生産緑地対象不動産所有者、好業績企業・COSMOS(登録商標:企業概要データベース)評点アップ企業・代表者変更企業などに基づいて行う。気付き情報抽出部240は気付き情報抽出のための抽出条件に合致するか否かを判断し、抽出条件に合致するものを抽出するようになっており、抽出条件は気付き毎に、DB104内の気付き情報抽出マスタに設定できる。
【0141】
気付き情報抽出部240は抽出目的に合わせ、複数の項目を組み合わせるロジックを用意し、例えば富裕層且つ推進商品情報の商品取引がなく、訪問頻度の項目で1ヶ月以上訪問していない顧客を、「気付き情報」として抽出する。
【0142】
気付き情報抽出部240で抽出された気付き情報は、気付き集約記憶装置250に送られて記憶される。記憶には一元集約記憶装置230と同様に、訪問計画、交渉履歴などの情報を記憶する顧客部251、期日管理、キャンペーンなどの日時データを記憶する日時部252、不動産、路線価などの情報を記憶する住所部253などがある。抽出条件に合致した各情報からキーとなる情報を識別し、キー情報を基に抽出条件に合致した各情報を気付き集約記憶装置250で記憶する。このキーとなる情報の例が顧客(口座番号)や日時、住所などであり、これらのキー情報は、気付き情報抽出部240と出力連携インターフェース260内の気付き集約記憶装置インターフェース261の設定により決定される。これらのキー情報は、顧客部251、日時部252、住所部253等に別々に記憶された情報を紐付けして、意味のある気付き情報にするために用いる。
【0143】
気付き情報抽出部240では、例えば「一定の富裕層以上で、且つ最近登記情報の更新があり、1ヶ月以上の交渉履歴が無い」情報を抽出するが、この抽出された富裕層情報・登記情報・交渉履歴情報は、一元集約記憶装置230から気付き集約記憶装置250へと複写される。その複写時に、気付き情報抽出マスタ識別子も併せて記憶することで、気付き集約記憶装置250に記憶された情報が何の気付きかを識別することが可能である。
【0144】
気付き集約記憶装置250に記憶された気付き情報は出力連携インターフェース260に入力され、地図やCRMなどに可視化される。地図上にアイコンで指示したり、CRMで訪問先候補リストにして連携させたりする。出力連携インターフェース260は、気付き集約記憶装置インターフェース261と、システム接続インターフェース262とで構成されており、気付き集約記憶装置250に記憶されている富裕層情報、登記情報、交渉履歴情報を「顧客」で紐付けした情報に加工した上で、住所をキーとした地図システム用データに加工する。気付き集約記憶装置インターフェース261は気付き情報を気付き可視化種別により引き出し、システム接続インターフェース262は単純化されている気付き情報を可視化部に合わせて出力する。
【0145】
なお、気付き情報構築部210は、入力連携インターフェース220、一元集約記憶装置230、気付き集約記憶装置250、出力連携インターフェース260で構成されている。
【0146】
図44は気付き情報構築システム200の相互関係を示すブロック図であり、入力連携インターフェース220内のシステム接続インターフェース221には、DWH・統合DB400、既存システム500、チャネル600及び外部情報700が接続されており、システム接続インターフェース221から取り込まれた情報等は一元集約記憶装置インターフェース222を経て一元集約記憶装置230に記憶される。気付き情報抽出部240は、一元集約記憶装置230に記憶された情報を読み出して気付き情報を抽出し、抽出した気付き情報を気付き集約記憶装置250に記憶する。気付き集約記憶装置250に記憶された気付き情報は気付き集約記憶装置インターフェース261により読み出され、システム接続インターフェース262を経てDWH・統合DB400及び既存システム500に送信される。
【0147】
図45は入力連携インターフェース220の動作例を示しており、先ず連携する既存システム情報を取得し(ステップS210)、取得した既存システム情報から、システム接続インターフェース221で接続している既存システム500から取得したデータを解読単位に分解する(ステップS211)。そして、分解データを1件取得し(ステップS212)、既存システム情報から分解条件を1件取得し(ステップS213)、分解データが分解条件に合致するか否かを判断する(ステップS214)。分解データが分解条件に合致する場合には、他に分解条件があるか否かを判断する(ステップS215)。
【0148】
上記ステップS214の判断において、分解データが分解条件に合致しないと判断された場合には上記ステップS212にリターンし、上記ステップS215の判断において、他に分解条件があると判断された場合には、上記ステップS213にリターンする。
【0149】
上記ステップS215において、他に分解条件がないと判断された場合には、取得した分解データを一元集約記憶装置230に記録し(ステップS216)、次の分解データがあるか否かを判断し(ステップS217)、次の分解データが無ければ気付き情報抽出部240に抽出依頼を行う(ステップS218)。ステップS217において次の分解データがあると判断された場合には、上記ステップS212にリターンする。
【0150】
図46は気付き情報抽出部240の動作例を示しており、先ずユーザ(利用者)情報を取得し(ステップS220)、DB104内の気付き情報抽出マスタから抽出条件を取得し(ステップS221)、一元集約記憶装置230からデータリストを取得する(ステップS222)。その後、データリストからデータを1件取得し(ステップS223)、抽出条件リストから抽出条件を1件取得する(ステップS224)。そして、データが抽出条件に合致するか否かを判断し(ステップS225)、データが抽出条件に合致する場合にはさらに他に抽出条件があるか否かを判断する(ステップS226)。上記ステップS225において、合致しないと判断された場合には上記ステップS223にリターンし、上記ステップS226において、他に抽出条件があると判断された場合には上記ステップS224にリターンする。
【0151】
上記ステップS226において、他に抽出条件が無いと判断された場合には気付き集約記憶装置250にデータを記録し(ステップS230)、データリストに次のデータがあるか否かを判断し(ステップS231)、次のデータが無い場合には出力連携インターフェース260に出力依頼を行う(ステップS232)。ステップS231において、次のデータがあると判断された場合には上記ステップS223にリターンする。
【0152】
次に、出力連携インターフェース260の動作例を、図47のフローチャートを参照して説明する。
【0153】
先ず、連携する可視化システム情報を取得し(ステップS240)、気付き集約記憶装置250から気付き情報データを取得する(ステップS241)。そして、気付き情報データを可視化システム情報から変換し(ステップS242)、変換した気付き情報データをシステム接続インターフェース262に入力し(ステップS243)、気付き情報データを可視化部に出力する(ステップS244)。気付き情報の可視化部は、本例では地図、CRM、Excel/Wordに可視化する。
【0154】
図48は気付き情報抽出部240における画面例を、顧客から預かった書類の管理業務(図48(A))を例として示している。本件では、案件の処理日が一元集約記憶装置230の日時部232に記憶されており、気付き情報抽出部240が、この日時情報と、図48(B)のように事前に、DB104に設定している通知(期日)マスタとで情報比較を行うことにより、図48(C)に示す気付き情報を抽出する。マスタ登録は気付き毎に設定できるため、例えば30日以上経過したものを抽出したり、処理予定日を1週間経過したものを抽出したりといったことが可能になる。
【0155】
自動車、家屋等の売買やローンの申込等で必要な書類等(印鑑証明書、抵当権設定証書等)は、一時的に顧客から預かって保管するが、売買や申込の案件処理日には必要な処理を行わなくてはならず、また、定期的に棚卸を行うなどの対応が必要である。これを紙台帳等で管理するとなると、預かり時の記載、日々の確認、棚卸等で業務の負担は大きくなる。そこで、本実施形態の気付き情報構築システム200を導入すると、図48(A)に示すように、預かり時の書類等を画面上で登録するだけで(既存システム連携部140)、自動的に必要な情報を一元集約記憶装置230に記憶し、気付き情報抽出部240で抽出して気付き集約記憶装置250に記憶する。そして、売買や申込の案件処理日になると出力連携インターフェース260を介して通知し、長期間預かったままの書類があれば図48(C)に示すような画面で出力連携インターフェース260を介して担当者に通知する。このため、台帳を調べたり、棚卸を行ったりといった担当者の負担、労力は大幅に削減される。
【0156】
処理が終わった書類の情報がいつまでも通知に残っていては、そのうちどれが処理したかどうかが分からなくなる。従来の紙台帳管理の場合、処理済み欄などでチェックし、処理したか否かを区別するが、本実施形態の場合は処理したものを通知一覧から消去することで、通知一覧を未処理のものとして区別することが可能になる。
【0157】
図49は、気付き情報抽出部240における気付き情報の抽出例を示すデータの流れを示しており、本例の抽出条件は、上記した「富裕層且つ推進商品情報の商品取引がなく、訪問頻度の項目で1ヶ月以上訪問していない顧客」の場合である。
【0158】
図49に示すように、ホストコンピュータ(PCを含む)としての勘定系ホスト300の顧客データベース301の内容が、入力連携インターフェース220を経て一元集約記憶装置230内の顧客データベース230-1に記憶される。また、CRM506内の商品リスト506-1、商品購入履歴506-2、訪問履歴506-3は既存システム連携部140(システム接続IF141、一元集約記憶装置IF142)を経て一元集約記憶装置230内の商品リスト230-2、商品購入履歴230-3、訪問履歴230-4に記憶される。一元集約記憶装置230内の商品リスト230-2、商品購入履歴230-3、訪問履歴230-4に対して、気付き情報の抽出条件を顧客情報として「富裕層(預金残高が1000万円以上)」、推奨商品として「商品名「xxxxx」の購入履歴がない」、訪問履歴として「訪問頻度で1ヶ月以上訪問していない」が設定されているので、抽出条件に合致するデータを抽出する。即ち、一元集約記憶装置230内の顧客データベース230-1から抽出条件「富裕層(預金残高が1000万円以上)」に合致する該当顧客を抽出し、一元集約記憶装置230内の商品リスト230-2及び商品購入履歴230-3から抽出条件「商品名「xxxxx」の購入履歴がない」に合致する該当商品及び購入履歴を抽出して該当商品リスト及び購入履歴無しリストを作成し、一元集約記憶装置230内の訪問履歴230-4から抽出条件「訪問頻度で1ヶ月以上訪問していない」に合致する該当訪問履歴を抽出する。このように抽出されたデータから、全ての条件に合致したものを抽出して気付き情報として生成する。本例では、気付き情報「富裕層且つ推進商品情報の商品取引がなく、訪問頻度の項目で1ヶ月以上訪問していない顧客」となり、データとしては「お客様番号」、「お客様番号氏名」、「預金残高」、「商品番号」、「商品名」、「購入履歴」及び「前回訪問日」となっている。
【0159】
次に、本実施形態の全体の作業例を図50図53の作業流れ図及び図54図59の画面図を参照して説明する。
【0160】
業務改革支援システム100ではヒヤリングシートの内容にて本人の特定を行い(工程SB1)、相談を受け付け(工程SB6)、申込書に記入し、疎明資料を提出し(工程SB10)、申込内容を入力し、疎明資料を登録し(工程SB11)、申込承認となる(工程SB13)。また、業務改革支援システム100では、郵送や持ち込みにおける住宅ローン事前審査申込(工程SC1)に対しても本人特定(工程SB2)を行う。郵送や持ち込みによる申し込みの場合には、申込書等に記入して本人確認書類をコピーし(工程SC2)、申込内容を入力し、疎明資料を登録し(工程SB12)、申込承認となる(工程SB13)。Webローン申し込み(工程SC3)の場合には、申込内容を入力して本人確認書類等を添付し(工程SC4)、申込承認となる(工程SB13)。
【0161】
業務改革支援システム100ではその後、審査システムに審査依頼を送信し(工程SB20)、審査システムは審査判断を行って判断結果を送信し(工程SC10)、業務改革支援システム100は審査結果を受信する(工程SB21)。そして、自行審査が否の場合には、外部の審査機関である保証会社に審査を依頼し(工程SB30)、保証会社は審査判断を行って判断結果を送信し(工程SC11)、業務改革支援システム100では審査結果を受信する(工程SB35)。
【0162】
その後、業務改革支援システム100は融資決裁を行い(工程SB40)、コンプライアンスチェックのための照会送信をコンプライアンスチェックシステムに対して行う(工程SB41)。コンプライアンスチェックシステムは、受信した照会内容をコンプライアンス上問題がないかのチェックを行い、その照会結果を業務改革支援システム100に送信する(工程SC33)。
【0163】
業務改革支援システム100は照会結果を受信し(工程SB42)、審査結果を行員が確認して電話若しくはe-メールで顧客に連絡し、連絡した内容を登録する。業務改革支援システム100は勘定系ホスト連携機能により勘定系ホスト(PCを含むホストコンピュータ)に連携データを送信し、勘定系ホスト300は連携データを受信する(工程SC40)。また、タイミングT1では、顧客の在籍確認と勘定系ホスト300への連携が完了したことになるため、在籍確認結果を登録する(工程SB50)。その後、承認条件解除作業を行い(工程SB51)、承認条件解除の確認を行う(工程SB52)。
【0164】
そして、本人同意となるが、業務改革支援システム100ではデータ連携を行い、メールやWeb等での本人同意を行う(工程SC50)。業務改革支援システム100は同意結果を受信し(工程SB53)、行員は実行用端末を使って融資の実行を行う(工程SC60)。このタイミングT3では、実行条件クリアの状態である。
【0165】
その後、事後条件解除作業を担保評価システム510と連携して行うが(工程SB60)、担保評価システム510は住宅ローン担保物件の評価を行い、業務改革支援システム100に評価結果を返す(工程SC70)。その後、事後条件解除を確認して完了となる。
【0166】
図54図59はそれぞれ図50図53の画面例で、画面DP1は工程SB1、画面DP2は工程SB6、画面DP3は工程SB11、画面DP4は工程SB13の画面にそれぞれ対応している。なお、画面MD1は、画面DP4を開く際に用いる本システムの気付き情報表示画面である。画面DP6は工程SB40で、画面MD3は画面DP6を開く際の気付き情報表示画面である。画面DP7は工程SB43で、画面MD4は画面DP7を開く際の気付き情報表示画面であり、画面DP9は工程SB51で、画面MD6は画面DP9を開く際の気付き情報表示画面である。画面PL5は工程SC50を示し、画面DP11は工程SB60で、画面MD8は画面DP11を開く際の気付き情報表示画面であり、画面DP12は工程SB62で、画面MD9は画面DP12を開く際の気付き情報表示画面である。
【0167】
図60は業務改革支援システムの将来展望図であり、融合結果としてAIの入り口となる。つまり、AIによる気付き情報抽出の自動化ができ、成績優秀者の成功パターン解析と気付き情報抽出への反映や、潜在顧客の獲得、新しい市場や商品の予測が可能となる。業務改革支援システムを個人ローン業務改革支援システムに適用した場合、交渉履歴や訪問頻度、ネタ情報、ビジネスマッチングから気付き情報を抽出することで、追加の商品提案(増収)や、訪問計画の変更(信頼獲得)を行い得るようになり、結果融資数の増加、融資の質向上の適正化を達成できる。
【0168】
企業においては、システム関連コストの削減や作業効率の改善、及び問題の解消という共通課題が存在しており、既存のシステム群を融合させる業務改革支援システムの応用は無限に広がる。また、他の業種や地図データ、デジタル図庫との連携及び2D・3DCADデータを利用したシステムの構築にも応用が可能である。
【0169】
また、上記の例では企業として金融機関を挙げて説明しているが、他の種々の企業(自動車製造会社、飲料製造会社、日用品販売会社など)でも同様に適用可能である。
【0170】
[第4実施形態]
本実施形態では、エキスパートシステムとして大規模言語モデルを用いる実施形態について説明する。エキスパートシステムの一例として特開2005-339529を参考に説明する。
【0171】
<概略>
本発明のエキスパートシステム生成装置は、エキスパートシステムを構築するためのエキスパートシステム生成装置であって、該エキスパートシステムの構築対象となる外部システムから観測される状況とそれに付随する結果とを蓄積する事例獲得手段と、該蓄積された状況と結果とを自動学習し、該状況から該結果が生じる統計的な傾向を知識として導くルール生成手段と、該導かれた統計的な傾向から、観測されるある状況に対する結果を自動判断するコンサルティング手段とを備え、該事例獲得手段と該ルール生成手段と該コンサルティング手段とを単独で動作させたり、相互に連携させたりすることによって該状況と該結果を更新し、より妥当な知識へと自動的に更新することを特徴とする。
【0172】
本発明のエキスパートシステム生成装置では、まず事例獲得手段によってエキスパートシステムの構築対象となる外部システムから観測できる状況とそれに付随する結果とを蓄積する。そして、ルール生成手段によって蓄積された状況と結果とを自動学習し、該状況から該結果が生じる統計的な傾向が知識として導かれる。ここで外部システムとは、製造装置や処理装置等の人工的に製造された装置のみならず、自然の変化や人の行動等、エキスパートシステムの適用対象となる全てのシステムをいう。こうして導かれた統計的な傾向としての知識は不変なものではなく、事例獲得手段とルール生成手段とコンサルティング手段とを単独で動作させたり、相互に連携させたりすることによって状況と結果を更新し、より妥当な知識へと自動的に更新される。このため、最初にコンサルティング手段によって自動判断された、知識が妥当性に欠けていたとしても、その後に状況及び結果を更新し、知識が自動的に更新されるため、知識が妥当性の高いものへと変化していくことができる。このため、最初から妥当性の高い知識を得るために、熟練したナリッジエンジニアを採用し、専門家から専門知識を的確に抽出し、それらの専門知識を整理し、取捨選択するという負担は軽減される。また、専門家のインタビューや、その記録から問題を整理し、事実及び規則、質問及び答え、因果のリンク、前提と結論、確率関数等を的確に確認するという負担も軽減される。このため、よく訓練され、熟達したナリッジエンジニアでなくても、エキスパートシステムの生成が可能となる。また、従来のナリッジエンジニアへの負担が継続的であったのに対し、このエキスパートシステム生成装置では、継続的な負担が大幅に軽減される。さらに、エキスパートシステムを構築するための、手間や時間及び費用の負担が軽減される。
【0173】
従って、 本発明のエキスパートシステム生成装置は、ナッリジエンジニアへの負担が少なく、適切なエキスパートシステムをそれほどの手間や時間をかけることなく作成することが可能であり、汎用性に優れる。
【0174】
本発明のエキスパートシステム生成装置において、事例獲得手段はエキスパートシステムの構築対象となる外部システムに関する状況と結果とをデータとして獲得して蓄積し、ルール生成手段は該事例獲得手段によって獲得し蓄積された該データから統計的な傾向をルールという形式で自動抽出し、コンサルティング手段は該ルール生成手段によって生成された該ルールを参照して該外部システムの現在のデータから状況に対する結果を自動判断し、該事例獲得手段、該ルール生成手段及び該コンサルティング手段は単独で動作させることが可能であり、該ルール生成手段は、該事例獲得手段及び該コンサルティング手段と連携して該データの集積と共に該ルールを自動的に更新し、より状況に適合したルールに更新していくこととすることができる。
【0175】
こうであれば、まず事例獲得手段によってエキスパートシステムの構築対象となる外部システムに関するデータが獲得され、ルール生成手段によってデータ間の因果関係をルールという形式で自動抽出される。ここで、外部システムに関するデータとは、それらの外部システムの状態を表現する数値や記号値等を意味する。こうして生成されたルールは不変のものではなく、その後に獲得されたデータの集積と共にルールを自動的に更新することによって、より状況に適合したルールに更新される。このため、最初に生成されたルールが妥当性に欠けていたとしても、その後のデータの獲得と共に徐々にルールが妥当性の高いものへと変化していくことができる。このため、ナッリジエンジニアへの負担が少なく、適切なエキスパートシステムをそれほどの手間や時間をかけることなく作成することが可能であり、汎用性に優れる。
【0176】
こうしたエキスパートシステム生成装置では、事例獲得手段で獲得されるデータを属性及び属性値からなる事例とし、コンサルティング手段において導かれる結論を結論属性値として求めることができる。
【0177】
本発明のエキスパートシステム生成装置におけるルール生成手段で生成されるルールの形式としては、決定木の形式、Prolog式の形式、論理式、統計分析手法における関数等で生成することができる。
【0178】
ルール生成手段が決定木の形式でルールを生成する場合、事例の過不足に関わらず、決定木を自動生成することが可能とされていることが好ましい。実際に産業現場から事例を獲得しようとした場合には、事例の一部が不明であることもある。また、どのような事例が必要であり、どのような事例が不要なのかを前もって的確に判断できない場合がある。このため、不明な条件属性値が存在する事例や不明な結論属性値が存在する事例等、事例の過不足に関わらず、決定木を自動生成することが可能であれば、とりあえず決定木を生成しておき、後から決定木自動更新手段によって、より妥当性の高い決定木に更新していくことが可能となる。このため、ナッリジエンジニアへの負担をさらに軽減できると共に、適用可能な範囲をさらに拡大することができる。このような、事例の過不足に関わらず、決定木を自動生成するための具体的な方法としては、情報量の計算時に、不明の値については、確率に影響を与えないように読み飛ばし処理を行ったりすること等が挙げられる。
【0179】
また、ルール生成手段は、所定の事例に対しては結論属性値を固定値に設定できることが好ましい。こうであれば、結論属性の属性値が明らかに間違っている場合に、それを適切な値に補正することが可能となる。また、任意の条件において結論が一義的に定まる場合において、適切な結論属性の属性値とすることができる。このため、本発明のエキスパートシステム生成装置によって得られる推定ルールをより現状に適合した、テーラーメードなものとすることができる。
【0180】
さらに、ルール生成手段は、獲得される事例の属性値の分布に関する事前の知識が得られている場合において、一度生成した決定木をトレースした結果導かれる不明な結論属性値に対して、該結論属性値を含む事例を追加することが好ましい。こうであれば、不明な結論属性値に到達するまでに決定木上に現れる条件属性に基づいて不足事例を生成することにより、少数の結論属性値が不明である場合でも、適切な決定木を生成することが可能となる。
【0181】
また、コンサルティング手段は、外部から自動的に条件属性値を獲得し、既得した決定木から結論属性値を導くことが好ましい。こうであれば、コンサルティングの自動化が可能となる。こうしたコンサルティング手段としては、実行プログラム形式の外部システムを自動起動し、該外部システムの出力値を条件属性値に変換して獲得すること等が挙げられる。こうであれば、例えば本エキスパートシステム生成装置が動作しているコンピュータ上にネットワークによって外部にアクセスするためのプログラムが存在する場合には、そのシステムを介してネットワークで結合された別の機器の外部プログラムを制御し、事例を獲得することができる。
【0182】
さらに、コンサルティング手段は、外部システムに対して結論属性値を適用することが好ましい。こうであれば、コンサルティングの結果に基づいて外部システムを自動的に制御することが可能となる。こうしたコンサルティング手段としては、実行プログラム形式の外部システムを自動起動し、コンサルティング手段によって得られた結論属性値を該外部システムの入力値に変換して引き渡すこと等が挙げられる。
【0183】
また、ルール生成手段は、生成された決定木の妥当性を評価し、その結果をもとに、より妥当性の高い決定木に更新することが好ましい。こうしたルール生成手段としては、事例の例外化が可能とされていることや、条件属性項目の例外化や、分岐枝の剪定が可能とされていること等が挙げられる。事例の例外化や条件属性項目の例外化が可能であれば、より現実に即した妥当な決定木を生成することができる。また、分岐枝の剪定が可能とされていれば、必要以上に複雑となり、事例の分析が困難となる場合において、決定木が単純化され、分析を行うことが容易になる。ここで、分岐枝の剪定は、任意の条件属性項目間及び条件属性と結論属性の間のどちらにおいても行うことが可能とされていることが好ましい。こうであれば、決定木の一部のみの変更や単純化や削除を行うことが可能となり、より現実に即した決定木の編集をすることができる。また、決定木をたどった結果として1つの条件事例に対して複数の結論属性値が導かれる場合、該当する事例を例外として該決定木を再生成することが可能とされていることも挙げられる。こうであれば、現在の事例では結論属性値どうしが矛盾して衝突する場合においても、決定木を生成することが可能となる。
【0184】
事例獲得手段は、事例を自動的に獲得することが可能とされていることが好ましい。こうであれば、決定木の自動更新を行うことができると共に、事例の獲得に要する作業者の手間を大幅に削減することができる。事例獲得手段としては、実行プログラム形式の外部システムを自動起動し、該外部システムの出力値を条件属性値に変換して獲得すること等が挙げられる。こうであれば、例えば本エキスパートシステム生成装置が動作しているコンピュータ上にネットワークによって外部にアクセスするためのプログラムが存在する場合には、そのシステムを介してネットワークで結合された別の機器の外部プログラムの制御し、事例を獲得することができる。
【0185】
ルール生成手段がルールを決定木の形式で生成する場合において、専門家が経験として得る情報を事例として集積し、互いに同じ知識要素を含む多重知識構造や、知識を構成している知識要素が別の知識の上位概念や下位概念であるような階層知識構造や、該多重知識構造の一つの特別な知識構造であり、多くの異なる観点からの知識の集合体である複数視点知識構造を有する知識を決定木として抽出することも好ましい。
【0186】
こうであれば、多重知識構造や、階層知識構造や、複数視点知識構造を有する知識を決定木として抽出することが可能であるため、知識要素をいろいろな側面から多層的に把握することが容易となり、より的確な決定木を生成させることが可能となる。
【0187】
この場合において、ルール生成手段は、目的に応じた決定木を生成することを可能とするために、以下のように構成されていることが好ましい。すなわち(1)事例の各属性項目に対して、条件属性か結論属性かを任意に選択できること。(2)特定の結論属性に対応する決定木のみを生成すること。
【0188】
また、ルール生成手段は、事例が集積された事例ベースに対して複数の結論属性項目を持つことを可能とし、各結論属性に対応する決定木を比較するためのユーザーインターフェースを備えることができる。こうであれば、複数の結論属性項目のうちの重要な結論属性が何であるかの判断が容易となる。
【0189】
さらに、ルール生成手段は、生成された決定木の結論属性値に、別の決定木を結合させる展開連接が可能とされていることもできる。こうであれば、因果関係について更なる因果関係の展開が可能となり、因果関係の分析を発展させることが可能となるである。
【0190】
また、ルール生成手段は、生成された決定木の条件属性項目に対して、該条件属性項目の全属性値を結論属性値として持つ別の決定木を結合させる詳細連接が可能とされていることもできる。こうであれば、任意の条件属性値について、さらに詳しい決定木を生成することができるため、因果関係についてさらに詳細な因果関係を求めることが可能となる。
【0191】
さらに、ルール生成手段は、結論属性値が数値型である場合において、該結論属性値を回帰直線で近似し、近似残差を結論属性の幅として求めることもできる。こうであれば、結論属性の数値を数値範囲として統計的に分割し、決定木の結論としたルールを構成できるため、事例として観測されていない結論値の範囲を推定することが可能となる。
【0192】
本発明のエキスパートシステム生成装置を用いて、本発明のエキスパートシステム生成装置の実施方法を実施することができる。
【0193】
さらに、このエキスパートシステム生成装置の実施方法では、ルール化された専門家の知識により、該専門家の行為を自動化することもできる。こうであれば、工業、鉱業、農業、林業、水産業、運輸業、医療産業、金融産業、商業、その他あらゆる産業における専門家の知識を吸収し、利用することができる。例えば、ルール化された専門家の知識により、人の作業を支援したり、人を教育したりすることができる。
【0194】
専門家は、産業プロセスに関する専門家とすることができる。こうであれば、産業プロセスに関する専門家の知識を資産とし、産業プロセスの自動運転をしたり、産業プロセスの運転者の支援をしたり、産業プロセスの運転者の教育を行うこと等に用いることができる。ここで産業プロセスとしては、精留塔を利用した精製プラント等の石油化学プラント、ロボット、鉄鋼生産現場、窯業製品生産現場、発電所、医療現場、その他あらゆる産業現場における装置・機械等が対象とされる。精留塔を利用した精製プラントは、従来熟練した専門家が精留塔内の温度、沸騰時に発生する音、精留塔に設けられた観察窓から観察される泡の状況等を元に、長年の経験と勘に基づいてオペレートされており、こうした精製プラントに本発明のエキスパートシステム生成装置の実施方法を用いれば、熟練した専門家と同等の制御が可能となり好適である。
【0195】
産業プロセスが精留塔を利用した精製プラントである場合において、精製プラントからの事例の獲得は、精留塔に設けられた温度センサ、圧力センサ、流量センサ、サウンドセンサ、画像センサの少なくとも一つを介してなされることができる。こうであれば、精留塔を利用した精製プラントの制御を行うために重要な属性及び属性値となる、精留塔のいろいろな位置における温度、圧力、流量、沸騰時に発生する音、沸騰時に発生する泡の状況を自動的に事例として取り込むことが可能となる。また、事例獲得手段における事例の獲得方法として、すでに計装されているデータ取得のための装置と事例獲得手段とをダイレクトにつなげることもできる。こうであれば、産業プロセスにおいて設置されているデータ取得のための装置に記録された過去のデータを有効に利用することができる。
【0196】
<実施形態の説明>
以下、本実施形態のエキスパートシステム生成装置及びその実施方法を具体化した実施形態について図面を参照しつつ説明する。
【0197】
実施形態のエキスパートシステム生成装置は、図61に示すように、事例獲得手段10とルール生成手段20とコンサルティング手段30とを備えている。事例獲得手段10には、事例獲得の対象となる外部システムで観測される事例を獲得するための、事例獲得インターフェース10aが内蔵されている。外部システムはエキスパートシステムの構築対象である。外部システムに設けられた各種センサ等から送られる各種事例に関するデータは、事例獲得インターフェース10aを介して各データの属性と属性値とからなる事例としてデータファイルに自動的に格納され、事例ベースを形成するようになっている。また、事例獲得手段10は、キーボードからデータを直接入力することも可能とされており、さらには、事例獲得インターフェース10aを介して制御装置の記憶部に直接アクセスし、記録された各種運転データを外部システムのシーケンサーを制御することで事例(状況とそれに付随する結果)として自動的に獲得することや、指定された書式のテキストファイルから事例を読み込むことも可能とされている。
【0198】
ルール生成手段20は、生成準備ブロック21と、ツリー生成ブロック22と、ツリーチェックブロック23とから構成されている。ルール生成手段20は、蓄積された状況と結果とを自動学習し、該状況から該結果が生じる統計的な傾向を知識として導く。生成準備ブロック21は、事例から決定木を生成することができるか否かのチェック(例えば事例に結論属性(以下「ターゲットエレメント」という)がない場合や、事例が1件もない場合等)を行ったり、数値型の結論属性値(以下「ターゲットエレメントバリュー」という)における境界値を、回帰直線を利用して決定したりする。
【0199】
また、ツリー生成ブロック22では、図62に示すように、ID3に関連するブロック関数に関する部分と、決定木の枝生成に関するブロック関数に関する部分とからなり、生成準備ブロック21によって作成されたデータに基づき、決定木生成のための演算処理を行う。ID3に関連するブロック関数は、数値型2値化ブロック関数と、情報量計算ブロック化関数とからなる。数値型2値化ブロック関数は、2数値型あるいは日付型のエレメントバリューを2値化し、2値化したエレメントバリューを2つクラスタに分ける。また、情報量計算ブロック化関数は、各エレメントの情報量や情報エントロピー等、情報量に関する計算を行う。
【0200】
さらに、ツリーチェックブロック23では、図63に示すように、重複したターゲットエレメントバリューの有無等、ツリー生成ブロック22によって生成された決定木に関するチェックを行う。
【0201】
また、コンサルティング手段30は、図64に示すように、コンサル準備ブロック31と、コンサルブロック32と、出力ブロック33とから構成されている。コンサルティング手段30は、導かれた統計的な傾向から、観測されるある状況に対する結果を自動判断する。
【0202】
コンサル準備ブロック31は、コンサルティングに必要な情報(決定木にトレースするデータ、詳細連接や展開連接等に関する情報、後述するフィックスターゲット事例に関する情報等)を取得するためのブロックである。また、コンサルブロック32は、コンサルデータを決定木にトレースしてコンサルティングを行うためのブロックである。さらに、出力ブロック33は、コンサルブロック32によってコンサルティングを行った結果を出力するためのブロックであり、コンサルティングで得られたターゲットエレメントとその値、トレースを失敗した以降の条件分岐のエレメント情報の出力、及びトレース結果の出
力を行う。
【0203】
エキスパートシステム生成装置は、事例獲得手段とルール生成手段と該コンサルティング手段とを単独で動作させたり、相互に連携させたりすることによって該状況と該結果を更新し、より妥当な知識へと自動的に更新する。
【0204】
これら事例獲得手段10、ルール生成手段20及びコンサルティング手段30が大規模言語モデルにより構成されている。また、エキスパートシステム生成装置が事例に基づいて生成するエキスパートシステムも大規模言語モデルで実現できる。
【0205】
<フローチャート>
以上のように構成されたエキスパートシステム生成装置は、以下のような手順で決定木が生成され、さらにその決定木に基づいてコンサルティングが行われる。
(決定木の生成)
決定木の生成は、図65に示すフローチャートに従って行われる。すなわち、ステップS000として、事例獲得手段10によって外部システムから獲得された事例に基づき、例外フラグのチェックを行い、例外事例を除いた事例をメモリに登録する。次に、ステップS100として、事例が存在するか否か、及び、事例が全部例外事例(ここで例外事例とは、生成されたルールに基づくターゲットエレメントバリューの値にかかわらず、例外的に決まったターゲットエレメントバリューの値を採用する事例をいう)となるか否かについてチェックされ、決定木の生成が可能かどうか判断される。その結果、決定木の生成が不可であると判断された場合には、そこで処理が終了される。一方、決定木の生成が可能であると判断された場合には、ステップS200として、ターゲットエレメントが数値ターゲットの場合において数値ターゲットの範囲を取得する。すなわち、各事例における条件属性値(以下「エレメントバリュー」という)とターゲットエレメントバリューに関して単回帰分析を行い、回帰直線を求める。そして、得られた回帰直線を用い、各ターゲットエレメントバリューと回帰値の差の比を求め、その比から境界値を求める。
【0206】
そして、さらにステップS300として、決定木が生成される。ステップS300をさらに詳細に示したのが図66である。すなわち、まずステップS301で既に決定木が存在するか否かをチェックし、存在する場合にはステップS302として決定木における全てのノードが削除され、存在しない場合には、ターゲットエレメントのテーマ名、ターゲット等のツリー情報がツリーデータベースに登録される。そして、次にステップS304として、先頭ノードがツリーデータベースに登録された後、ステップS305として、ID3による計算がなされる。
【0207】
ステップS305におけるID3による計算をさらに詳細に示したフローチャートが図67である。まずステップS3051として、情報量の計算を行うための前処理を行う。具体的には、図68に示すように、事例データが論理型(すなわち数値型または日付型のどちらか)か論理型でないかを判断し、論理型でない場合にはステップS30511として2値化を行う。ステップS30511をさらに詳細に示したフローチャートが図69である。すなわち、まずステップS305111として各エレメントバリューをカウントし、さらにステップS305112として期待値を計算する。そして、期待値が所定の値以下である場合にはフィッシャーの検定を行い(ステップS305113)、期待値が所定の値を超えていればカイ2乗検定を行う(ステップS305114)。その結果、2値化できた場合にはその境界値を取得し(ステップS305115)、さらに別のエレメントバリューについてステップS30511から上記の処理を繰り返す。また、2値化できなかった場合は、境界値を取得することなくさらに別のエレメントバリューについてステップS30511から上記の処理を繰り返す。こうして(事例数-1)回だけ処理を繰り返した後、S305116として求められた境界値からクラスタを作成する。そして、図68に示すように、ステップS30512として事例におけるエレメントバリュー毎にエレメントバリューの数とターゲットエレメントバリューの数とをカウントする。この場合において、エレメントバリュー値に不明なバリュー値が存在する場合、該不明バリュー値はカウントしない。エレメントバリューの値が数値型あるいは日付型の場合には、バリュー毎にカウントする。
【0208】
そして、図67に示すように、ステップS3052として、各エレメントから情報エレメントを求め、これをエレメントの数だけループさせることにより、全体の集合エントロピーを求め、情報量を求める。さらに、ステップS3053として、最も情報量の多いエレメントの取得をエレメント数だけ繰り返す。そして、ステップS3054としてエレメントとエレメントバリューとを登録する。さらに、ステップS3055として枝の剪定についてのフラグがオン状態であり、かつ先頭からのノード数が、指定された剪定ノード数と一致している場合には、ターゲットエレメントとターゲットエレメントバリューとを登録する。すなわち、ステップS3055では、図70に示すように、まずステップS30551として、予め値が定められているターゲットエレメント(以下「フィックスターゲットエレメント」という)の値と同じかどうかについて判断し、同じでない場合にはステップS30552として値が存在するか否かについて判断を行う。そして、値が存在する場合にはステップS30553として、一致する事例のターゲットバリューを取得する操作をその事例の数だけ繰り返す。また、ステップS30551として、フィックスターゲットエレメントの値と同じ場合には、値が存在するか否かについて判断を行う。そして、値が存在する場合にはステップS30553として、一致する事例のターゲットバリューを取得する操作をその事例の数だけ繰り返す。こうしてフィックスターゲットバリューを取得してステップS3055を終了する。一方、ステップS30552で値が存在しない場合にはステップS30553及びステップ30554を行うことなくステップS3055を終了する。
【0209】
一方、図67における枝の剪定についてのフラグがオン状態であり、かつ先頭からのノード数が、指定された剪定ノード数と一致しているという条件を一つでも満たしていない場合には、図67に示すように、ステップS3056においてターゲット到達判断を行う。すなわち、このステップS3056では、図71に示すように、エレメントバリューのエントロピーがゼロであり、かつすべてのエレメントの情報量がゼロまたはエレメントバリュー数が1以下の場合は、前の枝でターゲットに到達する。また、エレメントバリューのエントロピーがゼロであり、すべてのエレメントの情報量がゼロまたはエレメントバリュー数が1以下以外の場合には、ターゲットに到達する。
【0210】
一方、エレメントバリューのエントロピーがゼロでなければ、ステップS30561として、情報量でのターゲット到達判断がなされる。すなわち、ステップS30561では、図72に示すように、最も情報量の多いエレメントであり、かつエレメントの情報量がゼロ以下の場合には、前の枝でターゲットに到達する。また、最も情報量の多いエレメント以外の場合には、エレメントの情報量がゼロより大きいか否かが判断され、エレメントの情報量がゼロより大きい場合には、次の条件エレメントが探索され、そうでない場合にはターゲットに到達する。
【0211】
そして、図67に示すステップS3056においてターゲット到達判断の結果、到達しなかった場合には、ステップS3057として、前エレメントのエレメントバリュー毎に残りのエレメントに対する事例の再構築が行われ、さらにステップS3058として、ID3に基づく計算が行われる。
【0212】
こうして図65に示すステップS300において決定木が作成された後、ステップS400でターゲットバリューのチェックが行われる。すなわち、図73に示すように、まずステップS401においてノードのターゲットバリュー数を取得する。そして、ターゲットバリュー数が2つ以上ある場合には、ステップS402として複数ターゲットバリューの処理を行う。ステップS402をさらに詳細に示したフローチャートが図74である。すなわち、(1)複数のターゲットバリューをそのまま表示するか、(2)バリューは無効としてターゲットバリューノードを削除するか、(3)決定木の生成を中止するか、(4)ターゲットバリューを強制的に決定するかの選択を行う。
【0213】
また、ターゲットバリュー数が0(すなわちターゲットバリューが不明)の場合には、ステップS403として、ターゲットバリューなしの処理を行う。すなわち、図75に示すように、(1)ターゲットバリューは無効として無視するか、(2)決定木の生成を中止するか、(3)不明なターゲットバリューに到達するまでにツリー上に現れるエレメントに基づいて不足事例を生成するか、(4)ターゲットバリューをバリュー選択リクエスタにより強制的に割り当てるかの選択を行う。
【0214】
最後に、図65に示すステップS500として、例外化の処理に対して生成対象となったものだけビットをたてて、決定木の生成が終了する。
【0215】
(コンサルティング)
上記のようにして生成された決定木に基づき、図76に示すフローチャートに従って、コンサルティングが行われる。すなわち、まずステップS600でコンサルティングの対象となる事例ファイル、コンサルティングの環境設定ファイル(外部より自動でエレメントバリューを取得するか、手動取得するか、トレースしていない残エレメントを出力するか、再度スタイルを生成するかの選択情報が登録されているファイル)及び履歴ファイル(ツリーをトレースする過程において既にトレース済みのエレメントを記録するファイル)を読み込む。次に、ステップS700として、決定木のトレースを行う。ステップS700では、図77に示すように、ツリーのノードがエレメントの場合には、ステップS701としてエレメントバリューをトレースし、ツリーのノードがターゲットエレメントの場合にはS702としてターゲットエレメントバリューをトレースする。
【0216】
ステップS701におけるエレメントバリューのトレースは、図78に示すフローチャートに従って行われる。すなわち、まずステップS7011として、ステップS600で呼び込まれた履歴ファイルからバリューを取得可能か否かが判断され、バリュー取得が可能な場合には、ステップS7012としてログをとり、ツリーをトレースする。一方、バリュー取得ができない場合は、詳細連接のフラグの有無を判断し、詳細連接のフラグがあれば、ステップS7013として詳細連接に関するツリーをトレースする。一方、詳細連接のフラグがない場合には、外部プログラムによる取得を行うか否かを判断し、行う場合には外部プログラムからバリューを取得し、ステップS7012としてログをとり、ツリーをトレースする。また、外部プログラムからのバリューの取得をしない場合は、(1)標準偏差をとってバリューを取得した後ターゲットエレメントバリューをトレースする、(2)手動入力によりバリューを入力してツリーをトレースする、(3)残りのエレメントを取得してファイルに出力する、(4)再度ツリーを再構築する、のいずれかを選択して行う。
【0217】
また、S702におけるターゲットエレメントバリューのトレースは、図79に示すように、S7021としてフィックス事例とコンサル過程(ツリーをトレースする途中で通る条件属性)とを比較し、さらに展開連接の有無を判断し、展開連接がなければ、ステップS7022として、得られたターゲットエレメントバリューに基づいて外部プログラムを起動する。また、展開連接があれば、ステップS7023として、それに基づくツリーをトレースする。こうしてコンサルティングが終了する。
【0218】
以下、このエキスパートシステム生成装置を用いて決定木を生成し、コンサルティングを行った場合について、さらに具体的に説明する。
【0219】
<事例獲得工程S_1>
まず、事例獲得工程S_1として、エキスパートシステムで行おうとするテーマを決定し、そのテーマに関して使用され得るエレメント(条件属性)と、エレメントバリュー(条件属性値)とを登録する。さらに、ターゲットエレメント(結論属性)とターゲットエレメントバリュー(結論属性値)とを登録する。登録は外部システムに設けられた各種センサから、図61に示す事例獲得インターフェース10aを介して自動的に行うことができる。また、キーボードからデータを直接入力することも可能であり、事例ベースがテキストファイル形式であれば、呼び込みが可能である。さらには、事例獲得インターフェース10aを介して制御装置の記憶部に直接アクセスし、記録された各種運転データを事例として自動的に獲得することも可能である。こうして登録された事例は、図80に示すように、事例編集パネルとしてコンピュータの画面に表示されると共に、コンピュータ内にファイルされる。また、登録されたエレメントやターゲットエレメントの追加や削除は、自由に行うことができる。さらに、エレメント、エレメントバリュー、ターゲットエレメント及びターゲットエレメントバリューの組み合わせからなる「事例」の追加や削除も自由に行うことができる。また、エレメントとターゲットエレメントの入れ替えを自由に行うことができる。さらに、条件から明らかにターゲットエレメントバリューが間違っていると判断される場合や、任意の条件においてターゲットエレメントバリューが決まっている場合には、フィックスターゲットエレメントバリューとして、固定された値を登録することもできる(。また、事例編集パネルにおいて例外にしたい事例を選択し、編集メニューの「例外にする」をクリックすることにより、任意の事例を例外処理として選択することもできる。
【0220】
<決定木生成工程S_2>
次に、コンピュータの画面に表示された事例編集パネル上で、機能メニューから決定木生成を選択することにより、全ターゲットエレメントに対応する決定木を生成する場合と、現在選択されている決定木のみ選択する場合とを選択する。機能メニューから決定木の表示を選択することにより、図81に示す決定木表示パネルが表示される。さらに、決定木表示パネル内における任意のノードをマウスで選択し、機能メニューの剪定をクリックすることにより、決定木の剪定が実施される(図82)。ここで、決定木の剪定は、対応する事例の例外化を行うことと同じ操作となる。その後、ケース編集パネルに移動させることにより、決定木を再構成した場合に不用となる事例が自動的に例外処理される。なお、剪定はエレメント間だけでなく、エレメントとターゲットエレメント間でも行うことができる。
【0221】
また、生成された決定木を解析する場合、スタイル編集パネルにおいてトップノードを例外とすることにより、それ以外の属性に基づく決定木を生成することもできる。例えば図83は、汚泥処理による焼却灰のテストピースを焼き締め、その光沢や溶解程度から、溶融グレードを決定し、これに伴い汚泥処理における各種データを収集した結果の決定木のトップノード部分である。ここで、トップノードの「焼却場」というエレメントを例外とすると、焼却場に依存しない決定木を導くことができる。その結果、図84に示すように、トップノードに「MgO」というエレメントがきて、焼却場というエレメントの要因以外に酸化マグネシウムの含有量が重要な要因とされることが分かる。
【0222】
また、決定木の生成において、決定木の大部分が同一エレメントで占められる場合は、そのエレメントはルールを特殊化するノイズである可能性が高くなる。こうした場合には、同一となったエレメントを例外として除外することにより、見逃していた重要なエレメントを発見しやすくなる。例えば、図85に示す決定木における「日付」のエレメントを例外とすることにより、図86に示すように、「SiO2」のエレメントが現れる。酸化ケイ素は、物質の融解を高める働きがあるため、溶融グレードの値に大きな影響を与えていることが推測される。この推論は、「SiO2」のエレメントを例外としたときの決定木を観察することによって、容易に判断をすることができる。こうして、推論とルール誘導を繰り返すことにより、決定木の分析を効率よく進めることができる。
【0223】
また、生成された決定木のターゲットエレメントバリューに、別の決定木を結合させる
展開連接を行う場合には、編集メニューによってターゲットエレメントバリュー選択リクエスタを表示させ、展開可能なターゲットエレメントバリュー一覧の中から展開するターゲットエレメントバリューを選択する。こうして、展開連接が完了すれば、不図示のスタイル編集パネルにおけるターゲットエレメントバリュー名の前に展開連接マークが表示される。こうして、任意のターゲットエレメントバリューについて、さらに決定木を展開生成させることができ、因果関係について更なる因果関係の展開が可能となり、因果関係の分析を発展させることが可能となる
さらに、生成された決定木のエレメントバリューに、全エレメントバリューをターゲットエレメントバリューとして持つ別の決定木を結合させる詳細連接を行う場合には、編集メニューによって属性項目選択リクエスタを表示させ、表示されたエレメントから詳細にするエレメントをクリックして選択する。こうして詳細連接が完了すれば、不図示のスタイル編集パネルにおいて、連接したエレメント名の前に詳細連接マークが表示される。こうして、任意のエレメントバリューについて、さらに詳しい決定木を生成することができるため、因果関係についてさらに詳細な因果関係を求めることが可能となる
<コンサルティング工程S_3>
決定木生成工程S_2において決定木が生成された後、事例編集パネルにおいて画面上部メニューの「スタイル-コンサルティング」を選択する(不図示)。これにより、ターゲットエレメントの選択ダイアログが表示され、ターゲットエレメントの選択が可能となる。ターゲットエレメントを選択すると、そのターゲットエレメントごとの決定木に従ったコンサルティングが開始される。コンサルティング手段30は、実行プログラム形式の外部システムを自動起動し、外部システムの出力値をエレメントバリューに変換して獲得することが可能とされている。また、コンサルティング手段30は、実行プログラム形式の外部システムを自動起動し、コンサルティング手段30によって得られたターゲットエレメントバリューを該外部システムの入力値に変換して引き渡すことが可能とされている。そして、論理型、数値型、日付型といったエレメントの型に応じた回答を選択、或いは入力していき、すべての回答を入力し終わった段階で結論としてターゲットエレメントのバリューが導出される。ここで、エレメントが論理型の場合には、入力は単なる選択を行うだけである。年齢などの数値型エレメントでも、年齢が不詳の人の場合には、「年齢不詳」として、論理型と同様の扱いをすることができる。このように、データとして不足がある場合であっても、決定木を生成し、コンサルティングをすることが可能である。
【0224】
(精留塔を利用した回収溶媒精製プラントのオペレート)
実施形態のエキスパートシステム生成装置を用いて、精留塔を利用した回収溶媒精製プラントのオペレートを行った。
【0225】
この回収溶媒プラントは、回収溶媒からテトラヒドロフラン(THF)とメチルエチルケトン(MEK)とを分離回収するためのものであり、図34に示すように、THFとMEKが混合された回収溶媒を貯留する貯留タンク11と、2基の精留塔12、13とを備えている。貯留タンク11には配管11a、11bが接続されており、配管11a、11bの他端は精留塔12,13の9段目に接続されている。精留塔12、13の下端には熱交換器12a、13aが設けられており、外部からスチームを供給することにより、精留塔12、13の下端を加熱可能とされている。また、精留塔12、13の下端には缶出管12b、13bが接続されており、精留塔12、13の下端に溜まった缶出液を取り出し可能とされている。さらに、精留塔12、13の上端には留出管12c、13cが接続されており、留出管12c、13cはコンデンサ14、15の一端側に接続されている。また、コンデンサ14、15の他端側は回収管16、17を介してキャッチャタンク16b、17bに接続されている。さらに、回収管16、17の途中からは還流管16a、17aが分岐し、缶出管12b、13bに接続され、缶出液の一部を精留塔12、13に還流可能とされている。
【0226】
この回収溶媒精製プラントの稼働状況を把握し、事例に関する情報を得るための情報発信手段として、表1に示す位置に、図示しない温度計TR1~11、流量計V1~8及び圧力計P1、P2が設置されている。
【0227】
【表1】
回収溶媒精製プラントの運転は熟練した3名のオペレータが行った。
【0228】
(事例獲得)
温度計TR1~11、流量計V1~8及び圧力計P1、P2の時間ごとの値、気温、日時を図示しない制御装置の記録部から自動獲得インターフェース1aを介して自動的に事例獲得手段10に取り込んだ。また、天気、オペレータ、計器チェックの有無等について、キーボードから事例獲得手段10に直接入力した。こうして、事例獲得手段10により、表2~表4に分割して示した事例ベースを作成した。
【0229】
【表2】
【0230】
【表3】
【0231】
【表4】
(決定木生成)
さらに、上記事例ベースに基づきルール生成手段20により、決定木を生成した。
【0232】
(コンサルティング)
さらに、こうして生成された決定木に基づき、コンサルティングを行った。
【0233】
このエキスパートシステム生成装置を回収溶媒精製プラントに適用することにより、温度計TR1~11、流量計V1~8及び圧力計P1、P2からの情報が事例獲得手段10によって自動的に事例ベースが形成され、この事例ベースからルール生成手段20によって決定木が自動的に生成することが可能となる。そして、コンサルティング手段30がこの決定木を参照してターゲットエレメントのターゲットエレメントバリューを自動的に求めることができる。このため、ルール生成手段20によって当初に生成された決定木は、事例ベースの蓄積にともなって絶えず自動的に更新されることとなり、事例学習的に、より好適な決定木に更新されていくこととなる。また、時間の経過と共に何らかの原因によって因果関係が変化した場合でも、その変化に追従して適切な決定木が生成されてゆくこととなる。このため、コンサルティング手段30により得られるターゲットエレメントバリューもより適切な値とすることができる。
【0234】
なお、上記実施形態では、温度計TR1~11、流量計V1~8及び圧力計P1、P2からの情報は制御装置の記憶部から取り込んでいるが、それらの情報を、自動獲得インターフェース1aを介してリアルタイムに事例獲得手段10に送信することもできる。
【0235】
本実施形態は、工業、鉱業、農業、林業、水産業、運輸業、医療産業、金融産業、商業、その他あらゆる産業における専門家の知識を活用することにより、あらゆる産業に利用することができる。
【0236】
[第5実施形態]
本実施形態では、文書検索システムにおいてキーワードを複数の他言語に翻訳するキーワード翻訳手段として大規模言語モデルを用いる実施形態について説明する。文書検索システムの一例として特開2012-074087(特許第4945015号)を参考に説明する。
【0237】
この本実施形態は、日本語、英語、フランス語、中国語など、さまざまな言語で書かれた文書を含む文書データベースからの検索において、ある言語でキーワードを入力した時に、入力したキーワードを翻訳エンジンによって他国語に変換し、入力したキーワードと、他国語に変換した結果のキーワードとを同時に用いて検索を行う。キーワードにスコアを付与することによってキーワード間の優先順位を付け、この優先順位を、文書の検索結果の優先順位に反映させて出力する。このようにして、多言語に対応する文書検索方式が実現される。
【0238】
以下、この本実施形態を添付図面に基づいて説明する。
<実施の形態1>
図88は、本実施形態に係る文書検索システム150の構成を示す。文書検索システム150は、キーワードを用いて文書を検索するために用いられるシステムである。
【0239】
文書検索システム150は、キーワードを用いて文書を検索する文書検索装置9を含む。
【0240】
文書検索装置9は情報処理装置であり、周知のコンピュータとしての構成を有する。 文書検索装置9は、使用者がキーワードを入力するために用いる入力装置29を備える。この入力装置29は、例えばマウスやキーボード等である。また、文書検索装置9は、検索処理の結果を使用者に対して表示する表示装置40を備える。表示装置40は、例えばディスプレイやプリンタ等である。また、文書検索装置9は、演算を行う演算装置50を備える。演算装置50は例えばCPU(中央処理装置)である。
【0241】
また、図示しないが、文書検索装置9は、情報を格納する記憶手段としてメモリ及びHDD(ハードディスクドライブ)を含む。また、文書検索装置9は、他の情報処理装置との間で情報の送受信を行うためのネットワークインターフェースを備える。
【0242】
文書検索装置9の記憶手段には、文書検索装置9及び演算装置50の動作を規定する文書検索プログラムが格納されている。演算装置50は、この文書検索プログラムを実行することによって、図88に示すキーワード受付手段51、キーワード翻訳手段52(大規模言語モデルの適用例)、キーワードスコア決定手段53、文書検索手段54、文書スコア算出手段55、及び検索結果出力手段56として機能するが、それぞれの機能の詳細については後述する。
【0243】
また、演算装置50が文書検索プログラムまたは別のプログラムを実行することによって、コンピュータである文書検索装置9は、本明細書に記載するその他の機能を実現する。
【0244】
文書検索システム150は、文書検索装置9と通信可能に接続された翻訳サービス装置110を含む。翻訳サービス装置110はキーワードの翻訳を行うものである。翻訳サービス装置110は、ある言語によって表された語句を受け取り、これを他の言語に翻訳して出力する。すなわち、入力されたキーワード(入力キーワード)に基づいて、その入力キーワードが他言語に翻訳されたキーワード(翻訳キーワード)を生成する機能を有する。なお、ここでいう「翻訳」とは、ある言語によるキーワードから別の言語によるキーワードへの変換と捉えることもできる。
【0245】
翻訳サービス装置110は複数の言語への翻訳を行うものである。例えば、日本語による入力キーワードに対して、英語による翻訳キーワードと、フランス語による翻訳キーワードとを生成して出力する。
【0246】
また、翻訳サービス装置110は、1つの入力キーワードに対して、順位を有する複数の翻訳キーワードを生成する。すなわち、ある単語に対して、例えば対応する訳語がそれぞれ用いられる頻度に応じ、最も頻繁に用いられる訳語から順に順位を付与し、翻訳キーワードのリストを生成する。このリストは、例えば翻訳キーワードを順位に従って並べることによって各翻訳キーワードの順位を表すものであるが、翻訳キーワードと順位を表す数値等とを対応付けることによって各翻訳キーワードの順位を表してもよい。
翻訳サービス装置110の構成は周知のものを用いることができる。例えば、翻訳サービス装置110は多数の語句に対してそれぞれ一つ以上の訳語を関連付ける辞書ファイルを格納しており、この辞書ファイルを参照して翻訳を行う。
【0247】
文書検索システム150は、文書検索装置9と通信可能に接続された文書データベース120を含む。文書データベース120は、文書検索装置9による検索処理の対象となる複数の文書を記憶する。
【0248】
文書データベース120は、1つ以上のキーワードの入力を受け取り、記憶している文書のうちから、キーワードのいずれかを含むものをすべて抽出し、抽出した文書またはそのリストを出力する。
【0249】
以上のように構成される文書検索システム150の動作を、図89のフローチャート及び図90図94のデータ例を用いて説明する。
【0250】
図89は、文書検索システム150における文書検索装置9の動作を説明するフローチャートである。まずキーワード受付手段51は、検索に用いる1つ以上の入力キーワードを、入力装置29を介して使用者から受け取る(ステップS1、キーワード受付ステップ)。この例では、「先生」「教師」という2つの日本語による入力キーワードが受け取られたものとする。
【0251】
次に、キーワード翻訳手段52は、翻訳サービス装置110を利用し、入力キーワードを翻訳して翻訳キーワードとする(ステップS2、キーワード翻訳ステップ)。このステップS2において、キーワード翻訳手段52は入力キーワードを翻訳サービス装置110に渡し、翻訳サービス装置110は受け取った入力キーワードのそれぞれについて翻訳キーワードを生成してキーワード翻訳手段52に返す。このようにしてキーワード翻訳手段52は翻訳キーワードを取得する。
【0252】
図90は、入力キーワードと翻訳キーワードとの対応関係の例を示す。この例では、翻訳キーワードは、図90(A)に示すように英語によるものと、図90(B)に示すようにフランス語によるものとの2種類を含んでいる。図90(A)の表において、「先生」という入力キーワードに対しては、順位1を有する「teacher」、順位2を有する「instructor」及び順位3を有する「master」という3つの英語による翻訳キーワードが対応付けられている。このように、翻訳サービス装置110は、入力キーワードのそれぞれについて、順位付けられた複数の翻訳キーワードを対応付けて記憶している。
【0253】
また、図90(B)の表において、同じく「先生」という入力キーワードに対して、順位1を有する「professeur」及び順位2を有する「instructeur」という2つのフランス語による翻訳キーワードが対応付けられている。このように、キーワード翻訳手段52は、入力キーワードの言語以外の複数の言語について、翻訳キーワードを取得する。
【0254】
なお、文書検索装置9は、入力キーワード、取得した翻訳キーワード、及び図90に示す対応関係を、表等の形式によって記憶手段に記憶してもよい。
【0255】
次に、キーワードスコア決定手段53は、入力キーワード及び翻訳キーワードのそれぞれについて、キーワードスコアを決定する(ステップS3、キーワードスコア決定ステップ)。ここで、キーワードスコア決定手段53は、図91及び図92に示す対応関係に基づいてキーワードスコアを決定する。
【0256】
図91は、翻訳キーワードの順位と、その順位に基づく翻訳スコアとの対応関係の例を示す。キーワードスコア決定手段53は、この翻訳スコアに基づいて、各翻訳キーワードのキーワードスコアを決定する。文書検索装置9は、その記憶手段に、図91に示す対応関係を表等の形式によって予め記憶しており、また、この対応関係は文書検索装置9の使用者または管理者が適宜変更することができる。
入力キーワードに対しては、常に一定である所定のスコア、例えば100が与えられる(なお、このスコアは後述するように翻訳スコアとは一部扱いが異なるので、図91ではカッコを付して示す)。また、翻訳キーワードに対しては、その順位に応じて異なる翻訳スコアが与えられる。与えられるスコアは順位が1つ下がるごとに所定値ずつ、例えば10ずつ低下し、順位1に対しては90、順位2に対しては80、順位3に対しては70となる。
【0257】
このスコアの値が大きいほど、そのキーワードを含む文書が検索結果において重視される(すなわち、検索結果においてその文書の順位が高くなる)ことを意味する。このように、キーワードスコア決定手段53は、翻訳キーワードの順位に基づいて翻訳キーワードのキーワードスコアを決定する。
【0258】
なお、この順位と翻訳スコアとの関係は、図91に示すものに限らない。順位1に対する翻訳スコアは、入力キーワードに対するキーワードスコアより低い値であればよい。また、順位2以下に対する翻訳スコアは、順位の低下につれて(すなわち、この例では順位を表す数が大きくなるにつれて)単調に減少する関数によるものであればよい。
【0259】
翻訳サービス装置110は、一般的に訳語として用いられる頻度に応じて翻訳キーワードの順位付けを行う。ここで、構文や文脈等の情報を考慮しない場合、ある語句に対して辞書等に記載される複数の訳語のうち、実際に訳語として用いられる頻度が大きい訳語は、より適切な訳語ということができる。より適切な訳語を含む文書は、そうでない訳語のみを含む文書よりも、使用者が望むものである可能性が高い。すなわち、順位がより高い翻訳キーワードは、より確からしいキーワードということができる。キーワードスコア決定手段53は、各翻訳キーワードの順位に基づいて翻訳スコアを決定するので、より確からしい翻訳キーワードの翻訳スコアをより高くすることができ、より的確な検索結果を得ることができる。
【0260】
なお、翻訳サービス装置110は、各キーワードについて、厳密に統計的な分析によって使用頻度に応じた順位付けを行うものである必要はない。一般的な辞書等は、通常、訳語の使用頻度等をある程度考慮してその掲載順を決定しているので、一般的な辞書として周知のものを用いれば、検索結果の精度向上にある程度の効果を得ることができる。
【0261】
図92は、各キーワードについての、順位に基づく翻訳スコアと、最終的に各キーワードに対して与えられるキーワードスコアとの対応関係の例を示す。
【0262】
キーワードスコア決定手段53は、入力キーワードに対しては、上記のように、常に100というキーワードスコアを与える。翻訳キーワードに対しては、まず、入力キーワードのそれぞれと、翻訳キーワードのそれぞれとのすべての組合せについて、順位に基づいて翻訳スコアを決定する。図92では、2つの入力キーワードと、5つの翻訳キーワードとの組合せ(合計10通り)のすべてについて、順位に基づく翻訳スコアが与えられている。
【0263】
例えば、図90(A)に示すように、翻訳キーワード「master」は、入力キーワード「先生」に対しては順位3を有するので、図91において順位3に対応する翻訳スコア70が与えられる。また、この翻訳キーワード「master」は、入力キーワード「教師」に対しては順位2を有するので、図91において順位2に対応する翻訳スコア80が与えられる。なお、ある翻訳キーワードがいずれかの入力キーワードに対して順位を有しない場合、すなわちその翻訳キーワードがその入力キーワードを翻訳したものでない場合には、その組合せに対する翻訳スコアは0とする。ただし、この場合の翻訳スコアは0でなくともよく、その入力キーワードに対応する他の翻訳キーワードの翻訳スコアのいずれよりも小さい値であればよい。
【0264】
このようにして決定された翻訳スコアに基づき、さらにキーワードスコア決定手段53は、翻訳キーワードのそれぞれについて最終的なキーワードスコアを決定する。図92の例では、その翻訳キーワードに与えられた翻訳スコアの平均をもって、その翻訳キーワードのキーワードスコアとしている。
【0265】
このように、キーワードスコア決定手段53は、翻訳キーワードのそれぞれについて、関連する翻訳スコアのすべてに基づいてキーワードスコアを決定する。
【0266】
なお、文書検索装置9は、その記憶手段に、図92に示す対応関係を、表等の形式によって記憶してもよい。
【0267】
ここで、入力キーワードに与えられるキーワードスコアは、上記のように常に100である。また、翻訳スコアはすべて90以下(すなわち、順位1に対する翻訳スコア以下)であるので、その平均をとったキーワードスコア(翻訳キーワードのキーワードスコア)は、常に90以下となる。従って、母語による入力キーワードに与えられるキーワードスコアは、他言語による翻訳キーワードに与えられるキーワードスコアのいずれよりも高い値となる。
【0268】
母語による入力キーワードは、誤訳や不適切な訳のおそれがないので、入力キーワードを含む文書は、翻訳キーワードのみを含む文書よりも、使用者が望むものである可能性が高い。すなわち、入力キーワードはより確からしいキーワードということができる。このように、より確からしい入力キーワードのスコアを高く設定して重視し、相対的に翻訳キーワードのスコアを低く設定することによって、より的確な検索結果を得ることができる。
【0269】
また、この例における翻訳キーワード「master」のように、ある翻訳キーワードが複数の入力キーワードに対応する場合、その翻訳キーワードを含む文書は、他の翻訳キーワードのみを含む文書よりも、使用者が望むものである可能性が高い。すなわち、そのような翻訳キーワードはより確からしいキーワードということができる。
【0270】
ここで、キーワードスコア決定手段53は、ある翻訳キーワードに関連する翻訳スコアのすべてに基づいてキーワードスコアを決定することにより、複数の入力キーワードに同時に対応している翻訳キーワードのキーワードスコアを上昇させることができる。例えば、図92の翻訳キーワード「master」は、入力キーワード「先生」「教師」両方に対応するものであり、それぞれに対応して0でない翻訳スコアを有する。ところが、翻訳キーワード「instructor」は、入力キーワード「先生」には対応するが「教師」には対応せず、「教師」に対する翻訳スコアは0となる。この結果、翻訳キーワード「master」のキーワードスコアがより高くなる。このように、より確からしい翻訳キーワードのスコアを高く設定して重視し、相対的に翻訳キーワードのスコアを低く設定することによって、より的確な検索結果を得ることができる。
【0271】
次に、文書検索手段54は、文書検索システム150を利用して、入力キーワード及び翻訳キーワードに基づいて文書を検索し、複数の検索結果文書を取得する(ステップS4、文書検索ステップ)。このステップS4において、文書検索手段54は、入力キーワード及び翻訳キーワードを文書データベース120に渡し、文書データベース120は、記憶している文書のうちから、入力キーワード及び翻訳キーワードのいずれかを含むものをすべて抽出し、抽出した文書を検索結果文書として文書検索手段54に返す。
【0272】
ここで、文書検索手段54は、母語による入力キーワードと、他言語による翻訳キーワードとを用いて検索を行うので、複数の言語による文書を含む文書データベース120からの検索でも、一度の検索で結果を得ることができる。
【0273】
なお、ステップS4において取得される検索結果文書は、その文書の本文データを識別する情報(タイトル、日時、作成者等)を含むものであるが、必ずしもその本文データを含まないものであってもよい。検索結果文書が本文データを含まない場合には、本文データそのものは使用者による別途の要求に応じて文書データベース120から出力されるものであってもよい。
【0274】
また、検索結果文書のそれぞれには、その本文データ中に各キーワードが出現する回数を表す情報が関連付けられる。
【0275】
図93はこのような情報の例を示す。この例では、検索結果文書として文書A~文書Jが抽出されている。例えば文書Aには翻訳キーワード「teacher」が12回、翻訳キーワード「instructor」が10回、翻訳キーワード「master」が6回、それぞれ出現しており、文書Aについて全キーワードの出現回数を合計すると28回となることが表される。文書データベース120は、このように、検索結果文書のそれぞれについて、各入力キーワード及び各翻訳キーワードが出現する回数を計測し、これを検索結果文書のそれぞれに関連付けて文書検索手段54に返す。なお、図93では、検索結果文書は各キーワードが出現する回数の順にソートされている。
【0276】
なお、文書検索装置9は、その記憶手段に、図93に示す対応関係を、表等の形式によって記憶してもよい。
【0277】
なお、図93の例ではキーワードが出現する回数を用いているが、この代わりにキーワードが出現する回数に文字認識による認識率を加味したものを用いてもよい。
【0278】
文書中の文字列が文字コードによって表される文書(テキストデータやワードプロセッサプログラム用のデータ等)では、文字コードの照合処理を用いてキーワードの出現回数を正確に数えることができる。これに対し、文字列が画像データによって表される文書の場合には、文字認識処理を行って画像を文字コードに変換する必要があるが、この文字認識処理の精度が高いとは限らない。そこで、文字認識処理の際に、その文書について所定の基準で文字認識を行うことができた度合を認識率として評価し、この認識率を加味してもよい。例えば、認識率に応じてキーワードの出現回数を表す値を減少させてもよい。具体的には、認識率が100%である文書についてはキーワードの出現回数をそのまま用い、認識率が50%である文書についてはキーワードの出現回数を半分にして用いることができる。
【0279】
ここで、認識率の算出方法は従来の文字認識処理において周知の方法であればどのようなものを用いてもよい。
【0280】
次に、文書スコア算出手段55は、検索結果文書のそれぞれについて、キーワードスコア決定手段53によって決定されたキーワードスコア(図92参照)と、入力キーワード及び翻訳キーワードのそれぞれが出現する回数(図93参照)とに基づき、文書スコアを算出する(ステップS5、文書スコア算出ステップ)。
【0281】
このステップS5において、文書スコアは、例えば、各キーワードのキーワードスコアと、そのキーワードがその検索結果文書に出現する回数とを乗算し、これをすべてのキーワードについて合計することによって算出される。この文書スコアは、その検索結果文書が、使用者が望むものである可能性(確からしさ)を表すものということができる。
【0282】
図94はこの算出方法による算出結果の例を示す。文書Aには、キーワードスコア90を持つ翻訳キーワード「teacher」が12回出現しており、乗算の結果は90×12=1080となる。同様にして、翻訳キーワード「instructor」に対する乗算の結果は400となり、翻訳キーワード「master」に対する乗算の結果は450となる。また、これ以外の入力キーワード及び翻訳キーワードは文書Aには出現しておらず、乗算の結果は0となる。文書Aの文書スコアは、これらの値をすべて合計した値すなわち1930となる。
【0283】
なお、文書検索装置9は、その記憶手段に、図94に示す対応関係を、表等の形式によって記憶してもよい。
【0284】
なお、文字列が画像データによって表される文書については、文書スコア算出手段55は、キーワードスコア及び出現回数に加え、さらに検索結果文書に対する文字認識処理における認識率に基づいて文書スコアを算出してもよい。
【0285】
ここで、キーワードスコアはキーワードごとに異なる値なので、キーワードの出現回数が多い文書の文書スコアが必ずしも高くなるとは限らない。例えば、検索結果文書のうちキーワードの出現回数が最も多いものは文書A(28回、図93参照)であるが、文書スコアが最も高いものは文書C(2500、図94参照)であり、これらの順位が入れ替わっている。この理由は、文書Cに出現するキーワードはすべて入力キーワードであるためキーワードごとのキーワードスコアが比較的高く、逆に文書Aに出現するキーワードはすべて翻訳キーワードであるためキーワードごとのキーワードスコアが比較的低くなるためである。また、各翻訳キーワード間でもキーワードスコアが異なるので、より確からしい翻訳キーワードが重視される。
【0286】
このように、文書スコア算出手段55は、各検索結果文書の文書スコアを算出する際に各キーワードの質まで考慮するので、単にキーワードの出現回数によって文書スコアを算出するような方法と比較して、より的確な評価を行うことができる。
【0287】
次に、検索結果出力手段56は、検索結果文書(すなわち文書A~文書J)と、それぞれについて文書スコア算出手段55によって算出された文書スコアとを関連付けて出力する(ステップS6、検索結果出力ステップ)。この出力は、表示装置40を介して、使用者に対して行われ、これによって使用者は検索結果を知ることができる。この際、検索結果出力手段56は、文書スコアが高いものから順に検索結果文書に順位を付け、この順位に従って出力を行う。
【0288】
以上説明するように、実施の形態1に係る文書検索装置9、文書検索装置9が実行する文書検索方法、及び文書検索システム150は、入力されたキーワード及び翻訳されたキーワードのそれぞれについてキーワードスコアを決定し、このキーワードスコアに基づいて文書スコアを算出するので、検索結果として出力された文書の優先順位を適切に決定することができる。
【0289】
上記の実施の形態1では、入力キーワードを表す言語は日本語であり、翻訳キーワードを表す言語は英語及びフランス語であるが、これらは他の言語であってもよく、例えば中国語を含んでもよい。入力キーワードを表す言語は使用者が用いる言語に合わせて設定してもよく、翻訳キーワードを表す他言語は文書データベース120に含まれる文書の言語に合わせて設定してもよい。
【0290】
翻訳キーワードを表す言語は単一の言語(例えば英語のみ)であってもよい。また、翻訳サービス装置110は入力キーワードに対して単一の翻訳キーワードを出力するものであってもよく、また、複数の翻訳キーワードを順位付けずに出力するものであってもよい。このような構成であっても、入力キーワードと翻訳キーワードとの間でキーワードスコアが異なるものであれば、従来の検索よりも的確な結果を得ることができる。
【0291】
また、実施の形態1の例ではOR検索(論理和検索)が実行されており、複数の入力キーワード及び複数の翻訳キーワードのうちいずれか一つが出現する文書はすべて検索結果文書として取得される。これとは異なり、AND検索(論理積検索)を実行することもできる。
【0292】
この場合、図89のステップS4において、文書検索手段54は、入力キーワード及び翻訳キーワードを文書データベース120に渡し、AND検索を行うことを指示する。文書データベース120は、記憶している文書のうちから、次の条件i及びiiを満たす文書をすべて抽出し、抽出した文書を検索結果文書として文書検索手段54に返す。
【0293】
‐条件i:入力キーワード「先生」について、その入力キーワード自体及びこれに対応する翻訳キーワード「teacher」、「instructor」、「master」、「professeur」、「instructeur」のうち少なくとも一つが出現する
‐条件ii:入力キーワード「教師」について、その入力キーワード自体及びこれに対応する翻訳キーワード「teacher」、「master」、「professeur」のうち少なくとも一つが出現する。
【0294】
言い換えると、文書検索手段54及び文書データベース120は、入力キーワードのそれぞれについて、当該入力キーワード及びこれに対応する翻訳キーワードをOR条件によって連結することによって、入力キーワードごとのキーワードグループを作成し、このキーワードグループをすべてAND条件によって連結して最終的な検索条件を作成する。
【0295】
この条件による検索の結果として、例えば実施の形態1において検索結果文書として図93に示される文書のうち、文書Hは、入力キーワード「教師」もこれに対応する翻訳キーワード「teacher」、「master」、「professeur」も含まないので、条件iiを満たさず、抽出されない。また、文書Jも同様に条件iiを満たさず、抽出されない。
【0296】
なお、この例では、翻訳キーワード「teacher」、「master」及び「professeur」は、2つの入力キーワード「先生」「教師」のどちらにも対応する翻訳キーワードとなっているので、これらの翻訳キーワードのいずれかが出現する文書は抽出されることになる。例えば文書Eは翻訳キーワード「teacher」は含み、この翻訳キーワードは条件i及び条件iiの両方を満たすので、文書Eは抽出される。
【0297】
このようなAND検索の場合でも、ステップS5以降の処理はOR検索と同様に行うことができる。すなわち、実施の形態1と同様にして文書スコアが算出され検索結果が出力される。ただし、この例では文書H及び文書JはステップS4において抽出されないので、ステップS5以降の処理は文書H及び文書Jに対しては実行されない。
【0298】
また、実施の形態1では文書検索手段54による検索の際に必ず翻訳キーワードを用いる検索が行われるが、これは切り替え可能であってもよく、例えば翻訳キーワードを用いず入力キーワードのみを用いて検索を行うことを使用者が適宜指定可能であってもよい。このようにすると、必要に応じ、入力キーワードのみを用いた従来の文書検索と同等の処理を行うこともできる。
【0299】
文書データベース120は、検索対象となる文書のそれぞれについて、その文書がどの言語で表されたものかを示す言語情報を関連付けて記憶してもよく、翻訳サービス装置110も同様に、翻訳キーワードのそれぞれについて、その翻訳キーワードがどの言語で表されたものかを示す言語情報を関連付けて記憶してもよい。この場合、入力キーワードは常に母語に相当する所定の言語によるものとして扱えばよい。
【0300】
例えば、日本語のあるキーワードを中国語に翻訳しても同一の表記(同一のキャラクターコードによって表される文字列)となる場合がある。このようなキーワードについては、日本語による文書に対しては入力キーワードのキーワードスコアを適用し、中国語による文書に対しては翻訳キーワードのキーワードスコアを適用することができる。すなわち、入力キーワード及び翻訳キーワードのうち、異なる言語で同一の表記となるキーワードについては、検索結果文書の文書スコアを算出する際に、その検索結果文書と言語情報が一致するもののキーワードスコアを用いてもよい。
【0301】
このようにすると、複数の言語で同一の表記となるキーワードが含まれていた場合であっても、各キーワードの確からしさを適切に評価することができる。
【0302】
また、実施の形態1では、検索結果文書にキーワードが出現する回数は文書データベース120が計測するが、これは他の構成要素が計測してもよい。例えば、検索結果文書の本文データが文書データベース120から文書検索装置9に渡され、文書検索装置9の文書検索手段54または文書スコア算出手段55が計測してもよい。
【0303】
翻訳サービス装置110及び文書データベース120は、キーワードの翻訳及び文書の検索に関して文書検索装置9との間で適切な情報の送受信ができるものであればどのようなものでもよいが、例えばそれぞれコンピュータによって構成されてもよく、また、それぞれの記憶手段に格納されたプログラムを実行することによって、翻訳サービス装置110及び文書データベース120としての機能を実現するものであってもよい。この場合、文書検索装置9のプログラム、翻訳サービス装置110のプログラム、及び文書データベース120のプログラムが、文書検索プログラムとして、これらのコンピュータを文書検索システム150として機能させることになる。
【0304】
実施の形態1のハードウエア構成では、単一のコンピュータである文書検索装置9にはキーワード受付手段51、キーワード翻訳手段52、キーワードスコア決定手段53、文書検索手段54、文書スコア算出手段55及び検索結果出力手段56が含まれ、これとは別に、それぞれ単一のコンピュータとして翻訳サービス装置110及び文書データベース120が設けられる。しかしながら、ハードウエア構成はこれとは異なるものであってもよい。例えば、文書検索装置9を構成するコンピュータが翻訳サービス装置110としての機能や文書データベース120としての機能を兼ね備えてもよい。
【符号の説明】
【0305】
9 文書検索装置
10 事例獲得手段
20 ルール生成手段
30 コンサルティング手段
50 演算装置
100 業務改革支援システム
110 翻訳サービス装置
120 文書データベース
151 入出力装置
152 業務プロセステンプレートデータベース
153 設計情報データベース
154 分類結果データベース
155 業務支援手段
156 業務プロセステンプレート編集手段
157 キーワード抽出手段
158 文書作成元業務プロセス判別手段
159 分類手段
160 分類カテゴリ決定手段
161 分類結果表示手段
162 課題一覧表
163 課題一覧表編集手段
164 分類カテゴリ優先順位決定手段
170 業務支援処理装置
400 データウェアハウス(DWH)・統合データベース(DB)
500 既存システム
600 チャネル
700 外部情報
1001 データベースサーバ
1003 認証サーバ
1005 ユーザ端末装置
1007 管理者端末装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
図37
図38
図39
図40
図41
図42
図43
図44
図45
図46
図47
図48
図49
図50
図51
図52
図53
図54
図55
図56
図57
図58
図59
図60
図61
図62
図63
図64
図65
図66
図67
図68
図69
図70
図71
図72
図73
図74
図75
図76
図77
図78
図79
図80
図81
図82
図83
図84
図85
図86
図87
図88
図89
図90
図91
図92
図93
図94