IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立プラントコンストラクションの特許一覧

<>
  • 特開-作業記録作成支援システム 図1
  • 特開-作業記録作成支援システム 図2
  • 特開-作業記録作成支援システム 図3
  • 特開-作業記録作成支援システム 図4
  • 特開-作業記録作成支援システム 図5
  • 特開-作業記録作成支援システム 図6
  • 特開-作業記録作成支援システム 図7
  • 特開-作業記録作成支援システム 図8
  • 特開-作業記録作成支援システム 図9
  • 特開-作業記録作成支援システム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024179646
(43)【公開日】2024-12-26
(54)【発明の名称】作業記録作成支援システム
(51)【国際特許分類】
   G10L 15/10 20060101AFI20241219BHJP
   G10L 15/06 20130101ALI20241219BHJP
【FI】
G10L15/10 500T
G10L15/10 200W
G10L15/06 300J
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2023098652
(22)【出願日】2023-06-15
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ATOK
(71)【出願人】
【識別番号】509328928
【氏名又は名称】株式会社日立プラントコンストラクション
(74)【代理人】
【識別番号】100091306
【弁理士】
【氏名又は名称】村上 友一
(74)【代理人】
【識別番号】100174609
【弁理士】
【氏名又は名称】関 博
(72)【発明者】
【氏名】王 ゴウ
(72)【発明者】
【氏名】屋代 裕一
(72)【発明者】
【氏名】前川 秀主
(72)【発明者】
【氏名】上田 力男
(72)【発明者】
【氏名】関根 晴矢
(57)【要約】
【課題】予め膨大な量の言い回しや用語を学習させておかなくとも、作業記録の自動作成に対応することのできる作業記録作成支援システムを提供する。
【解決手段】音声入力装置12と、システム本体14と、出力手段30とを有し、システム本体14は少なくとも、音声データを文字データに変換する音声認識装置20と、文字データ中に含まれるフィラー言語や同音異義語、現場特有語、発話者の発話における癖を抽出し、適正な用語に変換、削除する数文字処理装置24と、文字データから固有表現と言われる現場用語を抽出し、予め登録された文章構造に基づいて会話の要旨を作成する自然言語処理装置26と、を備えることを特徴とする。
【選択図】図1
【特許請求の範囲】
【請求項1】
現場作業に応じて作成される作業記録の作成を簡易化するための支援システムであって、
作業者の発話音声を取得する音声入力装置と、
前記音声入力装置を介して取得された音声データに基づいて作業記録を自動で仮作成するシステム本体と、
仮作成された前記作業記録に基づいて修正された作業記録を出力する出力手段と、を有し、
前記システム本体は少なくとも、前記音声データを文字データに変換する音声認識装置と、
前記文字データ中に含まれるフィラー言語や同音異義語、現場特有語、発話者特有の発話における癖を抽出し、適正な用語に変換、削除する数文字処理装置と、
前記数文字処理装置により変換された後の文字データから固有表現と言われる現場用語を抽出し、予め登録された文章構造に基づいて会話の要旨を作成する自然言語処理装置と、を備え、前記仮作成される作業記録には、自然言語処理装置によって作成される会話の要旨が反映されることを特徴とする作業記録作成支援システム。
【請求項2】
前記システム本体には、前記音声認識装置による文字データの作成や、数文字処理装置による文字列の検出、及び自然言語処理装置による会話要旨の作成に必要な処理ルールを定めるための編集装置が備えられていることを特徴とする請求項1に記載の作業記録作成支援システム。
【請求項3】
前記システム本体には、前記音声入力装置によって取得された音声データを単位音声データに区切った状態で前記音声認識装置に送る転送装置が備えられていることを特徴とする請求項1または2に記載の作業記録作成支援システム。
【請求項4】
前記単位音声データは、発話音声の中に生じる会話の区切り毎に形成されることを特徴とする請求項3に記載の作業記録作成支援システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、現場作業に応じて作成される作業記録の作成を簡易化する支援システムに関する。
【背景技術】
【0002】
例えばプラント建設や、定期検査などの業務を行う現場作業では、施工手順や施工品質の保証、証明の手段の1つとして実施作業に応じた作業記録が作成される。こうした作業記録は多岐に亙る上、現場監督者や作業者自身が現場作業後に作成にとりかかるため、多くの労力を要することはもちろん、多くの残業時間も要するという実状がある。
【0003】
こうした現場作業に伴う記録の作成を支援するシステムとしては、特許文献1や特許文献2に開示されているようなものが知られている。特許文献1に開示されている支援システムは、現場作業として行われる測定業務の測定結果を記録するためのものであり、測定結果をマイクロフォンを通じてユーザから音声で受付け、受け付けた音声データを記録簿に記すということを基本とするシステムである。このような構成のシステムによれば、記録簿に記す測定値の位置を指定することで測定記録が作成されるため、測定作業を単独で行う事が可能になると考えられる。しかし、測定記録に比べて、記載事項の項目が多岐に亙る作業記録では、計測数値だけではなく、作業対象の不良状態や特別の連絡事項等の必要な事項を短い言葉で記載することとなる。また、上述の必要な事項について、作業中に日常会話を交えながら、作業者が作業記録に記載することも多いため、検出された音声が記録として必要な事項であるか否か等の判定や、用語の認識が複雑化するといった実状があり、単純に利用する事は難しい。
【0004】
また、特許文献2に開示されている支援システムは、介護記録を作成する際の支援システムであり、介護者が発する介護業務に関する音声データをテキストデータに変換し、このテキストデータに基づいて介護記録を自動作成し、必要に応じて修正を加えるというものである。このような支援システムによれば、介護記録の作成は、実質的に、自動作成された内容の確認、及び修正作業だけとなり、時間、及び労力共に大幅に削減することができると考えられる。そして、音声認識できない言葉を学習させることで、介護記録の作成に対応させることが可能となる。しかし、現場により、あるいは作業等の進捗状況等により、記載事項に使用する言葉が変化したり、大量の現場用語を利用する点で介護記録の作成と異なり、かつ作業を中断して作業記録を作成することは、安全面に大きなリスクを生じさせる。また、大量の現場用語を学習させるには、経済面にも大きなコストを要するため、適用する事が難しい。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2020-187673号公報
【特許文献2】特開2020-140620号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
そこで本発明では、予め膨大な量の言い回しや用語を学習させておかなくとも、作業記録の自動作成に対応することのできる作業記録作成支援システムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記目的を達成するための本発明に係る作業記録作成支援システムは、現場作業に応じて作成される作業記録の作成を簡易化するための支援システムであって、作業者の発話音声を取得する音声入力装置と、前記音声入力装置を介して取得された音声データに基づいて作業記録を自動で仮作成するシステム本体と、仮作成された前記作業記録に基づいて修正された作業記録を出力する出力手段と、を有し、前記システム本体は少なくとも、前記音声データを文字データに変換する音声認識装置と、前記文字データ中に含まれるフィラー言語や同音異義語、現場特有語、発話者特有の発話における癖を抽出し、適正な用語に変換、削除する数文字処理装置と、前記数文字処理装置により変換された後の文字データから固有表現と言われる現場用語を抽出し、予め登録された文章構造に基づいて会話の要旨を作成する自然言語処理装置と、を備え、前記仮作成される作業記録には、自然言語処理装置によって作成される会話の要旨が反映されることを特徴とする。
【0008】
また、上記のような特徴を有する作業記録作成支援システムにおいて前記システム本体には、前記音声認識装置による文字データの作成や、数文字処理装置による文字列の検出、及び自然言語処理装置による会話要旨の作成に必要な処理ルールを定めるための編集装置が備えられているようにすると良い。このような特徴を有する事によれば、現場の状況や発話者特有の話し方などに応じて文字変換の傾向を変化させることが可能となる。
【0009】
また、上記のような特徴を有する作業記録作成支援システムにおいて前記システム本体には、前記音声入力装置によって取得された音声データを単位音声データに区切った状態で前記音声認識装置に送る転送装置が備えられていることが望ましい。このような特徴を有する事によれば、音声データから文字データへ変換する際の処理タスクの負荷を軽減することができるようになる。
【0010】
さらに、上記のような特徴を有する作業記録作成支援システムにおける前記単位音声データは、発話音声の中に生じる会話の区切り毎に形成されるようにすると良い。このような特徴を有する事によれば、時間によって自動的に区切る場合と異なり、発話中の単語が分断されてしまうといった事態が生じる事を避けることができる。
【発明の効果】
【0011】
上記のような特徴を有する作業記録作成支援システムによれば、予め膨大な量の現場用語を学習させておかなくとも、作業記録の自動作成に対応することが可能となる。
【図面の簡単な説明】
【0012】
図1】実施形態に係る作業記録作成支援システムの概略構成を示すブロック図である。
図2】作業記録作成支援システムを用いた作業記録作成の流れを説明するためのフロー図である。
図3図3に示すフロー図における文字起こしに関する流れの詳細を説明するためのフロー図である。
図4】作業記録仮作成において、文字データに数値形式が存在する場合の流れを説明するためのフロー図である。
図5】フィラー言語データベースへの登録、編集画面の一例を示す図である。
図6】同音異義語/同音異字語データベースへの登録、編集が面の一例を示す図である。
図7】数値形式の検索と取り決めを定めたデータベースへの登録、編集画面の一例を示す図である。
図8】作業現場における作業班長などの監督者と作業者の会話の様子を場面別に示した図である。
図9】作業現場における作業班長などの監督者と作業者の会話を文字起こしし、これを作業記録に記載するために変換していく様子と、作業記録の一部に記載内容を転写した状態示す図である。
図10】作業記録の一例の一部であって、記載前の状態を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明の作業記録作成支援システムに係る実施の形態について、図面を参照して詳細に説明する。なお、以下に示す実施の形態は、本発明を実施する上での好適な形態の一例であり、その効果を奏する限りにおいて、構成の一部に変更を加えたとしても、本発明の実施とみなすことができる。
【0014】
[構成]
まず、図1を参照して、作業記録作成支援システム10の実施形態に係る一例について説明する。本実施形態に係る作業記録作成支援システム10は、音声入力装置12と、システム本体14、及び出力手段30を基本として構成されている。音声入力装置12は、作業者や現場監督等の会話を音声として取得するための要素であり、マイクと、マイクを介して取得した音声を有線、あるいは無線によりシステム本体へ送信する送信手段(不図示)を備えていれば良い。
【0015】
システム本体14は、音声入力装置12を介して取得した音声に基づいて、作業記録の作成支援を行うための要素である。具体的には、収録装置16と、転送装置18、音声認識装置20、編集装置22、数文字処理装置24、自然言語処理装置26、及び出力装置28とを有する。収録装置16とは、音声入力装置12から送信された音声データを取得するための装置であり、マイクなどの音声入力装置12を用いて取得された作業者などの発話者による発話内容を一時保管する。
【0016】
転送装置18とは、収録装置16により取得された音声データを単位音声データに区切った単位音声データファイルとして音声認識装置20へ送るための要素である。単位音声データの取り決め方は任意の時間等であっても良いが、会話の区切り毎としても良い。例えば会話の音声データには一般的に、発話者の話し方などにより、単語や通達内容の前後に、0.05~0.1Sec程度の無音区間が生ずることとなる。転送装置18では、音声データから無音区間を検出することで、音声データの区切りを設けて単位音声データを作成し、音声認識装置20へ送信する。
【0017】
音声認識装置20とは、転送装置18から送られて来た音声データを文字データへと変換するための要素である。音声認識装置20における文字データの変換は、WhisperやBERT等の深層学習モデルを活用し、音声データ(単位音声データ)をそのまま文字データへと変換する技術により、ベタ打ち状態の文字データを作成するものである。転送装置18から送信された単位音声データが複数存在する場合には、記録時間(音声が収録された時間)順で処理を行い、文字データは、処理された順番で記録される。複数の会話を同時に変換する時、発話者が所有する特有番号(例えば発話者に装備されたマイクのシリアル番号)から、発話者や発話内容を仕分ける仕組みの用意もある。
【0018】
数文字処理装置24とは、音声認識装置20により作成された文字データに対する正確性(適格性)の変換処理を行うための要素である。具体的には、作成する文字データから、既に手動で誤変換を訂正した同音異義語や同音異字語を抽出して変換するという処理を行う。ここで、同音異義語や同音異字語が存在する場合には、前後の品詞や、現場用語に対する使用頻度を重み付けする事などにより、適正判定を行うようにすれば良い。また、単語として物理単位を検出した場合、事前に登録した数値形式に基づいて文字データから、数値形式を満たす数字を物理単位を含めて抽出し、作業記録の指定箇所に転写する処理を行う。
【0019】
また、自然言語処理装置26とは、数文字処理装置24により抽出された言葉や数値に基づいて、作業記録に記入する会話要旨を自動的に作成するための要素である。具体的には、予め品詞について、人や工具、機械など、さらに人の手足、手指、工具の先端、持ち手、機械の回転部、機械の持ち手等を分類し、固有表現の現場用語として登録しておく。そして、ベクトル法を用いてこれらの固有表現における用語間の関係性を算出し、予め登録された文章構造に基づいてテキストの会話要旨を作成するというものである。
【0020】
出力装置28は、数文字処理装置24や自然言語処理装置26を介して取得された文字列や会話要旨に基づいて作業記録における指定セルの入力を行うための要素である。
【0021】
編集装置22とは、音声認識装置20による文字データの作成や、数文字処理装置24による文字列の検出、及び自然言語処理装置26による会話要旨の作成に必要な処理ルールを定めるための要素である。また、出力装置28に対しては、他の機器への転送や共有を実施するための設定を行うことを可能とする。
【0022】
各装置に対する編集装置の役割としては、次のようなものを挙げる事ができる。転送装置18に対しては、単位音声データを作成する際の無音区間の時間を設定し、起動時に当該設定値の既存情報を更新することができる。音声認識装置20に対しては、単位音声データから文字データを作成する際の文字起こしを行う際に、音声データ中の不適切な言語の文字変換の精度を制御する設定を行うことができる。また、数文字処理装置24に対しては、予め登録する数値形式や同音異義語、フィラー言語などの更新処理を行うことができる。自然言語処理装置26に対しては、予め登録している固有表現と、用語間の関係性を定める関係性数値(ベクトル)の更新処理を行うことができる。
【0023】
出力手段30は、前述した出力装置28と共通の要素であり、印刷装置30aやモニタ30b、及び他の機器への共有を図るための通信機器30c等である。印刷装置30aは、出力装置28に表示された作業記録を紙面に印刷することができれば良い。モニタ30bは、システム本体14の一部であっても、別途設けられたものであっても良く、数文字処理装置24や自然言語処理装置26を介して作成された作業記録を視認可能に表示するための要素である。作業者は、モニタ30bに表示された作業記録に対して修正を加えることができる。通信機器30cは、数文字処理装置24や自然言語処理装置26を介して作成された作業記録や、数文字処理装置24を介して作成した文字データを他の情報機器に転送することができれば良い。
【0024】
[作業記録作成支援システム実施]
上記のような基本構成を有する作業記録作成支援システムを用いた作業記録の作成について、図2から図4のフローを参照して説明する。作業記録作成支援システム10による作業記録の作成を行うにあたり、作業者等は、現場への入域後、マイク等の音声入力装置を装着する準備段階を経る。
【0025】
準備を終え現場作業に入り、作業者間の会話や指示の音声を音声入力装置12が取得すると、文字起こしが開始される(S10:文字起こし)。ここで、文字起こしの詳細については、図3を参照して説明する。文字起こしはまず、音声入力装置を介した音声の取り込みから行われる(S110:音声の取込)。取り込まれた音声は、収録装置16、転送装置18、及び音声認識装置20を介して文字データに変換される(S111:文字データ変換)。
【0026】
音声データから文字データへの変換が成されると、文字データに対して形態素解析が行われる。形態素解析とは、文字データ(テキストデータ)の中の単語や、その単語の変化形式などを割り出す技術である。この解析を経ることで、文字データの中の単語が品詞としてどれにあたるのかが分類され、同音異義語や同音異字語、現場特有語の種別判定に役立てることができる(S112:形態素解析)。
【0027】
形態素解析を行った後の文字データには、品詞分けされた単語または語句に対する重み付けが成される。各単語の重み付け(使用頻度など)を数値付けすることで、同音異義語や同音異字語における文字起こしの優先順位や、適正な使用方法などを判別することの精度を上げることができる(S113:文字データの座標設定)。
【0028】
次に、品詞分けされた単語または語句と、予め登録されたフィラー言語データベース(フィラー言語DB)と比較してフィラー言語の検出を行う。ここで、フィラー言語DBとは、図5に示すような形式のものであれば良い(S114:フィラー言語の検出)。フィラー言語の検出工程において、フィラー言語が検出された場合には(S115:フィラー言語有無の判定)、そのフィラー言語は文字データから削除される(S115A:フィラー言語の削除)。
【0029】
一方、フィラー言語有無の判定(S115)において、フィラー言語が無いと判定された場合、及びS115Aにおいてフィラー言語の削除が行われた後には、品詞分けされた単語または語句について、同音異義語または同音異字語の検出が行われる。同音異義語または同音異字語の検出もフィラー言語の検出と同様に、予め設定された同音異義語/同音異字語データベース(同音異義語/同音異字語DB)との比較により成される。なお、同音異義語/同音異字語DBについては、一例として、図6に示すような形式のものであれば良い。図6において、“変更前”の列記載されている用語は、形態素解析(S112)において自動変換された用語であり、“変更後”の列に記載されている用語は、作業現場においてよく使われる同音の用語である(S116:同音異義語/同音異字語の検出)。同音の用語の検出工程において同音異義語または同音異字語が検出された場合には(S117:同音異義語/同音異字語有無の判定)、適正であると判定される文字への切り替が実行される。ここで、適正な使用であるか否かの判定は、上述した文字データの座標設定(S113)により付与された情報に基づく(S117A:誤変換文字データとの切り替え)。さらに、文字データの切り替えを行った場合には、切り替えを行った箇所を表示する際に色付けを施すように設定する。仮作成された作業記録を確認する際の労力を軽減するためである(S117B:切替数文字の色付け)。
【0030】
一方、同音異義語または同音異字語有無の判定(S117)において、同音異義語または同音異字語が無いと判定された場合、及びS117Bにおいて切り替え文字の色付けが成された後には、品詞分けされた単語または語句について、文字データ中における現場特有語の検出が行われる。現場特有語の検出も、フィラー言語の検出(S114)や同音異義語または同音異字語の検出(S116)と同様に、予め設定された現場特有語データベース(現場特有語DB)との比較により成される(S118:現場特有語の検出)。現場特有語の検出工程において、現場特有語が検出された場合には(S119:現場特有語有無の判定)、適正であると判定される文字への切り替えが実行される(S119A:誤変換文字データとの切り替え)。また、上述した同音異義語または同音異字語の検出、切り替えと同様に、現場特有語に基づく切り替えが成された後は、切り替えを行った箇所を表示する際に色付けを施すように設定する(S119B:切替数文字の色付け)。
【0031】
一方、現場特有語有無の判定(S119)において、現場特有語が無いと判定された場合、及びS119Bにおいて切替数文字の色付けが成された後には、文字起こしの結果が保存される(S120:文字起こし結果の保存)。文字起こしの結果保存が成された後、結果に基づく文字データのベクトル(重み付け)の更新が成される(S121:文字ベクトル化)。なお、フィラー言語の検出工程(S114)と、同音の用語の検出工程(S116)、及び現場特有語の検出工程(S118)については、その順番を入れ替えたとしても同様の結果を得ることができる。
【0032】
上記のようにして文字起こしを終えたデータに基づいて作業記録の仮作成が自動的に行われる(S20:作業記録の仮作成)。ここで、作業記録の仮作成における対象機器や番号等、記入すべき内容が定められている欄の記載については、図4に示すフローのようにして実行される。まず、保存された文字起こし結果のデータ(文字データ)について、「指差し呼称」という文字データの検出が成される(S210:「指差し呼称」の検出)。「指差し呼称」文字データの有無の判定(S211)において「指差し呼称」文字データが有ると判定された場合には、「指差し呼称」文字データが含まれている語句の中に、特定の機器等を計測した数値データ(数値形式)が含まれているかにより検出を行う。数値形式の検出は、予め設定された数値形式データベース(数値形式DB)との比較により成される。具体的には、「指差し呼称」という言葉の検出が行われ、数値形式DBが立上げられ、「指差し呼称」から「よし」までの文字データから、SL単位や固有表現を抽出することで成される(S212:数値形式の検出)。数値形式の有無の判定(S213)において、数値形式が有ると判定された場合には、その検出された数値形式を作業記録の所定欄に転写する(S213A:数値転写)。ここで、数値形式とは、図7に示すように、文字データにSI単位に関する記載が表れた際、その単位における記載条件であり、数値形式の記入とは、その記載条件に対応した数値の記入を行うことをいう。数値形式の記入を終えた後、あるいは数値形式の有無の判定(S213)において数値形式が無いと判定された場合、作業対象とする機器の名称や対応するシート番号等が作業記録の所定欄に転写される。ここで、機器の名称や番号等は、予め定められた作業記録データベース(作業記録DB)に基づいて成される(S214:機器名称・番号等の転写)。
【0033】
上記のようにして機器名称・番号等の記入が成された後、あるいは「指差し呼称」文字データの有無の判定において「指差し呼称」文字データが無いと判定された場合には、自動作成される記録事項の入力を終えたと判断し、作業記録仮保存が成される(S215:作業記録の仮保存)。
【0034】
上記のようにして作業記録が仮作成された後、仮作成された作業記録に対する校正が行われる。校正は、モニタ30bなどに仮作成された作業記録の内容を表示した上で、監督や作業責任者等の人手によって行われる。具体的には、まず、仮作成された作業記録に入力された内容について、文字データ誤変換の有無の確認が成される(S30:文字データ誤変換の有無確認)。文字データ誤変換の有無の判定(S40)において、文字データ誤変換が有ると判定した場合には、同音異義語/同音異字語DBや現場特有語DBを読み出して、適正な現場用語(文字データ)の選択、置き換えを行う。同音異義語/同音異字語DBや、現場特有語DBに適正な現場用語(文字データ)が存在しない場合には、新たな同音の用語や現場用語の登録と、記載内容の変更を行う(S50:新たな同音異義語等の登録)。そして、新たに登録された現場用語等において、ベクトル(重み付け)が成される。新たな現場用語等の登録において、例えばMicrosoft日本語IMEというユーザーインターフェースの辞書ツールやATOKなどの利用が考えられる(S60:文字ベクトル化)。
【0035】
新たな同音異義語等の登録、及び記載内容の変更が成された後、あるいは文字データ誤変換の有無の判定において、誤変換が無いと判定された場合には、正式な作業記録の作成が行われる。なお、ここでいう作業記録の作成とは、モニタ30b等に表示されている作業記録を印刷装置30a等を介して出力する作業をいう(S70:作業記録の作成)。
【0036】
なお、図2においては、文字起こしの工程(S10)と作業記録の仮作成工程(S20)は、現場作業時に行われる処理である旨記載し、文字データ誤変換の有無確認の工程(S30)から作業記録の本作成工程(S70)に関しては、事務作業時に行われる作業である旨記載しているが、各処理がいつ、どこで行われるかに関しては、厳密に定めるものではなく、一例に過ぎない。
【0037】
上記のような作業記録作成支援システムを用いて仮作成される作業記録の一例について、図8から図11を参照して説明する。
例えば、作業者と作業班長との間で図8に示す場面1から場面4のようなやりとりの会話があったとする。
【0038】
この会話は、(1)から(6)に示す時系列で行われ、作業記録作成支援システム10では、(1)から(6)の会話を図9(A)に示すように時系列に並べた文字データを作成する。ここで、マイクのシリアル番号の検出や音源分離の技術などを活用し、各発話者を指定、分別する。そして、各会話文と発話者とを紐付ける。また、各行の会話文において、発話者に関わらず会話番号を指定する。
【0039】
文字データが時系列に並べられた後、図9(B)に示すようにして、文字データの中から固有表現を抽出する。なお、図9(B)に示す例では、下線部が固有表現として抽出された部分である。ここで、固有表現は現場特有語DBに登録された現場用語である。また、形態素解析にて分割された文字データや連結された文字データなどが含まれる。例えば、「養生」と「不良」といった2つの文字データを固有表現として登録する場合には、「養生不良」という1つの文字データとして連結されて登録される場合もある。図9(B)に示す会話文の場合には、「配電盤A」、「番号A16」、「養生不良」や「作業記録」を固有表現として、自然言語処理装置26を介して抽出する。
【0040】
次に、抽出された固有表現を機械名詞や部品名詞、人名詞などに品詞分けし、図9(C)に示すように、品詞分けした固有表現を用いて指定語句を自動作成する。ここで、指定形式の語句に関する厳密な取り決めは無いが、例えば本実施形態では、名詞、動詞、前置詞(介詞)以外の品詞を削除することで構成される語句(言葉)である。
【0041】
また、発話者の識別は、マイク等の音声入力装置12に備えられたシリアル番号の検出や、音源分離といった音声技術を活用することで、特定の発話文を「誰が」話したかという紐づけができる。このような紐づけの連鎖により、「誰が何をやっていた」、「誰が誰にやらされていた」という事を判定することができ、固有表現の品詞に基づく指定形式の語句を作成することが可能となる。
なお、品詞の選定は、語句を構成する場合に、ある単語に対する他の単語の使用率の関係(例えばベクトル法)などによる重み付けに基づいて成されれば良い。
【0042】
次に、図9(D)に示すように、指定された発話者に基づいて自動作成された指定形式の語句を仕分ける。ここで、各発話者の会話文から使用頻度が低い固有表現が含まれている会話文を優先的に抽出し、要約として図10に示すような作業記録の連絡事項記入欄に転写する。これにより、図9(D)示すような作業記録が仮作成される。
【0043】
このようにして作業記録の作成を行う作業記録作成支援システムによれば、予め膨大な量の現場用語を学習させておかなくとも、作業記録の自動作成に対応することができる。よって、作業記録作成に要する労力や時間を大幅に削減することが可能となる。
【産業上の利用可能性】
【0044】
上記実施形態では、本発明に係る作業記録作成支援システム10は、現場作業における作業記録へ適用するものとして記載した。確かに、上記作業記録作成支援システムは、現場作業における作業記録の作成支援に好適なものであるが、他の作業などにおける報告書等の作成支援に利用する事もできることは言うまでもない。
【符号の説明】
【0045】
10………作業記録作成支援システム、12………音声入力装置、14………システム本体、16………収録装置、18………転送装置、20………音声認識装置、22………編集装置、24………数文字処理装置、26………自然言語処理装置、28………出力装置、30………出力手段、30a………印刷装置、30b………モニタ、30c………通信機器。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10