(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023172480
(43)【公開日】2023-12-06
(54)【発明の名称】医療従事者の業務特定装置および判定モデル生成方法
(51)【国際特許分類】
G06Q 50/22 20180101AFI20231129BHJP
G10L 15/00 20130101ALI20231129BHJP
【FI】
G06Q50/22
G10L15/00 200L
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022084317
(22)【出願日】2022-05-24
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和2年度、総務省委託事業、戦略的情報通信研究開発推進事業(SCOPE)、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】591253593
【氏名又は名称】株式会社ケアコム
(71)【出願人】
【識別番号】504139662
【氏名又は名称】国立大学法人東海国立大学機構
(74)【代理人】
【識別番号】100105784
【弁理士】
【氏名又は名称】橘 和之
(72)【発明者】
【氏名】出野 義則
(72)【発明者】
【氏名】坂本 祐二
(72)【発明者】
【氏名】大山 慎太郎
(72)【発明者】
【氏名】山下 佳子
(72)【発明者】
【氏名】白鳥 義宗
【テーマコード(参考)】
5L099
【Fターム(参考)】
5L099AA13
(57)【要約】 (修正有)
【課題】医療従事者に負担をかけることなく業務内容および行為内容の少なくとも一方を高精度に特定する医療従事者の業務特定装置および判定モデル生成方法を提供する。
【解決手段】業務特定装置10は、動作検知センサ101により検知された医療従事者の動作データを判定モデル13に入力し、医療従事者の業務内容を判定する業務判定部12を備える。業務判定部は、業務実施時に動作検知センサ101により検知された動作データと、音声検知センサにより検知された音声データから変換された発話内容の文字データとを用いた機械学習処理により判定モデル13を医療従事者毎に生成し、動作データが入力された際に発話内容に対してあらかじめ関連付けられた業務内容を示す情報を出力するように判定モデル13を構成し、特定のキーワードを発することなく業務を行っているときの動作に対応する業務内容を、医療従事者に固有の判定モデル13によって特定する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
医療従事者の発話ではない動作を検知する動作検知センサにより検知された動作データを取得する動作データ取得部と、
上記動作データ取得部により取得された上記動作データを、学習用データを用いた機械学習処理により医療従事者ごとに生成された判定モデルのうち判定対象の医療従事者について学習済みの判定モデルに入力し、上記医療従事者が行った業務および当該業務に含まれる行為の内容の少なくとも一方を判定する業務判定部とを備え、
上記判定モデルは、上記医療従事者について上記動作検知センサにより検知された動作データと、上記医療従事者について音声検知センサにより検知された音声データから変換された発話内容の文字データとを上記学習用データとして用いた機械学習処理により、上記動作データが入力された際に上記音声データの発話内容に対してあらかじめ関連付けられた業務内容および行為内容の少なくとも一方を示す情報を出力するように生成されている
ことを特徴とする医療従事者の業務特定装置。
【請求項2】
上記判定モデルは、
上記動作データを入力し、当該動作データに対応する上記発話内容を表す情報を出力する第1の判定モデルと、
上記第1の判定モデルから出力された上記発話内容を表す情報を入力し、当該発話内容に対してあらかじめ関連付けられた業務内容および行為内容の少なくとも一方を示す情報を出力する第2の判定モデルとを含み、
上記第1の判定モデルが、上記学習用データを用いた機械学習処理により生成されており、
上記第2の判定モデルが、上記発話内容と上記業務内容および上記行為内容の少なくとも一方とをあらかじめ関連付けて成る関連付け情報に基づいて上記業務内容および上記行為内容の少なくとも一方を示す情報を出力するように構成されている
ことを特徴とする請求項1に記載の医療従事者の業務特定装置。
【請求項3】
上記動作検知センサは、上記医療従事者の姿勢を検知する姿勢検知センサを含むことを特徴とする請求項1または2に記載の医療従事者の業務特定装置。
【請求項4】
上記動作検知センサは、上記医療従事者が動作を行っている位置を検知する位置検知センサを更に含むことを特徴とする請求項3に記載の医療従事者の業務特定装置。
【請求項5】
上記動作検知センサは、上記医療従事者が業務を行う際に使用する機器に対する操作を検知する操作検知センサを更に含むことを特徴とする請求項3に記載の医療従事者の業務特定装置。
【請求項6】
モデル生成装置の判定モデル生成部が、医療従事者の発話ではない動作を検知する動作検知センサにより検知された動作データと、上記医療従事者について音声検知センサにより検知された音声データから変換された発話内容の文字データとを学習用データとして入力する第1のステップと、
上記判定モデル生成部が、上記第1のステップで入力された上記学習用データを用いて機械学習を行うことにより、上記動作データが入力された際に上記音声データの発話内容に対してあらかじめ関連付けられた業務内容および行為内容の少なくとも一方を示す情報を出力する判定モデルを生成する第2のステップとを有し、
上記判定モデル生成部は、上記医療従事者ごとに用意された上記学習用データを用いて、上記医療従事者ごとに上記判定モデルを生成する
ことを特徴とする判定モデル生成方法。
【請求項7】
上記判定モデル生成部は、あるタイミングで検知された上記音声データに対応する上記発話内容の文字データと、上記あるタイミングをもとに特定される業務の所要時間に相当する期間中に検知された一連の上記動作データとをデータセットとして機械学習を行うことを特徴とする請求項6に記載の判定モデル生成方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、医療従事者の業務特定装置および判定モデル生成方法に関し、特に、医療従事者が行った業務または行為の内容を特定するための装置およびこれに適用される判定モデルの生成方法に関するものである。
【背景技術】
【0002】
医療従事者(看護師、介護士を含む)の超過勤務や労働災害、健康被害などを防止するために、医療従事者が行っている業務や行動を把握して業務の見直しなどの対策を行うことが知られている。医療従事者の業務内容を把握するための方法として、医療従事者自身が業務内容を記録する方法が一般的に知られている。しかしながら、医療従事者自身に日々の業務内容を記録させると、それに伴う業務量が増加し、より超過勤務や労働災害、健康被害などが起こる可能性が増えてしまうという問題があった。また、医療従事者自身が行う業務内容の記録は、実際に行った業務や行動に対して、一部記載漏れや本人の理解不足による誤った記録が行われるリスクを有しており、業務内容の記録に対する真正性を担保することが難しいという課題があった。
【0003】
このような問題を解決するために、音声取得装置(例えばマイクロフォン)によって取得された介護者の音声を文字情報として認識し、この文字情報を、介護行為の種類を示すものとしてあらかじめ記憶されたキーワードと照合することにより、実施された介護行為の推定を行う技術が知られている(例えば、特許文献1参照)。しかし、音声取得装置のみで実施された介護行為の推定を行う場合、介護行為の入力の手間の削減は可能であっても、介護行為の事実確認に課題を残している。
【0004】
上述した課題を解決するための技術として、姿勢センサ(加速度センサおよび回転検出器)を搭載したアシスト装置を介護者に装着するとともに、位置センサを搭載した利用者端末を介護者に携行させ、姿勢センサにより検出される介護者の姿勢に基づいて介護作業を特定し、位置センサにより検出される介護者の位置に基づいて介護場所を特定する技術が知られている(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2019-175052号公報
【特許文献2】特開2021-51575号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に記載の技術では、介護者があらかじめ決められた特定のキーワードと全て一致する音声を常に発する必要がある。そのため、介護者は業務ごとのキーワードを覚えて常にそれを使わなければならず、介護者に負担をかけ続けてしまうという問題があった。また、特許文献2に記載の技術では、介護者の介護作業を特定するために姿勢センサを使用しているが、姿勢センサが個人差などにより様々な状態を検知するため、姿勢センサが検知した姿勢と介護者の業務内容との関連付けを適切に行うことが困難であるという問題があった。
【0007】
本発明は、このような問題を解決するために成されたものであり、医療従事者に負担をかけることなく、医療従事者が行った業務および行為の少なくとも一方内容を高精度に特定することができるようにすることを目的とする。
【課題を解決するための手段】
【0008】
上記した課題を解決するために、本発明では、医療従事者の発話ではない動作を検知する動作検知センサにより検知された動作データを、学習用データを用いた機械学習処理により医療従事者ごとに生成された判定モデルのうち判定対象の医療従事者について学習済みの判定モデルに入力し、医療従事者が行った業務および行為の少なくとも一方の内容を判定するようにしている。判定モデルは、医療従事者について動作検知センサにより検知された動作データと、医療従事者について音声検知センサにより検知された音声データから変換された発話内容の文字データとを学習用データとして用いた機械学習処理により、動作データが入力された際に音声データの発話内容に対してあらかじめ関連付けられた業務内容および行為内容の少なくとも一方を示す情報を出力するように生成されている。
【発明の効果】
【0009】
上記のように構成した本発明によれば、医療従事者が業務を行う際に、あらかじめ決められた特定のキーワードと一致する音声を常に発する必要はなく、普通に業務を行っていれば、そのときの動作が動作検知センサにより検知されて、その動作に対応する業務内容および行為内容が少なくとも特定される。また、動作データをもとに業務内容および行為内容の少なくとも一方を判定するための判定モデルは、個々の医療従事者ごとに機械学習されているので、医療従事者ごとに個人差のある動作からも業務内容および行為内容の少なくとも一方が正しく判定される可能性が高くなる。これにより、本発明によれば、医療従事者に負担をかけることなく、医療従事者が行った業務および行為の少なくとも一方の内容を高精度に特定することができる。
【図面の簡単な説明】
【0010】
【
図1】本実施形態による業務特定システムの全体構成例を示す図である。
【
図2】本実施形態による業務特定装置の機能構成例を示すブロック図である。
【
図3】本実施形態による第1の判定モデルの動作内容を説明するための図である。
【
図4】本実施形態による第2の判定モデルの動作内容を説明するための図である。
【
図5】本実施形態によるモデル生成装置の機能構成例を示すブロック図である。
【
図6】本実施形態による学習システムの全体構成例を示す図である。
【
図7】本実施形態による第1の判定モデルの機械学習に使用する学習期間設定情報の一例を示す図である。
【
図8】本実施形態によるモデル生成装置の動作例(モデル生成方法の処理手順の一例)を示すフローチャートである。
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本実施形態による医療従事者の業務特定装置(以下、単に業務特定装置という)を備えた業務特定システムの全体構成例を示す図である。
図1に示すように、本実施形態の業務特定システムは、本実施形態の業務特定装置10、動作検知センサ101および中継器110を備えている。動作検知センサ101と中継器110との間は無線通信手段により接続され、中継器110と業務特定装置10との間はLAN(Local Area Network)やWAN(Wide Area Network)等の通信ネットワーク120により接続される。ここで、通信ネットワーク120は、有線であっても無線であっても良い。
【0012】
動作検知センサ101は、医療従事者の発話ではない動作を検知し、その動作内容を表す動作データを周期的に逐次出力する。この動作検知センサ101は、例えば、医療従事者の姿勢を検知する姿勢検知センサであり、医療従事者の頭、胸、腕(手)、腰、足などに装着される。姿勢検知センサは、例えば、位置や床からの高さを検知する3次元センサ、加速度センサおよびジャイロセンサなどの何れかを含む。
【0013】
中継器110は、医療従事者が従事する施設の複数箇所に設置されており、無線LANなどの無線通信手段を介して動作検知センサ101から動作データを受信し、受信した動作データを、通信ネットワーク120を介して業務特定装置10に送信する。中継器110は、例えば、施設内の各部屋および廊下など必要な場所に設置されている。
【0014】
業務特定装置10は、動作検知センサ101から中継器110を介して送信されてくる医療従事者の動作データに基づいて、医療従事者が行った業務の内容を特定する処理を行う。ここでいう業務内容の特定とは、複数種類の業務のうちどれを医療従事者が行ったのかを特定することを意味する。
【0015】
図2は、本実施形態による業務特定装置10の機能構成例を示すブロック図である。
図2に示すように、本実施形態の業務特定装置10は、機能構成として、動作データ取得部11および業務判定部12を備えている。業務判定部12は、判定モデル13を実装している。この判定モデル13は、後述する学習用データを用いた機械学習処理により、医療従事者ごとに生成されている。すなわち、業務判定部12は、医療従事者ごとに生成された複数の判定モデル13を実装している。
【0016】
上記機能ブロック11,12は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記機能ブロック11,12は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROMに記憶されたプログラムが動作することによって実現される。なお、当該プログラムは、ハードディスクや半導体メモリ等の他の記憶媒体に記憶されていてもよい。
【0017】
動作データ取得部11は、動作検知センサ101により検知された医療従事者の動作データを取得する。上述したように、動作検知センサ101から動作データが周期的に逐次出力され、動作データ取得部11はこの動作データを逐次取得する。動作データ取得部11は、動作データを取得した日時を示すタイムスタンプを付加し、動作データとタイムスタンプとをセットで業務判定部12へ出力する。
【0018】
業務判定部12は、動作データ取得部11により取得された動作データを、医療従事者ごとに生成された複数の判定モデル13のうち、判定対象の医療従事者について学習済みの判定モデル13に入力し、医療従事者が行った行為および業務の内容を判定する。このとき業務判定部12は、動作データとセットで入力されるタイムスタンプに基づいて、動作データ取得部11から逐次供給される動作データの判定対象期間を決定する。判定対象期間とは、業務に含まれる行為が医療従事者により行われたか否かを判定する際に、一連の動作データのうちどの期間に検知された動作データを判定対象として用いるかを示すものである。この判定対象期間の詳細は、
図3を用いて後述する。
【0019】
判定モデル13は、医療従事者について動作検知センサ101により検知された動作データと、医療従事者について音声検知センサ102(
図6を用いて後述する)により検知された音声データから変換された発話内容の文字データとを学習用データとして用いた機械学習処理により生成されている。この判定モデル13は、動作データが入力された際に音声データの発話内容に対してあらかじめ関連付けられた行為内容および業務内容を示す情報を出力するように、機械学習されている。
【0020】
判定モデル13は、第1の判定モデル13aおよび第2の判定モデル13bを含む。第1の判定モデル13aは、動作データを入力し、当該動作データに対応する発話内容を表す情報を出力するように構成されており、当該第1の判定モデル13aが、上述の学習用データを用いた機械学習処理により生成されている。第2の判定モデル13bは、第1の判定モデル13aから出力された発話内容を表す情報を入力し、当該発話内容に対してあらかじめ関連付けられた行為内容および業務内容を示す情報を出力するように構成されている。具体的には、第2の判定モデル13bは、発話内容と行為内容と業務内容とをあらかじめ関連付けて成る関連付け情報に基づいて、発話内容に対応する行為内容および業務内容を示す情報を出力する。
【0021】
図3は、第1の判定モデル13aの動作内容を説明するための図である。
図3(a)は、ある業務Aが1つの行為A
ACT1により実施され、この行為A
ACT1を実施する際に医療従事者が関連の発話A
UTT1を行うことを示している。また、この行為A
ACT1を実施する際の所要時間がT
A1であることを示している。例えば、業務Aがバイタルサインの取得業務である場合、医療従事者は「体温測定をしますね」といった発話A
UTT1を行った上で、所要時間T
A1をかけて体温測定という行為A
ACT1をすることを意味している。ここで、体温測定を行う際には、医療従事者は体温測定という行為A
ACT1に特有の動作を行うことになり、その動作中の一連の姿勢が動作検知センサ101により逐次検知され、検知された動作データが動作データ取得部11により逐次取得されることになる。
【0022】
第1の判定モデル13aは、時間T
A1の間に動作データ取得部11から逐次供給される一連の動作データに基づいて、当該動作データから推定される発話A
UTT1の内容を表す情報(発話内容の文字データ)を出力する。ここで、一連の動作データとセットで供給されるタイムスタンプにより、時間T
A1のカウントが行われる。この
図3(a)に示す例の場合、時間T
A1が判定対象期間となる。例えば、第1の判定モデル13aは、動作データに基づいて発話A
UTT1に関する発話内容の情報を出力した時点で、その発話内容に関連付けてあらかじめ記憶しておいた時間T
A1を判定対象期間として決定する。
【0023】
上述のように、医療従事者が行為A
ACT1をしている際に動作検知センサ101により検知される動作データと、その行為A
ACT1に関連して医療従事者が発する発話A
UTT1の内容との間には強い相関関係がある。第1の判定モデル13aは、動作検知センサ101により検知される動作データと音声検知センサ102(
図6参照)により検知される音声データから把握される発話内容との相関関係が反映されるように機械学習されており、行為A
ACT1に対応する動作データが入力された際に、当該動作データに対応する発話内容(行為A
ACT1に関連する発話A
UTT1の内容)を表す情報を出力する。
【0024】
図3(b)は、ある業務Bが2つの行為B
ACT1,B
ACT2により実施され、これらの行為B
ACT1,B
ACT2を実施する際に医療従事者がそれぞれ関連の発話B
UTT1,B
UTT2を行うことを示している。また、これらの行為B
ACT1,B
ACT2を実施する際の所要時間がそれぞれT
B1,T
B2であることを示している。医療従事者が行為B
ACT1,B
ACT2を実施する際には、それぞれに特有の動作を行うことになり、その動作中の一連の姿勢が動作検知センサ101により逐次検知され、検知された動作データが動作データ取得部11により逐次取得されることになる。
【0025】
第1の判定モデル13aは、時間TB1の間に動作データ取得部11から逐次供給される一連の動作データに基づいて、当該動作データから推定される発話BUTT1の内容を表す情報を出力する。また、第1の判定モデル13aは、時間TB2の間に動作データ取得部11から逐次供給される一連の動作データに基づいて、当該動作データから推定される発話BUTT2の内容を表す情報を出力する。この場合、時間TB1,TB2がそれぞれ判定対象期間となる。
【0026】
図4は、第2の判定モデル13bの動作内容を説明するための図である。
図4は、発話内容と行為内容および業務内容とをあらかじめ関連付けて成る関連付け情報の一例を示すものである。
図4(a)は、
図3(a)のように1つの行為A
ACT1により1つの業務Aが実施される場合に対応する関連付け情報の例を示す。
図4(b)は、
図3(b)のように2つの行為B
ACT1,B
ACT2により1つの業務Bが実施される場合に対応する関連付け情報の例を示す。
【0027】
図4(a)では、6種類の発話内容を表す文字列に対して、体温測定という1つの行為内容とバイタルサイン取得という1つの業務内容とが関連付けられている。6種類の発話内容の文字列は、医療従事者がバイタルサイン取得業務を行う際に発する可能性のある発話内容、言い換えると、第1の判定モデル13aから出力される可能性のある発話内容として列挙されたものである。第2の判定モデル13bは、第1の判定モデル13aから出力される文字列が、関連付け情報として記録されている文字列の何れかと合致するか否かを判定し、合致するものがあった場合に、それに対応する行為内容および業務内容の情報を出力する。
【0028】
図4(b)では、複数種類の発話内容B
UTT1-1,B
UTT1-2,・・・を表す文字列に対して1つの行為B
ACT1が関連付けられるとともに、複数種類の発話内容B
UTT2-1,B
UTT2-2,・・・を表す文字列に対して1つの行為B
ACT2が関連付けられ、これら2つの行為B
ACT1,B
ACT2の組み合わせに対して1つの業務Bが関連付けられている。第2の判定モデル13bは、第1の判定モデル13aから出力される文字列が、行為B
ACT1に対応する発話内容B
UTT1-1,B
UTT1-2,・・・の文字列の何れかと合致し、かつ、行為B
ACT2に対応する発話内容B
UTT2-1,B
UTT2-2,・・・の文字列の何れかと合致すると判定された場合に、行為B
ACT1,B
ACT2を示す行為内容および業務Bを示す業務内容の情報を出力する。
【0029】
なお、複数の行為により実施する業務の場合、複数の行為の実施順が常に固定されている業務と、実施順が固定されず任意に変更可能な業務とが存在する。実施順が固定されている業務の場合は、
図4(b)のように関連付け情報に記録されている通りの順番で発話内容の文字列が第1の判定モデル13aから順次出力された場合に限り、対応する業務内容を示す情報を出力する。一方、実施順が固定されていない業務の場合は、
図4(b)のように関連付け情報に記録されている発話内容の文字列が第1の判定モデル13aから順不同で出力された場合に、対応する業務内容を示す情報を出力する。
【0030】
図4に示す関連付け情報では、個々の発話内容の文字列に対して、許容誤差文字数の情報が記録されている。許容誤差文字数は、第1の判定モデル13aから出力される文字列と、関連付け情報として記録されている文字列との間で誤差が許容される文字数を意味する。例えば、許容誤差文字数が“0”の場合は、第1の判定モデル13aから出力される文字列と、関連付け情報として記録されている文字列とが完全一致であることを要するものとなる。許容誤差文字数が“1”の場合は、第1の判定モデル13aから出力される文字列のうち、関連付け情報として記録されている文字列と相違する文字が1つ以内であれば、両者は合致するとみなされる。
【0031】
図5は、機械学習によって判定モデル13を生成する本実施形態によるモデル生成装置20の機能構成例を示すブロック図である。
図6は、モデル生成装置20を含む学習システムの全体構成例を示す図である。
図6において、
図1に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
【0032】
図6に示すように、機械学習によって判定モデル13を生成する際、医療従事者は、動作検知センサ101に加えて音声検知センサ102を携行する。音声検知センサ102は、例えばマイクロフォンである。マイクロフォンは、スマートフォンのような携帯端末に内蔵されるものであってもよいし、ヘッドセットに備えられるものであってもよいし、クリップ等により衣服に装着可能なピンマイクであってもよい。
【0033】
音声検知センサ102は、医療従事者の発話音声を検知し、その音声データを出力する。なお、音声検知センサ102が検知する音声データの中には、医療従事者の発話音声以外の音声も含まれる。中継器110は、動作検知センサ101により検知される動作データに加えて、音声検知センサ102により検知される音声データをモデル生成装置20に送信する。
【0034】
図5に示すように、本実施形態のモデル生成装置20は、機能構成として、学習用データ取得部21および判定モデル生成部22を備えている。また、モデル生成装置20は、記憶媒体として、学習用データ記憶部23を備えている。学習用データ取得部21は、具体的な機能構成として、動作データ取得部21a、音声データ取得部21bおよびテキスト変換部21cを備えている。また、判定モデル生成部22は、具体的な機能構成として、第1の判定モデル生成部22aおよび関連付け情報生成部22bを備えている。
【0035】
上記機能ブロック21,22は、ハードウェア、DSP、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記機能ブロック21,22は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROMに記憶されたプログラムが動作することによって実現される。なお、当該プログラムは、ハードディスクや半導体メモリ等の他の記憶媒体に記憶されていてもよい。
【0036】
学習用データ取得部21は、動作検知センサ101により検知される動作データと、音声検知センサ102により検知される音声データとを逐次取得し、当該動作データと、音声データから変換される文字データとを学習用データとして学習用データ記憶部23に記憶する。ここで、学習用データ取得部21は、任意に設定された学習用データ収集期間において、動作検知センサ101と音声検知センサ102とを携行した医療従事者が実際に業務を行っている際に検知される動作データと音声データとを逐次取得する。
【0037】
動作データ取得部21aは、動作検知センサ101により検知された医療従事者の動作データを逐次取得する。動作データ取得部21aは、動作データを取得した日時を示すタイムスタンプを付加し、動作データとタイムスタンプとをセットで学習用データ記憶部23に記憶する。
【0038】
音声データ取得部21bは、音声検知センサ102により検知された医療従事者の音声データを取得する。音声データ取得部21bは、取得した音声データから有音期間を抽出し、抽出した音声データ(以下の説明において、音声データというときは、有音期間の音声データを意味するものとする)をテキスト変換部21cに出力する。
【0039】
テキスト変換部21cは、音声データ取得部21bから供給された音声データに音声認識技術を適用することにより、音声データに含まれる医療従事者の発話音声を認識し、当該発話音声の内容を表す文字列から成る文字データを生成する。テキスト変換部21cは、文字データを生成した日時を示すタイムスタンプを付加し、文字データとタイムスタンプとをセットで学習用データ記憶部23に記憶する。
【0040】
なお、ここでは学習用データ取得部21が音声データ取得部21bおよびテキスト変換部21cを備える構成を示しているが、これに限定されない。例えば、音声データから文字データに変換する構成をモデル生成装置20の外部に備え、学習用データ取得部21は文字データ取得部を備える構成としてもよい。
【0041】
関連付け情報生成部22bは、学習用データ記憶部23に記憶された発話音声の文字データを用いて、
図4に例示した関連付け情報を生成する。ここで、関連付け情報に含まれる行為内容を示す情報、業務内容を示す情報および許容誤差文字数の情報は、判定モデル13の生成者が手動で設定する。すなわち、医療従事者がある業務のある行為する際に、患者や要介護者に対して事前に業務内容を口頭で伝えて同意を得たり、業務の実施結果を口頭で伝えたりすることが多く、業務ごとにどのような発話を行うかは凡そ決まっているため、発話内容と行為と業務との間には強い相関関係がある。判定モデル13の生成者は、あらかじめ認識しているこの相関関係をもとに、発話音声の文字データに対して、行為内容を示す情報および業務内容を示す情報の関連付けを設定する。許容誤差文字数は、任意に設定可能である。このように生成された関連付け情報が、
図2に示した第2の判定モデル13bに記憶される。
【0042】
第1の判定モデル生成部22aは、学習用データ記憶部23に記憶された動作データと発話音声の文字データとを学習用データとして機械学習を行うことにより、第1の判定モデル13aを生成する。この機械学習を行う際に、判定モデル13の生成者は、
図7に示すような学習期間設定情報を生成し、第1の判定モデル生成部22aに設定する。
図7に示す学習期間設定情報は、発話内容の文字列ごとに、それに対応して実施される行為に伴う医療従事者の動作データの学習対象期間を設定するものである。
【0043】
図7に示すように、学習対象期間として、発話を行った後に行為を実施する場合における当該行為の所要時間(以下、発話後行為の所要時間(単位は秒)という)、または、行為を実施した後に発話する場合における当該の行為の所要時間(以下、発話前行為の所要時間という。
図7では開始遡り時間(単位は秒)と記している)の何れかが設定される。ここで、ある医療従事者が同じ行為をするときに常に同じ時間だけかかるというものではなく、長短が生じる。
図7の学習期間設定情報として設定される所要時間は、実績としての最長時間であってもよいし、最短時間であってもよいし、平均時間であってもよい。学習期間設定情報において学習対象期間として設定される所要時間が、上述したように第1の判定モデル13aが決定する判定対象期間となる。
【0044】
第1の判定モデル生成部22aは、あるタイミングで音声検知センサ102により検知された音声データに対応する発話内容の文字データと、当該あるタイミングをもとに
図7の学習期間設定情報を参照することによって特定される業務の所要時間に相当する学習対象期間中に動作検知センサ101により検知された一連の動作データとをデータセットとして、機械学習を行う。
【0045】
すなわち、学習用データ記憶部23に記憶されている文字データが、発話後行為の所要時間が設定されている発話内容の文字データである場合、第1の判定モデル生成部22aは、学習用データ記憶部23に記憶されている動作データのうち、文字データに付加されているタイムスタンプとほぼ同じ日時から所要時間後の日時までのタイムスタンプが付加されている一連の動作データと、当該文字データとをセットとして機械学習を実施する。
【0046】
また、学習用データ記憶部23に記憶されている文字データが、発話前行為の所要時間(開始遡り時間)が設定されている発話内容の文字データである場合、第1の判定モデル生成部22aは、学習用データ記憶部23に記憶されている動作データのうち、文字データに付加されているタイムスタンプとほぼ同じ日時から遡って所要時間前の日時までのタイムスタンプが付加されている一連の動作データと、当該文字データとをセットとして機械学習を実施する。
【0047】
以上のような機械学習を行うことにより、学習対象期間に含まれる一連の動作データと発話内容の文字データとの相関関係が反映されるように第1の判定モデル13aが生成される。これにより、第1の判定モデル13aは、学習対象期間に含まれる一連の動作データが入力された際にそれに対応する発話内容の文字データが出力されるように構築される。このように生成された第1の判定モデル13aが、
図2に示した業務判定部12に実装される。このため、業務特定装置10の動作データ取得部11により取得される一連の動作データが、機械学習に使用された一連の動作データと近似したものであれば、それに対応する発話内容の文字データが出力されることとなる。
【0048】
本実施形態では、以上に説明したモデル生成装置20の処理を個々の医療従事者ごとに実行する。これにより、医療従事者ごとにカスタマイズされた複数の判定モデル13を生成する。
【0049】
図8は、モデル生成装置20の動作例(モデル生成方法の処理手順の一例)を示すフローチャートである。ここでは、学習用データ収集期間が既に終了しており、医療従事者の動作データと発話音声の文字データとを含む学習用データが学習用データ記憶部23に記憶されているものとする。
図8は、第1の判定モデル生成部22aが学習用データ記憶部23に記憶された学習用データを用いて第1の判定モデル13aを生成する動作例を示す。
【0050】
まず、第1の判定モデル生成部22aは、学習用データ記憶部23に記憶されている発話音声の文字データのうち、何れか1つの文字データを取得する(ステップS1)。処理を開始した直後は、例えば、タイムスタンプが最先の日時を示している文字データを取得する。そして、第1の判定モデル生成部22aは、
図7のようにあらかじめ設定された学習期間設定情報を参照し、ステップS1で取得された文字データが、開始遡り時間が設定されている発話内容の文字データであるか否かを判定する(ステップS2)。
【0051】
ここで、開始遡り時間が設定されている発話内容の文字データであると判定された場合、第1の判定モデル生成部22aは、学習用データ記憶部23に記憶されている動作データのうち、ステップS1で取得された文字データに付加されているタイムスタンプとほぼ同じ日時から遡って所要時間前の日時までのタイムスタンプが付加されている一連の動作データを学習用データ記憶部23から取得する(ステップS3)。そして、ステップS1で取得された文字データと、ステップS3で取得された一連の動作データとをセットとして第1の判定モデル13aの機械学習を実施する(ステップS5)。
【0052】
一方、上記ステップS2において、開始遡り時間が設定されている発話内容の文字データではないと判定された場合、第1の判定モデル生成部22aは、学習用データ記憶部23に記憶されている動作データのうち、ステップS1で取得された文字データに付加されているタイムスタンプから所要時間後の日時までのタイムスタンプが付加されている一連の動作データを学習用データ記憶部23から取得する(ステップS4)。そして、ステップS1で取得された文字データと、ステップS4で取得された一連の動作データとをセットとして第1の判定モデル13aの機械学習を実施する(ステップS5)。
【0053】
その後、第1の判定モデル生成部22aは、学習用データ記憶部23から全ての文字データを取得したか否かを判定する(ステップS6)。まだ全ての文字データを取得し終えていない場合、処理はステップS1に戻り、次のタイムスタンプが付加された文字データを取得する。以降、全ての文字データを学習用データ記憶部23から取得して機械学習を実施するまで、ステップS1~S6の処理を繰り返す。そして、ステップS6において、全ての文字データを学習用データ記憶部23から取得した判定された場合、
図8に示す処理が終了する。
【0054】
以上詳しく説明したように、本実施形態では、動作検知センサ101により検知された動作データを、判定対象の医療従事者について機械学習済みの判定モデル13に入力し、医療従事者が行った行為内容および業務内容を判定するようにしている。判定モデル13は、医療従事者について動作検知センサ101により検知された動作データと、医療従事者について音声検知センサ102により検知された音声データから変換された文字データとを学習用データとして用いた機械学習処理により、動作データが入力された際に音声データの発話内容に対してあらかじめ関連付けられた行為内容および業務内容を示す情報を出力するように構成している。
【0055】
このように構成した本実施形態によれば、医療従事者が業務を行う際に、あらかじめ決められた特定のキーワードと一致する音声を常に発する必要はなく、普通に業務を行っていれば、そのときの動作が動作検知センサ101により検知されて、その動作に対応する行為内容および業務内容が特定される。また、動作データをもとに業務内容を判定するための判定モデル13は、個々の医療従事者ごとに機械学習されているので、医療従事者ごとに個人差のある動作からも行為内容および業務内容が正しく判定される可能性が高くなる。これにより、本実施形態によれば、医療従事者に負担をかけることなく、医療従事者が行った行為および業務の内容を高精度に特定することができる。
【0056】
また、本実施形態によれば、機械学習を行うために、動作検知センサ101により検知される動作データに対して行為内容および業務内容を示す情報を正解ラベルとして付与する必要がない。すなわち、任意に設定された学習用データ収集期間において、動作検知センサ101と音声検知センサ102とを携行した医療従事者が実際に業務を行っている際に検知される動作データと音声データとを逐次取得して学習用データ記憶部23に記憶する一方、業務を行うときに通常発せられる発話内容に基づいて関連付け情報を生成しておけばよく、学習用データの収集を含む機械学習を効率的に行うことが可能である。
【0057】
ここで、第1の判定モデル13aの生成に使用される動作データと発話内容の文字データは、医療従事者が業務を行うときに動作検知センサ101により検知された動作データと、その業務の実施の際に医療従事者により実際に発せられた発話内容の音声データから変換された文字データとのセットであるから、強い相関がある。また、第2の判定モデル13bに設定される関連付け情報は、業務を行うときに通常発せられる発話内容に基づいて生成されるものであるから、関連付け情報により関連付けられる発話内容と行為内容および業務内容との間にも強い相関がある。よって、このようにして生成される第1の判定モデル13aおよび第2の判定モデル13bを用いて医療従事者の行為内容および業務内容を特定することにより、医療従事者の行為内容および業務内容を高精度に特定することができる。
【0058】
なお、上記実施形態では、動作検知センサ101として姿勢検知センサを用いる例について説明したが、本発明はこれに限定されない。例えば、動作検知センサとして、医療従事者が動作を行っている位置を検知する位置検知センサを更に用いてもよい。医療従事者が行う種々の業務には、例えば患者や要介護者のベッドサイドなどの一箇所に留まって行うものや、ベッドサイドと他の場所との複数箇所を移動しながら行うものが存在する。医療従事者の姿勢だけでなく、存在位置も検知して業務内容の特定に活用することにより、医療従事者の行為内容および業務内容をより高精度に特定することが可能となる。ここで、動作検知センサを小型化したり、必要なセンサ類のみを使用したりすることで、医療従事者が従来技術のような大型のアシスト装置を装着することなく行為内容および業務内容を特定することができる。
【0059】
また、動作検知センサとして、医療従事者が業務を行う際に使用する機器に対する操作(例えば、吸引装置のコック弁操作や医療機器の電源スイッチ操作など)を検知する操作検知センサを更に用いてもよい。医療従事者の姿勢だけでなく、医療従事者が使用している機器も検知して行為内容および業務内容の特定に活用することにより、医療従事者の行為内容および業務内容をより高精度に特定することが可能となる。
【0060】
また、上記実施形態では、機械学習の学習用データとして音声データを収集する際に、どの医療従事者からの発話音声であるかを確認していないが、これに限定されない。例えば、医療従事者からの発話音声を出力する装置を設け、この出力される音声を医療従事者本人や発話音声判定機器が確認できるようにしても良い。これにより、医療従事者本人の音声データに基づいて正しく機械学習を行うことができる。
【0061】
また、第1の判定モデル13aから出力される発話内容の情報を音声データに変換して出力する装置を設け、この装置から出力される音声を医療従事者本人が確認し、判定結果の正誤を示す情報を発話で第1の判定モデル13aにフィードバックすることにより、機械学習が正しく行われているか否かの情報を報酬として与える強化学習を行うようにしてもよい。このようにすれば、医療従事者別の学習レベルの度合い(適合率や再現率)を把握することが可能である。なお、夜間帯など患者が就寝中である時間帯があることを考慮し、第1の判定モデル13aから出力される発話内容の情報をリスト(テキストファイルやCSVファイルなど)として出力し、正誤を示す報酬情報の第1の判定モデル13aに対するフィードバック入力をリストとして行うようにしてもよい。
【0062】
また、上記実施形態では、医療従事者ごとに判定を行っているが、これに限定されない。例えば、判定モデルが未完成である新たに着任した医療従事者などに対し、他者である複数人の判定モデルをコピーし、動作データから行為内容や業務内容を示す情報を出力するようにしても良い。ここで、誤った判定を行った際にはその判定が誤りであることを学習させることで、短期間にて新たに着任した医療従事者に対する判定モデルの構築を可能とする。
【0063】
上記実施形態では、医療従事者の行為内容および業務内容を特定する例について説明したが、本発明はこれに限定されない。例えば、業務内容までは特定せず、業務を実施する際に行われる個々の行為内容を特定するのみとしてもよい。また、行為内容を特定せず、業務内容を直接特定するようにしてもよい。
【0064】
その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【符号の説明】
【0065】
10 業務特定装置
11 動作データ取得部
12 業務判定部
13 判定モデル
13a 第1の判定モデル
13b 第2の判定モデル
20 モデル生成装置
21 学習用データ取得部
21a 動作データ取得部
21b 音声データ取得部
21c テキスト変換部
22 判定モデル生成部
22a 第1の判定モデル生成部
22b 関連付け情報生成部
23 学習用データ記憶部
101 動作検知センサ
102 音声検知センサ