IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社4DINの特許一覧

特許7075063匿名加工装置、匿名加工処理方法および匿名加工処理プログラム
<>
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図1
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図2
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図3
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図4
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図5
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図6
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図7
  • 特許-匿名加工装置、匿名加工処理方法および匿名加工処理プログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-05-17
(45)【発行日】2022-05-25
(54)【発明の名称】匿名加工装置、匿名加工処理方法および匿名加工処理プログラム
(51)【国際特許分類】
   G06F 21/62 20130101AFI20220518BHJP
   G16H 10/60 20180101ALI20220518BHJP
【FI】
G06F21/62 354
G16H10/60
【請求項の数】 3
(21)【出願番号】P 2020075718
(22)【出願日】2020-04-06
(65)【公開番号】P2021166026
(43)【公開日】2021-10-14
【審査請求日】2020-05-08
(73)【特許権者】
【識別番号】520136537
【氏名又は名称】株式会社4DIN
(74)【代理人】
【識別番号】100201824
【弁理士】
【氏名又は名称】中村 智広
(72)【発明者】
【氏名】高橋 精彦
【審査官】中里 裕正
(56)【参考文献】
【文献】特開2019-144723(JP,A)
【文献】特開2020-042723(JP,A)
【文献】特開2019-101808(JP,A)
【文献】特開2016-033730(JP,A)
【文献】ELE EMAN, K, ARBUCKLE, L. ,データ匿名化手法 ヘルスデータ事例に学ぶ個人情報保護,株式会社オライリー・ジャパン,2015年05月22日,pp.1-22,91-112,141-163
【文献】中村優一, 細江貴博, 西宏章,二次利用のためのデータ属性を考慮した匿名化加工手法の提案と検討,電子情報通信学会技術研究報告,2016年12月08日,第116巻 第364号,pp.13-18
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/62
G16H 10/60
(57)【特許請求の範囲】
【請求項1】
医療機関が保有する医療情報を研究用に匿名加工化する匿名加工装置であって、
前記匿名加工装置には匿名化対象データを記憶する匿名化対象データ記憶装置と、
前記匿名化対象データ記憶装置が記憶する匿名化対象データを取得して匿名加工する演算装置と、
匿名加工情報を出力する手段を有する匿名加工情報出力部と
を有し、
前記匿名加工する演算装置には、
前記匿名対象データ記憶装置にアクセスして匿名化対象データを取得する匿名化対象データ取得手段と、
前記匿名化対象データを匿名加工する匿名加工処理ルールを取得する手段と、
前記匿名加工処理ルールに基づいて前記匿名化対象データを加工し、日付間の依存関係を失わずに臨床的価値を保った匿名加工情報を作成する匿名加工処理手段と、を備え
前記匿名加工処理ルールには、
前記匿名化対象データのIDとコードの情報を匿名化する「患者コード匿名化」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」の一または二以上の匿名加工処理ルールと、
前記匿名化対象データの日付に関する情報を匿名化する「日付ずらし」、「日付ずらし治験機関判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」の一または二以上の匿名加工処理ルールと、
前記「治験期間判定項目」の匿名加工ルールを実行した匿名加工情報を匿名化対象データから除外する匿名加工処理ルールと、
前記匿名化対象データの年齢、身長、体重の情報を匿名化する「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」の一または二以上の匿名加工処理ルールと、
前記匿名化対象データの郵便番号の情報を匿名化する「郵便番号3桁」の匿名加工処理ルールと、
前記匿名化対象データの空白文字を含む不正データの情報を匿名化する「後ろの半角空白を削除」の匿名加工処理ルールと、
前記匿名化対象データの全ての情報を匿名化する「文字クリア」の匿名加工処理ルールの一つまたは二以上の匿名加工処理ルールと、を備え、
前記匿名化対象データ記憶装置が記憶する前記匿名化対象データを前記演算装置で演算して日付に関する項目を抽出し、
前記演算装置においてランダム発番された数値を日付ずらし日数として演算し、
前記日付ずらし日数を前記日付に関する項目に加除する演算を行って前記匿名加工情報を作成すること、
を特徴とする匿名加工装置。
【請求項2】
医療機関が保有する医療情報を研究用に匿名加工化する匿名加工方法であって、
前記匿名加工方法には、匿名加工についてのルールを取得して匿名化対象データの入力を受け付ける匿名化対象データ取得ステップと、
前記匿名化対象データを匿名加工する匿名加工処理ルールの入力を受け付ける匿名加工処理ルール入力ステップと、
前記匿名加工処理ルール入力ステップで入力された匿名加工処理ルールを記憶装置に保存するステップと、
前記記憶装置に保存された匿名加工処理ルールを演算装置が受信するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データのIDとコードの情報を匿名化するよう、「患者コード匿名化」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」の一または二以上の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの日付に関する情報を匿名化するよう、「日付ずらし」、「日付ずらし治験機関判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」の一または二以上の匿名加工処理ルールを実行するステップと、
前記演算装置が受信した匿名加工処理ルールの情報に基づいて、前記「治験期間判定項目」を実行した匿名加工情報を匿名化対象データから除外するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの年齢、身長、体重の情報を匿名化するよう、「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」の一または二以上の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの郵便番号の情報を匿名化するよう、「郵便番号3桁」の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの空白文字を含む不正データの情報を匿名化するよう、「後ろの半角空白を削除」の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの全ての情報を匿名化するよう、「文字クリア」の匿名加工処理ルールを実行するステップと、
日付間の依存関係を失わずに臨床的価値を保った匿名加工情報を作成する匿名加工処理ステップと、
前記匿名加工処理ルールに従った匿名加工情報を記録して出力する匿名加工情報出力ステップと、
をコンピュータが実行して匿名加工化することを特徴とする匿名加工方法。
【請求項3】
医療機関が保有する医療情報を研究用に匿名加工化する匿名化プログラムであって、
前記匿名加工方法には、匿名加工についてのルールを取得して匿名化対象データの入力を受け付ける匿名化対象データ取得ステップと、
前記匿名化対象データを匿名加工する匿名加工処理ルールの入力を受け付ける匿名加工処理ルール入力ステップと、
前記匿名加工処理ルール入力ステップで入力された匿名加工処理ルールを記憶装置に保存するステップと、
前記記憶装置に保存された匿名加工処理ルールを演算装置が受信するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データのIDとコードの情報を匿名化するよう、「患者コード匿名化」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」の一または二以上の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの日付に関する情報を匿名化するよう、「日付ずらし」、「日付ずらし治験機関判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」の一または二以上の匿名加工処理ルールを実行するステップと、
前記演算装置が受信した匿名加工処理ルールの情報に基づいて、前記「治験期間判定項目」を実行した匿名加工情報を匿名化対象データから除外するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの年齢、身長、体重の情報を匿名化するよう、「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」の一または二以上の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの郵便番号の情報を匿名化するよう、「郵便番号3桁」の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの空白文字を含む不正データの情報を匿名化するよう、「後ろの半角空白を削除」の匿名加工処理ルールを実行するステップと、
前記演算装置が受信する匿名加工処理ルールの情報に基づいて、前記匿名化対象データの全ての情報を匿名化するよう、「文字クリア」の匿名加工処理ルールを実行するステップと、
日付間の依存関係を失わずに臨床的価値を保った匿名加工情報を作成する匿名加工処理ステップと、
前記匿名加工処理ルールに従った匿名加工情報を記録して出力する匿名加工情報出力ステップと、
を匿名加工装置のコンピュータに実行させて匿名加工化することを特徴とする匿名化プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、匿名加工のための匿名加工装置、匿名加工処理方法および匿名加工処理プログラムに関する。
【背景技術】
【0002】
近年、医療分野において、いわゆる電子カルテシステムなどの情報処理システムの導入が進み、患者の疾病や診療内容などの医療情報がコンピュータで管理されることが一般的となっている。さらに、医療研究においては、症例報告、学術研究に供する目的で、患者の医療情報を二次利用することもある。
このように、医療情報は患者のプライバシーにかかわる個人情報であるため、医療情報を利用するに当たっては万一、漏洩する事態になっても、患者のプライバシーを保護する目的から、患者個人を特定されないように匿名化することが重要な課題となっている。
【先行技術文献】
【特許文献】
【文献】特開2014-95931
【文献】特開2019-144723
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、従来の匿名加工処理は、データ内の生年月日や診断日、検査日などの日付項目に関して、日付値の日の部分を削除する方法、ランダム日付に置換する方法、のどちらかの方法が用いられているが、これらの匿名加工方法では依存関係にある異なる日付項目(例:投薬日、検査日)の関係を失ってしまうため、日付の関係性が重要である医学研究やデータ分析等で二次利用をすることができないという問題点を有していた。
【0004】
また、匿名加工処理をするにあたり、従来の技術はサーバーおよびネットワーク環境を構築し、匿名化データーベースを作成し、その匿名化データベースにアクセスしてアプリケーションプログラムを実行してデータ解析を実施していたが、匿名化データベースを作成するために大規模な投資を行わなければならず、短時間で安価かつ簡便にデータ解析をすることができないという問題点を有していた。
【0005】
本発明は、少なくとも上記のいずれかの問題点に鑑み提案されたものであり、大規模データの匿名化に関し、ネットワークやサーバーの構築などの大規模な投資を行うことなく、患者のプライバシーにかかわる情報である医療情報を短時間で容易に匿名化する匿名加工装置、匿名加工処理方法および匿名加工プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上記課題を解決するためになされたものであり、匿名加工化を容易にすることが可能な匿名加工装置、匿名加工方法、及びプログラムを提供することを目的とする。
【0007】
本発明の匿名加工装置は、医療機関が保有する医療情報を研究用に匿名加工化する匿名加工装置であって、匿名加工装置には匿名化対象データを記憶する匿名化対象データ記憶装置と、匿名化対象データ記憶装置が記憶する匿名化対象データを取得して匿名加工する演算装置と、匿名加工情報を出力する手段を有する匿名加工情報出力部とを有し、匿名加工する演算装置には、匿名対象データ記憶装置にアクセスして匿名化対象データを取得する匿名化対象データ取得手段と、匿名化対象データを匿名加工する匿名加工処理ルールを取得する手段と、匿名加工処理ルールに基づいて匿名化対象データを加工し、日付間の依存関係を失わずに臨床的価値を保った匿名加工情報を作成する匿名加工処理手段と、を備え、匿名加工処理ルールには、匿名化対象データのIDとコードの情報を匿名化する「患者コード匿名化」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」の一または二以上の匿名加工処理ルールと、匿名化対象データの日付に関する情報を匿名化する「日付ずらし」、「日付ずらし治験機関判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」の一または二以上の匿名加工処理ルールと、「治験期間判定項目」の匿名加工ルールを実行した匿名加工情報を匿名化対象データから除外する匿名加工処理ルールと、匿名化対象データの年齢、身長、体重の情報を匿名化する「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」の一または二以上の匿名加工処理ルールと、匿名化対象データの郵便番号の情報を匿名化する「郵便番号3桁」の匿名加工処理ルールと、匿名化対象データの空白文字を含む不正データの情報を匿名化する「後ろの半角空白を削除」の匿名加工処理ルールと、
匿名化対象データの全ての情報を匿名化する「文字クリア」の匿名加工処理ルールの一つまたは二以上の匿名加工処理ルールと、を備え、匿名化対象データ記憶装置が記憶する匿名化対象データを演算装置で演算して日付 に関する項目を抽出し、演算装置においてランダム発番された数値を日付ずらし日数として演算し、日付ずらし日数を日付に関する項目に加除する演算を行って匿名加工情報を作成すること、を備えることを特徴とする。
【0008】
本発明の匿名加工方法は、医療機関が保有する医療情報を研究用に匿名加工化する匿名加工方法であって、匿名加工方法には、匿名加工についてのルールを取得して匿名化対象データの入力を受け付ける匿名化対象データ取得ステップと、匿名化対象データを匿名加工する匿名加工処理ルールの入力を受け付ける匿名加工処理ルール入力ステップと、匿名加工処理ルール入力ステップで入力された匿名加工処理ルールを記憶装置に保存するステップと、記憶装置に保存された匿名加工処理ルールを演算装置が受信するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データのIDとコードの情報を匿名化するよう、「患者コード匿名化」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」の一または二以上の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの日付に関する情報を匿名化するよう、「日付ずらし」、「日付ずらし治験機関判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」の一または二以上の匿名加工処理ルールを実行するステップと、
演算装置が受信した匿名加工処理ルールの情報に基づいて、「治験期間判定項目」の匿名加工ルールを実行した匿名加工情報を匿名化対象データから除外するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの年齢、身長、体重の情報を匿名化するよう、「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」の一または二以上の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの郵便番号の情報を匿名化するよう、「郵便番号3桁」の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの空白文字を含む不正データの情報を匿名化するよう、「後ろの半角空白を削除」の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの全ての情報を匿名化するよう、「文字クリア」の匿名加工処理ルールを実行するステップと、日付間の依存関係を失わずに臨床的価値を保った匿名加工情報を作成する匿名加工処理ステップと、匿名加工処理ルールに従った匿名加工情報を記録して出力する匿名加工情報出力ステップとをコンピュータが実行して匿名加工化することを特徴とする。
【0009】
本発明の匿名化プログラムは、医療機関が保有する医療情報を研究用に匿名加工化する匿名化プログラムであって、匿名加工方法には、匿名加工についてのルールを取得して匿名化対象データの入力を受け付ける匿名化対象データ取得ステップと、匿名化対象データを匿名加工する匿名加工処理ルールの入力を受け付ける匿名加工処理ルール入力ステップと、記匿名加工処理ルール入力ステップで入力された匿名加工処理ルールを記憶装置に保存するステップと、記憶装置に保存された匿名加工処理ルールを演算装置が受信するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データのIDとコードの情報を匿名化するよう、「患者コード匿名化」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」の一または二以上の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの日付に関する情報を匿名化するよう、「日付ずらし」、「日付ずらし治験機関判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」の一または二以上の匿名加工処理ルールを実行するステップと、演算装置が受信した匿名加工処理ルールの情報に基づいて、「治験期間判定項目」の匿名加工ルールを実行した匿名加工情報を匿名化対象データから除外するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの年齢、身長、体重の情報を匿名化するよう、「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」の一または二以上の匿名加工処理ルールを実行するステップと、記演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの郵便番号の情報を匿名化するよう、「郵便番号3桁」の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの空白文字を含む不正データの情報を匿名化するよう、「後ろの半角空白を削除」の匿名加工処理ルールを実行するステップと、演算装置が受信する匿名加工処理ルールの情報に基づいて、匿名化対象データの全ての情報を匿名化するよう、「文字クリア」の匿名加工処理ルールを実行するステップと、日付間の依存関係を失わずに臨床的価値を保った匿名加工情報を作成する匿名加工処理ステップと、匿名加工処理ルールに従った匿名加工情報を記録して出力する匿名加工情報出力ステップとを匿名加工装置のコンピュータに実行させて匿名加工化することを特徴とする。
【発明の効果】
【0010】
本発明によれば、大規模な投資を行うことなく、個人情報の匿名加工化を短時間で容易にし、さらに、依存関係にある異なる日付項目の関係を失わずに医学研究やデータ分析等に二次利用することができ、よって匿名加工情報の利活用を促進させ、医学研究の発展や医療の進歩に寄与することが可能となる。
【図面の簡単な説明】
【0011】
図1】本実施形態に係る匿名加工装置10の構成例を示すブロック図である。
図2】匿名加工装置のハードウエア構成である。
図3】匿名加工プログラム46のフローチャートである。
図4】匿名加工ルールの表示例である。
図5】本実施形態に係る匿名加工処理アプリの初期設定画面の一例を示す図である。
図6】本実施形態に係る匿名加工処理アプリの匿名加工処理のルール設定画面の一例を示す図である。
図7】本実施形態に係る匿名加工処理アプリの匿名加工処理を実行する画面の一例を示す図である。
図8】本実施形態に係る匿名加工処理アプリで匿名加工されたデータの画面の一例を示す図である。
【発明を実施するための形態】
【0012】
[第1の実施形態]
図1は、本発明の実施形態に係る匿名加工装置10の構成例を示すブロック図である。
図2は、匿名加工装置のハードウエア構成を示す。CPU30には、メモリ32、ディスプレイ34、ハードディスク36、通信回路38、キーボード/マウス40、DVD-ROMドライブ42が接続されている。ハードディスク36には、オペレーティングシステム44、匿名加工プログラム46が記録されている。匿名加工プログラム46は、オペレーティングシステム44と協同してその機能を発揮するものである。
【0013】
これらのプログラムは、DVD-ROMやCD-ROM(図2には不図示)に記録されていたものを、DVD-ROMドライブ42を介してハードディスク36にインストールしたものである。なお、インストール手段に限定はなく、ネットワークを介してダウンロードしたものであってもよい。
【0014】
図3は、匿名加工プログラム46のフローチャートを示す。CPU30は、匿名化を行いたい患者の個人情報(匿名化対象データ)を取得し、ハードディスク36に記憶する(ステップS1)。
【0015】
次に、CPU30はハードディスク36に記録された匿名加工プログラム46に格納される匿名加工ルールを表示する(ステップS2)。
【0016】
その表示例を、図4に示す。ここでは、匿名加工処理ルールが、「患者コード匿名化」、「日付ずらし」、「日付ずらし治験期間判定項目」、「治験期間判定項目」、「年のみ」、「年月のみ」、「文字クリア」、「後ろの半角空白を削除」、「郵便番号3桁」、「医師コード匿名化」、「看護師コード匿名化」、「スタッフコード匿名化」、「紹介病院コード匿名化」、「年齢丸め(90歳以上)」、「年齢階層化」、「身長丸め(190cm以上)」、「身長階層化」、「体重丸め(120kg以上)」、「体重階層化」といった匿名加工ルールであること等が示されている。
【0017】
「患者コード匿名化」とは、患者毎に振り分けられた患者コードをハッシュ値(SHA-256、つまり任意の長さの原文から固定長の特徴的な値を算出するハッシュ関数として、256ビットのハッシュ値を算出する)で匿名化するルールのことである。「日付ずらし」とは、プロジェクト(施設や研究)単位にずらす日数範囲を-365日から365日の範囲で指定し、設定した日数範囲内でランダム発番された数値をずらす日数として患者ごとに決定する。そして、日付値を患者ごとに異なる日数分ずらすルールのことであり、依存関係にある異なる日付項目の関係性を失わずに日付をずらすことができる。例えば、患者Aが3月1日に糖尿病薬を服用し、3月14日にヘモグロビンA1cの検査値が6.2であった場合、日付ずらしの匿名加工処理を実施すると、3月11日に糖尿病薬を服用し、3月24日にヘモグロビンA1cの検査値が6.2となり、服用日や検査日といった日付項目は一律にずれるが、投薬後14日後の検査値は6.2であるという臨床的価値を保つことができる。「日付ずらし治験期間判定項目」とは、事前に設定した範囲で患者ごとにランダムな異なる日付を一律でずらし、治験期間に該当する患者の各種レコードを除外するルールのことであり、依存関係にある異なる日付の関係性を失わずに日付をずらすことができる。また「日付ずらし治験機関判定項目」は患者ごとに異なる日数分ずらすことができる。「治験期間判定項目」とは、治験期間に該当する患者を除外するルールのことである。「年のみ」とは、日付の月と日を削除し、年のみ出力するルールのことである。「年月のみ」とは、日付の日を削除し、年月のみ出力するルールのことである。「文字クリア」とは入力した内容を削除して空白を出力するルールのことである。「後ろの半角空白を削除」とは、データの後ろに付いた不要な半角空白を削除するルールのことである。「郵便番号3桁」とは、郵便番号7ケタ(地区レベル)を3桁(市区町村レベル)にして、住所の匿名化を行うルールのことである。「医師コード匿名化」とは、医師コードをハッシュ値(SHA-256、つまり任意の長さの原文から固定長の特徴的な値を算出するハッシュ関数として、256ビットのハッシュ値を算出する)で匿名化するルールのことである。「看護師コード匿名化」とは、看護師コードをハッシュ値(SHA-256、つまり任意の長さの原文から固定長の特徴的な値を算出するハッシュ関数として、256ビットのハッシュ値を算出する)で匿名化するルールのことである。「スタッフコード匿名化」とは、スタッフコードをハッシュ値(SHA-256、つまり任意の長さの原文から固定長の特徴的な値を算出するハッシュ関数として、256ビットのハッシュ値を算出する)で匿名化するルールのことである。「紹介病院コード匿名化」とは、紹介病院コードをハッシュ値(SHA-256、つまり任意の長さの原文から固定長の特徴的な値を算出するハッシュ関数として、256ビットのハッシュ値を算出する)で匿名化するルールのことである。「年齢丸め(90歳以上)」とは、年齢が90歳を超える場合には、90歳として匿名化するルールのことである。「年齢階層化」とは、年齢を10歳刻みで、例えば55歳であれば「50歳以上-60歳未満」というように「●●歳以上-●●歳未満」として匿名化するルールのことである。「身長丸め(190cm以上)」とは、身長が190cmを超える場合、190cmとして匿名化するルールのことである。「身長階層化」とは、身長を10cm刻みで、例えば155cmであれば、「150cm以上-160cm未満」というように「●●cm以上-●●cm未満」として匿名化するルールのことである。「体重丸め(120kg以上)」とは、体重が120kgを超える場合、120kgとして匿名化するルールのことである。「体重階層化」とは、体重を10kg刻みで、例えば45kgであれば、「40kg以上-50kg未満」というように「●●kg以上-●●kg未満」として匿名化するルールのことである。
【0018】
次に、ユーザーは、この画面から、キーボード/マウス40を用いて、所望の匿名加工ルールを選択する(ステップS3)。匿名加工ルールの選択は1つであってもよいし、2つ以上のルールを選択してもよい。
【0019】
次に、CPU30は、記憶された匿名化対象データについて、匿名加工ルールに基づいて匿名加工処理を実行する(ステップS4)。
【0020】
CPU30は、得られた匿名化対象データをハードディスク36に記憶する(ステップS5)。
【0021】
上記実施形態では、匿名加工装置はスタンドアローンのPCとして構成している。しかし、匿名加工装置はサーバー装置として構成し、インターネットなどを介して端末装置から使用できるようにしてもよい。
【0022】
以上、説明した実施形態によれば、大規模な投資を行うことなく、個人情報の匿名加工化を短時間かつ容易にし、さらに依存関係にある異なる日付項目の関係を失わずに医学研究やデータ分析等で二次利用することができ、よって匿名加工情報の利活用を促進させ、医学研究の発展や医療の進歩に寄与することが可能となる。
【0023】
実施形態を用いて本発明を説明したが、本発明の技術的範囲は、上記各実施形態の記載に限定されない。上記実施形態に多様な変更又は改良を加えることが可能であることは当業者にとって自明である。従って、そのような変更又は改良を加えた形態もまた本発明の技術的範囲に含まれることは説明するまでもない。また、以上に説明した実施形態において使用される、数値や各構成の名称等は例示的なものであり適宜変更可能である。
【0024】
以下、ディスプレイ34の画面例を参照しながら、実施される匿名加工処理について詳しく説明する。
【0025】
(初期設定)
図5は、本実施形態に係る匿名加工処理アプリの初期設定画面の一例を示す図である。はじめに、ユーザーは、ディスプレイ34に表示されるメニュー(施設選択)画面により、初期設定を行う。
【0026】
画面Aは、匿名加工処理アプリのトップ画面を示す。ユーザーは、初めて匿名加工処理を行う場合、ユーザー登録が必要となる。一方、すでにユーザー登録が済んでいる場合、IDおよびパスワードを入力して「ログイン」をキーボード/マウス40を用いて選択する。
【0027】
画面Bは、匿名加工処理アプリのメニュー(施設選択)画面を示す。ユーザーは、初めて匿名加工処理を行う場合、「新規登録(施設/研究)ボタンをキーボード/マウス40を用いて選択し、施設や研究を新たに登録する。
【0028】
画面C1は、匿名加工処理アプリの「新規施設登録/新規研究登録」画面を示す。ユーザーは、研究機関名や研究名、データベース名を入力するとともに、日付を匿名化する際に、日付をずらす範囲を-365日から365日の範囲で指定する。ユーザーは入力した必要項目を確認し、入力に誤りがなければ、「新規登録(施設/研究)」ボタンをキーボード/マウス40を用いて選択することで、施設登録/研究登録が完了する。
なお、画面C2は、匿名加工処理アプリの「施設/研究の修正・削除」画面を示す。ユーザーは、登録した施設や研究の修正・削除をする場合、その施設を選択し、「修正・削除」ボタンをキーボード/マウス40を用いて選択する。次に、画面C3は、医療機関名/研究名入力画面を示す。ユーザーは、修正する施設や研究の名前を入力し、「更新」ボタンをキーボード/マウス40を用いて選択すると、更新処理を確認するメッセージが表示される。ユーザーは入力に誤りがないことを確認して「はい」ボタンを選択して処理を続行する。キャンセルしたい場合は「いいえ」ボタンをキーボード/マウス40を用いて選択する。
【0029】
画面Dは、匿名加工処理アプリの「ファイル連結」画面を示す。ユーザーは、患者の個人情報が記録される各ファイルを一つするため、各ファイルを連結させたい場合、一方のファイルを「ヘッダーファイル」欄に入力し、他方のファイルを「データファイル」欄に入力し、出力先を指定し、ユーザーは入力に誤りがないことを確認して「ファイル連結」ボタンをキーボード/マウス40を用いて選択する。すると、連結したファイルが作成される。
【0030】
(匿名加工処理のルール設定)
図6は本実施形態に係る匿名加工処理アプリの匿名加工処理のルール設定画面の一例を示す図である。
画面Aは、匿名加工処理ルールを設定する画面を示す。ユーザーは「ファイル選択」ボタンを選択して、匿名化対象データを指定する。DPC(診断群分類包括評価制度、Diagnosis(診断) Procedure(診療行為) Combination(組み合わせ))チェックボックスにチェックを入れると日付ずらしを行わないが、データ入力した際に日付ずらし用の数値が追加されるため、この数値を日付に足して計算することで匿名化することができる。
画面Bは、匿名化対象データを読み込んだ画面を示す。匿名化対象データが読み込まれるとデータの一部が画面に表示されるので、ユーザーは、匿名加工処理ルールを選択して設定する。ユーザーは設定を終えたら、「ルール設定」ボタンを選択すると匿名加工処理ルールが登録される。
画面Cは、特定の患者を除外するルールを設定する画面を示す。ユーザーは、テストデータの患者など除外したいデータがある場合は、患者IDリストのファイルを登録することで除外することができる。ユーザーは「除外患者ID登録」ボタンを選択すると登録済みデータが表示されるので、[ファイル選択]ボタンをクリックして、ユーザーが読み込みたい患者IDリストを指定する。ファイルに項目名がある場合は、[ヘッダー有]チェックボックスにチェックを入れる。ファイルが読み込まれると全データが表示されるので、[除外患者ID登録]ボタンをクリックすると、特定の患者を除外するルールの登録処理が行われる。
画面Dは、特定の治験対象の患者を除外するルールを設定する画面を示す。ユーザーは、除外したい治験患者データがある場合、治験患者IDリストのファイルを登録することで除外することができる。ユーザーは▲1▼[治験患者除外一覧表示]ボタンを選択すると登録済みデータが表示されるので、▲2▼[ファイル選択]ボタンをクリックして、ユーザーが読み込みたい患者IDリストを指定する。ファイルに項目名がある場合は、▲3▼[ヘッダー有]チェックボックスにチェックを入れる。ファイルが読み込まれると全データが表示されるので、[治験患者除外設定]ボタンをクリックすると、特定の治験患者の治験対象期間に該当するデータを除外するルールの登録処理が行われる。
【0031】
(匿名加工処理実行)
図7は、本実施形態に係る匿名加工処理アプリの匿名加工処理を実行する画面の一例を示す。ユーザーは、匿名化対象データが入るフォルダと匿名処理後のデータを出力するフォルダを指定し、入力に誤りがないことを確認して「匿名化処理実行」ボタンを選択する。
図8は、本実施形態に係る匿名加工処理アプリで匿名加工されたデータの画面の一例を示す。患者Aが3月1日に糖尿病薬を服用し、3月14日にヘモグロビンA1cの検査値が6.2であった場合、日付ずらしの匿名加工処理を実施すると、3月11日に糖尿病薬を服用し、3月24日にヘモグロビンA1cの検査値が6,2となり、服用日や検査日といった日付項目は一律にずれるが、投薬後14日後の検査値は6.2であるという臨床的価値を保つことができる。
【0032】
以上によって、個人情報の匿名加工化を短時間で容易にし、さらに依存関係にある異なる日付項目の関係を失わずに医学研究やデータ分析等で二次利用することができ、よって匿名加工情報の利活用を促進させ、医学研究の発展や医療の進歩に寄与することが可能となる。
【符号の説明】
【0033】
10…匿名加工装置
30…CPU
32…メモリ
34…ディスプレイ
36…ハードディスク
38…通信回路
40…キーボード/マウス
42…DVD-ROMドライブ
44…オペレーティングシステム
46…匿名加工プログラム
S1…匿名加工対象データの取得
S2…匿名加工ルールの表示
S3…匿名加工ルールの選択
S4…匿名加工処理
S5…匿名化データの記録
図1
図2
図3
図4
図5
図6
図7
図8