(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-10-01
(45)【発行日】2025-10-09
(54)【発明の名称】コンピュータ実装方法、コンピュータ・プログラム、およびコンピュータ・システム
(51)【国際特許分類】
G06F 21/62 20130101AFI20251002BHJP
【FI】
G06F21/62 309
(21)【出願番号】P 2021195948
(22)【出願日】2021-12-02
【審査請求日】2024-05-16
(32)【優先日】2020-12-02
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【氏名又は名称】太佐 種一
(72)【発明者】
【氏名】ゾン ピーター
(72)【発明者】
【氏名】ジメノ イェペス アンティニオ ホセ
(72)【発明者】
【氏名】メヘディ レニン
【審査官】川原 光司
(56)【参考文献】
【文献】特開2010-072690(JP,A)
【文献】特開2006-243819(JP,A)
【文献】米国特許出願公開第2019/0129968(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 12/14
G06F 21/10
G06F 21/60-21/88
(57)【特許請求の範囲】
【請求項1】
1つまたは複数のプロセッサによって、第1のドキュメントの第1のレイアウトを決定する段階であって、前記第1のレイアウトは、前記第1のドキュメントの1つまたは複数のコンポーネントを含む、段階と、
1つまたは複数のプロセッサによって、前記1つまたは複数のコンポーネントについてのコンポーネント種類へのユーザのアクセスを許可するアクセス・ポリシーを定義する段階であって、事前定義済みレイアウト類似度閾値内でレイアウトが一致するドキュメントへ前記アクセス・ポリシーが動的に適用される、段階と、
1つまたは複数のプロセッサによって、第2のドキュメントが、前記事前定義済みレイアウト類似度閾値内で前記第1のレイアウトと一致する第2のレイアウトを有することを決定する段階と、
前記第2のドキュメントにアクセスするために前記ユーザから要求を受け取る段階と、
1つまたは複数のプロセッサによって、前記要求を受け取ることに応じて、前記アクセス・ポリシーと前記第2のレイアウトとに基づいて前記第2のドキュメントにおけるコンポーネントへの前記ユーザのアクセスを許可する段階であって、当該コンポーネントが、前記コンポーネント種類に関するものである、段階と
を備える、コンピュータ実装方法。
【請求項2】
前記アクセス・ポリシーは、前記第1のドキュメントおよび前記第2のドキュメントの外部に記憶される、請求項1に記載のコンピュータ実装方法。
【請求項3】
前記アクセス・ポリシーを定義する段階は、アクセス・レベルを定義する段階を含む、請求項1または2に記載のコンピュータ実装方法。
【請求項4】
1つまたは複数のプロセッサによって、前記第1のドキュメントおよび前記第2のドキュメントに対する前記アクセス・レベルを動的に変更する段階をさらに備える、請求項3に記載のコンピュータ実装方法。
【請求項5】
前記第2のドキュメントにおける前記コンポーネントを前記ユーザへ提示する段階を更に備える、請求項3または4に記載のコンピュータ実装方法。
【請求項6】
1つまたは複数のプロセッサによって、前記アクセス・ポリシーに基づいて前記第2のドキュメントの前記コンポーネントを検索して取り出す段階と
をさらに備える、請求項1から5のいずれか一項に記載のコンピュータ実装方法。
【請求項7】
前記1つまたは複数のコンポーネントは、表と図と区分とからなるグループから選択される、請求項1から6のいずれか一項に記載のコンピュータ実装方法。
【請求項8】
プロセッサに、
第1のドキュメントの第1のレイアウトを決定する手順であって、前記第1のレイアウトは前記第1のドキュメントの1つまたは複数のコンポーネントを含む、手順と、
前記1つまたは複数のコンポーネントについてのコンポーネント種類へのユーザのアクセスを許可するアクセス・ポリシーを定義する手順であって、事前定義済みレイアウト類似度閾値内でレイアウトが一致するドキュメントへ前記アクセス・ポリシーが動的に適用される、手順と、
第2のドキュメントが、前記事前定義済みレイアウト類似度閾値内で前記第1のレイアウトと一致する第2のレイアウトを有することを決定する手順と、
前記第2のドキュメントにアクセスするために前記ユーザから要求を受け取る手順と、
前記要求を受け取ることに応じて、前記アクセス・ポリシーと前記第2のレイアウトとに基づいて前記第2のドキュメントにおけるコンポーネントへの前記ユーザのアクセスを許可する手順であって、当該コンポーネントが、前記コンポーネント種類に関するものである、手順と
を含む、
複数の手順を実行させるコンピュータ・プログラム。
【請求項9】
前記アクセス・ポリシーは、前記第1のドキュメントおよび前記第2のドキュメントの外部に記憶される、請求項8に記載のコンピュータ・プログラム。
【請求項10】
前記アクセス・ポリシーを定義する手順は、アクセス・レベルを定義する手順を含む、請求項8または9に記載のコンピュータ・プログラム。
【請求項11】
前記プロセッサに、
前記第1のドキュメントおよび前記第2のドキュメントに対する前記アクセス・レベルを動的に変更する手順をさらに実行させる、請求項10に記載のコンピュータ・プログラム。
【請求項12】
前記プロセッサに、
前記第2のドキュメントにおける前記コンポーネントを前記ユーザへ提示する手順をさらに実行させる、請求項10または11に記載のコンピュータ・プログラム。
【請求項13】
前記プロセッサに、
前記アクセス・ポリシーに基づいて前記第2のドキュメントの前記コンポーネントを検索して取り出す手順と
をさらに実行させる、請求項8から12のいずれか一項に記載のコンピュータ・プログラム。
【請求項14】
前記1つまたは複数のコンポーネントは、表と図と区分とからなるグループから選択される、請求項8から13のいずれか一項に記載のコンピュータ・プログラム。
【請求項15】
1つまたは複数のコンピュータ・プロセッサと、1つまたは複数のコンピュータ可読記憶媒体と、前記1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つにより複数の手順を実行するために前記1つまたは複数のコンピュータ可読記憶媒体に記憶されたプログラム命令とを備えるコンピュータ・システムであって、前記複数の手順が、
第1のドキュメントの第1のレイアウトを決定する手順であって、前記第1のレイアウトは前記第1のドキュメントの1つまたは複数のコンポーネントを含む、手順と、
前記1つまたは複数のコンポーネントについてのコンポーネント種類へのユーザのアクセスを許可するアクセス・ポリシーを定義する手順であって、事前定義済みレイアウト類似度閾値内でレイアウトが一致するドキュメントへ前記アクセス・ポリシーが動的に適用される、手順と、
第2のドキュメントが、前記事前定義済みレイアウト類似度閾値内で前記第1のレイアウトと一致する第2のレイアウトを有することを決定する手順と、
前記第2のドキュメントにアクセスするために前記ユーザから要求を受け取る手順と、
前記要求を受け取ることに応じて、前記アクセス・ポリシーと前記第2のレイアウトとに基づいて前記第2のドキュメントにおけるコンポーネントへの前記ユーザのアクセスを許可する手順であって、当該コンポーネントが、前記コンポーネント種類に関するものである、手順と
を含む、コンピュータ・システム。
【請求項16】
前記アクセス・ポリシーは、前記第1のドキュメントおよび前記第2のドキュメントの外部に記憶される、請求項15に記載のコンピュータ・システム。
【請求項17】
前記アクセス・ポリシーを定義する手順は、アクセス・レベルを定義する手順を含む、請求項15または16に記載のコンピュータ・システム。
【請求項18】
前記第1のドキュメントおよび前記第2のドキュメントに対する前記アクセス・レベルを動的に変更する手順を実行させるべく、前記1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つにより実行するための前記1つまたは複数のコンピュータ可読記憶媒体に記憶されたプログラム命令をさらに備える、請求項17に記載のコンピュータ・システム。
【請求項19】
前記第2のドキュメントにおける前記コンポーネントを前記ユーザへ提示する手順をさらに実行させるべく、前記1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つにより実行するための前記1つまたは複数のコンピュータ可読記憶媒体に記憶されたプログラム命令を含む、請求項17または18に記載のコンピュータ・システム。
【請求項20】
前記アクセス・ポリシーに基づいて前記第2のドキュメントの前記コンポーネントを検索して取り出す手順を実行させるべく、前記1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つにより実行するための前記1つまたは複数のコンピュータ可読記憶媒体に記憶されたプログラム命令をさらに備える、請求項15から19のいずれか一項に記載のコンピュータ・システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般にはドキュメント・アクセス制御の分野に関し、より具体的には、ドキュメント・コンポーネント・レイアウトに基づくドキュメント・アクセス制御を提供することに関する。
【背景技術】
【0002】
物理セキュリティおよび情報セキュリティの分野では、アクセス制御は、ある場所またはその他の資源へのアクセスの選択的制限であり、一方アクセス管理はそのプロセスを表す。アクセスするという行為は、消費すること、入ること、または使用することを意味する場合がある。資源へのアクセスを許可することを権限付与と呼ぶ。錠とログイン・クレデンシャルとは、アクセス制御の互いに類似した2つの仕組みであると考えられる。ドキュメント・アクセス管理は、ドキュメント管理者がどのドキュメントをユーザ・グループが閲覧または変更することができるかを制御することができるようにする。これは、ユーザが特定のドキュメント・セットへのアクセスを管理したいと考え、新たなプロジェクトを作成することによるコーディングとメッセージングと管理とに関する完全な中断を生じさせたくない場合に有用である。
【0003】
既存のドキュメント・アクセス制御機構は、異なるユーザのために異なるレベルのアクセスを可能にするために、ドキュメント所有者による完全暗号化または小区分暗号化に依存している。これは、ドキュメント所有者が他のすべてのユーザのためにデータベース内のすべてのドキュメントを適切に暗号化することを要求し、これは、多数のユーザに合うように動的に更新することができない。現在、アクセス・ポリシーを特定のレイアウトを有するリポジトリ内の他のドキュメントに動的に適用することができるように、ドキュメントの異なる区分について異なるレベルのアクセス制御を行う選択肢はない。例えば、既存の技術では、ユーザが、別のユーザが特定の種類のドキュメントの表だけにアクセスすることができるが本文にはアクセスできないように指定することができない。
【0004】
例えば、Kanai(米国特許出願公開第2006/0265599号明細書)は、所定の資源へのアクセスを制御するアクセス制御装置を開示している。このアクセス制御装置は、所定の資源へのアクセスを試みる第1の実体と、第2の実体との所定の関係を定義する実体関係定義情報と、その所定の関係に基づいてその所定の資源に対するアクセス権を定義する間接アクセス制御情報と、実体関係定義情報に基づいて第1の実体と所定の関係にある第2の実態を検出し、検出された第2の実体との所定の関係と間接アクセス制御情報とに基づいて第1の実体のアクセス権を判定する間接アクセス権判定ユニットとを含む。
【0005】
別の例では、Neylanら(米国特許出願公開第2019/0129968号明細書)が、ユーザ識別情報に応じてファイルの特定の区分を動的に表示するためのシステムを開示している。このシステムは、作成者がファイルを作成し、それを何人かの消費者と共有し、各受信者に関連付けられたアクセス許可に応じて各受信者にそのファイルのカスタマイズされた区分のセットを閲覧させることができるようにするために、アクセス制御データを使用する。ファイルは、任意の形式、例えばワード・プロセッシング・ドキュメント、プレゼンテーション・ドキュメント、メディア・ファイル、またはいくつかの区分を有する任意のその他のファイルとすることができる。ファイルの区分は、ページ、スライド、タブ、ワークシート、ビデオ・セグメント、音声セグメントなどのデータの任意の明確な単位とすることができる。許可は、ユーザの許可レベル、職歴、技術レベル、組織における職務、肩書きなどに基づくことができる。このシステムは、消費者に関連付けられた許可に応じて、ファイルの特定の区分へのアクセスを防止することもできる。
【0006】
さらに別の例では、Mohammadら(米国特許出願公開第2020/0044843号明細書)が、ドキュメント・アクセスを規制する方法を開示している。この方法は、アクセス鍵のセットのうちのそれぞれの鍵が複合ドキュメントのコンポーネントのための異なるユーザ・アクセス特権を与えるアクセス鍵のセットをユーザに与えることと、分散記憶システム内の複数のノードを選択することと、アクセス鍵のセット、もしくは、個別鍵もしくは対称鍵またはその両方のうちの少なくとも1つ、またはその組合せの、暗号化版または非暗号化版のN個の断片を表すデータを分配することとを含む。
【先行技術文献】
【特許文献】
【0007】
【文献】米国特許出願公開第2006/0265599号明細書
【文献】米国特許出願公開第2019/0129968号明細書
【文献】米国特許出願公開第2020/0044843号明細書
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来技術の特定の欠点を克服するとともに、生産プロセスの生産性向上のためのリアルタイムの機会発見の手法の提供により、さらなる利点を提供する。プロセッサが、レイアウトがドキュメントの1つまたは複数のコンポーネントを含む、ドキュメントのレイアウトを検出するという利点がある。プロセッサが、レイアウトに基づいて1つまたは複数のコンポーネントにアクセスするためのアクセス・ポリシーを定義する。プロセッサが、アクセス・ポリシーとレイアウトとに基づいて上記1つまたは複数のコンポーネントへのアクセスの要求に権限付与する。プロセッサが、アクセス・ポリシーと権限付与された要求とに基づいて1つまたは複数のコンポーネントを検索して取り出す。
【課題を解決するための手段】
【0009】
1つまたは複数の実施形態では、ドキュメントのレイアウトを検出するためのコンピュータ実装方法が提供される。レイアウトは、ドキュメントの1つまたは複数のコンポーネントを含み得る。一実施例では、コンポーネントは、ドキュメントの図、表、区分、またはその他の小区分とすることができる。ドキュメントは、ドキュメント・リポジトリから検索して取り出すことができる。ドキュメントは、デジタル・ドキュメント、例えばスキャンされたドキュメントまたは他のデジタル形式のドキュメントとすることができる。ドキュメントは、機械学習技術を使用して分析することができるので有利である。レイアウトは、機械学習技術を使用して検出することができる。ドキュメントには、検出されたレイアウトとコンポーネントとに基づいて索引付けすることができる。一実施例では、ドキュメントは構造化形式とすることができるので有利である。別の実施例では、ドキュメントは非構造化形式とすることができる。
【0010】
1つまたは複数の実施形態では、レイアウトに基づいて、1つまたは複数のコンポーネントにアクセスするためのアクセス・ポリシーを定義するコンピュータ実装方法が提供される。このコンピュータ実装方法は、ユーザと作業とに基づいて異なるレイアウトのコンポーネントへのアクセスを提供することができるという利点がある。このコンピュータ実装方法は、レイアウトと1つまたは複数のコンポーネントとに基づいてアクセス制御を定義することができる。このコンピュータ実装方法は、レイアウトとコンポーネントとユーザ識別情報とに基づいて、アクセス・ポリシーを作成することができるので有利である。このコンピュータ実装方法は、レイアウトとコンポーネントとに基づいてアクセス・レベルを定義することもできる。このコンピュータ実装方法は、レイアウトに基づいてアクセス・レベルを動的に変更することができるので有利である。例えば、このコンピュータ実装方法は、ドキュメントに注釈を付けることによって、1つまたは複数のコンポーネント(例えば、表、図、表について説明する段落、および特定のドキュメント区分)を選択することができるので有利である。このコンピュータ実装方法は、ユーザを選択し、特定のユーザがコンポーネントのいずれかにアクセスすることができるか否かを指定することもできる。このコンピュータ実装方法は、ドキュメント・レイアウトに基づいてユーザがユーザのアクセス・レベルを動的に変更することができるようにしてもよいので有利である。このコンピュータ実装方法は、ドキュメント・レイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメントの異なるレイアウト・コンポーネントに対する動的で精細なアクセス制御を適用することもできるので有利である。
【0011】
1つまたは複数の実施形態では、アクセス・ポリシーとドキュメントのレイアウトとに基づいて、ドキュメントのコンポーネントにアクセスする要求に権限付与するコンピュータ実装方法が提供される。要求はアクセス・ポリシーに基づいて検証することができる。このコンピュータ実装方法は、ユーザからの検証された要求に基づいてコンポーネントへのアクセスを提供することができるので有利である。このコンピュータ実装方法は、ユーザがアクセスを要求し得る特定のコンポーネントを識別することができるので有利である。
【0012】
1つまたは複数の実施形態では、ドキュメントのアクセス要求のためにアクセス・ポリシーに基づいてドキュメントを検索して取り出すコンピュータ実装方法が提供される。このコンピュータ実装方法は、アクセス・ポリシーに基づいて、ドキュメントの許可されたコンポーネントを検索して取り出すことができるので有利である。ドキュメントの一部の特定のコンポーネントは、アクセス制御の詳細に基づいて判読不能にすることができる。別の実施例では、判読不能コンポーネントについてemptyを使用した内容を削除することもできる。このコンピュータ実装方法は、要求のために判読不能コンポーネントを暗号化することもできる。このコンピュータ実装方法は、要求に基づいて、一部の特定のコンポーネントを判読不能にするのに十分な程度にコンポーネントを不鮮明にすることができる。このコンピュータ実装方法は、判読不能な特定のコンポーネントおよび区分を有するドキュメントへのアクセスを提供してもよい。このコンピュータ実装方法は、許可された区分のみを抽出することができる。このコンピュータ実装方法は、索引を調べることによってユーザのアクセス・レベルに基づいてドキュメントの区分(例えば表、図)を表示するように提供することもできるので有利である。このコンピュータ実装方法は、検証された要求に基づいて1つまたは複数のコンポーネントを出力するように提供することもできる。このコンピュータ実装方法は、事前定義済み類似度閾値に基づいて、ドキュメントと他のドキュメント、例えばドキュメント・リポジトリ内のドキュメントとの間のレイアウト類似度を判定するように提供することもできる。このコンピュータ実装方法は、アクセス・ポリシーを他のドキュメントに動的に適用するように提供することもできる。
【0013】
別の態様では、1つまたは複数のコンピュータ可読記憶媒体と、1つまたは複数のコンピュータ可読記憶媒体にまとめて記憶されたプログラム命令とを含む、コンピュータ・プログラム製品が提供される。プログラム命令が、レイアウトがドキュメントの1つまたは複数のコンポーネントを含む、ドキュメントのレイアウトを検出するので有利である。プログラム命令が、レイアウトに基づいて、1つまたは複数のコンポーネントにアクセスするためのアクセス・ポリシーを定義する。プログラム命令が、アクセス・ポリシーとレイアウトとに基づいて、1つまたは複数のコンポーネントへのアクセスの要求に権限付与する。プログラム命令が、アクセス・ポリシーと権限付与された要求とに基づいて1つまたは複数のコンポーネントを検索して取り出す。
【0014】
さらに他の態様では、1つまたは複数のコンピュータ・プロセッサと、1つまたは複数のコンピュータ可読記憶媒体と、1つまたは複数のコンピュータ・プロセッサのうちの少なくとも1つのコンピュータ・プロセッサによる実行のために1つまたは複数のコンピュータ可読記憶媒体に記憶されたプログラム命令とを含む、コンピュータ・システムが提供される。プログラム命令が、レイアウトがドキュメントの1つまたは複数のコンポーネントを含む、ドキュメントのレイアウトを検出するので有利である。プログラム命令が、レイアウトに基づいて1つまたは複数のコンポーネントにアクセスするためのアクセス・ポリシーを定義する。プログラム命令が、アクセス・ポリシーとレイアウトとに基づいて1つまたは複数のコンポーネントへのアクセスの要求に権限付与する。プログラム命令が、アクセス・ポリシーと権限付与された要求とに基づいて、1つまたは複数のコンポーネントを検索して取り出す。
【0015】
その他の特徴および利点も、本発明の技術により実現される。本発明のその他の実施形態および態様についても本明細書で詳細に説明され、請求項に係る本発明の一部とみなされる。
【図面の簡単な説明】
【0016】
【
図1】本開示の一実施形態による、ドキュメント・アクセス制御環境を示す機能ブロック図である。
【
図2】本開示の一実施形態による、
図1のコンピューティング・デバイス内のドキュメント・アクセス制御モジュール110の動作ステップを示すフローチャートである。
【
図3】本開示の一実施形態による、
図1のコンピューティング・デバイス内のドキュメント・アクセス制御モジュールにおいて適用される、JavaScript(登録商標) Object Notation(JSON)で表された例示のアクセス・ポリシーを示す図である。
【
図4】本開示の一実施形態による、
図1のコンピューティング・デバイスのコンポーネントを示すブロック図である。
【発明を実施するための形態】
【0017】
本開示は、ドキュメント・コンポーネント・レイアウトに基づいてドキュメント・アクセス制御を提供するシステムおよび方法を対象とする。
【0018】
本開示の実施形態は、アクセス・ポリシーを特定の類似のレイアウトを有するドキュメント・リポジトリ内の他のドキュメントに動的に適用することができるように、ドキュメントの異なる区分のために異なるレベルのアクセス制御が必要であることを認識している。本開示の実施形態は、ドキュメントの特定の区分へのアクセスの制御を開示する。本開示の実施形態は、ドキュメント内の区分へのアクセスの管理を開示する。本開示の実施形態は、ユーザと作業とに基づいて異なるレイアウト・コンポーネントへのアクセスを提供することを開示する。
【0019】
本開示の実施形態は、ドキュメントのレイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメントの異なるレイアウト・コンポーネントへの動的で精細なアクセス制御を適用することを開示する。例えば、本開示の実施形態は、ユーザAがユーザBに、データベース内のすべての類似のドキュメント(例えば出版物、メモ、レジュメ)の表のみへのアクセスを認めることができるようにすることを開示し、このようなアクセス・ポリシーはドキュメントを変更せずに必要に応じて動的に更新することができる。本開示の実施形態は、ドキュメントを変更することなく、異なるユーザ・グループに動的に特定の種類のドキュメントにわたるアクセスを(レイアウトに基づいて)割り当てることを開示する。本開示の実施形態は、ドキュメント所有者が、元のドキュメントを変更せずに、数百万のドキュメントを備えるきわめて大規模なドキュメント・データベース内のすべてのドキュメントについて割り当てを行わずに、レイアウトの識別に基づいて複数のドキュメントにアクセスを動的に割り当てることができるようにすることを開示する。本開示の実施形態は、ユーザが、特定の区分(例えば金額の記載された表)にはアクセスすることができるが、ドキュメント内の契約/保証の区分に関連付けられた実体にはアクセスできないようにすることを開示する。本開示の実施形態は、記事へのアクセスの正規費用ではなく補助金付き費用でのドキュメント区分(例えば、表、図、または結果などの特定の区分)の購読を可能にすることを開示する。本開示の実施形態は、ユーザがドキュメントのレイアウトとコンポーネントとに基づいてドキュメント・アクセス・レベルを指定することができるようにすることを開示する。本開示の実施形態は、ユーザがドキュメント・レイアウトに基づいてユーザのアクセス・レベルを動的に変更することができるようにすることを開示する。本開示の実施形態は、ドキュメント・コンポーネント・レイアウトに基づくドキュメント・アクセス制御を開示する。本開示の実施形態は、ドキュメント・レイアウトの類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメントの異なるレイアウト・コンポーネントに対する動的で精細なアクセス制御を適用することを開示する。本開示の実施形態は、ドキュメントのレイアウトとコンポーネントとに基づいてドキュメント・アクセス・レベルを指定することを開示する。本開示の実施形態は、ユーザ・タイプと作業タイプとに基づいてアクセス制御を動的に定義することを開示する。本開示の実施形態は、アクセス制御に基づいてドキュメント・レイアウト・コンポーネントを抽出することを開示する。
【0020】
以下、本開示について図面を参照しながら詳細に説明する。
図1は、本開示の一実施形態による、全体的に100として示されているドキュメント・アクセス制御環境を示す機能ブロック図である。
【0021】
図の実施形態では、ドキュメント・アクセス制御環境100は、コンピューティング・デバイス102と、ドキュメント104と、ドキュメント・リポジトリ106と、ネットワーク108とを含む。図の実施形態では、ドキュメント104は、コンピューティング・デバイス102とドキュメント・リポジトリ106の外部にあり、ネットワーク108などの通信ネットワークを介してアクセスされる。しかし、他の実施形態では、ドキュメント104はドキュメント・リポジトリ106に記憶されていてもよい。いくつかの実施形態において、ドキュメント104はコンピューティング・デバイス102上にあってもよい。いくつかの実施形態において、ドキュメント104はコンピューティング・デバイス102から直接アクセスされてもよい。図の実施形態では、ドキュメント・リポジトリ106は、コンピューティング・デバイス102の外部にあり、ネットワーク108などの通信ネットワークを介してアクセスされる。しかし、他の実施形態では、ドキュメント・リポジトリ106は、コンピューティング・デバイス102上にあってもよい。いくつかの実施形態において、ドキュメント・リポジトリ106はコンピューティング・デバイス102から直接アクセスされてもよい。
【0022】
1つまたは複数の実施形態で、ドキュメント・リポジトリ106は、デジタル・ドキュメント、例えばスキャンされたドキュメントおよび他のデジタル形式のドキュメントを記憶するデータベースであってもよい。ドキュメント・リポジトリ106は、構造化ドキュメントと非構造化ドキュメントとを記憶してもよい。ドキュメント・リポジトリ106は、特定のユーザによってアクセスされてもよい。ドキュメント104は、ドキュメント・リポジトリ106に記憶されてもよい。ドキュメント104は、ドキュメント・リポジトリ106でアクセスされ、検索して取り出されてもよい。ドキュメント104は、レイアウト116を含むことができる。レイアウト116は、1つまたは複数のコンポーネント118a~118nを含んでもよい。例えば、コンポーネント118a~118nは、ドキュメント104の小区分とすることができる。一実施例では、コンポーネント118a~118nは、ドキュメントの図、表、区分またはその他の小区分とすることできる。ドキュメント104は、レイアウト116とコンポーネント118a~118nとに基づいて索引付けされてもよい。一実施例では、ドキュメント104は構造化形式とすることができる。別の実施例では、ドキュメント104は非構造化形式とすることができる。
【0023】
本開示の様々な実施形態において、コンピューティング・デバイス102は、ラップトップ・コンピュータ、タブレット・コンピュータ、ネットブック・コンピュータ、パーソナル・コンピュータ(PC)、デスクトップ・コンピュータ、携帯電話、スマートフォン、スマート・ウォッチ、ウェアラブル・コンピューティング・デバイス、パーソナル・デジタル・アシスタント(PDA)、またはサーバとすることができる。別の実施形態では、コンピューティング・デバイス102は、シームレスな資源の単一のプールとして機能するようにクラスタ化コンピュータとコンポーネントとを使用するコンピューティング・システムを表す。他の実施形態では、コンピューティング・デバイス102は、クラウド・コンピューティング環境におけるものなどのサーバシステムとして複数のコンピュータを使用するサーバ・コンピューティング・システムを表してもよい。一般に、コンピューティング・デバイス102は、ドキュメント・アクセス制御モジュール110とネットワーク108とにアクセスすることができ、本開示の一実施形態により、プログラム命令の処理とドキュメント・アクセス制御モジュール110の実行とが可能な、任意のコンピューティング・デバイスまたはデバイスの組合せとすることができる。コンピューティング・デバイス102は、
図4に関してさらに詳細に図示し、説明するような内部および外部ハードウェア・コンポーネントを含んでもよい。
【0024】
また、図の実施形態では、コンピューティング・デバイス102は、ドキュメント・アクセス制御モジュール110を含む。図の実施形態では、ドキュメント・アクセス制御モジュール110は、コンピューティング・デバイス102上にある。しかし、他の実施形態では、ドキュメント・アクセス制御モジュール110は、外部にあって、ネットワーク108などの通信ネットワークを介してアクセスされてもよい。通信ネットワークは、例えば、ローカル・エリア・ネットワーク(LAN)、インターネットなどのワイド・エリア・ネットワーク(WAN)、またはこの2つの組合せとすることができ、有線、無線、光ファイバ、または当技術分野で知られている任意のその他の接続を含んでよい。一般に、通信ネットワークは、本開示の所望の実施形態による、コンピュータ・デバイス102とドキュメント・アクセス制御モジュール110との間の通信をサポートすることになる接続とプロトコルとの任意の組合せとすることができる。
【0025】
1つまたは複数の実施形態では、ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116を検出するように構成される。レイアウト116は、ドキュメント104の1つまたは複数のコンポーネント118a~118nを含み得る。例えば、コンポーネント118a~118nは、ドキュメント104の小区分とすることができる。一実施例では、コンポーネント118a~118nは、ドキュメントの図、表、区分またはその他の小区分とすることができる。ドキュメント・アクセス制御モジュール110は、ドキュメント・リポジトリ106からドキュメント104を受け取ってもよい。ドキュメント・リポジトリ106は、デジタル・ドキュメント、例えばスキャンされたドキュメントまたはその他のデジタル形式のドキュメントを記憶してもよい。ドキュメント104は、ドキュメント・リポジトリ106からのデジタル・ドキュメントであってもよい。ドキュメント・アクセス制御モジュール110は、機械学習技術を使用してドキュメント104を分析してもよい。ドキュメント・アクセス制御モジュール110は、機械学習技術を使用してドキュメント104のレイアウト116を検出してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、表構造認識とセル内容認識の性能を捉える木編集距離類似度(tree edit distance similarity:TEDS)と呼ばれる評価指標を使用して、レイアウト116とコンポーネント118a~118n(例えば表)を検出してもよい。ドキュメント・アクセス制御モジュール110は、TEDSを使用してマルチホップ・セル不整合と光学式文字認識エラーとをより適切に捉えることができる。ドキュメント・アクセス制御モジュール110は、TEDSを使用して認識結果を大域木構造レベルで検査することができる。ドキュメント・アクセス制御モジュール110は、検出されたレイアウト116とコンポーネント118a~118nに基づいて、ドキュメント104に索引付けしてもよい。一実施例では、ドキュメント104は構造化形式とすることができる。別の実施例では、ドキュメント104は非構造化形式とすることができる。例えば、ドキュメント・アクセス制御モジュール110は、ラベルなしドキュメント(例えばポータブル・ドキュメント・フォーマット(PDF)ドキュメント)のセットと、拡張マークアップ言語(XML)ファイルなどの対応する構造化ドキュメントのセットとに基づいて、注釈付きドキュメント(例えばPDFドキュメント)の大きなセットを自動的に作成することができる。PDFドキュメントとXMLドキュメントとの各ペアが、異なる形式の同一の一般情報を表すことができ、PDFは人間の読者が使用しやすいように設計された形式であり、XML形式はドキュメント104の様々なコンポーネント118a~118n(例えば、段落、画像、表など)を識別するラベルを含む構造化形式である。ドキュメント・アクセス制御モジュール110は、レイアウト116の様々なコンポーネント118a~118n(例えば、文、段落、タイトル、画像、表、ヘッダ、フッタなど)を正確に識別し、ラベル付けすることができるように、各注釈付きドキュメントに自動的にラベル付けすることができる。その結果の注釈付きPDFドキュメントの大規模なセットは、次に、新たなドキュメントを分析し、新たなドキュメント、例えばドキュメント104からレイアウト要素を識別し、抽出するために、機械学習モデルを効果的にトレーニングするためのトレーニング・データとして使用することができる。ドキュメント・アクセス制御モジュール110は、レイアウト116とコンポーネント118a~118nとを識別し、抽出するためにこのトレーニング・データを使用してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116を分析するために深層ニューラル・ネットワークを使用してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、PDFを解析し、次に、解析されたPDFのラベルなし部分をXMLドキュメントのラベル付き部分と突き合わせることによって、最初はどのような指定された記述もラベルもない大量のドキュメント(例えばPDFドキュメント)にラベル付けすることができる。本開示は、一般に、本開示のシステムがトレーニング・データを自動的に生成するために使用する非構造化ドキュメントと構造化ドキュメントの例としてPDFドキュメントとXMLドキュメントを使用しているが、本発明の様々な実施形態で、他の適切な種類の非構造化ドキュメントもしくは構造化ドキュメントまたはその両方のドキュメントを代わりに使用することができることが意図されていることを理解されたい。例えば、他の種類の非構造化ドキュメントとしては、スキャンされたドキュメントとプレーン・テキスト(文字と記号を人間が知覚可能な方式で空間的に配置することによって、表、リスト、および単純な画像を作成することができる)を含めることができ、他の種類の構造化ドキュメントとしては、マークダウン、JSON、ワード・プロセッシング・ドキュメント、およびハイパーテキスト・マークアップ言語(HTML)を含めることができる。
【0026】
1つまたは複数の実施形態で、ドキュメント・アクセス制御モジュール110は、レイアウト116に基づいて1つまたは複数のコンポーネント118a~118nにアクセスするためのアクセス・ポリシーを定義するように構成される。ドキュメント・アクセス制御モジュール110は、ユーザと作業とに基づいて、異なるレイアウト・コンポーネント118a~118nへのアクセスを提供してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116と1つまたは複数のコンポーネント118a~118nとに基づいてアクセス制御を定義してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116と1つまたは複数のコンポーネント118a~118nとユーザ識別情報とに基づいて、アクセス・ポリシーを作成してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116と1つまたは複数のコンポーネント118a~118nとに基づいて、アクセス・レベルを定義してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116に基づいてアクセス・レベルを動的に変更してもよい。例えば、ドキュメント・アクセス制御モジュール110は、特定のレイアウト(例えばレイアウト116)のドキュメントを表すサンプル・ドキュメント(例えばドキュメント104)に注釈を付けることによって、1つまたは複数のコンポーネント118a~118n(例えば、表、図、表について説明している段落、および特定のドキュメント区分)を選択してもよい。ドキュメント・アクセス制御モジュール110は、ユーザを選択し、特定のユーザが、ドキュメント・データベース(例えばドキュメント・リポジトリ106)内の、レイアウト116と類似したレイアウトを有するドキュメントのコンポーネント118a~118nのいずれかにアクセスすることができるか否かを指定してもよい。ドキュメント・アクセス制御モジュール110は、コンポーネント118a~118nのいずれかにアクセスするための有効期限を設定するオプションを有してもよい。ドキュメント・アクセス制御モジュール110は、ユーザの当面の作業に基づいてアクセス制御を選択してもよい。ドキュメント・アクセス制御モジュール110は、ユーザがドキュメント104の特定の区分(例えば1つまたは複数のコンポーネント118a~118nのいずれか)にアクセスする必要があることを識別してもよい。
【0027】
ドキュメント・アクセス制御モジュール110は、特定のコンポーネント118a~118n(例えばコンポーネント118a)のみに対して制御アクセスを定義するが、他のコンポーネント118a~118n(例えばコンポーネント118n)への制御アクセスは定義しなくてもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、特定の区分(例えば、金額が記載された表)を定義するが、例示の金融ドキュメントにおける契約/保証に関連する実体は定義しなくてもよい。ドキュメント・アクセス制御モジュール110は、記事へのアクセスの正規費用ではなく補助金付き費用でのドキュメント区分(例えば、表、図、または結果などの特定の区分)の購読を可能にしてもよい。ドキュメント・アクセス制御モジュール110は、ユーザが、ドキュメント104のレイアウト116とコンポーネント118a~118nとに基づいてドキュメント・アクセス・レベルを指定することができるようにしてもよい。ドキュメント・アクセス制御モジュール110は、ユーザが、ドキュメント・レイアウト116に基づいてユーザのアクセス・レベルを動的に変更することができるようにしてもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント・レイアウトの類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメント104の異なるレイアウト・コンポーネント118a~118nへの動的で精細なアクセス制御を適用してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、事前トレーニングされた言語モデル、例えば、自然言語処理事前トレーニングのためのニューラル・ネットワーク・ベースの技術であるBERT(bidirectional encoder representations from transformers:トランスフォーマの双方向エンコーダ表現)を使用して、ドキュメント・レイアウト類似度を判定してもよい。ドキュメント・アクセス制御モジュール110は、テキスト生成のための自動評価指標、例えばBERTスコアを使用してもよい。ドキュメント・アクセス制御モジュール110は、参照文内の各トークンを使用して候補文内の各トークンの類似度スコアを計算してもよい。ドキュメント・アクセス制御モジュール110は、文脈埋め込みを使用してトークン類似度を計算してもよい。ドキュメント・アクセス制御モジュール110は、人間による判定とより良好な相関関係にあり、より強力なモデル選択性能を実現することができる。ドキュメント・アクセス制御モジュール110は、2つの文の類似度をトークンの埋め込み間のコサイン類似度の和として計算してもよい。ドキュメント・アクセス制御モジュール110は、ユーザ・タイプと作業タイプとに基づいてアクセス制御を動的に定義してもよい。ドキュメント・アクセス制御モジュール110は、アクセス制御に基づいてドキュメント・レイアウト・コンポーネント118a~118nを抽出してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116とコンポーネント118a~118nと、それぞれのユーザとを指定することによって、ユーザのアクセス・レベルを指定してもよい。
【0028】
ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーを、他のドキュメントにおいてドキュメント104と特定の類似のレイアウトを有する、ドキュメント・リポジトリ106内の他のドキュメントに動的に適用することができるように、ドキュメント104の異なるコンポーネント118a~118n(例えば異なる区分)に異なるレベルのアクセス制御を与えてもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント・レイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメントの異なるレイアウト・コンポーネントに対する動的で精細なアクセス制御を適用してもよい。例えば、ドキュメント・アクセス制御モジュール110は、ユーザAがユーザBに、ドキュメント・リポジトリ106内のすべての類似のドキュメント(例えば出版物、メモ、レジュメ)の表のみへのアクセスを認めることができるようにしてもよく、その場合、そのようなアクセス・ポリシーは必要に応じて動的に更新することができる。ドキュメント・アクセス制御モジュール110は、ドキュメント104のコンポーネント118a~118n(例えば特定の区分)に対するアクセス制御を提供してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104の個別の区分のアクセス管理を提供してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104内の個別の区分に対するアクセス制御を管理してもよい。ドキュメント・アクセス制御モジュール110は、構造化形式または非構造化形式であってもよいドキュメント104を使用してアクセス制御を管理してもよい。
【0029】
1つまたは複数の実施形態で、ドキュメント・アクセス制御モジュール110は、ドキュメント104のアクセス・ポリシーとレイアウト116とに基づいて、コンポーネント118a~118nへのアクセス要求に権限付与するように構成される。ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーに基づいて要求を検証してもよい。ドキュメント・アクセス制御モジュール110は、ユーザからの検証された要求に基づいて1つまたは複数のコンポーネント118a~118nへのアクセスを与えてもよい。ドキュメント・アクセス制御モジュール110は、ユーザがアクセスを要求し得る特定のコンポーネント(例えばコンポーネント118a~118nのいずれか)を識別してもよい。
【0030】
1つまたは複数の実施形態で、ドキュメント・アクセス制御モジュール110は、ドキュメント104のアクセス要求のためにアクセス・ポリシーに基づいてドキュメント104を検索して取り出すように構成されてもよい。ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーに基づいてドキュメント104の許可されたコンポーネント118a~118nを検索して取り出してもよい。ドキュメント・アクセス制御モジュール110は、アクセス制御の詳細に基づいて、ドキュメント104の区分(例えば一部の特定のコンポーネント118a~118n)を判読不能にしてもよい。別の実施例では、ドキュメント・アクセス制御モジュール110は、判読不能コンポーネントについてemptyを使用した内容を削除してもよい。ドキュメント・アクセス制御モジュール110は、要求のために判読不能コンポーネントを暗号化してもよい。ドキュメント・アクセス制御モジュール110は、要求に基づいて一部の特定のコンポーネントを判読不能にするのに十分な程度にコンポーネントを不鮮明にしてもよい。ドキュメント・アクセス制御モジュール110は、特定のコンポーネントと区分とが判読不能なドキュメント104へのアクセスを与えてもよい。ドキュメント・アクセス制御モジュール110は、許可された区分のみを抽出してもよい。ドキュメント・アクセス制御モジュール110は、索引を調べることによってユーザのアクセス・レベルに基づいてドキュメント区分(例えば表、図)を表示してもよい。ドキュメント・アクセス制御モジュール110は、検証された要求に基づいて1つまたは複数のコンポーネント118a~118nを出力してもよい。ドキュメント・アクセス制御モジュール110は、アクセス・レベルに基づいてコンポーネント118a~118nを表示してもよい。ドキュメント・アクセス制御モジュール110は、事前定義済み類似度閾値に基づいて、ドキュメント104と他のドキュメント、例えばドキュメント・リポジトリ106内のドキュメントとの間のレイアウト類似度を判定してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、事前トレーニング済みの言語モデル、例えば自然言語処理事前トレーニングのためのニューラル・ネットワーク・ベースの技術であるBERTを使用してドキュメント・レイアウト類似度を判定してもよい。ドキュメント・アクセス制御モジュール110は、テキスト生成のための自動評価指標、例えばBERTスコアを使用してもよい。ドキュメント・アクセス制御モジュール110は、参照文内の各トークンを使用して候補文内の各トークンの類似度スコアを計算してもよい。ドキュメント・アクセス制御モジュール110は、文脈埋め込みを使用してトークン類似度を計算してもよい。ドキュメント・アクセス制御モジュール110は、人間による判定とより良好な相関関係にあり、より強力なモデル選択性能を実現することができる。ドキュメント・アクセス制御モジュール110は、2つの文の類似度を、トークンの埋め込み間のコサイン類似度の和として計算してもよい。ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーを他のドキュメントに動的に適用してもよい。ドキュメント・アクセス制御モジュール110は、類似したレイアウトを有するドキュメント104のアクセス・ポリシーに基づいて他のドキュメントのコンポーネントを検索して取り出してもよい。
【0031】
図の実施形態では、ドキュメント・アクセス制御モジュール110は、アクセス・ポリシー・モジュール112とドキュメント検索モジュール114とを含む。1つまたは複数の実施形態で、アクセス・ポリシー・モジュール112は、レイアウト116に基づいて、1つまたは複数のコンポーネント118a~118nにアクセスするためのアクセス・ポリシーを定義するように構成される。アクセス・ポリシー・モジュール112は、ユーザと作業とに基づいて異なるレイアウト・コンポーネント118a~118nへのアクセスを与えてもよい。アクセス・ポリシー・モジュール112は、レイアウト116と1つまたは複数のコンポーネント118a~118nとに基づいてアクセス制御を定義してもよい。アクセス・ポリシー・モジュール112は、レイアウト116と、1つまたは複数のコンポーネント118a~118nと、ユーザ識別情報とに基づいて、アクセス・ポリシーを作成してもよい。アクセス・ポリシー・モジュール112は、レイアウト116と1つまたは複数のコンポーネント118a~118nとに基づいてアクセス・レベルを定義してもよい。アクセス・ポリシー・モジュール112は、レイアウト116に基づいてアクセス・レベルを動的に変更してもよい。例えば、アクセス・ポリシー・モジュール112は、ドキュメント104に注釈を付けることによって1つまたは複数のコンポーネント118a~118n(例えば、表、図、表について説明している段落、および特定のドキュメント区分)を選択してもよい。アクセス・ポリシー・モジュール112は、ユーザを選択し、特定のユーザがコンポーネント118a~118nのうちのいずれかにアクセスすることができるか否かを指定してもよい。アクセス・ポリシー・モジュール112は、コンポーネント118a~118nのいずれかにアクセスするための有効期限を設定するオプションを有してもよい。アクセス・ポリシー・モジュール112は、ユーザの当面の作業に基づいてアクセス制御を選択してもよい。アクセス・ポリシー・モジュール112は、ユーザがドキュメント104の特定の区分(例えば1つまたは複数のコンポーネント118a~118nのいずれか)にアクセスする必要があることを識別してもよい。
【0032】
アクセス・ポリシー・モジュール112は、特定のコンポーネント118a~118n(例えばコンポーネント118a)のみに対する制御アクセスを定義し、他のコンポーネント118a~118n(例えばコンポーネント118n)への制御アクセスを定義しなくてもよい。一実施例では、アクセス・ポリシー・モジュール112は、特定の区分(例えば金額が記載された表)を定義し、例示の金融ドキュメント内の契約/保証に関連する実体は定義しなくてもよい。アクセス・ポリシー・モジュール112は、記事に対するアクセスの正規費用ではなく補助金付き費用でのドキュメント区分(例えば、表、図、または結果などの特定の区分)の購読を可能にしてもよい。アクセス・ポリシー・モジュール112は、ユーザがドキュメント104のレイアウト116とコンポーネント118a~118nとに基づいてドキュメント・アクセス・レベルを指定することができるようにしてもよい。アクセス・ポリシー・モジュール112は、ユーザが、ドキュメント・レイアウト116に基づいてユーザのアクセス・レベルを動的に変更することができるようにしてもよい。アクセス・ポリシー・モジュール112は、ドキュメント・レイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメント104の異なるレイアウト・コンポーネント118a~118nに対する動的で精細なアクセス制御を適用してもよい。アクセス・ポリシー・モジュール112は、ユーザ・タイプと作業タイプとに基づいてアクセス制御を動的に定義してもよい。アクセス・ポリシー・モジュール112は、アクセス制御に基づいてドキュメント・レイアウト・コンポーネント118a~118nを抽出してもよい。アクセス・ポリシー・モジュール112は、ドキュメント104のレイアウト116とコンポーネント118a~118nと、それぞれのユーザとを指定することによって、ユーザのアクセス・レベルを指定してもよい。アクセス・ポリシー・モジュール112は、アクセス・ポリシーを、他のドキュメントにおいてドキュメント104と特定の類似のレイアウトを有する、ドキュメント・リポジトリ106内の他のドキュメントに動的に適用することができるように、ドキュメント104の異なるコンポーネント118a~118n(例えば異なる区分)に異なるレベルのアクセス制御を与えてもよい。アクセス・ポリシー・モジュール112は、ドキュメント・レイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメントの異なるレイアウト・コンポーネントに対する動的で精細なアクセス制御を適用してもよい。例えば、アクセス・ポリシー・モジュール112は、ユーザAがユーザBに、ドキュメント・リポジトリ106内のすべての類似のドキュメント(例えば出版物、メモ、レジュメ)の表のみへのアクセスを認めることができるようにしてもよく、その場合、そのようなアクセス・ポリシーは必要に応じて動的に更新することができる。アクセス・ポリシー・モジュール112は、ドキュメント104のコンポーネント118a~118n(例えば特定の区分)に対するアクセス制御を与えてもよい。アクセス・ポリシー・モジュール112は、ドキュメント104の個別の区分のアクセス管理を提供してもよい。アクセス・ポリシー・モジュール112は、ドキュメント104内の個別の区分に対するアクセス制御を管理してもよい。アクセス・ポリシー・モジュール112は、構造化形式または非構造化形式であってもよいドキュメント104を使用してアクセス制御を管理してもよい。
【0033】
1つまたは複数の実施形態で、ドキュメント検索モジュール114は、ドキュメント104のアクセス要求のためにアクセス・ポリシーに基づいてドキュメント104を検索して取り出すように構成される。ドキュメント検索モジュール114は、アクセス・ポリシーに基づいて、ドキュメント104の許可されたコンポーネント118a~118nを検索して取り出してもよい。ドキュメント検索モジュール114は、アクセス制御の詳細に基づいて、ドキュメント104の区分(例えば一部の特定のコンポーネント118a~118n)を判読不能にしてもよい。別の実施例では、ドキュメント検索モジュール114は、判読不能コンポーネントについてemptyを使用した内容を削除してもよい。ドキュメント検索モジュール114は、要求のために判読不能コンポーネントを暗号化してもよい。ドキュメント検索モジュール114は、要求に基づいて一部の特定のコンポーネントを判読不能にするのに十分な程度にコンポーネントを不鮮明にしてもよい。ドキュメント検索モジュール114は、特定のコンポーネントと区分とが判読不能なドキュメント104へのアクセスを与えてもよい。ドキュメント検索モジュール114は、許可された区分のみを抽出してもよい。ドキュメント検索モジュール114は、索引を調べることによってユーザのアクセス・レベルに基づいてドキュメント区分(例えば表、図)を表示してもよい。ドキュメント検索モジュール114は、検証された要求に基づいて1つまたは複数のコンポーネント118a~118nを出力してもよい。ドキュメント検索モジュール114は、アクセス・レベルに基づいてコンポーネント118a~118nを表示してもよい。ドキュメント検索モジュール114は、事前定義済み類似度閾値に基づいて、ドキュメント104と他のドキュメント、例えばドキュメント・リポジトリ106内のドキュメントとの間のレイアウト類似度を判定してもよい。ドキュメント検索モジュール114は、アクセス・ポリシーを他のドキュメントに動的に適用してもよい。ドキュメント検索モジュール114は、類似したレイアウトを有するドキュメント104のアクセス・ポリシーに基づいて他のドキュメントのコンポーネントを検索して取り出してもよい。
【0034】
図2は、本開示の一実施形態によるドキュメント・アクセス制御モジュール110の動作ステップを示すフローチャート200である。
【0035】
ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116を検出するように動作する。レイアウト116は、ドキュメント104の1つまたは複数のコンポーネント118a~118nを含み得る。ドキュメント・アクセス制御モジュール110は、レイアウト116に基づいて1つまたは複数のコンポーネント118a~118nにアクセスするためのアクセス・ポリシーを定義するようにも動作する。ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーとドキュメント104のレイアウト116とに基づいて、コンポーネント118a~118にアクセスする要求に権限付与するように動作する。ドキュメント・アクセス制御モジュール110は、ユーザからの要求のためにドキュメント104のアクセス・ポリシーに基づいてドキュメント104を検索して取り出すように動作する。
【0036】
ステップ202で、ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116を検出する。レイアウト116は、ドキュメント104の1つまたは複数のコンポーネント118a~118nを含み得る。例えば、コンポーネント118a~118nは、ドキュメント104の小区分とすることができる。一実施例では、コンポーネント118a~118nは、ドキュメントの図、表、区分またはその他の小区分とすることができる。ドキュメント・アクセス制御モジュール110は、ドキュメント・リポジトリ106からドキュメント104を受け取ってもよい。ドキュメント・リポジトリ106は、デジタル・ドキュメント、例えばスキャンされたドキュメントまたはその他のデジタル形式のドキュメントを記憶してもよい。ドキュメント104は、ドキュメント・リポジトリ106からのデジタル・ドキュメントであってもよい。ドキュメント・アクセス制御モジュール110は、機械学習技術を使用してドキュメント104を分析してもよい。ドキュメント・アクセス制御モジュール110は、機械学習技術を使用してドキュメント104のレイアウト116を検出してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、表構造認識およびセル内容認識の性能を捉える評価標識TEDSを使用して、レイアウト116とコンポーネント118a~118n(例えば表)を検出してもよい。ドキュメント・アクセス制御モジュール110は、TEDSを使用してマルチホップ・セル不整合と光学式文字認識エラーをより適切に捉えることができる。ドキュメント・アクセス制御モジュール110は、TEDSを使用して認識結果を大域木構造レベルで検査することができる。ドキュメント・アクセス制御モジュール110は、検出されたレイアウト116とコンポーネント118a~118nに基づいて、ドキュメント104に索引付けしてもよい。一実施例では、ドキュメント104は構造化形式とすることができる。別の実施例では、ドキュメント104は非構造化形式とすることができる。例えば、ドキュメント・アクセス制御モジュール110は、ラベルなしドキュメント(例えばPDFドキュメント)のセットと、XMLファイルなどの対応する構造化ドキュメントのセットとに基づいて、注釈付きドキュメント(例えばPDFドキュメント)の大きなセットを自動的に作成することができる。PDFドキュメントとXMLドキュメントとの各ペアが、異なる形式の同一の一般情報を表すことができ、PDFは人間の読者が使用しやすいように設計された形式であり、XML形式はドキュメント104の様々なコンポーネント118a~118n(例えば、段落、画像、表など)を識別するラベルを含む構造化形式である。ドキュメント・アクセス制御モジュール110は、レイアウト116の様々なコンポーネント118a~118n(例えば、文、段落、タイトル、画像、表、ヘッダ、フッタなど)を正確に識別し、ラベル付けすることができるように、各注釈付きドキュメントに自動的にラベル付けすることができる。その結果の注釈付きPDFドキュメントの大規模なセットは、次に、新たなドキュメントを分析し、新たなドキュメント、例えばドキュメント104からレイアウト要素を識別し、抽出するために、機械学習モデルを効果的にトレーニングするためのトレーニング・データとして使用することができる。ドキュメント・アクセス制御モジュール110は、レイアウト116とコンポーネント118a~118nとを識別し、抽出するためにこのトレーニング・データを使用してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116を分析するために深層ニューラル・ネットワークを使用してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、PDFを解析し、次に、解析されたPDFのラベルなし部分をXMLドキュメントのラベル付き部分と突き合わせることによって、最初はどのような指定された記述もラベルもない大量のドキュメント(例えばPDFドキュメント)にラベル付けすることができる。本開示は、一般に、開示されたシステムがトレーニング・データを自動的に生成するために使用する非構造化ドキュメントと構造化ドキュメントの例としてPDFドキュメントとXMLドキュメントを使用しているが、本発明の様々な実施形態で、任意の他の適切な種類の非構造化ドキュメントもしくは構造化ドキュメントまたはその両方のドキュメントを代わりに使用することができることが意図されていることを理解されたい。例えば、他の種類の非構造化ドキュメントとしては、スキャンされたドキュメントとプレーン・テキスト(文字と記号を人間が知覚可能な方式で空間的に配置することによって、表、リスト、および単純な画像を作成することができる)を含めることができ、他の種類の構造化ドキュメントとしては、マークダウン、JSON、ワード・プロセッシング・ドキュメント、およびHTMLを含めることができる。
【0037】
ステップ204で、ドキュメント・アクセス制御モジュール110は、レイアウト116に基づいて1つまたは複数のコンポーネント118a~118nにアクセスするためのアクセス・ポリシーを定義する。ドキュメント・アクセス制御モジュール110は、ユーザと作業とに基づいて異なるレイアウト・コンポーネント118a~118nへのアクセスを与えてもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116と1つまたは複数のコンポーネント118a~118nに基づいてアクセス制御を定義してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116と、1つまたは複数のコンポーネント118a~118nと、ユーザ識別情報とに基づいてアクセス・ポリシーを作成してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116と1つまたは複数のコンポーネント118a~118nとに基づいてアクセス・レベルを定義してもよい。ドキュメント・アクセス制御モジュール110は、レイアウト116に基づいてアクセス・レベルを動的に変更してもよい。例えば、ドキュメント・アクセス制御モジュール110は、特定のレイアウト(例えばレイアウト116)のドキュメントを表すサンプル・ドキュメント(例えばドキュメント104)に注釈を付けることによって、1つまたは複数のコンポーネント118a~118n(例えば、表、図、表について説明する段落、および特定のドキュメント区分)を選択してもよい。ドキュメント・アクセス制御モジュール110は、ユーザを選択し、特定のユーザがドキュメント・データベース(例えばドキュメント・リポジトリ106)内の、レイアウト116に類似したレイアウトを有するドキュメントのコンポーネント118a~118nのいずれかにアクセスすることができるか否かを指定してもよい。ドキュメント・アクセス制御モジュール110は、コンポーネント118a~118nのいずれかにアクセスするための有効期限を設定するオプションを有してもよい。ドキュメント・アクセス制御モジュール110は、ユーザの当面の作業に基づいてアクセス制御を選択してもよい。ドキュメント・アクセス制御モジュール110は、ユーザがドキュメント104の特定の区分(例えば1つまたは複数のコンポーネント118a~118nのいずれか)にアクセスする必要があることを識別してもよい。
【0038】
ドキュメント・アクセス制御モジュール110は、特定のコンポーネント118a~118n(例えばコンポーネント118a)のみに対して制御アクセスを定義するが、他のコンポーネント118a~118n(例えばコンポーネント118n)への制御アクセスは定義しなくてもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、特定の区分(例えば、金額が記載された表)を定義するが、例示の金融ドキュメントにおける契約/保証に関連する実体は定義しなくてもよい。ドキュメント・アクセス制御モジュール110は、記事へのアクセスの正規費用ではなく補助金付き費用でのドキュメント区分(例えば、表、図、または結果などの特定の区分)の購読を可能にしてもよい。ドキュメント・アクセス制御モジュール110は、ユーザが、ドキュメント104のレイアウト116とコンポーネント118a~118nとに基づいてドキュメント・アクセス・レベルを指定することができるようにしてもよい。ドキュメント・アクセス制御モジュール110は、ユーザが、ドキュメント・レイアウト116に基づいてユーザのアクセス・レベルを動的に変更することができるようにしてもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント・レイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメント104の異なるレイアウト・コンポーネント118a~118nへの動的で精細なアクセス制御を適用してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、事前トレーニングされた言語モデル、例えば、自然言語処理事前トレーニングのためのニューラル・ネットワーク・ベースの技術であるBERTを使用して、ドキュメント・レイアウト類似度を判定してもよい。ドキュメント・アクセス制御モジュール110は、テキスト生成のための自動評価指標、例えばBERTスコアを使用してもよい。ドキュメント・アクセス制御モジュール110は、参照文内の各トークンを使用して候補文内の各トークンの類似度スコアを計算してもよい。ドキュメント・アクセス制御モジュール110は、文脈埋め込みを使用してトークン類似度を計算してもよい。ドキュメント・アクセス制御モジュール110は、人間による判定とより良好な相関関係にあり、より強力なモデル選択性能を実現することができる。ドキュメント・アクセス制御モジュール110は、2つの文の類似度をトークンの埋め込み間のコサイン類似度の和として計算してもよい。ドキュメント・アクセス制御モジュール110は、ユーザ・タイプと作業タイプとに基づいてアクセス制御を動的に定義してもよい。ドキュメント・アクセス制御モジュール110は、アクセス制御に基づいてドキュメント・レイアウト・コンポーネント118a~118nを抽出してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104のレイアウト116とコンポーネント118a~118nと、それぞれのユーザとを指定することによって、ユーザのアクセス・レベルを指定してもよい。
【0039】
ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーを、他のドキュメントにおいてドキュメント104と特定の類似のレイアウトを有する、ドキュメント・リポジトリ106内の他のドキュメントに動的に適用することができるように、ドキュメント104の異なるコンポーネント118a~118n(例えば異なる区分)に異なるレベルのアクセス制御を与えてもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント・レイアウト類似度に基づいて、異なるアクセス・レベルで、異なるユーザに、ドキュメントの異なるレイアウト・コンポーネントに対する動的で精細なアクセス制御を適用してもよい。例えば、ドキュメント・アクセス制御モジュール110は、ユーザAがユーザBに、ドキュメント・リポジトリ106内のすべての類似のドキュメント(例えば出版物、メモ、レジュメ)の表のみへのアクセスを認めることができるようにしてもよく、その場合、そのようなアクセス・ポリシーは必要に応じて動的に更新することができる。ドキュメント・アクセス制御モジュール110は、ドキュメント104のコンポーネント118a~118n(例えば特定の区分)に対するアクセス制御を提供してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104の個別の区分のアクセス管理を提供してもよい。ドキュメント・アクセス制御モジュール110は、ドキュメント104内の個別の区分に対するアクセス制御を管理してもよい。ドキュメント・アクセス制御モジュール110は、構造化形式または非構造化形式であってもよいドキュメント104を使用してアクセス制御を管理してもよい。
【0040】
ステップ206で、ドキュメント・アクセス制御モジュール110は、ドキュメント104のアクセス・ポリシーとレイアウト116とに基づいて、コンポーネント118a~118nへのアクセスの要求に権限付与する。ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーに基づいて要求を検証してもよい。ドキュメント・アクセス制御モジュール110は、ユーザからの検証された要求に基づいて1つまたは複数のコンポーネント118a~118nへのアクセスを与えてもよい。ドキュメント・アクセス制御モジュール110は、ユーザがアクセスを要求し得る特定のコンポーネント(例えばコンポーネント118a~118nのいずれか)を識別してもよい。
【0041】
ステップ208で、ドキュメント・アクセス制御モジュール110は、ユーザからの要求のためにドキュメント104のアクセス・ポリシーに基づいてドキュメント104を検索して取り出す。ドキュメント・アクセス制御モジュール110は、要求のためにアクセス・ポリシーに基づいてドキュメント104の許可されたコンポーネント118a~118nを検索して取り出してもよい。ドキュメント・アクセス制御モジュール110は、アクセス制御の詳細に基づいて、ドキュメント104の区分(例えば一部の特定のコンポーネント118a~118n)を判読不能にしてもよい。別の実施例では、ドキュメント・アクセス制御モジュール110は、判読不能コンポーネントについてemptyを使用した内容を削除してもよい。ドキュメント・アクセス制御モジュール110は、要求のために判読不能コンポーネントを暗号化してもよい。ドキュメント・アクセス制御モジュール110は、要求に基づいて一部の特定のコンポーネントを判読不能にするのに十分な程度にコンポーネントを不鮮明にしてもよい。ドキュメント・アクセス制御モジュール110は、特定のコンポーネントと区分とが判読不能なドキュメント104へのアクセスを与えてもよい。ドキュメント・アクセス制御モジュール110は、許可された区分のみを抽出してもよい。ドキュメント・アクセス制御モジュール110は、索引を調べることによってユーザのアクセス・レベルに基づいてドキュメント区分(例えば表、図)を表示してもよい。ドキュメント・アクセス制御モジュール110は、検証された要求に基づいて1つまたは複数のコンポーネント118a~118nを出力してもよい。ドキュメント・アクセス制御モジュール110は、アクセス・レベルに基づいてコンポーネント118a~118nを表示してもよい。ドキュメント・アクセス制御モジュール110は、事前定義済み類似度閾値に基づいて、ドキュメント104と他のドキュメント、例えばドキュメント・リポジトリ106内のドキュメントとの間のレイアウト類似度を判定してもよい。一実施例では、ドキュメント・アクセス制御モジュール110は、事前トレーニング済みの言語モデル、例えば自然言語処理事前トレーニングのためのニューラル・ネットワーク・ベースの技術であるBERTを使用してドキュメント・レイアウト類似度を判定してもよい。ドキュメント・アクセス制御モジュール110は、テキスト生成のための自動評価指標、例えばBERTスコアを使用してもよい。ドキュメント・アクセス制御モジュール110は、参照文内の各トークンを使用して候補文内の各トークンの類似度スコアを計算してもよい。ドキュメント・アクセス制御モジュール110は、文脈埋め込みを使用してトークン類似度を計算してもよい。ドキュメント・アクセス制御モジュール110は、人間による判定とより良好な相関関係にあり、より強力なモデル選択性能を実現することができる。ドキュメント・アクセス制御モジュール110は、2つの文の類似度を、トークンの埋め込み間のコサイン類似度の和として計算してもよい。ドキュメント・アクセス制御モジュール110は、アクセス・ポリシーを他のドキュメントに動的に適用してもよい。ドキュメント・アクセス制御モジュール110は、類似したレイアウトを有するドキュメント104のアクセス・ポリシーに基づいて他のドキュメントのコンポーネントを検索して取り出してもよい。
【0042】
図3に、本開示の一実施形態による、ドキュメント・アクセス制御モジュール110において適用されるJSONで表された例示のアクセス・ポリシーを示す。
【0043】
図3の実施例では、ドキュメント・アクセス制御モジュール110は、レイアウト116と、コンポーネント118と、ユーザ識別情報302とに基づいて、JSONでアクセス・ポリシーを定義する。他の実施形態では、ドキュメント・アクセス制御モジュール110は、他の適切なファイルまたはプログラミング形式でアクセス・ポリシーを定義してもよい。本実施例では、コンポーネント118は、例えば表118aと区分118bを含むように定義される。ドキュメント・アクセス制御モジュール110は、制御アクセス304を含むようにアクセス・ポリシーを定義する。本実施例では、制御アクセス304は、アクセス不可を表す「X」として設定される。ドキュメント・アクセス制御モジュール110は、有効期限306のオプションを定義してもよい。
【0044】
図4に、本開示の例示の一実施形態によるコンピューティング・デバイス102のコンポーネントのブロック
図400を示す。
図4は、一実装形態の例示の提供に過ぎず、環境に関していかなる限定も示唆せず、異なる実施形態が実装されてもよいことを理解されたい。図の環境には多くの修正を加えてもよい。
【0045】
コンピューティング・デバイス102は、キャッシュ416と、メモリ406と、永続ストレージ408と、通信ユニット410と、入力/出力(I/O)インターフェース412との間の通信を提供する、通信ファブリック402を含んでもよい。通信ファブリック402は、システム内の、プロセッサ(マイクロプロセッサ、通信およびネットワークプロセッサなど)と、システム・メモリと、周辺デバイスと、任意のその他のハードウェア・コンポーネントとの間でのデータもしくは制御情報またはその両方の受け渡しのために設計された、任意のアーキテクチャを使用して実装することができる。例えば、通信ファブリック402は、1つまたは複数のバスまたはクロスバ・スイッチを使用して実装可能である。
【0046】
メモリ406と永続ストレージ408はコンピュータ可読記憶媒体である。本実施形態では、メモリ406はランダム・アクセス・メモリ(RAM)を含む。一般に、メモリ406は、任意の適切な揮発性または不揮発性のコンピュータ可読記憶媒体を含むことができる。キャッシュ416は、メモリ406から、最近にアクセスされたデータと、アクセスされたデータに近いデータとを保持することによって、コンピュータ・プロセッサ404のパフォーマンスを向上させる高速メモリである。
【0047】
ドキュメント・アクセス制御モジュール110は、キャッシュ416を介してそれぞれのコンピュータ・プロセッサ404のうちの1つまたは複数によって実行されるために、永続ストレージ408とメモリ406とに記憶されてもよい。一実施形態では、永続ストレージ408は磁気ハードディスク・ドライブを含む。これに代えて、または磁気ハードディスク・ドライブに加えて、永続ストレージ408は、ソリッド・ステート・ハード・ドライブ、半導体ストレージ・デバイス、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM)、フラッシュ・メモリ、またはプログラム命令またはデジタル情報を記憶可能な任意のその他のコンピュータ可読記憶媒体を含むことができる。
【0048】
永続ストレージ408によって使用される媒体は、取り外し可能であってもよい。例えば、取り外し可能ハード・ドライブを永続ストレージ408に使用してもよい。他の例としては、永続ストレージ408の一部でもある別のコンピュータ可読記憶媒体に転送するためにドライブに挿入される、光ディスク、磁気ディスク、サム・ドライブ、およびスマート・カードがある。
【0049】
通信ユニット410は、これらの例において、他のデータ処理システムまたはデバイスとの通信を提供する。これらの例において、通信ユニット410は1つまたは複数のネットワーク・インターフェース・カードを含む。通信ユニット410は、物理通信リンクと無線通信リンクのいずれか一方または両方を使用して通信を提供することができる。ドキュメント・アクセス制御モジュール110は、通信ユニット410を介して永続ストレージ408にダウンロードされてもよい。
【0050】
I/Oインターフェース412は、コンピューティング・デバイス102に接続可能な他のデバイスとの間でのデータの入出力を可能にする。例えば、I/Oインターフェース412は、キーボード、キーパッド、タッチ・スクリーン、もしくは他の何らかの適切な入力デバイスまたはその組合せなどの外部デバイス418への接続を提供することができる。外部デバイス418は、例えばサム・ドライブ、可搬型光ディスクまたは磁気ディスク、およびメモリ・カードなどの、可搬型コンピュータ読み取り可能記憶媒体も含み得る。本発明の実施形態を実施するために使用されるソフトウェアおよびデータ、例えばドキュメント・アクセス制御モジュール110を、このような可搬型コンピュータ可読記憶媒体に記憶することができ、I/Oインターフェース412を介して永続ストレージ408にロードすることができる。I/Oインターフェース412は、ディスプレイ420にも接続する。
【0051】
ディスプレイ420は、ユーザに対してデータを表示するための機構を提供し、例えばコンピュータ・モニタであってもよい。
【0052】
本明細書に記載のプログラムは、本発明の特定の実施形態においてそれらが実装される用途に基づいて識別される。しかし、本明細書におけるいずれの特定のプログラム命名法も、便宜上使用されているに過ぎず、したがって、本発明は、そのような命名法によって識別もしくは示唆される、またはその両方の、いかなる特定の用途のみでの使用にも限定されるべきではないことを理解されたい。
【0053】
本発明は、統合の任意の可能な技術的詳細レベルにおいて、システム、方法もしくはコンピュータ・プログラム製品またはその組合せとすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実施させるためのコンピュータ可読プログラム命令が記憶されたコンピュータ可読記憶媒体(または複数の媒体)を含み得る。
【0054】
コンピュータ可読記憶媒体は、命令実行デバイスによって使用される命令を保持し、記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学式ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適合する組合せであってよいが、これらには限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには以下のものが含まれ得る。すなわち、可搬コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、可搬コンパクト・ディスク読み取り専用メモリ(CD-ROM)、デジタル・バーサタイル・ディスク(DVD)、メモリ・スティック、フロッピィ・ディスク、パンチカードまたは命令が記録された溝内の隆起構造などの機械的に符号化されたデバイス、およびこれらの任意の適合する組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体とは、電波またはその他の自由に伝播する電磁波、導波路またはその他の伝送媒体を伝播する電磁波(例えば光ファイバ・ケーブルを通る光パルス)、または電線を介して伝送される電気信号などの、一時的の信号自体であると解釈すべきではない。
【0055】
本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスに、または、ネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくは無線ネットワークまたはその組合せを介して外部コンピュータまたは外部記憶デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、交換機、ゲートウェイ・コンピュータ、もしくはエッジ・サーバまたはその組合せを含み得る。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースが、ネットワークからコンピュータ可読プログラム命令を受信し、それらのコンピュータ可読プログラム命令を、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体への記憶のために転送する。
【0056】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、または、Python、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語、または同様のプログラム言語などの手続き型プログラミング言語を含む、1つまたは複数のプログラミング言語の任意の組合せで書かれたソース・コードまたはオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、全体がユーザのコンピュータ上で、部分的にスタンドアロン・ソフトウェア・パッケージとしてユーザのコンピュータ上で、部分的にユーザのコンピュータ上で且つ部分的にリモート・コンピュータ上で、または全体がリモート・コンピュータまたはサーバ上で実行されてもよい。後者の場合、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む、任意の種類のネットワークを介してユーザのコンピュータに接続することができ、または接続は(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行ってもよい。いくつかの実施形態において、本発明の態様を実行するために、例えばプログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路が、コンピュータ可読プログラム命令の状態情報を使用して電子回路をパーソナライズすることにより、コンピュータ可読プログラム命令を実行してもよい。
【0057】
本発明の態様について、本発明の実施形態による方法、装置(システム)、およびコンピュータ・プログラム製品を示すフローチャート図もしくはブロック図またはその両方を参照しながら説明している。フローチャート図もしくはブロック図またはその両方の図の各ブロックおよび、フローチャート図もしくはブロック図またはその両方の図のブロックの組合せは、コンピュータ可読プログラム命令によって実装可能であることはわかるであろう。
【0058】
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラマブル・データ処理装置のプロセッサに供給することができる。それにより、コンピュータまたはその他のプログラマブル・データ処理装置のプロセッサにより実行される命令が、フローチャートもしくはブロック図またはその両方の、ブロックまたは複数のブロックで規定されている機能/動作を実装する手段を形成するようなマシンを実現する。これらのコンピュータ可読プログラム命令は、コンピュータ、プログラマブル・データ処理装置、もしくはその他の装置またはその組合せに対して特定の方式で機能するように指示することができるコンピュータ可読記憶媒体に記憶することもできる。それにより、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートもしくはブロック図またはその両方の、ブロックまたは複数のブロックで規定されている機能/動作の態様を実装する命令を含む製造品を含む。
【0059】
コンピュータ可読プログラム命令は、コンピュータ、その他のプログラマブル装置、またはその他のデバイス上で一連の動作ステップが実行されてコンピュータ実装プロセスを実現するようにするために、コンピュータ、その他のプログラマブル・データ処理装置、またはその他のデバイスにロードすることもできる。それにより、コンピュータ、その他のプログラマブル装置またはその他のデバイス上で実行される命令がフローチャートもしくはブロック図またはその両方の、ブロックまたは複数のブロックで規定されている機能/動作を実装する。
【0060】
図面中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能および動作を示す。これに関連して、フローチャートまたはブロック図の各ブロックは、規定されている論理機能を実装するための1つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または部分を表すことがある。別の一部の実装形態では、ブロックに記載されている機能は、図に記載されている順序とは異なる順序で行われてもよい。例えば、連続して示されている2つのブロックは、関与する機能に応じて、実際には、1つのステップとして行われてもよく、並行して、実質的に並行して、部分的または全体が時間的にオーバーラップする方式で実行されてもよく、またはそれらのブロックは場合によっては逆の順序で実行されてもよい。また、ブロック図もしくはフローチャート図またはその両方の図の各ブロック、およびブロック図もしくはフローチャート図またはその両方の図のブロックの組合せは、規定されている機能または動作を実行する専用ハードウェア・ベースのシステムによって実装可能であるか、または専用ハードウェアとコンピュータ命令との組合せを実施することができることもわかるであろう。
【0061】
本発明の様々な実施形態の説明は、例示を目的として示したものであり、網羅的であること、または開示されている実施形態に限定することを意図していない。当業者には、本発明の範囲および思想から逸脱することなく多くの修正および変形が明らかになるであろう。本明細書で使用されている用語は、実施形態の原理、実際の適用、または市場に見られる技術に対する技術的改良を最もよく説明するため、または、当業者が本明細書で開示されている実施形態を理解することができるようにするために選択されている。
【0062】
本発明の特定の実施形態について説明したが、当業者は、記載されている実施形態と同等の他の実施形態があることがわかるであろう。したがって、本発明は特定の例示の実施形態によって限定されるべきではなく、添付の特許請求の範囲によってのみ限定されると理解すべきである。
【符号の説明】
【0063】
100 ドキュメント・アクセス制御環境
102 コンピューティング・デバイス
106 ドキュメント・リポジトリ
108 ネットワーク
110 ドキュメント・アクセス制御モジュール
112 アクセス・ポリシー・モジュール
114 ドキュメント検索モジュール
116 レイアウト
118a コンポーネント
118b コンポーネント
118n コンポーネント
400 ブロック図
402 通信ファブリック
404 プロセッサ
406 メモリ
408 永続ストレージ
410 通信ユニット
412 I/Oインターフェース
416 キャッシュ
418 外部デバイス
420 ディスプレイ