(58)【調査した分野】(Int.Cl.,DB名)
文字認識プロセスを実行すると、前記一意の英数字識別子を抽出するステップであって、前記文字認識プロセスは、光学式文字認識(OCR)プロセス、インテリジェント文字認識(ICR)プロセス、およびインテリジェント語認識(IWR)プロセスのうちの少なくとも1つを含む、ステップをさらに含む請求項1に記載の方法。
著作物は、学術的な参考文献の出版物であり、前記画像は、前記学術的な参考文献の出版物のテキストを含み、前記一意の英数字識別子は、前記画像に含まれる前記テキストから抽出された英数字文字を含む請求項3に記載の方法。
参考文献管理システムに記憶するために前記引用された参考文献のデータを前記ポータブルコンピューティングデバイスから受信するステップをさらに含む請求項1に記載の方法。
前記ポータブルコンピューティングデバイスは、モバイル電話およびタブレットコンピューティングデバイスのうちの少なくとも1つを含む請求項19に記載のポータブルコンピューティングデバイス。
【発明を実施するための形態】
【0022】
本開示の例示的な実施形態は、出典データベースから1つまたは複数の参考文献を取り出すために利用され得る一意の英数字識別子を含む著作物の一部からの撮影された画像に応じた引用された参考文献のデータの画像に基づく取り出しを対象とする。本開示の例示的な実施形態は、「つなぎっぱなしの」動き続ける接続性を要求するユーザに引用された参考文献のデータにアクセスするためのより高速でシームレスなインターフェースを提供するための引用された参考文献のデータの取り出しの効率的な手法を提供する。
【0023】
図1は、著作物104(画像に基づく参考文献取り出し)に含まれる一意の英数字識別子102の撮影された画像に基づいて書誌情報および/または1つもしくは複数の参考文献の1つもしくは複数の全文バージョンの検索、特定、および/または取り出しを容易にするための、本開示の例示的な実施形態によって実装される例示的な参考文献管理環境10を示すブロック図である。環境10の例示的な実施形態は、ハードウェア、ソフトウェア、および/またはこれらの組み合わせを用いて実装され得る参考文献管理システム100を含む可能性がある。一例として、一部の実施形態においては、1つまたは複数のコンピューティングデバイスが、システム100またはその一部の例示的な実施形態を実装するようにプログラミングおよび/または構成される可能性がある。システム100は、画像撮影デバイス122を制御する画像撮影エンジン120と通信するユーザインターフェース110と、認識エンジン130と、ヒューリスティックスエンジン140と、抽出エンジン150と、出典データベース162に通信可能なように結合された参考文献マネージャ160と、個人参考文献ライブラリ170と、全文データベース180と、トランザクション/加入者エンジン190とを含み得る。
【0024】
一意の英数字識別子102は、英数字文字の文字列(例えば、テキストおよび数字)である可能性がある。例示的な実施形態において、一意の英数字識別子102は、例えば、デジタルオブジェクト識別子(「DOI」)、国際標準図書番号(ISBN)、Pubmed識別子/Pubmed Central識別子、CAS登録番号、および/または著作物内の参考文献の引用を取り出すために利用され得る任意のその他の好適な一意の英数字識別子である可能性がある。ISBNは、本に割り当てられ、9桁の標準図書ナンバリング(SBN: Standard Book Numbering)コードに基づく一意の商用図書識別子である。Pubmed識別子/Pubmed Central識別子は、アメリカ国立医学図書館のPubmedデータベースのための文書識別スキーマである。CAS登録番号は、米国化学会の商用の化学抄録データベースのための化学抄録識別番号である。用語「英数字の」は、本明細書においては、1つもしくは複数の源(origin)もしくはアルファベットからの字/文字(例えば、ラテン語、中国語、日本語など)、1つもしくは複数の源からの数/数字(例えば、アラビア数字)、および/または字/文字と数/数字との組み合わせで形成された一意の識別子を広く指すために使用される。
【0025】
著作物104は、文献の著作物に対する参照および/または文献の著作物内の参考文献を特定しおよび/または取り出すために使用され得る一意の英数字識別子を組み込む文献の任意の著作物である可能性がある。例えば、著作物104は、記事(例えば、学術記事、業界記事(industry article)、雑誌記事)、本、定期刊行物、学位論文(thesis)、博士論文(dissertation)、研究費申請書、特許出願、特許などである可能性がある。一意の英数字識別子がその他の内容と区別され、その他の内容とは独立して抽出される必要がある可能性があるように、一意の英数字識別子102の画像撮影が著作物104のその他の内容も含み得るように、一意の英数字識別子102は、著作物104上にまたは著作物104内に埋め込まれる可能性があり、著作物104の内容によって囲まれるかまたは著作物104の内容に組み込まれる可能性がある。
【0026】
ユーザインターフェース110は、ユーザがシステム100とインタラクションすることができる1つまたは複数のグラフィカルユーザインターフェース(GUI)112を提供するようにプログラミングおよび/または構成され得る。ユーザに対して表示されるGUI 112は、ユーザから情報を受信するためのデータ入力領域、1つもしくは複数の動作、機能、および/もしくはプロセスをシステム100に実行させるためにユーザによって選択され得るユーザが選択可能な要素もしくは領域、ならびに/またはユーザに対して情報を表示するためのデータ出力を含み得る。例示的な実施形態において、ユーザインターフェースは、エンジン120、130、140、および150、ならびに参考文献マネージャ160、個人参考文献ライブラリ170、全文データベース180、およびトランザクションエンジン190とインターフェースをとるためにユーザによって利用され得る。
【0027】
画像撮影エンジン120は、ユーザインターフェース110を介して受信されたユーザ入力に応答して一意の英数字識別子102を含む著作物104の一部の画像を撮影するように画像撮影デバイス122(例えば、デジタルスチルカメラ)を制御するようにプログラミングおよび/または構成され得る。画像撮影デバイスによって撮影された画像は、ユーザインターフェース110に提供される可能性があり、ユーザインターフェース110は、画像をユーザに対して表示し、および/または画像を入力として認識エンジン130に提供することができる。一部の実施形態において、画像は、認識エンジン130に自動的に提供される可能性があり、および/またはユーザインターフェース110を介して受信されたユーザからの入力に応答して認識エンジン130に提供される可能性がある。一部の実施形態において、画像撮影エンジン120は、画像を認識エンジン130に直接提供する可能性がある。
【0028】
認識エンジン130は、画像撮影デバイス122によって撮影された画像を画像撮影エンジン120および/またはユーザインターフェース110から受信することができる。例示的な実施形態において、認識エンジン130は、撮影された画像を機械によって符号化されたデータまたはテキスト要素に変換するようにプログラミングおよび/または構成され得る。認識エンジン130は、光学式文字認識(OCR)プロセス、インテリジェント文字認識(ICR)プロセス、および/またはインテリジェント語認識(IWR)プロセスを利用して、撮影された画像からデータまたはテキスト要素を特定し、抽出することができる。
【0029】
データ/テキスト要素は、ヒューリスティックスエンジン140に提供される可能性があり、ヒューリスティックスエンジン140は、抽出されたデータ/テキスト要素によって形成された一意の英数字識別子102を特定するための1つまたは複数のプロセスを実行するようにプログラミングおよび/または構成され得る。例えば、ヒューリスティックスエンジン140は、撮影された画像から抽出されたデータ/テキスト要素の少なくとも一部によって形成された一意の英数字識別子を特定するために1つまたは複数の種類の一意の英数字識別子に関連するパターンおよび/またはシグネチャ(signature)を認識するようにプログラミングおよび/または構成され得る。一例として、ヒューリスティックスエンジン140は、1つもしくは複数の指定された種類の一意の英数字識別子の要素の量に対応する要素の量を有するデータ/テキスト要素のグループに関してデータ/テキスト要素を検索することができ、および/またはそれぞれの特定されたグループの要素が指定された種類のデータ/テキスト要素を指定された順序でまたはグループ内の指定された位置に含むかどうかを特定することができる。別の例として、ヒューリスティックスエンジン140は、撮影された画像から抽出されたデータ/テキスト要素内で見つかったパターンに基づいて複数の出典データベースを特定の順序で検索するようにプログラムおよび/または構成され得る。一部の実施形態において、ヒューリスティックスエンジン140は、撮影された画像から抽出されたデータ/テキスト要素内で見つかったパターンに基づいて検索を特定の出典データベース内のフィールドの特定のサブセットに制限するようにプログラムおよび/または構成され得る。
【0030】
抽出エンジン150は、データ/テキスト要素から一意の英数字識別子を抽出するようにプログラミングおよび/または構成され得る。例えば、ヒューリスティックスエンジン140が、ヒューリスティックスエンジン140によって実行されるプロセスに基づいて抽出エンジン150に一意の英数字識別子102を提供する可能性があり、抽出エンジン150が、一意の英数字識別子をユーザインターフェース110に提供する可能性があり、ユーザインターフェース110が、ユーザに対して一意の英数字識別子を表示する可能性があり、および/または参考文献管理システム160に一意の英数字識別子102を提供する可能性がある。一部の実施形態において、抽出エンジン150は、データ/テキスト要素を認識エンジン130から直接受信する可能性があり、データ/テキスト要素から一意の英数字識別子102を特定し、抽出するようにプログラミングおよび/または構成される可能性がある。
【0031】
例示的な実施形態において、抽出エンジン150は、抽出されたテキスト/データ要素を解析して一意の英数字識別子が撮影された画像内に存在するかどうかを判定するために使用されるコードまたはスクリプトを実行するようにプログラミングおよび/または構成され得る。例えば、抽出エンジン150は、1つまたは複数の予め定義された種類の一意の英数字識別子に対応する任意の一意の英数字識別子が存在するかどうかを判定する可能性がある。存在する場合、抽出エンジンは、一意の英数字識別子をユーザインターフェース110に提供することができ、ユーザインターフェース110は、一意の英数字識別子に関連する書誌情報の取り出しを容易にし、および/または一意の英数字識別子に関連する参考文献の全文バージョンの取り出しを容易にするために、一意の英数字識別子を参考文献マネージャ160に提供し得る。一部の実施形態において、抽出エンジン150は、一意の英数字識別子を参考文献マネージャ160に直接提供することができる。一意の英数字識別子が検出されない場合、抽出エンジン150は、一意の英数字識別子が検出されなかったという通知、または一意の英数字識別子を取得するためのプロセスがそれ以外の形で失敗したという通知をユーザインターフェースに提供する。一部の実施形態において、抽出エンジン150は、予め定義された種類の一意の英数字識別子との厳密な一致が検出されなかった場合、あり得る一意の英数字識別子を示唆するために参考文献マネージャとインタラクションするようにプログラミングおよび/または構成され得る。
【0032】
一意の英数字識別子102を受信すると、参考文献マネージャ160は、一意の英数字識別子102に対応する記憶された識別子に関して出典データベースのうちの1つまたは複数の検索を実行することができる。例えば、参考文献マネージャ160は、出典データベースのうちの1つまたは複数によって記憶された一意の英数字識別子または同様の識別子のインスタンスを検索する可能性がある。一部の実施形態において、参考文献マネージャ160は、一意の英数字識別子と、一意の英数字識別子と記憶された識別子との間の厳密な一致に対応する参考文献の取り出しを容易にするのみでなく、一意の英数字識別子に似ている記憶された識別子を有するその他の参考文献の取り出しも容易にするためのその他のパラメータとを含む検索基準を含み得る。この手法を用いて、参考文献マネージャ160は、著作物104から捕捉された一意の英数字識別子102に厳密に一致する記憶された識別子を有する参考文献、一意の英数字識別子102に似ている記憶された識別子を有する1つもしくは複数の参考文献、またはこれら両方を返す可能性があり、それらの返される文献は、ユーザに対する表示のためにユーザインターフェース110に提供され得る。参考文献マネージャ160は、検索に基づいていかなる参考文献も返さない場合、いかなる結果も見つからなかったことをユーザインターフェースに伝えることができ、ユーザインターフェース110は、著者の情報、題名の情報、出版者の情報、出版日付、および/または参考文献に関して出典データベース162に問い合わせるために参考文献マネージャ160によって利用され得る任意のその他の好適な情報などのユーザからのさらなる検索情報を要求するようにプログラミングおよび/または構成され得る。
【0033】
出典データベース162は、書誌情報および/または完全な著作物を一貫して、一意に、曖昧性なく特定するために利用され得る、一意の英数字識別子が書誌情報および/または完全な著作物を含むデータ構造に割り振られる私有および/または公共データベースを含み得る。書誌情報および著作物の全文バージョンは、本明細書においては、集合的におよび/または独立に、引用された参考文献のデータと呼ばれる可能性がある。出典データベースは、例えば、著者が誰であるか、題名、出版者、抄録、出版年などに基づく関連するまたは同様の著作物を含むその他のデータ構造への相互参照および/または論理的なリンクを含み得る。出典データベースのいくつかの例は、例えば、Thomson Reutersによって提供されるWeb of Science、Web of Knowledge、Cortellis、Biological Abstracts、および/またはThomson Reuters Innovation、ならびに国立生物工学情報センター(NCBI)のPubMed、AMJUR、Crossref.org、ITHAKAのJSTOR、および/またはBioOneを含む。
【0034】
参考文献マネージャ160が出典データベース162のうちの1つまたは複数の問い合わせに基づいて1つまたは複数の参考文献を返した後、ユーザは、ユーザインターフェース110を介してその後の使用のために参考文献のうちの1つまたは複数を個人参考文献ライブラリ170に記憶することができ、および/または全文データベース180から参考文献の全文バージョンを取り出すことができる。個人参考文献ライブラリ170は、ユーザのアカウントにユーザによって記憶された1つまたは複数の参考文献を含み得る。全文データベース180は、参考文献マネージャ160によって実行された検索によって返された著作物の完全なバージョンを取り出す要求をユーザインターフェースを介してユーザから受信する可能性がある。一部の実施形態において、参考文献マネージャ160は、検索によって返された参考文献を個人参考文献ライブラリに自動的に記憶する可能性があり、および/または全文データベース180に自動的に問い合わせて参考文献の全文バージョンを取り出し、ユーザに返す可能性がある。
【0035】
一部の実施形態においては、料金が、参考文献マネージャ160、個人データライブラリ170、および/または全文データベース180へのアクセスに関連付けられる可能性がある。これらの実施形態において、ユーザインターフェース110は、トランザクションエンジン190とインタラクションすることができる。トランザクションエンジン190は、参考文献マネージャ160、個人参考文献ライブラリ、および/または全文データベース180へのアクセスを許可するための料金の支払いを容易にするようにプログラミングおよび/または構成され得る。例えば、ユーザは、ユーザインターフェース110を介してシステム100とインタラクションし得るが、参考文献マネージャおよび/または全文データベースにアクセスできるようにされる前に、トランザクションエンジンを介してアカウントを作ることを要求される可能性がある。一部の実施形態において、全文データベース180は、出典データベースでもある可能性がある。
【0036】
図2は、参考文献管理システム100の実施形態を実装し、および/または参考文献管理システム100の実施形態とインタラクションするために利用され得るポータブルコンピューティングデバイス200のブロック図である。ポータブルコンピューティングデバイス200は、スマートフォン、タブレット、サブノートブック、ラップトップ、携帯情報端末(PDA)、ならびに/または画像撮影デバイスを含むかもしくは画像撮影デバイスに動作可能なように接続される可能性があり、参考文献管理システム100の実施形態を実装し、および/もしくは参考文献管理システム100の実施形態とインタラクションするようにプログラミングおよび/もしくは構成される可能性がある任意のその他の好適なポータブルコンピューティングデバイスである可能性がある。ポータブルコンピューティングデバイス200は、デジタル信号プロセッサ(DSP)またはマイクロプロセッサなどの処理デバイス204、非一時的コンピュータ可読媒体の形態のメモリ/ストレージ206、画像撮影ユニット208、ディスプレイユニット210、バッテリー212、および無線周波数トランシーバ214を含み得る。ポータブルコンピューティングデバイス200の一部の実施形態は、通例、センサ216、加入者識別モジュール(SIM)カード218、オーディオ構成要素220および222、ならびに電力管理回路224などのその他のよくある構成要素も含み得る。
【0037】
メモリ206は、任意の好適な非一時的コンピュータ可読ストレージ媒体、例えば、読み出し専用メモリ(ROM)、消去可能プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM)、フラッシュメモリなどを含み得る。例示的な実施形態においては、オペレーティングシステム226およびアプリケーション228が、非一時的コンピュータ可読メモリ206に記憶され、例えば、Java(登録商標)、C、C++、C#、アセンブリコード、機械可読言語などの任意の好適な高レベルまたは低レベルのコンピューティング言語および/またはプラットフォームを用いて実装されるコンピュータが読み取り可能な/実行可能なプログラムコードとして具現化され得る。一部の実施形態において、アプリケーション228は、画像撮影ユニットとインタラクションするように構成された画像アプリケーション、ウェブブラウザアプリケーション、参考文献管理システム100、エンジン130、140、および/または150の実施形態とインターフェースをとるように特にコーディングされたモバイルアプリケーションを含み得る。メモリは単一の構成要素として示されているが、当業者は、メモリが複数の構成要素から形成される可能性があり、別個の不揮発性および揮発性メモリデバイスが使用される可能性があることを認識するであろう。
【0038】
処理デバイス204は、ポータブルコンピューティングデバイス200の動作を実装するおよび/または容易にすることができる任意の好適なアーキテクチャの任意の好適な単一コアまたは複数コアマイクロプロセッサを含み得る。例えば、画像撮影動作を実行し、(例えば、RFトランシーバ214を介して)撮影された画像を送信し、(例えば、RFトランシーバ214を介して)撮影された画像に含まれる一意の英数字識別子を受信/送信し、ユーザインターフェース110のGUI 112、撮影された画像、一意の英数字識別子、書誌情報、参考文献の全文バージョンなどを含むデータ/情報を表示するため。処理デバイス204は、オペレーティングシステム226およびアプリケーション228(例えば、画像アプリケーションならびにエンジン130、140、および150)を実行して、動作を実行するための1つまたは複数のプロセスを実施するようにプログラミングおよび/または構成され得る。処理デバイス204は、ストレージデバイス206から情報/データを取り出し、ストレージデバイス206に情報/データを記憶することができる。例えば、処理デバイスは、撮影された画像、撮影された画像に含まれる一意の英数字識別子、書誌情報、参考文献の全文バージョン、ならびに/またはポータブルコンピューティングデバイスおよび/もしくはユーザによって利用され得る任意のその他の好適な情報/データを取り出すおよび/または記憶することができる。
【0039】
RFトランシーバ214は、アンテナ215を介して無線送信を送信および/または受信するように構成され得る。例えば、RFトランシーバ214は、画像撮影ユニットによって撮影された1つもしくは複数の画像および/もしくは撮影された画像に含まれる一意の英数字識別子などのデータ/情報を1つもしくは複数のサーバに直接的もしくは間接的に送信し、ならびに/または一意の英数字識別子、一意の英数字識別子に対応する書誌情報、および/もしくは一意の英数字識別子に対応する参考文献の全文バージョンなどのデータ/情報を1つもしくは複数のサーバから直接的もしくは間接的に受信するように構成され得る。RFトランシーバ214は、指定された周波数で、ならびに/または指定されたシーケンスおよび/もしくはパケットの配列にしたがって情報を送信および/または受信するように構成され得る。
【0040】
ディスプレイユニット210は、ユーザに対してグラフィカルユーザインターフェースなどのユーザインターフェースをレンダリングすることができ、一部の実施形態においては、ユーザがGUIとインタラクションすることを可能にするメカニズムを提供することができる。例えば、ユーザは、ディスプレイユニット210を通じてポータブルコンピューティングデバイス200とインタラクションする可能性があり、ディスプレイユニット210は、液晶タッチスクリーン(もしくは触覚)ディスプレイ、発光ダイオードタッチスクリーンディスプレイ、および/または例示的な実施形態によって提供され得る1つもしくは複数のユーザインターフェース(例えば、GUI 112)を表示し得る任意のその他の好適なディスプレイデバイスとして実装され得る。
【0041】
電源212は、電荷を蓄え、ポータブルコンピューティングデバイスに給電するように構成されたバッテリーまたは容量要素として実装され得る。例示的な実施形態において、電源212は、外部電源への接続によって再充電されるように構成されたバッテリーまたは1つもしくは複数の容量要素などの再充電可能な電源である可能性がある。
【0042】
一部の実施形態において、ポータブルコンピューティングデバイスは、画像撮影エンジン120の実行および/またはアプリケーション228のうちの1つの実行によるOCRまたはその他の文字/語認識プロセスを実施し得る。これらの実施形態において、画像撮影ユニット208は、撮影された画像を機械によって符号化されたデータまたはテキストに変換し、抽出されたテキスト/データ要素を解析するために、ポータブルコンピューティングデバイスのメインメモリに記憶されたアプリケーション228のうちの1つと連携して働く画像撮影エンジン120の一部として、前処理文字認識およびデータ要素抽出ユニットを含み得る。一部の実施形態において、ポータブルコンピューティングデバイス200は、画像が撮影されている文書の「質感(texture)」(例えば、紙の種類)を判定するために処理デバイス204によって利用される画像特徴付けユニット230を含み得る。この判定に応じて、処理デバイス204は、画像認識プロセスを改善し、画像認識プロセスにおける潜在的な誤りおよび/または不良を最小化するかまたは削減するために、画像の撮影に適切な撮像アルゴリズムを割り振ることができる。
【0043】
図3は、参考文献管理システム100またはその一部の実施形態を実装するために利用され得る例示的なコンピューティングデバイス300のブロック図である。本実施形態において、コンピューティングデバイス300は、参考文献管理システム100の動作および/または機能のうちの1つまたは複数を実行し、ポータブルコンピューティングデバイス200の実施形態などのポータブルコンピューティングデバイスとの通信を容易にするようにプログラミングおよび/または構成されるサーバとして構成される。コンピューティングデバイス300は、例示的な実施形態を実装するための1つまたは複数のコンピュータで実行可能な命令またはソフトウェアを記憶するための1つまたは複数の非一時的コンピュータ可読媒体を含む。非一時的コンピュータ可読媒体は、1つまたは複数の種類のハードウェアメモリ、非一時的な有形の媒体(例えば、1つまたは複数の磁気ストレージディスク、1つまたは複数の光ディスク、1つまたは複数のフラッシュドライブ)などを含む可能性があるがこれらに限定されない。例えば、コンピューティングデバイス300に含まれるメモリ306は、システム100またはその一部の例示的な実施形態を実装するためのコンピュータが読み取り可能なおよびコンピュータが実行可能な命令またはソフトウェアを記憶し得る。また、コンピューティングデバイス300は、メモリ306に記憶されたコンピュータが読み取り可能なおよびコンピュータが実行可能な命令またはソフトウェア、ならびにシステムのハードウェアを制御するためその他のプログラムを実行するための構成可能および/またはプログラミング可能なプロセッサ302および関連するコア304を含み、任意で、(例えば、複数のプロセッサ/コアを有するコンピュータシステムの場合)1つまたは複数の追加の構成可能および/またはプログラミング可能なプロセッサ302'および関連するコア304'を含む。プロセッサ302およびプロセッサ302'は、それぞれ、単一コアプロセッサまたは複数コア(304および304')プロセッサである可能性がある。
【0044】
コンピューティングデバイスのインフラストラクチャおよびリソースが動的に共有され得るように、コンピューティングデバイス300で仮想化が使用され得る。プロセスが複数のコンピューティングリソースではなく唯1つのコンピューティングリソースを使用しているように見えるように複数のプロセッサで実行されるプロセスを処理するための仮想マシン314が、提供され得る。複数の仮想マシンが、1つのプロセッサによって使用される可能性もある。
【0045】
メモリ306は、DRAM、SRAM、EDO RAMなどのコンピュータシステムメモリまたはランダムアクセスメモリを含み得る。メモリ306は、その他の種類のメモリも含むか、またはこれらの組み合わせを含む可能性がある。
【0046】
コンピューティングデバイス300は、本明細書において説明されるシステム100の例示的な実施形態を実装するために処理デバイス302によって実行され得るデータならびにコンピュータ可読命令および/またはソフトウェアを記憶するためのハードドライブ、CD-ROM、大容量ストレージフラッシュドライブ、またはその他のコンピュータ可読媒体などの1つまたは複数のストレージデバイス324も含み得る。
【0047】
コンピューティングデバイス300は、標準的な加入電話回線、ローカルエリアネットワーク(LAN)もしくは広域ネットワーク(WAN)リンク(例えば、802.11、T1、T3、56kb、X.25)、ブロードバンド接続(例えば、ISDN、フレームリレー、ATM)、無線接続(セルラ基地局を介することを含む)、コントローラエリアネットワーク(CAN)、または以上のいずれかもしくはすべての何らかの組み合わせを含むがこれらに限定されないさまざまな接続を通じて1つまたは複数のネットワークデバイス322によって1つまたは複数のネットワーク、例えば、LAN、WAN、またはインターネットとインターフェースをとるように構成されたネットワークインターフェース312を含み得る。ネットワークインターフェース312は、組み込みネットワークアダプタ、ネットワークインターフェースカード、PCMCIAネットワークカード、カードバスネットワークアダプタ、無線ネットワークアダプタ、USBネットワークアダプタ、モデム、またはコンピューティングデバイス300と通信することができる任意の種類のネットワークとのインターフェースをとり、本明細書において説明される動作を実行することに好適な任意のその他のデバイスを含み得る。
図3に示されたコンピューティングデバイス300はサーバとして実装されているが、コンピューティングデバイス300の例示的な実施形態は、ワークステーション、デスクトップコンピュータ、または無線通信かもしくは有線通信かのどちらかによってその他のデバイスと通信することができ、本明細書において説明される動作を実行するための十分なプロセッサ性能およびメモリ容量を有するコンピューティングもしくは電気通信デバイスのその他の形態などの任意のコンピュータシステムである可能性がある。
【0048】
コンピューティングデバイス300は、任意のUnix(登録商標)に基づくサーバアプリケーション、Linux(登録商標)に基づくサーバアプリケーション、任意の独自仕様のサーバアプリケーション、またはコンピューティングデバイス300で実行され、本明細書において説明される動作を実行し得る任意のその他のサーバアプリケーションを含むサーバアプリケーションのバージョンのいずれかなどの任意のサーバアプリケーション316を実行し得る。コンピューティングデバイスで実行され得るサーバアプリケーションの例は、Apacheサーバアプリケーションを含む。
【0049】
図4は、クライアント-サーバ環境400におけるシステム100の例示的な実施形態のシステム構成と、クライアント-サーバ環境400でシステム100の例示的な実施形態を実装するためのソフトウェア構成要素/サービスとを示す概略図である。
図4に示されるように、環境400は、通信ネットワーク450を介して(ポータブルコンピューティングデバイス)クライアント420〜422に動作可能なように結合されたサーバ410を含み、通信ネットワーク450は、ネットワークに通信可能なように結合されたデバイス間で情報が送信され得る任意のネットワークである可能性がある。例えば、通信ネットワーク450は、インターネット、イントラネット、仮想プライベートネットワーク(VPN)、広域ネットワーク(WAN)、ローカルエリアネットワーク(LAN)などである可能性がある。サーバ410の実施形態は、
図3のコンピューティングデバイス300と同様にして実装される可能性があり、クライアント420〜422は、
図2のポータブルコンピューティングデバイス200と同様にして実装される可能性がある。
【0050】
例示的な実施形態において、システム100は、サーバ410によって実装され得る。サーバ410は、クライアント420〜422によって撮影された画像に含まれる一意の英数字識別子に関連する書誌情報および/または参考文献の全文バージョンの画像に基づく取り出しを容易にするために使用され得るユーザインターフェースのGUIをクライアント420〜422のディスプレイに表示するためにクライアント420〜422によってアクセスされ得る、システム100のユーザインターフェースをホストするウェブサーバとして実装される可能性がある。
【0051】
図4に示されるように、クライアント420〜422は、環境100にアクセスし、環境100を実行するためにサーバ410とインタラクションするようにプログラミングおよび/または構成されたクライアント側アプリケーション423をそれぞれ含み得る。一部の実施形態において、クライアント420〜422のうちの1つまたは複数によって実装されるクライアント側アプリケーション423は、システム100のGUIをホストする1つまたは複数のウェブページにナビゲーションすることができるウェブブラウザである可能性がある。一部の実施形態において、クライアント420〜422のうちの1つまたは複数によって実装されるクライアント側アプリケーション423は、サーバ410によって実行されているシステム100とのインタラクションを可能にするためにクライアント420〜422にインストールされるシステム100に固有のアプリケーションである可能性がある。
【0052】
例示的な動作では、クライアント420〜422は、著作物または著作物に引用された参考文献に関連する一意の英数字識別子を含む著作物の一部の画像を撮影するためにユーザによって操作され得る。例えば、ユーザは、画像を撮影するためのインターフェースを提供するGUIをクライアント420〜422のディスプレイに表示するためにクライアント420〜422によってシステムにアクセスすることができる。画像が撮影された後、クライアント420〜422は、通信ネットワーク450を介して(無線または有線のどちらかで)サーバ410に画像を送信することができる。サーバによって実行されているシステムは、撮影された画像を機械によって符号化されたデータまたはテキスト要素に変換することができ、符号化されたデータまたはテキスト要素は、撮影された画像に含まれる一意の英数字識別子を検出するために解析され得る。一部の実施形態においては、一意の英数字識別子の検出を支援するためのデータ/テキスト要素の分析を実行するためにヒューリスティックスが使用され得る。一意の英数字識別子が検出された場合、システム100は、確認のためにGUIを介してユーザに対して一意の英数字識別子を表示するようにサーバ410に命令することができる。
【0053】
システム100は、ユーザからの確認に応じておよび/または(例えば、ユーザからの確認を必要とせずに)自動的に一意の英数字識別子に関連する書誌情報および/または参考文献の全文バージョンを取り出すための1つもしくは複数の出典データベースおよび/または全文データベース(例えば、データベース430)を含みおよび/またはそれらの出典データベースおよび/または全文データベースとインターフェースをとることができる。システム100が書誌情報および/または全文を取り出すと、書誌情報および/または全文は、サーバ410によってクライアントデバイス420〜422に表示されたGUIを介してユーザが利用できるようにされ得る。ユーザは、書誌情報および/または全文を閲覧し、システムによって保有されるユーザの個人参考文献ライブラリに書誌情報および/または全文を保存するためにクライアント420〜422を制御することができる。一部の実施形態においては、システムが、デフォルトでユーザに書誌情報を提供し、ユーザは、参考文献の全文バージョンを別に要求しなければならない。
【0054】
図5は、クライアント-サーバ環境500におけるシステム100の例示的な分散型の実施形態のシステム構成と、クライアント-サーバ環境500でシステム100の例示的な分散型の実施形態を実装するためのソフトウェア構成要素/サービスとを示す概略図である。
図5に示されるように、環境500は、通信ネットワーク450を介してクライアント420〜422に動作可能なように結合されたサーバ510〜512を含む。サーバ510〜512の実施形態は、
図3のコンピューティングデバイス300と同様にして実装され得る。
【0055】
例示的な実施形態において、システム100は、サーバ510〜512に分散され得る。例えば、サーバ510が、ユーザインターフェース110を実装する可能性があり、サーバ511が、認識エンジン130、ヒューリスティックスエンジン140、および抽出エンジン150を実装する可能性があり、サーバ512が、参考文献マネージャ160、出典データベース162の少なくとも一部、個人参考文献ライブラリ170、全文データベース180、およびトランザクション/加入者エンジン190を実装する可能性がある。本実施形態においては、サーバ510〜512のうちの1つまたは複数が、ウェブサーバとして実装される可能性がある。例えば、サーバ510は、クライアント420〜422によって撮影された画像に含まれる一意の英数字識別子に関連する書誌情報および/または参考文献の全文バージョンの画像に基づく取り出しを容易にするために使用され得るユーザインターフェースのGUIをクライアント420〜422のディスプレイに表示するためにクライアント420〜422によってアクセスされ得る、システム100のユーザインターフェース110をホストするウェブサーバとして実装される可能性がある。
【0056】
図5に示された分散型システム100の例示的な動作は、異なるサーバがシステムの異なる機能または動作を実行することを除いて、
図4に示されたシステムの動作と同様である。例えば、ユーザは、画像を撮影するためのインターフェースを提供するGUIをクライアント420〜422のディスプレイに表示するためにサーバ510を介してシステムにアクセスすることができる。画像が撮影された後、クライアント420〜422は、通信ネットワーク450を介して(無線または有線のどちらかで)サーバ510に画像を送信することができ、サーバ510は、撮影された画像を処理のためにサーバ511に送信するようにプログラミングおよび/または構成され得る。一部の実施形態においては、クライアント側アプリケーション423が、撮影された画像をサーバ510に最初に送信せずに、撮影された画像をサーバ511に送信するようにプログラミングおよび/または構成され得る。サーバ511は、エンジン130、140、および150を実行して、撮影された画像を機械によって符号化されたデータまたはテキスト要素に変換することができ、符号化されたデータまたはテキスト要素は、撮影された画像に含まれる一意の英数字識別子を検出するために解析される可能性があり、一意の英数字識別子は、サーバ412によって実行されている参考文献マネージャ160に送られる可能性がある。一意の英数字識別子が検出された場合、参考文献マネージャは、確認のためにGUIを介してユーザに対して一意の英数字識別子を表示するようにサーバ410に命令することができる。
【0057】
参考文献マネージャ160は、ユーザからの確認に応じておよび/または(例えば、ユーザからの確認を必要とせずに)自動的に一意の英数字識別子に関連する書誌情報および/または参考文献の全文バージョンを取り出すための1つまたは複数の出典データベースおよび/または全文データベースとインターフェースをとることができる。参考文献マネージャ160が書誌情報および/または全文を取り出すと、書誌情報および/または全文は、サーバ510によってクライアントデバイス420〜422に表示されたGUIを介してユーザが利用できるようにされ得る。ユーザは、書誌情報および/または全文を閲覧し、サーバ512によって保有されるユーザの個人参考文献ライブラリに書誌情報および/または全文を保存するためにクライアント420〜422を制御することができる。一部の実施形態においては、参考文献マネージャ160が、デフォルトでユーザに書誌情報を提供し、ユーザは、サーバ512の全文データベース180によって保有される参考文献の全文バージョンを別に要求しなければならない。
【0058】
図6は、少なくとも1つのクライアントがシステム100の少なくとも一部を実装するクライアント-サーバ環境600におけるシステム100の例示的な分散型の実施形態のシステム構成と、クライアント-サーバ環境600でシステム100の例示的な分散型の実施形態を実装するためのソフトウェア構成要素/サービスとを示す概略図である。
図6に示されるように、環境600は、通信ネットワーク450を介してクライアント420〜421およびクライアント622に動作可能なように結合されたサーバ510〜511および612を含む。サーバ612の実施形態は、
図3のコンピューティングデバイス300と同様にして実装される可能性があり、クライアント622の実施形態は、
図2のポータブルコンピューティングデバイス200と同様にして実装される可能性がある。
【0059】
例示的な実施形態において、システム100は、出典データベース162、個人参考文献ライブラリ170、全文データベース180、および(例えば、サーバ613上の)トランザクションサーバがサーバ612上に存在せず、むしろ、サーバ612に動作可能なように接続されることを除いて、上で
図5に示されたようにサーバ510-511および612に分散され得る。
図6に示されるように、クライアント622は、ユーザインターフェース110、認識エンジン130、ヒューリスティックスエンジン140、および抽出エンジン150を含むシステム100に固有であるようにプログラミングおよび/または構成されるクライアント側アプリケーション623(例えば、システム100のためのモバイルアプリケーション)をそれぞれ含み得る。クライアント622は、サーバ510とインタラクションするようにプログラミングおよび/または構成される可能性があり、クライアント622およびサーバ612は、システム100の実施形態を一緒に形成する可能性があり、一方、クライアント420〜421は、
図5に関連して説明されたように動作する。
【0060】
例示的な動作では、クライアント622は、文献の著作物または文献の著作物に引用された参考文献に関連する少なくとも1つの一意の英数字識別子を含む文献の著作物の一部の画像を撮影するためにユーザによって操作され得る。例えば、クライアント622は、画像を撮影するためのインターフェースを提供するGUIをクライアント622のディスプレイに表示するためにユーザインターフェース110を実行することができる。画像が撮影された後、クライアント622は、エンジン130、140、および150を実行して、撮影された画像を機械によって符号化されたデータまたはテキスト要素に変換し、データ/テキスト要素を解析することによって、撮影された画像内の一意の英数字識別子を検出することができる。ユーザインターフェースは、確認のためにGUIを介してユーザに対して一意の英数字識別子を表示するためにクライアント622によって実行され得る。
【0061】
一意の英数字識別子が検出された後、クライアント622は、通信ネットワーク450を介して(無線または有線のどちらかで)サーバ612に一意の英数字識別子を送信する可能性があり、サーバ612は、参考文献マネージャ160を実行することによって一意の英数字識別子を処理するようにプログラミングおよび/または構成される可能性がある。参考文献マネージャ160は、一意の英数字識別子に関連する書誌情報および/または参考文献の全文バージョンを取り出すための1つまたは複数の出典データベース162および/または全文データベース190とインターフェースをとることができる。参考文献マネージャ160が書誌情報および/または全文を取り出すと、書誌情報および/または全文は、ユーザインターフェース110によってクライアントデバイス622に表示されたGUIを介してユーザが利用できるようにされ得る。ユーザは、書誌情報および/または全文を閲覧し、ユーザの個人参考文献ライブラリ170に書誌情報および/または全文を保存するためにクライアント622を制御することができる。一部の実施形態においては、参考文献マネージャ160が、デフォルトでユーザに書誌情報を提供し、ユーザは、全文データベース180によって保有される参考文献の全文バージョンを別に要求しなければならない。
【0062】
概して、
図7〜
図15は、Web of Knowledge研究プラットフォームに関連して本開示の例示的な実施形態によって参考文献管理環境を実装する非限定的な例を対象とする。
図7〜
図15は本開示の例示的な実施形態の非限定的な例を示すが、当業者は、著作物または著作物に対する参照を特定する一意の英数字識別子が著作物に関連付けられるかまたは添付される任意の参考文献管理環境を形成するおよび/またはそのような参考文献管理環境に組み込まれるように本開示の例示的な実施形態が実装され得ることを認めるであろう。
【0063】
図7は、参考文献管理環境700の例示的な実施形態を実装するためのハードウェアおよびソフトウェア構成要素およびサービスのシステム構成を示す概略図である。ポータブルコンピューティングデバイス210は、通信ネットワーク450を介して参考文献管理システム710と通信することができる。ポータブルコンピューティングデバイス210は、スマートフォン、タブレット、サブノートブック、ラップトップ、携帯情報端末(PDA)、ならびに/または画像撮影デバイス(例えば、画像撮影デバイス122)を含むかもしくは画像撮影デバイス(例えば、画像撮影デバイス122)に動作可能なように接続される可能性があり、通信ネットワークを介して参考文献管理システム710のサーバと通信するようにプログラミングおよび/もしくは構成され得る任意のその他の好適なポータブルコンピューティングデバイスである可能性がある。ポータブルコンピューティングデバイス210、および参考文献管理システム710の1つまたは複数のサーバは、拡張可能マークアップ言語-リモートプロシージャコール(XML-RPC)の実装、セキュアソケットレイヤ(SSL)上のXMLリモートプロシージャコール(XRPC)の実装、ハイパーテキスト転送プロトコル(HTTP)上のXMLの通信の実装、シンプルオブジェクトアクセスプロトコル(SOAP)の実装などの1つまたは複数のトランスポートレイヤおよび符号化方法を用いて通信するようにプログラミングおよび/または構成され得る。
【0064】
図7に示されるように、システム710は、書誌情報および/または著作物の全文の要求を受信することができ、(例えば、ポータブルコンピューティングデバイスに入力されたユーザ名および/またはパスワードに基づいて)ポータブルコンピューティングデバイスが環境700とインタラクションする権限を与えられているかどうかを判定することができる認証モジュール712を含み得る。認証プロセスが、システム710にアクセスすることを許可する前にユーザに適用される可能性がある。認証は、環境の参考文献管理構成要素(例えば、Thomson ReutersのEndNote(登録商標)Web)などのシステム710の構成要素への登録を必要とする可能性がある。一部の実施形態において、ユーザは、認証または認可された後、撮影された画像に含まれる一意の英数字識別子に関連する書誌情報および/または参考文献の全文バージョンを取得するためにユーザによって使用され得るシステム710に固有のクライアント側アプリケーションをポータブルコンピューティングデバイスにダウンロードし得る。一部の実施形態において、ユーザは、システム710に固有のクライアント側アプリケーションをダウンロードし、利用するように要求されない可能性があるが、その代わりに、ポータブルコンピューティングデバイス210のウェブブラウザアプリケーションを利用する可能性がある。一部の実施形態において、認証プロセスは、撮影された画像を含む要求を受信する前に実施され得る。
【0065】
例示的な実施形態において、認証モジュール712は、ポータブルコンピューティングデバイスのユーザが認可されたユーザであるかどうかを判定し、および/またはポータブルコンピューティングデバイスのユーザの認可レベルを判定するための認可プロセスを実行するように構成され得る。例えば、一部の実施形態において、ユーザは、ユーザに関連する加入ステータス(例えば、ユーザが加入者であるか、およびユーザのアカウントが最新であるか)に基づいて認可および/または認証される可能性がある。ユーザアカウントは、どの出典データベースがユーザに利用され得るか、および/または出典データベースのどの引用された参考文献のデータがユーザに利用され得るかを決定することができる異なる加入レベルを有する可能性がある。つまり、異なる加入レベルに関して異なるユーザ認可レベルが存在する可能性がある(例えば、第1の認可レベルが第1の加入サービスレベルに関連する可能性があり、第2の認可レベルが第2の加入サービスレベルに関連する可能性がある)。第1の認可レベルを有するユーザは、参考文献管理システムから引用された参考文献のデータの第1のサブセットを与えられる可能性があり、第2の認可レベルを有するユーザは、参考文献管理システムから引用された参考文献のデータの第2のサブセットを与えられる可能性がある。一部の実施形態において、引用された参考文献のデータは、ポータブルコンピューティングデバイスのユーザが認可される場合、ポータブルコンピューティングデバイスで表示するために最適化され得る。
【0066】
要求は、紙またはその他の好適な材料で形成された有形の著作物の一部の画像を含み得る。画像は、ポータブルコンピューティングデバイス210のユーザが環境700を介して取り出したい有形の著作物704内の参照された著作物に対応する一意の英数字識別子702を含み得る。要求が認可されると判定すると、認証モジュール712は、認識エンジン、ヒューリスティックスエンジン、および抽出エンジンの実施形態(
図1)を含み得る英数字文字認識モジュール714とインターフェースをとることができる。英数字文字認識モジュール714は、ポータブルコンピューティングデバイス210によって撮影され、ポータブルコンピューティングデバイス210から受信された画像を、画像で撮影された一意の英数字識別子を抽出するために解析され、Web of Knowledge参考文献マネージャモジュール716に提供され得る機械によって符号化されたデータまたはテキストに変換することができ、Web of Knowledge参考文献マネージャモジュール716は、1つまたは複数の出典データベース718、スロットリングモジュール(throttling module)714、および電子商取引(eコマース)モジュール716とインターフェースをとることができる。
【0067】
参考文献マネージャモジュール716は、画像から抽出された一意の英数字識別子に基づいて出典データベースを検索するための1つまたは複数の問い合わせを構築することができる。例示的な実施形態において、出典データベース718のうちの1つまたは複数は、システム710内の私有データベース720である可能性があり、ならびに/またはシステム710の外部にあるが、システム710がアクセスすることができる公共および/もしくは私有データベース722である可能性がある。出典データベース718のうちの1つまたは複数は、一意の英数字識別子に基づく1つまたは複数の結果を返すことができ、結果は、システム710からポータブルコンピューティングデバイス210に送信され得る。
【0068】
スロットリングモジュール714は、環境700への到着するトラフィックを管理して、例えば、環境によって実行される1つもしくは複数の動作、機能、もしくはタスクを止めるおよび/または無効化することによって、環境700によりサービスを提供されているデータトラフィックに基づいて環境の性能を最適化することによって、通信の混雑を制御するためのメカニズムを提供するようにプログラミングおよび/または構成され得る。モジュール714の混雑制御のスロットルは、サイトを現在訪問している匿名のユーザの数が指定された閾値を超えるときに自動的に有効化される可能性がある。混雑制御のスロットルは、サイトを現在訪問している認証されたユーザの数が指定された閾値を超えるときに自動的に有効化される可能性がある。
【0069】
eコマースモジュール716は、システム710とポータブルコンピューティングデバイス210との間の金銭的トランザクションを容易にするためのトランザクションエンジンの実施形態(
図1)を実装するようにプログラミングおよび/または構成され得る。例えば、システム710は、環境700内のユーザがシステム710にアクセスするために加入していることを要求する可能性があり、システム710によって受信されたそれぞれの検索要求の料金を課金する可能性があり、および/または要求に含まれる一意の英数字識別子に対応する著作物の全文バージョンにアクセスすることをユーザが望む場合に料金を課金する可能性がある。
【0070】
図7に関連して説明されたモジュールおよび/またはデータベースは、それぞれ、システム710のサーバとして実装され得る。一部の実施形態において、モジュールおよび/またはデータベースのうちの1つまたは複数は、サーバがモジュールのうちの2つ以上を実装するようにサーバに組み込まれるかまたは統合される可能性がある。
【0071】
本実施形態のシステム710は文字認識プロセスを実行するが、当業者は、ポータブルコンピューティングデバイス210、および/またはシステム710の外部のサービスによって文字認識プロセスが実施され得ることを認めるであろう。これらの実施形態においては、ユーザによって与えられる要求が、画像からの抽出された一意の英数字識別子および/または機械によって符号化されたデータもしくはテキストを含み得る。
【0072】
図8は、Thomson ReutersのWeb of Knowledge研究プラットフォームなどの包括的な参考文献管理システム802を含み得る参考文献管理環境800の例示的な実施形態を実装するためのハードウェアおよびソフトウェア構成要素およびサービスのシステム構成を示す概略図である。本実施形態において、ポータブルコンピューティングデバイス210は、通信ネットワーク250を介して環境800と通信することができる。システム802は、参考文献管理システム802のためのコードを実行するサーバ806を含むサーバファーム804を含み得る。一実施形態において、サーバファーム804は、ポータブルコンピューティングデバイス210のユーザが参考文献管理システム802にアクセスすることを可能にする前に認証プロセスを実施するようにプログラミングおよび/または構成され得る。
【0073】
認証プロセスは、参考文献管理ソフトウェア構成要素(例えば、Thomson ReutersのEndNote(登録商標)Web)などのシステムの構成要素への登録を必要とする可能性がある。認証プロセスは、ポータブルコンピューティングデバイスによってサーバファーム804に送信された認証要求を含み得る。認証サーバ808と連携して動作するサーバファーム804が、ユーザが参考文献管理システム802にアクセスする権限を与えられていると判定する場合、サーバファーム804は、ポータブルコンピューティングデバイス210と環境800との間のセッションを生成するためのモバイルセッション識別子(MSID)を返すことができる。MSIDは、ポータブルコンピューティングデバイス210がシステム802にアクセスすることができることを保証するためにセッション中にポータブルコンピューティングデバイス210とサーバファーム804との間の通信で利用され得る。MSIDは、参考文献マネージャ812の例示的な実施形態のバックグラウンドでサーバファーム804で実行され、サーバファーム804によって実行されている参考文献マネージャシステム812とインタラクションするデーモンアプリケーション810によって保有および/または制御され得る。
【0074】
ユーザは、認証または認可されると、ポータブルコンピューティングデバイス210を介してシステム802とインタラクションして、本明細書において説明されるように、ポータブルコンピューティングデバイスの画像獲得デバイスによる著作物の少なくとも一部の撮影された画像に基づいて有形の著作物で引用された1つまたは複数の参考文献の書誌情報および/または全文バージョンを取り出すことができる。検索要求に応答してシステム802によって返された書誌情報および/または参考文献の全文バージョンは、後で取り出す、電子メールで送る、および/または印刷するためにポータブルコンピューティングデバイス210に記憶されるか、またはポータブルコンピューティングデバイス210の遠隔、例えば、包括的な参考文献管理システム810(例えば、EndNote(登録商標)Web)の構成要素814に記憶される可能性がある。
【0075】
一部の実施形態においては、商権管理アプリケーション816が、サーバファーム804によって実行され得る。アプリケーション816は、例えば、著作物に関連する権利管理データに基づいて、著作物の著作権が保護され、および/またはシステム802のユーザによって尊重されることを保証するために参考文献管理システム810によって利用され得る。
【0076】
図9は、Thomson ReutersのWeb of Knowledge研究プラットフォームなどの包括的な参考文献管理である可能性がある参考文献管理環境900の例示的な実施形態を実装するためのハードウェアおよびソフトウェア構成要素およびサービスのシステム構成を示す概略図である。環境900は、文字認識プロセスがサーバファーム804の外部のサーバ902で実施される可能性があり、システム802の内部または外部で実施される可能性があることを除いて
図8の環境800と実質的に同様にして実装され得る。
【0077】
図10は、1組のデータベース1002またはデータストレージユニットと、ポータブルコンピューティングデバイス210によってアクセスされ得るサーバシステム1004とを含むクライアント-サーバアーキテクチャを有する包括的な参考文献管理システム(例えば、Thomson Reuters Web of Knowledge(登録商標))のオンライン情報取り出しおよび分析構成要素の例示的な実施形態を示す。データベース1002は、研究者、学者、学生、およびその他の専門家などのユーザによって依拠されるリソースを示す1組のプライマリデータベース1006、1組のセカンダリデータベース1008、および1組のメタデータベース1010を含み得る。プライマリデータベース1006は、Thomson Reuters Web of Science(登録商標)およびWeb of Knowledge(登録商標)データベース、Cortellus、ならびにThomson Reuters Innovationデータベースなどの私有であるか、加入に基づくか、またはサービスプロバイダの内部にある可能性がある。セカンダリデータベース1008は、ユーザのグループが関心のあるさらなるリソースを示す外部または公共データベースである可能性があり、プライマリデータベース1006によって提供される出典に出典を補足する可能性がある。一実施形態において、セカンダリデータベース1008は、例えば、PubMedデータベース、AMJURデータベース、およびCrossref.orgデータベースを含み得る。メタデータベース1010は、例えば、引用関係、抄録、リンク、分類データ、および著作物に関連するその他の出所のデータを含み得る。本明細書において説明されるように、本開示の例示的な実施形態は、法律、研究、財務、科学、および/または健康管理情報に関連する内容を有する著作物と、著作物内で引用された参考文献を特定し、取り出すか、または著作物自体を特定し、取り出すために使用され得る一意の英数字識別子を含む任意のその他の内容を有する任意のその他の著作物とを含むデータベースを含み得る。
【0078】
データベース1002は、1つもしくは複数の電子的、磁気的、もしくは光学的データストレージデバイスである可能性があり、それぞれのインデックス(図示せず)を含むか、またはそうでなければそれぞれのインデックス(図示せず)に関連付けられる。インデックスのそれぞれは、対応する文書のアドレス、識別子、およびその他の慣習的な情報に関連して語および句を含む。データベース1002は、本明細書において説明されるように、ローカル、広域、プライベート、または仮想プライベートネットワークなどの無線または有線通信ネットワークを介してサーバに結合されるかまたは結合可能である。
【0079】
概して、サーバシステム1004は、関連するアプレット、ActiveXコントロール、遠隔呼び出しオブジェクト、またはその他の関連するソフトウェアおよびデータ構造をともなうウェブページの形態またはその他のマークアップ言語の形態でさまざまな「厚さ(thickness)」のサービスクライアントにデータを提供するための1つまたは複数のサーバを表す。より詳細には、一実施形態において、サーバシステム1004は、プロセッサモジュール1020、メモリモジュール1022、加入者データベース1024、プライマリ検索モジュール1026、メタデータ検索モジュール1028、およびユーザインターフェースモジュール1030を含み得る。プロセッサモジュール1020は、1つもしくは複数のローカルのもしくは分散型のプロセッサ、コントローラ、または仮想マシンを含み得る。一実施形態において、プロセッサモジュール1020は、当業者に知られている任意の便利なまたは望ましい形態をとる可能性がある。1つまたは複数の電子的、磁気的、または光学的データストレージデバイスである可能性があるメモリモジュール1022は、加入者データベース1024、プライマリ検索モジュール1026、セカンダリ検索モジュール1028、および引用推薦モジュール1030を記憶し得る。
【0080】
加入者データベース1024は、データベース1002の従量制課金の(pay-as-you-go)または加入に基づくアクセスを制御、監督、および管理するための加入者に関連するデータを含む。加入者データベース1024は、1つまたは複数のユーザプリファレンス(またはより広い)ユーザデータ構造を含み得る。一実施形態において、ユーザデータ構造の1つまたは複数の態様は、さまざまな検索およびインターフェースのオプションのユーザのカスタマイズに関する。この目的で、本開示の一部の実施形態は、経歴、機関関連(institution association)(例えば、大学、法人、協会など)、業務または学問または研究の領域(例えば、喘息、アレルギー)、および前の出版物などのユーザプロファイル情報を含み得る。ユーザデータは、ユーザの資格証明情報を認証し、加入者に基づくリソースまたはワークスペースへのアクセスを許可するために使用され得る。複数のプラットフォームおよび/またはサービスもしくはリソースにまたがるシームレスなアクセスのために、統合された資格証明サービス、例えば、Thomson ReutersのOnePassソリューションが使用され得る。
【0081】
プライマリ検索モジュール1026は、データベース1002のうちの1つまたは複数に対するデータを受信し、処理するための1つまたは複数の検索エンジンおよび関連するユーザインターフェース構成要素を含み得る。一部の実施形態において、検索モジュール1026に関連する1つまたは複数の検索エンジンは、ブール(Boolean)、索引語頻度-逆文書頻度(tf-idf: term frequency - inverse document frequency)、および/または自然言語分析能力を提供する。セカンダリ検索モジュール1028も、データベース1002のうちの1つまたは複数に対するデータを処理するための1つまたは複数の検索エンジンを含み得る。
【0082】
一部の実施形態において、サーバシステム1004は、ポータブルコンピューティングデバイス210を介してユーザによって受信された要求に基づいてユーザに引用を推薦するための引用推薦モジュール1030を含み得る。例えば、ユーザは、データベース1002のうちの1つまたは複数を検索するためにサーバによって利用され得る一意の英数字識別子を含む画像を撮影し得る。検索に応答して、サーバシステム1004は、ユーザが関心がある可能性、一意の英数字識別子に関連する参考文献に関連する可能性、一意の英数字識別子に関連する参考文献で引用される可能性などがある1組の参考文献を返すことができる。
【0083】
一部の実施形態において、サーバシステム1004は、情報統合ツール(IIT: information-integration-tool)フレームワークモジュール1040(またはソフトウェアフレームワークもしくはプラットフォーム)を含み得る。IITフレームワークモジュールは、ワードプロセッサアプリケーション、電子メールアプリケーション、プレゼンテーションアプリケーション、および表計算アプリケーションなどの1つまたは複数の文書処理(または文書著作もしくは編集)アプリケーションと統合されるかまたは協調する1つまたは複数の部分を有するソフトウェアおよび関連するユーザインターフェースを完全にまたは部分的に定義する機械が読み取り可能なおよび/または実行可能な命令セットを含み得る。一部の実施形態において、これらのアプリケーションは、1つまたは複数のアクセスデバイス、例えば、ポータブルコンピューティングデバイス210でホストされる可能性がある。
【0084】
図11は、本開示の例示的な実施形態によって利用され得る文献の著作物1100の非網羅的な例を示す。DOIの形態の例示的な一意の英数字識別子1102が、著作物1100のうちの1つに関して示されている。
図11に示されるように、一意の英数字識別子1102は、著作物のテキストに含まれ得る。著作物1100のテキストは、一意の英数字識別子1102を囲む可能性があり、したがって、本開示の例示的な実施形態で使用するために画像中の一意の英数字識別子1102のみを撮影することが、可能または実際的でない可能性がある。本明細書において説明されるように、本開示の例示的な実施形態は、ヒューリスティックな処理を利用して、撮影された画像に対して文字認識プロセスが実行された結果得られる機械に対応したデータまたはテキストを処理し、一意の英数字識別子を周りのテキストから区別することができる。
【0085】
図12は、本開示の例示的な実施形態によるポータブルコンピューティングデバイス1200でレンダリングされる例示的な画像取得インターフェース1202を示す。包括的な参考文献管理システムの学術的な著作物に電子的にアクセスしたいポータブルコンピューティングデバイス1200のユーザは、一意の英数字識別子1206を含む引用の上にポータブルコンピューティングデバイスの画像獲得デバイスを構え、コントロール1204を選択して一意の英数字識別子1206を含む画像を撮影することによって画像を撮影することができる。本開示の例示的な実施形態によって、撮影された画像は、光学式文字認識(OCR)ソフトウェア、インテリジェント文字認識(ICR)ソフトウェア、インテリジェント語認識(IWR)ソフトウェアなどによって実施される文字認識プロセスなどの文字認識プロセスを用いて機械によって符号化されたデータまたはテキストに変換され得る。
【0086】
文字認識ソフトウェアは、抽出されたテキスト/データ要素を解析して一意の英数字識別子が存在するかどうかを判定するために使用される支援スクリプトを含み得る。存在する場合、一意の英数字識別子、一意の英数字識別子に関連する書誌情報、および/または一意の英数字識別子に関連する文献の全文バージョンが、ユーザに返され得る。存在しない場合、一意の英数字識別子が見つからなかったという通知、または一意の英数字識別子を取得するためのプロセスがそれ以外の形で失敗したという通知。代替的にまたは追加的に、本開示の例示的な実施形態は、厳密な一致が見つからなかったことを伝達する可能性があり、ポータブルコンピューティングデバイスを介してユーザにあり得る代替的選択肢を示唆する可能性がある。
【0087】
図13および
図14は、それぞれ、ポータブルコンピューティングデバイス1350(例えば、スマートフォン、タブレット)のディスプレイ上にレンダリングされる可能性があり、本開示の例示的な実施形態に関連して使用される可能性がある例示的なグラフィカルユーザインターフェース1300および1400を示す。GUI 1300および1400は、ポータブルコンピューティングデバイス1350のユーザに、本明細書において説明される参考文献管理システムの例示的な実施形態とのインターフェースを提供する検索インターフェースを提供する。一例として、
図13を参照すると、インターフェース1300が、ポータブルコンピューティングデバイス1350のユーザが、題名1302、著者1304、出版年1306、および/または任意のその他の好適な引用データなどの引用データを指定することによって出典データベースのうちの少なくとも1つを検索することを可能にする。別の例として、
図14を参照すると、インターフェース1400は、ユーザがどの出典データベース1402を検索すべきかを指定または選択することを可能にするようにやはりプログラミングおよび/または構成され得る。
図13は題名、著者、および出版年による検索を示すが、当業者に知られているように、その他の引用データ(例えば、出版者の識別情報、巻、版など)が含まれ得ることは理解されるであろう。
図13に示されるように、インターフェース1300は、手動検索ボタン1310を選択するとユーザに対して表示される可能性があり、ユーザは、スキャンボタン1312を選択すると
図12のインターフェース1202にナビゲーションされる可能性がある。
【0088】
例示的な実施形態において、本明細書において説明される参考文献管理システムおよび/またはクライアント側アプリケーションは、1つもしくは複数の出典データベースの検索を容易にするために利用される一意の英数字識別子が撮影された画像に含まれない、ならびに/または撮影された画像内で検出された一意の英数字識別子が出典データベースに記憶された書誌情報および/もしくは全文著作物のいずれとも一致しないかもしくは関連しないという参考文献管理システムによる判定に応じてポータブルコンピューティングデバイス1350のディスプレイ上にインターフェース1300および/または1400をレンダリングするために実行され得る。一部の実施形態において、インターフェース1300および/または1400は、著者の情報、出版者の情報、題名の情報、出版年の情報、一意の英数字識別子などの検索基準を入力することによって出典データベースの手動検索をユーザが実行することを可能にするために提供され得る。
【0089】
一部の実施形態において、本明細書で説明される参考文献管理システムおよび/またはクライアント側アプリケーションは、ポータブルコンピューティングデバイスのユーザが、例えば、題名、著者、出版年、および/または任意のその他の好適な引用データに基づいてより幅広い検索を依頼することを可能にするために、撮影された画像に含まれる一意の英数字識別子に基づいてポータブルコンピューティングデバイス1350のディスプレイ上にインターフェース1300および/または1400をレンダリングするために実行される可能性があり、ユーザのためにデータ入力/検索フィールドのうちの少なくとも1つまたは複数に自動的にデータを投入する可能性がある。
【0090】
図15は、ユーザの個人参考文献ライブラリ1504の書誌情報および/または著作物の全文バージョン(集合的に参考文献データ1502)を取り出し、それを記憶するために、ポータブルコンピューティングデバイス1350(例えば、スマートフォン、タブレット)のディスプレイ上にレンダリングされる可能性があり、本開示の例示的な実施形態に関連して使用される可能性がある例示的なグラフィカルユーザインターフェース1500を示す。例えば、例示的な実施形態において、インターフェース1500は、ポータブルコンピューティングデバイス1350のユーザがEndNote Web(登録商標)とインタラクションして、メタデータを含む引用された参考文献データを、後で取り出す、電子メールで送る、および/または印刷するためにポータブルコンピューティングデバイス1350に、および/またはポータブルコンピューティングデバイス1350の遠隔に記憶することができる。例示的な実施形態においては、物理的な/有形の著作物に含まれる一意の英数字識別子の獲得された画像に基づいて、例えば、ポータブルコンピューティングデバイスを通じてユーザによって送られた検索要求の結果が、後で使用するためにユーザの個人ライブラリ1504に記憶され得る。
【0091】
図16は、本開示の例示的な実施形態によって実装され得る例示的な画像に基づく参考文献取り出しプロセス1600を示す流れ図である。始めに、ステップ1602において、ユーザのポータブルコンピューティングデバイスが、一意の英数字識別子を含む著作物の一部の画像を撮影するために利用され得る。ステップ1604において、文字認識プロセスが、一意の英数字識別子を抽出するために画像に対して実施され得る。一意の英数字識別子が取得されると、ステップ1606において、識別子が、ポータブルコンピューティングデバイスによって包括的な参考文献管理システム(例えば、Thomson ReutersのWeb of Knowledge研究プラットフォーム)に送信される。
【0092】
ステップ1608において、参考文献管理システムが、受信された識別子を少なくとも1つの出典データベース(例えば、Thomson Reuters Web of KnowledgeおよびWeb of Scienceデータベースならびに/または公共引用参考文献データベース)内の記憶された識別子とプログラムで比較するためのコードを実行する。良好な一致が存在する場合(ステップ1610)、ステップ1612において、メタデータを含む引用された参考文献のデータが、画像から抽出された一意の英数字識別子に関連する著作物に関して取り出される。(上述のように、「良好な一致」は、ある程度のまたはある割合の許容範囲が認められる場合、抽出された一意の英数字識別子と記憶された識別子との厳密な一致のみでなく、完全ではない一致も包含することが、当業者に理解されるであろう。そのような場合、参考文献管理システムは、厳密な一致が見つからなかったことを伝達する可能性があり、あり得る代替的選択肢を示唆する可能性がある。)
【0093】
良好な一致が存在しない場合(ステップ1610)、ステップ1614において、参考文献管理システムが、良好な一致が存在しなかったことと、(例えば、一意の英数字識別子を含む)検索基準が別の比較のために修正/編集され、再び送られ得ることとを示すGUIをユーザのポータブルコンピューティングデバイスのディスプレイ上にレンダリングするようにユーザインターフェースに命令するために実行され得る。一部の実施形態において、メタデータを含む引用された参考文献のデータは、後で取り出す、電子メールで送る、および/または印刷するために、デバイス外に、例えば、包括的な参考文献管理システム(例えば、EndNote(登録商標)Web)の構成要素に記憶され得る。
【0094】
図17は、本開示の例示的な実施形態によって実装され得る例示的な画像に基づく参考文献取り出しプロセス1700を示す流れ図である。ステップ1702において、ユーザのポータブルコンピューティングデバイスが、モバイルアプリケーション(例えば、参考文献管理システムに固有のクライアント側アプリケーション)をダウンロードし、インストールし得る。アプリケーションがダウンロードされた後、ユーザが、参考文献管理のアカウントを作成することができる。これらのステップは、当業者に知られており、さらに詳細に検討されない。一部の実施形態においては、参考文献管理システムとポータブルコンピューティングデバイスとの間の通信が、セキュアソケットレイヤ(SSL)上のXMLリモートプロシージャコール(XRPCオーバSSL)を用いて実行され、認可応答および要求が、ポータブルコンピューティングデバイスの移動局ID(MSID)を用いるオープン認可(OAuth: open authorization)プロトコルを使用する。一実施形態において、参考文献管理システム(例えば、Thomson ReutersのWeb of Knowledge研究プラットフォーム)の認証および登録サブシステム(図示せず)ならびにユーザ権利管理および認証システム(例えば、Valve CorporationのSTEAMソリューション)が、ポータブルコンピューティングデバイスを登録し、認証する。
【0095】
モバイルアプリケーションのインストールおよび認証の後、ステップ1704において、ユーザは、ポータブルコンピューティングデバイスを用いて一意の英数字識別子を含む著作物の一部の画像を撮影し得る。ステップ1706において、撮影された画像が、撮影された画像を機械によって符号化されたデータまたはテキストに変換するための文字認識プロセスを実行するシステム構成要素に転送される可能性があり、ステップ1708において、一意の英数字識別子が、機械によって符号化されたデータまたはテキストから抽出される。
【0096】
ステップ1710において、抽出された一意の英数字識別子が、1つまたは複数の出典データベースに記憶されたデータおよび情報と比較される。抽出された識別子が1つまたは複数の出典データベースに記憶されたデータおよび情報とよく一致する場合(ステップ1712)、関連する引用された参考文献のデータが、ステップ1714において、出典データベースから取り出され、ステップ1716において、表示するためにポータブルコンピューティングデバイスに関連するメタデータと一緒に提供される。そうでない場合、ステップ1718において、ユーザが、エラーメッセージを送信される可能性があり、および/または検索基準を修正するように促される可能性がある。システムによって提供されるデータおよび情報は、ユーザによる後の使用および取り出しのためにデバイス外に記憶される可能性がある。一実施形態において、データおよび情報は、Thomson ReutersのEndNote出版ソリューションの参考文献ライブラリ構成要素でプロビジョニングまたはカスタマイズされ、記憶される。
【0097】
システムのさまざまな特徴は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせで実装され得る。例えば、システムの一部の特徴が、プログラミング可能なコンピュータで実行される1つまたは複数のコンピュータプログラムで実装され得る。
【0098】
各プログラムは、コンピュータシステムまたはその他の機械と通信するために高レベルの手続き型またはオブジェクト指向プログラミング言語で実装され得る。
【0099】
さらに、それぞれのそのようなコンピュータプログラムは、上述の機能を実行するようにコンピュータを構成し、動作させるために処理デバイスによって読み取り可能なまたは実行可能な読み取り専用メモリ(ROM)などの非一時的ストレージ媒体に記憶され得る。
【0100】
本明細書で開示される対象の特定の実施形態の上述の説明は、例示および説明を目的として示されており、本明細書において説明される対象の範囲を限定するように意図されていない。その他のさまざまな実施形態、修正、および応用が上述の説明および添付の図面から当業者に明らかになるであろうことは、完全に企図される。したがって、そのようなその他の実施形態、修正、および応用は、以降の添付の特許請求の範囲の範囲に入るように意図される。さらに、当業者は、本明細書において説明された実施形態、修正、および応用が特定の環境に関連しており、本明細書において説明された対象がそれらに限定されず、任意の数のその他の方法、環境、および目的で利益をもたらすように適用され得ることを理解するであろう。したがって、以下に記載の特許請求の範囲は、本明細書において開示された新規の特徴および技術の完全な範囲および精神を考慮して解釈されるべきである。