(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023070794
(43)【公開日】2023-05-22
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
G06F 16/33 20190101AFI20230515BHJP
G06F 21/62 20130101ALI20230515BHJP
【FI】
G06F16/33
G06F21/62 327
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021183132
(22)【出願日】2021-11-10
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.HDMI
(71)【出願人】
【識別番号】519356331
【氏名又は名称】株式会社サピエンス
(74)【代理人】
【識別番号】110002789
【氏名又は名称】弁理士法人IPX
(72)【発明者】
【氏名】高田 龍太郎
(72)【発明者】
【氏名】二見 広太
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175BA01
5B175DA01
5B175JC04
(57)【要約】
【課題】出版物の検索結果として、適切な範囲を表示させることのできる情報処理装置及びプログラムを提供すること。
【解決手段】本発明の一態様によれば、出版物の検索を行う情報処理装置が提供される。この情報処理装置は、受付部と、検索部と、特定部と、生成部とを備える。受付部は、検索語の入力を受け付け可能に構成される。検索語は、文字と文字列と単語とのいずれかである。検索部は、対象出版物から検索語を全文検索可能に構成される。対象出版物は、検索可能な全ての出版物群又は該出版物群から指定された1冊以上の出版物である。特定部は、対象出版物中の検索語を含む抽出範囲を特定する。抽出範囲は、所定数の文字又は単語を含む。生成部は、抽出範囲から制限リストに含まれる制限範囲と重複する範囲を除外した表示範囲を表示させる表示情報を生成可能に構成される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
出版物の検索を行う情報処理装置であって、
受付部と、検索部と、特定部と、生成部とを備え、
前記受付部は、検索語の入力を受け付け可能に構成され、
前記検索語は、文字と文字列と単語とのいずれかであり、
前記検索部は、対象出版物から前記検索語を全文検索可能に構成され、
前記対象出版物は、検索可能な全ての出版物群又は該出版物群から指定された1冊以上の出版物であり、
前記特定部は、前記対象出版物中の前記検索語を含む抽出範囲を特定し、
前記抽出範囲は、所定数の文字又は単語を含み、
前記生成部は、前記抽出範囲から制限リストに含まれる制限範囲と重複する範囲を除外した表示範囲を表示させる表示情報を生成可能に構成される
情報処理装置。
【請求項2】
請求項1に記載の情報処理装置において、
前記生成部は、前記抽出範囲中の前記検索語が前記制限リストに含まれる場合は、該抽出範囲の全てを除外した表示情報を生成する
情報処理装置。
【請求項3】
請求項1又は請求項2に記載の情報処理装置において、
指定部を備え、
前記指定部は、前記表示範囲の前後の所定数の文字又は単語を含む範囲を前記制限範囲として指定し、前記制限リストに追加する
情報処理装置。
【請求項4】
請求項3に記載の情報処理装置において、
前記制限範囲は、有効期限を有する
情報処理装置。
【請求項5】
請求項3又は請求項4に記載の情報処理装置において、
前記指定部は、前記表示範囲を許可範囲として許可リストに追加し、前記制限範囲を指定する際に、前記許可範囲を前記制限範囲から除外する
情報処理装置。
【請求項6】
請求項5に記載の情報処理装置において、
前記許可範囲は、有効期限を有する
情報処理装置。
【請求項7】
請求項1乃至請求項6のいずれか1項に記載の情報処理装置において、
前記生成部は、前記対象出版物から前記検索語が複数検索された場合には、予め定めた順序で、前記表示情報を生成する
情報処理装置。
【請求項8】
請求項1乃至請求項7のいずれか1項に記載の情報処理装置において、
前記表示情報による表示は、前記検索語がハイライト表示される
情報処理装置。
【請求項9】
プログラムであって、
コンピュータを請求項1乃至請求項8のいずれか1項に記載の情報処理装置として機能させる
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
近年、インターネットを利用して配信されるコンテンツが増大しており、電子化された書籍である電子書籍の数も増加している。
【0003】
また、電子書籍に関しては、コンピュータと親和性が高いといった特徴を利用し、電子書籍に関連する情報を容易に取得できるようにする技術等が提案されている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、文字や単語を検索語として書籍や雑誌等の出版物の検索を行う場合、検索結果として書籍名や雑誌名のみが表示される場合には、利用者は、検索された出版物が所望の出版物であるか否かを判断することが困難である。このため、出版物の内容のうち、検索語が出現する周辺の文章とともに、検索結果を表示することも提案されている。
【0006】
しかしながら、検索結果として、文章の表示を行った場合、表示された文章の端部の単語等を用いて再検索を行うといった利用がなされると、結果として、利用者が出版物の全ての内容を検索により入手できてしまうことになる。
【0007】
本発明では上記事情を鑑み、出版物の検索結果として、適切な範囲を表示させることのできる情報処理装置及びプログラムを提供することとした。
【課題を解決するための手段】
【0008】
本発明の一態様によれば、出版物の検索を行う情報処理装置が提供される。この情報処理装置は、受付部と、検索部と、特定部と、生成部とを備える。受付部は、検索語の入力を受け付け可能に構成される。検索語は、文字と文字列と単語とのいずれかである。検索部は、対象出版物から検索語を全文検索可能に構成される。対象出版物は、検索可能な全ての出版物群又は該出版物群から指定された1冊以上の出版物である。特定部は、対象出版物中の検索語を含む抽出範囲を特定する。抽出範囲は、所定数の文字又は単語を含む。生成部は、抽出範囲から制限リストに含まれる制限範囲と重複する範囲を除外した表示範囲を表示させる表示情報を生成可能に構成される。
【0009】
本発明の一態様によれば、所望する検索語を含む出版物を検索し、その検索結果を、出版物の内容の適切な範囲とともに表示させることが可能となる。
【図面の簡単な説明】
【0010】
【
図1】本発明の実施形態に係る情報処理装置1と他の装置との接続構成を示した図である。
【
図3】情報処理装置1の機能的な構成を示すブロック図である。
【
図4】表示情報に基づいて端末2に表示される画面の例を示した図である。
【
図5】表示情報に基づいて端末2に表示される画面の例を示した図である。
【
図6】情報処理装置1の動作の流れを示すアクティビティ図である。
【発明を実施するための形態】
【0011】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
【0012】
ところで、本実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
【0013】
また、本実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集合体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
【0014】
また、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、及びメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
【0015】
1.全体構成
図1は、本発明の実施形態に係る情報処理装置1と他の装置との接続構成を示した図である。同図に示すように、情報処理装置1は、ネットワーク3に接続されている。ネットワーク3は、例えば、インターネットである。この情報処理装置1は、ネットワーク3を介して、複数の端末2にと通信可能に接続される。
【0016】
この情報処理装置1は、出版物の検索を行うものである。出版物とは、書籍や雑誌、電子書籍等を含むものである。また、端末2は、情報処理装置1を利用する利用者が用いるもので、パーソナルコンピュータやスマートフォン、タブレット等であり、ウェブブラウザが動作するものであれば、どのようなものであってもよい。なお、ウェブブラウザにかえて専用のソフトウェアを利用するようにしてもよい。
2.情報処理装置1の構成
図2は、情報処理装置1の構成を示した図である。同図に示すように、情報処理装置1は、処理部11と、記憶部12と、一時記憶部13と、外部装置接続部14と、通信部15とを有しており、これらの構成要素が情報処理装置1の内部において通信バス16を介して電気的に接続されている。
【0017】
処理部11は、例えば、中央処理装置(Central Processing Unit:CPU)により実現されるもので、記憶部12に記憶された所定のプログラムに従って動作し、種々の機能を実現する。
【0018】
記憶部12は、様々な情報を記憶する不揮発性の記憶媒体である。これは、例えばハードディスクドライブ(Hard Disk Drive:HDD)やソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスにより実現される。なお、記憶部12は、情報処理装置1と通信可能な別の装置に配するようにすることも可能である。
【0019】
一時記憶部13は、揮発性の記憶媒体である。これは、例えばランダムアクセスメモリ(Random Access Memory:RAM)等のメモリにより実現され、処理部11が動作する際に一時的に必要な情報(引数、配列等)を記憶する。
【0020】
外部装置接続部14は、例えばユニバーサルシリアルバス(Universal Serial Bus:USB)や高精細度マルチメディアインターフェース(High-Definition Multimedia Interface:HDMI)といった規格に準じた接続部であり、キーボード等の入力装置やモニタ等の表示装置を接続可能としている。
【0021】
通信部15は、例えばローカルエリアネットワーク(Local Area Network:LAN)規格に準じた通信手段であり、情報処理装置1とローカルエリアネットワークやこれを介したインターネット等のネットワーク3との間の通信を実現する。
【0022】
なお、情報処理装置1には、汎用のサーバ向けのコンピュータやパーソナルコンピュータ等を利用することが可能であり、複数のコンピュータを用いて情報処理装置1を構成することも可能である。
3.情報処理装置1の機能
次に、情報処理装置1の機能について説明する。
図3は、情報処理装置1の機能的な構成を示すブロック図である。
【0023】
同図に示すように、情報処理装置1は、受付部101と、検索部102と、特定部103と、生成部104と、保持部105と、指定部106とを備える。これら情報処理装置1の各機能部は、プログラムが、コンピュータを情報処理装置1として機能させることで実現される。
【0024】
受付部101は、検索語の入力を受け付け可能に構成される。このとき、受付部101は、全文検索の対象となる対象出版物を指定する指定条件を受け付けるようにしてもよい。対象出版物は、検索可能な全ての出版物群又は該出版物群から指定された1冊以上の出版物である。この指定条件は、書誌情報であり、例えば、出版物名や出版物の発刊年(発刊年月、発刊年月日でもよい)、出版社、著者等を指定条件とすることができる。なお、指定条件を受け付けなかった場合は、デフォルトとして設定されている指定条件が全文検索に用いられる。デフォルトとして設定されている指定条件は、例えば、検索可能な全ての出版物であるが、販売可能な出版物に限定するようにしてもよい。また、受付部101が受け付ける検索語は、文字と文字列と単語とのいずれかである。
【0025】
検索部102は、対象出版物から検索語を全文検索可能に構成される。検索部102は、受付部101が指定条件を受け付けた場合には、指定条件に合致する出版物を指定出版物として全文検索の対象にし、受付部101が指定条件を受け付けなかったデフォルトとして設定されている指定条件を用いる。
【0026】
出版物の全文検索は、出版物情報DB4に格納されている出版物情報を対象に行う。この出版物情報DB4には、電子出版物の電子データと、紙文書を光学的に読み取って得た画像及び当該画像から文字認識処理により電子データ化したものの組とが格納されている。したがって、検索部102は、指定出版物が紙の出版物である場合に、該紙の出版物の各ページの画像を文字認識処理した結果を対象に検索を行う。
【0027】
また、検索部102は、検索語の別称が存在する場合に、該検索語と該別称との論理和により全文検索を行うようにしてもよい。例えば、「製造物責任法」は、「PL法」と呼ばれることもあり、通常、両者は同一の意味を示すものである。したがって、受付部101検索語として「製造物責任法」を受け付けた場合には、検索部102は、「製造物責任法」と「PL法」との論理和による検索、いわゆるOR検索を行う。このような別称は、複数存在する場合があり、その場合には、全ての別称の論理和で検索を行う。例えば、「自動車損害賠償責任保険」は、略称として「自賠責保険」の語が用いられ、通称又は俗称として「強制保険」の語が用いられる。
【0028】
特定部103は、対象出版物中の検索語を含む抽出範囲を特定する。抽出範囲は、所定数の文字又は単語を含む範囲であり、例えば、320文字の範囲である。
【0029】
生成部104は、特定部103が特定した抽出範囲から制限リストに含まれる制限範囲と重複する範囲を除外した表示範囲を表示させる表示情報を生成可能に構成される。このとき、表示情報による端末2での表示は、検索語がハイライト表示されていることが望ましい。また、生成部104は、抽出範囲中の検索語が制限リストに含まれる場合は、該抽出範囲の全てを除外した表示情報を生成する。なお、制限リストについては後述する。
【0030】
また、生成部104は、対象出版物から検索語が複数検索された場合には、予め定めた順序で、表示情報を生成する。例えば、対象出版物の同じページから、検索語が複数検索された場合、制限範囲を考慮せずに全ての抽出範囲を表示すると、当該ページの全ての内容が表示される可能性があり、制限範囲を考慮した場合には、処理を行う順序により、表示される内容が異なることになる。このため、表示情報を生成する処理順を予め定めることができる。表示情報を生成する処理順は、例えば、出現順である。
【0031】
保持部105は、制限リストと許可リストとを保持する。制限リストは、制限範囲を含むのもので、制限範囲は、複数であってもよい。この制限範囲は、表示情報により表示させない範囲を示すものであり、例えば、表示情報により表示された表示範囲の前後のそれぞれに位置し、所定数の文字又は単語を含む範囲である。この制限範囲は、有効期限を有する。つまり、一定の時間が経過すると、制限範囲は無効となる。
【0032】
許可リストは、許可範囲を含むもので、許可範囲は、複数であってもよい。この許可範囲は、表示情報により表示した表示範囲と一致するもので、制限範囲を指定する際に、当該指定から除外される範囲を示すものである。この許可範囲は、有効期限を有する。つまり、一定の時間が経過すると、許可範囲は無効となる。
【0033】
指定部106は、出版物中の制限範囲と許可範囲とを指定し、それぞれを制限リストと許可リストに保持させる。具体的には、制限範囲は、表示範囲の前後の所定数の文字又は単語を含む範囲を制限範囲として指定し、制限リストに追加する。許可範囲は、表示範囲を許可範囲として許可リストに追加する。この許可範囲は、制限範囲を指定する際に、許可範囲が制限範囲から除外されるように用いられる。
【0034】
4.表示情報による表示の例
図4及び
図5は、表示情報に基づいて端末2に表示される画面の例を示した図である。端末2に表示される表示画面200には、出版物情報201が表示され、出版物情報201に隣接して見出情報202が表示される。さらに、見出情報202に対応する内容情報203が表示される。同一の出版物に複数の検索語が出現している場合には、見出情報204と対応する不図示の内容情報も表示される。
【0035】
図4に示した表示画面200は、検索語として「160文字」を検索した結果であり、内容情報203には、検索語の前部分として「次に~場合は」が160文字表示されるとともに、検索語の後部分として「である。~する章」が160文字表示される。また、検索語である「160文字」は、ハイライト表示205となる。
【0036】
この表示画面200が表示されたことにより、表示頭の「次」よりも前の160文字と、表示末の「章」よりも後の160文字とが、それぞれ制限範囲となり、制限リストに加えられるとともに、「次に~する章」までが、許可範囲として許可リストに加えられる。
【0037】
続いて、検索語として「出版物内」が検索されると、その結果は、表示画面210として端末2に表示される。表示画面210には、出版物情報211が表示され、出版物情報211に隣接して見出情報212が表示される。さらに、見出情報212に対応する内容情報213が表示される。同一の出版物に複数の検索語が出現している場合には、見出情報214と対応する不図示の内容情報も表示される。
【0038】
表示画面210は、検索語として「出版物内」を検索した結果であり、内容情報213には、検索語の前部分として「表示させる~出現した」が160文字表示されるとともに、検索語の後部分として「の該検索語~する章」が74文字表示される。また、検索語である「出版物内」は、ハイライト表示215となる。検索語の後部分が74文字で表示されるのは、先の「160文字」を検索した際に、制限リストに加えられた部分が非表示となっているからである。
【0039】
5.情報処理装置1の動作
次に、情報処理装置1の動作について説明する。
図6は、情報処理装置1の動作の流れを示すアクティビティ図である。
【0040】
まず、利用者が端末2を操作して情報処理装置1に接続すると、受付部101が端末2に入力画面を提供する(A101)。入力画面は、検索語や出版物の指定等の条件を入力するもので、利用者がこれらを入力画面に入力すると、受付部101が出版物指定等と検索語とを受け付ける(A102)。続いて、検索部102が検索語と指定条件に基づいて出版物の全文検索を行い(A103)、特定部103が、所定の範囲を抽出範囲として特定する。
【0041】
そして、生成部104が、保持部105に保持されている制限リストを取得し(A104)、取得した制限リストに含まれる制限範囲を、抽出範囲から除外した表示範囲に基づく表示情報を生成する(A105)。そして、指定部106が、表示範囲を新たな許可範囲として許可リストに追加して保持部105に保持させ(A106)、表示範囲の前後の所定範囲を、制限範囲として制限リストに追加して保持部105に保持させる(A107)。
【0042】
ここで、検索結果として特定された抽出範囲が複数されば、同様の処理を繰り返し、全ての抽出範囲に対する処理が終了すると、生成部104が生成した表示情報を端末2に提供し(A108)、処理を終了する。
【0043】
6.制限範囲と許可範囲の具体例
続いて、
図7乃至
図13を参照して、表示範囲と制限範囲と許可範囲の具体例について説明する。
図7乃至
図13は、範囲の具体例を説明するための図である。なお、以下では、簡略化のため、出版物のページが5行で構成され、1行が5文字で構成され、表示範囲と制限範囲と許可範囲が5文字であるものとして説明する。
【0044】
まず、「ABCDEFGHIJKLMNOPQRSTUVWXY」と記述されたページから「C」を検索語とする検索を行うと、
図7に示すように、表示範囲として「ABCDE」が特定され、許可範囲として「ABCDE」、制限範囲として「FGHIJ」が追加される。
【0045】
この状態で、「M」を検索語とする検索を行うと、
図8に示すように、表示範囲として「KLMNO」が特定され、許可範囲として「KLMNO」、制限範囲として「PQRST」が追加される。
【0046】
さらに、この状態で、「E」を検索語とする検索を行うと、抽出範囲は、「CDEFG」であるが、「FG」は制限範囲に含まれるため、
図9に示すように、表示範囲として「CDE」が特定される。このとき、「CDE」は、すでに許可範囲であるため、許可範囲の追加は行われず、「FGHIJ」は、すでに制限範囲であるため、制限範囲の追加は行われない。
【0047】
また、この状態で、「F」を検索語とする検索を行うと、「F」は制限範囲であるため、表示範囲は特定されず、表示情報として、例えば、「この検索結果は、ページ表示制限中です。制限解除時刻:2021/11/9 13:53:09」といった表示を行わせるものが生成される。
【0048】
続いて、「ABCDEFGHIJKAMNOPQRSTUVWXY」と記述されたページから「A」を検索語とする検索を行う場合を2例説明する。まず、正順に処理を行う場合を説明すると、
図10に示すように、表示範囲として「ABCDE」が特定され、許可範囲として「ABCDE」、制限範囲として「FGHIJ」が追加される。
【0049】
この状態で、3行目の「A」について処理を行うと、
図11に示すように、表示範囲として「KAMN」が特定される。「J」は、制限範囲に含まれているため、表示範囲から除外される。また、許可範囲として「KAMN」、制限範囲として「OPQRS」が追加される。
【0050】
一方、逆順に処理を行うと、
図12に示すように、表示範囲として「JKAMN」が特定され、許可範囲として「JKAMN」、制限範囲として「EFGHI」と「OPQRS」が追加される。
【0051】
この状態で、1行目の「A」について処理を行うと、
図13に示すように、表示範囲として「ABCD」が特定される。「E」は、制限範囲に含まれているため、表示範囲から除外される。また、許可範囲として「ABCD」が追加される。制限範囲は追加されない。
【0052】
このように、複数の検索語が存在した場合には、処理を行う順により表示される内容が変わることがあるため、その処理順を予め定めておくことができる。例えば、最初に出現する検索語は、見出し的に使われている場合があるため、2つ目以降の検索語から処理を行い、最初に出現した検索語の処理を最後に行うといったように、処理順序を設定しておくことができる。
【0053】
7.その他
本発明は、次に記載の各態様で提供されてもよい。
前記情報処理装置において、前記生成部は、前記抽出範囲中の前記検索語が前記制限リストに含まれる場合は、該抽出範囲の全てを除外した表示情報を生成する情報処理装置。
前記情報処理装置において、指定部を備え、前記指定部は、前記表示範囲の前後の所定数の文字又は単語を含む範囲を前記制限範囲として指定し、前記制限リストに追加する情報処理装置。
前記情報処理装置において、前記制限範囲は、有効期限を有する情報処理装置。
前記情報処理装置において、前記指定部は、前記表示範囲を許可範囲として許可リストに追加し、前記制限範囲を指定する際に、前記許可範囲を前記制限範囲から除外する情報処理装置。
前記情報処理装置において、前記許可範囲は、有効期限を有する情報処理装置。
前記情報処理装置において、前記生成部は、前記対象出版物から前記検索語が複数検索された場合には、予め定めた順序で、前記表示情報を生成する情報処理装置。
前記情報処理装置において、前記表示情報による表示は、前記検索語がハイライト表示される情報処理装置。
プログラムであって、コンピュータを前記情報処理装置として機能させるプログラム。
もちろん、この限りではない。
【0054】
また、上記のプログラムを格納する、コンピュータ読み取り可能な非一時的な記録媒体として提供してもよい。
【符号の説明】
【0055】
1 :情報処理装置
2 :端末
3 :ネットワーク
4 :出版物情報DB
11 :処理部
12 :記憶部
13 :一時記憶部
14 :外部装置接続部
15 :通信部
16 :通信バス
101 :受付部
102 :検索部
103 :特定部
104 :生成部
105 :保持部
106 :指定部
200 :表示画面
201 :出版物情報
202 :見出情報
203 :内容情報
204 :見出情報
205 :ハイライト表示
210 :表示画面
211 :出版物情報
212 :見出情報
213 :内容情報
214 :見出情報
215 :ハイライト表示