特許第5944338号(P5944338)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許5944338情報処理装置、情報処理プログラム、および情報処理方法
<>
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000002
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000003
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000004
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000005
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000006
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000007
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000008
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000009
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000010
  • 特許5944338-情報処理装置、情報処理プログラム、および情報処理方法 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5944338
(24)【登録日】2016年6月3日
(45)【発行日】2016年7月5日
(54)【発明の名称】情報処理装置、情報処理プログラム、および情報処理方法
(51)【国際特許分類】
   G06F 17/30 20060101AFI20160621BHJP
   G06F 17/24 20060101ALI20160621BHJP
【FI】
   G06F17/30 310C
   G06F17/30 210A
   G06F17/24 620
【請求項の数】5
【全頁数】14
(21)【出願番号】特願2013-60966(P2013-60966)
(22)【出願日】2013年3月22日
(65)【公開番号】特開2014-186546(P2014-186546A)
(43)【公開日】2014年10月2日
【審査請求日】2013年12月16日
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100089118
【弁理士】
【氏名又は名称】酒井 宏明
(74)【代理人】
【識別番号】100125612
【弁理士】
【氏名又は名称】中嶋 裕昭
(72)【発明者】
【氏名】宮崎 祐
【審査官】 吉田 誠
(56)【参考文献】
【文献】 特開2004−240597(JP,A)
【文献】 特開2013−037419(JP,A)
【文献】 特開2006−285896(JP,A)
【文献】 米国特許出願公開第2006/0221064(US,A1)
【文献】 特開2010−170525(JP,A)
【文献】 米国特許出願公開第2010/0188674(US,A1)
【文献】 米国特許出願公開第2007/0247673(US,A1)
【文献】 特開2001−236360(JP,A)
【文献】 米国特許出願公開第2003/0004991(US,A1)
【文献】 特開2013−008109(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
G06F 17/24
(57)【特許請求の範囲】
【請求項1】
スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得する取得手段と、
前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶する記憶手段と、
前記手書箇所により指定された前記スキャン画像中の指定文字列をハッシュタグとして抽出する抽出手段とを備え、
前記記憶手段は、前記ハッシュタグを前記対象文章に対応付けて記憶する、
ことを特徴とする情報処理装置。
【請求項2】
前記取得手段は、前記対象文章を、前記手書箇所を含む画像データとして取得することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記取得手段は、前記対象文章を前記スキャン画像からテキストデータとして取得することを特徴とする請求項1に記載の情報処理装置。
【請求項4】
コンピュータが実行する情報処理方法であって、
スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得し、
前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶し、
前記手書箇所により指定された前記スキャン画像中の指定文字列をハッシュタグとして抽出し、
前記ハッシュタグを前記対象文章に対応付けて記憶する、
処理を実行することを特徴とする情報処理方法。
【請求項5】
コンピュータに、
スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得し、
前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶し、
前記手書箇所により指定された前記スキャン画像中の指定文字列をハッシュタグとして抽出し、
前記ハッシュタグを前記対象文章に対応付けて記憶する、
処理を実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理プログラム、および情報処理方法に関する。
【背景技術】
【0002】
書籍のスキャン画像を基にテキストデータを作成する書籍の電子化技術が普及している。書籍を電子化するには、まず、書籍をスキャンし、スキャン画像から文字画像を抽出する。この文字画像に対応する文字コードを文字パターン辞書から取得することにより、文字画像をテキストデータに変換する。そうして、スキャン画像を基にテキストデータを作成することにより、書籍を電子ファイル化する。
【0003】
事業者に電子化を依頼する書籍には、依頼した時点ですでに手書文字が付されている場合がある。例えば、ユーザは学術文献等を読む際に、学術文献で特に重要と考える部分を波線で示したり、「要点」「ポイント」というワードを記載したりして、後で読み返したときに重要な部分が一目で判断できるようにすることがある。このような手書文字は書籍を電子ファイル化する際、ノイズとして削除されるのが通常である。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2011−053889号公報
【特許文献2】特開2009−231172号公報
【特許文献3】特開2009−212655号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、書籍を電子化する際に手書文字が有効利用されていない問題がある。
【0006】
開示の技術は、上記に鑑みてなされたものであって、手書文字を有効利用することができる情報処理装置、情報処理プログラム、および情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0007】
本願に係る情報処理装置は、スキャン画像に含まれる手書箇所の範囲を前記スキャン画像に対応する座標を用いて特定し、特定された前記範囲の前後に対応する対象文章を取得する取得手段と、前記スキャン画像、前記範囲を特定する情報、および前記対象文章を対応付けて記憶する記憶手段と、を備えたことを特徴とする。
【発明の効果】
【0008】
開示の技術の実施態様によれば、手書文字を有効利用することができるという効果を奏する。
【図面の簡単な説明】
【0009】
図1図1は、実施例1に係る手書データを取得し、対象文章を投稿用のWebページに投稿するまでの処理の流れを説明するための図である。
図2図2は、書籍の電子化処理システムに係る構成の一例を示した図である。
図3図3は、電子化処理サーバの構成を示す機能ブロック図である。
図4図4は、画像データの一例を示した図である。
図5図5は、テキストデータの一例を示した図である。
図6図6は、手書データの一例を示した図である。
図7図7は、画像データから各手書データを作成するまでの流れを示したフロー図である。
図8図8は、スキャン画像から投稿用のWebページへ遷移する様子を示した図である。
図9図9は、対象文章にハッシュタグを付した場合の手書データの一例を示す図である。
図10図10は、端末が投稿サイトの入力欄にハッシュタグを設定し、対象文章を入力したときの一例を示した図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理プログラム、および情報処理方法を実施するための実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る検索装置、検索プログラム、および検索方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【実施例1】
【0011】
[処理の概要]
まず、図1を用いて、実施例1に係る表示処理について説明する。図1は、手書データを取得し、対象文章を投稿用のWebページに投稿するまでの処理の流れを説明するための図である。情報処理サーバ200は、主に、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する処理と、スキャン画像11および対象文章を対応付けて記憶する処理とをおこなう。以下、より具体的に説明する。
【0012】
まず、情報処理サーバ200は、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する。そのために、情報処理サーバ200は、最初に、スキャナ等によって読み込まれた画像データ221aを受け付け、手書文字もしくは手書符号が記載された箇所を手書文字データとして取得する。例えば、情報処理サーバ200は、画像データ221aに記載された「為替レート」という用語の下の部分に下線が引かれ、その下に「ポイント」という文字が手書きで記載されているので、この手書箇所をまとめて長方形で囲んで抽出する。そして、情報処理サーバ200は、手書箇所を抽出する際、手書箇所が記された画像データ221に対応するページ数「3」と、手書箇所を長方形で囲んだときの左上および右下の座標「(90,80)−(130,85)」とを、手書文字データと関連付け、さらに手書箇所ごとにシーケンシャルに与えられる手書ID「1」を関連付ける。
【0013】
次に、情報処理サーバ200は、抽出した手書箇所の前後にある対象文章を取得する。例えば、情報処理サーバ200は、手書箇所があるページ数「3」と、手書箇所に係る座標「(90,80)−(130,85)」とに基づき手書箇所を特定し、手書箇所の前後に対応する対象文章データを取得する。例えば、情報処理サーバ200は、手書箇所に係る行の前後1行を含む、計3行をテキストデータとして取得する。
【0014】
次に、情報処理サーバ200は、手書データ10をスキャン画像11に対応付けて記憶する。情報処理サーバ200は、対象文章を取得する際に対象文章の行「3−6」を取得する。そして、情報処理サーバ200は、対象文章の行「3−6」と、対象文章のテキストデータとを手書ID「1」に関連付け、手書データ10とする。すなわち、情報処理サーバ200は、先述の手書ID、ページ数、座標、手書文字データと、取得した対象文章の行、および対象文章データを、手書データ10として対応付けて記憶する。
【0015】
端末30aは、手書データ10およびスキャン画像11をダウンロードし、表示部31aにスキャン画像11を表示する。端末30aは、スキャン画像11の手書箇所が押下されると、手書データ10を基に手書箇所に対応する対象文章を取得する。そして、端末30aは、手書箇所が押下されたとき、表示部31aが投稿用のWebページに切り替え、表示部31bに遷移する。さらに、端末30bは、投稿用のWebページの入力欄に対象文章を入力する。端末30bは、投稿ボタンの押下を検知すると、対象文章を投稿用のWebページに投稿する。
【0016】
このように、情報処理サーバ200は、スキャン画像に含まれる手書箇所の前後に対応する対象文章を取得し、スキャン画像11および対象文章を対応付けて記憶する。スキャン画像11と、対象文章とを対応付けた手書データ10とをダウンロードした端末30は、表示部31aに表示されている手書箇所が押下された際、手書データ10から対象文章を取得し、対象文章を投稿用のWebページの入力欄に入力することができる。このため、ユーザは、表示部31bの投稿用のWebページにおいて、投稿ボタンを選択する等の簡易な操作をするだけで、選択した手書箇所に対応する対象文章を投稿サイトに投稿できる。
【0017】
[電子化システムの全体構成]
図2は、電子化システム100の全体構成の一例を示した図である。ユーザ端末101と電子化サーバ110と管理システム120は、図示しないネットワークに接続し、各種の情報を交換する。かかるネットワークの一態様としては、有線または無線を問わず、LAN(Local Area Network)やVPN(Virtual Private Network)、移動体通信網などの任意の通信網が挙げられる。
【0018】
ユーザ端末101は、ユーザが操作する端末装置である。例えば、ユーザ端末101は、デスクトップ型PC(パーソナルコンピュータ)、タブレット型PC、ノート型PCなどの情報処理装置等である。なお、ユーザ端末101は、スマートフォン、PDA(Personal Digital Assistant)、携帯電話機であってもよい。なお、図2の例では、ユーザ端末101として、デスクトップ型PCとスマートフォンをそれぞれ1つ示したが、これはユーザ端末の例示であり、他の種類の端末を使用してもよい。
【0019】
電子化サーバ110は、書籍の電子化をする事業者の所有するサーバである。電子化サーバ110には、スキャナ等の機器を接続し、スキャンした画像から書籍の電子化を行い、テキストデータ222を作成する。
【0020】
管理システム120は、各種の管理を行うシステムである。管理システム120は、電子書籍データ等を管理しており、受信サーバ121と、ファイル管理サーバ122と、認証サーバ123と、決済サーバ124とを有する。受信サーバ121とファイル管理サーバ122と認証サーバ123と決済サーバ124は、ネットワークを介して電子化サーバ110に接続されている。また、受信サーバ121は、電子化サーバ110からテキストデータ222、スキャン画像11を受信する。また、ファイル管理サーバ122は、登録されたユーザ毎にユーザ用の記憶領域を有している。
【0021】
次に、電子化システム100が受け付けるユーザの操作、およびユーザの操作に対する電子化システム100の処理について説明する。電子化サーバ110は、事業者Webページ103を提供しており、事業者Webページ103から書籍の電子化の依頼を受け付ける。ユーザは、書籍を電子化する場合、事業者Webページ103から会員登録を行う(1)。事業者Webページ103には、書籍の電子化に関する料金など各種の情報が表示される。
【0022】
事業者Webページ103は、管理システム120のユーザIDおよびパスワードを入力する入力領域を有しており、ユーザIDおよびパスワードを用いて認証サーバ123によりユーザの認証を行う。ユーザは、事業者Webページ103に管理システム120のユーザIDおよびパスワードを入力してログインする(1)。事業者Webページ103は、入力されたユーザIDおよびパスワードを用いて認証サーバ123によりユーザの認証を行い、認証が得られた場合、書籍の電子化の依頼を受け付ける(2)。事業者Webページ103は、書籍の電子化の依頼を受け付けると、依頼内容を受信サーバ121へ通知する。
【0023】
事業者がユーザから発送された書籍を受け付けると(3)、事業者は図示されていないスキャナにより書籍を読み取り、電子化サーバ110はスキャン画像11を取得する。電子化サーバ110は、スキャン画像11に含まれる文字列を取得し、電子化することによりテキストデータに変換する(4)。
【0024】
電子化サーバ110は、ユーザにより課金を確認すると(5)、スキャン画像11、テキストデータ222を含む電子書籍データ122を受信サーバ121へ送信して、記憶部21の事業者用の記憶領域に書き込む(6)。
【0025】
受信サーバ121は、事業者用の記憶領域に電子書籍データ112が書き込まれた際、電子書籍データ112を、ファイル管理サーバ122における依頼元のユーザの記憶領域に移動する。これにより、ユーザはユーザ端末101から依頼元のユーザの記憶領域にアクセスすることで、スキャン画像11およびテキストデータ222を閲覧できる(7)。
【0026】
[情報処理サーバにおける処理]
実施例1に係る情報処理サーバ200の機能構成の一例について説明する。図3は、実施例1に係る電子化処理サーバの構成を示す機能ブロック図である。図3に示すように、情報処理サーバ200は、制御部210と、記憶部220とを有する。また、情報処理サーバ200は、入力部201と、通信I/F202とに接続される。なお、先述した図2のファイル管理サーバ122は、情報処理サーバ200の一例である。
【0027】
入力部201は、スキャナ等により取込まれたスキャン画像11を入力するための装置である。入力部201は、書籍の各ページをスキャン画像11として記憶部220に入力する。また、通信I/F202は、NIC(Network Interface Card)等のインターフェースである。通信I/F202は、画像データ221と、テキストデータ222と、手書ID、ページ数、座標、手書文字データ、対象文章の行、および対象文章データを関連付けた手書データ10とを端末30へ送信する。
【0028】
記憶部220は、各種情報を記憶するデバイスである。記憶部220は、画像データ221と、テキストデータ222と、手書データ10とを有する。記憶部220は、それ以外に、制御部210で実行されるOS(Operating System)や、後述する格納処理を実行するプログラムを含む各種プログラムを記憶する。
【0029】
記憶部220が有する画像データ221は、スキャン画像11の各ページの画像である。図4は、画像データ221の一例を示した図である。図4のように、記憶部220は、スキャン画像11をページ単位に分割し、各ページの画像を画像データ221として記憶してもよい。記憶部220は、画像データ221を記憶する際、スキャン画像11における画像データ221に対応するページ数を関連付けて記憶してもよい。また、画像データ221には手書箇所が含まれてもよい。なお、記憶部220は、別途、書籍の全ページに係る画像を記憶してもよい。
【0030】
記憶部220が有するテキストデータ222は、スキャン画像11をテキスト化したものである。図5は、テキストデータ222の一例を示した図である。記憶部220は、スキャン画像11をテキストデータ222に対応付けて記憶する。このため、スキャン画像11およびテキストデータ222を受信した端末30は、テキストデータ222の各文字について、スキャン画像11での位置をそれぞれ特定することができる。このように、スキャン画像11はテキストデータと対応付けられている。
【0031】
記憶部220が有する手書データ10は、スキャン画像11に含まれる各手書箇所の座標等を対応付けたデータである。手書データ10は、手書ID、ページ数、座標、手書文字データ、対象文章の行、および対象文章データを関連付け、さらに、手書箇所ごとにシーケンシャルに与えられる手書IDを関連付ける。記憶部220は、手書IDを主キーに設定し、各手書データ10をデータベースで管理してもよい。なお、情報処理サーバ200は、手書データ10により、座標と手書文字データとが対応付けられているので、スキャン画像11から各手書文字データを取り除くことも可能である。
【0032】
次に、図6を用いて、手書データ10の各項目について説明する。図6は、手書データ10の一例を示した図である。図6に示すように、手書データ10は、手書ID、頁、座標、手書文字データ、行、および対象文章データを含む。取得部212は、手書箇所ごとにシーケンシャルに番号を付すことにより、「手書ID」を設定する。情報処理サーバ200は、「手書ID」を一意な番号に設定するので、各手書データ10をデータベースで管理する場合に、「手書ID」を各レコードの主キーとすることができる。手書データ10の「頁」は、手書箇所があるページ数である。手書データ10の「座標」は、画像データ221における手書箇所を長方形で囲ったときの左上端の座標と右下端の座標を示す。手書データ10の「手書文字データ」は、「座標」に対応する手書箇所を画像として抜き出したものである。手書データ10の「行」は、画像データ221における対象文章の行である。手書データ10の「対象文章データ」は、スキャン画像11における対象文章の部分をテキストデータとして抜き出したものである。なお、「対象文章データ」は、画像データ221から対象文章に係る部分を画像として抜き出したものであってもよい。
【0033】
例えば、図6の手書データ10は、図4の手書箇所を示しており、手書ID「1」、手書箇所が記された画像データ221の頁「3」、手書箇所の範囲を示す座標「(90,80)−(130,85)」、手書箇所を画像として抜き出した手書データ、対象文章の行「3−6」、および対象文章をテキストデータとして抜き出した対象文章データが関連付けられている。
【0034】
制御部210は、受付部211と、取得部212と、送信部213とを備える。制御部210の各機能は、例えば、CPU(Central Processing Unit)が所定のプログラムを実行することで実現することができる。
【0035】
制御部210が有する受付部211は、画像データ221を受け付ける。受付部211は、記憶手段220において画像データ221がスキャン画像11の各ページに対応付けられているので、各画像データ221を受け付ける際に、対応するページ数をそれぞれ受け付けてもよい。なお、受付部211は、各画像データ221を受け付ける際、それぞれの画像データ221にページ数を割り振ってもよい。
【0036】
制御部210が有する取得部212は、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する。取得部212は、まず、受付部211から、そのページに係る画像データ221と、受け付けた画像データ221のページ数とを取得する。取得部212は、次に、画像データ221の上部から下部に向かって、手書箇所を探し、手書箇所を見つけたらシーケンシャルに手書IDを付し、ページ数と、手書箇所の座標と、手書文字データとを対応付ける。なお、手書文字と活字文字とを区別する際には、例えば、スペクトル領域局所ゆらぎ検出法を使用する。手書によるゆらぎを検出し、これを基に手書文字であるか活字文字であるかの判定をおこなう。
【0037】
次に、取得部212は、手書データ10の座標を基にして手書箇所の前後に対応する対象文章を取得する。そのために、取得部212は、まず、画像データ221における手書箇所の位置を、手書データ10に係る「座標」を基にして特定する。
【0038】
取得部212は、次に、画像データ221における手書箇所前後に対応する対象文章の範囲を特定する。例えば、取得部212は、手書箇所の上下設定行数の範囲を、対象文章の範囲としてもよい。その場合、取得部212は、画像データ221における対象文章の範囲に記載された文字列を、テキストデータ222で特定し、テキストデータとして対象文章を取得する。このとき、取得部212は、画像データ221における対象文章の行も取得する。そして、取得部212は、手書ID、ページ数、座標、手書文字データ、対象文章の行、および対象文章データを関連付けて手書データ10として記憶部220に記憶する。
【0039】
また、取得部212は、手書箇所前後の文字数の範囲を対象文章の範囲としてもよい。この場合、取得部212は、まず、取得部212は、画像データ221における手書箇所の位置を、手書データ10に係る「座標」を基にして、画像データ221における手書箇所の位置を特定する。次に、取得部212は、画像データ221における手書箇所の位置からテキストデータ222における手書箇所の位置を特定し、テキストデータ222から手書箇所前後の所定の文字数分の文字列を対象文章として取得する。なお、取得部212は、対象文章を画像データ221における対象文章の部分を、テキストに変換することにより対象文章を取得してもよい。
【0040】
これにより、取得部212は、スキャン画像11に含まれる各手書箇所に対応する対象文章をそれぞれ取得できる。なお、上記では取得部212は、対象文章をテキストデータとして取得する例について説明したが、画像データとして取得してもよい。
【0041】
制御部210が有する送信部213は、手書データ10と、スキャン画像11とを通信I/F202を介して端末30に送信する。なお、送信部213は、スキャン画像11に対応付けられたテキストデータ222を送信してもよい。
【0042】
次は、図7を用いて、画像データ221から各手書箇所に係る、手書文字データおよび対象文章を手書データ10に登録するまでの手順について説明する。図7は、画像データ221から各手書データ10を作成するまでの流れを示したフロー図である。取得部212は、受付部211が受け付けた画像データ221に含まれる手書箇所を、画像データ221の上部から順番に探す(ステップS10)。その処理方法は従来技術であり、たとえば特開2009−212655等で開示されている。取得部212は、画像データ221に手書箇所がなければ(ステップS10No)、処理を終了し、次のページに係る画像データ221の処理を開始する。取得部212は、画像データ221に手書箇所があれば(ステップS10Yes)、その手書箇所を手書文字データとして抽出する(ステップS11)。取得部212は、抽出した手書文字データを、画像データ221に係るページ数、および手書箇所の座標に関連付けて手書データ10に登録する(ステップS12)。さらに、取得部212は、手書箇所の座標に基づき、画像データ221において、手書箇所前後に対応する対象文章の範囲を特定し、対象文章の範囲を基にしてテキストデータ222より対象文章を抽出する(ステップS13)。そして、取得部212は、対象文章の行と、対象文章とを手書データ10とを、同じ手書IDに係る手書データ10に関連付けて登録する(ステップS14)。上記処理は、ステップS10で画像データ221の手書箇所を全て抽出したと判定されるまで繰り返される。
【0043】
[端末]
図8を用いて、スキャン画像11の画面を操作して、対象文章を投稿用のWebページへ投稿するまでの流れについて説明する。図8は、スキャン画像11から投稿用のWebページへ遷移する様子を示した図である。端末30aは、まず、表示部31aに情報処理サーバからダウンロードしたスキャン画像11を表示する。なお、端末30aは、表示部31aに対して画面をスクロールする操作がなされると、次ページを表示する。
【0044】
端末30aは、「為替レート」の下にある手書箇所が押下されると、これに対応する手書データ10を検索する。まず、端末30aは、現在表示部31aに表示しているスキャン画像のページに対応する手書データ10を探し、押下された位置に係る座標と、手書データ10の「座標」とを比較する。端末30aは、押下された位置に係る座標が手書データ10の「座標」の範囲内であれば、押下された手書箇所に対応する手書データ10と判定する。次に、端末30aは、押下された手書箇所に対応する対象文章データをその手書データ10から取得する。
【0045】
次に、端末30bは、投稿サイトを表示し、投稿サイトの入力欄41に取得した対象文章を入力する。端末30bは、表示部31bにおいて投稿ボタン42が押下されると、対象文章を投稿する。これにより、ユーザはスキャン画像11から手書箇所を選択し、投稿用のWebページで所定の操作をするだけで、文書の引用文を投稿することができる。すなわち、ユーザは書籍に関する情報を発信する際に、手書箇所に関連する情報を入力する手間を省くことができる。
【0046】
なお、投稿サイトはユーザ個人のブログのようなものであっても、所定文字数の短文を時系列で投稿できるサイトのようなものであってもよい。情報処理サーバ200は、一度に投稿できる文字数が、所定の文字数に制限されているサイトに対象文章を投稿する場合、取得部212は、対象文章を取得する際に、対象文章として取得する手書箇所前後の文字数を、投稿用のWebページで制限されている文字数に設定し、対象文章として取得してもよい。
【0047】
[効果]
上述してきたように、実施形態に係る情報処理サーバ200は、取得部212と、記憶部220とを備える。取得部212は、スキャン画像11に含まれる手書箇所の前後に対応する対象文章を取得する。記憶部220は、スキャン画像11および対象文章を対応付けて記憶する。これにより、情報処理サーバ200からスキャン画像11と、スキャン画像11に対応付けられた対象文章とを受信した端末30は、スキャン画像11に記載された手書文字から対象文章を取得することができる。その結果、手書文字を有効利用することができる。
【0048】
また、実施形態に係る情報処理サーバ200において取得部212は、対象文章をスキャン画像11からテキストデータとして取得する。これにより、情報処理サーバ200からスキャン画像11と、テキストデータとして取得された対象文章とを受信した端末30は、簡易な操作で対象文章を投稿Webサイトの入力欄に記入することができ、対象文章を手入力しなくても投稿できるようになる。
【0049】
[ハッシュタグを付す処理]
上記、第一の実施形態では、手書データ10によりスキャン画像11と対象文章とを関連付けたが、ハッシュタグの機能を有する投稿Webサイトで使用するためのハッシュタグを、手書データ10によりさらに関連付けてもよい。そこで、第2の実施形態では、手書データ10にハッシュタグを含めた例について説明する。なお、第2の実施形態に係る情報処理サーバ200の構成は、制御部210に、抽出部を含ませたものである。
【0050】
情報処理サーバ200は、制御部210にさらに抽出部を含んでもよい。手書箇所により指定されたスキャン画像中の指定文字列をハッシュタグとして抽出し、「ハッシュタグ」を手書データ10に関連付ける。例えば、図4において、抽出部は、画像データ221の手書箇所により「為替レート」の部分を強調しているので、「為替レート」に対応する文字列をテキストデータ222から抽出する。そして、抽出部は、抽出した「為替レート」を手書データ10の「ハッシュタグ」の欄に設定し、「ハッシュタグ」を手書データ10と関連付ける。
【0051】
例えば、抽出部は、手書データ10の「座標」に示された(90,80)−(130,85)の範囲の上部にある文字列「為替レート」を指定文字列とし、手書データ10に係る「ハッシュタグ」に設定する。
【0052】
情報処理サーバ200から手書データ10を受信した端末30は、投稿サイトに投稿する際に対象文章にハッシュタグを付すことができる。図9は、対象文章にハッシュタグを付した場合の手書データ10の一例である。情報処理サーバ200は、手書箇所が指定している指定文字列をハッシュタグに設定する。例えば、図4において情報処理サーバ200は、画像データ221の「為替レート」の下に手書箇所があるので、手書箇所が指定している指定文字列は「為替レート」である。
【0053】
図10は、端末30が投稿サイトの入力欄にハッシュタグを設定し、対象文章を入力したときの一例を示した図である。端末30は、情報処理サーバ200から当該手書データ10を受信し、対象文章を投稿する際に、手書データ10の「ハッシュタグ」を、投稿用のWebページにおいてハッシュタグに設定して対象文章を投稿することができる。例えば、投稿サイトの入力欄41に「# 為替レート」を対象文章の先頭に付して、半角の空白文字の後に対象文章「政策がデフレ・・・」を入力する。これにより、ユーザが重要と認識して直接手書きを付した部分をハッシュタグに設定して対象文章を投稿でき、投稿サイトを利用する他のユーザがハッシュタグを基に対象文章にたどり着くことが可能となる。
【0054】
なお、情報処理サーバ200において抽出部は、一つの手書データ10につきハッシュタグを複数設定してもよい。例えば、抽出部は、対象文章として取得したテキストデータから重要な用語を複数抽出し、それぞれをハッシュタグに設定する。これにより、ユーザが対象文章を投稿した投稿サイトで他のユーザが対象文章へ、よりたどり着きやすくすることが可能となる。
【0055】
なお、実施例1において、情報処理サーバ200は、対象文章をテキストデータとして取得したが、画像データとして取得してもよい。これにより、ユーザは、手書箇所を含めた画像データを、対象文章として自己が開設したブログ等に公開することができる。
【0056】
なお、図2のファイル管理サーバ122は、情報処理サーバ200の一例であると説明したが、図2の電子化サーバ110が情報処理サーバ200の一例であってもよい。
【0057】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0058】
また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、受付手段は、受付部や受付回路に読み替えることができる。
【符号の説明】
【0059】
10 手書データ
11 スキャン画像
200 情報処理サーバ
201 入力部
202 通信I/F
210 制御部
211 受付部
212 取得部
213 送信部
220 記憶部
221 画像データ
222 テキストデータ
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10