特開2017-4406(P2017-4406A)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 学校法人 名古屋電気学園の特許一覧 ▶ 株式会社リオの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2017-4406(P2017-4406A)
(43)【公開日】2017年1月5日
(54)【発明の名称】文書変換システム
(51)【国際特許分類】
   G06F 17/24 20060101AFI20161209BHJP
【FI】
   G06F17/24 610
【審査請求】未請求
【請求項の数】6
【出願形態】OL
【全頁数】17
(21)【出願番号】特願2015-120005(P2015-120005)
(22)【出願日】2015年6月15日
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 一般社団法人情報処理学会、情報処理学会第77回全国大会講演論文集DVD、講演番号5F−06、第4分冊、第441〜442頁、平成27年3月17日発行
(71)【出願人】
【識別番号】304000836
【氏名又は名称】学校法人 名古屋電気学園
(71)【出願人】
【識別番号】594116781
【氏名又は名称】株式会社リオ
(74)【代理人】
【識別番号】100110744
【弁理士】
【氏名又は名称】藤川 敬知
(72)【発明者】
【氏名】菱田 隆彰
(72)【発明者】
【氏名】池田 輝政
(72)【発明者】
【氏名】遠藤 正隆
(72)【発明者】
【氏名】中嶋 裕一
(72)【発明者】
【氏名】三浦 哲郎
【テーマコード(参考)】
5B109
【Fターム(参考)】
5B109MA13
5B109MJ03
5B109SA14
(57)【要約】
【課題】読み手の特性に対応して、表示された文書の理解を容易にすることができる文書変換システムの提供。
【解決手段】操作者が、自分の属性に関する個人プロファイルデータおよび原文テキストデータを、文書表示モジュール2に入力する。個人プロファイルデータおよび原文テキストデータは、アプリケーションサーバー3に送信される。原文テキストデータは、素解析部313によって形態素解析および構成素解析され、複数の変換文字列に分割される。候補選択部314は、文書処理データベース6を用いて、変換文字列が変換される置換文字列を形成する。文書変換部321は、原文テキストデータに置換文字列を埋め込んで埋込文書データを形成する。埋込文書データは、アプリケーションサーバー3から文書表示モジュール2に送信される。また、変換文字列と置換文字列とが対応付けられた変換情報が、文書処置データベース6に送信される。
【選択図】図1
【特許請求の範囲】
【請求項1】
操作者の個人プロファイルデータおよび文書画像データを送受信する通信部(21)、受信した前記文書画像データに基づいて文書画像(LI)を表示する表示部(23)および該表示部に表示された前記文書画像を操作する操作部(24)を有する通信端末(2)と、
前記個人プロファイルデータに基づいて編集された、前記文書画像を処理するための変換データが記憶された文書処理データベース(6)と、
前記通信端末から、前記個人プロファイルデータおよび前記文書画像データである原文テキストデータを受信する受信部(311)、受信した前記原文テキストデータに対し、形態素解析および構成素解析のうちの少なくともいずれかを実行して所定の文字列に分割する素解析部(313)、前記変換データを用いて、前記素解析部によって分割された前記文字列を変換するための置換文字列を形成し、該置換文字列を前記原文テキストデータに含めた埋込文書データを形成する埋込形成部(314、321)および前記埋込文書データを前記通信端末に送信するとともに、前記文字列と前記置換文字列とを対応付けた変換情報を前記文書処理データベースに送信する送信部(322)を有する文書変換装置(3)と、
を備えた文書変換システム(1)。
【請求項2】
前記文書処理データベースは、
操作者ごとに、過去において変換された前記文字列と前記置換文字列とを対応付けたユーザデータベース(61)を含み、
前記文書変換装置は、
受信した前記個人プロファイルデータに基づいて、該当する操作者の前記ユーザデータベース中から、前記文字列が一致する個人履歴データを抽出し、抽出された前記個人履歴データに基づいて前記置換文字列を形成する請求項1記載の文書変換システム。
【請求項3】
前記文書処理データベースは、
複数の操作者について、過去において変換された前記文字列と前記置換文字列とを対応付けた変換履歴データベース(62)を含み、
前記文書変換装置は、
該当する操作者の前記ユーザデータベース中に、前記文字列が一致する前記個人履歴データが存在しない場合、前記変換履歴データベース中から、操作者と前記個人プロファイルデータが近似した他の操作者の前記個人履歴データであって、前記文字列が一致する前記個人履歴データを抽出し、抽出された他の操作者の前記個人履歴データに基づいて前記置換文字列を形成する請求項2記載の文書変換システム。
【請求項4】
前記文書処理データベースは、
前記文字列に使用される漢字、読み仮名、それぞれの漢字の就学年を対応付けた漢字情報データベース(63)を含み、
前記文書変換装置は、
前記変換履歴データベース中に、操作者と前記個人プロファイルデータが近似した他の操作者の前記個人履歴データであって、前記文字列が一致する前記個人履歴データが存在せず、かつ、操作者が前記文字列に使用される漢字の就学年に達していない場合、前記漢字情報データベース中から、前記文字列に使用される漢字の読み仮名を抽出し、抽出された読み仮名を用いて前記置換文字列を形成する請求項3記載の文書変換システム。
【請求項5】
前記通信端末において、
操作者が、前記操作部によって自由文字列を入力し、該自由文字列により前記原文テキストデータ中の前記文字列が変換され、
前記自由文字列は、変換前の前記文字列と対応付けられて、前記通信部により前記文書処理データベースに送信される請求項1乃至4のうちのいずれか一項に記載の文書変換システム。
【請求項6】
前記個人プロファイルデータは、
操作者の漢字習熟レベル、性別、世代、最終学歴、馴染みの有る地域を含んでいる請求項1乃至5のうちのいずれか一項に記載の文書変換システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、文書中における文字列を部分的に変換して表示する文書変換システムに関する。
【背景技術】
【0002】
文章データを、その特性に応じた表示態様にて表示部に表示する情報表示装置に関する従来技術があった(例えば、特許文献1参照)。当該従来技術による情報表示装置は、文章解析部によって文章データの特性情報を取得し、表示属性設定部が、取得した特性情報に基づき、特性・表示属性対応テーブル群を検索して、文章データに対応した表示属性を設定する。表示生成部は、設定された表示属性に従い表示態様を決定し、決定した表示態様で文章データを表示部に表示している。これにより、表示された文章データを一瞥するだけで、その内容が示唆する特性を速やかに類推でき、文章データの内容を容易に把握することができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2005−346712号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、文書データには、しばしば理解が困難な文字列が含まれており、それにより表示文章全体の把握を困難にしている場合がある。理解が困難な文字列としては、読解不能な漢字表示や高度な専門用語が挙げられる。これらの文字列に対する理解の困難性は、表示文章の読み手の年齢、習得している知識等により異なり、すべての読み手において一定ではない。したがって、表示文章の理解を容易にするためには、読み手の特性に応じて、理解が困難な文字列を分かりやすい表現に置き換える必要がある。上述した従来技術による情報表示装置においては、文章データを、その客観的な特性情報に基づいて決定された表示態様により表示しているのみであるため、表示内容がどの読み手に対しても同じであって、読み手の特性に応じて、表示文章の理解を助けることができるものではなかった。
上述した問題を解決する手段として、読み手ごとに異なる文書データを提供することが考えられる。しかしながら、読み手の有する様々な語彙力や専門知識のレベルのすべてに合わせて、多数の文書データを用意することは非常に困難であった。
本発明は上記事情に鑑みてなされたものであり、その目的は、読み手の特性に対応して、表示された文書の理解を容易にすることができる文書変換システムを提供することにある。
【課題を解決するための手段】
【0005】
上述した課題を解決するために、請求項1に係る文書変換システム(1)の発明は、操作者の個人プロファイルデータおよび文書画像データを送受信する通信部(21)、受信した文書画像データに基づいて文書画像(LI)を表示する表示部(23)および表示部に表示された文書画像を操作する操作部(24)を有する通信端末(2)と、個人プロファイルデータに基づいて編集された、文書画像を処理するための変換データが記憶された文書処理データベース(6)と、通信端末から、個人プロファイルデータおよび文書画像データである原文テキストデータを受信する受信部(311)、受信した原文テキストデータに対し、形態素解析および構成素解析のうちの少なくともいずれかを実行して所定の文字列に分割する素解析部(313)、変換データを用いて、素解析部によって分割された文字列を変換するための置換文字列を形成し、置換文字列を原文テキストデータに含めた埋込文書データを形成する埋込形成部(314、321)および埋込文書データを通信端末に送信するとともに、文字列と置換文字列とを対応付けた変換情報を文書処理データベースに送信する送信部(322)を有する文書変換装置(3)と、を備えている。
【0006】
この構成によれば、文書変換装置は、個人プロファイルデータに基づいて編集された変換データを用いて、受信した原文テキストデータ中の文字列を変換するための置換文字列を形成し、置換文字列を原文テキストデータに含めた埋込文書データを通信端末に送信するとともに、分割された文字列と置換文字列とを対応付けた変換情報を文書処理データベースに送信している。これにより、文書画像の読み手の属性に対応して、原文テキストデータ中の文字列を置換文字列に変換して通信端末の表示部に表示することができ、どの読み手に対しても、表示された文書の理解を容易にすることができる。
また、送信された変換情報を、文書処理データベースにおいて登録することにより、読み手の属性と変換履歴とを対応付けた文書処理データベースを形成することができる。したがって、これ以降、読み手の属性と過去の変換実績に応じた文書変換を行うことができる。
【図面の簡単な説明】
【0007】
図1】本発明の一実施形態による文書変換システムの全体図
図2】文書表示モジュールにおいて、個人プロファイルデータを入力する際の初期画面を示した図
図3】個人プロファイルデータの漢字就学年を入力する際の表示画面を示した図
図4】個人プロファイルデータの地域を入力する際の表示画面を示した図
図5】個人プロファイルデータのその他の属性を入力する際の表示画面を示した図
図6】文書表示モジュールにおいて、原文テキストデータによる文書画像が表示された状態を示した図
図7】形態素解析により、一文章を複数の文字列に分割する方法の一例を示した図
図8】ユーザデータベースの登録例を示した図
図9】変換履歴データベースの登録例を示した図
図10】変換履歴データベースから抽出した変換候補の一例を示した図
図11】漢字情報データベースの登録例を示した図
図12A】文書表示モジュールにおいて、埋込文書データによる文書画像の一部を変換するために該当箇所をマーキングした状態を示した図
図12B】表示画面上をスクラッチして、文書画像の該当箇所に第1優先の置換文字列を表示した状態を示した図
図12C】表示画面上を反対方向にスクラッチして、文書画像の該当箇所に第2優先の置換文字列を表示した状態を示した図
図12D】表示画面上を渦巻状に擦ることにより、文書画像の該当箇所に置換文字列を表示した状態を示した図
図12E】文書表示モジュールの操作部によって、操作者が原文テキストデータによる文書画像の該当箇所を自由文字列に変換した状態を示した図
図13】文書変換システムによる制御フローチャートを示した図
【発明を実施するための形態】
【0008】
<実施形態の構成>
(文書変換システム1の全体構成)
図1に基づき、本発明の一実施形態による文書変換システム1について説明する。図1に示した文書表示モジュール2(通信端末に該当する)は、従前の携帯型の通信端末に、後述するスクラッチジェスチャまたは渦巻ジェスチャを機能させるソフトウェアをインストールしたものである。文書表示モジュール2には、ipad(登録商標)等のタブレット端末またはスマートフォン(登録商標)等の携帯電話等が使用可能である。文書表示モジュール2は、通信インタフェース21(通信部に該当する)、記憶部22、ディスプレイ23(表示部に該当する)、操作入力部24(操作部に該当する)および表示制御部25を含んでいる。
【0009】
通信インタフェース21は、後述するアプリケーションサーバー3(文書変換装置に該当する)との間において、文書表示モジュール2の操作者の個人プロファイルデータおよび文書画像データを送受信可能に形成されている。文書画像データには、後述する原文テキストデータおよび原文テキストデータに置換文字列を含めた埋込文書データが含まれている。記憶部22はRAM等によって形成され、原文テキストデータおよびアプリケーションサーバー3から送信された埋込文書データを保存することが可能に形成されている。ディスプレイ23は、液晶等を利用した表示画面であって、通信インタフェース21が受信した原文テキストデータおよび埋込文書データに基づいた文書画像LIを表示する。また、ディスプレイ23は、後述する操作入力部24によって機能する操作キー画像241(図12E参照)を表示する。操作入力部24は、操作者が、ディスプレイ23に触れることによって、ディスプレイ23に表示された文書画像LIを操作することが可能に形成されている。表示制御部25は、通信インタフェース21およびディスプレイ23の作動を制御することが可能に形成されている。
【0010】
アプリケーションサーバー3は、文書表示モジュール2とインターネット4によって通信可能に形成されている。アプリケーションサーバー3と文書表示モジュール2とは、有線または無線によるローカルエリアネットワーク(LAN)によって接続されていてもよい。また、アプリケーションサーバー3は、LANによって、後述するハードディスク装置5および文書処理データベース6とも接続されている。アプリケーションサーバー3は、文書解析エンジン31と文書変換エンジン32とにより形成されている。
【0011】
文書解析エンジン31は、受信部311、RAM312、素解析部313、候補選択部314(埋込形成部に該当する)および解析制御部315を含んでいる。受信部311は、文書表示モジュール2から、操作者の個人プロファイルデータおよび原文テキストデータを受信する。RAM312は、ハードディスク装置5から取得した素解析ソフトウェア51を保存する。素解析部313は、受信した原文テキストデータに対し形態素解析と構成素解析との双方を実行し、形態素あるいは構成素である所定の文字列に分割する。以下、形態素解析と構成素解析の双方を行うことを、素解析を行うと言う。尚、上述した形態素とは、ある言語において、それ以上分解したら意味をなさなくなるまで分解して抽出された音素のまとまりの一つ一つをさし、構成素とは、文や句などの一部で、それ自体が言語学的な単位として機能するものを指している。
候補選択部314は、素解析部313によって分割された文字列の各々について、それぞれの品詞、属性について、変換可能な文字列(以下、変換文字列と言う)を選択する。変換文字列を選択した後、文書処理データベース6中の変換データを用いて、変換文字列の変換後の文字列(以下、置換文字列と言う)を形成する。解析制御部315は、受信部311、素解析部313および候補選択部314の作動を制御している。
【0012】
文書変換エンジン32は、文書解析エンジン31と接続され、文書変換部321(埋込形成部に該当する)および送信部322を含んでいる。文書変換部321は、候補選択部314により形成された置換文字列を、原文テキストデータに含めた埋込文書データを形成する。送信部322は、形成した埋込文書データを、文書表示モジュール2に送信する。また、送信部322は、変換文字列と置換文字列とを対応付けた変換情報を、個人プロファイルデータとともに文書処理データベース6へと送信する。
ハードディスク装置5は、上述した素解析を行うための素解析ソフトウェア51を保存している。
文書処理データベース6は、個人プロファイルデータに基づいて編集された、文書画像LIを処理するための変換データを記憶している。文書処理データベース6は、ユーザデータベース61、変換履歴データベース62および漢字情報データベース63を含んでいる。
【0013】
(文書表示モジュール2への入力方法)
以下、図2乃至図6に基づき、文書表示モジュール2を用いた個人プロファイルデータおよび原文テキストデータの入力方法について説明する。以下の説明中において、文書表示モジュール2を操作して、個人プロファイルデータを入力した人物を、現在の操作者と言うことがある。文書表示モジュール2の現在の操作者が、文書変換システム1を起動させようとする場合、図2に示したように、ディスプレイ23に自分自身の個人プロファイルデータを入力するための初期画面DP1を表示させる。操作者は、初期画面DP1を用いて、個人プロファイルデータを形成する各々の属性を入力する。初期画面DP1上には、操作者の氏名を入力するためのユーザ名欄DP1a、操作者の漢字に対する習熟レベルを入力するための漢字就学年アイコンDP1b、操作者の性別を入力するための性別アイコンDP1c、操作者の世代を入力するための世代アイコンDP1d、操作者の最終学歴を入力するための最終学歴アイコンDP1e、操作者の出身地、現住所といった馴染みの有る地域を入力するための地域アイコンDP1f、操作者が個別に上記以外の属性を入力するための補足入力アイコンDP1gが表示される。補足入力アイコンDP1gによって入力される属性には、国籍、使用可能言語、職業、既往症等が挙げられる。各属性の内、操作者の漢字習熟レベル、性別、世代、最終学歴、馴染みの有る地域については、専用の入力フォームを使用している。
【0014】
操作者が、ユーザ名欄DP1aに氏名を入力した後、漢字就学年アイコンDP1bに指等で触れると、ディスプレイ23上に、図3に示した漢字就学年画面DP2が表示される。漢字就学年画面DP2上には、小学校1年生から一般までに対応した、複数の漢字習熟レベルアイコンDP2aが表示されている。操作者が、漢字習熟レベルアイコンDP2aのうちの一つに触れることにより、漢字就学年の入力が完了する。
その後、操作者が、性別アイコンDP1c、世代アイコンDP1d、最終学歴アイコンDP1eに触れて、性別入力、世代入力および最終学歴入力を順に完了した後、地域アイコンDP1fに触れると、ディスプレイ23上に、図4に示した地域画面DP3が表示される。地域画面DP3上においては、スクロール可能な複数の地域名DP3aが表示されており、スクロールさせながら操作者が馴染みの有る地域に触れることにより、地域入力を完了する。
地域入力を完了した後、補足入力アイコンDP1gに触れると、ディスプレイ23上に、図5に示した補足入力画面DP4が表示される。補足入力画面DP4上には、入力スペースDP4aが表示され、操作者が操作キー画像214により、個人プロフィールデータに関する任意の属性情報を入力することが可能に形成されている。入力スペースDP4aへの属性情報の入力は、セパレータ(♯♯)で区切って、複数の属性を同時に入力することが可能に形成されている(例えば、アメリカ人♯♯認知症♯♯アナウンサー)。
【0015】
個人プロファイルデータの入力が完了すると、置換文字列を含める以前の文書画像データである原文テキストデータの入力を行う。原文テキストデータは、インターネットからダウンロードされたものでもよいし、USBメモリまたはSDカード等によって入力されてもよい。図6に示したように、入力された原文テキストデータにより、文書表示モジュール2のディスプレイ23上に、文書画像LIが表示可能に形成されている。
入力された個人プロファイルデータおよび原文テキストデータは、通信インタフェース21によって、文書表示モジュール2からアプリケーションサーバー3へと送信される。
【0016】
(埋込文書データの形成方法)
以下、図7乃至図11に基づき、原文テキストデータに置換文字列を埋め込んだ埋込文書データを形成する方法について説明する。また、説明の前提として、現在の操作者を大学卒の30代の男性と仮定する。原文テキストデータがアプリケーションサーバー3へと送信されると、原文テキストデータに対し、文書解析エンジン31の素解析部313において、素解析が実行される。素解析は、ハードディスク装置5からRAM312に記憶された素解析ソフトウェア51を用いて行われ、文法、品詞、活用形、読み等の情報に基づいて、文章を、所定の文字列に分割する。図7は、原文テキストデータ中の文章を形態素解析して、複数の文字列に分解した一例である。操作者が所望する文字列が素解析ソフトウェア51の辞書にない場合、操作者が文書表示モジュール2を操作することにより、素解析ソフトウェア51に登録することも可能に形成されている。
【0017】
素解析部313における素解析が完了すると、候補選択部314によって、置換文字列の形成が行われる。候補選択部314は、最初に、素解析によって分割された複数の文字列の中で、置換文字列に変換可能な文字列(以下、変換文字列と言う)を選択する。変換文字列には、主に、名詞や動詞などの文字列が該当する。
変換文字列が選択されると、候補選択部314は、アプリケーションサーバー3が受信した個人プロファイルデータに基づいて、文書処理データベース6中のユーザデータベース61を用いて、選択された変換文字列を変換するための置換文字列を形成する。ユーザデータベース61は、操作者ごとに編集された変換データの集合体であって、現在の操作者が、過去において変換した原文テキストデータ中の変換文字列と置換文字列とを対応付けたものである。尚、ユーザデータベース61および後述する変換履歴データベース62に含まれる変換データを、以下、個人履歴データと言い、これらは、図8乃至図10において、各行のデータに該当する。
【0018】
ユーザデータベース61に保存された個人履歴データの一例を、図8に示している。図8において、id(主キー)は、個人履歴データの登録時に、ユーザデータベース61によって、自動的に付される番号である。word(元文字列)は、変換文字列を表している。wordsInfo(元文字列の形態素情報)は、素解析ソフトウェア51から出力された形態素情報の文字列を示している。kanji(必要漢字就学年タグ)は、wordの文字列を構成する複数の漢字を読むのに必要な漢字就学年(漢字就学年が複数ある場合、その内、最も高い学年)を表す属性タグ文字列を示してしている。userName(登録したユーザ名)は、操作者の氏名を示している。UUID(登録したユーザのUUID)は、個人プロファイルが入力された時に自動的に付され、操作者を特定可能なコードを示している。attributes(登録したユーザの属性)は、入力された個人プロファイルデータに含まれた操作者の属性を示している。操作者の属性は、セパレータによって区分けされた複数の文字列によって形成されている。alterWord(変換後文字列)は、変換文字列が変換された置換文字列を表している。timestamp(登録日時)は、置換文字列への変換が実行された年月日を示している。
【0019】
候補選択部314は、ユーザデータベース61中の現在の操作者(該当する操作者に該当する)の個人履歴データにおいて、変換文字列が一致するものがあれば、当該個人履歴データに含まれる置換文字列を選択する。例えば、原文テキストデータ中の文字列である「恒久」を変換文字列として選択したとする。この場合、図8に示した現在の操作者の個人履歴データ中に、過去に文字列「恒久」を変換した個人履歴データがあるため、個人履歴データ中の変換後の文字列「永久」を、置換文字列として抽出する。抽出された置換文字列「永久」は、文書変換エンジン32の文書変換部321により、原文テキストデータの変換文字列「恒久」の位置に埋め込まれ、埋込文書データが形成される。
【0020】
候補選択部314は、ユーザデータベース61中の現在の操作者の個人履歴データにおいて、変換文字列に一致するものがなければ、次に、文書処理データベース6中の変換履歴データベース62を用いて置換文字列を形成する。変換履歴データベース62は、不特定多数の操作者が、過去において変換した原文テキストデータ中の変換文字列と置換文字列とを対応付けたものである。すなわち、変換履歴データベース62は、現在の操作者の個人履歴データと、他の操作者の個人履歴データとが混在して形成されている。変換履歴データベース62に保存された個人履歴データの一例を、図9に示している。図9から分かるように、変換履歴データベース62のテーブルの構成および内容については、上述したユーザデータベース61のものと同一であるため、詳細な説明は省略する。
【0021】
候補選択部314は、変換履歴データベース62中から、現在の操作者の個人プロファイルデータによる属性に近似した属性を有した他の操作者の個人履歴データであって、かつ、変換文字列に一致する個人履歴データを抽出する。候補選択部314は、抽出された他の操作者の個人履歴データ(一つとは限らない)を、操作者の属性が現在の操作者の属性に近似している順に並べて、変換候補を作成する。図10に、作成された変換候補の個人履歴データの一例を示す。変換候補を形成する個人履歴データに含まれる置換文字列(図10における「長い間」、「永久」および「こうきゅう」)は、文書変換部321により、操作者の属性が現在の操作者の属性に近似している順に優先順位をつけられ、すべて原文テキストデータの変換文字列「恒久」の位置に埋め込まれ、埋込文書データが形成される。尚、図10において、pcは上記優先順位を示している。また、図9および図10に示した個人履歴データは、図8に示したものとは無関係に作成されている。
【0022】
候補選択部314は、変換履歴データベース62中に、現在の操作者の属性に近似した属性を有した他の操作者の個人履歴データがない場合、または、現在の操作者の属性に近似した属性を有した他の操作者の個人履歴データ中に、変換文字列が一致した個人履歴データがなければ、文書処理データベース6中の漢字情報データベース63を用いて置換文字列を形成する。漢字情報データベース63は、変換文字列に使用されている漢字、その読み仮名および当該漢字の就学年を対応付けた漢字情報データを保存している。図11の左方部に、漢字情報データベース63に含まれた変換データである漢字情報データの一例を示す。図11において、Goiは変換文字列を形成する漢字を示し、yomiは文字列のそれぞれの読み仮名、gradeは漢字の就学年を就学年番号によって表している。漢字の就学年と就学年番号との対応は、図11の右方部に示した通りである。
【0023】
候補選択部314は、漢字情報データベース63中において、変換文字列「恒久」の就学年が中学生であることから、大学卒の30代の男性という現在の操作者の属性から、変換する必要はないと判断すれば、置換文字列は形成されない。これに対し、仮に、現在の操作者が小学校1年生であった場合、操作者の学年が変換文字列「恒久」の就学年に達していないため、候補選択部314は、文字列「こうきゅう」を置換文字列とする。文書変換部321は、置換文字列「こうきゅう」を原文テキストデータの文字列「恒久」の位置に埋め込んで、埋込文書データを形成する。
【0024】
形成された埋込文書データは、文書変換エンジン32の送信部322から、文書表示モジュール2に送信される。後述するように、埋込文書データは、文書表示モジュール2において文書画像LIとして表示される。また、変換文字列と置換文字列とを対応付けた変換情報と個人プロファイルデータは、アプリケーションサーバー3から、文書処理データベース6に送信される。文書処理データベース6に送信された変換情報は、個人プロファイルデータと関連付けられて、ユーザデータベース61および変換履歴データベース62に登録される。
【0025】
(文書表示モジュール2による文書画像LI上での置換文字列の表示方法)
以下、図12A乃至図12Eに基づき、文書表示モジュール2を用いた文書画像LI上での置換文字列の表示方法について説明する。説明において、文書表示モジュール2に送信された埋込文書データには、変換履歴データベース62を使用して形成された優先順位が1番目の置換文字列「長い間」と、優先順位が2番目の置換文字列「永久」とが含まれているとする。図12Aに示したように、文書表示モジュール2のディスプレイ23上には、埋込文書データによる文書画像LIが表示されている。操作者が置換文字列への変換を所望する変換文字列「恒久」に、画面上において指等で触れると、文書表示モジュール2の操作入力部24は、文字列「恒久」にマーキングを施す(図12Aにおいて網掛けにて示す)。
【0026】
次に、図12Bに示したように、操作者が、画面上を指等で一方向(図12Bにおいて上方)に擦る(以下、スクラッチジェスチャと言う)と、マーキングされた変換文字列「恒久」が、画面上において優先順位が1番目の置換文字列「長い間」に変換される。
操作者が、変換文字列「恒久」について、さらに変換が必要であると思う場合、画面上を先回とは反対方向(図12Cにおいて下方)にスクラッチジェスチャを施すことにより、図12Cに示すように、表示されていた置換文字列「長い間」が、優先順位が2番目の置換文字列「永久」に変換される。このように文書表示モジュール2の操作入力部24は、操作者がディスプレイ23の画面上を直線方向に往復するように擦る操作を検知することにより、埋込文書データに含まれた置換文字列を、ディスプレイ23上に優先順位の順番に順次表示させる。
図12Dに示すように、操作入力部24は、操作者がディスプレイ23の画面上を渦巻状に擦る操作(以下、渦巻ジェスチャと言う)を検知するにより、埋込文書データに含まれた置換文字列を、ディスプレイ23上に優先順位の順番に順次表示させてもよい。渦巻ジェスチャにおいて、ディスプレイ23の画面を渦巻状に擦る方向を反対にすることにより、表示する置換文字列を以前のものに戻すことができるようにしてもよい。
画面上に表示された変換文字列を、置換文字列に変換するためには、必ずしも、上述したスクラッチジェスチャまたは渦巻ジェスチャによらなければならないわけではなく、他のあらゆる操作方法が使用可能である。例えば、表示された変換文字列の上を指先等で叩くたびに、優先順位の順に置換文字列に変換されるようにしてもよい。また、変換を所望する変換文字列に、画面上において指等で触れることにより、変換候補の複数の置換文字列が画面上に同時に表示され、さらに、その内の一つに指で触れることによって、当該置換文字列に変換されるようにしてもよい。
【0027】
操作者が、変換文字列「恒久」について、任意の文字列に変換する必要があると思う場合、新規変更登録を実行する。新規変更登録においては、文書処理データベース6を使用せずに、操作者が、操作入力部24により自ら変換する文字列(以下、自由文字列と言う)の入力を行う。新規変更登録を実行する際、図12Eに示すように、最初に、ディスプレイ23の下方に表示されたアイコン「新規変更登録」を操作者が触れることにより、ディスプレイ23の画面上に操作キー画像241を表示させる。次に、操作者が操作キー画像241を使用して、所望の自由文字列(図12Eにおいては「えいきゅう」)を入力することにより、文字列「恒久」が文字列「えいきゅう」に変換される。
その後、自由文字列「えいきゅう」と、変換前の文字列「恒久」とが対応付けられた変換情報は、個人プロファイルデータとともに、文書表示モジュール2の通信インタフェース21から、アプリケーションサーバー3を介して文書処理データベース6に送信される。自由文字列「えいきゅう」を含んだ変換情報は、個人プロファイルデータと関連付けられて、ユーザデータベース61および変換履歴データベース62に登録される。
【0028】
(文書変換システム1の制御方法)
以下、図13に基づき、文書変換システム1の制御方法に関して、文書表示モジュール2に個人プロファイルデータおよび原文テキストデータが入力されてから、置換文字列を含んだ変換データを文書処理データベース6に登録するまでのフローについて説明する。最初に、操作者が、操作入力部24を用いて、文書表示モジュール2に個人プロファイルデータおよび原文テキストデータを入力する(ステップS101)。次に、アプリケーションサーバー3に個人プロファイルデータおよび原文テキストデータが送信されると、素解析部313は、素解析ソフトウェア51を用いて原文テキストデータに対して素解析を実行し、原文テキストデータ中の文章を複数の文字列に分割する(ステップS102)。
【0029】
次に、候補選択部314は、分割された文字列中から選択した変換文字列が、ユーザデータベース61中の現在の操作者の個人履歴データにあるか否かを判定する(ステップS103)。変換文字列が、ユーザデータベース61中の現在の操作者の個人履歴データにある場合、当該個人履歴データに含まれる置換文字列を抽出する(ステップS104)。変換文字列が、ユーザデータベース61中の現在の操作者の個人履歴データにない場合、候補選択部314は、選択した変換文字列が、変換履歴データベース62中の現在の操作者の属性に近似した属性を有した操作者の個人履歴データにあるか否かを判定する(ステップS105)。選択した変換文字列が、変換履歴データベース62中の現在の操作者の属性に近似した属性を有した操作者の個人履歴データにある場合、当該個人履歴データに含まれる置換文字列を抽出する(ステップS106)。選択した変換文字列が、変換履歴データベース62中の現在の操作者の属性に近似した属性を有した操作者の個人履歴データにない場合、候補選択部314は、前述したように、漢字情報データベース63を用いて置換文字列を抽出する。(ステップS107)。
【0030】
置換文字列が抽出されると、原文テキストデータに置換文字列が埋め込まれて形成された埋込文書データが、文書変換エンジン32の送信部322によって、文書表示モジュール2に送信される(ステップS108)。また、変換文字列と置換文字列とを対応付けた変換情報と個人プロファイルデータは、文書処理データベース6に送信され、ユーザデータベース61および変換履歴データベース62に登録される(ステップS109)。
【0031】
<実施形態の作用効果>
本実施形態によれば、アプリケーションサーバー3は、個人プロファイルデータに基づいて編集された変換データを用いて、受信した原文テキストデータ中の変換文字列を変換するための置換文字列を形成する。そして、形成された置換文字列を原文テキストデータ中に含めた埋込文書データを形成し、埋込文書データを文書表示モジュール2に送信するとともに、変換文字列と置換文字列とを対応付けた変換情報を文書処理データベース6に送信している。これにより、文書画像の読み手の属性に対応して、原文テキストデータ中の文字列を置換文字列に変換することができ、どの読み手に対しても、表示された文書の理解を容易にすることができる。特に、読み手の学年、認知症等の疾病、操作者が外国人の場合の日本語の習熟度等に応じて、原文テキストデータ中の文字列を置換文字列に変換することができる。
また、送信された変換情報を、文書処理データベース6において登録することにより、読み手の属性と変換履歴とを対応付けたユーザデータベース61および変換履歴データベース62を形成することができる。したがって、これ以降、読み手の属性と過去の変換実績に応じた文書変換を行うことができる。
【0032】
また、文書処理データベース6は、操作者ごとに、過去において変換された変換文字列と置換文字列とを対応付けたユーザデータベース61を含んでいる。そして、アプリケーションサーバー3は、受信した個人プロファイルデータに基づいて、ユーザデータベース61中の現在の操作者の個人履歴データにおいて、変換文字列が一致する個人履歴データを抽出し、抽出された個人履歴データに基づいて埋込文書データを形成している。これにより、操作者の過去における変換実績に基づいて、置換文字列を含んだ埋込文書データを形成することができ、操作者個人の属性に合致した文書変換を行うことができる。
【0033】
また、文書処理データベース6は、複数の操作者について、過去において変換された変換文字列と置換文字列とを対応付けた変換履歴データベース62を含んでいる。そして、アプリケーションサーバー3は、ユーザデータベース61中の現在の操作者の個人履歴データにおいて、変換文字列が一致する個人履歴データが存在しない場合、変換履歴データベース62中から、操作者と個人プロファイルデータが近似した他の操作者の個人履歴データであって、変換文字列が一致する個人履歴データを抽出し、抽出された個人履歴データに基づいて埋込文書データを形成する。これにより、ユーザデータベース6中の現在の操作者の個人履歴データにおいて、変換文字列が一致する個人履歴データが存在しない場合においても、操作者の属性に近い属性を有する他者の変換実績を利用して、操作者の属性に合致した文書変換を行うことができる。
【0034】
また、文書処理データベース6は、変換文字列に使用される漢字、読み仮名、それぞれの漢字の就学年を対応付けた漢字情報データベース63を含んでいる。そして、アプリケーションサーバー3は、変換履歴データベース62中に、操作者と個人プロファイルデータが近似した他の操作者の個人履歴データであって、変換文字列が一致する個人履歴データが存在せず、かつ、操作者が変換文字列に使用される漢字の就学年に達していない場合、漢字情報データベース63中から、変換文字列に使用される漢字の読み仮名を抽出し、抽出された読み仮名を用いて置換文字列を形成する。これにより、変換履歴データベース62中に、操作者と個人プロファイルデータが近似した他の操作者の個人履歴データであって、変換文字列が一致する個人履歴データが存在しない場合においても、操作者の漢字の習熟度に応じて、原文テキストデータ中の漢字を、必要な読み仮名に変換することができる。
【0035】
また、文書表示モジュール2は、操作入力部24によって新規変更登録を実行し、文書処理データベース6を使用せずに、操作者が、操作入力部24により自ら自由文字列の入力を行うことが可能である。そして、入力された自由文字列は、変換文字列と対応付けられて、文書表示モジュール2の通信インタフェース21から文書処理データベース6に送信される。自由文字列を含んだ変換データは、文書処理データベース6において、ユーザデータベース61および変換履歴データベース62に登録される。これにより、文書処理データベース6に既に登録されている変換データに基づいて形成された置換文字列に対し、操作者が満足できない場合においても、操作者が自ら自由文字列を形成することができ、操作者の属性に合致した文書変換を行うことができる。
【0036】
また、文書表示モジュール2の操作入力部24は、ディスプレイ23の画面を直線方向に往復するように擦るスクラッチジェスチャを行ったことを検知することにより、埋込文書データに含まれた置換文字列をディスプレイ23に順次表示させることができる。これにより、操作者が、簡単な操作の繰り返しによって、ディスプレイ23上に置換文字列を連続して順番に表示させることができる。
また、文書表示モジュール2の操作入力部24は、ディスプレイ23の画面を渦巻状に擦る渦巻ジェスチャを行ったことを検知することにより、埋込文書データに含まれた置換文字列を、ディスプレイ23上に順次表示させることができる。これにより、操作者が単純な一方向への指の操作によって、ディスプレイ23上に置換文字列を連続して順番に表示させることができ、文書表示モジュール2の操作による操作者の疲労を低減することができる。また、ディスプレイ23の画面を渦巻状に擦る方向を反対にすることにより、表示する置換文字列を以前のものに戻すことができ、操作者が所望する置換文字列を容易に表示させることができる。
また、個人プロファイルデータは、操作者の漢字習熟レベル、性別、世代、最終学歴、馴染みの有る地域を含んでいる。これにより、文書表示モジュール2への限られた操作によって、文書変換に必要とされる操作者の属性を的確に入力することができる。
【0037】
<他の実施形態>
本発明は、上述した実施形態に限定されるものではなく、次のように変形または拡張することができる。
原文テキストデータを所定の文字列に分割するための素解析において、形態素解析および構成素解析のうちの一方のみを実行するようにしてもよい。
また、図12Bおよび図12Cに示したスクラッチジェスチャにおいて、ディスプレイ23の画面を擦る方向は、必ずしも上下方向ではなく、左右方向または斜め方向であってもよい。
また、図12Dに示した渦巻ジェスチャにおいて、ディスプレイ23の画面を擦る方向は、時計回りでも反時計回りでもよい。
また、個人プロファイルデータは、操作者の漢字習熟レベル、性別、世代、最終学歴、馴染みの有る地域のうちの一部のみで形成されていてもよい。
【符号の説明】
【0038】
図面中、1は文書変換システム、2は文書表示モジュール(通信端末)、3はアプリケーションサーバー(文書変換装置)、6は文書処理データベース、21は通信インタフェース(通信部)、23はディスプレイ(表示部)、24は操作入力部(操作部)、61はユーザデータベース、62は変換履歴データベース、63は漢字情報データベース、311は受信部、313は素解析部、314は候補選択部(埋込形成部)、321は文書変換部(埋込形成部)、322は送信部、LIは文書画像を示している。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12A
図12B
図12C
図12D
図12E
図13