(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022140854
(43)【公開日】2022-09-28
(54)【発明の名称】電子文書の閲覧用電子機器、表示方法
(51)【国際特許分類】
G06F 40/103 20200101AFI20220920BHJP
G06F 40/289 20200101ALI20220920BHJP
【FI】
G06F40/103
G06F40/289
【審査請求】未請求
【請求項の数】8
【出願形態】書面
(21)【出願番号】P 2021076794
(22)【出願日】2021-03-14
(71)【出願人】
【識別番号】518366119
【氏名又は名称】石川 多一
(72)【発明者】
【氏名】石川 多一
【テーマコード(参考)】
5B091
5B109
【Fターム(参考)】
5B091AA15
5B091CA02
5B091CA05
5B109NA04
5B109NA11
5B109QA02
(57)【要約】 (修正有)
【課題】電子化された文書の視認性を向上する電子機器及び電子文書データの表示方法を提供する。
【解決手段】方法は、電子文書の書き手が当該文書の一部を書式変更する。書式変更の前に当該文書データに対して、構文解析を行い名詞句およびそれ以外の単位に区切る。名詞句とされる単位は複数の可能性が存在する。書き手は、マウスで矩形選択する等で当該文書の一部を範囲指定する。範囲指定されると、当該範囲に含まれる名詞句を一定のルールで抽出する。さらにそれら名詞句および/または非名詞句部に対して書式変更を施す。書式変更設定は、書き手自身が行う場合も、予め定めておいたルールにより自動で行われる場合もある。
【選択図】
図4
【特許請求の範囲】
【請求項1】
電子文書データの生成装置であって、
第一の文字列データを入力する文字列データ入力装置と、
前記第一の文字列データを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位で分割された第二の文字列データを出力する構文解析装置と、
前記第二の文字列データの一部を選択する第一の選択装置と、
前記第二の文字列データの一部を含む名詞句を複数列挙し、その中の一つを選択する第二の選択装置と、
前記選択を引数にして前記第二の文字列データの書式を設定する書式設定装置と、
を有する、電子文書データの生成装置。
【請求項2】
電子文書データの生成方法であって、
第一の文字列データを入力する工程と、
前記第一の文字列データを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位で分割された第二の文字列データを出力する工程と、
前記第二の文字列データの一部を選択する工程と、
前記第二の文字列データの一部を含む名詞句を複数列挙し、その中の一つを選択する工程と、
前記選択を引数にして前記第二の文字列データの書式を設定する工程と、を有する、電子文書データの生成方法。
【請求項3】
前記複数の名詞句の列挙は、当該選択を複数回行うことでサイクリックに表示することを特徴とする請求項1に記載の電子文書データの生成装置
【請求項4】
前記複数の名詞句の列挙は、当該選択を複数回行うことでサイクリックに表示することを特徴とする請求項2に記載の電子文書データの生成方法
【請求項5】
電子文書データの生成装置であって、
第一の文字列データを入力する文字列データ入力装置と、
前記第一の文字列データを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位で分割された第二の文字列データを出力する構文解析装置と、
前記第二の文字列データの一部を範囲指定する範囲指定装置と、
前記第二の文字列データの一部に含まれる名詞句を一定のルールに基づき列挙する列挙装置と、
前記第二の文字列データに対して、当該各名詞句部および非名詞句部の書式変更の内容を設定する書式設定装置と、
を有する、電子文書データの生成装置。
【請求項6】
電子文書データの生成装置であって、
第一の文字列データを入力する工程と、
前記第一の文字列データを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位で分割された第二の文字列データを出力する工程と、
前記第二の文字列データの一部を範囲指定する工程と、
前記第二の文字列データの前記一部に含まれる名詞句を一定のルールに基づき列挙する工程と
前記第二の文字列データに対して、当該各名詞句部および非名詞句部の書式変更の内容を設定する工程と、
を有する、電子文書データの生成方法。
【請求項7】
前記各名詞句部の書式設定は、あらかじめ設定された書式変更群を順次に適用することを特徴とする請求項5に記載の電子文書データの生成装置
【請求項8】
前記各名詞句部の書式設定は、あらかじめ設定された書式変更群を順次に適用することを特徴とする請求項6に記載の電子文書データの生成方法
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子文書を閲覧する際に利用される電子機器、および電子文書データの表示方法に関する。
【背景技術】
【0002】
産業界では、電子文書の需要、供給が日々増大している。電子文書の例としてはインターネット上で公開される論文、電子書籍等が挙げられる。本明細書のような特許公報もその一例である。また、最終的に紙に印刷する場合でも、推敲段階では電子データであることが多い。
【0003】
読み手が文書を読みやすくするために、当該文書の一部の書式変更がなされたりする。例えば強調したい箇所をボールド体に変えたり、色を赤色に変えたりなどである。
【発明の概要】
【発明が解決しようとする課題】
【0004】
ただし、書式を変更する作業は文書の書き手の手間になる。更に文書を読みやすくする単位も一意ではない。例えば、「更に文書を読みやすくする単位は一意ではない」、といった具合に文章すべてを書式変更したり、更に「文書を読みやすくする単位」は「一意ではない」といった具合である。これは当該文書が書かれた文脈に依る。
【0005】
本発明は、上記を鑑みてなされたものであって、電子化された文書の一部を強調する際に当該文書の書き手の手間を軽減することを目的とする。
【課題を解決するための手段】
【0006】
本発明である電子文書データの生成装置10は以下を有する。すなわち、
第一の文字列データ12xを入力する文字列データ入力装置12と、
前記第一の文字列データ12xを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位14pで分割された第二の文字列データ14xを出力する構文解析装置14と、
前記第二の文字列データ14xの一部16xを選択する第一の選択装置16と、
前記第二の文字列データ14xの一部16xを含む名詞句を複数列挙し、その中の一つを選択する第二の選択装置18と、
前記選択を引数にして前記第二の文字列データ14xの書式を設定する書式設定装置20と、である。
【0007】
さらに、本発明である電子文書データの生成方法は以下の工程を有する。すなわち、
第一の文字列データ12xを入力する工程と、
前記第一の文字列データ12xを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位14pで分割された第二の文字列データ14xを出力する工程と、
前記第二の文字列データ14xの一部16xを選択する工程と、
前記第二の文字列データ14xの一部16xを含む句単位を複数列挙し、その中の一つを選択する工程と、
前記選択を引数にして前記第二の文字列データ14xの書式を設定する工程と、
である。
【0008】
更に本発明である電子文書データの生成装置110は以下を有する。すなわち、
第一の文字列データ112xを入力する文字列データ入力装置112と、
前記第一の文字列データ112xを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位114pで分割された第二の文字列データ114xを出力する構文解析装置114と、
前記第二の文字列データ114xの一部116xを範囲指定する範囲指定装置116と、
前記第二の文字列データの一部116xに含まれる名詞句118xを一定のルールに基づき列挙する列挙装置118と、
前記第二の文字列データ114xに対して、当該各名詞句部118xおよび非名詞句部118yの書式変更の内容を設定する書式設定装置120と、である。
【0009】
更に本発明である電子文書データの生成方法は以下を有する。すなわち、
第一の文字列データ12xを入力する工程と、
前記第一の文字列データ12xを構文解析し、指示代名詞により置き換え可能な名詞句とそれ以外という単位14pで分割された第二の文字列データ114xを出力する工程と、
前記第二の文字列データ114xの一部116xを範囲指定する工程と、
前記第二の文字列データの一部116xに含まれる名詞句118xを一定のルールに基づき列挙する工程と、
前記第二の文字列データ114xに対して、当該各名詞句部118xおよび非名詞句部118yの書式変更の内容を設定する工程と、である。
【発明の効果】
【0010】
書式変更による強調の単位を書き手がすべて指定する必要がなくなり、複数の選択肢を選ぶのみで済むため、書き手の文書作成時の書式変更による強調の手間を減らすことができる。
【0011】
さらに予め文書の文章を構文解析して名詞句を単位として文書の一部を強調するため、視認性良い単位で強調が可能となる。視認性向上の観点での、名詞句単位での強調の有効性については、本発明の関連発明(特開2020-057337)を組み込んだソフトのレポジトリを参照されたい。
<https://github.com/polymonyrks/poppyS/blob/master/READMEJP.md>
【図面の簡単な説明】
【0012】
【
図1】
図1は、本発明のある構成の構成要素を本発明の工程の流れとともに示した図である。
【
図2】
図2は、本発明の別の構成の構成要素を本発明の工程の流れとともに示した図である。
【
図3】
図3は、本発明のある構成を、ある和文に対し適用したものである。
【
図4】
図4は、本発明の別の構成を、ある和文に対し適用したものである。
【発明を実施するための形態】
【0013】
以下、本発明を実施するための形態について詳細を説明する。
【0014】
まず、第一の文字列データ12xを構文解析装置14に入力する文字列データ入力装置12を用意する。第一の文字列データ12xは例えばMicrosoft Wordのdocx形式やpdf、html等の形で与えられる。他にも、それらの情報が予め得られていないもの(例えば紙の文書)に対しては、光学的文字認識(OCR)を適用することにより、前記情報を得ることも可能である。文字列データ入力装置12は、HDDやSSDなどの記憶装置や、サーバーを想定しているが、文字列データを与えるものであれば何でも良い。
【0015】
次に前記文字列データ12xを構文解析し、名詞句とそれ以外という単位で分割された第二の文字列データ14xを与える構文解析装置14を用意する。なお、名詞句とは、指示代名詞により置き換え可能な単位を指すものとする。以下、日本語と英語の適用例を挙げる。
【0016】
日本語文書の場合、構文解析装置14として例えばMecabなどの形態素解析器を利用することができる。Mecabの出力結果から名詞句を抽出する簡素な方法として、例えば、助詞や句読点で挟まれた部分を抽出し、そこから動詞的要素を含むものは除く、という操作が一例としてあげられる。ただし、このやり方に限られるものではない。例えば、付加的要素、特許公報であれば例えば、「第一の○○」について「第一」と「○○」の2つの名詞句があるのではなく、「第一の○○」という一つの名詞句として扱う、と例外ルールを設ける等の工夫ができる。後者の場合も、名詞句は指示代名詞で置き換えられるものというルールに合致している。Mecabによる形態素解析の結果から、このように名詞句をさまざまな態様で抽出するのは、本発明の技術の分野における通常の知識を有するものならば容易である。
【0017】
英語文書であれば、構文解析器14として例えばStanford Parserを利用して名詞句(Noun Phrase)を抽出することができる。なお、名詞句としての抽出方法は日本語の場合と同様、複数ありうる。例えば前置詞で分節する場合としない場合、などの違いが存在する。
【0018】
ここから先は本発明は2つの形態がありうる。まずひとつ目の形態である。
【0018】
次に第二の文字列データ14xの一部16xを選択する。選択する手段としては、例えばパソコンやタブレット、スマートフォンにて当該文書を編集している場合、マウスのクリックやタッチパネルの押下によることが可能である。以下の他の選択手段も上記手段と同様のものが使える。
【0019】
次に前記一部16xを含む句単位を複数列挙し、当該文書の書き手がその中の一つを選択する。
【0020】
例えば、書き手が前記一部分を複数回クリックすることで所望の句単位をサイクリックに示すなどがある。
【0021】
他には例えば、書き手が前記一部分を一度クリックした後に前記一部を含む句単位を空間的に複数列挙し、その中から書き手が選択することも挙げられる。
【0022】
最後に前記選択をもとに前記第二の文字列データの書式を変更する。予め設定しておいた書式変更を前記書式変更単位の選択時に適用したり(つまり名詞句単位の選択と書式変更設定を同時に行う)、前記書式変更単位の選択後、所望の書式変更を選択することもありうる。
【0023】
書式変更の可能性を複数登録しておいて、その文書内でこれまで利用していなかったものを自動適用するのも有効である。例えば赤色、青色、緑色、紫色、オレンジ等の書式変更を設定しておくなどである。その文書内で緑色とオレンジが既に使われていれば、赤、青、紫の順に自動適用する等である。これにより、特定箇所の書式変更の手間を大きく軽減することが可能となる。
【0024】
書式変更の可能性を複数登録しておいて、前記書式変更単位の選択後、当該書式変更単位を複数回選択することで、前記複数登録された書式変更をサイクリックに変更したり、空間的に複数列挙することも可能である。
【0025】
以上が本発明の1つ目の実施形態である。次に2つ目の実施形態を説明する。
【0026】
次に第二の文字列データ114xの一部116xを範囲指定する。指定する手段としては、例えばパソコンやタブレット、スマートフォンにて当該文書を編集している場合、マウスの左ボタンを押下した状態でテキスト選択したりやタッチパネルを指で押下し、なぞった後でリリースする等によることが可能である。
【0027】
次に前記一部116xに含まれる名詞句118xを一定のルールに基づき列挙する。一定のルールとは、例えば「▲1▼名詞句+▲2▼「の」+▲3▼名詞句」という単位を抽出する等である。一定のルールを適用することで強調適用後の電子文書を読む読者に対して安心感を与えることができる。さらに除外ワードも指定しておくと有効である。これは決定論的に指定することも可能だし、確率論的に指定するのも可能である。
【0028】
最後に前記各名詞句部118xおよびそれ以外の118yに書式変更の内容を設定する。
【0029】
書式変更の内容設定は、前記範囲指定と同時に予め登録しておいた設定を適用することが可能である。例えば、名詞句をすべて赤字にする等である。赤、青、緑、紫、オレンジ等を順番に登録し、名詞句の出現に応じて前から順に自動適用することも可能である。当該電子文書にてまだ使われていない色を優先的に適用することも可能である。
【0030】
他にも、各名詞句部に対して手動にて一つずつ書式を指定することも可能である。その際はある名詞句部を選択した際に書式内容を空間的に列挙したり、複数選択でサイクリックに書式内容を漸次列挙することも可能である。このあたりは本発明の1つ目の実施例と同様である。
【0031】
以上が本発明の2つ目の実施形態である。次に具体的な実施例としてある和文に対して本発明を適用した結果を示す。
【実施例0032】
(第1実施形態)
図3は、「電子文書の書き手が当該文書の一部を書式変更する。」という文章12xに対して、本発明を適用したものの一例である。以下、これらを得るまでの手順を具体的に説明する。
【0033】
前記文章12xを例えばPC、スマートフォンなどの入力装置12へ入力する。
【0034】
次に前記文章12xを構文解析する。構文解析の結果、前記文章12xは名詞句およびそれ以外という文字列データ14xに変換される。なお前記文字列データ14xは元の文章12xでの順番を保っているものとする。すなわち前記文字列データ14xを結合すると概ね前記文章12xを復元できるものとする。概ねというのは一部全角が半角になったりなど変換がなされる可能性を想定している。
【0035】
次に前記文字列データ14xの一部16xを当該電子文書の書き手が選択する。この例では「当該文書」という箇所とする。選択は例えば前記文字列データ14xをパソコン、タブレット、スマートフォン等の当該電子文書の編集をしている画面に表示し、一部16xが表示されている箇所をマウスでクリックしたりタッチパネルを押下する等でなされる。
【0036】
この例では、「当該文書」を含む名詞句は、以下の複数の可能性がある。すなわち「当該文書」、「当該文書の一部」、「当該文書の一部を書式変更」、「電子文書の書き手が当該文書の一部を書式変更」、「電子文書の書き手が当該文書の一部を書式変更する。」とである。
【0037】
第二の選択装置18と書式設定装置20は別れていることもあるし、同じであることもある。すなわち、前者は前記名詞句の可能性を一つ選択するもの、後者はそうして選ばれた名詞句の書式を設定するものであるが、名詞句の可能性を一つ選択した際にその書式も同時に確定させるやり方もある。
その具体例は、本発明を実施するための形態の箇所で既に触れているので割愛する。
【0038】
このように本発明を用いることで、視認性をよくする自然な区切りである名詞句単位という縛りを加えつつ、効率的に書式を変更することが可能となる。
【0039】
(第2実施形態)
図4は、「電子文書の書き手が当該文書の一部を書式変更する。」という文章112xに対して、本発明を適用したものの一例である。以下、これらを得るまでの手順を具体的に説明する。なお、構文解析装置144までは第1実施形態と同じなので割愛する。
【0040】
構文解析装置114から出力された前記文字列データ114xの一部116xを当該電子文書の書き手が範囲指定する。この例では「電子文書の書き手が当該文書の一部を書式変更する。」という箇所すべてを範囲指定したとする。範囲指定は例えば前記文字列データ114xをパソコン、タブレット、スマートフォン等の当該電子文書の編集をしている画面に表示し、一部116xが表示されている箇所をマウスの左ボタンを押下した状態でテキストの一領域を指定したり、タッチパネルを指で押下し、テキストの一領域をなぞった後でリリースする等でなされる。
【0041】
次に一部116xに含まれる名詞句を一定のルールにもとづいて列挙する。ここでは一定のルールは、「名詞句」「の」「名詞句」は一つの名詞句として扱う、すなわちそれより細かくは分解しない、とする。そのルールだとこの事例では、「電子文書の書き手」、「当該文書の一部」、「書式変更」が列挙される。
【0042】
最後に上記「電子文書の書き手」、「当該文書の一部」、「書式変更」、およびそれ以外の要素、すなわち「が」「を」「する。」について各々書式を設定する。
図4の第三段目では、これら3つの名詞句はすべてボールド+下線とし、それ以外の3要素は文字サイズを小さくした。第四段目では、3つの名詞句に対してそれぞれ違う書式設定を施している。これらの書式設定は電子文書の書き手自身が行うこともあるし、予め登録しておいた設定を適用することも可能である。その具体例は、本発明を実施するための形態の箇所で既に触れているので割愛する。
【0043】
このように本発明を用いることで、視認性をよくする自然な区切りである名詞句単位という縛りを加えつつ、効率的に書式を変更することが可能となる。本実施形態のようにある文章全体が一様に書式変更されて強調されている事例は散見される。これはマウス等では広範囲を一気に領域指定させやすい、心理的にも一気に領域指定するのは心地よい、という事情があると見受けられる。しかしそのように指定された箇所は細かいレベルでの視認性は確保されていない。本発明を用いると同様の広範囲の領域指定をしつつ、視認性を良くするための細やかな書式変更が容易となる。