【文献】
榛葉武士, 外4名,“曲面に書かれた文字列の抽出と補正”,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2006年 2月17日,第105巻, 第615号,p.13-18
(58)【調査した分野】(Int.Cl.,DB名)
前記指定フレーズは、前記面内の他の領域に含まれる文字列,前記面のプロパティに含まれる文字列,検索ログ又は置換ログに含まれる文字列,ユーザ辞書に含まれる文字列にそれぞれ対応する複数のフレーズうちのいずれかである、
請求項6に記載の情報処理装置。
【発明を実施するための形態】
【0010】
[1.実施形態]
[1−1.概要]
(1)実施形態の機能の概要
本実施形態は、設計図等の図面の作成及び編集を支援するCAD(Computer Aided Design)機能(「実施形態の機能」)を有する情報処理装置に関する。実施形態の機能は、独自形式の図面データ(ベクター画像データ)の他に、他の指定形式の図面データ(ラスター画像データ,ベクター画像データ)の読込み(インポート)に対応している。
【0011】
ある種の図面データでは、技術的な要因その他の事情により、もとの文字列が分解され2つ以上の別個の文字要素に分散している場合がある。例えば、PDF(Portable Document Format)形式の図面データの中には、印刷位置を正確に合わせる等の目的で、もとの文字列が1文字ずつに分解され、分解された各文字がそれぞれ独立の文字要素になっているものがある。
【0012】
もともと文字列を構成していた複数の文字が分散していると、検索漏れや置換漏れが発生する。また、もとの文字列部分の属性値を編集する場合に、余計な手間が発生し得る。そのため、インポートした図面データをベースに設計や製図の作業を行う場合に、もともと1つの文字列を構成していた複数の文字が当該図面データにおいて複数の文字要素として分散していると、作業効率が低下しかねない。
【0013】
そこで実施形態の機能に、1つ以上の文字から成る文字列をそれぞれ含む複数の文字要素(領域,文字領域)が配置され得るレイヤ(面,配置面)上で指定(選択)された範囲で、結合の要否判定に用いる結合判定基準(縦条件,横条件,外観条件)を満たす複数の文字要素にそれぞれ含まれる複数の文字列どうしを一括で結合する機能(「範囲文字結合機能」)を追加した。範囲文字結合機能により、設計や製図の作業において作業効率の低下が抑制され得る。
【0014】
(2)レイヤ,文字要素,文字属性
図1は、レイヤの基本構造を示す。レイヤ100は、横幅と縦幅によりサイズが規定される矩形の平面である。レイヤ100内の位置は、左下を原点とし、横方向110をx軸,縦方向120をy軸とするxy平面の座標により特定される。
【0015】
図2は、文字要素の基本構造を示す。文字要素の範囲210は、縦幅211と横幅212により規定される矩形である。範囲210は、1つ以上の文字から成る文字列を含み得る。範囲210には、9つの点221〜229のうちいずれかが配置基準点として設定される。範囲210が基準方向231に対し配置角度232だけ傾いているとき、縦方向233及び横方向234も基準方向231に対し同様に傾いている。
【0016】
実施形態の機能では、レイヤ100に各種の要素が配置される。レイヤ100に配置される文字要素の位置及び範囲は、配置基準点,配置点及び配置角度を用いて特定され得る。すなわち、レイヤ100上の文字要素は、その配置基準点を配置点に合わせ、当該配置基準点を中心として配置角度だけ回転させる手順で配置される。
【0017】
図3は、文字要素の主要な属性項目を示す。文字要素は、「縦幅(高さ)」,「横幅」,「配置基準点」,「配置点(配置位置)」,「配置角度」の他に、「フォント名」,「太文字設定」,「文字傾き設定」,「文字色」等の属性項目を有する。特に、「フォント名」,「太文字設定」,「文字傾き設定」,「文字色」の値により、当該文字要素に含まれる文字列のレイヤ100における外観が規定される。
【0018】
一般に、同一の文字列に由来して分散している複数の文字要素の属性項目をそれぞれ対比すると、「縦幅(高さ)」及び「配置角度」の値は近似する。また、「配置基準点」,「フォント名」,「太文字設定」,「文字傾き設定」,「文字色」の値は一致する。さらに、文字列が全て左から右に向かう方向への横書き(Left To Right,LTR)であることを前提とすれば、いずれかの文字要素の「配置点」の横方向に他の文字要素の「配置点」がある。したがって、これらの属性項目の値は、結合の要否を判定する際に有用な手がかりとなる。
【0019】
(3)範囲文字結合機能の主要な特徴
図4−1は、文字要素の結合前の状態を示す。ここでは、実施形態の機能が起動され、PDF形式の図面データがインポートされた後の典型的な状態が想定されている。レイヤ100には、例えば、複数の文字要素(411〜414,421〜425)が配置されている。
【0020】
この状態において、レイヤ100の全体を指定して範囲文字結合機能の処理(範囲文字結合処理)を実行すると、まず第1段階で、配置角度が近似する複数の文字要素が特定される。その結果として、文字要素411〜414を含むグループと、文字要素421〜425を含むグループと、が形成される。
【0021】
続く第2段階で、同一のグループに属する文字要素の中から結合判定基準を満たす複数の文字要素が特定される。ここで特定される複数の文字要素が、結合対象に設定される。続く第3段階で、結合対象に設定された文字要素どうしが結合(合成)される。その結果、結合対象の文字要素にそれぞれ含まれていた複数の文字列が連結され、1つの文字列に変換される。
【0022】
図4−2は、文字要素の結合後の状態を示す。レイヤ100において、文字要素411〜414の組(
図4−1)が結合され、文字要素410に変化している。同様に、文字要素421〜423の組(
図4−1)及び文字要素424〜425の組(
図4−1)がそれぞれ結合され、文字要素420a及び文字要素420bに変化している。
【0023】
[1−2.構成]
[1−2−1.概要]
実施形態の機能は、汎用の処理装置(例えば、PC(personal computer)など)に、処理装置向けOS(Operating System)と当該OS上で動作する所定プログラム(制御プログラム)がそれぞれインストールされることにより実現される。本実施形態では、実施形態の機能に係る各種処理が、処理装置上で実行されることが主として想定されている。
【0024】
処理装置向けOSは、出荷当初からインストールされていてもよいし、CD(Compact Disc),DVD(Digital Versatile Disk),MOディスク(Magneto-Optical disk),フラッシュメモリ(flash memory)等の記録媒体に記録された状態で配布され当該記録媒体から処理装置に読み込まれてもよい。
【0025】
所定プログラムは、CD,DVD,MOディスク,フラッシュメモリ等の記録媒体に記録された状態で配布され当該記録媒体から処理装置に読み込まれてもよいし、販売元のサーバ装置から通信ネットワークを介し搬送波に重畳させて処理装置に供給されてもよいし、同時起動可能なライセンス数を管理するサーバ装置から通信ネットワークを介し搬送波に重畳させて処理装置に供給されてもよい。
【0026】
[1−2−2.電気的構成]
図5は、処理装置の電気的構成を例示する。典型的な処理装置は、CPU(Central Processing Unit)やROM(Read Only Memory)を含む制御処理装置510と、RAM(Random Access Memory)を含む主記憶装置520と、HDD(Hard Disc Drive)を含む補助記憶装置530と、各種のポインティングデバイスやキーボードを含む入力装置540と、ディスプレイやスピーカを含む出力装置550と、ネットワークカード(Network Interface Card)を含む通信制御装置560と、を有する。
【0027】
主記憶装置520,補助記憶装置530,入力装置540,出力装置550及び通信制御装置560は、バスラインを介して制御処理装置510にそれぞれ接続される。制御処理装置510は、(1)補助記憶装置530に記憶されたプログラムを主記憶装置520上に読み込み、(2)プログラムの指示に従って入力装置540と補助記憶装置530と通信制御装置560との少なくともいずれかからデータを取得し、(3)取得したデータをプログラムに規定される手順で演算・加工した上で、(4)演算済み・加工済みのデータを補助記憶装置530と出力装置550と通信制御装置560との少なくともいずれかに提供する。
【0028】
[1−2−3.機能的構成]
図6は、情報処理装置の範囲文字結合機能に係る機能的構成を例示する。
図6に例示されるように、情報処理装置10に実現される範囲文字結合機能は、設定部610,整理部620,判定部630,結合部640を含む。設定部610,整理部620,判定部630,結合部640はそれぞれ、情報処理装置10の制御処理装置510を少なくとも含んで構成される。
【0029】
設定部610は、範囲文字結合処理に用いる各種パラメータの値を設定する。具体的には、ユーザによる指定に応じて、範囲文字結合処理の対象とする文字要素の範囲と、横条件(後述)の基準となる許容差の値が設定される。文字要素の範囲は、レイヤ100上で矩形の対頂点をユーザ操作により指定させるのが好適である。許容差の値は、ポップアップ表示させた入力画面において数値と単位(例えば、ミリメートル)をユーザに入力させるのが好適である。
【0030】
整理部620は、配置角度が近似する複数の文字要素を特定する。具体的には、配置角度が許容誤差以内である複数の文字要素が特定され、これらがグループ化される。さらに、必要に応じて、各グループにおいて文字要素が、レイヤ100における文字要素の配置点の順に整列される。
【0031】
判定部630は、結合判定基準を用いて少なくとも2つの文字要素を特定する。具体的には、隣接する2つの文字要素について結合判定基準を構成する条件を全て満たす関係にあるか否かがそれぞれ判定され、これらの判定結果を総合して結合対象とする少なくとも2つの文字要素が特定される。
【0032】
結合部640は、指定された範囲において結合対象として特定された複数の文字要素を1つの文字要素に変換する。具体的には、複数の文字要素にそれぞれ含まれる複数の文字列が連結され、複数の文字要素の全部を包含する新たな文字要素の範囲に連結後の文字列が配置される。連結後の文字列は、新たな文字要素の範囲に均等割付で配置されるのが好適である。なお、新たな文字要素の範囲に、左寄せ,中寄せ,右寄せ等により配置されてもよい。
【0033】
[1−2−4.結合判定基準]
(1)概要
範囲文字結合機能の結合判定基準は、文字要素の縦方向のずれ度合いに関する縦条件,文字要素の横方向の離れ度合いに関する横条件,文字列の外観の関連度合いに関する外観条件の全部を満たすことである。なお、縦条件は整理部620におけるグループ化の際に考慮してもよい。
【0034】
(2)縦条件及び横条件
図7は、結合判定基準の主要な条件(縦条件及び横条件)を模式的に示す。縦条件は、文字要素711と文字要素712の縦方向721における差731が所定値に満たないことである。所定値は、実施形態の機能における数値の有効桁数等を考慮して設定されるのが好適である。横条件は、文字要素711と文字要素712の横方向722における間隔732が許容差以内であることである。許容差は、ユーザにより指定されるのが好適である。
【0035】
(3)外観条件
外観条件は、文字要素の外観を規定する属性項目(
図3の「フォント名」,「太文字設定」,「文字傾き設定」,「文字色」)の値のうち少なくともいずれかが一致することである。これらの値のうち少なくとも複数が一致することを条件としてもよいし、これらの値の全部が一致することを条件としてもよい。本実施形態では、これらの値の全部が一致することを条件とする。
【0036】
[1−3.動作]
[1−3−1.範囲文字結合手順]
図8は、範囲文字結合手順を例示する。
図8に例示される手順の各ステップの処理は、情報処理装置10が実行する。
【0037】
ステップS810では、範囲文字結合処理の対象となる複数の文字要素を特定する。具体的には、設定部610が、ユーザが指定する矩形範囲に含まれる複数の文字要素を範囲文字結合処理の対象に設定する。ステップS820では、横条件の基準となる許容差を設定する。具体的には、設定部610が、ユーザが入力する数値及び単位に応じて許容差を設定する。
【0038】
ステップS830では、ステップS810で設定された文字要素に含まれる文字要素を配置角度ごと分類し、グループ化する。併せて、各グループにおいて、複数の文字要素をレイヤ100における配置点の順に整列させる。
【0039】
ステップS840では、制御変数を初期化する。具体的には、変数aに1が代入され、変数bにグループ数が代入される。ステップS850では、グループ[a]の結合判定処理(後述)を実行する。ステップS860では、変数aがインクリメントされる。
【0040】
ステップS870では、範囲文字結合手順の終了条件が判定される。具体的には、変数aの値が変数bの値(グループ数)を超過していれば、範囲文字結合手順が終了する。一方、超過していなければ、ステップS850に戻る。
【0041】
[1−3−2.結合判定手順]
図9は、結合判定手順を例示する。
図8に例示される手順は、グループ[a]の結合判定処理(
図8のステップS850)に対応する。
図8に例示される手順の各ステップの処理は、情報処理装置10が実行する。
【0042】
ステップS910では、制御変数が初期化される。具体的には、変数iに1が代入され、変数jにグループ[a]の文字要素数が代入される。ステップS920では、ループの終了条件が判定される。具体的には、変数iの値が変数jの値に等しければ、ステップS960に進む。等しくなければ、ステップS930に進む。
【0043】
ステップS930では、文字要素[i]と文字要素[i+1]が結合判定基準を満たすか否かを判定する。具体的には、判定部630が、縦条件,横条件,外観条件の全部を満たすか否かを判定する。結合判定基準を満たすと判定されれば、ステップS940に進み、判定部630が、文字要素[i]と文字要素[i+1]を結合対象に設定する。結合判定基準を満たすと判定されなければ、ステップS950に進んで変数iがインクリメントされ、ステップS920に戻る。
【0044】
ステップS960では、結合対象を結合する。具体的には、結合部640が、グループ[a]において結合対象に設定された複数の文字要素を1つの文字要素に変換する。より具体的には、複数の文字要素にそれぞれ含まれる複数の文字列が連結され、複数の文字要素の全部を包含する新たな文字要素の範囲に連結後の文字列が配置される。連結後の文字列は、新たな文字要素の範囲に均等割付で配置される
【0045】
[2.変形例]
範囲文字結合機能の結合判定基準は、縦条件,横条件,外観条件のうち少なくともいずれかに代えて、又はこれらの条件とともに、文字列の親和度合いに関する親和条件を満たすことでもよい。
【0046】
親和条件は、複数の文字要素にそれぞれ含まれる複数の文字列を仮に連結した連結文字列が指定フレーズに含まれることである。指定フレーズは、レイヤ100内の他の文字要素に含まれる文字列,レイヤ100のプロパティ項目の値に含まれる文字列,実施形態の機能の検索ログに含まれる文字列,実施形態の機能の置換ログに含まれる置換前文字列,予め定義されるユーザ辞書に含まれる文字列にそれぞれ対応する複数のフレーズうちのいずれかであるとよい。
【0047】
[3.付記]
[3−1.概要]
本発明は、1つ以上の文字から成る文字列をそれぞれ含む複数の領域が配置され得る面上で基準方向に対する配置角度が近似する複数の前記領域を特定し、特定される前記領域の中から該領域の縦方向のずれ度合いに関する縦条件と結合の要否判定に用いる所定条件の双方の判定結果を用いて少なくとも2つの前記領域を特定する。これにより、複数の領域が配置され得る面において結合対象の領域を簡易に特定可能である。
【0048】
[3−2.主要な形態]
本発明は、少なくとも下記の形態を包含する。
〔A〕1つ以上の文字から成る文字列をそれぞれ含む複数の領域が配置され得る面上で基準方向に対する配置角度が近似する複数の前記領域を特定する第1手段と、前記第1手段により特定される前記領域の中から該領域の縦方向のずれ度合いに関する縦条件と結合の要否判定に用いる所定条件の双方の判定結果を用いて少なくとも2つの前記領域を特定する第2手段と、を備える情報処理装置。
〔B〕1つ以上の文字から成る文字列をそれぞれ含む複数の領域が配置され得る面上で基準方向に対する配置角度が近似する複数の前記領域を特定する第1段階と、前記第1段階において特定される前記領域の中から該領域の縦方向のずれ度合いに関する縦条件と結合の要否判定に用いる所定条件の双方の判定結果を用いて少なくとも2つの前記領域を特定する第2段階と、を含む、コンピュータの制御方法。
〔C〕1つ以上の文字から成る文字列をそれぞれ含む複数の領域が配置され得る面上で基準方向に対する配置角度が近似する複数の前記領域を特定する第1機能と、前記第1機能により特定される前記領域の中から該領域の縦方向のずれ度合いに関する縦条件と結合の要否判定に用いる所定条件の双方の判定結果を用いて少なくとも2つの前記領域を特定する第2機能と、をコンピュータに実現させる制御プログラム。
〔D〕1つ以上の文字から成る文字列をそれぞれ含む複数の領域が配置され得る面上で基準方向に対する配置角度が近似する複数の前記領域を特定する第1機能と、前記第1機能により特定される前記領域の中から該領域の縦方向のずれ度合いに関する縦条件と結合の要否判定に用いる所定条件の双方の判定結果を用いて少なくとも2つの前記領域を特定する第2機能と、をコンピュータに実現させる制御プログラムを記録する記録媒体。
【0049】
[3−3.主要な限定]
上記〔A〕「情報処理装置」には、下記の技術的限定を加えてもよい。また、同様の技術的限定を、上記〔B〕「制御方法」,上記〔C〕「制御プログラム」及び上記〔D〕「記録媒体」にそれぞれ加えてもよい。
(1)前記所定条件は、前記領域の横方向の離れ度合いに関する横条件を含む。
(2)前記所定条件は、前記文字列の外観の関連度合いに関する外観条件を含む。
(3)前記外観条件は、フォント名,太文字設定,文字傾き設定,文字色にそれぞれ対応する複数の属性値のうち少なくともいずれかが一致していることである。
(4)前記外観条件は、複数の前記属性値のうち少なくとも複数が一致していることである。
(5)前記所定条件は、前記文字列の親和度合いに関する親和条件を含む。
(6)前記親和条件は、複数の前記領域にそれぞれ含まれる複数の文字列を仮に連結した連結文字列が指定フレーズに含まれることである。
(7)前記指定フレーズは、前記面内の他の領域に含まれる文字列,前記面のプロパティに含まれる文字列,検索ログ又は置換ログに含まれる文字列,ユーザ辞書に含まれる文字列にそれぞれ対応する複数のフレーズうちのいずれかである。
【解決手段】本発明の一形態である情報処理装置(例えば、情報処理装置10)は、1つ以上の文字から成る文字列をそれぞれ含む複数の領域が配置され得る面上で基準方向に対する配置角度が近似する複数の前記領域を特定する第1手段(例えば、整理部620)と、前記第1手段により特定される前記領域の中から該領域の縦方向のずれ度合いに関する縦条件と結合の要否判定に用いる所定条件の双方の判定結果を用いて少なくとも2つの前記領域を特定する第2手段(例えば、判定部630)と、を備える。