(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-19
(45)【発行日】2024-02-28
(54)【発明の名称】検索装置、検索方法、検索プログラム
(51)【国際特許分類】
G06F 16/332 20190101AFI20240220BHJP
【FI】
G06F16/332
(21)【出願番号】P 2019172681
(22)【出願日】2019-09-24
【審査請求日】2022-09-14
(73)【特許権者】
【識別番号】000001443
【氏名又は名称】カシオ計算機株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100179062
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100153051
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100199565
【氏名又は名称】飯野 茂
(74)【代理人】
【識別番号】100162570
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】佐藤 勝彦
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開2006-120000(JP,A)
【文献】特開2009-205490(JP,A)
【文献】特開2018-049515(JP,A)
【文献】特開平08-194709(JP,A)
【文献】特開2006-107261(JP,A)
【文献】特開2015-014980(JP,A)
【文献】特開2005-202924(JP,A)
【文献】特開2017-054352(JP,A)
【文献】特開2007-094547(JP,A)
【文献】特開2011-186680(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
複数の単語からなる成句と、前記成句の意味とを対応付けて記憶している成句辞書データと、
検索語と、前記検索語を含む文である含有文とが指定された場合に、
前記含有文に対する構文解析結果に基づいて取得された前記検索語の基本形を用いて、前記検索語に対応する成句を前記成句辞書データから検索し、検索された結果得られた成句候補の表示を前記含有文との類似度に基づいて制御する制御部と、
を有する検索装置。
【請求項2】
単語と、前記単語の語義とを対応付けて記憶している単語辞書データを有し、
前記制御部は、
検索語と、前記検索語を含む文である含有文とが指定された場合に、前記検索語に対応する語義を前記単語辞書データから検索するとともに、
前記含有文に対する構文解析結果に基づいて取得された前記検索語の基本形を用いて、前記検索語に対応する成句を前記成句辞書データから検索し、
検索された結果得られた成句候補の表示を前記含有文との類似度に基づいて制御するとともに、前記検索された語義を表示する請求項
1記載の検索装置。
【請求項3】
前記制御部は、
前記
類似度に基づいて、
前記成句候補の表示の優先順位を制御する請求項
1または2記載の検索装置。
【請求項4】
前記制御部は、
前記
類似度に基づいて、
前記成句候補における所定の成句の表示の有無を制御する請求項
1または2記載の検索装置。
【請求項5】
前記成句辞書データは、前記成句を構成する第1単語の意味が、前記単語辞書データに記憶されている前記第1単語の語義とは異なる意味で使われている成句および前記成句の意味を記憶し、
前記制御部は、
前記単語辞書データから検索された単語の語義と、前記成句辞書データから検索された成句の意味とを表示する請求項
2記載の検索装置。
【請求項6】
前記単語辞書データは、単語と、前記単語に対応する複数の語義と、前記複数の語義それぞれに対応する用例とを対応付けて記憶し、
前記制御部は、
前記含有文と、前記用例および前記成句とを比較し、
前記類似度としての比較結果に基づいて、前記検索語に対応する語義および成句の意味の表示を制御する請求項
2記載の検索装置。
【請求項7】
前記制御部は、
前記含有文と
複数の前記用例それぞれとの
類似度と、前記含有文と
前記成句候補それぞれとの
類似度とに基づき、前記複数の語義および
前記成句候補の意味について、表示の有無または表示の優先順位を制御する請求項
6記載の検索装置。
【請求項8】
前記制御部は、
前記含有文に含まれる複数の単語と、前記成句に含まれる複数の単語とを比較して、一致する単語の数を特定し、
前記成句候補のうち、前記含有文に対して一致する単語の数が多い成句を優先して表示させる請求項
1記載の検索装置。
【請求項9】
前記制御部は、
前記含有文と前記用例とを比較する第1の比較方法と、前記含有文と前記成句とを比較する前記第1の比較方法とは異なる第2の比較方法を用いる請求項
6記載の検索装置。
【請求項10】
含有文の構文解析結果に基づいて、検索語の基本形、品詞、動詞タイプ、文型タイプ、検索語の係り受け先の前置詞、検索語の係り受け先の固有表現情報、構文特徴の何れかを含む、前記検索語に対する検索キーを生成し、
前記生成した検索キー
に含まれる前記検索語の基本形を用いて、前記語義の検索および前記成句の検索を行う請求項
2記載の検索装置。
【請求項11】
検索装置が実行する検索方法であって、
検索語と、前記検索語を含む文である含有文とが指定された場合に、
前記含有文に対する構文解析結果に基づいて取得された前記検索語の基本形を用いて、前記検索語に対応する成句を成句辞書データから検索し、検索された結果得られた成句候補の表示を前記含有文との類似度に基づいて制御する検索方法。
【請求項12】
コンピュータに、
検索語と、前記検索語を含む文である含有文とが指定された場合に、
前記含有文に対する構文解析結果に基づいて取得された前記検索語の基本形を用いて、前記検索語に対応する成句を成句辞書データから検索し、検索された結果得られた成句候補の表示を前記含有文との類似度に基づいて制御するように機能させるための検索プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、検索装置、検索方法、検索プログラムに関する。
【背景技術】
【0002】
ユーザが英語の文章などを読んでいる途中で調べたい単語が出てきた場合に、電子辞書を用いて単語を検索することにより、この単語に関する複数の語義と、各語義に対応する例文を表示させることができる。ユーザは、各語義に対応して表示された例文などを参考にして、読んでいる文章中における該当単語の意味がどれであるかを知ることができた。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、検索対象とする単語が、文章中で成句(慣用句)として用いられていた場合には、単語が通常とは異なる特別な意味で用いられていることがあり、例文に対応する語義だけでは、文書中における単語(成句)の意味を正しく知ることは難しかった。
【0005】
本発明は、前記のような課題に考慮してなされたもので、ユーザが調べたい単語が通常の意味で用いられているか、成句として用いられているかをユーザが理解していなくても、普通に単語検索を行うだけで、単語または単語を含む成句の意味や用法を効果的に知ることができる検索装置、検索方法、検索プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本実施形態における検索装置は、複数の単語からなる成句と、前記成句の意味とを対応付けて記憶している成句辞書データと、検索語と、前記検索語を含む文である含有文とが指定された場合に、前記含有文に対する構文解析結果に基づいて取得された前記検索語の基本形を用いて、前記検索語に対応する成句を前記成句辞書データから検索し、検索された結果得られた成句候補の表示を前記含有文との類似度に基づいて制御する制御部と、を有する。
【発明の効果】
【0007】
本発明によれば、ユーザが調べたい単語が通常の意味で用いられているか、成句として用いられているかをユーザが理解していなくても、普通に単語検索を行うだけで、単語または単語を含む成句の意味や用法を効果的に知ることができる。
【図面の簡単な説明】
【0008】
【
図1】本発明の実施形態に係る検索装置の電子回路の構成を示す機能ブロック図。
【
図2】本実施形態における電子辞書の外観構成を示す正面図。
【
図3】本実施形態における電子辞書による辞書制御処理を示すフローチャート。
【
図4】
図3に示すフローチャートの表示制御処理を示すフローチャート。
【
図5】本実施形態における成句検索のための検索画面の一例を示す図。
【
図6】本実施形態における成句検索の検索結果を表示する検索結果画面の一例を示す図。
【
図7】本実施形態における含有文付き単語検索のための検索画面の一例を示す図。
【
図8】本実施形態における第2の類似度に相当する評価値の算出方法を説明するための図。
【
図9】本実施形態における含有文付き単語検索の検索結果を表示する検索結果画面の一例を示す図。
【
図10】
図3に示すフローチャートの表示制御処理を示すフローチャート。
【
図11】本実施形態における電子辞書による辞書制御処理の変形例を示すフローチャート。
【発明を実施するための形態】
【0009】
以下、図面により本発明の実施の形態について説明する。
【0010】
図1は、本発明の実施形態に係る検索装置の電子回路の構成を示す機能ブロック図である。
【0011】
本実施形態では、検索装置を例えば電子辞書10として構成した例について示す。なお、検索装置は、電子辞書10の他、パーソナルコンピュータ、スマートフォン、タブレットPCなどの各種の電子機器により実現することが可能である。
【0012】
電子辞書10は、複数の見出し語とする単語にそれぞれ対応する少なくとも1つの語義に関する情報が辞書データとして記録されている。辞書データには、語義に対応する見出し語の単語を含む用例(例文)、見出し語を含む成句(慣用句)を含む。電子辞書10は、見出し語を指定する文字列(検索語とする単語)を入力することで、見出し語に対応する語義及び用例を含む情報を検索する単語検索、成句を構成する1つまたは複数の単語を含む文字列を入力して成句を検索する成句検索、及び検索語と共に検索語を含む文(以下、含有文と称する)を入力して単語検索と成句検索を実行する含有文付き単語検索を実行可能な検索機能を有する。
【0013】
電子辞書10は、含有文付き単語検索においては、検索対象として入力された検索語を含む含有文に対して構文解析を実行し、構文解析結果を利用した検索を実行する。また、電子辞書10は、含有文だけでなく、辞書データに予め登録されている複数の語義のそれぞれに対応する用例に対する構文解析を実行し、用例に対する構文解析結果と含有文に対する構文解析結果との比較(類似度)に基づいて、検索語に対応する語義及び用例を検索することができる。
【0014】
電子辞書10は、各種の記録媒体に記録されたプログラム、又は、伝送されたプログラムを読み込んで、その読み込んだプログラムによって動作が制御されるコンピュータの構成を有し、その電子回路には、CPU(central processing unit)11が備えられる。
【0015】
CPU11は、電子辞書10の全体を制御する制御部として機能する。CPU11は、メモリ12内に予め記憶された制御プログラム、あるいはROMカードなどの記録媒体13から記録媒体読取部14を介してメモリ12に読み込まれた制御プログラム、あるいはインターネット等を含むネットワークNを通じて、サーバ20から通信部15を介しダウンロードされてメモリ12に読み込まれた制御プログラムに応じて、回路各部の動作を制御する。
【0016】
メモリ12に記憶された制御プログラムは、キー入力部16からのユーザ操作に応じた入力信号、タッチパネル式表示部17からのユーザ操作に応じた入力信号、あるいは外部接続されるネットワークN上のサーバ20との通信信号、あるいは記録媒体読取部14を介して接続されるEEPROM(登録商標),RAM,ROMなどの記録媒体13との接続通信信号に応じて起動される。
【0017】
CPU11には、メモリ12、記録媒体読取部14、通信部15、キー入力部16、タッチパネル式表示部17などが接続される。
【0018】
メモリ12に記憶される制御プログラムとしては、電子辞書10の全体の動作を司るシステムプログラム、外部接続されるネットワークN上のサーバ20、パーソナルコンピュータなどの他の電子機器とデータ通信するための通信プログラムが記憶される。さらに、メモリ12には、入力された文字列(検索語)をもとに情報を検索して出力する検索機能を実行する辞書制御プログラム12aが記憶される。辞書制御プログラム12aは、含有文や用例などの文に対して構文解析を実行する構文解析プログラム12bが含まれる。
【0019】
また、メモリ12には、辞書データ12c、検索キーデータ12d、第1類似度データ12e、成句候補リストデータ12f、第2類似度データ12g、検索語データ12h、含有文データ12kなどが記録される。
【0020】
辞書データ12cには、例えば、英和辞書、和英辞書、英英辞書、国語辞書などの複数の辞書を集録したデータベース(辞書コンテンツデータ)が含まれる。辞書データ12cには、辞書毎に、各見出し語のそれぞれに対応する意味(語義)を説明する語義情報が含まれる。1つの見出し語に対して複数の語義情報が記憶される場合ある。また、語義情報には、見出し語(単語)の語義に応じた文章内での使用例を示す用例、見出し語(単語)を含む成句の情報が含まれる。
【0021】
辞書データ12cに対しては、単語検索及び成句検索を実行することができる。そのため、辞書データ12cには、例えば、Nグラムベース検索インデックスによるランク付け機能付きテキスト検索アルゴリズムを利用する、単語検索のための語義検索インデックス12c1と成句検索のための成句検索インデックス12c2が設けられる。語義検索インデックス12c1は、辞書コンテンツデータに対して、見出し語の説明が記載されている説明部内を語義単位で取り扱える語義部を定義して見出し語の語義単位でランク付け出来るようにしたインデックスである。成句検索インデックス12c2は、辞書コンテンツデータに対して、見出し語を用いた成句が記載されている箇所をまとめて成句部を定義したインデックスである。すなわち、本実施形態における辞書データ12cは、語義検索インデックス12c1を用いて検索が実行される単語辞書データと、成句検索インデックス12c2を用いて検索が実行される成句辞書データとして使用される。
【0022】
なお、辞書データ12cは、電子辞書10の本体に内蔵せずに、ネットワークNを通じてアクセス可能な辞書データベース(例えば、サーバ20)から取得するようにしても良い。
【0023】
検索キーデータ12dは、含有文に対する構文解析結果に基づいて生成される、検索語に対する検索キーを示すデータである。検索キーは、例えば、検索キーは、検索語の基本形、品詞、動詞タイプ(他動詞/自動詞)、文型タイプ(SVC,SVO、SVOO、SVOC、等)検索語の係り受け先の前置詞、検索語の係り受け先の固有表現情報(場所、時間、等)、構文特徴(不定詞、等)で構成されている。例えば、含有文「The boy took a toy away from his younger brother.」、検索語「took」の場合には、検索キーとして「take 動詞 他動詞 SVOM from」が生成される。なお、検索キーには、少なくとも検索語の基本形と、その他の何れかの構文解析結果のデータが含まれていれば良い。
【0024】
第1類似度データ12eは、含有文付き単語検索による単語検索により検索される検索語に対応する語義の用例と、含有文との比較結果を示す類似度(第1の類似度)を示すデータである。語義の用例と含有文との類似度(第1の類似度)は、例えば構文解析により抽出される係り受け種類(係り受け関係タグ)の一致数に基づくものとする。すなわち、同じ係り受け種類(係り受け関係タグ)を多く有するほど類似度が高いものとする。さらに、係り受け種類(係り受け関係タグ)の一致数が同じ複数の構文解析情報(用例)がある場合には、係り受け種類(係り受け関係タグ)が一致した係り受け関係にある見出し語と他の単語との距離が小さい方を類似度が高いものと判別する。
【0025】
成句候補リストデータ12fは、含有文付き単語検索による成句検索により検索される、検索語に対応する成句が登録される成句候補リストを示すデータである(
図8参照)。
【0026】
第2類似度データ12gは、成句候補リストに登録される成句候補と、含有文との比較結果を示す類似度(第2の類似度)を示すデータである。成句候補と含有文との類似度(第2の類似度)は、例えば成句候補を構成する単語数、含有文を構成する単語数、成句候補を構成する単語と含有文とが合致する単語数をもとに算出される評価値(スコア)が用いられる(詳細については後述する)。
【0027】
検索語データ12hは、入力された検索語のデータである。含有文データ12kは、検索語と共に入力された含有文を示すデータである。
【0028】
図2は、電子辞書10の外観構成を示す正面図である。
【0029】
図2における電子辞書10の場合、開閉される装置本体の下段側にCPU11、メモリ12、記録媒体読取部14、通信部15が内蔵されると共に、キー入力部16が設けられ、上段側にタッチパネル式表示部17が設けられる。
【0030】
キー入力部16には、文字入力キー16a、各種の辞書や各種機能を選択することができる辞書選択キー16b、[訳/決定]キー16c、[戻る]キー16d、カーソルキー(上下左右キー)16e、電源ボタン、その他の各種機能キーなどが備えられる。タッチパネル式表示部17には、各種機能の実行に応じて、各種メニューやボタン17aなどが表示される。
【0031】
電子辞書10は、ユーザによるキー入力部16に対する操作、あるいは表示部17に表示されたメニューやボタンに対するタッチ操作(ペン先、あるいは指先による)に応じて、ユーザによる指示を入力することができる。
【0032】
このように構成された電子辞書10は、CPU11が辞書制御プログラム12aに記述された命令に従い回路各部の動作を制御し、ソフトウエアとハードウエアとが協働して動作することにより、以下の動作説明で述べる機能を実現する。
【0033】
次に、本実施形態における電子辞書10の動作について説明する。
【0034】
図3は、本実施形態における電子辞書10による辞書制御処理(メイン処理)を示すフローチャート、
図4は、
図3に示すフローチャートの表示制御処理を示すフローチャートである。
【0035】
CPU11は、電源オンされると、辞書制御プログラム12aを起動して辞書制御処理を開始する。CPU11は、タッチパネル式表示部17に初期画面であるホーム画面を表示させる。ホーム画面には、検索対象とする辞書を選択するためのメニューが含まれる。メニューでは、検索対象とする辞書を選択することができる。例えば、検索対象とする辞書として、全ての辞書を検索対象とする、特定の範囲の辞書(例えば、英語系辞書など)、あるいは特定の辞書(例えば、○○英和辞書など)を選択することができる。
【0036】
CPU11は、メニューにおいて検索対象とする辞書が選択されると、検索語を入力するための入力エリアが設けられた検索画面をタッチパネル式表示部17に表示させる。
【0037】
図5は、本実施形態における成句検索のための検索画面AR1の一例を示す図である。
図5に示すように、検索画面AR1には、検索語とする文字列を入力するための入力エリアAR11が設けられている。CPU11は、入力エリアAR11に文字列(検索語)が入力されると(ステップA1)、入力された検索語の検索語データ12hをメモリ12に記憶させる。CPU11は、例えば[訳/決定]キー16cの操作により検索実行が指示されると、成句検索のための検索画面に対する入力であるため、含有文付きではない成句検索であると判断し(ステップA2、No→ステップA10、「成句検索」)、入力された検索語をもとにした成句検索を開始する。
【0038】
CPU11は、メモリ12に記憶された成句を指定する検索語(1つ、または複数)の検索語データ12hを指定し(ステップA31)、検索語に対応する成句を、語義検索インデックス12c1を用いて成句辞書データから検索する(ステップA32)。
【0039】
CPU11は、成句辞書データから検索される成句を成句候補リストに記録すると共に、成句検索の検索結果をタッチパネル式表示部17に表示させる(ステップA33)。
【0040】
図6は、本実施形態における成句検索の検索結果を表示する検索結果画面AR2の一例を示す図である。
図6に示すように、検索結果画面AR2には、成句検索により検索された複数の成句を表示する成句リストエリアAR21と、成句リストに表示された成句を用いた用例を表示する用例表示エリアAR22が設けられている。
【0041】
成句リストエリアAR21には、検索語を含む複数の成句がリスト表示され、用例表示エリアAR22には、成句リストエリアAR21において選択されている成句を含む用例が表示される。例えば、
図6に示す例では、検索語「cake」を含む成句「take the cake」が選択されており、この成句を用いた用例「That takes the cake.」と訳文「ひどい、最低だ」が表示されている。
【0042】
成句リストエリアAR21にリスト表示されている成句の表示の順番は、成句辞書データに登録されている順番である。
【0043】
一方、単語検索を実行する場合には、前述した成句検索と同様にして、単語検索のための検索画面に検索語とする文字列が入力されると、CPU11は、入力された検索語の検索語データ12hをメモリ12に記憶させる。CPU11は、例えば[訳/決定]キー16cの操作により検索実行が指示されると、単語検索のための検索画面に対する入力であるため、単語検索であると判断し(ステップA2、No→ステップA10、「単語検索」)、入力された検索語をもとにした単語検索を開始する。
【0044】
CPU11は、メモリ12に記憶された検索語の検索語データ12hを指定し(ステップA11)、検索語に対応する見出し語に対応する語義及び用例を含む情報を、語義検索インデックス12c1を用いて単語辞書データから検索する(ステップA12)。見出し語に対して複数の語義が存在する場合には、複数の語義と用例の情報が検索される。
【0045】
CPU11は、単語辞書データから検索される各語義及び各用例を含む情報を、タッチパネル式表示部17に表示させる(ステップA13)。
【0046】
次に、含有文付き単語検索を実行する場合について説明する。
【0047】
図7は、本実施形態における含有文付き単語検索のための検索画面AR3の一例を示す図である。
図7に示すように、検索画面AR3には、検索語とする文字列を入力するための入力エリアAR31と含有文を入力するための入力エリアAR32が設けられている。CPU11は、入力エリアAR31に文字列(検索語)が入力され(ステップA1)、入力エリアAR32に検索語を含む文字列(含有文)が入力されると(ステップA2、Yes)、入力された検索語の検索語データ12hと含有文の含有文データ12kをメモリ12に記憶させる。CPU11は、例えば[訳/決定]キー16cの操作により検索実行が指示されると、含有文付き単語検索のための検索画面に対する入力であるため、含有文付きであると判断し、入力された検索語と含有文をもとにした含有文付き単語検索のための処理を開始する。
【0048】
なお、前述した説明では、含有文付き単語検索のための検索画面AR3を通じて検索語と含有文を入力するとしているが、他の方法により検索語と含有文を入力できるようにしても良い。例えば、文章表示エリアに表示された文章に対するタッチ操作(ペン先、あるいは指先による)に応じて、タッチ位置の単語を検索語として特定し、この単語を含む1文章のテキストデータを抽出して含有文として入力する。CPU11は、特定した単語を検索語データ12hとして記憶し、また文章から抽出テキストデータを含有文データ12kとしてメモリ12に記憶させる。これにより、表示された文章に対するタッチ操作のみにより、検索語と含有文を簡単に入力して含有文付き単語検索を実行させることができる。
【0049】
CPU11は、入力された含有文(含有文データ12k)に対して、構文解析プログラム12bによる構文解析処理を実行する(ステップA3)。構文解析処理では、検索キーの生成に必要なデータ、係り受け種類(係り受け関係タグ)に関するデータなどが検出される。
【0050】
CPU11は、含有文に対する構文解析結果に基づいて検索キーを作成して、検索キーデータ12dをメモリ12に記憶させる(ステップA4)。検索キーは、例えば前述したように、検索語の基本形、品詞、動詞タイプ、文型タイプ、検索語の係り受け先の前置詞、検索語の係り受け先の固有表現情報、構文特徴などを含む。
【0051】
CPU11は、含有文付き単語検索のための検索画面に対する入力、または、文章表示エリアに表示された文章中の単語が検索語として指定されたことにより含有文付き単語検索を実行する場合(ステップA10、「含有文付き単語検索」)、検索キーを用いて、検索語による単語検索を実施すると共に、検索キー内の検索語の基本形を用いて成句検索を実施する。
【0052】
まず、CPU11は、単語検索のための検索語と、この検索対象とする検索語を含む含有文とを指定する(ステップA21,A22)。CPU11は、検索語に対応する見出し語に対応する語義及び用例を含む情報を、語義検索インデックス12c1を用いて単語辞書データから検索する(ステップA23)。
【0053】
次に、CPU11は、含有文と単語検索によって検索された各語義の用例との比較結果を示す第1の類似度を構文解析に基づいて算出する(ステップA24)。すなわち、CPU11は、各語義の用例と含有文との類似度(第1の類似度)は、例えば構文解析により抽出される係り受け種類(係り受け関係タグ)の一致数に基づいて算出し、用例毎の第1の類似度を示す第1類似度データ12eをメモリ12に記憶させる。
【0054】
また、CPU11は、入力された検索語に対応する成句を、語義検索インデックス12c1を用いて成句辞書データから検索し、成句候補リストに登録する(ステップA25)。
【0055】
次に、CPU11は、成句候補リストに登録された成句のそれぞれについて、含有文に対する各成句との比較結果を示す第2の類似度を構文解析に基づいて算出し、成句毎の第2類似度データ12gをメモリ12に記憶させる(ステップA26)。CPU11は、含有文に対する各成句との類似度(第2の類似度)を、例えば構文解析処理により得られた、成句候補を構成する単語数、含有文を構成する単語数、成句候補を構成する単語と含有文とが合致する単語数をもとに算出する。
【0056】
図8は、本実施形態における第2の類似度に相当する評価値(スコア)の算出方法を説明するための図である。ここでは、含有文に含まれる複数の単語と成句に含まれる複数の単語との一致数に基づいて評価値を算出する。
【0057】
図8には、成句候補リストに登録された複数の成句(成句候補)のそれぞれについて、成句候補を構成する単語数(単語数PhraseSize)、含有文を構成する単語数(単語数SentenceSize)、成句候補を構成する単語と含有文とが合致する単語数(単語数Count)を示している。
【0058】
CPU11は、以下の式をもとにして、評価値を算出する。なお、以下の式をもとに計算される評価値は、数値が小さいほど類似度が高いことを示す。
【0059】
単語数PhraseSize-単語数Count≠0の場合
評価値=(単語数SentenceSize)/(単語数PhraseSize) …(1)
単語数PhraseSize-単語数Count=0の場合
評価値=1/(単語数PhraseSize) …(2)
例えば、
図8に示す成句候補「a piece of cake」の(単語数PhraseSize)は「4」、
図7に示す入力エリアAR32に入力された含有文を構成する単語数(単語数SentenceSize)は「10」、(単語数Count)は「4」となる。この場合、(単語数PhraseSize)と(単語数Count)が等しいため、式(2)に基づいて、評価値=1/4=0.250と算出される。
【0060】
また、
図8に示す成句候補「take the cake」の(単語数PhraseSize)は「3」、含有文を構成する単語数(単語数SentenceSize)は「10」、(単語数Count)は「1」となる。この場合、(単語数PhraseSize)と(単語数Count)が等しくないため、式(1)に基づいて、評価値=10/3=3.333と算出される。
【0061】
なお、前述した説明では、前述した式(1)(2)をもとに評価値を算出しているが、評価値が同じ成句がある場合に優先度を変えるために、成句毎あるいは成句に含まれる単語に重み付けを予め設定しておき、第2の類似度を求めるようにしても良い。
【0062】
CPU11は、第1の類似度及び第2の類似度に基づいて、入力された検索語及び含有文をもとに検索された各語義、各用例、各成句の情報を表示するための表示制御を実行する(ステップA27)。
【0063】
CPU11は、例えば
図4に示すフローチャートによる表示制御処理を行う。
図9は、本実施形態における含有文付き単語検索の検索結果を表示する検索結果画面AR4の一例を示す図である。
図9に示すように、検索結果画面AR4には、成句検索により検索された複数の成句を表示する成句リストエリアAR41と、成句リストに表示された成句を用いた用例を表示する成句用例表示エリアAR42と、単語検索により検索された語義と用例を表示するための語義用例表示エリアAR43が設けられている。
【0064】
CPU11は、単語検索により検索された語義、用例を、第1の類似度が高いものを優先して、語義用例表示エリアAR43に表示させ(ステップB1)、成句検索により検索された成句と成句を用いた用例を、第2の類似度が高いものを優先して、成句リストエリアAR41と成句用例表示エリアAR42にそれぞれ表示させる(ステップB2)。
【0065】
図9に示す検索結果画面AR4では、最も優先度の高い語義「ケーキ」と例文1「I like the cake.」が語義用例表示エリアAR43の先頭に表示されている。その他の語義と例文は2番目以降に表示されるが、ここでは表示エリアを狭く設定しているために隠れており、スクロール操作に応じて表示されるようになっている。また、成句検索の結果として、成句候補リストに設定された複数の成句の順番を第2の類似度(評価値)に応じて並べ替えて成句リストエリアAR41内に一覧表示させている。
図9では、成句「a piece of cake」が先頭に表示され、その他の成句は2番目以降に表示される。表示エリアに表示しきれない成句についてはスクロール操作に応じて表示することができる。また、検索直後においては、成句リストエリアAR41の先頭に表示されている成句が自動的に選択状態となっており、選択状態となっている成句を含む用例が成句用例表示エリアAR42に表示されている。成句用例表示エリアAR42に表示する成句の用例は、成句リストエリアAR41で所望の成句をタッチ操作などで指定することで切り換えることができる。
【0066】
つまり、優先した表示を行う場合には、表示エリア内において優先して表示される成句の表示位置が決まっていて見やすく、最初の状態でスクロール操作などを行わなくても隠れることなく表示される先頭部分に表示したり、特別な追加操作を行わなくても表示エリアに自動的に表示されるようにしたりすることができる。
【0067】
なお、前述した説明では、第1の類似度及び第2の類似度が高いものを優先させて表示する表示制御をしているが、類似度が所定以上あるいは上位から所定数だけを選択的に表示する、あるいは類似度が高いものから順番に並べ替えた一覧によって表示するといった表示制御をしても良い。
【0068】
こうして、検索語と含有文とが入力される含有文付き検索処理では、成句辞書データから検索された成句候補と含有文との比較(第2の類似度の算出)に基づいて成句候補を表示することができ、また検索語をもとにした単語検索の結果とする語義を表示させることができる。ユーザが調べたい単語が通常の意味で用いられているか、成句として用いられているかをユーザが理解していなくても、普通に単語検索を行うだけで、検索語を含む含有文における検索語として適切な検索結果が表示されるため、単語または単語を含む成句の意味や用法を効果的に知ることができる。
【0069】
また、成句候補リストに設定された複数の成句候補に対しては、含有文との比較結果(第2の類似度)に基づいて優先順に並べ替えて表示されるので、検索語と含有文に応じた成句の意味や用法を効果的に知ることができる。
【0070】
また、検索結果画面AR4では、成句検索により検索された複数の成句と共に、単語検索により検索された語義と用例、成句リストに表示された成句を用いた用例が表示される。成句で用いられる検索語の意味は、単語検索により検索される語義とは異なる意味で使われていることがあるので、成句を用いた用例と意味を合わせて表示することで、その違いを容易に把握することができる。
【0071】
また、前述した説明では、成句辞書データに記憶されている複数の成句から検索語を含む成句を検索しているが、他の処理手順を用いた成句検索を実行することが可能である。例えば、成句辞書データに記憶されている複数の成句のそれぞれと含有文とを比較し、この比較結果が所定条件を満たす成句のうち、検索語を含む成句を選択して表示させたり、この比較結果に基づく優先順位で成句を表示する際に検索語を含まない成句を除外するように表示させたりする表示制御が可能である。
【0072】
なお、前述した表示制御処理では、第1の類似度を用いて語義及び用例について表示制御し、第2の類似度を用いて成句について表示制御しているが、第1の類似度と第2の類似度を統合して、語義、用例、成句に関する情報の表示制御するようにしていても良い。
【0073】
この場合、CPU11は、例えば
図10に示すフローチャートによる表示制御処理を行う。
【0074】
この場合、CPU11は、第1の類似度と第2の類似度とを正規化する(ステップC1)。正規化の方法としては、例えば第1の類似度が取り得る最大値と最小値と、第2の類似度が取り得る最大値と最小値とをそれぞれ対応づけて、第1の類似度と第2の類似度との対応関係を定義しておく。CPU11は、検索処理により求められた第1の類似度と第2の類似度を、それぞれ前述した対応関係をもとに変換して第3の類似度を求める。
【0075】
なお、類似の正規化の方法は、前述した方法に限るものではなく、異なる方法で求められた類似度を統合できれば他の方法を用いても良い。また、第1の類似度と第2の類似度の何れかに重み付けして、何れかの優先度の方が表示制御に大きく影響するように優先度を正規化するようにしても良い。
【0076】
CPU11は、こうして正規化した第3の類似度をもとにして、類似度が高い語義、用例、成句を優先して表示する表示制御を実行する(ステップC2)。
【0077】
こうして、第1の類似度と第2の類似度とを正規化し、正規化した類似度に基づいて、語義、用例、成句の表示制御をすることで、入力された検索語と含有文に応じた語義、用例、成句を統合して優先順を変更してユーザに提示することができる。
【0078】
次に、本実施形態における電子辞書10による辞書制御処理(メイン処理)の変形例について説明する。
図11は、本実施形態における電子辞書10による辞書制御処理(メイン処理)の変形例を示すフローチャートである。
【0079】
図3に示す辞書制御処理では、単語検索、成句検索、含有文付き単語検索を、それぞれ個別に実行しているが、
図11に示す辞書制御処理の変形例では、入力された検索語と含有文をもとに、単語検索と成句検索を実行して、検索処理において算出された類似度(第1の類似度、第2の類似度)に基づいて、検索結果(語義、用例、成句)についての表示の有無を制御する。
【0080】
CPU11は、前述した含有文付き単語検索と同様にして検索語と含有文を入力し、
図3に示すステップA23,A24と同様にして、検索語に対応する見出し語に対応する語義及び用例を含む情報を、語義検索インデックス12c1を用いて単語辞書データから検索し、含有文と単語検索によって検索された各語義の用例との比較結果を示す第1の類似度を構文解析に基づいて算出する(ステップD1,D2)
ここで、CPU11は、第1の類似度が所定以上の語義、用例がある場合には(ステップD3、Yes)、該当する語義、用例をタッチパネル式表示部17において表示させる(ステップD4)。
【0081】
一方、第1の類似度が所定以上の語義、用例がない場合には(ステップD3、No)、CPU11は、
図3に示すステップA25と同様にして、入力された検索語に対応する成句を、語義検索インデックス12c1を用いて成句辞書データから検索し、含有文に対する各成句との比較結果を示す第2の類似度を構文解析に基づいて算出する(ステップD6)。
【0082】
ここで、CPU11は、第2の類似度が所定以上の成句がある場合には(ステップD7、Yes)、該当する成句をタッチパネル式表示部17において表示させる(ステップD8)。
【0083】
CPU11は、第2の類似度が所定以上の成句がない場合には(ステップD7、No)、単語検索、成句検索によって検索された全ての語義、用例、成句をタッチパネル式表示部17において表示させる(ステップD9)。
【0084】
こうして、辞書制御処理の変形例では、含有文付き単語検索において、検索処理において算出された類似度(第1の類似度、第2の類似度)に基づいて、検索結果(語義、用例、成句)についての表示の有無を制御することができる。
【0085】
このようにして、本実施形態における電子辞書10では、ユーザが調べたい単語が通常の意味で用いられているか、成句として用いられているかをユーザが理解していなくても、普通に単語検索を行うだけで、単語または単語を含む成句の意味や用法を効果的に知ることができる。
【0086】
なお、前述した説明では、ユーザにより入力された検索語、成句、含有文などをもとに電子辞書10において検索処理を実行しているが、前述した電子辞書10により実行する処理を、ネットワークNを介して接続されたサーバ20(クラウド)において実行させるようにしても良い。電子辞書10(あるいはパーソナルコンピュータなど)から入力された検索語、成句、含有文などをサーバ20に送信し、サーバ20による検索処理結果を受信して、電子辞書10(あるいはパーソナルコンピュータの画面に表示させる。
【0087】
また、前述した実施形態では、英語系の辞書を例にして説明しているが、他の言語系の辞書を対象として実施することが可能である。
【0088】
また、実施形態において記載した手法、すなわちフローチャートに示す処理等の各手法は、コンピュータに実行させることができるプログラムとして、メモリカード(ROMカード、RAMカード等)、磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD-ROM、DVD等)、半導体メモリ等の記録媒体に格納して配布することができる。そして、コンピュータは、記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されることにより、実施形態において説明した機能と同様の処理を実現することができる。
【0089】
また、各手法を実現するためのプログラムのデータは、プログラムコードの形態としてネットワーク(インターネット)上を伝送させることができ、このネットワーク(インターネット)に接続されたコンピュータ(サーバ装置等)からプログラムデータを取り込み、前述した実施形態と同様の機能を実現することもできる。
【0090】
なお、本願発明は、実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。さらに、実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件から幾つかの構成要件が削除されたり、幾つかの構成要件が組み合わされても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除されたり組み合わされた構成が発明として抽出され得るものである。
【0091】
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
【0092】
[1]複数の単語からなる成句と、前記成句の意味とを対応付けて記憶している成句辞書データと、
検索語と、前記検索語を含む文である含有文とが指定された場合に、前記検索語および前記含有文に基づいて、前記成句辞書データに記憶されている前記検索語を含む成句の検索および表示を制御する制御部と
を有する検索装置。
【0093】
[2]前記制御部は、
検索語と、前記検索語を含む文である含有文とが指定された場合に、前記検索語を含む成句を前記成句辞書データから検索し、
検索された成句と前記含有文との比較結果に基づいて、前記検索語を含む成句の表示を制御する請求項1記載の検索装置。
【0094】
[3]単語と、前記単語の語義とを対応付けて記憶している単語辞書データを有し、
前記制御部は、
検索語と、前記検索語を含む文である含有文とが指定された場合に、前記検索語に対応する語義を前記単語辞書データから検索するとともに、前記検索語を含む成句を前記成句辞書データから検索し、
前記検索された語義を表示するとともに、前記比較結果に基づいて前記検索語を含む成句の表示を制御する[2]記載の検索装置。
【0095】
[4]前記制御部は、
前記成句辞書データから複数の成句が検索された場合に、検索された各成句と前記含有文とを比較し、
前記比較結果に基づいて、前記検索語を含む複数の成句の表示を制御する[2]または[3]記載の検索装置。
【0096】
[5]前記制御部は、
前記比較結果に基づいて、前記検索語を含む複数の成句の表示の優先順位を制御する[4]記載の検索装置。
【0097】
[6]前記制御部は、
前記比較結果に基づいて、前記検索語を含む成句の表示の有無を制御する[4]記載の検索装置。
【0098】
[7]前記成句辞書データは、前記成句を構成する第1単語の意味が、前記単語辞書データに記憶されている前記第1単語の語義とは異なる意味で使われている成句および前記成句の意味を記憶し、
前記制御部は、
前記単語辞書データから検索された単語の語義と、前記成句辞書データから検索された成句の意味とを表示する[3]記載の検索装置。
【0099】
[8]前記単語辞書データは、単語と、前記単語に対応する複数の語義と、前記複数の語義それぞれに対応する用例とを対応付けて記憶し、
前記制御部は、
前記含有文と、前記用例および前記成句とを比較し、
前記比較結果に基づいて、前記検索語に対応する語義および成句の意味の表示を制御する[3]記載の検索装置。
【0100】
[9]前記制御部は、
前記含有文と前記複数の用例それぞれとの比較結果と、前記含有文と前記複数の成句それぞれとの比較結果とに基づき、前記複数の語義および前記複数の成句の意味について、表示の有無または表示の優先順位を制御する請求項8記載の検索装置。
【0101】
[10]前記制御部は、
前記含有文に含まれる複数の単語と、前記成句に含まれる複数の単語とを比較して、一致する単語の数を特定し、
検索された複数の成句のうち、前記含有文に対して一致する単語の数が多い成句を優先して表示させる[4]記載の検索装置。
【0102】
[11]前記制御部は、
前記含有文と前記用例とを比較する第1の比較方法と、前記含有文と前記成句とを比較する前記第1の比較方法とは異なる第2の比較方法を用いる[8]記載の検索装置。
【0103】
[12]含有文の構文解析結果に基づいて、検索語の基本形、品詞、動詞タイプ、文型タイプ、検索語の係り受け先の前置詞、検索語の係り受け先の固有表現情報、構文特徴の何れかを含む、前記検索語に対する検索キーを生成し、
前記生成した検索キーを用いて、前記語義の検索および前記成句の検索を行う[8]記載の検索装置。
【0104】
[13]検索語と、前記検索語を含む文である含有文とが指定された場合に、前記検索語を含む成句を、複数の単語からなる成句と前記成句の意味とを対応付けて記憶している成句辞書データから検索し、
検索された成句と前記含有文との比較結果に基づいて、前記検索語を含む成句の表示を制御する検索方法。
【0105】
[14]コンピュータに、
検索語と、前記検索語を含む文である含有文とが指定された場合に、前記検索語を含む成句を、複数の単語からなる成句と前記成句の意味とを対応付けて記憶している成句辞書データから検索し、
検索された成句と前記含有文との比較結果に基づいて、前記検索語を含む成句の表示を制御するように機能させるための検索プログラム。
【符号の説明】
【0106】
10 …電子辞書
11 …CPU
12 …メモリ
12a…辞書制御処理プログラム
12b…構文解析プログラム
12c…辞書データ
12c1…語義検索インデックス
12c2…成句検索インデックス
12d…検索キーデータ
12e…第1類似度データ
12f…成句候補リストデータ
12g…第2類似度データ
12h…検索語データ
12k…含有文データ
13 …記録媒体
14 …記録媒体読取部
15 …通信部
16 …キー入力部
17 …タッチパネル式表示部
20 …サーバ