IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社インタラクティブソリューションズの特許一覧

<>
  • 特許-検索用資料情報記憶装置 図1
  • 特許-検索用資料情報記憶装置 図2
  • 特許-検索用資料情報記憶装置 図3
  • 特許-検索用資料情報記憶装置 図4
  • 特許-検索用資料情報記憶装置 図5
  • 特許-検索用資料情報記憶装置 図6
  • 特許-検索用資料情報記憶装置 図7
  • 特許-検索用資料情報記憶装置 図8
  • 特許-検索用資料情報記憶装置 図9
  • 特許-検索用資料情報記憶装置 図10
  • 特許-検索用資料情報記憶装置 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-13
(45)【発行日】2023-07-24
(54)【発明の名称】検索用資料情報記憶装置
(51)【国際特許分類】
   G06F 16/38 20190101AFI20230714BHJP
   G06F 16/907 20190101ALI20230714BHJP
【FI】
G06F16/38
G06F16/907
【請求項の数】 1
(21)【出願番号】P 2021009037
(22)【出願日】2021-01-22
(62)【分割の表示】P 2020070734の分割
【原出願日】2018-05-07
(65)【公開番号】P2021073590
(43)【公開日】2021-05-13
【審査請求日】2021-01-22
【審判番号】
【審判請求日】2022-11-09
(31)【優先権主張番号】P 2017109339
(32)【優先日】2017-06-01
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】511113970
【氏名又は名称】株式会社インタラクティブソリューションズ
(74)【代理人】
【識別番号】100116850
【弁理士】
【氏名又は名称】廣瀬 隆行
(72)【発明者】
【氏名】関根 潔
【合議体】
【審判長】林 毅
【審判官】脇岡 剛
【審判官】稲垣 良一
(56)【参考文献】
【文献】特開2011-242844号公報(JP,A)
【文献】特開平8-314974号公報(JP,A)
【文献】特開2008-140377号公報(JP,A)
【文献】欧州特許出願公開第2927824号明細書(EP,A1)
【文献】特開2016-21178号公報(JP,A)
【文献】特開平3-122768号(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
コンピュータを用いた資料検索情報記憶方法であって,
前記コンピュータが,
資料のある頁に含まれる用語である資料中用語を抽出する用語抽出工程と,
資料中用語と関連するキーワードとなる用語をそれぞれのキーワードのスコアであるキーワードスコアと関連付けて記憶するキーワード記憶手段(5)から,前記用語抽出工程で抽出した前記資料中用語と関連する前記キーワードを前記キーワードスコアの高い順に複数抽出するキーワード抽出工程と,
前記キーワードと関連するトピックス語をそれぞれのトピックス語のスコアであるトピックス語スコアと関連付けて記憶するトピックス語記憶手段(9)から,前記キーワード抽出工程で抽出した複数のキーワードのうち前記キーワードスコアの高いものを用いて,当該複数のキーワードのうち前記キーワードスコアの高いものと関連するトピックス語を前記トピックス語スコアの高い順に抽出するトピックス語抽出工程と,
前記資料のある頁の検索用語の候補を抽出する,検索用語候補抽出工程と,
前記検索用語候補抽出工程で抽出した検索用語の候補を,表示部(15)に表示させる検索用語候補表示工程と,
前記表示部(15)に表示された検索用語の候補のうち検索用語である旨の入力を受け取る,検索用語入力工程と,
前記検索用語入力工程で入力された検索用語と,前記資料のある頁に関する情報とを関連付けて記憶する資料検索情報記憶工程と,
前記トピックス語と関連するカテゴリー語をそれぞれのカテゴリー語のスコアであるカテゴリー語スコアと関連付けて記憶するカテゴリー語記憶手段から,前記トピックス語抽出工程で抽出したトピックス語のうち前記トピックス語スコアの高いものを用いて,前記前記トピックス語スコアの高いトピックス語と関連するカテゴリー語を前記カテゴリー語スコアの高い順に抽出するカテゴリー語抽出工程を含み,
前記検索用語候補抽出工程は,前記トピックス語抽出工程で抽出したトピックス語,キーワード抽出工程で抽出した複数のキーワード及び前記カテゴリー語抽出工程で抽出したカテゴリー語から,前記資料のある頁の検索用語の候補を前記キーワードスコア,前記トピックス語スコア及び前記カテゴリー語スコアを用いて得られた集計後のスコアの高い順に前記資料のある頁の検索用語の候補を抽出する工程である
方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は,検索用資料情報記憶装置に関する。より詳しく説明すると,本発明は,プレゼンテーション資料の各頁を効果的に検索できるように,各頁と関連する検索用語を効果的に提案し,その上で各頁に関する情報と,各頁に関する検索用語とを関連付けて記憶させることができる,検索用資料情報記憶装置に関する。
【背景技術】
【0002】
特開2019-16355号公報には,検索情報管理装置,検索情報管理方法及び検索情報管理プログラムが開示されている。このように,各種資料には,検索を行うための検索用語が紐づけられていることが多い。ユーザは,検索用語を用いることで,適切な資料を探すことができる。一方,各資料に付される検索用語は,必ずしも検索にふさわしいものではないので,検索にふさわしい検索用語を提案し,ユーザの意向を踏まえることができるようにすることが望ましい。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-16355号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は,資料の各頁についての検索用語の候補を適切に抽出又は提供できるシステムを提供することを目的とする。本発明は,資料の各頁を効果的に検索できるように,その上で各頁に関する情報と,各頁に関する検索用語とを関連付けて記憶させることができる,装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明は,基本的には,資料の各ページに含まれる用語をキーワードとして抽出し,キーワードと関連するトピック語を抽出したうえで,評価の高いトピック語を表示することで,資料の各ページにふさわしい検索用語の候補を提案できるという知見に基づく。
【0006】
上記の発明のひとつは,
コンピュータを用いた資料検索情報記憶方法であって,
コンピュータが,資料のある頁に含まれる用語である資料中用語を抽出する用語抽出工程と,
資料中用語と関連するキーワードとなる用語をそれぞれのキーワードのスコアであるキーワードスコアと関連付けて記憶するキーワード記憶手段から,用語抽出工程で抽出した資料中用語と関連するキーワードをキーワードスコアの高い順に複数抽出するキーワード抽出工程と,
キーワードと関連するトピックス語をそれぞれのトピックス語のスコアであるトピックス語スコアと関連付けて記憶するトピックス語記憶手段から,キーワード抽出工程で抽出した複数のキーワードのうちキーワードスコアの高いものを用いて,当該複数のキーワードのうちキーワードスコアの高いものと関連するトピックス語をトピックス語スコアの高い順に抽出するトピックス語抽出工程と,
トピックス語抽出工程で抽出したトピックス語及びキーワード抽出工程で抽出した複数のキーワードから,資料のある頁の検索用語の候補をキーワードスコア及びトピックススコアを用いて得られた集計後のスコアの高い順に抽出する,検索用語候補抽出工程と,
検索用語候補抽出工程で抽出された検索用語の候補を記憶する検索用語候補記憶工程と,を含む検索用語候補記憶方法に関する。
この方法の好ましい態様は,
トピックス語と関連するカテゴリー語を記憶するカテゴリー語記憶手段から,トピックス語抽出工程で抽出したトピックス語を用いて,トピックス語と関連するカテゴリー語を抽出するカテゴリー語抽出工程をさらに有し,
検索用語候補抽出工程は,さらに,カテゴリー語抽出工程において抽出したカテゴリー語を検索用語の候補の一つとして抽出する,
方法に関する。
【0007】
上記の発明のひとつは,資料のある頁に含まれる用語である資料中用語を抽出する用語抽出手段と,
資料中用語と関連するキーワードとなる用語をそれぞれのキーワードのスコアであるキーワードスコアと関連付けて記憶するキーワード記憶手段と,
用語抽出手段が抽出した資料中用語と関連するキーワードを,キーワードスコアの高い順に,キーワード記憶手段から複数抽出するキーワード抽出手段と,
キーワードと関連するトピックス語をそれぞれのトピックス語のスコアであるトピックス語スコアと関連付けて記憶するトピックス語記憶手段と,
キーワード抽出手段が抽出した複数のキーワードのうちキーワードスコアの高いものを用いて,当該複数のキーワードのうちキーワードスコアの高いものと関連するトピックス語を,トピックス語スコアの高い順にトピックス語記憶手段から抽出するトピックス語抽出手段と,
トピックス語抽出手段が抽出したトピックス語及びキーワード抽出手段が抽出した複数のキーワードから,資料のある頁の検索用語の候補をキーワードスコア及びトピックススコアを用いて得られた集計後のスコアの高い順に抽出する,検索用語候補抽出手段と,
検索用語候補抽出手段が抽出した検索用語候補を記憶する検索用語候補記憶手段と,を含む検索用語候補記憶装置に関する。
この装置の好ましい態様は,トピックス語と関連するカテゴリー語を記憶するカテゴリー語記憶手段と,
トピックス語抽出手段が抽出したトピックス語を用いて,カテゴリー語記憶手段から,トピックス語と関連するカテゴリー語を抽出するカテゴリー語抽出手段と,をさらに有し,
検索用語候補抽出手段は,さらに,カテゴリー語抽出手段が抽出したカテゴリー語を検索用語の候補の一つとして抽出する,装置に関する。
【0008】
上記の発明のひとつは,
コンピュータを,
資料のある頁に含まれる用語である資料中用語を抽出する用語抽出手段と,
資料中用語と関連するキーワードとなる用語をそれぞれのキーワードのスコアであるキーワードスコアと関連付けて記憶するキーワード記憶手段と,
用語抽出手段が抽出した資料中用語と関連するキーワードを,キーワードスコアの高い順に,キーワード記憶手段から複数抽出するキーワード抽出手段と,
キーワードと関連するトピックス語をそれぞれのトピックス語のスコアであるトピックス語スコアと関連付けて記憶するトピックス語記憶手段と,
キーワード抽出手段が抽出した複数のキーワードのうちキーワードスコアの高いものを用いて,当該複数のキーワードのうちキーワードスコアの高いものと関連するトピックス語を,トピックス語スコアの高い順にトピックス語記憶手段から抽出するトピックス語抽出手段と,
トピックス語抽出手段が抽出したトピックス語及びキーワード抽出手段が抽出した複数のキーワードから,資料のある頁の検索用語の候補をキーワードスコア及びトピックススコアを用いて得られた集計後のスコアの高い順に抽出する,検索用語候補抽出手段と,
検索用語候補抽出手段が抽出した検索用語候補を記憶する検索用語候補記憶手段と,を含む検索用語候補記憶装置として機能させるためのプログラムに関する。
このプログラムの好ましい態様は,
コンピュータを,さらに
トピックス語と関連するカテゴリー語を記憶するカテゴリー語記憶手段と,
トピックス語抽出手段が抽出したトピックス語を用いて,カテゴリー語記憶手段から,トピックス語と関連するカテゴリー語を抽出するカテゴリー語抽出手段と,をさらに有し,
検索用語候補抽出手段は,さらに,カテゴリー語抽出手段が抽出したカテゴリー語を検索用語の候補の一つとして抽出する,
装置として機能させるためのプログラムに関する。
【0009】
上記の発明のひとつは,上記したいずれかのプログラムを記録したコンピュータ読み取り可能な記録媒体に関する。
【0010】
この明細書は,検索用資料情報記憶装置をも開示する。
この装置は,コンピュータによる処理装置であって,用語抽出手段3と,キーワード記憶手段5と,キーワード抽出手段7と,トピックス語記憶手段9と,トピックス語抽出手段11と,検索用語候補抽出手段13と,検索用語候補表示手段17と,検索用語入力手段19と,資料検索情報記憶手段21と,を含む。各手段は,コンピュータによる手段であり,ハードウェアとソフトウェアの協働により達成される。
【0011】
用語抽出手段3は,資料のある頁に含まれる用語である資料中用語を抽出するための手段である。
キーワード記憶手段5は,資料中用語と関連するキーワードとなる用語を記憶するための手段である。
キーワード抽出手段7は,用語抽出手段3が抽出した資料中用語を用いて,キーワード記憶手段5から,資料中用語と関連するキーワードとなるものを複数抽出するための手段である。
トピックス語記憶手段9は,キーワードと関連するトピックス語を記憶するための手段である。
トピックス語抽出手段11は,キーワード抽出手段7が抽出した複数のキーワードを用いて,トピックス語記憶手段9から,キーワードと関連するトピックス語を抽出するための手段である。
検索用語候補抽出手段13は,トピックス語抽出手段11が抽出したトピックス語及びキーワード抽出手段7が抽出した複数のキーワードから,資料のある頁の検索用語の候補を抽出するための手段である。
検索用語候補表示手段17は,検索用語候補抽出手段13が抽出した検索用語の候補を,表示部15に表示させるための手段である。
検索用語入力手段19は,表示部15に表示された検索用語の候補のうち検索用語である旨の入力を受け取るための手段である。
資料検索情報記憶手段21は,検索用語入力手段19により入力された検索用語と,資料のある頁に関する情報とを関連付けて記憶するための手段である。
【0012】
上記の検索用資料情報記憶装置は,
さらに,カテゴリー語記憶手段25と,カテゴリー語抽出手段27とを有してもよい。
カテゴリー語記憶手段25は,トピックス語と関連するカテゴリー語を記憶するための手段である。
カテゴリー語抽出手段27は,トピックス語抽出手段11が抽出したトピックス語を用いて,カテゴリー語記憶手段25から,トピックス語と関連するカテゴリー語を抽出するための手段である。
そして,この検索用資料情報記憶装置の検索用語候補表示手段17は,さらに,カテゴリー語抽出手段27が抽出したカテゴリー語を検索用語の候補の一つとして抽出する。
【0013】
上記の検索用資料情報記憶装置は,
キーワード記憶手段5が,複数のキーワードと,それぞれのキーワードのスコアとを関連付けて記憶し,
キーワード抽出手段7が,複数のキーワードとともに,それぞれのキーワードのスコアを抽出するものであってもよい。
【0014】
上記の検索用資料情報記憶装置は,
トピックス語記憶手段9が,トピックス語と,それぞれのトピックス語のスコアとを関連付けて記憶し,
トピックス語抽出手段11が,キーワード抽出手段7が抽出した複数のキーワードのうちスコアが高い所定個(1個又は2個以上)をトピックス語有力候補とし,トピックス語記憶手段9から所定個(1個又は2個以上)のトピックス語有力候補と関連するトピックス語を抽出し,
検索用語候補抽出手段13が,
キーワード抽出手段7が抽出した複数のキーワードのうちスコアが高い所定個(1個又は2個以上)を検索用語の候補として抽出するとともに,キーワードのスコア及びトピックス語のスコアを用いて,トピックス語抽出手段11が抽出したトピックス語から所定個(1個又は2個以上)を検索用語の候補を抽出するものであってもよい。
【0015】
上記の検索用資料情報記憶装置は,
検索用語候補表示手段17が,
表示部15に,検索用語の候補として抽出された所定個(1個又は2個以上)のキーワード及び検索用語の候補として抽出された所定個(1個又は2個以上)のトピックス語を,検索用語の候補として表示するとともに,
キーワード抽出手段7が抽出した複数のキーワードのうち検索用語の候補として抽出されなかったもの,及びトピックス語抽出手段11が抽出したトピックス語のうち検索用語の候補として抽出されなかったものを検索用語の予備候補として表示し,
検索用語入力手段19が,
検索用語の予備候補について,検索用語とする旨の入力を受け取った場合は,検索用語の予備候補を検索用語とし,
検索用語の候補として表示されたものについては,検索用語としない旨の入力を受け取ったものを除いて,検索用語とするものであってもよい。
【0016】
この明細書は,
コンピュータを
資料のある頁に含まれる用語である資料中用語を抽出する用語抽出手段3,
資料中用語と関連するキーワードとなる用語を記憶するキーワード記憶手段5,
用語抽出手段3が抽出した資料中用語を用いて,キーワード記憶手段5から,資料中用語と関連するキーワードとなるものを複数抽出するキーワード抽出手段7,
キーワードと関連するトピックス語を記憶するトピックス語記憶手段9,
キーワード抽出手段7が抽出した複数のキーワードを用いて,トピックス語記憶手段9から,キーワードと関連するトピックス語を抽出するトピックス語抽出手段11,
トピックス語抽出手段11が抽出したトピックス語及びキーワード抽出手段7が抽出した複数のキーワードから,資料のある頁の検索用語の候補を抽出する,検索用語候補抽出手段13,
検索用語候補抽出手段13が抽出した検索用語の候補を,表示部15に表示させる検索用語候補表示手段17,
表示部15に表示された検索用語の候補のうち検索用語である旨の入力を受け取る,検索用語入力手段19,及び
検索用語入力手段19により入力された検索用語と,資料のある頁に関する情報とを関連付けて記憶する資料検索情報記憶手段21,
として機能させるための検索用資料情報記憶用プログラムやそのプログラムを記憶したコンピュータ読み取り可能な記録媒体をも開示する。
【発明の効果】
【0017】
本発明は,資料の各ページについての検索用語の候補を適切に提案できるシステムを提供できる。本発明は,資料の各頁を効果的に検索できるように,その上で各頁に関する情報と,各頁に関する検索用語とを関連付けて記憶させることができる,装置を提供できる。
【図面の簡単な説明】
【0018】
図1図1は,本発明の検索用資料情報記憶装置を説明するためのブロック図である。
図2図2は,コンピュータの基本構成を示すブロック図である。
図3図3は,本発明のシステム例を示す概念図である。
図4図4は,プレゼンテーション資料のある頁の例である。
図5図5は,キーワード記憶手段の記憶例を示す概念図である。
図6図6は,トピックス語記憶手段の記憶例を示す概念図である。
図7図7は,カテゴリー語記憶手段の記憶例を示す概念図である。
図8図8は,抽出された(カテゴリー語),トピックス語,キーワード,及び資料中用語を示す概念図である。
図9図9は,表示画面の例である。
図10図10は,本発明の検索用資料情報記憶装置の使用例を説明するためのフローチャートである。
図11図11は,本発明の検索用資料情報記憶装置の使用例を説明するための概念図である。
【発明を実施するための形態】
【0019】
以下,図面を用いて本発明を実施するための形態について説明する。本発明は,以下に説明する形態に限定されるものではなく,以下の形態から当業者が自明な範囲で適宜修正したものも含む。
【0020】
図1は,本発明の検索用資料情報記憶装置を説明するためのブロック図である。この装置は,コンピュータによる処理装置である。コンピュータは,携帯端末,デスクトップ型パーソナルコンピュータ,及びサーバのいずれか又は2つ以上の組み合わせであってもよい。これらは通常インターネット(イントラネット)等により情報の授受を行うことができるように接続されている。一部の機能をいずれかのコンピュータにもたせるなど,複数のコンピュータを用いて,機能を分担してもよい。
【0021】
図2は,コンピュータの基本構成を示すブロック図である。この図に示されるように,コンピュータは,入力部31,出力部33,制御部35,演算部37及び記憶部39を有しており,各要素は,バス41などによって接続され,情報の授受を行うことができるようにされている。例えば,記憶部には,制御プログラムが記憶されていてもよいし,各種情報が記憶されていてもよい。入力部から所定の情報が入力された場合,制御部は,記憶部に記憶される制御プログラムを読み出す。そして,制御部は,適宜記憶部に記憶された情報を読み出し,演算部へ伝える。また,制御部は,適宜入力された情報を演算部へ伝える。演算部は,受け取った各種情報を用いて演算処理を行い,記憶部に記憶する。制御部は,記憶部に記憶された演算結果を読み出して,出力部から出力する。このようにして,各種処理が実行される。この各種処理を実行するものが,各手段である。
【0022】
図3は,本発明のシステム例を示す概念図である。図3に示されるように,本発明のシステム(本発明の装置を含むシステム)は,インターネット又はイントラネット43と接続された携帯端末45と,インターネット又はイントラネット43に接続されたサーバ47とを含むものであってもよい。もちろん,単体のコンピュータや携帯端末が,本発明の装置として機能してもよいし,複数のサーバが存在してもよい。
【0023】
検索用資料情報記憶装置1は,ユーザが欲しい情報を検索しやすいように,プレゼンテーション資料の各頁を読み出すための情報(例えば,プレゼンテーション資料の識別番号と頁番号)と,その頁に関連する1又は複数の検索用語とが関連付けて記憶する。検索用資料情報記憶装置1は,いずれかの端末装置,コンピュータ(又はサーバ)の記憶部(記憶装置)を含んでもよい。また,検索用資料情報記憶装置は,データベースとデータベース管理ソフトを含んでもよい。検索用資料情報記憶装置において,検索用語ごとに,プレゼンテーション資料の頁のランク付けやスコアリングがなされていてもよい。たとえば,複数の頁について,糖尿病という検索用語と関連付けて記憶されている場合を考える。この場合,糖尿病という検索用語について,最もランクの高い頁,次にランクの高い頁,糖尿病という検索用語について,最もスコアの高い頁,次にスコアの高い頁といった情報も,記憶部に記憶されていてもよい。
【0024】
図1に示されるように,検索用資料情報記憶装置1は,用語抽出手段3と,キーワード記憶手段5と,キーワード抽出手段7と,トピックス語記憶手段9と,トピックス語抽出手段11と,検索用語候補抽出手段13と,検索用語候補表示手段17と,検索用語入力手段19と,資料検索情報記憶手段21とを含む。各手段は,コンピュータによる手段であり,ハードウェアとソフトウェアの協働により,各処理を達成する。
【0025】
用語抽出手段3は,資料のある頁に含まれる用語である資料中用語を抽出するための手段である。資料の例は,いわゆるプレゼンテーション資料である。プレゼンテーション資料のフォーマットは特に限定されない。プレゼンテーション用ソフトウェアの例は,マイクロソフト(登録商標)パワーポイント(登録商標),キングソフト(登録商標)キングソフトオフィス(登録商標),アパッチ(登録商標)オープンオフィスインプレス(登録商標),キーノート(登録商標),ロータス・フリーランス(登録商標),イラストレータ(登録商標),PDF(登録商標)及びプレツィ(登録商標)である。資料の例は,例えば,これらのプレゼンテーション用ソフトウェアのいずれかで作成された資料である。プレゼンテーション用ソフトウェアは,例えば,画面などの表示部に,頁ごとにその内容を表示することができるソフトウェアである。
【0026】
図4は,プレゼンテーション資料のある頁の例である。図4に示されるように,プレゼンテーション資料には,作成者が入力した複数のテキストが含まれている。ユーザは,複数の文字を視認できる。一方,コンピュータは,ユーザが入力したテキストやテキストに関する入力情報(文字の大きさ,文字の色,アニメーションの有無)といった情報をテキストと共に記憶している。用語抽出手段3の好ましい例は,テキストを抽出する際に,テキストに関する入力情報(文字の大きさ,文字の色,アニメーションの有無)に応じて,テキストの評価(スコア)を付与するものである。例えば,文字が大きいほど,プレゼンテーション資料の内容を示すものであることが多いため,高いスコアが付与される。また,例えば,赤色系の文字の色の場合やアニメーションが付されているテキストも,プレゼンテーション資料の内容を示すものであることが多いため,高いスコアが付与される。用語抽出手段3は,テキストと関連した効果についての評価(スコア)を記憶しておき,用語を抽出する際に,テキスト関連スコアとして読み出して,後述するスコアを算出する際に,他のスコアと加算又は乗算し,評価を行えばよい。
【0027】
一方,用語抽出手段3自体は,公知である。プレゼンテーション資料は,複数のテキスト情報を有している。そして,プレゼンテーション資料は,例えば,サーバ(又はコンピュータ内の)記憶部に記憶されている。用語抽出手段3は,記憶されているプレゼンテーション資料の各頁を読み出し,各頁に含まれるテキストを読み出す。そして,用語抽出手段3は,読み出したテキストを品詞解析する。この際,記憶部には,例えば,品詞データベースが存在し,各種用語とその品詞が記憶されている。この際,記憶部には,用途に応じて,各種用語の検索用語としてのスコアもともに記憶されていてもよい。例えば,検索用資料情報記憶装置が製薬メーカ,MR(医薬情報担当者),MS(医薬品卸)向けであれば,各種疾患名が一般的な名詞に比べて高いスコアが割り振られていてもよい。また,各種薬剤名や有効成分が,疾患名より低いものの,一般的な名詞に比べて高いスコアが割り振られていてもよい。そして,用語抽出手段3は,テキストに含まれている用語(特に名詞)を抽出し,その頻度や,記憶部に記憶されている用語のスコアを用いて,1又は複数の資料中用語を抽出すればよい。例えば,用語抽出手段3が,ある頁から,用語A,用語B及び用語Cを抽出し,用語Cが2回登場し,用語A及びBは1回登場し,記憶部に記憶された用語A,B及びCのそのスコアがそれぞれ5,50,及び40であった場合,用語A,B及びCのスコアをそれぞれ5,50及び80とすればよい。例えば,資料中用語の抽出数が2と設定されていた場合,用語抽出手段3は,用語C及びBを資料中用語として抽出すればよい。そして,抽出された資料中用語(用語C及びB)は,その頁を読み出すことができるページに関する情報と関連付けて,記憶部に記憶される。すると,その頁と共に,用語C及びBを読み出すことができることとなる。用語抽出手段3の別の例は,プレゼンテーションのある頁のうち最も大きなフォントが用いられている部分を識別するものである。そして,最も大きなフォントが用いられている部分に含まれる資料中用語に対し,所定の係数を付与するものである。係数(第1の係数:a)は記憶部に記憶されていればよい。用語抽出手段3は,最も大きなフォントが用いられている部分に含まれる資料中用語とともに,第1の係数を記憶部に記憶する。また,用語抽出手段3は,資料中用語と共に,フォントの大きさに応じた係数(第2の係数:a)も記憶部に記憶してもよい。
【0028】
キーワード記憶手段5は,資料中用語と関連するキーワードとなる用語を記憶するための手段である。キーワード記憶手段5は,記憶部と,記憶部から情報を読み出すための要素(例えば制御プログラム)により実現されればよい。キーワードとは,各頁を検索する際に,複数の資料中用語ばかりではなく,それらに関連する用語を検索用語とすることで,各頁を検索しやすくするための用語である。これにより各頁と関連して記憶される検索用語が少なくなり,迅速に検索できるようになる。もっとも資料中用語がそのままキーワードであることもある。キーワードは,資料中用語に関する第1の変換語といえる。キーワードは,複数種類の資料中用語から,検索に用いることがふさわしいある用語を選んだものであってもよい。
【0029】
資料中用語は,プレゼンテーションに含まれている用語である。このため,資料中用語は,必ずしも,検索用語と一致しない又は検索用語としてはふさわしくない場合もある。例えば,ob遺伝子やob/obマウスという用語が,プレゼンテーションに含まれていたとする。これは,肥満遺伝子(及び肥満症,肥満症実験動物)と関連している。このため,キーワード記憶手段5は,資料中用語であるob遺伝子やob/obマウスと関連して,そのキーワードである肥満遺伝子(及び肥満症,肥満症実験動物)を記憶する。
【0030】
キーワード記憶手段5が存在するため,各頁と関連付けて記憶される検索用語が統一した用語となる。このため,検索を行った際に,迅速に関連ページを読み出すことができることとなる。
【0031】
図5は,キーワード記憶手段の記憶例を示す概念図である。図5に示されるように,キーワード記憶手段は,複数の資料中用語のそれぞれに対し,1又は複数のキーワードを関連付けて記憶するとともに,それぞれのキーワードについてスコア(このスコアをbとする)を関連付けて記憶している。このスコアは,検索に用いられる用語としてふさわしいものほど高くなるようにあらかじめ入力されていることが好ましい。
【0032】
キーワード抽出手段7は,用語抽出手段3が抽出した資料中用語を用いて,キーワード記憶手段5から,資料中用語と関連するキーワードとなるものを複数抽出するための手段である。キーワード記憶手段5は,資料中用語と関連してキーワードとなる用語を記憶している。このため,キーワード抽出手段7は,資料中用語を用いて,キーワード記憶手段5から,資料中用語と関連するキーワードとなる用語を読み出すことができる。ある頁から,通常,資料中用語が複数抽出される。このため,ある頁に関しキーワードとなる用語は,通常複数抽出される。また,資料中用語と関連するキーワードとなる用語も通常複数である(それぞれスコアが割り振られていてもよい。)。このため,ある頁に関しキーワードとなる用語は,通常複数抽出される。なお,資料中用語が,キーワードとなる用語の場合も当然存在する。つまり,資料中用語がそのままキーワードとして抽出されてもよい。キーワード抽出手段7は,記憶部に記憶される資料中用語の係数及びキーワードのスコアを用いて,それぞれのキーワードのスコアを評価してもよい。キーワードのスコアの例は,a×a×bである。スコアを算出するためには,記憶部に上記の演算を行うための制御プログラムが記憶されているので,制御部は,その制御プログラムを読み出すとともに,記憶部に記憶された各係数及びスコアを読み出して,演算部にa×a×bを求める演算を行わせ,記憶部に演算結果を記憶させればよい。また,資料中用語の登場頻度(この係数をa21とする)や,複数種類の資料中用語からある特定のキーワードが抽出された場合の加算係数(この係数をa22とする)を記憶部に記憶させておき,a×a×a21×a22×bを求めることで,キーワードのスコアを求め,記憶部に記憶させてもよい。その他,ある頁に含まれる強調色には強い係数を与えるようにしてもよい。この場合,頁から用語の色を分析する手段と,色ごとの係数を記憶する記憶部とを有しており,分析した用語の色を用いて,記憶部からその色に関する係数を読み出せばよい。なお,キーワードのみならずトピックス語及びカテゴリー語も基本的には同様に,様々な要素について係数やスコアを記憶させておき,それを読み出して,乗算又は加算等を行いスコアを求めて,それぞれの語のスコアを記憶し,比較することで,優位な候補を求めればよい。
【0033】
トピックス語記憶手段9は,キーワードと関連するトピックス語を記憶するための手段である。トピックス語記憶手段9は,記憶部と,記憶部から情報を読み出すための要素(例えば制御プログラム)により実現されればよい。
例えば,トピックス語記憶手段には,肥満遺伝子,肥満症,肥満症実験動物というキーワードと関連して,肥満というトピックス語が記憶されていればよい。トピックス語は,複数のキーワードをさらに統一した用語や上位概念化した用語であってもよい。トピックス語を用いることで,検索をより迅速に行うことができることとなる。トピックス語の例は,疾患名,薬剤名,有効成分名及び製薬企業名である。つまり,トピックス語は,資料中用語に関する第2の変換語といえる。トピックス語は,複数種類のキーワードについて,検索に用いることがふさわしい用語を割り振った用語であってもよい。また,トピックス語は,メッセージに関するものであってもよい。
【0034】
トピックス語抽出手段11は,キーワード抽出手段7が抽出した複数のキーワードを用いて,トピックス語記憶手段9から,キーワードと関連するトピックス語を抽出するための手段である。
トピックス語記憶手段9には,キーワードと関連するトピックス語が記憶されている。このため,トピックス語抽出手段11は,キーワード抽出手段7が抽出した複数のキーワードを用いて,トピックス語記憶手段9から,キーワードと関連するトピックス語を抽出する。
【0035】
図6は,トピックス語記憶手段の記憶例を示す概念図である。図6に示されるように,トピックス語記憶手段は,複数のキーワードのそれぞれに対し,1又は複数のトピックス語を関連付けて記憶するとともに,それぞれのトピックス語についてスコアを関連付けて記憶している。このスコアは,検索に用いられる用語としてふさわしいものほど高くなるようにあらかじめ入力されていることが好ましい。
【0036】
検索用語候補抽出手段13は,トピックス語抽出手段11が抽出したトピックス語及びキーワード抽出手段7が抽出した複数のキーワードから,資料のある頁の検索用語の候補を抽出するための手段である。
例えば,ある頁と関連するとされたトピックス語が1又は複数記憶部に記憶されている。また,ある頁と関連するとされた複数のキーワードが記憶されている。
制御プログラムが,例えば,トピックス語は全て検索用語の候補とし,キーワードは数個(例えば,表示部に表示するサイズを考慮して4個)検索用語の候補とするという制御を行う場合は,検索用語候補抽出手段13は,読み出したトピックス語を全て検索用語の候補とし,キーワードのうち4個を検索用語の候補とする。
なお,キーワード記憶手段5が,複数のキーワードと,それぞれのキーワードのスコアとを関連付けて記憶し,キーワード抽出手段7が,複数のキーワードとともに,それぞれのキーワードのスコアを抽出するものであってもよい。この場合,例えば,スコアの高いキーワードが検索用語の候補として抽出される。
トピックス語記憶手段9が,トピックス語と,それぞれのトピックス語のスコアとを関連付けて記憶し,トピックス語抽出手段11が,キーワード抽出手段7が抽出した複数のキーワードのうちスコアが高い所定個(1個又は2個以上)をトピックス語有力候補とし,トピックス語記憶手段9から所定個のトピックス語有力候補と関連するトピックス語を抽出するようにしてもよい。
【0037】
上記の検索用資料情報記憶装置は,
さらに,カテゴリー語記憶手段25と,カテゴリー語抽出手段27とを有してもよい。
カテゴリー語記憶手段25は,トピックス語と関連するカテゴリー語を記憶するための手段である。
カテゴリー語抽出手段27は,トピックス語抽出手段11が抽出したトピックス語を用いて,カテゴリー語記憶手段25から,トピックス語と関連するカテゴリー語を抽出するための手段である。カテゴリー語は,資料中用語に関する第3の変換語といえる。カテゴリー語は,複数種類のトピックス語について,カテゴリー検索に用いることがふさわしいある用語を選んだものであってもよい。カテゴリー語の例は,資料に興味があると考えられる対象を示すものであってもよい。例えば,資料のある頁がMR用のある糖尿病用の薬剤ものであれば(これは例えばトピックス語と関連して記憶されていればよい),カテゴリー語の例は,「MR」,「糖尿病」,「医薬」といったものでもよい。また,資料のある頁が,銀行の行員向けの経理情報であれば,カテゴリー語の例は,行員といったものでもよいし,「行員」及び「経理」といったものであってもよい。さらに,カテゴリー語は,製品に関する情報であってもよい。そして,この検索用資料情報記憶装置の検索用語候補表示手段17は,さらに,カテゴリー語抽出手段27が抽出したカテゴリー語を検索用語の候補の一つとして抽出する。図7は,カテゴリー語記憶手段の記憶例を示す概念図である。カテゴリー語記憶手段は,複数のトピックス語のそれぞれに対し,1又は複数のカテゴリー語を関連付けて記憶するとともに,それぞれのカテゴリー語についてスコアを関連付けて記憶している。このスコアは,検索に用いられる用語としてふさわしいものほど高くなるようにあらかじめ入力されていることが好ましい。
【0038】
図8は,抽出された(カテゴリー語),トピックス語,キーワード,及び資料中用語を示す概念図である。
【0039】
検索用語候補抽出手段13は,キーワード抽出手段7が抽出した複数のキーワードのうちスコアが高い所定個(1個又は2個以上)を検索用語の候補として抽出してもよい。また,検索用語候補抽出手段13は,キーワードのスコア及びトピックス語のスコアを用いて,トピックス語抽出手段11が抽出したトピックス語から所定個(1個又は2個以上)を検索用語の候補を抽出するものであってもよい。例えば,トピックス語記憶手段9が,トピックス語と,それぞれのトピックス語のスコアとを関連付けて記憶している。また,キーワード記憶手段5が,複数のキーワードと,それぞれのキーワードのスコアとを関連付けて記憶している。あるトピックス語は,もととなるキーワードが存在する。つまり,トピックス語は,キーワードを用いて読み出されたものである。トピックス語は,常に1又は複数のキーワードと関連があることとなる。この場合,検索用語候補抽出手段13は,トピックス語記憶手段9からあるトピックス語に関するスコアを読み出すとともに,キーワード記憶手段5からトピックス語が抽出されるもととなった各キーワードのスコアを読み出す。そして,例えば,検索用語候補抽出手段13は,あるトピックス語についてキーワードが複数存在する場合は,演算部に各キーワードのスコアを合計させるとともに,トピックス語のスコアとキーワードのスコア(又はキーワードの合計したスコア)を乗算させる。このようにして,トピックス語に関する集計後のスコアを求め,記憶部に記憶させる。検索用語候補抽出手段13は,複数のトピックス語について,集計後のスコアを読み出し,演算部に比較させ,所定個(1個又は2個以上)のトピックス語を抽出する。このようにして,トピックス語を抽出する数が決まっている場合であっても,検索用語候補抽出手段13は,所定の数のトピックス語を抽出できる。
【0040】
検索用語候補表示手段17は,検索用語候補抽出手段13が抽出した検索用語の候補を,表示部15に表示させるための手段である。
【0041】
検索用語候補表示手段17は,
表示部15に,検索用語の候補として抽出された所定個(1個又は2個以上)のキーワード及び検索用語の候補として抽出された所定個(1個又は2個以上)のトピックス語を,検索用語の候補として表示するとともに,
キーワード抽出手段7が抽出した複数のキーワードのうち検索用語の候補として抽出されなかったもの,及びトピックス語抽出手段11が抽出したトピックス語のうち検索用語の候補として抽出されなかったものを検索用語の予備候補として表示し,
検索用語入力手段19が,
検索用語の予備候補について,検索用語とする旨の入力を受け取った場合は,検索用語の予備候補を検索用語とし,
検索用語の候補として表示されたものについては,検索用語としない旨の入力を受け取ったものを除いて,検索用語とするものであってもよい。
【0042】
資料検索情報記憶手段21は,検索用語入力手段19により入力された検索用語と,資料のある頁に関する情報とを関連付けて記憶するための手段である。
【0043】
本発明の装置は,さらにプレゼンテーション資料の種類に応じて,コンテンツタイプの候補を表示し,コンテンツのタイプをプレゼンテーションの各頁(又はプレゼンテーション自体)と関連させて記憶するものであってもよい。この場合,本発明の装置は,記憶部に記憶されるプレゼンテーションのフォーマット(パワーポイント(登録商標),PDF(登録商標),ワード(登録商標)など)を読み出す。本発明の装置は,読み出したフォーマットに含まれるテキストを読み出す。本発明の装置は,コンテンツ分析用の用語を記憶したコンテンツ分析用の用語データベースを含む。そして,本発明の装置は,コンテンツ分析用の用語データベースに格納された用語を用いて,コンテンツのタイプを分析する。例えば,資料がPDF(登録商標)であり,「添付文書」というテキストが比較的初めに存在する場合,その資料のコンテンツタイプの候補として「添付文書」を抽出する。そして,表示部に,コンテンツタイプとして「添付文書」を表示し,ユーザから承認が入力された場合に,その資料と関連して,コンテンツタイプに関し「添付文書」を記憶する。
【0044】
図9は,表示画面の例である。この例では,表示画面の上半分部分にプレゼンテーション資料のある頁が表示されている。そして,検索用語の候補については,採用及び不採用のアイコン(チェックボックス)とともに各検索用語の候補が表示されている。検索用語の候補は,図9の例では,左からカテゴリー語,トピックス語,及びキーワードの順に並べられている。資料中用語についても表示部に表示されてもよい。図9の例では,検索用語候補抽出手段13が検索用語として抽出した用語については,採用のチェックボックスに印がつけられている。表示画面の下部には,承認ボタンがあり,ユーザが承認ボタンを用いて,コンピュータ(端末)に承認指示を入力すると,検索用語の候補が承認される。コンピュータから入力を受けた装置1は,記憶部に,プレゼンテーションのある頁に関して,承認された検索用語(及びそれぞれの検索用語のスコア)と関連させて記憶する。
【0045】
検索用語入力手段19は,表示部15に表示された検索用語の候補のうち検索用語である旨の入力を受け取るための手段である。図9の例では,チェックボックスによる入力が,検索用語入力手段19として機能する。ユーザが,採用状態にある検索用語の候補を不採用とする入力を行った場合,例えば,不採用のチェックボックスに印が入力される。チェックボックスからの不採用の入力を受け取った装置1は,指示された検索用語の候補を不採用状態とする。そして,ユーザが承認ボタンを用いて,コンピュータ(端末)に承認指示を入力すると,検索用語の候補が不採用とされる。なお,装置1は,不採用とされた検索用語の候補をスコアを下げたうえで(例えばスコアを半分にしたうえで),上記の頁と関連した検索用語として記憶するようにしてもよい。検索用語候補抽出手段13が検索用語として抽出しなかった用語については,不採用のチェックボックスに印がつけられている(又は,いずれのチェックボックスに印がつけられていない)。ユーザが,不採用状態にある検索用語の候補を採用とする入力を行った場合,例えば,採用のチェックボックスに印が入力される。チェックボックスからの採用の入力を受け取った装置1は,指示された検索用語の候補を採用状態とする。そして,ユーザが承認ボタンを用いて,コンピュータ(端末)に承認指示を入力すると,検索用語の候補が採用とされる。つまり,その検索用語が,ある頁の検索用語として,頁と関連して記憶されることとなる。この際に,ユーザが選択した検索用語であるから,スコアに加点又は乗算した状態で,その検索用語を記憶してもよい。
【0046】
図10は,本発明の検索用資料情報記憶装置の使用例を説明するためのフローチャートである。つまり,この図は,検索用資料情報記憶装置を用いた検索用資料情報記憶方法を説明するための図である。図中Sはステップ(工程)を意味する。
【0047】
ユーザがプレゼンテーション資料を作成する(S101)。すると,ユーザの端末又はコンピュータは,記憶部(又はサーバの記憶部)に,プレゼンテーション資料を記憶する。
【0048】
装置1は,プレゼンテーション資料の各頁について,その頁に含まれる用語である資料中用語を抽出する(S102)。この際,装置1は,資料中用語にスコアを付与してもよい。例えば,資料中用語の登場頻度が高い場合や,太字,色つき文字,アニメーション等を伴う場合,あらかじめ加点について登録しておき,登録した加点情報を用いて,資料中用語にスコアを付与してもよい。また,装置1は,資料中用語の辞書を有しており,辞書には,様々な資料中用語について,資料中用語とスコアとを関連付けて記憶しており,装置1は,資料中用語のスコアを読み出してもよい。そのうえで,辞書に存在する資料中用語のスコアと,加点に関するスコアとを用いて(例えば加算又は乗算して),資料中用語のスコアを求めてもよい。この場合,資料中用語の数をあらかじめ設定している場合は,スコアの高いものを資料中用語としてもよい。
【0049】
装置1は,抽出された1又は複数の資料中用語を用いて,記憶部から,資料中用語と関連するキーワードとなるものを複数抽出する(S103)。記憶部は,資料中用語と関連するキーワードとなる用語を記録している。このため,装置1は,資料中用語を用いることで,それと関連するキーワードを記憶部から抽出することができる。この際,キーワードごとに検索用語としてのスコアが付与されていてもよい。また,同じキーワードが,異なる資料中用語から選択された場合,そのキーワードが検索用語となる可能性が高いことから,加点対象とされてもよい。その場合,キーワードの頻度が高いことに関する加点を登録しておき,キーワードの重複回数に応じた加点を読み出して,スコアと加算又は乗算してもよい。このようにして複数のキーワード(及びそれぞれのキーワードのスコア)が求められる。
【0050】
装置1は,複数のキーワードを用いて,記憶部から,キーワードと関連するトピックス語を抽出する(S104)と,この処理は,キーワードの抽出工程と同様である。
【0051】
装置1は,抽出されたトピックス語を用いて,記憶部から,トピックス語と関連するカテゴリー語を抽出してもよい(S105)。この工程は,任意の工程である。
【0052】
装置1は,トピックス語,複数のキーワード(及びカテゴリー語)から,資料のある頁の検索用語の候補を抽出する(S106)。装置1は,あらかじめ検索用語の候補を抽出するための制御指令が記憶されており,その制御指令に従って,トピックス語,複数のキーワード(及びカテゴリー語)から,資料のある頁の検索用語の候補を抽出すればよい。制御指令の例は,複数のキーワードのうちスコアが高い4つ,トピックス語のうちスコアが高い2つ(,及び全てのカテゴリー語)を,検索用語の候補として抽出するというものである。このようにして,自動的にプレゼンテーション資料のある頁についての検索用語の候補が抽出される。なお,記憶部は,ある頁の検索用語として,抽出された検索用語の候補を記憶してもよい。
【0053】
次に,ユーザに検索用語を承認又は決定させる場合,装置1は,抽出された検索用語の候補を,表示部に表示するようにしてもよい(S107)。この際,プレゼンテーションの対象頁(を小さくしたもの),検索用語の候補とされなかったトピックス語,複数のキーワード(及びカテゴリー語)も合わせて表示部に表示するようにしてもよい。その場合,ユーザが,検索用語を選択することができることとなる。
【0054】
ユーザが,そのまま承認した場合,端末は承認に関する入力を受け取り,装置1が抽出した検索用語の候補がそのままプレゼンテーション資料のある頁に関連した検索用語として記憶部に記憶されることとなる(S111)。
【0055】
一方,端末が,検索用語の候補を不採用とする入力を受け取った場合や,端末が検索用語の候補ではなかった用語を採用とする入力を受け取った場合,これらの修正を反映した検索用語の候補が,記憶部にある頁に関連した検索用語とされる(S121)。
【0056】
上記の修正を行った後に,ユーザが,承認した場合,端末は承認に関する入力を受け取り,修正後の検索用語の候補が,プレゼンテーション資料のある頁に関連した検索用語として記憶部に記憶されることとなる(S122)。
【0057】
本発明は,
コンピュータを
資料のある頁に含まれる用語である資料中用語を抽出する用語抽出手段3,
資料中用語と関連するキーワードとなる用語を記憶するキーワード記憶手段5,
用語抽出手段3が抽出した資料中用語を用いて,キーワード記憶手段5から,資料中用語と関連するキーワードとなるものを複数抽出するキーワード抽出手段7,
キーワードと関連するトピックス語を記憶するトピックス語記憶手段9,
キーワード抽出手段7が抽出した複数のキーワードを用いて,トピックス語記憶手段9から,キーワードと関連するトピックス語を抽出するトピックス語抽出手段11,
トピックス語抽出手段11が抽出したトピックス語及びキーワード抽出手段7が抽出した複数のキーワードから,資料のある頁の検索用語の候補を抽出する,検索用語候補抽出手段13,
検索用語候補抽出手段13が抽出した検索用語の候補を,表示部15に表示させる検索用語候補表示手段17,
表示部15に表示された検索用語の候補のうち検索用語である旨の入力を受け取る,検索用語入力手段19,及び
検索用語入力手段19により入力された検索用語と,資料のある頁に関する情報とを関連付けて記憶する資料検索情報記憶手段21,
として機能させるための検索用資料情報記憶用プログラムやそのプログラムを記憶したコンピュータ読み取り可能な記録媒体をも提供する。
【0058】
図11は,本発明の検索用資料情報記憶装置の使用例を説明するための概念図(ブロック図)である。この例では,基本データベース(DB)として,コンテンツDB,顧客DB,ログDB及びその他の情報を記憶するDBを含む。そして,これらのデータベースは,インターフェイスを介して,インタラクティブプロフレームワークとよばれるエンジンと接続されている。このエンジンは,アプリケーションプログラミングインタフェース(API)を介して各種端末(例えば,PCタブレット,携帯端末,携帯電話)と情報の授受を行うことができるようにされている。また,このエンジンは,クライアント内の制御プログラムやアプリケーション,HTMLデータ,動画データ,パワーポイントデータ,PDFデータ,書類データ,データベース管理ソフト,と情報の授受を行うことができるようにされている。また,このエンジンは,サーバ(クラウド)と同期がとられ,情報の授受を行うことができるようにされている。一方,図11の例では,このサーバを介して顧客のBI(ビジネスインテリジェンス),CRM(顧客関係管理),及びDWH(データウェアハウス)を含む各種データベース及びソフトウェアと情報の授受を行うことができるようにされている。
【産業上の利用可能性】
【0059】
本発明は,情報提供産業において利用されうる。
【符号の説明】
【0060】
1...検索用資料情報記憶装置
3...用語抽出手段
5...キーワード記憶手段
7...キーワード抽出手段
9...トピックス語記憶手段
11...トピックス語抽出手段
13...検索用語候補抽出手段
15...表示部
17...検索用語候補表示手段
19...検索用語入力手段
21...資料検索情報記憶手段
23...検索用資料情報記憶装置
25...カテゴリー語記憶手段
27...カテゴリー語抽出手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11