(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-07-22
(45)【発行日】2024-07-30
(54)【発明の名称】情報処理方法、そのプログラムおよび装置
(51)【国際特許分類】
G06F 16/958 20190101AFI20240723BHJP
G06F 16/81 20190101ALI20240723BHJP
【FI】
G06F16/958
G06F16/81
(21)【出願番号】P 2024066476
(22)【出願日】2024-04-17
【審査請求日】2024-04-24
【早期審査対象出願】
(73)【特許権者】
【識別番号】315015139
【氏名又は名称】株式会社コンテンシャル
(74)【代理人】
【識別番号】100083725
【氏名又は名称】畝本 正一
(74)【代理人】
【識別番号】100140349
【氏名又は名称】畝本 継立
(74)【代理人】
【識別番号】100153305
【氏名又は名称】畝本 卓弥
(72)【発明者】
【氏名】柏崎 剛
【審査官】甲斐 哲雄
(56)【参考文献】
【文献】特開2010-055501(JP,A)
【文献】特開2003-058529(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータで実行する情報処理方法であって、
情報収集部が、ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する工程と、
情報処理部が、前記コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、前記特定ワードおよび前記構成情報を含む情報提示画面を生成する工程と、
提示部が、前記ユーザーに前記情報提示画面を提示する工程と、
を含む、情報処理方法。
【請求項2】
さらに、前記情報処理部が、抽出した前記特定ワードの中から選出条件に基づいて、選出キーワードを選出し、前記情報提示画面内に前記選出キーワードを提示する工程と、
を含む、請求項1に記載の情報処理方法。
【請求項3】
前記情報処理部が、
抽出した前記特定ワードと、前記調査条件または設定された除外条件とを対比して関連度を判別する工程と、
前記特定ワードから、前記調査条件との関連度が所定の閾値未満の特定ワード、または前記除外条件との関連度が所定の閾値以上の特定ワードを除外して、前記情報提示画面を生成する、請求項1に記載の情報処理方法。
【請求項4】
ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する機能と、
前記コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、前記特定ワードおよび前記構成情報を含む情報提示画面を生成する機能と、
前記ユーザーに前記情報提示画面を提示する機能と、
をコンピュータに実行させる情報処理プログラム。
【請求項5】
さらに、抽出した前記特定ワードの中から選出条件に基づいて、選出キーワードを選出させ、前記情報提示画面内に前記選出キーワードを提示させる機能と、
を前記コンピュータに実行させる、請求項4に記載の情報処理プログラム。
【請求項6】
抽出した前記特定ワードと、前記調査条件または設定された除外条件とを対比して関連度を判別する機能と、
前記特定ワードから、前記調査条件との関連度が所定の閾値未満の特定ワード、または前記除外条件との関連度が所定の閾値以上の特定ワードを除外して、前記情報提示画面を生成する機能と、
を前記コンピュータに実行させる、請求項4に記載の情報処理プログラム。
【請求項7】
コンテンツ毎に、抽出した前記特定ワードをコンテンツの前記構成情報に設定された優先度情報に応じて提示する第1の情報提示領域と、前記選出キーワードを提示する第2の情報提示領域とを含む前記情報提示画面を生成する機能、
を前記コンピュータに実行させる、請求項5に記載の情報処理プログラム。
【請求項8】
ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する情報収集部と、
前記調査条件に関連付けて前記コンテンツデータを記憶する記憶部と、
前記コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、前記特定ワードおよび前記構成情報を含む情報提示画面を生成する情報処理部と、
前記ユーザーに前記情報提示画面を提示する情報提示部と、
を含む、情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の技術は、取得したコンテンツに利用されている情報を解析し、その解析結果をユーザーに提供する技術に関する。
【背景技術】
【0002】
ネットワークの利用者は、たとえばそれぞれの目的に応じたキーワードを使って検索し、その検索結果を利用して、ウェブサイトにアクセスする。このとき利用者は、たとえば知名度の高いウェブサイトや検索結果の一覧で上位に挙げられているウェブサイトにアクセスする傾向にある。この検索処理では、たとえばウェブサイトに対するアクセス数のほか、提供しているコンテンツの内容、コンテンツの構成なども結果に大きく影響する。つまり利用者の嗜好や興味に沿ったコンテンツであることに加えて、たとえばコンテンツの内容を把握し易くする見出しの数やその文字数、記事の長さなども重要な要素である。
【0003】
コンテンツの作成、更新、管理を行うウェブサイトのクリエイター側では、検索結果で上位に評価されたコンテンツの情報を把握できれば、利用者が求めているテーマに沿ったコンテンツが作成できる。そのため検索結果が上位のウェブサイトで提供されるコンテンツを調査・検討することは、利用者のニーズを捉えるために重要な作業といえる。
【0004】
このようなコンテンツの情報の調査に関し、データベースに存在する文書を検索し、特定のワードに対する共起単語やクエリ単語を抽出し、それらの単語を含むフレーズに対して関連度を算出して提示することで、文書の内容が、ユーザーが求めている内容であるかを容易に把握可能にするものが知られている(たとえば、特許文献1)。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、ウェブサイトの管理者やコンテンツのクリエイターは、コンテンツの利用者が興味を持つ内容や分野などを把握し、利用者が求めるテーマに沿ったコンテンツの作成を行うことで、閲覧数の増加や検索性の向上を図っている。しかしながら、利用者の興味・流行性は変化し易いため、詳細に調査することは困難であり、常に利用者の興味・流行傾向の変化を追従して調査するには膨大な労力を要するという課題がある。また、このように変化しやすい興味・流行を追従して利用者に閲覧してもらうには、調査に多くの時間や労力をかけずに、できるだけ短時間でコンテンツの生成や更新作業を行い、早期に公開可能にすることが望ましいという課題がある。
【0007】
本開示の技術の発明者は、斯かる課題に対し、たとえば閲覧数や検索性が高いコンテンツで取上げられたキーワードのほか、そのコンテンツの構造も利用者の興味や流行性に影響しており、このコンテンツの構造情報を取得することで、利用者の興味を引くコンテンツの生成に利用できるとの知見を得た。
【0008】
そこで、本開示の技術の目的は、上記課題に鑑み、他のコンテンツの構造情報を収集して解析し、その解析結果を提供することで、流行性や嗜好性に沿ったコンテンツの生成処理の迅速化、容易化に寄与することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本開示の情報処理方法の一側面は、コンピュータで実行する情報処理方法であって、情報収集部が、ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する工程と、情報処理部が、前記コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、前記特定ワードおよび前記構成情報を含む情報提示画面を生成する工程と、提示部が、前記ユーザーに前記情報提示画面を提示する工程とを含む。
【0010】
上記情報処理方法において、さらに、前記情報処理部が、抽出した前記特定ワードの中から選出条件に基づいて、選出キーワードを選出し、前記情報提示画面内に前記選出キーワードを提示する工程とを含む。
上記情報処理方法において、前記情報処理部が、抽出した前記特定ワードと、前記調査条件または設定された除外条件とを対比して関連度を判別する工程と、前記特定ワードから、前記調査条件との関連度が所定の閾値未満の特定ワード、または前記除外条件との関連度が所定の閾値以上の特定ワードを除外して、前記情報提示画面を生成してよい。
【0011】
上記目的を達成するため、本開示の情報処理プログラムの一側面は、ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する機能と、前記コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、前記特定ワードおよび前記構成情報を含む情報提示画面を生成する機能と、前記ユーザーに前記情報提示画面を提示する機能とをコンピュータに実行させる。
【0012】
上記情報処理プログラムにおいて、さらに、抽出した前記特定ワードの中から選出条件に基づいて、選出キーワードを選出させ、前記情報提示画面内に前記選出キーワードを提示させる機能とを前記コンピュータに実行させる。
上記情報処理プログラムにおいて、抽出した前記特定ワードと、前記調査条件または設定された除外条件とを対比して関連度を判別する機能と、前記特定ワードから、前記調査条件との関連度が所定の閾値未満の特定ワード、または前記除外条件との関連度が所定の閾値以上の特定ワードを除外して、前記情報提示画面を生成する機能とを前記コンピュータに実行させる。
上記情報処理プログラムにおいて、コンテンツ毎に、抽出した前記特定ワードをコンテンツの前記構成情報に設定された優先度情報に応じて提示する第1の情報提示領域と、前記選出キーワードを提示する第2の情報提示領域とを含む前記情報提示画面を生成する機能を、前記コンピュータに実行させる。
【0013】
上記目的を達成するため、本開示の情報処理装置の一側面は、ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する情報収集部と、前記調査条件に関連付けて前記コンテンツデータを記憶する記憶部と、前記コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、前記特定ワードおよび前記構成情報を含む情報提示画面を生成する情報処理部と、前記ユーザーに前記情報提示画面を提示する情報提示部と含む。
【発明の効果】
【0014】
本発明によれば、次の何れかの効果が得られる。
【0015】
(1) ターゲットとした他者のコンテンツに対し、その内容を表す文書や特定の用語のほか、そのコンテンツの構成情報を取得してユーザーに提示することで、ユーザーのコンテンツの生成に要する時間や負荷を軽減できる。
(2) アクセス数や話題性の高いコンテンツの内容やそのコンテンツの構成情報を収集してユーザーに提示することで、これらの情報を利用してネットワークの利用者のニーズや関心性の高いコンテンツの生成が可能となる。
(3)コンテンツなどの作成において、流行性のある話題などの情報調査の作業負荷を軽減することができる。
【図面の簡単な説明】
【0016】
【
図1】第1の実施形態に係るコンテンツ情報収集システムの構成例を示す図である。
【
図2】コンテンツ情報収集システムの他の構成例を示す図である。
【
図3】コンテンツデータの解析処理および特定ワードなどの抽出処理例を示す図である。
【
図5】コンテンツの情報収集処理例を示すフローチャートである。
【
図6】第2の実施形態に係るコンテンツ情報収集システムの構成例を示す図である。
【
図7】コンテンツの情報収集処理例を示すフローチャートである。
【
図8】実施例に係るコンテンツの情報収集処理例を示すフローチャートである。
【発明を実施するための形態】
【0017】
〔第1の実施形態〕
図1は、第1の実施形態に係るコンテンツ情報収集システムを示している。また
図2は、コンテンツ情報収集システムの他の構成例を示している。
図1、2に示す構成は一例であり、本開示の技術が斯かる構成に限定されない。また、
図1、2において、共通の構成には同一符号を付している。
【0018】
コンテンツ情報収集システム2は、特定のテーマに関するコンテンツの作成を行うクリエイターであるユーザーに対し、他のウェブサイトで提供しているコンテンツの特定ワードやそのコンテンツの構成情報を抽出して提供する機能を有する。
特定ワードは、文書や画像、映像、その他の形式で構成されているコンテンツの内容を表す情報の一例であり、たとえばコンテンツで採用されているテーマやタイトルなどを表す言葉のほか、内容を細分化して表す見出し、コンテンツ内で頻度が高く使われる共起語やその他のキーワードを含む言葉などである。この特定ワードは、たとえば単一または複数の文書であってもよく、または所定の長さのキーワードであってもよい。また、コンテンツの構成情報は、コンテンツのアドレスや文字数などの情報に加えて、コンテンツに含まれる特定ワードの配置順序、特定ワードとして設定するための優先度情報や、コンテンツの更新日付などの情報を含んでもよい。
【0019】
図1に示すコンテンツ情報収集システム2は、たとえば情報処理装置4とユーザー端末6を有しており、情報処理装置4とユーザー端末6がインターネットなどのネットワークを介して情報の送受信を行っている。このコンテンツ情報収集システム2は、たとえばユーザーが指定した特定のウェブサイト、またはコンテンツにアクセスするほか、図示しない他の手段で収集したコンテンツ情報を読み込んで特定ワードやコンテンツの構成情報の情報収集を行う。このコンテンツ情報は、ユーザーから提供されるコンテンツデータのほか、特定のウェブサイトやコンテンツを指定するアドレス情報が含まれる。
また、
図2に示すコンテンツ情報収集システム2は、たとえば外部の情報源の一例である情報供給手段20を利用して1または複数のウェブサイトやそこで提供されているコンテンツのデータを取得し、この取得したデータから特定ワードおよびコンテンツの構成情報の情報収集を行う。
【0020】
<情報処理装置4について>
情報処理装置4は、たとえばネットワークに接続可能なPC(Personal Computer)や、コンテンツをネットワーク上に公開し、または管理するサーバー装置などが用いられる。この情報処理装置4は、たとえばコンテンツデータの取得機能やコンテンツデータから特定ワードおよび構成情報の抽出処理や特定ワード、構成情報の情報提示処理を実現するために、通信部8、記憶部10、情報提示部12、処理部14を備える。
【0021】
通信部8は、使用するユーザー端末6や、調査条件に基づいてウェブサイトやコンテンツを調査する情報供給手段20(
図2)に対して、ネットワークを通じて接続する。
記憶部10は、たとえば収集したコンテンツデータやこのコンテンツデータから抽出した特定ワードおよびコンテンツの構成情報を格納する。そのほか記憶部10には、ユーザー情報などの登録情報を格納するほか、本開示の情報処理プログラム、情報処理装置4を動作させるためのOS(Operating System)などのプログラムを格納する。記憶部10は、たとえばROM(Read Only Memory)や不揮発メモリで構成されればよい。
情報提示部12は、抽出した特定ワードやコンテンツの構成情報を利用して生成した情報提示画面を提示する手段の一例である。この情報提示部12は、たとえば情報処理装置4のモニターを通じて情報提示画面をユーザーに視認可能に表示するほか、通信部8と組み合せてユーザー端末6に情報提示画面のデータを送信させてもよい。
【0022】
処理部14は、コンテンツデータの収集や解析処理、コンテンツデータから特定ワードやコンテンツの構成情報を抽出する処理、および抽出した情報をユーザーに提示する処理を実行する機能部の一例である。この処理部14は、たとえば情報処理装置4のプロセッサとRAM(Random Access Memory)が協同し、情報処理プログラムを実行演算しており、情報収集部16および情報処理部18を有する。
【0023】
情報収集部16は、調査対象として設定されたコンテンツからコンテンツデータを収集する機能部である。情報収集部16は、たとえばユーザー端末6から指示された抽出条件に基づいて、コンテンツデータを抽出する。また、情報収集部16は、情報供給手段20を通じてコンテンツを調査する場合、ユーザー端末6から指示された調査条件を利用して1または複数のコンテンツを収集した後に、抽出条件に基づいてコンテンツデータを抽出する。コンテンツデータは、たとえばコンテンツ内の記事や動画、画像のほか、HTML形式のウェブサイトを形成するためのタグ情報なども含まれる。このコンテンツ情報収集システム2によるコンテンツデータの抽出処理は、
図1に示すようにユーザーから設定されるコンテンツ情報から抽出する場合と、
図2似示すように外部の情報供給手段20で収集したコンテンツ情報から抽出する場合のいずれか一方、または両方を行えばよい。
コンテンツデータの抽出条件には、たとえばユーザーが指定するテーマワードなどの主題情報が含まれる。
【0024】
情報処理部18は、コンテンツデータから特定ワードやコンテンツの構成情報を抽出し、これらの情報をユーザーに提示する情報提示画面を生成する機能部の一例である。また、この情報処理部18は、たとえば特定のコンテンツまたは複数のコンテンツの間で、それぞれの特定データまたはコンテンツデータ同士を対比させ、その対比結果から抽出基準に基づいてキーワードを抽出する。この抽出基準は、たとえば出現頻度の多少のほか、特定の範囲において収集して使われていることなどを基準としてもよい。これにより情報処理部18は、たとえばよく使われるキーワードなどを抽出する。このよく使われるキーワードは、既述の特定ワードに含まれる。
【0025】
<ユーザー端末6について>
ユーザー端末6は、情報処理装置4を利用して特定のテーマワードに関連するコンテンツを調査させ、そのコンテンツに含まれる特定ワードやコンテンツの構成情報の取得の指示を出すユーザーが利用する端末装置であり、たとえばPCのほか、携帯端末装置など情報入力機能、通信機能および情報表示機能を備えたコンピュータで構成される。このユーザーは、テーマワードに基づき、取得した特定ワードや構成情報を利用してウェブサイトの運営、管理やコンテンツの作成を行う者である。
ユーザー端末6は、たとえば情報処理装置4に対して、端末情報やユーザーの識別情報などを登録するとともに、コンテンツを調査するためのキーワードなどを含む調査条件、コンテンツデータや特定ワードの収集を行うための抽出条件などを提供している。
そして、ユーザー端末6は、たとえば情報処理装置4から特定ワードやコンテンツの構成情報を含む情報提示画面の提供を受ける。
【0026】
<特定ワードおよびコンテンツの構成情報の抽出について>
図3は、コンテンツデータの解析処理および特定ワードなどの抽出処理例を示す図である。
図3に示す処理内容は一例である。
このコンテンツデータ21には、たとえば
図3のAに示すように、特定のテーマに基づく文書で構成されたテキスト領域22、動画や画像などテキスト形式以外で構成された非テキスト領域24の何れか一方または両方が含まれる場合を示している。
情報処理部18は、取得したコンテンツデータ21の解析処理を行い、テキスト領域22から文書のタイトルや見出しなどの特定ワード26を抽出する。この解析処理では、たとえばコンテンツデータ21がHTML形式の場合、タグ情報として設定される「TITLE」タグやコンテンツ内の「見出し」として表示させるための設定情報である「hタグ」などを基準に特定ワード26を判別すればよい。その他、解析処理では、所定範囲のテキスト同士を比較し、文字の大きさや色、装飾の有無などを基準に、「タイトル」や「見出し」を判別し、特定ワードとして抽出してもよい。さらに情報処理部18は、たとえばHTML形式のタグ情報をコンテンツの構成情報として抽出する。その他、この構成情報には、コンテンツデータ21内の全体または所定範囲ごとに計数した文字数情報、更新日時情報のほか、コンテンツの内容の要約を記載した「ディスクリプション」情報などを含んでもよい。
【0027】
また情報処理部18は、非テキスト領域24に対し、対象とするコンテンツデータ21の形式に対応した解析処理を利用して、特定ワードやコンテンツの構成情報を抽出する。情報処理部18は、たとえば非テキスト領域24が動画で構成されている場合、その動画の内容を読み取るプログラムや人工知能(AI:Artificial Intelligence)などを利用してテキスト化し、または読み取った内容から直接、特定ワードに該当するワードを抽出すればよい。その他、情報処理部18は、動画や画像に付随して設定された説明情報などからタイトルや見出しなどを、非テキスト領域24の特定ワードとして抽出してもよい。
【0028】
記憶部10は、たとえば
図3のBに示すように、データベース(DB)30を有しており、情報処理部18が抽出した特定ワード26とそれに関連したコンテンツの構成情報が格納される。このDB30は、たとえばコンテンツ毎に区別されており、特定ワード情報部32とコンテンツの構成情報部34を備える。
【0029】
さらに、情報処理部18は、たとえばDB30の特定ワード情報部32に格納された特定ワードや、これに加えてコンテンツデータ21内に含まれる言葉に対し、選出条件の一例として出現頻度を解析し、その出現頻度が高いキーワードを選出する。その他、情報処理部18は、たとえば他の選出条件として、出現頻度の解析とともに、ユーザーが希望するテーマワードを取得し、このテーマワードに対する類似度や関連度を判断し、それらの類似性や関連性の高いワードを選出してもよい。この関連度は、たとえば図示しないデータベースや外部データベースを利用して取得した情報を利用して判断すればよく、所謂サジェストワードや再検索キーワード、競合ワードなどを用いてもよい。選出されたキーワードは本開示の選出キーワードの一例である。
【0030】
<情報提示画面について>
情報処理部18は、収集したコンテンツから特定ワードおよびコンテンツの構成情報を抽出すると、これらの情報をユーザーに提示するための情報提示画面の生成処理に移行する。情報提示画面40には、たとえば
図4に示すように、選出ワード情報42、コンテンツ情報44を有する。
選出ワード情報42は、既述したように、収集した特定ワード情報やコンテンツ内で出現頻度の高い言葉や、テーマワードとの関連度が高いワードなどの解析結果である選出キーワードを提示する領域である。
コンテンツ情報44は、コンテンツデータ21から抽出した特定ワードおよびコンテンツの構成情報を提示する領域の一例であり、収集したコンテンツデータ毎にそれぞれの情報領域44-1、44-2、・・・44-Nを有する。各コンテンツ情報44には、たとえばアドレス情報部46、調査条件・抽出条件部47、文字数情報部48、日付情報部49、優先度情報部50、特定ワード情報部52を有する。
【0031】
アドレス情報部46は、コンテンツの特定や所在を特定する情報を格納しており、URLのみに限らず、コンテンツ名またはウェブサイト名が格納されてもよい。
調査条件・抽出条件部47は、ユーザー端末6を通じてユーザーから指定されたテーマワードや特定ワードとして抽出する対象などを指定する情報を格納する領域の一例である。これらの条件は、たとえば情報供給手段20を通じてウェブサイトやコンテンツの検索処理に利用するほか、コンテンツデータ21に対しHTMLのタグ情報を対象として「タイトル」や「見出し」の抽出に利用する。
そのほか、優先度情報部50は、たとえばコンテンツの構成情報の一例であって、特定ワードとして抽出するワードに設定された情報が格納される。この優先度情報部50は、たとえば出現順序、出現回数の多少のほか、HTMLのタグの「h1」、「h2」、・・・「h6」などの順位情報などが格納される。
また、特定ワード情報部52には、たとえば優先度情報部50の情報に基づき、優先度の高低を表す表示として、ワード毎の記載開始位置をずらして表示してもよい。
【0032】
図5は、コンテンツの情報収集処理例を示している。
図5に示す処理内容、処理手順は一例であり、斯かる構成に本開示の技術が限定されない。
このコンテンツ情報収集処理は、本開示の情報処理方法または情報処理プログラムの一例である。
情報処理装置4は、ユーザー端末6から取得した抽出条件と、情報収集対象であるコンテンツを特定するための調査条件を取得し、ユーザーから指定されまたは情報供給手段20が提示したコンテンツにアクセスしてコンテンツデータ21を取得する(S101)。情報処理装置4は、収集したコンテンツデータ21を解析し(S102)、たとえばテキスト情報やタグ情報、その他、言葉の出現頻度の割り出しなどを行う。情報処理部18は、解析した情報に対し、抽出条件に基づいて、特定ワードとコンテンツの構成情報を抽出する(S103)。情報処理装置4は、情報処理部18が抽出した特定ワード、コンテンツの構成情報を利用し、収集結果である情報提示画面40を生成して(S104)、通信部8や情報提示部12を通じてユーザーに提示する(S105)。
【0033】
〔第1の実施形態の効果〕
斯かる構成によれば、次のいずかの効果が得られる。
(1) ターゲットとした他者のコンテンツや話題性の高いコンテンツの情報を収集し、その情報を提示してユーザーが利用可能にすることで、ネットワークの利用者のニーズや関心性の高いコンテンツの生成処理の支援が可能となる。
(2) 特定のテーマに対するネットワーク利用者の嗜好性や流行性に合せた特定ワードやコンテンツの構成情報を取入れたコンテンツを生成することで、アクセス数の増加などが期待できる。
(3) コンテンツの作成において、ネットワーク利用者の関心が高い特定ワードやコンテンツ構成などの情報の調査に対する作業負荷や時間的負荷を軽減でき、コンテンツの生成や更新の迅速性が高められ、流行に追従したコンテンツの公開が可能となる。
【0034】
〔第2の実施形態〕
図6は、第2の実施形態に係るコンテンツ情報収集システムの構成を示している。
図6に示す構成は一例であり、本開示の技術において、斯かる構成に限定されない。また
図6において、
図1、2と同一部分には同様の記号を付し、その説明を省略する。
【0035】
このコンテンツ情報収集システム60は、第1の実施形態に係るコンテンツ情報収集システム2に対し、情報処理部18において、調査したウェブサイトまたはコンテンツ、またはコンテンツデータ21から抽出した特定ワードを監視し、所定の条件を満たしたコンテンツ、または特定ワードを除外する機能を備える。
この情報処理装置4には、たとえば情報処理部18内に、判定機能部62、除外処理部64を備えるとともに、記憶部10内に除外情報DB66を格納している。
【0036】
判定機能部62は、調査したウェブサイトやコンテンツ、コンテンツデータ21、または抽出した特定ワードが除外条件に該当するか否かを判定するほか、抽出した特定ワードがユーザーが指定したテーマワードに該当するか否かを判定する機能部である。この判定では、たとえば除外情報DB66に格納されたアドレス情報、コンテンツ名、除外キーワードを利用するとともに、ユーザーが設定したコンテンツのテーマワードを利用する。より具体的には、判定機能部62は、調査したウェブサイトやコンテンツ、その特定ワードと除外条件との関連度を判定し、その関連度が一致、または所定の閾値以上の関係にある場合は、そのコンテンツや特定ワードを除外する。また、判定機能部62は、抽出した複数の特定ワードとユーザーが指定したテーマワードとの関連度を判定し、その関連度が所定の閾値未満の場合、情報提示画面40に提示させない処理を行う。
【0037】
除外処理部64は、判定機能部62による関連度の算出および判定結果に基づいて、除外判定されたコンテンツ、特定ワードを除外する機能部の一例である。この除外処理は、たとえばコンテンツデータ21の解析処理を実行させない処理や、抽出した特定ワードをDB30に格納しない、もしくは削除するなどの処理が含まれる。
除外情報DB66は、除外判定の基準情報を格納する領域であり、たとえばユーザーまたは図示しない外部データベースから取得した除外条件が格納される。また、この除外情報DB66には、既述のように抽出した複数の特定ワードに対して除外するワードを判定する場合、ユーザーが指定したテーマワードが格納されればよい。
【0038】
図7は、コンテンツの情報収集処理例を示している。
図7に示す処理内容、処理手順は一例であり、斯かる構成に本開示の技術が限定されない。
このコンテンツ情報収集処理は、本開示の情報処理方法または情報処理プログラムの一例である。
情報処理装置4は、たとえばユーザー端末6からの指示に基づいて、コンテンツデータの取得(S201)、コンテンツデータの解析処理(S202)、特定ワード、コンテンツ構成情報の抽出(S203)を実行する。これらの処理(S201-S203)は、
図5で既述した処理ステップS101-S103と同様の処理を行えばよく、説明を省略する。
【0039】
情報処理装置4は、記憶部10に格納された除外情報DB66を読み込み(S204)、判定機能部62によりコンテンツデータ、特定ワードと除外情報DB66に登録された情報との関連度を特定する(S205)。この関連度は、たとえば特定ワードの一部または全体に除外すべきNGキーワードが使われているか、またはそのNGキーワードに類似、または関連するワードが使われているかなどで関連度を設定すればよい。その関連度は、たとえばNGワードが使われる割合や使われたワードの類似性などに基づいて、段階的な評価情報、または数値情報として設定してもよい。
【0040】
処理部14は、設定された除外条件に対する関連度が所定の閾値以上か否かの判断(S206)を行い、この判断で閾値以上であれば(S206のYES)、その特定ワードまたはコンテンツデータをDB30から除外する(S207)。この関連度の特定および閾値に対する判断は、収集した特定ワードの一部または全部について実行する。
【0041】
処理部14は、除外条件との関連度が所定の閾値未満と判断した場合(S206のNO)、特定ワードとユーザーが設定したテーマワードを含む調査条件との関連度を設定する(S208)。この関連度の設定は、既述のNGキーワードに対する関連度の設定処理と同様に行えばよい。この特定ワードとテーマワードとの対比は、たとえば収集したコンテンツに多数の話題や内容が含まれている場合、抽出したタイトルや見出しなどの特定ワードの中にユーザーが指定したテーマに関連しないものを判別する。
そして、処理部14は、設定された調査条件に対する関連度が所定の閾値未満か否かの判断(S209)を行い、この判断で閾値未満であれば(S209のYES)、その特定ワードをDB30から除外する(S210)。これらの処理により、ユーザーが希望するテーマ以外の特定ワードを除外することができる。
また情報処理装置4は、設定された調査条件に対する関連度が所定の閾値以上であれば(S209のNO)、その特定ワードおよびコンテンツの構成情報を利用して情報提示画面の生成(S211)や、その提示処理(S212)を行う。
【0042】
その他、除外条件との関連度の判定処理は、たとえば情報供給手段20から提示された複数のウェブサイトやコンテンツにアクセスするタイミングや、これらのコンテンツからコンテンツデータを収集するときに実行してもよい。この場合、除外条件は、たとえば特定のアドレス情報やコンテンツ内に所定のNGキーワードが含まれているかを判定し、除外条件に当てはまる場合、そのコンテンツを除外して情報収集処理を行えばよい。
さらに、この実施形態では、除外条件に対する関連度の対比と、ユーザーが指定したテーマである調査条件との関連度の対比処理を行う場合を示したが、これに限られない。これらの対比の何れか一方のみを行うようにしてもよい。
【0043】
〔第2の実施形態の効果〕
斯かる構成によれば、以下の何れかの効果が得られる。
(1) 第1の実施形態と同様の効果が得られる。
(2) 他のコンテンツから、指定したテーマに関連性の高い見出しやタイトルなどの特定ワードを抽出することができ、ユーザーの希望に適合したコンテンツの情報を提供することができる。
(3) ユーザーが希望しない情報を予め除外して特定ワードを抽出することができるので、コンテンツの生成処理において、特定ワードの選択処理、確認処理の作業負荷を軽減できる。
【実施例】
【0044】
次に、コンテンツの情報収集処理の実施例を示す。
図8は、実施例に係るコンテンツの情報収集処理例を示している。
情報処理装置4は、ユーザー端末6から調査条件として、検索クエリとなる対象キーワード、ユーザーがターゲットにした特定のウェブサイトの対象URL、またはユーザーが指定するコンテンツデータの解析ファイルが入力される(S301)。情報処理装置4には、これら何れかの情報が入力さされず、または入力エラーとなっている間は待機状態となり(S302のYES)、情報が入力されると(S302のNO)、処理部14において、入力された情報に応じた調査、解析処理に移行する。
【0045】
処理部14は、調査条件である対象キーワードが入力されたと判断した場合(S303のYES)、通信部8を通じてネットワーク上で利用可能な一般的な検索エンジンの利用指示があるかを判断し(S304)、この指示がある場合(S304のYES)、指定された検索エンジンによる検索結果に基づき、複数のコンテンツデータを抽出する(S305)。このコンテンツデータの抽出では、たとえば検索のランキング順位の上位から所定数のコンテンツにアクセスし、それぞれのコンテンツから主要な見出し、タイトルなどの文字列、その他情報を抽出する。またこの抽出処理では、見出しやタイトルに設定された既述の優先度情報や平均文字数、最大文字数、最小文字数などの情報をコンテンツ構成情報として取得する。
【0046】
また処理部14には、たとえば調査条件に特定の検索システムの利用指示がある場合(S304のNO、S306のYES)、その検索システムの仕様により、たとえば優先順位の指定や更新日付、評判情報などの条件を設定して検索結果をソートしてもよい(S307)。そして処理部14は、提示された検索結果に対してコンテンツデータの抽出する(S308)。この抽出処理は、S305と同様に行えばよく、説明を省略する。
【0047】
また、情報処理装置4は、調査条件である対象キーワードは入力されず(S303のNO)、特定の対象URLが入力された場合(S309のYES)、または独自のデータがアップロードされた場合(S309のNO、S310のYES)、検索処理を経ずに、提示されたコンテンツからコンテンツデータの抽出処理を行う(S305)。
【0048】
処理部14は、たとえば指定された条件によるコンテンツデータの抽出処理が完了すると、記憶部10の作業領域として、DB30などに抽出された情報を格納し(S311)、各データを利用して情報提示画面40を生成する(S312)とともに、複数のコンテンツデータでよく使われている単語、つまり出現頻度の高い単語(キーワード)を抽出し、情報提示画面40の一部(たとえば、選出ワード情報42)に提示する(S313)。
これらの処理により、コンテンツの情報収集処理を終了する。
〔変形例〕
【0049】
以上説明した実施形態について、その特徴事項や変形例を以下に列挙する。
【0050】
上記実施形態では、情報処理装置4が他のコンテンツから収集したタイトルや見出し等の特定ワードと、コンテンツの構成情報を提示する情報提示画面を生成することを示したが、本開示の技術はこれに限られない。情報処理装置4は、たとえば収集した特定ワードやコンテンツの構成情報と、ユーザーが作成、管理を行うコンテンツから抽出した特定ワード情報やコンテンツの構成情報とを対比し、その評価処理を行う機能を備えてもよい。また、この評価処理とともに、ユーザーのコンテンツに不足する特定ワードやコンテンツの構成情報を提示する機能を備えてもよい。
このような機能を備えることで、ユーザーのコンテンツをネットワーク利用者の嗜好性や流行性に適合させることが可能となり、利便性が高められる。
【0051】
以上説明したように、本開示の技術について最も好ましい実施形態および実施例について説明した。本開示の技術は、上記記載に限定されるものではない。特許請求の範囲に記載され、または発明を実施するための形態に開示された発明の要旨に基づき、当業者において様々な変形や変更が可能である。斯かる変形や変更が、本開示の技術範囲に含まれることは言うまでもない。
【産業上の利用可能性】
【0052】
本開示のコンテンツの情報収集処理によれば、特定のテーマと同一または関連性の高い他のコンテンツに含まれるタイトルや見出しなどの特定ワードや、コンテンツの構成情報を解析し、その情報をユーザーに提示することで、ネットワーク利用者の嗜好性や流行性に追従したコンテンツの生成に寄与することができ、有用である。
【符号の説明】
【0053】
2、60 コンテンツ情報収集システム
4 情報処理装置
6 ユーザー端末
8 通信部
10 記憶部
12 情報提示部
14 処理部
16 情報収集部
18 情報処理部
20 情報供給手段
21 コンテンツデータ
22 テキスト領域
24 非テキスト領域
26 特定ワード
30 DB
32 特定ワード情報部
34 コンテンツの構成情報部
40 情報提示画面
42 選出ワード情報
44 コンテンツ情報
44-1、44-2、・・・44-N 情報領域
46 アドレス情報部
47 調査条件・抽出条件部
48 文字数情報部
49 日付情報部
50 優先度情報部
52 特定ワード情報部
62 判定機能部
64 除外処理部
66 除外情報DB
【要約】
【課題】他のコンテンツの構造情報を収集して解析し、その解析結果を提供することで、流行性や嗜好性に沿ったコンテンツの生成処理の迅速化、容易化に寄与する。
【解決手段】コンピュータ(情報処理装置4)で実行する情報処理方法であって、情報収集部(16)が、ユーザーが指定したコンテンツ、もしくはユーザーにより設定された調査条件により所定の情報源を通じてネットワーク上で調査したコンテンツの一方または両方から、コンテンツデータを収集する工程と、情報処理部(18)が、コンテンツデータを解析して、少なくともコンテンツを構成する特定ワードおよびコンテンツの構成情報を抽出し、コンテンツ毎に、特定ワードおよび構成情報を含む情報提示画面(40)を生成する工程と、提示部(情報提示部12)が、ユーザーに情報提示画面を提示する工程とを含む。
【選択図】
図1