IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ロック キューブ ホールディングス エルエルシーの特許一覧

特表2024-532618構造ベースの自動ハイパーリンクのためのシステムと方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-05
(54)【発明の名称】構造ベースの自動ハイパーリンクのためのシステムと方法
(51)【国際特許分類】
   G06F 40/134 20200101AFI20240829BHJP
   G06F 40/205 20200101ALI20240829BHJP
【FI】
G06F40/134
G06F40/205
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024537304
(86)(22)【出願日】2022-08-26
(85)【翻訳文提出日】2024-04-25
(86)【国際出願番号】 US2022075523
(87)【国際公開番号】W WO2023028587
(87)【国際公開日】2023-03-02
(31)【優先権主張番号】63/260,682
(32)【優先日】2021-08-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】524075490
【氏名又は名称】ロック キューブ ホールディングス エルエルシー
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】グルシャ マイケル
(72)【発明者】
【氏名】グルシャ ダグラス
【テーマコード(参考)】
5B109
【Fターム(参考)】
5B109NH02
5B109NH13
5B109NH14
5B109QA07
5B109QA08
5B109QA09
5B109VC03
(57)【要約】
ハイパーリンクを自動的に挿入する方法を提供する。一例では、本方法は、文書内で識別された構造要素の種類に基づいて、文書内のハイパーリンクアンカーの位置を決定することを含む。ハイパーリンクアンカーの提示は、構造要素の種類に従ってハイパーリンクアンカーの外観を定義する一連の規則に従って表示されてもよい。
【選択図】図1
【特許請求の範囲】
【請求項1】
ハイパーリンクを自動的に挿入する方法であって、
サーバのプロセッサにおいて、前記ハイパーリンクを電子文書に、前記電子文書の構造要素に基づいて挿入するための一連の規則を受け取ることと、
前記プロセッサにおいて実装され、前記一連の規則に基づいてハイパーリンクの挿入を実行するように構成された自動化ツールを介して、前記電子文書に存在する構造要素を識別することと、
前記識別された構造要素に基づいて、前記ハイパーリンクを前記電子文書に挿入することと、
表示装置において、前記ハイパーリンクを有する前記電子文書を表示することと、を含む方法。
【請求項2】
前記構造要素を識別することは、キーワード、箇条書きリスト、番号付きリスト、見出し、および表のうちの1つ以上を識別することを含む、請求項1に記載の方法。
【請求項3】
前記電子文書内の前記キーワードを識別することに応答して、前記ハイパーリンクを挿入することは、テキストの段落内のキーワードの1回目の出現をハイパーリンクし、前記テキストの段落内の前記キーワードのそれ以降の出現をハイパーリンクしないことを含む、請求項2に記載の方法。
【請求項4】
前記電子文書内の前記箇条書きリストを識別することに応答して、前記ハイパーリンクが、前記箇条書きリストの行頭記号に続くテキストに挿入される、請求項2に記載の方法。
【請求項5】
前記電子文書内の前記番号付きリストを識別することに応答して、前記番号付きリストの項目を表すテキストに前記ハイパーリンクが挿入される、請求項2に記載の方法。
【請求項6】
前記電子文書内の前記見出しを識別することに応答して、前記ハイパーリンクが前記見出しのキーワードにおいて前記見出しに挿入される、請求項2に記載の方法。
【請求項7】
前記電子文書内の表を識別することに応答して、前記ハイパーリンクを表の列に挿入する、請求項2に記載の方法。
【請求項8】
前記一連の規則を受け取ることは、前記プロセッサに通信可能に接続されたユーザーインターフェースにおいてユーザが入力した設定を受け取ることを含む、請求項1に記載の方法。
【請求項9】
前記ユーザが入力した前記設定は、前記識別された構造要素の種類に特定の前記ハイパーリンクの配置および書式を含む、請求項8に記載の方法。
【請求項10】
前記一連の規則を受け取ることは、人工知能または機械学習を使用して生成された規則を受け取ることを含む、請求項1に記載の方法。
【請求項11】
ハイパーリンク挿入のためのシステムであって、
電子文書を格納するデータベースと、
前記電子文書を表示するように構成された表示装置と、
前記表示装置に通信可能に接続され、非一過性メモリに格納された実行可能な命令で構成された自動化ツールを含むプロセッサと、を含み、
前記実行可能な命令は、実行されると、前記プロセッサに、
ハイパーリンクを、前記電子文書内で識別された1つ以上の構造要素において、前記実行可能な命令に含まれる、前記1つ以上の構造要素の種類に応じて前記ハイパーリンクがどのように表示されるかを定義する一連の規則に従って、前記電子文書に挿入させ、
前記ハイパーリンクを含む前記電子文書を前記表示装置に表示させる、システム。
【請求項12】
前記一連の規則は、ウェブサイト・サイトマップを使用して、前記ハイパーリンクのアンカーと前記ハイパーリンクのリンク先との間の関係をマッピングするテキスト・リンク先マップを生成する命令を含む、請求項11に記載のシステム。
【請求項13】
前記一連の規則は、前記電子文書のテキストのあるセクションに対するハイパーリンクの最大許容数を含む、請求項11に記載のシステム。
【請求項14】
前記一連の規則は、第1のアンカーと第2のアンカーが閾値文字距離未満離れている場合に、前記ハイパーリンクの第1のアンカーを拡張して、前記ハイパーリンクの前記第2のアンカーを含むようにする命令を含む、請求項11に記載のシステム。
【請求項15】
前記一連の規則は、前記ハイパーリンクのアンカーの表示の頻度、前記アンカーの書式、および前記アンカーとして構成されるテキストのセクションの一部の範囲のうちの1つ以上を調整する命令を含む、請求項11記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年8月27日に出願された、「SYSTEMS AND METHODS FOR STRUCTURE-BASED AUTOMATED HYPERLINKING」と題する米国仮出願第63/260,682号の優先権を主張する。上記出願の全内容は、あらゆる目的のため、参照によりここに援用される。
【0002】
本開示は、概してウェブページ上のハイパーリンクの自動表示に関する。
【背景技術】
【0003】
簡単にアクセス可能な情報に対する需要の高まりが、インターネットベースのコンテンツなど、一般公開されるメディアの増加を促進している。ユーザは、ウェブサイトを利用して特定のトピックまたは様々なトピックに関する情報を統合したり、また、一部の例では、関連するコンテンツの他のウェブサイトを見つけたりすることができるインターネット上にホストされているそれらウェブサイトに依存する場合がある。ウェブサイトは、共通のドメイン名の下に配置された1つ以上のウェブページを含んでいてもよく、また、ウェブサイトのウェブページ間並びにウェブサイトと外部のウェブサイト間のナビゲーションは、ハイパーリンクによって提供されてもよい。
【0004】
ハイパーリンクは、HTML要素であり、別名アンカーとして知られ、現在の電子文書、例えばウェブサイトに表示されているものから、他のウェブページ、ファイル、電子メールアドレス、同じ文書内の位置、またはURLがアドレス指定し得るその他の項目へのリンクを張る。新しい文書は、ウェブサイト内の別のウェブページであってもよいし、または、外部のウェブサイト、例えば異なるドメイン名に属するウェブサイトのウェブページであってもよい。ハイパーリンクは、リンク先の文書のトピックを示すハイパーリンク先を示すコンテンツとともに提示され、文書内の関連箇所に配置されてもよい。ハイパーリンクには、アイコンや画像、およびコンテナなどのHTML要素を含む、テキスト以外の形式のコンテンツが含まれる場合もある。ページ数が少なく、また、コンテンツ量が比較的少ないウェブサイトの場合、ハイパーリンクは手作業で挿入(例えば、ウェブページのコーディング内に入力)してもよいし、または、1つ以上のキーワードに基づいて、ハイパーリンク生成用のアルゴリズムなどを使用して自動的に生成してもよい。
【0005】
しかし、大量の情報を扱う多数のウェブページで構成される大規模コンテンツのウェブサイトでは、手作業による入力は手間がかかり、非効率的、かつ、入力中にエラーが発生する場合がある。キーワードに基づくハイパーリンク生成は、ウェブページを煩雑に見せ、また、視覚的な魅力を低下させる場合がある。ウェブページにハイパーリンクが過剰に存在すると、ユーザがハイパーリンクに対してアクションを起こす可能性が低くなる、例えば、ユーザが大量のハイパーリンクに無感覚になる可能性がある。一方、情報量の多いウェブページにハイパーリンクをまばらに配置すると、ハイパーリンクの視認性が低下し、ハイパーリンクがウェブページのテキストに紛れてしまう可能性がある。そのため、ウェブページ上のハイパーリンクを見つけるのが難しくなる可能性がある。
【0006】
さらに、ハイパーリンクの静的な特性により、ハイパーリンクが時間の経過とともに古く、使用されなくなる可能性がある。例えば、特定のコンテンツへのリンクなど、ディープリンクが張られたウェブページでは、ハイパーリンクが正しくリンクされている可能性が時間とともに低下する場合がある。場合によっては、壊れたり、または古く、使用されなくなったりしたりしたハイパーリンクが時間の経過とともに増加する場合がある(例えば、もはや存在しないリンク先や変更されたリンク先などにリンクしてあるなど)。そのため、ハイパーリンク切れの結果、ウェブページの情報提供の有用性が低下する可能性がある。しかし、ハイパーリンクの精度を維持するためには、時間のかかる監視や、移行された対象リンク先の検索、またはハイパーリンクの新しい、適切なリンク先の検索を必要とする場合もあるため、手作業でウェブページを更新することは、不便で非効率的となる場合がある。
【0007】
カスタマイズ可能で適応性のあるハイパーリンクの生成と提示を行い、情報を探すための、より有意義で有用な経路を提供するシステムと方法が望まれている。
【発明の概要】
【0008】
ハイパーリンクを自動的に挿入するハイパーリンク生成方法を提供する。この方法は、文書内で識別された構造要素の種類に基づいて、文書内のハイパーリンクアンカーの位置を決定することを含む。このようにして、ハイパーリンクを文書内に戦略的に配置され得、ハイパーリンクの視認性を高め、ウェブページの整理された審美性を維持することができる。
【0009】
一実施形態では、ハイパーリンク生成エンジンを実装し、ユーザが入力した一連の規則を受け取ってもよい。ハイパーリンク生成エンジンは、ウェブページなどの電子文書にハイパーリンクを自動的に挿入するための文書処理アルゴリズムで構成された自動化ツールであってもよい。一連の規則は、ハイパーリンクが挿入される構造要素の種類に従って、ハイパーリンクがウェブページでどのように提示されるかを定義することができる。例えば、ウェブページの構造要素は、テキストの段落、リスト、および表、そして位置のうちの1つ以上を含んでいてもよい。構造要素の各々におけるハイパーリンクの書式は、ユーザが提供する一連の規則に基づいて決定してもよい。このように、ウェブページへのハイパーリンクの自動挿入は、ユーザの設定に従ってカスタマイズしてもよく、それにより、ハイパーリンクをより識別可能で有意義な方法で提示することができる。さらに、ハイパーリンク生成エンジンは、機械学習および/または人工知能を利用して、時間の経過とともにデータセットから適切なハイパーリンクの配置を学習することができる。時間の経過とともにデータセットも増加し、それによってハイパーリンク生成エンジンは、ユーザの関与に従って、対象とするハイパーリンクの配置をより高い精度で決定できるようになる。
【0010】
上記の簡単な説明は、詳細な説明でさらに説明される選択された概念を簡略化した形で紹介するために提供されていることを理解されたい。これは、特許請求の範囲に記載された主題の主なまたは本質的な特徴を識別するためのものではなく、その範囲は、詳細な説明に続く特許請求の範囲によって独自に定義される。さらに、特許請求に記載される主題は、上記または本開示の任意の部分において指摘される欠点を解決する実装態様に限定されない。
【0011】
本開示は、添付図面を参照しながら、以下の非限定的な実施形態の説明を読むことにより、より良く理解され得る。
【図面の簡単な説明】
【0012】
図1】動的ハイパーリンク生成エンジンを介して、ユーザ設定に基づいてハイパーリンクを文書に自動的に挿入するように構成されたハイパーリンク生成システムの一例のブロック図である。
図2】動的ハイパーリンク生成エンジンを介してハイパーリンクを自動的に生成するための、ネットワーク化されたコンピューティング・システムの一例のブロック図である。
図3】テキストの段落のキーワードにハイパーリンクが自動的に挿入され得る文書の構造要素の一例を示す。
図4】従来のハイパーリンク・システムで発生するハイパーリンク・エラーの第1の実施例を示す。
図5A】文書の構造要素におけるハイパーリンクの不正確な表現の一例を示す。
図5B図5Aのハイパーリンクのより正確な提示の一例を示す。
図6A】文書内の煩雑なハイパーリンク配置の一例を示す。
図6B図6Aと比較して、より整理されたハイパーリンクの配置の一例を示す。
図7】ハイパーリンクが自動的に挿入され得るパターンの第2の例を示す。
図8A図7のパターンに基づく、精度が低いハイパーリンクの配置の一例を示す。
図8B図8Aと比較して精度がより高いハイパーリンクの配置の一例を示す。
図9A】パターンを持つ構造要素における、精度が低いハイパーリンクの配置の一例を示す。
図9B図9Aと比較して、ユースケース・シナリオに従ったハイパーリンクのより適切な配置の一例を示す。
図10】ハイパーリンクが自動的に配置され得る構造要素の一例を示す。構造要素は箇条書きリストである。
図11】ハイパーリンクが自動的に配置され得る構造要素の一例を示す。構造要素は番号付きリストである。
図12】ハイパーリンクが自動的に配置され得る構造要素の一例を示す。構造要素は見出しである。
図13】ハイパーリンクが自動的に配置され得る構造要素の一例を示す。構造要素は表である。
図14】ハイパーリンクが自動的に配置され得る構造要素内のパターンの一例を示す。パターンは句読点であり、構造要素は箇条書きリストである。
図15】文書の可視部分におけるハイパーリンクの最大許容数に基づく自動ハイパーリンク生成の一例を示す。
図16】文書にハイパーリンクを自動的に挿入する方法の一例を示す。
【発明を実施するための形態】
【0013】
以下の説明は、動的ハイパーリンク生成システムの様々な実施形態に関する。動的ハイパーリンク生成システムは、図1に示すようなハイパーリンク生成エンジンを備えて構成されてもよく、これにより、文書、例えばウェブページにハイパーリンクを自動的に挿入することができる。動的ハイパーリンク生成システムは、図2に示すように、ネットワーク化されたコンピューティング・システムに含まれていてもよく、ハイパーリンクをウェブページの様々な構造要素に挿入することができる。ハイパーリンクの提示は、構造要素の種類および/またはパターンによって異なる場合がある。ハイパーリンクが構造要素/パターンの種類に応じてどのように提示され得るかの実施例を図3図15に示す。ハイパーリンクを表示するための構造固有の命令を提供する一連の規則に従って、ウェブページにハイパーリンクを自動的に挿入する方法の一例を図16に示す。
【0014】
本明細書では、テキストのハイパーリンクについて説明するが、システムおよび方法は、画像、アイコン、HTML要素などとして構成されたハイパーリンクなど、テキスト以外のアンカー付きハイパーリンクに対しても実施され得ることを理解されたい。ハイパーリンクアンカーは、ハイパーリンク先のウェブサイトの内部および外部のウェブページ、電子文書、画像など、異なる種類のリンク先にリンクしてもよい。リンク先には、文書ファイルタイプ、画像ファイルタイプ、ビデオファイルタイプ、音楽ファイルタイプ、PDF、PNG、JPG、TXT、スプレッドシートファイルタイプなど、様々なファイルタイプが混在して含まれていてもよい。
【0015】
図1を見ると、動的ハイパーリンク生成システム100がブロック図として描かれている。動的ハイパーリンク生成システム(以下、システム)100は、以下にさらに説明するように、電子テキストファイル内のコンテンツ構造に関してユーザが定義した規則に従って、ハイパーリンクをリアルタイムで自動的に生成し、電子テキストファイルに挿入してもよい。ハイパーリンクは、様々な種類のデジタルコンテンツを電子テキストファイルに関連付け得る。
【0016】
システム100は、サーバ、例えばウェブサーバ102、ハイパーリンク生成エンジン104、およびコンテンツデータベース106を含んでいてもよい。ハイパーリンク生成エンジン104は、コンテンツデータベース106からリンクされたコンテンツを引き出してもよい。サーバ102は、ネットワーク110(例えば、インターネット)によってクライアントシステム108に接続されていてもよい。サーバ102、クライアントシステム108、ネットワーク110などの各々のうちの1つだけが示されているが、他の実施例では、システム100の各要素のうちの2つ以上を含んでいてもよいことが理解されよう。さらに、各要素の代替タイプも可能である。例えば、サーバ102は、インターネット活動をホストするように構成されてもよいし、または、ネットワーク環境内のサーバであってもよい。
【0017】
サーバ102は、電子テキストファイルを含むウェブページなどのデータコンテンツをホストしてもよい。電子テキストファイルは、電子文書、電子メール、新着記事やその他のコンテンツ関連記事、ブログ投稿など、様々な種類のテキストベースのコンピュータ可読ファイルであってもよい。電子テキストファイルの各々は、HTML(Hyper-Text Markup Language)ファイル、XHTML(Extensible Hyper-Text Markup Language)ファイル、または他の同様の種類のファイルで形成されていてもよい。一例では、電子テキストファイルは、サーバ102とネットワーク110を経由してクライアントシステム108のウェブサイトにホストされ表示されるHTMLファイルであってもよい。
【0018】
電子テキストファイルは、ハイパーリンクの作成が開始されたときに要求に応じて読み出しができるように、コンテンツデータベース106に格納されていてもよい。一例として、サーバは、コンテンツデータベース106から電子テキストファイル112を読み出して、ハイパーリンク生成エンジン104に電子テキストファイル112を提供してもよい。ハイパーリンク生成エンジン104は、図3図9を参照して以下に説明するように、電子テキストファイル112を分析して処理して、電子テキストファイル112内の対象位置にハイパーリンクを挿入してもよい。ハイパーリンクの各々は、ハイパーリンクが埋め込まれている電子テキストファイル112内のポイント、例えばハイパーリンクアンカーと、アンカーとは異なる位置にある関連情報のソース、例えばハイパーリンクのリンク先との間の橋渡しとなり得る。
【0019】
ハイパーリンクは、href属性を使ってリンク先のURLを指定してもよい。しかし、他の例では、ウェブブラウザがサポートするURLスキームに準拠したHTTPベースのURL以外のプロトコルを使用してもよい。その他のハイパーリンク属性は、target(例えば、リンク先のURLをウェブページのどこに表示するか)、および、リンク先のURLにナビゲートする代わりにリンク先のURLをコンピュータに保存するようユーザに促すDownload属性などを含んでいてもよい。コンテンツデータベース106から電子テキストファイル112にハイパーリンクを追加する場合、ハイパーリンク生成エンジン104は、指示された場所および/または対象となる場所にハイパーリンクを追加することによって、電子テキストファイル112を修正してもよい。結果として得られた、電子テキストファイルの修正版は、元のファイルとは別に格納してもよい。電子テキストファイル112は、プレーンテキスト、Markdownなどを含む様々なフォーマットで書かれ、構文解析されていてもよく、最終的には、ユーザに返す前に、サーバ102によってHTMLに変換されてもよい。
【0020】
リンク先は、アンカーと同じ電子テキストファイルの別のセクションでも、1つ以上の電子テキストファイルで形成された同じウェブサイトに含まれる別の電子テキストファイル、または別のウェブサイトでもよい。ハイパーリンクアンカーは、ユーザがアンカーによって示されるトピックに関連する追加情報に容易にアクセスできるようにする、ユーザに表示されるウェブページ内の視覚的に明確な文字、単語、フレーズ、文、画像、絵文字、シンボルなどでもよい。ここで、ハイパーリンクは、変更可能なアンカーと、アンカーに基づいて選択されたリンク先との間のリンクを張ることができる。例えば、アンカーは、ウェブページに対してアクションを起こすユーザの行動を監視することによって決定され得るユーザが示した関心のあるトピックに対応するようにリアルタイムで変更されてもよい。ハイパーリンクのリンク先も同様に、アンカーの変化に応じてリアルタイムに調整されてもよく、それによってユーザが有用な情報を迅速に入手できる可能性を高めることができるようになる。
【0021】
電子テキストファイル112の対象位置を利用して、ウェブページデータベースインデックス114に照会して、ターゲットの位置に関連するウェブサイトを識別し、見つけてもよい。ウェブページデータベースインデックス114は、インデックス付き内部ウェブページ、例えば、電子テキストファイル112が表示されているウェブサイトと同じウェブサイトに含まれるウェブページ、および/または外部ウェブページ、例えば、電子テキストファイル112が表示されているウェブサイトとは異なるウェブサイトに含まれるウェブページ、または他の種類の電子文書のインデックス付きバージョンを含んでいてもよい。ウェブページデータベースインデックス114のインデックス付きウェブページは、電子テキストファイル112の対象位置に関連するメタデータで識別されたウェブページでもよく、ハイパーリンク生成エンジン104は、ウェブページデータベースインデックス114に照会して、対象位置に対応するメタデータ識別子を持つウェブページを見つけることができる。
【0022】
関連するウェブページを識別すると、ハイパーリンク生成エンジン104は、電子テキストファイル112の対象位置の各々にハイパーリンクを動的に生成することができ、それによって各ハイパーリンクで電子テキストファイル112を関連するウェブページにリンクすることができるようになる。一例では、ウェブページデータベースインデックス114は、ウェブページデータベース116に格納されたウェブページを正確に描写するウェブページのインデックス付きバージョンを含み、ウェブページデータベースはサーバ102に格納されてもよい。ウェブページがウェブページデータベース116に追加または削除されると、ウェブページデータベースインデックス114は通信リンク120を介して適宜更新され得る。ハイパーリンク生成エンジン104は、通信リンク120を介してウェブページデータベース116に格納されたウェブページのアドレスと位置にアクセスできる。電子テキストファイル112は、ハイパーリンク生成エンジン104によってハイパーリンク付き電子テキストファイル118に変換され、ハイパーリンク付き電子テキストファイル118をサーバ102に返すことによって、クライアントシステム108にアクセス可能になる。一部の例では、ハイパーリンク付き電子テキストファイル118は、コンテンツデータベース106に格納されてもよい。
【0023】
サーバ102とクライアントシステム108の詳細が、図2に描かれている。図2は、一実施形態による、ネットワーク・コンピューティング・システム200の一例を示すブロック図である。ネットワーク・コンピューティング・システム200は、サーバ102と、ネットワーク110を介してサーバ102に通信可能に接続されたクライアントシステム108とを含む。ネットワーク化されたコンピューティング・システム200の構成要素の配列および種類の変更が、本開示の範囲から逸脱することなくなされ得ることを理解されたい。例えば、ネットワーク・コンピューティング・システム200は、ネットワーク110を介してサーバ102に通信可能に接続された複数のクライアントシステム108を含んでいてもよい。
【0024】
サーバ102は、クライアントシステム108のような1つ以上のクライアントシステムへの要求に応じてウェブページを提供するように構成されたコンピューティング・システムを含む。サーバ102は、図1では単一のデバイスとして描かれているが、一部の実施形態では、ネットワーク・コンピューティング・システム200は、分散コンピューティングのために構成された複数のサーバ102を含んでいてもよい。異なる実施形態において、サーバ102は、メインフレームコンピュータ、サーバコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、ネットワークコンピューティングデバイス、モバイルコンピューティングデバイス、マイクロプロセッサなどの形態をとることができる。
【0025】
サーバ102は、論理サブシステム202とデータ保持サブシステム204を含む。論理サブシステム202は、1つ以上の命令を実行するように構成された1つ以上の物理デバイスを含んでいてもよい。例えば、論理サブシステム202は、1つ以上のアプリケーション、サービス、プログラム、ルーチン、ライブラリ、オブジェクト、コンポーネント、データ構造、または他の論理構成要素の一部である1つ以上の命令を実行するように構成されてもよい。このような命令は、タスクを実行するため、データタイプを実装するため、1つ以上のデバイスの状態を変換するため、またはその他の方法で所望の結果を得るために実装してもよい。
【0026】
論理サブシステム202は、ソフトウェア命令を実行するように構成された1つ以上のプロセッサを含んでいてもよい。追加的または代替的に、論理サブシステム202は、ハードウェアまたはファームウェア命令を実行するように構成された1つ以上のハードウェアまたはファームウェア論理マシンを含んでいてもよい。論理サブシステム202のプロセッサは、シングルコアであってもマルチコアであってもよく、そこで実行されるプログラムは、並列処理または分散処理のために構成されてもよい。論理サブシステム202は、任意選択で、2つ以上のデバイス全体に分散された個々のコンポーネントを含むことができ、これらのコンポーネントは、遠隔に配置されてもよく、かつ/または協調処理用に構成されてもよい。論理サブシステム202の1つ以上の態様は、仮想化され、クラウドコンピューティング構成で構成された遠隔アクセス可能なネットワークコンピューティングデバイスによって実行されてもよい。
【0027】
データ保持サブシステム204は、本明細書で説明する方法およびプロセスを実施するために、論理サブシステム202によって実行可能なデータおよび/または命令を保持するように構成された1つ以上の物理デバイスを含んでいてもよい。このような方法およびプロセスが実施されると、データ保持サブシステム204の状態が(例えば、異なるデータを保持するように)変換され得る。
【0028】
上述したように、サーバ102は、ウェブページのような文書内のハイパーリンクを自動的に生成するためのウェブサーバであってもよい。特に、本明細書でさらに説明するように、ハイパーリンク生成エンジン104は、データ保持サブシステム204にアップロードされた電子ファイルメタデータに関連するコードを評価し、評価されたコードに基づいて、図1のウェブページデータベースインデックス114およびウェブページデータベース116を含む1つ以上のデータベース206を生成し、さらなるユーザ入力なしでハイパーリンクを自動的に生成してもよい。1つ以上のデータベース206が、サーバ102のデータ保持サブシステム204に格納されるように描かれているが、一部の例では、1つ以上のデータベース206は、サーバ102に通信可能に接続され、ネットワーク110を介してアクセス可能な別のコンピューティング・システムに格納され得ることを理解されたい。
【0029】
サーバ102は、表示サブシステム208と通信サブシステム210をさらに含んでいてもよい。含まれる場合、表示サブシステム208は、データ保持サブシステム204によって保持されるデータの視覚的表現を提示するために使用されてもよい。本明細書で説明する方法およびプロセスが、データ保持サブシステム204によって保持されるデータを変更し、したがってデータ保持サブシステム204の状態を変換すると、表示サブシステム208の状態も同様に、基礎となるデータの変化を視覚的に表すように変換されてもよい。表示サブシステム208は、事実上あらゆる種類の技術を利用した1つ以上の表示装置を含んでいてもよい。このような表示装置は、共有筐体内で論理サブシステム202および/またはデータ保持サブシステム204と組み合わされてもよく、あるいは、このような表示装置は周辺表示装置であってもよい。
【0030】
含まれる場合、通信サブシステム210は、サーバ102を、クライアントシステム108などの1つ以上の他のコンピューティングデバイスと通信可能に接続するように構成されてもよい。通信サブシステム210は、1つ以上の異なる通信プロトコルに対応する有線および/または無線通信デバイスを含んでいてもよい。非限定的な例として、通信サブシステム210は、無線電話網、無線ローカルエリアネットワーク、有線ローカルエリアネットワーク、無線ワイドエリアネットワーク、有線ワイドエリアネットワークなどを介して通信するように構成されてもよい。一部の実施形態では、通信サブシステム210は、サーバ102が公衆インターネットを介して他のデバイスとの間でメッセージを送信および/または受信することを可能にしてもよい。例えば、通信サブシステム210は、ネットワーク110を介してサーバ102とクライアントシステム108とを通信可能に接続してもよい。一部の例では、ネットワーク110は公衆インターネットであってもよい。他の例では、ネットワーク110は、プライベートネットワーク接続と見なすことができ、例えば、仮想プライベートネットワーク、または公衆インターネット上で採用される暗号化または他のセキュリティ機構を含んでいてもよい。
【0031】
さらに、サーバ102は、ネットワーク110を介してサーバ102と通信可能に接続されたクライアントシステム108などの複数のクライアントシステムを介して、複数のユーザがアクセス可能なネットワークサービスを提供する。このように、ネットワーク・コンピューティング・システム200は、クライアントシステム108のような、ユーザによって操作される1つ以上のデバイスを含んでいてもよい。クライアントシステム108は、パーソナルデスクトップコンピュータ、ラップトップ、スマートフォン、タブレットなどを含むがこれらに限定されない、ネットワーク110などのネットワークにアクセスするように構成された任意のコンピューティングデバイスであってもよい。1つのクライアントシステム108が示されているが、任意の数のユーザデバイスまたはクライアントシステムが、ネットワーク110を介してサーバ102に通信可能に接続され得ることを理解されたい。
【0032】
クライアントシステム108は、論理サブシステム212とデータ保持サブシステム214を含む。クライアントシステム108は、任意選択で、表示サブシステム216、通信サブシステム218、ユーザインターフェースサブシステム220、および/または任意選択で図2に示されていない他の構成要素を含んでいてもよい。
【0033】
論理サブシステム212は、1つ以上の命令を実行するように構成された1つ以上の物理デバイスを含んでいてもよい。例えば、論理サブシステム212は、1つ以上のアプリケーション、サービス、プログラム、ルーチン、ライブラリ、オブジェクト、コンポーネント、データ構造、または他の論理構成要素の一部である1つ以上の命令を実行するように構成されてもよい。このような命令は、タスクを実行するため、データタイプを実装するため、1つ以上のデバイスの状態を変換するため、またはその他の方法で所望の結果を得るために実装してもよい。
【0034】
論理サブシステム212は、ソフトウェア命令を実行するように構成された1つ以上のプロセッサを含んでいてもよい。追加的または代替的に、論理サブシステム212は、ハードウェアまたはファームウェア命令を実行するように構成された1つ以上のハードウェアまたはファームウェア論理マシンを含んでいてもよい。論理サブシステム212のプロセッサは、シングルコアでもマルチコアであり得、その上で実行されるプログラムは、並列処理または分散処理のために構成されてもよい。論理サブシステム212は、任意選択で、2つ以上のデバイス全体に分散された個々のコンポーネントを含み得、これらのコンポーネントは、遠隔に配置されてもよく、かつ/または協調処理のために構成されていてもよい。論理サブシステム212の1つ以上の態様は、クラウドコンピューティング構成で構成された遠隔アクセス可能なネットワークコンピューティングデバイスによって仮想化され、実行されてもよい。
【0035】
データ保持サブシステム214は、本明細書で説明する方法およびプロセスを実施するために、論理サブシステム212によって実行可能なデータおよび/または命令を保持するように構成された、1つ以上の物理的な非一過性のデバイスを含んでいてもよい。このような方法およびプロセスが実施されると、データ保持サブシステム214の状態を(例えば、異なるデータを保持するように)変換してもよい。
【0036】
データ保持サブシステム214は、リムーバブルメディアおよび/または内蔵デバイスを含んでいてもよい。データ保持サブシステム214は、光メモリ(例えば、CD、DVD、HD-DVD、ブルーレイディスクなど)、および/または磁気メモリデバイス(例えば、ハードディスクドライブ、フロッピーディスクドライブ、テープドライブ、MRAMなど)などを含んでいてもよい。データ保持サブシステム214は、揮発性、不揮発性、動的、静的、読み取り/書き込み、読み取り専用、ランダムアクセス、シーケンシャルアクセス、ロケーションアドレス指定可能、ファイルアドレス指定可能、およびコンテンツアドレス指定可能のうちの1つ以上の特徴を有するデバイスを含んでいてもよい。一部の実施形態では、論理サブシステム212およびデータ保持サブシステム214は、特定用途向け集積回路またはシステムオンチップなどの1つ以上の一般的なデバイスに統合されてもよい。
【0037】
含まれる場合、表示サブシステム216は、データ保持サブシステム214によって保持されるデータの視覚的表現を提示するために使用されてもよい。本明細書で説明する方法およびプロセスが、データ保持サブシステム214によって保持されるデータを変更し、したがってデータ保持サブシステム214の状態を変換すると、表示サブシステム216の状態も同様に、基礎となるデータの変化を視覚的に表すように変換されてもよい。表示サブシステム216は、事実上あらゆる種類の技術を利用した1つ以上の表示装置を含んでいてもよい。このような表示装置は、共有筐体内で論理サブシステム212および/またはデータ保持サブシステム214と組み合わされてもよく、あるいは、このような表示装置は周辺表示装置であってもよい。
【0038】
一例では、本明細書でさらに説明するように、クライアントシステム108は、論理サブシステム212によって実行されると、論理サブシステム212に様々な動作を実行させる実行可能命令222をデータ保持サブシステム214に含んでいてもよい。一例として、クライアントシステム108は、命令222を介して、サーバ102によって送信された1つ以上のハイパーリンクを含むウェブページを受信し、表示サブシステム216上のグラフィカルユーザーインターフェースを介してハイパーリンクされたウェブページをユーザに表示するように構成されてもよい。
【0039】
含まれる場合、通信サブシステム218は、クライアントシステム108を、サーバ102などの1つ以上の他のコンピューティングデバイスと通信可能に接続するように構成されてもよい。通信サブシステム218は、1つ以上の異なる通信プロトコルに対応する有線および/または無線通信デバイスを含んでいてもよい。非限定的な例として、通信サブシステム218は、無線電話網、無線ローカルエリアネットワーク、有線ローカルエリアネットワーク、無線ワイドエリアネットワーク、有線ワイドエリアネットワークなどを介して通信するように構成されてもよい。一部の実施形態では、通信サブシステム218は、クライアントシステム108が、ネットワーク110を介して、サーバ102などの他のデバイスとの間でメッセージを送信および/または受信することを可能にし得る。
【0040】
クライアントシステム108は、キーボード、マウス、ゲームコントローラ、カメラ、マイクロフォン、および/またはタッチスクリーンなどのユーザ入力デバイスを含むユーザインターフェースサブシステム220をさらに含んでいてもよい。クライアントシステム108のユーザは、例えば、ユーザインターフェースサブシステム220を介して、サーバ102によって格納されたウェブページのハイパーリンクをロードする、あるいはアクションを起こす要求を入力することができる。
【0041】
したがって、サーバ102およびクライアントシステム108は各々、一般に、計算を実行するように構成され、1つ以上の有線および/または無線通信インターフェースを介してデータ通信を送受信することができる任意のデバイスを含み得るコンピューティングデバイスを表す。このようなデバイスは、様々なネットワークプロトコルのいずれかを使用して通信するように構成されてもよい。例えば、クライアントシステム108は、サーバ102から情報を要求するためにHTTPを採用した後、表示サブシステム216のようなディスプレイ上でユーザに検索された情報を表示する命令222として格納されたブラウザアプリケーションを実行するように構成されてもよい。
【0042】
ハイパーリンク生成エンジン、例えば、図1および図2のハイパーリンク生成エンジン104では、ウェブページのハイパーリンクを自動的に挿入することを可能にし得る。ウェブページにハイパーリンクを自動的に挿入する従来の方法とは対照的に、ハイパーリンク生成エンジン104は、ウェブページで利用可能な構造要素の種類に基づいてハイパーリンクを追加してもよい。言い換えれば、ハイパーリンクの配置はページ構造に基づいて決定されてもよい。さらに、ハイパーリンクの配置と提示は、例えばキーワードに基づいてハイパーリンクを挿入する場合と比較して、より識別可能で適切なハイパーリンクの配置を提供する、ユーザが定義した一連の規則に従って選択されてもよい。ページ構造に従ってハイパーリンクを追加することで、ウェブページをナビゲートする際のユーザ体験が向上し得、ユーザはより効率的に所望の情報を得ることができる。さらに、ハイパーリンクは、ウェブページ内の、より美的に魅力的で有意義な位置に配置してもよく、それによって、ユーザがハイパーリンクとアクションを起こす可能性を高めることができる。
【0043】
一例として、ハイパーリンクを生成する従来のシステムでは、電子テキストファイル内のキーワードがハイパーリンクされるように識別されてもよく、その結果、ウェブページ内でキーワードが反復されるたびにハイパーリンクが作成される。場合によっては、キーワードがウェブページのセクションで何度も繰り返される場合もある。例えば、キーワードはウェブページの各段落の各文章に少なくとも1回登場する場合もある。その結果、セクション内にハイパーリンクが多すぎて、テキストが煩雑に見え、ユーザに不快感を与える場合がある。同様に、ハイパーリンク生成のための従来の方法は、別のキーワード内でハイパーリンクされるキーワードの識別、ダッシュ、アポストロフィを有するキーワードへの適応、複数形、またはキーワードの変化形、および/またはキーワードの重複マッチングへの適応などの機能を含まない場合がある。
【0044】
一例では、本明細書で説明するように、ハイパーリンク生成エンジンは、ウェブページで表示される特定のフォーマット、例えばパターン、および構造要素に基づいて、ハイパーリンクの配置を選択してもよい。例えば、ハイパーリンク生成は、テキストおよび/または文書処理アルゴリズムを介して、様々な種類のリスト(箇条書き、番号付きなど)、見出し、表、テキストの段落、画像上の座標などの構造要素を識別し、ハイパーリンク配置の一連の規則を参照することができる。その一連の規則はユーザに定義されることがある。パターンには、ハイパーリンクを配置するターゲットアンカー(例えばキーワードなど)の出現率または頻度、ハイパーリンク間の距離、ウェブページにおけるハイパーリンクの最大許容数、ハイパーリンクされる構造要素の割合(%)などを含んでいてもよい。構造要素内のハイパーリンクの位置は、一連の規則に基づいて決定されてもよい。一例として、箇条書きリストの行頭記号の前または後のハイパーリンクの配置は、一連の規則によって決定されてもよい。ハイパーリンク生成エンジンを介したハイパーリンク挿入のさらなる詳細は、図3~7を参照して以下に提供する。
【0045】
次に図3を見ると、テキストの段落300内にハイパーリンクを挿入するための構造要素の第1の実施例が示されている。段落300は、段落の様々な単語または用語に配置された複数のハイパーリンクを含む。このように、複数のハイパーリンクの1つが配置される各用語は、ハイパーリンクアンカーと呼ばれる。段落300に描かれた各アンカーは、その段落のトピックに関連する有用な情報を提供する特定の用語またはフレーズに対応する場合がある。
【0046】
例えば、段落300は、フットボールにおける「得点ルール」を定義することに向けられており、各アンカーは、「得点ルール」をさらに定義し、かつ/または「得点ルール」と有意義な関係を持つ表現方法である。各アンカーは、さらなる興味を喚起し得、したがってユーザ、例えば、ウェブページを熟読しているユーザが、アンカーによって紹介されたトピックに関する情報を提供する別のウェブページまたは電子文書にナビゲートできるように、ハイパーリンクが張られている場合がある。アンカーに繋がるリンク先は、例えばハイパーリンクによって提供されるように、別のウェブページや電子文書への直接的なナビゲーション以外の様々な方法で提示され得ることが理解されよう。他の例としては、例えば、ウェブページをスクロールして、アンカーに関する情報を提供するウェブページの別のセクションに移動することが挙げられる。別の例として、ユーザがアンカーに対してアクションを起こすと、現在のウェブページのポップアップ表示をアクティブにすることができ、ポップアップはアンカーの定義、アンカーに関連するリンク先のリストなどを提示することができる。
【0047】
一例では、アンカーは、ユーザ(例えば、ハイパーリンク生成エンジンに規則を提供するユーザ)によって定義されたキーワードおよびキーフレーズの所定のセットに基づいて、ハイパーリンク生成エンジンによってウェブページに表示されたテキストから選択されてもよい。別の例では、キーワードの所定のセットは、機械学習(ML)および/または人工知能(AI)を使用して定義されてもよい。例えば、ウェブページ/ウェブサイトの構造要素や、または関連するウェブページ/ウェブサイトの構造要素、ならびにキーワード、フレーズ、リンク先を、ウェブサイトのウェブページタイトルに基づいて自動的に識別し、テキスト・リンク先マップの生成に使用してもよい。
【0048】
テキスト・リンク先マップは、ウェブページのどの要素、例えば対象位置にハイパーリンクが張られているか、ハイパーリンクがウェブページを何に接続しているかの記録を構築するためのツールとして使用してもよい。さらに、テキスト・リンク先マップは、ハイパーリンクが、格納された関係および関連付けに基づいて生成される、1つ以上のリンク可能なテキストと1つ以上のリンク先との間の関係および関連付けを格納してもよい。
【0049】
テキスト・リンク先マップは、ハイパーリンク生成エンジンが、ハイパーリンクアンカーとして使用できる名詞、エンティティ、名前、フレーズ、画像など、ウェブサイトの各ウェブページにあるリンク可能なテキストと、それらに関連するリンク先を自動的に識別できるようにしてもよい。将来のハイパーリンク生成のために、ハイパーリンク生成エンジンがアクセスできるレコードが作成されてもよい。このツールは、ユーザがウェブページに対してアクションを起こしているときにリアルタイムで照会し得るアンカーとリンク先のマップを生成することができ、有意義で有用な動的ハイパーリンクの配置を支援することができる。テキスト・リンク先マップは、例えば、ハイパーリンク生成エンジンがアクセス可能なデータベースに記録されてもよい。
【0050】
ユーザによって提供される、またはML/AIを介して生成されるキーワードの所定のセットは、ハイパーリンク生成エンジンのための一連の規則に格納され得、ハイパーリンク生成エンジンは、ハイパーリンク挿入が要求される各ウェブページのキーワードのセットを参照してもよい。ウェブページはグループ化されたり、またはタグ付けされたりすることがあり、それらは対応するタグを持つ所定のキーワードの参照セットと照合されてもよい。代替的にページごとにキーワードを設定してもよい。キーワードは、文脈に関係なく「どこにでもリンクする」ように構成されたグローバルキーワードであってもよいし、または「トピック内にのみリンクする」ように構成された文脈ベースのキーワードであってもよい。キーワードはトピックによって異なる意味を持つことがあるため、ハイパーリンクのための(トピックに応じた)より関連性の高いキーワードのリストが、ユーザまたはAI/MLによって決定されてもよい。キーワードは、重要度や関連性に基づいて、より高いウェイトまたはランキングを持ち得る。例えば、実体の名前は形容詞よりも高いウェイトまたはランクを持っていてもよい。
【0051】
一例として、テキスト・リンク先マップは、ユーザ入力によって生成されることもあれば、あるいは、ウェブサイトのウェブページやメタデータが読み込まれるAI/MLによって生成されてもよい。キーワードおよび/またはキーフレーズは、テキストコーパスとキーワード/キーフレーズのデータベースとの間のマッチングに基づいて、テキストコーパス内で識別されてもよい。ハイパーリンクは、テキスト・リンク先マップからキーワード/キーフレーズにリンク先をリンクする、マッチ(match)で作成してもよい。
【0052】
一連の規則がなければ、キーワード/キーフレーズのデータベースだけを使った自動ハイパーリンク生成は、処理能力に大きな負担をかけ、エラーを起こしやすい可能性がある。例えば、図4に示すように、ハイパーリンク生成エンジンは、周囲のテキストまたは識別されたキーワードのコンテキストに基づいて、適切なハイパーリンクの配置を決定できないこともあり得る。例えば、図4に示す段落400の2つ目の行頭記号では、ハイパーリンク生成エンジンは、「ポイント」とキーワードデータベースとの間の一致を見つけ、そこにハイパーリンク402を生成し得る。しかし、段落400では、段落400のトピックに基づき、「ポイント」だけでなく、「2ポイントコンバージョン」の方がより適切なアンカーであり得る。そのため、「ポイント」に設定されたハイパーリンクは、関連性が低く、ユーザにとって関心の薄いリンク先に固定される場合がある。
【0053】
別の例として図5Aに示すように、一連の規則は、フレーズを形成するように意味がリンクされた用語にハイパーリンクを配置するように命令を提供することができる。ウェブページ内のテキストを自動的にハイパーリンクする従来のシステムは、例えば、キーワードの識別のみに基づいて、アンカー500の適切なコンテキストを考慮することなく、ハイパーリンクするアンカー500を選択することを含み得る。テキスト502の段落の第3文は、ランニングバックの説明を提供し得るが、従来のシステムは、フレーズの第1部分、例えば「ランニング」とフレーズの第2部分、例えば「バック」との間の関係を認識するように構成されていない場合がある。その結果、最初の部分のみがアンカー500として使用され、「ランニングバック」ではなく、「ランニング」に関連するリンク先にリンクされる場合がある。
【0054】
対照的に、図5Bに示すように、ハイパーリンク生成エンジンは、図5Aのテキスト502の段落のトピックに基づいて、ハイパーリンクのより適切なアンカー550を評価できるように、一連の規則で構成されてもよい。場合によっては、テキスト502の段落の見出し(例えば、「フットボールのタッチダウン」)、またはウェブページのタイトルを使用して、トピックを識別してもよい。そのため、「ランニングバック」というフルフレーズが、「ランニング」単独よりも関連性が高いと判断され、アンカー550として使用することができる。ハイパーリンクのリンク先は、ランニングバックに関する追加情報を提供し得る。ハイパーリンク生成エンジンは、長いアンカーテキストほど関連性が高いため、複数の可能性のあるアンカーを比較する場合、長いアンカーテキストを最初に使用するように構成されてもよい。その結果、「ランニング」ではなく「ランニングバック」をハイパーリンクすることにより、フットボールのタッチダウンにより関連性の高いリンク先へのリンクを張ることができる。
【0055】
ハイパーリンク生成エンジンを誘導する一連の規則を実装することによって、ハイパーリンクは、データベースからのキーワード/キーフレーズとのマッチングと、一連の規則を満たすことの両方の後にのみ生成され得る。一連の規則を満たすことで、ハイパーリンク間の距離またはウェブページの構造要素の一部など、構造、ユーザが定義した規則、およびパターンを考慮しながら、キーワード/キーフレーズを関連するリンク先に自動的にリンクされ得る。
【0056】
ハイパーリンク生成エンジンに命令を与える一連の規則は、アンカーとして表示される用語またはフレーズが、その後にアンカーとして表示される頻度に関する規則を含んでいてもよい。例えば、一連の規則は、用語またはフレーズの最初の出現時にハイパーリンクを張り、それ以降に出現する用語またはフレーズにはハイパーリンクを張らないことを含んでいてもよい。図3に戻ると、複数のハイパーリンクのうちの最初のハイパーリンク302が、「得点」の第1のアンカーで示されている。「得点(すること)」には、「得点する (score)(動詞)」「得点する (scores)(動詞)」などの様々なバージョンの外観が登場するが、ハイパーリンクは張られていない。したがって、ハイパーリンクアンカーとして使用される用語またはフレーズの異なる変化形は、ハイパーリンク生成エンジンによって、そのフレーズの用語のハイパーリンクされたバージョンに関連していると認識される場合がある。同様に、「エンドゾーン」の2番目のアンカーにリンクされた複数のハイパーリンクのうち、2番目のハイパーリンク304は、段落300では複数回使用されているが、「エンドゾーン」の最初のインスタンスだけがハイパーリンクされている。しかし、他の例では、複数のキーワード/キーフレーズが2回以上出現してもハイパーリンクされる場合もある。例えば、一連の規則には、ウェブページのセクション内でキーワードの最初の出現箇所と2番目の出現箇所をハイパーリンクすることを含んでいてもよい。さらに、キーワードがテキストに登場する「1回おき」「3回おき」「4回おき」にハイパーリンクを張るように命令するなど、出現率に基づくパターンを設定してもよい。ハイパーリンク生成エンジンは、ハイパーリンクされたすべてのキーワードのカウントを監視してもよい。
【0057】
他の例では、アンカーとして選択された用語/フレーズは、ウェブページの他の所望の間隔でハイパーリンクされてもよい。例えば、用語/フレーズは、ウェブページの各段落で1回目に出現する用語/フレーズ、またはウェブページの異なる構造要素で1回目に出現する用語/フレーズのアンカーとして構成されてもよい。一例として、用語/フレーズは、段落、リスト、および表において、その用語/フレーズが1回目に出現する箇所でハイパーリンクされてもよい。別の例として、アンカーとして設定された用語/フレーズの頻度は、その用語/フレーズがウェブページに含まれる頻度に対して重み付けされてもよい。
【0058】
ハイパーリンクの適切な配置を評価するために、構造要素内のパターンを使用することもできる。上述したように、パターンは用語の出現率または頻度を含んでいてもよい。例えば、図6Aに示すように、第1の段落602と第2の段落604を含むテキストのセクション600において、「タッチダウン」という用語がテキストのセクション600全体を通して繰り返し現れる。ハイパーリンク生成エンジンは、その用語が出現する頻度を検出し、その用語をハイパーリンクされるキーワードとして指定することができる。しかし、テキスト600内のアンカーの選択は、アンカーの視覚的に魅力的な配置を提供するために、一連の規則に基づいて決定されてもよい。
【0059】
例えば、ハイパーリンクを自動的に生成する従来のシステムでは、図6Aに示されるように、「タッチダウン」という用語の各出現をアンカーとして割り当て得る。アンカーとして同じ用語を使用するこのような頻度のハイパーリンクの配置は、ユーザから過度に反復的であるとみなされてもよい。しかし、ハイパーリンク生成エンジンを代わりに使用した場合、一連の規則は、ハイパーリンク生成エンジンがアンカーとして選択された用語の繰り返しに対してどのように対処するかを定義してもよい。一例として、図6Bに示すように、一連の規則は、ハイパーリンクされる第1の段落602と第2の段落604の各々において、用語の1回目の出現のみを使用する命令を提供してもよい。言い換えれば、ハイパーリンク生成エンジンによってセクションリセットが識別される場合があり、この場合、新しい段落または新しい見出しに遭遇したときにセクションリセットが認識される。したがって、ユーザは、テキストのセクション600の外観が整理された状態のまま、前後にスクロールすることなく、ハイパーリンクを容易に見つけることができる。このパターンは、文書内で「every other(1つおき)」または「hyperlink every other occurrence(1つおきの出現に対してハイパーリンクを設定する)」と呼ばれる場合もある。
【0060】
ウェブページの構造要素内でのハイパーリンクの配置を決定するために使用されるパターンには、ハイパーリンク配置のためのアンカーとして識別された用語/フレーズ間の文字距離も含んでいてもよい。図7を見てみると、図6A図6Bのテキストのセクション600は、数字と矢印で示された注釈付きで示されているが、これは説明のために提示されたものであり、実際にウェブページに表示されるものではない。テキストのセクション600の第1の段落602は、第1のハイパーリンクのための第1のアンカー702(例えば、「タッチダウン」(touchdown))と、第2のハイパーリンクのための第2のアンカー704(例えば、「エンドゾーン」(end zone))を含む。図7の矢印、およびテキストのセクション600の上に配置された数字で示すように、第1のアンカー702は、第1の段落602の最初の文字(例えば、「A」)の後の10文字(スペースを含む)の位置で終了する。第2のアンカー704は、第1の段落602の最初の文字から110文字後の位置から始まる。従って、第1のアンカー702の終端は、第2のアンカー704の始端から101文字分離れており、この距離は、一連の規則に含まれる閾値距離よりも大きいか小さくあり得る。閾値距離は、図7におけるハイパーリンクの配置決定には適用されない。図7に加え、図8Aおよび図9Aのテキストのセクションの上に配置された矢印と数字は、同様に説明のためのものであり、ウェブページには実際には表示されないことに留意されたい。
【0061】
対照的に、図8Aに示すように、第1のアンカー702は、テキストのセクション600の上に配置された矢印と数字で示すように、第3のアンカー802から5文字分離れている。第1のアンカー702と第3のアンカー802との間の距離は、閾値距離未満である可能性があり、閾値距離は5文字以下の距離である可能性がある。ハイパーリンク生成エンジンは、一連の規則に基づいて、図8Bに示すように、第1のアンカー702と第3のアンカー802をハイパーリンク用の単一の第4のアンカー850に結合するように構成されてもよい。
【0062】
アンカーを分離するか、または結合するかを決定するための閾値距離の使用は、箇条書きリストのような他の構造要素にも適用してもよい。さらに、一連の規則は、ハイパーリンクによって形成される構造要素の割合(%)に基づいて、隣接するハイパーリンクを結合する命令も含んでいてもよい。例えば、箇条書きリスト900が図9A図9Bに示されている。箇条書きリスト900の第1の箇条書き項目は第1のアンカー902を含み、箇条書きリスト900の第2の箇条書き項目は第2のアンカー904と第3のアンカー906の両方を含む。
【0063】
第1の箇条書き項目において、第1のアンカー902を形成する第1の箇条書き項目におけるテキストの割合(%)が、第1のアンカー902を調整するために使用されてもよい。例えば、「inbounds(インバウンド)」の第1のアンカー902は、「stay“inbounds」(インバウンドにとどまる)に含まれる合計13文字のうち8文字を含み、それによって第1の箇条書き項目の62%が組み込まれる。ハイパーリンク生成エンジンは、第1のアンカー902によって形成された第1の箇条書き項目の割合(%)部分を比較し、割合部分(%)を閾値パーセントと比較するように構成されてもよい。例えば、閾値の割合(%)は50%、60%、またはその他の割合(%)であってもよい。第1のアンカー902の割合部分(%)が閾値の割合(%)よりも大きい場合、第1のアンカー902は、図9Bに示すように、「stay(とどまる)」を含むように拡張されてもよい。その結果、第1のアンカー902は、ウェブページのセクションのトピックに関連するより顕著なフレーズに調整されてもよい。
【0064】
図9Aの第2の箇条書き項目(第1の箇条書き項目の下に位置する第2の箇条書き項目)において、第2のアンカー904と第3のアンカー906との間の文字距離が、例えば上述したように、閾値距離未満であると判定される場合がある。第2のアンカー904と第3のアンカー906を組み合わせて1つのアンカーとすることもできるが、適切なリンク先を選択することが要求される。例えば、単一の結合されたアンカーは、第2のアンカー904のリンク先、または第3のアンカー906のリンク先にリンクされてもよい。アンカーの変更は、第2の箇条書き項目のテキストのうち、どちらのアンカーの割合(%)が大きいかに基づいて実行されてもよい。例えば、「ゴールライン(goal line)」よりも「エンドゾーンラインを割る(break the plane)」の方が、2番目の箇条書きのテキストに占める割合(%)が大きい。従って、第2のアンカー904は第3のアンカー906よりも重く重み付けされ得、または高くランク付けされ得、また、図9Bに示すように、第2のアンカー904は第3のアンカー906を包含するように延長されてもよい。図9Bの第2のアンカー904のリンク先は、「ゴールライン」ではなく「エンドゾーンラインを割る」に対応する場合がある。
【0065】
箇条書きリスト1000の別の例を図10に示す。箇条書きリスト1000には、アルファベット順に提示されたスポーツのカタログが含まれている。箇条書きリスト1000の各項目1002は、スポーツの種類の名称の前に、例えばドットで描かれた行頭記号1004によって示される。箇条書き項目1002の前に配置された行頭記号1004の識別、および行頭記号1004に続く箇条書き項目1002のテキストからの行頭記号1004の識別に基づいて、ハイパーリンク生成エンジンによってハイパーリンクが箇条書きリスト1000に挿入されてもよい。
【0066】
図10の箇条書きリスト1000の場合、ハイパーリンクをリストに挿入するための一連の規則は、リストを定義するための命令、例えば、ウェブページの縦軸に沿って整列された一連の行頭記号の検出、および一連の行頭記号の検出に応答して、行頭記号の各々の後に表示されたテキストにハイパーリンクを挿入する(例えば、水平方向に)命令を含んでいてもよい。その結果、箇条書きリストは、効率的かつ美的に魅力的な方法で自動的にハイパーリンクされてもよい。
【0067】
リストが箇条書きではなく番号付きの場合、ハイパーリンク生成エンジンは同様に、一連の規則に基づいてハイパーリンクを自動的に挿入してもよい。例えば、一連の規則は、箇条書きまたは番号付きリストの各項目の全文をハイパーリンクするか、または、テキストのいずれもハイパーリンクしないようにする命令を含んでいてもよい。別の例として、一連の規則は、各項目で単一のハイパーリンクを生成することのみが含んでいてもよい。図11に示すように、ハイパーリンクが自動的に挿入され得るウェブページの構造要素の別の例が、番号付きリスト1100として描かれている。一連の規則は、一例として、ウェブページの縦軸に沿って配置された、各番号の後に用語またはフレーズが続く一連の番号を識別するための命令をさらに含んでいてもよい。ハイパーリンク生成モジュールは、ハイパーリンクを、番号に続き、番号を含まない、番号付き各項目の用語/フレーズ全体に挿入するように命令されてもよい。
【0068】
自動ハイパーリンク挿入のためのウェブページの構造要素のさらに別の例が、図12に段落1202の見出し1200として示されている。ハイパーリンク生成エンジンは、例えば、一連の規則によって定義されているように、見出し1200のフォントサイズおよび/または書体、見出し1200のフォントスタイル、段落1202に対する見出し1200の位置などに基づいて、見出し1200が段落1202から区別されるように識別するように構成されてもよい。一連の規則は、見出し1200のどれだけの割合、例えば見出しの文字の割合(%)がアンカーとして構成されるかについての命令をさらに提供してもよい。例えば、見出し1200は「フットボール」と「タッチダウン」という2つの用語で提示され、段落1202に記述された関連する関心のあるトピックの完全な名称を提供するために、見出し1200の両方の単語を含める必要があると判断されてもよい。見出しの一方の用語のみ、例えば「フットボール」のみ、または「タッチダウン」のみをハイパーリンクすると、関心のあるトピックを正確に表現できない可能性があるため、見出し1200では両方の用語がハイパーリンクされている。
【0069】
しかし、他の例では、見出しの代わりに、文章である場合があり、文中の用語の一部が関心のあるトピック固有のものでない可能性がある。そのような場合、見出しの関連部分のみがアンカーとして構成されてもよい。ハイパーリンク生成エンジンは、例えば、見出しを識別するために提供される規則と、キーワードを識別するために提供される規則の組み合わせに基づいて、論理的な決定を行うことができる。このように、アンカーの構成は両方の種類の規則を満たすことに基づいて選択されてもよく、例えば、見出し内のキーワードがハイパーリンクアンカーとして設定される。
【0070】
次に図13を見ると、自動ハイパーリンク挿入用ウェブページの構造要素は、表1300を含んでいてもよい。表1300は2列で図示されているが、本明細書で説明する表への自動ハイパーリンク挿入の適用は、様々な寸法の表、例えば任意の数の列および行に適用可能であることが理解されよう。表1300の列の第1の列1302は、エアスポーツの名前を提供してもよい。表1300の第2の列1304は、第1の列1302に列挙された対応するエアスポーツの簡単な説明を提供してもよい。表1300内のハイパーリンクの配置は、第1の列1302のみのハイパーリンクを指示する一連の規則によって定義されてもよい。
【0071】
パターンに基づくハイパーリンクの配置の別の例では、句読点を使用してハイパーリンクの適切な配置を決定してもよい。一例として、箇条書きリスト1400が図14に示されており、各々の箇条書き項目は、コロンが続く用語を含む。コロンは、その用語の定義を示すコロンに続く文から用語を切り離す。一連の規則は、コロンに先行する用語をハイパーリンクアンカーとして使用する、そしてコロンに続く文へのハイパーリンクの挿入を禁止する命令を含んでいてもよい。このように、箇条書きリスト1400内のハイパーリンクの位置は、均一かつ整理されている。追加的に、セミコロン、ハイフン、コンマなど、一貫したパターンで、例えば、リスト内の各箇条書きの各最初の用語またはフレーズの後に配置された他の種類の句読点が、ハイパーリンクの配置を決定するために使用されてもよい。
【0072】
ハイパーリンク生成エンジンの一連の規則には、ユーザに見えるウェブページの一部、例えば可視画面内に表示されるハイパーリンクの最大許容数も含んでいてもよい。例えば、可視画面1500の一例が図15に描かれているが、これはテキストの段落1502を示しており、テキストの各段落は見出し1504を有している。ハイパーリンクの最大許容数1506は、説明のために可視画面1500の右上隅に表示されているもので、可視画面1500で実際にユーザに表示されるわけではない。
【0073】
図15に描かれているように、一例では、ハイパーリンクの最大許容数1506は8個のハイパーリンクに設定されてもよい。ハイパーリンク生成エンジンは、一連の規則に基づいて、ハイパーリンク配置のための候補アンカーを評価するように構成されてもよい。例えば、ハイパーリンク生成エンジンは、テキストの段落1502内のキーワード、見出し1504、および上記のような他の構造要素およびパターンなど、可視画面1500内の構造要素およびパターンの位置を識別してもよい。すべてのアンカー候補を識別すると、ハイパーリンク生成エンジンは、各種類のアンカー候補の数をハイパーリンクの最大許容数1506と比較して、ハイパーリンクに最も適した種類のアンカーを決定するように構成されてもよい。
【0074】
一例として、図15に示すように、可視画面1500には、見出し1504の3つと、テキストの段落1502に3つより多いキーワードが含まれている。一連の規則は、最も候補の多いアンカーを持つ構造要素をハイパーリンクすることによって、ハイパーリンクの最大許容数1506を満たす命令を含んでいてもよく、それによって、可視画面1500でハイパーリンクされる構造要素の種類の一貫性を維持することができるようになる。ハイパーリンクとして構成されてもよいのは、1種類の構造要素またはパターンのみである。しかし、他の例では、一連の規則は、代わりに見出し1504のハイパーリンクを優先する命令を提供してもよく、ハイパーリンクの最大許容数1506の残りの5つのハイパーリンクは、テキストの段落1502のキーワードになど、異なる構造要素またはパターンで提示される場合もある。
【0075】
さらに他の例では、一連の規則は、最大許容数が設定されている場合、同じキーワードを2回以上ハイパーリンクすることを控え、最大許容数が設定されている場合、特定のリンク先を1回以上ハイパーリンクせず、特定の構造要素、またはその他を優先する命令(例えば、最初に見出し、次に行頭記号、表、最後に段落などの優先順位)、そして、重み付けされたキーワードまたはリンク先を重み付けされていないまたは重み付けが低いキーワード/リンク先よりも優先する命令などを含んでいてもよい。
【0076】
このようにして、ハイパーリンクは、ウェブページに含まれる構造要素やフォーマットに基づいて、ウェブページに自動的に挿入されてもよい。ハイパーリンクは、ウェブページ内で識別された構造要素に対応するアンカーの部分の選択を定義する一連の規則に基づいて、ウェブページに追加されてもよい。ハイパーリンクを、例えばキーワードだけでなく、構造要素に従って挿入することで、ハイパーリンクは、ユーザの注意を引く可能性が高いウェブページの領域に配置することができる。さらに、ハイパーリンクを構造的に定義して配置し、一貫した書式にすることで、ウェブページの美的魅力を高めることができる。構造要素を意図的に使用することで、ユーザにより自然な体験を提供し得る。さらに、箇条書きリスト内のハイパーリンクは、箇条書きされた各項目の全文がハイパーリンクされていると、より有用で魅力的であってもよい一方、1つのコラムをハイパーリンクに使用した場合には表の中のハイパーリンクの方がより有用かつ魅力的である。同様に、段落内のハイパーリンク間の距離は、妥当性の印象に影響を与える可能性がある。例えば、適切な距離をとることで、ユーザがハイパーリンクをスパムリンクと誤認する可能性や、そうでなければ構造要素内のすべてのリンクを無視する「リンクブラインドネス」を減らすことができる。
【0077】
ウェブページにハイパーリンクを自動的に挿入する方法1600の一例を図16に示す。方法1600は、図2の論理サブシステム202などの論理サブシステムのメモリに格納された命令に基づいて、図1および図2のハイパーリンク生成エンジン104などの自動化ツールによって実行されてもよい。命令が実行されると、論理サブシステムのプロセッサがウェブページを分析し、そのメタデータを読み取ることができる。方法1600の実施は、ユーザが新しいウェブページを作成するか、または既存のウェブページを修正するときに開始されてもよい。
【0078】
1602では、方法1600は、ハイパーリンクがどのように電子文書(例えば、ウェブページを生成するために使用される電子ファイル)、電子文書、および電子文書の主題に関連するリンク先のリストに挿入されるかを定義する一連の規則を受け取ることを含む。1602でユーザによって提供される情報が、ハイパーリンク生成エンジンによってユーザーインターフェースに表示されるユーザ入力ページに入力されてもよい。例えば、ユーザ入力ページは、テキスト・リンク先マップを自動的に作成するためのサイトマップへのリンク、キーワード、フレーズ、およびリンク先の手動入力リスト、キーワードおよび/またはリンク先の定義された重みおよび優先順位、キーワードおよびフレーズに対応するパターンのリスト、ハイパーリンクのための構造要素(例えば、行頭記号、番号付きリスト、表など)のリスト、および構造要素に関連付けられた様々な設定、ならびにハイパーリンクしない構造要素のリストを含むか、またはそれらで構成してもよい。ユーザ入力ページは、常にハイパーリンクする構造要素のリスト、パターンをリセットするタイミング(例えば、各見出しの後など)に対する指示、AI/MLを適用する基準、2つのハイパーリンク間の最小および最大閾値文字距離、ハイパーリンクする構造要素内のテキストの割合(%)閾値、アンカーテキストを拡張する割合(%)閾値、およびリンク先、アンカーテキスト、または構造要素に基づくハイパーリンクまたは特定の種類のハイパーリンクのスタイリングをさらに含むか、またはそれらで構成してもよい。
【0079】
1604で、方法1600は、電子文書に1つ以上のハイパーリンクを挿入することを含む。1つ以上のハイパーリンクを挿入することは、1605において、テキストおよび/または文書処理アルゴリズムを使用して、電子文書に存在する構造要素について電子文書を分析および/またはスキャンすることを含んでいてもよい。構造要素は、一連の規則で定義された構造要素に従って識別され得、識別された構造要素の種類および位置は、一例として、ハイパーリンクの挿入が完了するまで、一時的または一時的なメモリに格納されてもよい。
【0080】
1つ以上のハイパーリンクを挿入することは、1606でHTMLパーサーを使用して、識別された構造要素で電子文書のテキストにハイパーリンクアンカーを生成することも含んでいてもよい。言い換えれば、電子文書のテキストの選択された部分が、構造要素のアンカーに変換されてもよい。上述したように、識別された構造要素は、一連の規則に基づいてハイパーリンクの位置として指定された構造要素であってもよい。HTMLパーサーは、電子テキストファイルのHTMLコードにアクセスして修正するため、および/またはエラーやアンカーの外観を調整するために使用されるソフトウェアパッケージであってもよい。しかし、他の例では、電子文書は、プレーンテキスト、マークダウン(Markdown)など、HTML以外の他の種類のテキストを含んでいてもよく、テキストの種類に対応する他の種類の構文解析ツールを適宜使用してもよい。ハイパーリンクは、ハイパーリンクを組み込むために電子文書のHTMLコードを変更し、電子文書が表示されるウェブページでアンカーの視覚的な外観を調整することによって、(例えば、手動入力なしで)自動的に追加されてもよい。
【0081】
1つ以上のハイパーリンクを挿入することは、1608の一連の規則に従ってハイパーリンクに追加の修正を適用することも含んでいてもよい。例えば、電子文書の構造要素が箇条書きリストを含む場合、図10に示すように、行頭記号に続くテキストのみを含むようにアンカーが調整されてもよい。別の例として、テキストの段落に配置されたアンカーは、一連の規則によって選択されたキーワードが段落に2回以上現れると削除されてもよい。例えば、図6Bに示すように、段落に1回目に出現した後にキーワードが出現しても、ハイパーリンクされないことがある。
【0082】
1つ以上のハイパーリンクを挿入することは、1610で修正された電子文書を表示することをさらに含んでいてもよい。例えば、電子文書は、サーバでホストされているウェブサイトのウェブページで提示されることがあり、表示装置でユーザに表示されてもよい。一例として、ウェブページはインターネット上で一般にアクセス可能であってもよい。さらに、ハイパーリンクのリンク先も同様にホストされてもよい。方法1600は終了する。
【0083】
電子文書の構造要素に基づいてハイパーリンクを電子文書に自動的に挿入する技術的効果は、ハイパーリンクの配置と書式がユーザ設定に従って自動的に選択されて、ハイパーリンクの有用かつ整理された表現が実現されることであり、それによって情報を効率的に取得できるようになることである。ハイパーリンクの配置は、ウェブページ表示におけるハイパーリンクの配列の美的魅力を高めつつ、要求する処理負荷が比較的低いハイパーリンク管理戦略に従ってカスタマイズされてもよい。事前に設定された規則は、電子文書を分析し、(例えばユーザによる)手動挿入でできるよりも短時間でハイパーリンクを挿入するアルゴリズムベースのツール(例えばハイパーリンク生成エンジンなど)を使用して適用してもよい。さらに、このツールは、電子文書にハイパーリンクを配置する際に、複数の規則を同時に適用することができる。
【0084】
実施形態の説明が、例示と説明の目的で提示された。実施形態に対する適切な修正および変形を、上記の説明を踏まえて実施することができ、または方法を実践することから取得することができる。例えば、特に指示のない限り、説明した方法の1つ以上は、図1に関して上述したシステムなど、適切なデバイスおよび/またはデバイスの組み合わせによって実行してもよい。この方法は、記憶装置、メモリ、ハードウェアネットワークインターフェース/アンテナ、スイッチ、アクチュエータ、クロック回路などの1つ以上のハードウェア要素と組み合わせた1つ以上の論理デバイス(例えば、プロセッサ)を用いて、格納された命令を実行することによって実行されてもよい。記載された方法および関連する動作はまた、本出願に記載された順序に加えて様々な順序で、並行して、および/または同時に実行されてもよい。記載されたシステムは本質的に例示的なものであり、また、追加的な要素を含んでいてもよく、さらに/または要素を省略してもよい。本開示の主題は、様々なシステムおよび構成、ならびに開示された他の特徴、機能、および/または特性の、すべての新規かつ非自明な組み合わせおよび下位の組み合わせを含む。
【0085】
本開示はまた、ハイパーリンクを自動的に挿入する方法のサポートを提供するものであり、本方法は、サーバのプロセッサにおいて、電子文書の構造要素に基づいて、ハイパーリンクを電子文書に挿入するための一連の規則を受け取ることと、プロセッサにおいて実装され、かつ、一連の規則に基づいてハイパーリンクの挿入を実行するように構成される自動化ツールを介して、電子文書に存在する構造要素を識別することと、識別された構造要素に基づいて、ハイパーリンクを電子文書に挿入することと、表示装置において、ハイパーリンクを有する電子文書を表示することと、を含む。本方法の第1の実施例では、構造要素を識別することは、キーワード、箇条書きリスト、番号付きリスト、見出し、および表のうちの1つ以上を識別することを含む。本方法の第2の実施例では、任意選択で第1の実施例を含み、電子文書内のキーワードを識別することに応答して、ハイパーリンクを挿入することは、テキストの段落内のキーワードの1回目の出現をハイパーリンクし、テキストの段落内のキーワードのそれ以降の出現をハイパーリンクしないことを含む。本方法の第3の実施例では、任意選択で第1および第2の実施例の1つまたは両方を任意に含み、電子文書内の箇条書きリストを識別することに応答して、ハイパーリンクは、箇条書きリストの行頭記号に続くテキストに挿入される。本方法の第4の実施例では、任意選択で第1~第3の実施例の1つ以上または各々を含み、電子文書内の番号付きリストを識別することに応答して、番号付きリストの項目を表すテキストにハイパーリンクが挿入される。本方法の第5の実施例では、任意選択で第1~第4の実施例の1つ以上または各々を含み、電子文書内の見出しを識別することに応答して、ハイパーリンクが見出しのキーワードにおいて見出しに挿入される。本方法の第6の実施例では、任意選択で第1~第5の実施例の1つ以上または各々を含み、電子文書内の表を識別することに応答して、ハイパーリンクが表の列に挿入される。本方法の第7の実施例では、任意選択で第1~第6の実施例のうちの1つ以上または各々を含み、一連の規則を受け取ることは、プロセッサに通信可能に接続されたユーザーインターフェースにおいてユーザが入力した設定を受け取ることを含み、ユーザが入力した設定は、識別された構造要素の種類に固有のハイパーリンクの配置および書式を含む。本方法の第8の実施例では、任意選択で第1~第7の実施例の1つ以上または各々を含み、一連の規則を受け取ることは、人工知能または機械学習を使用して生成された規則を受け取ることを含む。
【0086】
本開示はまた、システムのハイパーリンク挿入のためのサポートを提供するものであり、本システムは、電子文書を格納するデータベースと、電子文書を表示するように構成された表示装置と、表示装置に通信可能に接続され、非一過性メモリに格納された実行可能命令で構成された自動化ツールを含むプロセッサと、を含み、実行可能な命令は、実行されると、プロセッサに、実行可能な命令に含まれる、1つ以上の構造要素の種類に応じてハイパーリンクがどのように表示されるかを定義する一連の規則に従って、電子文書内で識別される1つ以上の構造要素においてハイパーリンクを電子文書に挿入させ、ハイパーリンクを含む電子文書を表示装置に表示させる。本システムの第1の実施例では、一連の規則は、ウェブサイト・サイトマップを使用して、ハイパーリンクアンカーとハイパーリンクのリンク先の間の関係をマッピングするために、テキスト・リンク先マップを生成する命令を含む。本システムの第2の実施例では、任意選択で第1の実施例を含み、一連の規則は、電子文書のテキストのセクションに対する最大許容数のハイパーリンクを含む。本システムの第3の実施例では、任意選択で第1および第2の実施例の一方または両方を含み、一連の規則は、第1のアンカーと第2のアンカーが閾値文字距離未満離れている場合に、ハイパーリンクの第1のアンカーを拡張して、ハイパーリンクの第2のアンカーを含むようにする命令を含む。システムの第4の実施例では、任意選択で第1~第3の実施例の1つ以上または各々を含み、一連の規則は、ハイパーリンクアンカーの表示の頻度、アンカーの書式、およびアンカーとして構成されたテキストのセクションの一部の範囲のうち、1つ以上を調整する命令を含む。
【0087】
本開示はまた、電子文書内のハイパーリンクの配置を決定する方法のサポートを提供するものであり、本方法は、プロセッサで、電子文書と、ハイパーリンク先のリストと、電子文書内で識別された構造要素の種類に基づいて、ハイパーリンクを電子文書に自動的に挿入するための命令を提供する一連の規則とを受け取ることと、プロセッサで実装される文書処理アルゴリズムを使用して、電子文書内の構造要素の種類を識別することと、構造要素を構文解析して、構造要素の選択されたテキストに、ハイパーリンク先のリストの対応するリンク先にリンクされるハイパーリンクアンカーを生成することと、ハイパーリンクを有する電子文書を表示装置で表示することと、を含む。本方法の第1の実施例では、本方法はさらに、ハイパーリンクアンカーを、アンカーのパターンおよび頻度のうちの1つ以上に基づいて修正することをさらに含む。本方法の第2の実施例では、任意選択で第1の実施例を含み、パターンに基づいてアンカーを修正することは、構造要素の出現率、キーワード、テキストの割合(%)、文字距離、セクションリセット、および重みまたはランキングのうちの1つ以上に従ってアンカーの外観および/またはリンク先を調整することを含む。本方法の第3の実施例では、任意選択で第1および第2の実施例の一方または両方を含み、アンカーの頻度に基づいてアンカーを修正することは、キーワードが電子文書のセクション内で他のキーワードよりも高い頻度で出現する場合に、アンカーとしてキーワードを選択することを含む。本方法の第4の実施例では、任意選択で第1~第3の実施例の1つ以上または各々を含み、アンカーを修正することは、第1のアンカーと第2のアンカーとが、第1のアンカー対第2のアンカーの順位または重みに基づいて単一のアンカーに結合される場合に、アンカーの第1のアンカーの第1のリンク先とアンカーの第2のアンカーの第2のリンク先との一方を選択することをさらに含む。本方法の第5の実施例では、任意選択で第1~第4の実施例の1つ以上または各々を含み、アンカーは、リンク先にリンクされたHTML要素であり、リンク先は、異なる文書、電子文書の異なるセクション、およびポップアップのうちの1つである。
【0088】
本出願で使用される場合、単数形で記載され、「a」または「an」という単語に続く要素またはステップは、当該要素またはステップの複数形を、それらを除外すると記載されない限り、除外しないと理解されるべきである。さらに、本開示の「一実施形態」または「一実施例」という言及は、述べられた特徴を取り込んだ追加の実施形態の存在を除外すると解釈されることを意図するものではない。「第1」、「第2」、「第3」などの用語は、単にラベルとして使用されているものであり、その対象に数値的な要件または特定の位置順序を課すことを意図したものではない。以下の特許請求の範囲は、新規かつ非自明とみなされる上記開示の主題を特に指摘するものである。
図1
図2
図3
図4
図5A
図5B
図6A
図6B
図7
図8A
図8B
図9A
図9B
図10
図11
図12
図13
図14
図15
図16
【国際調査報告】