IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カスケード リーディング インコーポレイテッドの特許一覧

特許7541422言語学的に駆動される自動化されたテキスト・フォーマット設定
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-20
(45)【発行日】2024-08-28
(54)【発明の名称】言語学的に駆動される自動化されたテキスト・フォーマット設定
(51)【国際特許分類】
   G06F 40/137 20200101AFI20240821BHJP
【FI】
G06F40/137
【請求項の数】 19
(21)【出願番号】P 2023562214
(86)(22)【出願日】2022-04-08
(65)【公表番号】
(43)【公表日】2024-03-15
(86)【国際出願番号】 US2022024070
(87)【国際公開番号】W WO2022217087
(87)【国際公開日】2022-10-13
【審査請求日】2023-11-29
(31)【優先権主張番号】63/173,298
(32)【優先日】2021-04-09
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】17/233,339
(32)【優先日】2021-04-16
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】523381516
【氏名又は名称】カスケード リーディング インコーポレイテッド
【氏名又は名称原語表記】CASCADE READING,INC.
(74)【代理人】
【識別番号】100105957
【弁理士】
【氏名又は名称】恩田 誠
(74)【代理人】
【識別番号】100068755
【弁理士】
【氏名又は名称】恩田 博宣
(74)【代理人】
【識別番号】100142907
【弁理士】
【氏名又は名称】本田 淳
(72)【発明者】
【氏名】ヴァン ダイク、ジュリー エイ.
(72)【発明者】
【氏名】ゴーマン、マイケル
(72)【発明者】
【氏名】ラセック、マーク
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】特開平04-348464(JP,A)
【文献】特表2000-516002(JP,A)
【文献】米国特許出願公開第2017/0046311(US,A1)
【文献】米国特許第10303742(US,B2)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
(57)【特許請求の範囲】
【請求項1】
入力テキストから言語的手がかりを含むテキストの表示を生成するための方法であって、
コンピューティング・デバイスの少なくとも1つのプロセッサが、入力デバイスからの前記入力テキストを受け取る工程と、
前記少なくとも1つのプロセッサが、自然言語処理サービスのコンスティテュエンシ解析オペレーションおよび依存関係解析オペレーションから、前記入力テキストについてのコンスティテュエンシ情報および依存関係情報を取得する工程であって、前記自然言語処理サービスが、少なくとも1つの自動化されたパーサからの出力として前記コンスティテュエンシ情報および前記依存関係情報を提供する、工程と、
前記少なくとも1つのプロセッサが、前記コンスティテュエンシ情報および前記依存関係情報から言語モデルを生成する工程であって、前記言語モデルが、前記入力テキストの構成要素間の依存関係を表す解析木と、前記構成要素と前記入力テキストの前記構成要素の依存関係との間の関係を表す符号化データとを含むデータ構造である、工程と、
前記少なくとも1つのプロセッサが、前記言語モデルを使用して、カスケード・ルールを前記入力テキストの前記構成要素に適用する工程であって、前記カスケード・ルールが、
それぞれの構成要素の垂直配置を決定するための命令であって、それぞれの構成要素が、前記生成された言語モデルの解析木の階層において個々の文法単位として機能する語または語のグループを備え、前記垂直配置により、前記入力テキストの構成要素がそれぞれの行または連続単位の中に置かれる、命令と、
それぞれの構成要素の水平配置を決定するための命令とを備える、工程とを備え、
1つまたは複数の依存関係およびそれぞれの構成要素の先頭が、前記言語モデルの前記符号化データから決定され、前記水平配置により、同じ先頭に対する依存関係または互いの依存関係を有する前記入力テキストの構成要素について同じ水平変位とし、
前記少なくとも1つのプロセッサが、前記カスケード・ルールによる前記垂直配置および前記水平配置の適用に基づいて、インデントおよびライン・フィードを含む出力を生成する工程と、
前記少なくとも1つのプロセッサが、前記出力の表示を出力デバイスのディスプレイに表示させる工程とを備える、方法。
【請求項2】
前記カスケード・ルールが、
従属語と該従属語を含有するそれぞれの構成要素とをリンクするルールを使用して、前記入力テキストの前記構成要素中のコア・アーギュメントおよび非コア従属語を識別することをさらに含み、
前記水平配置により、前記入力テキストの言語フレーズの先頭の下の前記それぞれの構成要素に対して、前記コア・アーギュメントおよび前記非コア従属語をインデントし、
前記水平配置により、前記それぞれの構成要素の完了を知らせるためにインデント解除するとともに、従属構成要素を互いに位置合わせする、請求項1に記載の方法。
【請求項3】
前記出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む前記自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強される、請求項1に記載の方法。
【請求項4】
前記少なくとも1つのプロセッサが、匿名化された使用状況データまたはユーザ指定のプリファレンスを受け取る工程と、
前記少なくとも1つのプロセッサが、前記匿名化された使用状況データまたは前記ユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルを生成する工程とをさらに備える、請求項1に記載の方法。
【請求項5】
前記少なくとも1つのプロセッサが、前記カスタム表示プロファイルの前記出力表示特性を使用して前記出力を調整する工程をさらに備え、前記出力表示特性が、前記出力の表示特徴を前記出力の形状の修飾なしで修飾する、請求項4に記載の方法。
【請求項6】
前記出力が、電話、タブレット、ラップトップ、モニタ、仮想現実デバイス、または拡張現実デバイスにおける表示のために生成される、請求項1に記載の方法。
【請求項7】
前記出力が、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成される、請求項1に記載の方法。
【請求項8】
前記自然言語処理サービスのコンスティテュエンシ解析オペレーションが、それぞれの構成要素を決定するための1つまたは複数の診断テストを満たし、前記1つまたは複数の診断テストが、i)do-so/one置換、ii)等位構造、iii)話題化、iv)省略、v)分裂文形成または擬似分裂文形成、vi)受身化、vii)wh前置、viii)右枝節点繰り上げ、ix)代名詞置換、x)質問応答、xi)脱落、およびxii)副詞的侵入、の中から提供される、請求項1に記載の方法。
【請求項9】
前記入力テキストが、前記出力デバイスの前記ディスプレイ上で複数の行を使用する少なくとも1つの連続単位で前記出力中に提示される、請求項1に記載の方法。
【請求項10】
入力テキストから言語的手がかりを含むテキストの表示を生成するための命令を含む、少なくとも1つの機械可読媒体であって、前記命令は、前記コンピューティング・デバイスの前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサが、請求項1~9のいずれか一項に記載の方法を実行する、少なくとも1つの機械可読媒体。
【請求項11】
入力テキストから言語的手がかりを含むテキストの表示を生成するためのシステムであって、
少なくとも1つのプロセッサと、
命令を含むメモリとを備え、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサが、
入力デバイスからの前記入力テキストを受け取る工程と、
自然言語処理サービスのコンスティテュエンシ解析オペレーションおよび依存関係解析オペレーションから、前記入力テキストについてのコンスティテュエンシ情報および依存関係情報を取得する工程であって、前記自然言語処理サービスが、少なくとも1つの自動化されたパーサからの出力として前記コンスティテュエンシ情報および前記依存関係情報を提供する、工程と、
前記コンスティテュエンシ情報および前記依存関係情報から言語モデルを生成する工程であって、前記言語モデルが、前記入力テキストの構成要素間の依存関係を表す解析木と、前記構成要素と前記入力テキストの前記構成要素の依存関係との間の関係を表す符号化データとを含むデータ構造である、工程と、
前記言語モデルを使用して、カスケード・ルールを前記入力テキストの前記構成要素に適用する工程であって、前記カスケード・ルールが、
それぞれの構成要素の垂直配置を決定するための命令であって、それぞれの構成要素が、前記生成された言語モデルの解析木の階層において個々の文法単位として機能する語または語のグループを備え、前記垂直配置により、前記入力テキストの構成要素がそれぞれの行または連続単位の中に置かれる、命令と、
それぞれの構成要素の水平配置を決定するための命令とを備える、工程とを備え、
1つまたは複数の依存関係およびそれぞれの構成要素の先頭が、前記言語モデルの前記符号化データから決定され、前記水平配置により、同じ先頭に対する依存関係または互いの依存関係を有する前記入力テキストの構成要素について同じ水平変位とし、
前記カスケード・ルールによる前記垂直配置および前記水平配置の適用に基づいて、インデントおよびライン・フィードを含む出力を生成する工程と、
前記出力の表示を出力デバイスのディスプレイに表示させる工程とを行うよう、オペレーションを実行する、システム。
【請求項12】
前記カスケード・ルールが、
従属語と該従属語を含有するそれぞれの構成要素とをリンクするルールを使用して、前記入力テキストの前記構成要素中のコア・アーギュメントおよび非コア従属語を識別する命令をさらに含み、
前記水平配置により、前記入力テキストの言語フレーズの先頭の下の前記それぞれの構成要素に対して、前記コア・アーギュメントおよび前記非コア従属語をインデントし、
前記水平配置により、前記それぞれの構成要素の完了を知らせるためにインデント解除するとともに、従属構成要素を互いに位置合わせする、請求項11に記載のシステム。
【請求項13】
前記出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む前記自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強される、請求項11に記載のシステム。
【請求項14】
前記メモリが命令をさらに備え、この命令は、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサが、
匿名化された使用状況データまたはユーザ指定のプリファレンスを受け取るオペレーションと、
前記匿名化された使用状況データまたは前記ユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルを生成するオペレーションとを実行する、請求項11に記載のシステム。
【請求項15】
前記メモリが命令をさらに備え、この命令は、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサが、
前記カスタム表示プロファイルの前記出力表示特性を使用して前記出力を調整するオペレーションを実行し、前記出力表示特性が、前記出力の表示特徴を前記出力の形状の修飾なしで修飾する、請求項14に記載のシステム。
【請求項16】
前記出力が、電話、タブレット、ラップトップ、モニタ、仮想現実デバイス、または拡張現実デバイスにおける表示のために生成される、請求項11に記載のシステム。
【請求項17】
前記出力が、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成される、請求項11に記載のシステム。
【請求項18】
前記自然言語処理サービスのコンスティテュエンシ解析オペレーションが、それぞれの構成要素を決定するための1つまたは複数の診断テストを満たし、前記1つまたは複数の診断テストが、i)do-so/one置換、ii)等位構造、iii)話題化、iv)省略、v)分裂文形成または擬似分裂文形成、vi)受身化、vii)wh前置、viii)右枝節点繰り上げ、ix)代名詞置換、x)質問応答、xi)脱落、およびxii)副詞的侵入、の中から提供される、請求項11に記載のシステム。
【請求項19】
前記入力テキストが、前記出力デバイスの前記ディスプレイ上で複数の行を使用する少なくとも1つの連続単位で前記出力中に提示される、請求項11に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本明細書において記述されている実施形態は、全般的には、理論言語学から導き出された大規模自然言語処理(NLP)技術によって駆動される、マシンによって自動化されたテキスト処理に関する。いくつかの実施形態においては、より具体的には、読解を改善するという目的のために、カスケードされたテキストを産出するための構成要素および依存関係の解析に関する。
【背景技術】
【0002】
標準的なテキスト・フォーマット設定は、言語をブロックで提示することを伴い、基本的な句読点と、パラグラフを示す改行またはインデントとを超えるフォーマット設定をほとんど伴わない。本明細書において記述されている代替のテキスト・フォーマットは、言語関係が強調されるようにテキストを提示して、理解プロセスのためのサポートを提供し、これは、正確さを高めること、または読解時間を低減することが可能である。
【発明の概要】
【発明が解決しようとする課題】
【0003】
カスケードされたテキスト・フォーマット設定を提供する。
【課題を解決するための手段】
【0004】
カスケードされたテキスト・フォーマット設定は、読者が文法構造および関連したコンテンツを識別するのを手助けするという目的のために従来のブロック形状のテキストをカスケード・パターンへと変形する。テキスト・カスケードは、文の構文を見えるようにする。構文単位が、文の基礎的要素である。自然言語を解析する場合には、読者の心は、文をより小さな単位の文字列へと単に「大まかに切り分ける」よりも多くのことを行わなければならない。むしろ読者の心は、フレーズどうしの間における依存関係を特定して、それぞれのフレーズが、そのフレーズを含むさらに大きなフレーズにどのように関連しているかを認識する必要がある。カスケードされたテキスト・フォーマットは、読者が文内のこれらの関係を識別するのを手助けする。言語単位を他の単位の中に埋め込むプロセスを通じて文を構築する人間の心の能力は、言語が無数の意味を表すことを可能にする。したがって、カスケードされた解析パターンは、読者が、ある特定のフレーズを見ているときに、そのフレーズがその前後のフレーズにどのように関連しているかにすぐに気づくことを可能にするように意図されている。
【0005】
図面(必ずしも原寸に比例して描かれているとは限らない)においては、同様の数字どうしが、別々の図における同様のコンポーネントどうしを記述する場合がある。別々の文字の添え字を有する同様の数字どうしが、同様のコンポーネントどうしの別々のインスタンスを表す場合がある。図面は、本文書において論じられている様々な実施形態を、限定としてではなく例として一般的に示している。
【図面の簡単な説明】
【0006】
図1】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために使用されることになる構成要素を定義する解析木の例を示す図。
図2】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析およびカスケードされたテキスト出力の一例のブロック図。
図3】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析およびカスケードされたテキスト出力の一例のブロック図。
図4】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたテキスト出力の一例を示す図。
図5】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、指示的にリンクされているフレーズどうしを識別するように拡張されているカスケードされたテキスト出力の一例を示す図。
図6A】一実施形態による、コンスティテュエンシおよび依存関係パーサによって特定された文法情報に基づいて複数の従属セグメントへとセグメント化されているテキスト部分を示す図。
図6B】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定を介してそれぞれのセグメントに関して指定されている階層配置を伴って表示されているテキスト部分を示す図。
図7】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための環境およびシステムの一例のブロック図。
図8】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケード・フォーマットへの言語学的修正を受け取るための環境の一例を示す図。
図9】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、文どうしにわたる同一指示追跡のためのシステムの一例を示す図。
図10】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステムの一例のためのデータフロー図。
図11】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。
図12】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。
図13】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。
図14】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにマシン学習分類子を使用してテキストをカスケードするための方法の一例を示す図。
図15】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにテキストをカスケードするようにマシン学習分類子をトレーニングするための方法の一例を示す図。
図16】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたフォーマットで文を表示するためのテキスト変形の一例を示す図。
図17】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、自然言語処理を使用するカスケードされたテキスト用にタグ付けされたハイパーテキスト・マークアップ言語(HTML)コードのための解析構造の一例を示す図。
図18】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用して、取り込まれた画像から、カスケードされたテキストを生成することの一例を示す図。
図19】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用して、取り込まれた画像から、カスケードされたテキストを生成するための方法の一例を示す図。
図20】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用してアイウェア・デバイスにおいてテキストを第1の表示フォーマットから第2の表示フォーマットへ変換することの一例を示す図。
図21】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用してアイウェア・デバイスにおいてテキストを第1の表示フォーマットから第2の表示フォーマットへ変換するための方法の一例を示す図。
図22】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにテキストが著される際に自然言語処理を使用するカスケードされたテキストを生成することの一例を示す図。
図23】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのユーザおよび発行者のプリファレンス管理のためのアーキテクチャの一例を示す図。
図24】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのパーソナライゼーションのための方法の一例を示す図。
図25】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのデュアル表示の例を示す図。
図26】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために第1の言語での入力テキストを第2の言語でのカスケードされた出力へ翻訳するためのシステムの一例を示す図。
図27】一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法の一例を示す図。
図28】1つまたは複数の実施形態が実装されることが可能であるマシンの一例を示すブロック図。
【発明を実施するための形態】
【0007】
本明細書において論じられているシステムおよび方法は、言語理論から導き出された言語分析を利用して、カスケードを特定する。そのような分析は、自動化された自然言語処理(NLP)における最先端技術であり、これは、本明細書において論じられているシステムおよび方法が、NLP技術(これ以降、NLPサービス)から提供される入力を活用することを可能にする。
【0008】
本明細書において論じられているシステムおよび方法は、NLPサービス(たとえば、コンスティテュエンシ・パーサ、依存関係パーサ、同一指示パーサなど)を使用して、入ってくるテキストを解析して、その基礎となる言語特性を強調表示する表示にする。カスケード・ルールを含む表示ルールが、次いでこれらの表示に適用されて、言語関係を読者にとってさらに見えるようにする。
【0009】
言語構成要素は、文における特定の機能を満たす語または語のグループである。たとえば、「John believed X(ジョンはXを信じた)」という文において、Xは、単一の語(「Mary(メアリー)」)もしくは(「facts(事実)」)によって、またはフレーズ(「the girl(その少女)」)もしくは(「the girls with curls(巻き毛の少女たち)」)もしくは(「the girl who shouted loudly(大声で叫んだ少女)」)によって、または完全な節(「the story was true.(その話は本当だった。)」)によって置換されることが可能である。このケースにおいては、これらのすべては、「John believed(ジョンは信じた)」の直接の目的語の役割を満たす構成要素である。特に、構成要素は、完全性という特性を有する。「the story was(その物語は、~だった)」は、文法単位として独立することが可能ではないので、構成要素ではない。同様に、「the girl who(~である少女)」または「the(その)」は、構成要素ではない。加えて、構成要素は、その他の構成要素内に埋め込まれる場合がある。たとえば、「the girls with curls(巻き毛の少女たち)」というフレーズは、構成要素であるが、「the girls(少女たち)」および「with curls(巻き毛の)」も、構成要素である。しかしながら、「girls with(~の状態の少女たち)」というフレーズは、文法単位として独立することが可能ではないので、構成要素ではない。その結果として、「girls with(~の状態の少女たち)」は、いずれの文法機能も満たすことが可能ではなく、その一方で「the girls(少女たち)」または「with curls(巻き毛の)」という構成要素フレーズは両方とも、文における必要な文法機能を満たすのに適格である。品詞は、語の構文機能(たとえば、名詞、動詞、前置詞など)のカテゴリである。単一の語の機能について記述する品詞とは異なり、コンスティテュエンシは、文における特定の文法的役割(たとえば、主語、直接目的語など)を満たすために単位として機能する語のセットを叙述する。したがって、「コンスティテュエンシ」という概念は、文内で語のグループどうしがどのように関連しているかに関するさらに多くの情報を提供する。
【0010】
本明細書において論じられているシステムおよび方法は、構成要素のカスケーディングを実施し、そのカスケーディングにおいては、様々なレベルのインデントを特定するルールのセットに従って構成要素が表示される。ルールは、コンスティテュエンシ・パーサおよび依存関係パーサからの情報に共同で基づく。コンスティテュエンシ・パーサは、フレーズ構造の理論(たとえば、Xバー理論)を使用して、今しがた記述されたように構成要素を識別するNLPサービスである。依存関係パーサは、文におけるそれぞれの語に関するラベル付けされている構文依存関係を提供して、その語(およびその語が率いている構成要素)によって保持されている構文機能について記述するNLPサービスである。構文依存関係のセットは、言語間で一貫した構文注釈標準を提供することを目的とする普遍依存関係イニシアチブ(UD,http://universaldependencies.org)によって列挙されている。英語以外にも、構文分析は、中国語(簡体字)、中国語(繁体字)、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、およびスペイン語を限定ではなく例として含む様々なさらなる言語をサポートすることが可能である。
【0011】
テキスト・カスケーディングのプロセスを実施することを通じて、本明細書において論じられているシステムおよび方法は、テキストにおける基礎となる言語構造に対する視覚的な手がかりを提供する。これらの手がかりは、教訓的な機能を果たし、これらの手がかりを利用して、より正確かつ効率的な読解、文法構造を教示する際のさらに高い容易さ、および読解関連障害の矯正のためのツールを促進する多くの実施形態が提示される。
【0012】
一例においては、カスケードは、解析オペレーションから入手されたコンスティテュエンシおよび依存関係データに基づいて改行およびインデントを使用して形成される。優先順位が、完全に1行の上に残っている構成要素に置かれるか、またはデバイスの表示制限が単一の行での表示を妨げ得る状況においては連続単位として示されるようにカスケード・ルールが適用される。これは、言語機能において語のどのグループどうしが一緒に役割を果たすかの容易な識別を促進し、それによって構成要素は、より容易に識別されることが可能である。正確な言語理解は、テキストにおいて提示されているエンティティどうしまたは概念どうしの間における関係を識別する能力を必要とする。これにとっての必要条件は、構成要素(すなわち、個別の文法機能を果たすテキストの単位)を解析する能力である。理解力に乏しい人は、読取りおよび口頭での産出の両方の間に、構成要素を定義する構文境界を識別するのにかなりの困難を有しているということを証拠が示唆している(たとえば、ブリーンら(Breen et al.)、2006年;ミラー(Miller)およびシュヴァーネンフリューゲル(Schwanenflugel)、2008年)。その上、境界認識は、解説的なテキスト(すなわち、教科書、新聞など)において見受けられる種類の複雑な構文構造にとって特に重要である。これらの事実は、テキストにおける構文境界を識別する能力が読解にとって特に重要であるということ、およびこれらの境界を知らせる方法が、悪戦苦闘している読者にとって重要な助けとしての役割を果たすことが可能であるということを示唆している。しかしながら、標準的なテキスト提示方法(すなわち、テキストを左揃えのブロックで提示すること)は、言語構成要素を明示的に識別せず、またはそうするプロセスをサポートするためのいかなる手段も提供しない。本明細書において論じられているシステムおよび方法は、改行(たとえば、キャリッジ・リターン、ライン・フィードなど)、インデント、色での強調表示、イタリック、アンダーライン等などの視覚的な手がかりを介して構文上の境界および依存関係を明示的に知らせる手段を提示する。
【0013】
図1は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために使用されることになる構成要素を定義する解析木100の例を示している。言語理論は、言語構成要素(フレーズとも呼ばれる)と、それらの言語構成要素の間における関係を表すためのフォーマリズムとのための確立された診断テストを提供する。これらのテストは、限定ではなく例として、i)do-so/one置換、ii)等位構造、iii)話題化、iv)省略、v)分裂文形成/擬似分裂文形成、vi)受身化、vii)wh前置、およびviii)右枝節点繰り上げ、ix)代名詞置換、およびx)質問応答、xi)脱落、およびxii)副詞的侵入を含む。
【0014】
X’理論(「Xバー理論」と発音される)として知られている有力な理論は、フレーズがどのように作成されるかについて記述している(チョムスキー(Chomsky)、1970年;ジャッケンドフ(Jackendoff)、1977年)。この理論は、特定の品詞(たとえば、名詞、動詞など)どうしにわたって抽象化を行い、XPまたはXフレーズとして記述されるすべてのタイプのフレーズ(たとえば、X=名詞の場合には、それは名詞フレーズであり、X=動詞の場合には、それは動詞フレーズである、といった具合である)が、3つの一般的な2項枝分かれ書き換えルールを介して作成されると主張している。第1にフレーズ(「XP)が、任意の順序での、任意選択の「指定子」と、必要とされる「Xバー」とから構成される。第2にXバーが、任意選択で、Xバーと、Xバーを修飾することを認められている任意のタイプの付加詞とから構成されることが可能である。第3にXバーは、フレーズの必須の主要部(たとえば、任意の品詞の語)と、任意選択で、任意の線形順序で生じる、その主要部によって認められている任意の数の補語フレーズとから構成される。
【0015】
これらのルールは、指定子とXバーとが、および主要部と補語とが姉妹関係にあり、XPが階層における最高の位置にあって、X’を支配し、そしてX’がXを支配するように解析木100を作成するために使用されることが可能である。たとえば、「saw the girl(少女を見た)」という動詞フレーズは、V主要部とNP補語とを伴うVPとして表されることが可能であり、そしてそのNP補語は、指定子の位置に「the」を伴うN’として表され、そのN’は、解析木105において示されているようにN主要部からの投射として表される。文110「saw the girl with the curls(巻き毛の少女を見た)」におけるように、(前置詞フレーズのような)その他の付加詞フレーズがNPのN’フレーズに対してさらに付加されることが可能であるということに留意されたい。同様に、解析木110において示されているように、「recently(最近)」という副詞など、指定子フレーズがV’に対して付加されることが可能である。指定子のインスタンスは、図1においては簡略化されているが、これらも、XPフレーズであるものと理解される。
【0016】
本明細書で論じられているシステムおよび方法は、これらのフレーズ構造ルールを利用して、構成要素キューイングの2部構成プロセスの第1部を規定する。第1部では、表示のために文をより小さいピースにどのように分割するかを規定する。すなわち、文は、語がその支配的なXPフレーズから切り離されないように構成要素ピースに分断される(たとえば、図6Aに示されるように、図11の要素1110、図12の要素1205など)。たとえば、「with」と「curl」の間の分断は、「curl」が「with」を先頭とするPPに支配されているので、起きることがない。同様に、「the」が「girl」とは別の行に現れることはない。その理由は、これらが両方とも、「girl」を先頭とするNPに支配されているからである。したがって、カスケード・ジェネレータの目的のために、セグメントが、提示ライン上に一緒にとどまることになる、XPに支配されたフレーズと定義される。「saw」と「the」の間の分断は、「the」が「saw」とは別のXPフレーズに支配されているので、起こり得る(すなわち、「saw」はVPに支配され、「the」はNPに支配されている)。同様に、「girl」と「with」の間の分断が、「with」がPPに支配され、「girl」がNPに支配されているので、起こり得る。改行が、XPの存在するところで行われる。その理由は、これが新しい構成要素を特徴付けるからである。行の長さがXPの間で改行するにはあまりに短い場合、改行がXのレベルで、構成要素の継続を示す付随する視覚的フォーマット(括弧、フラッシュ・インデント、色コーディング、イタリック体マッチングなどを、これらに限定されないが含む)を用いて行われる。
【0017】
第1部の例示的な実施形態では、構成要素を区切るための代表的な言語として、他のフレーズ構造理論(たとえば、ベア・フレーズ構造など)を利用することがある。本明細書で論じられているシステムおよび方法のいくつかの態様は、改行が構成要素境界で起こること、および構成要素境界が、確立された言語診断テスト(置換、移動、分裂文形成、質問など)に基づいて確立されることである。構成要素境界は、特有のフレーズ構造表現にかかわらず一定である。
【0018】
例示的な実施形態では、カスケード・ジェネレータで使用するための構成要素を提供するのに自動化された構成要素パーサが使用されるが、カスケード・ジェネレータは、1つの自動化されたパーサの使用に、または何か特定の自動化されたパーサに依存しない。このパーサは、NLPサービスとして表示される(たとえば、図10で論じられているNLPサービス1020のコンスティテュエンシ・パーサ1025など)。様々な解析技術およびサービスが、カスケード・ジェネレータによって次に処理される構成要素を識別するのに使用され得ることを理解されたい。
【0019】
構成要素カスケーディング・オペレーションの第2部は、言語構造の手がかりを提供するためのインデント・スキームを指定する(たとえば、図6Bなどに示されているように)。これらの手がかりは、自動化された依存関係パーサからの出力に基づいており、このパーサは各語の、他の各語に対する特有の言語機能を指定する(たとえば、図11の要素1115または図12の要素1210などに示されるように)。この機能は、カスケードの水平変位(インデント)を決定するために使用される。手がかりは、カスケード内の構成要素フレーズの水平変位(インデント)によって表され得るので、インデントされているのは所定の行のフレーズになる。カスケードは、フレーズ境界、改行、および水平変位を含む全結果を指す。
【0020】
依存関係解析機能だけでは言語構成要素を識別することができない。これは、依存関係パーサが言語機能を構成要素ではなく語に割り当てるからである。言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステムは、言語モデル(図10の1050)を作成し、このモデルは、完全な構成要素を、その構成要素の先頭に関連付けられた特有の依存関係とリンクする(たとえば、図6A)。たとえば、構成要素XPの先頭はXである。すなわち、名詞句(NP)の先頭は名詞(N)であり、前置詞句(PP)の先頭は前置詞(P)である。コア・アーギュメントおよび非コア従属語の先頭と関連付けられた依存関係は、改行および水平変位をトリガするために使用される。依存関係パーサ625(たとえば、図10に記述されている依存関係パーサ1035など)は、テキスト中の語の依存関係を提供する依存関係出力635(たとえば、図10に記述されている依存関係データ1040など)を生成する。コア・アーギュメントおよび非コア従属セレクタ640は、コンスティテュエンシ・パーサ620(たとえば、図10に記述されているコンスティテュエンシ・パーサ1025など)からのコンスティテュエンシ出力630(たとえば、図10に記述されているコンスティテュエンシ・データ1030など)と、依存関係出力635とを受け取り、構成要素に関連する依存関係を選択して言語構造615(たとえば、図10に記述されているモデル1050など)を生成する。その結果、言語学的に駆動される自動化されたテキスト・フォーマット設定のシステムは、コンスティテュエンシ情報と依存関係情報の両方を要求する。
【0021】
代替実施形態が、依存関係パーサだけを含み得るが、言語構成要素を定義する追加のルール(たとえば、フレーズ構造ルール)もまた要求する。このようなルールは、計算的に実施されたパーサを含まなくてもよいが、構成要素を記述する言語理論に基づくルールの任意の集まりを含み得る。これは、キーワード(たとえば、前置詞)、従属節マーカ(すなわち、that、which、who)、節接続詞(すなわち、either、but、and)、およびフレーズ構造の他の単一語インジケータに基づいて構成要素を識別するためのヒューリスティックを、これだけに限定されないが含む。
【0022】
構成要素カスケーディング・オペレーションの例示的な実施形態は、文中の構成要素および依存関係の特徴付けに基づいており、加えて、同一指示、感情分析、名前付きエンティティ認識、およびトピック追跡をこれらに限定されないが例として含む、列挙されたNLP-Servicesによって提供されるその他の言語的特徴に基づいている。カスケーディングに加えて、これらのパーサからの出力は、認知的手がかりを提供してユーザの認知負荷を軽減するようにテキストをハイライト、色分け、アンダーライン、付随する音声情報などによって修飾するために使用され得る。
【0023】
例としてカスケーディングが使用されているが、本明細書で論じられているシステムおよび方法は、テキストに関与するときの認知負荷の軽減をユーザにもたらす、様々な目に見える出力、可聴出力、および蝕知できる出力に適用可能である。別の例示的な実施形態では、ユーザが認知負荷を軽減するためのキューイングを実現する他のフォーマット設定が使用され得る。例示的な実施形態では、キューイングは、コンスティテュエンシ・データおよび依存関係データなどの解析出力を使用して、色、イタリック体を使用すること、ビデオ出力、振動出力、音声出力(たとえば、トーンなど)を提供することなどの、テキスト・フォーマット設定および/または強調の修飾によって達成されることが可能である。
【0024】
図2は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析205およびカスケードされたテキスト出力210の一例のブロック図を示す。
【0025】
依存関係パーサは、言語機能を指定するための様々なラベリング規約または依存関係セットを採用することができる。本明細書で論じられているシステムおよび方法は、構文、意味、または韻律に基づくものを含めて、語間の言語機能を指定するための任意の依存関係セットの使用を組み込む。例示的な実施形態では、言語間で有効な依存関係セットを開発するための協同オープンソース国際プロジェクトである、Universal Dependency(UD)イニシアチブからの依存関係セットが採用される。関係のセットは、https://universaldependencies.org/u/dep/index.htmlで入手可能である。
【0026】
UD依存関係セットは、名詞句および節のコア・アーギュメントと、非コア従属語(すなわち、斜格アーギュメント、副詞節、関係詞節)および名詞修飾語(すなわち、形容詞、名詞属性、節修飾語)を含む、その他のタイプの従属語とに分割される。構成要素カスケーディングのプロセスでは、コア・アーギュメントおよび非コア従属語が、その先頭の下で強制的にインデントされるべきであると規定する。このインデントは、文の中のコア関係に視覚的な手がかりを与える。したがって、直接目的語または間接目的語(依存関係解析205において「obj」または「iobj」とラベル標示)は、カスケードされた出力210に示されているように、それらが修飾する動詞(多くの場合、「root」とラベル標示)の下でインデントされる。一例では、名詞句の従属語もまた、その先頭の下でインデントされることがある。これらは、名詞修飾語および形容詞修飾語(すなわち、所有格形の語句、縮小関係詞節、数値修飾語、および同格句)の様々なセットを含む。カスケードされたテキスト出力210は、依存関係解析205に基づくインデントを含む。インデントの量は、後述のように、システム・プリファレンスで指定され得る。例示的な実施形態では、従属名詞句は、行の長さまたは構成要素のタイプに応じて、可能な限り改行を最小限にするという目標で、個々別々に取り扱われる。異なるインデント量が任意選択で、異なる従属語タイプに対して、それらを視覚的に区別するために適用されてよい。
【0027】
図3は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための依存関係解析305およびカスケードされたテキスト出力310の一例のブロック図を示す。
【0028】
インデント・ルールが構成要素に適用される。構成要素が他の構成要素(たとえば、関係詞節、補文)の中に埋め込まれる場合、インデント解除ルールが、カスケードされた出力310に示されるように、構成要素の完了を知らせるために適用される。インデント解除の結果、水平変位が、埋め込まれたフレーズの先頭の位置に復元される。これは、埋め込みの構造、および各動詞とそのアーギュメントの間の関係についての明確な手がかりをもたらす、カスケード・パターンを生成する。カスケードされたテキスト出力310は、カスケード・ジェネレータで指定されたカスケード・ルールによる依存関係解析305に基づくインデントを含む。追加の処理が、表示制限のあるデバイスに表示されるカスケードされた出力に追加の手がかりを提供するために、使用され得る。たとえば、追加の文字または他の信号が、構成要素が追加の行に折り返すことを示すために、挿入され得る。これらの場合、水平変位は、折り返された構成要素に対して一貫したままである(たとえば、構成要素が位置40で始まる場合、折り返されたセグメントも位置40で始まり、それが継続であることを示すための視覚的なマーキング(たとえば、括弧、網掛けなど)を持つ)。
【0029】
図4は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたテキスト出力400の一例を示す。水平位置は、関連付けられるべき構成要素を示す。たとえば、動詞「left」の位置付けは、カスケード405に示されているように、その主語が「the janitor」である(たとえば「the principal」ではない)ことを示している。同様に、フレーズ「every night」の位置付けは、それが、たとえば「noticed」ではなく、動詞「cleaned」に伴っていることを示している。図4に示されている縦線は説明のためのものであり、テキスト出力の一部ではないことに留意されたい。
【0030】
水平変位が同様に、カスケード410に示されるように、行列節に対して最初の節をインデントすることによって、事前配置された従属節を知らせるために使用される。この技法は、文の中心情報、および最初の節の従属状態に関する明確な手がかりをもたらす。
【0031】
別の例示的実施形態では、カスケーディング・プロセスは、依存関係パーサによって与えられる特有の構文依存関係を参照することなく、Xバー理論解析からの指定子位置および補語位置を用いてインデントを決定する。これは、指定子および補語の位置自体が文の構成要素間の一般的な依存関係を指定していることを活用している。しかし、2つのタイプの依存関係(たとえば、指定詞および補語など)に限定された実施形態では、文内の言語構造をキューイングするために利用可能な情報はより限定される。
【0032】
別の例示的実施形態では、カスケーディング・プロセスは、関連するインデント量を含む、ユーザから供給され得る特定の依存関係のリストに応じてインデントを決定する。たとえば、ユーザは、直接目的語は4スペースでインデントされるが間接目的語は2スペースしかインデントされないことを好むことがある。1つの実施形態では、これらのユーザ指定は、特定の文法関係を総合授業計画の一部として強調することを望むことがある教師または個人教師によって行われる。このような指定は、個々別々に、または依存関係タイプのカテゴリに対して行われ得る。たとえば、ユーザは、コア・アーギュメントが、非コア修飾語よりも多くインデントされるべきであることを指定することができる。構成要素カスケーディング・オペレーションは、構成要素が依存関係タイプに基づいてインデントされるかどうかを決定し、ユーザ・プリファレンスは、どれだけのインデントがフォーマット設定に反映されるかを決定することに留意されたい。ユーザ・プリファレンスは、加えて、フォントタイプ、フォント・サイズ、フォント色、行長さなどの、カスケードの表示属性に影響を及ぼし得る。
【0033】
例示的実施形態では、カスケードは、表示デバイスの制約に適合するように自動的に調整する。たとえば、コンピュータ画面は、タブレットまたは電話の表示よりも長い行長を許容することができる。行の長さが、XP間の改行を許容するにはあまりに短い場合、改行がX’レベルで行われ、追加の水平変位がない。したがって、水平変位に関連する視覚的手がかりは、新たな言語依存関係の開始を知らせるために確保される。追加のキューイング(たとえば、括弧、フォント・スタイル、色)が、構成要素の容易な識別を維持するために追加されてよい。
【0034】
図5は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、指示的にリンクされているフレーズどうしを識別するように拡張されているカスケードされたテキスト出力の一例500を示す。構成要素カスケーディング・オペレーションは、構成要素間の構文関係および意味関係についてカスケードを定義する。例示的実施形態では、テキストを参照語および先行詞に解析する別のNLPサービスが、言語論的に駆動される自動化されたテキスト・フォーマット設定を、参照キューイングを含むように拡張するために使用され、それにより、視覚的手がかり(たとえば、色など)が、語または構成要素間の参照関係(たとえば、図8に示される)を識別するようになる。これは、代名詞参照語(図8でアンダーラインで示されている)と同じフォント特性を持つ先行詞を提示することを伴う。参照キューイングは、図5および図8のものなどの文において、カスケード505に示される「occupied herself(自分自身を占有した)」人物が「the performer(演奏者)」であるか「the soloist(ソリスト)」であるかに関する混乱を防止するのに役立つ。構成要素レベルでの参照キューイングの例(たとえば、フレーズ「measure the room(部屋を測定する)」全体が「it(それ)」の先行詞である)が、カスケード510に示されている。参照キューイング・オペレーションが、限定ではなく例として、Stanford CoreNLPまたはAllenNLPなどの、自動化された同一指示解決パーサ(NLPサービス)の出力に基づいて、実施される。同一指示解決は、テキスト中の同じエンティティを指し示す表現を見つける。この情報は、カスケード・ジェネレータへの入力として機能する言語モデルに組み込まれる。同一指示情報はまた、訓練された言語技術者によって産出されるような、手動コード化ルールまたはフォーマット設定によって、または非ルールベースの確率的推論エンジンによる自動化された処理によって表示され得る。
【0035】
同一指示手がかりを示すためのカスケードの増大が、限定ではなく例として、構成要素または依存関係に基づくもの以外の言語特性がカスケード中でどのように知らされ得るかを示す。たとえば、同一指示パーサは、テキスト中の様々な言語関係を示す分析を産出する代替のNLPサービスに置き換えられてよい。例は、名前付きエンティティ認識、感情分析、意味役割ラベリング、テキスト含意、トピック追跡、韻律分析を、これらに限定されないが含む。これらは、ルールベースの、または確率的な推論システムとして実施され得る。これらのNLPサービスの出力は、言語関係を強調するようにしてカスケードの表示特性を修飾するために使用されることが可能な情報をもたらす。これらの修飾は、文内または文間で行われてよく、読者または学習者が読むときに一貫性を維持するのを助ける手がかりとして役立つ。
【0036】
本明細書に記述されているように、カスケードされたテキスト表示を生成するためのシステムおよび方法の様々な実施形態が提供される。図6Aに示された実施形態600では、テキスト部分605は、NLPサービス610からの出力に基づくテキスト部分605から決定された文法情報に基づいて、複数の従属セグメントにセグメント化される。これらのそれぞれは、コンスティテュエンシ・パーサ620によって定義された完全な構成要素であり、構成要素の先頭と関連付けられている依存関係パーサ625によって決定された依存関係役割を有する。1つの実施形態では、構成要素は、その最大射影(XP)によって識別され、その射影(X)の先頭と関連付けられた依存関係に割り当てられる。たとえば、構成要素「the principal(校長)」は、それと関連付けられた2つの依存関係(detおよびnsubj)を有するが、完全なNP構成要素は、カスケード・ジェネレータによる解釈のために、nsubjとして割り当てられる。
【0037】
図6Bは、一実施形態による、カスケード・ジェネレータ635によって提供された、言語学的に駆動される自動化されたテキスト・フォーマット設定によってそれぞれのセグメントに関して指定されている階層的な位置に応じて、カスケード630内のインデントを含むテキスト部分605を示す。
【0038】
図7は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための環境700およびシステム705の一例のブロック図である。図7は、図1図5図6A、および図6Bに示された特徴を提示し得る。環境は、クラウドベースの配信システム(または他のコンピューティング・プラットフォーム(たとえば、仮想コンピューティング・インフラストラクチャ、software-as-a-service(SaaS)、モノのインターネット(IoT)ネットワークなど))であってよいシステム705を含み得る。システムは、システム705をホストするクラウド・サービス・プロバイダのコンピューティング容量およびストレージ容量などのインフラストラクチャ・サービスを提供する、様々なバックエンド・システム710の中に分散していてよい。システム705は、(たとえば、有線ネットワーク、無線ネットワーク、セルラ・ネットワーク、共有バスなどを介して)ネットワーク720(たとえば、インターネット、プライベート・ネットワーク、パブリック・ネットワークなど)に通信可能に結合され得る。エンドユーザ・コンピューティング・デバイス715は、ネットワークに通信可能に接続されてよく、システム705への接続を確立することができる。エンドユーザデバイスは、ウェブ・ブラウザ、ダウンロード・アプリケーション、オンデマンド・アプリケーションなどを介してシステム705と通信することができる。一例では、システムのコンポーネントは、システム705の特徴へのオフラインアクセスを提供するインストール・アプリケーションを介した、エンドユーザ・コンピューティング・デバイス715への配信のために用意され得る。
【0039】
システム705は、エンドユーザ・コンピューティング・デバイス715を介して直接オンライン接続を提供することができ、パッケージサービスのセットをエンドユーザ・コンピューティング・デバイス715のエンドユーザ・アプリケーションに配信することができ、このエンドユーザ・コンピューティング・デバイス715は、インターネット接続なしでオフライン動作し、また、インターネットを通じてクラウドサービス(または他のコンピューティング・プラットフォーム)に(たとえば、プラグインなどによって)接続する、エンドユーザ・アプリケーションとのハイブリッドとして動作する。ハイブリッド・モードは、ユーザが接続性にかかわらずカスケード・フォーマットで読み出すことを可能にするが、システム705を改善するためのデータをなお提供する。エンドユーザ・アプリケーションは、いくつかの形で配布され得る。たとえば、ブラウザ・プラグインおよび拡張は、ユーザが、カスケーディング・フォーマットを使用してウェブ上およびアプリケーションで読むテキストのフォーマット設定を変更することを可能にすることができる。別の例では、エンドユーザ・アプリケーションがメニュー・バー、クリップ・ボード、またはテキスト・エディタに統合されることがあり、それにより、ユーザがマウスまたはホットキーを使用してテキストを強調表示するとウィンドウが、カスケード・フォーマットを使用してレンダリングされた、選択されたテキストとともに提示され得る。別の例では、エンドユーザ・アプリケーションは、入力ソースとしてPDFファイルを入力することができるとともにユーザに対する表示のためのカスケード・フォーマットを出力することができる、ポータブル・ドキュメント・ファイル(PDF)リーダであってもよい。さらに別の例では、エンドユーザ・アプリケーションは、拡張画像エンハンスメントであってもよく、これは、カメラからのライブ・ビューを変換するとともに、光学式文字認識(OCR)を、リアルタイムで画像をテキストに変換してレイアウトをカスケード・フォーマットでレンダリングするために適用する。バージョン管理サービス755は、アプリケーション・バージョンを追跡することができ、また、エンドユーザ・コンピューティング・デバイス715上で実行されるアプリケーションに提供されるポータブル・コンポーネントを、インターネットに接続されているときに定期的に更新することができる。
【0040】
例示的実施形態によれば、エンドユーザ・コンピューティング・デバイス715はOCR機能を含み、これはユーザが、(たとえば、自分の携帯電話の)カメラでテキストの画像を取り込み、それを(たとえば、図18に示されるように)カスケード・フォーマット設定されたテキストに即座に変換することを可能にする。一実施形態によれば、エンドユーザ・コンピューティング・デバイス715は、スマートグラス、スマート・コンタクトレンズなどのユーザ着用デバイスを含むか装着しており、ユーザに見られたテキストの入力は、理解の向上のために、カスケードされたフォーマットに変換される。このようにして、テキストは、ユーザのパーソナル視覚デバイスによってリアルタイムで変換され得る。別の例示的実施形態によれば、エンドユーザ・コンピューティング・デバイス715は、カスケード・フォーマットの拡張ビデオ(AV)、拡張現実(AR)、および仮想現実(VR)を提供し、カスケード・フォーマット設定の適用が、ユーザがテキストをカスケード・フォーマットで見ることを可能にするためのAVヘッドセットおよびVRヘッドセットと、眼鏡と、コンタクトレンズまたは移植可能レンズとを含む、ユーザ着用視覚表示デバイス内で完了され得る。
【0041】
本明細書で論じられているシステムおよび方法は、テキストを処理してカスケード・フォーマット設定に変換することによってテキストがデバイス上でレンダリングされる、様々な環境に適用可能である。画面へのテキストの表示は、レンダリングに関する命令を必要とし、カスケード命令セットは、コマンド・シーケンスに挿入され得る。これは、あるドキュメント・タイプ(たとえば、PDFなど)と、レンダリング・エンジンが埋め込まれているシステムとに適用されることがあり、この場合、レンダリング・エンジンへの呼び出しがインターセプトされ、カスケードされたフォーマット設定命令が挿入され得る。一例では、ユーザは、(たとえば、メニュー上、製品ラベル上などの)コンテンツにアクセスするための、バーコード、クイック・レスポンス(QR)コード、または他の機構をスキャンすることができ、そのコンテンツは、カスケードされたフォーマットで返され得る。
【0042】
システム705は、様々なサービス・コンポーネントを含むことができ、これらのコンポーネントは、カスケード・ジェネレータ725、自然言語処理(NLP)サービス730、マシン学習サービス735、分析性サービス740、ユーザ・プロファイル・サービス745、アクセス制御サービス750、およびバージョン制御サービス755を含む、バックエンド・システム710の様々なコンピューティング・デバイス上で全体的または部分的に実行されることが可能である。カスケード・ジェネレータ725、NLPサービス730、マシン学習サービス735、分析性サービス740、ユーザ・プロファイル・サービス745、アクセス制御サービス750、およびバージョン制御サービス755は、外部システムとの間で、および他のサービスとの間でデータを入出力できるアプリケーション・プログラミング・インターフェース(API)命令を含む、命令を含み得る。
【0043】
システム705は、様々なモードで動作することができる。すなわち、エンドユーザ(たとえば、読者など)が、カスケードされたテキストを生成するためのオフライン・コンポーネントのコピーを有するローカル・クライアントを使用して、テキストをローカル・クライアント上で変換し、エンドユーザは、テキストをシステム705へ送出して標準テキストを、カスケードされたテキストに変換することができ、発行者が、テキストをシステム705へ送出してテキストを、カスケードされたフォーマットに変換することができ、発行者は、システム705のオフライン・コンポーネント・セットを使用して、そのテキストをカスケード・フォーマットに変換することができ、また発行者は、システム705を使用して、従来のブロック・フォーマット設定またはカスケードされたフォーマット設定でテキストを発行することができる。
【0044】
カスケード・ジェネレータ725は、テキスト入力を受け取り、テキストをNLPサービス730パーサへ送って言語データを生成することができる。言語データは、限定ではなく例として、品詞、語レンマ、構成要素解析木、離散構成要素のチャート、名前付きエンティティのリスト、依存関係グラフ、依存関係のリスト、リンクされた同一指示表、リンクされたトピック・リスト、名前付きエンティティのリスト、感情分析の出力、意味役割ラベル、含意参照信頼度統計を含み得る。したがって、所与のテキストについて、言語解析は、それぞれのトークンについての豊富な言語情報のセットを含む語の内訳を返すことができる。この情報は、別々の文または別々の段落において現れる語または構成要素の間の関係のリストを含み得る。
【0045】
カスケード・ジェネレータ725は、コンスティテュエンシ・データおよび依存関係データを使用して作成されたマシン学習サービス735によって生成された言語モデルに対し、カスケード・フォーマット設定ルールおよびアルゴリズムを適用して確率的カスケード出力を生成することができる。
【0046】
図8は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケード・フォーマットへの言語的修正を受信するための環境800の一例を示す。ユーザ・インターフェース805およびプラグイン810は、図1A図1B、および図2図7に記述されている特徴を提供することができる。ユーザ・インターフェース805およびプラグイン810は、図7に記述されているシステム705に接続することができる。システム705は、テキストを解析してテキスト中の関連する用語を特定できる、同一指示パーサ810を含み得る。たとえば、ユーザ・インターフェース805に表示されているカスケードされた文中の「The performer(演奏者)」は、文の他の部分では代名詞によって指し示され得る。「The performer(演奏者)」および「herself(彼女自身)」は、これらが同じエンティティを指し示していることを示すために、強調表示されることが可能である(たとえば、アンダーラインが引かれる、色で強調表示される、他のテキストと対照的な色で表示される、イタリック体にされるなど)。一例では、同一指示パーサ810は、テキスト中の言語関係を示す分析を産出する代替のNLPサービスに置き換えられてよい。ユーザが特徴をオンまたはオフできるようにする、モード選択ボタン815が設けられることが可能である。たとえば、カスケード・モードが有効になっているときに、テキストがカスケード・フォーマットで表示されることが可能であり、同一指示追跡が有効になっているときに、関連用語が強調表示されることが可能であるなどである。
【0047】
図9は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、文どうしにわたる同一指示追跡のためのシステム900の一例を示す。例900は、図1図5図6A図6B、および図7図8に記述されている特徴を提供することができる。
【0048】
システム900は、クラウドベースの配信システム705を含むことができ、この配信システムは、同一指示パーサ910、コンスティテュエンシ・パーサ915、依存関係パーサ920、およびトピック・トラッカ925を含み得る。同一指示パーサ910、コンスティテュエンシ・パーサ915、依存関係パーサ920、およびトピック・トラッカ925は、テキストの特定のピースの間の関係のインジケーションを提供することができる。これらのシステムは、カスケード・ジェネレータ(たとえば、図7に記述されているカスケード・ジェネレータ725など)と連携して働いて、カスケードされたテキストを、視覚的な手がかりによって(たとえば、色などを使用して)示されるトピックおよび代名詞指示語とともにユーザ・インターフェース905に対して出力することができる。
【0049】
図10は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのシステム1000のデータフロー図を示す。システム1000は、図1図5図6A図6B、および図9に記述されている特徴を提供することができる。
【0050】
ユーザは、テキストを含む入力1005を提供することができる。一例では、テキストは、入力されたテキスト、OCR処理を使用して取り込まれたテキスト、アプリケーションまたはブラウザ・プラグインを介して取り込まれたテキスト、ハイパーテキスト・マークアップ言語(HTML)などとして提供され得る。テキストはまた、フォント・サイズまたはフォント・スタイルが強調された見出しを含む図、表、グラフ、写真および視覚的に強調されたテキストを含む、視覚的コンテンツを含み得る。入力はまた、たとえば、ユーザがテキスト文字列「The patient who the girl liked was coming today.(その女の子が好きだった患者が今日来ることになっていた。)」をタイプ入力できるように、ユーザから直接来ることもある。入力プロセッサ1010は、テキスト・コンテンツを、フォーマット設定および特殊文字を除去し、段落の場合には、テキストを個々の文に分割するように処理することができる。
【0051】
処理されたテキストを含む処理された入力1015は、入力プロセッサ1010によってNLPサービス1020のセットへ送られ得る。一実施形態によれば、2つの主要なNLPサービスは、コンスティテュエンシ・パーサ1025および依存関係パーサ1035である。文の構成要素は、文の言語学的に定義された部分であり、語、句または節と一致し得る。構成要素は、階層的に編成され、フレーズ構造ルールによって(たとえば、図1などに示されるように)定義される。コンスティテュエンシ・パーサ1025は、入力テキストを処理し、解析木(たとえば、コンスティテュエンシ・パース)、離散構成要素のチャート、品詞、語レンマおよびメタデータを含むコンスティテュエンシ・データ1030を生成し、データ処理部1045へ送ることができる。
【0052】
たとえば、コンスティテュエンシ・パース1025は、テーブル1に示されるように「The patient who the girl liked was coming today.」のコンスティテュエンシ・データ1030を生成することができる。
【0053】
【表1】
【0054】
処理されたテキストを含む、処理された入力1015は、入力プロセッサによってNLPサービス1020の依存関係パーサ1035へ送られ得る。依存関係パーサ1035は、入力テキストを処理できるとともに語間の依存関係についてのデータを提供する依存関係データ1040を生成し、データ処理器1045へ送ることができる。依存関係データ1040は、付加的な階層埋め込み(たとえば図3)、トークン、依存関係ラベル、およびメタデータとともにルート・ノートの下に埋め込まれた従属子を記述する、解析木または有向グラフを含み得る。たとえば、依存関係パーサ1035は、テーブル3に示されるように「The patient who the girl liked was coming today.」の依存関係データ1040を生成することができる。
【0055】
【表2】
【0056】
別の例では、依存関係解析部1035は、テーブル2に示されるように「The patient who the girl liked was coming today.」の依存関係データ1040を生成することができる。
【0057】
【表3-1】

【表3-2】
【0058】
データ・プロセッサ1045は、コンスティテュエンシ・データ1030および依存関係データ1040と、他の任意のNLPサービスからの情報とを用いて、モデル1050を生成することができる。モデル1050は、品詞、語レンマ、構成要素解析木、離散構成要素のチャート、名前付きエンティティのリスト、依存関係グラフ、依存関係のリスト、リンクされた同一指示テーブル、リンクされたトピック・リスト、感情分析の出力、意味役割ラベル、含意参照信頼度統計を含み得る。
【0059】
一例では、データ・プロセッサ1045は、テーブル4に示されるように「The patient who the girl liked was coming today.」のモデル1050を生成することができる。
【0060】
【表4-1】

【表4-2】
【0061】
モデル1050は、カスケード・ジェネレータ1055によって処理され得る。カスケード・ジェネレータ1055は、カスケード・ルールをモデル1050に対して適用してカスケード出力1060を生成することができる。カスケード・ルールは、解析出力における特有の構成要素または依存関係の検出に基づいた実行のためにトリガされるオペレーションである。カスケード・ルールによって実行されるオペレーションは、改行が出力に挿入されるべきかどうかと、テキストの行のインデントレベルと、ユーザのための手がかりを作成する他の出力生成オペレーションとを決定することを含み得る。一例では、カスケード・ルールは、表示デバイスに表示されるテキスト出力のインデントおよび改行の配置を識別するデータを含む、テキスト・モデルを生成するために使用され得る。カスケード・ジェネレータ1055は、カスケードされたテキストおよびメタデータを、カスケードされた出力1060中で返すことができる。たとえば、カスケード・ジェネレータ1055は、「the patient who the girl liked was coming.」という文に対して、テーブル5に示されるようなカスケード・ルールを使用して、カスケードされた出力1060を生成することができる。
【0062】
【表5-1】

【表5-2】
【0063】
別の例では、カスケード・ジェネレータ1055は、テーブル6に示されるカスケード・ルールを使用して、カスケードされた出力1060を生成することができる。
【0064】
【表6-1】

【表6-2】
【0065】
カスケードされたテキストのその他の例がテーブル7に示されている。
【0066】
【表7】
【0067】
図11は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法1100の一例を示す。方法1100は、図1図5図6A図6B図7、および図10に記述されている特徴を提供することができる。
【0068】
オペレーション1105で、テキスト部分がインターフェースから取得され得る。一例では、インターフェースは、物理的キーボード、ソフトキーボード、テキスト音声ディクテーション・インターフェース、ネットワーク・インターフェース、またはディスク・コントローラ・インターフェースであってよい。一例では、テキスト部分は、リッチ・テキスト、プレーン・テキスト、ハイパーテキスト・マークアップ言語、拡張可能マークアップ言語、または情報交換用米国標準コードのグループから選択された、一般的なフォーマットの一連のテキストであってよい。
【0069】
オペレーション1110で、テキスト部分は複数の従属セグメントにセグメント化され得る。セグメンテーションは、コンスティテュエンシ・パーサおよび依存関係パーサを使用して、テキスト部分の評価に基づくことができる。一例では、コンスティテュエンシ・パーサは、依存関係パーサによって識別された特定の依存関係役割を保持する完全なセグメントを識別する。
【0070】
オペレーション1115で、複数の従属セグメントは、それぞれのセグメントの階層的な位置を記述するキューイング・ルールに従って符号化され得る。一例では、テキスト部分のテキスト・モデルが、コンスティテュエンシ・パーサおよび依存関係パーサの出力と、さらに他のNLPサービスとを使用して構築されることが可能であり、カスケード・ルールがテキスト・モデルに適用されて、符号化されたセグメントが生成され得る。一例では、テキスト・モデルは、品詞、レンマ、コンスティテュエンシ・チャート、解析木、およびテキスト中のそれぞれの語の依存関係リストを含むデータ構造とすることができる。符号化されたセグメントは、テキストと、従属セグメントの階層的な位置を定義するメタデータを含み得る。一例では、従属セグメントは文からのセグメントであり得る。一例では、階層的な位置は、ユーザ・インターフェースにおける、符号化されたセグメントの、従属セグメントの別の1つに対するオフセットに対応し得る。一例では、符号化されたセグメントは、改行データおよびインデント・データを含み得る。一例では、テキスト部分のセグメンテーションは、テキスト部分を別のテキスト部分に付け加えること、テキスト部分のインデントを修正すること、またはテキスト部分の前に改行を挿入することを含み得る。
【0071】
オペレーション1120で、符号化された複数の従属セグメントが、ユーザ・プリファレンスに応じてユーザ・インターフェースに表示され得る。一例では、従属セグメントは、JavaScript(登録商標) Object Notation、拡張可能マークアップ言語、または情報交換用米国標準コードを使用して符号化され得る。一例では、従属セグメントを符号化することは、いくつかの文の従属セグメントを連結してテキスト・コンポジションを作成することを含み得る。一例では、結合された文は、ファイルに書き込まれること、クラウド・プロトコルを介して伝達されること、または出力デバイスに直接表示されることが可能である。
【0072】
一例では、符号化されたセグメントが受け取られ得る。符号化されたセグメントが解析されて、それぞれのテキストと、符号化されたセグメントの階層的な位置とが取り出され、その位置に応じて、テキストが表示されることが可能である。一例では、テキストの表示は、位置に応じて、テキストの一部分のオフセットの修正と、テキストの一部分の文字高さの調整とを含むことができる。一例では、オフセットは、左から右への言語では左から、右から左への言語では右からとすることができる。
【0073】
一例では、テキストの表示は、位置に応じて、インデントの付け加え、修正、および改行の修正を、言語構造に基づくテキストの位置配置に影響を及ぼすことなく含み得る。
図12は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法1200の一例を示す。方法1200は、図1図5図6A図6B、および図7図11に記述されている特徴を提供することができる。
【0074】
オペレーション1205で、入力文の1つまたは複数の構成要素を表すデータは、コンスティテュエンシ・パーサ(たとえば、図10に記述されているコンスティテュエンシ・パーサ1025など)から受け取られてよい。1つまたは複数の構成要素を表すデータは、コンスティテュエンシ・パーサを使用して入力文を評価することに基づいて生成されることが可能である。一例では、コンスティテュエンシ・パーサは、文の構成要素を識別することができる。一例では、構成要素は、階層構造内で単一ユニットとして機能する語または語のグループであり得る。
【0075】
オペレーション1210で、入力文の語間の関係を表すデータが、依存関係パーサ(たとえば、図10に記述されている依存関係パーサ1035など)から受け取られ得る。この関係は、文構造に基づいていてよく、依存関係パーサを使用して入力文を評価することに基づいて導き出され得る。一例では、依存関係は、1対1の対応とすることができ、それにより、入力文の1つの要素に対して、その要素に対応する入力文の構造内に正確に1つのノードがあることになる。
【0076】
オペレーション1215で、テキスト・モデルは、(図6Aなどに示された)構成要素および依存関係を使用して構築されることが可能である(たとえば、図10に記述されている入力プロセッサ1015などによって)。一例では、テキスト・モデルは、限定ではなく例として、同一指示情報、感情追跡、名前付きエンティティ・リスト、トピック追跡、確率的推論評価、韻律輪郭、および意味分析を含む、追加のNLPサービスによって産出された言語特徴によってさらに精緻化されることが可能である。
【0077】
オペレーション1220で、カスケード・ルールは、(たとえば、図10に記述されているカスケード・ジェネレータ1055などによって)テキスト・モデルに対して適用されて、カスケードされたテキスト・データ構造を生成することができる。一例では、カスケードされたテキスト・データ構造は、テキストと、テキストの表示パラメータを指定するメタデータとを備える。一例では、カスケード・テキスト・データ構造は、スキーマ(たとえば、XMLスキーマなど)に従って編成されたファイル(たとえば、拡張可能マークアップ言語(XML)ファイルなど)を備える。一例では、スキーマは、ファイル内のコンポーネントおよびコンポーネントの配置についての仕様を備える。一例では、テキスト・モデルは、入力文に含まれる語の構成要素および依存関係を記述するデータ構造とすることができる。一例では、テキスト・モデルは、テキストの解析木、品詞、トークン、構成要素チャート、および依存関係を含むデータ構造とすることができる。一例では、カスケード・ルールは、構成要素および依存関係に対応して定義された改行およびインデントを作成する、フォーマット作成ルールを備える。
【0078】
一例では、カスケードされたテキストと関連付けられているメタデータが生成され得る。別の例では、カスケードされたテキストは、表示デバイスに表示するための改行およびインデントを含む、フォーマット設定されたテキスト・セグメントのセットを備える。いくつかの例では、テキストの入力文は、ユーザによって指定されたソースから受け取られてよい。
【0079】
段落または文の集まりの例では、テキストは、それがコンスティテュエンシ・パーサまたは依存関係パーサに提供される前にテキストを文のリストに分割するように処理されることが可能である。それぞれの文は、コンスティテュエンシ・パーサ1205および依存関係パーサ1210によって個別に処理されてよい。一例では、方法1200は、テキスト中のそれぞれの文に対して適用される。たとえば、文は、それぞれが別々にカスケードされて、しかしユーザ・プリファレンスに応じて、順次に表示されてよい。いくつかの例では、文は、インデント以外の視覚的な手がかり(たとえば、背景陰影、専用のマーカなど)によって、段落にグループ分けされてもよい。
【0080】
図13は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法1300の一例を示す。方法1300は、図1図5図6A図6B、および図7図12に記述されている特徴を提供することができる。
【0081】
テキストのモデルは、テキストを解析することによって取得された依存関係データおよびコンスティテュエンシ・データから(たとえば、図10に記述されている入力プロセッサ1015などによって)構築され得る(たとえば、オペレーション1305で)。カスケード・データ構造は、テキストのモデルに対して(たとえば、図10に記述されているカスケード・ジェネレータ1055などによって)適用されるカスケード・ルールに従って生成されてよい(たとえば、オペレーション1310で)。テキストの文は、カスケードされたテキスト・データ構造に応じて表示され得る(たとえば、オペレーション1315で)。データ構造は、テキストの水平配置および垂直配置を表示のために指定することができる。
【0082】
図14は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにマシン学習分類子を使用してテキストをカスケードするための方法1400の一例を示す。方法1400は、図1図5図6A図6B、および図7図13に記述されている特徴を提供することができる。
【0083】
オペレーション1405で、テキスト部分がインターフェースから取得される。たとえば、テキストは、入力デバイスを介してユーザによって入力されてよく、また、ローカルまたはリモートのテキスト・ソース(たとえば、ファイル、発行者データ・ソースなど)などから取得されてよい。オペレーション1410で、テキスト部分は、言語エンコーディングを取得するために、NLPサービス(たとえば、図7に記述されているNLPサービス730など)を通して処理される。たとえば、テキストは、限定ではなく例として、コンスティテュエンシ・パーサ、依存関係パーサ、同一指示パーサなどを含み得る様々なパーサを使用して解析されて、構成要素、依存関係、同一指示などが識別され得る。オペレーション1415で、マシン学習(ML)分類子が言語エンコーディングに対して適用されてカスケードが決定される(たとえば、図7に記述されているカスケード・ジェネレータ725などによって)。たとえば、マシン学習分類子は、パーサによって識別された情報(たとえば、パーサによって識別された言語情報とともに符号化されたテキストの一部分など)を用いて、テキストの一部分をフォーマット設定(たとえば、改行、インデントなど)のために分類することができる。オペレーション1420で、カスケードは、ユーザ・プリファレンスに応じてユーザ・インターフェースに表示される。たとえば、カスケードは、コンピューティング・デバイス(たとえば、スタンドアロン・コンピュータ、モバイル・デバイス、タブレットなど)の画面に、アプリケーション・ウィンドウ、ウェブ・ブラウザ、テキスト・エディタなどで表示され得る。
【0084】
図15は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにテキストをカスケードするようにマシン学習分類子をトレーニングするための方法1500の一例を示す。方法1500は、図1図5図6A図6B、および図7図14に記述されている特徴を提供することができる。
【0085】
図7に示されたマシン学習サービス735などのマシン学習サービスは、人間の労力によって手作業で定義された、またはカスケード・ジェネレータ(たとえば、図10で論じられているカスケード・ジェネレータ1055など)によって定義されたロジックおよびルールを使用することの別法として、出力(たとえば、図10に記述されている出力1060など)をカスケードするためにカスケードの例を用いてトレーニングされる。
【0086】
オペレーション1505で、カスケードされたテキストのコーパスが取得され得る。コーパスは、トレーニング・セットとテスト・セットに分離される。オペレーション1510で、コーパスはサブセットに分割され得る。たとえば、コーパスの大部分がトレーニング用に、残りの部分が検証用に指定される。オペレーション1515で、確率的マシン学習法(たとえば、再帰的特徴量削減を用いるサポート・ベクター・マシンなど)が適用されて、サブセットの一部分(たとえば、トレーニング・セットなど)のパターン分類子のセットが生成され得る。交差検証手順が実行されて、テスト・セット内の文のカスケードされていない例に対してパターン分類子を適用することによって、パターン分類子のセットが評価される。オペレーション1520で、パターン分類子のセットが、サブセットの残りの部分におけるカスケードされたテキストのコーパスの、カスケードされていないバージョンに適用されて、カスケードされたテキストの新たなセットが生成され得る。分類子セットによって生成されたカスケードの妥当性が、既知のカスケードに関して評価され得る。オペレーション1525で、カスケードされたテキストの新しいセットの妥当性は、精度、感度、および特異度に応じて、テスト・セットの既知のカスケードに対して評価され得る。たとえば、構成要素および依存関係がマークされているカスケードされたテキストのコーパスは、トレーニング・セットとして機能して分類子機能が産出され、この機能は、(トレーニング・セット中にない)特定の新規文の適切なカスケードをその言語属性に基づいて生成するために使用され得る。限定ではなく例として、分類が、再帰的特徴量削減を用いる線形カーネル・サポート・ベクター・マシンを使用して実行され得る(SVM-RFE;グヨン(Guyon)ら、2002年)。SVM分類アルゴリズム(バプニク(Vapnik)、1995年、1999年)は、幅広い適用例において使用されており、他の方法よりも良い精度を産出している(たとえば、アスリ(Asri)ら、2016年、ファング(Huang)ら、2002年、ブラック(Black)ら、2015年)。SVMは、高次元特徴空間における2つのクラス間の最適な分離点(超平面)を識別することによって、超平面まわりのマージン幅が最大化されるように、また、誤分類誤差が最小化されるように、データをクラス(たとえば、カスケード・パターン)に分割する。超平面に最も近いケースはサポート・ベクトルと呼ばれ、これらはクラスを区別するための重要な識別子としての役割を果たす。交差検証(CV)手法が、分類モデルの汎化可能性を評価するために利用される(たとえば、アーロット(Arlot)およびセリッセ(Celisse)、2010年、ジェームス(James)、ウィッテン(Witten)、ヘイスティー(Hastie)およびチブシラニ(Tibshirani)、2013年)。これは、データをサブセットまたはフォールドに分割することを含み(10個が、10-fold CVと呼ばれる規約に従って使用される)、9個が分類子の学習に使用され、差し出しセットが結果の分類子を検証するために使用される。
【0087】
交差検証は、マルチレベルの手法を用いて我々の分類子の汎化可能性を、i)ケース(文)、ii)特徴(たとえば、構文カテゴリまたは依存関係)、およびiii)チューニングパラメータ(最適化)にわたって検証するために実行される。この方法は、オーバーフィッティングを防ぐとともに、分類子の複数の態様を同時に評価するために同じCVサブセットを使用することから生じ得る偏った分類精度の推定を回避する。それぞれのCV手順の結果は、特殊性=TN/(TN+FP)、感度=TP/(TP+FN)、および精度=(感度+特殊性)/2の尺度を使用して評価され、ここで、TNは真の負の数、FPは偽の正の数、TPは真の正の数、FNは偽の負の数である。
【0088】
様々なマシン学習技法が、ラベル付けされたデータまたはラベル付けされていないデータを使用してキュー挿入ポイントおよびキュー・フォーマット設定を認識するように分類子をトレーニングするために、使用され得ると理解されてよい。ラベル付けされたデータを観察し、そのデータから学習すること、またはトレーニング・カスケード・コーパスの位置構造に基づく固有のコーディングから学習することに一致しているマシン学習技法が、分類子のトレーニングを容易にするために使用されてよい。したがって、SVMが、トレーニング・プロセスにさらに情報を与えるための例として使用されているが、同様の機能を持つ代替のマシン学習技法も使用されてよいことを理解されたい。
【0089】
このプロセスは、代替手段によって生成されたトレーニング・セットを用いて適用することができ、カスケード・ジェネレータには依存しない。たとえば、手作業でコード化されたトレーニングデータなどが、カスケードされたテキストを生成するようにMLモデルをトレーニングするために使用されてよい。
【0090】
一例では、本明細書で言及されているNLPサービスは、テキスト解析のためにRNNを使用できる、事前にトレーニングされたAIモデル(たとえば、AMAZON(登録商標)コンプリヘンドまたはスタンフォードパーサ(Comprehend or Stanford Parser)(https://nlp.stanford.edu/software/lex-parser.shtml)、GOOGLE(登録商標)自然言語(Natural Language)、またはMICROSOFT(登録商標)テキスト分析性(Text Analytics)、アレンNLP(AllenNLP)、スタンザ(Stanza)など)を使用することができる。より大量のデータが与えられると、RNNは、マッピングをフリー・テキスト入力から学習して、フリー・テキスト中に存在し得る予測エンティティ、キー・フレーズ、品詞、構成要素チャート、または依存関係などの出力を作成することができる。一例では、追加のマシン学習モデルが、キー・フレーズ・フォーマット・ルール、品詞フォーマット・ルール、エンティティ・フォーマット・ルール対、コンスティテュエンシ・データ、依存関係データなどをトレーニングデータとして使用してトレーニングされて、将来の解析オペレーションで使用され得る様々な品詞、キー・フレーズ、エンティティ、構成要素、依存関係などを識別するように学習することができる。別の例では、ユーザ・プリファレンスおよび品詞、キー・フレーズ、エンティティ対、コンスティテュエンシ、依存関係などが使用されて、マシン学習モデルが、様々な品詞、キー・フレーズ、およびエンティティに基づいてユーザ・プリファレンスを識別するようにトレーニングされ得る。様々なマシン学習モデルは、選択された出力に所与の入力が関連している統計的尤度に基づいて、出力を提供することができる。たとえば、様々な閾値層を含むリカレント・ニューラル・ネットワークが、出力をフィルタリングして出力選択の精度を高めるためのモデルを生成するのに使用されてよい。
【0091】
カスケードされた出力は、様々な媒体でユーザに対して提示されてよい。たとえば、元のテキストとカスケードされたテキストとの横並び表示が、表示デバイスに表示されてよく、元のテキストが、カスケードされた出力で置換または修飾されてよい。
【0092】
一例では、マシン学習が、カスケードされたテキストのコーパスを評価して、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケード・パターン分類子を学習するために使用され得る。パターン分類子は、カスケード・ルールのスタイルに応じて、テキスト・セグメントに含有される言語属性を知らせる実際の視覚的手がかり(たとえば、カスケーディング、インデント、改行、色など)を指定する。一例では、分類子は、テキスト・セグメントの語、品詞、構成要素グループ、または依存関係ラベルを評価し、カスケード・トレーニング・セット中に存在する視覚的手がかりと一致するフォーマット設定構造を産出することができる。一例では、分類子は、トレーニング・セット中のカスケードの形状および表示特性を直接評価し、トレーニング・セット中に存在する視覚的手がかりと一致するフォーマット設定構造を産出することができる。
【0093】
図16は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためのカスケードされたフォーマットでテキストの文を表示するためのテキスト変形1600の一例を示す。テキスト変換1600は、図1図5図6A図6B、および図7図15に記述されている機能を提供することができる。ブラウザ・ウィンドウ1605は、システム1605に接続されているプラグイン1610と、カスケード・モードがオフのときのカスケード・モード・ボタン1615とを含むことができ、標準テキスト1620は、ユーザがウェブサイトのテキストを閲覧するときに表示され得る。カスケード・モードがオンのとき、テキストは、カスケード・フォーマット1625でフォーマット設定され、表示され得る。
【0094】
図17は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための、カスケードされたテキスト用にタグ付けされたハイパーテキスト・マークアップ言語(HTML)コードの一例1700を示す。例1700は、図1図5図6A図6B、および図7図16に記述されている特徴を提供することができる。ソース・テキスト1705は、テキスト・モデル1050(たとえば、品詞、キー・フレーズ、コンスティテュエンシ・データ、依存関係データなど)を産出するように、図7に記述されているNLPサービス730によって処理され得る。この例は、ソース・テキスト1705をHTMLコードとして示しているが、テキストは、ASCII形式、XML形式、または他の様々な機械可読形式であってよい。図7に記述されているカスケード・ジェネレータ725は、テキスト・モデル1050に基づいてテキストに挿入された改行(たとえば、HTMLコードで</br>タグなどのような)、およびインデント(たとえば、text-indent:tag in HTMLなどを使用して)を示す、タグ付き出力テキスト1715をレンダリングすることができる。
【0095】
カスケード・ジェネレータ725は、構成要素および依存関係、または他の言語データに関して本明細書に記述されているような複数の機能について、いくつかの呼び出しをNLPサービス730に対して行うことができる。1つの実施形態では、これらのそれぞれが、別個の呼び出し/機能であり、組み合わされたときに、カスケードされたテキストを生成するために使用されるべきタグのセットを提供する。
他の実施形態
図7の記述に戻ると、1つの例示的実施形態によれば、キー・フレーズ、構成要素、依存関係などが、NLPサービス730によって確率的に、計算言語学を使用して決定され得る。カスケード・ジェネレータ725によって生成されたカスケーディング・テキストは、読解を改善することができる。一例示的実施形態によれば、文中の「誰が」「いつ」「どこで」「何を」の情報を記述する構成要素は、改行および/またはインデントによって分離されて、カスケードされたテキスト・フォーマットが達成される。カスケード・ジェネレータ725は、依存関係などにリンクされている構成要素を使用して、文の「誰が」「いつ」「どこで」「何を」を決定する。たとえば、カスケード・ジェネレータ725によって挿入されるインデントは、NLPサービス730によって通知された文コンスティテュエンシ階層に基づいている。
【0096】
カスケード・フォーマット設定の継続的改善は、マシン学習サービス735によるマシン学習技法を含む人工知能を使うことによって、達成され得る。マシン学習サービス735との間の入力/出力は、能動的および受動的に処理され得る。たとえば、マシン学習サービス735は、2人のユーザが、人物Aと人物Bの間でわずかに異なるカスケード・フォーマットで同じ資料を読んでいる可能性がある例において、能動的マシン学習手法のもとで動作することができる。ユーザによる資料の読解は、評価によって追跡されることが可能であり、マシン学習サービス735は、カスケード・ジェネレータ725によって使用されて経時的に表示特性を修正できる出力を生成することができる。この手法は、システム705が、規模および使用法によって改善することを可能にする。マシン学習サービス735は、受動モードで動作して、読む行動のような属性を明示的な評価なしで測定することができる。たとえば、分析性サービス740は、読者理解度を示す出力を生成するのに(単独で、および組み合わされたときに)使用されてよいデータを、ユーザが評価を受けなくても収集することができる。カスケード・フォーマット設定を改良するために評価され得るデータの一部は、限定ではなく例として、テキストの所与の部分を読むのに費やされた時間と(たとえば、読むのに費やされた時間が短いほど、理解度がより高いことなどを示し得る)、同じコンテンツの異なるカスケード・フォーマット間で視線の動きの効率を評価してマシン学習入力を提供するカメラ(たとえば、埋め込みカメラ、外部カメラなど)を使用する視線追跡と、個人的な修飾の程度をユーザ・プリファレンス(たとえば、より多くの間隔、文節の長さ、フォント、キー・フレーズまたは品詞の色の強調、構成要素、従属語など)について評価するためのユーザ修飾とであり得る。
【0097】
分析性サービス740は、読解の尺度、システムに対する修飾(たとえば、スクロール速度、間隔、フラグメント長さ、ダーク・モード、キー・フレーズ強調表示など)に反映されたユーザ・プリファレンスなどを含むユーザ分析性をログに記録し、保存することができる。修飾は、様々な修飾がどのようにして理解パーフォーマンスになるかを決定するために、様々なカスケード・フォーマットについて評価されることが可能であり、デフォルト表示フォーマットを改善するための入力としてマシン学習サービス735に供給され得る。ユーザ・プロファイル・サービス745は、プライバシーおよびプライバシー・コンプライアンス(たとえば、HIPPAコンプライアンスなど)のための匿名化された識別子を含むユーザ・プロファイル・データを保存し、パーフォーマンス・メトリクスおよび進捗を追跡することができる。たとえば、ユーザによって継続的に行われる表示パラメータに対する修飾は、分析性サービス740からの入力に基づいてマシン学習サービス735によって学習されることが可能であり、ユーザ固有の表示特性を生成するために使用され得る。アクセス制御サービス750は、頻度、使用時間、およびテキスト属性(たとえば、フィクション、ノンフィクション、著者、研究、詩など)についてのメトリクスを含む、保存されたコンテンツへのアクセスを提供することができる。別のパーソナライゼーションによれば、ユーザは、テキスト色、フォント、フォント・サイズなどの表示パラメータをパーソナライズすることができる。
【0098】
一例では、読書スコアがユーザのために開発され得る。学生の年齢および学年に基づき得るスコアリング行列が作成されることが可能であり、このスコアリング行列は、指定されたコンテンツを学生が読むことと、次いで、関連する学生の理解との結果(たとえば、読解スコア(RCS)など)であり得る。RCS手法は、同様の集団間の相対的なスコアリング・メトリクスを確立するという点で、成績平均点(GPA)に類似している。このメトリクスは、カスケード・フォーマット設定を使用するユーザによる、テキストの消費の評価に基づくことができる。たとえば、評価が経時的に追跡されて(能動的または受動的に)、ユーザによるテキストの理解の速度および効率が決定され得る。理解の速度とともに増加するスコアが、ユーザについて計算され得る。読書評価を実行する前に受け取られた入力が、ユーザのベースライン割当量を生成するために使用されてよい。
【0099】
認知トレーニング・ライブラリが、カスケード・フォーマット設定を使用して開発され得る。たとえば、書籍、雑誌および論文などの様々な出版コンテンツが、カスケーディング・フォーマットを使用して翻訳されることが可能であり、ユーザが、理解力および保持力を高めるために自分の脳をトレーニングする目的で、ライブラリにアクセスすることが可能にされ得る。テストおよびクイズが、ユーザの理解のパーフォーマンスを評価するために使用されて、認知力改善の明白な証拠がユーザに提供されることが可能である。
【0100】
カスケード・フォーマット設定が、様々な言語を処理するために適用されてよい。NLPサービスが、他の言語テキストの言語的特徴を提供するために使用されてよく、ルールが作成され、NLP出力(たとえば、スペイン語テキストなど)に対して適用され、それに応じて外国語テキストがカスケードされることが可能である。言語改作物に加えて、改作物が他の言語の構文に基づいて作られることもあり、したがって、異なる言語のカスケードされたテキストは、言語固有の構文上のバリエーションを考慮するために、異なるフォーマット設定ルールを使用して、異なるフォーマットでカスケードすることができる。コンスティテュエンシおよび依存関係のNLPサービスは、複数の言語で利用可能である。カスケード・ルールが世界共通の依存関係セットに基づいているので、カスケード・ルールは他の言語に移る可能性が高いが、出力は異なって見えることがある(たとえば、いくつかの言語では左から右、上から下ではなく、右から左に読むなど)。一部には、異なる種類の改行を必要とし得る、異なる長さの語がある(たとえば、膠着語は、形態素を付け加えることによって文法を追加する結果、非常に長い語になるなど)。言語に適応している表示特性が適用されるが、本明細書で論じられている構成要素キューイングのプロセスは一定のままである。
【0101】
一例では、口語が、カスケード・フォーマット設定されたテキストの視覚表示と組み合わされ得る。人がカスケーディング・テキストを読んでいるときに、同じテキストを読んでいるサウンドトラックもまた、個々の読者の速度に合わせて制御可能な速度で再生されるように、音声が統合され得る。たとえば、テキストからスピーチへの変換が、音声/スピーチ出力をリアルタイムかつ読むペースで提供するために使用されてよく、理解度が評価されてよく、また、テキストからスピーチへの変換出力の速度が、音声とユーザの読みとの同期を保持するために変更されてよい(たとえば、スピードアップ、スローダウン、一時停止、再開など)。カスケードには、読者が改行と関連付けられた韻律的な手がかりを視覚的に認識できるようにして、スピーチが伴うことが可能である。この演繹的なシステムは、ユーザ自身の音読がこの韻律を模倣するようにユーザを指導するのに使用され得る。これは、構文構造についての知識の増大をサポートする。
【0102】
図18は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために取り込まれた画像から、カスケードされたテキストを生成することの一例1800を示す。例1800は、図1図5図6A図6B、および図7図17に記述されている特徴を提供することができる。撮像デバイス1805は、テキスト1810を含む画像を取り込むことができる。画像は、テキスト1810を画像から(たとえば、光学式文字認識などによって)抽出するように処理され得る。テキスト1810は、システム1000によって評価されて、テキスト中の(たとえば、コンスティテュエンシ、依存関係などに基づく)テキスト・モデルが識別され得る。カスケード・フォーマット設定ルールが、システム1000によって割り当てられた言語属性に基づいてテキスト1810に適用されてよい。テキスト1810は、カスケード・フォーマット設定ルールによって、カスケードされた出力テキストに変換され、ユーザによる消費のために表示されることが可能である。
【0103】
図19は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために取り込まれた画像から、カスケードされたテキストを生成するための方法1900の一例を示す。方法1900は、図1図5図6A図6B、および図7図18に記述されている特徴を提供することができる。オペレーション1905で、テキストの画像が撮像デバイスの視野内に取り込まれ得る。オペレーション1910で、テキストが画像内で認識されて、機械可読テキスト文字列が生成され得る。オペレーション1915で、機械可読テキスト文字列がNLPサービスによって、言語属性(たとえば、品詞、レンマ、コンスティテュエンシ・データ、依存関係データ、同一指示データ、感情分析、トピック追跡、確率的推論、および韻律構造など)を識別するように処理されて、テキスト・モデル(たとえば、図10の要素1050で示される)が生成され得る。オペレーション1920で、テキスト・モデルを用いて適用されたルールに基づく改行およびインデントを含む、テキスト・カスケードが生成され得る。一例では、テキスト文字列はテキストの文を含むことがあり、改行およびインデントがその文に対して適用され得る。一例では、テキスト文字列は、視覚的な手がかり(たとえば、背景色、明示的なマーカなど)によって段落にグループ分けされた複数の文を含み得る。
【0104】
図20は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために自然言語処理を使用して、アイウェア・デバイスにおいてテキストを第1の表示フォーマットから第2の表示フォーマットへ変換することの一例2000を示す。例2000は、図1図5図6A図6B、および図7図19に記述されている特徴を提供することができる。ユーザ2005が、撮像デバイス2010を含むスマートグラスを装着していることがあってよい。撮像デバイス2010は、テキスト2015を含む画像を取り込むことができる。画像は、テキスト2015を画像から(たとえば、光学式文字認識などによって)抽出するように処理され得る。テキスト2015は、システム705によって評価されて、テキスト中の言語属性(たとえば、品詞、キー・フレーズ、コンスティテュエンシ・データ、依存関係データなど)が識別され得る(たとえば、図10に記述されているモデル1050などを形成するために)。カスケード・フォーマット設定ルールは、クラウドベースの配信システム705によって識別された言語属性(たとえば、図10に記述されているモデル1050など)を使用して、テキスト2015に適用されてよい。テキスト2015は、カスケードされた出力テキスト2020に変換され、撮像デバイス2010を含むスマートグラスの表示デバイス上に、ユーザによる消費のために表示されることが可能である。
【0105】
図21は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにアイウェア・デバイスにおいてテキストを第1の表示フォーマットから第2の表示フォーマットへ変換するための方法2100の一例を示す。方法2100は、図1図5図6A図6B、および図7図20に記述されている特徴を提供することができる。オペレーション2105で、テキストの画像が、アイウェア・デバイスの撮像コンポーネントの視野内で取り込まれ、またはテキスト入力の別のソースから取り込まれ得る。一例では、アイウェア・デバイスは、テキストがファイルとして保存またはダウンロードされるメモリを有することができ、テキストが無線で獲得され、次いで変換されるなどの無線機能を有することができる。オペレーション2110で、テキストは画像内で認識されて、機械可読テキスト文字列が生成され得る。オペレーション2115で、機械可読テキスト文字列がNLPサービス1020によって、言語属性(たとえば、品詞、レンマ、コンスティテュエンシ・データ、依存関係データ、同一指示データ、感情分析、トピック追跡、確率的推論、および韻律構造など)を識別するように処理されて、テキスト・モデル(たとえば、図10に記述されているモデル1050)が生成され得る。オペレーション2120で、テキスト・モデル1050を用いて適用されたルールに基づく改行およびインデントを含む、テキスト・カスケードが生成され得る。一例では、テキスト文字列はテキストの文を含むことがあり、改行およびインデントがその文に対して適用され得る。一例では、テキスト文字列は、視覚的な手がかり(たとえば、背景色、明示的なマーカなど)によって段落にグループ分けされた複数の文を含むことがある。オペレーション2125で、テキスト・カスケードは、アイウェア・デバイスのディスプレイ・コンポーネントを介してユーザに表示され得る。
【0106】
図22は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにカスケードされたテキストを生成することの一例2200を示す。例2200は、図1図5図6A図6B、および図7図21に記述されている機能を提供することができる。テキスト・オーサリング・ツール2205は、ユーザから(たとえば、キーボード、音声コマンドなどによって)テキスト入力2210を受け取ることができる。テキスト入力2210が受け取られると、それは、テキスト入力2210の言語属性(たとえば、品詞データ、コンスティテュエンシ・データ、依存関係データなど)が識別されるように、(オンライン接続、ローカルで利用可能なコンポーネントなどを介して)システム705によって処理される。一例では、システム705(またはシステム705のコンポーネント)は、リモート・コンピューティング・プラットフォーム上で実行されてよく、または、テキスト・オーサリング・ツール2205が実行されているデバイス上で実行されてよい。カスケード・フォーマット設定ルールは、入力テキスト2210で識別された言語属性を使用して、入力テキスト2210に対して適用されてよい。表示された出力テキスト2215は、テキストが入力される際にリアルタイムのカスケード・フォーマットをユーザに提供するために、ユーザがテキストを入力する際に、カスケードされた出力テキストとして表示され得る。
【0107】
図23は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのユーザおよび発行者のプリファレンス管理のためのアーキテクチャ2300の一例を示す。アーキテクチャ2300は、図1図5図6A図6B、および図7図19に記述されている特徴を提供することができる。ユーザ・インターフェース2305およびプラグイン2310は、図7に記述されているようにシステム705に接続し得る。システム705は、ユーザおよび発行者がシステム705によってテキストを発行および消費するために登録することを可能にする、ユーザ・レジストリ2310を含み得る。ユーザ・レジストリは、カスケードされたテキストを見るときに適用されるべき表示プリファレンスを含む、ユーザおよび発行者のプロファイルを維持することができる。ユーザ・プリファレンスは、カスケードされたテキストの形成を変更しないが、テキスト色、フォント・サイズ、行間隔などのユーザまたは発行者定義の表示修飾を提供することができる。ユーザが編集モードをオンまたはオフにすることを可能にする、カスケード・モード・ボタン2315が設けられ得る。テキストはカスケード・フォーマットで表示されてよく、カスケード編集モードが有効になっているとき、カスケード表示特性に対する変更は、追跡されることが可能であり、また、ユーザ用のパーソナライズされたカスケード表示特性を生成するために評価されることが可能である。追跡された変更は、ユーザ・プリファレンスを経時的に学習するために使用され得る、プロファイルに保存されたフィードバック情報として使用されることが可能である。フィードバックはまた、コンテンツ表示特性に対するプリファレンスを示すユーザまたは発行者によって提供される、直接入力であってもよい。
【0108】
一例では、発行者は、ユーザ・レジストリ2310によって登録することができ、公開コンテンツをシステム705のユーザによる消費のために提供することができる。発行者データ2320は、システム705に入力され得る、書籍、雑誌、マニュアル、試験などを含むコンテンツを含むことができる。言語属性(たとえば、品詞、コンスティテュエンシ・データ、依存関係データ、同一指示リンクなど)は、発行者データ2320中の文ごとにNLPサービスによって識別されることが可能であり、NLPサービスは、語または語の組み合わせを、名前付きエンティティ、品詞、コンスティテュエンシ関係を有すること、依存関係を有すること、同一指示、およびトピック・リンクなどとして分類する。言語分析を含む発行者データ2320は、システム705によって受け取られることが可能である。
【0109】
発行者データ2320の識別された言語属性は、改行、インデント、およびその他のフォーマット設定要素を挿入するためのルールを含み得るカスケード・フォーマット設定ルールのセットに対して、評価されることが可能である。カスケード・フォーマット設定ルールは、テキスト中で識別されたクラスまたは品詞、キー・フレーズ、構成要素または依存関係のタイプなどによってトリガされ得る。カスケードされた発行者データは、発行者へ返されて発行者データ2320に含まれてよく、また、ユーザ・インターフェース2305を介してユーザによって消費されてよい。
【0110】
追加のフォーマット設定が、さらなる手がかりをユーザに対して提供するために用いられることがある。たとえば、構成要素構造の強調表示が、読むことの認知負荷を低減させるために行われ得る。これは、本明細書で論じられているシステムおよび方法が、読む作業を簡単にするシステムを提供することを可能にする。色、アンダーライン、強調表示などによってテキストを修飾することを含む様々な修飾が、ユーザの認知負荷の低減を助けるために適用され得る。
【0111】
図24は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力に基づいて自然言語処理を使用するカスケードされたテキストのパーソナライゼーションのための方法2400の一例を示す。方法2400は、図1図5図6A図6B、および図7図23に記述されている特徴を提供することができる。本明細書で論じられているシステムおよび方法は、個人に固有のパーソナライズされたアルゴリズムを開発するのに使用されることが可能である。テキスト情報を処理する人々の方法は異なっており、人ごとに最適化されているパーソナル・リーディング・アルゴリズム(PRA)が作成され得る。テキストがカスケード・フォーマットで表示されることが可能であり、カスケード編集モードが有効にされると、カスケード・フォーマット設定された出力の表示特性に対する変更は、追跡されることが可能であり、また、病状、認知機能、学習障害を認識するために、および/またはユーザに対してパーソナライズされたカスケード・フォーマット・ルールを生成するために、分析されることが可能である。様々な属性を微調整し、理解および読みやすさを評価することによって、表示特性をカスタマイズするために使用される、パーソナライズされた設定が開発され得る。これは、ユーザのリーディング・プリファレンスに合うようにユーザによってなされる表示特性のパラメータ変更によって、作成され得る。追跡されることが可能な特性を表示するためのユーザ調整は、インデントの量の修正、主要な構成要素の強調表示または色付け、スクロール速度などを含み得る。カスケード・ロジックは言語情報に基づいたままであるが、ユーザのプロファイルを使用して、強調表示すること、イタリック化すること、カラー化すること、間隔を増やすこと、改行を追加することなどが、カスケードされたテキストの表示特性において可能である。
【0112】
2つの眼鏡処方箋の間の相違のように、異なる目は情報をわずかに異なるように処理し、その結果、2人のユーザで表示特性が異なることになり得る。認知多様性(たとえば、人々がテキストに直面し処理する異なる方法)はまた、個人間で、またはたとえば、ADHD、失読症、自閉症などの同様の認知プロファイルを共有するグループ間で、表示特性を最適化することによって対処されることも可能である。
【0113】
たとえば、読者属性に基づいて提示パラメータを修飾するリーディング・プロファイルが、(単独で、または組み合わせて)作成されることが可能である。文脈プロファイルが、ユーザ入力によって、またはコンピュータ自動化された評価を通じて、特有の病状および認知症状(たとえば、失読症、注意欠陥・多動性障害(ADHD)、注意欠陥障害(ADD)など)、自閉症、母国語(たとえば、中国語を母国語とする人は、スペイン語を母国語とする人とは異なるフォーマットから恩恵を受けることがあるなど)、読まれているコンテンツの性質(たとえば、フィクション、ノンフィクション、ニュース、詩など)、または画面モード(たとえば、電話、タブレット、ノートパソコン、モニタ、AR/VRデバイスなど)などについて、知らされ得る。カスケード出力の表示特性最適化はまた、傷害および障害に対処するための診断および治療様式で使用され得る。脳震盪または外傷性脳損傷(TBI)を患っている人々の重要な症状は、眼球運動および視線追跡の変化である。1つの例として、アスリートが、サイドライン上で、目の前で水平に動かされている指を追跡するように求められているのが見られることがある。読むことが、脳震盪を起こした脳に対して重い負担をかける。TBIを患っている人々は、脳を休ませ回復させるために、頻繁に休憩を取る必要がある。軍隊および多くのスポーツでは、参加者は、将来の傷害を評価するために、ベースラインの認知テストを行うことが求められる。一例では、本明細書で論じられているシステムおよび技法は、拡張現実ヘッドセット/眼鏡と組み合わせて使用されて、理解レベル・ベースラインを、参加者用のカスケードされたテキストと調整された表示特性とを用いて測定することができる。このベースラインは、理解評価およびユーザ報告の快適さ/緊張に加えて、視線追跡情報を含み得る。
【0114】
そのベースラインが確立された後、視線追跡および理解が、カスケードと、ベースライン設定からの表示特性の変更が緩和を提供する度合いとを使用して、測定され得る。たとえば、ベースライン測定が、参加者が3文字インデントで読んでXの理解レベルのスコアであった場合に、TBI後に参加者がその同じ測定でどうなるかと、強調されたインデント、色などで修飾された表示によって参加者がどれだけよくなり得るかとが、決定され得る。負傷した参加者をサポートするために必要な表示特性変更は、参加者の診断および治療計画に対する情報を提供し得る。一例では、ユーザは、自分自身の個人的なパラメータおよび出力フォーマット(たとえば、長さ、間隔、強調表示、インデント、改行など)、フォント、色、サイズ、背景色を設定することができる。
【0115】
オペレーション2405で、コンテンツ(たとえば、テキスト、画像など)は、テキスト文を含むクラウド接続されたソースから取得され得る。オペレーション2410で、個人のレジストリと、個人用のパーソナライズされたテキスト・フォーマット・パラメータとが維持され得る。一例では、テキスト・フォーマット設定パラメータは、個人用にパーソナライズされた、カスケードされたテキスト表示フォーマットを生成するためのルールを含み得る。オペレーション2415で、個人用のパーソナライズされたテキスト・フォーマット・パラメータに基づいたユーザ指定の属性付きカスケードの表示を可能にする、表示制御命令が生成され得る。たとえば、テキストの文が、レジストリからの個人と関連付けられた発行元から受け取られてよく、また、表示制御命令が、クライアント・デバイス上で文の表示を制御するために生成されてよい。オペレーション2420で、カスケードは、ユーザ指定の属性を適用して、表示デバイス上のカスケード出力の表示特性を修飾することによって表示され得る。表示制御命令は、個人用のパーソナライズされたテキスト・フォーマット・パラメータを使用することができ、命令は、個人用にパーソナライズされた、カスケードされたフォーマットで文章の表示を可能にし得る。一例では、クラウド接続されたソースはブラウザ・アプリケーションであってよく、このブラウザ・アプリケーションは、テキストの文をテキスト処理エンジンに供給することができる。
【0116】
図25は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のためにフィードバック入力(たとえば、表示されたテキストのユーザ修飾など)に基づいてカスケードされたテキストのデュアル表示の例2500を示す。例2500は、図1図5図6A図6B、および図7図24に記述されている特徴を提供することができる。テキストは、ユーザ・インターフェース2505を介して受け取られ得る。テキスト2510は、パース構造(たとえば、品詞、コンスティテュエンシ・データ、依存関係データなど)を識別するようにシステム705によって処理され得る。テキスト2510(たとえば、カスケードされていない、原語、カスケードされているなど)、またはソース・テキストは、ユーザ・インターフェース2505の第1のウィンドウ内に表示されてよい。ブロック・テキストが一例として使用されているが、生テキストは、タイトル、見出し、図キャプションなどを含む、html強調を有し得る。修飾されたテキスト2515は、ユーザ・インターフェース2505の第2のウィンドウ内に表示され得る。修飾されたテキスト2515は、カスケード・フォーマット設定されている、翻訳されている、ユーザ・プリファレンスを含み得る別のカスケード・フォーマットでフォーマット設定されている、などのテキストであってよい。一例では、修飾されたテキスト2515は、識別された言語属性を使用して適用されたカスケード・フォーマット設定ルールによる改行およびインデントを使用して、カスケード・フォーマットで提示されることが可能である。修飾されたテキスト2515は、ユーザがテキスト2510の構造を識別することができるように、品詞、コンスティテュエンシ・データ、依存関係データなどが強調表示されて(たとえば、アンダーライン付きで、太字にされて、色付けされて、網掛けされてなど)、提示されることが可能である。
【0117】
したがって、ソース・テキストとカスケード・フォーマット設定されたテキストとの並列表示が、2つの画面または分割画面によって並列提示で提示され得る。たとえば、元のソース・テキストが一方の画面に表示されてよく、カスケード・テキストが第2の画面に並列で表示され、同期することができ、したがって、ユーザがどちらかの表示でスクロールしたときに、これらの画面は同期したままであることができる。これは、構文、キー・フレーズ、品詞、コンスティテュエンシ・データ、依存関係データなどを強調表示するために、または、テキストの基礎となる構造を表示するテキストX-RAYに似ている「強調された理解ビュー」を提示するために、教育目的で使用されることが可能である。たとえば、構成要素、同一指示情報、およびキー・フレーズが、太字にされたりされなかったり、動詞が色付けされたり、太字にされたりするなどして、基礎となる言語特性が強調表示されることが可能である。
【0118】
図26は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のために第1の言語2610の入力テキストを第2の言語2615のカスケードされた出力へ翻訳するためのシステムの一例2600を示す。翻訳エンジン2620は、第1の言語の入力2610を受け取り、その入力を第2の言語に翻訳することができる。翻訳エンジンは、入力と第2の言語2615のカスケードされた出力とを表示しているユーザ・インターフェース2605を見るために使用されるデバイス上で、ローカルに実行されていてよく、ウェブサービス、クラウドベースのサービス、リモートサーバーなどから、リモートで実行されていてよい。翻訳エンジン2620は、入力テキストに対して実行されたときにそのテキストを入力言語から第2の言語に変換する、翻訳ロジックを含むことができる。
【0119】
翻訳エンジン2620からの出力は、上述のように、カスケードされた第2の言語の出力2615が産出されるように、クラウドベースのシステム705によって処理され得る。たとえば、カスケード・フォーマット設定された節が、画面の一方のウィンドウ内に表示されてよく、別の言語の節の翻訳が、カスケードされたフォーマットで画面の第2のウィンドウ内に提示されてよい。別の例では、ブロック・テキストが、デュアル表示の一方の側に表示され、カスケード・フォーマット設定されたテキストが他方の側に表示され得る。さらに別の例では、ブロックおよびカスケードでスクロールする分割画面が提供され、および/または言語が、画面の別々の側に、またはデュアル表示構成の別々のディスプレイに表示され得る。二画面は、難しい節の理解を助けるためにユーザが他方のビューを参照することを可能にし得る。
【0120】
図27は、一実施形態による、言語学的に駆動される自動化されたテキスト・フォーマット設定のための方法2700の一例を示す。方法2700は、図1図5図6A図6B、および図7図26に記述されている特徴を提供することができる。
【0121】
オペレーション2705で、テキスト入力が入力デバイスから受け取られ得る。オペレーション2710で、入力テキストが、自然言語処理サービスのコンスティテュエンシ・オペレーションおよび依存関係解析オペレーションからの識別された言語関係を伝達するための手がかりを使用して、フォーマット設定され得る。
【0122】
オペレーション2715で、カスケード・ルールが適用されて、テキスト入力の構成要素の配置について表示出力の連続単位としての優先順位が付けられ得る。カスケード・ルールは、自動化された依存関係パーサから出力された情報に基づいて、構成要素のうちの一構成要素の水平変位を決定することができ、また、その構成要素を他の構成要素とともに水平位置付けに基づいてグループ分けして依存関係を強調することができる。インデント解除が、コンスティテュエンシ・グループの完了を示し得る。一例では、カスケード・ルールはさらに、依存関係と構成要素とをリンクするルールを使用して、入力テキストのコア・アーギュメントおよび非コア従属語を識別することができる。これらのルールは、コア・アーギュメントおよび非コア従属語を入力テキストの言語フレーズの先頭の下にインデントすることができる。
【0123】
オペレーション2720で、インデントおよびライン・フィードを含む出力が、カスケード・ルールの適用に基づいて生成され得る。一例では、出力は、同一指示情報、感情分析、名前付きエンティティ認識、意味役割ラベリング、テキスト連携、トピック追跡、または韻律分析を含む、自然言語処理サービスによって提供される追加の言語特徴手がかりによって補強され得る。
【0124】
オペレーション2725で、出力は、出力デバイスのディスプレイに表示され得る。一例では、匿名化された使用状況データまたはユーザ指定のプリファレンスが受け取られてよく、また、匿名化された使用状況データまたはユーザ指定のプリファレンスに基づいた出力表示特性を含むカスタム表示プロファイルが、生成されてよい。一例では、出力が、カスタム表示プロファイルの出力表示特性を使用して調整され得る。この表示特性は、出力の表示特徴を出力の形状の修飾なしで修飾することができる。一例では、出力は、電話、タブレット、ラップトップ、モニタ、仮想現実デバイス、または拡張現実デバイスにおける表示のために生成され得る。一例では、出力は、横並びのテキスト・フォーマット、フォーマット・ホワイル・エディット・フォーマット、またはカスケード・アンド・トランスレイト・フォーマットを表示する、二画面フォーマットの形の表示のために生成され得る。
【0125】
図28は、本明細書で論じられている技法(たとえば、方法論)のうちのいずれか1つまたは複数が実行され得る例示的マシン2800のブロック図を示す。代替実施形態では、マシン2800は、スタンドアロン・デバイスとして動作することができ、または他のマシンと接続(たとえば、ネットワーク接続)されることが可能である。ネットワーク化された配備では、マシン2800は、サーバ・クライアント・ネットワーク環境において、サーバ・マシン、クライアント・マシン、またはその両方の能力で動作することができる。一例では、マシン2800は、ピア・ツー・ピア(P2P)(または他の分散)ネットワーク環境において、ピア・マシンとして動作することができる。マシン2800は、パーソナル・コンピュータ(PC)、タブレットPC、セットトップ・ボックス(STB)、パーソナル・デジタル・アシスタント(PDA)、携帯電話、ウェブ・アプライアンス、ネットワーク・ルータ、スイッチもしくはブリッジ、またはそのマシンによって取られるべきアクションを指定する命令(順次またはその他)を実行することが可能な任意のマシンであってよい。さらに、単一のマシンだけが示されているが、「マシン」という用語は、クラウドコンピューティング、サービスとしてのソフトウェア(SaaS)、他のコンピュータクラスタ構成などの、本明細書で論じられている方法論のうちのいずれか1つまたは複数を実行するために、命令の一セット(または複数のセット)を個々にまたは共同で実行するマシンの任意の集まりもまた含むと解釈されるものである。
【0126】
本明細書に記述されている例は、ロジックもしくはいくつかのコンポーネント、または機構を含み得るか、またはこれらによって動作し得る。回路セットは、ハードウェア(たとえば、簡単な回路、ゲート、ロジックなど)を含む有形エンティティにおいて実施された回路の集まりである。回路セット帰属関係は、時間、および基礎となるハードウェア多様性に対して適応性があり得る。回路セットは、動作時に、指定されたオペレーションを単独または組み合わせで実行することができる部材を含む。一例では、回路セットのハードウェアは、特定の動作を行うように不変に設計され得る(たとえば、ハードワイヤード)。一例では、回路セットのハードウェアは、特有の動作の命令を符号化するために物理的に修正された(たとえば、不変質量粒子の磁気的、電気的に移動可能な配置など)コンピュータ可読媒体を含む、可変に接続された物理的コンポーネント(たとえば、実行ユニット、トランジスタ、単純回路など)を含み得る。物理的コンポーネントを接続する際、ハードウェア構成要素の基礎となる電気的特性は、たとえば絶縁体から導体へ、またはその逆へと変更される。命令は、埋め込まれたハードウェア(たとえば、実行ユニットまたはローディング機構)が、動作時に特有のオペレーションの一部分を行うために、可変接続によって回路セットの部材をハードウェア中に作成することを可能にする。したがって、コンピュータ可読媒体は、デバイスが動作しているときに、回路セット部材の他のコンポーネントに通信可能に結合される。一例では、物理的コンポーネントのいずれかが、複数の回路セットの複数の部材に使用されることが可能である。たとえば、オペレーション中に、実行ユニットは、ある時点において第1の回路セットの第1の回路で使用され、別の時点において、第1の回路セットの第2の回路によって、または第2の回路セットの第3の回路によって再使用されることが可能である。
【0127】
マシン(たとえば、コンピュータ・システム)2800は、ハードウェア・プロセッサ2802(たとえば、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、ハードウェア・プロセッサ・コア、またはこれらの任意の組み合わせ)、メイン・メモリ2804、およびスタティック・メモリ2806を含むことができ、その一部または全部は、インターリンク(たとえば、バス)2808を介して互いに通信することができる。マシン2800は、ディスプレイ・ユニット2810、英数字入力デバイス2812(たとえば、キーボード)、およびユーザ・インターフェース(UI)ナビゲーション・デバイス2814(たとえば、マウス)をさらに含み得る。一例では、ディスプレイ・ユニット2810、入力デバイス2812およびUIナビゲーション・デバイス2814は、タッチ・スクリーン・ディスプレイであってよい。マシン2800は、加えて、ストレージ・デバイス(たとえば、ドライブ・ユニット)2816と、信号生成デバイス2818(たとえば、スピーカ)と、ネットワーク・インターフェース・デバイス2820と、全地球測位システム(GPS)センサ、コンパス、加速度計、または他のセンサなどの、1つまたは複数のセンサ2821とを含み得る。マシン2800は、1つまたは複数の周辺デバイス(たとえば、プリンタ、カードリーダなど)と通信またはその制御をするための、シリアル(たとえば、ユニバーサル・シリアル・バス(USB)、パラレル、または他の有線もしくは無線(たとえば、赤外線(IR)、近距離無線通信(NFC)など)接続などの、出力コントローラ2828を含み得る。
【0128】
ストレージ・デバイス2816は、本明細書に記述されている技法または機能のいずれか1つまたは複数を具現化する、またはそれらによって利用される、データ構造または命令2824(たとえば、ソフトウェア)の1つまたは複数のセットが記憶されている機械可読媒体2822を含み得る。命令2824はまた、マシン2800によるそれの実行中に、完全または少なくとも部分的に、メイン・メモリ2804内に、スタティック・メモリ2806内に、またはハードウェア・プロセッサ2802内に、存在し得る。一例では、ハードウェア・プロセッサ2802、メイン・メモリ2804、スタティック・メモリ2806、またはストレージ・デバイス2816のうちの1つまたは任意の組み合わせが、機械可読媒体を構成し得る。
【0129】
機械可読媒体2822は単一の媒体として示されているが、「機械可読媒体」という用語は、1つまたは複数の命令2824を保存するように構成された単一の媒体または複数の媒体(たとえば、集中もしくは分散データベース、および/または関連するキャッシュおよびサーバ)を含み得る。
【0130】
「機械可読媒体」という用語は、マシン2800によって実行するための、かつ、マシン2800に本開示の技法のいずれか1つ以上を実行させる、命令を記憶、符号化、または保持することが可能である、またはそのような命令によって使用される、もしくはそのような命令と関連付けられたデータ構造を保存、符号化、または保持することが可能である、任意の媒体を含み得る。非限定的な機械可読媒体例は、固体メモリ、ならびに光学媒体および磁気媒体を含み得る。一例では、機械可読媒体は、一時的な伝搬信号(たとえば、非一時的な機械可読記憶媒体)を除外することがある。非一時的な機械可読記憶媒体の具体的な例は、半導体メモリデバイス(たとえば、電気的プログラマブル読取り専用メモリ(EPROM)、電気的消去可能プログラマブル読取り専用メモリ(EEPROM))およびフラッシュ・メモリ・デバイスなどの不揮発性メモリ;内蔵ハードディスクおよびリムーバブル・ディスクなどの磁気ディスク;光磁気ディスク;ならびにCD-ROMおよびDVD-ROMディスクを含み得る。
【0131】
命令2824はさらに、いくつかの転送プロトコル(たとえば、フレーム・リレー、インターネット・プロトコル(IP)、伝送制御プロトコル(TCP)、ユーザ・データグラム・プロトコル(UDP)、ハイパーテキスト転送プロトコル(HTTP)など)のうちのいずれか1つを利用するネットワーク・インターフェース・デバイス2820を介する伝送媒体を使用して、通信ネットワーク2826を通じて送信または受信され得る。例示的通信ネットワークは、ローカル・エリア・ネットワーク(LAN)、ワイド・エリア・ネットワーク(WAN)、パケット・データ・ネットワーク(たとえば、インターネット)、携帯電話ネットワーク(たとえば、セルラ・ネットワーク)、従来の普通の電話(POTS)ネットワーク、および無線データ・ネットワーク(たとえば、Wi-Fi(登録商標)、LoRa(登録商標)/LoRaWAN(登録商標)LPWAN規格などで知られるIEEE802.11規格ファミリ)、IEEE802.15.4規格ファミリ、ピア・ツー・ピア(P2P)ネットワーク、以下を含む4Gおよび5G無線通信用の第3世代パートナーシップ・プロジェクト(3GPP(登録商標))規格:3GPPロングターム・エボリューション(LTE)規格ファミリ、3GPP LTEアドバンスド規格ファミリ、3GPP LTEアドバンスド・プロ規格ファミリ、3GPP新無線(NR)規格ファミリ、などをとりわけ含み得る。一例では、ネットワークインターフェースデバイス2820は、通信ネットワーク2826と接続するための1つまたは複数の物理的ジャック(たとえば、イーサネット(登録商標)・ジャック、同軸ジャック、または電話ジャック)、または1つもしくは複数のアンテナを含み得る。一例では、ネットワーク・インターフェース・デバイス2820は、単入力多出力(SIMO)技法、多入力多出力(MIMO)技法、または多入力単出力(MISO)技法のうちの少なくとも1つを使用して無線で通信するための複数のアンテナを含み得る。「伝送媒体」という用語は、マシン2800によって実行するための命令を保存、符号化、または保持することが可能な任意の無形の媒体を含むと解釈されるものであり、デジタルもしくはアナログ通信信号、またはそのようなソフトウェアの通信を容易にするための他の無形の媒体を含む。
追加の注釈
上記の詳細な記述は、詳細な記述の一部を形成する添付の図面の参照を含む。図面は、実践され得る特有の実施形態を例示的に示している。これらの実施形態は、本明細書では「例」とも呼ばれる。このような例は、図示または記述されたものに加えて、要素を含み得る。しかし、本発明者らは、図示または記述された要素のみが提供される例も企図している。さらに、本発明者らは、特定の例(またはその1つもしくは複数の態様)に関して、または本明細書に図示または記述された他の例(またはその1つもしくは複数の態様)に関して、図示または記述されたそれらの要素(またはその1つもしくは複数の態様)の任意の組み合わせまたは順列を使用する例も企図している。
【0132】
本明細書で言及されるすべての刊行物、特許、および特許文書は、参照により個別に組み込まれるものとして、その全体で本明細書に援用する。本明細書と、そのように援用されたそれらの文書との間で矛盾する用法がある場合、援用された文献の用法は、本明細書の用法を補足するものとみなされるべきであり、妥協できない矛盾については、本明細書の用法が支配する。
【0133】
本明細書では、特許文献で一般的であるように、「1つの(a)」または「1つの(an)」という用語は、「少なくとも1つ」または「1つまたは複数」のいかなる他の事例または用法とも無関係に、1つまたは複数を含むものとして使用される。本明細書では、「または(or)」という用語は、特にことわらない限り、「AまたはB」が、「BではなくAである」、「AではなくBである」、「AおよびB」を含むように、非排他的な「または」を指すものとして使用される。添付の特許請求の範囲では、「含む(including)」および「ここで(in which)」という用語は、「備える(comprising)」および「ここで(wherein)」というそれぞれの用語の平易な英語の同義語として使用されている。また、以下の特許請求の範囲では、用語の「含む(including)」および「備える(comprising)」は制限がなく、すなわち、特許請求の範囲でこのような用語の後に列挙された要素に加えて諸要素を含むシステム、デバイス、物品、または処理は、やはりその特許請求の範囲内に入るとみなされる。さらに、以下の特許請求の範囲において、「第1」、「第2」、および「第3」などの用語は、単なる標識として使用されており、その対象物に数値的な要件を課すものではない。
【0134】
上の記述は例示的なものであり、限定的なものではない。たとえば、上述の例(またはその1つもしくは複数の態様)は、互いに組み合わせて使用され得る。他の実施形態は、上の記述を検討することにより、当業者などによって使用され得る。要約書は、読者が技法開示の特質を迅速に確認できるようにするものであり、それが特許請求の範囲または意味を解釈または限定するためには使用されないものと理解して提出されている。また、上の詳細な記述では、開示を簡素化するために様々な特徴がひとまとめにされていることがある。このことは、特許請求されていない開示された特徴が、いずれの請求項にも必須であると解釈されるべきではない。むしろ、発明の主題は、ある特定の開示された実施形態のすべての特徴とは言えないところにあり得る。したがって、以下の特許請求の範囲は、本明細書では発明を実施するための形態に組み込まれ、各請求項が別個の実施形態としてそれ自体で存立している。実施形態の範囲は、添付の特許請求の範囲を、そのような特許請求の範囲の権利がある等価物の全範囲とともに参照して決定されるべきである。
図1
図2
図3
図4
図5
図6A
図6B
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28