(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-10-31
(54)【発明の名称】方法およびシステム
(51)【国際特許分類】
G09B 5/02 20060101AFI20241024BHJP
G06F 40/169 20200101ALI20241024BHJP
【FI】
G09B5/02
G06F40/169
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024529613
(86)(22)【出願日】2022-11-15
(85)【翻訳文提出日】2024-07-16
(86)【国際出願番号】 AU2022051361
(87)【国際公開番号】W WO2023087051
(87)【国際公開日】2023-05-25
(32)【優先日】2021-11-16
(33)【優先権主張国・地域又は機関】AU
(32)【優先日】2022-09-08
(33)【優先権主張国・地域又は機関】AU
(81)【指定国・地域】
(71)【出願人】
【識別番号】524186246
【氏名又は名称】エルヴォスリー・ピーティーワイ・リミテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】クリストファー・コリン・スティーヴン
【テーマコード(参考)】
2C028
5B109
【Fターム(参考)】
2C028AA04
2C028BB04
2C028BC04
5B109SA14
(57)【要約】
1つまたは複数の形式の基本アルファベットを定義するテキストを含む少なくとも1つの文書を受け取るように構成されたシステムと、
読者が文書をより深く理解するための追加データを提供するように構成されたシステムであって、
読者がそれぞれの発音に即していない単語の音をデコードすることを可能にするために、文書の発音に即していない単語をエンコードまたはマークアップする方法を含む、システムと、
テキストおよび追加データを伴うエンコードされた文書を1つまたは複数の形式で出力するように構成されたシステムとを含むコンポーネントを持つ出版システムであって、
エンコードされた単語を発音に即すようにするために、発音に即していない単語を自動的にエンコードする方法が、
発音に即していない単語の少なくとも1つの文字(「綴り文字」)に関して、綴り文字および音文字を含む合成文字を使用することであって、音文字が、
基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
各綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
綴り文字が音文字と視覚的に弁別され得るように追加され、
単語の綴りが元のままであるので読者が目で見て発音に即していない単語を認識し得るように追加され、
各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音文字が人間が読むことができるままであるように綴り文字に追加される、使用すること、ならびに
エンコードされた単語の合成文字が、綴り文字のうちのどれが綴り文字の通常の音以外の音を持つか、および各文字が文字の通常の音を出さないときに発音に即していない単語において文字がどのような音を出すかを視覚的に示すように、エンコードされた単語を人間が読むことができる形態/形式で自動的に出力することを行う、出版システム。
【特許請求の範囲】
【請求項1】
1つまたは複数の形式の基本アルファベットを定義するテキストを含む少なくとも1つの文書を受け取るように構成されたシステムと、
読者が前記文書をより深く理解するための追加データを提供するように構成されたシステムであって、前記読者がそれぞれの発音に即していない単語の音をデコードすることを可能にするために、前記文書の発音に即していない単語をエンコードまたはマークアップする方法を含む、システムと、
前記テキストおよび前記追加データを伴うエンコードされた文書を1つまたは複数の形式で出力するように構成されたシステムと、
を含むコンポーネントを持つ出版システムであって、
エンコードされた単語を発音に即すようにするために、前記発音に即していない単語を自動的にエンコードする方法が、
前記発音に即していない単語の少なくとも1つの文字(「綴り文字」)に関して、前記綴り文字および音文字を含む合成文字を使用することであって、前記音文字が、
前記基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
各綴り文字が前記音文字の通常の音を出すことを示すために前記綴り文字に追加され、
綴り文字が音文字と視覚的に弁別され得るように追加され、
前記単語の綴りが元のままであるので読者が目で見て前記発音に即していない単語を認識し得るように追加され、
各合成文字の前記綴り文字および前記音文字が1つの視野内にあるように、前記綴り文字および前記音文字が人間が読むことができるままであるように前記綴り文字に追加される、使用すること、ならびに
前記エンコードされた単語の前記合成文字が、前記綴り文字のうちのどれが前記綴り文字の通常の音以外の音を持つか、および各文字が前記文字の通常の音を出さないときに前記発音に即していない単語において前記文字がどのような音を出すかを視覚的に示すように、前記エンコードされた単語を人間が読むことができる形態/形式で自動的に出力することを行う、出版システム。
【請求項2】
前記基本アルファベットの複数の単語および前記単語の国際音声記号(IPA)表現を含む単語-IPAペアの辞書/データベースからの入力に基づいて、英単語を、無音の文字、音節の区切り、強勢音節、および/または各文字が出す音を含むエンコードされた単語へと自動的にエンコード/マークアップすることを含み、任意で、エンコード/マークアップされた単語が、
コンピューティングシステムにおいて自動的に、単語-IPAペアの前記辞書/データベースにない1つのIPA文字または複数のIPA文字がIPAマークアップにあるかどうかを判定すること、
コンピューティングシステムにおいて自動的に、前記エンコードされた単語の文字ペアがすべて有効な文字ペアであるかどうかを判定すること、
コンピューティングシステムにおいて自動的に、2つ以上の辞書からの前記IPAマークアップを翻訳し、翻訳を比較し、違いがある場合、前記単語を編集すること、
コンピューティングシステムにおいて自動的に、接頭辞および接尾辞でマークアップされた単語を探し出し、標準化すること、
コンピューティングシステムにおいて自動的に、語根のマークアップを予め定義されたマークアップに自動的に変更し、変更を似た単語と比較することによって前記変更を自動的にチェックさせることを含め、前記語根の前記マークアップができるだけ標準的であることを保証するために前記語根を探し出すために前記マークアップされた単語を分析すること、
コンピューティングシステムにおいて自動的に、同じ語根を持つ単語のマークアップを比較し、前記マークアップが前記語根に関して一貫していることをチェックすること、
コンピューティングシステムにおいて自動的に、1つの母音を持つ単語が1音節の単語であることをチェックすること、および/または子音によって分けられている複数の母音を持つマークアップされた単語が、存在する母音と同じ数の音節をマークアップ内に有することをチェックすること、
コンピューティングシステムにおいて自動的に、新しい音節が作成される場合、すべての前記綴り文字が前記音文字と同じである新しい音節に、一部の綴り文字が異なる音文字を有する音節よりも低いチェックの優先度でフラグを立てることを含め、手動チェックのために前記新しい音節にフラグを立てること、ならびに
コンピューティングシステムにおいて自動的に、前記マークアップされた単語の音節を再生し、このようにして作成された単語の音をエンコードされていない単語の別の録音と自動的に比較することのうちの1つまたは複数によってチェックされる請求項1に記載のシステム。
【請求項3】
エンコードする前記方法が、
前記基本アルファベットから形成された単語の予め選択されたセット内の複数の予め選択された単語のうちの1つと一致するソーステキストの少なくとも1つの単語(「特定された単語」)を特定することであって、前記特定された単語が、前記予め選択されたセット内で定義された少なくとも1つの強勢のある音節および/または少なくとも1つの強勢のない音節を含み、各音節が、前記綴り文字のうちの1つまたは複数を含む、特定することと、
各音節の前にドット/四角を追加することによって前記特定された単語を置き換える/調整することであって、前記音節の前記綴り文字が、元のままであり、前記強勢のある音節の前記ドット/四角が、前記強勢のない音節の前記ドット/四角と視覚的に異なる、置き換える/調整することと
によって音節の区切りを追加することを含め、音節の前に記号を追加することによって音節の区切りを示すことを含む、前記音節の区切りを追加するステップを含む請求項1に記載のシステム。
【請求項4】
エンコードする前記方法が、無音の文字の形を変えることなく、前記無音の文字を前記綴り文字と視覚的に区別することによることを含め、前記無音の文字を示すステップを含む請求項1に記載のシステム。
【請求項5】
前記エンコードされた単語をスクリーン上に静的に表示するか、またはビデオもしくはその他の動的表示システムに動的に表示する1つまたは複数のインタラクティブな教授/練習コンピューティングシステムを含み、前記インタラクティブなコンピューティングシステムが、自動的に
前記インタラクティブなコンピューティングシステムのユーザからのユーザ入力を受け取り、
前記ユーザ入力に基づいて前記ユーザを複数のカテゴリのうちの1つに分類し、
ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、前記ユーザカテゴリに基づいて複数のセットから音素セットを選択するように構成され、
分類することが、
前記コンピューティングシステムが前記ユーザの知識/パフォーマンスの測定された値を生成すること、および
前記コンピューティングシステムが前記測定された値に基づいて前記ユーザを前記複数のカテゴリのうちの1つに分類することを含み、
前記インタラクティブなコンピューティングシステムが、自動的に
テストテキストを可視的に表示するか、または前記テストテキストを可聴的に再生することによって、前記基本アルファベットの前記テストテキストを前記ユーザに提示することであって、前記テストテキストが、少なくとも1つのテスト単語および前記テスト単語ではない1つまたは複数の誤答選択肢単語を含む、ユーザインターフェースを使用して前記ユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、提示すること、ならびに
前記ユーザが選択可能な単語のユーザ選択からの値を測定することであって、前記少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/または前記テスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、測定することを行うように構成される請求項1に記載のシステム。
【請求項6】
テキスト文書を変換/エンコードする方法であって、
複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
前記ソーステキストを、
1つまたは複数の文字(「綴り文字」)を有する前記ソーステキストの各単語であって、前記1つまたは複数の文字(「綴り文字」)が前記文字の通常の音以外の音を持つと特定される、各単語に関して、前記綴り文字および音文字をそれぞれが含むそれぞれの合成文字を持つ代替単語を使用することであって、前記音文字が、
前記基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
前記綴り文字が前記音文字の通常の音を出すことを示すために前記綴り文字に追加され、
綴り文字が音文字と弁別され得るように表示され、
各合成文字の前記綴り文字および前記音文字が1つの視野内にあるように、前記綴り文字および前記音文字が人間が読むことができるままであるように前記綴り文字に追加される、使用することによってエンコードするステップと、
エンコードされたテキストが、前記綴り文字のうちのどれが前記文字の通常の音以外の音を持つかを視覚的に示す前記合成文字を持つ前記ソーステキストからの前記複数の単語を含むように、および前記エンコードされたテキストの前記単語の前記綴り文字が前記ソーステキストのそれぞれの単語の文字と同じであり、同じ順序であるように、前記エンコードされたテキストを人間が読むことができる形態/形式で出力するステップとを含む、方法。
【請求項7】
前記音文字が、
副次的アルファベットの文字を使用して定義/発音され得る前記基本アルファベットの音素に関連する前記副次的アルファベットの複数の音文字、
前記副次的アルファベットに存在しない前記基本アルファベットの音素に関連する前記基本アルファベットの複数の音文字、および/または
前記副次的アルファベットに存在しない国際音声記号(IPA)の音素に関連する前記基本アルファベットの複数の音文字を含む予め選択された音素セット内にある請求項6に記載の方法。
【請求項8】
1つまたは複数の音文字の追加が、前記エンコードされたテキストの前記単語において、前記綴り文字が前記音文字に接触していないか、または前記音文字が前記綴り文字に接触する場合には、前記音文字の行長の5%未満が前記綴り文字に接触するように、前記音文字とそれぞれの綴り文字との間に隙間/スペースを追加することを含む請求項6に記載の方法。
【請求項9】
任意の小文字の音文字のうちの1つまたは複数が、異なるフォントを有することを含め、対応する大文字とは異なるように成形される、および/または前記綴り文字に対して異なるように配置される請求項6に記載の方法。
【請求項10】
前記音文字が、6:9の比率で前記ソーステキストのフォントサイズ(「ソースフォントサイズ」)に基づくフォントサイズ(「音フォントサイズ」)を有し、および/または前記音文字が、少なくとも6ポイントのフォントサイズを有する請求項6に記載の方法。
【請求項11】
前記ソーステキストを1単語ずつエンコードするための単語のデータベースを自動的に生成するステップを含む請求項6に記載の方法。
【請求項12】
ユーザが前記基本アルファベットの単語に関してマークアップされた発音に即した単語を手動で選択するためのユーザインターフェースを提供するステップを含む請求項11に記載の方法。
【請求項13】
コンピューティングシステムが、インタラクティブなコンピューティングシステムのユーザからおよび/または登録時のユーザ入力からのユーザ入力を受け取るステップと、
前記コンピューティングシステムが前記ユーザ入力に基づいて前記ユーザを複数のユーザカテゴリのうちの1つに分類するステップと、
前記コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、前記ユーザカテゴリに基づいて、複数の音素セットから、文字が綴り文字および音文字によって構成される最適な音素セットを選択するステップとを含む請求項11に記載の方法。
【請求項14】
強勢のある音節の前の閉じたドット、および強勢のない音節の前の開いたドット、強勢のある音節の前のドット、および強勢のない音節の前の四角、強勢のある音節の前の開いたドット、および強勢のない音節の前の閉じたドット、または強勢のある音節の前の四角、および強勢のない音節の前のドットによって、前記代替単語の強勢を示すステップを含む請求項6に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本出願は、2021年11月16日に出願されたオーストラリア仮特許出願第2021903667号および2022年9月8日に出願されたオーストラリア特許出願第2022228148号に関連するものであり、これらの出願の当初出願された明細書は、参照によりそれらの全体が本明細書に組み込まれる。
【0002】
本開示は、テキストの読みやすさ/発音しやすさ、改善された聴覚弁別、読者による語彙の習得、および/または読者による理解力を改善することを含め、グループまたは個人のために最適化されることが可能であり、読者が使用するアルファベットの文字を最適化するため、読者による語彙の習得を最適化するため、勉強されている言語における読むスキルおよび/または読者の理解力を最適化するため、ならびに勉強されている言語における聴覚弁別および発音を含む言語コミュニケーションスキルを効率的に改善するために統合されたインタラクティブなインテリジェントシステムで拡張され得る、単語およびテキスト文書を新しい1つの形式または複数の形式に変換/エンコードする統合されたヒューリスティックな出版方法およびシステムに関し、マークアップシステムの単純さ、完全さ、および読者にとっての直観性は、システムを実行するコンピュータの機能を向上させ、新しいアルゴリズムおよびユーザインターフェースの開発を支援することができる。
【背景技術】
【0003】
言語を読むこと、話すこと、および聞くことは、最適化され得る基本的に関連したアクティビティである。人間の脳の言語領が進化したので、子どもは、指導がなくてもその第1言語を聞き、話すことを学習する。読むことに関して脳のそのような領域は存在せず、読むことが行われるためには、脳のいくつかの部位が系統的に迅速で効率的に働かなければならない。読むことは、新しい神経経路の発達を必要とし、脳を物理的に変化させる。
【0004】
筆記によるコミュニケーションおよび/または口頭でのコミュニケーションを理解することは、語彙、すなわち、単語が何を意味するかを知ることを必要とする。単語がどのように綴られるか、単語がどのように見えるか、単語がどのように発音されるか、単語がどのように聞こえるか、および単語が何を意味するかを教えることは、すべて、言語への習熟と、医師であることなどのスキルのセットへの習得とに貢献する。
【0005】
読むことは、書かれた単語の音をデコードすること、および読者が脳の言語領を使用して読者の頭の中で単語の音を聞くことである。音を聞くと、読者は、単語の意味を思い出し、そして、テキストの意味を理解する。したがって、書かれた単語の音を正確にデコードすることは、その単語を表すテキストの意味を理解することに先立つ条件である。
【0006】
認知負荷理論(CLT)は、新しい情報をワーキングメモリから長期記憶に効率的に転送する方法に焦点を当てた、実験的に開発された理論である。
【0007】
速度が重要であり、すなわち、人間は、自身の理解力を最大化するために、話し言葉とほぼ同じレートで自身の頭の中で単語を聞く必要があり、これは、流暢な読み(fluent reading)と呼ばれる。優れた理解力のためには、流暢な読みが必要とされる。あまりにゆっくり読みすぎると、読者は、テキストの始めの単語を忘れてしまうので、テキストを理解するのが難しいと感じる。したがって、流暢な読みおよび優れた理解力を養うために、生徒は、サイトワード認識--単語を見て、その音および意味が即座に分かること--を発達させる必要がある。サイトワード認識の例は、STOP標識を見ることである。誰かがSTOP標識を見るや否や、その人は、心の中で単語STOPを聞く。認知心理学および認知負荷理論は、サイトワード認識を発達させる最速の方法が、単語を1音素ずつ発音することによる(「音素」は音であり、「文字」は音を表す記号である)ということを我々に教える--我々の記憶は、意味を成す物は憶えるが、単語が綴られる通りに聞こえないときの単語の音および単語の形のようなランダムな情報を憶えることは非常に苦手である。単語が綴られる通りに聞こえない場合、その単語は、丸暗記されなければならない。丸暗記の学習は、たくさんの反復を必要とする。読者が新しい単語を3~5回発音通りに音読することは、音とレター(letter)との間に単純な関係が存在するので、サイトワード認識を発達させる可能性があるが、綴られる通りに聞こえない単語の丸暗記の学習に関しては、単語の音と単語の綴りとの間にほとんど関係がない場合があるので、20~50回の反復が必要とされる可能性がある。人間は、意味を成す物事を記憶するように進化してきたが、ランダムな情報を記憶するようには進化してこなかった。
【0008】
半分を超える英語の単語は綴られる通りに発音されないので、発音に即していない(non-phonetic)言語の例は英語である。例として、「baked」および「naked」は、似た綴りを有するが、異なる発音をされ、「U」は、7つの音(up、use、put、fruit、busy、quick、bury)を持ち、単語「signature」では文字「g」が発音されるが、単語「sign」では発音されない。
【0009】
英語は、42~45の音素(定義による)および26の文字を有する。これは、多くの英字が、2つ以上の音を出さなければならないことを意味し、このことは、読者にとって分かりづらい。
【0010】
不規則な英語の綴りは、非常に大きな識字の問題である。ヨーロッパで行われた研究は、フィンランド人が3~6ヶ月で発音に即した(phonetic)フィンランド語を読むことを学習する一方、英語の生徒が同じレベルに達するために2.5~3年を要することを見いだした。1200人のイタリア人の生徒の第2の研究は、多くのディスレクシアの(dyslexic)生徒が、特別な支援を必要とせずに大学に進学するのに十分なほどイタリア語(発音に即した言語)をよく読めることを見いだした。学習するべき規則がないので、発音通りに記述される言語をデコードすることを学習するのは、明らかにずっと簡単である、つまり、読者は、規則または例外なしに1文字ずつその単語を発音することによって新しい単語を学習する。したがって、読者は、自身のデコードスキルと、その単語を正しく発音する自身の能力とに自信を持つことができる。
【0011】
英語の綴りは、非常に不規則なので、AIベースのコンピュータシステムは、たとえ10万語を超える英単語で訓練されたとしても、多くの英語の音を正確にデコードすることができなかった。
【0012】
また、英語の不規則な綴りは、英語の音素、音節、および単語の正確な聴覚弁別に関する問題、ならびに発音の問題を引き起こし、その結果、芳しくない口頭でのコミュニケーションをもたらす。以下のこと、すなわち、ある人が会議に出ており、外国語話者が自分の名前を言うのを聞くことを考える。名前を聞くその人は、何が言われたのか認識しない。しかし、外国人の名前が書かれたカードを手渡されるとき、名前を聞くその人は、何を聞くべきか分かっているので、名前を弁別することができる。
【0013】
同様に、単語を発音通りにマークアップさせることは、人々が単語をどのように発音すべきかを正確に知ることを可能にし、査読のある学術雑誌に発表された実験が、単に単語を聞くことによるよりも優れた発音を書かれた単語から示す。
【0014】
人々は、情報を読むことおよび聞くことにより情報を吸収することによって学習する。人々が読んだことおよび聞いたことを理解することができるということが、決定的に重要である。人々は、口頭でのコミュニケーションと同様のレートで、流暢に読む必要がある。人々は、個々の単語を正確に認識することができるように、良好な聴覚弁別を必要とする。人々は、人々が単語を理解するのに十分なだけ正確にそれらの単語を発音することができる必要がある。人々は、読んだことまたは聞いたことを理解することができるために、単語が何を意味するかを知る必要がある。英語の不規則な綴りは、人々が読むことおよび口頭でのコミュニケーションを習得することをより難しくする。
【0015】
多くの国で使用されている、英単語の音をどのようにデコードすべきかを教える現在の方法は、シンセティックフォニックスと呼ばれるシステムである。このシステムは、複数の規則および例外を有する。生徒は、新しい単語に出会うとき、単語が発音に即しており、発音され得るかどうか、発音規則が当てはまるかどうか、たとえば、「cake」が/cayk/と発音されるかどうか、または単語が例外なのかどうかが分からない。(文字/cat/は、英語話者によって発音されるときの単語「cat」の音を表す。)そのような発音規則には多くの例外がある。これは、生徒にとって非常に分かりにくくなり得る。
【0016】
シンセティックフォニックスの規則を除く英単語のデコードを教える別の方法は、単語が発音通りに音読され得るように単語をマークアップすることである。1つのシステムは、グリフ(glyph)を使用して、特定の単語(watch)において文字がどのような音を出すか、その単語(sign)においてどの文字が発音されないか、ならびにその単語(bakedおよびnaked)において音節の区切りがどこにあるかを読者に知らせる。このシステムは、シンセティックフォニックスよりもかなりうまく働く。しかし、この手法に関して明らかになった問題が存在し、すなわち、グリフが読者にとって直感的に何かを意味せず、学習されなければならず、それが時間(ときには数週間)を要し、幅広い採用の大きな障壁を作り、すべての英単語がこのシステムを使用してマークアップされ得るわけなく、システムが英語に制限され、音節の強勢が明示的に表示されないためにマークアップシステムがまだ曖昧であった。
【0017】
教育用のテキストを生成し、訓練のエクササイズを実行するための既存のテクノロジーは、非常に限られており、多くの言語教授用テキストおよびエクササイズは、手動で教えられるか、または不十分に自動化されており、たとえば、特定の学習者にとって難しい場合が多い。
【0018】
長くて複雑な文は、誰にとっても理解することが難しくなり得、文中で学習者の母語と異なる語順を有する新しい言語を学習する人にとっては特に難しくなり得る。複雑な段落を理解するために、読者は、文を単語の意味のあるグループに分けることができるように、まず、文または文の集まりを何度か読む必要がある場合がある。それから、読者は、テキストに書かれていることを理解するために、単語の異なるグループを一緒に関連付けることができる必要がある。
【0019】
上記の例は、すべての言語学習システムの複雑で相互に関連した性質を示す。また、それは、英語を使用するすべてのコミュニケーションシステムにおいて、生徒が何も学習する必要なしにすべての英単語を発音に即すようにし、英字の音を知っている誰もが任意の単語の音をデコードすることを可能にするシステムの必要性も示した。
【先行技術文献】
【特許文献】
【0020】
【非特許文献】
【0021】
【非特許文献1】www.speechace.com
【非特許文献2】http://www.apache.org
【非特許文献3】http://www.php.net
【非特許文献4】http://www.mysql.com
【非特許文献5】Peter J. Eccles、An Introduction to Mathematical Reasoning: Numbers, Sets, and Functions、「Chapter 11 : Properties of Finite Sets」、Cambridge University Press (1998)
【発明の概要】
【発明が解決しようとする課題】
【0022】
従来技術に関連する1つもしくは複数の欠点もしくは制限に対処するかまたはそれらを改善する、あるいは少なくとも有用な代替技術を提供することが望まれている。
【課題を解決するための手段】
【0023】
本明細書において説明されるのは、
1つまたは複数の形式の基本アルファベットを定義するテキストを含む少なくとも1つの文書を受け取るように構成されたシステムと、
読者が文書をより深く理解するための追加データを提供するように構成されたシステムであって、
読者がそれぞれの発音に即していない単語の音をデコードすることを可能にするために、文書の発音に即していない単語をエンコードまたはマークアップする方法を含む、システムと、
テキストおよび追加データを伴うエンコードされた文書を1つまたは複数の形式で出力するように構成されたシステムと含むコンポーネントを持つ出版システムであって、
エンコードされた単語を発音に即すようにするために、発音に即していない単語を自動的にエンコードする方法が、
発音に即していない単語の少なくとも1つの文字(「綴り文字」)に関して、綴り文字および音文字を含む合成文字(compound character)を使用することであって、音文字が、
基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
各綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
綴り文字が音文字と視覚的に弁別され得るように追加され、
単語の綴りが元のままであるので読者が目で見て発音に即していない単語を認識し得るように追加され、
各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音文字が人間が読むことができるままであるように綴り文字に追加される、使用すること、ならびに
エンコードされた単語の合成文字が、綴り文字のうちのどれが綴り文字の通常の音以外の音を持つか、および各文字が文字の通常の音を出さないときに発音に即していない単語において文字がどのような音を出すかを視覚的に示すように、エンコードされた単語を人間が読むことができる形態/形式で自動的に出力することを行う、出版システムである。
【0024】
システムは、基本アルファベットの複数の単語およびそれらの単語の国際音声記号(IPA: International Phonetic Alphabet)表現を含む単語-IPAペアの辞書/データベースからの入力に基づいて、英単語を、無音の文字、音節の区切り、強勢音節、および/または各文字が出す音を含むエンコードされた単語へと自動的にエンコード/マークアップするように構成されてよく、任意で、エンコード/マークアップされた単語は、
コンピューティングシステムにおいて自動的に、単語-IPAペアの辞書/データベースにない1つのIPA文字または複数のIPA文字がIPAマークアップにあるかどうかを判定すること、
コンピューティングシステムにおいて自動的に、エンコードされた単語の文字ペアがすべて有効な文字ペアであるかどうかを判定すること、
コンピューティングシステムにおいて自動的に、2つ以上の辞書からのIPAマークアップを翻訳し、翻訳を比較し、違いがある場合、単語を編集すること、
コンピューティングシステムにおいて自動的に、接頭辞および接尾辞でマークアップされた単語を探し出し、標準化すること、
コンピューティングシステムにおいて自動的に、語根のマークアップを予め定義されたマークアップに自動的に変更し、変更を似た単語と比較することによって変更を自動的にチェックさせることを含め、語根のマークアップができるだけ標準的であることを保証するために語根を探し出すためにマークアップされた単語を分析すること、
コンピューティングシステムにおいて自動的に、同じ語根を持つ単語のマークアップを比較し、マークアップが語根に関して一貫していることをチェックすること、
コンピューティングシステムにおいて自動的に、1つの母音を持つ単語が1音節の単語であることをチェックすること、および/または子音によって分けられている複数の母音を持つマークアップされた単語が、存在する母音と同じ数の音節をマークアップ内に有することをチェックすること、
コンピューティングシステムにおいて自動的に、新しい音節が作成される場合、すべての綴り文字が音文字と同じである新しい音節に、一部の綴り文字が異なる音文字を有する音節よりも低いチェックの優先度でフラグを立てることを含め、手動チェックのために新しい音節にフラグを立てること、ならびに
コンピューティングシステムにおいて自動的に、マークアップされた単語の音節を再生し、このようにして作成された単語の音をエンコードされていない単語の別の録音と自動的に比較することのうちの1つまたは複数によってチェックされる。
【0025】
エンコードする方法は、
基本アルファベットから形成された単語の予め選択されたセット内の複数の予め選択された単語のうちの1つと一致するソーステキストの少なくとも1つの単語(「特定された単語」)を特定することであって、特定された単語が、予め選択されたセット内で定義された少なくとも1つの強勢のある音節および/または少なくとも1つの強勢のない音節を含み、各音節が、綴り文字のうちの1つまたは複数を含む、特定することと、
各音節の前にドット/四角を追加することによって特定された単語を置き換える/調整することであって、音節の綴り文字が、元のままであり、強勢のある音節のドット/四角が、強勢のない音節のドット/四角と視覚的に異なる、置き換える/調整することとによって音節の区切りを追加することを含め、音節の前に記号を追加することによって音節の区切りを示すことを含む、音節の区切りを追加するステップを含んでよい。
【0026】
エンコードする方法は、無音の文字の形を変えることなく、無音の文字を綴り文字と視覚的に区別することによることを含め、無音の文字を示すステップを含んでよい。
【0027】
システムは、エンコードされた単語をスクリーン上に静的に表示するか、またはビデオもしくはその他の動的表示システムに動的に表示する1つまたは複数のインタラクティブな教授/練習コンピューティングシステムを含んでよく、インタラクティブなコンピューティングシステムは、自動的に
インタラクティブなコンピューティングシステムのユーザからのユーザ入力を受け取り、
ユーザ入力に基づいてユーザを複数のカテゴリのうちの1つに分類し、
ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて複数のセットから音素セットを選択するように構成され、
分類することは、
コンピューティングシステムがユーザの知識/パフォーマンスの測定された値を生成すること、および
コンピューティングシステムが測定された値に基づいてユーザを複数のカテゴリのうちの1つに分類することを含み、
インタラクティブなコンピューティングシステムは、自動的に
テストテキストを可視的に表示するか、またはテストテキストを可聴的に再生することによって、基本アルファベットのテストテキストをユーザに提示することであって、テストテキストが、少なくとも1つのテスト単語およびテスト単語ではない1つまたは複数の誤答選択肢(distractor)単語を含む、ユーザインターフェースを使用してユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、提示すること、ならびに
ユーザが選択可能な単語のユーザ選択からの値を測定することであって、少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/またはテスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、測定することを行うように構成される。
【0028】
本明細書において説明されるのは、テキスト文書を変換/エンコードする方法であって、
複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
ソーステキストを、
1つまたは複数の文字(「綴り文字」)を有するソーステキストの各単語であって、1つまたは複数の文字(「綴り文字」)がその文字の通常の音以外の音を持つと特定される、各単語に関して(すなわち、単語および対応するマークアップされた発音に即した単語のデータベースの1単語ずつの検索において)、綴り文字および音文字をそれぞれが含むそれぞれの合成文字を持つ代替単語を使用することであって、音文字が、
基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
綴り文字が音文字と弁別され得るように表示され、
各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音文字が人間が読むことができるままであるように綴り文字に追加される、使用することによってエンコードするステップと、
エンコードされたテキストが、綴り文字のうちのどれがその文字の通常の音以外の音を持つかを視覚的に示す合成文字を持つソーステキストからの複数の単語を含むように、および前記エンコードされたテキストの単語の綴り文字がソーステキストのそれぞれの単語の文字と同じであり、同じ順序であるように、エンコードされたテキストを人間が読むことができる形態/形式で出力するステップとを含む、方法である。
【0029】
音文字は、
副次的アルファベットの文字を使用して定義/発音され得る基本アルファベットの音素に関連する副次的アルファベットの複数の音文字、
副次的アルファベットに存在しない基本アルファベットの音素に関連する基本アルファベットの複数の音文字、および/または
副次的アルファベットに存在しない国際音声記号(IPA)の音素に関連する基本アルファベットの複数の音文字を含む予め選択された音素セット内にあってよい。
【0030】
1つまたは複数の音文字の追加は、エンコードされたテキストの単語において、綴り文字が音文字に接触していないか、または音文字が綴り文字に接触する場合には、音文字の行長(line length)の5%未満が綴り文字に接触するように、音文字とそれぞれの綴り文字との間に隙間/スペースを追加することを含んでよい。
【0031】
任意の小文字の音文字のうちの1つまたは複数は、異なるフォントを有することを含め、対応する大文字とは異なるように成形されてよく、および/または綴り文字に対して異なるように配置されてよい。
【0032】
音文字は、6:9(たとえば、音文字のフォントサイズ : 綴り文字のフォントサイズ)の比率でソーステキストのフォントサイズ(「ソースフォントサイズ」)に基づくフォントサイズ(「音フォントサイズ」)を有してよく、および/または音文字は、少なくとも6ポイントのフォントサイズを有する。
【0033】
方法は、ソーステキストを1単語ずつエンコードするための単語のデータベース(「翻訳データベース」)を自動的に生成するステップを含んでよい。
【0034】
方法は、ユーザが基本アルファベットの単語に関してマークアップされた発音に即した単語を手動で選択するためのインタラクティブなコンピューティングシステムのユーザインターフェースを提供するステップを含んでよい。
【0035】
方法は、
コンピューティングシステムが、インタラクティブなコンピューティングシステムのユーザからおよび/または登録時のユーザ入力からのユーザ入力を受け取るステップと、
コンピューティングシステムがユーザ入力に基づいてユーザを複数のユーザカテゴリのうちの1つに分類するステップと、
コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて、複数の音素セットから、文字が綴り文字および音文字によって構成される最適な音素セットを選択するステップとを含んでよい。
【0036】
方法は、強勢のある音節の前の閉じたドット(closed dot)、および強勢のない音節の前の開いたドット(open dot)、強勢のある音節の前のドット、および強勢のない音節の前の四角、強勢のある音節の前の開いたドット、および強勢のない音節の前の閉じたドット、または強勢のある音節の前の四角、および強勢のない音節の前のドットによって、代替単語の強勢を示すステップを含んでよい。
【0037】
本明細書において説明されるのは、読むこと、読解、口頭でのコミュニケーション、口頭でのコミュニケーションの理解、および語彙の習得への習熟度を高める生徒の能力を向上させることができ、それが、ひいては多くのその他の対象領域における改善された学習結果につながる可能性があるヒューリスティックな出版/教育/単語マークアップシステムであり、マークアップシステムの単純さ、完全さ、および読者にとっての直観性は、システムを実行するコンピュータの機能を向上させ、新しいアルゴリズムおよびユーザインターフェースの開発を支援することができる。システムは、ヒューリスティック(すなわち、自己学習型)であり、データが収集され、分析され、アルゴリズムおよびシステムを改善し、予測を行うために使用されるにつれてより効率的になる可能性があり、システムは、これらの予測を迅速にテストすることができ、システムを駆動するアルゴリズムのアップグレードが実装されること、さらなる予測がなされ、迅速にテストされることなどを可能にし、これは、生徒の学習結果を反復的に改善する可能性がある。
【0038】
出版/教育システムの中心となるは、テキスト文書を変換/エンコードする方法であって、
a. 複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
b. ソーステキストを、
i. 1つまたは複数の文字(「綴り文字」)を有するソーステキストの各単語であって、1つまたは複数の文字(「綴り文字」)が(その文字の)通常の音以外の音を持つと特定される、各単語に関して(すなわち、単語および対応するマークアップされた発音に即した単語のデータベースの1単語ずつの検索において)、綴り文字および(上付き文字によって表され得る)音文字をそれぞれが含むそれぞれの合成文字を持つ代替単語を使用することであって、音文字が、
1. (レターの音が読者に既に知られている)基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
2. 綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
3. 綴り文字を音文字と弁別することが容易であるように表示され、
4. 各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音が人間が読むことができるままであるように綴り文字に追加される、使用することによってエンコードするステップと、
c. エンコードされたテキストが、綴り文字のうちのどれが(その文字の)通常の音以外の音を持つかを視覚的に示す合成文字を持つソーステキストからの複数の単語を含むように(およびエンコードされたテキストの単語の綴り文字によって作られる形がソーステキストのそれぞれの単語の形と実質的に同じであるように)、エンコードされたテキストを人間が読むことができる形態/形式で出力するステップとを含む、方法である。
【0039】
本明細書において説明されるのは、テキスト文書を変換/エンコードする方法であって、
a. 複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
b. ソーステキストを、
i. 1つまたは複数の文字(「綴り文字」)を有するソーステキストの各単語であって、1つまたは複数の文字(「綴り文字」)が(その文字の)通常の音以外の音を持つと特定される、各単語に関して(すなわち、「翻訳データベース」または「翻訳辞書」と呼ばれる場合があるデータ構造である、単語および対応するマークアップされた発音に即した単語のデータベースの1単語ずつの検索において)、綴り文字および(上付き文字によって表され得る)音文字をそれぞれが含むそれぞれの合成文字を持つ代替単語を使用することであって、音文字が、
1. (レターの音が読者に既に知られている)基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
2. 綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
3. 綴り文字を音文字と弁別することが容易であるように表示され、
4. 各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音が人間が読むことができるままであるように綴り文字に追加される、使用することによってエンコードするステップと、
c. エンコードされたテキストが、綴り文字のうちのどれが(その文字の)通常の音以外の音を持つかを視覚的に示す合成文字を持つソーステキストからの複数の単語を含むように、およびエンコードされたテキストの単語の綴り文字によって作られる形がソーステキストのそれぞれの単語の形と実質的に同じであるように、エンコードされたテキストを人間が読むことができる形態/形式で出力するステップとを含む、方法である。
【0040】
予め選択された音素セットは、
a. 副次的アルファベットの文字を使用して定義/発音され得る基本アルファベットの音素に関連する副次的アルファベットの複数の音文字、
b. 副次的アルファベットに存在しない基本アルファベットの音素に関連する基本アルファベットの複数の音文字、および/または
c. 副次的アルファベットに存在しないIPAの音素に関連する基本アルファベットの複数の音文字を含む場合がある。
【0041】
方法は、音節の区切りを示すステップを含んでよい。
【0042】
方法は、音節の前に記号を追加することによって音節の区切りを示すステップを含んでよい。
【0043】
方法は、任意で、無音の文字の形を変えることなく、無音の文字を綴り文字と視覚的に区別することによって無音の文字を示すステップを含んでよい。
【0044】
方法は、無音の文字および音節の区切りを示すステップを含んでよい。
【0045】
1つまたは複数のサイズの音文字の追加は、エンコードされたテキストの単語がはっきりと見え、音文字と接触していないように、音文字とそれぞれの綴り文字との間に隙間/スペースを追加することを含んでよい。
【0046】
方法は、音節の区切りを示すステップであって、音節の区切りが、音節の区切りに続く音節が強勢を置かれるのかまたは強勢を置かれないのかを示す、ステップを含んでよい。
【0047】
任意の小文字の音文字のうちの1つまたは複数は、異なるフォントを有することを含め、対応する大文字とは異なるように成形されてよい。
【0048】
出力されたテキストは、物理的な印刷された本および/または電子書籍を含む、人間が読むことができる形態/形式であってよく、方法は、任意で、物理的な本を印刷するステップ。および/または電子書籍を非一時的コンピュータ可読媒体に記憶するステップを含んでよい。
【0049】
音文字は、6:9(音文字のフォントサイズ : 綴り文字のフォントサイズ)の比率でソーステキストのフォントサイズ(「ソースフォントサイズ」)に基づくフォントサイズ(「音フォントサイズ」)を有してよい。
【0050】
音文字は、少なくとも6ポイントのフォントサイズを有してよい。
【0051】
合成文字の名前は、/綴り文字/ says /音文字/および/または/綴り文字/ rhymes with /音文字/であってよい。
【0052】
方法は、
a. コンピューティングシステムのユーザからのユーザ入力を受け取るステップと、
b. コンピューティングシステムがユーザ入力に基づいてユーザを複数のカテゴリのうちの1つに分類するステップと、
c. コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて複数のセットから音素セットを選択するステップとを含んでよい。
【0053】
方法は、
a. コンピューティングシステムがユーザの知識の測定された値を生成するステップと、
b. コンピューティングシステムが測定された値に基づいてユーザを複数のカテゴリのうちの1つに分類するステップとを含んでよい。
【0054】
方法は、
a. コンピューティングシステムが、テストテキストを可視的に表示するか、またはテストテキストを可聴的に再生することによって、基本アルファベットのテストテキストをユーザに提示するステップであって、テストテキストが、少なくとも1つのテスト単語および(テスト単語ではない)1つまたは複数の誤答選択肢単語を含む、インタラクティブなコンピューティングシステムのユーザインターフェースを使用してユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、ステップと、
b. コンピューティングシステムが、ユーザが選択可能な単語のユーザ選択からの値を測定するステップであって、少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/またはテスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、ステップとを含んでよい。
【0055】
方法は、音声分析ツールを使用してユーザの発音を分析することによって測定された値を生成するステップを含んでよい。
【0056】
方法は、
a. 学習されるべき音素を含む異なる音節の音を、同じ生徒カテゴリのその他の生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にした順序で再生すること、
b. 生徒が学習エクササイズまたはテストでより多くの正解を出すことを可能にするなまりで音を再生することによって測定された値を生成するステップを含んでよい。
【0057】
生徒が基本言語の母語話者よりも易しいと感じるなまりで発音された音節および音素を弁別することができるとき、生徒を、基本言語の母語話者によって発音された音素および音節の聞き取りに移行させる。
【0058】
測定された値を生成するステップは、
a. 学習されるべき音素を含む異なる音節の音を、同じ生徒カテゴリのその他の生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にした順序で再生すること、
b. 生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にするなまりで音を再生すること、ならびに/または
c. 生徒が基本言語の母語話者よりも易しいと感じるなまりで発音された音節および音素を弁別することができるとき、たとえば、生徒と同じ母語を持つ人がこれらの音節および音素を話しているのを聞くときに生徒がより易しいと感じた音節および音素の音をまず再生することによって、生徒を基本言語の母語話者によって発音された音素および音節の聞き取りに移行させることを含んでよい。
【0059】
方法は、
a. コンピューティングシステムが少なくとも3つのマークアップされた単語を表示することであって、それらのマークアップされた単語のうちの2つが間違いである、表示することと、
b. コンピューティングシステムが、ユーザがいくつの間違いの単語を選択するかを測定することとによって測定された値を生成するステップを含んでよい。
【0060】
方法は、
a. コンピューティングシステムが、少なくとも2つのそれぞれの正しい音節を定義する少なくとも2つの音節を持つ多音節の単語を再生することと、
b. コンピューティングシステムが、少なくとも2つのそれぞれの空欄、および少なくとも2を超える複数のユーザが選択可能な音節を表示することと、
c. コンピューティングシステムが、ユーザが選択可能な音節のうちの少なくとも2つを選択するユーザからの入力を受け取ることと、
d. コンピューティングシステムが、いくつの正しい音節がユーザによって選択された音節の中にあるかを測定することとによって測定された値を生成するステップを含んでよい。
【0061】
方法は、
a. コンピューティングシステムが、第1の複数の正しい文字を定義する単語の音を再生することと、
b. コンピューティングシステムが、第1の複数に等しい空欄を表示することと、
c. コンピューティングシステムが、第2の複数のユーザが選択可能な文字を表示することであって、第2の複数が第1の複数よりも大きい、表示することと、
d. コンピューティングシステムが、ユーザが選択可能な文字を選択するユーザからの入力を受け取ることと、
e. コンピューティングシステムが、いくつの正しい文字がユーザによって選択された文字の中にあるかを測定することとによって測定された値を生成するステップを含んでよい。
【0062】
方法は、
a. コンピューティングシステムが、それぞれの複数の単語の音を、単語の再生される音の隣接するものの間に無音の時間があるようにして再生することと、
b. コンピューティングシステムが、ユーザからの入力に基づいて、再生される音の間の無音の時間を短くすることと、
c. コンピューティングシステムが、ユーザからの入力に基づいて、(人間同士のしゃべりで使用される)連続した音でゆっくりと単語の音を再生することと、
d. コンピューティングシステムが、ユーザからの入力に基づいて、(人間同士のしゃべりで使用される)連続した音で通常のしゃべりの速度で単語の音を再生することとによって測定された値を生成するステップを含んでよい。
【0063】
コンピューティングシステムは、単語を取得し、単語を自動テキストトゥスピーチソフトウェアモジュールに渡すことができ、自動テキストトゥスピーチソフトウェアモジュールは、単語の音を含む音声ファイルを生成するように構成され、音声ファイルは、単語のテキストを単語の音にリンクするデータベースに記憶され得る。文は、単語を選択し、その単語の音に関してデータベースを調べ、その単語を再生することによって1単語ずつ再生され得る。再生される文は、イントネーションおよび抑揚(cadence)を含まない。
【0064】
コンピューティングシステムは、文を取得し、文を自動テキストトゥスピーチソフトウェアモジュールに渡すことができ、自動テキストトゥスピーチソフトウェアモジュールは、イントネーションおよび抑揚を付けて音読される文の音声ファイルを生成するように構成される。それから、文の音声ファイルは、Stefan Rapp博士によって開発されたAlignerのような自動スピーチセグメンテーションシステムに渡されることが可能であり、自動スピーチセグメンテーションシステムは、文中の単語の音を含む連続的なしゃべりを個別の単語および音素に分けることができる。異なる文においては単語に適用されるイントネーションおよび抑揚が異なり得るので、単語をその単語の音にリンクするデータベースは、文書識別子、文識別子、および単語識別子も含み、それが、単語間に可変の間を置き、抑揚およびイントネーションを付けて順番に文中の単語が再生されることを可能にする。
【0065】
音声信号を個別の単語の音に分け、単語のテキストをデータベース内のその単語の音にリンクすることによって、文中の各単語は、その単語の音が再生されるときに強調され得る。これは、一部の読者、たとえば、子供の頃に読み聞かせをされなかった読者を支援する可能性があり、単語を見て、単語が発音されるのを聞くことによって聴覚弁別を向上させるのに役立つ可能性がある。読者の理解力を測定するために、多肢選択問題が追加され得る。
【0066】
単語のテキストを強調しながら単語の音を再生することは、読み練習ツールの有用な特徴である場合がある。
【0067】
上の方法を使用して、読み練習ツールは、文を強調しながらフレーズで文を再生することも可能である。
【0068】
認知負荷理論の分割集中原理(split concentration principle)は、注意が分割されるので、一度に複数のソースからの情報が学習を低下させ得ることを示す。読者がある程度の読解力を発達させると、生徒が読むだけの場合、または生徒が聞くだけの場合、注意は分割れない。
【0069】
音素、音節、単語、フレーズ、句動詞、熟語などをクリックすることによって、読み練習ツールは、イントネーションおよび抑揚を付けてまたは付けずに、個々の単語、音節、音素、フレーズ、句動詞(come up withは思いつくことを意味する)、および熟語を再生する可能性もある。
【0070】
同様に、読者は、単語、フレーズ、句動詞、熟語などをクリックし、単語、フレーズ、句動詞、熟語などの定義または翻訳を提示される可能性がある。
【0071】
ユーザ入力は、ユーザによって選択された値を含んでよく、方法は、ユーザによって選択された値を、
a. コンピューティングシステムが、テキスト入力プロンプトおよび/または選択可能なリストをユーザに提示すること、ならびに
b. コンピューティングシステムが、テキスト入力プロンプトおよび/または選択可能なリストにおける入力として、ユーザによって選択された値を受け取ることによって受け取るステップを含み、
方法は、コンピューティングシステムがユーザによって選択された値に基づいてユーザを複数のカテゴリのうちの1つに分類するステップを含む。
【0072】
テキスト入力プロンプトおよび/または選択可能なリストは、年齢、性別、母語、教育レベル、および/または英語もしくはその他の言語スキルレベルを定義する複数のユーザが選択可能な値を定義してよい。
【0073】
方法は、コンピューティングシステムが、ユーザがユーザアカウントを有する学習管理システムに接続することによってユーザを認証し、特定するステップを含んでよい。
【0074】
方法は、コンピューティングシステムが、LMSのアプリケーションプログラミングインターフェース(API)を通じて、ユーザがユーザアカウントを有する学習管理システムに接続することによって、ユーザを認証し、特定するステップを含んでよい。
【0075】
方法は、ユーザカテゴリおよび/または測定された値を、LMSにユーザの記録とともに記憶するために、ユーザアカウントに関連するLMSに送るステップを含んでよい。
【0076】
方法は、コンピューティングシステムが、複数のユーザカテゴリグループの各々のユーザからのデータで訓練された訓練された分類器を使用して、ユーザを複数のカテゴリのうちの1つに分類するステップを含んでよい。
【0077】
方法は、
a. コンピューティングシステムが、各部分的音節/音節に関して1音素(無音の文字以外の文字または二重音字)インクリメントして、ソーステキストからの単語を、最初の文字/レターと、徐々に、さらなる文字/レター/二重音字(digraph)(異なる音を表す2つのレター、たとえば、二重音字「ph」は音/f/を表す)とを含む、複数の個々の音素/部分的音節/音節に分割するステップと、
b. コンピューティングシステムが、音素の部分的音節/音節を、ユーザが聞くためにコンピューティングシステムのユーザインターフェースから長さの順に漸進的に発音する(再生する)ステップと、
c. コンピューティングシステムが、ユーザインターフェースを介して、部分的音節/音節を繰り返すようにユーザに指示するステップと、
d. コンピューティングシステムが、ユーザが音節/部分的音節を話すのを録音するステップと、
e. コンピューティングシステムが、部分的音節/音節のセットを発音し、それから、ユーザの録音された部分的音節/音節のセットを発音するステップであって、任意で、発音するステップを2回以上繰り返すことを含む、ステップとを含んでよい。
【0078】
方法は、コンピューティングシステムが、文字、音節、および単語をユーザインターフェース上に表示し、同時に、音素、音節、および単語を含むサウンドファイルを発音する(再生する)ステップを含んでよい。
【0079】
方法は、
a. コンピューティングシステムが、ある/そのユーザが聞くためのテスト音を再生するステップと、
b. コンピューティングシステムが、言語でテスト音を表す1つのテスト文字または複数のテスト文字を含む複数の文字を表示するステップと、
c. コンピューティングシステムが、ユーザが1つのテスト文字または複数のテスト文字をクリックするかどうかを測定するステップとを含んでよい。
【0080】
方法は、コンピューティングシステムが、基本アルファベットの音素と、対応するIPA記号によって接続/リンクされた副次的アルファベットの音素とを含む予め定義された音素チャート(たとえば、
図4の日本語音素チャート)を表すデータに基づいて、基本アルファベットにはあるが副次的アルファベットにはない音素を選択するステップを含んでよい。
【0081】
方法は、
a. コンピューティングシステムが、ユーザがテスト文字(および/または音素/音節/単語)を発音するのを録音するステップ、
b. コンピューティングシステムが、ユーザが聞くためにユーザの録音を繰り返し再生するステップ、
c. コンピューティングシステムが、ユーザがユーザの録音と予め録音された発音との違いを聞き取ることができるように、ユーザの録音の後に、テスト文字(および/または音素/音節/単語)の予め録音された発音を繰り返し再生するステップを含んでよい。
【0082】
方法は、ソーステキストの音節を特定するステップと、エンコードされたテキストの隣接する音節の間にスペース/音節の区切りを追加するステップとを含んでよい。
【0083】
方法は、
a. 基本アルファベットから形成された単語の予め選択されたセット内の複数の予め選択された単語のうちの1つと一致するソーステキストの少なくとも1つの単語(「特定された単語」)を特定することであって、特定された単語が、予め選択されたセット内で定義された少なくとも1つの強勢のある音節および/または少なくとも1つの強勢のない音節を含み、各音節が、綴り文字のうちの1つまたは複数を含む、特定することと、
b. 各音節の前にドット/四角を追加することによって、特定された単語を置き換える/調整することであって、音節の綴り文字が、元のままであり、強勢のある音節のドット/四角が、強勢のない音節のドット/四角と視覚的に異なる、置き換える/調整することとによってソーステキストをエンコードするステップを含んでよい。
【0084】
方法は、
a. コンピューティングシステムのユーザからのユーザ入力を受け取るステップと、
b. コンピューティングシステムがユーザ入力に基づいてユーザを複数のカテゴリのうちの1つに分類するステップと、
c. コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて複数のセットから音素セットを選択するステップとを含んでよい。
【0085】
本明細書において説明されるのは、
a. 英語で書かれた各単語(「英単語」)および国際音声記号で書かれた各単語(「IPA単語」)を受け取るステップと、
b. 1つまたは複数の文字が(その1つまたは複数の文字の)通常の音以外の音を持つかどうかを特定するために英単語の文字(「英字」)をIPA単語の文字と比較するステップと、1つまたは複数の文字が(その1つまたは複数の文字の)通常の音以外の音を持つ場合、
c. 綴り文字および音文字を含む単語(「マークアップされた発音に即した単語」)を自動的に生成するために英字の代わりに合成文字を使用するステップであって、音文字が、
i. 基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
ii. 各合成文字の綴り文字のために選択された基本フォント/文字サイズよりも小さい選択された副次的フォント/文字サイズを有し、
iii. 各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字が人間が読むことができるままであるように、合成文字に追加される、ステップと、
d. マークアップされた発音に即した単語の形がそれぞれの英単語の形と実質的に同じであるような、英単語およびマークアップされた発音に即した単語のデータベース(「翻訳データベース」)を出力するステップとを含む(それぞれが音文字を含む合成文字を持つ単語のデータベースを自動的に生成する)方法である。
【0086】
同じプロセスが、IPAマークアップされた単語が存在する英語以外の言語の単語をマークアップするために使用されることが可能であり、方法は、その他の言語で書かれた各単語を受け取っており、その他の言語の文字を比較し、その他の言語の単語のデータベース(「翻訳データベース」)を出力する。
【0087】
方法は、ユーザが英単語に関してマークアップされた発音に即した単語を手動で選択するためのユーザインターフェースを提供するステップを含んでよい。
【0088】
本明細書において説明されるのは、エンコードされた単語を発音に即し、読者にとって直観的であるようにするために、
a. 綴り文字および(上付き文字によって表され得る)音文字をそれぞれが含むそれぞれの合成文字を使用することであって、音文字が、
i. 基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
ii. 綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
iii. 綴り文字を音文字と弁別することが容易であるように表示され、
iv. 熟練した読者が目で見て単語を認識する(単語をサイトワード読みする(sightword read))ことが容易であるように追加され、
v. 各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音文字が人間が読むことができるままであるように綴り文字に追加される、使用することと、
b. エンコードされた単語の合成文字が、綴り文字のうちのどれが(その文字の)通常の音以外の音を持つかを視覚的に示すように、エンコードされた単語を人間が読むことができる形態/形式で出力することとによって単語をエンコードすることによって単語をエンコードする方法である。
【0089】
方法は、基本アルファベットの文字によって曖昧さなく指定されない音を表す文字および/または記号を追加するステップを含んでよい。
【0090】
方法は、音節の区切りを追加するステップであって、音節の区切りが、音節が強勢を置かれるのかもしくは強勢を置かれないのかを読者に明示的に曖昧さなく知らせる、ステップ、および/または音素もしくは二重音字が有声であるかどうかを読者に明示的に曖昧さなく知らせるための記号を追加するステップを含んでよい。
【0091】
音節の区切りは、音節の数を最小化するようにして追加されてよい。
【0092】
綴り文字によって綴られる単語の形は、実質的に保たれてよい。
【0093】
音文字は、見やすい可能性があり、したがって、読者が、新しい単語を迅速で効率的に発音することができ、同時に、音文字が、読者による読みの効率を妨げず、綴り文字を使用して綴られた単語を読むことに役立つように表示される可能性がある。
【0094】
単語は、その単語のIPAのマークアップを使用して、完全にまたは部分的にマークアップされてよい。
【0095】
本明細書において説明されるのは、
a. 複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップ、
b. ソーステキストを、
i. その単語の音をデコードすることについての1つまたは複数の明示的な情報を有するソーステキストの各単語に関して(つまり、単語および対応するマークアップされた発音に即した単語のデータベースの1単語ずつの検索において)、
ii. エンコードされたテキストが、その単語の音をデコードすることについての明示的な情報を持つソーステキストからの複数の単語を含むように、エンコードされたテキストを人間が読むことができる形態/形式で出力することによってエンコードするステップを含む方法である。
【0096】
本明細書において説明されるのは、機械可読命令がコンピューティングシステムの1つまたは複数のマイクロプロセッサによって実行/遂行されるときに、コンピューティングシステムに上記方法のいずれか1つを遂行させるように構成された機械可読命令を含む不揮発性コンピュータ可読ストレージである。
【0097】
以降で、本発明のいくつかの実施形態が、添付の図面を参照して単に非限定的な例として説明される。
【図面の簡単な説明】
【0098】
【
図1】本明細書において説明される学習のための方法のチャートである。
【
図2】方法を実行するように構成されたコンピューティングシステムのブロック図である。
【
図4】英語の音素と、IPAおよび日本語の上付き文字を伴う(合成文字を含む)対応するマークアップされた発音に即した単語とのチャートである。
【
図5】英単語およびその単語のIPSへの翻訳を取得し、合成文字を使用して「Fonetic English」の英単語のマークアップされたバージョンを自動的に生成することができるプログラムのスクリーンショットである。
【
図6】対応するマークアップされた発音に即した単語にリンクされた英単語のデータベース(「翻訳データベース」)のためのマークアップされた発音に即した単語を形成するために、英単語の元の文字を置き換える合成文字を選択するためのユーザインターフェース(UI)のスクリーンショットである。
【
図7B】
図7AのテキストがFonetic Englishにエンコードされた、合成文字を使用するエンコードされたテキストの例の図である。
【
図8A】表示される無音の文字の英語の例のリストの図である。
【
図8B】表示される強勢のある/強勢のない音節の区切りの英語の例のリストの図である。
【
図9A】非標準的なフォントの英語の例示的なテキストの図である。
【
図9B】
図9Aのテキストに対応する、Fonetic Englishでエンコードされた非標準的なフォントのエンコードされたテキストの図である。
【発明を実施するための形態】
【0099】
概要
本明細書において説明される出版システムは、文書を理解し、その文書からできるだけ効率的に学習するために必要とされるすべての情報に迅速にアクセスするために読者に提供することを目標として、本明細書において簡潔に説明される認知負荷理論の規則を適用する。異なる読者は、異なる情報の要件を有する。たとえば、ある読者は、ある単語を目で見て読むことができる場合があるが、別の読者は、その単語を学習するためにその単語の音をデコードする必要がある場合がある。単語が発音に即していない場合、読者は、各文字を順番に発音することによってその単語を簡単にデコードすることができない。情報を表示するときには、読者を多すぎる情報で圧倒しないことが重要であり、したがって、デジタル画面では、読者に表示の選択肢を提供することが重要である。オンデマンド印刷テクノロジーを使えば、紙の本に関して費用効率の高い個別化が可能である。読者は、似た情報のニーズを持つ様々なグループにカテゴリ分けされ得る。これは、出版システムが、以下のプロセスで、グループのメンバの学習結果を実験的に最適化することを可能にし、すなわち、(i)異なる情報の混合を試行し、結果を測定し、測定結果を分析してより良い学習結果を予測し、予測された改善された情報の混合を実施し、サイクルを繰り返すことによる、ユーザのグループの情報の要件、および(ii)同様のプロセスが、ユーザのグループのためのインターフェースを最適化するために使用され得る。読者のそのようなテストは、(i)グループへのユーザのより正確なカテゴリ分けを提供する場合があり、(ii)読者が抱えている特定の問題を示す場合があり、その読者が自身の問題を克服するのに役立つ教具(teaching tool)が提供される場合、読者は、読んだことをより深く理解し、より良い学習結果を享受することがより一層できる場合がある。情報の混合の最適化と、この情報がユーザに対して表示される方法とは、学習結果を向上させるために、そのユーザのために個別化され得る。個々の最適化のために使用される情報は、(i)ユーザの母語およびユーザが読みたい言語(目標言語)と、(ii)ユーザの年齢および学業成績と、(iii)語彙または予測される語彙(predicted vocabulary)を含む目標言語の知識とを含む。この理解の結果として、以降で説明される「Fonetic English」出力を使用する出版システムは、読者が学習するために読んでいる間に自身の言語スキル、読むスキル、および理解力を発達させるのを助けるように設計されたシステムを組み込む。これらのシステムは、英語またはローマ字だけに限定されない。出版システムは、本明細書に記載されている、本明細書において説明されるマークアップシステムを中心に構築され、そのマークアップシステムによってのみ可能な、いくつかの新しい緊密に統合されたコンピュータアルゴリズム/プロセスに依拠する。この理由は、以下を含む。(i)マークアップシステムが、各単語に関して完全な発音の指示を提供する、すなわち、各文字が出す音(無音を含む)、音節が示され、強勢のある音節が印を付けられる。(ii)目標言語のあらゆる単語が、その言語の音素で構成され、したがって、その言語のあらゆる単語が、マークアップ形式でマークアップされ得る。(iii)それぞれのマークアップされた単語の綴りが、元のままである。
【0100】
システムは、ヒューリスティック(自己学習型)であり、データが収集され、分析され、アルゴリズムおよびシステムを改善し、予測を行うために使用されるにつれてより効率的になる可能性があり、システムは、これらの予測を迅速にテストすることができ、システムを駆動するアルゴリズムのアップグレードが実装されること、さらなる予測がなされ、テストされることなどを可能にし、これは、生徒の学習結果を反復的に改善する可能性がある。
【0101】
認知負荷理論の規則を適用する出版システムの要素は、以下を含む。
a. 様々な形式の文書を受け取るためのシステムであって、
i. テキストファイル、
ii. Wordファイル、HTMLファイル、および/もしくはPDFファイルなどのフォーマット付きテキストファイル、
iii. テキストがXMLもしくはその他の方法でマークアップされているファイル、
iv. スキャン画像をフォーマットマークアップありでもしくはなしでテキストファイルに変換するために光学式文字認識付きのスキャナによってその後デコードされるテキストのスキャン画像、ならびに/または
v. 音声認識ソフトウェアによって発話された音から作成されたテキストファイルを受け取るように構成されたシステム(たとえば、ファイル転送サーバおよびデジタルファイルストレージシステム)を含む場合がある、システム、
b. 読者が文書をより深く理解するための追加データを提供するためのシステムであって、追加データを提供することが、
i. 読者が各単語の音を素早く、簡単に、正確にデコードすることを可能にするために、発音に即していない単語をマークアップすること、
ii. 単語とそれらの定義および/もしくはそれらの翻訳をリンクすること。有用性を最大化するために、定義は、単にあり得る意味を持つ辞書の定義へのリンクではなく、単語がその文書においてどのように使用されているかを反映するべきである、
iii. 熟語および句動詞(「to come up with」=「to think of」)を強調し、それらの定義にリンクすること、
iv. 読者が自分の好みのなまりを選択することを可能にするために、音節、単語、およびフレーズを複数の異なるなまりのそれらの発音にリンクすること、
v. テキストを読者に、読者の好みのなまりで、読者の好みの速度で、単語の間に区切りを入れてもしくは入れずに、イントネーションおよび/もしくは抑揚を付けてもしくは付けずに、発音されるときに単語を強調させるなどして再生すること、ならびに/または
vi. 文をフレーズに分けることを含む、システム、
c. 情報を1つまたは複数の形式で出力するためのシステムであって、
i. ローカルプリンタから印刷するためのプリントドライバおよびプリンタ自体、
ii. (異なる形式を必要とする場合がある)オンデマンド印刷(POD)のためのもしくは版(print run)のための本としてファイルをフォーマットするためのフォーマッタ、
iii. 物理的な書籍を制作するためのPOD施設もしくは印刷所のための本としてフォーマットされた情報のストレージ、
iv. HTML文書を画面上に表示するためのディスプレイ、
v. 読者によって好まれる形式(たとえば、フォントサイズ、文書が電子的に閲覧される場合のその他の文書への埋め込みリンクなど)のPDF文書のファイル、ならびに/または
vi. ローカルメディアおよび/またはリモートファイルストレージ上を含む、文書を記憶させた不揮発性メモリを含む場合がある、システム、ならびに
d. 読みおよび学習結果を、
i. ユーザをグループにカテゴリ分けすること、
ii. 各ユーザグループに関して、情報の混合および表示を最適化すること、ならびに/または
iii. 特定のユーザの使用を記録し、そのユーザをテストし、ユーザをグループにカテゴリ分けし、上述のようにインタラクティブに最適化され得る最適な形式を予測するためにグループおよび個人の使用およびテストデータを使用することによって最適化するためのシステム。
【0102】
このシステムは、特定のユーザのために形式を個別化するように拡張され得る。
【0103】
合成文字(音文字を伴う綴り文字)の間の同形関係(isomorphic relationship)と、それに加えて、あらゆる単語をマークアップする本明細書に記載の「Fonetic Alphabet」の能力とによって可能にされる練習および学習ツールが開発されており、これらのツールは、出版システムによって作成された文書の読者が自身の読むスキル、理解力、および話し言葉のスキルを向上させるのを助けるために単語のマークアップを組み込んで構築されている。これらのツールは、下で説明され、読者が以下のことを素早く行うのを助けるためのツールを含む。
a. 読者の現在の状況に最も適したマークアップのバージョンを選択する。たとえば、読者は、英語、IPA、および読者の母語のアルファベットからのレターでの英語の綴りの単語のマークアップを選択してよい、
b. 新しい単語をデコードする、
c. 新しい単語のサイトワード認識を発達させる、
d. 語彙を学習する、
e. 聴覚弁別および発音を改善する、ならびに/または
f. その他の用途は、本明細書において説明される。
【0104】
うまくいくためには、単語マークアップシステムが、
a. 学習が完全に最小化され、したがって、効率的であるように、読者にとって直観的である、
b. すべての英単語がマークアップされ得るように包括的である、ならびに/あるいは
c. 書かれた単語の音を正確にデコードするために読者が知る必要があるあらゆることを、明示的におよび曖昧さなく表示し、
i. すべての英語の音素が、マークアップにおいて明示的および一意に表され、
ii. すべての強勢のある音節が明示的に印を付けられ(「contract」のような単語は、第1音節もしくは第2音節が強勢を置かれる場合、異なる意味を持つので、これは重要である場合がある)、および/または
iii. 有声のレターおよび二重音字が印を付けられる(たとえば、二重音字「th」は、有声になり得る、つまり、単語「the」の場合のように喉頭が関与しているが、単語「with」では「th」という二重音字は関与しておらず、有声のレターもしくは二重音字を示すためにスピーカアイコンが使用され得る)ことを要求することを必要とする場合がある。
【0105】
単語が出す音を明示的に、厳密に、および曖昧さなく定義する能力、言語のすべての単語を明示的に、厳密に、および曖昧さなくマークアップする能力、ならびにたとえ単語中の文字がその通常の音以外の音を出すとしても、綴りを変えることなく、その文字の音を明示的に、厳密に、および曖昧さなく表す能力は、文書の理解力を高めるために、読者のグループおよび個々の読者のために文書が最適化されることを可能にする場合があるヒューリスティックなコンピュータシステムおよびアーキテクチャを一緒に可能にし、一部の読者が自身の理解力を制限する問題を克服することを支援することができることが、本明細書において下で説明される。システムのヒューリスティックな能力と、システムを駆動するアルゴリズムとは、学習システムを反復的に改善する可能性がある。
【0106】
既存の単語マークアップシステムの問題を克服し、発音に即した単語マークアップシステムを直観的なものにするために、特定の単語において文字がどのような音を出すかを読者に知らせるために学習される必要がある新しい記号を割り振るのではなく、その代わりに、本開示においては、読者に知られている特定の音を表す記号が使用される。知られている音を持つ記号は、読者に知られているアルファベットの文字である。単語が綴られる通りの単語の文字は、綴り文字と呼ばれ、単語においてその文字が実際にどのような音を出すかを読者に知らせる追加された記号は、音文字と呼ばれる。英語の例において、音文字は、以下を含む。
a. 英字(読者が英語を母語とする話者であるか、もしくは英字の音を知っている場合)、
b. 読者がIPAを知っている場合はIPA文字、および/または
c. 各文字が英語の音素と同じ音を出す場合、読者の母語の文字。
【0107】
一部の言語においては、一部の音素が、音素を表す一意の文字を持たず、または音素が発音される方法が、明示的に示されない。すべての単語の音が明示的に、曖昧さなく、および厳密に指定され得るように、この情報を明示的に、曖昧さなく、および厳密に指定するための追加の情報が、導入されなければならない。
【0108】
たとえば、英語では、単語「too」および単語「foot」の場合のように、二重音字「oo」が2つの音を出し得る。2つのギリシャ文字の小文字のシグマの文字「σσ」が、「foot」の「oo」の音を表すために使用される。別の問題は、二重音字「th」が、単語「with」(「th」が無声である)および単語「that」(二重音字が有声である)において異なる音を出すことである。有声の二重音字は、スピーカ記号によって表される。
【0109】
新しい発音に即した形式の1つの用途は、読者が、たとえば、学術的なテキストまたは技術文書を読んでいる間に、新しい単語の音を迅速で効率的に学習することである。読者が、
a. 読者が目で見て知っている単語を素早く便利に読むことができ、元の単語の形が保たれ、音文字が、読むときに読者の気を散らさないようにフォーマットされ、
b. 新しい単語の音を効率的にデコードし得ることが可能であり、読者が新しい単語の音をデコードしたいときに、音文字がはっきりと見え、その単語において各文字が出す音を読者に明示的に知らせることが重要である場合がある。
【0110】
動物は、逃げることまたは自分を守ることができるように、危険な動物に瞬時に気付き、認識する必要がある。人間は、たとえヘビが隠れているときでも、ヘビに気付くのが得意である。人間がヘビに気付くとき、反応は瞬時である。科学者は、これを「ヘビ検出理論(Snake Detection Theory)」と呼ぶ。読みは、おそらく、ヘビを検出するためのスキルを使用する。読者は、単語の形を認識し、単語の形、音、および意味を長期記憶からほぼ瞬時に思い出させる。また、単語がどのように書かれているかは問題ではない--単語は、普通に印刷されることが可能であり、巻き型(curly type)であることが可能であり、下手に印刷されることが可能であり、またはレターが手書されることが可能であり、我々は、それでも、単語をその形によって認識することができる。偽装された単語(disguised word)を認識できることは、読者がコンピュータではなく人間であることを読者が一部のウェブサイトに証明することができる方法である。単語の形が保たれていれば、読者は、たとえ単語にマークアップが加えられても、単語の形を認識することができ、したがって、読者は、マークアップされた単語を目で見て読むことができる。
【0111】
単語を音節に分けることは、音節の音および意味が独立して教えられ得ることを意味する。最も頻繁に使用される500の音節から、およそ13,802の単語が作られ得る。医学で、用語「ectomy」は、何かを切除することを意味する。たとえば、tonsillectomyは、扁桃腺の切除であり、appendectomyは、虫垂の切除である。単語の音が単純に音節の音からデコードされ得る方法と同様の方法で、単語の意味は、単語の構成要素の意味からデコードされ得る場合が多い。これは、形態論(morphology)と呼ばれる。単語の中心部分は、語根と呼ばれる。単語の接頭辞および接尾辞をはっきりと視覚的に弁別し、単語の語根をはっきりと特定することができることが重要である。接頭辞および接尾辞は、付加的な意味を与えるために語根に追加される。さらに、生徒が語根に付加された接頭辞および接尾辞から構成される複合語を理解するためには、接頭辞、接尾辞、および語根の意味が、知られていなければならない。
【0112】
想起(recall)vs認識: 単語の認識は、単語の想起よりも達成しやすい。読みには認識が必要とされ--あなたは、単語を見るとき、それを認識する--、記憶の手がかり(memory cue)がないとき、話すことおよび/または書くことには想起が必要とされる。読む練習は、想起を向上させる。
【0113】
一部の医師および医学者は、医学語彙の習得を、医者になる際の最も時間のかかるタスクのうちの1つと考える。多くの医学用語は、発音に即しておらず、つまり、それらが聞こえる通りに綴られず、そのことが、語彙の習得を著しく複雑にする。多くのメディカルスクールは、必要とされる語彙を学習する最良の方法に関する指導をせず、医学語彙の学習を生徒に任せる。
【0114】
文中の単語を意味のあるグループとして表示することは、複雑な文書を理解するための時間、労力、および目の動きを減らし、理解の結果を向上させる可能性がある。
【0115】
エンコード
一部の言語においては、言語のアルファベットのあらゆるレターが、1つの音しか出さない。42~45の音素(定義による)が存在し、26のレターだけが存在する英語のような一部の言語においては、一部のレターが、2つ以上の音を出す。用語「レターの通常の音」は、レターが出す最も普通の音を意味する。英語の26のレターの通常の音が、付録BのTable A(表2)に示されている。付録BのTable B(表3)は、それら自体の名前の音を出す英語の母音の音を列挙する。付録BのTable C(表4)は、英語の二重音字の音を列挙する。英語で、レターAは、「at」における音と、「ape」における音とを出し得る。Aが「ape」における音を出すとき、それは、「それ自体の名前の音を出すa」と説明される。3つの表(付録BのTable A(表2)、Table B(表3)、およびTable C(表4))の左の列の文字は、英語のあらゆる単語の音を高い精度で発音通りにスペルアウトするために使用され得る。
【0116】
一部の言語学者は、単語「about」における文字「a」の音のように聞こえるシュワ(schwa)のような文字を導入した。それは、単語「up」において文字「u」が出す音に似た音を持つ。システムを簡単にするため、上記のシュワのような細かい区別は採用されなかった。
【0117】
発音に即した単語マークアップシステムを直観的なものにするために、特定の単語において文字がどのような音を出すかを読者に知らせるために学習される必要がある新しい記号を割り振るのではなく、その代わりに、本開示においては、読者に知られている特定の音を表す記号が使用される。知られている音を持つ記号は、読者に知られているアルファベットの文字である。英語の例において、文字は、以下を含む。
a. 英字(読者が英語を母語とする話者であるか、もしくは英字の音を知っている場合)、
b. 読者がIPAを知っている場合はIPA文字、または
c. 各文字が英語の音素と同じ音を出す場合、読者の母語の文字。
【0118】
英語では、多くの単語が、綴られる通りに発音されず、一部の文字が、その他の文字の音を出す--これらは、基本アルファベットの文字によって曖昧さなく特定されない音を持つと説明される場合がある。英単語「any」を例に取る。単語「any」を発音することができるためには、レター「a」がレター「e」の通常の音として発音され、レター「n」がその通常の音を出し、レター「y」がレター「e」がそれ自体の名前の音を出すときの音を出すことを読者が知っている必要がある。文字が異なる音を出し得るので、読者は、英単語の各文字がどのように発音されるかを知っている必要がある。3つの表の左の列の英字は、ただ1つの音を出し、英単語において関連する文字が音を出すことを読者に一意に示すために使用される。
【0119】
したがって、英単語「any」を認識するための情報は、「any」の文字「a」がレター「e」の通常の音を出し、「n」がその通常の音を出し、「y」がそれ自体の名前の音を出す文字「E」の音を出すことを示す3つの文字ペア(a:e)(n:n)(y:E)である。この文字および発音の情報は、英単語の文字を第1の文字(本明細書においては「綴られる文字(spelled character)」もしくは「綴り文字」、または「基本文字」と呼ばれる)および第1の文字が実際に出す音を表す第2の文字(本明細書においては「音文字」と呼ばれる)として表す文字ペアから構成された新規の複合的な発音に即したアルファベットを形成する。用語「Fonetic Alphabet」は、本明細書において、文字ペアから構成された、すなわち、文字ペアを含む(including)/含む(comprising)任意の複合的なアルファベットを指す。用語「Fonetic English」は、本明細書においては通常、綴られる文字および音文字が英字である複合的なアルファベットを指すが、場合によっては、Fonetic Englishは、Fonetic EnglishとFonetic Alphabetとの両方を意味するために使用される。Fonetic Englishの文字の例が、付録Cの表に示されており、この表は、(後述される)合成文字を使用してマークアップされた例示的な単語を含み、合成文字が単語をマークアップするためにまだ使用されていない例示的な単語は含まない。
【0120】
音節の区切りおよび無音の文字を含むこの情報が適切に表示された状態で、英語のレターおよび二重音字の通常の音の知識がある人は、ほとんどまたはまったく学習することなく、英語で書かれた単語内の任意の文字の音を直観的に正確にデコードすることができる。
【0121】
複合的なアルファベットは、その他のアルファベットの音文字を追加することによってさらに拡張され得る。たとえば、日本語のアルファベットおよび英語のアルファベットは、いくつかの共通の音素を共有する。日本人学習者が英語のアルファベットを学習するのを支援するために、英語の音文字が、英語の音素と同じ音を出す日本語の文字によって置き換えられる可能性がある。国際音声記号(IPA)には、あらゆる英語の音素の音を出す文字(または文字の組合せ)が存在し、したがって、1つのIPA文字または複数のIPA文字が、Fonetic Englishのアルファベットの音文字として使用される可能性があり、これは、IPAを知っており、英字の音を学習したい人の助けとなる場合がある。
【0122】
本明細書において開示されるのは、発音に即していない英単語をどのように発音すべきかについてのデータをFonetic Alphabet形式で捕捉し、特に、英単語をどのように発音すべきかについてのデータを(本明細書においてはFonetic English形式と呼ばれる)英語の綴り文字および英語の音文字を使用して捕捉するための方法、ならびにFonetic English形式の単語を最適な方法で表示するために使用され得る様々な表示規則である。
【0123】
Fonetic Alphabetおよび特にFonetic English形式で単語を表示する原則は、その単語が目で見て認識され得るように元の単語の綴りおよび形をそのまま維持し、単語において文字が出す音を読者に伝えるための情報を追加し、冗長な情報を追加しないことである。たとえば、英単語の文字がその通常の音を出す場合、音文字が必要とされないので、その文字は、音文字を伴わない綴られる文字として表示され得る。音文字を伴う綴られる文字を表示する1つの方法は、綴られる文字をより小さな上付きの文字とすることである。しかし、上付き文字、下付き文字、音文字を完全にまたは部分的に綴られる文字の中に配置すること、およびそれらの組合せを含む、音文字を表示するその他の方法があり得る。
【0124】
英語のアルファベットは、すべての英語の音素、または特定の音素によって出される音の完全な表現ではない。
【0125】
現在、母音の通常の音(「at」の場合の/a/)と、それ自体の名前の音を出す母韻(「ape」の場合の/a/)とを区別する方法はない。Fonetic Englishにおいて、音文字の母韻としての大文字は、それ自体の名前の音を出し、音文字としての小文字の母音は、その通常の音を出す。
【0126】
英語には、同じ音である「foot」のooの音または「put」の音uを一意に出す文字はない。Fonetic Englishは、「foot」のooの音または「put」の音uを表すために新しい二重音字σσを導入する。「too」のooを「foot」のooと区別するために、異なるフォントのooを使用して実験が行われた。最も認識しやすいのは、ギリシャ文字の小文字のシグマを使用することであった。
【0127】
さらに、英語には、単語「with」の無声のthまたは有声の単語「them」のthの違いを表示する文字はない。小さなスピーカ記号が、有声の「th」を示すために使用される。これは、音を変えないが、音の出され方を変える。
【0128】
Fonetic Englishのために必要とされる合成文字を作成するために、必要とされるFonetic Englishの文字を効率的に作成するために開発されたシステムを使用して、不明瞭なUnicode文字(obscure Unicode character)が選択され、編集される。
【0129】
無音の文字は、その他の文字と異なって表示されない。
【0130】
英語では音節の区切りが印を付けられず、あいまいな発音につながる。Fonetic Englishでは、音節が、強勢のある音節を示す塗りつぶされた音節マークと、強勢のない音節を示す塗りつぶされていない音節マークとで印を付けられる。
【0131】
その他の技術を使用して、たとえば、WO 2012/071630 A1(ACCESSIBLE PUBLISHING SYSTEMS PTY LTD)、2012年6月7日(本明細書において「Readable English」と呼ばれる)に記載されているグリフでマークアップされた単語の発音は、強勢のある音節が印を付けられていないので曖昧である。Readable Englishには1つの音節の印のみ存在する一方、Fonetic Englishには2つある。単語CONtract(大文字の音節は強勢を置かれる)はconTRACTと異なる意味を持つので、これは重要である。Readable Englishには、単語「contract」の2つの異なるバージョンをマークアップする方法がない。
【0132】
上述の特徴により、Fonetic Englishのアルファベットは、綴り文字に関係なく、読者に知られている音文字を使用して、あらゆる英語の音素を明示的におよび曖昧さなく表すことができる。これは、英語または別の言語の任意の単語がFonetic EnglishまたはFonetic Alphabetでマークアップされ得ることを意味する。例外はない。Fonetic Englishは、デカルト座標が3次元空間を定義するように、英語の音素、音節、および単語の音を明示的に、曖昧さなく、正確および厳密に定義する単語および音素の座標と考えられ得る。
【0133】
これをReadable Englishと対比する: 単語「one」は、WO 2012/071630 A1 (Appendix B)の付録Bに見られ得るようにReadable Englishではマークアップされ得ず、したがって、Readable English用の翻訳データベースを自動生成するならば、データベース生成システムは、あらゆる単語を調べて、それが(「one[wun]」のような)例外であるかどうかを確認し、例外の単語の音を異なるように示す必要があり、これは、ユーザインターフェースおよび処理速度に影響を与える--対照的に、Fonetic Alphabetでは、すべての音素を音文字によって表されることが可能であり、任意の音文字が綴り文字に追加され得るので、例外の単語は必要ない。
【0134】
さらに、F.E.の音文字および綴り文字は、Readable Englishのグリフ/非文字記号とは異なり、学習される必要がないので、F.E.でマークアップされた単語は、単語の音を明示的に、曖昧さなく、正確に記述し、したがって、マークアップされた単語は、音を表すために表示される必要があることがすべてである。
【0135】
さらに、例外がなく、F.E.の単語がその単語の音を表すので、必要とされる動作がより少なく、ユーザインターフェースの使用がより簡単である。たとえば、本明細書において説明されるインタラクティブなコンピューティングシステムが、ユーザ/学習者のために単語「one」を表示するとき、画面は、Readable English(WO 2012/071630 A1、付録B参照)に関しては、「one[wun]」を表示するが、F.E.を使用する同等のシステムは、付録Cに示されるように、「o」の上の「wu」という音文字および無音の「e」を用いて単語「one」を表示し(付録C、3ページ5行目の「o says wu」参照(誤って「o says w」と記載している))、同様にReadable Englishのその他の例外に関して、F.E.ではすべての単語を示す。
【0136】
加えて、F.E.の単語は、Readable Englishの例外の単語よりも画面スペースを取らず、ページの構造が影響を受けない(R.E.では、[]内の例外が追加されるので、単語の長さが元のテキストと異なるため)。
【0137】
さらに、F.E.では文字セットがUnicodeフォントの適応に基づいて定義され得るので、フォントデータベースのサイズは同じである。
【0138】
その上、本明細書において説明されるインタラクティブなコンピューティングシステムが、たとえば、本明細書において説明されるテキストトゥスピーチシステムによって単語を音読するとき、Readable Englishの「one[wun]」--これは、/c/、/ca/、および/cat/のように発音される単語「cat」のように発音され得ない--などのすべての例外の単語は、第2の発音システム、またはおそらくユーザにとって直観的でないはるかに複雑な発音システムを必要とし、「wun」の発音を教えることは、--F.E.を使用してマークアップされた「one」の同等の例(付録C、3ページ5行目の「o says wu」参照)とは対照的に--サイトワード認識を教えない。
【0139】
さらに、F.E.を使用するシステムは、以下で説明されるように、読者が音を既に知っているレターを使用して、単語が出す音について読者が知る必要があるあらゆることを明示的におよび曖昧さなく表示することができる。
【0140】
加えて、F.E.を使用するシステムは、読者が何も学習する必要なしに、単語において文字がどのような音を出すかを読者に知らせることができる。音文字は、Fonetic EnglishおよびFonetic Alphabetに新規なものである。新規性の度合いは大きい。ローマ字の上のグリフは、何百年もの間、ヨーロッパ人によって使用されてきた。単語において綴り文字が通常の音を出さないときにその綴り文字の音を示すために、音が読者に知られている文字だけを使用する言語は存在しない。Fonetic EnglishおよびFonetic Alphabetでは、単語においてその通常の音以外の音を持つ各綴り文字が、その単語においてその綴り文字がどのような音を出すかを読者に曖昧さなく知らせるための音文字を有する。文字の音が何であるかを読者に知らせるただ1つの方法、すなわち、綴り文字の上の音文字が存在する。1対1の関係または同形関係が存在する。読者は、アルファベットの音を知っており、したがって、何も学習する必要なく、音文字がどのような音を出すか分かる。
【0141】
Readable Englishを使用するシステムにおいては、その通常の音を出さない単語の音を示すために、レターではなく記号が使用される。これらのグリフの一部は、フランス語のcセディーユ(c)およびeアキュート(e')、ならびにドイツ語のoウムラウトo^など、ヨーロッパ言語から借用された(23、24ページ)。その他のグリフの多くは、考案された。これらのグリフの音は、学習される必要がある。
【0142】
しかし、グリフの使用は一貫していない場合がある(WO 2012/071630 A1参照)。
a. 23ページにおいて、「ape」の場合と同様のレター「a」の音/ay/は、2つの異なる方法、すなわち、a-およびe'で表されることが可能であり、
b. 23ページにおいて、上にドットの付いたa、e、o、u、およびyは、「it」の場合と同様の音/i/を表し、--24ページにおいて、上にドットの付いたgは、「jug」の場合と同様の/j/の音を出し、
c. 付録Bにおいて、グリフが2つ以上の音を出すことは明らかであり、すなわち、a-が「ape」の場合と同様の音/ay/を出し、e-が「be」の場合と同様の音/ee/を出し、o-が「go」の場合と同様の音/oh/を出す。
【0143】
読者は、アルファベットの文字の音を既に知っているので、数分または数時間でFonetic Englishまたはその他のFonetic Alphabetを学習することができる。グリフを学習することは、多くの場合、数週間を必要とする、時間がかかるタスクである。
【0144】
Fonetic Englishまたはその他のFonetic Alphabetを使用することは、本明細書において説明される学習/出版ソフトウェアアルゴリズム/自動プロセスの複雑さを減らす。Fonetic EnglishまたはFonetic Alphabetのように、言語のすべての単語をマークアップすることができ、グリフとレターの音との間に同形関係を有していれば、洗練されたアルゴリズムを開発することは、多対多の関係および複数の例外を有するマークアップシステムでこれらの関係を構築しようとするよりもはるかに容易である。
【0145】
綴り文字および音文字を変更せずに表示し、単語の形を標準英語と同じままにすることによって、(たとえば、学術文書の)読者は、Fonetic Englishへとマークアップされた文書を標準英語であるかのように読む可能性があるが、新しい単語に出くわす場合、その単語を発音し、サイトワード認識を迅速に発達させることができる。速読のためには、英単語の形が保たれることが重要である。読者による単語の音の簡単で正確なデコードのために、単語の音についてのすべての情報が明示的におよび曖昧さなく表示されることが、新しい単語を学習するために重要である。
【0146】
Readable Englishが英語に制限される一方、Fonetic Englishによって例示される手法は、複数の外国語ペアのために使用され得る。
【0147】
認知負荷理論の創始者であるJohn Sweller教授は、「私は、数年前、多くの学者(その多くはより良い教授法を見つけることに注力していた)、教師、生徒、および一般の人々と同じように、Readable Englishに触れた。Readable Englishは、元のアルファベットを学習した人たちが追加の訓練なしに新しいアルファベットを読むことをなおも可能にしながら、ほぼ完全に発音に即した英語のアルファベットを我々に提供するタスクを達成した。それは大きな進歩だったが、生徒たちがその新しいアルファベットを学習しなければならないという犠牲を払ってなされた進歩だった。私は、次のハードルである、生徒による追加の学習を必要としない新しいアルファベットの構築が不可能だと考えていた。私にとって、Fonetic Englishは、目にすると予想していない発見だった。私は、Readable EnglishからFonetic Englishに飛躍しなかったし、数千人にのぼるであろうReadable Englishに触れた人々のいずれもしなかった。私の考えでは、Fonetic Englishは斬新だ」と述べている。
【0148】
Jon Sweller教授は、「私は、学習および理解の根底にあるプロセスである、新しい情報をワーキングメモリから長期記憶に効率的に転送する方法に焦点を当てた、実験的に開発された理論である認知負荷理論(CLT)を創始した。ワーキングメモリは、新しい情報の3~4個以下の要素を一度に処理することができ、リフレッシュされることが必要になるまでの20秒以内の間、その情報を保持することができる。これらの限界は、ワーキングメモリが、長期記憶に以前に記憶されたよく知っている情報を扱うときにはなくなる。生徒がCLTの原則に従った指導を受けるとき、学習結果は統計的に有意に改善される。Fonetic Englishは、CLTの原則を使用して指導を構築している」と書いている。すべての新しい情報を一箇所に表示させることは、学習者が情報をリフレッシュするために学習を中断する必要なしに、情報がリフレッシュされることを可能にする。学習は、ワーキングメモリ内の新しい情報を最小化するために、学習タスクをより小さな連続した学習タスクに分けることによって支援され得る。ワーキングメモリにあまりに多くの情報を詰め込み過ぎることは、学習を止める。
【0149】
本明細書において開示されるのは、テキスト文書を変換/エンコードする方法の特定の事例であり、方法は、
a. 複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
b. ソーステキストを、
i. 1つまたは複数の文字(「綴られる文字」)であって、その文字の通常の音以外の音を持つものとして特定される、1つまたは複数の文字(「綴られる文字」)(すなわち、それらの音は、基本アルファベットの文字によって曖昧さなく指定されない)を有するソーステキストの各単語に関して(すなわち、単語、および各単語に関して、発音に即した単語としてマークアップされた単語のデータベース--翻訳データベース--の1単語ずつの検索において)、それぞれが綴られる文字および(上付き文字によって表され得る)音文字を含むそれぞれの合成文字(合成または組み合わされた文字は、綴られる文字と、綴られる文字とは異なる音文字との両方を含み、新しい文字として一緒に組み合わされる文字である)を持つ代替単語を使用することであって、音文字が、
1. (レターの音が読者に既に知られている)基本アルファベットおよび/またはそれぞれが基本アルファベットの音を表す1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり(そして、各音文字は、その音文字がどの綴られる文字の上にあるかに関係なく基本アルファベットの同じ音を表す--たとえば、上付き文字「i」は、英語の以下の綴られる文字が両方とも同じ音/音素を有する、すなわち、単語「English」の「e」が音/i/を出し、「o」も単語「women」において音/i/を出すので、それらの綴られる文字の両方とともに使用され得る)、
2. 各合成文字の綴られる文字のために選択された基本フォント/文字サイズよりも小さい選択された副次的フォント/文字サイズを有し、
3. 各合成文字の綴られる文字および音文字が1つの視野内にあるように(これは、読者が両方の文字を見るために目を動かさなくてよいことを意味する)、綴られる文字が人間が読むことができるままであるように、合成文字に追加される、使用することによってエンコードするステップと、
c. エンコードされたテキストが、綴られる文字のうちのどれが(その文字の)通常の音以外の音を持つかを視覚的に示す合成文字を持つソーステキストからの複数の単語を含むように、およびエンコードされたテキストの単語の形がソーステキストのそれぞれの単語の形と実質的に同じであるように、エンコードされたテキストを人間が読むことができる形態/形式(電子ディスプレイおよび/または印刷されたページを含む)で出力するステップとを含む。
【0150】
英語がソーステキストの言語(およびしたがって、本明細書において「Fonetic English」と呼ばれる場合がある基本言語)であるとき、基本アルファベットの人間が読むことができる文字は、a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p、q、r、s、t、u、v、w、x、y、およびzを含む。
【0151】
計算を簡単にするため、あらゆる合成文字は、2つの構成要素、すなわち、綴り文字と、音文字を指す番号とを持つ一意のIDを与えられる。例において、a0は、無音のaであり、a1は、その通常の音を出し、a2は、それ自体の名前の音を出し、a3、a4、a5などは、すべて、異なるアルファベットの文字を含む可能性がある異なる音文字を伴う綴られる文字aを指す。加えて、付録Dに示されるように、a1iは、a1によって表される記号がイタリック体で提示されることを示し、a1bは、太字であり、a1cは、太字イタリック体である。
【0152】
例示的な合成文字の名前が、付録Cに記載されている。合成文字(a:o)は、/a/ says /o/と呼ばれ、/a/は、単語「at」における音を出し、/o/は、単語「off」における音を出す。付録Cの表をより見やすくするため、/a/ says /o/は、「a says o」と表示されている。さらに、合成文字の名前は、それが韻を踏む単語または音に関連して指定され得る。たとえば、単語「coin」において、音/o/は、単語「boy」の音である/oy/と韻を踏む。人は、英語の音素の音を知っている場合、各合成文字の名前が直観的に分かる。
【0153】
音文字の(フォント)サイズおよび綴られる文字の(フォント)サイズは、少なくとも、音文字の(フォント)サイズが綴られる文字(フォント)サイズより小さく、たとえば、少なくとも2ポイント小さいような関係に固定されるが、絶対的な(フォント)サイズは、たとえば、物理的な本のための選択された印刷フォントサイズに基づいて、ならびに/または、たとえば、合成文字およびマークアップされた発音に即した単語がTrueType(TM)フォントを使用して定義されるようにして、電子書籍のためのユーザによって選択されたデジタルフォントサイズに基づいて変わり得る。
【0154】
方法は、物理的な本を印刷するステップ、および/あるいは電子書籍を非一時的コンピュータ可読媒体、たとえば、CD ROMもしくはメモリスティック、ハードドライブ、またはクラウドサーバに記憶するステップを含む場合がある。
【0155】
特定のプロセスを使用して自動的に単語をマークアップすることを含むテキストのエンコードは、単語レベルで実行されることが可能であり、たとえば、1つの母音のみ存在する場合、それは1音節の単語であり、音節の区切りがなく、単語がIPAに翻訳されており、英単語と同じ数のIPAの音素(英語の音素または音を表す文字または二重音字)が存在する場合、IPAには無音の文字はない。
【0156】
上付きの文字を弁別することが困難な可能性がある場合は、上付き文字を容易に認識可能および区別可能にするために、異なるフォントが使用され得る。たとえば、2つの上付き文字Uおよびuがある場合、それらが同じフォントであったならば、唯一の違いが上付き文字のサイズであるので、どちらがどちらであるかを認識するのは難しくなり得るであろう。たとえば、「a」の上にあるカールした「u」は、/up/の場合と同様の音を出す小さな「u」を意味し、より大きなまっすぐな「U」は、音/you/を出し、すなわち、その名前の音を出す。小文字の母音はカールしていてより小さく、大文字の母音はよりまっすぐでより大きいので、文字が見やすい。読者は、小さな大文字でさえも認識することに慣れており、上付きの文字のフォントが異なって見えるので、大文字と小さな小文字を区別することができる。Oおよびoのような一部の上付き文字は、それらの丸みおよびそれらの配置によって区別されることが可能であり、すなわち、大文字のOが、より楕円形であることが可能であり、Aのやや横に位置するときに、小文字のoは、丸みを帯びることが可能であり、大文字のAの中央に位置する。
【0157】
(上付き文字として表示され得る)音文字は、少なくとも6~8ポイントのサイズであるように選択される。綴り文字は、音文字よりも少なくとも2ポイント大きいように選択される。綴られる文字がより大きいことに加えて、綴られる文字は、(現在、組版された文書において単語が表示されているように)横に一直線に並んでおり、上付き文字は、表示される音文字があるときにのみ発生し、その配置は、綴られる文字および音文字によって変わる。
【0158】
英字の音を学習する日本語が流暢な読者は、上に日本語の文字(すなわち、日本語の音文字)が付いた文字を--最初のアルファベット英語の一部として--選択してよく、したがって、日本語の文字と同じである英字の音を学習する。これは、読者がIPAを知っていたならば、一部の文字に関しては英語から日本語へのマッピング(すなわち、日本語の音文字による)があり、その他の文字に関しては日本語からIPA(すなわち、IPAの音文字)へのマッピングがあるように選択されるであろう。
【0159】
たとえば、英語および英語の音素を知っている人に関して、システムは、発音通りにマークアップされた英単語を読むための第2のアルファベットを必要としない--綴り文字および音文字が、同じ基本アルファベットからもたらされる。第2のアルファベットの使用は、基本アルファベットと第2のアルファベットとの間の音・音節の関連付けを教えるためである--たとえば、日本語話者に、特定の英字が、英字(基本アルファベット)に追加された日本語の文字(第2アルファベット)の音を出すことを教える。
【0160】
予め選択された文字セットが、以下を含む場合がある。
a. (たとえば、日本語の音文字およびIPAの音文字を用いて
図4の表に示されるように)両方のアルファベットに存在する共通の音素に関して、すなわち、副次的アルファベットの文字を使用して定義/発音され得る主たるアルファベットの綴り文字に関して、基本アルファベット(本明細書においては「主たるアルファベット」とも呼ばれる)で単語を綴ることに関連する副次的アルファベットの複数の音文字、
b. 副次的アルファベットに存在しない音素に関して、主たるアルファベットの音素に関連する主たるアルファベットの複数の音文字、ならびに/または
c. 副次的アルファベットに存在しない音素に関して、IPAの音素に関連する主たるアルファベットの複数の音文字。(したがって、英語にあって日本語にない音が存在する場合、方法は、英字を使用するか、もしくはIPA文字を使用することができる。したがって、予め選択された文字セットは、主たるアルファベット(英語)の綴り文字と、主たるアルファベット(英語)、IPA、および副次的アルファベットの音文字との組合せであってよい。英語話者が、たとえば、イタリア語もしくはスペイン語を学習している場合、スペイン語もしくはイタリア語の音は、英語の音文字を使用して、英語話者にとってそれなりの精度で綴られ得る。スペイン語の「LL」は、音/y/を出し、イタリア語において、「cello」の場合と同様の「ce」は、音/che/を出す。システムおよび方法は、英語話者に外国語の単語によって出されるおおよその音を伝える音文字を伴う、ローマ字を使用する外国語のアルファベットを含み得る。)
【0161】
読者は、1つまたは複数の文字である可能性がある音文字(上付き文字)によって表される通常の音に従って合成文字を発音し、音文字(上付き文字)は、どの綴り文字に追加されたかに関係なく同じ音を表す。
【0162】
音文字は、任意で、重なり合う組合せ、たとえば、「ae」として組版される文字のセットであってよい二重字(diphthong)、たとえば、「th」、「oy」、「ow」、「ch」、「sh」などを含み得る。
【0163】
上の例においては、音文字(上付き文字)を伴う綴られる文字、およびこれらの文字がこれらの文字の通常の音を出すときのローマ字の綴り文字である、文字ペアを表示する合成文字は、1つまたは複数のアルファベットからの文字、たとえば、英語、IPA、その他の言語の文字、ならびにローマ字/両方ともローマ字を使用する異なる主たるアルファベットおよび副次的アルファベットのローマ字の文字の組合せで新しいアルファベットを効果的に定義する。例は、付録Cに記載されているFonetic Englishのアルファベットである。
【0164】
方法は、文字の音を、読者によって既に理解されている別の文字を用いて示す。音素セットは、副次的アルファベットの話者に主たるアルファベットを教えるのに適切であるような副次的アルファベットに基づいてよい。外国語話者が英語を学習している場合、英語を(基本アルファベットを定義する)主たる言語とし、外国語を(第2のアルファベットを定義する)副次的言語とすることによって、音/文字の関連付けが教えられ得る。音/文字の関連付けが教えられ/学習されると、外国語話者は、英字を主たるアルファベットと副次的アルファベットとの両方として使用することができ、または英語を主たるアルファベットとし、外国語の文字を副次的アルファベットとして使用し続ける可能性がある。電子的形態では、読者に最適なカスタムアルファベットが、読者によって、またはシステムによって収集された読者の使用情報に基づいてAIシステムによって選択され得る。ローカルで印刷される文書は、カスタマイズされたアルファベットを持ち得る。版が高い費用効率で生産されることを要求する印刷された形態の製本された本では、費用効率の高いソリューションは、英語を主たるアルファベットと副次的アルファベットとの両方とすることである。しかし、製本された本のための個別化された印刷ソリューションが、オンデマンド印刷を利用することによって提供され得る。
【0165】
音素セットは、上付き音文字に、基本アルファベットの複数の各ローマ字を含む場合があり、複数の中のこれらの文字は、太字フォント、大文字フォント、筆記体フォント、および/またはイタリック体フォントを含むフォントによって互いに視覚的に区別される。たとえば、母音は、2つの音(たとえば、/at/の場合と同様の通常の音/a/、および/day/の場合と同様の/ay/)を持つ場合があり、したがって、/a/が、上付き文字「a」として示される場合があり、/ay/が、「A」として示される場合がある。たとえば、文字「u」および「U」を区別するために、方法およびシステムは、大文字の文字が直立した大文字であり、小文字の文字が視覚的に異なる表現(たとえば、より曲線的な表現)であるようにして異なるフォントを使用し、すなわち、異なるフォントを使用して、どちらが大文字の母韻であるか、およびどちらかが小文字の母韻であるかを明瞭にする。付録BのTable B(表3)を参照して、英語の5つの母音が「それら自体の名前の音を出す」方法を確認されたい。
【0166】
このようにして形成された複数の合成文字は、1つの合成アルファベット(compound alphabet)または複数の合成アルファベットと呼ばれる場合があり、合成アルファベットは、読者による記号の追加学習を最小化する可能性がある方法で読者に音を視覚的に示すことによって、特定された音素を持つ単語の音を読者がデコードすることを可能にする。英語を学習している人の場合、このアルファベットは、複数の互いに異なるアルファベット、たとえば、英語、IPA、および英語以外のアルファベットからの音文字を伴う文字を含む場合がある。重要なのは、英語の単語の形が上付き文字なしおよび上付き文字ありで同じに見えること、すなわち、マークアップなしの単語の形がマークアップありの単語の形と比べて同じに見えることである。これは、サイトワード認識を効率的に発達させるために必要である。
【0167】
たとえば、英語を母語とする話者が発音に即していない英単語の音のデコードを管理するために、および英語のレターの音に習熟している外国語アルファベット話者によって、主たるアルファベットは、英語である場合があり、副次的アルファベットは、英語である場合がある。たとえば、国際音声記号(IPA)を知っている外国語話者のために、主たるアルファベットは、英語である場合があり、副次的アルファベットは、IPAである場合がある。主たるアルファベットは、英語である場合があり、副次的アルファベットは、英語以外のアルファベットである場合があり、したがって、英語以外の文字を使用して、英語以外の言語および英語で同じである音に関して、どのような音が出されているのかを読者に伝える。主たるアルファベットは、英語以外である場合があり、副次的アルファベットは、英語である場合がある。主たるアルファベットと副次的アルファベットとの両方が、英語以外であり、互いに異なる。たとえば、ヒンディー語のアルファベットの文字および日本語の音文字である場合がある。しかし、英語が国際共通語(lingua franca)になるにつれて、英語から外国語および外国語から英語により焦点が当てられている。最もありふれた形式は、英語の音文字を伴う英語である可能性がある。
【0168】
言語の音素は、音素の順序付けられたセットを使用して単語を作ることによって言語が単語の音を作るために使用する音である。アルファベット言語(alphabetic language)では、あらゆる音素が、1つまたは複数の文字によって表され得る。音素がその言語のアルファベットの文字によって表され得ない単語はない。英語を例に取る。アルファベットを綴り文字および音文字に拡張することによって、英語のあらゆる単語は、英字の文字ペアのセットによって表され得る。発音に即していない単語「colonel」を取り上げる。単語「colonel」は、文字ペアのセット、すなわち、<sbst><c:c><o:ur><l:0><o:0><unsb><n:n><e:e><l:l>として表され得る。文字ペア<l:0(ゼロ)> および <o:0 (ゼロ)>は、lおよびoが無音の文字であることを示し、これは下で説明される。
【0169】
1つまたは複数の音文字の追加は、エンコードされたテキストの単語がはっきりと見え、音文字に接触していない(たとえば、したがって、印刷された音文字のインクがその対応する綴り文字のインクから目に見える隙間を有する)ように、音文字とそれぞれの綴り文字との間に隙間/スペースを追加すること、または文字の長さの5%未満および任意で1%未満である最大の重なりを選択することを含み、すなわち、xy平面における2次元の文字の長さは、1次元のx平面への文字の射影である。
【0170】
綴り文字と上付き文字との間のスペースは、綴り文字がある単語の形がはっきりと見えることを可能にする。スペースは、主たるアルファベットの文字の上にあるとは限らず、たとえば、文字Uの下部の上にある文字Uの直立している部分の間のスペースを使用し得る。
【0171】
綴り文字(たとえば、英語の綴り文字)は、音文字(たとえば、上付き文字)よりも大きく、したがって、読者は、たとえば、
図4に示されるように、綴り文字がある単語(たとえば、ソーステキストの英単語)の形をはっきりと見ることができる。問題となる文字は、小文字のuおよび大文字のU、ならびに小文字のoおよび大文字のOである。音文字(たとえば、上付き文字)は、異なる合成文字に関して異なる位置に配置される場合があり、たとえば、小文字のoは、Aの上に来ることが可能であるが、大文字のOは、少し片側に寄ることが可能である。
【0172】
音文字(たとえば、上付き文字)は、より小さく、綴り文字と異なるように成形され、たとえば、まっすぐおよびカールしている場合があり、小文字の「o」は、丸みがあるが、大文字の「O」は、それよりも楕円形0である。「カールしたu」の場合、xy平面内の2次元のカールしたuがx平面上に投射される場合、曲線的なuは、同じ幅および高さを持つまっすぐなuの射影を5%上回る。楕円形のOでは、水平断面の幅が、垂直断面の高さより少なくとも10%小さい。
【0173】
ソーステキストの綴り文字がある単語を維持することは、サイトワード認識(単語を見て、その音および意味が即座に分かること)の発達を可能にし、促進し、サイトワード認識が発達すると、音文字は、もはや必要とされない。言い換えると、エンコードされたテキストは、音文字が追加された後でも、ソーステキストの単語がサイトワード認識によって読まれ得るようにソーステキストを維持し、したがって、読者が必要な場合に(たとえば、目で見て認識しない単語がある場合に)音文字を使用することを可能にし、同時に、読者が目で見て認識する単語を(したがって、より速く)読むことを可能にする。
図7Aは、「不思議の国のアリス」の3つの段落を示す。
図7Bに示されるように、
図7Aの単語が、エンコードされたテキスト内に(この例においては、Fonetic Englishの出力されたテキスト内に)あり、
図7Aの元のソーステキストの単語の形を維持しており、たとえば、「the」は、ソーステキストおよびエンコードされたテキストにおいて同じ形を保持しており、目で見て英単語を読むことができる人によって容易に読まれ得る。音文字の上付き文字のサイズおよび配置は、視線追跡を妨げない。たとえば、かなりのマークアップを有する「conversations」のような単語において、その単語が現れるテキストの行に沿ったサイトワード認識または視線追跡の妨げは、最小限である。(塗りつぶされた音節の区切りが表示されていないことと、一部の単語においては、音節の区切りが表示されておらず(たとえば、第2段落の単語「pleasure」)、いくつかのその他の規則からの逸脱があり、たとえば、単語「close」はFonetic Englishに翻訳されなかったことに留意されたい。)
【0174】
人間が読むことができる形態/形式の出力されたテキストは、適切にフォーマットされた印刷された文書、版で印刷されるかまたはオンデマンドで印刷され得る、本文および表紙を持つ印刷され、製本された本(すなわち、紙にインクで印刷された)、ならびに電子書籍(すなわち、PC、ラップトップ、Kindleデバイス、タブレット、またはモバイル電話を含む、コンピュータ/電子書籍リーダ画面上に表示された)を含む場合がある。
【0175】
方法は、たとえソーステキストが発音に即していない(たとえば、そのままの英語)としても、文字がその通常の音を出さないときに、音文字を追加することにより、その文字がどのような音を出すかを読者に曖昧さなく伝えることによって、発音に即したエンコードされたテキストを提供してよい。
【0176】
方法は、音節の区切りを追加するステップと、無音の文字を維持する/示すステップとをさらに含んでよい。方法は、ソーステキストの音節を特定するステップと、エンコードされたテキストの隣接する音節の間にスペース/音節の区切りを追加するステップとを含んでよい。
【0177】
無音の文字は、維持されるが、無音の文字の形を変えることなく、単語/テキスト内の無音の文字に関して一貫性のある、綴り文字との視覚的な差別化要素を使用すること、たとえば、異なるフォントの色、たとえば、黒の代わりに灰色を使用することによって、目立たなくされてよい。無音の文字を示す複数の方法があり、いくつかの例が
図8Aに示される。無音の文字を示す他の方法は、文字の輪郭、異なる色の輪郭(たとえば、灰色)、反転表示(reverse video)、異なるフォント、異なる文字サイズなどを示すことを含む。一重もしくは二重取り消し線を使用して、輪郭を使用して、異なるフォントを使用して、Xなどのウォーターマークで無音の文字を消すことによって、または音文字と同様の位置および形で無音の文字の上にxを配置して無音の文字を示すことも可能である。無音の文字を示す異なる方法および強勢のあるまたは強勢のない音節を示す異なる方法の例が、
図8Aおよび
図8Bに示される。標準中国語または日本語などの表語文字(logographic)言語の使用者は、母語がアルファベット言語である人々とは異なる無音の文字の示し方を好む可能性があり、それは、実験的に決定され得る。
【0178】
単語の始めの音節の区切りは、単語の第1音節が強勢を置かれる場合にのみ必要である。音節の区切りならびに強勢のあるおよび強勢のない音節の区切りは、様々な異なる方法で示されることが可能であり、強勢のあるおよび強勢のない音節の区切りのいくつかの例が、
図8Bに示される。
【0179】
デジタル活字では、「Em」は、eMあたりユニット数(UPM: Units Per eM)サイズと呼ばれるグリッドに細分化されるスペースである。12ポイントの活字では、eMが、12ポイントであり、eM内の文字の特定のサイズではない。たとえば、12ptのVerdanaの文字は、12ptのCalibriの文字より大きい。True TypeフォントのUPMは、2048であることが多く、これは、各eM内に2048個のグリッドの長方形があることを意味する。
【0180】
図3に示されるように、合成文字の例は、音文字と綴り文字との以下のペアから形成される場合がある。
a. 大文字の綴り文字「a」(すなわち、「A」)の上の音文字「e」、
b. 小文字の綴り文字「a」の上の音文字「e」、
c. 大文字の綴り文字「c」(すなわち、「C」)の上の音文字「s」、
d. 小文字の綴り文字「c」の上の音文字「s」、
e. 大文字の綴り文字「d」(すなわち、「D」)の上の音文字「J」、
f. 小文字の綴り文字「d」の上の音文字「J」、
g. 大文字の綴り文字「e」(すなわち、「E」)の上の音文字「A」、および
h. 小文字の綴り文字「e」の上の音文字「E」。
【0181】
図3において、左側の列は、綴り文字が大文字である合成文字を示し、右側の列では、綴り文字が小文字である。レターの周りのボックスは、eMのサイズを表し、
図3の例において、あらゆる文字の高さは、上付き文字の有無にかかわらず、すべての綴り文字に関して3700UPMである。
【0182】
EMの基底部と(ディセンダを除く)綴り文字の基底部との間の垂直方向の高さは、数字1によって表され、
図3の例においては、500UPMである。
図3の現在の例において、フォントは、綴り文字用に選択されており、綴り文字は、小文字のレターのディセンダを含め、合成フォント(compound font)で変わっていないように見え、そのため、それらは、別々に印を付けられない。したがって、数字の1および2によって表される垂直方向のスペースは、大文字であろうとまたは小文字であろうと、ディセンダまたはアセンダがあろうとなかろうと、元の綴りのフォントから変更されない。
【0183】
垂直方向の綴りレターの高さは、数字2によって表され、
図3の例においては、アセンダを持つ大文字の綴り文字および小文字の綴り文字に関して2000UPMである。
【0184】
綴り文字の最上部と音文字の基底部との間の垂直方向のスペースは、数字3によって表され、アセンダを持つ大文字の綴り文字および小文字の綴り文字に関して150UPMである(小文字のレター「d」は、500UPMの高さのアセンダを有しており、したがって、文字は、大文字のレターと同じ全体の高さを有する)。アセンダを持たない小文字の綴り文字に関して、綴り文字の最上部と音文字の基底部との間の垂直方向のスペースは、200UPMである。
【0185】
音文字の垂直方向の高さは、数字4によって表され、下で検討される母音oおよびUの特別な場合を除いて700UPMである。
【0186】
音文字の最上部とeMの最上部との間の垂直方向の距離は、数字5によって表され、アセンダを持つ大文字の綴り文字および小文字の綴り文字では、高さが、350UPMである。アセンダを持たない小文字の綴り文字では、高さは、800UPMである。
【0187】
図3の現在の例において、アセンダを持つ大文字の綴り文字および小文字の綴り文字の高さと比較した、700UPMである上付きの音文字の高さの比率は、35%であり、アセンダを持たない大文字の綴り文字および小文字の綴り文字の高さと比較した、700UPMである上付きの音文字の高さの比率は、46.6%である。
【0188】
以下を含む、標準的な音文字の上付き文字のサイズの例外が存在する。
【0189】
「ur」または「or」などの二重音字では、制限寸法(limiting dimension)は、高さではなく、二重音字の文字の幅であることが可能である。
【0190】
綴り文字の幅を少し(5%以下)大きくすることは可能であるが、それは、この量を超える増加が、文字の水平方向の離間と、ひいては単語の形とに影響を与え得るからである。
【0191】
単語の綴り文字は、縦の分離スペースで分けられる。二重音字である上付きの音文字は、単一の文字として扱われ、したがって、二重音字の音文字の間の縦の分離スペースは、必要とされない。たとえば、二重音字「oy」に関して、「o」および「y」は、湾曲した分離線を持つことによってより密接に一緒に合わせられることが可能であり、より大きな上付き文字を可能にする。
【0192】
小文字のレター「o」および大文字の「O」は、小文字の「o」を通常の上付き文字のサイズよりも大幅に小さくし、大文字の「O」を楕円形にし、それをその他の上付き文字と同じサイズに保ち、大文字の「A」のような特定の文字に関して、大文字の「O」を「A」の横に配置することによって、視覚的により容易に弁別される。小さい方の「o」は、円形で、常に綴り文字の上の真ん中に置かれるので、容易に認識され得る。同様の例外が、文字「U」に関して認められる。
【0193】
上述のように、小文字の母音は、母音の通常の音を表し、大文字の母音は、それ自体の名前の音を出す。上付き文字の母音の文字を視覚的により弁別しやすくするために、小文字の母音は、「カールした」フォントで提示される。大文字の「I」は、それを視覚的により弁別しやすくするためにセリフ体フォントで提示され得る。
【0194】
上付きの文字のサイズとのトレードオフが存在し、すなわち、上付きの音文字が大きいほど、認識することはより容易であるが、上付きの音文字が単語の形の容易な認識により影響を与える場合がある。これを克服するための戦略は、以下を含む。
【0195】
英単語に実際に出現する限られた数の綴り文字および音文字の組合せが存在し、すなわち、綴り文字「a」は、単語「watch」の場合と同様の音/o/を出すことができるが、「a」が音「t」を出す単語はまだ見つかっていない。「zh」の音を出す綴り文字「z」など、ただ1つの音文字が見つかっているとき、音文字を伴う「z」を見る読者は、それが文字ペア<z:zh>であることをすぐに学習する可能性がある。綴り文字「d」は、「dew」の場合と同様の<d:j>および「baked」の場合と同様の<d:t>という2つの文字ペアを有することが可能である。これらの場合、読者は、上付きの音文字として使用される「D」および「T」を弁別することをすぐに学習する可能性がある。ほんのわずかな量の練習で、読者は、綴りと音とを組み合わせた文字を認識し始める可能性があり、それが、より速い読みおよびより小さな上付き文字を可能にする。比較的大きな上付き文字は、人が初めてFonetic Englishに出会うとき、それらの人のために役に立つ可能性がある。
【0196】
上述のように、綴り文字に関して複数の音文字が存在する場合、たとえば、母音で、上付きの文字のサイズは、それらの形、音文字に対して相対的な上付きの音文字のフォントおよび位置によって、特定の綴り文字に関連するその他の音文字と区別することが容易であるように上付きの音文字の形を選択することによって、合成文字の認識可能性を損なうことなく小さくされ得る。
【0197】
文字のサイズは、多くの電子ディスプレイにおいて操作されることが可能であり、読者が自身の視力および読むスタイルに最も良く合うように合成文字のサイズを調整することを可能にする。オンデマンド印刷は、個人の読みやすさのための最適化のために、合成文字のサイズのスケーリングも可能にする。本のページ数が比較的少ない比較的小さな版は、中程度から良好な視力を持つ人のための低コストな印刷版を提供する場合があり、大きな印刷版は、比較的大きな活字を好む人のためにオンデマンド印刷で生産され得る。複数のFonetic Englishのフォントが、異なるサイズの音文字の上付き文字を用いて生み出され得るが、これらの追加フォントは、必要とされない可能性がある。
【0198】
読者は、上付き文字を読むことができるようにフォントのサイズを選択してよい。小さな文字は、弁別しにくく、特に、読者が初めてFonetic Englishのフォントを紹介され、読者が発音する必要がある新しい単語に遭遇するときに、読者の速度を遅くし得る。読者は、概して、単語を発音するために綴り文字と音文字との両方を視覚的に弁別する必要がある。それらの単語の視覚認識が達成されると、読者は、綴り文字だけを使用して単語を読むことができる場合がある。
【0199】
図3に示されるように、
a. 例示的な音文字は、綴り文字の大文字のサイズ--各文字の最下部から各文字の最上部まで垂直方向に測定される--の24%から36%であり、
b. 12ポイントの大文字の綴り文字は、4.2ptの上付きの音文字を伴う約22ポイントの合成文字を生じ、
c. 大文字の綴り文字は約5mmであり、上付きの音文字は約2.1mmであり、
d. 上付きの音文字は、正常な視力を持つ相当数の読者によって視覚的に弁別され得るように、少なくとも1.8mmであるべきであり、
e. 音文字のサイズは、読者によって視覚的に弁別され得るように3.7ポイント以上であるべきである。
【0200】
綴り文字および音文字の異なるサイズ、異なる音文字のフォントおよび綴り文字のフォント、ならびに綴り文字に対して相対的な音文字の異なる位置を有する同じ文字ペアに関して、様々な異なる合成文字が作成され得る。読者のために最良な合成文字が選択され得るいくつかの方法が存在し、それらの方法は、以下を含む。
【0201】
ユーザは、Fonetic Englishの合成文字のフォントオプションのうちの1つまたは複数を選択することによって、ユーザが最も読みやすいとユーザが判断するFonetic Englishの合成文字のフォントをオンラインでインタラクティブに選択することができる。
【0202】
別の選択方法は、合成文字を画面に映し出し、最も読みやすい合成文字をユーザに選択させることである。
【0203】
読者に最も良く合う合成文字を選択するさらなる方法は、異なるFonetic Englishの合成文字のフォントでテキストを提示することであり、ユーザは、そのテキストを読むことができ、そのテキストは、どのFonetic Englishの合成文字のフォントがユーザが最も速く読むことができるおよび/または最も高い理解力スコアをもたらすかを確かめるためにテストされる。
【0204】
この経験的データの収集は、機械学習システムが、読者の読む流暢さおよび理解力を向上させるためにユーザにフォントをインテリジェントに提案するように訓練されることを可能にする場合がある。
【0205】
上で説明されたように、上付きの音文字は、日本語および標準中国語などの異なるアルファベットであることが可能である。上付きの音文字が非常に複雑な場合、または2つの文字がそっくりに見える可能性がある場合には、より大きな上付き文字が必要とされる場合がある。代替的な方法は、異なるアルファベットの組合せを使用し、別の文字と同じように見える文字を、たとえば、IPAまたはローマ字によって置き換えることである。
【0206】
本明細書において説明される方法は、国際音声記号(IPA)にテキストを翻訳するときに人がするように文字を置き換えるのではなく、綴り文字に音文字を追加し、したがって、ソーステキストからの綴り文字が、エンコードされたテキストにおいて判読可能なままとなり、したがって、エンコードされたテキストは、主たるアルファベットの読者にとって少なくともソーステキストと同じくらい読みやすい(別に学習される必要があるIPAとは対照的であり、IPAで表される単語は、基本アルファベット(綴り文字)の単語とは似ても似つかない)。エンコード方法は、ソーステキストの綴りを変えないので、(このため、方法は、無音の文字を削除せず、すなわち、無音の文字は、ソーステキストの元の単語をそれらの元の形に保つために維持されるが、それらが無音の文字であることを示すために目立たなくされる)読者が単語を発音し、その単語のサイトワード認識を発達させるとき、読者は、形によって単語を認識し、その単語がエンコードされている(または「マークアップされている」)か否かにかかわらずその単語を読むことができ、言い換えると、エンコードプロセスは、元のソースの文字のいずれも削除または移動することなくソーステキストに情報を追加する。例において、ソーステキストが発音に即していない英語である場合、エンコードされたテキストにおいて単語の音を正しい順序で曖昧さなく示すことによって英語を発音に即すようにすることは、読みを教える効率的な方法を可能にする場合がある。
【0207】
単語をどのように音節に分けるべきかを学習することは、読者が新しい単語の音をデコードすることを可能にするために必要とされるだけである。新しいマークアップシステムにおいて、音節が、読者のために印を付けられる。エンコードされた単語のサイトワード認識が達成されるとき、単語の形およびその音が学習されたので、(複数の規則および例外があり教えるのが複雑である)分節法を別途教える必要はない。多くの人は、それ以上教えなくても、単に単語が音節に分けられるのを見ることによって分節法を学習し得る。重要なことは、サイトワード認識を教えることであり、すなわち、読者が目で見て単語を認識することができると、読者は、概して、いかなるマークアップもない標準英語でその単語を読むことができる。
【0208】
さらに、音文字を綴り文字に、すなわち、綴り文字の実質的に上または下に(すなわち、音文字が綴り文字とともに印刷されるときに実質的に重ならないように)追加することによって、音文字は、エンコードされたテキストにあるときに、対応する綴り文字と同じ視野内にあり、したがって、エンコードされたテキストは、基礎のテキストと同じ目の負担(すなわち、読むためにどれだけの目の動きが必要とされるか)を有する場合があり、したがって、エンコードされた文字の情報の内容が、読者の目の負担を増加させることなくより多くなり得る。読者は、綴り文字および上付き/下付きの音文字を、文字が出す音を表す合成文字名(a says o)を持つ単一の視覚的単位として見る(および認識する)ことができる。これは、読者が単語の綴り文字を認識し、また、単語を発音することができることを可能にし、サイトワード認識を効率的に発達させる。
【0209】
エンコードされたテキストにあるとき、音文字は対応する綴り文字と同じ視野内にあるので、音文字が主たるアルファベットまたは副次的アルファベットからのものであるとき、集中および/または認知負荷のレベルは、IPAのような純粋な発音に即したアルファベットのテキストを読むのに比べて最小化される場合がある。読者が文字を視覚的に弁別し、認識するために集中しなければならない場合、読者は、意味を理解するための集中力が低下する可能性がある。IPAでスペルアウトされた単語は、たとえば、英語のアルファベットで綴られた単語とは似ても似つかない。IPAの単語を発音することは、基本アルファベットでのサイトワード認識を発達させない。音文字を伴う綴り文字を提供することは、音文字の想起を助ける可能性がある。
【0210】
音文字は、エンコードされたテキストにあるとき、対応する綴り文字と同じ視野内にあるように設計されており、読者は、通常、組合せを、上付きの文字の音を出す合成文字として認識する。読者が綴り文字と音文字との許される組合せにますます慣れるにつれて、読者は、綴り文字と音文字との特定の組合せのみが存在することを知っており、読者の脳の視覚記憶部分(visual memory part)が合成文字全体に一致するので、音文字が何であるかが直感的に分かるはずである。
【0211】
方法は、ソーステキストを、
a. 基本アルファベットから形成された単語の予め選択されたセット内の複数の予め選択された単語のうちの1つと一致するソーステキストの少なくとも1つの単語(「特定された単語」)を特定することであって、特定された単語が、(各音節に等しい強勢を持つ単語を含む)予め選択されたセット内で定義された少なくとも1つの強勢のある音節および/または少なくとも1つの強勢のない音節を含み、各音節が、綴り文字のうちの1つまたは複数を含む、特定することと、
b. 各音節の前にドット/四角を追加することによって、特定された単語を置き換える/調整することであって、音節の綴り文字が、元のままであり、強勢のある音節のドット/四角が、強勢のない音節のドット/四角と視覚的に異なる、置き換える/調整することとによってエンコードするステップを含んでよい。
【0212】
ドットの直径は、実質的に最も細い文字、通常はサンセリフ体フォントのiの幅であり、単語の形を保つために幅の2倍以下である。
【0213】
方法は、強勢のある音節の前の閉じたドット(もしくは実質的に塗りつぶされたドット)、および強勢のない音節の前の開いたドット(もしくは実質的に塗りつぶされていないドット)、強勢のある音節の前のドット、および強勢のない音節の前の四角、強勢のある音節の前の開いたドット、および強勢のない音節の前の閉じたドット、または強勢のある音節の前の四角、および強勢のない音節の前のドットによって、単語の強勢を示すステップを含んでよい。四角がドットとともに使用されるとき、両方が開いている場合があり、両方が閉じている場合があり、または一方が開いている場合があり、他方が閉じている場合がある。たとえば、第1音節に強勢がある「CONTRACT」は、「[CLOSED DOT]Con[OPEN DOT]tract」とエンコードされてよく、一方、第2音節に強勢がある「CONTRACT」は、「Con[CLOSED DOT]tract」とエンコードされてよい。第1音節に強勢がある単語は第2音節に強勢がある単語とは異なる意味を持つので、どの音節が強勢を置かれるかを示すことは重要である。強勢を示す1つの方法は、塗りつぶされた点および円を持つことである。別の方法は、ドットおよび四角を持つことである。互いに異なる音節の印の任意のペアが、音節の印の間の違いを示してよい。3つのレベルの強勢、すなわち、強い強勢、中程度の強勢、および弱い強勢が存在する場合がある。閉じたドットおよび開いたドットが、サイトワード認識のために全体的な単語の形を維持しながら使用されてよい。
【0214】
「Fonetic English」(「FE」)は、本明細書においては、綴り文字および音文字が英字であるアルファベットを指す。
【0215】
図5に示されるように、方法は、インタラクティブなコンピューティングシステムのヒューマンマシンインターフェース(HMI)を介して、ソーステキストの単語(たとえば、「acknowledgement」502)を、エンコードされたテキストの対応するエンコードされた単語(たとえば、FEの「acknowledgement」504)と一緒に、および選択で、対応するIPAの単語(たとえば、IPAの「acknowledgement」506)と一緒に、自動的に生成し、ユーザに対して表示するステップを含んでよい。方法は、方法のエンコードステップを開始/実行するための入力コマンドをユーザから受け取るHMIを介したユーザインターフェースコントロール(たとえば、「翻訳」ボタン508)を提供するステップを含んでよい。Fonetic Englishは、絶対に必要なマークアップのみを使用することを目指している。たとえば、
図5においては、辞書が、文字「e」をシュワで置き換えて音節「ment」をマークアップした。シュワのない音節を、すなわち、「ment」として発音することは、英語話者は混乱させず、より単純であり、したがって、マークアップされた単語は、このシュワのマークアップをレター「e」に戻すように後処理される。
【0216】
方法は、単語-IPAペア、すなわち、主たる言語の複数の単語およびそれらの単語のIPA表現の辞書/データベースからの入力、たとえば、単語「Thoroughgoing」およびそのIPA表現「/,θ∧r.E'GEU.IN/」(または、
図5に示された単語「acknowledgement」502およびそのIPA表現「/Ek'nAl.Id3.mEnt/」506)に基づいて、英単語をFonetic English(無音の文字、音節の区切り、強勢音節、および各文字が出す音を含む)に、以下のように、自動的にエンコード/マークアップするステップを含んでよい。
a. IPA文字を音素(音)に分け、IPAの音素と同じ音を出す合成文字、たとえば、「Thoroughgoing」に関して<sbun><θ:th><∧:u><r:r><.:sbun><E:u><':sbst><g:g><EU:O><.:sbun><I:i><N:ng>--または「acknowledgement」502に関して(Ek)'(nAl).(Id3).(mEnt)を追加し、<sbun>は、単語の始めにあるために音節の区切りが示されていない強勢のない音節の区切りを意味し、または<.:sbun>は、IPAにおいて「.」によって音節の区切りが印を付けられている強勢のない音節の区切りを意味し、<':sbst>は、IPAにおいて「'」によって強勢のある音節の区切りが印を付けられている強勢のある音節の区切りを意味し、
b. 音素および強勢の印(第1音節が強勢を置かれない限り、単語は強勢のない第1音節を有する)に連番を付け、これは、IPAの各文字/二重字に関して、括弧<>内の最後の番号であり、たとえば、<sbun1><θ:th2><∧:u3><r:r4><.:sbun5><E:u6><7':sbst7><G:g8><EU:O9><.:sbun10><I:i11><N:ng12>であり、
c. 不変である、綴られる文字が出す音を示すIPA情報を追加することによって、漸次、(たとえば、付録Aに示される)IPAから複合語への翻訳表を参照することにより、IPA文字を主たる言語の文字に追加し(これは、単語がマークアップされ得る可能な方法の数を劇的に少なくする可能性がある)、
d. 文字th、r、およびngの各々は1つの英語音のみを出すので、これらの文字が最初に追加され、すなわち、文字「g」の2つのインスタンスが存在するが、1つの音素だけが音/g/を出し、したがって、文字「g」は、さらなる反復のために残され、たとえば、Thoroughgoingは、<Th:θ:th2>o<r:r:r4>oughgoi<ng:N:ng12>となり、
e. 右から左へ進むと、第1音節は、強勢があるものとして印を付けられておらず、したがって、強勢がないものとして印を付けられ、たとえば、強勢のない音節の区切りは、文字「r」の後に続き、「th」と「r」との間には1つの文字だけがあり、したがって、その文字は、音∧を持たなければならず、したがって、「Thoroughgoing」は、<sbun1><Th:θ:th2><∧:u3><r:r:r4><.:sbun5>oughgoi<ng:N:ng12>であり、
f. 右から左へ進んで、英単語の最後の音節に3つの文字「ing」がある場合、文字「i」は、音/i/を出し、その前に強勢のない音節の区切りがあり、したがって、「Thoroughgoing」は、<sbun1><Th:θ:th2><∧:u3><r:r:r4><.:sbun5>oughgo<.:sbun10><I:i11><ng:N:ng12>となり、
g. 右から左に進み続けると、次の2つの音素は、Oおよび/g/である場合があり、2つの英字は、「o」および「g」であり、したがって、IPAの音素が、これらの文字に追加されることが可能であり、したがって、<sbun1><Th:θ:th2><o:∧:u3><r:r:r4><.:sbun5>ough<g:G:g8><o:EU:O9><.:sbun10><I:i11><ng:N:ng12>であり、
h. 右から左に進み続けると、強勢のある音節の区切りが、第2の「g」の前に追加されることが可能であり、したがって、<sbun1><Th:θ:th2><o:∧:u3><r:r:r4><.:sbun5>ough<':sbst7><g:G:g8><o:EU:O9><.:sbun10><i:I:i11><ng:N:ng12>であり、
i. 音素を数えることにより、文字「ough」が1つの音、すなわち、/u/を出すことは明らかであり、文字「o」、「g」、および「h」は、無音であり、文字「u」は、その通常の音/u/を出し、したがって、<sbun1><Th:θ:th2><o:∧:u3><r:r:r4><.:sbun5><o:0><u:E:u6><g:0><h:0><':sbst7><g:G:g8><o:EU:O9><.:sbun10><i:I:i11><ng:N:ng12>である(<o:0>、<g:0>、<h:0>は、o、g、およびhが無音であることを示す)(米国式の発音は若干異なり、第6のエントリにおいて、「u」が無音であり、文字「o」が音/O/を出す。)
【0217】
自動チェックによってマークアップをチェックすることは、以下を含む。
a. IPAマークアップの中に、IPAからFE(Fonetic English)への翻訳表にない1つのIPA文字または複数のIPA文字があるかをチェックすること(英語の音素は、ときとして異なるIPA記号によって表される場合がある)。
b. Fonetic Englishへとマークアップされた綴られた単語内の文字ペアがすべて有効な文字ペアであることをチェックすること
c. 音節の区切りと一緒に、マークアップから真ん中の文字を取得することによって、マークアップされた単語からIPAが抽出されることが可能であるか。
d. 括弧<>内の最初の文字を取得することによって、英単語を抽出されることが可能であるか。
【0218】
IPAでマークアップされた単語は、以下の理由により、Fonetic Englishの標準に準拠していない可能性がある。
a. IPA辞書のマークアップに間違いが存在し得る。たとえば、1つのよく知られている辞書において、単語「acknowledge」は、/Ek'nAl.Id3/と翻訳され、これは、3つの音節の区切りを有するが、その同じ辞書の単語「acknowledgement」は、1つの音節の区切りのみ有する/Ek'nAlId3mEnt/
b. 単語をマークアップする辞書の目的が、Fonetic Englishの目的とは異なる--多くの標準的な辞書の目標は、発音を、その辞書が出版されている国において英語話者によって単語が発音される方法にできるだけ近づけることである。
【0219】
Fonetic Englishの目的には、以下を含む場合がある。
a. マークアップされた単語をできるだけ読みやすくすること。これは、単語の音についての追加の情報が、この情報を追加しないことが書かれた単語の音をデコードすることを不可能にする場合にのみ追加されることを意味する。そしてさらに、これは、話されるときに単語が認識可能であるように元の綴りがデコードされ得る場合、追加の音文字が必要とされないことを意味する。単語「real」を例に取る。IPA翻訳における単語の1つのマークアップは、文字「a」がシュワにされる「rE.ul」である。しかし、マークアップされた単語「rE.al」が、音「rE.ul」とよく似た音を出すようにデコードされ得るので、これは不必要な追加である。
b. 接頭辞、接尾辞、および語根を容易に認識可能にすること。単語「getting」は、一部の辞書において「get.ting」とマークアップされている。Fonetic Englishのマークアップは、「gett.ing」(2番目のtは無音の文字である)である。これはいくつかの利点を有し、すなわち、接尾辞「ing」が明確に区別され、それが生徒が学習する必要がある音節の数を減らし、接尾辞「ing」を明確に特定しており、語根「get」が明確に認識可能である。
c. 語根を可能な限り認識可能にするために語根のマークアップを標準化すること。単語「real」を取り上げる。以下のマークアップ、「rEal」(「e」がそれ自体の名前の音を出し、無音の「a」を持つ1音節)、「a」がシュワである「rE.ul」、および強勢のない「a」がその通常の音を出す「rE.al」が、異なる辞書に載っている。単語「reality」は、「real」の「a」が強勢を置かれ、その通常の音を出す「rE・al〇i〇tE」とマークアップされる。したがって、語根「real」の最も一貫性のあるマークアップは「rE〇al」であり、したがって、このマークアップがFonetic Englishのために選択される。
d. 読みを教えるために現在使用されている方法と一貫性がある単語のマークアップを印すこと。特定のマークアップが存在する「読みの科学(The Science of Reading)」と呼ばれる体系がある。開音節は、母音または二重母音で終わる音節である。開音節の母音は、通常、それ自体の名前の音を出し、たとえば、paperは、pA〇perと発音される。閉音節において、母音は、その通常の音を出す傾向がある。2つの有効なマークアップの選択肢がある場合、開音節および閉音節のマークアップを使用することが優先される。
【0220】
マークアップされた単語は、以下の方法のうちの1つまたは複数を使用して、プログラム的に(コンピューティングシステムで自動的に)チェックされ得る。
a. 2つ以上の辞書から、またはDARPAによって開発された単語のマークアップなどのその他のシステムからのIPAマークアップを翻訳し、翻訳を比較すること。違いがある場合、これらの単語は、(機械学習から派生したアルゴリズムを含む)コンピューティングシステムによって自動的に編集される、および/または手動で編集される。
b. コンピュータの比較ツールを使用して、接頭辞および接尾辞でマークアップされた単語を探し出し、標準化すること。たとえば、「get〇ting」は、2番目の「t」を無音の文字として「gett〇ing」に標準化され得る。
c. 語根のマークアップができるだけ簡単で標準的であることを保証するために、コンピュータツールを使用して、マークアップされた単語を分析して、上で検討された「real」のような語根を探し出すこと。たとえば、単語「real」のマークアップは、IPAバージョンの音文字シュワを綴り文字と同じである元の音文字によって置き換えて、「re〇al」となる。これは、語根のマークアップを予め定義されたものに自動的に変更し、変更されたものを似た単語と比較することによってその変更されたものを自動的にチェックさせるか、手動でチェックさせるか、またはその両方でチェックさせることによって自動的に行われ得る。
d. 同じ語根を持つ単語のマークアップを比較して、語根に関してマークアップが一貫していることをチェックし、たとえば、「acknowledge」および「acknowledgement」のような似た単語のIPAからの翻訳を比較して、マークアップが一貫していることをチェックすること。上述の例においては、単語「acknowledgement」の翻訳に、追加の音節の区切りが追加され得る。
e. コンピューティングシステムにおいて、自動的に、1つの母音を持つ単語が1音節の単語であることをチェックすること、および/または子音によって分けられている複数の母音を持つ単語が、存在する母音と同じ数の音節をマークアップ内に有することをチェックすることを含め、音節の区切りの規則の遵守をチェックすること。あらゆる音節は、母音を持つ。したがって、1つの母音を持つ単語は、必然的に1音節の単語である。子音によって分けられている3つの母音を持つ単語は、3つの音節を有する。2つの隣接する母音のみを持つ単語は1音節の単語である可能性が高いが、母音の間に音節の区切りがある可能性があることがあり得るけれども、これは可能性が低い。開音節および閉音節の規則に適合しない単語は、エディタによる検査するために強調されるべきである。
f. 新しい音節が作成される場合、新しい音節を持つ単語がチェックされることが可能であり、したがって、方法は、手動チェックのために新しい音節にフラグを立てるステップを含む。すべての綴り文字が音文字と同じである新しい音節は、正しい可能性が高く、一部の綴り文字が異なる音文字を有する音節よりもチェックの優先度が低い。
g. マークアップされた単語は、単語の録音と照合され得る。これは、チェックされているマークアップされた単語の音節を再生し、このようにして作成された単語の音を単語の録音と比較することによって行われ得る。一致しない場合、単語の綴りを引き続き保ちながら、異なるようにマークアップされた音節を使用して、異なる単語の音が生成され得る。同じ語根を持つ単語は、以下のプロセスを使用してマークアップされ得る。
i. 接頭辞および接尾辞の包括的な表が作成され、接尾辞および接頭辞がマークアップされ、たとえば、「ly」は、音「〇lE」を出す。一部の接頭辞および接尾辞、たとえば、接頭辞「inter」および接尾辞「ectomy」は、2つ以上の音節を持ち得る。
ii. 「real」のような語根に関する包括的な辞書の検索が、検索される単語(searched word)と呼ばれる、この語根を含む単語を探し出す。
iii. 語根がマークアップされ、(必要に応じて音節の区切りを持つ)マークアップされた語根が英単語の語根を置き換える。
iv. 英単語の接頭辞および接尾辞が、マークアップされた接頭辞および接尾辞(音節の区切りを持つが、文字によって分けられていない2つの音節の区切りはない)によって置き換えられ得る。
【0221】
単語は、手動で、またはその単語を上で検討されたIPAマークアッププロセスによって導出されたその単語のマークアップと比較することによってチェックされ得る。
【0222】
英語では、アメリカ英語が、イギリス英語と綴り(color vs colour)、発音(pathは英語ではparthと発音される)、および強勢が異なる。したがって、英語のアルファベットのアメリカバージョンおよびイギリスバージョンが、必要とされる可能性がある。
【0223】
たとえば、地方の発音または特定の方言のために、さらなるカスタマイズが可能である。
【0224】
本明細書において説明されるマークアップシステムのアルゴリズムは、ヒューリスティックであってよく、したがって、訂正が行われるたびに改善される可能性があり、その結果、マークアップされた単語の数が増えるにつれて、マークアップの精度が向上する。
【0225】
上述の動作を使用して十分な単語がマークアップされたとき、マークアップされた単語は、上記動作を使用してFonetic Englishへとマークアップされた単語を編集し、新しい単語の正確なマークアップを提案するように機械学習システムを訓練するために使用されてよい。訓練情報は、以下を含む場合がある。
a. 各英単語に関して、英単語、および英単語の音の1つまたは複数のIPA表現、および利用可能な場合は、Fonetic Englishへと正しくマークアップされた単語、
b. IPAマークアップの誤りの検出を支援し、最も複雑でないFonetic Englishのマークアップの選択を支援するための複数のIPA表現、
c. 語根を含むすべての単語でマークアップが一貫していることを保証するために、語根(たとえば、上述の「real」)のマークアップを分析すること、
d. 接頭辞および接尾辞の表、ならびにそれらのマークアップ、
e. 機械学習システムがより頻度の高い音節により高い確率を与えることを可能にする、マークアップされたFonetic Englishの音節およびそれらの頻度のデータベース、ならびに
f. 各音節は少なくとも1つの音を持たなければならない、各音節は少なくとも1つの母音を持たなければならない、各接頭辞および接尾辞は少なくとも1つの音節を含まなければならない、単語に2つの母音があり、これらの母音が子音で分けられている場合、2つの音節がなければならない、語根を含むすべての単語で一貫して語根がマークアップされているか(上の「real」の検討を参照)などの規則のデータベース。
【0226】
機械学習マークアップシステムは、上述のように、マークアップされた単語、音節、および音素、ならびに発音された単語、および音節の音で訓練されるように拡張され得る。
【0227】
方法は、それぞれが音文字を含む合成文字を持つ単語のデータベースを、以下によって自動的に生成するステップを含んでよい。
a. 英語で書かれた各単語(「英単語」)および国際音声記号で書かれた各単語(「IPA単語」)を受け取ること、
b. 1つまたは複数の文字が(その1つまたは複数の文字の)通常の音以外の音を持つかどうかを特定するために英単語の文字(「英字」)をIPA単語の文字と比較すること、1つまたは複数の文字が(その1つまたは複数の文字の)通常の音以外の音を持つ場合、
c. 綴り文字および音文字を含む単語(「マークアップされた発音に即した単語」)を自動的に生成するために英字の代わりに合成文字を使用することであって、音文字が、
i. 基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
ii. 各合成文字の綴り文字のために選択された主たるフォント/文字サイズよりも小さい選択された副次的フォント/文字サイズを有し、
iii. 各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字が人間が読むことができるままであるように、合成文字に追加される、使用すること、
d. マークアップされた発音に即した単語の形がそれぞれの英単語の形と実質的に同じであるような、英単語およびマークアップされた発音に即した単語のデータベースを出力すること。
【0228】
同じプロセスが、IPAマークアップされた単語が存在する英語以外の言語の単語をマークアップするために使用されることが可能であり、方法は、その他の言語で書かれた各単語を受け取っており、その他の言語の文字を比較し、その他の言語の単語のデータベースを出力する。
【0229】
方法は、たとえば、
図6に示されるように、ユーザが英単語のマークアップされた発音に即した単語を手動で選択し、したがって、マークアップされた発音に即した単語のデータベースを手動で生成するためのヒューマンマシンインターフェース(HMI)のユーザインターフェースを提供するステップを含んでよい。マークアップシステムは、エディタが単語の綴り文字に適切な音文字を選択することを可能にし、綴り文字は、グレーアウトされる(その綴り文字が無音であることを意味する)か、綴り文字が音文字の上付き文字の音を出すことを示す音文字の上付き文字を有するか、または綴り文字そのものであるかのいずれかであり、綴り文字そのものである場合、綴り文字は、綴り文字の通常の音を出す。綴り文字の間の下のボックスは、強勢のない音節の区切りを示し、上のボックスは、強勢のある音節の区切りを示す。
【0230】
標準的な組版された文書でない文書、たとえば、テキストが芸術的なフォントである可能性があり、水平または垂直でない可能性がある子供向けの絵本または漫画では、テキストをFonetic Englishのフォントに変換することが、(本/ページの見た目を実質的に維持するために)以下を含む場合がある。
a. 非標準的な組版された文書のページを機械スキャンし、自動光学式文字認識(OCR)を使用して、ページ上の非標準的な組版されたテキストを機械が読むことができる英語テキストに変換すること、
b. 機械が読むことができる英語テキストを、本明細書において説明されるように、Fonetic Englishに変換すること、
c. 機械が読むことができる英語テキストをFonetic Englishのテキストと(第1のプログラムによって)自動的に比較し、音文字、音節の区切りを追加すること、または無音の文字の色を変更することを含む可能性がある、ページ上の各単語に必要とされる追加のマーキングの表を自動的に作成すること、ならびに
d. スキャンされた非標準的な組版されたページ上の非標準的な組版されたテキストに追加の情報を、
i. デフォルトの位置がFonetic Englishのフォントの音文字の位置に基づく、非標準的な組版されたテキストの活字のサイズに基づいて計算された音文字のサイズおよび位置(さらに、変則的な活字は、第2のプログラムが状況に合わせて位置を変更することを必要とする場合がある)、
ii. 無音の文字を示すために(非標準的な組版されたテキストの)非標準的な組版された文字の上に重ねられる新しい文字であって、たとえば、レターが撮像され、薄い灰色に変換され、それから、非標準的な組版されたテキストの既存の文字の上に重ねられるか、または代替的に、無音の文字が、単語の形を実質的に変えないように薄く取り消しされる可能性がある、新しい文字、ならびに
iii. 音節の区切りが標準的なFonetic Englishの音節の区切りよりも下、たとえば、実質的に綴り文字の下に追加されることを含む場合がある、音節の区切りのための余地がある場合に追加される音節の区切りを用いて(第2のプログラムによって)自動的に直接挿入すること。
【0231】
元の組版された単語を変更することなくどのようにして単語がFonetic Englishへとマークアップされ得るかの例が、
図9Bに示される。本のページの一部が、上部に再現され、このページの一部の単語が、Fonetic Englishへとマークアップされて、下部に表示されている。
【0232】
英語以外の単語をマークアップすることは、重要であり得る。英語以外の単語は、名前、特に人および場所の外国語名を含み、製品名およびプロセス名、ならびに商標を含む。これらの単語の多くは、あいまいな発音を持つ。これは、悪い発音をされた名前が怪我につながる可能性がある薬品名では特に重要である場合がある。薬品名などの名前を効率的にマークアップする1つのプロセスは、マークアップされた音節を使用して名前の潜在的な発音のリストを作成し、商標もしくは製品名の所有者にマークアップを選択してもらうか、またはマークアップを選択し、それからマークアップを編集してもらうことである。
【0233】
読者の理解力を高めるためのその他の情報の追加
800~1200CEの期間に、2つの進歩、すなわち、単語の間にスペースを入れることと、単語の中での大文字および小文字のレターの使用とが、黙読を可能にした。単語のスペース以前には、読者は、個々の単語を特定するために、文字の並びに沿って目を前後に動かさなければならなかった。文をフレーズに分けることは、読者が文中の単語をスキャンしてフレーズの区切りを探し出す必要を減らす。
【0234】
出版システムは、単語の意味のあるグループに分けられた文を提示することもでき、それらのグループは、たとえ一部の学者が単語の一部のグループは厳密にはフレーズではないという見解を持っている場合があるとしても、本明細書においてはフレーズである。上述のように、文が長く、複雑で、および/または入り組んでいるとき、熟練した読者でさえも、フレーズの区切りがどこにあるかを判定するために文を何度か読む必要がある場合があるので、文をフレーズに分けることは、かなりの助けになる。フレーズの区切りを追加することは、特に、外国語が読者の母語と異なる語順を有する場合、その外国語を読んでいる読者の助けになる場合がある。
【0235】
文は、以下によってフレーズに分けられ得る。
a. 文中の句読点を使用すること、ならびに/または
b. 通常、新しいフレーズを開始する「because」のような接続詞を認識すること。「and」のような接続詞は、「and」によって2つの文が1つの文に結合される場合にフレーズの区切りを示す場合があり、もしくはたとえばフレーズ「bat and ball」において音節の区切りを示さない場合があるので、より複雑である。
【0236】
各単語をその品詞によって分類することができるように、カーネギーメロン大学で開発されたAutoMapのようなツールを使用して文の文法構造を分析し、それから、この情報を使用して単語をフレーズにグループ化すると、たとえば、名詞および形容詞が、文の主語に関して一緒にグループ化される場合があり、動詞および副詞が、一緒にグループ化される場合があり、名詞および形容詞が、文の目的語として一緒にグループ化される場合がある。これは、「and」のような接続詞の効果を分類する方法である。
【0237】
学術文書、法律文書、規制文書、技術文書、およびその他の文書は、句読点、および接続詞などのその他のフレーズを示す単語の間の文中に単語の長い流れを含む場合がある。正確なフレーズ検出ソフトウェアを開発するためのヒューリスティックなプロセスは、以下を含む。
a. 句読点および接続詞を使用して多数の学術文書、法律文書、規制文書、技術文書、およびその他の文書を分析し、音節の区切りが検出されない大きな単語列を選択し、
b. これらの大きな単語列が出現する文(およびその文の前後の文)において、フレーズの区切りが、少なくとも1人の専門家によって印を付けられ、
c. これらのフレーズの区切りが、新しいアルゴリズムを開発し、新しいアルゴリズムがフレーズに正しく印を付けるかどうかを確かめるためにアルゴリズムをテストすることによって、フレーズに印を付けるためのより良いアルゴリズムを開発するために使用され、フレーズの区切りが正しく挿入されるまで修正される。
【0238】
上の段落で説明されたプロセスが、新しいデータおよび新しい訂正で繰り返されてよく、それが、アルゴリズムを更新して精度を高める。妥当なマークアップ精度(たとえば95%)が確立されると、マークアップ付きのベータテスト文書が、フレーズの区切りを手動で訂正するために教師および学者が利用することができるようにされ得る。この追加データは、アルゴリズムをさらに改善するためにシステムに追加される。この段落および上の段落で説明されたこのプロセスは、生徒が文書をマークアップすることに拡張されることが可能であり、正しい確率が高いフレーズの区切りだけを、たとえば、文書を与えられた3人の生徒が全員同じフレーズの区切りをマークアップする場合に受け入れる統計的アルゴリズムを使用することによって精度を保つ。十分なデータが収集されると、収集されたデータが、テキストを分析し、それをフレーズに分けるように機械学習システムを訓練するために使用され得る。
【0239】
テキストの形式を維持するが、フレーズ間の単語間隔を広げてフレーズの区切りを示すこと、◇フレーズ1◇フレーズ2◇のように容易に認識可能な記号を使用して、同じブロック形式を使用してフレーズを区切ること、または各フレーズを別々の行に表示することによるなどの方法を含む複数の方法でフレーズの区切りが表示され得る多くの方法が存在する。
【0240】
分をフレーズに分けることは、方法100のステップ12における理解力向上ツールの例であり、下でさらに説明される。
【0241】
出版システムから文書を使用して読者をサポートするためのテストおよび練習
言語を読むこと、書くこと、聞くこと、および話すことは、すべて相互に関連している。1つの分野の改善が、その他の分野を改善する場合がある。1つの分野のエクササイズで収集されたデータは、その他の分野で使用され得る場合が多い。たとえば、生徒が単語の音を正確に弁別することができない場合、生徒は、その単語を正確に発音できる可能性が低く、したがって、その単語を発音するエクササイズは、生徒がその単語の音を正確に弁別することができるようになった後でのみ優先される。相互関係があるので、出版の特徴および言語学習の特徴を提供するシステムもまた、相互に関連するシステムでなければならない。
【0242】
単語が出す音を明示的に、厳密に、および曖昧さなく定義する能力、言語のすべての単語を明示的に、厳密に、および曖昧さなくマークアップする能力、ならびにたとえ単語中の文字がその通常の音以外の音を出すとしても、綴りを変えることなく、その文字の音を明示的に、厳密に、および曖昧さなく表す能力、文字および文字によって表される音素を知り、理解する読者の能力は、マークアップされた単語の表示が単語の音の表示でもあるので、簡素化された表示を可能にし、単語の音素と音素との間に同形関係があるので、より高速なコンピュータの演算を可能にし、明示的で、厳密で、曖昧さのないエクササイズが作成されることを可能にする。たとえば、本明細書において説明される聞くスキル(聴覚弁別)および話すスキル(発音)を向上させるためのエクササイズおよびテストは、ユーザに知られている、本明細書において説明されるマークアップシステムを使用する、音素、音節、および単語の明示的で、厳密で、曖昧さのないマークアップにより、はるかに効果的になる場合がある。
【0243】
読むこと、聞くこと、話すこと、綴ること、および語彙のためのヒューリスティックで包括的な統合された出版および言語教授システムは、本明細書において説明される発音に即したアルファベットを使用するいくつかの新しいアルゴリズムを有する。これらの新しいアルゴリズムには、以下を含む。
a. インテリジェントでヒューリスティックなレッスンスケジューリングシステム、
b. インテリジェントでヒューリスティックな単語マークアップシステム、
c. インテリジェントでヒューリスティックな語彙教授システム、および
d. 読者に単語の音、たとえば、音素をどのように音節へと混合するべきかを曖昧さなくに表現する単語の表示に依拠するインテリジェントでヒューリスティックなエクササイズ。
【0244】
その他の例が、本明細書において説明される。
【0245】
上で説明されたのは、追加情報を含むアルファベットが作成されることが可能であり、読者が言語を読むことを学習したり、言語をより効率的に学習したり、自身の言語スキルを効率的に向上させたり、および/またはその言語で書かれた文書をより深く理解したりするのを支援するために使用されることが可能である多くの方法である。読者の特定のクラスまたは個々の読者を支援するためには、情報が、方法100のステップ9であるユーザ進捗データベースに収集され、学習および理解の結果をヒューリスティックに最適化するために分析される必要がある。
【0246】
方法100のステップ8のエクササイズスキル向上データベース、ステップ10の語彙向上ツール、ステップ11の読み向上ツール、およびステップ12の理解力向上ツールの学習アクティビティの最適化を達成するためのヒューリスティックな方法は、以下を含む。
a. 人のクラス(もしくは個人)が何を知っていて、何を知らないかを測定し、知らないことを教え、たとえば、個人は特定の文字がどのような音を出すかを知っているか、
b. 個人もしくは個人のクラスのスキルレベル、たとえば、ある人が特定の音素の音をどれだけ正確に弁別することができるかを測定する、および/または。
c. その知識が比較的不揮発性の長期記憶に記憶されるために人が何かを学習する必要がある回数。
【0247】
方法100のステップ8のエクササイズスキル向上データベース、ステップ10の語彙向上ツール、ステップ11の読み向上ツール、およびステップ12の理解力向上ツールの学習アクティビティの最適化は、インタラクティブな学習モジュールを含んでよく、このインタラクティブ性は、システムが以下のような情報を漸進的に記録し、分析することを可能にする。
a. 人が知る必要があることについての情報、たとえば、その人は医学を勉強しており、医学語彙を習得する必要がある、
b. 人が何を知らないかおよび知る必要があるかをシステムがそこから計算することができる、人が何を知っているかおよび人が何を知る必要があるかの情報および/もしくは予測、
c. 人の現在のスキルレベル、ならびに/または
d. どのような復習計画が、その個人もしくは同様の学習プロファイルを持つ個人のグループに最も効果的か。
【0248】
方法100のステップ9は、ユーザ進捗DBである。このシステムは、あらゆることをロギングし、答えをロギングし、答えを正しい答えと比較し、答えが正しいか否かを判断する。
【0249】
ユーザ情報をロギングし、記憶する方法は、以下を含む場合がある。
a. コンピューティングシステムが記憶するコンピューティングシステムのユーザからのユーザ入力を受け取るステップ、
b. コンピューティングシステムがユーザの知識/パフォーマンスの測定された値を生成するステップ、
c. コンピューティングシステムが測定された値に基づいてユーザを複数のカテゴリのうちの1つに分類するステップ、および
d. コンピューティングシステムが、同じ1つのカテゴリまたは複数のカテゴリのユーザの記憶されたユーザデータに基づいてどのようなアクティビティがユーザにとって最適であるかを予測するステップ。
【0250】
ユーザ情報をロギングし、記憶する方法の例は、以下を含む場合がある。
a. コンピューティングシステムのユーザからのユーザ入力を受け取るステップ、
b. コンピューティングシステムがユーザ入力に基づいてユーザを複数のカテゴリのうちの1つに分類するステップ、および
c. コンピューティングシステムが、ユーザカテゴリと文字セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて複数のアルファベットの文字からアルファベットの文字を選択するステップ。
【0251】
ユーザ情報をロギングし、記憶する方法の別の例は、以下を含む場合がある。
a. コンピューティングシステムが、テストテキストを可視的に表示するか、またはテストテキストを可聴的に再生することによって、主たるアルファベットのテストテキストをユーザに提示するステップであって、テストテキストが、少なくとも1つのテスト単語および(テスト単語ではない)1つまたは複数の誤答選択肢単語を含む、ユーザインターフェースを使用してユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、ステップ、ならびに
b. コンピューティングシステムが、ユーザが選択可能な単語のユーザ選択からの値を測定するステップであって、少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、少なくとも1つのテスト単語が正しく選択されたかどうか、および/またはテスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、ステップ。
【0252】
ユーザ情報をロギングし、記憶する方法の別の例は、以下によって測定された値を生成するステップを含む場合がある。
a. コンピューティングシステムが複数の(たとえば3つの)マークアップされた単語を表示することであって、複数のマークアップされた単語のサブセット(たとえば、2つ)が間違いである、表示すること、および
b. コンピューティングシステムが、ユーザがいくつの正しい単語および誤りの単語を選択するかを測定すること。誤りの単語は、データベースにロギングされ、システムは、たとえば3回連続で答えが正解になるまでこれらの誤った答えを再度教え続ける。
【0253】
長期記憶でさえも復習を、ただし比較的少ない頻度で必要とするので、正しい答えが長期記憶に維持されることを保証するために正しい答えを復習するために、正しく答えられたエクササイズが時々ユーザに提示され得る。これが測定され、復習に費やされる最小化された時間で長期記憶の維持を保証するための個々のパターンが培われる。
【0254】
ユーザ情報をロギングし、記憶する方法の別の例は、以下によって測定された値を生成するステップを含む場合がある。
a. コンピューティングシステムが、対応する複数の正しい音節(たとえば、少なくとも2つのそれぞれの正しい音節、たとえば、3つ)を定義する複数の音節を持つ単語(たとえば、少なくとも2つの音節を持つ多音節の単語、たとえば、3音節の単語)の音を再生すること、
b. コンピューティングシステムが、対応する複数の空欄(たとえば、少なくとも2つのそれぞれの空欄)、および対応する複数よりも多くの複数のユーザが選択可能な音節(すなわち、空欄よりも多いユーザが選択可能な音節が存在し、たとえば、3つ以上または4つ以上存在する)を表示すること、
c. コンピューティングシステムが、対応する複数の(たとえば、少なくとも2つまたは3つの)ユーザが選択可能な音節を選択するユーザからの入力を受け取ること、
d. コンピューティングシステムが、正しい音節および誤りの音節のうちのいくつがユーザによって選択された音節の中にあるかを測定すること、ならびに
e. 誤りの音節が学習されるまで、したがって、誤りの音節の測定された数が選択された閾値を下回るまで、誤りの音節を再度教えること(正しい音節は、上で検討されたように時々復習される)。
【0255】
このプロセス(ユーザ情報をロギングし、記憶する方法の上の例)は、綴りを教えるために使用されることが可能であり、すなわち、綴り文字が単語を正確にスペルアウトし、音文字が正しい音を出すように、正しい音節を選択させることができる。このプロセスは、サイトワード認識を向上させ、生徒が「単語が正しく見えない」という理由で綴りの間違いを検出することを可能にするために使用され得る。
【0256】
ユーザ情報をロギングし、記憶する方法の別の例は、以下によって測定された値を生成するステップを含む場合がある。
a. コンピューティングシステムが、第1の複数の正しい文字を定義する単語の音を再生すること、
b. コンピューティングシステムが、第1の複数に等しい空欄を表示すること、
c. コンピューティングシステムが、第2の複数のユーザが選択可能な文字を表示することであって、第2の複数が第1の複数よりも大きい、表示すること、
d. コンピューティングシステムが、ユーザが選択可能な文字を選択するユーザからの入力を受け取ること、および
e. コンピューティングシステムが、いくつの正しい文字がユーザによって選択された文字の中にあるかを測定すること。
【0257】
このプロセス(ユーザ情報をロギングし、記憶する方法の上の例)は、サイトワード認識を向上させ、正しく綴られた単語を認識することを生徒に教えるために使用され得る。これは、生徒が、「単語が正しく見えない」という理由で間違って綴られている単語を検出することを可能にする。
【0258】
ユーザ情報をロギングし、記憶する方法の別の例は、以下によって測定された値を生成するステップを含む場合がある。
a. コンピューティングシステムが、それぞれの複数の単語の音を、単語の再生される音の隣接するものの間に無音の時間があるようにして再生すること、
b. コンピューティングシステムが、ユーザからの入力に基づいて、再生される音の間の無音の時間を短くすること、
c. コンピューティングシステムが、音調が速度に応じて補正されるようにして(一部のオーディオプレーヤでは、速度が落とされるときに、しゃべりの音調が下がる)、ユーザからの入力に基づいて、(人間同士のしゃべりで使用される)連続した音でゆっくりと単語の音を再生すること、および
d. コンピューティングシステムが、ユーザからの入力に基づいて、(人間同士のしゃべりで使用される)連続した音で通常のしゃべりの速度で単語の音を再生すること。
【0259】
コンピューティングシステムは、単語を取得し、単語を自動テキストトゥスピーチソフトウェアモジュールに渡すことができ、自動テキストトゥスピーチソフトウェアモジュールは、単語の音を含む音声ファイルを生成するように構成され、音声ファイルは、単語のテキストを単語の音にリンクするデータベースに記憶され得る。文は、単語を選択し、その単語の音に関してデータベースを調べ、その単語を再生することによって1単語ずつ再生され得る。再生される文は、イントネーションおよび抑揚を含まない。
【0260】
コンピューティングシステムは、文を取得し、文を自動テキストトゥスピーチソフトウェアモジュールに渡すことができ、自動テキストトゥスピーチソフトウェアモジュールは、イントネーションおよび抑揚を付けて音読される文の音声ファイルを生成するように構成される。それから、文の音声ファイルは、Stefan Rapp博士によって開発されたAlignerのような自動スピーチセグメンテーションシステムに渡されることが可能であり、自動スピーチセグメンテーションシステムは、文中の単語の音を含む連続的なしゃべりを個別の単語および音素に分けることができる。異なる文においては単語に適用されるイントネーションおよび抑揚が異なり得るので、単語をその単語の音にリンクするデータベースは、文書識別子、文識別子、および単語識別子も含み、それが、単語間に可変の間を置き、抑揚およびイントネーションを付けて順番に文中の単語が再生されることを可能にする。
【0261】
音声信号を個別の単語の音に分け、単語のテキストをデータベース内のその単語の音にリンクすることによって、文中の各単語は、その単語の音が再生されるときに強調され得る。これは、一部の読者、たとえば、子供の頃に読み聞かせをされなかった読者を支援する可能性があり、単語を見て、単語が発音されるのを聞くことによって聴覚弁別を向上させるのに役立つ。読者の理解力を測定するために、多肢選択問題が追加され得る。
【0262】
単語のテキストを強調しながら単語の音を再生することは、読み練習ツールの有用な特徴である場合がある。
【0263】
上の方法を使用して、読み練習ツールは、文を強調しながらフレーズで文を再生することも可能である。
【0264】
認知負荷理論の分割集中原理は、注意が分割されるので、一度に複数のソースからの情報が学習を低下させ得ることを示す。読者がある程度の読解力を発達させると、生徒が読むだけの場合、または生徒が聞くだけの場合、注意は分割されない。
【0265】
音素、音節、単語、フレーズ、句動詞、熟語などをクリックすることによって、読み練習ツールは、イントネーションおよび抑揚を付けてまたは付けずに、個々の単語、音節、音素、フレーズ、句動詞(come up withは思いつくことを意味する)、および熟語を再生する可能性もある。
【0266】
同様に、読者は、単語、フレーズ、句動詞、熟語などをクリックし、単語、フレーズ、句動詞、熟語などの定義または翻訳を提示される可能性がある。
【0267】
ユーザ入力は、ユーザによって選択された値を含んでよく、方法は、ユーザによって選択された値を、
a. コンピューティングシステムが、テキスト入力プロンプトおよび/または選択可能なリストをユーザに提示すること、ならびに
b. コンピューティングシステムが、テキスト入力プロンプトおよび/または選択可能なリストにおける入力として、ユーザによって選択された値を受け取ることによって受け取るステップを含み、
方法は、コンピューティングシステムがユーザによって選択された値に基づいてユーザを複数のカテゴリのうちの1つに分類するステップを含む。
【0268】
方法100のステップ(2)において、登録時に収集されるユーザについての情報は、以下を含む場合がある。
a. 名前および連絡先の詳細(電話、電子メールなど)、
b. 居住国、
c. 母語、
d. 年齢、
e. 性別、
f. 母語での学業成績(初等、中等、高等)、
g. 職業資格、
h. 母語で読む能力の自己評価、
i. 英語(もしくは教授されているその他の言語)の学習に費やされた年数、
j. 英語での学業成績(たとえば、IELTS 5)、
k. 英語で読む能力の自己評価、
l. 英語での口頭による英語コミュニケーションの自己評価、および/または
m. ユーザが何のために英語を学習したいのか。たとえば、会計を勉強するため。
【0269】
方法100のステップ4は、方法100のステップ2である登録システムからの情報を使用して、グループのメンバが類似した知識およびスキルを有するユーザグループを形成するユーザ分類システムである。
【0270】
これは、ユーザが少ない数の質問に答えることによってグループにうまい具合にカテゴリ分けされることを可能にし、それから、グループの利用データが、新しいメンバの最適な学習戦略を予測するために使用され得る。
【0271】
たとえば、新しいユーザが、質問に答え、自身の母語が標準中国語であり、自身が18歳、男性であり、IELTSグレード5を有することを示す。記録された生徒のデータを分析することにより、このカテゴリの多くの生徒は、英語のアルファベットを認識することができ、3~500語の語彙を持っており、英語の音素の約半分の音を正確に弁別することができるが、その他の音素の弁別に問題があると分かる。難しい音素を含む英単語のそれらの生徒の発音は、悪い場合が多い。
【0272】
生徒の使用を記録するデータベースから、統計的に、新しいユーザが聴覚弁別を向上させるために特定のコースを取り、聴覚弁別が向上したとき、発音に関する特定のコースを取ることから恩恵を受ける可能性が高いことが計算され得る。
【0273】
特定の聴覚弁別コースは、同じグループのその他のユーザが聞き取ることができた音素を持つ単語を教え、より聞き取りにくい音節と、それから、音素とに進むことによって、難しい音素を持つ音節を教える可能性がある。さらに、生徒は、ユーザと同じ母語を持つ人によって話されたこれらの単語をよりしっかりと聞き取ることができる場合がある。同じ母語を持つ人によって発音されるときの音節および音素の音を正確に弁別することができるとき、生徒は、学習されている言語である基本言語の母語話者によって出された音に取り組み始めることができる。
【0274】
これらの予測は、ユーザにアクティビティを与え、その結果を記録および分析し、ユーザデータに基づいてコースを修正することによってテストされ得る。たとえば、ユーザはグループよりも優れた聴覚弁別を有する場合があり、ユーザが既に知っていることまたはスキルを持っていることに時間を費やす必要はない可能性がある。そして、このユーザ情報は、将来、より良いグループの予測を提供するために分析され、より大きなグループを、より明確な知識およびスキルを持つ2つ以上のグループに分割させる場合がある。
【0275】
ユーザが会計を勉強したかった場合、生徒が知っている必要がある語彙リストが生成され得る。生徒は、何が知られているかおよび何が教えられる必要があるかを判定するために語彙に関してテストされ、システムは、どんな単語が知られているかおよびどんな単語が学習される必要があるかを予測し、この予測は、ユーザが受けるインタラクティブなコースによってテストされる。
【0276】
方法100のステップ3において、エクササイズが、方法100のステップ4であるユーザ分類システムを使用してユーザをユーザグループに分類するための追加データを提供することができ、これは、以下を含む場合がある。
a. 以下によって、コンピューティングシステムのユーザを測定すること(すなわち、読者の知識およびスキルをテストすること)、
b. コンピューティングシステムが、テストテキストを可視的に表示するか、またはテストテキストを可聴的に再生することによって、主たるアルファベットのテストテキストをユーザ(副次的アルファベットの話者)に提示することであって、テストテキストが、少なくとも1つのテスト単語および(テスト単語ではない)1つまたは複数の誤答選択肢単語を含む、ユーザインターフェースを使用してユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、提示すること、および
c. コンピューティングシステムが、少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/またはテスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、ユーザが選択可能な単語のユーザ選択を測定すること--ユーザは、テストテキストを読む副次的アルファベットの話者である(たとえば、テキストのテストにおいていくつの誤りおよび/またはどのような誤りがあるかを特定すること、単語の再生とユーザ選択の受け取りとの間のタイムラグを測定すること);
d. コンピューティングシステムが、測定値に基づいて(および任意で、以降で説明される追加のユーザによって選択された値に基づいて、および任意で、複数のユーザカテゴリグループの各々の訓練ユーザからのデータに基づいて訓練された訓練された分類器、たとえば、訓練された人工ニューラルネットワークANNを使用して)ユーザを複数のカテゴリのうちの1つに分類すること;ならびに
e. コンピューティングシステムが、ユーザカテゴリと文字セットとの間の予め定義されたマッピング(多くの異なるグループ/カテゴリが英語/英語のアルファベットにマッピングされるので多対1のマッピングである)を使用して、ユーザカテゴリに基づいて複数のセットから音素セットを選択すること(すなわち、ユーザのカテゴリを使用してエンコードのための文字セットを選択する)。
【0277】
方法100のステップ4であるユーザ分類システム、方法100のステップ5であるユーザ分類システムのためのデータ、方法100のステップ6であるユーザ分類アルゴリズム改善システム、および方法100のステップ7、ユーザグループへのユーザ割り振りは、一緒に、以下の例によって示されるヒューリスティックなシステムを形成する。
【0278】
11歳の中国人の生徒が、3年間の英語の訓練を受ける。テストは、3年の英語の訓練を受けている11歳のその他の中国人の生徒が特定の英語の音素をはっきりと聞き分けることに苦労するが、これらの生徒が、中国語を母語とする話者によって発音されるこれらの音素を含む多くの音節を聞き取ることができることを示す。また、これらの生徒が中国語話者によって発音された難しい音素を含む追加の音節を学習する場合、生徒の聴覚弁別が向上することと、そのとき、これらの生徒が、英語を母語とする話者がより簡単な音節を言うときにこれらの音節の正しい弁別をし始め得ることとが分かっている。コンピュータシステムは、その他の生徒の使用結果から、生徒が同じ音節を同じ順序で提示されるべきであると予測する。より多くの生徒がこのシステムを利用するとき、一部の生徒が、その他の生徒よりも速く学習する場合があり、学習をより簡単だと感じる生徒には早道がある場合がある。システムは、生徒の結果を分析し、ロギングされた使用に基づいて、その生徒の個別のパフォーマンスを最大化するための学習アクティビティを提供する。
【0279】
方法100のステップ5および6であるユーザ分類改善アルゴリズムのためのさらなる情報が、以下の例で示される。
【0280】
訓練ユーザは、「テキストのこの短い一節の中にいくつ誤りがありますか」のようなテスト質問をされ、それらのユーザが特定する誤りが記録される。手動でカテゴリ分けされたユーザからのこれらの質問に対するユーザの答えに基づいて、ANNが、ユーザをカテゴリ分けするように訓練される。ANNによってカテゴリ分けされたユーザは、その使用情報をロギングされ、予測/カテゴリ分けの精度に関する情報を提供する。手動で訂正されたユーザ分類を持つデータが、訓練の際にANNに追加されてよい。
【0281】
ユーザ登録データおよび生徒のアクティビティに基づく追加データが受け取られると、ユーザは、ユーザがそのグループ内で最良の学習結果を有する確率に基づいて、方法100のステップ7においてユーザグループに割り振られる。ユーザがユーザグループに割り振られると、ユーザは、ユーザIDおよびグループIDを割り振られる。
【0282】
方法100のステップ8である英語スキル向上データベース、方法100のステップ10である語彙向上ツール、方法100のステップ11である読み向上ツール、および方法100のステップ12である理解力向上ツールは、ロギングされたユーザ情報を使用して、最適なグループの学習結果の計算された確率に基づいて、エクササイズ、エクササイズの内容、アルファベットの選択、単語の選択、および優先度を選択し、十分なデータが収集されるときには、個別に最適化されたエクササイズ、エクササイズの内容、アルファベットの選択、および優先度を選択する。
【0283】
たとえば、上述のように収集されたユーザ情報を使用して、異なる読者ユーザカテゴリ(「グループ」)のための異なる最適化されたアルファベットが、提供され得る。(たとえば、語学の生徒の)各グループは、学習プロファイルを有する。たとえば、各言語に関して、3つの(またはそれよりも多くの)グループ、たとえば、初級、中級、および上級が存在する場合がある。分類システムによってユーザをグループ分けすることによって、以降で説明される教授ステップが、ユーザが知っていることおよび知らないことを予測し、ユーザが知らないことを教え、ユーザが知っていることは教えないことによって、ユーザのグループに基づいてこれらのユーザのために最適化されてよい。
【0284】
分類システムは、個人の年齢、(IPAを含む)個人の言語習得度、個人の教育レベル、個人の英語リテラシー(たとえば、ある人が英語の音素セットを知っている場合、その人は英語/英語のアルファベットを使用することができる)に基づいて、個人のグループのために個別化され、最適化される音素セットを選択することができる。
【0285】
方法100にとって極めて重要なのは、方法100のステップ9である、ユーザの進歩を測定することができるデータベースにすべてのユーザ登録およびアクティビティを収集することである場合がある。データは、可能な限り詳細に収集され、AmazonのDymanoDBのような非SQLデータベースは、必要に応じてデータベースの再構築を可能にする。
【0286】
方法は、コンピューティングシステムが、たとえば、LMSのアプリケーションプログラミングインターフェース(API)を通じて、ユーザがユーザアカウントを有する学習管理システム(LMS、たとえば、米国DCのBlackboard Inc.製)に接続することによって、ユーザを認証し、特定するステップを含んでよい。方法は、ユーザカテゴリおよび/または測定値(測定された値)を、LMSにユーザの記録とともに記憶するために、ユーザアカウントに関連するLMSに送るステップを含んでよい。xAPI、Tin Can、共有可能コンテンツオブジェクト記憶モデル(SCORM: Sharable Content Object Storage Model)を含む、ここで使用され得るいくつかの形式がある。
【0287】
下で説明される方法100のステップ11である多くの読み向上ツールがある。
【0288】
本明細書において説明される方法は、学習者の言語、たとえば、日本語に基づいて、言語、たとえば、英語の個人学習のために最適化された方法でテキスト文書をエンコードし、したがって、エンコードされたテキストは、各個人/生徒のために最適化される。方法は、主たるアルファベット(たとえば、英語)または副次的アルファベット(たとえば、日本語)の文字でもある音文字を使用し、したがって、人間の読者は、新しい記号(たとえば、グリフ)を学習する必要がない。
【0289】
方法は、ユーザの既知の言語(本明細書においては「副次的言語」)ならびにその他の聞く能力、読む能力、および発音の能力に基づいて、そのユーザのための最適な文字セットを見つけるためにユーザをテストするステップを含む。
【0290】
認識の容易さと、さらに音の想起との両方において、記号が最適な自動性を有する場合、読者の精神的オーバーヘッドが削減される場合がある。初級者に関して、読者の母語の文字は、視覚的に容易に認識可能であり、また、読者は、それがどのような音を出すのか知っている。したがって、副次的言語(たとえば、英語以外)において同じである主たる言語(たとえば、英語)の音素が存在する場合、および読者が英語のレター/音の関連付け(すなわち、英字がそれらの通常の音として出す音)--「完全自動性(full automaticity)」と呼ばれる--を習得していない場合、これらの音を学習する早道は、同じ音を出す英字および副次的文字を見ることである。(明らかに、副次的言語にはない英語の音がある場合、その音を出す文字はない。英字が使用されるか、IPA文字が使用されるかのどちらかである。ユーザは、それらの音をどのようにして聞くべきかおよび出すべきかを教わる必要がある。生徒は、自分の発音と、自分が学習している言語の母語話者の発音との違いを正確に弁別することができなければ、自分の発音を自己矯正することができない)。さらに、生徒がIPAの自分の知識に自信がない場合、読者はIPAではなく読者の母語(副次的言語)で音を見る場合に、音を聞くことおよび話すことにより自信を持つ場合がある。対照的に、日本および中国のような国は、IPAをそれらの生徒に教える。副次的アルファベットは、たとえば、漢字の上にIPA文字を置くことにより、IPAであってよい。
【0291】
方法が既存の読者の知識を特定するステップを含むので、読者に主たる言語を教える効率が、改善される場合がある(人に既に知っていることを教えるのは効率的でない)。方法が読者を複数の読者グループ(または「カテゴリ」)のうちの1つに分類するステップを含むので、読者の知識のレベルが、わずか数問の質問で迅速に推定される場合がある。
【0292】
任意の言語の全体的な理解は、正確な聴覚弁別、正確な発音、および流暢な読みを必要とする。さらに、コミュニケーションで使用される単語の意味を理解しない場合、言われたまたは書かれた情報を誰も理解することができない。語彙の発達は、向上した理解力のために不可欠である。方法100のステップ12である理解力向上ツールは、読者の理解力を向上させる効率的な方法を提供し、その例が、下で説明される。ツールの間には重複がある。例は、聴覚弁別である。ユーザの聴覚弁別を向上させることは、話し単語を聞き、理解するユーザの能力を向上させ(口頭のコミュニケーションの正確な聞き取りおよび向上した理解力)、発音を改善し(話された音素を正確に弁別することは発音のより効果的な自己矯正を可能にする)、単語の綴り方を知ることは、ユーザが何を聞くべきかを知ることを可能にする。
【0293】
第2の例は、単語を発音することを学習することであり、これは、聴覚弁別、発音を向上させ、サイトワード認識を効率的に発達させ、それが読みの流暢さおよび理解力を向上させる。
【0294】
言語学習の相互に関連した性質を考慮すると、特定のスキル、たとえば、単語の発音を発達させることへの言及は、ユーザが目で見て認識することができる単語の数の増加、聴覚弁別の向上、および発音の改善などのその他の利点を含む。
【0295】
方法のステップ11である読み向上ツールの例が、以下に示される。ステップ11の要素は、以下を含む。
a. コンピューティングシステムが、(完全な単語を再構築するまで、それぞれが単語の最初の音素と、それに加えて、単語の0個以上の音素とを順番に含む)各部分的音節/音節に関して1音素(無音の文字以外の文字または二重音字)インクリメントして、単語(ソーステキストから、たとえば、「cat」)を、最初の文字/レターと、徐々に、さらなる文字/レター/二重音字(異なる音を表す2つのレター、たとえば、二重音字「ph」は音/f/を表す)とを含む複数の個々の音素/部分的音節/音節に分割すること、
b. コンピューティングシステムが、部分的音節/音節を、ユーザが聞くためにコンピューティングシステムのユーザインターフェースから長さの順に(たとえば、/c/、/ca/、/cat/)漸進的に発音すること(再生すること)(すなわち、シーケンスを再生する)(記号/cat/は、英語を母語とする話者によって発音されるときの単語「cat」の音を表す)、
c. コンピューティングシステムが、ユーザインターフェースを介して、部分的音節/音節を繰り返すようにユーザに指示すること、
d. コンピューティングシステムが、ユーザが音節/部分的音節を話すのを録音すること、および
e. コンピューティングシステムが、部分的音節/音節のセットと、それから、ユーザの録音された部分的音節/音節のセットと(たとえば、/c/、/ca/、/cat/のユーザの録音と、それから、/c/、/ca/、/cat/の公式の録音と)を発音することであって、発音するステップが、2回以上繰り返され得る、発音すること。
【0296】
生徒は、混合すること、たとえば、/c/、/a/、/t/が音/cat/を出すことを学習する必要がある場合がある。一部の生徒、特にフィンランド語、イタリア語、またはスペイン語のように、母語が発音に即している生徒は、このことを既に知っている。ほとんどのシステムは、生徒が部分的音節の音を1音素ずつ漸進的に実施すること/c/、/ca/、/cat/を学習する漸進的な音素の混合は教えない。通常、生徒は、/c/ /a/ /t/を聞き、これが音/cat/を出すと言われる。現在の教授法は、3音素の単語のために短期記憶の少なくとも4ビットの情報を必要とする。より長い単語は、ワーキングメモリへのより高い負荷を引き起こし、すぐにワーキングメモリをあふれさせる可能性が高い。認知負荷理論は、ワーキングメモリ内の項目の数を減らことが学習結果を高めることを教示する。単語を音節に分け、各音節をどのように混合するべきかを学習し、それから、その音節を次々に素早く発音して単語を発音するという戦略は、短期記憶への負荷を大幅に減らすことができる。混合は、生徒が/c/、/ca/、/cat/などを聞き、それから録音され、自分の録音を再生して、同じ録音をする母語話者と比較することができるシステムを使用して、オンラインで教えられ得る。母語が(標準中国語のような)表語文字である一部の人は、単語の発音(混合)が得意でない場合があり、これらの人は、教授を必要とする。
【0297】
www.speechace.comからダウンロード可能なコンピュータ化された音声認識システムなどのコンピュータ化された音声認識システムが、正しく読まれた単語および正しく読まれなかった単語、ならびにユーザの発音の正確さを測定することによってユーザの読むスキルを測定するために使用され得る。この情報は、ロギングされ、ユーザをグループに分類し、エクササイズを最適化し、特定のユーザのための最適なエクササイズを予測し、予測の精度に関するフィードバックを提供するために使用される。
【0298】
単語を発音することを学習する際、生徒は、目で見て音節を読むことを学習し、これは、生徒が音節を見る場合に、その音節の音が即座に分かることを意味する。最もよくある500音節だけで構成される少なくとも13,802個の単語が存在する。多くの生徒に関して、500音節だけを学習することが、生徒が基本的な英語を読むことを可能にする。これは、特に多くの単語が発音に即しておらず、丸暗記によって学習される必要があり、それがたくさん反復を要し得るときに、13,802個の単語を個別に学習しなければならないよりもはるかに効率的である。Fonetic Englishのマークアップの標準化によって、単語の意味をデコードすることをより容易にする、接頭辞および接尾辞にはっきりと印を付けることによって、ならびに学習される必要がある音節の数を削減する、Fonetic Englishの音節の区切りの標準化によって、システムの効率は、さらに高められる。たとえば、13,802個の単語は、わずか450個のFonetic Englishの音節だけで構成される可能性があり、したがって、Fonetic Englishのマークアップを使用して13,802個のサイトワードを学習する方が圧倒的に速い場合がある。
【0299】
最もよくある英単語の半分以上は、発音に即しておらず、つまり、これらの単語は、それらが綴られる通りに発音されない。これらの発音に即していない単語は、丸暗記によって学習されなければならず、各単語を学習するためにたくさんの反復を必要とする。反復によって学習される必要がある5000を超える単語がある。この手法を、500個の音節を2または3回発音することによって、それらの音節を目で見て迅速に学習することを人に教えるのと比較する。音節は、短く、学習しやすい。我々は単語を1音節ずつ発音するので、音節の音を知ることは、単語を発音することを容易にする。単語を発音に即した音節に分け、最もよくある音節を教えることは、現在の暗記学習手法よりもはるかに効率的である。
【0300】
英単語を文書中のそれらの英単語の頻度によってランク付けするいくつかの単語頻度リストが、学者によって作成された。最もよくある1000個の単語の音節は、たとえば、最もよくある5000~6000個の単語に現れる音節よりも必然的により頻度に出現する。音節を含む単語の頻度と、その音節が出現する単語の数との両方を考慮に入れる、音節の重み付けされた頻度を伴うすべてのFonetic Englishの音節のデータベースを生成するために、すべてのマークアップされたFonetic Englishの単語のデータベースが、英語文書中の単語の頻度と一緒に使用される。たとえば、音節が、最もよくある1000個の英単語のうちの30個の英単語に出現する可能性がある。第2の音節は、英語文書中の頻度が、最もよくある9000個の単語よりは少ないが、最もよくある10000個の単語よりは多い単語に出現する可能性がある。明らかに、最初の1000個の単語に現れる音節は、頻度が9~10000の間である単語よりも頻繁に見られる。
【0301】
分節法を使用することによって読みを改善する方法の例は、たとえば、医学コースのためにユーザが学習する必要がある単語のリストの音を教える効率的な方法、すなわち、以下を含む場合がある。
a. リスト内の単語が、まだマークアップされていない場合は、Fonetic Englishへとマークアップされ、
b. コンピューティングシステムが、リスト内の単語を分析し、音節がリスト内に出現する頻度と一緒に音節のリストを作成し、
c. コンピューティングシステムが、ユーザのユーザ分類に基づいて、ユーザが知っていると予測される音節により低い優先度を与えることによって、教示される音節を優先順位付けする。
【0302】
読者は、よくある音節を含む新しい単語では、新しい音節の中の数文字を発音するだけでよい場合が多いので、読むことを学習するために必要とされる認知負荷を大幅に軽減するために、英語を初めて学習する生徒は、最もよくある単語および音節、たとえば、最もよくある1~200個以上の音節の音を教えられる場合がある。
【0303】
聴覚弁別を向上させる方法の例は、以下を含む場合がある。
a. コンピューティングシステムが、インタラクティブなコンピューティングシステムのユーザインターフェース上に音素、音節、および単語を表す文字を表示し、同時に、音素、音節、および単語を含むサウンドファイルを発音する(再生する)ステップ(方法は、ユーザが何を聞くべきか分かり、表示された単語、音節、または音素を見ながら、発音された、または1音節ずつ発音された単語を同時に聞くことができるように、文字を示すステップを含む)、ならびに
b. ユーザ入力を与えるための何らかの形態のアクション、たとえば、音を聞き、その音を最も良く表す文字の集まりをクリックすることを行うようにユーザに要求するステップ。
【0304】
生徒が聞くべきことが分かるので、英語の音素、音節、および単語の聴覚弁別が改善される。多くの人は、人がその人の名前を言うのを聞き、名前の音素を正確に弁別することができなかった。名前がスペルアウトされたカードを渡されるとき、多くの場合、人は、何が言われたかを弁別することができる。システムは、さらに、どのなまりを人が聞き取ることができるのか見つけ出し、人が聞き取ることができるなまりで音を提示し、それから、英語を母語とする話者に向かってなまりを漸進的に近づけることによって、これをより容易にしてよい。
【0305】
聴覚弁別を向上させるための方法の例は、以下を含む場合がある。
a. 以下によって、コンピューティングシステムが、コンピューティングシステムのユーザを測定するステップ(すなわち、読者のスキルおよび知識をテストするステップ)
b. コンピューティングシステムが、複数のテストテキスト(「a」および「e」)を可視的に表示し、テストテキストのうちの1つ(「a」または「e」の音であることが可能である)を可聴的に再生することによって、主たるアルファベットのテストテキストをユーザ(副次的アルファベットの話者)に提示すること、および
c. コンピューティングシステムが、(たとえば、「a」と「e」との間の)聴覚弁別を判定するために、少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/またはテスト単語を選択するのにどれだけの時間がかけられるかを測定することを含め、ユーザが選択可能な単語のユーザ選択を測定すること、ならびに
d. 測定値が予め選択された閾値未満である場合に、コンピューティングシステムが、短い音節から始まり、長い音節に進み、それから長さが増した単語に進む複数の音節および単語を提供することを含め、ユーザの聴覚弁別を訓練するためにユーザに、テストテキストと追加の文字および音素とを持つ複数の音節および単語を(1つまたは複数のなまりで可視的および可聴的に)提供するステップ。
【0306】
ユーザのインタラクションを記録し、分析することによって、システムは、どの単語、音節、および音素が問題があるかおよびどれが問題がないかをインテリジェントに判定し、問題がある単語、音節、および音素に関する異なる学習戦略を立てることができ、これは、ロギングされたユーザデータを使用して、異なるなまりなど、学習結果を改善するためのその他のアクティビティをインテリジェントに予測すること、ユーザが弁別することができる単語を見つけること、難しい音素および/または音節を追加して、これが学習およびスキル開発結果を改善するかどうかをテストすることなどを含み得る。
【0307】
聴覚弁別を向上させる方法の例は、以下を含む場合がある。
a. コンピューティングシステムが、主たるアルファベットの音素と、同じ音を出す対応するIPA記号によって接続またはリンクされた副次的アルファベットの音素とを含んでよい予め定義された音素チャート(または音素チャートを表すデータ)、たとえば、
図4の日本語音素チャートに基づいて、主たるアルファベットにはあるが副次的アルファベットにはない音素(音)を選択するステップ。
【0308】
聴覚弁別のためには、同じでない音だけが、教えられる必要がある。
【0309】
聴覚弁別を向上させる方法の例は、以下によって聴覚弁別を教えるステップを含む場合がある。
a. コンピューティングシステムが、ユーザが聞くためのテスト音を再生すること、
b. コンピューティングシステムが、言語でテスト音を表す1つのテスト文字または複数のテスト文字を含む複数の文字を表示すること、および
c. コンピューティングシステムが、ユーザが1つのテスト文字または複数のテスト文字をクリックするかどうかを測定すること。
【0310】
聴覚弁別を向上させる方法の例は、音を録音する生徒と同じ言語背景を持つ(すなわち、母語が副次的言語である)者、または主たる言語の母語話者によるテスト音を録音するステップを含む場合がある。この方法は、生徒が音に近いものを弁別することができるときに、ユーザ/生徒が脳の中に新しい神経回路網を構築することを可能にする、および/または生徒が初めて成功するときに練習する意欲をより高められることを可能にする場合がある。
【0311】
聴覚弁別を向上させる方法の例は、基本アルファベットにあるが学習者が慣れ親しんでいる言語にはない、たとえば、副次的アルファベットにはない音を教えるために、単語および音節を録音し、再生するステップを含む場合がある。2つの言語のIPA文字の分析は、各言語でどの音素が同じであるか(「共通音素」)を示す。この情報は、異なる学習者が異なるなまりで発音された共通音素のみを含む音素、音節、または単語を聞くときのそれらの学習者の聴覚弁別の正確さを測定するために使用され得る。学習者が外国語のいくつかの音素を正確に弁別することができる場合、学習者は、音節の中のいくつかの音素を正確に弁別することができる場合に、その音節にその他の音素も含めるように自身の弁別を効率的に拡張することができる。学習者が音素を弁別することができない場合、単純な反復は、その学習者にその音素を教えない。たとえば、ある人が/a/と/e/との違いが聞き取ることができない場合、その人は、レター「c」、「k」、および「t」が共通音素である場合、/cat/および/ket/のような単語の違いを聞き取ることができる可能性が高い。システムは、多くの生徒で異なる組合せをテストし、統計分析を使用して異なる生徒グループの各々のための最適な組合せを決定することによって、何が生徒が正確に弁別するのが最も容易な音節および単語であるかを実験的に決定する。結果は、学習者の聴覚弁別スキルを迅速、効果的、および効率的に構築する異なる速度で話される異なるなまりを使用して学習者に教えられる音節の順序付けられたセットである。
【0312】
方法の例は、以下によって聴覚弁別を教えるステップを含む場合がある。
a. コンピューティングシステムが、ユーザがテスト文字(および/または音素/音節/単語)を発音するのを録音するステップ、ならびに
b. コンピューティングシステムが、ユーザが聞くためにユーザの録音を繰り返し再生するステップ、
c. コンピューティングシステムが、ユーザがユーザの録音と予め録音された発音との違いを聞き取ることができるように、ユーザの録音の後に、テスト文字(および/または音素/音節/単語)の予め録音された発音を繰り返し再生するステップ、ならびに
d. ユーザの録音および予め録音された録音が、交互に再生されてよい。
【0313】
予め録音された発音は、ユーザがどのようななまりを聞き取ることができるかをテストし、それから、母語話者によって発音された、ユーザが学習したい言語のすべての音を聞き取ることができるようにユーザを進歩させるために、異なるなまりで予め録音することができる。
【0314】
話されていることを理解するためには、聴いている人が、単語が話されているときにそれらの単語の音を弁別することができる必要がある。母語話者が自身の母語で話すとき、話者の単語は、単語間に無音の間を挟んで順々に発音されない。そうではなく、単語は、比較的小さなボリュームの音が単語間の分かれ目を示すようにして混ぜられる。新しい言語を学習するとき、人は、個々の単語の音を弁別することだけでなく、話された単語間に無音がないときに、速く話された個々の単語を弁別することも学習しなければならない。
【0315】
その言語の母語話者によって話された単語を正確に弁別する能力を教える1つの方法は、独立して再生された個々の単語の音を教えることである。これは、音節の音を教え、それから、音節を組み合わせることによって単語の音を教えることを含む場合があり、たとえば、
a. 単語の間に別々の無音を挟んで個々の単語の音を再生し、単語間の無音の継続時間を短くしていき、
b. 母語話者によってゆっくり話されたかのように単語の音を再生し、
c. 通常のレートで話された単語の音を再生する場合がある。
【0316】
システムの有効性は、単語の音を、学習する人と同じ言語を用いる人に話してもらうことによってさらに改善されることが可能であり、学習者は、馴染みのあるなまりで話された単語を正確に弁別することができるとき、母語話者によって話された単語で同じプロセスを踏むことができる。
【0317】
システムは、本明細書において説明される予測技術を使用して、同じグループのその他の学習者の経験に基づいて、学習者が聞き取る可能性が高い単語および音節を予測し、学習者が遭遇する可能性が最も高い単語および音節を教えることによってより効率的にされ得る。
【0318】
人が単語を綴ることを教わり、音素の音および音素をどのように混合するべきかを知っている場合、その人は、その単語を習得する可能性がある。その人は、単語の意味を知らない場合、単語が使用されている文を理解できる可能性が低い。したがって、文書を読み、理解し得るためには、語彙が不可欠である。
【0319】
方法100のステップ12である語彙向上ツールは、効率的な語彙の習得の必要性に対処し、以下で例が与えられる。
【0320】
語彙習得の負担は、題目ごとに異なる。多くの題目において、語彙の習得は、トピックを理解し得るために決定的に重要である。たとえば、医学において、一部の医師は、語彙の習得がコースの中の単一の最も時間のかかる部分だと推定する。
【0321】
多くの医学用語は綴られる通りに発音されないので、語彙の習得がより難しくされる。これは、単純に単語およびその音を認識すること--サイトワード認識--がかなりの反復を必要とすることを意味する。単語が1文字ずつ発音され得るならば、ずっと少ない反復が必要とされるであろう。したがって、単語を発音通りにマークアップさせることは、すべての語彙習得アクティビティを著しく向上させる。語彙の習得は、生徒が学習することを求められる単語のリストの中で最もよくある音節の音を効率的に教えることによっても改善される。
【0322】
認識は、単語を見てまたは聞いて、その単語の意味が分かることである。想起は、単語の定義を聞くか、または単語のイメージを見て、その単語の名前を思い出すことである。認知は、想起よりも習得が容易であり、通常は最初に習得される。
【0323】
語彙の認識は、人にマークアップされた単語をイメージ、定義、翻訳とペアにさせること、または生徒に正しい単語で文を埋めさせること、ひょっとすると4つの単語から1つの単語を選択することによって習得され得る。想起の習得のエクササイズは、用語の定義または用語に関連するイメージを見て、名前を打ち込まなければならないことを含み、すなわち、認識の引き金となるきっかけはない。
【0324】
これを行うための様々な形式がある。足の骨の図を思い浮かべてみよう。システムは、生徒に数個の骨の名前を示す。それから、システムは、これらの骨のうちのたとえば4つまたは5つの名前をリストに持っており、生徒は、認識を発達させるために骨を指す矢印をクリックしなければならない。そして、良好な認識があるとき、人がいかなる認識のきっかけもなしにタイピングにより名前を入力しなければならないとき、システムは人々が想起を習得するのに役立つ。
【0325】
システムは、統計で同じことをし得る。ベルカーブ上に線を示すことが、たとえば、標準偏差が何かであるかを示し得る。最終的には、目標は、生徒に方程式を学習させ、理解させることである。この場合も、認識から想起に進む。
【0326】
人間は、自分が理解する情報を、ランダムな情報よりもはるかに簡単に憶えるように進化してきた。したがって、語彙の習得を、たとえば、習得されるべき語彙の用語の機能についての学習と切り離すことは、実は、長期記憶の発達を妨げ得る。人間の足の例を考えてみよう。生徒が骨の名前を言うだけでなく、隣接する骨の名前と、これらの隣接する骨が互いに対してどのように動くことができるかとを言わなければならないとしたら、生徒は、図上の骨の名前よりも足についてずっと多くのことを知るであろう。体の重さが足の骨にどのように分散されたかを説明することは、語彙を習得すると同時に、足の解剖学的構造についてのさらなる情報を生徒に提供する。この種の理解は、長期記憶に残るためにより少ない反復および復習を必要とする。
【0327】
上の足の例のような語彙の用語をより深く理解することの利点は、以下を含む場合がある。
a. 音もしくは書かれた用語およびその用語がどのように綴られるかを学習すると同時に、用語についての情報を獲得することによって、生徒の時間および労力を節約すること、
b. 生徒がより多くの時間を費やし、より多くの努力をする意欲を高められるように、語彙習得のプロセスを生徒にとってより興味深いものにすること、ならびに/または
c. このようにして学習された語彙は、はるかに少ない復習でより長く思い出され得る可能性がより高い。
【0328】
多くの人にとって、語彙の習得は、単語が長期記憶に記憶されるまで、単語を学習し、忘れ、再び学習し、再び忘れるといったことである。長期記憶に入ると、引き続き単語を復習する必要はあるが、これは、最初に単語を学習するための反復の頻度を必要としない。
【0329】
単語の意味を長期記憶に入れるために必要とされる反復を最適化して、関連する生徒の時間および労力を最小化する必要がある。長期記憶の単語を思い出すためには、反復が必要である。単語が長期記憶にあるとき、反復の周期は著しく長くなる。反復回数を最小化するためのヒューリスティックなアルゴリズムは、生徒のテスト結果を使用し、生徒は、生徒が単語の意味を忘れ始める経過時間を推定し、生徒がその単語を忘れる前に反復および長期記憶のリフレッシュを保証するために、異なる経過時間に異なる単語でテストされる。また、ヒューリスティックなシステムは、単語がどれくらいの頻度で読まれたかを調べるために、生徒が読んだものからのデータを分析し、その単語を含む、生徒が行ったエクササイズを分析する。システムは、特定の生徒のデータと、生徒がカテゴリ分けされたグループからの使用データとに基づいて予測を行う。これらの予測は、その単語を用いた特定のエクササイズを特定の間隔で生徒に与えることによって自動的にテストされる。これらのテストの結果は、システムを駆動するアルゴリズムを更新して、それをより効率的にする。
【0330】
統合されたヒューリスティックな語彙習得の方法は、以下の要素を含む場合がある。
a. 習得されるべき語彙の用語の発音に即したレンダリング(rendering)を提供するステップ、
b. 語根ならびに接頭辞および接尾辞を容易に認識可能にするために発音に即したレンダリングを最適化し、生徒が接頭辞、接尾辞、および語根を理解することによって単語の意味を理解することを支援するステップ、
c. 異なるインタラクティブな語彙習得方法を実験的にテストし、生徒のグループおよび/または個々の生徒の最適な学習戦略を予測するために使用され得るデータベースを作成するためにすべてのユーザのアクティビティをロギングするステップ、
d. 似た学習結果を持つと予測されるユーザグループを作成するためにユーザ登録データを収集し、分析するステップ、
e. 新しいユーザをユーザグループに割り振るためにユーザ登録情報を使用するステップ、
f. 新しいユーザのための最適なインタラクティブなエクササイズおよび最適な復習体制を予測するために、新しいユーザが割り振られたグループのメンバによって収集された使用データを使用するステップ、
g. 予測を実験的にテストし、実際のユーザデータに基づいてユーザに関する予測を修正するステップ、ならびに
h. システムがより効率的になるようにユーザグループの分類、ユーザグループのメンバーシップに基づく予測、およびシステムを駆動するアルゴリズムを修正するために、この新しいユーザデータを使用するステップ。
【0331】
方法は、主たる言語の文字(たとえば、英字)と、主たる言語の文字がその通常の音を出さない場合は、たとえば、主たる言語の文字の上の上付き文字としての主たる言語、副次的言語、またはIPAからの音文字(サイズで)とから構成される、読者のグループにとって意味のある文字を用いる発音に即したアルファベットを中心に構築された、読むこと、聞くこと、話すこと、綴ること、および語彙のためのヒューリスティックで包括的な統合された出版および言語教授システムであって、マークアップが、マークアップされた単語の発音を完全に、明示的に、および曖昧さなく指定し、言語のあらゆる単語が、一貫してマークアップされることが可能であり、マークアップの単語が読者に知られているので、マークアップされた単語の表示が、単語の音も読者に表示する、システムを提供する場合がある。この特徴は、インターフェースの複雑さを減らし、マークアップシステムが音素、音節、または単語の音を完全に、曖昧さなく、および明示的に定義しなかった場合に同じ情報を提供するために必要とされる動作の回数を減らす。より少ない動作を持つことは、コンピュータがより速く機能することを意味する。同様に、綴り文字および音文字によって指定される単語の音とその音素との間の同形関係は、より少ない動作を持つより単純なコンピュータアルゴリズムを可能にする。より少ない動作を持つことは、本明細書において説明されるヒューリスティックな出版および言語教授システムをコンピュータシステムが駆動しているときに、コンピュータシステムがより迅速に実行されることを意味する。
【0332】
実装
本明細書において説明される方法は、C#プログラミング言語で記述されたソースコードからコンパイルされたコンピュータ可読/機械可読命令で具現化されてよい。
【0333】
テキスト文書をエンコードする方法は、特にプログラミングされたコンピューティングシステム200によって遂行/実行される。
【0334】
図2は、特にプログラミングされたコンピューティングシステム200(「コンピュータシステム200」)の概略的なブロック図である。
【0335】
説明される実施形態において、システム200は、32ビットまたは64ビットのインテルアーキテクチャに基づく市販のパーソナルコンピュータまたはサーバコンピュータシステムなどの標準的なコンピュータシステム200を含み、システム200のマイクロプロセッサによって実行または遂行されるプロセスおよび/または方法は、
図2に示されるように、コンピュータシステム200に関連する不揮発性(たとえば、ハードディスク)コンピュータ可読ストレージ204に記憶された1つまたは複数のソフトウェアコンポーネントまたはモジュール202のプログラミング命令の形で実装される。ソフトウェアモジュール202の少なくとも一部は、代替的に、特定用途向け集積回路(ASIC)および/またはフィールドプログラマブルゲートアレイ(FPGA)などの1つまたは複数の専用ハードウェアコンポーネントとして実装される可能性がある。
【0336】
コンピュータシステム200は、バス216によってすべて相互に接続された、以下の標準的な市販のコンピュータコンポーネント、すなわち、ランダムアクセスメモリ(RAM)206、少なくとも1つのコンピュータプロセッサ208、および外部コンピュータインターフェースのうちの少なくとも1つまたは複数を含む。外部コンピュータインターフェースは、ユニバーサルシリアルバス(USB)インターフェース210(そのうちの少なくとも1つは、キーボード、ポインティングデバイス(たとえば、マウス218またはタッチパッド)などの1つまたは複数のユーザインターフェースデバイスに接続される)と、コンピュータシステム200をインターネット220などのデータ通信ネットワークに接続するネットワークインターフェースコネクタ(NIC)212と、液晶ディスプレイ(LCD)パネルデバイスなどのディスプレイデバイスQ322に接続されるディスプレイアダプタ214とを含む。
【0337】
コンピュータシステム200は、オペレーティングシステム(OS)224(たとえば、Linux(登録商標)またはMicrosoft Windows(登録商標))、ウェブサーバソフトウェア226(たとえば、http://www.apache.orgで入手可能なApache)、スクリプト言語モジュール228(たとえば、http://www.php.netで入手可能なパーソナルホームページもしくはPHP、またはMicrosoft ASP)、およびデータがSQLデータベース232に記憶され、SQLデータベース232から取り出される/アクセスされることを可能にする構造化照会言語(SQL)モジュール230(たとえば、http://www.mysql.comから入手可能なMySQL(登録商標))を含む複数の標準的なソフトウェアモジュールを含む。
【0338】
ウェブサーバ226、スクリプト言語228、およびSQLモジュール230は、一緒に、標準的なウェブブラウザソフトウェアを備えた標準的なコンピューティングデバイスを持つインターネット220のユーザがコンピュータシステム200にアクセスし、特に、データベース232にデータを提供し、データベース232からデータを受け取ることを可能にする全般的な能力をコンピュータシステム200に提供する。システム200によってそのようなユーザに提供される特定の機能が、本明細書において説明されるプロセスを実装する1つまたは複数のソフトウェアモジュール202を含むウェブサーバ226によってアクセス可能なスクリプトと、さらに、マークアップ言語(たとえば、HTML、XML)スクリプト、PHP(もしくはASP)、および/またはCGIスクリプト、画像ファイル、スタイルシートなどを含む任意のその他のスクリプトおよびサポートデータ234とによって提供されることは、当業者に理解されるであろう。
【0339】
ソフトウェアモジュール202内のモジュールおよびコンポーネントの間の境界は、例示的であり、代替的な実施形態は、モジュールを合併するか、またはモジュールの機能の代替的な分解を課す場合がある。たとえば、本明細書において検討されるモジュールは、複数のコンピュータプロセスとしておよび任意で複数のコンピュータ上で実行されるサブモジュールに分解される場合がある。さらに、代替的な実施形態は、特定のモジュールまたはサブモジュールの複数のインスタンスを組み合わせる場合がある。さらに、本発明に従って、動作が組み合わされる場合があり、または動作の機能が追加の動作に分散される場合がある。代替的に、そのようなアクションは、複合命令セットコンピュータ(CISC)、縮小命令セットコンピュータ(RISC)のマイクロコード、プログラマブルデバイスまたは消去可能/プログラマブルデバイスにプログラミングされたファームウェア、フィールドプログラマブルゲートアレイ(FPGA)の構成、ゲートアレイまたはフルカスタム特定用途向け集積回路(ASIC)の設計などの、そのような機能を実装する回路の構造に具現化される場合がある。
【0340】
コンピュータシステム200のプロセスの流れ図のブロックの各々は、(ソフトウェアモジュール202の)モジュールまたはモジュールの一部によって実行されてよい。プロセスは、方法を実行するようにコンピュータシステムを構成するために機械可読媒体および/またはコンピュータ可読媒体に具現化される場合がある。ソフトウェアモジュールは、モジュールの機能を実行するようにコンピュータシステムを構成するためにコンピュータシステムのメモリ内に記憶されるおよび/またはコンピュータシステムのメモリに送られる場合がある。
【0341】
コンピュータシステム200は、通常、プログラム(特定のアプリケーションプログラムおよび/またはオペレーティングシステムなどの、内部に記憶された機械可読命令のリスト)に従って情報を処理し、結果として得られた出力情報を入力/出力(I/O)デバイスを介して生成する。コンピュータプロセスは、通常、実行されている(走っている)プログラムまたはプログラムの一部、現在のプログラムの値および状態情報、ならびにプロセスの実行を管理するためにオペレーティングシステムによって使用されるリソースを含む。親プロセスは、親プロセスの全体的な機能の実行を助けるためのその他の子プロセスをスポーンしてよい。親プロセスは、特に、親プロセスの全体的な機能の一部を実行するために子プロセスをスポーンするので、子プロセス(および孫プロセスなど)によって実行される機能は、時として、親プロセスによって実行されると説明される場合がある。
【0342】
データ生成、データ記憶、およびデータ通信動作は、デジタルデータ操作に関する。デジタルデータは、電圧、電流、および/または抵抗を含む場合がある電子的な量によって表される論理回路--二値論理回路を含む場合がある--によって定義される電子データを含んでよい。
【0343】
本明細書において開示されるのは、以下の実装である。
実装1:
エンコードされた単語を発音に即し、読者にとって直観的であるようにするために、
綴り文字および(上付き文字によって表され得る)音文字をそれぞれが含むそれぞれの合成文字を使用することであって、音文字が、
基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
綴り文字を音文字と弁別することが容易であるように表示され、
熟練した読者が目で見て単語を認識する(単語をサイトワード読みする)ことが容易であるように追加され、
各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音文字が人間が読むことができるままであるように綴り文字に追加される、使用することと、
エンコードされた単語の合成文字が、綴り文字のうちのどれが(その文字の)通常の音以外の音を持つかを視覚的に示すように、エンコードされた単語を人間が読むことができる形態/形式で出力することとによって単語をエンコードすることによって単語をエンコードする方法。
実装2:
実装1に記載の方法、および基本アルファベットの文字によって曖昧さなく指定されない音を表す文字および/または記号を追加すること。
実装3:
実装1または2に記載の方法、ならびに音節の区切りを追加することであって、音節の区切りが、音節が強勢を置かれるのかもしくは強勢を置かれないのかを読者に明示的に曖昧さなく知らせる、追加すること、および/または音素もしくは二重音字が有声であるかどうかを読者に明示的に曖昧さなく知らせるための記号を追加すること。
実装4:
音節の区切りが、音節の数を最小化するようにして追加される実装1、2、または3のいずれか1つの方法。
実装5:
綴り文字によって綴られる単語の形が実質的に保たれる実装1から4のいずれか1つの方法。
実装6:
音文字が見やすく、したがって、読者が新しい単語を迅速で効率的に発音することができ、同時に、音文字が、読者による読みの効率を妨げず、綴り文字を使用して綴られた単語を読むことに役立つように表示される実装1から5のいずれか1つの方法。
実装7:
単語が、その単語のIPAのマークアップを使用して完全にまたは部分的にマークアップされる実装1から6のいずれか1つの方法。
実装8:
テキスト文書を変換/エンコードする方法であって、
複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
ソーステキストを、
その単語の音をデコードすることについての1つまたは複数の明示的な情報を有するソーステキストの各単語に関して(つまり、単語および対応するマークアップされた発音に即した単語のデータベースの1単語ずつの検索において)、
エンコードされたテキストが、その単語の音をデコードすることについての明示的な情報を持つソーステキストからの複数の単語を含むように、エンコードされたテキストを人間が読むことができる形態/形式で出力することによってエンコードするステップとを含む、方法。
実装9:
テキスト文書を変換/エンコードする方法であって、
複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
ソーステキストを、
1つまたは複数の文字(「綴り文字」)を有するソーステキストの各単語であって、1つまたは複数の文字(「綴り文字」)が(その文字の)通常の音以外の音を持つと特定される、各単語に関して(すなわち、単語および対応するマークアップされた発音に即した単語のデータベースの1単語ずつの検索において)、綴り文字および(上付き文字によって表され得る)音文字をそれぞれが含むそれぞれの合成文字を持つ代替単語を使用することであって、音文字が、
基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
綴り文字が音文字の通常の音を出すことを示すために綴り文字に追加され、
綴り文字を音文字と弁別することが容易であるように表示され、
各合成文字の綴り文字および音文字が1つの視野内にあるように、綴り文字および音が人間が読むことができるままであるように綴り文字に追加される、使用することによってエンコードするステップと、
エンコードされたテキストが、綴り文字のうちのどれが(その文字の)通常の音以外の音を持つかを視覚的に示す合成文字を持つソーステキストからの複数の単語を含むように、およびエンコードされたテキストの単語の綴り文字によって作られる形がソーステキストのそれぞれの単語の形と実質的に同じであるように、エンコードされたテキストを人間が読むことができる形態/形式で出力するステップとを含む、方法。
実装10:
予め選択された音素セットが、
副次的アルファベットの文字を使用して定義/発音され得る主たるアルファベットの音素に関連する副次的アルファベットの複数の音文字、
副次的アルファベットに存在しない主たるアルファベットの音素に関連する主たるアルファベットの複数の音文字、および/または
副次的アルファベットに存在しないIPAの音素に関連する主たるアルファベットの複数の音文字を含む実装1または9の方法。
実装11:
音節の区切りを示すステップを含む実装1または9の方法。
実装12:
音節の前に記号を追加することによって音節の区切りを示すステップを含む実装1または9の方法。
実装13:
任意で、無音の文字の形を変えることなく、無音の文字を綴り文字と視覚的に区別することによって無音の文字を示すステップを含む実装1または9の方法。
実装14:
無音の文字および音節の区切りを示すステップを含む実装1または9の方法。
実装15:
1つまたは複数のサイズの音文字の追加が、エンコードされたテキストの単語がはっきりと見え、音文字と接触していないように、音文字とそれぞれの綴り文字との間に隙間/スペースを追加することを含む実装1または9の方法。
実装16:
音節の区切りを示すステップであって、音節の区切りが、音節の区切りに続く音節が強勢を置かれるのかまたは強勢を置かれないのかを示す、ステップを含む実装1または9の方法。
実装17:
任意の小文字の音文字のうちの1つまたは複数が、異なるフォントを有することを含め、対応する大文字とは異なるように成形される実装1または9の方法。
実装18:
出力されたテキストが、物理的な印刷された本および/または電子書籍を含む、人間が読むことができる形態/形式であり、方法が、任意で、物理的な本を印刷するステップ、および/または電子書籍を非一時的コンピュータ可読媒体に記憶するステップを含む、実装1または9の方法。
実装19:
音文字が、6:9(音文字のフォントサイズ : 綴り文字のフォントサイズ)の比率でソーステキストのフォントサイズ(「ソースフォントサイズ」)に基づくフォントサイズ(「音フォントサイズ」)を有する実装1または9の方法。
実装20:
音文字が、少なくとも6ポイントのフォントサイズを有する実装1または9の方法。
実装21:
合成文字の名前が、/綴り文字/ says /音文字/および/または/綴り文字/ rhymes with /音文字/である実装1または9の方法。
実装22:
コンピューティングシステムのユーザからのユーザ入力を受け取るステップと、
コンピューティングシステムがユーザ入力に基づいてユーザを複数のカテゴリのうちの1つに分類するステップと、
コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて複数のセットから音素セットを選択するステップとを含む実装1から20のいずれか1つの方法。
実装23:
コンピューティングシステムがユーザの知識の測定された値を生成するステップと、
コンピューティングシステムが測定された値に基づいてユーザを複数のカテゴリのうちの1つに分類するステップとを含む実装22の方法。
実装24:
コンピューティングシステムが、テストテキストを可視的に表示するか、またはテストテキストを可聴的に再生することによって、主たるアルファベットのテストテキストをユーザに提示するステップであって、テストテキストが、少なくとも1つのテスト単語および(テスト単語ではない)1つまたは複数の誤答選択肢単語を含む、ユーザインターフェースを使用してユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、ステップと、
コンピューティングシステムが、ユーザが選択可能な単語のユーザ選択からの値を測定するステップであって、少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/またはテスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、ステップとを含む実装23の方法。
実装25:
音声分析ツールを使用してユーザの発音を分析することによって測定された値を生成するステップを含む実装23の方法。
実装26:
学習されるべき音素を含む異なる音節の音を、同じ生徒カテゴリのその他の生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にした順序で再生すること、
生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にするなまりで音を再生すること、ならびに/または
生徒が基本言語の母語話者よりも易しいと感じるなまりで発音された音節および音素を弁別することができるとき、生徒を、基本言語の母語話者によって発音された音素および音節の聞き取りに移行させることによって測定された値を生成するステップを含む実装23の方法。
実装27:
学習されるべき音素を含む異なる音節の音を、同じ生徒カテゴリのその他の生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にした順序で再生すること、
生徒が学習エクササイズもしくはテストでより多くの正解を出すことを可能にするなまりで音を再生すること、ならびに/または
生徒が基本言語の母語話者よりも易しいと感じるなまりで発音された音節および音素を弁別することができるとき、生徒と同じ母語を持つ人がこれらの音節および音素を話しているのを聞くときに生徒がより易しいと感じた音節および音素の音をまず再生することによって、生徒を基本言語の母語話者によって発音された音素および音節の聞き取りに移行させることによって測定された値を生成するステップを含む実装23の方法。
実装28:
コンピューティングシステムが少なくとも3つのマークアップされた単語を表示することであって、それらのマークアップされた単語のうちの2つが間違いである、表示することと、
コンピューティングシステムが、ユーザがいくつの間違いの単語を選択するかを測定することとによって測定された値を生成するステップを含む実装23の方法。
実装29:
コンピューティングシステムが、少なくとも2つのそれぞれの正しい音節を定義する少なくとも2つの音節を持つ多音節の単語を再生することと、
コンピューティングシステムが、少なくとも2つのそれぞれの空欄、および少なくとも2を超える複数のユーザが選択可能な音節を表示することと、
コンピューティングシステムが、ユーザが選択可能な音節のうちの少なくとも2つを選択するユーザからの入力を受け取ることと、
コンピューティングシステムが、いくつの正しい音節がユーザによって選択された音節の中にあるかを測定することとによって測定された値を生成するステップを含む実装23の方法。
実装30:
コンピューティングシステムが、第1の複数の正しい文字を定義する単語の音を再生することと、
コンピューティングシステムが、第1の複数に等しい空欄を表示することと、
コンピューティングシステムが、第2の複数のユーザが選択可能な文字を表示することであって、第2の複数が第1の複数よりも大きい、表示することと、
コンピューティングシステムが、ユーザが選択可能な文字を選択するユーザからの入力を受け取ることと、
コンピューティングシステムが、いくつの正しい文字がユーザによって選択された文字の中にあるかを測定することとによって測定された値を生成するステップを含む実装23の方法。
実装31:
コンピューティングシステムが、それぞれの複数の単語の音を、単語の再生される音の隣接するものの間に無音の時間があるようにして再生することと、
コンピューティングシステムが、ユーザからの入力に基づいて、再生される音の間の無音の時間を短くすることと、
コンピューティングシステムが、ユーザからの入力に基づいて、(人間同士のしゃべりで使用される)連続した音でゆっくりと単語の音を再生することと、
コンピューティングシステムが、ユーザからの入力に基づいて、(人間同士のしゃべりで使用される)連続した音で通常のしゃべりの速度で単語の音を再生することとによって測定された値を生成するステップを含む実装23の方法。
実装32:
ユーザ入力が、ユーザによって選択された値を含み、方法が、ユーザによって選択された値を、
コンピューティングシステムが、テキスト入力プロンプトおよび/または選択可能なリストをユーザに提示することと、
コンピューティングシステムが、テキスト入力プロンプトおよび/または選択可能なリストにおける入力として、ユーザによって選択された値を受け取ることとによって受け取るステップを含み、
方法が、コンピューティングシステムがユーザによって選択された値に基づいてユーザを複数のカテゴリのうちの1つに分類するステップを含む実装22の方法。
実装33:
テキスト入力プロンプトおよび/または選択可能なリストが、年齢、性別、母語、教育レベル、および/または英語もしくはその他の言語スキルレベルを定義する複数のユーザが選択可能な値を定義する実装32の方法。
実装34:
コンピューティングシステムが、ユーザがユーザアカウントを有する学習管理システム(LMS)に接続することによってユーザを認証し、特定するステップを含む実装32の方法。
実装35:
コンピューティングシステムが、LMSのアプリケーションプログラミングインターフェース(API)を通じて、ユーザがユーザアカウントを有する学習管理システムに接続することによって、ユーザを認証し、特定するステップを含む実装34の方法。
実装36:
ユーザカテゴリおよび/または測定された値を、LMSにユーザの記録とともに記憶するために、ユーザアカウントに関連するLMSに送るステップを含む実装34の方法。
実装37:
コンピューティングシステムが、複数のユーザカテゴリグループの各々のユーザからのデータで訓練された訓練された分類器を使用して、ユーザを複数のカテゴリのうちの1つに分類するステップを含む実装24の方法。
実装38:
コンピューティングシステムが、各部分的音節/音節に関して1音素(無音の文字以外の文字または二重音字)インクリメントして、ソーステキストからの単語を、最初の文字/レターと、徐々に、さらなる文字/レター/二重音字(異なる音を表す2つのレター、たとえば、二重音字「ph」は音/f/を表す)とを含む、複数の個々の音素/部分的音節/音節に分割するステップと、
コンピューティングシステムが、音素の部分的音節/音節を、ユーザが聞くためにコンピューティングシステムのユーザインターフェースから長さの順に漸進的に発音する(再生する)ステップと、
コンピューティングシステムが、ユーザインターフェースを介して、部分的音節/音節を繰り返すようにユーザに指示するステップと、
コンピューティングシステムが、ユーザが音節/部分的音節を話すのを録音するステップと、
コンピューティングシステムが、部分的音節/音節のセットを発音し、それから、ユーザの録音された部分的音節/音節のセットを発音するステップであって、任意で、発音するステップを2回以上繰り返すことを含む、ステップとを含む実装22から37のいずれか1つの方法。
実装39:
コンピューティングシステムが、文字、音節、および単語をユーザインターフェース上に表示し、同時に、音素、音節、および単語を含むサウンドファイルを発音する(再生する)ステップを含む実装38の方法。
実装40:
コンピューティングシステムが、ある/そのユーザが聞くためのテスト音を再生するステップと、
コンピューティングシステムが、言語でテスト音を表す1つのテスト文字または複数のテスト文字を含む複数の文字を表示するステップと、
コンピューティングシステムが、ユーザが1つのテスト文字または複数のテスト文字をクリックするかどうかを測定するステップとを含む実装22から39のいずれか1つの方法。
実装41:
コンピューティングシステムが、主たるアルファベットの音素と、対応するIPA記号によって接続/リンクされた副次的アルファベットの音素とを含む予め定義された音素チャート(たとえば、
図4の日本語音素チャート)を表すデータに基づいて、主たるアルファベットにはあるが副次的アルファベットにはない音素を選択するステップを含む実装22から40のいずれか1つの方法。
実装42:
コンピューティングシステムが、ユーザがテスト文字(および/または音素/音節/単語)を発音するのを録音するステップと、
コンピューティングシステムが、ユーザが聞くためにユーザの録音を繰り返し再生するステップと、
コンピューティングシステムが、ユーザがユーザの録音と予め録音された発音との違いを聞き取ることができるように、ユーザの録音の後に、テスト文字(および/または音素/音節/単語)の予め録音された発音を繰り返し再生するステップとを含む実装22から41のいずれか1つの方法。
実装43:
ソーステキストの音節を特定するステップと、エンコードされたテキストの隣接する音節の間にスペース/音節の区切りを追加するステップとを含む実装22から42のいずれか1つの方法。
実装44:
ソーステキストを、
基本アルファベットから形成された単語の予め選択されたセット内の複数の予め選択された単語のうちの1つと一致するソーステキストの少なくとも1つの単語(「特定された単語」)を特定することであって、特定された単語が、予め選択されたセット内で定義された少なくとも1つの強勢のある音節および/または少なくとも1つの強勢のない音節を含み、各音節が、綴り文字のうちの1つまたは複数を含む、特定することと、
各音節の前にドットを追加することによって、特定された単語を置き換える/調整することであって、音節の綴り文字が、元のままであり、ドットが、強勢のある音節に関しては閉じたドットであり、および/または強勢のない音節に関しては開いたドットである、置き換える/調整することとによってエンコードするステップを含む実装22から43のいずれか1つの方法。
実装45:
コンピューティングシステムのユーザからのユーザ入力を受け取るステップと、
コンピューティングシステムがユーザ入力に基づいてユーザを複数のカテゴリのうちの1つに分類するステップと、
コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、ユーザカテゴリに基づいて、複数の文字セットから、文字が綴り文字および音文字によって構成される最適な文字セットを選択するステップとを含む方法。
実装46:
実装1から21のいずれかの形式にマークアップされた単語のデータベースを自動的に生成する方法。
実装47:
ユーザが英単語に関してマークアップされた発音に即した単語を手動で選択するためのユーザインターフェースを提供するステップを含む実装46の方法。
実装48:
機械可読命令がコンピューティングシステムの1つまたは複数のマイクロプロセッサによって実行/遂行されるときに、コンピューティングシステムに前述の実装のいずれか1つの方法を遂行させるように構成された機械可読命令を含む不揮発性コンピュータ可読ストレージ。
【0344】
解釈
様々な修正が、本発明の範囲を逸脱することなく当業者に明らかになるであろう。
【0345】
本明細書の図または本文中の「/」の存在は、「および/または」を意味するものと理解され、すなわち、「X/Y」は、特に断りのない限り、「X」、または「Y」、または「XとYとの両方」を意味することになる。
【0346】
用語「レター」および用語「文字」は、用法から反対の意図が明らかでない限り、本明細書において同じ意味を持つ。
【0347】
/a/などの線の中の小文字のレターは、たとえば、単語「at」のレター「a」によって出される通常の音を表す。/A/などの線の中の大文字の母音は、単語「ape」において音Aが出すような、母音の名前の音を出す。
【0348】
本明細書で使用されるとき、用語「セット」は、知られている数学的定義に従って(たとえば、Peter J. EcclesによるAn Introduction to Mathematical Reasoning: Numbers, Sets, and Functions、「Chapter 11 : Properties of Finite Sets」(たとえば、140ページに示される)、Cambridge University Press (1998)に記載されているものに対応する方法で)、数学的に少なくとも1の濃度を示す元の空でない有限の組織体に対応するかまたはそのような組織体として定義される(すなわち、本明細書において定義されるセットは、単位集合(unit)、シングレット(singlet)、もしくは単一元の集合、または複数元の集合に対応し得る)。したがって、セットは、少なくとも1つの要素を含む。概して、セットの要素は、検討中のセットの種類に応じて、システム、装置、デバイス、構造、オブジェクト、プロセス、手順、物理パラメータ、もしくは値の1つもしくは複数の部分を含むか、またはそれらの1つもしくは複数の部分であることが可能である。
【0349】
いかなる以前の刊行物(もしくはその刊行物から導き出された情報)または知られているいかなる出版物への本明細書における言及は、以前の刊行物(もしくはその刊行物から導き出された情報)または知られている出版物が本明細書が関連する努力傾注分野(field of endeavor)の技術常識の一部を形成することの承認または容認またはいずれかの形態の示唆として受け取られず、受け取られるべきでない。
【0350】
本明細書および添付の請求項全体を通じて、文脈がそうでないことを必要としない限り、単語「含む(comprise)」ならびに「含む(comprises)」および「含んでいる(comprising)」などの変化形は、明言された完全体(integer)もしくはステップまたは完全体もしくはステップのグループの包含を示唆するが、いかなるその他の完全体もしくはステップまたは完全体もしくはステップのグループの除外も示唆しないと理解される。
【0351】
「背景技術」のセクションに含まれる検討は、そのような検討または参照された文書もしくはデバイスが何らかの形で当技術分野の技術常識の一部を形成するという本発明者または特許出願人による説明と解釈されるべきでない。
【0352】
【0353】
【0354】
【0355】
【0356】
【0357】
【0358】
【0359】
【0360】
【0361】
【符号の説明】
【0362】
100 方法
200 コンピューティングシステム、コンピュータシステム
202 ソフトウェアコンポーネントまたはモジュール
204 コンピュータ可読ストレージ
206 ランダムアクセスメモリ(RAM)
208 コンピュータプロセッサ
210 ユニバーサルシリアルバス(USB)インターフェース
212 ネットワークインターフェースコネクタ(NIC)
214 ディスプレイアダプタ
216 バス
218 マウス
220 インターネット
224 オペレーティングシステム(OS)
226 ウェブサーバソフトウェア
228 スクリプト言語モジュール
230 構造化照会言語(SQL)モジュール
232 SQLデータベース
234 任意のその他のスクリプトおよびサポートデータ
Q322 ディスプレイデバイス
502 「acknowledgement」
504 FEの「acknowledgement」
506 IPAの「acknowledgement」
508 「翻訳」ボタン
【手続補正書】
【提出日】2024-07-17
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
1つまたは複数の形式の基本アルファベットを定義するテキストを含む少なくとも1つの文書を受け取るように構成されたシステムと、
読者が前記文書をより深く理解するための追加データを提供するように構成されたシステムであって、前記読者がそれぞれの発音に即していない単語の音をデコードすることを可能にするために、前記文書の発音に即していない単語をエンコードまたはマークアップする方法を含む、システムと、
前記テキストおよび前記追加データを伴うエンコードされた文書を1つまたは複数の形式で出力するように構成されたシステムと、
を含むコンポーネントを持つ出版システムであって、
エンコードされた単語を発音に即すようにするために、前記発音に即していない単語を自動的にエンコードする方法が、
前記発音に即していない単語の少なくとも1つの文字(「綴り文字」)に関して、前記綴り文字および音文字を含む合成文字を使用することであって、前記音文字が、
前記基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
各綴り文字が前記音文字の通常の音を出すことを示すために前記綴り文字に追加され、
綴り文字が音文字と視覚的に弁別され得るように追加され、
前記単語の綴りが元のままであるので読者が目で見て前記発音に即していない単語を認識し得るように追加され、
各合成文字の前記綴り文字および前記音文字が1つの視野内にあるように、前記綴り文字および前記音文字が人間が読むことができるままであるように前記綴り文字に追加される、使用すること、ならびに
前記エンコードされた単語の前記合成文字が、前記綴り文字のうちのどれが前記綴り文字の通常の音以外の音を持つか、および各文字が前記文字の通常の音を出さないときに前記発音に即していない単語において前記文字がどのような音を出すかを視覚的に示すように、前記エンコードされた単語を人間が読むことができる形態/形式で自動的に出力することを行う、出版システム。
【請求項2】
前記基本アルファベットの複数の単語および前記単語の国際音声記号(IPA)表現を含む単語-IPAペアの辞書/データベースからの入力に基づいて、英単語を、無音の文字、音節の区切り、強勢音節、および/または各文字が出す音を含むエンコードされた単語へと自動的にエンコード/マークアップすることを含み、任意で、エンコード/マークアップされた単語が、
コンピューティングシステムにおいて自動的に、単語-IPAペアの前記辞書/データベースにない1つのIPA文字または複数のIPA文字がIPAマークアップにあるかどうかを判定すること、
コンピューティングシステムにおいて自動的に、前記エンコードされた単語の文字ペアがすべて有効な文字ペアであるかどうかを判定すること、
コンピューティングシステムにおいて自動的に、2つ以上の辞書からの前記IPAマークアップを翻訳し、翻訳を比較し、違いがある場合、前記単語を編集すること、
コンピューティングシステムにおいて自動的に、接頭辞および接尾辞でマークアップされた単語を探し出し、標準化すること、
コンピューティングシステムにおいて自動的に、語根のマークアップを予め定義されたマークアップに自動的に変更し、変更を似た単語と比較することによって前記変更を自動的にチェックさせることを含め、前記語根の前記マークアップができるだけ標準的であることを保証するために前記語根を探し出すために前記マークアップされた単語を分析すること、
コンピューティングシステムにおいて自動的に、同じ語根を持つ単語のマークアップを比較し、前記マークアップが前記語根に関して一貫していることをチェックすること、
コンピューティングシステムにおいて自動的に、1つの母音を持つ単語が1音節の単語であることをチェックすること、および/または子音によって分けられている複数の母音を持つマークアップされた単語が、存在する母音と同じ数の音節をマークアップ内に有することをチェックすること、
コンピューティングシステムにおいて自動的に、新しい音節が作成される場合、すべての前記綴り文字が前記音文字と同じである新しい音節に、一部の綴り文字が異なる音文字を有する音節よりも低いチェックの優先度でフラグを立てることを含め、手動チェックのために前記新しい音節にフラグを立てること、ならびに
コンピューティングシステムにおいて自動的に、前記マークアップされた単語の音節を再生し、このようにして作成された単語の音をエンコードされていない単語の別の録音と自動的に比較することのうちの1つまたは複数によってチェックされる請求項1に記載のシステム。
【請求項3】
エンコードする前記方法が、
前記基本アルファベットから形成された単語の予め選択されたセット内の複数の予め選択された単語のうちの1つと一致するソーステキストの少なくとも1つの単語(「特定された単語」)を特定することであって、前記特定された単語が、前記予め選択されたセット内で定義された少なくとも1つの強勢のある音節および/または少なくとも1つの強勢のない音節を含み、各音節が、前記綴り文字のうちの1つまたは複数を含む、特定することと、
各音節の前にドット/四角を追加することによって前記特定された単語を置き換える/調整することであって、前記音節の前記綴り文字が、元のままであり、前記強勢のある音節の前記ドット/四角が、前記強勢のない音節の前記ドット/四角と視覚的に異なる、置き換える/調整することと
によって音節の区切りを追加することを含め、音節の前に記号を追加することによって音節の区切りを示すことを含む、前記音節の区切りを追加するステップを含む請求項1に記載のシステム。
【請求項4】
エンコードする前記方法が、無音の文字の形を変えることなく、前記無音の文字を前記綴り文字と視覚的に区別することによることを含め、前記無音の文字を示すステップを含む請求項1に記載のシステム。
【請求項5】
前記エンコードされた単語をスクリーン上に静的に表示するか、またはビデオもしくはその他の動的表示システムに動的に表示する1つまたは複数のインタラクティブな教授/練習コンピューティングシステムを含み、前記インタラクティブなコンピューティングシステムが、自動的に
前記インタラクティブなコンピューティングシステムのユーザからのユーザ入力を受け取り、
前記ユーザ入力に基づいて前記ユーザを複数のカテゴリのうちの1つに分類し、
ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、前記ユーザカテゴリに基づいて複数のセットから音素セットを選択するように構成され、
分類することが、
前記コンピューティングシステムが前記ユーザの知識/パフォーマンスの測定された値を生成すること、および
前記コンピューティングシステムが前記測定された値に基づいて前記ユーザを前記複数のカテゴリのうちの1つに分類することを含み、
前記インタラクティブなコンピューティングシステムが、自動的に
テストテキストを可視的に表示するか、または前記テストテキストを可聴的に再生することによって、前記基本アルファベットの前記テストテキストを前記ユーザに提示することであって、前記テストテキストが、少なくとも1つのテスト単語および前記テスト単語ではない1つまたは複数の誤答選択肢単語を含む、ユーザインターフェースを使用して前記ユーザによって選択され得る複数の単語(「ユーザが選択可能な単語」)を含む、提示すること、ならびに
前記ユーザが選択可能な単語のユーザ選択からの値を測定することであって、前記少なくとも1つのテスト単語のうちのいくつがユーザに選択されるか、および/または前記テスト単語を選択するのにどれだけの時間がかけられるかを測定することを含む、測定することを行うように構成される請求項1に記載のシステム。
【請求項6】
コンピューティングシステムにより実施される、テキスト文書を変換/エンコードする方法であって、
複数の単語を形成する基本アルファベットの複数の人間が読むことができる文字を含むソーステキストを表すデータを受け取るステップと、
前記ソーステキストを、
1つまたは複数の文字(「綴り文字」)を有する前記ソーステキストの各単語であって、前記1つまたは複数の文字(「綴り文字」)が前記文字の通常の音以外の音を持つと特定される、各単語に関して、前記綴り文字および音文字をそれぞれが含むそれぞれの合成文字を持つ代替単語を使用することであって、前記音文字が、
前記基本アルファベットおよび/または1つもしくは複数の副次的アルファベットの人間が読むことができる文字であり、
前記綴り文字が前記音文字の通常の音を出すことを示すために前記綴り文字に追加され、
綴り文字が音文字と弁別され得るように表示され、
各合成文字の前記綴り文字および前記音文字が1つの視野内にあるように、前記綴り文字および前記音文字が人間が読むことができるままであるように前記綴り文字に追加される、使用することによってエンコードするステップと、
エンコードされたテキストが、前記綴り文字のうちのどれが前記文字の通常の音以外の音を持つかを視覚的に示す前記合成文字を持つ前記ソーステキストからの前記複数の単語を含むように、および前記エンコードされたテキストの前記単語の前記綴り文字が前記ソーステキストのそれぞれの単語の文字と同じであり、同じ順序であるように、前記エンコードされたテキストを人間が読むことができる形態/形式で出力するステップとを含む、方法。
【請求項7】
前記音文字が、
副次的アルファベットの文字を使用して定義/発音され得る前記基本アルファベットの音素に関連する前記副次的アルファベットの複数の音文字、
前記副次的アルファベットに存在しない前記基本アルファベットの音素に関連する前記基本アルファベットの複数の音文字、および/または
前記副次的アルファベットに存在しない国際音声記号(IPA)の音素に関連する前記基本アルファベットの複数の音文字を含む予め選択された音素セット内にある請求項6に記載の方法。
【請求項8】
1つまたは複数の音文字の追加が、前記エンコードされたテキストの前記単語において、前記綴り文字が前記音文字に接触していないか、または前記音文字が前記綴り文字に接触する場合には、前記音文字の行長の5%未満が前記綴り文字に接触するように、前記音文字とそれぞれの綴り文字との間に隙間/スペースを追加することを含む請求項6に記載の方法。
【請求項9】
任意の小文字の音文字のうちの1つまたは複数が、異なるフォントを有することを含め、対応する大文字とは異なるように成形される、および/または前記綴り文字に対して異なるように配置される請求項6に記載の方法。
【請求項10】
前記音文字が、6:9の比率で前記ソーステキストのフォントサイズ(「ソースフォントサイズ」)に基づくフォントサイズ(「音フォントサイズ」)を有し、および/または前記音文字が、少なくとも6ポイントのフォントサイズを有する請求項6に記載の方法。
【請求項11】
前記ソーステキストを1単語ずつエンコードするための単語のデータベースを自動的に生成するステップを含む請求項6に記載の方法。
【請求項12】
ユーザが前記基本アルファベットの単語に関してマークアップされた発音に即した単語を手動で選択するためのユーザインターフェースを提供するステップを含む請求項11に記載の方法。
【請求項13】
コンピューティングシステムが、インタラクティブなコンピューティングシステムのユーザからおよび/または登録時のユーザ入力からのユーザ入力を受け取るステップと、
前記コンピューティングシステムが前記ユーザ入力に基づいて前記ユーザを複数のユーザカテゴリのうちの1つに分類するステップと、
前記コンピューティングシステムが、ユーザカテゴリと音素セットとの間の予め定義されたマッピングを使用して、前記ユーザカテゴリに基づいて、複数の音素セットから、文字が綴り文字および音文字によって構成される最適な音素セットを選択するステップとを含む請求項11に記載の方法。
【請求項14】
強勢のある音節の前の閉じたドット、および強勢のない音節の前の開いたドット、強勢のある音節の前のドット、および強勢のない音節の前の四角、強勢のある音節の前の開いたドット、および強勢のない音節の前の閉じたドット、または強勢のある音節の前の四角、および強勢のない音節の前のドットによって、前記代替単語の強勢を示すステップを含む請求項6に記載の方法。
【国際調査報告】