(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-04-25
(45)【発行日】2022-05-09
(54)【発明の名称】記録されたメディアからの提案された文書編集の、人工知能を用いた生成
(51)【国際特許分類】
G06F 40/166 20200101AFI20220426BHJP
G06F 40/216 20200101ALI20220426BHJP
【FI】
G06F40/166
G06F40/216
(21)【出願番号】P 2020042546
(22)【出願日】2020-03-12
【審査請求日】2020-03-12
(32)【優先日】2019-03-15
(33)【優先権主張国・地域又は機関】US
【前置審査】
(73)【特許権者】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】スティーブン エー ネルソン
(72)【発明者】
【氏名】北田 博之
(72)【発明者】
【氏名】ラナ ウォン
【審査官】成瀬 博之
(56)【参考文献】
【文献】特開2018-142059(JP,A)
【文献】特開2012-103891(JP,A)
【文献】特表2016-526216(JP,A)
【文献】特表2009-515253(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
G06Q 10/00-99/00
G06F 3/048-3/0489
(57)【特許請求の範囲】
【請求項1】
機器であって、コンテンツ受信部と、会話認識部と、コンテンツ相関部と、文書提示部と、
コンテンツ認識部とを含み、
前記コンテンツ受信部が、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされた1つ以上のメディアコンテンツアイテムを受信し、
前記会話認識部が、前記メディアコンテンツアイテムを文字転写に変換し、前記文字転写から、コメント又は提案された編集を表す単語又はフレーズを認識することにより、前記1つ以上のメディアコンテンツアイテムから、前記1つ以上の電子文書に対するコメント又は提案された編集を表すメディアコンテンツ部分を識別し、
前記メディアコンテンツ部分のうちの各メディアコンテンツ部分について、
前記会話認識部が、該メディアコンテンツ部分に対応する文字転写から、前記電子文書の構造を表す単語又はフレーズを識別し、
前記コンテンツ相関部が、前記会話認識部が識別した、前記電子文書の構造を表す単語又はフレーズに基づいて、前記1つ以上の電子文書から、該メディアコンテンツ部分に対応する文書部分を識別し、該メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す注釈を生成し、前記注釈を前記1つ以上の電子文書のうちの特定の電子文書内の前記文書部分に対応する位置に関連付け、
前記文書提示部が、ディスプレイウインドウに、前記1つ以上の電子文書を、前記メディアコンテンツ部分からの、該1つ以上の電子文書の対応する1つ以上の生成された注釈と共に、表示し、
前記1つ以上のメディアコンテンツアイテムは、オーディオファイル、ビデオファイル、キャプチャされたスクリーンショット、又は対話型ホワイトボードにおいて生成されたマークを表す受信した入力に対応する一連の座標を含む対話型ホワイトボードファイル、のうちの少なくとも1つであ
り、
前記1つ以上の電子文書から、前記メディアコンテンツ部分に対応する前記文書部分を識別することは、
前記コンテンツ認識部が、第1機械学習モデルを用いて、前記1つ以上の電子文書の文書種類に基づき、前記1つ以上の電子文書内の文書部分を識別し、前記文書種類は電子文書のタイトル、フォーマット、章題、キーワードのうちの1つ以上に基づき決定され、前記第1機械学習モデルは、異なる文書種類の複数の文書を用いてトレーニングされている、ことを含む、機器。
【請求項2】
機器であって、コンテンツ受信部と、会話認識部と、コンテンツ相関部と、文書提示部と、を含み、
前記コンテンツ受信部が、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされた1つ以上のメディアコンテンツアイテムを受信し、
前記会話認識部が、前記メディアコンテンツアイテムを文字転写に変換し、前記文字転写から、コメント又は提案された編集を表す単語又はフレーズを認識することにより、前記1つ以上のメディアコンテンツアイテムから、前記1つ以上の電子文書に対するコメント又は提案された編集を表すメディアコンテンツ部分を識別し、
前記メディアコンテンツ部分のうちの各メディアコンテンツ部分について、
前記会話認識部が、該メディアコンテンツ部分に対応する文字転写から、前記電子文書の構造を表す単語又はフレーズを識別し、
前記コンテンツ相関部が、前記会話認識部が識別した、前記電子文書の構造を表す単語又はフレーズに基づいて、前記1つ以上の電子文書から、該メディアコンテンツ部分に対応する文書部分を識別し、該メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す注釈を生成し、前記注釈を前記1つ以上の電子文書のうちの特定の電子文書内の前記文書部分に対応する位置に関連付け、
前記文書提示部が、ディスプレイウインドウに、前記1つ以上の電子文書を、前記メディアコンテンツ部分からの、該1つ以上の電子文書の対応する1つ以上の生成された注釈と共に、表示し、
前記1つ以上のメディアコンテンツアイテムは、オーディオファイル、ビデオファイル、キャプチャされたスクリーンショット、又は対話型ホワイトボードにおいて生成されたマークを表す受信した入力に対応する一連の座標を含む対話型ホワイトボードファイル、のうちの少なくとも1つであ
り、
前記1つ以上の電子文書から、前記メディアコンテンツ部分に対応する前記文書部分を識別することは、
前記コンテンツ相関部が、第2機械学習モデルを用いて、前記会話認識部の識別した前記文字転写と前記電子文書の構造を表す単語又はフレーズに基づき、前記電子文書内の文書部分を識別し、前記第2機械学習モデルは、複数の電子文書からの複数の文書部分と前記複数の文書部分に対応するコメント又は提案された編集とを用いてトレーニングされている、ことを含む、機器。
【請求項3】
更新された1つ以上の電子文書を生成する文書管理部であって、該更新された1つ以上の電子文書の各々は、識別された文書部分に対応する関連付けられた注釈を含む、文書管理部を更に含む請求項1
又は2に記載の機器。
【請求項4】
前記コンテンツ相関部が、前記メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す前記注釈を生成し、前記注釈を前記1つ以上の電子文書の前記特定の電子文書内の前記文書部分に対応する前記位置に関連付けることは、
前記メディアコンテンツ部分の文字転写と前記メディアコンテンツ部分を含む前記メディアコンテンツアイテムへの電子リンクとを含む前記注釈を生成し、前記メディアコンテンツアイテムへの前記電子リンクは、前記メディアコンテンツ部分を再生するためにキューに入れられる、ことと、
前記注釈を、前記1つ以上の電子文書のうちの前記特定の電子文書内の前記文書部分に対応する前記位置に関連付けることと、
を含む、請求項1
又は2に記載の機器。
【請求項5】
前記会話認識部が、前記メディアコンテンツ部分を識別することは、
機械学習モデルを用いて、前記メディアコンテンツ部分を識別し、前記機械学習モデルは、コメントを含む又はコンテンツの編集を提案した会話を含むメディアコンテンツアイテムの入力データセットを用いてトレーニングされている、ことを含む、請求項1
又は2に記載の機器。
【請求項6】
前記会話認識部が、メディアコンテンツ部分を識別することは、前記機械学習モデルを用いて、前記メディアコンテンツ部分の各々について前記コメント又は前記提案された編集を決定することを含み、
前記会話認識部が、前記メディアコンテンツ部分内の会話の明確さ、及び機械学習モデルが前記メディアコンテンツ部分に対応する文字転写をコメント又は提案された編集を表す単語又はフレーズにどれだけ良好に一致させることができるか、のうちの1つ以上に基づき、前記コメント又は前記提案された編集の信頼スコアを計算し、前記信頼スコアは、前記メディアコンテンツ部分により表される前記コメント又は前記提案された編集の信頼レベルを表し、
前記会話認識部が、前記コメント又は前記提案された編集の前記信頼スコアが、前記文書部分を自動的に編集するための信頼スコア閾より高いことを決定し、
前記機器の文書管理部が、前記コメント又は前記提案された編集の中で提案された変更を反映するよう、前記文書部分を自動的に編集する、
請求項
5に記載の機器。
【請求項7】
命令を記憶した1つ以上の非一時的コンピュータ可読媒体であって、前記命令は、コンテンツ受信部と、会話認識部と、コンテンツ相関部と、文書提示部と
、コンテンツ認識部とを含む機器により処理されると、
前記コンテンツ受信部が、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされた1つ以上のメディアコンテンツアイテムを受信するステップと、
前記会話認識部が、前記メディアコンテンツアイテムを文字転写に変換し、前記文字転写から、コメント又は提案された編集を表す単語又はフレーズを認識することにより、前記1つ以上のメディアコンテンツアイテムから、前記1つ以上の電子文書に対するコメント又は提案された編集を表すメディアコンテンツ部分を識別するステップと、
前記メディアコンテンツ部分のうちの各メディアコンテンツ部分について、
前記会話認識部が、該メディアコンテンツ部分に対応する文字転写から、前記電子文書の構造を表す単語又はフレーズを識別するステップと、
前記コンテンツ相関部が、前記会話認識部が識別した、前記電子文書の構造を表す単語又はフレーズに基づいて、前記1つ以上の電子文書から、該メディアコンテンツ部分に対応する文書部分を識別し、該メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す注釈を生成し、前記注釈を前記1つ以上の電子文書のうちの特定の電子文書内の前記文書部分に対応する位置に関連付けるステップと、
前記文書提示部が、ディスプレイウインドウに、前記1つ以上の電子文書を、前記メディアコンテンツ部分からの、該1つ以上の電子文書の対応する1つ以上の生成された注釈と共に、表示するステップと、
を生じさせ、
前記1つ以上のメディアコンテンツアイテムは、オーディオファイル、ビデオファイル、キャプチャされたスクリーンショット、又は対話型ホワイトボードにおいて生成されたマークを表す受信した入力に対応する一連の座標を含む対話型ホワイトボードファイル、のうちの少なくとも1つであ
り、
前記1つ以上の電子文書から、前記メディアコンテンツ部分に対応する前記文書部分を識別することは、
前記コンテンツ認識部が、第1機械学習モデルを用いて、前記1つ以上の電子文書の文書種類に基づき、前記1つ以上の電子文書内の文書部分を識別し、前記文書種類は電子文書のタイトル、フォーマット、章題、キーワードのうちの1つ以上に基づき決定され、前記第1機械学習モデルは、異なる文書種類の複数の文書を用いてトレーニングされている、ことを含む、1つ以上の非一時的コンピュータ可読媒体。
【請求項8】
命令を記憶した1つ以上の非一時的コンピュータ可読媒体であって、前記命令は、コンテンツ受信部と、会話認識部と、コンテンツ相関部と、文書提示部とを含む機器により処理されると、
前記コンテンツ受信部が、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされた1つ以上のメディアコンテンツアイテムを受信するステップと、
前記会話認識部が、前記メディアコンテンツアイテムを文字転写に変換し、前記文字転写から、コメント又は提案された編集を表す単語又はフレーズを認識することにより、前記1つ以上のメディアコンテンツアイテムから、前記1つ以上の電子文書に対するコメント又は提案された編集を表すメディアコンテンツ部分を識別するステップと、
前記メディアコンテンツ部分のうちの各メディアコンテンツ部分について、
前記会話認識部が、該メディアコンテンツ部分に対応する文字転写から、前記電子文書の構造を表す単語又はフレーズを識別するステップと、
前記コンテンツ相関部が、前記会話認識部が識別した、前記電子文書の構造を表す単語又はフレーズに基づいて、前記1つ以上の電子文書から、該メディアコンテンツ部分に対応する文書部分を識別し、該メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す注釈を生成し、前記注釈を前記1つ以上の電子文書のうちの特定の電子文書内の前記文書部分に対応する位置に関連付けるステップと、
前記文書提示部が、ディスプレイウインドウに、前記1つ以上の電子文書を、前記メディアコンテンツ部分からの、該1つ以上の電子文書の対応する1つ以上の生成された注釈と共に、表示するステップと、
を生じさせ、
前記1つ以上のメディアコンテンツアイテムは、オーディオファイル、ビデオファイル、キャプチャされたスクリーンショット、又は対話型ホワイトボードにおいて生成されたマークを表す受信した入力に対応する一連の座標を含む対話型ホワイトボードファイル、のうちの少なくとも1つであ
り、
前記1つ以上の電子文書から、前記メディアコンテンツ部分に対応する前記文書部分を識別することは、
前記コンテンツ相関部が、第2機械学習モデルを用いて、前記会話認識部の識別した前記文字転写と前記電子文書の構造を表す単語又はフレーズに基づき、前記電子文書内の文書部分を識別し、前記第2機械学習モデルは、複数の電子文書からの複数の文書部分と前記複数の文書部分に対応するコメント又は提案された編集とを用いてトレーニングされている、ことを含む、1つ以上の非一時的コンピュータ可読媒体。
【請求項9】
追加命令を更に含み、該追加命令は、前記機器により処理されると、
前記機器の文書管理部が、更新された1つ以上の電子文書を生成するステップであって、前記更新された1つ以上の電子文書の各々は、識別された文書部分に対応する関連付けられた注釈を含む、ステップを生じさせる、請求項
7又は8に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項10】
前記コンテンツ相関部が、前記メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す前記注釈を生成し、前記注釈を前記1つ以上の電子文書の前記特定の電子文書内の前記文書部分に対応する前記位置に関連付けるステップは、
前記メディアコンテンツ部分の文字転写と前記メディアコンテンツ部分を含む前記メディアコンテンツアイテムへの電子リンクとを含む前記注釈を生成するステップであって、前記メディアコンテンツアイテムへの前記電子リンクは、前記メディアコンテンツ部分を再生するためにキューに入れられる、ステップと、
前記注釈を、前記1つ以上の電子文書のうちの前記特定の電子文書内の前記文書部分に対応する前記位置に関連付けるステップと、
を含む、請求項
7又は8に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項11】
前記会話認識部が、前記メディアコンテンツ部分を識別するステップは、
機械学習モデルを用いて、前記メディアコンテンツ部分を識別するステップであって、前記機械学習モデルは、コメントを含む又はコンテンツの編集を提案した会話を含むメディアコンテンツアイテムの入力データセットを用いてトレーニングされている、ステップを含む、請求項
7又は8に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項12】
前記会話認識部が、メディアコンテンツ部分を識別するステップは、前記識別されたメディアコンテンツ部分の各メディアコンテンツ部分について、
機械学習モデルを用いて、前記メディアコンテンツ部分の各々について前記コメント又は前記提案された編集を決定するステップと、
前記会話認識部が、前記メディアコンテンツ部分内の会話の明確さ、及び機械学習モデルが前記メディアコンテンツ部分に対応する文字転写をコメント又は提案された編集を表す単語又はフレーズにどれだけ良好に一致させることができるか、のうちの1つ以上に基づき、前記コメント又は前記提案された編集の信頼スコアを計算するステップであって、前記信頼スコアは、前記メディアコンテンツ部分により表される前記コメント又は前記提案された編集の信頼レベルを表す、ステップと、
前記会話認識部が、前記コメント又は前記提案された編集の前記信頼スコアが、前記文書部分を自動的に編集するための信頼スコア閾より高いことを決定するステップと、
前記機器の文書管理部が、前記コメント又は前記提案された編集の中で提案された変更を反映するよう、前記文書部分を自動的に編集するステップと、
を含む、請求項
7又は8に記載の1つ以上の非一時的コンピュータ可読媒体。
【請求項13】
検出したメディアコンテンツアイテムからコンテンツ提案を自動的に生成する、コンピュータにより実施される方法であって、前記コンピュータは、コンテンツ受信部と、会話認識部と、コンテンツ相関部と、文書提示部と
、コンテンツ認識部とを含み、前記コンピュータにより実施される方法は、
前記コンテンツ受信部が、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされた1つ以上のメディアコンテンツアイテムを受信するステップと、
前記会話認識部が、前記メディアコンテンツアイテムを文字転写に変換し、前記文字転写から、コメント又は提案された編集を表す単語又はフレーズを認識することにより、前記1つ以上のメディアコンテンツアイテムから、前記1つ以上の電子文書に対するコメント又は提案された編集を表すメディアコンテンツ部分を識別するステップと、
前記メディアコンテンツ部分のうちの各メディアコンテンツ部分について、
前記会話認識部が、該メディアコンテンツ部分に対応する文字転写から、前記電子文書の構造を表す単語又はフレーズを識別するステップと、
前記コンテンツ相関部が、前記会話認識部が識別した、前記電子文書の構造を表す単語又はフレーズに基づいて、前記1つ以上の電子文書から、該メディアコンテンツ部分に対応する文書部分を識別し、該メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す注釈を生成し、前記注釈を前記1つ以上の電子文書のうちの特定の電子文書内の前記文書部分に対応する位置に関連付けるステップと、
前記文書提示部が、ディスプレイウインドウに、前記1つ以上の電子文書を、前記メディアコンテンツ部分からの、該1つ以上の電子文書の対応する1つ以上の生成された注釈と共に、表示するステップと、
を含み、
前記1つ以上のメディアコンテンツアイテムは、オーディオファイル、ビデオファイル、キャプチャされたスクリーンショット、又は対話型ホワイトボードにおいて生成されたマークを表す受信した入力に対応する一連の座標を含む対話型ホワイトボードファイル、のうちの少なくとも1つであ
り、
前記1つ以上の電子文書から、前記メディアコンテンツ部分に対応する前記文書部分を識別することは、
前記コンテンツ認識部が、第1機械学習モデルを用いて、前記1つ以上の電子文書の文書種類に基づき、前記1つ以上の電子文書内の文書部分を識別し、前記文書種類は電子文書のタイトル、フォーマット、章題、キーワードのうちの1つ以上に基づき決定され、前記第1機械学習モデルは、異なる文書種類の複数の文書を用いてトレーニングされている、ことを含む、コンピュータにより実施される方法。
【請求項14】
検出したメディアコンテンツアイテムからコンテンツ提案を自動的に生成する、コンピュータにより実施される方法であって、前記コンピュータは、コンテンツ受信部と、会話認識部と、コンテンツ相関部と、文書提示部とを含み、前記コンピュータにより実施される方法は、
前記コンテンツ受信部が、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされた1つ以上のメディアコンテンツアイテムを受信するステップと、
前記会話認識部が、前記メディアコンテンツアイテムを文字転写に変換し、前記文字転写から、コメント又は提案された編集を表す単語又はフレーズを認識することにより、前記1つ以上のメディアコンテンツアイテムから、前記1つ以上の電子文書に対するコメント又は提案された編集を表すメディアコンテンツ部分を識別するステップと、
前記メディアコンテンツ部分のうちの各メディアコンテンツ部分について、
前記会話認識部が、該メディアコンテンツ部分に対応する文字転写から、前記電子文書の構造を表す単語又はフレーズを識別するステップと、
前記コンテンツ相関部が、前記会話認識部が識別した、前記電子文書の構造を表す単語又はフレーズに基づいて、前記1つ以上の電子文書から、該メディアコンテンツ部分に対応する文書部分を識別し、該メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す注釈を生成し、前記注釈を前記1つ以上の電子文書のうちの特定の電子文書内の前記文書部分に対応する位置に関連付けるステップと、
前記文書提示部が、ディスプレイウインドウに、前記1つ以上の電子文書を、前記メディアコンテンツ部分からの、該1つ以上の電子文書の対応する1つ以上の生成された注釈と共に、表示するステップと、
を含み、
前記1つ以上のメディアコンテンツアイテムは、オーディオファイル、ビデオファイル、キャプチャされたスクリーンショット、又は対話型ホワイトボードにおいて生成されたマークを表す受信した入力に対応する一連の座標を含む対話型ホワイトボードファイル、のうちの少なくとも1つであ
り、
前記1つ以上の電子文書から、前記メディアコンテンツ部分に対応する前記文書部分を識別することは、
前記コンテンツ相関部が、第2機械学習モデルを用いて、前記会話認識部の識別した前記文字転写と前記電子文書の構造を表す単語又はフレーズに基づき、前記電子文書内の文書部分を識別し、前記第2機械学習モデルは、複数の電子文書からの複数の文書部分と前記複数の文書部分に対応するコメント又は提案された編集とを用いてトレーニングされている、ことを含む、コンピュータにより実施される方法。
【請求項15】
前記コンピュータの文書管理部が、更新された1つ以上の電子文書を生成するステップであって、前記更新された1つ以上の電子文書の各々は、識別された文書部分に対応する関連付けられた注釈を含む、ステップ、
を更に含む請求項
13又は14に記載のコンピュータにより実施される方法。
【請求項16】
前記コンテンツ相関部が、前記メディアコンテンツ部分に対応する前記コメント又は前記提案された編集を表す前記注釈を生成し、前記注釈を前記1つ以上の電子文書の前記特定の電子文書内の前記文書部分に対応する前記位置に関連付けるステップは、
前記メディアコンテンツ部分の文字転写と前記メディアコンテンツ部分を含む前記メディアコンテンツアイテムへの電子リンクとを含む前記注釈を生成するステップであって、前記メディアコンテンツアイテムへの前記電子リンクは、前記メディアコンテンツ部分を再生するためにキューに入れられる、ステップと、
前記注釈を、前記1つ以上の電子文書のうちの前記特定の電子文書内の前記文書部分に対応する前記位置に関連付けるステップと、
を含む、請求項
13又は14に記載のコンピュータにより実施される方法。
【発明の詳細な説明】
【技術分野】
【0001】
[関連出願]
本願は、米国特許出願番号第14/992,273(代理人管理番号:49986-0859)、名称「Electronic Meeting Intelligence」、2016年1月11日出願;米国特許出願番号第14/992,278(代理人管理番号:49986-0860)、名称「Electronic Meeting Intelligence」、2016年1月11日出願;米国特許出願番号第15/290.855(代理人管理番号:49986-0888)、名称「Managing Electronic Meetings Using Artificial Intelligence and Meeting Rules Templates」、2016年10月11日出願;米国特許出願番号第15/290,856(代理人管理番号:49986-0889)、名称「Creating Agendas for Electronic Meetings Using Artificial Intelligence」、2016年10月11日出願;米国特許出願番号第15/290,858(代理人管理番号:49986-0890)、名称「Selecting Meeting Participants for Electronic Meetings Using Artificial Intelligence」、2016年10月11日出願;米国特許出願番号第15/290,860(代理人管理番号:49986-0891)、名称「Real-Time (Intra-Meeting) Processing Using Artificial Intelligence」、2016年10月11日出願;米国特許出願番号第15/290,861(代理人管理番号:49986-0892)、名称「Post-Meeting Processing Using Artificial Intelligence」、2016年10月11日出願;米国特許出願番号第15/477,240(代理人管理番号:49986-0902)、名称「Electronic Meeting Intelligence」、2017年4月3日出願;米国特許出願番号第15/477,276(代理人管理番号:49986-0903)、名称「Electronic Meeting Intelligence」、2017年4月3日出願;米国特許出願番号第15/728,360(代理人管理番号:49986-0906)、名称「Person Detection, Person Identification and Meeting Start for Interactive Whiteboard Appliances」、2017年10月9日出願;米国特許出願番号第15/728,367(代理人管理番号:49986-0907)、名称「Speech-to-Text Conversion for Interactive Whiteboard Appliances Using Multiple Services」、2017年10月9日出願;米国特許出願番号第15/728,368(代理人管理番号:49986-0910)、名称「Speech-to-Text Conversion for Interactive Whiteboard Appliances in Multi-Language Electronic Meetings」、2017年10月9日出願;米国特許出願番号第15/728,372(代理人管理番号:49986-0911)、名称「Attendance Tracking, Presentation Files, Meeting Services and Agenda Extraction for Interactive Whiteboard Appliances」、2017年10月9日出願;米国特許出願番号第15/728,376(代理人管理番号:49986-0912)、名称「Interactive Whiteboard Appliances With Learning Capabilities」、2017年10月9日出願;米国特許出願番号第15/910,878(代理人管理番号:49986-0919)、名称「Conducting Electronic Meetings over Computer Networks using Interactive Whiteboard Appliances and Mobile Devices」、2018年3月2日出願;米国特許出願番号第16/112,361(代理人管理番号:49986-0935)、名称「Electronic Meeting Intelligence」、2018年8月24日出願;米国特許出願番号第XX/XXX,XXX(代理人管理番号:49986-0937)、名称「Artificial Intelligence Assisted Review of Physical Documents」、2019年3月15日出願;米国特許出願番号第XX/XXX,XXX(代理人管理番号:49986-0938)、名称「Artificial Intelligence Assisted Review of Electronic Documents」、2019年3月15日出願;米国特許出願番号第XX/XXX,XXX(代理人管理番号:49986-0940)、名称「Generating a Meeting Review Document that Includes Links to One or More Documents」、2019年3月15日出願;米国特許出願番号第XX/XXX,XXX(代理人管理番号:49986-0941)、名称「Generating Document Edit Requests for Electronic Documents Managed by a Third Party Document Management Service using Artificial Intelligence」、2019年3月15日出願;米国特許出願番号第XX/XXX,XXX(代理人管理番号:49986-0943)、名称「Updating Existing Content Suggestions to include Suggestions from Recorded Media using Artificial Intelligence」、2019年3月15日出願;に関連し、これらの出願の全内容は、参照により、本願明細書に完全に記載されたかのように、その全体が組み込まれる。
[技術分野]
実施形態は、概して、電子文書の処理に関し、より具体的には、電子文書内のコンテンツについての提案を分析し及び提案される編集を生成するコンピュータソフトウェアに関する。提案される技術グループユニット:2657。提案される分類:704。
【背景技術】
【0002】
この章に記載されるアプローチは、達成しようとされた可能性のあるアプローチであるが、必ずしも従前に考案され又は達成されたアプローチではない。したがって、特に示されない限り、本章に記載されるアプローチは、本願の請求項に対する従来技術ではなく、この章に含まれることにより従来技術と見なされるものではない。
【0003】
専門の及び/又は学術的環境における最も一般的な活動の1つに、文書内で提示される情報のレビューがある。例えば、ビジネス環境では、従業員は1人以上の同業者によりレビューされる必要のある内容(コンテンツ)を含む文書を生成することがある。文書内の内容を議論し、内容に関するフィードバックを提供するために、文書レビュー会議が行われることがある。
【0004】
例えば、文書レビュー会議中に、参加者は、提案される編集及びコメントを文書作成者に伝えることがある。文書作成者は、他の参加者からの入力を受けるとき、確実に全てのフィードバックを書き留め及びフィードバックが文書の改訂に適用されるように、会議中に傾聴しメモを取ることがある。さらに、一部の参加者は、文書の印刷バージョン又は文書の電子バージョン上にフィードバックを提供することがある。レビュー会議の結果は、キャプチャされたメモ、手書きコメント、及び電子コメントの形式の、コメント及び提案された編集の集まりであり得る。しかしながら、集められたコメントを統合することは、会議中に議論された全てのコメントが正確にキャプチャされるようにしようとするとき、課題があり得る。
【0005】
以上に鑑み、会議参加者からのコンテンツ提案を自動的に受信し及び識別し、このような提案を文書に組み込むアプローチが必要である。
【発明の概要】
【0006】
別の実施形態によると、機器は、1つ以上のプロセッサと、命令を記憶した1つ以上のメモリとを含む。1つ以上のプロセッサによる命令の処理は、電子マークアップ文書を生成するために、第1ユーザにより提供されるレビュー及びマークアップのための元のコンテンツを含む物理文書を受信するステップを生じさせる。電子マークアップ文書から、物理文書にマークアップを提供した第1ユーザを識別するユーザコードが識別される。第1ユーザに関連付けられる第1ユーザIDは、識別されたユーザコードに基づき決定される。第1ユーザにより提案されたコンテンツ提案を表す1つ以上の電子マークアップが、生成された電子マークアップ文書から識別される。識別された1つ以上のマークアップのうちの各マークアップについて、マークアップに対応する電子マークアップ文書の元のコンテンツの文書部分が識別される。マークアップ及び第1ユーザIDを含む注釈がマークアップについて生成される。該注釈を識別された文書部分に関連付ける1つ以上のマークアップから生成された1つ以上の注釈を有する元のコンテンツは、ディスプレイウインドウ内に電子的形式で表示される。
【0007】
別の実施形態によると、機器は、1つ以上のプロセッサと、命令を記憶した1つ以上のメモリとを含む。1つ以上のプロセッサによる命令の処理は、レビューのための元の電子文書から元のコンテンツを含む電子文書、及び第1ユーザにより提供された電子マークアップを受信するステップを生じさせる。第1ユーザにより提案されたコンテンツ提案を表す1つ以上の電子マークアップが、電子文書から識別される。識別された1つ以上の電子マークアップのうちの各電子マークアップについて、該電子マークアップに対応する元のコンテンツの文書部分が識別され、電子マークアップ及び第1ユーザの第1ユーザIDを含む電子マークアップの注釈が生成され、該注釈を識別された文書部分に関連付ける。1つ以上の電子マークアップから生成された1つ以上の注釈を有する元のコンテンツは、ディスプレイウインドウ内に電子的形式で表示される。
【0008】
別の実施形態によると、機器は、1つ以上のプロセッサと、命令を記憶した1つ以上のメモリとを含む。1つ以上のプロセッサによる命令の処理は、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされたコンテンツを表す1つ以上のメディアコンテンツアイテムを受信するステップを生じさせる。1つ以上の電子文書のためのコンテンツ提案に対応するメディアコンテンツ部分は、1つ以上のメディアコンテンツアイテムから識別される。メディアコンテンツ部分のうちの各メディアコンテンツ部分について、メディアコンテンツ部分に対応する1つ以上の電子文書から文書部分が識別され、メディアコンテンツ部分を提示する注釈が生成される。注釈は、1つ以上の電子文書のうちの特定電子文書内の文書部分に対応する位置に関連付けられる。メディアコンテンツ部分から生成された1つ以上の注釈を有する1つ以上の電子文書は、ディスプレイウインドウ内に電子的形式で表示される。
【0009】
別の実施形態によると、機器は、1つ以上のプロセッサと、命令を記憶した1つ以上のメモリとを含む。1つ以上のプロセッサによる命令の処理は、1人以上のユーザによる電子文書の議論からキャプチャされたコンテンツを表す1つ以上のメディアコンテンツアイテムを受信するステップを生じさせる。電子文書のためのコンテンツ提案に対応するメディアコンテンツ部分は、メディアコンテンツアイテムから識別される。メディアコンテンツ部分のうちの各メディアコンテンツ部分について、該メディアコンテンツ部分に対応する電子文書の文書部分が識別され、電子文書の文書部分が既存の注釈に関連付けられているか否かに関する決定が行われる。電子文書の文書部分が既存の注釈に関連付けられていると決定すると、既存の注釈はメディアコンテンツ部分に基づき更新される。1メディアコンテンツ部分に関連付けられた1つ以上の更新された注釈を有する電子文書は、ディスプレイウインドウ内に電子的形式で表示される。
【0010】
別の実施形態によると、機器は、1つ以上のプロセッサと、命令を記憶した1つ以上のメモリとを含む。1つ以上のプロセッサによる命令の処理は、第三者管理システムにより管理される電子文書内のコンテンツについてのコンテンツ提案を表すコンテンツ入力を受信するステップを生じさせる。1つ以上のコンテンツ提案は、コンテンツ入力から識別される。コンテンツ入力からの1つ以上のコンテンツ提案のうちの各コンテンツ提案について、該コンテンツ提案に対応する電子文書の文書部分が識別され、コンテンツ提案についての文書提案要求が生成される。文書提案要求は、コンテンツ提案、コンテンツ提案種類、コンテンツ提案に関連付けられたユーザの関連ユーザID、及び識別された文書部分に基づく電子文書位置を含む。1つ以上の生成された文書提案要求は、第三者管理システムへ送信される。
【0011】
一実施形態によると、機器は、1つ以上のプロセッサと、命令を記憶した1つ以上のメモリとを含む。1つ以上のプロセッサによる命令の処理は、1つ以上の電子文書のレビュー会議からキャプチャされたコンテンツを表す1つ以上のメディアコンテンツアイテムを受信するステップを生じさせる。1つ以上のメディアコンテンツアイテムから、レビュー会議中に議論された1つ以上の議題が識別される。レビュー会議中に議論された1つ以上の電子文書のためのコンテンツ提案に対応するメディアコンテンツ部分は、次に、1つ以上のメディアコンテンツアイテムから識別される。メディアコンテンツ部分のうちの各メディアコンテンツ部分について、1つ以上の議題のうちの議題が、メディアコンテンツ部分に関連付けられ、1つ以上の電子文書から、メディアコンテンツ部分に対応する文書部分が識別される。メディアコンテンツ部分のトピックセットを生成するために、メディアコンテンツ部分は、それらの関連付けられた議題に基づき集約される。1つ以上のメディアコンテンツアイテムを再生するよう構成されるメディアコンテンツアイテムプレイヤを含む第1区域と、1つ以上の議題のリストを含む第2区域と、を含む会議要約文書が生成される。リストされた各議題は、メディアコンテンツ部分の対応するトピックセットを含む。会議要約文書は、ディスプレイウインドウ内に提示される。
【図面の簡単な説明】
【0012】
添付の図面中、同様の参照符号は同様の要素を表す。
【0013】
【
図1】実施形態が実施され得る例示的なコンピュータアーキテクチャを示す。
【0014】
【
図2】マークアップ文書から提案された変更に基づき注釈を生成し、生成した注釈と共に文書を表示するアプローチを示すフロー図である。
【0015】
【
図3A】レビューユーザ識別子を含む印刷された文書の例示的な実施形態を示す。
【0016】
【
図3B】電子文書の元のコンテンツ及び元のコンテンツの上に重ね合わされた識別されたマークアップを表示するグラフィカルユーザインタフェースの例示的な実施形態を示す。
【0017】
【
図3C】識別されたマークアップを表す注釈と共に表示された電子文書の例示的な実施形態を示す。
【0018】
【
図4】マークアップ電子文書から受信した提案に基づき注釈を生成し、生成した注釈と共に文書を表示するアプローチを示すフロー図である。
【0019】
【
図5】識別されたマークアップを表す注釈と共に表示された電子文書の例示的な実施形態を示す。
【0020】
【
図6】メディアコンテンツアイテムから提案された変更に基づき注釈を生成し、対応する提案された変更を含む更新された電子文書を生成するアプローチを示すフロー図である。
【0021】
【
図7】識別されたメディアコンテンツ部分を表す注釈と共に表示された電子文書の例示的な実施形態を示す。
【0022】
【
図8】メディアコンテンツアイテムから提案された変更に基づき既存の注釈を更新し、対応する提案された変更を含む更新された電子文書を生成するアプローチを示すフロー図である。
【0023】
【
図9】コンテンツ入力から受信した提案に基づき注釈要求を生成するアプローチを示すフロー図である。
【0024】
【
図10】文書レビュー会議の間にキャプチャされた議論のメディアコンテンツアイテムに基づき会議要約文書を生成するアプローチを示すフロー図である。
【0025】
【
図11】生成した会議要約文書の例示的な実施形態を示す。
【0026】
【
図12】本発明の実施形態が実装され得るコンピュータシステムのブロック図である。
【発明を実施するための形態】
【0027】
以下の説明では、説明を目的として、本発明の実施形態の完全な理解を提供するために、多くの詳細事項が説明される。しかしながら、当業者は、本発明がそのような特定の詳細にかかわらず実施できることを理解するだろう。他の例では、良く知られた構造及び装置が、本発明を不必要に不明瞭にしないために、ブロック図で示される。本発明の種々の態様は、以下の章で記載される。
I.概略
II.アーキテクチャ
A.文書管理
B.知的コンテンツ認識モデル
1.コンテンツ認識サービス
2.マークアップ認識サービス
3.会話認識サービス
4.コンテンツ相関サービス
C.入力/出力サービス
III.手続概要
A.マークアップされた物理文書の処理
B.マークアップされた電子文書の処理
C.提案を含むメディアコンテンツアイテムの処理
D.追加提案による注釈の更新
E.第三者注釈要求の生成
F.会議要約文書の生成
IV.実装メカニズム
【0028】
I.概略
人工知能が、文書処理に導入されて、様々な異なる種類のソースから、レビュー中の電子文書に関連するコンテンツ提案を識別する。コンテンツ提案は、レビュー中文書の中のコンテンツに対するコメント及び提案された編集を表してよい。コンテンツ提案は、文書の印刷されたバージョン上の物理的メモ及びマークアップから、又は文書の電子バージョンの中で識別された変更から、識別されてよい。さらに、コンテンツ提案は、文書レビュー会議のキャプチャされたオーディオ及びビデオ記録から識別されてよい。コンテンツ提案は、Interactive Whiteboard Applianceのような会議提示装置又は他のメディア装置からのスクリーンショット又は他のメディアの形式で受信されてもよい。人工知能は、物理又は電子文書及びメディアコンテンツのような受信したコンテンツ入力を分析し、受信したコンテンツ入力から、レビュー中の文書の文書部分に対応するコンテンツ提案を識別してよい。人工知能は、コンテンツ提案が文書の元のコンテンツに対するコメント又は提案された編集であるかを決定してよい。人工知能は、分析したコンテンツ提案から適切な注釈を生成し、該注釈を文書の元のコンテンツ内の位置に関連付けてよい。新しい注釈を有する文書は、次に、将来のレビューのために、文書作成者のようなユーザに提示されてよい。本願明細書に記載のアプローチは、外部のコンテンツ提案を文書内の元のコンテンツに相関する効率を向上する。したがって、コンテンツ提案を受信し、受信した提案をそれらの対応する文書部分に相関する、より効率的な方法を提供する。
【0029】
II.アーキテクチャ
図1は、実施形態が実施され得る例示的なコンピュータアーキテクチャを示す。
図1は、外部コンテンツ入力の受信及びレビュー中文書の電子表現への統合をサポートする文書管理システム100の種々の例を含む。文書管理システム100は、文書管理サービス105、コンテンツ受信サービス110、ユーザ識別管理サービス115、注釈生成サービス120、知的コンテンツ認識モデル130、多機能印刷サービス140、文書提示サービス150、ネットワーク160、及びデータレポジトリ170を含む。
図1に示す幾つかの要素は、説明の目的で他の図には示されないことがある。しかし、これらの要素は、他の図の要素に含まれてもよい。
【0030】
文書管理システム100によりサポートされる文書レビュー会議は、1つ以上の文書が1人以上の参加者によりレビューされる任意の種類の電子的又は直接会議を含んでよい。文書管理システム100は、レビュー中文書のコンテンツを管理してよく、会議中に議論されたコンテンツ提案及び編集をレビュー中文書に自動的に適用してよい。
【0031】
一実施形態では、文書管理システム100は、コンピュータのネットワークを表す。「コンピュータ」は、1又は複数の物理的コンピュータ、仮想コンピュータ、及び/又はコンピューティング装置であってよい。コンピュータは、クライアント及び/又はサーバであってとい。本願明細書における「コンピュータ」への言及は、特に明示的に断りのない限り、1又は複数のコンピュータを意味することがある。
図1に示したモジュール/サービスの各々は、実行可能命令がロードされ及び実行されると文書管理システム100に該モジュールを参照して本願明細書に記載される機能又は動作を実行させる1つ以上のコンピュータ内の、RAMのようなメインメモリの1つ以上のページのセットを含んでよい。さらに、文書管理サービス105は、実行されると本願明細書に記載される電子文書管理及び記憶を実行させる命令を含むRAM内のページのセットを含んでよい。命令は、CPUの命令セットの中の機械実行可能コードの中にあってよく、JAVA(登録商標)、C、C++、OBJECTIVE-C、又は任意の他の人間により読み取り可能なプログラミング言語若しくは環境で、単独で又はJAVASCRIPT(登録商標)、他のスクリプト言語及び他のプログラミングソーステキストにおけるスクリプトと結合して、記述されたソースコードに基づきコンパイルされていてよい。用語「ページ」は、メインメモリ内の任意の領域を広義に表すことを意図する。システムにおいて使用される特定の用語は、メモリアーキテクチャ又はプロセッサアーキテクチャに依存して変化することがある。別の実施形態では、文書管理システム100内の各コンポーネントは、また、1つ以上のコンピュータ内の不揮発性RAM又はディスク記憶装置のような大容量記憶装置にデジタル方式で格納されたソースコードの1つ以上のファイル又はプロジェクトを表してよく、これは、コンパイルされ又はインタープリットされると実行可能命令の生成を生じ、実行可能命令は、実行されると、文書管理システム100に、上述のモジュールを参照して本願明細書に記載される機能又は動作を実行させる。言い換えると、図面は、プログラマ又はソフトウェア開発者が、実行可能形式への後のコンパイル、又は文書管理システム100による実行のためにバイトコード若しくは等価物へのインタープリットのために、ソースコードを編成し構成する方法を提示し得る。
【0032】
A.文書管理
一実施形態では、コンテンツ受信サービス110は、レビュー中文書に関連するコンテンツを受信するための命令を含んでよい。コンテンツ受信サービス110は、元のコンテンツ、マークアップされたコンテンツ、及び/又はレビュー中文書に関連する提案された変更若しくはコメントを受信してよい。例えば、コンテンツ受信サービス110は、レビューのための元の文書を含む電子ファイルを受信してよい。別の例では、コンテンツ受信サービス110は、元のコンテンツ及び元のコンテンツに対するマークアップの両方を含む電子ファイルを受信してよい。更に別の例では、コンテンツ受信サービス110は、オーディオファイル、ビデオファイル、又は画像ファイルのような、レビュー中文書に関連する提案された変更又はコメントを含むコンテンツメディアアイテムを受信してよい。
【0033】
コンテンツ受信サービス110は、受信した電子文書を文書管理サービス105に送信するよう構成されてよい。一実施形態では、文書管理サービス105は、受信した電子文書について元のコンテンツを識別し、元の文書に対するマークアップとしてコンテンツを識別し、ユーザを彼らの対応するマークアップに関連付け、及び、或いは、コンテンツの記憶及び通信、及び電子文書に対するコンテンツ提案を管理する命令を含んでよい。例えば、コンテンツ受信サービス110は、文書の元のバージョンを表す電子文書を、文書管理サービス105に送信してよい。文書管理サービス105は、電子ファイルから、レビューのための文書の元のバージョンを表す元のコンテンツを識別してよい。別の例では、コンテンツ受信サービス110は、マークアップを含む文書のバージョンを文書管理サービス105に送信してよい。文書管理サービス105は、文書のマークアップバージョンの中の1つ以上のマークアップを識別するために、文書のマークアップバージョンからのコンテンツを、前に受信した文書の元のコンテンツと比較してよい。
【0034】
一実施形態では、文書管理サービス105は、マークアップを作成したユーザを示す、文書のマークアップバージョンにおける1つ以上のコード及び/又はマークを識別してよい。例えば、コンテンツ受信サービス110により受信した文書のマークアップバージョンは、特定ユーザを識別するカスタムバーコード又はQRコード(登録商標)を含んだ、文書の印刷されたバージョンに起因していてよい。文書の印刷されたバージョンは、特定ユーザを、マークを手書きしたレビュアーとして識別するために使用され得るカスタムIDコードを含んでよい。文書管理サービス105は、文書のマークアップバージョン内のコードを識別してよく、該コードに関連付けられた特定ユーザを識別するために、識別したコードをユーザID管理サービス115に送信してよい。
【0035】
一実施形態では、ユーザID管理サービス115は、マークアップ文書内のカスタムIDコードに関連付けられたユーザを識別するための命令を含んでよい。データレポジトリ170は、ユーザとカスタムIDコードとの間の関連付けを格納するよう構成されてよい。ユーザID管理サービス115は、受信したマークアップ文書にあるカスタムIDコードに関連付けられたユーザを決定するために、データレポジトリ170と通信して、ユーザ-IDコード関連付けを読み出してよい。例えば、コンテンツ受信サービス110は、特定IDコードを含むマークアップ文書を受信してよい。コンテンツ受信サービス110は、文書を文書管理サービス105に送信してよい。文書管理サービス105は、文書内で、特定IDコードを識別してよく、特定IDコードをユーザID管理サービス115に送信してよい。ユーザID管理サービス115は、特定IDコードを受信してよく、データレポジトリ170にクエリして、特定IDコードに関連付けられた特定ユーザを決定してよい。特定IDコードに関連付けられた特定ユーザを決定すると、ユーザID管理サービス115は、特定ユーザの識別子を文書管理サービス105に送信してよい。その結果、文書管理サービス105は、受信した電子文書からのマークアップを、該マークアップを作成した適切なユーザに関連付けてよい。
【0036】
一実施形態では、注釈生成サービス120は、1つ以上の注釈を生成し、注釈を文書の元のコンテンツ内の位置に関連付けるための命令を含んでよい。例えば、文書管理サービス105は、文書も元のコンテンツ、及び文書について識別されたマークアップを管理してよい。文書管理サービス105は、注釈生成サービス120に要求を送信してよい。注釈生成サービス120は、要求を受信してよく、識別されたマークアップを含む新しい注釈を生成してよく、新しく生成した注釈を、識別されたマークアップに対応する文書部分に対応する元のコンテンツ内の位置に関連付けてよい。別の例では、注釈生成サービス120は、追加マークアップを含めるために、既存の注釈を更新する要求を受信してよい。注釈生成サービス120は、既存の注釈を識別してよく、追加マークアップを既存の注釈に挿入してよい。
【0037】
一実施形態では、新しい注釈を生成すること及び/又は既存の注釈を更新することは、コメントを生成すること及び/又は更新することに限定されない。注釈は、文書内のコンテンツに対する提案された編集を表してもよい。例えば、マークアップが単語「不可能な(impossible)」を「起こりにくい(highly unlikely)」に変更することを示す場合、注釈生成サービス120は、元のコンテンツからの単語「不可能な」を「起こりにくい」に更新する要求を受信してよい。注釈生成サービス120は、マークアップを表す提案された編集注釈を生成してよく、提案された編集及び編集を提案したユーザを示すコメントも含んでよい。
【0038】
図3Bは、電子文書の元のコンテンツ及び元のコンテンツの上に重ね合わされた識別されたマークアップを表示するグラフィカルユーザインタフェースの例示的な実施形態を示す。注釈330A及び340Aは、注釈生成サービス120により生成された提案された編集である注釈を表す。注釈330A及び340Aは、提案された編集として解釈されているマークアップに基づく。注釈330Aは、単語「this」に引かれた取消線を表すマーク330に基づく。取消線は、単語「this」を削除する提案として解釈されてよい。注釈340Aは、単語「holigram」を囲む手書きされた円を表すマーク340に基づく。単語「holigram」は、単語「hologram」の誤記であり、マーク340は「holigram」のスペルを修正する提案として解釈されてよい。注釈335Aは、「do we want to show the 22” model?」という手書きメモへの線を有する単語の強調表示区域を表すマーク335に基づく。マーク335はコメントとして解釈されてよい。
【0039】
一実施形態では、生成された注釈は、注釈種類を反映するためにカスタマイズされてよい。例えば、注釈335Aは、コメント注釈を表すために、黄色のような1つの特定の色で着色されてよい。一方で、注釈330A及び340Aは、提案された編集注釈を表すために、赤のような別の色で着色されてよい。一実施形態では、注釈は、注釈に関連付けられたユーザのユーザIDを含んでよい。注釈は、注釈340A内のチェックボタン341及び拒否ボタン342のような、提案された編集を受け入れる又は拒否するために使用されてよい選択可能アクションボタンを含んでもよい。注釈は、生成された注釈に関連するコンテンツ入力への電子リンクも含んでよい。例えば、注釈は、注釈に関連するキャプチャされた議論のオーディオファイルへの電子リンクを含んでよい。電子リンクは、スクリーンショット、又はマークアップの他の画像、又は提案されたコメント若しくは変更へのリンクであってもよい。電子リンクは、電子リンクにより指定されたファイル、ウェブページ、オブジェクト、又は任意の他の行き先への任意の種類のリンク、ハイパーリンク、又はショートカットであってもよい。
【0040】
一実施形態では、ネットワーク160は、A及びBの間のデータ交換を提供する通信媒体又はメカニズムを表してよい。ネットワーク160の例は、LAN(Local Area Network)、WAN(Wide Area Network)、イーサネット(登録商標)若しくはインターネットのようなネットワーク、又は1つ以上の地上波、衛星若しくは無線ネットワークを含むが、これらに限定されない。一実施形態では、データレポジトリ170は、文書、マークアップ、注釈、関連付けられたメディアコンテンツアイテム、及び文書及び注釈管理に関連付けられた任意の他のデータオブジェクトに関連する任意の種類のデータを格納するよう構成されてよい。
【0041】
B.知的コンテンツ認識モデル
一実施形態では、知的コンテンツ認識モデル130は、受信した電子文書について文書種類及び文書部分を識別し、手書きメモから提案されたコンテンツを決定し、メディアコンテンツアイテムからコンテンツ提案を決定し、及びコンテンツ提案と文書部分との間の相関を決定するよう構成される1つ以上のサービスを実装するための命令を含んでよい。知的コンテンツ認識モデル130は、コンテンツ認識サービス131、マークアップ認識サービス132、会話認識サービス133、及びコンテンツ相関サービス134で構成されてよい。
【0042】
一実施形態では、知的コンテンツ認識モデル130は、コンテンツ認識サービス131、マークアップ認識サービス132、会話認識サービス133、及びコンテンツ相関サービス134の各々により使用され得る1つ以上の機械学習モデルをトレーニングし及び実行するための命令を含んでよい。知的コンテンツ認識モデル130は、種々の機械学習アルゴリズム及び構造を使用して、1つ以上の機械学習モデルを実装してよい。例示的な機械学習アルゴリズムは、人工ニューラルネットワーク、深層ニューラルネットワーク、畳み込みニューラルネットワーク、再帰型ニューラルネットワーク、分類器、及び他の教師あり又は教師無し機械学習アルゴリズムを含む。提案される方法及びシステムは、任意の適切な機械学習アルゴリズム又はアーキテクチャを使用して実装されてよい。
【0043】
1.コンテンツ認識サービス
一実施形態では、コンテンツ認識サービス131は、文書内のコンテンツ部分、文書のフォーマット及びスタイル、並びに元の電子文書のコンテンツ内の他の指示子に基づき、元の電子文書の文書種類を識別するよう構成された命令を含んでよい。例えば、コンテンツ認識サービス131は、入力として、特許出願書類の草案である元の電子文書を受信してよい。コンテンツ認識サービス131は、タイトル、章題、フォーマット、コンテンツ内のキーワード、及び元の電子文書の文書種類を示し得る任意の他の特性を含む、元の電子文書のコンテンツを分析してよい。例えば、元の電子文書が特許出願書類の草案である場合、コンテンツ認識サービス131は、「背景技術」、「図面の簡単な説明」、「発明を実施するための形態」、「特許請求の範囲」、及び「要約」のような章の名称を識別し及び分析し、章題に基づき、元の電子文書が特許出願のための文書種類であると決定してよい。
【0044】
一実施形態では、コンテンツ認識サービス131は、電子文書の文書種類を決定するよう構成された機械学習モデルを実装するよう構成されてよい。機械学習モデルは、入力として電子文書を受信し、電子文書の文書種類を指定する出力を、タイトル、章題、フォーマット、コンテンツ内のキーワード、及び電子文書の任意の他の特性に基づき生成するよう構成されてよい。さらに、機械学習モデルは、決定した文書種類のコンテキスト固有特性のデータセットを出力してよい。例えば、コンテキスト固有特性は、キーワード、フレーズ、フォーマット、及び、受信したコンテンツ提案の提案種類及び位置を決定するのを助けるために使用され得る任意の他の特性を定めてよい。
【0045】
一実施形態では、機械学習モデルは、各文書種類を定義する識別された文書特性に基づき特定文書種類として分類されている文書セットを含むトレーニングデータセットを用いて、文書種類を決定するようトレーニングされてよい。例えば、トレーニングデータセットは、文書を含み、及び、特許出願文書種類、契約文書種類、提案文書種類、技術仕様文書種類のいずれかとして分類される識別された文書特性を記録してよい。
【0046】
一実施形態では、機械学習モデルは、マークアップを元のコンテンツに相関するときに使用され得る元のコンテンツからの文書部分を識別するよう構成されてよい。文書部分は、表題、章、段落、文、製品の説明及び名称のような、特定キーワード、及び特定フレーズを表してよい。例えば、文書種類が技術仕様文書である場合、文書内の章及び小区分は、部分として識別されてよい。さらに、「対話型支援サービス(Interactive Assistance Service)」及び「IFDP」のような特定の製品キーワードが、キーワード部分として識別されてよい。
【0047】
2.マークアップ認識サービス
一実施形態では、マークアップ認識サービス132は、物理文書から識別された手書きメモを解釈し、該手書きメモの文字転写(Transcription)を生成するよう構成される命令を含んでよい。例えば、マークアップ認識サービス132は、入力として、マークアップ文書からの手書きメモ、つまり「このアイデアを拡張できるか(can we expand on this idea)」の画像を受信してよい。マークアップ認識サービス132は、手書きメモの画像を分析し、手書きメモの意味を決定し、メモの解釈を表すテキストを生成してよい。マークアップ認識サービス132は、手書きメモのテキスト転写及び意味に基づき、コメント又は提案された編集のようなコンテンツ提案種類を決定してよい。本例を用いると、メモ「can we expand on this idea」は、マークアップ認識サービス132によりコメントとして解釈されてよい。一方で、単語「impossible」の取消線に続き「change to ‘highly unlikely'」と記述している注を含む手書きメモは、提案された編集として解釈されてよい。
【0048】
一実施形態では、マークアップ認識サービス132は、手書きメモをテキストに変換するよう構成された機械学習モデルを実装するよう構成されてよい。機械学習モデルは、手書きメモの画像を入力として受信するよう構成されてよく、変換された文字キャラクタセットを出力として生成してよい。一実施形態では、機械学習モデルは、手書きメモのトレーニング画像セット及び1人以上のユーザからの対応する文字転写を含むトレーニングデータセットを用いて、手書きメモの文字転写を決定するようトレーニングされてよい。例えば、トレーニング画像セットは、手書きの言葉、書簡、速記、及び1人以上のユーザにより使用され得る他の記号を含んでよい。一実施形態では、機械学習モデルは、文書種類をモデルに入力するよう更に構成されてよい。入力された文書種類は、各手書きメモの文書コンテキストを指定することにより、文字転写精度を向上するために使用されてよい。例えば、文書種類が化学に関連する学術論文である場合、機械学習モデルは、「CO2」という手書きメモを化合物として識別し、該メモを「CO2」又は「二酸化炭素」に変換するようにトレーニングされてよい。
【0049】
一実施形態では、マークアップ認識サービス132により実装される機械学習モデルは、マークアップの文字転写に信頼スコアを割り当てるよう構成されてよい。信頼スコアは、モデルトレーニングデータに基づき、機械学習モデルの出力がどれくらい正確であるかを定める値を表してよい。例えば、機械学習モデルは、単語の上にある線の位置、線の角度、線の色、及び取り消しが他のマークに関連付けられるか否かに基づき、単語「this」の取り消しの解釈に高い信頼スコアを割り当ててよい。反対に、単語「this」の取り消しが単語の下に重なり、マークが取り消しか下線かが不明確である場合、機械学習モデルは低い信頼スコアを割り当ててよい。
【0050】
3.会話認識サービス
一実施形態では、会話認識サービス133は、オーディオ及び/又はビデオからキャプチャした会話を変換された文字に翻訳するよう構成される命令を含んでよい。例えば、会話認識サービス133は、入力として、文書レビュー会議から、録音されたオーディオファイルの一部を受信してよい。会話認識サービス133は、オーディオコンテンツを分析し、オーディオコンテンツ内の発話された単語を表す変換された文字を決定してよい。
【0051】
一実施形態では、会話認識サービス133は、キャプチャされた会話を変換された文字に翻訳するよう構成された機械学習モデルを実装するよう構成されてよい。機械学習モデルは、変換されるべきキャプチャされた会話を表すメディアコンテンツアイテムを含む入力を受信するよう構成されてよい。機械学習モデルは、出力として、キャプチャされた会話の文字転写を生成してよい。一実施形態では、機械学習モデルは、会話の部分及び対応する文字転写を含むトレーニングデータセットを用いてトレーニングされてよい。例えば、トレーニングデータは、複数の異なるユーザにより発話されたフレーズ、及び対応する意味を含んでよい。トレーニングデータ内の発話されたフレーズは、会話がどのように変換されるかに影響を与え得る、アクセント、主題、及び識別された背景雑音のような属性も含んでよい。
【0052】
一実施形態では、会話認識サービス133の機械学習モデルは、コメント又は提案された編集のいずれかのコンテンツ提案を示すメディアコンテンツ部分を識別するよう構成されてよい。メディアコンテンツアイテム内の検出された会話は、会話から文字へと変換されてよい。文字は、次に、レビューされた文書の提案された編集又はコメントのいずれかを示し得る特定の単語又はフレーズについて分析されてよい。例えば、「the word... is duplicated」、「we need more examples」、「the introduction is too short」、「the word... is misspelled」、「could you update figure X」のような発言は、特定のメディアコンテンツ部分が文書について提案された編集又はコメントに関連することを示してよい。機械学習モデルは、「on the second page」、「the final paragraph」、「the sentence starting with」、等のような文書内の位置を示し得る発言も識別してよい。機械学習モデルの出力は、レビューされた文書についての可能性のある提案された編集として識別されたメディアコンテンツ部分のセットを含んでよい。
【0053】
一実施形態では、会話認識サービス133により実装される機械学習モデルは、識別されたメディアコンテンツ部分のセットの文字転写に信頼スコアを割り当てるよう構成されてよい。信頼スコアは、モデルトレーニングデータに基づき、機械学習モデルの出力がどれくらい正確であるかを定める値を表してよい。信頼スコアの決定は、メディアコンテンツ部分内の会話の明確さ、及び機械学習モデルがメディアコンテンツ部分内の話された会話に変換された単語及びフレーズをどれだけ良好に一致させることができるか、に基づいてよい。例えば、会話が不明瞭である、又は話者が非常に速く話す場合、機械学習モデルは、変換された文字に低い信頼スコアを割り当ててよい。
【0054】
4.コンテンツ相関サービス
一実施形態では、コンテンツ相関サービス134は、電子文書の文書部分と、手書きメモからの変換文字、キャプチャされた会話、スクリーンショット画像、及び任意の他のメディアとの間の一致を識別するよう構成される命令を含んでよい。例えば、コンテンツ相関サービス134は、入力として、電子文書の元のコンテンツ、及び手書きマークアップから又はキャプチャされた会話からのものであるコンテンツ提案の文字転写を受信してよい。コンテンツ相関サービス134は、元のコンテンツ内の文書部分を識別してよく、1つ以上の文書部分がコンテンツ提案の文字転写と一致するか否かを決定してよい。代替として、コンテンツ相関サービス134は、文書種類を指定する入力を受信してよい。該入力は、文字転写と元のコンテンツの文書部分との間の一致を決定するために更に使用されてよい。
【0055】
一実施形態では、コンテンツ相関サービス134は、文字転写と文書部分との間の一致を決定するよう構成された機械学習モデルを実装するよう構成されてよい。機械学習モデルの入力は、文書の元のコンテンツ、文書種類、及び手書きメモから又はキャプチャされた会話から提案されたコンテンツを表す文字転写を含んでよい。機械学習モデルは、文字転写に対応する文書部分及び/又は元のコンテンツ内の前後関係に依存する(positional)位置を出力してよい。例えば、電子文書種類が研究論文であり、文字転写が「reference 49 is incorrect」に等しい場合、機械学習モデルは、文字転写が電子文書内の参照脚注を表すことを、脚注を含む文書の文書種類及び識別された文書部分に基づき決定してよい。機械学習モデルは、脚注49に対応する、元のコンテンツ内の位置を出力してよい。機械学習モデルは、電子文書の複数の文書部分及び電子文書の複数の文書部分からのコンテンツ提案の対応する文字転写を用いてトレーニングされていてよい。
【0056】
C.入力/出力サービス
文書管理システム100は、文書を受信し及び解釈された注釈を含む電子文書を提示する1つ以上の入力及び出力サービスを含んでよい。一実施形態では、多機能印刷サービス140は、物理文書をスキャンするよう構成される1つ以上の多機能プリンタ装置を表してよい。例えば、多機能印刷サービスは、元の文書又はマークアップ物理文書をスキャンするために使用されてよい。多機能印刷サービス140は、スキャンした文書を、データオブジェクトとして、処理のためにコンテンツ受信サービス110に送信してよい。別の実施形態では、多機能印刷サービス140は、レビュアー及び他のユーザに分配するために、電子文書の物理的バージョンを印刷するための要求を受信してよい。
【0057】
一実施形態では、文書提示サービス150は、対応する注釈を含む1つ以上の電子文書を提示するグラフィカルユーザインタフェースを実装するための命令を含んでよい。例えば、文書提示サービス150は、電子文書からのコンテンツを表示するための1つ以上のコンテンツウインドウ枠、表示されたコンテンツに対応する1つ以上の注釈、及びレビュアー又は他のユーザに基づく注釈及び他のコンテンツをフィルタリングするための表示オプション制御を含むグラフィカルユーザインタフェースを生成してよい。
【0058】
III.手続概要
以下の章は、複数の異なる入力サービスからの文書提案を受信し及び合併することを含む、文書レビューを実装するための実施形態を説明する。
【0059】
A.マークアップされた物理文書の処理
一実施形態では、文書管理システム100は、物理的な紙の形式の文書マークアップを受信し、コンテンツ提案を識別し、レビュー中文書のコンテンツ提案についての注釈を生成することにより、文書レビューを支援するために使用されてよい。例示的な機能は、限定ではなく、コンテンツ提案の1つ以上のマークアップを含む1つ以上のマークアップ文書を受信すること、コンテンツ提案の種類を識別すること、各コンテンツ提案の注釈を生成すること、生成した注釈をレビュー中文書の文書部分に関連付けること、ディスプレイウインドウ内に生成した注釈の中の文書を表示すること、を含む。
【0060】
文書管理システム100は、マークアップされていないコンテンツを含む元の文書を受信し、レビューのための元のコンテンツを決定するよう構成されてよい。元のコンテンツは、1人以上のユーザによるレビューを受けるコンテンツを表してよい。一実施形態では、多機能印刷サービス140は、紙文書を受け、スキャンするスキャナを表してよい。多機能印刷サービス140は、PDF(Portable Document Format)ファイルのようなスキャンされた画像を生成してよい。多機能印刷サービス140は、元の文書のPDFファイルを、コンテンツ受信サービス110に送信してよい。コンテンツ受信サービス110は、PDFファイルを文書管理サービス105に送信してよい。文書管理サービス105は、PDFファイルを分析し、レビューのためにマークされるべき元のコンテンツを識別してよい。文書管理サービス105は、元のコンテンツをデータレポジトリ170に格納してよい。
【0061】
別の実施形態では、多機能印刷サービス140は、スキャンした物理文書から元のコンテンツを識別し及び元のコンテンツをデータレポジトリ170に格納する能力を有する多機能プリンタを表してよい。例えば、多機能印刷サービス140は、文書管理システム100内の種々のサービスと通信するために、プラグインソフトウェアにより構成されてよく、又はAPI(application programming interface)を利用してよい。APIは、元のコンテンツの識別及び元のコンテンツのデータレポジトリ170への記憶を実施する関数呼び出しを含んでよい。
【0062】
スキャンした物理文書から元のコンテンツを識別すると、文書管理システム100は、1人以上のレビューユーザに分配されてよい物理文書の1つ以上のコピーを生成してよい。一実施形態では、文書管理サービス105は、1つ以上の物理文書を生成するための印刷要求を、多機能印刷サービス140に送信してよい。印刷要求は、レビューユーザのユーザ識別子を含んでよい。例えば、文書レビュー会議がユーザA~Dにより予定されている場合、印刷要求はユーザA~Dを指定してよい。その結果、文書の4枚のコピーが印刷され、各々の印刷された文書はユーザA~Dのうちの1人を識別する識別子を含む。
【0063】
一実施形態では、文書管理システム100は、文書の元のコンテンツにより識別される名前に基づき、可能性のあるレビュアーを決定してよい。例えば、文書が複数の著者による研究論文である場合、文書管理システム100は、著者の名前を識別してよく、物理文書の1つ以上のコピーを生成してよく、各コピーは著者の各々の識別子を含む。
【0064】
一実施形態では、多機能印刷サービス140は、レビューユーザの印刷された名前、レビューユーザを識別する機械可読コード、又はその両方を有する文書を印刷してよい。
図3Aは、レビューユーザ識別子を含む印刷された文書の例示的な実施形態を示す。文書305は、多機能印刷サービス140により印刷された物理文書を示す。タイトル310は、物理文書の目的を示す文書レビュータイトルを表す例えば、タイトル310は、会議の時間及び場所を含む、文書レビュー会議を含んでよい。他の例では、タイトル310は、文書タイトルの前に「For Review」を追加されてよい。更に他の例では、タイトル310は、レビューユーザのために任意のタイトルを表示するようカスタマイズされてよい。
【0065】
レビュアー部分315は、レビュアーの名前を含む印刷された部分を示してよい。例えば、レビュアー部分315は、Jane Doeのようなレビューユーザの名前を表示してよい。印刷された各物理的コピーは、レビューユーザ毎に異なるレビュアーの名前を含んでよい。追加の又は未だ識別されていないユーザが印刷された文書をレビューする場合、多機能印刷サービス140は、「Reviewer:________」を有する文書のコピーを印刷してよい。ここに、追加ユーザは、彼又は彼女の名前を書いてよい。
【0066】
ユーザコード320は、QRコード、バーコード、又は任意の他の機械可読コードのような任意的な印刷されたコードを示してよい。これは、文書のマークアップされたコピーがスキャンされ提案された編集及びコメントについて分析されるとき、レビューユーザを識別するために文書管理システム100により使用されてよい。例えば、多機能印刷サービス140は、レビュアーJane Doeを識別するQRコードを印刷してよい。追加文書コピーが識別されたユーザ無しに印刷される例では、多機能印刷サービス140は、スキャンされたマークアップされた文書がアドホックレビュアーによりレビューされるという注意を与える(flag)ために使用され得るゲストユーザコード320を印刷してよい。一例では、文書管理システム100がアドホックレビュアーを識別する場合、文書管理システム100は、マークアップされた文書上の手書きの名前を分析して、ユーザの識別情報を決定してよい。ユーザの識別情報が決定されない場合、文書管理システム100は、レビュアーによる任意のマークアップを「ゲストレビュアー」として関連付けてよい。「ゲストレビュアー」は次に適切なレビュアーに手動で割り当てられてよい。文書305内のコンテンツ325は、レビューされるべき元のコンテンツを表してよい。
【0067】
文書管理システム100は、多機能印刷サービス140を用いて文書のコピーを印刷することに限定されない。一実施形態では、文書管理サービス105は、それぞれのレビュアー毎に、タイトル310、レビュアー部分315、ユーザコード320、及びコンテンツ325の各々を含む文書ファイルを生成してよく、該文書ファイルを、別個の印刷装置で印刷するために各レビュアーに送信してよい。
【0068】
物理文書を印刷し、文書を各レビュアーに分配すると、各レビュアーは、提案された編集及びコメントを物理文書に対して直接生成してよい。
図2は、マークアップ文書から提案された変更に基づき注釈を生成し、生成した注釈と共に文書を表示するアプローチを示すフロー図である。処理200は、単一のプログラム又は複数のプログラムにより実行されてよい。
図2に示すような処理の動作は、コンピュータメモリに格納されたプロセッサ実行可能命令を用いて実装されてよい。より明確な例を提供することを目的として、
図2の動作は、文書管理システム100のサービスにより実行されるとして説明される。明確化の目的で、処理200は単一のエンティティの観点で説明される。
【0069】
ブロック202で、文書管理システム100は、電子マークアップ文書を生成するために、第1ユーザにより提供されるレビュー及びマークアップのための元のコンテンツを含む物理文書を受信してよい。一実施形態では、多機能印刷サービス140は、元のコンテンツに対するマークアップを含む物理文書をスキャンし、電子マークアップ文書と呼ばれるスキャンをコンテンツ受信サービス110に送信してよい。コンテンツ受信サービス110は、電子マークアップ文書を受信し、電子マークアップ文書を文書管理サービス105に送信してよい。
【0070】
図3Bは、文書管理システム100により受信されたマークアップされた物理文書の例示的な実施形態を示す。一実施形態では、マークアップされた物理文書は、記述された単語、取消線、下線、囲まれた単語、強調表示、及び任意の他の種類の物理的マークのような、手書きの又はタイプされたマークアップを含んでよい。
図3Bを参照すると、文書305は、
図3Aに示したものと同じ印刷された文書を表し、タイトル310、レビュアー部分315、ユーザコード320、及びコンテンツ325を含む。マークアップは、マーク330、335、及び340により示される。マーク330は、単語「this」の上の取消線を表す。マーク335は、コンテンツ325内の単語の強調表示された部分、及び「do we want to show the 22” model?」という手書きメモへの線を表す。マーク340は、単語「holigram」の周囲の手書きの円を表す。
【0071】
図2を参照すると、ブロック204で、文書管理システム100は、物理文書上にマークアップを提供した第1ユーザを識別する。一実施形態では、文書管理サービス105は、電子マークアップ文書からユーザコード320を識別することにより、第1ユーザを識別してよく、ユーザコード320に関連付けられたユーザを決定するためにユーザID管理サービス115に要求を送信してよい。
【0072】
別の実施形態では、物理文書がユーザコード320を含まない場合、文書管理サービス105は、手書きの名前に対応するレビュアー部分315内のマークを識別することにより、第1ユーザを識別してよい。文書管理サービス105は、マークアップ認識サービス132と通信して、手書きの名前に基づき第1ユーザを識別してよい。例えば、マークアップ認識サービス132は、レビュアー部分315から手書きの名前の画像クロップを受信してよく、画像クロップを分析して、第1ユーザの名前を表す文字セットを決定してよい。
【0073】
マークアップ認識サービス132は、手書きの名前に対応するマークに基づき第1ユーザを識別することに限定されない。別の実施形態では、物理文書がユーザコード320を含まない場合、文書管理サービス105は、レビュアー部分315内の機械で印刷された名前を識別することにより、第1ユーザを識別してよい。物理文書がレビュアー部分315内に印刷された名前を含む、又はレビュアー部分315の近く若しくは周囲に印刷された名前を含む場合、文書管理サービス105は、マークアップ認識サービス132と通信して、印刷された名前に基づき第1ユーザを識別してよい。例えば、マークアップ認識サービス132は、印刷された名前の画像クロップを受信してよく、光学式文字認識(Optical Character Recognition:OCR)技術を実施して、画像クロップから、第1ユーザの名前を表す文字セットを識別してよい。
【0074】
ブロック206で、文書管理システム100は、識別された第1ユーザに関連付けられた第1ユーザIDを決定する。一実施形態では、識別された第1ユーザがユーザコード320に基づく場合、ユーザID管理サービス115は、データレポジトリ170にクエリして、ユーザコード320に関連付けられた関連する第1ユーザIDを読み出すことにより、第1ユーザIDを決定してよい。データレポジトリ170は、ユーザコード320及びユーザJane Doeのような、ユーザ、ユーザコード、及びユーザIDの間の関連付けを格納してよい。ユーザID管理サービス115は、データレポジトリ170から、Jane Doeの第1ユーザIDを受信してよい。第1ユーザIDは、従業員ID、電子メールに基づくID、又はユーザを識別するために使用されるよう構成された任意の他の識別子のような、任意の種類のユーザ識別子を表してよい。
【0075】
別の実施形態では、識別された第1ユーザがレビュアー部分315から転写された手書きの名前に基づく場合、マークアップ認識サービス132は、データレポジトリ170にアクセスして、ユーザの名前が手書きの名前から転写された文字セットに一致するか否かを決定してよい。例えば、文字セット「Jane Doe」がマークアップ認識サービス132により識別された場合、マークアップ認識サービス132は、データレポジトリ170にクエリして、ユーザが「Jane Doe」の文字セットに一致するか否かを決定してよい。ユーザが「Jane Doe」に一致した場合、マークアップ認識サービス132は、データレポジトリ170にクエリして、ユーザ「Jane Doe」に関連付けられた第1ユーザIDを読み出してよい。
【0076】
更に別の実施形態では、識別された第1ユーザがレビュアー部分315から転写された手書きの名前に基づき、マークアップ認識サービス132がユーザの名前を構成する文字セットを、ある信頼レベルで決定できない場合、文書管理サービス105は、「ゲストユーザ」又は「未識別ユーザ」に対応する第1ユーザIDを割り当ててよい。マークアップ認識サービス132がデータレポジトリ170内で一致するユーザを見付けることができなかった場合、第1ユーザIDは、「ゲストユーザ」又は「未識別ユーザ」ラベルに対応してもよい。一実施形態では、ユーザは、後に、ユーザIDを手動で割り当てて、「ゲストユーザ」又は「未識別ユーザ」ラベルを置き換えてよい。
【0077】
ブロック208で、文書管理システム100は、第1ユーザにより提案されたコンテンツ提案を表す1つ以上のマークアップを識別してよい。一実施形態では、文書管理サービス105は、電子マークアップ文書を元の文書からの元のコンテンツと比較して電子マークアップ文書内の元のコンテンツを識別することにより、電子マークアップの中のマークアップを識別してよい。次に、文書管理サービス105は、識別された元のコンテンツと別個のコンテンツを識別することにより、電子マークアップ文書内のマークアップを識別してよい。例えば、
図3Bを参照すると、元のコンテンツは、コンテンツ325内の印刷されたコンテンツとして識別されてよい。文書管理サービス105は、次に、マーク330、335、340を、コンテンツ325と別個である1つ以上のマークアップとして識別してよい。一実施形態では、文書管理サービス105は、タイトル310、レビュアー部分315、及びユーザコード320のような、追加印刷コンテンツを、該コンテンツがマークアップとして又は元のコンテンツと考えられないので、無視されるべきコンテンツとして取り扱うよう構成されてよい。
【0078】
一実施形態では、文書管理サービス105は、マークアップの意味を決定するために、マークアップ認識サービス132を使用して、識別されたマークアップの各々を分析してよい。例えば、マークアップは、文字に翻訳され得る手書きコメントを含んでよく、マークアップ内の他の線又は矢印が分析されて、それらの文書上の位置を参照して、マークアップの意味を決定してよい。例えば、マークアップは、重複する単語を削除する、句読点を追加する、誤記を修正する、単語を挿入する、等の線として識別されてよい。一実施形態では、マークアップ認識サービス132は、手書きメモを文字に変換し及び変換された文字の意味を決定するよう構成された機械学習モデルを実装してよい。機械学習モデルは、入力として、手書きマークアップの画像を受信してよく、手書きマークアップの文字転写を含む出力を生成してよい。線、矢印、円、又は任意の他の非文字書き込みを含むマークアップでは、機械学習モデルは、マークアップを説明する変換された文字、及びマークアップがコメントか提案された編集かの決定を出力してよい。例えば、マークアップが単語の取消線である場合、出力は、取り消された単語が削除されるべきであること、及びマークアップが提案された編集であること、を示す文字であってよい。
図3Bを参照すると、マーク330は、単語「this」の上の取消線であり、「delete ‘this’?」を記述する文字に翻訳されてよい。
【0079】
一実施形態では、マークアップ認識サービス132は、分析されたマークアップの提案種類を決定するよう構成されてよい。提案種類は、限定ではないが、コメント及び提案された編集を含んでよい。提案された編集は、元のコンテンツ内の文字を変更する提案を示す、手書きメモ又はマークを表してよい。例えば、単語が、該単語の上の取消線マークを有する場合、取消線マークは、該単語を削除するために提案された編集として解釈されてよい。他の例は、マーク及び手書き文字を含んでよい。例えば、単語「car」が円で囲まれてよく、その円の隣に「change to automobile」という手書き文字を有してよい。「change to automobile」という手書き文字は、単語「car」を囲む円と共に、単語carを単語automobileに変更するために提案された編集として解釈されてよい。
【0080】
コメントは、元のコンテンツ内の1つ以上の単語又はフレーズに関連する、メモ、疑問、又は他のコメントを表してよい。例えば、元のコンテンツ内の文は、下線を引かれ又は円で囲まれてよく、「Should we expand upon this?」という手書きメモを含んでよい。この手書きメモは、明確に提案された編集を伝達しないので、コメントであると決定されてよい。反対に、手書きメモが下線を引かれた/円で囲まれた文の隣に「please remove」と言っている場合、マークアップ認識サービス132は、「please remove」というメモが下線を引かれた/円で囲まれた文を削除するために提案された編集であると決定してよい。
【0081】
一実施形態では、マークアップ認識サービス132は、文書管理サービス105に出力を送信してよい。出力は、手書きマークアップの変換された文字、提案された編集又はコメントのような決定されたマークアップ種類、マークアップの画像、変換された文字に割り当てられた信頼レベルを説明する信頼スコア、を含むデータオブジェクトを含んでよい。例えば、メモ「please remove」を含む下線の引かれた文に対するマークアップを表すデータオブジェクトは、フレーズ「please remove」と記述する変換された文字、提案された編集として割り当てられたマークアップ種類、下線の引かれた文及び手書きメモの画像クロップ、及び変換された文字に関連付けられた信頼スコア、を含んでよい。
【0082】
決定ブロック210で、文書管理システム100は、分析すべき残りのマークアップがあるか否かを決定してよい。一実施形態では、文書管理サービス105は、識別されたマークアップの各々を繰り返し分析するよう構成されてよい。例えば、マーク330、335、及び340が識別され、文書管理サービス105は、各マークアップを繰り返し分析して、マークアップに対応する電子文書部分を決定してよい。一実施形態では、文書管理サービス105が、分析すべき残りのマークアップがあると決定した場合、文書管理サービス105はブロック212に進んでよい。
【0083】
ブロック212で、文書管理システム100は元のコンテンツから、特定マークアップに対応する文書部分を識別する。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、元のコンテンツの文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、元のコンテンツ内の特定文書部分を識別し、特定マークアップと元のコンテンツの特定文書部分との間の相関を決定してよい。
【0084】
一実施形態では、コンテンツ認識サービス131は、文書からの元のコンテンツを分析して、文書種類を決定してよい。異なる文書種類は、それぞれ固有の用語、フレーズ、フォーマットを有してよい。これらは、特定のマークアップがどのように解釈され、文書部分と相関するかを決定するのを助けるために使用されてよい。例えば、元のコンテンツが特許出願文書種類である場合、「move limitation to a dependent」のようなフレーズを含む提案された編集は、請求項の限定又は提案された編集により強調表示されたフレーズを、独立請求項から新しい従属請求項へと移動するための提案として解釈されてよい。一実施形態では、コンテンツ認識サービス131は、電子文書の文書種類、及び電子文書の元のコンテンツを構成する特定文書部分を決定するよう構成された機械学習モデルを実装してよい。機械学習モデルは、入力として、元のコンテンツを電子文書から受信してよく、電子文書の文書種類及び元のコンテンツから識別された文書部分を出力してよい。
【0085】
文書種類の決定は、マークアップとコンテンツ部分との間の相関の決定の精度を向上することができ、それにより、自動的に生成される注釈の品質を向上する。一実施形態では、文書管理サービス105は、文書種類及び元のコンテンツからの文書部分を含むコンテンツ認識サービス131の出力を、メモリに保存するよう構成されてよい。その結果、文書種類及び文書部分の決定が1回実行されればよい。元のコンテンツ及びマークアップの後の分析は、現在の文書に対応する文書種類及び文書部分の格納されたデータを参照してよい。
【0086】
さらに、文書種類を決定すると、文書管理サービス105は、データレポジトリ170から文書種類属性を読み出してよい。文書種類属性は、格納されたキーワード、フレーズ、フォーマット、及び特定文書種類に関連付けられた任意の他の特性のような、特性値を含んでよい。例えば、文書種類がRicoh固有製品の技術仕様書である場合、文書種類の特性値は、製品の頭字語、技術仕様フォーマット、及び機械学習モデルをトレーニングするために使用される他の技術仕様文書から決定された製品固有フレーズを含んでよい。
【0087】
元のコンテンツ内の文書部分を決定すると、文書管理サービス105は、特定のマークアップと文書部分との間の相関を決定してよい。一実施形態では、コンテンツ相関サービス134は、特定マークアップと元のコンテンツの文書部分との間の一致を識別してよい。コンテンツ相関サービス134は、特定のマークアップの文字転写と文書部分との間の一致を決定するよう構成される機械学習モデルを使用してよい。例えば、
図3Bのマーク335は、「do we want to show the 22” model?」として解釈されてよく、「22’-84’ IFDPs」として識別されるコンテンツの部分に相関されてよい。相関は、強調表示されたマークアップ部分、及びモデル22を指定する文書部分内で識別されたモデル22”を指定する変換された文字に基づいてよい。
【0088】
特定マークアップを文書部分に相関すると、文書管理サービス105は、特定マークアップについて注釈を生成してよい。
図2を参照すると、ブロック214で、文書管理システム100は、マークアップの文字転写及び第1ユーザIDを含む特定マークアップの注釈を生成し、注釈を識別された文書部分に関連付けてよい。注釈は、文字転写を含む吹き出しコメントのような可視性コメント、又は追跡された変更として表現され得る提案された編集のように表現されてよい。例えば、マークアップ種類がコメントであると決定された場合、注釈は可視性コメントとして表現されてよい。しかしながら、マークアップが提案された編集である場合、注釈は、吹き出しコメント内に、マークアップ認識サービス132により決定された信頼スコアに基づき、追跡された変更又は提案された編集として表現されてよい。
【0089】
図3Cは、識別されたマークアップを表す注釈と共に表示された電子文書の例示的な実施形態を示す。注釈335Aは、マーク335について生成された注釈を表してよい。注釈335Aは、特定マークアップの変換された文字、及び第1ユーザのIDを含む。別の例では、注釈330Aは、マーク330について生成された注釈を表してよい。注釈330Aは、マーク330が重複する単語「this」を削除するために提案された編集を表すことを説明する文字を含んでよい。マーク330が高い信頼スコアを有する場合、注釈330Aは、注釈330Aが既に適用された編集を表すことを示すために、異なる色を付けられてよい。しかしながら、マーク330が低い信頼スコアを有する場合、注釈330Aは、ユーザの承認を必要とする保留中の変更として表示されてよい。一実施形態では、信頼閾値は、提案された編集に関連付けられた変更をコンテンツに適用すべきか否かを決定するために使用されてよい。例えば、信頼スコアが100点の値尺度に基づく場合、信頼閾値は、85に設定されてよい。ここで、85より高い信頼値は自動的に適用され、85より低い信頼値は自動的に適用されないが、注釈内に承認又は拒否ボタンと共に表示される。
【0090】
一実施形態では、コンテンツ相関サービス134は、特定マークアップの変換された文字が直ぐに実施可能な命令を含むか否かを識別するよう更に構成されてよい。直ぐに実施可能な命令は、文書管理サービス105により自動化され得る外部コンテンツのための任意の種類のコマンドであってよい。例えば、変換された文字は、「プリンタモデル92XXの写真を挿入する」(insert a picture of printer model 92XX)ためのコマンドを含んでよい。コンテンツ相関サービス134は、このコマンドを、ファイル、リンク、又は他のオブジェクトを読み出すためのコマンドとして識別してよい。コンテンツ相関サービス134は、コマンドを実行するための要求を文書管理サービス105に送信してよい。文書管理サービス105は、コマンドを受信し実行してよい。例えば、コマンドが変換された文字「プリンタモデル92XXの写真を挿入する」(insert a picture of printer model 92XX)に基づく場合、文書管理サービス105は、画像の内部レポジトリから、又は公衆に利用可能な画像から、92XXプリンタの画像を読み出してよい。別の例では、文書管理サービス105は、公衆に利用可能な検索エンジンから、92XXプリンタの画像検索結果へのリンクを読み出してよい。
【0091】
文書管理サービス105は、画像又は検索結果のページへのリンクであってよい実行したコマンドの結果を、注釈生成サービス120に送信してよい。注釈生成サービス120は、実行されたコマンドの結果を受信し、該結果を特定マークアップについて生成された注釈に挿入するよう構成されてよい。例えば、結果が内部又は外部画像である場合、注釈生成サービス120は、内部又は外部画像へのリンクを挿入してよい。結果が画像検索結果へのリンクである場合、注釈生成サービス120は、検索結果リンクを、特定マークアップについて生成した注釈に挿入してよい。
【0092】
一実施形態では、特定マークアップについての注釈を生成すると、文書管理システム100は、生成された注釈と識別された文書部分との間の関連付けをデータレポジトリ170に格納してよい。
【0093】
注釈を生成すると、文書管理システム100は、決定ブロック210に進み、分析される必要のある追加マークアップが存在するか否かを決定してよい。分析されるべき追加マークアップが存在する場合、文書管理システム100は、ブロック212及び214を繰り返して、マークアップの各々について注釈を生成してよい。決定ブロック210で、分析されるべき追加マークアップが存在しないと決定された場合、文書管理システム100はブロック216に進んでよい。
【0094】
一実施形態では、文書管理システム100は、ユーザから受信した、マークアップを含む各物理文書について、ブロック202~214を繰り返してよい。例えば、John Smithという名前の第2ユーザも、マークアップを含む物理文書を提供した場合、文書管理システム100は、John Smithからマークアップされた文書を受信しスキャンし、物理文書からJohn Smithのユーザコードを識別し、John Smithにより生成された1つ以上のマークアップを識別し、John Smithにより提供されたマークアップに関連付けられた1つ以上の注釈を生成してよい。
【0095】
ブロック216で、文書管理システム100は、ディスプレイウインドウ内に電子的形式で、1つ以上の生成された注釈と共に元のコンテンツを表示してよい。一実施形態では、文書管理サービス105は、文書管理サービス105と通信して、クライアントコンピューティング装置上のディスプレイウインドウ内に1つ以上の生成された注釈と共に元のコンテンツを表示するグラフィカルユーザインタフェースを生成してよい。グラフィカルユーザインタフェースは、限定ではないが、文書の元のコンテンツ、生成された注釈、及び注釈に関連付けられたマークアップを、元のコンテンツのディスプレイに重ね合わせて表示することを含んでよい。
【0096】
図3Cは、電子文書の元のコンテンツ、元のコンテンツの上に重ね合わされた識別されたマークアップ、及び生成された注釈、を表示するために使用されるグラフィカルユーザインタフェースの例示的な実施形態を示す。文書ウインドウ350は、電子文書の元のコンテンツ、重ね合わされたマークアップ、及びマークアップ及び/又は他の提案された編集に関連する他の改訂を表示するよう構成される表示要素を提示してよい。レビュアードロップダウンリスト360は、電子文書について提案される編集を提供した利用可能なレビュアーのドロップダウンリストを提示してよい。Jane Doeのような特定レビュアーが、レビュアードロップダウンリスト360から選択された場合、グラフィカルユーザインタフェースは、レビュアーJane Doeに関連付けられたマークアップ及び注釈を表示してよい。一実施形態では、レビュアードロップダウンリスト360は、選択されると提案された編集を提供した各レビュアーからのマークアップ及び注釈を表示し得る「全てのレビュアー」(all reviewers)選択を含んでよい。複数のレビュアーからの注釈を表示するとき、文書提示サービス150は、レビュアーに基づく注釈及び関連付けられたマークアップ毎の色コードをグラフィカルユーザインタフェースに構成してよい。例えば、全てのレビュアー選択が、Jane Doe及びJohn Smithからの提案された編集を表示する場合、表示されるグラフィカルユーザインタフェースは、Jane Doeに関連付けられたマークアップ及び注釈を赤で強調表示し、John Smithに関連付けられたマークアップ及び注釈を緑で強調表示してよい。
【0097】
一実施形態では、レビュアーにより提案された編集を提示する注釈は、提案された編集を承認する又は拒否する制御ボタンを含んでよい。例えば、注釈330Aは、チェックボタン331を含む。チェックボタン331が選択されると、重複する単語「this」を電子文書から削除する提案された編集を適用する。別の実施形態では、注釈340Aは、提案された編集を適用するためのチェックボタン341、及び提案された編集を拒否するための拒否ボタン342を含む。チェックボタン341の選択は、文書管理サービス105に、「holigram」のスペルを「hologram」の正しいスペルに変更させる。拒否ボタン342の選択は、文書管理サービス105に、提案された編集を適用させず、電子文書内の「holigram」の元のスペルを維持させる。
【0098】
グラフィカルユーザインタフェースを閲覧しているユーザは、表示された注釈の各々を承認する又は拒否することにより、レビュアーからの提案された編集を承認又は拒否してよい。一実施形態では文書管理サービス105は、電子文書に適用された変更を、データレポジトリ170内の電子文書の新しいバージョンとして保存してよい。電子文書の新しいバージョンは、1つ以上の変更を含んでよい。例えば、電子文書の新しいバージョンは、ユーザによるグラフィカルユーザインタフェースの単一のレビューセッションの間に承認された及び/又は拒否された全ての変更を含んでよい。別の例では、電子文書の各保存されたバージョンは、単一の承認された変更を含んでよい。別の実施形態では、文書管理サービス105は、特定の変更を含む電子文書の特定バージョンを生成するために、各承認された又は拒否された注釈を電子文書に選択的に適用され得るトランザクションのシリーズとして保存するよう構成されてよい。
【0099】
B.マークアップされた電子文書の処理
一実施形態では、文書管理システム100は、異なる電子文書から文書マークアップを収集し及び統合するために使用されてよい。文書管理システム100は、レビューされた電子文書内のコンテンツについて、コンテンツ提案を識別し、注釈を生成してよい。例えば、文書は、Microsoft Word for Windows、Microsoft Word for Mac、Open Office、Google Docs、コメントを有するPDF文書、及び任意の他の文書編集プログラムのような複数の異なる文書編集プログラムを用いて複数のユーザによりレビューされてよい。文書編集プログラムの各々は、コメントを管理し、異なる方法で編集してよい。その結果、異なる編集プログラムからのコンテンツ提案を単一のディスプレイ内で閲覧することが課題となり得る。
【0100】
文書管理システム100は、編集又はマークアップされていない元の電子文書から、元のコンテンツを受信し及び管理してよい。文書管理システム100は、元のコンテンツ及び元のコンテンツに対するマークアップを含む、後に受信した電子文書を受信し及び管理するよう構成されてよい。
図4は、マークアップ電子文書から受信した提案に基づき注釈を生成し、生成した注釈と共に文書を表示するアプローチを示すフロー図である。処理400は、単一のプログラム又は複数のプログラムにより実行されてよい。
図4に示すような処理の動作は、コンピュータメモリに格納されたプロセッサ実行可能命令を用いて実装されてよい。より明確な例を提供することを目的として、
図4の動作は、文書管理システム100のサービスにより実行されるとして説明される。明確化の目的で、処理400は単一のエンティティの観点で説明される。
【0101】
ブロック402で、文書管理システム100は、第1ユーザにより提供されるレビュー及び電子マークアップの元のコンテンツを含む電子マークアップ文書を受信してよい。一実施形態では、コンテンツ受信サービス110は、電子マークアップ文書を、第1ユーザのようなレビュアーから受信してよい。電子マークアップ文書は、指定されたウェブサイトへの直接アップロードから、文書管理システム100に関連付けられた特定電子メールアカウントへ送信された電子メールから、又はBox、Google Drive、Drop Box又は任意の他のネットワークストレージサービスのようなネットワークストレージサービスに関連付けられたネットワーク位置から、受信されてよい。
【0102】
一実施形態では、文書管理サービス105は、特定ユーザに関連付けられた特定識別子を識別することにより、特定ユーザを受信した電子マークアップ文書に関連付けてよい。電子マークアップ文書が文書管理システム100に電子メールで送信された場合、特定識別子は、ユーザの電子メールアドレスを表してよい。別の例では、特定ユーザは、特定ユーザに関連付けられた特定ファイル名を有する電子文書を編集してよい。例えば、ユーザJane Doeは、電子マークアップ文書名「document1_userJaneDoe.doc」を編集し送信してよい。更に別の例では、レビューユーザに送信された電子文書は、文書メタデータ内に又は文書のファイル構造内に埋め込まれたユーザコードを含んでよい。埋め込まれたユーザコードは、次に、レビューユーザを識別するために、文書管理サービス105により抽出されてよい。
【0103】
ブロック404で、文書管理システム100は、第1ユーザにより提案されたコンテンツ提案を表す1つ以上のマークアップを識別してよい。一実施形態では、文書管理サービス105は、電子マークアップ文書を元の電子文書からの元のコンテンツと比較して電子マークアップ文書内の元のコンテンツを先ず識別することにより、電子マークアップの中のマークアップを識別してよい。文書管理サービス105は、識別された元のコンテンツと別個のコンテンツを識別することにより、電子マークアップ文書内のマークアップを識別してよい。
【0104】
一実施形態では、文書管理サービス105は、マークアップの意味を決定するために、マークアップ認識サービス132を使用して、識別されたマークアップの各々を分析してよい。マークアップ認識サービス132は、挿入されたコメント及び追跡された変更を提示する種々の電子文書フォーマット内のオブジェクトを識別するよう構成されてよい。例えば、Microsoft Wordフォーマットの電子マークアップ文書は、コメントを提示するデータオブジェクト、及び追跡された変更として編集されて文字を提示するオブジェクトを含んでよい。
【0105】
一実施形態では、マークアップ認識サービス132は、コメント又は編集を含み得る行内の文字変更を識別するよう構成されてよい。行内の文字変更は、コメント又は追跡された変更を提示するデータオブジェクト内で指定されない編集を提示してよい。例えば、第1ユーザは、コメントの前の開き括弧及びコメントの後の閉じ括弧を含むようフォーマットされた行内のコメントを挿入されてよい。マークアップ認識サービス132は、トレーニングされた機械学習モデルを実装して、コメントをマークするために使用される特殊文字に基づき行内のコメントを認識してよい。別の実施形態では、マークアップ認識サービス132は、電子マークアップ文書からのコンテンツを元の電子文書のコンテンツと比較することにより、マークされていない編集を識別するよう構成されてよい。追加された文字又は削除された文字のような変更されたコンテンツは、コンテンツ提案としてマークされてよい。
【0106】
決定ブロック406で、文書管理システム100は、注釈を生成するために分析すべき残りのマークアップがあるか否かを決定してよい。一実施形態では、文書管理サービス105は、識別されたマークアップの各々を繰り返し分析するよう構成されてよい。文書管理サービス105が、分析すべき残りのマークアップがあると決定した場合、文書管理サービス105はブロック408に進んでよい。しかしながら、分析すべき残りのマークアップが存在しない場合、文書管理サービス105はブロック412に進んでよい。
【0107】
ブロック408で、文書管理システム100は元の電子文書から、特定マークアップに対応する文書部分を識別する。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、元の電子文書の文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、元の電子文書内の特定文書部分を識別し、特定マークアップと元の電子文書の特定文書部分との間の相関を決定してよい。
【0108】
一実施形態では、コンテンツ認識サービス131は、文書からの元の電子文書を分析して、文書種類を決定してよい。文書種類は、それぞれ固有の用語、フレーズ、フォーマットを有してよい。これらは、特定のマークアップがどのように解釈され、文書部分と相関するかを決定するのを助けるために使用されてよい。一実施形態では、コンテンツ認識サービス131は、電子文書の文書種類、及び元の電子文書の特定文書部分を決定するよう構成された機械学習モデルを実装してよい。機械学習モデルは、入力として、電子文書からの元のコンテンツを受信してよく、電子文書の文書種類及び元のコンテンツからの識別された文書部分を出力してよい。
【0109】
元の電子文書内の文書部分を決定すると、文書管理システム100は、特定のマークアップと文書部分との間の相関を決定してよい。一実施形態では、コンテンツ相関サービス134は、電子マークアップと元の電子文書の文書部分との間の一致を識別してよい。
【0110】
ブロック410で、文書管理システム100は、マークアップ及びマークアップを生成したユーザの第1ユーザIDを含む、特定マークアップについての注釈を生成してよい。注釈は、マークアップの文字転写を含む吹き出しコメントのような可視性コメント、又は提案された変更を記述する吹き出し変更により追跡された変更として表現され得る提案された編集のように表現されてよい。例えば、マークアップ種類がコメントであると決定された場合、注釈は可視性コメントとして表現されてよい。しかしながら、マークアップが提案された編集である場合、注釈は、吹き出しコメント内に、マークアップ認識サービス132により決定された信頼スコアに基づき、追跡された変更及び/又は提案された編集として表現されてよい。
【0111】
図5は、識別されたマークアップを表す注釈と共に表示された電子文書の例示的な実施形態を示す。文書505は、文書レビュー会議中にレビューされた電子文書を表してよい。注釈510は、文書505内の画像に対応する文書部分に対応するコメント型の注釈を表してよい。注釈510は、「写真を別のものに変える」(Change the picture to the alternative)と記述する文字を含んでよく、電子マークアップ文書から電子コメント内で提供された別の写真へのリンクを含んでよい。注釈510は、「Jane Doe」のような第1ユーザIDを表示する。
【0112】
注釈を生成すると、文書管理システム100は、決定ブロック406に戻ってよい。決定ブロック406で、文書管理システム100は、注釈を生成するために分析すべき残りのマークアップがあるか否かを決定してよい。分析すべき残りのマークアップがある場合、文書管理システム100は、ブロック408及び410に進み、現在のマークアップに対応する文書部分を識別し、現在のマークアップについての注釈を生成してよい。
【0113】
一実施形態では、ブロック402~410は、コンテンツ受信サービス110により受信された各電子文書について繰り返されてよい。例えば、文書レビュー会議の後に、複数のレビュアーは、彼らの提案したマークアップを、電子文書の形式で、コンテンツ受信サービス110に提出してよい。文書管理サービス105は、電子文書の各々をそれらが受信されると繰り返し処理することにより、受信した電子文書の各々を管理してよい。
【0114】
決定ブロック406で、識別されたマークアップの全部が分析されると、文書管理システム100は、ブロック412に進み、電子的形式で、ディスプレイウインドウ内に、生成された注釈と共に元の電子文書を表示してよい。一実施形態では、文書管理サービス105は、文書提示サービス150と通信して、クライアントコンピューティング装置上のディスプレイウインドウ内に1つ以上の生成された注釈と共に元のコンテンツを表示するグラフィカルユーザインタフェースを生成してよい。グラフィカルユーザインタフェースは、限定ではないが、電子文書の元のコンテンツ、表示された特定文書の文書部分に関連付けられた生成された注釈、及び注釈に関連付けられた適用された提案された編集を、特定文書の元のコンテンツの表示に重ね合わさせて表示することを含んでよい。一実施形態では、文書管理サービス105は、レビューされた1つ以上の文書の各々のコピーをデータレポジトリ170に格納してよい。
【0115】
C.提案を含むメディアコンテンツアイテムの処理
多くの専門的及び学術的機関は、1つ以上の文書に対する変更を議論し提案するために、文書レビュー会議を行うことがある。文書レビュー会議は、レビュアー間の正式な会議、レビュアー間のアドホック会議、レビュアー間の電話及びテレビ会議を含んでよい。例えば、レビュアーJane Doeが、文書Aを議論するためにJohn Smithとの電話呼を開始した場合、電話呼は、文書レビュー会議として考えられてよい。文書レビュー会議中、レビュアーは、文書に対する変更又は変更の提案を口頭で議論してよい。レビュアーは、ホワイトボード、黒板、対話型プロジェクタ、及び他の対話型装置上でメモを生成してもよい。文書提案は、ホワイトボード又は他の装置において口頭で又は書面で行われたかに拘わらず、提案をメディアコンテンツアイテムとしてキャプチャすることにより保存されてよい。メディアコンテンツアイテムは、限定ではないが、文書レビュー会議の録音されたオーディオ、文書レビュー会議の録画されたビデオ、文書レビュー会議からのメモの写真、及びプロジェクタ、対話型ホワイトボード機器(Interactive Whiteboard Appliance:IWB)、又は任意の他のメディア装置からのキャプチャされたスクリーンショット、を含む様々な異なる種類のメディアコンテンツを表してよい。
【0116】
IWBは、一連のスタイラスペン入力の形式で、IWBディスプレイ上のユーザ入力をキャプチャするよう構成されてよい。例えば、スタイラスペンが、IWBディスプレイ上でマークを生成するために使用されるとき、IWBは、一連のデータオブジェクトを生成してよい。ここで、各オブジェクトは、タイムスタンプと、IWBがスタイラスペンを検出したIWBディスプレイ上の位置に対応する(x,y)座標と、を含む。一連のデータオブジェクトは、スタイラスペンストロークの経路に対応してよい。別の例では、スタイラスペンストロークの経路は、ベジエ曲線点により表されてよい。ベジエ曲線は、経路をモデル化するために、コンピュータグラフィックで使用されるパラメトリック曲線を表す。一実施形態では、生成されたマークに対応する一連のデータオブジェクトは、スクリーンショットの座標と一緒にIWBディスプレイのスクリーンショットも含み得るメディアコンテンツアイテムにパッケージ化されてよい。例えば、IWBからのキャプチャされたコンテンツを表すメディアコンテンツアイテムは、IWBディスプレイのスクリーンショットをスクリーンショット内の対応するピクセル座標と共に、及びスタイラスペンのような入力装置から生成されたマークに対応する一連のオブジェクトを、含んでよい。
【0117】
一実施形態では、文書管理システム100は、レビュー中の1つ以上の文書についてのコンテンツ提案を含むメディアコンテンツアイテムを受信することにより、文書レビュー会議において提案をキャプチャする際に支援するために使用されてよい。例えば、文書レビュー会議は、オーディオレコーダ又はビデオデコーダを用いて記録されてよい。記録は、文書管理システム100により受信され得る、レビュー会議のメディアコンテンツアイテムを表してよい。文書管理システム100は、次に、受信したメディアコンテンツアイテムを分析し、レビュー中文書についての1つ以上のコンテンツ提案を決定してよい。1つ以上のコンテンツ提案は、注釈を生成し、レビュー中文書の中の文書部分に生成された注釈を関連付けるために使用されてよい。
【0118】
図6は、メディアコンテンツアイテムから提案された変更に基づき注釈を生成し、対応する提案された変更を含む更新された電子文書を生成するアプローチを示すフロー図である。処理600は、単一のプログラム又は複数のプログラムにより実行されてよい。
図6に示すような処理の動作は、コンピュータメモリに格納されたプロセッサ実行可能命令を用いて実装されてよい。より明確な例を提供することを目的として、
図6の動作は、文書管理システム100のサービスにより実行されるとして説明される。明確化の目的で、処理600は単一のエンティティの観点で説明される。
【0119】
ブロック602で、文書管理システム100は、1人以上のユーザによる1つ以上の電子文書の議論からキャプチャされたコンテンツを表す1つ以上のメディアコンテンツアイテムを受信してよい。一実施形態では、コンテンツ受信サービス110は、1つ以上の文書の文書レビュー会議からのキャプチャされたコンテンツを含むメディアコンテンツアイテムを受信してよい。例えば、メディアコンテンツアイテムは、文書レビュー会議からの、記録されたオーディオ、ビデオ、及びキャプチャされたスクリーンショットを含んでよい。キャプチャされたスクリーンショットは、デジタルカメラによりキャプチャされたデジタル画像、又はPDF(Portable Document File)、PNG(Portable Network Graphics)ファイル、JPEGファイル、又は文書レビュー会議中に生成されたメモ若しくはマークアップの画像を含み得る任意の他のファイルのようなデジタル画像ファイルを表してよい。例えば、レビュアーは、IWB機器を用いて、IWBディスプレイスクリーン内に表示された文書に対するメモ及び他の文書マークアップを生成してよい。IWBは、IWB上にスタイラスにより生成された書き込まれたメモを含む、レビュー中文書のPDFコピーを生成してよい。会議の終わりに、IWBは、生成したPDFファイルをコンテンツ受信サービス110にアップロードしてよい。
【0120】
ブロック604で、文書管理システム100は、1つ以上のメディアコンテンツアイテムから、1つ以上の文書内の文書部分を表すメディアコンテンツの部分を識別してよい。メディアコンテンツ部分は、オーディオクリップ、ビデオクリップ、画像のコピー、又は任意の他のメディアコンテンツアイテムの部分集合のような、メディアコンテンツアイテムの部分集合を表してよい。一実施形態では、文書管理システム100は、会話認識サービス133を用いて、メディアコンテンツアイテムの各々を分析して、レビューされた文書内の文書部分を表すメディアコンテンツ部分を識別してよい。例えば、会話認識サービス133は、レビューされる文書の、特定の単語、フレーズ、章に対する編集に関して話しているユーザのオーディオクリップを識別してよい。
【0121】
一実施形態では、会話認識サービス133は、コメント又は提案された編集のいずれかのコンテンツ提案を示すメディアコンテンツ部分を識別するよう構成される機械学習モデルを実装してよい。機械学習モデルは、入力として、オーディオを含むメディアコンテンツアイテムを受信してよい。機械学習モデルは、メディアコンテンツアイテム内の検出された会話を分析し、会話を文字に変換してよい。文字は、次に、レビューされた文書の提案された編集を示し得る特定の単語又はフレーズについて分析されてよい。例えば、「the word... is duplicated」、「we need more examples」、「the introduction is too short」、「the word... is misspelled」、「could you update figure X」のような発言は、特定のメディアコンテンツ部分が文書についての提案又は編集に関連することを示してよい。機械学習モデルは、次に、コメント又は提案された編集のようなコンテンツ提案種類を、会話の変換された文字に基づき割り当ててよい。機械学習モデルは、「on the second page」、「the final paragraph」、「the sentence starting with」、等のような文書内の位置を示し得る発言も識別してよい。機械学習モデルの出力は、レビューされた文書についての可能性のある提案された編集として識別されたメディアコンテンツ部分のセットを含んでよい。
【0122】
一実施形態では、機械学習モデルは、会話を分析して話者の識別情報を決定するよう更に構成されてよい。機械学習モデルは、従業員の会話クリップを用いてトレーニングされて、話者の識別情報を決定してよい。例えば、機械学習モデルは、頻度、ピッチ、及び他のオーディオ品質を分析して、会話のオーディオクリップが既知の従業員又は他の参加者の音声品質と一致するかどうかを決定してよい。
【0123】
一実施形態では、受信したメディアコンテンツアイテムが、ビデオ、スクリーンショット、又はマークアップの画像を含む画像ファイルを含むメディアコンテンツを含む場合、文書管理システム100は、マークアップ認識サービス132を用いて、提案された編集に対応するマークを識別してよい。マークアップ認識サービス132は、マークの意味を決定するために、手書きマークのようなマークを分析してよい。上述のように、マークアップ認識サービス132は、機械学習モデルを実装して、マーク、及びメディアコンテンツアイテムからのマークの意味を決定してよい。ビデオの例では、文書管理システム100は、マークアップ認識サービス132及び会話認識サービス133の両方を用いて、ビデオによりキャプチャされたマーク及びビデオのオーディオによりキャプチャされたメディアコンテンツ部分から、提案された編集を識別してよい。
【0124】
図6を参照すると、決定ブロック606で、文書管理システム100は、分析されるべきメディアコンテンツ部分が存在するか否かを決定してよい。注釈を生成するために分析されるべきメディアコンテンツ部分が存在する場合、文書管理システム100は、メディアコンテンツ部分からメディアコンテンツ部分を選択し、ブロック608に進んでよい。しかしながら、分析されるべき更なるメディアコンテンツ部分が存在しない場合、文書管理システム100は、ブロック612に進み、生成された注釈を含む1つ以上の更新された電子文書を生成してよい。
【0125】
ブロック608で、文書管理システム100は、1つ以上の電子文書の電子文書部分から、メディアコンテンツ部分に対応する文書部分を識別してよい。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、1つ以上の文書の各々の文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、1つ以上の文書内の特定文書部分を識別し、メディアコンテンツ部分と文書部分との間の相関を決定してよい。
【0126】
一実施形態では、文書管理サービス105は、どの文書がレビューされたかを、文書レビュー会議のまとめ役のようなユーザにより選択された文書ファイル名に基づき、又は受信したメディアコンテンツアイテムを分析してレビューされた文書のファイル名を識別することにより、決定してよい。一実施形態では、コンテンツ認識サービス131は、レビューされた1つ以上の文書のコンテンツを分析して、文書種類、及び各レビューされた文書の文書部分を決定してよい。コンテンツ認識サービス131は、文書のコンテンツを入力として用いて各文書の文書種類を決定するよう構成された機械学習モデルを実装してよい。機械学習モデルは、メディアコンテンツアイテムからのコンテンツ提案を文書内の位置に相関し得る、文書からの文書部分を識別するよう構成されてよい。
【0127】
一実施形態では、文書管理サービス105は、メディアコンテンツ部分及び1つ以上の電子文書から識別された文書部分を、文書部分とメディアコンテンツ部分との間の相関を決定するために、コンテンツ相関サービス134に送信してよい。コンテンツ相関サービス134に送信されたメディアコンテンツ部分は、会話認識サービス133からの変換された文字及びその元の形式でメディアコンテンツ部分を含むデータオブジェクトの形式であってよい。文書部分は、各文書部分に関連付けられた電子文書、電子文書に関連付けられた文書種類、及びメディアコンテンツ部分と文書部分との間の一致を見付けるのに支援するために使用され得る任意の他の文書固有情報を定める、メタデータのような追加特性データを含んでよい。
【0128】
一実施形態では、コンテンツ相関サービス134は、変換された文字と文書部分との間の一致を決定するよう構成された機械学習モデルを使用してよい。例えば、メディアコンテンツ部分の変換された文字が「要約の最初の文を書き換えてください」(Please reword the first sentence of the abstract)を含む場合、機械学習モデルは、電子文書の要約部分の第1文に対応する一致する文書部分が存在するか否かを決定してよい。機械学習モデルは、「要約」(abstract)のようなメディアコンテンツ部分内のキーワードを識別し、要約のキーワードが特許出願文書種類の中の章を参照することを決定してよい。機械学習モデルは、次に、要約のキーワードを用いて、一致する文書種類に基づき文書部分をフィルタリングしてよい。さらに、複数の文書種類が要約の章を有する場合、機械学習モデルは、一致する文書種類に関連付けられた各文書部分を分析してよい。コンテンツ相関サービス134は、文書管理サービス105に、メディアコンテンツ部分への参照及び一致する文書部分を送信してよい。対応する文書部分は、文書部分への参照、及び/又は一致する文書部分に対応する電子文書内の前後関係に依存する(positional)位置であってよい。
【0129】
ブロック610で、文書管理システム100は、メディアコンテンツ部分を表す注釈を生成し、注釈を、メディアコンテンツ部分に対応する文書部分に関連付けてよい。一実施形態では、注釈生成サービス120は、以下:メディアコンテンツ部分の文字転写、文字転写に関連付けられた信頼スコア、注釈がコメントか提案された編集かを指定する注釈種類、メディアコンテンツ部分へのリンク、のうちのいずれかを含むメディアコンテンツ部分の注釈を生成してよい。注釈種類は、メディアコンテンツ部分について決定された提案種類に基づいてよい。例えば、提案種類がコメントである場合、生成された注釈は吹き出しコメントであってよい。しかしながら、提案種類が提案された編集である場合、注釈は提案された編集として表示されてよい。
【0130】
図7は、識別されたメディアコンテンツ部分を表す注釈と共に表示された電子文書の例示的な実施形態を示す。文書705は、文書レビュー会議中にレビューされた文書を表してよい。注釈710は、文書705内の文書部分「AI Ricoh Interactive Assistance Service」に対応するに対応するコメント型の注釈を表してよい。注釈710は、「今年はRAISが説明されるべきかどうか、マーケティングにより調べる」(Check with marketing if RAIS should be demonstrated this year)の文字転写、及び文字転写を参照するメディアコンテンツ部分を含むメディアコンテンツアイテムへのリンクを含んでよい。一実施形態では、メディアコンテンツアイテムへのリンクは、ユーザにより選択されると、メディアコンテンツ部分の位置にキューに入れられたメディアプレイヤプログラムを開始させてよい。例えば、ユーザが注釈710内のリンクを選択すると、メディアプレイヤプログラムが起動してよく、メディアコンテンツ部分にキューに入れられてよい。
【0131】
注釈715は、単語「exciting」を単語「amazing」で置き換えるために提案された編集の注釈を表す。文字転写は、「「exciting」を「amazing」で置き換える」(Replace: “exciting” with “amazing)を表示してよい。関連付けられた信頼スコアが特定信頼スコア閾より高い場合、注釈715の提案された編集は、
図7に示されるように、文書705内の文書部分に適用されてよい。
【0132】
一実施形態では、注釈生成サービス120は、提案が行われ及び/又は議論されたときを識別するために使用され得る会議固有情報により、注釈を更新してよい。例えば、注釈生成サービス120は、会議名、会議日時、会議場所、及び会議出席者のような、文書レビュー会議の詳細事項を含むよう注釈を更新してよい。会議特性の各々は、文書のグラフィカルディスプレイ内に表示され得る注釈をフィルタリングするために使用されてよい。
【0133】
一実施形態では、会話認識サービス133は、メディアコンテンツアイテムを分析するとき、ユーザの音声が会話認識サービス133により識別された場合、特定ユーザを識別されたメディアコンテンツ部分に関連付けてよい。ユーザ識別情報は、会話認識サービス133内の機械学習モデルをトレーニングするために使用される履歴及び/又はトレーニングメディアコンテンツアイテムに基づいてよい。会話認識サービス133が、特定ユーザをメディアコンテンツ部分の中の会話に関連付ける場合、注釈生成サービス120は、話者として識別されたユーザのユーザIDを含むよう、生成された注釈を更新してよい。しかしながら、ユーザが識別されない場合、注釈生成サービス120は、グローバルユーザID、企業ID、又は特定企業の及び/又は文書レビュー会議を行った部門の部門IDを含むよう、生成された注釈を更新してよい。
【0134】
一実施形態では、文書所有者又は文書レビュアーのようなユーザは、注釈をレビューするとき、メディアコンテンツ部分に基づく注釈にユーザIDを割り当てるよう、注釈特性を更新してよい。例えば、James Smithが会議中に提案を行ったユーザである場合、ユーザJane Doeは、James SmithのユーザIDを注釈710に割り当てるよう、注釈710を更新してよい。別の実施形態では、複数のユーザが注釈710に関連する議論に従事した場合、ユーザJane Doeは、議論に参加したユーザの各々を含むよう、注釈710を更新してよい。
【0135】
注釈を生成すると、文書管理システム100は、決定ブロック606に進み、分析される必要のある追加メディアコンテンツ部分が存在するか否かを決定してよい。分析されるべき追加メディアコンテンツ部分が存在する場合、文書管理システム100は、ブロック608及び610を繰り返して、メディアコンテンツ部分の各々について注釈を生成してよい。決定ブロック606で、分析されるべき追加メディアコンテンツ部分が存在しない場合、文書管理システム100はブロック612に進んでよい。
【0136】
ブロック612で、文書管理システム100は、ディスプレイウインドウ内に電子的形式で、生成された注釈と共に1つ以上の文書を表示してよい。一実施形態では、文書管理サービス105は、文書提示サービス150と通信して、クライアントコンピューティング装置上のディスプレイウインドウ内に1つ以上の生成された注釈と共に元のコンテンツを表示するグラフィカルユーザインタフェースを生成してよい。グラフィカルユーザインタフェースは、限定ではないが、文書の元のコンテンツ、表示された特定文書の文書部分に関連付けられた生成された注釈、及び注釈に関連付けられた適用された提案された編集を、特定文書の元のコンテンツの表示に重ね合わさせて表示することを含んでよい。
【0137】
一実施形態では、文書管理サービス105は、レビューされた1つ以上の文書の各々のコピーをデータレポジトリ170に格納してよい。文書の格納されたコピーは、各対応する文書に関連付けられた生成された注釈の各々を含んでよい。
【0138】
D.追加提案による注釈の更新
一実施形態では、文書管理システム100は、既存の注釈を既に有する元のコンテンツの文書部分を参照するマークアップを含む、メディアコンテンツアイテム、電子文書、及び物理文書から提案を受信してよい。例えば、特定文書部分は、導入部分の第1文を表してよく、文書管理システム100は、コメントを含む注釈を特定文書部分に以前に関連付けていてよい。文書管理システム100は、次に、導入部分の第1文を参照する同じ文書部分についての別の提案されたコメントを含むメディアコンテンツアイテムを受信してよい。文書管理システム100は、メディアコンテンツアイテムからのコメントが既存の注釈に関連するか否かを決定してよい。関連する場合、文書管理システム100は、メディアコンテンツアイテムからのコメントを含むよう注釈を更新してよい。
【0139】
図4と共に説明したように、文書管理システム100は、1つ以上のマークアップされた電子文書を受信し、1つ以上のマークアップされた電子文書からの受信した提案に基づき、注釈を生成してよい。文書管理システム100は、1つ以上のマークアップされた電子文書を分析し、1つ以上のマークアップされた電子文書の中で提案されたマークアップの各々について注釈を生成してよい。文書管理システム100は、生成した注釈を、更新された電子文書の部分としてデータレポジトリ170に格納してよい。一実施形態では、生成した注釈は、データレポジトリ170内に別個の注釈オブジェクトとして格納されてもよい。
【0140】
図8は、メディアコンテンツアイテムから提案された変更に基づき既存の注釈を更新し、対応する提案された変更を含む更新された電子文書を生成するアプローチを示すフロー図である。処理800は、単一のプログラム又は複数のプログラムにより実行されてよい。
図8に示すような処理の動作は、コンピュータメモリに格納されたプロセッサ実行可能命令を用いて実装されてよい。より明確な例を提供することを目的として、
図8の動作は、文書管理システム100のサービスにより実行されるとして説明される。明確化の目的で、処理800は単一のエンティティの観点で説明される。
【0141】
ブロック802で、文書管理システム100は、1人以上のユーザによる電子文書の議論からキャプチャされたコンテンツを表す1つ以上のメディアコンテンツアイテムを受信してよい。一実施形態では、コンテンツ受信サービス110は、電子文書の文書レビュー会議の記録を表すメディアコンテンツアイテムを受信してよい。メディアコンテンツアイテムの例は、文書レビュー会議からの、記録されたオーディオ、ビデオ、及びキャプチャされたスクリーンショットを含む。コンテンツ受信サービス110は、指定されたウェブサイトへの直接アップロードから、文書管理システム100に関連付けられた特定電子メールアカウントへ送信された電子メールから、又はBox、Google Drive、Drop Box又は任意の他のネットワークストレージサービスのようなネットワークストレージサービスに関連付けられたネットワーク位置から、メディアコンテンツアイテムを受信してよい。
【0142】
別の実施形態では、コンテンツ受信サービス110は、電子文書について提案された変更を含む、メディアコンテンツアイテム以外のファイルを受信してよい。例えば、コンテンツ受信サービス110は、追加のマークアップされた電子文書、マークアップされた物理文書のスキャンされたバージョン、及び電子文書に対する提案された変更に対応するマークアップを含み得る任意の他の種類のファイルを受信してよい。
【0143】
ブロック804で、文書管理システム100は、受信したメディアコンテンツアイテムから、電子文書についてのコンテンツ提案に対応するメディアコンテンツ部分を識別してよい。メディアコンテンツ部分は、オーディオクリップ、ビデオクリップ、画像のコピー、又は任意の他のメディアコンテンツアイテムの部分集合のような、メディアコンテンツアイテムの部分集合を表してよい。一実施形態では、文書管理システム100は、会話認識サービス133を用いて、メディアコンテンツアイテムの各々を分析して、レビューされた文書内の文書部分を表すメディアコンテンツ部分を識別してよい。例えば、会話認識サービス133は、レビューされる文書の、特定の単語、フレーズ、章に対する編集に関して話しているユーザのオーディオクリップを識別してよい。
【0144】
一実施形態では、会話認識サービス133は、電子文書に対する提案された変更を示すメディアコンテンツ部分を識別するよう構成される機械学習モデルを実装してよい。機械学習モデルは、入力として、オーディオを含むメディアコンテンツアイテムを受信してよい。機械学習モデルは、メディアコンテンツアイテム内の検出された会話を分析し、会話を文字に変換してよい。文字は、次に、レビューされた文書に対するコンテンツ提案を示し得る特定の単語又はフレーズについて分析されてよい。機械学習モデルは、「on the second page」、「the final paragraph」、「the sentence starting with」、等のような文書内の位置を示し得る発言も識別してよい。機械学習モデルの出力は、レビューされた文書についての可能性のある提案された編集として識別されたメディアコンテンツ部分のセットを含んでよい。
【0145】
一実施形態では、会話認識サービス133により実装される機械学習モデルは、識別されたメディアコンテンツ部分のセットの文字転写に信頼スコアを割り当てるよう構成されてよい。ここで、信頼スコアは、変換の正確さの値を表す。信頼スコアの決定は、メディアコンテンツ部分内の会話の明確さ、及び機械学習モデルがメディアコンテンツ部分内の話された会話に変換された単語及びフレーズをどれだけ良好に一致させることができるか、に基づいてよい。
【0146】
一実施形態では、受信したメディアコンテンツアイテムが、ビデオ、スクリーンショット、又はマークアップの画像を含む画像ファイルを含むメディアコンテンツを含む場合、文書管理システム100は、マークアップ認識サービス132を用いて、提案された編集に対応するマークを識別してよい。マークアップ認識サービス132は、マークの意味を決定するために、手書きマークのようなマークを分析してよい。上述のように、マークアップ認識サービス132は、機械学習モデルを実装して、マーク、及びメディアコンテンツアイテムからのマークの意味を決定してよい。ビデオの例では、文書管理システム100は、マークアップ認識サービス132及び会話認識サービス133の両方を用いて、ビデオによりキャプチャされたマーク及びビデオのオーディオによりキャプチャされたメディアコンテンツ部分から、提案された編集を識別してよい。別の実施形態では、受信したファイルがマークアップされた電子文書又はマークアップされた物理文書を含む場合、文書管理システム100は、マークアップ認識サービス132を用いて、提案された編集に対応するマークを識別してよい。
【0147】
決定ブロック806で、文書管理システム100は、分析されるべきメディアコンテンツ部分が存在するか否かを決定してよい。注釈を生成するために分析されるべきメディアコンテンツ部分が存在する場合、文書管理システム100は、メディアコンテンツ部分からメディアコンテンツ部分を選択し、ブロック808に進んで、選択したメディアコンテンツ部分を分析してよい。しかしながら、分析されるべき更なるメディアコンテンツ部分が存在しない場合、文書管理システム100は、ブロック814に進み、更新された注釈を含む更新された電子文書を生成してよい。
【0148】
ブロック808で、文書管理システム100は、電子文書の文書部分から、メディアコンテンツ部分に対応する文書部分を識別してよい。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、文書の文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、文書内の特定文書部分を識別し、メディアコンテンツ部分と文書部分との間の相関を決定してよい。
【0149】
一実施形態では、
図6のブロック6608と同様に、文書管理システム100は、電子文書の文書部分から、メディアコンテンツ部分に対応する文書部分を識別してよい。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、1つ以上の文書の各々の文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、1つ以上の文書内の特定文書部分を識別し、メディアコンテンツ部分と文書部分との間の相関を決定してよい。
【0150】
一実施形態では、文書管理サービス105は、メディアコンテンツ部分及び電子文書から識別された文書部分を、文書部分とメディアコンテンツ部分との間の相関を決定するために、コンテンツ相関サービス134に送信してよい。コンテンツ相関サービス134は、変換された文字と文書部分との間の一致を決定するよう構成された機械学習モデルを使用してよい。コンテンツ相関サービス134は、文書管理サービス105に、メディアコンテンツ部分への参照及び一致する文書部分を送信してよい。対応する文書部分は、文書部分への参照、及び/又は一致する文書部分に対応する電子文書内の前後関係に依存する(positional)位置であってよい。
【0151】
ブロック810で、文書管理システム100は、ブロック808で識別された文書部分が既存の注釈に関連付けられると決定してよい。一実施形態では、文書管理サービス105は、既存の注釈が識別された文書部分に関連付けられるか否かを決定するために、データレポジトリ170からの既存の格納された注釈にアクセスしてよい。例えば、識別された文書部分が文書「exampleDoc.doc」の第1段落にある用語「AI Ricoh Interactive Assistance Service」に対応する場合、文書管理サービスは、データレポジトリ170からの既存の格納された注釈にアクセスして、「AI Ricoh Interactive Assistance Service」についての既存の注釈が存在するか否かを決定してよい。データレポジトリ170内に既存の注釈が存在する場合、文書管理サービス105は、注釈を識別し、ブロック812に進んで、既存の注釈を更新してよい。
【0152】
一実施形態では、文書管理サービス105は、既存の注釈に関連付けられた文書部分を分析して、既存の注釈の関連付けられた文書部分が、メディアコンテンツ部分の識別された文書部分に対応するか否かを決定してよい。上述のように、文書部分は、単語、フレーズ、文、画像、段落、及び章を表してよい。既存の注釈に関連付けられた文書部分が特定段落に対応し、メディアコンテンツ部分の識別された文書部分が特定段落内の単語又はフレーズに対応する場合、文書管理サービス105は、文書部分が重なり合っていたとしても、2つの文書部分が文書の別個の部分を表すと決定してよい。文書管理サービス105は、次に、注釈生成サービス120に、対応するメディアコンテンツ部分について別個の注釈を生成するよう要求を送信してよい。一実施形態では、文書管理サービス105は、文書部分が同じ部分に対応することを決定するために、2つの文書部分の間の重なり合いの量が閾を超えるか否かを決定するよう構成されてよい。例えば、閾は60%の重なり合いに設定されてよい。ここで、2つの文書部分は、同じ文書部分と見なされるためには、60%以上重なり合わなければならない。前述の例では、既存の注釈に関連付けられた文書部分が完全な段落に対応し、メディアコンテンツ部分に関連付けられた文書部分が段落内の文に対応し、文が段落の60%未満を構成する場合、文書管理サービス105は、閾が満たされず、既存の注釈がメディアコンテンツ部分と重なり合っていると見なされないことを決定してよい。一実施形態では、文書部分の重なり合いを決定するための閾値は、0~100の間の任意の重なり合い値に設定されてよい。
【0153】
ブロック812で、文書管理システム100は、既存の注釈をメディアコンテンツ部分に基づき更新する。一実施形態では、文書管理サービス105は、既存の注釈をメディアコンテンツ部分に基づき更新してよい。更新は、以下:メディアコンテンツ部分の文字転写、文字転写に関連付けられた信頼スコア、及びメディアコンテンツ部分へのリンク、のうちのいずれかを注釈オブジェクトに追加することを含んでよい。
【0154】
一実施形態では、文書管理サービス105は、既存の注釈種類及びメディアコンテンツ部分について決定された提案種類が同じか否かを決定してよい。既存の注釈種類及びメディアコンテンツ部分の提案種類が同じ場合、文書管理サービス105は、注釈生成サービス120に、既存の注釈を更新するための要求を送信してよい。しかしながら、既存の注釈種類及びメディアコンテンツ部分の提案種類が同じではない場合、文書管理サービス105は、注釈生成サービス120に、メディアコンテンツ部分についての新しい注釈を生成するための要求を送信してよい。文書管理サービス105は、異なる種類の提案を明確に識別するために、異なる提案種類がユニークな注釈により表されることを保証してよい。
【0155】
一実施形態では、文書管理サービス105は、既存の注釈種類に関連付けられたユーザIDが、メディアコンテンツ部分に関連付けられたユーザIDと同じであるか否かを決定してよい。既存の注釈種類に関連付けられたユーザIDがメディアコンテンツ部分に関連付けられたユーザIDがと同じ場合、文書管理サービス105は、注釈生成サービス120に、既存の注釈を更新するための要求を送信してよい。しかしながら、既存の注釈種類に関連付けられたユーザIDがメディアコンテンツ部分に関連付けられたユーザIDがと同じではない場合、文書管理サービス105は、注釈生成サービス120に、メディアコンテンツ部分についての新しい注釈を生成するための要求を送信してよい。文書管理サービス105は、各ユーザの提案を明確に表示する目的で、各ユーザIDのためにユニークな注釈の生成を要求してよい。さらに、ディスプレイウインドウ内に注釈を表示するとき、ユーザは、ユーザIDに基づき注釈をフィルタリングしてよい。したがって、注釈毎にユニークなユーザIDを有することはユーザによるフィルタリングを可能にし得る。
【0156】
別の実施形態では、既存の注釈のユーザIDとメディアコンテンツ部分のユーザIDとが異なる場合、文書管理サービス105は、注釈生成サービス120に、メディアコンテンツ部分を含むように既存の注釈を更新するよう要求し、メディアコンテンツ部分が異なるユーザIDに関連付けられることを指定してよい。複数のユーザIDからのコンテンツを有する注釈は、ディスプレイウインドウ内でそのようにマークされ又は示されてよい。
図7を参照すると、注釈720は、複数のユーザからのコンテンツを含む例示的な注釈である。注釈720は、用語「IFPD’s」に対応する文書部分に関連付けられる。注釈720は、2つのコメントを含む。第1のコメントは、文書レビュー会議に出席したリコーの従業員に対応する「Ricoh Reviewer」として識別され、メディアコンテンツアイテムによりキャプチャされた会話である。第2のコメントは、「Jane Doe」として識別され、マークアップされた電子文書に由来する。
【0157】
ブロック814で、文書管理システム100は、ディスプレイウインドウ内に電子的形式で、更新された注釈を有する電子文書、既存の注釈、及び新しく生成された注釈を表示してよい。一実施形態では、文書管理サービス105は、文書提示サービス150と通信して、クライアントコンピューティング装置上のディスプレイウインドウ内に1つ以上の更新された生成された注釈を有する電子文書を表示するグラフィカルユーザインタフェースを生成してよい。グラフィカルユーザインタフェースは、限定ではないが、電子文書の元のコンテンツ、関連付けられた注釈、及び注釈に関連付けられたマークアップを、元のコンテンツのディスプレイに重ね合わせて表示することを含んでよい。
【0158】
図7を参照すると、レビュアードロップダウンリスト730は、電子文書について提案を提供した利用可能なレビュアーのドロップダウンリストを提示してよい。Jane Doeのような特定レビュアーが、レビュアードロップダウンリスト730から選択された場合、グラフィカルユーザインタフェースは、レビュアーJane Doeに関連付けられたマークアップ及び注釈を表示してよい。一実施形態では、文書提示サービス150は、複数のユーザのうちの1人がレビュアードロップダウンリスト730から選択されると、複数のユーザに関連付けられた特定の注釈を表示するよう構成されてよい。例えば、レビュアーJane Doeがレビュアードロップダウンリスト730から選択された場合、注釈720がJane Doe及びRicoh Reviewerからの提案を含む場合でも、文書提示サービス150は、注釈720を表示してよい。
【0159】
別の実施形態では、文書提示サービス150は、レビュアードロップダウンリスト730から選択された特定ユーザからの注釈のコメントのみを表示するよう構成されてよい。例えば、Jane Doeがレビュアードロップダウンリスト730から選択されると、文書提示サービス150は、「IFPDは何の略ですか?展開できるかも?」(What does IFPD stand for? Maybe expand?)を含む、Jane Doeに関連付けられたコメントだけを表示してよい。更に別の実施形態では、文書提示サービス150は、選択された特定ユーザからの注釈のコメント及び公衆ユーザコメントを表示するよう構成されてよい。公衆ユーザコメントは、「Ricoh Reviewer」のような一般ユーザID、又は公開されるよう構成された任意の他のグループユーザIDに関連付けられたコメントを含んでよい。
【0160】
E.第三者注釈要求の生成
レビュー中の電子文書は、文書管理システム100以外のシステムにより管理されてよい。例えば、電子文書は、GoogleによるG-Suite又は任意の商用利用可能な又はプライベートに管理された文書管理システムのような、外部文書管理システムにより管理されてよい。文書管理システム100は、様々な入力からコンテンツ提案を識別し、提案の種類を決定し、レビュー中の電子文書を管理する外部文書管理システムへ送信され得る注釈生成要求を生成するよう構成されてよい。
【0161】
図9は、コンテンツ入力から受信した提案に基づき注釈要求を生成するアプローチを示すフロー図である。処理900は、単一のプログラム又は複数のプログラムにより実行されてよい。
図9に示すような処理の動作は、コンピュータメモリに格納されたプロセッサ実行可能命令を用いて実装されてよい。より明確な例を提供することを目的として、
図9の動作は、文書管理システム100のサービスにより実行されるとして説明される。明確化の目的で、処理900は単一のエンティティの観点で説明される。
【0162】
ブロック902で、文書管理システム100は、第三者管理システムにより管理される電子文書内のコンテンツについて提案されたコンテンツを表すコンテンツ入力を受信してよい。一実施形態では、コンテンツ受信サービス110は、電子文書内のコンテンツについての提案を含む、コンテンツ入力を受信してよい。コンテンツ入力は、電子文書内のコンテンツについての提案を含む任意の種類のメディアを表してよく、限定ではないが、マークアップされた物理文書、マークアップされた電子文書、オーディオ、ビデオ又は1つ以上のスクリーンショットの形式のメディアコンテンツアイテム、又はコンテンツに対する提案された変更を含む任意の他のファイル、を含む。コンテンツ受信サービス110は、指定されたウェブサイトへの直接アップロード、ネットワークストレージサービスに関連付けられたネットワーク位置へのリンク、又は任意の他の方法により、コンテンツ入力を受信してよい。
【0163】
一実施形態では、文書管理サービス105は、受信したコンテンツ入力から、電子文書のコンテンツを決定してよい。例えば、受信したコンテンツ入力がマークアップされた電子文書である場合、文書管理サービス105は、マークアップ、コメント、又は追跡された変更を含まない文字に基づき、電子文書の元のコンテンツを決定してよい。別の実施形態では、文書管理サービス105は、第三者文書管理システムと通信して、電子文書の元のバージョンを読み出すことにより、電子文書の元のコンテンツを決定してよい。例えば、文書管理サービス105は、コンテンツ入力に与えられたファイル名から、元の電子文書の名称を決定してよい。他の例では、文書管理サービス105は、元の電子文書についての要求を、第三者文書管理システムに送信してよい。第三者文書管理システムは、元の電子文書のコピー、又は元の電子文書をダウンロードするためのリンクにより、応答してよい。
【0164】
コンテンツ入力がコンテンツメディアアイテムを表す例では、文書管理サービス105は、コンテンツ入力の中のキャプチャされたコンテンツから、元の電子文書の名称を抽出してよい。例えば、コンテンツ入力がオーディオファイルである場合、文書管理サービス105は、レビュー中の電子文書のファイル名を表し得る発話された単語について、オーディオコンテンツを分析してよい。文書管理サービス105は、次に、元の電子文書についての要求を、第三者文書管理システムに送信してよい。
【0165】
ブロック904で、文書管理システム100は、電子文書に対する提案された変更を表す1つ以上のコンテンツ提案を識別してよい。一実施形態では、コンテンツ入力がマークアップされた電子文書である場合、文書管理サービス105は、先ず、電子マークアップ文書を読み出した元の電子文書からの元のコンテンツと比較して、電子マークアップ文書内の元のコンテンツを識別することにより、マークアップされた電子文書の中のマークアップとして、コンテンツ提案を識別してよい。文書管理サービス105は、識別された元のコンテンツと別個のコンテンツを識別することにより、電子マークアップ文書内のマークアップを識別してよい。
【0166】
一実施形態では、文書管理サービス105は、マークアップの意味を決定するために、マークアップ認識サービス132を使用して、識別されたマークアップの各々を分析してよい。マークアップ認識サービス132は、機械学習モデルを実装して、マークアップの各々の意味を識別してよい。
【0167】
一実施形態では、コンテンツ入力がメディアコンテンツアイテムである場合、文書管理サービス105は、コンテンツ入力から、電子文書内の文書部分を参照するコンテンツ提案を識別してよい。コンテンツ提案は、オーディオクリップ、ビデオクリップ、又は電子文書の部分を参照するスクリーンショットのクロップのような、メディアコンテンツ部分を表してよい。一実施形態では、文書管理サービス105は、会話認識サービス133を用いて、レビューされた文書の文書部分を表すコンテンツ提案へのコンテンツ入力を分析してよい。会話認識サービス133は、電子文書に対する提案された変更を示すコンテンツ提案を識別するよう構成される機械学習モデルを実装してよい。
【0168】
一実施形態では、文書管理サービス105は、識別したコンテンツ提案の意味から、提案種類を決定してよい。例えば、コンテンツ入力がマークアップされた電子文書である場合、文書管理サービス105は、マークアップ認識サービス132を用いて、識別されたマークアップの意味に基づき提案種類を決定してよい。別の例では、コンテンツ入力がコンテンツアイテムである場合、文書管理サービス105は、会話認識サービス133を用いて、コンテンツ提案について変換された文字を決定し、変換された文字の意味に基づき提案種類を決定してよい。
【0169】
一実施形態では、文書管理サービス105は、識別したコンテンツ提案に関連付けられたユーザのユーザIDを決定してよい。例えば、コンテンツ入力は、マークアップされた電子文書である場合、文書管理サービス105は、マークアップされた電子文書に関連付けられたメタデータ、例えば電子文書の作成者特性、又はマークアップされた電子文書に埋め込まれた特定コメントに関連付けられたユーザ名から、ユーザを決定してよい。コンテンツ入力がメディアコンテンツアイテムである場合、文書管理サービス105は、会話認識サービス133を用いて、特定のコンテンツ提案に対応する会話に関連付けられたユーザを決定してよい。
【0170】
1つ以上のコンテンツ提案を識別すると、文書管理システム100は、電子文書の元のコンテンツから対応する文書部分を決定するために、各コンテンツ提案を繰り返し分析してよい。決定ブロック906で、文書管理システム100は、分析のために残りのコンテンツ提案があるか否かを決定してよい。分析されるべき残りのコンテンツ提案が存在する場合、文書管理システム100は、コンテンツ提案を選択し、ブロック908に進んで選択したコンテンツ提案を分析してよい。しかしながら、分析されるべき更なるコンテンツ提案が存在しない場合、文書管理システム100は、ブロック912に進み、1つ以上の生成された文書提案要求を第三者管理システムに送信してよい。
【0171】
ブロック908で、文書管理システム100は、電子文書の文書部分から、選択したコンテンツ提案に対応する文書部分を識別してよい。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、電子文書の文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、電子文書内の特定文書部分を識別し、メディアコンテンツ部分と文書部分との間の相関を決定してよい。
【0172】
元の電子文書内の文書部分を決定すると、文書管理システム100は、選択されたコンテンツ提案と文書部分との間の相関を決定してよい。一実施形態では、コンテンツ相関サービス134は、選択したコンテンツ提案と電子文書の文書から識別された文書部分の中の文書部分との間の一致を識別してよい。
【0173】
ブロック910で、文書管理システム100は、選択したコンテンツ提案についての文書提案要求を生成してよい。一実施形態では、注釈生成サービス120は、コンテンツ提案の文字転写、提案の種類、コンテンツ提案から決定されたユーザID、電子文書の文書部分に対応する電子文書位置、及びコンテンツ入力への電子リンクを含む、第三者互換文書提案要求を生成してよい。例えば、選択したコンテンツ提案が、電子文書内に記載された製品を対象とするコメントのメディアコンテンツアイテムからのオーディオクリップである場合、生成される文書提案要求は、オーディオクリップの文字転写、変換されたオーディオクリップから決定されたコメントのような提案種類、提案を行ったユーザを識別するユーザID、記載された製品の文書部分に対応する文書位置、及び特定オーディオクリップへのキューに入れられたメディアコンテンツアイテムへの電子リンクを含んでよい。
【0174】
文書提案要求を生成すると、文書管理システム100は、決定ブロック906に進んでよい。決定ブロック906で、文書管理システム100は、分析されるべき残りのコンテンツ提案があるか否かを決定してよい。分析されるべき残りのコンテンツ提案がある場合、文書管理システム100は、全てのコンテンツ提案が分析されるまで、ブロック908及び910を繰り返してよい。分析されるべき残りのコンテンツ提案がない場合、文書管理システム100は、ブロック912に進んでよい。
【0175】
ブロック912で、文書管理システム100は、生成した文書提案要求を第三者管理システムに送信してよい。一実施形態で、文書管理サービス105は、ネットワーク160を介して、生成した文書提案要求を第三者管理システムに送信してよい。一実施形態では、コンテンツ入力がメディアコンテンツアイテムである場合、文書管理サービス105は、文書提案要求と一緒に、文書提案要求に対応するコンテンツ入力を送信してよい。例えば、文書提案要求がメディアコンテンツアイテムからのオーディオクリップに対応する場合、文書管理サービス105は、メディアコンテンツアイテムを、対応するオーディオクリップへメディアコンテンツアイテムをキューイングするメタデータと共に送信してよい。第三者管理システムは、対応するメディアコンテンツアイテムと一緒に文書提案要求を受信し、第三者管理システムに固有の注釈を生成してよい。例えば、第三者管理システムがGoogle G-Suiteである場合、Google G-Suiteは受信した文書提案要求に対するコメントを生成してよい。文書提案要求がメディアコンテンツアイテム参照を含む場合、対応するメディアコンテンツアイテムは、Google G-Suiteに格納されてよく、生成されたコメントは、格納されたメディアコンテンツアイテムへの電子リンクを有してよい。その結果、電子文書をレビューするユーザは、電子シンクを選択して、対応するオーディオクリップを聞くことができる。
【0176】
F.会議要約文書の生成
多くの専門的及び学術的機関は、1つ以上の文書に対する変更を議論し提案するために、文書レビュー会議を行うことがある。文書レビュー会議は、レビュアー間の正式な会議、レビュアー間のアドホック会議、レビュアー間の電話又はテレビ会議を含んでよい。文書レビュー会議の間に、複数の異なる文書からのコンテンツをカバーし得る多くの異なるトピックが議論されてよい。要約会議文書は、文書レビュー会議の間にカバーされた異なる議題を記載してよい。例えば、1つのこのような議題は、複数の文書に関連する図をレビューすることであってよい。議題が複数の文書に及ぶときでも、各議題のメモを集めることは有用である。しかしながら、単一又は複数の記録係に依存することは、記録係が議論の幾つかの詳細事項を見落とす可能性があるので、欠点を有する。
【0177】
一実施形態では、文書管理システム100は、文書レビュー会議の間にキャプチャされた議論の1つ以上のメディアコンテンツアイテムを受信するよう構成されてよい。文書管理システム100は、メディアコンテンツアイテムの各々を分析し、文書レビュー会議からの議題を含む会議要約文書を生成してよい。
【0178】
図10は、文書レビュー会議の間にキャプチャされた議論のメディアコンテンツアイテムに基づき会議要約文書を生成するアプローチを示すフロー図である。処理1000は、単一のプログラム又は複数のプログラムにより実行されてよい。
図10に示すような処理の動作は、コンピュータメモリに格納されたプロセッサ実行可能命令を用いて実装されてよい。より明確な例を提供することを目的として、
図10の動作は、文書管理システム100のサービスにより実行されるとして説明される。明確化の目的で、処理1000は単一のエンティティの観点で説明される。
【0179】
ブロック1002で、文書管理システム100は、1つ以上の電子文書についてのレビュー会議からのキャプチャされたコンテンツを表す1つ以上のメディアコンテンツアイテムを受信してよい。一実施形態では、コンテンツ受信サービス110は、1つ以上の文書の文書レビュー会議の記録されたオーディオ、ビデオ、及びキャプチャされたスクリーンショットを含む、メディアコンテンツアイテムを受信してよい。
【0180】
ブロック1004で、文書管理システム100は、1つ以上のメディアコンテンツアイテムから、レビュー会議の間に議論された1つ以上の議題を識別してよい。議題は、製品を説明するキーワード又はフレーズ、マイルストーン、場所、人物、又はレビュー会議の間に議論され得るレビューされる文書に関連する任意の他の主題さえも表してよい。一実施形態では、文書管理サービス105は、会話認識サービス133を用いて、メディアコンテンツアイテムの各々を分析して、議題を表し得る特定のキーワード及びフレーズを識別してよい。会話認識サービス133は、1つ以上の機械学習モデルを実装して、メディアコンテンツアイテムを分析することにより、議題を識別してよい。機械学習モデルは、識別される議題を対象とするキーワード及びフレーズを含む入力データセットを用いてトレーニングされてよい。
【0181】
別の実施形態では、会議のまとめ役のようなユーザが、文書管理サービス105に、レビュー会議の間に議論された議題のセットを提供してよい。例えば、会議のまとめ役は、レビュー会議の前又は後に、レビュー会議の予定された議題のリストを提供してよい。別の実施形態では、文書管理サービス105は、ユーザから、提案された議題のリストを受信してよく、提案された議題のリストを、メディアコンテンツアイテムと一緒に、会話認識サービス133に提供してよい。会話認識サービス133は、提案された議題のリストを、メディアコンテンツアイテムから議題を識別するための指針及び/又は開始点として使用するよう構成されてよい。
【0182】
更に別の実施形態では、文書管理サービス105は、レビュー会議の主題である1つ以上の電子文書を決定してよく、1つ以上の電子文書をコンテンツ認識サービス131に提供して、追加の議題を決定してよい。コンテンツ認識サービス131は、1つ以上の電子文書を分析し、電子文書内の章、段落、キーワード、及びタイトルに基づき、可能性のある議題を決定してよい。
【0183】
ブロック1006で、文書管理システム100は、1つ以上のメディアコンテンツアイテムから、レビュー会議の間に議論された1つ以上の電子文書についてのコンテンツ提案に対応するメディアコンテンツ部分を識別してよい。一実施形態では、文書管理システム100は、会話認識サービス133を用いて、メディアコンテンツアイテムの各々を分析して、レビューされた文書内の文書部分を表すメディアコンテンツ部分を識別してよい。例えば、会話認識サービス133は、レビューされる文書の、特定の単語、フレーズ、章に対する編集に関して話しているユーザのオーディオクリップを識別してよい。
【0184】
一実施形態では、会話認識サービス133は、コメント又は提案された編集のいずれかのコンテンツ提案を示すメディアコンテンツ部分を識別するよう構成される機械学習モデルを実装してよい。機械学習モデルは、入力として、オーディオを含むメディアコンテンツアイテムを受信してよい。機械学習モデルは、メディアコンテンツアイテム内の検出された会話を分析し、会話を文字に変換してよい。文字は、次に、レビューされた文書の提案された編集を示し得る特定の単語又はフレーズについて分析されてよい。例えば、「the word... is duplicated」、「we need more examples」、「the introduction is too short」、「the word... is misspelled」、「could you update figure X」のような発言は、特定のメディアコンテンツ部分が文書についての提案又は編集に関連することを示してよい。機械学習モデルは、次に、コメント又は提案された編集のようなコンテンツ提案種類を、会話の変換された文字に基づき割り当ててよい。機械学習モデルは、「on the second page」、「the final paragraph」、「the sentence starting with」、等のような文書内の位置を示し得る発言も識別してよい。機械学習モデルの出力は、レビューされた文書についての可能性のあるコンテンツ提案として識別されたメディアコンテンツ部分のセットを含んでよい。
【0185】
決定ブロック1008で、文書管理システム100は、分析されるべきメディアコンテンツ部分が存在するか否かを決定してよい。分析されるべきメディアコンテンツ部分が存在する場合、文書管理システム100は、メディアコンテンツ部分からメディアコンテンツ部分を選択し、ブロック1010に進んでよい。しかしながら、分析されるべき追加メディアコンテンツ部分が存在しない場合、文書管理システム100はブロック1014に進んでよい。
【0186】
ブロック1010で、文書管理システム100は、1つ以上の議題のうちの議題を、メディアコンテンツ部分に関連付けてよい。一実施形態では、文書管理サービス105は、会話認識サービス133を用いて、どの議題が選択されたメディアコンテンツ部分に関連付けられるかを決定してよい。会話認識サービス133は、議題及びメディアコンテンツ部分の中のキーワードを分析することにより、識別された議題とメディアコンテンツ部分との間の関連付けを決定するよう構成されてよい。会話認識サービス133は、機械学習モデルを実装して、メディアコンテンツ部分と議題との間の関連付けを決定してよい。例えば、機械学習モデルは、メディアコンテンツ部分内に存在する特定キーワードを使用して、特定キーワードに関連し得る関連付けられた議題を決定するようトレーニングされてよい。別の実施形態では、会話認識サービス133は、議題及部分メディアコンテンツに関連付けられたタイムスタンプを分析して、メディアコンテンツ部分が特定の議題に対応するレビュー会議中の時間に対応するかどうかを決定してよい。メディアコンテンツ部分に関連付けられた1つ以上の議題を決定すると、文書管理サービス105は、メディアコンテンツ部分のデータオブジェクト内に、関連付けられた議題を識別する特性を格納してよい。
【0187】
ブロック1012で、文書管理システム100は、1つ以上の電子文書から、メディアコンテンツ部分に対応する文書部分を識別してよい。一実施形態では、文書管理システム100は、1つ以上の機械学習モデルを実装して、1つ以上の文書の各々の文書種類を識別し、セクション、フレーズ、特定キーワード、及び任意の他のコンテンツ固有部分に対応する、1つ以上の文書内の特定文書部分を識別し、メディアコンテンツ部分と文書部分との間の相関を決定してよい。
【0188】
一実施形態では、文書管理サービス105は、どの文書がレビューされたかを、文書レビュー会議のまとめ役のようなユーザにより提供された文書ファイル名に基づき、又は受信したメディアコンテンツアイテムを分析してレビューされた文書のファイル名を識別することにより、又はレビューされた文書のリストをユーザから受信することにより、決定してよい。一実施形態では、コンテンツ認識サービス131は、レビューされた1つ以上の文書のコンテンツを分析して、文書種類、及び各レビューされた文書の文書部分を決定してよい。コンテンツ認識サービス131は、文書のコンテンツを入力として用いて各文書の文書種類を決定するよう構成された機械学習モデルを実装してよい。機械学習モデルは、メディアコンテンツアイテムからのコンテンツ提案を文書内の位置に相関し得る、文書からの文書部分を識別するよう構成されてよい。
【0189】
一実施形態では、文書管理サービス105は、メディアコンテンツ部分及び1つ以上の電子文書から識別された文書部分を、文書部分とメディアコンテンツ部分との間の相関を決定するために、コンテンツ相関サービス134に送信してよい。コンテンツ相関サービス134に送信されたメディアコンテンツ部分は、会話認識サービス133からの変換された文字及びその元の形式でメディアコンテンツ部分を含むデータオブジェクトの形式であってよい。文書部分は、各文書部分に関連付けられた電子文書、電子文書に関連付けられた文書種類、及びメディアコンテンツ部分と文書部分との間の一致を見付けるのに支援するために使用され得る任意の他の文書固有情報を定める、メタデータのような追加特性データを含んでよい。
【0190】
一実施形態では、コンテンツ相関サービス134は、変換された文字と文書部分との間の一致を決定するよう構成された機械学習モデルを使用してよい。例えば、メディアコンテンツ部分の変換された文字が「要約の最初の文を書き換えてください」(Please reword the first sentence of the abstract)を含む場合、機械学習モデルは、電子文書の要約部分の第1文に対応する一致する文書部分が存在するか否かを決定してよい。機械学習モデルは、「要約」(abstract)のようなメディアコンテンツ部分内のキーワードを識別し、要約のキーワードが特許出願文書種類の中の章を参照することを決定してよい。コンテンツ相関サービス134は、文書管理サービス105に、メディアコンテンツ部分への参照及び一致する文書部分を送信してよい。対応する文書部分は、文書部分への参照、及び/又は一致する文書部分に対応する電子文書内の前後関係に依存する(positional)位置であってよい。
【0191】
メディアコンテンツ部分に対応する文書部分を識別すると、文書管理システム100は、決定ブロック1008に進み、分析される必要のある追加メディアコンテンツ部分が存在するか否かを決定してよい。分析されるべき追加メディアコンテンツ部分が存在しない場合、文書管理システム100はブロック1010及び1012を繰り返してよい。決定ブロック1008で、分析されるべき追加メディアコンテンツ部分が存在しない場合、文書管理システム100はブロック1014に進んでよい。
【0192】
ブロック1014で、文書管理システム100は、それらの関連付けられた議題に基づき、メディアコンテンツ部分を集約して、メディアコンテンツ部分のトピックセットを生成してよい。一実施形態では、文書管理サービス105は、関連付けられた議題の照合に基づき、メディアコンテンツ部分のトピックセットを生成してよい。例えば、5個のメディアコンテンツ部分が「図のレビュー及び更新」(Review figures and update)という議題に関連付けられている場合、文書管理サービス105は、議題「図のレビュー及び更新」(Review figures and update)についてのメディアコンテンツ部分のトピックセットを生成し、5個のメディアコンテンツ部分をメディアコンテンツ部分のトピックセットに含めてよい。
【0193】
ブロック1016で、文書管理システム100は、会議要約文書を生成してよい。一実施形態では、文書管理サービス105は、議題のリストを含む会議要約文書を生成してよい。
図11は、生成された会議要約文書及びメディアコンテンツアイテムプレイヤを表示するディスプレイウインドウの例示的な実施形態を示す。ディスプレイウインドウ1105は、会議の説明1115、第1区域1110、及び第2区域1120を含む、グラフィカルユーザディスプレイを表す。会議の説明1115は、会議の日時、会議名、会議場所、及び参加者を含む、レビュー会議の一般的詳細を表示してよい。ディスプレイウインドウ1105に例示的に表示された会議の説明1115は、会議の日付を表示する。
【0194】
第1区域1110は、1つ以上のメディアコンテンツアイテムを再生するよう構成されるメディアコンテンツアイテムプレイヤを含んでよい。メディアコンテンツアイテムプレイヤは、巻き戻し、一時停止、再生、早送りのための再生制御、及び再生ウインドウのサイズを変更するためのリサイズボタンを有するよう構成されてよい。メディアコンテンツアイテムプレイヤは、オーディオファイル、ビデオファイル、対話型ビデオファイル、及び任意の他の再生可能メディアを含むがこれらに限定されない、任意の種類のメディアコンテンツアイテムを再生するよう構成されてよい。
【0195】
第2区域1120は、1つ以上の議題のリストを含む生成された会議要約文書の表示を含んでよい。文書トピック(Document topics)1130は、リストされたトピックの種類を説明し得る、構成可能なトピック見出しを提示してよい。一実施形態では、リストされた議題の各々は、リストされた項目として、又は選択可能な電子リンクとして、表示されてよい。議題1135は、議題「図のレビュー及び更新」(review figures and update)を提示する。議題1150は、議題「マーケティングによる製品名の確認」(Confirm product name with marketing)を提示する。これは、選択可能な電子リンクとして表示される。ユーザが議題1150の電子リンクを選択した場合、文書管理システム100は、議題1150に関連付けられたメディアコンテンツ部分への電子リンクを含むグラフィカルユーザインタフェースを生成し表示してよい。
【0196】
一実施形態では、議題に関連付けられたメディアコンテンツ部分は、議題の下のサブリスト内に表示されてよい。例えば、3個のメディアコンテンツ部分のサブリストは、議題1135の直下に表示される。一実施形態では、関連付けられたメディアコンテンツ部分は、選択可能な電子リンクとして表示されてよい。該電子リンクは、選択されると、選択されたメディアコンテンツ部分を、ディスプレイウインドウ1105の第1区域1110内のメディアコンテンツアイテムプレイヤ内で再生させてよい。例えば、ユーザが、「
図1-数値を更新する」(Fig 1-update numbers)というタイトルのメディアコンテンツ部分1140を選択した場合、文書管理サービス105は、メディアコンテンツ部分1140を含むメディアコンテンツアイテムの再生を、メディアコンテンツアイテムプレイヤ内で生じてよい。メディアコンテンツアイテムの再生は、メディアコンテンツ部分1140に対応する部分を再生するために、キューに入れられてよい。
【0197】
一実施形態では、各文書トピックの下に表示されたサブリストは、メディアコンテンツ部分に関連付けられた文書部分を含む電子文書に対応する第2電子リンクのリストも含んでよい。例えば、サブリストは、「
図1-数値を更新する」(Fig 1-update numbers)というメディアコンテンツ部分1140に関連付けられた文書部分を含む電子文書「Doc-1」に対応する第2電子リンク1145を表示してよい。一実施形態では、第2電子リンク1145は、電子文書名を示す文字、及び対応する文書部分を含むページ番号を表示してよい。別の実施形態では、ディスプレイウインドウ1105が、単一の文書を議論する会議の要約文書を表示する場合、要約文書内の第2電子リンクの表示文字は、文書部分に対応するページ番号を表示するだけでよい。
【0198】
一実施形態では、文書管理サービス105は、ユーザから、第2電子リンク1145を選択する選択要求を受信してよい。第2電子リンク1145の選択要求を受信すると、文書管理サービス105は、対応する電子文書を開き、第2電子リンクに対応する特定文書部分を含む文書ページを表示してよい。例えば、ユーザは、第2電子リンク1145を選択してよい。第2電子リンク1145は、文書管理サービス105に、「Doc-1」を開かせ、「
図1-数値を更新する」(Fig 1-update numbers)に対応する文書部分を含む電子文書のページ2を表示させてよい。
【0199】
一実施形態では、文書管理サービス105は、第1区域1110内のメディアコンテンツアイテムプレイヤ内で、特定メディアコンテンツアイテムを再生するための要求を受信してよい。文書管理サービス105は、特定メディアコンテンツアイテムの再生中に、特定の議題が議論されるとき、特定メディアコンテンツアイテムの再生の中で該特定の議題を強調表示してよい。文書管理サービス105は、各議題に関連付けられたタイムスタンプに基づき、議題を識別するよう構成されてよい。例えば、文書管理サービス105は、特定のメディアコンテンツアイテムを再生してよく、再生中に、文書管理サービス105は、再生中のメディアコンテンツアイテムのタイムスタンプが議題1135に関連付けられたタイムスタンプと一致することを決定し、次に、文書管理サービス105は、第2区域1120内の議題1135を強調表示してよい。
【0200】
一実施形態では、文書管理サービス105は、再生中のメディアコンテンツアイテムのタイムスタンプがメディアコンテンツ部分に関連付けられたタイムスタンプと一致すると、表示された特定のメディアコンテンツ部分及び/又は表示された文書部分の電子リンクを強調表示するよう構成されてよい。別の例では、文書管理サービス105は、対応する電子文書を開き、文書部分の表示をメディアコンテンツアイテムの再生に同期させるために、対応する文書部分を表示するよう構成されてよい。例えば、メディアコンテンツアイテムが再生され、メディアコンテンツアイテムの現在のタイムスタンプが第2電子リンク1145の文書部分に対応する場合、文書管理サービス105は、「Doc-1」を開き、再生されているメディアに対応する文書部分を表示するために「Doc-1」のページ2を表示してよい。
【0201】
図10を参照すると、ブロック1018で、文書管理システム100は、ディスプレイウインドウ内で会議要約文書を提示してよい。一実施形態では、文書管理サービス105は、文書提示サービス150と通信して、クライアントコンピューティング装置上のディスプレイウインドウ内に会議要約文書を表示するグラフィカルユーザインタフェースを生成してよい。
【0202】
IV.実装メカニズム
本発明の一実施形態によると、本願明細書に記載した技術は、1又は複数の特定目的コンピュータ装置により実施される。特定目的コンピュータ装置は、この技術を実行するためにハードウェアに組み込まれても良く、この技術を実行するよう永続的にプログラムされた1又は複数の特定用途向け集積回路(ASIC)若しくはフィールドプログラマブルゲートアレイ(FPGA)のようなデジタル電子装置を有して良く、この技術を実行するようプログラム命令に従ってファームウェア、メモリ、他の記憶若しくは組合せでプログラムされた1又は複数の汎用目的ハードウェアプロセッサを有してよい。このような特定目的コンピュータ装置は、この技術を達成するために、カスタムハードワイヤードロジック、ASIC又はFPGAをカスタムプログラミングと組み合わせてよい。特定目的コンピュータ装置は、デスクトップコンピュータシステム、ポータブルコンピュータシステム、ハンドヘルド装置、ネットワーク装置、又はこの技術を実施するためのハードワイヤードロジック及び/又はプログラムロジックを組み込んだ任意の他の装置であってよい。
【0203】
図12は、本発明の実施形態が実装され得る例示的なコンピュータシステム1200を示すブロック図である。コンピュータシステム1200は、バス1202又は情報を通信する他の通信機構、及びバス1202に接続され情報を処理するプロセッサ1204を有する。コンピュータシステム1200は、また、ランダムアクセスメモリ(RAM)又は他のダイナミック記憶素子のような、バス1202に接続され情報及びプロセッサ1204により実行されるべき命令を格納する主記憶1206も有する。主記憶1206は、プロセッサ1204により実行されるべき情報の実行中に、一時変数又は他の中間的情報を格納するために用いられてよい。コンピュータシステム1200は、バス1202に接続され、静的情報及びプロセッサ1204のための命令を格納する読み出し専用メモリ(ROM)1208又は他の静的記憶装置を更に有する。情報及び命令の格納のために、磁気ディスク又は光ディスクのような記憶装置1210が設けられバス1202に接続される。
【0204】
コンピュータシステム1200は、バス1202を介して、陰極線管(CRT)のような、コンピュータユーザに情報を表示するディスプレイ1212に接続されてよい。バス1202は単一のバスとして図示されるが、バス1202は1又は複数のバスを有してよい。例えば、バス1202は、プロセッサ1204がコンピュータシステム1200内の他の装置を制御する制御バス、プロセッサ1204が実行のために命令のメモリ位置を指定するアドレスバス、又はコンピュータシステム1200のコンポーネント間でデータ又は信号を転送するための任意の他の種類のバスを有してよいが、これらに限定されない。
【0205】
入力装置1214は、英数字及び他のキーを有し、バス1202に接続され、プロセッサ1204に情報及びコマンド選択を伝達する。別の種類のユーザ入力装置は、マウス、トラックボール又はカーソル方向キーのようなカーソル制御1216であり、プロセッサ1204に方向情報及びコマンド選択を伝達し、ディスプレイ1212上のカーソルの移動を制御する。この入力装置は、通常、2軸、つまり第1の軸(例えばX)及び第2の軸(例えばY)における2度の自由度を有し、装置に平面内の位置を指定させる。
【0206】
コンピュータシステム1200は、本願明細書に記載した技術を、カスタマイズハードワイヤードロジック、1又は複数のASIC若しくはFPGA、コンピュータシステムと組み合わせて、コンピュータシステム1200を特定用途向け機械にする若しくはプログラムするファームウェア及び/又はプログラムロジック若しくはコンピュータソフトウェアを用いて実装してよい。本発明の一実施形態によると、これらの技術は、プロセッサ1204が主記憶1206に含まれる1又は複数の命令の1又は複数のシーケンスを実行するのに応答して、コンピュータシステム1200により実行される。このような命令は、記憶装置1210のような別のコンピュータ可読媒体から主記憶1206に読み込まれてもよい。主記憶1206に含まれる命令シーケンスの実行は、プロセッサ1204に本願明細書に記載した処理ステップを実行させる。代替の実施形態では、ハードワイヤード回路が、本発明を実施するソフトウェア命令の代わりに又はそれと組み合わせて用いられてもよい。このように、本発明の実施形態は、ハードウェア回路とソフトウェアのいかなる特定の組合せにも限定されない。
【0207】
本願明細書で用いられる用語「コンピュータ可読媒体」は、コンピュータを特定の方法で動作させるデータを提供する際に関与する任意の媒体を表す。コンピュータシステム1200を用いて実施される実施形態では、種々のコンピュータ可読媒体が、例えば命令をプロセッサ1204に実行するために提供する際に、関与する。このような媒体は、不揮発性媒体及び揮発性媒体を含む多くの形態を取ることができ、これらに限定されない。不揮発性媒体は、例えば、記憶装置1210のような光又は磁気ディスクを含む。揮発性媒体は、主記憶1206のような動的記憶を含む。コンピュータ可読媒体の共通形態は、例えば、フロッピディスク、フレキシブルディスク、ハードディスク、磁気テープ、又は任意の他の磁気媒体、CD-ROM、任意の他の光学媒体、RAM,PROM及びEPROM、FLASH-EPROM、任意の他のメモリチップ若しくはメモリカートリッジ、又はコンピュータが読み取れる任意の他の媒体を含む。
【0208】
種々の形態のコンピュータ可読媒体は、実行のためにプロセッサ1204に1又は複数の命令の1又は複数のシーケンスを伝達する際に、関与し得る。例えば、命令は、初めにリモートコンピュータの磁気ディスクで運ばれ得る。リモートコンピュータは、その命令を自身の動的記憶にロードし、及びモデムを用いて電話線を介して命令を送信できる。コンピュータシステム1200にローカルなモデムは、電話線でデータを受信し、赤外線送信機を用いて、そのデータを赤外線信号に変換できる。赤外線検出器は、赤外線信号で伝達されたデータを受信し、適切な回路がそのデータをバス1202に置くことができる。バス1202は、データを主記憶1206に伝達する。主記憶1206から、プロセッサ1204が命令を読み出し実行する主記憶1206により受信された命令は、任意的に、プロセッサ1204により実行される前又は後に、記憶装置1210に格納されてよい。
【0209】
コンピュータシステム1200は、バス1202に接続された通信インタフェース1218も含む。通信インタフェース1218は、ローカルネットワーク1222に接続されるネットワークリンク1220に接続される2方向データ通信を提供する。例えば、通信インタフェース1218は、対応する種類の電話線へのデータ通信接続を提供するISDN(Integrated Services Digital Network)カード又はモデムであってもよい。別の例として、通信インタフェース1218は、互換性のあるLANへのデータ通信接続を提供するLAN(Local Area Network)カードであってよい。無線リンクも実装されてよい。任意のこのような実装で、通信インタフェース1218は、種々の情報を表すデジタルデータストリームを伝達する電気、電磁気又は光信号を送信及び受信する。
【0210】
ネットワークリンク1220は、通常、1又は複数のネットワークを通じて他のデータ装置へのデータ通信を提供する。例えば、ネットワークリンク1220は、ローカルネットワーク1222を通じてホストコンピュータ1224への又はISP(Internet Service Provider)1226により稼働されるデータ機器への接続を提供できる。ISP1226は、また、現在一般的に「インターネット」1228と称される世界的規模のパケットデータ通信ネットワークを通じてデータ通信サービスを提供する。ローカルネットワーク1222及びインターネット1228の両者は、デジタルデータストリームを伝達する電気、電磁気又は光信号を用いる。
【0211】
コンピュータシステム1200は、ネットワーク、ネットワークリンク1220及び通信インタフェース1218を通じて、プログラムコードを含む、メッセージを送信し及びデータを受信できる。インターネットの例では、サーバ1230は、インターネット1228、ISP1226、ローカルネットワーク1222及び通信インタフェース1218を通じてアプリケーションプログラムのために要求されたコードを送信し得る。受信されたコードは、プロセッサ1204により受信されるとプロセッサ1204により実行され、及び/又は後に実行するために記憶装置1210若しくは他の不揮発性記憶に格納され得る。
【0212】
上述の明細書では、本発明の実施形態は、実施形態毎に変化し得る多数の特定の詳細を参照し説明された。したがって本発明の、および本出願者により発明であるように意図したものの唯一の指標は、特許請求の範囲が由来する特定の形式の、いかなる今後の補正も含む本出願に由来する一組の特許請求の範囲である。したがって請求項内で明示的に記述されない限界、要素、特性、特徴、利点、または属性がこのような特許請求項の範囲を決して制限してはならない。したがって本明細書と添付図面は限定的ではなく例示的であると解釈すべきである。
【符号の説明】
【0213】
100 文書管理システム
105 文書管理サービス
110 コンテンツ受信サービス
115 ユーザID管理サービス
120 注釈生成サービス
130 知的コンテンツ認識モデル
131 コンテンツ認識サービス
132 マークアップ認識サービス
133 会話認識サービス
134 コンテンツ相関サービス
140 多機能印刷サービス
150 文書提示サービス
160 ネットワーク
170 データレポジトリ