IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 和碩聯合科技股▲ふん▼有限公司の特許一覧

特許7572480ビデオ会議またはビデオ授業用の電子装置及び表示方法
<>
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図1
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図2
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図3
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図4
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図5A
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図5B
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図6
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図7
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図8
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図9
  • 特許-ビデオ会議またはビデオ授業用の電子装置及び表示方法 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-15
(45)【発行日】2024-10-23
(54)【発明の名称】ビデオ会議またはビデオ授業用の電子装置及び表示方法
(51)【国際特許分類】
   G09G 5/377 20060101AFI20241016BHJP
   G09G 5/00 20060101ALI20241016BHJP
   G09G 5/38 20060101ALI20241016BHJP
   G09G 5/14 20060101ALI20241016BHJP
   G09G 5/37 20060101ALI20241016BHJP
   H04N 23/63 20230101ALI20241016BHJP
   G06F 3/0483 20130101ALI20241016BHJP
   G06F 3/04883 20220101ALI20241016BHJP
【FI】
G09G5/377 100
G09G5/00 510H
G09G5/00 550B
G09G5/00 555D
G09G5/38
G09G5/00 550C
G09G5/14 A
G09G5/37 320
G09G5/37 110
H04N23/63 300
G06F3/0483
G06F3/04883
【請求項の数】 14
【外国語出願】
(21)【出願番号】P 2023033553
(22)【出願日】2023-03-06
(65)【公開番号】P2023138910
(43)【公開日】2023-10-03
【審査請求日】2023-04-04
(31)【優先権主張番号】111110298
(32)【優先日】2022-03-21
(33)【優先権主張国・地域又は機関】TW
(73)【特許権者】
【識別番号】508226687
【氏名又は名称】和碩聯合科技股▲ふん▼有限公司
【氏名又は名称原語表記】PEGATRON CORPORATION
【住所又は居所原語表記】5F.,No.76,Ligong St., Beitou Dist., Taipei City 112, Taiwan
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】▲蒋▼佳良
(72)【発明者】
【氏名】陳柏森
(72)【発明者】
【氏名】游清皓
(72)【発明者】
【氏名】高才虔
(72)【発明者】
【氏名】鍾權岳
(72)【発明者】
【氏名】鄭道華
【審査官】中村 直行
(56)【参考文献】
【文献】特開2011-145995(JP,A)
【文献】特開2014-203119(JP,A)
【文献】特開2010-206745(JP,A)
【文献】特開2014-212404(JP,A)
【文献】特開2020-048117(JP,A)
【文献】特開2022-042980(JP,A)
【文献】韓国公開特許第10-2017-0087357(KR,A)
【文献】韓国公開特許第10-2005-0009417(KR,A)
(58)【調査した分野】(Int.Cl.,DB名)
G09G 3/00 - 5/42
H04N 23/63
G06F 3/0483
G06F 3/04883
(57)【特許請求の範囲】
【請求項1】
物理的文書の第1の文書画像を取得するように構成された第1の画像取得部と、
ディスプレイと、
注釈情報を生成するように構成された入力部と、
前記第1の画像取得部、前記ディスプレイ、及び前記入力部に結合され、前記第1の文書画像を表示するように前記ディスプレイを制御するように構成されたプロセッサであって、前記プロセッサは、前記第1の画像取得部が前記第1の文書画像を取得し、前記ディスプレイが前記第1の文書画像を同時に表示している間に、前記入力部から前記注釈情報を受信した場合、前記第1の文書画像及び前記注釈情報を同時に表示するように前記ディスプレイを制御するように構成された、プロセッサと、を備え
前記第1の画像取得部は、さらに、前記物理的文書の第2の文書画像を取得するように構成され、前記プロセッサは、さらに、前記第1の文書画像の特徴値を取得し、前記第2の文書画像が前記特徴値と一致する場合、前記プロセッサは、前記第2の文書画像及び前記注釈情報を同時に表示するように前記ディスプレイを制御する、ビデオ会議またはビデオ授業用のための電子装置。
【請求項2】
前記プロセッサは、さらに、前記第1の文書画像と前記注釈情報との間の相対位置を取得し、前記注釈情報が前記第2の文書画像上に表示される場合、前記注釈情報は前記相対位置に基づいて前記第2の文書画像上に配置される、請求項に記載の電子装置。
【請求項3】
前記プロセッサは、さらに、前記注釈情報がデータベースに格納されているかどうかを確認し、前記データベースが前記注釈情報を有していない場合、前記プロセッサは前記注釈情報を登録し、前記注釈情報を前記データベースに格納する、請求項に記載の電子装置。
【請求項4】
前記第2の文書画像が前記特徴値と一致しない場合、前記プロセッサは、前記注釈情報を表示しないように前記ディスプレイを制御する、請求項に記載の電子装置。
【請求項5】
前記プロセッサに結合され、ユーザのユーザ画像を取得するように構成された第2の画像取得部と、
をさらに備え、
前記プロセッサは、前記ユーザ画像を表示するように前記ディスプレイを制御する、請求項1に記載の電子装置。
【請求項6】
前記プロセッサは、前記ユーザ画像の背景部分を除去する、請求項に記載の電子装置。
【請求項7】
前記プロセッサは、セマンティックセグメンテーションモデルにより前記背景部分をセグメント化する、請求項に記載の電子装置。
【請求項8】
ビデオ会議またはビデオ授業における電子装置に適した表示方法であって、
前記電子装置は、第1の画像取得部と、ディスプレイと、入力部と、を備え、
前記表示方法は、
前記第1の画像取得部で物理的文書の第1の文書画像を取得することと、
前記ディスプレイで前記第1の文書画像を表示することと、
前記入力部で注釈情報を生成することと、
前記第1の画像取得部が前記第1の文書画像を取得し、前記ディスプレイが前記第1の文書を同時に表示している間に前記入力部から前記注釈情報が受信されると、前記注釈情報及び前記第1の文書画像とを同時に表示するように前記ディスプレイを制御することと、
前記第1の文書画像の特徴値を取得することと、
前記第1の画像取得部で前記物理的文書の第2の文書画像を取得することと、
前記第2の文書画像が前記特徴値と一致する場合、前記第2の文書画像及び前記注釈情報を同時に表示するように前記ディスプレイを制御することと、を含む表示方法。
【請求項9】
前記第1の文書画像の特徴値を取得することは、
前記注釈情報がデータベースに格納されているかどうかを確認することと、
前記データベースが前記注釈情報を有していない場合、前記注釈情報を登録し、前記データベースに前記注釈情報を格納することと、を含む、請求項に記載の表示方法。
【請求項10】
前記第1の文書画像と前記注釈情報との間の相対位置を取得することと、
前記注釈情報が前記第2の文書画像上に表示される場合、前記相対位置に基づいて前記第2の文書画像上に前記注釈情報を配置することと、を更に含む、請求項に記載の表示方法。
【請求項11】
前記第2の文書画像が特徴値と一致しない場合、前記注釈情報を表示しないように前記ディスプレイを制御することを更に含む、請求項に記載の表示方法。
【請求項12】
第2の画像取得部によって、ユーザのユーザ画像を取得することを更に含む、請求項に記載の表示方法。
【請求項13】
前記ユーザ画像の背景部分を除去することを更に含む、請求項12に記載の表示方法。
【請求項14】
セマンティックセグメンテーションモデルにより前記背景部分をセグメント化することを更に含む、請求項13に記載の表示方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、電子装置及び表示方法に関し、特に、ビデオ会議またはビデオ授業用の電子装置及び表示方法に関する。
【背景技術】
【0002】
近年、ビデオ授業やビデオ会議の需要が急速に高まっている。ソフトウェアファイルは、既存のビデオソフトウェアを介して、ビデオ授業またはビデオ会議で共有することができる。ただし、物理的文書(教師の配布資料、公式文書など)をビデオで視聴者と共有する必要がある場合、話者は物理的文書をカメラの前で見せる必要がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
操作上、話者が物理的文書を共有したり、読み物をガイドしたりする必要がある場合、話者は物理的文書をカメラの前で保持する必要がある。上記の方法は揺れやすく、物理的文書の画像比率が小さすぎるため、ビデオ授業やビデオ会議の聴衆がコンテンツをはっきりと見ることができないという問題が発生する。さらに、話者が補助的な説明のために、物理的文書の要点または注釈を直接マークする必要がある場合、その物理的文書は必ず覆われることになる。上記に照らして、ビデオ会議またはビデオ授業の過程で、物理的文書をビデオで聴衆と共有する必要がある場合、従来の操作方法は、話者と聴衆のユーザ体験を大きく不快にさせる。
【課題を解決するための手段】
【0004】
本発明は、物理的文書をビデオで聴衆と共有する必要がある場合に、話者及び聴衆のユーザ体験及び利便性を向上させることができる、ビデオ会議またはビデオ授業のための電子装置及び表示方法を提供する。
【0005】
本発明の電子装置は、ビデオ会議またはビデオ授業に適用される。電子装置は、第1の画像取得部と、ディスプレイと、入力部と、プロセッサとを備える。第1の画像取得部は、物理的文書の第1の文書画像を取り込む。入力部は注釈情報を生成する。プロセッサは、第1の画像取得部、ディスプレイ、及び入力部に結合される。プロセッサは、ディスプレイを制御して、第1の文書画像を表示する。プロセッサが、第1の画像取得部が第1の文書画像を取得し、ディスプレイが第1の文書画像を同時に表示している間に注釈情報を受信すると、プロセッサは、ディスプレイを制御して、注釈情報及び第1の文書画像を同時に表示する。
【0006】
本発明の表示方法は、ビデオ会議またはビデオ授業における電子装置に適用される。電子装置は、第1の画像取得部と、ディスプレイと、入力部とを含む。表示方法は、以下を含む。物理的文書の第1の文書画像を第1の画像取得部によって取得することと、第1の文書画像をディスプレイによって表示することと、第1の画像取得部が第1の文書画像を取得し、ディスプレイが第1の文書画像を同時に表示している間に、入力部が注釈情報を受信した場合、ディスプレイは注釈情報及び第1の文書画像を同時に表示するように制御されることと、を含む。
【発明の効果】
【0007】
第1の画像取得部が第1の文書画像を取得し、ディスプレイが第1の文書画像を同時に表示している間に注釈情報を受信すると、本発明は、注釈情報及び第1の文書画像を同時に表示する。したがって、物理的文書の読み取りを共有またはガイドする場合、本発明は、第1の文書画像に注釈情報を追加して、第1の文書画像をマークすることができる。このようにすることで、第1の文書画像が揺れないので、画像比率が小さいために、ビデオ授業やビデオ会議の聴衆が内容を明瞭に見ることができないという問題が発生しない。話者が物理的文書を共有したり、読み方をガイドしたりしている場合も、第1の文書画像は覆われない。上記に照らして、本発明は、ユーザ体験及び利便性を効果的に改善することができる。
【図面の簡単な説明】
【0008】
図1】本発明の一実施形態による電子装置の動作シナリオの概略図である。
図2】本発明の第1の実施形態による電子装置の概略図である。
図3図2に示す表示方法による第1の方法のフローチャートである。
図4図2に示す表示方法による第2の方法のフローチャートである。
図5A図5に示す操作インターフェースの概略図である。
図5B図5に示す操作インターフェースの概略図である。
図6図2による動作フローチャートである。
図7】本発明の第2の実施形態による電子装置の概略図である。
図8図7に示す表示方法のフローチャートである。
図9図7に示す操作インターフェースの概略図である。
図10図7による操作のフローチャートである。
【発明を実施するための形態】
【0009】
以下、添付された図面とともに、本発明のいくつかの実施形態を詳細に説明する。以下の説明で使用する符号は、異なる図面間で同一の符号を付した場合、同一または類似の要素とみなす。これらの実施形態は、本発明の一部にすぎず、本発明のすべての可能な実施を開示していない。より正確には、実施形態は、本発明の特許請求の範囲の例示に過ぎない。
【0010】
図1図2を併せて参照されたい。図1は、本発明の一実施形態による電子装置の動作シナリオの概略図である。図2は、本発明の第1の実施形態による電子装置の概略図である。本実施形態において、電子装置100は、ビデオ会議またはビデオ授業に適用されうる。電子装置100は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、スマートフォンなどであってもよい。本実施形態において、電子装置100はラップトップコンピュータである。本実施形態において、電子装置100は、画像取得部110と、ディスプレイ120と、入力部130と、プロセッサ140と、を含む。画像取得部110は、物理的文書FLの文書画像FIMG1~FIMGnのうちの少なくとも1つを取得する。物理的文書FLは、例えば、書籍、印刷物、公文書などである。文書画像FIMG1~FIMGnは、例えば、物理的文書FLの異なるページの画像である(本発明はこれに限定されない)。本実施形態において、画像取得部110は、カメラであり得る。本実施形態において、画像取得部110は、ラップトップコンピュータの背面カバーに配置される。したがって、画像取得部110は、後方向きカメラ(または世界向きカメラ(world facing camera)と呼ばれる)である。いくつかの実施形態において、画像取得部110は、電子装置100に外部的に接続されてもよい。物理的文書FLが固定部材(例えば、本棚)によって固定される場合、画像取得部110は、物理的文書FLの画像文書画像FIMG1~FIMGnのうちの少なくとも1つをリアルタイムで取得することができる。本実施形態において、入力部130は、注釈情報MKを生成するように適合されている。ユーザは、例えば、入力部130を介して注釈情報MKを提供する。入力部130は、スタイラス、マウス、トレースボールなどの要素であってよい。別の例として、入力部130は、ディスプレイ120のタッチパネルであってもよい。ユーザは、指を使用してディスプレイ120のタッチパネル上でタッチ操作を行い、マーキングトレースパターンを生成して注釈情報MKを提供してもよい。
【0011】
本実施形態において、プロセッサ140は、画像取得部110、ディスプレイ120、及び入力部130に結合される。プロセッサ140は、ディスプレイ120を制御して、文書画像FIMG1~FIMGnのうちの1つを表示する。本実施形態では、ビデオ要件に基づいて、画像取得部110が文書画像FIMG1を取得しているときに、ディスプレイ120は文書画像FIMG1をリアルタイムで同時に表示する。いくつかの実施形態では、画像取得部110が文書画像FIMG1~FIMGnのうちの1つを取り込むとき、ディスプレイ120は、文書画像FIMG1~FIMGnのうちの1つを表示するように制御される。本発明は、文書画像FIMG1~FIMGnが表示されているタイミングに限定されない。
【0012】
本実施形態において、ディスプレイ120は、液晶ディスプレイ(LCD)、発光ダイオード(LED)、有機発光ダイオード(OLED)など、または表示機能を提供するための任意のディスプレイ装置、またはバックライトモジュールとして冷陰極蛍光ランプ(CCFL)または発光ダイオード(LED)を使用するスクリーンであってよい。プロセッサ140は、例えば、中央処理装置(CPU)、または他のプログラマブル汎用または専用マイクロプロセッサ、デジタル信号プロセッサ(DSP)、プログラマブルコントローラ、特定用途向け集積回路(ASIC)、プログラマブルロジックデバイス(PLD)、または他の同様の装置、または前述の装置の組み合わせであり、コンピュータプログラムをロードして実行することができる。
【0013】
画像取得部110が文書画像FIMG1を取得し、ディスプレイ120が文書画像FIMG1(例えば、第1の文書画像)を同時に表示している間に、プロセッサ140が注釈情報MKを受信すると、プロセッサ140は、ディスプレイ120を制御して、注釈情報MK及び文書画像FIMG1とを同時に表示する。本実施形態において、注釈情報MKは、ユーザが電子装置100の入力部130を介して生成した少なくとも1つのマーキングトレースパターンである。例えば、電子装置100のユーザは、スタイラス、マウス、トレースボール、または指を使用して、ディスプレイ120のタッチスクリーン上でタッチ操作を行い、マーキングトレースパターンを生成することができる。
【0014】
ユーザは、例えば話者である。ユーザは、物理的文書FLの文書画像FIMG1に対してマーキング操作を行って注釈情報MKを生成することができる。プロセッサ140は、ディスプレイ120を制御して、文書画像FIMG1上に注釈情報MKを表示する。したがって、参加者は、ディスプレイ120上で物理的文書FLの文書画像FIMG1及び注釈情報MKを見ることができる。
【0015】
ここで、画像取得部110が文書画像FIMG1を取得し、ディスプレイ120が文書画像FIMG1を同時に表示している間に、プロセッサ140が注釈情報MKを受信すると、プロセッサ140は、ディスプレイ120を制御して、注釈情報MK及び文書画像FIMG1を同時に表示することに留意されたい。したがって、ユーザが物理的文書の読み取りを共有またはガイドする場合、プロセッサ140は注釈情報MKを使用して文書画像FIMG1をマークすることができる。ユーザは、物理的文書FLを保持する必要がない。したがって、物理的文書FLの文書画像FIMG1が揺れないので、ビデオ授業やテレビ会議の参加者が、画像比率が小さいために内容を明瞭にみることができないという問題が生じない。さらに、ユーザが物理的文書を共有している場合や、または読み方をガイドしている場合も、文書画像FIMG1は不明瞭にならない。上記に照らして、電子装置100は、ユーザ体験及び利便性を効果的に改善することができる。
【0016】
本実施形態において、プロセッサ140は、文書画像FIMG1の特徴値F1を取得する。プロセッサ140は、特徴値F1を使用して、ディスプレイ120に表示された現在の文書画像(例えば、第2の文書画像)を識別する。現在の文書画像の特徴値が文書画像FIMG1の特徴値F1と一致する場合、プロセッサ140は、現在の文書画像が文書画像FIMG1と一致すると判断する。すなわち、現在の文書画像と文書画像FIMG1は物理的文書FLの同一ページの画像であると判断する。したがって、プロセッサ140は、ディスプレイ120を制御して、注釈情報MK及び現在の文書画像を同時に表示する。これに対して、現在の文書画像の特徴値が文書画像FIMG1の特徴値F1と一致しない場合、プロセッサ140は、現在の文書画像が文書画像FIMG1以外の文書画像であると判断する。したがって、プロセッサ140は、現在の文書画像上に注釈情報MKを表示しないようにディスプレイ120を制御する。
【0017】
プロセッサ140は、特徴値F1を使用して現在の文書画像を識別し、ディスプレイ120が注釈情報MK及び現在の文書画像を同時に表示できるようにするかどうかを判断できることに留意されたい。このようにして、物理的文書FLの同一ページが再度表示されると、注釈情報MKもすぐに表示される。
【0018】
本実施形態において、プロセッサ140は、深層学習モデルを通じて文書画像FIMG1の特徴値F1を獲得することができる。
【0019】
本実施形態において、プロセッサ140は、文書画像FIMG1と注釈情報MK(または注釈情報MKのマーキング特徴値)との相対位置を取得する。したがって、文書画像FIMG1と一致する現在の文書画像が表示される場合、注釈情報MKは、文書画像FIMG1と注釈情報MKとの間の相対位置に基づいて、現在の文書画像上に配置される。したがって、注釈情報MKは、現在の文書画像上の正確な位置に表示される。さらに、注釈の特徴値は、文書画像FIMG1の特徴値の位置に関連付けられる。したがって、文書画像FIMG1がシフトまたはズームされても、注釈情報MKはそれに応じて変更される。
【0020】
図2及び図3を併せて参照されたい。図3は、図2に示す表示方法のフローチャートである。本実施形態の表示方法は、電子装置100に適用される。ステップS110では、物理的文書FLの第1の文書画像(例えば、文書画像FIMG1)が取得される。本実施形態では、第1の文書画像は画像取得部110により取得される。ステップS120において、プロセッサ140は、第1の文書画像を表示するようにディスプレイ120を制御する。ステップS130において、入力部130は、注釈情報MKを生成する。ステップS140において、画像取得部110が第1の文書画像を取得し、第1の文書画像を同時に表示している間に注釈情報MKを受信すると、注釈情報MKが第1の文書画像上に表示される。本実施形態において、ステップS140は、プロセッサ140によって実行されてもよい。ステップS110からS140までの実施の詳細は、図1及び2の実施形態から十分に教示され得るため、ここでは説明を繰り返さない。
【0021】
図4を参照すると、図2に示す表示方法の第2のフローチャートである。本実施形態の表示方法は、電子装置100のプロセッサ140に適合する。ステップS201において、プロセッサ140は、画像取得部110を起動して、現在の文書画像を取得する。ステップS202において、プロセッサ140は、電子装置100のデータベース(図示せず)に注釈情報が格納されているかどうかを判断する。注釈情報がデータベースに格納されていると判断した場合、プロセッサ140は、現在の文書画像が文書画像FIMG1と一致するかどうかを判断する。文書画像FIMG1の特徴値F1を例にとると、プロセッサ140は、特徴値F1を使用して現在の文書画像を識別する。現在の文書画像の特徴値が特徴値F1と一致する場合、プロセッサ140は、現在の文書画像が文書画像FIMG1と一致すると判断し、現在の文書画像を識別する。したがって、ステップS203において、プロセッサ140は、文書画像FIMG1に対応する注釈情報をさらに検索する。さらに、注釈情報を受信すると、プロセッサ140は、注釈情報を登録し、データベースに注釈情報を格納する。ディスプレイ120が現在の文書画像を表示する場合、プロセッサ140はまず、ステップS202で、データベースが何らかの注釈情報を記憶しているかどうかを確認する。データベースに格納された注釈情報がある場合、プロセッサ140は、ステップS203で、現在の文書画像の特徴値に基づいて、対応する注釈情報を検索する。次に、プロセッサ140は、文書画像と対応する注釈情報との間の相対位置を取得する。したがって、プロセッサ140は、ステップS204において、注釈情報を現在の文書画像に重畳する。
【0022】
これに対して、ステップS203でプロセッサ140が対応する注釈情報が発見されない場合、それは、現在の文書画像に対応する注釈情報が除去されてもよいことを意味する。したがって、プロセッサ140は、ステップS205で、新しい注釈情報を追加するかどうかを判断する。
【0023】
ステップS202に戻る。現在の文書画像が対応する注釈情報を有していないと判断された場合、それは、現在の文書画像に対応する注釈情報がデータベースに格納されていないことを意味する。したがって、プロセッサ140は、ステップS205で、新しい注釈情報を追加するかどうかを判断する。
【0024】
ステップS205において、新しい注釈情報を受信しない場合、プロセッサ140は、ステップS206において、現在の文書画像のみを表示するようにディスプレイ120を制御する。これに対して、画像取得部110が起動され、現在の文書画像の表示中に新しい注釈情報を受信すると、プロセッサ140は、ステップS207において、新しい注釈情報を受信する。プロセッサ140は、ステップS208において、現在の文書画像の特徴値を取得し、新しい注釈情報を登録し、ステップS209において、現在の文書画像に新しい注釈情報を重畳する。
【0025】
図2図5A図5B、及び図6を併せて参照されたい。図5A及び5Bは、図2に示す操作インターフェースの概略図である。図6は、図2による動作フローチャートである。本実施形態では、第1の文書画像(例えば、文書画像FIMG1)の操作を例に挙げる。本実施形態においては、ステップS301で動作フローがスタートする。画像取得部110は、文書画像を取得するために起動される。ステップS302では、図5Aに示すように、第1の文書画像が表示される。ステップS303では、注釈情報MKを追加するか否かを判断する。本実施形態において、ユーザは操作インターフェース上で操作を行うことができる。プロセッサ140は、操作インターフェースに対するユーザの操作に基づいて、注釈情報MKを付加する意思があるか否かを判断する。ステップS303において、ユーザが注釈情報MKを追加しようとしていると判断した場合、ステップS304において、プロセッサ140はフォーマットメニューを表示するようにディスプレイ120を制御し、注釈情報MKのフォーマットを提供する。本実施形態において、プロセッサ140は、ステップS304で操作ウィンドウOWを提供する。操作ウィンドウOWは、例えば、色選択アイコンC1~C5及び保存アイコンB1を含む(本発明はこれに限定されない)。ユーザは、色選択アイコンC1~C5から少なくとも注釈情報MKの色を選択することができる。
【0026】
ステップS305において、注釈情報MKを受信する。ステップS305において、プロセッサ140は、注釈情報MKを受信する。したがって、ステップS306において、プロセッサ140は、ディスプレイ120を制御して、注釈情報MK及び文書画像FIMG1を表示する。例えば、注釈情報MKは、図5Bに示すように、マーキングトレースMK1~MK4を含む。注釈情報MK及び文書画像FIMG1は、操作インターフェースを介して同時に他の参加者(例えば聴衆)に提示される。
【0027】
以上の操作に基づいて、参加者は、操作インターフェースを介して受け取った文書画像FIMG1にマークを付けて注釈情報を生成することもできることを理解されたい。
【0028】
さらに、ステップS306において、ユーザは、保存アイコンB1をクリックして、注釈情報MK及び第1の文書画像との合成画像ファイルを保存することができる。
【0029】
ステップS307において、ユーザは、物理的文書FLのページを変更し、第1の文書画像を第1の文書画像以外の別の文書画像(例えば、特徴値F1と一致しない文書画像)に切り替える。したがって、第1の文書画像に対応する注釈情報MKの表示が停止される。文書画像FIMG1を例にとると、プロセッサ140は、特徴値F1を使用して現在の文書画像を識別する。現在の文書画像が文書画像FIMG1の特徴値F1と一致しない場合、プロセッサ140は、現在の文書画像と文書画像FIMG1が物理的文書FLの同一ページに属していないと判断する。したがって、プロセッサ140は、注釈情報MKを表示しないようにディスプレイ120を制御する。すなわち、ディスプレイ120に表示されている現在の文書画像が文書画像FIMG1と一致しない場合、プロセッサ140は、注釈情報MKの表示を停止するようにディスプレイ120を制御する。したがって、ステップS308において、ディスプレイ120は現在の文書画像のみを表示する。現在の文書画像は、他の参加者の操作インターフェースに表示される。
【0030】
さらに、ステップS308において、ユーザは、保存アイコンB1をクリックして、現在の文書画像の写真ファイルを保存することができる。
【0031】
ステップS309において、ユーザは物理的文書FLのページを第1の文書画像のページに戻す。例えば、プロセッサ140は、現在の文書画像が文書画像FIMG1と一致すると判断する。したがって、プロセッサ140は、ステップS306の動作に戻る。
【0032】
ステップS303に戻る。ユーザが注釈情報MKを追加するか否かを判断できない場合、プロセッサ140は、ステップS310の動作に入り、フォーマットメニューの表示を停止するようにディスプレイ120を制御する。したがって、注釈情報MKの生成は停止される。
【0033】
図7を参照すると、本発明の第2の実施形態による電子装置の概略図である。本実施形態において、電子装置200は、画像取得部210_1、210_2、ディスプレイ220、及びプロセッサ240を備える。画像取得部210_1の動作詳細は、図1及び図2の画像取得部110の動作詳細を参照することができるため、ここでは説明を繰り返さない。本実施形態において、文書画像FIMG1上に注釈情報MKを表示するように制御されるディスプレイ220の実施は、図1から図6の様々な実施形態で十分に教示されているため、ここでは説明を繰り返さない。
【0034】
本実施形態において、画像取得部210_2は、電子装置200のユーザのユーザ画像UIMGを取得する。ユーザ画像UIMGは、例えば、リアルタイム動画像である。本実施形態において、画像取得部210_2は、プロセッサ240に結合される。プロセッサ240は、ユーザ画像UIMGを受信し、ディスプレイ220を制御して、ユーザ画像UIMGを表示する。このようにして、他の参加者は、電子装置200のユーザを見ることができる。本実施形態において、画像取得部210_2は、例えばディスプレイ220の表示面上に配置され、画像取得部210_2のレンズは、ディスプレイ220の表示方向に向いている。したがって、画像取得部210_2のレンズは、例えば、前面カメラ(またはユーザ向きカメラ(user facing camera)という)である。
【0035】
図7及び図8を併せて参照されたい。図8は、図7の表示方法のフローチャートである。本実施形態では、ステップS401において、ユーザ画像UIMGが取得される。ステップS402では、ユーザ画像UIMGの背景が除去される。ステップS402において、プロセッサ240は、背景を識別し、ユーザ画像UIMG内の背景を除去する。例えば、ステップS402において、プロセッサ240は、セマンティックセグメンテーションモデル(semantic segmentation model)などによって背景部分をセグメント化し、背景部分が除去されたユーザ画像UIMGのみを保持する。いくつかの実施形態では、プロセッサ240は、例えば、他の画像分類モデルを通じて背景部分をセグメント化する。
【0036】
ステップS403では、画像取得部を起動して、現在の文書画像を取得する。ステップS404において、プロセッサ240は、何らかの注釈情報がデータベース(図示せず)に格納されているかどうかを判断する。データベースに注釈情報が格納されていると判断した場合、プロセッサ240は、ステップS405において、対応する注釈情報をさらに検索する。ステップS403~S405の動作は、図4のステップS201~S203の動作と同様である。ステップS403~S405の動作の詳細は、図4のステップS201~S203で明確に説明されているので、ここでは説明を繰り返さない。
【0037】
本実施形態では、ステップS405において、プロセッサ240が現在の文書画像に対応する注釈情報を発見した場合、それは、現在の文書画像に対応する注釈情報が保持されていることを意味する。したがって、プロセッサ240は、ステップS406で、背景部分が除去されたユーザ画像UIMG及び注釈情報を現在の文書画像に重畳する。
【0038】
これに対して、ステップS405において、プロセッサ240が現在の文書画像に対応する注釈情報を発見しない場合、それは、現在の文書画像に対応する注釈情報が除去されてもよいことを意味する。したがって、プロセッサ240は、ステップS407で、新しい注釈情報を追加するかどうかを判断する。
【0039】
ステップS404に戻る。データベースに格納された注釈情報がない場合、プロセッサ240は、ステップS407において、新しい注釈情報を追加するかどうかを判断する。
【0040】
ステップS407において、注釈情報を受信しない場合、プロセッサ240は、ステップS408において、背景部分が除去されたユーザ画像UIMGを現在の文書画像に重畳するようにディスプレイ220を制御する。これに対して、ステップS409でプロセッサ240が新しい注釈情報を受信すると、プロセッサ240は、ステップS410で、現在の文書画像の特徴値を取得し、新しい注釈情報を登録する。そして、ステップS411で、背景部分が除去されたユーザ画像UIMG及び新しい注釈情報を現在の文書画像に重畳する。
【0041】
図7図9、及び図10をまとめて参照されたい。図9は、図7に示す操作インターフェースの概略図である。図10は、図7による操作のフローチャートである。本実施形態において、ステップS501で動作が開始される。画像取得部210_1を起動して、第1の文書画像(例えば、文書画像FIMG1)を取得する。画像取得部210_2を起動して、ユーザ画像UIMGを取得する。
【0042】
ステップS502では、ユーザ画像UIMGが表示される。ユーザ画像UIMGの表示位置とサイズが調整される。ステップS503では、第1の文書画像が表示される。例えば、プロセッサ240は、ディスプレイ220を制御して、ユーザ画像UIMGを表示する。ユーザは、図9に示すように、操作インターフェースを介して、ユーザ画像UIMGをドラッグしてユーザ画像UIMGの表示位置を調整し、ユーザ画像UIMGの縁をドラッグしてユーザ画像UIMGのサイズを調整することができる。
【0043】
ステップS504では、注釈情報MKを追加するか否かを判断する。ステップS504において、ユーザが注釈情報MKを追加すると、ステップS505において、プロセッサ240はフォーマットメニューを表示する。したがって、ユーザは、フォーマットメニューから注釈情報MKのフォーマットを選択することができる。ステップS506では、注釈情報MKを受信する。したがって、ステップS507において、プロセッサ240は、ディスプレイ220を制御して、注釈情報MK、第1の文書画像、及びユーザ画像UIMGを表示する。例えば、注釈情報MKは、図9に示すように、マーキングトレースMK1~MK4を含む。注釈情報MK、文書画像FIMG1、ユーザ画像UIMGは、操作インターフェースを介して他の参加者に提示される。したがって、他の参加者は、ユーザ画像UIMGを見ることができる。また、ステップS507において、ユーザは、保存アイコンB1をクリックして、注釈情報MKと第1文書画像との合成画像ファイルを保存することができる。
【0044】
ステップS508において、ユーザは物理的文書FLを変更し、第1の文書画像を第1の文書画像以外の別の文書画像(例えば、特徴値F1と一致しない文書画像)に切り替える。したがって、第1の文書画像に対応する注釈情報MKの表示が停止される。したがって、ステップS509において、ディスプレイ220は、現在の文書画像及びユーザ画像UIMGを表示する。現在の文書画像及びユーザ画像UIMGが、操作インターフェースを介して他の参加者に提示される。さらに、ステップS509において、ユーザは、保存アイコンB1をクリックして、現在の文書画像の写真ファイルを保存することができる。
【0045】
ステップS510において、ユーザはページを元のページに戻す。プロセッサ240は、現在の文書画像(すなわち、特徴値F1に一致する文書画像)が第1の文書画像と一致すると判断する。したがって、プロセッサ240は、ステップS507に戻り、ディスプレイ220を制御して、注釈情報MK、第1の文書画像、及びユーザ画像UIMGを表示する。
【0046】
ステップS504において、ユーザが注釈情報MKを追加するか否かを判断できない場合、プロセッサ240は、ステップS511の動作に入り、フォーマットメニューの表示を停止するようにディスプレイ220を制御する。したがって、注釈情報MKの生成は停止される。
【産業上の利用可能性】
【0047】
文書画像が取得され、文書画像が同時に表示されている間に注釈情報を受信した場合、本発明は、注釈情報及び文書画像を同時に表示する。したがって、物理的文書の読み取りが共有またはガイドされるとき、本発明は、ユーザが物理的文書を保持することなく、現在表示されている文書画像に注釈を追加することができる。これにより、手ぶれによる文書画像の揺れがなくなり、画像比率が小さすぎてビデオ授業やビデオ会議の他の参加者が内容を明瞭に見ることができないという問題が発生しない。話者が物理的文書を共有したり、読み物をガイドしたりしている場合、聴衆が見る文書の画像は話者によって覆われない。上記に照らして、本発明は、ユーザ体験及び利便性を効果的に改善することができる。さらに、本発明は、特徴値を利用して現在の文書画像を識別し、注釈情報が表示されるかどうかを判断する。このようにして、一致した文書画像が再度表示されると、注釈情報もすぐに表示される。
【符号の説明】
【0048】
100, 200: 電子装置
110: 画像取得部
120, 220: ディスプレイ
130, 230: 入力部
140, 240: プロセッサ
210_1: 画像取得部/第1の画像取得部
210_2: 画像取得部/第2の画像取得部
B1: 保存アイコン
C1-C5: 色選択アイコン
F1: 特徴値
FIMG1-FIMGn: 文書画像
FL: 物理的文書
MK: 注釈情報
MK1-MK4: マーキングトレース
OW: 操作ウィンドウ
S110-S140: ステップ
S201-S209: ステップ
S301-S310: ステップ
S401-S411: ステップ
S501-S511: ステップ
UIMG: ユーザ画像
図1
図2
図3
図4
図5A
図5B
図6
図7
図8
図9
図10