(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023041614
(43)【公開日】2023-03-24
(54)【発明の名称】表示装置、表示方法、表示システム
(51)【国際特許分類】
G06F 16/583 20190101AFI20230316BHJP
G09G 5/00 20060101ALI20230316BHJP
G06V 30/19 20220101ALI20230316BHJP
G06F 3/04883 20220101ALI20230316BHJP
G06F 3/0484 20220101ALI20230316BHJP
H04L 67/53 20220101ALI20230316BHJP
【FI】
G06F16/583
G09G5/00 550C
G09G5/00 510A
G06V30/19 G
G06F3/04883
G06F3/0484
H04L67/53
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022092374
(22)【出願日】2022-06-07
(31)【優先権主張番号】P 2021148719
(32)【優先日】2021-09-13
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000006747
【氏名又は名称】株式会社リコー
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100107515
【弁理士】
【氏名又は名称】廣田 浩一
(72)【発明者】
【氏名】高橋 仁人
【テーマコード(参考)】
5B064
5B175
5C182
5E555
【Fターム(参考)】
5B064AB04
5B064DD08
5B175DA02
5B175FB03
5B175HB03
5C182AA04
5C182AB02
5C182AB04
5C182AB06
5C182AB08
5C182AB11
5C182AB12
5C182AB14
5C182AB21
5C182AB37
5C182AC03
5C182AC33
5C182AC43
5C182BA03
5C182BA06
5C182BA14
5C182BA35
5C182BA65
5C182BA66
5C182BA75
5C182BB03
5C182BB11
5C182BC01
5C182BC22
5C182BC25
5C182BC26
5C182CA01
5C182CA21
5C182CB13
5C182CB14
5C182CB54
5C182DA44
5E555AA04
5E555AA76
5E555BA13
5E555BA28
5E555BB13
5E555BB28
5E555BC17
5E555CA13
5E555CA14
5E555CB11
5E555CB12
5E555CB46
5E555CC01
5E555CC05
5E555DA03
5E555DB41
5E555DB49
5E555DB53
5E555DB56
5E555DC13
5E555DC14
5E555DD06
5E555DD07
5E555EA07
5E555EA08
5E555EA24
5E555FA00
(57)【要約】
【課題】手書きデータを用いて情報を検索する表示装置を提供すること。
【解決手段】本発明は、外部から入力される画像を表示できる表示装置であって、手書きデータの入力を受け付ける手書きデータ入力部と、前記画像と前記手書きデータを表示する表示制御部と、手書きデータを文字認識してテキストデータに変換する文字認識部と、を有し、前記表示制御部は、前記画像の少なくとも一部と前記テキストデータの少なくとも一部を用いた検索結果を表示することを特徴とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
外部から入力される画像を表示できる表示装置であって、
手書きデータの入力を受け付ける手書きデータ入力部と、
前記画像と前記手書きデータを表示する表示制御部と、
手書きデータを文字認識してテキストデータに変換する文字認識部と、を有し、
前記表示制御部は、前記画像の少なくとも一部と前記テキストデータの少なくとも一部を用いた検索結果を表示する、
ことを特徴とする表示装置。
【請求項2】
手書き入力により前記画像の領域が指定され、前記領域と関連付けられた前記手書きデータが手書きされた場合、前記領域内の画像と前記テキストデータの少なくとも一部を用いた検索を行う検索部を有することを特徴とする請求項1に記載の表示装置。
【請求項3】
手書きされた枠により前記画像の領域が指定され、前記枠内の領域に前記手書きデータが手書きされた場合、前記検索部は、前記枠内の画像と前記テキストデータの少なくとも一部を用いた検索を行うことを特徴とする請求項2に記載の表示装置。
【請求項4】
前記検索部は、前記テキストデータを検索意図に変換し、
前記検索部は、前記検索意図に基づいて、前記枠内の画像によりWebサイトを検索することを特徴とする請求項3に記載の表示装置。
【請求項5】
前記検索部は、前記テキストデータに、前記検索意図と、前記枠内の画像又は前記枠内の画像の特徴の少なくともいずれかが検索に使用する情報として対応付けられた意図変換情報を参照し、
前記テキストデータに対応付けられた前記検索に使用する情報によりWebサイトを検索することを特徴とする請求項4に記載の表示装置。
【請求項6】
前記テキストデータに対応付けられた前記検索に使用する情報が前記枠内の画像である場合、前記検索部は、前記枠内の画像と類似する画像を有するWebサイトを検索することを特徴とする請求項5に記載の表示装置。
【請求項7】
前記テキストデータに対応付けられた前記検索に使用する情報が前記枠内の画像と前記枠内の画像の特徴である場合、前記検索部は、前記枠内の画像と前記枠内の画像の特徴に類似する画像を有するWebサイトを検索することを特徴とする請求項5に記載の表示装置。
【請求項8】
前記テキストデータに対応付けられた前記検索意図が前記枠内の画像があるWebサイトのコピーライトである場合、
前記検索部は、前記枠内の画像と類似する画像を有するWebサイトを検索し、前記Webサイトのコピーライトを取得することを特徴とする請求項6に記載の表示装置。
【請求項9】
前記テキストデータに対応付けられた前記検索意図が前記枠内の画像があるWebサイト内の類似する画像の検索である場合、
前記検索部は、前記枠内の画像と類似する画像を有するWebサイトを検索し、前記Webサイトから前記枠内の画像と類似する画像を取得することを特徴とする請求項6に記載の表示装置。
【請求項10】
表示装置が外部から入力される画像を表示する表示方法であって、
手書きデータの入力を受け付けるステップと、
前記画像と前記手書きデータを表示するステップと、
手書きデータを文字認識してテキストデータに変換するステップと、
前記画像の少なくとも一部と前記テキストデータの少なくとも一部を用いた検索結果を表示するステップと、
を有することを特徴とする表示方法。
【請求項11】
外部から入力される画像を表示できる表示システムであって、
手書きデータの入力を受け付ける手書きデータ入力部と、
前記画像と前記手書きデータを表示する表示制御部と、
手書きデータを文字認識してテキストデータに変換する文字認識部と、を有し、
前記表示制御部は、前記画像の少なくとも一部と前記テキストデータの少なくとも一部を用いた検索結果を表示する、
ことを特徴とする表示システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、表示装置、表示方法、及び、表示システムに関する。
【背景技術】
【0002】
タッチパネル式のディスプレイにユーザーが専用の電子ペンや指などで描画した手書きデータを表示する電子黒板などの表示装置が知られている。従来のホワイトボードと異なり手書きデータを電子データで保存したり、PC(Personal Computer)等の外部装置と接続して外部装置が表示する資料の画像を表示装置が表示したりすることができる。
【0003】
例えば、表示装置を使った会議中などにあらたな資料が必要になる場合があるが、画像に基づいてコンテンツなどを取得する技術が考案されている(例えば、特許文献1参照。)。特許文献1には、検索要求に含まれる撮像画像内のオブジェクトに類似するオブジェクトを検索し、検索されたオブジェクトに関連付けられた連携情報(例えば、撮像画像がURLを含む場合、URLに示されるWebサイトの情報)を取得するシステムが開示されている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、情報の検索に手書きデータが用いられていないという問題がある。表示装置では、電子ペンや指などで文字等を手書きでき、手書きデータを用いて検索すれば、より詳細な検索が可能になることが期待される。
【0005】
本発明は、上記課題に鑑み、手書きデータを用いて情報を検索する表示装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題に鑑み、本発明は、外部から入力される画像を表示できる表示装置であって、手書きデータの入力を受け付ける手書きデータ入力部と、前記画像と前記手書きデータを表示する表示制御部と、手書きデータを文字認識してテキストデータに変換する文字認識部と、を有し、前記表示制御部は、前記画像の少なくとも一部と前記テキストデータの少なくとも一部を用いた検索結果を表示することを特徴とする。
【発明の効果】
【0007】
手書きデータを用いて情報を検索する表示装置を提供できる。
【図面の簡単な説明】
【0008】
【
図1】表示装置が情報を検索する場合の操作方法を説明する図である。
【
図3】表示装置のハードウェア構成図の一例である。
【
図4】表示装置が表示する各画像レイヤの構成図の一例である。
【
図6】表示装置が有する機能をブロックに分けて説明する機能ブロック図の一例である。
【
図7】入力層から出力層までL層が全結合されたニューラルネットワークの一例を示す図である。
【
図8】意図変換情報記憶部に記憶されている意図変換情報を模式的に示す図である。
【
図9】通信システムの全体的な動作を示すシーケンス図の一例である。
【
図10】検索部による検索手順を説明するフローチャート図の一例である。
【
図11】表示装置が表示する検索結果の一例を示す図である。
【
図12】表示装置が表示する検索結果の一例を示す図である。
【
図14】
図11の表示システムにおける、表示装置と情報処理装置の機能ブロック図の一例を示す図である。
【
図15】情報処理装置を有する通信システムの全体的な動作を示すフローチャート図の一例である。
【
図16】通信システムが情報処理装置を有する場合に、検索部による検索手順を説明するフローチャート図の一例である。
【発明を実施するための形態】
【0009】
以下、本発明を実施するための形態の一例として、表示装置と表示装置が行う表示方法について実施例を挙げながら説明する。
【0010】
<本実施形態の動画の保存方法を概略>
図1を参照して、表示装置2が情報を検索する処理の概略を説明する。
図1は、本実施形態の表示装置2が情報を検索する場合の操作方法を説明する図である。
【0011】
(1) 発表者がノートPC6と表示装置2を接続して、「企画提案書」というファイルを表示装置2で表示している。
【0012】
(2)
図1では、ファイル内の市場予測の統計グラフ101が表示されている。
【0013】
(3) 例えば、発表者が統計グラフ101を枠102等で選択し、その近辺に「データの出所は?」という手書きデータ103を手書きすると、手書きデータ103を文字認識することでデジタル信号化する。
【0014】
(4) 表示装置2は、文字認識の結果に基づいて検索の意図が、統計グラフ101の出所であると判断する。表示装置2は囲まれた統計グラフ101の特徴に基づいて、統計グラフ101と同じ又は類似する情報があるWebサイト上のコピーライト情報を取得する。
【0015】
(5) 同様に、発表者が、「予測精度は?」という手書きデータ104を手書きすると、表示装置2は、手書きデータ104を文字認識することでデジタル信号化する。表示装置2は、文字認識の結果に基づいて検索の意図が、統計グラフ101と類似する統計グラフの検索であると判断し、統計グラフ101と同じ又は類似する情報があるWebサイトの他の情報を解析し、類似する統計グラフを提示することができる。類似する統計グラフにより、ユーザーが例えば統計グラフ101の予測がどの程度当たっているか推測できる。
【0016】
このように、本実施形態では、外部から入力された画像や画像の特徴に基づいて類似する画像を検索するだけでなく、手書きデータを文字認識してテキストデータに変換することで、外部から入力された画像に対し、テキストデータに応じた情報を提供することができる。
【0017】
<用語について>
入力手段とはタッチパネルに座標を指定して手書きが可能な手段であればよい。例えば、ペン、人の指や手、棒状部材などがある。
【0018】
ユーザーがディスプレイに入力手段を押しつけてから連続的に移動させた後、ディスプレイから離すという一連の操作をストロークという。ストロークデータとは、入力手段により入力される座標の軌跡に基づいてディスプレイに表示される情報である。ストロークデータは適宜、補間されてよい。手書きデータとは、1つ以上のストロークデータを有するデータである。手書き入力とは、ユーザーによって、手書きデータが入力されることを示している。
【0019】
手書きデータが文字認識して変換されたテキストデータとは、コンピュータで扱われる1つ以上の文字である。テキストデータの実態は文字コードである。文字には、数字、アルファベット、及び、記号等が含まれる。
【0020】
テキストデータには、「済」などの決まった文字やマークとして表示されるスタンプ、円や星などの図形、直線等も含まれてよい。
【0021】
Webサイトとは、一般に特定のドメイン名の下にある複数のWebページの集まりをいう。ホームページと呼ばれることもある。
【0022】
検索意図とは、どのような検索を行うか、換言すると検索条件を決定する方針である。検索意図は、例えば検索の対象と検索に使用する情報(検索キー)である。
【0023】
<システム構成例>
図2は、本実施形態の通信システムの全体構成図である。なお、
図2では、説明を簡略化するために、2台の表示装置2a,2b及びこれに付随する電子ペン4a,4b等を示しているだけであって、3台以上の表示装置2や電子ペン等が利用されてもよい。
【0024】
図2に示されているように、通信システム1は、複数の表示装置2a,2b、複数の電子ペン4a,4b、USBメモリ5a,5b、ノートPC(Personal Computer)6a,6b、テレビ(ビデオ)会議端末7a,7b、及びPC8を有する。また、表示装置2a,2b、及びPC8は、通信ネットワーク9を介して通信可能に接続されている。更に、複数の表示装置2a,2bには、それぞれディスプレイ3a,3bが設けられている。
【0025】
また、表示装置2aには、電子ペン4aによって生じたイベント(ディスプレイ3aに電子ペン4aのペン先、又は、電子ペン4aのペン尻のタッチ)による描画された画像を、ディスプレイ3aに表示させることができる。なお、電子ペン4aだけでなく、ユーザーの手Ha等によって生じたイベント(拡大、縮小、ページめくり等のジェスチャ)に基づいて、ディスプレイ3a上に表示されている画像を変更させることもできる。
【0026】
また、表示装置2aには、USBメモリ5aが接続可能であり、表示装置2aはUSBメモリ5aからPDF等の電子ファイルを読み出したり、表示装置2aはUSBメモリ5aに電子ファイルを記録したりすることができる。また、表示装置2aには、DisplayPort(登録商標)、DVI(Digital Visual Interface)、HDMI(High-Definition Multimedia Interface。登録商標)及びVGA(Video Graphics Array)等の規格による通信が可能なケーブル10a1を介して、ノートPC6aが接続されている。そして、表示装置2aは、ディスプレイ3aに対する接触によってイベントを発生させ、このイベントを示すイベント情報を、マウスやキーボード等の入力装置からのイベントと同様に、ノートPC6aに送信する。同じく、表示装置2aには、上記規格による通信が可能なケーブル10a2を介して、テレビ(ビデオ)会議端末7aが接続されている。なお、ノートPC6a、及びテレビ会議端末7aは、Bluetooth(登録商標)等の各種無線通信プロトコルに準拠した無線通信により、表示装置2aと通信してもよい。
【0027】
一方、表示装置2bが設置されている他の拠点では、上記と同様に、ディスプレイ3bを備えた表示装置2b、電子ペン4b、USBメモリ5b、ノートPC6b、テレビ会議端末7b、ケーブル10b1、ケーブル10b2が利用される。更に、ユーザーの手Hb等によって生じたイベントに基づいて、ディスプレイ3b上に表示されている画像を変更させることもできる。
【0028】
これにより、一の拠点で表示装置2aのディスプレイ3a上に描画された画像は、他の拠点で表示装置2bのディスプレイ3b上にも表示され、逆に他の拠点で表示装置2bのディスプレイ3b上に描画された画像は、一の拠点で表示装置2aのディスプレイ3a上に表示される。このように、通信システム1では、遠隔地において同じ画像を共有する遠隔共有処理を行うことができるため、遠隔地での会議等に用いると、非常に便利である。
【0029】
なお、以下では、複数の表示装置2のうち任意の表示装置2を示す場合には「表示装置2」と示す。複数のディスプレイのうち任意のディスプレイを示す場合には「ディスプレイ3」と示す。複数の電子ペンのうち任意の電子ペンを示す場合には「電子ペン4」と示す。複数のUSBメモリのうち任意のUSBメモリを示す場合には「USBメモリ5」と示す。複数のノートPCのうち任意のノートPCを示す場合には「ノートPC6」と示す。複数のテレビ会議端末のうち任意のテレビ会議端末を示す場合には「テレビ会議端末7」と示す。また、複数のユーザーの手のうち任意の手を示す場合には「手H」と示す。複数のケーブルのうち任意のケーブルを示す場合には「ケーブル10」と示す。
【0030】
また、本実施形態では、表示装置2の一例として、電子黒板を説明するが、これに限るものではなく、表示装置2の他の例として、表示装置2は、電子看板(デジタルサイネージ)、スポーツや天気予報等で利用されるテレストレータ、又は、遠隔画像(映像)診断装置等であってもよい。また、外部装置の一例として、ノートPC6を説明するが、これに限るものではなく、外部装置の他の例として、外部装置は、デスクトップ型PCやタブレット型PC、PDA、デジタルビデオカメラ、デジタルカメラ、ゲーム機等の画像フレームを供給可能な端末であってもよい。更に、通信ネットワークには、インターネット、LAN(Local Area Network)、携帯電話通信網等が含まれる。また、本実施形態では、記録媒体の一例として、USBメモリを説明するが、これに限るものではなく、記録媒体の他の例として、記録媒体は、SDカード等の各種記録メディアであってもよい。
【0031】
<表示装置のハードウェア構成>
続いて、
図3を用いて、本実施形態の表示装置2のハードウェア構成を説明する。なお、
図3は、表示装置2のハードウェア構成図である。
図3に示されているように、表示装置2は、CPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、SSD(Solid State Drive)204、ネットワークI/F205、及び、外部機器接続I/F(Interface)206を備えている。
【0032】
これらのうち、CPU201は、表示装置2全体の動作を制御する。ROM202は、CPU201やIPL(Initial Program Loader)等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。
【0033】
SSD204は、OSや表示装置2用のプログラム等の各種データを記憶する。このプログラムは汎用的なOS(Windows(登録商標)、Mac OS(登録商標)、Android(登録商標)、iOS(登録商標)等)を搭載した情報処理装置で動作するアプリケーションプログラムでもよい。したがって、表示装置2は、普段は汎用的な情報処理装置として利用されるが、ユーザーがアプリケーションプログラムを実行すると、表示装置2の専用機と同様、ユーザーが手書きすることができる。
【0034】
ネットワークI/F205は、通信ネットワーク9との通信を制御する。外部機器接続I/F206は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリ5、外付け機器(マイク240、スピーカ250、カメラ260)である。
【0035】
また、表示装置2は、キャプチャデバイス211、GPU212、ディスプレイコントローラ213、接触センサ214、センサコントローラ215、電子ペンコントローラ216、近距離通信回路219、及び近距離通信回路219のアンテナ219a、電源スイッチ222及び選択スイッチ類223を備えている。
【0036】
これらのうち、キャプチャデバイス211は、外付けのノートPC6のディスプレイに対して映像情報を静止画又は動画として表示させる。GPU(Graphics Processing Unit)212は、グラフィクスを専門に扱う半導体チップである。ディスプレイコントローラ213は、GPU212からの出力画像をディスプレイ3等へ出力するために画面表示の制御及び管理を行う。接触センサ214は、ディスプレイ3上に電子ペン4やユーザーの手H等が接触したことを検知する。センサコントローラ215は、接触センサ214の処理を制御する。接触センサ214は、赤外線遮断方式による座標の入力及び座標の検出を行う。この座標の入力及び座標の検出する方法は、ディスプレイ3の上側両端部に設置された2つ受発光装置が、ディスプレイ3に平行して複数の赤外線を放射し、ディスプレイ3の周囲に設けられた反射部材によって反射されて、受光素子が放射した光の光路と同一の光路上を戻って来る光を受光する方法である。接触センサ214は、物体によって遮断された2つの受発光装置が放射した赤外線のIDをセンサコントローラ215に出力し、センサコントローラ215が、物体の接触位置である座標位置を特定する。電子ペンコントローラ216は、電子ペン4と通信することで、ディスプレイ3へのペン先のタッチやペン尻のタッチの有無を判断する。近距離通信回路219は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。電源スイッチ222は、表示装置2の電源のON/OFFを切り換えるためのスイッチである。選択スイッチ類223は、例えば、ディスプレイ3の表示の明暗や色合い等を調整するためのスイッチ群である。
【0037】
更に、表示装置2は、バスライン210を備えている。バスライン210は、
図3に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
【0038】
なお、接触センサ214は、赤外線遮断方式に限らず、静電容量の変化を検知することにより接触位置を特定する静電容量方式のタッチパネル、対向する2つの抵抗膜の電圧変化によって接触位置を特定する抵抗膜方式のタッチパネル、接触物体が表示部に接触することによって生じる電磁誘導を検知して接触位置を特定する電磁誘導方式のタッチパネルなどの種々の検出手段を用いてもよい。また、電子ペンコントローラ216が、電子ペン4のペン先及びペン尻だけでなく、電子ペン4のユーザーが握る部分や、その他の電子ペンの部分のタッチの有無を判断するようにしてもよい。
【0039】
<レイヤの構成>
図4は、表示装置2が表示する各画像レイヤの構成図である。
図4に示すように、表示装置2は、UI画像(A)、ストローク画像(B)、出力画像(C)、及び、背景画像(D)を重畳して1つの画像を表示する。
【0040】
UI画像(A)は、UI(ユーザインターフェース)画像であり、ユーザーが操作するメニューボタン等を表示する。
【0041】
ストローク画像(B)は、ユーザーが手書きした1つ以上のストロークデータ(手書きデータ)が表示される画像である。
【0042】
出力画像(C)は、外部装置(ノートPC6等)が入力した画像(静止画、動画)である。外部装置にはサーバーやUSBメモリ5等が含まれ、Webページや記憶媒体の動画も出力画像(C)に含まれる。
【0043】
背景画像(D)は、予め保持されている無地、グリッド表示等、手書きの際に背景となる画像である。なお、保存された静止画など、予め保持されている画像は背景画像となりうる。
【0044】
表示装置2は、4つのレイヤを選択的に表示することもできる。例えば、UI画像(A)、ストローク画像(B)、出力画像(C)、又は背景画像(D)のうち、1つ以上の任意の画像を表示させることができる。
【0045】
<外部映像の表示例>
図5は、外部映像の表示例を説明する図である。
図5(a)に示すように、出力画像(C)に表示される外部映像110を表示装置2はディスプレイ3の全面に(又は一部に小さく表示してもよい)表示している。
【0046】
ユーザーは外部映像110を含む、ディスプレイ3上の任意の位置にストロークを手書きできる。
図5(a)では、統計グラフ101が枠102で囲まれていると共に、枠で形成される領域内(以下、枠内という)に「データの出所は?」という手書きデータ103と「予測精度は?」という手書きデータ104が手書きされている。このように、枠内の手書きデータ103,104は、枠内の画像に関するどのような情報を検索するかという、検索意図の検出に使用される。なお、枠102の形状は、四角に限らず、三角形以上の多角形でもよいし、円形でもよい。枠102は始点と終点がほぼ同じ位置のストロークであればよい。また、枠102は、領域を特定できる手書きデータであればよい。枠102は、ほぼ閉じた領域を形成していればよく、完全に閉じている必要はない。枠102は、点線で形成されてもよい。枠102は、複数のストロークで形成されてもよく、「」、()等で領域が特定されてもよい。
【0047】
また、
図5(b)に示すように、検索意図の検出に使用される手書きデータは枠内でなくてもよい。
図5(b)では、枠102の外部に同様の手書きデータ105,106があり、矢印107で枠102と関連付けられている(接続されている)。表示装置2は、枠102と関連付けられている手書きデータ105,106を検索意図の検出に使用する。
【0048】
また、
図5(b)の手書きデータでは、枠102がなくてもよい。この場合、表示装置2は、手書きデータの接続先のオブジェクト(統計グラフ101)を画像処理で検出し、特徴検出の対象とする。この場合の画像処理としては、画面内で独立しているオブジェクトを分割するセグメンテーションが知られている。
【0049】
<機能について>
図6は、表示装置2が有する機能をブロックに分けて説明する機能ブロック図の一例である。
図6に示すように、表示装置2は、外部映像入力部81、通信映像入力部82、外部映像受信部83、重畳画像生成部84、手書きデータ入力部85、筆記データ受信部86、録画データ生成部87、表示制御部88、記憶部89、文字認識部90、画像特徴検出部91、及び、検索部92を有している。表示装置2が有するこれらの機能は、例えば、
図3に示したCPU201がSSD204からRAM203に展開されたプログラムを実行することで実現される機能又は手段である。
【0050】
外部映像入力部81は、CPU201によるプログラムの実行とキャプチャデバイス211等により実現され、ノートPC6が継続的に送信する外部映像の入力を受け付ける。入力される外部映像は、主にノートPC6が自機のディスプレイに表示している画面の映像であるが、保存しているコンテンツを表示装置2に送信してもよい。
【0051】
通信映像入力部82は、CPU201によるプログラムの実行とネットワークI/F205等により実現され、無線LAN、有線LAN又はMiracast(登録商標)等の通信経由で送信された外部映像の入力を受け付ける。
【0052】
外部映像入力部81と通信映像入力部82は外部映像を外部映像受信部83に入力する。外部映像受信部83は、外部映像入力部81が入力する外部映像、及び、通信映像入力部82が入力する外部映像の少なくとも一方を重畳画像生成部84に入力する。
【0053】
手書きデータ入力部85は、CPU201によるプログラムの実行と接触センサ214等により実現され、入力手段が入力した座標点列の入力を受け付ける。手書きデータ入力部85は座標点列を筆記データ受信部86に入力する。
【0054】
筆記データ受信部86は、手書きデータ入力部85から入力された座標点列を基にストロークデータを作成する。筆記データ受信部86は、座標点列を補間し、設定された太さや色のストロークデータを作成する。筆記データ受信部86はストロークデータを重畳画像生成部84及び文字認識部90に入力する。
【0055】
重畳画像生成部84は、外部映像受信部83から入力された外部映像に、筆記データ受信部86から入力された手書きデータを重畳して(合成して)、ディスプレイ3への出力データを作成し、録画データ生成部87と表示制御部88に入力する。また、重畳画像生成部84は、外部映像に手書きデータが重畳された画像と音声データを同期させる。これにより、録画データ生成部87は、手書きデータを音声と共に保存できる。
【0056】
録画データ生成部87は、外部映像を取り込む操作をユーザーが行うと、静止画又は動画を記憶部89に保存する。表示制御部88は、出力データをディスプレイ3に表示する。
【0057】
文字認識部90は、筆記データ受信部86から入力された手書きデータを文字認識することでテキストデータに変換する。文字認識部90は、テキストデータを形態素解析することで品詞付きの単語に分解できる。なお、文字認識のアルゴリズムは各種開発されており、本実施形態ではどのアルゴリズムで文字認識してもよい。一例としてディープラーニングを用いた手法を後述する。文字認識部90は、テキストデータを検索部92に入力する。
【0058】
画像特徴検出部91は、筆記データ受信部86から入力された手書きデータに基づいて枠102を検出する。枠102の検出は必須でないが、説明の便宜上、枠102が手書きされるものとする。また、画像特徴検出部91は外部映像受信部83から入力された外部映像のうち枠内の画像を取り出す。画像特徴検出部91は、枠内の画像をそのまま検索部92に入力してもよいし、枠内の画像から特徴を検出してから画像と共に又は特徴のみを検索部92に入力してもよい。
【0059】
したがって、検索部92には以下の情報が入力される。
1.テキストデータと枠内の画像
2.テキストデータと枠内の画像の特徴
3.テキストデータと枠内の画像と枠内の画像の特徴
画像特徴検出部91は、画像の特徴として色のヒストグラムを生成できる。また、画像特徴検出部91は、枠内の画像にOCR処理を行い、得られた文字データ(手書きデータから変換されたテキストデータと区別して、「文字データ」と記載する)を画像の特徴とすることもできる。
【0060】
なお、枠102の検出及び特徴の検出には、パターンマッチングや後述する機械学習により生成された分類器が使用されてよい。
【0061】
検索部92は、
図8にて後述する意図変換情報を参照し、テキストデータに対応付けられた検索意図を判断する。また、検索部92は、テキストデータに対応付けられた検索に使用する情報を検索エンジンに入力しインターネットの情報を検索する。検索エンジンのWebサイト(例えば、google.com(登録商標)等)は既知であるとする。
【0062】
<手書きデータに対する文字認識、枠内の画像の特徴検出>
手書きデータに対する文字認識及び枠内の画像の特徴検出の方法として、機械学習を利用したり、パターンマッチングを利用したりする方法がある。機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し、新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、更に、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。パターンマッチングとは、予め特定したいパターンを用意しておき、データを検索する場合に、特定のパターンが出現するかどうか、またどこに出現するかを特定する手法のことである。
【0063】
図7は、入力層31から出力層33までL層が全結合されたニューラルネットワーク11である。階層が深いニューラルネットワークをDNN(Deep Neural Network)という。入力層31と出力層33の間の層を中間層32という。階層数やノード35の数等はあくまで一例である。
【0064】
手書きデータに対する文字認識の場合、入力層31には、ストロークデータ(座標点列)が入力される。ストロークデータは連続的に入力されるので、一定数の座標点列が入力される。一方、出力層33のノード数は、分類したいカテゴリの数である。例えば文字への分類であれば、英語ではアルファベットの26がノード数となる。文字単位でなく、単語単位の認識も可能であり、この場合は単語の数となる。日本語の場合は、ひらがな、カタカナ、及び漢字の数が出力層33のノードの数となる。
【0065】
枠内の画像の特徴検出の場合、入力層31には、枠内の画像(各画素の画素値)が入力される。前処理部が枠内の画像をマスに区切ってもよい。一方、出力層33のノード数は、分類したいカテゴリの数である。例えば、枠内の画像に何が写ってるか(被写体)を分類するのであれば、分類したい被写体の種類の数である。例えば、人物、車、電車、動物、棒グラフ、円グラフ、折れ線グラフ、図形、など多種多様な分類が可能である。
【0066】
また、ニューラルネットワークによって、画像特徴検出部91が枠内の画像のテクスチャ(網目、斜線、木、鉄、ガラスなどの質感)を検出することもできる。
【0067】
したがって、枠内の画像の特徴としては、例えば以下が得られる。
・色ヒストグラム
・文字データ(OCR処理で得られる)
・被写体
・テクスチャ
ニューラルネットワーク11では、第l層(l(エル):2~L)の1つのノード35に第l-1層の全てのノード35が接続され、第l-1層のノード35の出力zと結合の重みwの積が第l層のノードに入力される。
【0068】
第l層の各ノードには活性化関数が配置されており、第l層のノード35では活性化関数で入力を0~1の間の値に変換して第l+1層のノード35に出力する。この処理が入力層31から出力層33まで繰り返えされる。活性化関数としては、ReLU、tanh、シグモイドなどが知られている。なお、入力層31のノードは特徴ベクトルを第2層に伝えるだけでよく活性化されない。
【0069】
本実施例では、出力層33のノードの出力をテキストデータ(文字や単語)、又は、画像の特徴に分類するので、機械学習では分類問題を扱う。したがって、出力層33のノードの活性化関数はソフトマックス関数でよい。出力層の各ノードの出力と教師信号(正しい分類のノードが1で残りはゼロのワンホットベクトル)との誤差は、クロスエントロピーにより求められ、結合の重みwとバイアスbは、出力層33の出力が教師信号に近づくように更新(学習)される。
【0070】
なお、ストロークデータや音声データのような連続データの分類には、再帰型ニューラルネットワーク(Recurrent Neural Network:以下、RNN)を適用するとよい。RNNは、ニューラルネットワークを拡張して時系列データを扱えるようにしたものである。また、画像の分類には畳み込みニューラルネットワーク(Convolutional Neural Network: CNN又はConvNet)が有効であることが知られている。
【0071】
また、機械学習の手法には、パーセプトロン、サポートベクターマシン、ロジスティック回帰、ナイーブベイズ、決定木、ランダムフォレストなどがあり、本実施形態で説明する手法には限られない。
【0072】
<検索意図の検出>
検索部92は、テキストデータの主に名詞を検索意図として採用することもできるし、テキストデータを検索意図に変換してもよい。
図8は、意図変換情報記憶部79に記憶されている、テキストデータを検索意図に変換する意図変換情報を示す。検索意図により検索条件が定まる。意図変換情報のテキストデータは、ユーザーが発話したテキストデータの少なくとも一部でよい。また、意図変換情報のテキストデータは、例えば形態素解析で得られた名詞でもよい。
【0073】
意図変換情報によれば、例えば「データの出所」というテキストデータが、「枠内の画像があるWebサイトのコピーライト」という検索意図に変換される。この場合、検索に使用される情報は枠内の画像である。また、検索の対象はこのWebサイトのコピーライトである。コピーライトは著作者を意味するので、だれが枠内の画像を作成したかを検索部92が検索できる。
【0074】
また、「予測精度」というテキストデータが、「枠内の画像があるWebサイト内の類似する画像の検索」という検索意図に変換される。この場合、検索に使用される情報は枠内の画像である。また、検索の対象はこのWebサイト内の画像である。枠内の画像があるWebサイト内の類似する統計グラフ等があれば、ユーザーが保持する知見などから枠内の画像の精度を推測できる。
【0075】
また、「確認」というテキストデータが、「枠内の画像の文字データの信頼性」という検索意図に変換される。この場合、検索に使用される情報は画像の特徴(文字データ)である。また、検索の対象はインターネット上の情報であるが、枠内の画像や文字で検索の対象を絞ることもできる。検索部92が枠内に記載された文字でWebサイトを検索すると、適合率が高いWebサイトがヒットする。ユーザーは保持する知見などから枠内の画像に記載された情報の精度を推測できる。
【0076】
また、「オリジナルの入手」というテキストデータが、「枠内の画像の高品質な画像の取得」という検索意図に変換される。この場合、検索に使用される情報は枠内の画像と画像の特徴(色のヒストグラム、テクスチャ)である。また、検索の対象はインターネット上の情報であるが、枠内の画像や文字で検索の対象を絞ることもできる。ユーザーが枠内の画像の解像度が低いなどの理由でオリジナルの画像データが欲しい場合がある。検索部92は枠内の画像でWebサイトを検索し、更に、画像の特徴(色のヒストグラム、テクスチャ)で絞り込む。ユーザーは枠内の画像と比較することで枠内の画像の元となるオリジナルの画像を判断できる。
【0077】
また、「詳細」というテキストデータが、「枠内の画像があるWebサイトの詳細情報の取得」という検索意図に変換される。この場合、検索に使用される情報は枠内の画像とテキストデータである。また、検索の対象はこのWebサイトの内容である。ユーザーが枠内の画像の詳細な情報が欲しい場合がある。検索部92は枠内の画像でWebサイトを検索し、更に、テキストデータ(詳細に続けて手書きされた任意のテキストデータ)で、このWebサイトの情報を取得する。
このように本実施形態の検索意図は、ユーザーによって特定された画像を用いてどのような検索を行うか、すなわち、ユーザーによって特定された画像を用いて検索条件を決定可能な情報である。また、本実施形態の検索に使用する情報は、ユーザーによって特定された画像から得られる情報である。
【0078】
<動作手順>
図9は、通信システム1の全体的な動作を示すシーケンス図の一例である。
【0079】
S1:表示装置2に接続されたノートPC6は外部映像を表示装置2に送信する。
【0080】
S2:表示装置2の外部映像入力部81は外部映像の入力を受け付け、外部映像受信部83に入力する。外部映像受信部83は重畳画像生成部84に外部映像を入力する。外部映像は、表示制御部88によりディスプレイ3に表示される。
【0081】
S3:ユーザーが手書きした場合、手書きデータ入力部85が手書きデータの入力を受け付ける。手書きデータ入力部85は筆記データ受信部86に手書きデータを入力する。筆記データ受信部86は重畳画像生成部84と文字認識部90に手書きデータを入力する。
【0082】
S4:重畳画像生成部84は、外部映像に手書きデータを重ねて表示制御部88に入力する。表示制御部88は外部映像に手書きデータが重畳された画像をディスプレイ3に表示する。なお、外部映像が動画の場合、フレームは次々に更新されるが、重畳画像生成部84は新しい外部映像のフレームにそれまでの全ての手書きデータを重畳する処理を繰り返す。
【0083】
図10は、検索部92による検索手順を説明するフローチャート図の一例である。手書きデータが入力されると、画像特徴検出部91は領域が指定されたか否かを判断する(S11)。この領域は、枠102で囲まれた領域である。すなわち、画像特徴検出部91は枠102を検出する。例えば、画像特徴検出部91は、ストロークの始点と終点が一定距離内で、面積(ストロークの外接矩形の面積)が一定以上の場合、枠102が手書きされたと判断する。あるいは、画像特徴検出部91は、パターン認識や機械学習の結果を使用してもよい。なお、枠102の検出に先立って、ユーザーはUI画像(A)のメニューからエリア選択を押下する。
【0084】
画像特徴検出部91は枠内の画像を取得する(S12)。枠内の画像は、簡単には枠の内接矩形又は枠の外接矩形の内部の画像である。
【0085】
次に、画像特徴検出部91は、枠内の画像の特徴を検出する(S13)。ここで検出される枠内の画像の特徴は、色のヒストグラム、文字データ(OCR処理で得られる)、被写体、及び、テクスチャ等である。画像特徴検出部91は、画像から検出可能な特徴であれば検出可能である。
【0086】
次に、文字認識部90は、枠102に関連付けて(例えば枠内に)手書きデータが入力されたか否かを判断する(S14)。「枠102に関連付けて」とは、枠内の他、手書きデータが枠102の外側の近辺に手書きされた場合も含む。なお、オブジェクト(例えば統計グラフ)が1つしかない場合は、ユーザーがオブジェクトを特定しなくてもよい。
【0087】
ステップS14の判断がYesの場合、文字認識部90は、枠102に関連付けて入力された手書きデータを文字認識する(S15)。
【0088】
次に、検索部92は、テキストデータと意図変換情報に基づいて検索意図を判断する(S16)。この結果、検索部92は、検索先のWebサイトや検索に使用する情報を決定できる。
【0089】
検索部92は、検索に使用する情報で検索先のWebサイトを検索する(S17)。枠内の画像の検索について説明する。検索部92は、枠内の画像そのものをWeb上で公開されている検索エンジンに送信する。検索エンジンは枠内の画像の色、点、線、テクスチャ等を解析し、検索クエリ(1つ以上の単語を含む検索文)を生成する。検索エンジンは、検索クエリに基づいてキャッシュしている画像と一定以上類似する画像を特定する。検索エンジンは検索結果を返す。検索エンジンが行う枠内の画像の色、点、線、テクスチャ等の解析を検索部92が行い、この解析結果を検索エンジンに渡してもよい。
【0090】
文字データの検索については、検索部92が1つ以上の文字データを含む検索クエリを検索エンジンに送信する。検索エンジンはキャッシュしているWebサイトから文字データを含むWebサイトを特定する。検索エンジンは検索結果を返す。
【0091】
Webサイト内の検索については、検索範囲が当該Webサイトに制限される他は、同じ検索方法でよい。
【0092】
検索部92は検索結果を表示制御部88に入力するので、表示制御部88は検索に使用される情報に適合した(ヒットした)情報をディスプレイ3に表示する(S18)。
【0093】
<検索結果の表示例>
図11は、表示装置2が表示する検索結果の一例を示す。
図11では、枠内の統計グラフ101に「データの出所は?」という手書きデータ103が手書きされたものとする。検索部92は手書きデータ103を検索意図に変換する。この場合、検索部92は、枠内の統計グラフ101でWebサイトを検索し、統計グラフ101が掲載されているWebサイトを特定する。そして、検索部92はWebサイトのコピーライトを検索する。コピーライトは、一般に「Cを丸で囲んだ記号」「copyright」などの文字に続いて記載されるので、検索部92はWebサイトからこれらの文字を検索すればよい。これにより、
図11では「2020 Sample Inc.」というコピーライト130が表示されている。
【0094】
なお、表示制御部88は、検索した情報をポップアップ表示してもよいし、余白に表示してもよい。あるいは、表示制御部88は、ディスプレイ3の右下などにバルーン(アイコン)で「検索しました」のように表示し、ユーザーの操作に応じて検索した情報をポップアップ表示してもよい。
【0095】
なお、表示装置2は、意図変換情報を使用せず、手書きデータから変換されたテキストデータでWebサイトを検索することもできる。例えば、ユーザーが「コピーライト」と手書きすれば、検索部92は、統計グラフ101が掲載されているWebサイトからコピーライトを検索できる。このように、表示装置2は、枠内の画像でWebサイトを特定し、このWebサイト内で検索意図に応じた情報を取得できる。
【0096】
図12は、表示装置2が表示する検索結果の一例を示す。
図12では、枠内の統計グラフ101に「予測精度は?」という手書きデータ104が手書きされたものとする。検索部92は手書きデータ104を検索意図に変換する。この場合、検索部92は枠内の統計グラフ101でWebサイトを検索し、統計グラフ101が掲載されているWebサイトを特定する。そして、検索部92はWebサイト内の類似する統計グラフを検索する。これにより、
図12では別の棒グラフ140が表示されている。
【0097】
<変形例>
以上の本実施形態では、表示装置2単体で検索を行っているが、検索に関する処理をネットワーク上の情報処理装置が行ってもよい。このような情報処理装置をサーバー装置という。
【0098】
図13は、表示システム100の構成例を示す。
図13の表示システム100では、表示装置2と情報処理装置300とが通信ネットワーク9を介して通信可能に接続されている。情報処理装置300は一台以上のコンピュータであり、クラウドコンピューティングに対応していてもよい。また、情報処理装置300はオンプレミスに存在しても、インターネット上に存在してもよい。
図13のような構成によれば、表示装置2は手書きデータと枠内の画像を情報処理装置300に送信し、情報処理装置300から検索結果を受信できる。
【0099】
図14は、
図13の表示システム100における、表示装置2と情報処理装置300の機能ブロック図を示す。なお、
図14の説明では主に
図6との相違を説明する。
図14の表示装置2は、通信部74を有している。通信部74は、手書きデータと枠内の画像をリアルタイムに情報処理装置300に送信し、情報処理装置300から検索結果を受信する。
【0100】
情報処理装置300は通信部75、文字認識部90、画像特徴検出部91、及び検索部92を有している。この通信部75は、手書きデータと枠内の画像を表示装置2から受信し、表示装置2に検索結果を送信する。文字認識部90、画像特徴検出部91、及び検索部92の機能は、
図6と同様でよい。
【0101】
このような構成によれば、検索に関する処理をネットワーク上の情報処理装置300が行うことができる。文字認識や画像の特徴検出、検索を情報処理装置300に集約できるので、保守が容易になる。
【0102】
<主な効果>
以上説明したように、本実施形態の表示装置2は、外部から入力された画像に類似する画像を検索するだけでなく、手書きデータを文字認識してテキストデータに変換することで、外部から入力された画像に対し、テキストデータに応じた情報を提供することができる。
【0103】
<その他の適用例>
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【0104】
例えば、表示装置2は、手書きデータをテキストデータに変換しているが、手書きデータのまま検索してもよい。この場合、検索エンジンは手書きデータを画像として検索する。
【0105】
また、表示装置2は、手書きデータをテキストデータに変換すると共に、音声データを認識し、テキストデータと音声データを検索に使用してもよい。
【0106】
また、本実施形態では、詳細を省略したが、テキストデータは文字コードとして、手書きデータは座標点データとして表示装置2に保存される。また、各種の記憶媒体に保存したり、ネットワーク上の記憶装置に保存したりしておいて、後で、表示装置2からダウンロードして再使用することができる。再使用する表示装置2はどの表示装置2でもよく、一般的な情報処理装置でもよい。したがって、ユーザーは手書きした内容を異なる表示装置2で再現して会議などを継続することができる。
【0107】
また、本実施形態では表示装置2の一例として電子黒板を説明したが、電子黒板は、電子ホワイトボード、電子情報ボード、などと呼ばれてよい。また、本実施形態は、タッチパネルを有する情報処理装置であれば好適に適用できる。タッチパネルを搭載した情報処理装置としては、例えば、PJ(Projector:プロジェクター)、デジタルサイネージ等の出力装置、HUD(Head Up Display)装置、産業機械、撮像装置、集音装置、医療機器、ネットワーク家電、ノートPC(Personal Computer)、携帯電話、スマートフォン、タブレット端末、ゲーム機、PDA(Personal Digital Assistant)、デジタルカメラ、ウェアラブルPC又はデスクトップPC等であってもよい。
【0108】
また、表示装置2がプロジェクターの場合、表示装置2はペン先の座標を超音波により検出してもよい。この場合、ペンは発光と共に超音波を発信しており、表示装置2は超音波の到達時間により距離を算出する。表示装置2は発光をカメラで撮像して方向を特定する。表示装置2は方向と距離によりペンの位置を特定できる。ペンの軌跡をストロークデータとしてプロジェクターが描画(投影)する。この場合、プロジェクターには外部映像が入力されており、外部映像にストロークデータが重畳されている。
【0109】
また、
図6などの構成例は、表示装置2による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。表示装置2の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、1つの処理単位が更に多くの処理を含むように分割することもできる。
【0110】
また、表示装置2が行う処理の一部を、表示装置2とネットワークを介して接続されたサーバーが行ってもよい。
【0111】
また、上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
【符号の説明】
【0112】
1 通信システム
2 表示装置
3 ディスプレイ
6 ノートPC
【先行技術文献】
【特許文献】
【0113】