(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024087938
(43)【公開日】2024-07-02
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G06F 3/01 20060101AFI20240625BHJP
【FI】
G06F3/01 510
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022202853
(22)【出願日】2022-12-20
(71)【出願人】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】池松 香
(72)【発明者】
【氏名】山中 祥太
【テーマコード(参考)】
5E555
【Fターム(参考)】
5E555AA08
5E555AA48
5E555BA02
5E555BA05
5E555BA06
5E555BB02
5E555BB05
5E555BB06
5E555BC17
5E555CA12
5E555CA42
5E555CB12
5E555CB65
5E555CB67
5E555CC03
5E555DB05
5E555DB11
5E555DB20
5E555DB50
5E555DC13
5E555DD01
5E555EA03
5E555EA19
5E555EA22
5E555FA00
(57)【要約】
【課題】利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【解決手段】本開示に係る情報処理装置は、利用者端末に操作処理の対象となる複数の対象コンテンツを表示させる表示制御部と、利用者の対象コンテンツに対する操作を示す操作情報を取得する取得部と、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する推定部と、推定部が利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成する生成部と、を備える。
【選択図】
図3
【特許請求の範囲】
【請求項1】
利用者端末に操作処理の対象となる複数の対象コンテンツを表示させる表示制御部と、
利用者の対象コンテンツに対する操作を示す操作情報を取得する取得部と、
対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する推定部と、
前記推定部が利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成する生成部と、
を備える情報処理装置。
【請求項2】
前記推定部は、利用者の視線情報と表情情報に対する操作の正誤との関係を学習した学習済みモデルを用いて利用者の操作の正誤を推定する、
請求項1に記載の情報処理装置。
【請求項3】
前記推定部が利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定する判定部と、をさらに備える、
請求項1又は請求項2に記載の情報処理装置。
【請求項4】
前記生成部は、前記判定部が利用者の誤操作態様について、利用者は誤ったページに遷移したと判定した場合に、元のページに戻るためのブラウザのバックボタンを含む提案情報を生成する、
請求項3に記載の情報処理装置。
【請求項5】
前記生成部は、前記判定部が利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定した場合に、利用者が選択したリンクの隣に表示されたリンクを含む提案情報を生成する、
請求項3に記載の情報処理装置。
【請求項6】
前記生成部は、前記判定部が利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと推定された場合に、直近の入力キーを考慮しない推測変換候補を含む提案情報を生成する、
請求項3に記載の情報処理装置。
【請求項7】
利用者端末に操作処理の対象となる複数の対象コンテンツを表示させるステップと、
利用者の対象コンテンツに対する操作を示す操作情報を取得するステップと、
対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定するステップと、
利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成するステップと、
を含む情報処理方法。
【請求項8】
利用者端末に操作処理の対象となる複数の対象コンテンツを表示させるステップと、
利用者の対象コンテンツに対する操作を示す操作情報を取得するステップと、
対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定するステップと、
利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成するステップと、
をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
利用者の眼球運動を分析して視線方向を把握し、視線の先の注視点の位置を認識する技術が知られている。例えば、下記の特許文献1には、被験者の視機能を適切に検査する視機能検出装置であって、表示部に判断用画像を表示させて、判断用画像を表示領域内で移動させ、表示部を観察する被験者の注視点の位置を検出し、判断用画像の移動方向と注視点の移動方向との関係に基づいて被験者の視機能を検出する視機能検出装置が開示されている。
【0003】
このような視線認識技術を、HMI(Human Machine Interface)に応用し、GUI(Graphical User Interface)としてディスプレイ上に表示されたオブジェクトの指定を受け付ける技術が知られている。これにより、キーボードやマウスなどの物理的な動きの認識により利用者の操作を受け付ける手段を用いることが困難な重度の障害を抱えた方などの操作意思を把握して、パーソナルコンピュータなどの装置に対する操作を受け付けることができる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、視線認識技術を用いたUI(User Interface)においては、利用者の注視点の先のオブジェクトを選択、ないし操作する意思があったとは限らず、コンピュータが利用者の注視点の先のオブジェクトを選択、ないし操作すると利用者の意思とは異なる場合がある。また、利用者の意思とは異なるオブジェクトを選択、ないし操作した場合に、元の状態に戻すことができなかった。
【0006】
本開示は上記課題を鑑み、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本開示に係る情報処理装置は、利用者端末に操作処理の対象となる複数の対象コンテンツを表示させる表示制御部と、利用者の対象コンテンツに対する操作を示す操作情報を取得する取得部と、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する推定部と、前記推定部が利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成する生成部と、を備える。
【発明の効果】
【0008】
本開示によれば、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置、情報処理方法、及び情報処理プログラムを提供することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報処理の一例を示す図である。
【
図2】
図2は、実施形態に係る情報処理システムの構成例を示す図である。
【
図3】
図3は、実施形態に係る情報処理装置の構成例を示す図である。
【
図4】
図4は、実施形態に係る情報処理装置の操作情報記憶部に記憶される情報の一例を示す図である。
【
図5】
図5は、実施形態に係る情報処理装置のモデルデータ記憶部に記憶される情報の一例を示す図である。
【
図6】
図6は、実施形態に係る情報処理装置のコンテンツ記憶部に記憶される情報の一例を示す図である。
【
図7】
図7は、実施形態に係る利用者端末の構成例を示す図である。
【
図8】
図8は、実施形態に係る情報処理の一例を示すフローチャートである。
【
図9】
図9は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と記載する。)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。
【0011】
(実施形態)
〔1-1.実施形態に係る情報処理の一例〕
まず、
図1を用いて、実施形態に係る情報処理の一例について説明する。
図1は、実施形態に係る情報処理の一例を示す図である。
図1では、実施形態に係る情報処理が情報処理装置100、利用者端末200により実行される例を示す。以下、実施形態に係る情報処理についてステップごとに順を追って説明する。
【0012】
まず、情報処理装置100は、利用者端末200に操作対象となる複数のコンテンツを表示させる(ステップS1)。例えば、情報処理装置100は、利用者端末200に、電子ブックのページ画面や、テキストボックス、動画のスクロールバー、ブラウザのWEBページのスクロールバーやリンク、CAD(Computer‐Aided Design)のオブジェクトなどを含む操作対象となる複数のコンテンツを表示させて、利用者の操作情報を受け付ける。なお、操作対象となる複数のコンテンツが表示される状態とは、例えば、スワイプ操作を受け付けるスクロールバーが複数表示される場合や、スクロールバーとスワイプ操作を受け付けるページ画面が重ねて表示される状態、別のページへ遷移するリンクが複数並べて表示される状態、文字入力のキーボードの画面表示がされ入力キーが複数並べて表示される状態などのことを指している。
【0013】
次に、情報処理装置100は、利用者端末200から利用者の操作情報と、操作時の視線情報、表情情報を取得する(ステップS2)。ここで、操作情報とは、利用者の利用者端末200に対する操作を示す情報であって、例えば、タッチパネルに対するタッチ操作の情報や、アイトラッキング装置の注視点の情報であってよい。また、視線情報は、アイトラッキング装置による利用者の視線方向に関する情報である。また、表情情報は、利用者端末200が備える撮像部250により撮像された利用者の表情についての画像情報である。例えば、情報処理装置100は、利用者Uが利用者端末200に対して操作を行った時に、利用者Uの操作情報と、操作時の利用者Uの視線情報、及び表情情報を一括して取得する。
【0014】
次に、情報処理装置100は、利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する(ステップS3)。例えば、情報処理装置100は、利用者の操作時の視線情報と表情情報に対する利用者の操作の正誤との関係を学習した学習済みモデルを用いて、利用者の操作時の視線情報と表情情報に基づいて、利用者の操作が誤りであったか否かを推定してよい。この場合の学習済みモデルは、CNN(Convolutional Neural Network)などにより実現されてよい。例えば、視線情報としての左右の眼球ごとの視線移動速度や瞳孔径、及び表情情報としての口角、眉角度などの特徴と、利用者の操作の誤りとの関係を学習させることにより実現されてよい。
【0015】
次に、情報処理装置100は、利用者の操作が誤りと推定された場合に、元の状態に戻すための利用者への提案を示す提案情報を生成する(ステップS4)。例えば、情報処理装置100は、利用者の操作の誤りの態様を示す誤操作態様を判定して、判定された誤操作態様に応じて、元の状態に戻すための利用者への提案を示す提案情報を生成する。
【0016】
次に、情報処理装置100は、生成した提案情報を利用者端末200に表示させる(ステップS5)。例えば、情報処理装置100は、元の状態に戻すための利用者への提案を示す提案情報を利用者端末200に表示させて、利用者から元の状態に戻す処理に対する意思を受け付ける。なお、この場合、情報処理装置100は、利用者端末200に元々表示されていた複数のコンテンツに重ねて提案情報を表示させてよい。
【0017】
これにより、情報処理装置100は、利用者の視線情報、及び表情情報に基づいて、利用者の操作の誤りを推定し、元の状態に戻す提案情報を利用者端末200に提供することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置100を提供することができる。
【0018】
〔1-2.実施形態に係る情報処理の他の例1〕
情報処理装置100は、利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定し、利用者の誤操作態様について、利用者は誤ったページに遷移したと判定した場合に、元のページに戻るためのブラウザのバックボタンを含む提案情報を生成する。
【0019】
この情報処理について順を追って説明する。まず、情報処理装置100は、
図1に示したステップS1からS3までと同じ処理を実行する。ステップS1からS3までの処理は、前述した処理と同じであるから説明を省略する。
【0020】
次に、情報処理装置100は、利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定し、利用者の誤操作態様について、利用者は誤ったページに遷移したと判定した場合に、元のページに戻るためのブラウザのバックボタンを含む提案情報を生成する(ステップS4-1)。例えば、利用者の操作情報の受け付け時のコンテンツの状態が、ブラウザが表示されている状態であって、利用者の操作情報がブラウザに表示されたページとは異なる別のページへのリンクの選択を示し、利用者端末200に操作情報にしたがって別のページを表示したにもかかわらず、推定部132が利用者の操作が誤りであると推定したとする。この場合、情報処理装置100は、利用者の誤操作態様について、利用者は誤ったページに遷移したと判定する。そして、情報処理装置100は、元のページに戻るためのブラウザのバックボタンを含む提案情報を生成する。
【0021】
次に、情報処理装置100は、
図1に示したステップS5と同じ処理を実行する。ステップS5の処理は、前述した処理と同じであるから説明を省略する。
【0022】
これにより、ブラウザが表示された状態において、利用者の意図とは異なる誤ったページに遷移した場合に、元のページに戻るためのバックボタンを利用者端末200に表示させることができる。
【0023】
〔1-3.実施形態に係る情報処理の他の例2〕
情報処理装置100は、利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定し、利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定した場合に、利用者が選択したリンクの隣に表示されたリンクを含む提案情報を生成する。
【0024】
この情報処理について順を追って説明する。まず、情報処理装置100は、
図1に示したステップS1からS3までと同じ処理を実行する。ステップS1からS3までの処理は、前述した処理と同じであるから説明を省略する。
【0025】
次に、情報処理装置100は、利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定し、利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定した場合に、利用者が選択したリンクの隣に表示されたリンクを含む提案情報を生成する(ステップS4-2)。例えば、利用者の操作情報の受け付け時のコンテンツの状態が、ブラウザに表示されたページとは異なる別のページへの複数のリンクが密集して表示されている状態であって、利用者の操作情報が複数のリンクのうちの一つの選択を示し、利用者端末200に操作情報にしたがって選択したリンクに対応する別のページを表示したにもかかわらず、ステップS3において情報処理装置100が利用者の操作が誤りであると推定したとする。この場合、情報処理装置100は、利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定する。そして、情報処理装置100は、利用者が選択したリンクから最も近い位置に表示されたリンクを含む提案情報を生成する。
【0026】
次に、情報処理装置100は、
図1に示したステップS5と同じ処理を実行する。ステップS5の処理は、前述した処理と同じであるから説明を省略する。
【0027】
これにより、利用者が複数のリンクのうちの誤ったリンクを選択した場合に、利用者が選択したリンクの隣に表示されたリンクを含む提案情報を利用者端末200に表示させることができる。
【0028】
〔1-4.実施形態に係る情報処理の他の例3〕
情報処理装置100は、利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定し、利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと推定された場合に、直近の入力キーを考慮しない推測変換候補を含む提案情報を生成する。
【0029】
この情報処理について順を追って説明する。まず、情報処理装置100は、
図1に示したステップS1からS3までと同じ処理を実行する。ステップS1からS3までの処理は、前述した処理と同じであるから説明を省略する。
【0030】
次に、情報処理装置100は、利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定し、利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと推定された場合に、直近の入力キーを考慮しない推測変換候補を含む提案情報を生成する(ステップS4-3)。例えば、利用者が「視線」という文字入力を行っている最中に、「視線」の文字の内の最後の「ン」の文字の選択の際に、操作を誤って「ル」を選択したとする。そして、ステップS3において情報処理装置100が利用者の操作が誤りであると推定し、情報処理装置100が利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと判定したとする。この場合、情報処理装置100は、「シセ」までの文字入力によって推測される「視線」の推測変換候補を含む提案情報を生成する。
【0031】
次に、情報処理装置100は、
図1に示したステップS5と同じ処理を実行する。ステップS5の処理は、前述した処理と同じであるから説明を省略する。
【0032】
これにより、利用者が文字入力の際に誤ったキーを入力した場合に、直近の入力キーを考慮しない推測変換候補を提案することができる。
【0033】
〔2.情報処理システムの構成〕
次に、
図2を用いて実施形態に係る情報処理システムの構成について説明する。
図2は、実施形態に係る情報処理システムの構成例を示す図である。
図2に示すように、情報処理システム1は、情報処理装置100と、利用者端末200と、ネットワークNを含む。なお、
図2に示した情報処理システム1は、複数台の利用者端末200が含まれ構成されていてもよい。
【0034】
情報処理装置100は、例えばPC(Personal Computer)、WS(Work Station)、サーバの機能を備えるコンピュータなどの情報処理装置であってよい。情報処理装置100は、利用者端末200からネットワークNを介して送信されてきた情報に基づいて処理を行う。
【0035】
利用者端末200は、利用者が利用する情報処理装置である。利用者端末200は、例えば、スマートフォン、タブレット型端末、デスクトップ型PC、ノート型PC、携帯電話機、PDA(Personal Digital Assistant)等の情報処理装置であってよい。なお、
図1に示す例においては、利用者端末200がスマートフォンである場合を示している。
【0036】
ネットワークNは、情報処理装置100と利用者端末200を有線、又は無線により相互に通信可能に接続する。ネットワークNが有線の場合は、IEEE802.3に規定されるイーサネット(登録商標)(ETHERNET(登録商標))により実現されてよい。また、ネットワークNが無線の場合は、IEEE802.11に規定される無線LAN(Local Area Network)を用いて実現されてよい。
【0037】
〔3.情報処理装置の構成〕
次に、
図3を用いて、実施形態に係る情報処理装置100の構成について説明する。
図3は、実施形態に係る情報処理装置の構成例を示す図である。
図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130と、を有する。なお、
図3に図示はしていないが、情報処理装置100は、情報処理装置100の管理者から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0038】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークNと有線または無線で接続され、利用者端末200との間で情報の送受信を行う。
【0039】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、SSD(Solid State Drive)、光ディスク等の記憶装置によって実現される。
図3に示すように、記憶部120は、操作情報記憶部121と、モデル記憶部122と、コンテンツ記憶部123と、を有する。
【0040】
(操作情報記憶部121について)
操作情報記憶部121は、利用者端末200から取得した利用者の操作情報を記憶する。ここで、
図4を用いて、操作情報記憶部121が記憶する情報の一例を説明する。
図4は、実施形態に係る情報処理装置の操作情報記憶部に記憶される情報の一例を示す図である。
【0041】
図4に示す例において、操作情報記憶部121は、「利用者ID」、「操作情報」という項目に係る情報を紐付けて記憶する。
【0042】
「利用者ID」は、利用者を識別する識別子であり文字列や番号などによって表される。「操作情報」は、「利用者ID」に紐付けられた利用者の操作情報であり、操作情報をタッチパネルにより受け付ける場合、操作情報は利用者の指ごとのタッチ所要時間、タッチ移動速度(X軸、Y軸)、タッチダウン位置(X軸、Y軸)、タッチアップ位置(X軸、Y軸)、接触面積、タッチダウン‐アップ位置の差異などを含んでよい。また、操作情報をアイトラッキング装置により受け付ける場合、操作情報は左右の眼球の視線方向、左右の眼球の注視点の位置などを含んでよい。
【0043】
すなわち、
図4においては、利用者ID「UID#1」により識別された利用者の操作情報が操作情報「操作情報#1」であることを示している。
【0044】
なお、操作情報記憶部121に記憶される情報は、「利用者ID」、「操作情報」という項目に係る情報に限定されるものではなく、その他の任意の利用者の操作に関係する情報が記憶されてよい。
【0045】
(モデル記憶部122について)
モデル記憶部122は、利用者の操作時の視線情報と表情情報に対する利用者の操作の正誤との関係を学習した学習済みモデルを記憶する。
図5は、実施形態に係る情報処理装置のモデル記憶部に記憶される情報の一例を示す図である。
【0046】
図5に示す例において、モデル記憶部122は、「モデルID」、「モデルデータ」という項目に係る情報を紐付けて記憶する。
【0047】
「モデルID」は、機械学習モデルを識別する識別子であり文字列や番号などによって表される。「モデルデータ」は、機械学習モデルのモデルデータを示す。例えば、機械学習モデルは、ニューラルネットワークなどであってよい。
【0048】
すなわち、
図5において、モデルID「M#1」で識別されるモデルは、機械学習モデルM#1を示す。また、モデルデータ「MDT#1」は、機械学習モデルM#1のモデルデータを示す。
【0049】
ここで、機械学習モデルがニューラルネットワークである場合は、モデルデータ「MDT#1」には、例えば、ニューラルネットワークを構成する複数の層のそれぞれに含まれるノードが互いにどのように結合するかという結合情報や、結合されたノード間で入出力される数値に掛け合わされる結合係数などの各種情報が含まれる。
【0050】
なお、モデル記憶部122は、「モデルID」、「モデルデータ」という項目に係る情報に限定されることなく、その他の任意の機械学習モデルに関係する情報が記憶されてよい。
【0051】
(コンテンツ記憶部123について)
コンテンツ記憶部123は、利用者端末200に表示させる複数の対象コンテンツを記憶する。
図6は、実施形態に係る情報処理装置のコンテンツ記憶部に記憶される情報の一例を示す図である。
【0052】
図6に示す例において、コンテンツ記憶部123は、「コンテンツID」、「コンテンツデータ」という項目に係る情報を紐付けて記憶する。
【0053】
「コンテンツID」は、コンテンツを識別する識別子であり文字列や番号などによって表される。「コンテンツデータ」は、利用者端末200に表示させるコンテンツのデータである。
【0054】
すなわち、
図6においては、コンテンツID「CT#1」によって識別されるコンテンツとして、コンテンツデータ「CD#1」が示すコンテンツデータが記憶されていることを示している。
【0055】
なお、コンテンツ記憶部123は、「コンテンツID」、「コンテンツデータ」という項目に係る情報に限定されることなく、その他の任意のコンテンツに関係する情報が記憶されてよい。
【0056】
(制御部130について)
次に
図3に戻って、制御部130について説明する。制御部130は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
【0057】
図3に示すように、制御部130は、取得部131と、推定部132と、判定部133と、生成部134と、表示制御部135を有する。
【0058】
(取得部131について)
取得部131は、情報処理装置100の内部、ないし外部から各種の情報を取得する。
【0059】
例えば、取得部131は、利用者の対象コンテンツに対する操作を示す操作情報を取得する。利用者端末200がタッチパネルによって利用者の操作を受け付ける場合であれば、取得部131は、利用者のタッチ操作のタッチ所要時間、タッチ移動速度(X軸、Y軸)、タッチダウン位置(X軸、Y軸)、タッチアップ位置(X軸、Y軸)、接触面積、タッチダウン‐アップ位置の差異を含む操作情報を取得する。また、利用者端末200がアイトラッキング装置によって利用者の操作を受け付ける場合であれば、取得部131は、利用者の左右の眼球の視線方向、左右の眼球の注視点の位置などを含む操作情報を取得する。
【0060】
また、取得部131は、利用者の視線情報、及び表情情報を取得する。具体的には、取得部131は、入力部230のアイトラッキング装置によって計測された利用者の視線情報を取得する。なお、視線情報には、左右の眼球ごとの視線方向、左右の眼球ごとの注視点の位置、左右の眼球ごとの視線の移動速度、左右の眼球ごとの瞳孔径などの情報が含まれていてよい。また、取得部131は、利用者端末200の撮像部250により撮像された利用者の表情についての画像情報を利用者端末200から取得する。
【0061】
(推定部132について)
推定部132は、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する。例えば、推定部132は、利用者の操作時の視線情報と表情情報に対する利用者の操作の正誤との関係を学習した学習済みモデルを用いて、利用者の操作時の視線情報と表情情報に基づいて、利用者の操作が誤りであったか否かを推定してよい。この場合の学習済みモデルは、CNN(Convolutional Neural Network)などにより実現されてよい。例えば、学習済みモデルは視線情報としての左右の眼球ごとの視線移動速度や瞳孔径、及び表情情報としての口角、眉角度などの特徴と、利用者の操作の誤りとの関係を学習させることにより実現されてよい。
【0062】
(判定部133について)
判定部133は、推定部132が利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定する。すなわち、判定部133は、推定部132が利用者の操作が誤りであったと推定した時に対応する利用者の操作情報の受け付け時のコンテンツの状態に応じて、利用者の誤操作態様を判定する。
【0063】
例えば、利用者の操作情報の受け付け時のコンテンツの状態が、ブラウザが表示されている状態であって、利用者の操作情報がブラウザに表示されたページとは異なる別のページへのリンクの選択を示し、利用者端末200に操作情報にしたがって別のページを表示したにもかかわらず、推定部132が利用者の操作が誤りであると推定したとする。この場合、判定部133は、利用者の誤操作態様について、利用者は誤ったページに遷移したと判定する。
【0064】
また、例えば、利用者の操作情報の受け付け時のコンテンツの状態が、ブラウザに表示されたページとは異なる別のページへの複数のリンクが密集して表示されている状態であって、利用者の操作情報が複数のリンクのうちの一つの選択を示し、利用者端末200に操作情報にしたがって選択したリンクに対応する別のページを表示したにもかかわらず、推定部132が利用者の操作が誤りであると推定したとする。この場合、判定部133は、利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定する。
【0065】
また、例えば、利用者の操作情報の受け付け時のコンテンツの状態が、文字入力のキーボードの入力キーが複数表示されている状態であり、利用者の操作情報が複数の入力キーのうちの一つの選択を示し、利用者端末200に操作情報にしたがって当該の入力キーに対応する文字を表示したにもかかわらず、推定部132が利用者の操作が誤りであると推定したとする。この場合、判定部133は、利用者は文字入力の際に誤ったキーを入力したと判定する。
【0066】
(生成部134について)
生成部134は、推定部132が利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成する。具体的には、生成部134は、判定部133が判定した誤操作態様に応じて提案情報を生成する。以下、生成部134が生成する提案情報について、判定部133が判定した誤操作態様ごとに説明する。
【0067】
生成部134は、判定部133が利用者の誤操作態様について、利用者は誤ったページに遷移したと判定した場合に、元のページに戻るためのブラウザのバックボタンを含む提案情報を生成する。例えば、生成部134は、利用者が選択すると、元のページに戻る処理が実行されるようにプログラムが組まれている矢印によって戻る方向を指し示したオブジェクトにより表現されるバックボタンを含む提案情報を生成する。
【0068】
また、生成部134は、判定部133が利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定した場合に、利用者が選択したリンクから最も近い位置に表示されたリンクを含む提案情報を生成する。例えば、生成部134は、利用者が選択したリンクの位置を操作情報に基づいて特定し、当該のリンクからの距離が最も近いリンクを示す最近接リンクを特定する。そして、生成部134は、特定した最近接リンクに対応付けられたページに遷移する処理が実行されるにプログラムとともに、最近接リンクのオブジェクトを含む提案情報を生成する。
【0069】
また、生成部134は、判定部133が利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと判定された場合に、直近の入力キーを考慮しない推測変換候補を含む提案情報を生成する。例えば、利用者が「視線」という文字入力を行っている最中に、「視線」の文字の内の最後の「ン」の文字の選択の際に、操作を誤って「ル」を選択したとする。そして、推定部132が利用者の操作が誤りであると推定し、判定部133が利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと判定したとする。この場合、生成部134は、直近の入力キーである「ル」の入力を取り消して、「シセ」までの文字入力によって推測される「視線」の推測変換候補を含む提案情報を生成する。
【0070】
(表示制御部135について)
表示制御部135は、利用者端末200の出力部240の表示を制御する。
【0071】
例えば、表示制御部135は、利用者端末200に操作処理の対象となる複数の対象コンテンツを表示させる。表示制御部135は、例えば、電子ブックのページ画面、テキストボックス、動画のスクロールバー、ブラウザのWEBページのスクロールバーやリンク、CADのオブジェクトなどを含む複数のコンテンツを表示させる。なお、表示制御部135が表示させるコンテンツは、これに限定されるものではなく、VR(Virtual Reality)やMR(Mixed Reality)の技術を利用したコンテンツなどであってもよい。
【0072】
また、表示制御部135は、生成部134が生成した提案情報を利用者端末200の出力部240に表示させる。例えば、表示制御部135は、判定部133が利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定した場合に、利用者が選択したリンクから最も近い位置に表示されたリンクを含む提案情報を利用者端末200に表示させる。また、表示制御部135は、判定部133が利用者の誤操作態様について、利用者は誤ったページに遷移したと判定した場合に、元のページに戻るためのブラウザのバックボタンを含む提案情報を利用者端末200に表示させる。また、表示制御部135は、判定部133が利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと判定された場合に、直近の入力キーを考慮しない推測変換候補を含む提案情報を利用者端末200に表示させる。
【0073】
〔4.利用者端末の構成〕
次に、
図7を用いて、実施形態に係る利用者端末200の構成について説明する。
図7は、実施形態に係る利用者端末の構成例を示す図である。
図7に示すように、利用者端末200は、通信部210と、記憶部220と、入力部230と、出力部240と、撮像部250と、制御部260を有する。
【0074】
通信部210は、例えば、NIC等によって実現される。そして、通信部210は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、情報処理装置100との間で各種の情報の送受信を行う。
【0075】
記憶部220は、各種の情報を記憶する記憶装置である。記憶部220は、例えば、撮像部250が撮像した撮像データを記憶する。記憶部220は、主記憶装置と補助記憶装置とを備える。主記憶装置は、例えばRAM、ROM、フラッシュメモリ等のような半導体メモリ素子によって実現されてよい。また、補助記憶装置は、例えばハードディスクやSSD、光ディスク等によって実現されてよい。
【0076】
入力部230は、利用者から各種の操作情報が入力される。例えば、入力部230は、タッチパネルにより表示面(例えば出力部240)を介して利用者からの各種操作を受け付ける。また、入力部230は、アイトラッキング装置であってもよい。アイトラッキング装置は、ステレオカメラが撮像した利用者の眼球の画像情報に基づいて、利用者の眼球運動を分析して、利用者の視線方向を把握し、利用者の注視点を操作情報として受け付ける装置である。
【0077】
出力部240は、例えば液晶ディスプレイや有機EL(Electro-Luminescence)ディスプレイ等によって実現されるタブレット型端末等の表示画面であり、各種情報を表示するための表示装置である。つまり、利用者端末200は、入力部230がタッチパネルである場合は、出力部240である表示画面により利用者の入力を受け付け、利用者への出力も行う。また、出力部240は、スピーカーであり、スピーカーにより音声を出力してよい。
【0078】
撮像部250は、利用者の顔の表情を撮像する撮像装置である。撮像部250は、例えばカメラであってよい。カメラは、光学素子と撮像素子を含む。光学素子は、例えばレンズ、ミラー、プリズム、フィルタなどの光学系を構成する素子である。撮像素子は、光学素子を通して入射した光を電気信号である画像信号に変換する素子である。撮像素子は、例えば、CCD(Charge Coupled Device)センサやCMOS(Complementary Metal Oxide Semiconductor)センサなどである。
【0079】
制御部260は、例えば、CPUやMPU等によって、利用者端末200に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部260は、例えば、ASICやFPGA等の集積回路により実現されてもよい。
【0080】
図7に示すように、制御部260は、受付部261と、表示制御部262と、を有する。以下、これらの構成について順を追って説明する。
【0081】
受付部261は、利用者からコンテンツに対する操作情報を受け付ける。また、例えば、受付部261は、出力部240に操作対象となる複数のコンテンツを表示させて、利用者から操作対象となる複数のコンテンツに対する操作情報を受け付ける。受付部261は、例えば、出力部240がタッチパネルである場合であれば、利用者の指ごとのタッチ座標の中心点座標や、移動速度、移動方向、接触面積などの情報をセンシングすることにより、利用者からコンテンツに対する操作情報を受け付けてよい。また、受付部261は、入力部230がアイトラッキング装置である場合であれば、利用者の左右の眼球の視線方向、注視点などを操作情報として受け付ける。
【0082】
表示制御部262は、出力部240に表示される情報を制御する。例えば、表示制御部262は、出力部240に情報処理装置100の表示制御部135の制御指令にしたがって複数の対象コンテンツを表示させるように制御する。また、表示制御部262は、出力部240に情報処理装置100の生成部134が生成した提案情報を表示させるように制御する。この場合は、表示制御部262は、元々の表示に重ねて提案情報を表示させてよい。
【0083】
〔5.情報処理のフロー〕
次に、
図8を用いて、実施形態に係る情報処理装置100による情報処理の手順について説明する。
図8は、実施形態に係る情報処理の一例を示すフローチャートである。以下、
図8に示すフローチャートに沿って、実施形態に係る情報処理の手順について説明する。
【0084】
例えば、情報処理装置100は、利用者端末200に操作処理の対象となる複数の対象コンテンツを表示させる(ステップS101)。そして、情報処理装置100は、利用者の対象コンテンツに対する操作を示す操作情報を取得する(ステップS102)。そして、情報処理装置100は、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する(ステップS103)。そして、情報処理装置100は、利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成する(ステップS104)。
【0085】
これによれば、利用者の視線情報、及び表情情報に基づいて、利用者の操作の誤りを推定し、元の状態に戻す提案情報を利用者端末200に提供することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理方法、及び情報処理プログラムを提供することができる。
【0086】
〔6.ハードウェア構成〕
また、上述した実施形態に係る情報処理装置100は、例えば
図9に示すような構成のコンピュータ1000によって実現される。
図9は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
【0087】
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一次的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが記憶される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
【0088】
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
【0089】
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
【0090】
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
【0091】
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
【0092】
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、情報処理装置100の制御部130の機能を実現する。
【0093】
〔7.構成と効果〕
本開示に係る情報処理装置100は、利用者端末200に操作処理の対象となる複数の対象コンテンツを表示させる表示制御部135と、利用者の対象コンテンツに対する操作を示す操作情報を取得する取得部131と、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定する推定部132と、推定部132が利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成する生成部134と、を備える。
【0094】
この構成によれば、利用者の視線情報、及び表情情報に基づいて、利用者の操作の誤りを推定し、元の状態に戻す提案情報を利用者端末200に提供することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置100を提供することができる。
【0095】
本開示に係る情報処理装置100の推定部132は、利用者の視線情報と表情情報に対する操作の正誤との関係を学習した学習済みモデルを用いて利用者の操作の正誤を推定する。
【0096】
この構成によれば、利用者の視線情報と表情情報に基づいて、利用者の操作の正誤を推定することができる。そのため、利用者の操作の誤りを的確に検出することができる。
【0097】
本開示に係る情報処理装置100は、推定部132が利用者の操作が誤りであると推定した場合に、利用者の操作の誤りの態様を示す誤操作態様を判定する判定部133と、をさらに備える。
【0098】
この構成によれば、利用者の操作の誤りの態様を示す誤操作態様を判定することができる。そのため、それぞれの誤操作態様に応じた、的確な処理を実行することができる。
【0099】
本開示に係る情報処理装置100の生成部134は、判定部133が利用者の誤操作態様について、利用者は誤ったページに遷移したと判定した場合に、元のページに戻るためのブラウザのバックボタンを含む提案情報を生成する。
【0100】
この構成によれば、ブラウザが表示された状態において、利用者の意図とは異なる誤ったページに遷移した場合に、元のページに戻るためのバックボタンを利用者端末200に表示させることができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置100を提供することができる。
【0101】
本開示に係る情報処理装置100の生成部134は、判定部133が利用者の誤操作態様について、利用者は複数のリンクのうちの誤ったリンクを選択したと判定した場合に、利用者が選択したリンクの隣に表示されたリンクを含む提案情報を生成する。
【0102】
この構成によれば、利用者が複数のリンクのうちの誤ったリンクを選択した場合に、利用者が選択したリンクの隣に表示されたリンクを含む提案情報を利用者端末200に提供することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置100を提供することができる。
【0103】
本開示に係る情報処理装置100の生成部134は、判定部133が利用者の誤操作態様について、利用者は文字入力の際に誤ったキーを入力したと推定された場合に、直近の入力キーを考慮しない推測変換候補を含む提案情報を生成する。
【0104】
この構成によれば、利用者が文字入力の際に誤ったキーを入力した場合に、直近の入力キーを考慮しない推測変換候補を提案することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理装置100を提供することができる。
【0105】
また、本開示に係る情報処理方法は、利用者端末200に操作処理の対象となる複数の対象コンテンツを表示させるステップと、利用者の対象コンテンツに対する操作を示す操作情報を取得するステップと、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定するステップと、利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成するステップと、を含む。
【0106】
この構成によれば、利用者の視線情報、及び表情情報に基づいて、利用者の操作の誤りを推定し、元の状態に戻す提案情報を利用者端末200に提供することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理方法を提供することができる。
【0107】
また、本開示に係る情報処理プログラムは、利用者端末200に操作処理の対象となる複数の対象コンテンツを表示させるステップと、利用者の対象コンテンツに対する操作を示す操作情報を取得するステップと、対象コンテンツに対する利用者の操作時における視線情報と、表情情報に基づいて、利用者の操作が誤りであったか否かを推定するステップと、利用者の操作が誤りであると推定した場合に、対象コンテンツの状態を元の状態に戻すための利用者への提案を示す提案情報を生成するステップと、をコンピュータに実行させる。
【0108】
この構成によれば、利用者の視線情報、及び表情情報に基づいて、利用者の操作の誤りを推定し、元の状態に戻す提案情報を利用者端末200に提供することができる。そのため、利用者の操作の誤りを的確に検出し、元の状態に戻すことができる情報処理プログラムを提供することができる。
【0109】
以上、本願の実施形態を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0110】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部131は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0111】
1 情報処理システム
100 情報処理装置
110 通信部
120 記憶部
121 操作情報記憶部
122 モデル記憶部
123 コンテンツ記憶部
130 制御部
131 取得部
132 推定部
133 判定部
134 生成部
135 表示制御部
200 利用者端末
210 通信部
220 記憶部
230 入力部
240 出力部
250 撮像部
260 制御部
261 受付部
262 表示制御部
N ネットワーク