IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エンカレッジ・テクノロジ株式会社の特許一覧

特開2024-75082検出装置、検出方法、およびプログラム
<>
  • 特開-検出装置、検出方法、およびプログラム 図1
  • 特開-検出装置、検出方法、およびプログラム 図2
  • 特開-検出装置、検出方法、およびプログラム 図3
  • 特開-検出装置、検出方法、およびプログラム 図4
  • 特開-検出装置、検出方法、およびプログラム 図5
  • 特開-検出装置、検出方法、およびプログラム 図6
  • 特開-検出装置、検出方法、およびプログラム 図7
  • 特開-検出装置、検出方法、およびプログラム 図8
  • 特開-検出装置、検出方法、およびプログラム 図9
  • 特開-検出装置、検出方法、およびプログラム 図10
  • 特開-検出装置、検出方法、およびプログラム 図11
  • 特開-検出装置、検出方法、およびプログラム 図12
  • 特開-検出装置、検出方法、およびプログラム 図13
  • 特開-検出装置、検出方法、およびプログラム 図14
  • 特開-検出装置、検出方法、およびプログラム 図15
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024075082
(43)【公開日】2024-06-03
(54)【発明の名称】検出装置、検出方法、およびプログラム
(51)【国際特許分類】
   G01N 21/88 20060101AFI20240527BHJP
【FI】
G01N21/88 J
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022186262
(22)【出願日】2022-11-22
(71)【出願人】
【識別番号】504169647
【氏名又は名称】エンカレッジ・テクノロジ株式会社
(74)【代理人】
【識別番号】100115749
【弁理士】
【氏名又は名称】谷川 英和
(72)【発明者】
【氏名】大川 裕貴
(72)【発明者】
【氏名】中西 崇文
【テーマコード(参考)】
2G051
【Fターム(参考)】
2G051AA90
2G051AB02
2G051CA04
2G051CB01
2G051EB09
2G051ED08
2G051ED11
2G051ED21
2G051FA01
(57)【要約】
【課題】従来、一のコンピュータに対する操作の画面画像の集合である動画ログを確認する際に、目視で全ての画面画像を確認することの労力が多大であった。
【解決手段】コンピュータに対する操作の切り替わり箇所を検出する条件であり、コンピュータに対する操作の画面のスクリーンショットの画像である画面画像に関する条件である検出条件が格納される条件管理部11と、一のコンピュータに対する操作の画面画像の集合である動画ログを取得するログ取得部31と、動画ログの画面画像の中で、検出条件を満たす画面画像を検出する検出部32と、検出部32が検出した画面画像の箇所である切替箇所を特定する切替箇所情報を蓄積する箇所蓄積部33とを具備する検出装置Aにより、コンピュータに対する操作の切り替わり箇所を検出し、利用することにより、コンピュータに対する操作の画面画像の集合である動画ログの確認の労力を低減できる。
【選択図】図1
【特許請求の範囲】
【請求項1】
コンピュータに対する操作の切り替わり箇所を検出する条件であり、当該コンピュータに対する操作の画面のスクリーンショットの画像である画面画像に関する条件である検出条件が格納される条件管理部と、
一のコンピュータに対する操作の画面画像の集合である動画ログを取得するログ取得部と、
前記動画ログの前記画面画像の中で、前記検出条件を満たす画面画像を検出する検出部と、
前記検出部が検出した前記画面画像の箇所である切替箇所を特定する切替箇所情報を蓄積する箇所蓄積部とを具備する検出装置。
【請求項2】
前記検出条件は、連続する画面画像が類似条件を満たさないことであり、
前記検出部は、
前記動画ログの中で、類似条件を満たさない連続する画面画像を検出し、
前記箇所蓄積部は、
前記類似条件を満たさない前記連続する画面画像の箇所を特定する切替箇所情報を蓄積する請求項1記載の検出装置。
【請求項3】
前記検出条件は、画面画像に関する条件である画像条件を含み、
前記画像条件は、前記動画ログの前記2以上の画面画像のうちの連続する2つの画面画像の1以上の特徴量である画像特徴量集合の類似度が閾値以下または閾値未満であることであり、
前記検出部は、
前記動画ログの2以上の各画面画像の画像特徴量集合を取得する画像特徴量取得手段と、
前記2以上の画面画像の中の連続する2つの画面画像の画像特特徴量集合が前記画像条件を満たす画面画像を検出する検出手段とを具備する請求項2記載の検出装置。
【請求項4】
前記検出条件は、動画ログの中の2以上の各画面画像の中の1以上の文字列を用いた文字列条件を含む、請求項2または請求項3記載の検出装置。
【請求項5】
前記文字列条件は、前記動画ログの前記2以上の画面画像の中の連続する2つの各画面画像の1以上の文字列から取得される1以上の特徴量である文字列特徴量集合の類似度が閾値以下または閾値未満であることであり、
前記検出部は、
前記動画ログの2以上の各画面画像の文字列特徴量集合を取得する文字列特徴量取得手段と、
前記2以上の画面画像の中の連続する2つの画面画像の文字列特特徴量集合が前記文字列条件を満たす画面画像を検出する検出手段とを具備する請求項4記載の検出装置。
【請求項6】
前記検出手段は、
前記画像条件と前記文字列条件とを満たす画面画像を検出する請求項4記載の検出装置。
【請求項7】
前記検出部が検出した1以上の各画面画像を区切りとして、前記動画ログを2以上の画面画像グループに分けるグループ化部と、
前記2以上の各画面画像グループに対する処理を行うグループ処理部とをさらに具備する請求項1記載の検出装置。
【請求項8】
前記グループ処理部は、
前記動画ログの中の画面画像を出力するためのインターフェイスであり、前記2以上の各画面画像グループが区別可能になったインターフェイスを構成するIF構成手段を具備し、
前記インターフェイスを出力するIF出力部をさらに具備する請求項7記載の検出装置。
【請求項9】
前記グループ化部は、
前記2以上の各画面画像グループの特徴量集合であるグループ特徴量集合を取得し、連続する画面画像グループのグループ特徴量集合の類似度を取得し、当該類似度が閾値以上または閾値より大きい連続する画面画像グループを一つのグループにする請求項7または請求項8記載の検出装置。
【請求項10】
前記動画ログを構成する画面画像を出力する画面画像出力部と、
切替箇所情報が示す切替箇所にジャンプする指示であるジャンプ指示を受け付ける指示受付部とをさらに具備し、
前記画面画像出力部は、
前記ジャンプ指示に対応する前記切替箇所情報が示す切替箇所の画面画像を出力する請求項1記載の検出装置。
【請求項11】
コンピュータに対する操作の切り替わり箇所を検出する条件であり、当該コンピュータに対する操作の画面のスクリーンショットの画像である画面画像に関する条件である検出条件が格納される条件管理部と、ログ取得部と、検出部と、箇所蓄積部とにより実現される情報処理方法であって、
前記ログ取得部が、一のコンピュータに対する操作の画面画像の集合である動画ログを取得するログ取得ステップと、
前記検出部が、前記動画ログの前記画面画像の中で、前記検出条件を満たす画面画像を検出する検出ステップと、
前記箇所蓄積部が、前記検出部が検出した前記画面画像の箇所である切替箇所を特定する切替箇所情報を蓄積する箇所蓄積ステップとを具備する情報処理方法。
【請求項12】
コンピュータに対する操作の切り替わり箇所を検出する条件であり、当該コンピュータに対する操作の画面のスクリーンショットの画像である画面画像に関する条件である検出条件が格納される条件管理部にアクセス可能な情報処理装置を、
一のコンピュータに対する操作の画面画像の集合である動画ログを取得するログ取得部と、
前記動画ログの前記画面画像の中で、前記検出条件を満たす画面画像を検出する検出部と、
前記検出部が検出した前記画面画像の箇所である切替箇所を特定する切替箇所情報を蓄積する箇所蓄積部として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータに対する操作の画面のスクリーンショット画像の集合である動画ログに対して、操作の切り替わり箇所を検出する検出装置等に関するものである。
【背景技術】
【0002】
従来、情報システムの証跡ログから、不正操作を検出するとともに、システム動作の正当性を確認できる証跡ログ解析システムがあった(特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開第2012/001795号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術において、コンピュータに対する不正操作を検出する際に、コンピュータの操作画面のスクリーンショットの画像を用いていない。そのため、例えば、従来技術に加えて、コンピュータの操作画面のスクリーンショットの画像を用いて不正操作の検出等を行おうとした場合、目視で全ての画面画像を確認することが必要であり、労力が多大である。
【課題を解決するための手段】
【0005】
本第一の発明の検出装置は、コンピュータに対する操作の切り替わり箇所を検出する条件であり、コンピュータに対する操作の画面のスクリーンショットの画像である画面画像に関する条件である検出条件が格納される条件管理部と、一のコンピュータに対する操作の画面画像の集合である動画ログを取得するログ取得部と、動画ログの画面画像の中で、検出条件を満たす画面画像を検出する検出部と、検出部が検出した画面画像の箇所である切替箇所を特定する切替箇所情報を蓄積する箇所蓄積部とを具備する検出装置である。
【0006】
かかる構成により、コンピュータに対する操作の切り替わり箇所を検出し、利用できる結果、コンピュータに対する操作の画面画像の集合である動画ログの確認の労力を低減できる。
【0007】
また、本第二の発明の検出装置は、第一の発明に対して、検出条件は、連続する画面画像が類似条件を満たさないことであり、検出部は、動画ログの中で、類似条件を満たさない連続する画面画像を検出し、箇所蓄積部は、類似条件を満たさない連続する画面画像の箇所を特定する切替箇所情報を蓄積する検出装置である。
【0008】
かかる構成により、連続する画面画像が類似条件を満たさない箇所を検出し、利用できる結果、動画ログの確認の労力を低減できる。
【0009】
また、本第三の発明の検出装置は、第二の発明に対して、検出条件は、画面画像に関する条件である画像条件を含み、画像条件は、動画ログの2以上の画面画像のうちの連続する2つの画面画像の1以上の特徴量である画像特徴量集合の類似度が閾値以下または閾値未満であることであり、検出部は、動画ログの2以上の各画面画像の画像特徴量集合を取得する画像特徴量取得手段と、2以上の画面画像の中の連続する2つの画面画像の画像特特徴量集合が画像条件を満たす画面画像を検出する検出手段とを具備する検出装置である。
【0010】
かかる構成により、画像条件に基づき、操作の切り替わり箇所を正確に検出できる。
【0011】
また、本第四の発明の検出装置は、第二または第三の発明に対して、検出条件は、動画ログの中の2以上の各画面画像の中の1以上の文字列を用いた文字列条件を含む、検出装置である。
【0012】
かかる構成により、画面画像の中の1以上の文字列を用いた文字列条件に基づき、操作の切り替わり箇所を正確に検出できる。
【0013】
また、本第五の発明の検出装置は、第四の発明に対して、文字列条件は、動画ログの2以上の画面画像の中の連続する2つの各画面画像の1以上の文字列から取得される1以上の特徴量である文字列特徴量集合の類似度が閾値以下または閾値未満であることであり、検出部は、動画ログの2以上の各画面画像の文字列特徴量集合を取得する文字列特徴量取得手段と、2以上の画面画像の中の連続する2つの画面画像の文字列特特徴量集合が文字列条件を満たす画面画像を検出する検出手段とを具備する検出装置である。
【0014】
かかる構成により、画面画像の中の1以上の文字列から取得される文字列特徴量集合を用いた文字列条件に基づき、操作の切り替わり箇所を正確に検出できる。
【0015】
また、本第六の発明の検出装置は、第四の発明に対して、検出手段は、画像条件と文字列条件とを満たす画面画像を検出する検出装置である。
【0016】
かかる構成により、画像条件と文字列条件との両方を満たす画面画像を検出する結果、操作の切り替わり箇所をより正確に検出できる。
【0017】
また、本第七の発明の検出装置は、第一から第六いずれか1つの発明に対して、検出部が検出した1以上の各画面画像を区切りとして、動画ログを2以上の画面画像グループに分けるグループ化部と、2以上の各画面画像グループに対する処理を行うグループ処理部とをさらに具備する検出装置である。
【0018】
かかる構成により、動画ログを2以上の画面画像グループに分けて、処理できる。
【0019】
また、本第八の発明の検出装置は、第七の発明に対して、グループ処理部は、動画ログの中の画面画像を出力するためのインターフェイスであり、2以上の各画面画像グループが区別可能になったインターフェイスを構成するIF構成手段を具備し、インターフェイスを出力するIF出力部をさらに具備する検出装置である。
【0020】
かかる構成により、動画ログを2以上の画面画像のグループに分けて、各画面画像グループを明示したインターフェイスを提供できる。
【0021】
また、本第九の発明の検出装置は、第七または第八の発明に対して、グループ化部は、2以上の各画面画像グループの特徴量集合であるグループ特徴量集合を取得し、連続する画面画像グループのグループ特徴量集合の類似度を取得し、類似度が閾値以上または閾値より大きい連続する画面画像グループを一つのグループにする検出装置である。
【0022】
かかる構成により、動画ログを構成する2以上の画面画像グループをさらに纏めることができる。
【0023】
また、本第十の発明の検出装置は、第一から第九いずれか1つの発明に対して、動画ログを構成する画面画像を出力する画面画像出力部と、切替箇所情報が示す切替箇所にジャンプする指示であるジャンプ指示を受け付ける指示受付部とをさらに具備し、画面画像出力部は、ジャンプ指示に対応する切替箇所情報が示す切替箇所の画面画像を出力する検出装置である。
【0024】
かかる構成により、コンピュータに対する操作の切り替わり箇所にジャンプできることにより、コンピュータに対する操作の画面画像の集合である動画ログの確認の労力を低減できる。
【発明の効果】
【0025】
本発明による検出装置によれば、コンピュータに対する操作の切り替わり箇所を検出し、利用することにより、コンピュータに対する操作の画面画像の集合である動画ログの確認の労力を低減できる。
【図面の簡単な説明】
【0026】
図1】実施の形態1における検出装置Aのブロック図
図2】同検出装置Aの動作例について説明するフローチャート
図3】同検出処理の例について説明するフローチャート
図4】同画像特徴量集合取得処理の例について説明するフローチャート
図5】同文字列特徴量集合取得処理の例について説明するフローチャート
図6】同グループ化処理の例についてフローチャート
図7】同上位グループ化処理の例について説明するフローチャート
図8】同画面構成処理の例について説明するフローチャート
図9】同動画ログの例を示す図
図10】同画面例を示す図
図11】同画面例を示す図
図12】同画面例を示す図
図13】同検出装置Aの実験結果を示す図
図14】同コンピュータシステムの概観図
図15】同コンピュータシステムのブロック図
【発明を実施するための形態】
【0027】
以下、検出装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
【0028】
(実施の形態1)
本実施の形態において、動画ログの中の1以上の箇所であり、検出条件を満たす1以上の箇所を検出する検出装置について説明する。検出装置は、主に、コンピュータに対する不正な操作の検出を支援する装置である。ただし、検出装置は、不正検知以外のために用いられても良い。
【0029】
動画ログとは、画面画像の集合である。動画ログは、コンピュータの画面の時間的な推移を示す情報である。動画ログは、コンピュータに対するユーザの操作を受け付けている間のコンピュータの画面の画像の集合である。動画ログは、例えば、ログインからログアウトまでの間の画面画像の集合であり、時間の経過の順に画面画像が配置された動画である。画面画像とは、コンピュータの操作画面のスクリーンショット画像である。画面画像は、通常、コンピュータの画面全体のスクリーンショットの画像であるが、画面の一部の領域の画像でも良い。画面の一部の領域の画像は、例えば、一ウィンドウの画像である。また、コンピュータは、例えば、パーソナルコンピュータ、タブレット等であるが、ユーザの操作の対象であれば良い、と考えても良い。動画ログは、時系列の画面画像の集合である。なお、動画ログのフレームレートは問わない。動画ログのフレームレートは、例えば、「1フレームレート/秒」「30フレーム/秒」「60フレーム/秒」である。また、動画ログに含まれる隣接する画面画像の時間間隔は一定でなくても良い。
【0030】
また、本実施の形態において、動画ログを、操作の切り替わり箇所を区切りにした2以上のグループに分けて、各グループごとに処理を行う検出装置について説明する。
【0031】
また、本実施の形態において、操作の切り替わり箇所を区切りにした2以上のグループを、さらに纏める処理を行う検出装置について説明する。
【0032】
さらに、本実施の形態において、ユーザの指示により、動画ログの中のグループの区切りの箇所にジャンプして、ジャンプ先の画面画像を出力する検出装置について説明する。
【0033】
図1は、本実施の形態における検出装置Aのブロック図である。検出装置Aは、格納部1、受付部2、処理部3、および出力部4を備える。格納部1は、条件管理部11を備える。受付部2は、指示受付部21を備える。処理部3は、ログ取得部31、検出部32、箇所蓄積部33、グループ化部34、およびグループ処理部35を備える。検出部32は、画像特徴量取得手段321、文字列特徴量取得手段322、および検出手段323を備える。グループ処理部35は、IF構成手段351を備える。出力部4は、IF出力部41、および画面画像出力部42を備える。
【0034】
検出装置Aを構成する格納部1には、各種の情報が格納される。各種の情報は、例えば、後述する検出条件、動画ログ、後述する操作ログである。
【0035】
条件管理部11には、1または2以上の検出条件が格納される。検出条件とは、動画ログに対して、操作の切り替わり箇所を検出する条件である。検出条件は、動画ログを構成する画面画像を用いた条件である。
【0036】
検出条件は、例えば、動画ログの中の連続する2つの画面画像が類似条件を満たさないことである。検出条件は、例えば、動画ログの中のグループの切れ目であることである。類似条件は、動画ログの中の連続する2つの画面画像が類似すると判断されるための条件である。
【0037】
検出条件は、画像条件を含むことは好適である。検出条件は、例えば、文字列条件を含む。検出条件は、画像条件と文字列条件の両方を含むことは好適である。
【0038】
画像条件とは、画面画像に関する条件である。画像条件は、例えば、画面画像の特徴量に関する条件である。画像条件は、例えば、動画ログの2以上の画面画像のうちの連続する2つの画面画像の画像特徴量集合の類似度が閾値以下または閾値未満であることである。なお、画像特徴量集合とは、画面画像の1以上の画像特徴量である。画像特徴量は、画像から取得される特徴量である。画像特徴量集合を構成する画像特徴量は、例えば、ImageNet(インターネットURL「https://image-net.org/index」「https://ja.wikipedia.org/wiki/ImageNet」参照)を事前学習させている深層学習モデルと画面画像とを予測モジュールに与え、当該予測モジュールを実行させることにより取得された特徴量である。ただし、画面画像から取得される画像特徴量は問わない。画像特徴量は、画面画像の特徴を表す情報であれば良い。なお、画像から1以上の画像特徴量を取得する技術は、種々の公知技術が利用可能である。画像特徴量は、例えば、画素値の平均値、SIFT特徴量、HoG特徴量である。
【0039】
文字列条件とは、2以上の各画面画像の中の1以上の文字列に関する条件である。文字列条件は、2以上の各画面画像に対して文字認識処理が行われ取得された1以上の文字列に関する条件である。文字列条件は、例えば、動画ログの中の連続する2つの各画面画像から取得される文字列特徴量集合の類似度が閾値以下または閾値未満であることである。文字列特徴量集合とは、1以上の文字列特徴量の集合である。文字列特徴量とは、1以上の文字列から取得される特徴量である。文字列特徴量集合は、例えば、画面画像から取得される1以上の文字列から取得されるベクトルである。かかるベクトルは、例えば、画面画像から取得される1以上の文字列に含まれる2以上の各単語の出現回数を要素とするベクトルである。文字列特徴量集合は、例えば、画面画像ごとに画面画像から取得される1以上の文字列に含まれる各単語ごとにTF/IDFの値を算出し、単語ごとのTF/IDFの値を要素とするベクトルである。文字列特徴量集合は、例えば、画面画像ごとに画面画像から取得される1以上の文字列に含まれる各単語ごとにTF/IDFの値を算出し、TF/IDFの値が閾値以上または閾値より大きい1または2以上の単語(画面画像において特徴的な単語)のみを取得し、当該1以上の単語の集合から取得したベクトルである。単語の集合から取得したベクトルは、例えば、1以上の単語の集合を構成する各単語に対応する要素を「1」としたベクトルである。
【0040】
受付部2は、各種の指示や情報を受け付ける。各種の指示や情報は、例えば、後述する検出指示等の各種の指示、動画ログ、操作ログである。
【0041】
受付部2は、例えば、ユーザの操作を受け付ける。かかる場合、検出装置Aは、ユーザの操作対象のコンピュータである。なお、操作対象のコンピュータは、操作対象の装置であれば良く、いわゆるパーソナルコンピュータやタブレットやスマートフォン等の汎用機だけではなく、専用機も含む。
【0042】
操作ログとは、コンピュータに対するユーザの1または2以上の操作のログである。操作ログは、1または2以上の操作情報を有する。操作情報は、ユーザの操作を特定する情報である。操作情報は、ユーザの操作により発生する内部イベントでも良い。内部イベントとは、ユーザの操作により、コンピュータの内部で行われる処理を特定する情報である。操作ログは、通常、当該操作を行った画面の画面画像に対応付いている。
【0043】
各種の指示や情報の入力手段は、タッチパネルやキーボードやマウスやメニュー画面によるもの等、何でも良い。
【0044】
指示受付部21は、各種の指示を受け付ける。各種の指示は、例えば、検出指示、画像指示、ジャンプ指示、次指示である。検出指示とは、動画ログの中の切り替わりの箇所を検出する指示である。検出指示は、例えば、切り替わりの箇所を検出する対象の動画ログの識別子を有する。画像指示とは、動画ログの一の画面画像の出力の指示である。画像指示は、例えば、動画ログのバーの中の一の位置の指示である。ジャンプ指示とは、切替箇所情報が示す箇所にジャンプする指示である。ジャンプ指示は、例えば、切替箇所情報に対する指示、または「ジャンプ」ボタンに対する指示である。次指示とは、出力されている画面画像の次の画面画像の出力の指示である。次指示は、例えば、「次」ボタンに対する指示である。
【0045】
受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。
【0046】
処理部3は、各種の処理を行う。各種の処理とは、例えば、ログ取得部31、検出部32、箇所蓄積部33、グループ化部34、グループ処理部35が行う処理である。
【0047】
ログ取得部31は、一のコンピュータに対する操作の画面画像の集合である動画ログを取得する。
【0048】
ログ取得部31は、例えば、検出装置Aに対して行われた操作を反映した検出装置Aの画面のスクリーンショット画像の集合である動画ログを取得する。ログ取得部31は、例えば、動画ログに対応付けて、操作ログをも取得することは好適である。
【0049】
ログ取得部31は、例えば、受付部2が受け付けた動画ログを取得する。ログ取得部31は、例えば、操作ログに対応付いている動画ログを取得する。
【0050】
ログ取得部31は、例えば、検出指示により識別される動画ログを取得する。ログ取得部31は、例えば、格納部1に格納されている動画ログを取得する。かかる動画ログには、操作ログが対応付いていることは好適である。なお、動画ログに操作ログが対応付いていることは、通常、動画ログを構成する画面画像に、当該画面画像に対応する画面に対して行われた操作の操作ログが対応付いていることである。
【0051】
検出部32は、動画ログを用いて、コンピュータに対する操作の切り替わり箇所を検出する。検出部32は、動画ログの画面画像の中で、検出条件を満たす画面画像を検出する。検出部32は、例えば、動画ログの中で、類似条件を満たさない連続する画面画像を検出する。
【0052】
検出部32は、例えば、動画ログを構成する連続する2つの画面画像の組を、順に、変更しながら、画面画像の各組に含まれる2つの画面画像が類似するか否かを判断する。そして、検出部32は、例えば、類似しない画面画像の組を検出する。
【0053】
検出部32は、例えば、2つの画面画像の組が類似するか否かは、後述するように、画像特徴量集合と文字列特徴量集合のうちの1または2種類の情報を用いることは好適である。
【0054】
ただし、検出部32は、例えば、2つの画面画像の組が類似するか否かを、機械学習の予測モジュールを用いて決定しても良い。つまり、検出部32は、画面画像の組と学習モデルとを予測モジュールに与え、当該予測モジュールを実行し、2つの画面画像が類似するか否かの予測結果を取得する。なお、学習モデルは、画面画像の組と2つの画面画像が類似するか否かを示す情報とを有する2以上の教師データを学習モジュールに与え、当該学習モジュールを実行し、得られた情報である。なお、機械学習は、深層学習が好適であるが、ランダムフォレスト、決定木、SVM等でも良く、そのアルゴリズムは問わない。
【0055】
例えば、画像特徴量取得手段321と文字列特徴量取得手段322のうちの1以上の構成が取得した特徴量の集合を用いて、検出手段323が、動画ログから、検出条件を満たす画面画像を検出する。
【0056】
画像特徴量取得手段321は、動画ログの2以上の各画面画像の画像特徴量集合を取得する。画像特徴量取得手段321は、動画ログの2以上の各画面画像から、画面画像ごとに、画像特徴量集合を取得する。
【0057】
画像特徴量取得手段321は、例えば、動画ログの2以上の各画面画像と、ImageNetを事前学習させている深層学習モデルとを、深層学習の予測モジュールに与え、当該予測モジュールを実行し、1または2以上の画像特徴量である画像特徴量集合を取得する。なお、画面画像から画像特徴量集合を取得する処理は、種々の公知技術が利用可能である。また、機械学習を利用する場合、ランダムフォレスト、決定木等の深層学習以外のアルゴリズムを用いても良い。
【0058】
画像特徴量取得手段321は、例えば、動画ログの2以上の各画面画像に対して、公知の画像解析処理を行い、画像特徴量集合を取得しても良い。
【0059】
文字列特徴量取得手段322は、動画ログの2以上の各画面画像の文字列特徴量集合を取得する。
【0060】
文字列特徴量取得手段322は、例えば、動画ログの2以上の各画面画像に対して、文字認識処理を行い、画面画像ごとに1以上の文字列を取得する。次に、文字列特徴量取得手段322は、例えば、画面画像ごとに、取得した1以上の文字列を単語に分割し、各単語の出現回数を要素とするベクトルである文字列特徴量集合を取得する。
【0061】
文字列特徴量取得手段322は、例えば、動画ログの2以上の各画面画像に対して、文字認識処理を行い、画面画像ごとに1以上の文字列を取得する。次に、文字列特徴量取得手段322は、例えば、画面画像ごとに取得した1以上の文字列を単語に分割し、画面画像ごと、単語ごとにTF/IDF値を算出する。次に、文字列特徴量取得手段322は、例えば、画面画像ごとに、TF/IDF値が閾値以上または閾値より大きい単語(特徴単語)のみを用いて、ベクトルである文字列特徴量集合を取得する。なお、特徴単語のみを用いたベクトルは、例えば、1または2以上の各特徴単語の出現回数を要素とするベクトルである。特徴単語のみを用いたベクトルは、例えば、1または2以上の各特徴単語の対応する要素を「1」、特徴単語に対応しない要素を「0」とするベクトルである。
【0062】
なお、文字列特徴量取得手段322は、画面画像ごとに、単語ごとのTF/IDF値を要素とするベクトルである文字列特徴量集合を取得しても良い。また、文字列特徴量取得手段322は、画面画像ごとに、各画面画像に出現する1以上の各単語の出現回数を要素とするベクトルである文字列特徴量集合を取得しても良い。つまり、文字列特徴量取得手段322は、画面画像ごとに、各画面画像の1以上の文字列を用いて、文字列特徴量集合を取得すれば良く、文字列特徴量集合の構造や作成のアルゴリズムは問わない。
【0063】
検出部32は、画面画像ごとに、画像特徴量集合を有する特徴量集合を取得することは好適である。また、検出部32は、画面画像ごとに、画像特徴量集合と文字列特徴量集合の両方を有する特徴量集合を取得しても良い。
【0064】
検出手段323は、2以上の画面画像の中の連続する2つの画面画像の画像特特徴量集合が画像条件を満たす画面画像を検出する。画像条件は、例えば、動画ログの2以上の画面画像のうちの連続する2つの画面画像の画像特徴量集合の類似度が閾値以下または閾値未満であることである。なお、画像特徴量集合は、通常、ベクトルである。そして、2つのベクトルの類似度を算出する処理は公知の処理である。
【0065】
検出手段323は、2以上の画面画像の中の連続する2つの画面画像の文字列特特徴量集合が文字列条件を満たす画面画像を検出する。文字列条件は、例えば、動画ログの2以上の画面画像の中の連続する2つの各画面画像の文字列特徴量集合の類似度が閾値以下または閾値未満であることである。なお、文字列特徴量集合は、通常、ベクトルである。
【0066】
検出手段323は、画像条件と文字列条件との両方を満たす画面画像を検出することは好適である。
【0067】
検出手段323は、画像条件を満たす連続する2つの画面画像を検出する。そして、検出手段323は、当該2つの画面画像のうち、後の画面画像を特定する箇所情報を取得することは好適である。ただし、検出手段323は、当該2つの画面画像のうち、前の画面画像を特定する箇所情報を取得しても良いし、当該2つの画面画像を特定する箇所情報を取得しても良い。なお、箇所情報とは、操作の切り替わり箇所を特定する情報である。箇所情報は、例えば、画面画像のフレームID、画面画像そのものである。
【0068】
箇所蓄積部33は、検出部32が検出した画面画像の箇所を特定する1または2以上の箇所情報を蓄積する。箇所蓄積部33は、例えば、検出手段323が取得した1または2以上の箇所情報を蓄積する。
【0069】
箇所蓄積部33は、類似条件を満たさない連続する画面画像の箇所を特定する1または2以上の箇所情報を蓄積する。
【0070】
グループ化部34は、検出部32が検出した1以上の各画面画像を区切りとして、動画ログを2以上の画面画像グループに分ける。グループ化部34は、例えば、1以上の各箇所情報が示す箇所を区切りとして、動画ログを2以上の画面画像グループに分ける。
【0071】
グループ化部34は、例えば、画面画像グループを特定するグループ情報を取得する。グループ情報は、例えば、グループの最初の画面画像の識別子と最後の画面画像の識別子である。画面画像の識別子は、例えば、フレームIDである。
【0072】
グループ化部34は、2以上の各画面画像グループの特徴量集合であるグループ特徴量集合を取得し、連続する画面画像グループのグループ特徴量集合の類似度を取得し、類似度が閾値以上または閾値より大きい連続する画面画像グループを一つのグループにする。
【0073】
グループ処理部35は、グループ化部34が分けた、2以上の各画面画像グループに対する処理を行う。画面画像グループに対する処理は、例えば、後述するIF構成手段351が行う処理である。
【0074】
IF構成手段351は、グループ動画ログの中の画面画像を出力するためのインターフェイスであり、2以上の各画面画像グループが区別可能になったインターフェイスを構成する。IF構成手段351は、例えば、動画ログの中の画面画像が選択可能なインターフェイスであり、箇所情報を明示したインターフェイスである。
【0075】
出力部4は、各種の情報を出力する。各種の情報は、例えば、インターフェイス、動画ログ、操作ログ、箇所情報、画面画像グループである。
【0076】
ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。
【0077】
IF出力部41は、IF構成手段351が構成したインターフェイスを出力する。
【0078】
画面画像出力部42は、動画ログを構成する画面画像を出力する。画面画像出力部42は、ジャンプ指示に対応する箇所情報が示す箇所の画面画像を出力する。
【0079】
格納部1、および条件管理部11は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
【0080】
格納部1等に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部1等で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部1等で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部1等で記憶されるようになってもよい。
【0081】
受付部2、指示受付部21は、タッチパネルやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
【0082】
処理部3、ログ取得部31、検出部32、箇所蓄積部33、グループ化部34、グループ処理部35、画像特徴量取得手段321、文字列特徴量取得手段322、検出手段323、およびIF構成手段351は、通常、MPUやメモリ等から実現され得る。処理部3の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
【0083】
出力部4、IF出力部41、および画面画像出力部42は、ディスプレイやスピーカー等の出力デバイスを含むと考えても含まないと考えても良い。出力部4は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
【0084】
次に、検出装置Aの動作例について、図2のフローチャートを用いて説明する。
【0085】
(ステップS201)指示受付部21は、検出指示を受け付けたか否かを判断する。検出指示を受け付けた場合はステップS202に行き、検出指示を受け付けなかった場合はステップS207に行く。
【0086】
(ステップS202)ログ取得部31は、検出指示に対応する動画ログ等を取得する。ログ取得部31は、例えば、検出指示に対応する動画ログ等を、格納部1から読み出す。なお、動画ログ等は、動画ログと操作ログとを有することは好適であるが、動画ログだけでも良い。
【0087】
(ステップS203)検出部32は、動画ログの中の切り替え箇所の検出を行う。かかる検出処理の例について、図3のフローチャートを用いて説明する。なお、切り替え箇所は、通常、動画ログの中で画面画像が大きく変化する箇所である。
【0088】
(ステップS204)グループ化部34は、ステップS203で切り替え箇所が検出された当該動画ログに対するグループ化処理を行う。グループ化処理の例について、図6のフローチャートを用いて説明する。
【0089】
(ステップS205)IF構成手段351等は、出力する画面を構成する。かかる画面構成処理の例について、図8のフローチャートを用いて説明する。
【0090】
(ステップS206)出力部4は、ステップS205で構成された画面を出力する。ステップS201に戻る。なお、この段階でのカレント箇所情報は、動画ログの中の最初の画面画像(1番目のフレーム)である。カレント箇所情報とは、着目している画面画像を特定する情報である。
【0091】
(ステップS207)指示受付部21は、画像指示を受け付けたか否かを判断する。画像指示を受け付けた場合はステップS208に行き、画像指示を受け付けなかった場合はステップS213に行く。
【0092】
(ステップS208)処理部3は、画像指示に対応する箇所の箇所情報を取得する。処理部3は、当該箇所情報をカレント箇所情報として、図示しないバッファに蓄積する。
【0093】
(ステップS209)処理部3は、カレント箇所情報に対応する画面画像を取得する。
【0094】
(ステップS210)処理部3は、ステップS209で取得した画面画像と対になる操作ログを取得する。
【0095】
(ステップS211)画面画像出力部42が、ステップS209で取得された画面画像を出力する。
【0096】
(ステップS212)出力部4は、ステップS210で取得された操作ログを出力する。ステップS201に戻る。
【0097】
(ステップS213)指示受付部21は、ジャンプ指示を受け付けたか否かを判断する。ジャンプ指示を受け付けた場合はステップS214に行き、ジャンプ指示を受け付けなかった場合はステップS216に行く。
【0098】
(ステップS214)処理部3は、図示しないバッファからカレント箇所情報を取得する。
【0099】
(ステップS215)処理部3は、カレント箇所情報が示す箇所から、時間的に先の画面画像の箇所情報であり、最初に出現する切替箇所情報を取得する。処理部3は、かかる切替箇所情報をカレント箇所情報として、図示しないバッファに蓄積する。ステップS209に行く。
【0100】
(ステップS216)指示受付部21は、次指示を受け付けたか否かを判断する。次指示を受け付けた場合はステップS217に行き、次指示を受け付けなかった場合はステップS201に戻る。
【0101】
(ステップS217)処理部3は、図示しないバッファからカレント箇所情報を取得する。
【0102】
(ステップS218)処理部3は、カレント箇所情報が示す画面画像の次の画面画像の箇所情報を取得する。処理部3は、取得した箇所情報を、カレント箇所情報として、図示しないバッファに蓄積する。ステップS209に行く。
【0103】
なお、図2のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
【0104】
次に、ステップS203の検出処理の例について、図3のフローチャートを用いて説明する。
【0105】
(ステップS301)検出部32は、カウンタiに1を代入する。
【0106】
(ステップS302)検出部32は、切り替え箇所の検出対象の動画ログの中に、i番目の画面画像が存在するか否かを判断する。i番目の画面画像が存在する場合はステップS303に行き、存在しない場合はステップS306に行く。
【0107】
(ステップS303)画像特徴量取得手段321は、i番目の画面画像に対して画像特徴量集合取得処理を行う。画像特徴量集合取得処理の例について、図4のフローチャートを用いて説明する。なお、画像特徴量集合取得処理とは、画面画像から画像特徴量集合を取得する処理である。
【0108】
(ステップS304)文字列特徴量取得手段322は、i番目の画面画像に対して文字認識処理を行い、1以上の文字列を取得し、当該1以上の文字列をi番目の画面画像に対応付ける。また、文字列特徴量取得手段322は、当該1以上の文字列に対して、形態素解析し、1以上の単語を取得する。また、文字列特徴量取得手段322は、1以上の各単語の出現概数を取得する。ここで、文字列特徴量取得手段322が取得する単語は、通常、自立語である。
【0109】
(ステップS305)検出部32は、カウンタiを1、インクリメントする。ステップS302に戻る。
【0110】
(ステップS306)検出部32は、カウンタiに1を代入する。
【0111】
(ステップS307)検出部32は、検出対象の動画ログの中に、i番目の画面画像が存在するか否かを判断する。i番目の画面画像が存在する場合はステップS308に行き、存在しない場合はステップS310に行く。
【0112】
(ステップS308)文字列特徴量取得手段322は、ステップS304で取得した1以上の文字列を用いて、i番目の画面画像に対して文字列特徴量集合取得処理を行う。文字列特徴量集合取得処理の例について、図5のフローチャートを用いて説明する。なお、文字列特徴量集合取得処理とは、画面画像の1以上の文字列を用いて、文字列特徴量集合を取得する処理である。
【0113】
(ステップS309)検出部32は、カウンタiを1、インクリメントする。ステップS307に戻る。
【0114】
(ステップS310)検出部32は、カウンタjに1を代入する。
【0115】
(ステップS311)検出部32は、検出対象の動画ログの中に、j番目の画面画像と(j+1)番目の画面画像が存在するか否かを判断する。2つの画面画像が存在する場合はステップS312に行き、存在しない場合は上位処理にリターンする。
【0116】
(ステップS312)検出部32は、j番目の画面画像の画像特徴量集合と、(j+1)番目の画面画像の画像特徴量集合とを取得する。次に、検出部32は、2つの画像特徴量集合の類似度を取得する。
【0117】
(ステップS313)検出部32は、ステップS312で取得した類似度が画像条件を満たすか否かを判断する。画像条件を満たす場合はステップS314に行き、画像条件を満たさない場合はステップS315に行く。なお、画像条件は、2つの画面画像が切り替えの箇所であるための画像特徴量集合に関する条件であり、例えば、2つの画像特徴量集合の類似度が閾値未満または閾値以下であることである。
【0118】
(ステップS314)箇所蓄積部33は、j番目の画面画像と(j+1)番目の画面画像に対応する画像切替箇所情報を取得し、図示しないバッファに一時蓄積する。なお、画像切替箇所情報は、画像特徴量集合を用いて取得された切替箇所情報である。画像切替箇所情報は、例えば、(j+1)番目の画面画像の識別子(例えば、フレームID)である。
【0119】
(ステップS315)検出部32は、j番目の画面画像の文字列特徴量集合と、(j+1)番目の画面画像の文字列特徴量集合とを取得する。次に、検出部32は、2つの文字列特徴量集合の類似度を取得する。
【0120】
(ステップS316)検出部32は、ステップS315で取得した類似度が文字列条件を満たすか否かを判断する。文字列条件を満たす場合はステップS317に行き、画像条件を満たさない場合はステップS318に行く。なお、文字列条件は、2つの画面画像が切り替えの箇所であるための文字列特徴量集合に関する条件であり、例えば、2つの文字列特徴量集合の類似度が閾値未満または閾値以下であることである。
【0121】
(ステップS317)箇所蓄積部33は、j番目の画面画像と(j+1)番目の画面画像に対応する文字列切替箇所情報を取得し、図示しないバッファに一時蓄積する。なお、文字列切替箇所情報は、文字列特徴量集合を用いて取得された切替箇所情報である。文字列切替箇所情報は、例えば、(j+1)番目の画面画像の識別子(例えば、フレームID)である。
【0122】
(ステップS318)検出部32は、j番目の画面画像と(j+1)番目の画面画像が検出条件を満たすか否かを判断する。検出条件を満たす場合はステップS319に行き、検出条件を満たさない場合はステップS320に行く。
【0123】
なお、検出条件は、例えば、「画像条件を満たす AND 文字列条件を満たす」、または「画像条件を満たす OR 文字列条件を満たす」である。
【0124】
(ステップS319)箇所蓄積部33は、j番目の画面画像と(j+1)番目の画面画像に対応する切替箇所情報を取得し、図示しないバッファに一時蓄積する。なお、切替箇所情報は、例えば、(j+1)番目の画面画像の識別子である。
【0125】
(ステップS320)検出部32は、カウンタiを1、インクリメントする。ステップS311に戻る。
【0126】
なお、図3のフローチャートにおいて、1または2以上の画像切替箇所情報、1または2以上の文字列切替箇所情報、および1または2以上の切替箇所情報が蓄積された。
【0127】
次に、ステップS303の画像特徴量集合取得処理の例について、図4のフローチャートを用いて説明する。
【0128】
(ステップS401)画像特徴量取得手段321は、格納部1から学習モデルを取得する。なお、学習モデルは、例えば、ImageNetを事前学習させた深層学習モデルである。
【0129】
(ステップS402)画像特徴量取得手段321は、処理対象の画面画像と学習モデルとを予測モジュールに与える。なお、処理対象の画面画像は、ステップS302のi番目の画面画像である。
【0130】
(ステップS403)画像特徴量取得手段321は、当該予測モジュールを実行し、1以上の画像特徴量を取得する。
【0131】
(ステップS404)画像特徴量取得手段321は、ステップS403で取得した1以上の画像特徴量を有する画像特徴量集合を構成する。なお、画像特徴量集合は、1または2以上の各画像特徴量を要素とするベクトルである。
【0132】
(ステップS405)画像特徴量取得手段321は、処理対象の画面画像に対応付けて、ステップS404で構成した画像特徴量集合を蓄積する。上位処理にリターンする。
【0133】
次に、ステップS308の文字列特徴量集合取得処理の例について、図5のフローチャートを用いて説明する。
【0134】
(ステップS501)文字列特徴量取得手段322は、処理対象の画面画像に対する文字認識処理の結果である1以上の文字列を取得する。
【0135】
(ステップS502)文字列特徴量取得手段322は、ステップS501で取得した1以上の文字列に対する形態素解析の結果である1以上の単語を取得する。なお、単語は、通常、自立語である。
【0136】
(ステップS503)文字列特徴量取得手段322は、カウンタiに1を代入する。
【0137】
(ステップS504)文字列特徴量取得手段322は、ステップS502で取得した1以上の単語の中に、i番目の単語が存在するか否かを判断する。i番目の単語が存在する場合はステップS505に行き、存在しない場合はステップS507に行く。
【0138】
(ステップS505)文字列特徴量取得手段322は、処理対象の画面画像におけるi番目の単語の出現回数を取得する。また、文字列特徴量取得手段322は、動画ログの全画面画像の中におけるi番目の単語の出現回数を取得する。次に、文字列特徴量取得手段322は、i番目の単語のTF/IDF値を算出する。
【0139】
(ステップS506)文字列特徴量取得手段322は、カウンタiをp1、インクリメントする。ステップS504に戻る。
【0140】
(ステップS507)文字列特徴量取得手段322は、ステップS505で算出した各単語のTF/IDF値を用いて、処理対象の画面画像における文字列からみた特徴を示す文字列特徴量集合を構成する。
【0141】
(ステップS508)文字列特徴量取得手段322は、ステップS507で構成した文字列特徴量集合を、処理対象の画面画像に対応付けて蓄積する。上位処理にリターンする。
【0142】
次に、ステップS204のグループ化処理の例について、図6のフローチャートを用いて説明する。
【0143】
(ステップS601)グループ化部34は、カウンタiに1を代入する。
【0144】
(ステップS602)グループ化部34は、処理対象の動画ログにおいて、i番目の切替箇所情報が存在するか否かを判断する。i番目の切替箇所情報が存在する場合はステップS603に行き、存在しない場合はステップS605に行く。
【0145】
(ステップS603)グループ化部34は、処理対象の動画ログにおける最初の画面画像または(i-1)番目の切替箇所情報に対する画面画像から、i番目の切替箇所情報に対する画面画像の直前の画面画像までの画面画像集合の情報であるi番目のグループ情報を取得する。ここでのグループ情報は、例えば、グループを構成する最初の画面画像の識別子と、最後の画面画像の識別子である。なお、かかる画面画像集合を、適宜、画面画像グループと言う。画面画像グループは、通常、操作の切り替わりが発生していない画面画像の集合であり、時間的に連続する2以上の画面画像の集合である。
【0146】
(ステップS604)グループ化部34は、カウンタiを1、インクリメントする。ステップS602に戻る。
【0147】
(ステップS605)グループ化部34は、処理対象の動画ログにおける最後の切替箇所情報に対する画面画像から、当該動画ログにおける最後の画面画像までの画面画像グループの情報である最後のグループ情報を取得する。
【0148】
(ステップS606)グループ化部34は、さらに上位階層のグループ化を行うか否かを判断する。上位階層のグループ化を行う場合はステップS607に行き、行わない場合は上位処理にリターンする。なお、さらに上位階層のグループ化を行うか否かは、例えば、予め決められている。例えば、グループの階層数は、予め決められている。
【0149】
(ステップS607)グループ化部34は、上位グループ化処理を行う。上位グループ化処理の例について、図7のフローチャートを用いて説明する。
【0150】
次に、ステップS607の上位グループ化処理の例について、図7のフローチャートを用いて説明する。
【0151】
(ステップS701)グループ化部34は、カウンタiに1を代入する。
【0152】
(ステップS702)グループ化部34は、対象の動画ログの中の切替箇所情報を参照し、対象の動画ログの中に、i番目のグループが存在するか否かを判断する。i番目のグループが存在する場合はステップS703に行き、存在しない場合はステップS706に行く。
【0153】
(ステップS703)グループ化部34は、i番目のグループの各画面画像の特徴量集合を取得する。
【0154】
(ステップS704)グループ化部34は、ステップS703で取得したi番目のグループの各画面画像の特徴量集合の代表値を取得する。なお、各画面画像の特徴量集合の代表値は、例えば、各画面画像の特徴量集合であるベクトルの各要素の代表値(例えば、平均値、中央値)を要素とするベクトルである。また、ここでの特徴量集合は、画像特徴量集合と文字列特徴量集合の両方を有する情報であることは好適であるが、画像特徴量集合のみであっても良い。
【0155】
(ステップS705)グループ化部34は、カウンタiを1、インクリメントする。ステップS702に戻る。
【0156】
(ステップS706)グループ化部34は、カウンタjに1を代入する。
【0157】
(ステップS707)グループ化部34は、(j+1)番目のグループが存在するか否かを判断する。(j+1)番目のグループが存在する場合はステップS708に行き、存在しない場合は上位処理にリターンする。
【0158】
(ステップS708)グループ化部34は、j番目のグループの特徴量集合の代表値と(j+1)番目のグループの特徴量集合の代表値との類似度を算出する。
【0159】
(ステップS709)グループ化部34は、ステップS708で算出した類似度がグループ条件を満たすか否かを判断する。グループ条件を満たす場合はステップS710に行き、満たさない場合はステップS711に行く。なお、グループ条件は、例えば、「2つのグループの特徴量集合の代表値の類似度が閾値以上、または閾値より大きいこと」である。
【0160】
(ステップS710)グループ化部34は、(j+1)番目のグループを、j番目のグループが属する上位グループに含めるための処理を行い、上位のグループのグループ情報を取得し、当該グループ情報をグループ識別子と対にして蓄積する。なお、グループ識別子とは、グループを識別する情報であり、例えば、IDである。また、上位のグループのグループ情報は、例えば、j番目のグループが属する上位グループの最初の画面画像の識別子と、(j+1)番目のグループの最後の画面画像の識別子とを有する。
【0161】
(ステップS711)グループ化部34は、カウンタjを1、インクリメントする。ステップS707に戻る。
【0162】
次に、ステップS205の画面構成処理の例について、図8のフローチャートを用いて説明する。
【0163】
(ステップS801)処理部3は、カウンタiに1を代入する。
【0164】
(ステップS802)処理部3は、対象の動画ログの中に、i番目のグループが存在するか否かを判断する。i番目のグループが存在する場合はステップS803に行き、存在しない場合はステップS809に行く。
【0165】
(ステップS803)IF構成手段351は、対象の動画ログの中のi番目のグループに属する画面画像の数(フレーム数)を取得する。
【0166】
(ステップS804)IF構成手段351は、i番目のグループに対応するバーであり、フレーム数が示す長さのバーを構成する。なお、バーは、例えば、矩形であり、当該バーの各箇所が選択可能である。かかるバーの選択は、例えば、画像指示の入力である。
【0167】
(ステップS805)IF構成手段351は、出力する画面情報の雛形の中であり、バーを配置する位置に、i番目のグループのバーを追加して配置する。
【0168】
(ステップS806)IF構成手段351は、i番目のグループに対応するi番目のインデックスを構成する。なお、i番目のインデックスは、例えば、i番目のグループの最初の画面画像と当該画面画像と対になる操作ログとを有する。グループの最初の画面画像は、操作が切り替わった最初の画面の画像である。操作が切り替わった最初の画面の画像は、例えば、新たなウィンドウがオープンされた画面の画像である。
【0169】
(ステップS807)IF構成手段351は、出力する画面情報の雛形の中であり、インデックスを配置する位置に、i番目のグループのインデックスを追加して配置する。
【0170】
(ステップS808)処理部3は、カウンタiを1、インクリメントする。ステップS802に戻る。
【0171】
(ステップS809)処理部3は、検査対象の動画ログの最初の画面画像を、出力する画面情報の雛形の中であり、着目する画面画像を配置する位置に配置する。
【0172】
(ステップS810)処理部3は、バー、インデックス、および最初の画面画像を有する画面であり、出力する画面を構成する。上位処理にリターンする。
【0173】
以下、本実施の形態における検出装置Aの具体的な動作について説明する。
【0174】
今、格納部1には、一の操作者Xがコンピュータを用いて作業を行っていた間のスクリーンショットの画面の集合である動作ログが格納されている、とする。かかる動画ログの例は、図9である。動画ログは、例えば、2フレーム/秒のフレームレートで、画面全体の画像のスクリーンショットが取得されたものである。また、当該動作ログに含まれる2以上の各画面画像には、当該操作者Xの操作により取得された操作ログが対応付いて、当該操作ログも格納部1に格納されている、とする。
【0175】
また、条件管理部11には、画像条件「画像特徴量集合の類似度<=0.8」、文字列条件「文字列特徴量集合の類似度<=0.7」、検出条件「画像条件を満たす AND 文字列条件を満たす」が格納されている、とする。
【0176】
かかる状況において、操作者Xが行った操作に不正がなかったか否かを検出する検査者Iは、検出装置Aに検出指示を入力した、とする。
【0177】
次に、検出装置Aの指示受付部21は、検出指示を受け付ける。次に、ログ取得部31は、格納部1から、操作者Xの操作に基づく動作ログと操作ログとを格納部1から取得する。
【0178】
次に、検出部32は、以下のように動画ログの中の切り替え箇所の検出を行う。つまり、画像特徴量取得手段321は、動作ログに含まれる各画面画像から、図4のフローチャートを用いて説明した処理により、画面画像ごとに、画像特徴量集合を取得し、当該画像特徴量集合を、画面画像識別子(ここでは、フレームID)に対応付けて、図示しないバッファに一時蓄積する。また、フレームIDは、例えば、動画ログを構成する画面画像の順番であり、動画ログがN枚の画面画像を有する場合、各画面画像のフレームIDは、「1」「2」・・・「N」である、とする。
【0179】
また、文字列特徴量取得手段322は、動作ログに含まれる各画面画像に対して、文字認識処理を行い、画面画像ごとに、文字認識処理の結果である1以上の文字列を取得し、当該1以上の文字列を、画面画像識別子に対応付けて、図示しないバッファに一時蓄積する。
【0180】
また、文字列特徴量取得手段322は、画面画像ごとに、対応付く1以上の文字列に含まれる各単語のTF/IDF値を算出する。そして、文字列特徴量取得手段322は、画面画像ごとに、各単語のTF/IDF値を用いて、文字列特徴量集合を取得し、当該文字列特徴量集合を、画面画像識別子に対応付けて、図示しないバッファに一時蓄積する。
【0181】
次に、検出部32は、連続する2つの画面画像の組ごとに、画像特徴量集合の類似度を算出し、当該類似度が画像条件「画像特徴量集合の類似度<=0.8」を満たすか否かを判断する。そして、検出部32は、画像条件を満たす画面画像の組の中の後の画面画像の画面画像識別子(ここでは、フレームID)を画像切替箇所情報として取得し、当該画像切替箇所情報を図示しないバッファに蓄積する。
【0182】
また、検出部32は、連続する2つの画面画像の組ごとに、文字列特徴量集合の類似度を算出し、当該類似度が文字列条件「文字列特徴量集合の類似度<=0.7」を満たすか否かを判断する。そして、検出部32は、文字列条件を満たす画面画像の組の中の後の画面画像の画面画像識別子(ここでは、フレームID)を文字列切替箇所情報として取得し、当該文字列切替箇所情報を図示しないバッファに蓄積する。
【0183】
次に、検出部32は、1以上の画像切替箇所情報の中に含まれる切替箇所情報であり、1以上の文字列切替箇所情報の中に含まれる切替箇所情報を、検出条件を満たす切替箇所情報として取得し、図示しないバッファに蓄積する。
【0184】
次に、グループ化部34は、図6のフローチャートで説明した処理により、切替箇所情報を用いて、切り替え箇所が検出された当該動画ログに対するグループ化処理を行う。
【0185】
次に、IF構成手段351等は、図8のフローチャートで説明した処理により、出力する画面を構成する。次に、出力部4は、当該画面を出力する。かかる画面例は図10である。
【0186】
図10において、1001の各矩形は画像切替箇所情報に基づく各グループであり、1002の各矩形は文字列切替箇所情報に基づく各グループであり、1003は切替箇所情報に基づく各グループである。また、1004は、各グループの先頭の画面画像である。1005は、各グループの先頭の画面画像に対応付く操作ログである。
【0187】
次に、検査者Iが、図10の1006を指示した、とする。なお、1006は、切替箇所情報が示す切替箇所である。すると、検査装置Aの指示受付部21は、ジャンプ指示を受け付ける。次に、処理部3は、1006の切替箇所情報に対応する画面画像識別子を取得する。次に、処理部3は、当該画面画像識別子で識別される画面画像を動画ログから取得する。次に、画面画像出力部42が、当該画面画像を1007の領域に出力する。そして、図10の画面例は、図11のようになる。図11の1101は、1006の切替箇所情報に対応する画面画像である。
【0188】
以上、本実施の形態によれば、コンピュータに対する操作の切り替わり箇所を検出し、利用することにより、コンピュータに対する操作の画面画像の集合である動画ログの確認の労力を低減できる。
【0189】
また、本実施の形態によれば、動画ログの中で類似条件を満たさない連続する2つの画面画像を検出し、利用できる結果、動画ログの確認の労力を低減できる。なお、利用とは、例えば、当該連続する2つの画面画像へのジャンプである。
【0190】
また、本実施の形態によれば、画像条件と文字列条件との両方を満たす画面画像を検出する結果、操作の切り替わり箇所をより正確に検出できる。
【0191】
また、本実施の形態によれば、動画ログを2以上の画面画像グループに分けて、処理できる。例えば、動画ログを2以上の画面画像のグループに分けて、各画面画像グループを明示したインターフェイスを提供できる(図10参照)。
【0192】
さらに、本実施の形態によれば、動画ログを構成する2以上の画面画像グループをさらに纏めることができる。
【0193】
なお、本実施の形態において、検出装置Aの画面は、図12のような画面でも良い。図12において、1201は、検査対象の動画ログの中の着目している画面画像である。1202は、画像条件を満たした箇所である。1203は、文字列条件を満たした箇所である。1204は、検出条件を満たした箇所である。なお、ここでの検出条件は、画像条件と文字列条件の両方を満たすことである。そして、図12において、検査者Iは、1204等の箇所を指示することにより、グループの切り替わりの箇所の画面画像に一挙にジャンプできる。その結果、検査者Iが検査対象の動画ログの全画面画像を見る場合と比較して、操作者Xの操作の不正を検査する際の労力が削減できる。検査者Iは、例えば、各グループの先頭の画面画像だけを見ていって、不正が起こりえる画面画像のグループのみを、精査すれば良くなる。なお、図12の1205は、画面画像識別子であり、動画ログの中の画面画像(静止画)のフレームIDである。また、1206は、カレントの画面画像(1201)の、動画ログ内での位置を示す。
【0194】
また、本実施の形態の検出装置Aの精度の実験結果を図13に示す。本実験は、あるユーザの一のコンピュータに対する5日分の画面画像の集合である動画ログを用いた。図13において、8936枚の画面画像を有する動画ログにおいて、画像条件のみで切替箇所を検出した場合、文字列条件のみで切替箇所を検出した場合、画像条件と文字列条件の両方で切替箇所を検出した場合の再現率、適合率、F値を示す。本実験では、当該動画ログに対して、2回の検査(モニタ)を行った。
【0195】
本実験によれば、画像の特徴量を使用することにより、操作の切れ目の再現率が98%以上で検出できた。また、操作の切れ目を検出することで8936枚の画像から2273枚まで確認すべき対象が絞られた(約1/4削減)。また、画像とテキストの特徴量を使用することにより、操作の切れ目や似た操作の検出が可能になることが判明した。
【0196】
また、本実施の形態において、検出装置Aは、スタンドアロンの装置として説明したが、サーバでも良い。検出装置Aがサーバである場合、検出装置Aは、図示しない端末から検出指示等の各種の指示を受信し、処理結果(例えば、図10の画面)を端末に送信する。
【0197】
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD-ROMなどの記録媒体に記録して流布しても良い。なお、このことは、本明細書における他の実施の形態においても該当する。なお、本実施の形態における検出装置Aを実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、コンピュータに対する操作の切り替わり箇所を検出する条件であり、当該コンピュータに対する操作の画面のスクリーンショットの画像である画面画像に関する条件である検出条件が格納される条件管理部にアクセス可能な情報処理装置を、一のコンピュータに対する操作の画面画像の集合である動画ログを取得するログ取得部と、前記動画ログの前記画面画像の中で、前記検出条件を満たす画面画像を検出する検出部と、前記検出部が検出した前記画面画像の箇所である切替箇所を特定する切替箇所情報を蓄積する箇所蓄積部として機能させるためのプログラムである。
【0198】
また、図14は、本明細書で述べたプログラムを実行して、上述した種々の実施の形態の検出装置A等を実現するコンピュータの外観を示す。上述の実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムで実現され得る。図14は、このコンピュータシステム300の概観図であり、図15は、システム300のブロック図である。
【0199】
図14において、コンピュータシステム300は、CD-ROMドライブを含むコンピュータ301と、キーボード302と、マウス303と、モニタ304とを含む。
【0200】
図15において、コンピュータ301は、CD-ROMドライブ3012に加えて、MPU3013と、CD-ROMドライブ3012等に接続されたバス3014と、ブートアッププログラム等のプログラムを記憶するためのROM3015と、MPU3013に接続され、アプリケーションプログラムの命令を一時的に記憶するとともに一時記憶空間を提供するためのRAM3016と、アプリケーションプログラム、システムプログラム、及びデータを記憶するためのハードディスク3017とを含む。ここでは、図示しないが、コンピュータ301は、さらに、LANへの接続を提供するネットワークカードを含んでも良い。
【0201】
コンピュータシステム300に、上述した実施の形態の検出装置A等の機能を実行させるプログラムは、CD-ROM3101に記憶されて、CD-ROMドライブ3012に挿入され、さらにハードディスク3017に転送されても良い。これに代えて、プログラムは、図示しないネットワークを介してコンピュータ301に送信され、ハードディスク3017に記憶されても良い。プログラムは実行の際にRAM3016にロードされる。プログラムは、CD-ROM3101またはネットワークから直接、ロードされても良い。
【0202】
プログラムは、コンピュータ301に、上述した実施の形態の検出装置A等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティープログラム等は、必ずしも含まなくても良い。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいれば良い。コンピュータシステム300がどのように動作するかは周知であり、詳細な説明は省略する。
【0203】
なお、上記プログラムにおいて、情報を送信するステップや、情報を受信するステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。
【0204】
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
【0205】
また、上記各実施の形態において、一の装置に存在する2以上の通信手段は、物理的に一の媒体で実現されても良いことは言うまでもない。
【0206】
また、上記各実施の形態において、各処理は、単一の装置によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
【0207】
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
【産業上の利用可能性】
【0208】
以上のように、本発明にかかる検出装置Aは、コンピュータに対する操作の切り替わり箇所を検出し、利用することにより、コンピュータに対する操作の画面画像の集合である動画ログの確認の労力を低減できるという効果を有し、不正な操作を検出する装置等として有用である。
【符号の説明】
【0209】
A 検出装置
1 格納部
2 受付部
3 処理部
4 出力部
11 条件管理部
21 指示受付部
31 ログ取得部
32 検出部
33 箇所蓄積部
34 グループ化部
35 グループ処理部
41 IF出力部
42 画面画像出力部
321 画像特徴量取得手段
322 文字列特徴量取得手段
323 検出手段
351 IF構成手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15