(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-10
(45)【発行日】2024-05-20
(54)【発明の名称】システム、方法、およびプログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20240513BHJP
G06T 7/00 20170101ALI20240513BHJP
【FI】
G06N20/00
G06T7/00 350B
(21)【出願番号】P 2023174341
(22)【出願日】2023-10-06
【審査請求日】2023-10-25
【早期審査対象出願】
(73)【特許権者】
【識別番号】515029558
【氏名又は名称】セーフィー株式会社
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100141553
【氏名又は名称】鈴木 信彦
(74)【代理人】
【識別番号】100170209
【氏名又は名称】林 陽和
(72)【発明者】
【氏名】菅原 宏明
(72)【発明者】
【氏名】寺田 裕也
(72)【発明者】
【氏名】今田 大聖
(72)【発明者】
【氏名】澁谷 海
(72)【発明者】
【氏名】玉▲崎▼ あかね
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2021-175033(JP,A)
【文献】特開2020-027424(JP,A)
【文献】特開2022-191637(JP,A)
【文献】国際公開第2014/208575(WO,A1)
【文献】国際公開第2023/090119(WO,A1)
【文献】特表2022-523606(JP,A)
【文献】動画切り取りアプリのおすすめ人気ランキング33選,mybest[online],2023年08月07日, [retrieved on 2024.01.29], Retrieved from the Internet: <URL: https://my-best.com/14555>
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
カメラにより撮影された映像を情報端末で表示するシステムであって、
ユーザに対応する複数のカメラを表示し、
前記ユーザの指示に応じて、前記
表示された複数のカメラの中からカメラを選択し、
前記選択されたカメラにより撮影された第1映像を表示し、
ユーザの指示に応じて、前記第1映像の一部を切り出して学習データとして用いられる複数の第2映像を作成し、
前記作成された複数の
第2映像を表示し、
前記ユーザの指示に応じて、前記
表示された複数の
第2映像の中から
少なくとも1つ以上の第2映像を選択し、
前記選択された
第2映像に基づいて、学習モデルを作成する、
ように構成されている、システム。
【請求項2】
前記複数の
第2映像は、前記情報端末を介し
た前記ユーザの指示に応じて作成される、
請求項1に記載のシステム。
【請求項3】
前記複数の
第2映像は、
前記情報端末において前記映像を表示するため
に用いられるビューアを介し
た前記ユーザの指示に応じて作成される、
請求項
2に記載のシステム。
【請求項4】
前記複数の
第2映像は、前記ユーザに対応するものである、
請求項1に記載のシステム。
【請求項5】
前記選択された
第2映像
の合計時間が所定時間以上となった場合に、前記学習モデルを作成する、
請求項1に記載のシステム。
【請求項6】
ユーザの指示に応じて、前記選択されたカメラの映像の中から解析対象とするエリアを設定し、
前記選択された
第2映像の中で前記設定されたエリアの映像に基づいて、前記学習モデルを作成する、
請求項1に記載のシステム。
【請求項7】
前記ユーザに対応する複数の学習モデルを表示し、
前記ユーザの指示に応じて、前記複数の学習モデルの中から学習モデルを選択し、
前記選択された学習モデルに基づいて、映像解析を行う、
請求項1に記載のシステム。
【請求項8】
前記ユーザの指示に応じて、映像解析の対象とする映像を特定し、
前記特定された映像に対して、映像解析を行う、
請求項1に記載のシステム。
【請求項9】
前記学習モデルに基づく映像解析の解析結果として、前記映像の元画像と解析画像とを並べて表示する、
請求項1に記載のシステム。
【請求項10】
前記学習モデルに基づく映像解析の解析結果として、同じ時間帯に異常検知し
た画像
を表示する、
請求項1に記載のシステム。
【請求項11】
カメラにより撮影された映像を情報端末で表示するシステムで実行される方法であって、
ユーザに対応する複数のカメラを表示することと、
前記ユーザの指示に応じて、前記
表示された複数のカメラの中からカメラを選択することと、
前記選択されたカメラにより撮影された第1映像を表示することと、
ユーザの指示に応じて、前記第1映像の一部を切り出して学習データとして用いられる複数の第2映像を作成することと、
前記作成された複数の
第2映像を表示することと、
前記ユーザの指示に応じて、前記
表示された複数の
第2映像の中から
少なくとも1つ以上の第2映像を選択することと、
前記選択された
第2映像に基づいて、学習モデルを作成することと、
を含む、方法。
【請求項12】
カメラにより撮影された映像を情報端末で表示するシステムとしての少なくとも1つのコンピュータに、
ユーザに対応する複数のカメラを表示することと、
前記ユーザの指示に応じて、前記
表示された複数のカメラの中からカメラを選択することと、
前記選択されたカメラにより撮影された第1映像を表示することと、
ユーザの指示に応じて、前記第1映像の一部を切り出して学習データとして用いられる複数の第2映像を作成することと、
前記作成された複数の
第2映像を表示することと、
前記ユーザの指示に応じて、前記
作成された複数の
第2映像の中から
少なくとも1つ以上の第2映像を選択することと、
前記選択された
第2映像に基づいて、学習モデルを作成することと、
を実行させるための、プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、システム、方法、およびプログラムに関する。
【背景技術】
【0002】
近年、AI(人工知能)による様々な解析がなされるようになってきている。AIによる解析に使用する学習モデルを作成するためのステップは、大別して、学習に用いるデータの収集と、収集したデータの加工と、加工したデータに基づく学習による学習モデルの構築と、構築した学習モデルの評価および当該評価に基づく再学習による学習モデルの調整と、の4つである。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで、AIによる解析に使用する学習モデルの作成は、専門の業者によって、ユーザごとに、個々の解析対象に対して、オーダーメイド方式で行われることが一般的である。このようなオーダーメイド方式での学習モデルの作成においては、特に学習に用いるデータの収集および収集したデータの加工のステップに人手を要するため、学習モデルの作成が完了するまでにかかる時間およびコストが大きくなりやすい。その結果、ユーザは、学習モデルの作成を躊躇してしまい、社会全体としてAIの導入が進みにくい状況が発生していた。
【0005】
そこで、本開示が解決しようとする課題の一つは、ユーザ側で所望の学習モデルの作成を迅速かつ簡単にワンストップで実行することが可能なシステム、方法、およびプログラムを提供することである。
【課題を解決するための手段】
【0006】
本開示の一例としてのシステムは、カメラにより撮影された映像を情報端末で表示するシステムであって、ユーザに対応する複数のカメラを表示し、ユーザの指示に応じて、複数のカメラの中からカメラを選択し、選択されたカメラに対応する複数の映像を表示し、ユーザの指示に応じて、複数の映像の中から映像を選択し、選択された映像に基づいて、学習モデルを作成する、ように構成されている。
【0007】
また、本開示の他の一例としての方法は、カメラにより撮影された映像を情報端末で表示するシステムで実行される方法であって、ユーザに対応する複数のカメラを表示することと、ユーザの指示に応じて、複数のカメラの中からカメラを選択することと、選択されたカメラに対応する複数の映像を表示することと、ユーザの指示に応じて、複数の映像の中から映像を選択することと、選択された映像に基づいて、学習モデルを作成することと、を含む。
【0008】
また、本開示のさらに他の一例としてのプログラムは、カメラにより撮影された映像を情報端末で表示するシステムとしての少なくとも1つのコンピュータに、ユーザに対応する複数のカメラを表示することと、ユーザの指示に応じて、複数のカメラの中からカメラを選択することと、選択されたカメラに対応する複数の映像を表示することと、ユーザの指示に応じて、複数の映像の中から映像を選択することと、選択された映像に基づいて、学習モデルを作成することと、を実行させるための、プログラムである。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態にかかるシステムの機能的構成を示した例示的かつ模式的なブロック図である。
【
図2】
図2は、実施形態にかかるシステムによって実行される学習モデルの作成の流れを示した例示的かつ模式的なシーケンス図である。
【
図3】
図3は、実施形態にかかるシステムによって実行される映像解析の流れを示した例示的かつ模式的なシーケンス図である。
【
図4】
図4は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図5】
図5は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図6】
図6は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図7】
図7は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図8】
図8は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図9】
図9は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図10】
図10は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図11】
図11は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【
図12】
図12は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図を示した例示的かつ模式的な図である。
【
図13】
図13は、実施形態にかかる映像解析の流れにおいて表示されうる画面を示した例示的かつ模式的な図を示した例示的かつ模式的な図である。
【
図14】
図14は、実施形態にかかる映像解析の流れにおいて表示されうる画面を示した例示的かつ模式的な図を示した例示的かつ模式的な図である。
【
図15】
図15は、実施形態にかかる映像解析の流れにおいて表示されうる画面を示した例示的かつ模式的な図を示した例示的かつ模式的な図である。
【
図16】
図16は、実施形態にかかるカメラ、サーバ装置、およびユーザ端末に含まれる情報処理装置のハードウェア構成を示した例示的かつ模式的なブロック図である。
【発明を実施するための形態】
【0010】
以下、本開示の実施形態および変形例を図面に基づいて説明する。以下に記載する実施形態および変形例の構成、ならびに当該構成によってもたらされる作用および効果は、あくまで一例であって、以下の記載内容に制限されるものではない。
【0011】
図1は、実施形態にかかるシステム100の機能的構成を示した例示的かつ模式的なブロック図である。
【0012】
図1に示されるように、実施形態にかかるシステム100は、カメラ110と、サーバ装置120と、ユーザ端末130(情報端末)と、を含む。情報端末としては、PC、タブレット、スマートフォン等、どの様な端末でもよい。
【0013】
カメラ110は、機能モジュールとして、通信部111と、撮影部112と、検知部113と、を含む。また、サーバ装置120は、機能モジュールとして、通信部121と、映像記録部122と、演算処理部123と、を含む。また、ユーザ端末130は、機能モジュールとして、通信部131と、表示処理部132と、入力受付部133と、を含む。
【0014】
カメラ110は、ネットワーク経由でサーバ装置120と通信可能に接続される。また、サーバ装置120は、ネットワーク経由でユーザ端末130と通信可能に接続される。このような通信は、カメラ110の通信部111、サーバ装置120の通信部121、およびユーザ端末130の通信部131によって実現される。これにより、カメラによって撮影された映像(および当該映像に基づいて検出される情報)は、サーバ装置120を介してユーザ端末130に提供される。
【0015】
なお、カメラ110の撮影部112は、カメラ110の設置位置から見た所定の領域の映像を取得する。サーバ装置120の演算処理部123は、学習モデルを含み、当該学習モデルを利用して、カメラ110の撮影部112により撮影された映像を解析し、映像から所定の検知対象を検知する。たとえば、撮影部112が工場の製造ラインを撮影している場合、演算処理部123は、製造ラインを流れる互いに同一であるはずの複数の物品から、他の物品とは異なる異常な物品(たとえば不良品)を検知しうる。なお、この様な学習モデルを用いた映像解析は、サーバ装置側で行う代わりにカメラ側で行ってもよい。その場合、カメラ110の検知部113が学習モデルを含み、検知部113にて前述した映像解析や検知を行うようにすればよい。
【0016】
ここで、一般に、上記のような学習モデルを作成するためのステップは、大別して、学習に用いるデータの収集と、収集したデータの加工と、加工したデータに基づく学習による学習モデルの構築と、構築した学習モデルの評価および当該評価に基づく再学習による学習モデルの調整と、の4つに分けられる。
【0017】
上記のような学習モデルの作成は、専門の業者によって、ユーザごとに、個々の解析対象に対して、オーダーメイド方式で行われることが一般的である。このようなオーダーメイド方式での学習モデルの作成においては、特に学習に用いるデータの収集および収集したデータの加工のステップに人手を要するため、学習モデルの作成が完了するまでにかかる時間およびコストが大きくなりやすい。その結果、ユーザは、学習モデルの作成を躊躇してしまい、社会全体としてAIの導入が進みにくい状況が発生していた。
【0018】
そこで、実施形態は、サーバ装置
図1に示される各機能モジュールが次の
図2に示されるような流れで動作することで、ユーザ側で所望の学習モデルの作成を迅速かつ簡単にワンストップで実行することを可能にする。
【0019】
図2は、実施形態にかかるシステムによって実行される学習モデルの作成の流れを示した例示的かつ模式的なシーケンス図である。
【0020】
図2に示されるように、実施形態では、学習モデルの作成を開始するにあたり、まず、ユーザ端末130の通信部131は、S201において、サーバ装置120に対してログイン要求を行う。そして、サーバ装置120の通信部121は、S202において、ユーザ端末130からのログイン要求に応じて認証処理を実行する。認証が完了すると、サーバ装置120の通信部121は、S203において、認証されたユーザに紐づけられた各種の情報(たとえば当該ユーザに紐づけられたカメラ110の情報やユーザが既に作成した学習モデルの情報など)を必要に応じてユーザ端末130に提供する。
【0021】
上記の認証が完了すると、ユーザ端末130の表示処理部132は、S204において、次の
図4に示されるような学習モデル作成用アプリのトップ画面(マイページ画面)を表示する。
【0022】
図4は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【0023】
図4に示される画面400は、上記のマイページ画面の一例である。この画面400には、ログインしたユーザに関する情報(名前、メールアドレス、パスワードなど)を確認するためのインターフェースを含む領域410が設けられている。また、画面400には、カメラ110により撮影された映像の確認・編集を行うための画面(後述する
図9など参照)に表示内容を切り替えるためのボタン420も設けられている。その他、画面400には、「解析結果一覧」ボタン401、「学習モデル一覧」ボタン402、および「マイページ」ボタン403などといった、画面400の表示内容を切り替えるための各種のボタンが設けられている。「解析結果一覧」ボタン401が押下されると、後述する
図13に示されるような画面に表示内容が切り替わり、「学習モデル一覧」ボタン402が押下されると、画面400は、後述する
図5に示される画面500移行する。なお、「マイページ」ボタン403は、他の画面からマイページ画面に戻るためのボタンである。
【0024】
図2に戻り、マイページ画面において所定の操作(たとえば「学習モデル一覧」ボタン402の押下)が行われると、ユーザ端末130の表示処理部132は、以下の
図5~
図12に示されるような、学習モデルの作成のための各種の画面(学習モデル作成画面)を表示する。
【0025】
図5~
図12は、実施形態にかかる学習モデルの作成の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【0026】
図5に示される画面500は、
図4に示される画面400において「学習モデル一覧」ボタン402が押下された場合に最初に表示される画面である。この画面500には、ユーザの指示に応じて既に作成された、または作成途中の学習モデルの情報が表示される領域510が設けられている。また、画面500には、
図4に示される画面400と同様の「解析結果一覧」ボタン501、「学習モデル一覧」ボタン502、および「マイページ」ボタン503が設けられている。さらに、画面500には、新規の学習モデルの作成を開始するための「新規作成」ボタン520も設けられている。この「新規作成」ボタン520が押下されると、画面500は、次の
図6に示される画面600に移行する。
【0027】
図6に示される画面600には、
図4および
図5に示される例と同様の「解析結果一覧」ボタン601、「学習モデル一覧」ボタン602、および「マイページ」ボタン603が設けられている。また、画面600には、新規に作成する学習モデルに関する各種の情報が表示される領域610が設けられている。
【0028】
領域610には、学習モデルの新規作成にかかる作業の現在の進捗が表示される領域611と、新規に作成する学習モデルに学習させる映像を取得するカメラ110を選択するためのインターフェースが表示される領域612と、当該領域612において現在選択されているカメラ110が現在撮影している映像が表示される領域613と、作業を次に進めるための「次へ」ボタン614と、が設けられている。ユーザが領域612のプルダウンボタンをクリックすると、そのユーザのアカウントに対応するカメラの一覧が表示され、その中からユーザがカメラを指定すると、それが学習モデル作成の対象カメラとして選択される。領域613には、選択されたカメラで撮影された映像のサムネイル画像が確認用に表示される。「次へ」ボタン614が押下されると、画面600は、次の
図7に示される画面700に移行する。
【0029】
図7に示される画面700には、
図4~
図6に示される例と同様の「解析結果一覧」ボタン701、「学習モデル一覧」ボタン702、および「マイページ」ボタン703が設けられている。この画面700は、作業に関連する各種の情報が表示される領域710を含む。
【0030】
領域710には、学習モデルの新規作成にかかる作業の現在の進捗が表示される領域711が設けられている。また、領域710には、上記の画面600(
図6参照)を介して選択したカメラ110の映像のうち、注目して学習させるエリアを設定するためのインターフェースが表示される領域712が設けられている。ユーザは、この領域712内で枠720の大きさおよび位置をクリック&ドラッグ等の操作により適宜調整することで、注目して学習させるエリアを設定することができる。なお、領域710には、作業を次に進めるための「次へ」ボタン713も設けられている。この「次へ」ボタン713が押下されると、画面700は、次の
図8に示される画面800に移行する。
【0031】
図8に示される画面800には、
図4~
図7に示される例と同様の「解析結果一覧」ボタン801、「学習モデル一覧」ボタン802、および「マイページ」ボタン803が設けられている。この画面800は、作業に関連する情報が表示される領域810を含む。
【0032】
領域810には、学習モデルの新規作成にかかる作業の現在の進捗が表示される領域811が設けられている。また、領域810には、新規に作成する学習モデルに学習させる映像を選択するためのインターフェースが表示される領域812が設けられている。また、領域710には、作業を次に進めるための「次へ」ボタン813も設けられている。この「次へ」ボタン813が押下されると、
図4~
図8に示される各画面を介して設定された内容の確認をユーザに促すための確認画面(不図示)が表示される。そして、当該確認画面上のたとえば「OK」ボタンが押下されると、学習モデルの作成が開始される。学習モデルの作成が完了したら、サーバ装置120は完成した学習モデルをログイン中のユーザおよび当該ユーザにより選択されたカメラと対応付けて映像記憶部122に記憶させる。
【0033】
ここで、上記の領域812についてより詳細に説明する。領域812には、学習モデルに学習させる映像の取得元として上記の画面600(
図6参照)を介して選択されたカメラ110から取得される映像に基づいてユーザの編集により作成された複数の映像が表示されうる。この領域812内に設けられた「ムービークリップ作成」ボタン821が押下されると、画面800は、次の
図9に示される画面900に移行する。すなわち、学習モデル作成用アプリからいったん抜け、ビューア(カメラにより撮影された映像をユーザが閲覧するためのアプリ)が起動する。
【0034】
図9は、ビューアのトップ画面を示している。
図9に示される画面900には、ユーザに紐づけられた複数のカメラ110の情報が、当該カメラ110から取得される映像のサムネイルとともに表示される領域910が設けられている。当該領域910においていずれか1つのカメラ110を選択する操作がユーザにより行われると、画面900は、次の
図10に示される画面1000に移行する。なお、
図9(ビューアのトップ画面)の表示を省略し、その代わりに
図6の612を介してユーザが指定した対象カメラが選択されたものとして、
図10に移行してもよい。
【0035】
図10に示される画面1000には、上記の画面900(
図9参照)を介して選択されたカメラ110から取得される映像が表示・再生される領域1010と、当該領域1010に表示・再生される映像の時系列を示すタイムラインが表示される領域1020と、が設けられている。領域1020に表示されたタイムライン上で任意の時刻を指定する操作がユーザにより行われると、当該時刻における映像が領域1010に表示される。そして、タイムラインとともに領域1020内に表示された「ムービークリップ」ボタン1021が押下されると、画面1000は、次の
図11に示される画面1100に移行する。
【0036】
図11に示される画面1100は、上記の画面1000(
図10参照)に表示された映像を、学習モデルに学習させる用に編集(クリッピング)するための各種の操作を受け付けるインターフェースが表示される領域1110を含む。ユーザは、当該領域1110を介して各種の操作を行うことで、上記の画面1000に表示された映像のどの時刻(開始時刻)からどの時刻(終了時刻)まで切り出すかを指定し、学習モデルに学習させる用の短い映像を作成することができる。領域1110には、ユーザが指定した開始時刻における映像のサムネイルが表示される領域1111と、ユーザが指定した終了時刻における映像のサムネイルが表示される領域1112と、が設けられている。また、領域1110には、開始時刻および終了時刻を指定する操作を受け付けるタイムライン1113と、画面1100を用いた作業を完了するための「確認する」ボタン1114と、が設けられている。開始時刻および終了時刻が指定された状態で「確認する」ボタン1114が押下されると、映像の編集に関して指定された情報の確認をユーザに促すための確認画面(不図示)が表示される。そして、当該確認画面上のたとえば「作成する」ボタンが押下されると、ムービークリップの作成が開始される。ムービークリップの作成が完了したら、サーバ装置120は完成したムービークリップをログイン中のユーザおよび当該ユーザにより選択されたカメラと対応付けて映像記憶部122に記憶させる。
【0037】
なお、作成された学習モデルに関する情報は、次の
図12に示される画面1200によって確認可能である。
図12は、
図5で表示された学習モデル一覧の中から、ユーザにより何れかの学習モデルが選択された場合等に表示される。
【0038】
図12に示される画面1200には、
図4~
図8に示される例と同様の「解析結果一覧」ボタン1201、「学習モデル一覧」ボタン1202、および「マイページ」ボタン1203が設けられている。この画面1200には、ユーザが指定した学習モデルの名前などの文字情報が表示される領域1210と、
図7を介して特に注目して学習させるエリアとしてユーザが指定したエリアが映像とともに表示される領域1220と、
図8を介して学習モデルに学習させる用にユーザが選択した映像した映像が表示される領域1230と、が設けられている。
【0039】
図2に戻り、上述した
図4~
図11に示される各種の学習モデル作成画面を介して入力されたユーザの設定がユーザ端末130の入力受付部133により受け付けられると、ユーザ端末130の通信部131は、S206において、当該ユーザの設定に基づいて学習モデルの作成を開始するようサーバ装置120に指示を送信する。
【0040】
そして、サーバ装置120の演算処理部123は、S207において、通信部121を介してユーザ端末110から受信された指示と、映像記録部122に記録されたカメラ110の映像と、に基づいて、ユーザの指示に沿った学習モデルの作成を開始する。学習モデルの作成が完了したら、サーバ装置120は完成した学習モデルをログイン中のユーザおよび当該ユーザにより選択されたカメラと対応付けて映像記憶部122に記憶させる。なお、本実施例では学習モデルを用いた映像解析や各種検知をサーバ側で実行する前提で説明するが、これをカメラ側で実行する場合には、完成した学習モデルをカメラ110の検知部113に記憶させることにより、予めカメラに学習モデルをデプロイすればよい。
【0041】
なお、サーバ装置120の通信部121は、S208において、学習モデルの作成状態を必要に応じてユーザ端末110に送信する。そして、ユーザ端末110は、S209において、サーバ装置120から受信された学習モデルの作成状態を、上記の
図5に示される画面500のような、作成済または作成途中の学習モデルの一覧を表示する画面に表示する。
【0042】
次に、
図3を参照して、上記のように作成された学習モデルを用いて映像を解析する際に実行される処理の流れについて説明する。
【0043】
図3は、実施形態にかかるシステムによって実行される映像解析の流れを示した例示的かつ模式的なシーケンス図である。
【0044】
図3に示されるように、実施形態では、上記のように作成された学習モデルを用いた映像解析を実行するにあたり、まず、ユーザ端末130の表示処理部122は、S301において、映像解析の条件などを含む各種の設定を行うための設定画面(後述する
図13~
図15参照)を表示する。
【0045】
そして、S302において、ユーザ端末130の通信部131は、ユーザにより設定された内容に基づいて、サーバ装置120に指示を送信する。
【0046】
そして、S304において、サーバ装置120の演算処理部123は、ユーザ端末130からの指示に応じて、カメラ110の撮影部112により取得された映像に対して、上記のように作成された学習モデルを用いた解析(検知)処理を実行する。
【0047】
そして、S306において、サーバ装置120の通信部121は、解析結果をユーザ端末130に送信する。
【0048】
そして、ユーザ端末130の表示処理部132は、サーバ装置120から受信した解析結果を、たとえば次の
図13に示される画面1300のような形で表示する。
【0049】
なお、本実施例では学習モデルを用いた映像解析や各種検知をサーバ側で実行する前提で説明したが、これをカメラ側で実行する場合には、次の様にすればよい。すなわち、S304の主体をサーバ装置120からカメラ110に変更し、S302とS304の間にS303(不図示)を追加し、S304とS306の間にS305(不図示)を追加する。S303において、サーバ装置120の通信部121は、ユーザ端末130からの指示をカメラ110に送信する。S305において、カメラ110の通信部111は、上記の解析処理の結果をサーバ装置120に送信する。
【0050】
図13は、実施形態にかかる映像解析の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
図13は、
図4~
図5で「解析結果一覧」ボタンを押下すると表示される。
【0051】
図13に示される画面1300は、上記のように作成された学習モデルを用いた映像解析の結果をユーザに通知するための画面である。この画面1300には、
図4~
図8および
図12に示される例と同様の「解析結果一覧」ボタン1301、「学習モデル一覧」ボタン1302、および「マイページ」ボタン1303が設けられている。
【0052】
画面1300には、新たな映像解析を実行するための各種の設定を開始する際に押下する「映像の新規解析」ボタン1305と、映像解析の結果(および途中経過)が一覧表示される領域1310と、が設けられている。領域1310に一覧表示された複数の項目のうち、映像解析が完了済の項目には、「詳細」ボタン1311が対応して表示される。「映像の新規解析」ボタン1305が押下されると、画面1300は、次の
図14に示される画面1400に移行し、「詳細」ボタン1311が押下されると、その次の
図15に示される画面1500に移行する。
【0053】
図14および
図15は、実施形態にかかる映像解析の流れにおいて表示されうる画面を示した例示的かつ模式的な図である。
【0054】
図14は、
図13で「映像の新規解析」ボタン1305が押下されると表示される。
図14に示される画面1400には、
図4~
図8、
図12、および
図13に示される例と同様の「解析結果一覧」ボタン1401、「学習モデル一覧」ボタン1402、および「マイページ」ボタン1403が設けられている。また、画面1400には、新たに実行する映像解析に対して各種の条件設定を行うための各種のインターフェースが表示される領域1410が設けられている。
【0055】
より具体的に、領域1410には、新たに実行する映像解析の便宜上の名前の入力を受け付けるインターフェースが表示される領域1411と、新たな映像解析を実行させるカメラ映像の選択を受け付けるインターフェースが表示される領域1412と、新たな映像解析のために使用する学習モデルの選択を受け付けるインターフェースが表示される領域1413と、が設けられている。領域1412をクリックすると、カメラ映像の選択画面(不図示)が表示される。その画面には、ユーザに対応するムービークリップの一覧が表示され、その中からユーザの指示に応じて映像解析に使用する映像が選択される。このとき、まずユーザに対応するカメラの一覧が表示され、その中から選択されたカメラに対応するムービークリップを表示するようにしてもよい。領域1413をクリックすると、学習モデルの選択画面(不図示)が表示される。その画面には、ユーザに対応する学習モデルの一覧が表示され、その中からユーザの指示に応じて映像解析に使用する学習モデルが選択される。このとき、まずユーザに対応するカメラの一覧が表示され、その中から選択されたカメラに対応する学習モデルを表示するようにしてもよい。なお、カメラ映像または学習モデルの何れか一方を先に選択した場合には、他方を選択する際に選択済のカメラ映像または学習モデルに対応するカメラに絞ってその候補を表示してもよい。領域1412で「ビューアと連携」ボタンが押下されると、前述した
図9の画面が表示され、ムービークリップを新規作成することが可能である。領域1413で「学習モデルの新規作成」ボタンが押下されると、前述した
図6が表示され、学習モデルを新規作成することが可能である。また、領域1410には、領域1413を介して選択した学習モデルを作成する際に設定された解析エリアが表示される領域1414と、領域1412を介して選択したカメラ映像のうちどの時刻からどの時刻までを映像解析の対象とするかの指定を受け付けるインターフェースが表示される領域1415と、その他ユーザが任意に入力可能なメモ欄が表示される領域1416と、が設けられている。領域1415の開始時刻と終了時刻には、デフォルト値として領域1412を介して選択したカメラ映像の最初の時刻と最後の時刻がそれぞれセットされ、そこからユーザが適宜変更可能である。開始時刻と終了時刻それぞれの上側には、その時刻に対応する映像がサムネイルで表示される。さらに、領域1410には、「次へ」ボタン1417が設けられている。当該「次へ」ボタン1417が押下されると、画面1400を介して設定された内容の確認をユーザに促すための確認画面(不図示)が表示される。そして、当該確認画面上のたとえば「OK」ボタンが押下されると、ユーザ端末130からサーバ装置120に映像解析の指示が送信される。
【0056】
図15は、
図13で解析結果の「詳細」ボタン1311が押下されると表示される。
図15に示される画面1500には、
図4~
図8、および
図12~
図14に示される例と同様の「解析結果一覧」ボタン1501、「学習モデル一覧」ボタン1502、および「マイページ」ボタン1503が設けられている。この画面1500には、映像解析の結果が詳細に表示される領域1510が設けられている。
【0057】
より具体的に、領域1510には、結果を表示する対象の映像解析の概要を示す情報(上記の
図14に示される画面1400を介して設定されたような情報)が表示される領域1511と、当該領域1511に表示された情報に対応する映像解析の結果の詳細が表示される領域1512と、が設けられている。領域1512には、映像解析において検知された異常な物品が映っているタイミングの映像(のサムネイル)が表示される領域1521および1531と、当該領域1521および1531に表示された映像のヒートマップが表示される領域1522および1532と、が設けられている。つまり、領域1512には、異常な物品が映っていると検知されたタイミングの映像を、そのヒートマップとともに複数表示される。
【0058】
なお、たとえば、同じ物品が製造ラインを流れる中で複数の位置で撮影されたに過ぎない映像は、個別に取り扱うよりはまとめて取り扱った方が便宜である。このため、上記の領域1512に表示される各映像は、同じ時間であると見なせる範囲内でグルーピングされる。
図15に示される例では、ユーザは、領域1512に設けられた選択可能領域1520を選択することで、対応する映像1521と同じグループに属する複数の映像を確認することができ、領域1512に設けられた選択可能領域1530を選択することで、対応する映像1531と同じグループに属する複数の映像を確認することができるようになっている。その他、ユーザは、領域1512上で、「映像を確認する」ボダンを押下することで、領域1512に表示された映像1521や1531の再生を行うことができ、「画像の保存」ボダンを押下することで、領域1512に表示された映像1521や1531に対応する画像の保存を行うこともできる。このとき、元画像とそれに対応する解析画像とが一緒に保存されるようにしてもよい。
【0059】
最後に、上述した実施形態にかかるシステム100を構成するカメラ110、サーバ装置120、およびユーザ端末130に含まれるハードウェア構成について説明する。実施形態において、カメラ110、サーバ装置120、およびユーザ端末130は、たとえば次の
図16に示されるようなハードウェア構成を有する情報処理装置1600を含むように構成される。
【0060】
図16は、実施形態にかかるカメラ110、サーバ装置120、およびユーザ端末130に含まれる情報処理装置1600のハードウェア構成を示した例示的かつ模式的なブロック図である。
【0061】
なお、
図16は、カメラ110、サーバ装置120、およびユーザ端末130において実質的に共通するハードウェア構成のみを示したものである。このため、カメラ110、サーバ装置120、およびユーザ端末130の実際のハードウェア構成は、
図16に示されている以外の部分で様々に異なる点について留意されたい。
【0062】
図16に示されるように、情報処理装置1600は、プロセッサ1610と、メモリ1620と、ストレージ1630と、入出力インターフェース(I/F)1640と、通信インターフェース(I/F)1650と、を備えている。これらのハードウェアは、バス2160に接続されている。
【0063】
プロセッサ1610は、たとえばCPU(Central Processing Unit)として構成され、情報処理装置1600の各部の動作を統括的に制御する。
【0064】
メモリ1620は、たとえばROM(Read Only Memory)およびRAM(Random Access Memory)を含み、プロセッサ1610により実行されるプログラムなどの各種のデータの揮発的または不揮発的な記憶、およびプロセッサ1610がプログラムを実行するための作業領域の提供などを実現する。
【0065】
ストレージ1630は、たとえばHDD(Hard Disk Drive)またはSSD(Solid State Drive)を含み、各種のデータを不揮発的に記憶する。
【0066】
入出力インターフェース1640は、たとえばキーボードおよびマウスなどのような入力装置(不図示)から情報処理装置1600へのデータの入力と、たとえば情報処理装置1600からディスプレイおよびスピーカなどのような出力装置(不図示)へのデータの出力と、を制御する。
【0067】
通信インターフェース1650は、情報処理装置1600が他の装置と通信を実行することを可能にする。
【0068】
実施形態にかかるカメラ110、サーバ装置120、およびユーザ端末130が有する各機能モジュール(
図1参照)は、それぞれの情報処理装置1600のプロセッサ2110がメモリ2120またはストレージ2130に予め記憶された情報処理プログラムを実行した結果として、ハードウェアとソフトウェアとの協働による機能モジュール群として実現される。ただし、実施形態では、
図1に示される機能モジュール群のうち一部または全部が、専用に設計された回路のようなハードウェアのみによって実現されてもよい。
【0069】
なお、上述した情報処理プログラムは、必ずしもメモリ1620またはストレージ1630に予め記憶されている必要はない。たとえば、上述した情報処理プログラムは、フレキシブルディスク(FD)のような各種の磁気ディスク、またはDVD(Digital Versatile Disk)のような各種の光ディスクなどといった、コンピュータで読み取り可能な媒体にインストール可能な形式または実行可能な形式で記録されたコンピュータプログラムプロダクトとして提供されてもよい。
【0070】
また、上述した情報処理プログラムは、インターネットなどのネットワーク経由で提供または配布されてもよい。すなわち、上述した情報処理プログラムは、インターネットなどのネットワークに接続されたコンピュータ上に格納された状態で、ネットワーク経由でのダウンロードを受け付ける、といった形で提供されてもよい。
【0071】
以上、本開示のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これらの新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態およびその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0072】
100 システム
110 カメラ
111 通信部
112 撮影部
113 検知部
120 サーバ装置
121 通信部
122 映像記録部
123 演算処理部
130 ユーザ端末
131 通信部
132 表示処理部
133 入力受付部
【要約】
【課題】ユーザ側で所望の学習モデルの作成を迅速かつ簡単に実行する。
【解決手段】本開示の一例としてのシステムは、カメラにより撮影された映像を情報端末で表示するシステムであって、ユーザに対応する複数のカメラを表示し、ユーザの指示に応じて、複数のカメラの中からカメラを選択し、選択されたカメラに対応する複数の映像を表示し、ユーザの指示に応じて、複数の映像の中から映像を選択し、選択された映像に基づいて、学習モデルを作成する、ように構成されている。
【選択図】
図1