(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023145957
(43)【公開日】2023-10-12
(54)【発明の名称】情報処理装置、情報処理プログラムおよび情報処理方法
(51)【国際特許分類】
H04N 7/14 20060101AFI20231004BHJP
G06Q 50/10 20120101ALI20231004BHJP
H04N 21/258 20110101ALI20231004BHJP
G06F 3/01 20060101ALI20231004BHJP
【FI】
H04N7/14 110
G06Q50/10
H04N21/258
G06F3/01 510
【審査請求】未請求
【請求項の数】5
【出願形態】OL
(21)【出願番号】P 2022052886
(22)【出願日】2022-03-29
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和2年度、国立研究開発法人科学技術振興機構、ムーンショット型研究開発事業「CA基盤構築及び階層的CA連携と操作者割り当ての研究開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願/令和2年度、国立研究開発法人科学技術振興機構、ムーンショット型研究開発事業「利用者モニタリングと経験管理の研究開発」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】393031586
【氏名又は名称】株式会社国際電気通信基礎技術研究所
(74)【代理人】
【識別番号】100090181
【弁理士】
【氏名又は名称】山田 義人
(72)【発明者】
【氏名】内海 章
(72)【発明者】
【氏名】宮下 敬宏
(72)【発明者】
【氏名】西村 祥吾
(72)【発明者】
【氏名】太田 陽
【テーマコード(参考)】
5C164
5E555
5L049
【Fターム(参考)】
5C164FA09
5C164SC11P
5C164VA35P
5C164YA07
5E555AA27
5E555AA52
5E555AA71
5E555BA02
5E555BA76
5E555BA87
5E555BB02
5E555BD01
5E555BD07
5E555CA42
5E555CB64
5E555DB32
5E555DB57
5E555EA22
5E555EA23
5E555FA00
5L049CC11
(57)【要約】
【課題】 プライバシに配慮した遠隔対話を実現できる情報処理装置を提供する。
【解決手段】 アバタ遠隔対話システム(10)では、ネットワーク(12)によって、移動するロボット(14)、操作者端末(16)およびサーバ(18)が連係する。ロボットは、ディスプレイ(30)、カメラ(40、42)、マイク(48)およびスピーカ(50)を含み、ディスプレイにアバタ(28)を表示した操作者とロボットに対面するユーザとが対話する。カメラが撮影した映像およびマイクが拾った音声のデータがサーバへ送られる。サーバでは、ユーザのような特定の人物以外の映像および音声を匿名化処理して、操作者端末へ送信する。したがって、操作者端末のディスプレイ(78)およびスピーカ(74)では、特定の人物以外の人物の映像および音声がぼかされたりミュートされたりするので、アバタとの対話への参加を意図しないそのような人たちのプライバシが保護され得る。
【選択図】
図6
【特許請求の範囲】
【請求項1】
操作者端末およびロボットがネットワークを介して連係して、前記操作者端末の操作者が、前記ロボットを通してユーザと対話する遠隔対話システムにおける情報処理装置であって、
前記ロボットのカメラからの映像データを受ける受信手段、
前記受信手段で受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する判断手段、
前記判断手段で匿名化すべき人物の映像が含まれていると判断したとき、当該人物の映像データに匿名化処理を適用する匿名化手段、および
前記匿名化手段によって匿名化処理を適用した映像データを含む送信データを前記操作者端末へ送信する送信手段を備える、情報処理装置。
【請求項2】
前記ロボットはさらにマイクを備え、
前記受信手段は前記マイクからの音声データを受信し、前記匿名化手段は前記音声データに基づいて、匿名化すべき人物の音声が含まれているかどうか判断し、前記匿名化手段は、前記判断手段で匿名化すべき人物の音声が含まれていると判断したとき、当該人物の音声データに匿名化処理を適用し、前記送信手段は、前記匿名化手段によって匿名化処理を適用した音声データを含む送信データを前記操作者端末へ送信する、請求項1記載の情報処理装置。
【請求項3】
前記判断手段は、匿名化を解除してよい人物を特定する人物特定手段を含み、前記人物特定手段で特定された人物以外の人物を前記匿名化すべき人物とする、請求項1または2記載の情報処理装置。
【請求項4】
操作者端末およびロボットがネットワークを介して連係して、前記操作者端末の操作者が、前記ロボットを通してユーザと対話する遠隔対話システムにおける情報処理装置の情報処理プログラムであって、前記情報処理装置のCPUを、
前記ロボットのカメラからの映像データを受ける受信手段、
前記受信手段で受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する判断手段、
前記判断手段で匿名化すべき人物の映像が含まれていると判断したとき、当該人物の映像データに匿名化処理を適用する匿名化手段、および
前記匿名化手段によって匿名化処理を適用した映像データを含む送信データを前記操作者端末へ送信する送信手段として機能させる、情報処理プログラム。
【請求項5】
操作者端末およびロボットがネットワークを介して連係して、前記操作者端末の操作者が、前記ロボットを通してユーザと対話する遠隔対話システムにおける情報処理方法であって、
前記ロボットのカメラからの映像データを受ける受信ステップ、
前記受信ステップで受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する判断ステップ、
前記判断ステップで匿名化すべき人物の映像が含まれていると判断したとき、当該人物の映像データに匿名化処理を適用する匿名化ステップ、および
前記匿名化ステップで匿名化処理を適用した映像データを含む送信データを前記操作者端末へ送信する送信ステップを含む、情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は情報処理装置、情報処理プログラムおよび情報処理方法に関し、特にたとえば、アバタによってユーザにサービスを提供したり、サービスの提供を受けたりする、情報処理装置、情報処理プログラムおよび情報処理方法に関する。
【背景技術】
【0002】
特許文献1には、ディスプレイに操作者の顔画像を表示して移動するロボットが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術では、移動ロボットのカメラに写り込んだ人が望まないのに第三者に見られてしまうことがあるので、プライバシへの配慮が望まれるところである。
【0005】
それゆえに、この発明の主たる目的は、新規な、情報処理装置、情報処理プログラムおよび情報処理方法を提供することである。
【0006】
この発明の他の目的は、プライバシに配慮したアバタとの対話を実現できる、情報処理装置、情報処理プログラムおよび情報処理方法を提供することである。
【課題を解決するための手段】
【0007】
この発明は、上記の目的のために、以下の構成を採用した。なお、括弧内の参照符号および補足説明等は、この発明の理解を助けるために記述する実施形態との対応関係を示したものであって、この発明を何ら限定するものではない。
【0008】
第1の実施例は、操作者端末およびロボットがネットワークを介して連係して、操作者端末の操作者が、ロボットを通してユーザと対話する遠隔対話システムにおける情報処理装置であって、ロボットのカメラからの映像データを受ける受信手段、受信手段で受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する判断手段、判断手段で匿名化すべき人物の映像が含まれていると判断したとき、当該人物の映像データに匿名化処理を適用する匿名化手段、および匿名化手段によって匿名化処理を適用した映像データを含む送信データを操作者端末へ送信する送信手段を備える、情報処理装置である。
【0009】
第1の実施例では、情報処理装置(18:実施例において対応する部分を例示する参照符号。ただし、限定を意味しない。以下同じ。)は、たとえばネットワーク(12)を介して、ロボット(14)および操作者端末(16)と連係し、操作者端末(16)の操作者が、ロボット(14)を通して、ユーザと遠隔対話を実行する遠隔対話システムを構成する。一例として、ロボット(14)に設けたディスプレイ(30)に自身のアバタ(28)を表示して、ディスプレイ(30)に対面するユーザと対話する遠隔対話システムを構成する。情報処理装置(18)は、ロボット(14)のカメラ(40、42)からの映像データを受ける受信手段(82、104a、S3)を備える。判断手段(82、104b、104c、S11)は、受信手段で受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する。判断手段で匿名化すべき人物の映像が含まれていると判断したとき、匿名化手段(82、104d、S13)が、当該人物の映像データに匿名化処理を適用する。送信手段(82、104e、S17)匿名は、匿名化手段によって匿名化処理を適用した映像データを含む送信データを操作者端末へ送信する。
【0010】
第1の実施例によれば、匿名化すべき人物の映像を匿名化するので、操作者のアバタとユーザの対話に参加する意図のない人物のプライバシを保護することができる。
【0011】
第2の実施例は、第1の実施例に従属する情報処理装置であって、ロボットはさらにマイクを備え、受信手段はマイクからの音声データを受信し、判断手段は音声データに基づいて、匿名化すべき人物の音声が含まれているかどうか判断し、匿名化手段は、判断手段で匿名化すべき人物の音声が含まれていると判断したとき、当該人物の音声データに匿名化処理を適用し、送信手段は、匿名化手段によって匿名化処理を適用した音声データを含む送信データを操作者端末へ送信する。
【0012】
第2の実施例では、匿名化すべき人物の音声データも匿名化処理されるので、匿名化すべき人物のプライバシの保護が一層強化される。
【0013】
第3の実施例は、第1または第2の実施例に従属する情報処理装置であって、判断手段は、匿名化を解除してよい人物を特定する人物特定手段を含み、人物特定手段で特定された人物以外の人物を匿名化すべき人物とする。
【0014】
第3の実施例では、匿名化しなくてよい人物以外の人物の映像および/または音声が確実に匿名化される。
【0015】
第4の実施例は、操作者端末およびロボットがネットワークを介して連係して、操作者端末の操作者が、ロボットを通してユーザと対話する遠隔対話システムにおける情報処理装置の情報処理プログラムであって、情報処理装置のCPUを、ロボットのカメラからの映像データを受ける受信手段、受信手段で受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する判断手段、判断手段で匿名化すべき人物の映像が含まれていると判断したとき、当該人物の映像データに匿名化処理を適用する匿名化手段、および匿名化手段によって匿名化処理を適用した映像データを含む送信データを操作者端末へ送信する送信手段として機能させる、情報処理プログラムである。
【0016】
第5の実施例は、操作者端末およびロボットがネットワークを介して連係して、操作者端末の操作者が、ロボットを通してユーザと対話する遠隔対話システムにおける情報処理方法であって、ロボットのカメラからの映像データを受ける受信ステップ、受信ステップで受信した映像データに基づいて、匿名化すべき人物の映像が含まれているかどうか判断する判断ステップ、判断ステップで匿名化すべき人物の映像が含まれていると判断したとき、当該人物の映像データに匿名化処理を適用する匿名化ステップ、および匿名化ステップで匿名化処理を適用した映像データを含む送信データを操作者端末へ送信する送信ステップを含む、情報処理プログラムである。
【0017】
第4および第5の実施例によっても、第1の実施例と同様の効果がきたいできる。
【発明の効果】
【0018】
この発明によれば、アバタとの対話への参加を意図しない人物の映像および/または音声を匿名化するので、当該人物のプライバシを保護できる。
【0019】
この発明の上述の目的、その他の目的,特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。
【図面の簡単な説明】
【0020】
【
図1】
図1はこの発明の一実施例を示すアバタ遠隔対話システムの概要を示す図解図である。
【
図2】
図2は
図1に示すロボットの電気的な構成を示すブロック図である。である。
【
図3】
図3は
図1に示す操作者端末の電気的な構成を示すブロック図である。
【
図4】
図4は
図1に示すサーバの電気的な構成を示すブロック図である。
【
図5】
図5は
図4に示すサーバのメモリのメモリマップの一例を示す図解図である。
【
図6】
図6は
図4に示すサーバの情報処理動作の一例を示すフロー図である。
【発明を実施するための形態】
【0021】
図1を参照して、この実施例のアバタ遠隔対話システム10は、遠隔操作者がアバタ(遠隔操作型CGエージェント)を利用してサービスを提供するための基盤システム(プラットフォーム)である、アバタ遠隔操作基盤システム(CA:Cybernetic Avatar)を利用する。
【0022】
しかしながら、この発明は、必ずしもそのアバタ遠隔操作基盤システム上のものである必要はなく、一般的には、ネットワーク12を介してロボット14に操作者端末16の操作者のアバタを表示し、あるいはロボット14自体を操作者のアバタとして、サーバ18の関与を得て、そのアバタとユーザとが遠隔対話を実現することができる、システムである。
図1の実施例では、サーバ18が上述の基盤システムの機能を果たすように設定されている。
【0023】
この実施例に用いられるロボット14は、たとえばDouble Robotics, Inc.(ダブルロボティクス社)製の商品名「Double 3」のような、自律移動可能な、いわゆるテレプレゼンス(または、テレイグジステンス)ロボットである。ただし、ロボット14はこのような特定のロボットに限られることなく、特許文献1で開示しているようなロボットも利用可能であることを予め指摘しておく。
【0024】
実施例においては、このロボット14は、ネットワーク12に接続(無線または有線)された操作者端末16と通信可能である。操作者端末16は、ロボット14を遠隔操作する操作者が使用する汎用のコンピュータである。操作者は、操作者端末16を用いてロボット14にタスクを実行させるためのコマンドを送信する。また、操作者は、操作者端末16を用いて音声をロボット14に送信し、ロボット14から音声を出力することにより、ロボット14の近傍に存在する人または人物と対話することができる。
【0025】
このロボット14は、ベース20を含み、このベース20の正面には移動用センサの1つである超音波センサ22が設けられる。また、このベース20の両端には左右の移動用車輪24Lおよび24Rが回転自在に設けられる。
【0026】
ベース20の上面には、上方に延びるポール26が設けられ、そのポール26の上端には、操作者のアバタ28を表示することができる、タッチディスプレイ30が設けられる。なお、このタッチディスプレイ(以下、単に「ディスプレイ」という。)30には、カメラやマイク、スピーカ等が設けられるが、詳細は
図2に示すブロック図を参照して説明する。また、このロボット14は、バッテリ駆動型のロボットであり、バッテリはたとえばポール26の中に収容されている。
【0027】
この実施例では、ロボット14は、ネットワーク12に接続された操作者端末16と通信可能である。操作者端末16は、ロボット14を遠隔操作する操作者が使用する汎用のコンピュータである。操作者は、操作者端末16を用いて映像および音声をロボット14に送信し、ロボット14のディスプレイ30に自分アバタ28(
図1)を表示し、ユーザと対話して、サービスを提供する。
【0028】
ここで、「サービス」とは、この実施例のアバタ遠隔対話システム10を利用して提供可能な、たとえば家庭教師、物品販売、観光案内などを含むものであって、後述のサービス管理データベース106a(
図5)に事前に登録されている。「操作者」とはこのアバタ遠隔対話システム10で、ディスプレイ30にアバタを表示して、そのアバタを通して販売等のサービスを提供する者であって、後述する操作者管理データベース106b(
図5)に事前登録されている者である。また、「ユーザ」とは、実施例のアバタ遠隔対話システム10において、ディスプレイ30に対面して操作者のアバタ28と対話しながらアバタによるサービスの提供を受ける者であって、後述するユーザ管理データベース106c(
図5)に事前登録されている人または人物のことである。
【0029】
また、ロボット14から送信される映像データ(動画像または静止画像)および音声データを操作者端末16で受信し、操作者端末16で映像および音声を出力することにより、操作者は、ロボット14の周囲を見たり、ロボット14の周囲の状況を把握したり、ロボット14のディスプレイ30に対面しているユーザと対話することができる。
【0030】
なお、操作者端末16でロボット14の移動等を操作することは既に周知であり、また、この発明にとって本質的な事項ではないため、ここではその遠隔操作についての詳細な説明は省略する。
【0031】
ディスプレイ30には、よく知られているように、映像を表示するディスプレイの表面に(または内蔵されて)タッチパネルが設けられており、タッチすることによって、ディスプレイ30上の位置をポイントすることができる。
【0032】
サーバ18は、コンピュータのような情報処理装置であり、この実施例では、ロボット14のカメラ40および/または42(
図2)による映像において、操作者端末16の操作者すなわちディスプレイ30に表示されたアバタ28との対話への参加を意図しない人に由来する情報(映像および/または音声)を匿名化する。
【0033】
図2はロボット14のブロック図である。ここでは、実施例の説明に必要な範囲で、
図2を参照して、ロボット14を説明する。
【0034】
ロボット14はさらに、CPU32およびメモリ34を含む。メモリ34は、詳細は図示しないが、RAM、ROM、HDD(ハードデイスクドラブ)等を含む。CPU32には、バス36が接続されており、このバス36には、メモリ34のRAM、ROM、HDD等が電気的に接続される。CPU32は、コンピュータプログラムを実行することによって、後述の匿名化処理や自律移動等の動作を実行する。
【0035】
通信部38は、ネットワーク12を介して、操作者端末16およびサーバ18と通信して、映像データおよび音声データを授受する。
【0036】
ロボット14には全方位カメラ40およびユーザカメラ42が設けられ、それらはカメラインタフェース(I/F)を通してバス36に接続される。全方位カメラ40は、
図1では図示を省略したがたとえばディスプレイ30の上方に設けられて、ディスプレイ30のアバタ28(
図1)と対話するユーザの背景を撮影する。ただし、この全方位カメラ40は必須のものではない。
【0037】
ユーザカメラ42は、たとえば横方向に間隔を隔てた2つのカメラ(ステレオカメラ)であって、ディスプレイ30に対面して操作者のアバタ28と対話するユーザを撮影する。必要に応じて、パン、チルトおよびズームすることができる。カメラI/F44には、全方位カメラ40やユーザカメラ42において、パン、チルトおよびズームの機能や、ホワイトバランスや露出制御を自動的に実行するプロセサが設けられてもよい。
【0038】
レーザ距離計46は、特定の人を追跡するためなどの目的で設けられるものであり、後述のレーザ距離計56はこのロボット14の自律移動のためのものである。
【0039】
ロボット14はさらに、たとえば6個のマイクを配列して広い範囲の音声を集音できるマイク48を備える。このマイク48は、スピーカ50と同様に、たとえばディスプレイ30に内蔵して設けられる。スピーカ50は、ロボット14の前のユーザと対話する操作者の音声を出力する。マイク48およびスピーカ50は、音声I/F52を介してバス36に接続される。
【0040】
図1に示す超音波センサ22は、移動用センサI/F54を介してバス36に接続される。この移動用センサI/F54にはさらに、レーザ距離計56が接続される。レーザ距離計56は先のレーザ距離計46と兼用されてもよい。つまり、ロボット14の移動中と、ロボット14の移動を停止してアバタ28による対話中とで、1つのレーザ距離計を使い分けるようにしてもよい。
【0041】
慣性計測ユニット58もまた移動用センサI/F54に接続されるが、この慣性計測ユニット58は3次元の慣性運動(直交3軸方向の並進運動および回転運動)を検出する装置であって、加速度センサによって並進運動を検出し、角速度(ジャイロ)センサによって回転運動を検出する。
【0042】
バス36にはさらに、モータドライバ60が接続される。このモータドライバ60は、CPU32の命令に従って、右車輪モータ62Rおよび左車輪モータ62Lを制御する。つまり、CPU34は、移動用センサI/F54およびモータドライバ60から得られる状況を示すデータに基づいて、モータドライバ60によって、右車輪モータ62Rおよび左車輪モータ62Lを制御するのであるが、この発明はロボット14の移動自体には直接関係しないので、ここでは、これ以上の説明は省略する。
【0043】
図3は操作者の操作者端末16のブロック図である。操作者端末16は汎用のコンピュータであるが、ここでは、実施例の説明に必要な範囲で、
図3を参照して、操作者端末16の構成を説明する。
【0044】
操作者端末16は、CPU64およびメモリ66を含む。メモリ68は、詳細は図示しないが、RAM、ROM、HDD等を含む。CPU64には、バス68が接続されており、このバス68には、メモリ68のRAM、ROM、HDD等が電気的に接続される。CPU64は、コンピュータプログラムを実行することによって、必要な動作を実行する。
【0045】
操作者端末16は、音声I/F70を介してバス68に接続される、マイク72およびスピーカ74を備える。操作部76は、図示しないが、タッチディスプレイやキーボードを含む。これらのマイク72、スピーカ74および操作部76を用いて、操作者はロボット14のディスプレイ30に自身のアバタ28(
図1)を表示させて、ディスプレイ30に対面するユーザとの遠隔対話を実行する。
【0046】
通信部80は、ネットワーク12を介して、ロボット14およびサーバ18と通信して、映像データおよび音声データを授受する。
【0047】
ディスプレイ78には、後述するようにしてサーバ18が匿名化処理した後の、ロボット14の全方位カメラ40やユーザカメラ42が撮影したユーザ等の映像を表示する。
【0048】
図4はサーバ18のブロック図である。サーバ18は汎用のコンピュータであるが、ここでは、実施例の説明に必要な範囲で、
図4を参照して、サーバ18の構成を説明する。
【0049】
サーバ18は、CPU82およびメモリ84を含む。メモリ84は、詳細は図示しないが、RAM、ROM、HDD等を含む。CPU82には、バス86が接続されており、このバス86には、メモリ84のRAM、ROM、HDD等が電気的に接続される。CPU82は、コンピュータプログラムを実行することによって、匿名化処理等の必要な動作を実行する。
【0050】
サーバ18は、音声I/F88を介してバス86に接続される、マイク90およびスピーカ92を備える。操作部94は、図示しないが、タッチディスプレイやキーボードを含む。
【0051】
通信部96は、ネットワーク12を介して、ロボット14および操作者端末16と通信して、映像データおよび音声データを授受する。特に、ロボット14から映像データおよび音声データを受信し、必要に応じて匿名化処理を施した映像データおよび音声データを操作者端末16へ送信する。
【0052】
ディスプレイ98には、ロボット14の全方位カメラ40やユーザカメラ42が撮影したユーザ等の映像を表示する。
【0053】
図5は
図4に示したサーバ18のメモリ84(RAM)のメモリマップの一例を示す図解図である。
図5に示すように、メモリ84は、プログラム記憶領域100およびデータ記憶領域102を含む。プログラム記憶領域100は、サーバとして必要なプログラムの他、この発明の匿名化処理に必要なプログラムを記憶する。
【0054】
すなわち、プログラム記憶領域100は、受信プログラム104a、人物特定プログラム104b、人物検出プログラム104c、匿名化プログラム104dおよび送信プログラム104e等を含む。
【0055】
受信プログラム104aは、通信部96を制御して、ネットワーク12を介してロボット14から映像データおよび音声データを受信するプログラムである。
【0056】
人物特定プログラム104bは、データ記憶領域102のユーザ管理データベース106bに事前に登録されているユーザデータに基づいて、匿名化を解除してよい人物を特定するためのプログラムである。具体的には、たとえばサーバ18のユーザ管理データベース106cへのユーザの顔画像の登録、ユーザ本人による操作(たとえばスマホなどによる登録、ロボット14(に設けられた操作部(図示せず)を操作することによる登録)、ユーザIDを表すIDタグの着用などが考えられる。
【0057】
さらに、ロボット14すなわちユーザが存在する場所による特定方法もある。たとえば、その場所が特定の匿名化が必要な場所かどうか、あるいは匿名化除外区域(たとえば要監視区域)かどうか判断することができる。ただし、ロボット14すなわちユーザが存在する場所は、ロボット14に設けられたGPSのような位置検出手段、あるいはロボット14の移動経路に設けられた床センサなどの情報に基づいて、検出することができる。
【0058】
人物検出ログラム104cは、人物特定プログラム104bによって特定された人物に関する、ロボット14からの映像データおよび音声データに含まれる情報、たとえば当該人物本人の顔画像や発話音声等を検出したり追跡したりするためのプログラムである。具体的には、たとえばロボット14に設けた全方位カメラ40やユーザカメラ42の映像データを画像認識処理することによって、人物を追跡することが考えられる。あるいは、ロボット14に設けたレーザ距離計46(および/または56)(
図2)によって、その人物の位置を追跡することができる。そして、人物特定プログラム104bによって特定された匿名化しなくてもよい人物およびそれ以外の匿名化すべき人物の顔の位置座標を匿名化プログラム104dに渡す
匿名化プログラム104dは、ロボット14からの映像データおよび音声データに含まれる、匿名化しなくてもよい人物およびそれ以外の匿名化すべき人物のそれぞれの顔の位置座標に基づいて、その特定された人物以外の人物の映像および/音声に対して匿名化処理を適用するためのプログラムである。
【0059】
送信プログラム104eは、匿名化プログラム104dによって匿名化処理した映像および/音声をユーザの対話相手である操作者の操作者端末16に送信するためのプログラムである。
【0060】
また、データ記憶領域102には、サービス管理データベース106a、操作者管理データベース106b、ユーザ管理データベース106c、ロボット14から受信した映像および音声の受信データを一時的に記憶する受信データ領域106dおよび操作者端末16へ送信する送信データを一時的に記憶する送信データ領域106eを含む。
【0061】
サービス管理データベース106aは、前述したように、実施例のアバタ遠隔対話システム10で提供可能な種々のサービスを、サービス提供者である操作者によって事前に登録したデータベースである。
【0062】
操作者管理データベース106bは、前述したように、実施例のアバタ遠隔対話システム10によってユーザにサービスを提供する操作者の各種情報を事前に登録したデータベースである。ただし、操作者の各種情報は、操作者の氏名または名称、住所または居所や操作者IDなどの基本データ、操作者の顔画像等の映像、提供できるサービスなどを含む。また、操作者としては、たとえばサービスが家庭教師であるとすると、各家庭教師だけでなく、家庭教師の運営会社も含む。つまり、操作者管理データベース106bに登録できるのは、個人だけでなく、会社等の団体である。
【0063】
ユーザ管理データベース106cは、前述したように、実施例のアバタ遠隔対話システム10によってアバタを通して提供されるサービスを受ける人の各種情報を事前に登録したデータベースである。ただし、ユーザの各種情報は、ユーザの氏名または名称、住所または居所やユーザIDなどの基本データ、ユーザの顔画像等の映像、提供を受けるサービスなどを含む。また、ユーザとしては、たとえばサービスが物品販売であるとすると、個人だけでなく販売される物品を仕入れる業者等も含む。つまり、ユーザ管理データベース106cに登録できるのは、個人だけでなく、会社等の団体である。
【0064】
ただし、以下に
図6のフローチャートを参照して説明する実施例では、個人のユーザを前提としている。
【0065】
実施例のアバタ遠隔対話システム10において、操作者が操作者端末16を通してサーバ18へログイン操作すると、サーバ18がそのログイン情報に対して操作者管理データベース106bを参照して認証処理を実行し、認証に成功すると操作者端末16がサーバ18にログインできる。一方、ユーザは、たとえばロボット14のディスプレイ30に近づくと、ロボット14のユーザカメラ42がそのユーザの顔を撮影する。その顔画像がサーバ18に送信される。サーバ18ではユーザ管理データベース106cを参照してユーザに対して認証処理を実行し、認証に成功するとユーザがサーバ18にログインできる。そのうえで、操作者が提供しユーザが受けるサービスが確定される。
【0066】
このようにして
図6の最初のステップS1では、サーバ18において、操作者、ユーザおよびサービスの組み合わせが確定される。
【0067】
そして、ステップS3で、サーバ18は、ロボット14の2つのカメラ40および42による映像データおよびマイク48による音声データの取得を開始する。つまり、ロボット14の通信部38から映像データおよび音声データがネットワーク12を介して、サーバ18の通信部96へ送信される。サーバ18は、それらのデータを受信し、受信データとして、受信データ領域106dに一時的に保存する。
【0068】
続くステップS5でサーバ18(のCPU82)は、人物特定プログラム104b(
図5)に従って、受信データの中の映像データおよび音声データに含まれている人物のうち、匿名化する必要のない人物を特定する。たとえば、サーバ18に操作者やユーザとして登録している人、ロボット14のカメラ42に対面している人などは、ここでいう「匿名化する必要のない人物」ということができる。
【0069】
次のステップS7で、サーバ18は、取得(受信)した映像データおよび音声データに基づいて、それらのデータが示す個別の人物に由来する情報、すなわち、顔画像などの映像およびマイク48で拾った音声を検出する。つまり、ロボット14のカメラ40および42に写り込んでいる各個人と、その個人の映像データおよび音声データを紐付けて、個人毎に受信データ領域106dに保存する。
【0070】
その後、ステップS9-S15を繰り返し実行して必要な匿名化処理を実行する。
【0071】
すなわち、まず、ステップS9で、個別の人物に由来する情報(映像データおよび音声データ)を順次選択し、ステップS11で、その選択した情報が匿名化が必要な人物の情報かどうか判断する。この判断は、たとえば人物特定プログラム104bおよび人物検出プログラム104cに従って実行される。つまり、人物特定プログラム104bによって匿名化しなくてもよい人物を特定し、その特定の人物の情報を、人物検出プログラム104cによって検出することによって、ステップS9で選択した情報がその特定の人物の情報かどうか判断することができる。
【0072】
そして、次のステップS13では、サーバ当該人物に由来する情報、映像および音声に匿名化処理を適用する。なお、ここでいう「匿名化」とは、映像および/または音声によってその人物を認識できなくする(認識できにくくする)処理ということができ。
【0073】
映像を匿名化する具体的な方法としては、ロボット14からの映像データにおいて、その人物の顔画像(または上半身など)に対して、モザイク処理を施したり、ぼかし処理を施したりする方法が考えられる。
【0074】
あるいは、その人物の映像に、予め準備しておいたキャラクタ画像あるいはCG画像を重畳したり、その人物の映像をキャラクタ画像あるいはCG画像と置換したりする方法がある。
【0075】
音声を匿名化する具体的な方法としては、音声データのボリューム(音量)の低減、変声データへの置換、あるいは発話内容に応じたミュート処理などが考えられる。
【0076】
なお、いずれの場合にも、匿名化処理を施す、特定の人物以外の性別、年代などの情報を収集データとしてサーバ18内に残すようにしてもよい。
【0077】
その後、ステップS15で、サーバ18は、ステップS7で保存した個別の人物のすべてについてステップS11およびS13の処理が実行したかどうか、すなわち、すべての情報を検査したかどうか判断する。たとえば、ステップS7で検出した個別の人物の数をカウンタ(図示せず)でカウントすることによって、全情報を検査したかどうか判断することができる。
【0078】
ステップS17で、サーバ18は、匿名化処理済みの映像データおよび/または音声データを含む送信データを送信データ領域106e(
図5)に一時的に保存して、その送信データを操作者端末16へ送信する。
【0079】
操作者端末16では、この送信データを通信部78を通して受信し、受信したデータに含まれる音声データに基づく音声をスピーカ74から出力し、受信したデータに含まれる映像データに基づく映像をディスプレイ78で表示する。したがって、操作者端末16のディスプレイ80で表示される映像および/またはスピーカ74から出力される音声は必要な匿名化が施されたものとなり、操作者端末16による操作者とユーザの対話への参加を意図しない人物のプライバシに配慮した遠隔対話が実現できる。
【0080】
なお、上述の実施例のステップS13では、映像および音声に匿名化処理を実行するようにしたが、どちらか一方だけに匿名化処理を施すようにしてもよいし、少なくとも映像だけを匿名化するようにしてもよい。
【0081】
さらに、上述の実施例は、ロボット14に設けたディスプレイ30にアバタ28の画像を表示し、そのアバタ28とユーザとが遠隔対話するシステムとして説明した。
【0082】
しかしながら、この発明は、ロボット14自体を操作者のアバタとして機能させるような遠隔対話システムにも適用できる。たとえばSOTA(https://www.vstone.co.jp/products/sota/)やエリカ(https://www.irl.sys.es.osaka-u.ac.jp/projects/erica)(いずれも商品名)のように、ディスプレイのないロボットを遠隔操作しながらロボットを通して人(ユーザ)と対話することもできる。
【0083】
さらに、この発明は、操作者が遠隔操作するCGキャラクタを画面に表示してその前にいる人(ユーザ)と対話する(CGキャラクタが操作者のアバタの役割)遠隔対話システムにも適用できる。
【符号の説明】
【0084】
10 …アバタ遠隔対話システム
12 …ネットワーク
14 …ロボット
16 …操作者端末
18 …サーバ
30 …ディスプレイ
32、64、82 …CPU
40 …全方位カメラ
42 …ユーザカメラ
46 …レーザ距離計
48、72、90 …マイク
50、74、92 …スピーカ
104d …匿名化プログラム