IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日本総合研究所の特許一覧

特開2024-131077プログラム、データ提供装置及びデータ提供方法
<>
  • 特開-プログラム、データ提供装置及びデータ提供方法 図1
  • 特開-プログラム、データ提供装置及びデータ提供方法 図2
  • 特開-プログラム、データ提供装置及びデータ提供方法 図3
  • 特開-プログラム、データ提供装置及びデータ提供方法 図4
  • 特開-プログラム、データ提供装置及びデータ提供方法 図5
  • 特開-プログラム、データ提供装置及びデータ提供方法 図6
  • 特開-プログラム、データ提供装置及びデータ提供方法 図7
  • 特開-プログラム、データ提供装置及びデータ提供方法 図8
  • 特開-プログラム、データ提供装置及びデータ提供方法 図9
  • 特開-プログラム、データ提供装置及びデータ提供方法 図10
  • 特開-プログラム、データ提供装置及びデータ提供方法 図11
  • 特開-プログラム、データ提供装置及びデータ提供方法 図12
  • 特開-プログラム、データ提供装置及びデータ提供方法 図13
  • 特開-プログラム、データ提供装置及びデータ提供方法 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024131077
(43)【公開日】2024-09-30
(54)【発明の名称】プログラム、データ提供装置及びデータ提供方法
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20240920BHJP
【FI】
G06Q50/10
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023041117
(22)【出願日】2023-03-15
(71)【出願人】
【識別番号】302064762
【氏名又は名称】株式会社日本総合研究所
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】渡邊 駿太
(72)【発明者】
【氏名】朝原 千賀子
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC12
5L050CC12
(57)【要約】
【課題】対話データを編集した編集対話データを出力するプログラム、データ提供装置及びデータ提供方法を提供すること。
【解決手段】プログラムは、メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得し、前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する処理をコンピュータに実行させる。
【選択図】図7
【特許請求の範囲】
【請求項1】
メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得し、
前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する
処理をコンピュータに実行させるプログラム。
【請求項2】
前記対話データに含まれるプライバシーデータを削除する編集を行い、前記編集対話データを生成する
請求項1に記載のプログラム。
【請求項3】
前記第2アバターから希望する前記対話データの属性を受け付け、
前記サービス提供側アバターと前記第1アバターとの前記対話データより、受け付けた前記属性に対応する前記対話データを抽出し、
抽出した前記対話データに基づく前記編集対話データを生成する
請求項1又は請求項2に記載のプログラム。
【請求項4】
前記編集対話データを前記第2アバターに視認可能な状態で出力する
請求項1又は請求項2に記載のプログラム。
【請求項5】
前記第2アバターの属性に基づいて、前記サービス窓口とは異なるサービス窓口への移動を促す表示を行う
請求項1又は請求項2に記載のプログラム。
【請求項6】
前記第1アバターを利用するユーザより予め受け付けた秘匿設定に基づき、前記編集により秘匿するプライバシーデータの秘匿レベルを変更する
請求項1又は請求項2に記載のプログラム。
【請求項7】
メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得する取得部と、
前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する出力部と
を備えるデータ提供装置。
【請求項8】
コンピュータが、
メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得し、
前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する
処理を行うデータ提供方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、メタバースにおける対話データを提供するプログラム、データ提供装置及びデータ提供方法に関する。
【背景技術】
【0002】
メタバースを始めとする仮想空間において、様々な社会活動が行われるようになっている。ユーザがアバターを利用して活動する仮想空間においては、文字によるチャットに代わり、音声を用いたコミュニケーションも行われている。現実世界における音声による会話では、会話の当事者となるだけではなく、会話には参加していないが、自分の近くで交わされている会話を聞き、情報や知識を得ることもある。このような、会話には明示的には参加しているわけではないが、その情報の一部を得ることができるという状況の実現を目指し、仮想空間において会話に参加する/しないの中間の状態を実現することができるメッセージ交換システムが提案されている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2003-67317号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述のメッセージ交換システムは、自分の近くで交わされている会話を聞き、情報や知識を得ることもあるという利点がある反面、次のような不都合がある。交わしている会話の大半は、会話に参加していない第三者に聞かれたとしても問題ないが、プライバシー情報を秘匿したい場合、上述のメッセージ交換システムは対応できない。プライバシー情報を秘匿したいというニーズは、会話よりも対話の方がより高いと考えられる。
【0005】
本発明はこのような状況に鑑みてなされたものである。その目的は、対話データを編集した編集対話データを提供するプログラム、データ提供装置及びデータ提供方法を提供することである。
【課題を解決するための手段】
【0006】
本願の一態様に係るプログラムは、メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得し、前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する処理をコンピュータに実行させる。
【発明の効果】
【0007】
本願の一態様にあっては、対話データを編集した編集対話データを出力することが可能となる。
【図面の簡単な説明】
【0008】
図1】相談窓口システムの構成例を示す説明図である。
図2】メタバースサーバのハードウェア構成例を示すブロック図である。
図3】窓口端末の構成例を示すブロック図である。
図4】ユーザ端末の構成例を示すブロック図である。
図5】ユーザDBの例を示す説明図である。
図6】パターンDBの例を示す説明図である。
図7】配信処理の手順例を示すフローチャートである。
図8】音声翻訳モデルの構成例を示すブロック図である。
図9】題目DBの例を示す説明図である。
図10】音声変更処理の手順例を示すフローチャートである。
図11】待ち行列DBの例を示す説明図である。
図12】待ち行列更新処理の手順例を示すフローチャートである。
図13】メタバース空間の例を示す説明図である。
図14】配信処理の他の手順例を示すフローチャートである。
【発明を実施するための形態】
【0009】
(実施の形態1)
以下実施の形態を、図面を参照して説明する。図1は相談窓口システムの構成例を示す説明図である。相談窓口システム100はメタバースサーバ1、窓口端末2及びユーザ端末3を含む。メタバースサーバ1、窓口端末2及びユーザ端末3はネットワークNにより、互いに通信可能に接続されている。図1において、窓口端末2は1台を記載しているが、2台以上であってもよい。ユーザ端末3は2台を記載しているが、1台であってもよいし、3台以上であってもよい。BtoCのビジネス形態においては、顧客と企業との接点として相談窓口やコンタクトセンタが設けられる。相談窓口システム100は、相談窓口をIT技術で実現しようとするものである。以下においては、金融機関での相談窓口を想定して説明するが、それに限らない。また、相談窓口システム100と同様な構成で、コンタクトセンタやコールセンタ等のシステムを構築してもよい。
【0010】
メタバースサーバ1はインターネット上で、仮想三次元空間を提供するコンピュータである。メタバースサーバ1はサーバコンピュータ、ワークステーション、PC(Personal Computer)等で構成する。また、メタバースサーバ1を複数のコンピュータからなるマルチコンピュータ、ソフトウェアによって仮想的に構築された仮想マシン又は量子コンピュータで構成しても良い。さらに、メタバースサーバ1の機能をクラウドサービスで実現してもよい。なお、メタバースサーバ1は相談窓口を設ける企業等が管理、運営してもよいが、メタバースをプラットフォームとして提供する企業等が管理、運営し、相談窓口を設ける企業等が、メタバースへ出店する形態としてもよい。
【0011】
窓口端末2は相談窓口を受け持ち、相談を受ける窓口担当者が用いる端末である。窓口端末2はPC(Personal Computer)、ノートパソコン、タブレットコンピュータ等で構成する。ユーザ端末3は相談窓口で相談をするエンドユーザが利用する端末である。ユーザ端末3はノートパソコン、タブレットコンピュータ、スマートフォン等で構成する。以下、エンドユーザを単なるユーザという。
【0012】
図2はメタバースサーバのハードウェア構成例を示すブロック図である。メタバースサーバ1は処理部11、記憶部12及び通信部14を含む。各構成はバスBにより接続されている。処理部11は、CPU(Central Processing Unit)、MPU(Micro-Processing Unit)又はGPU(Graphics Processing Unit)等の演算処理装置、ROM(Read Only Memory)、及び、RAM(Random Access Memory)等を用いて構成されている。処理部11は、記憶部12に記憶された制御プログラム1P(プログラム、プログラム製品)を読み出して実行することにより、種々の処理を行う。
【0013】
記憶部12は、例えばフラッシュメモリ又はEEPROM(Electrically Erasable Programmable Read Only Memory)等の不揮発性のメモリ素子を用いて構成されている。記憶部12は、処理部11が実行する各種のプログラム、及び、処理部11の処理に必要な各種DB(DataBase:データベース)を記憶する。記憶部12は、ユーザDB121、3DモデルDB122、画像DB123、動画DB124及びパターンDB125を記憶する。また、本実施の形態においては必須ではないが、記憶部12は題目DB126及び待ち行列DB127を記憶する。本実施の形態において記憶部12は、処理部11が実行する制御プログラム1Pを記憶する。
【0014】
本実施の形態において制御プログラム1Pは、例えばメタバースサーバ1の運用開始前の設定作業において記憶部12に書き込まれる。また例えば制御プログラム1Pは、遠隔のサーバ装置等が配信するものをメタバースサーバ1が通信にて取得してもよい。また例えば制御プログラム1Pは、メモリカード又は光ディスク等の記録媒体に記録された態様で提供され、メタバースサーバ1は記録媒体から制御プログラム1Pを読み出して記憶部12に記憶してもよい。
【0015】
通信部14は、携帯電話通信網、無線LAN(Local Area Network)又はインターネット等のネットワークNを介して、種々の装置との間で通信を行う。本実施の形態において通信部14は、窓口端末2及びユーザ端末3と通信を行い、メタバースにおける相談窓口サービスを実現する。
【0016】
図3は窓口端末の構成例を示すブロック図である。窓口端末2は制御部21、主記憶部22、補助記憶部23、通信部24、入力部25、表示部26及び音声処理部27を含む。各構成はバスBで接続されている。
【0017】
制御部21は、一又は複数のCPU、MPU、GPU等の演算処理装置を有する。制御部21は、補助記憶部23に記憶された制御プログラム2P(プログラム、プログラム製品)を読み出して実行することにより、種々の機能を提供する。
【0018】
主記憶部22は、SRAM(Static RAM)、DRAM(Dynamic RAM)、フラッシュメモリ等である。主記憶部22は主として制御部21が演算処理を実行するために必要なデータを一時的に記憶する。
【0019】
補助記憶部23はハードディスク又はSSD等であり、制御部21が処理を実行するために必要な各種データを記憶する。補助記憶部23は窓口端末2と別体で外部接続された外部記憶装置であってもよい。補助記憶部23に記憶する各種DB等を、データベースサーバやクラウドストレージに記憶してもよい。
【0020】
通信部24はネットワークNを介して、メタバースサーバ1と通信を行う。また、制御部21が通信部24を用い、ネットワークN等を介して他のコンピュータから制御プログラム2Pをダウンロードし、補助記憶部23に記憶してもよい。
【0021】
入力部25はキーボードやマウスである。表示部26は液晶表示パネル又は有機EL(electro Luminescence)表示パネル等を含む。表示部26はメタバースサーバ1が出力したメタバース空間等を表示する。入力部25と表示部26とを一体化し、タッチパネルディスプレイを構成してもよい。なお、窓口端末2は外部の表示装置に表示を行ってもよい。入力部25と表示部26とを、VR(Virtual Reality)ゴーグル又はHMD(Head Mounted Display)とコントローラとで構成してもよい。
【0022】
音声処理部27は音声を収集するマイク(図示しない)が拾った窓口担当者の発言音声を受け付ける。また、音声処理部27は、ユーザの発話音声等をスピーカ(図示しない)へ出力する。
【0023】
図4はユーザ端末の構成例を示すブロック図である。ユーザ端末3は制御部31、主記憶部32、補助記憶部33、通信部34、表示パネル35、操作部36及び音声処理部37を含む。各構成はバスBで接続されている。制御部31、主記憶部32、補助記憶部33、通信部34及び音声処理部37は、それぞれ窓口端末2の制御部21、主記憶部22、補助記憶部23、通信部24及び音声処理部27と同様であるから、説明を省略する。以下の説明において、ユーザ端末3はユーザの状況により、次のように使い分ける。相談窓口にて相談を行っている状況のユーザを相談ユーザという。相談ユーザが使用しているユーザ端末3を、相談者端末という。相談ユーザとなっているユーザが使用しているアバターは第1アバターの一例である。相談窓口の待ち行列に並んでいる等の状況のユーザを待機ユーザという。待機ユーザが使用しているユーザ端末3を待機者端末という。待機ユーザとなっているユーザが使用しているアバターは第2アバターの一例である。窓口担当者が使用しているアバターは、サービス提供側アバターの一例である。
【0024】
表示パネル35は、液晶表示パネル又は有機EL表示パネル等で構成することができる。操作部36は、例えば、表示パネル35に組み込まれたタッチパネルで構成することができ、ユーザが表示パネル35上で行う所定の操作を行うことができる。また、操作部36は、表示パネル35に表示したソフトウェアキ-ボード上の操作を行うことができる。なお、操作部36は、ハードウェアキーボード、マウスなどでもよい。また、表示パネル35と操作部36に替えて、VR(Virtual Reality)ゴーグル又はHMD(Head Mounted Display)とコントローラとで構成してもよい。
【0025】
音声処理部37は音声を収集するマイク(図示しない)が拾ったエンドユーザの発言音声を受け付ける。また、音声処理部37は、窓口担当者の発話音声等をスピーカ(図示しない)へ出力する。
【0026】
続いて、データベースについて説明する。なお、図2には題目DB126及び待ち行列DB127が記載されているが、これらについては後の実施の形態において説明する。図5はユーザDBの例を示す説明図である。ユーザDB121はユーザの情報を記憶する。ユーザDB121はユーザID列、氏名列、住所列、アバター列、ランク列、秘匿レベル列、投資目的列、資産状況列及び投資経験列を含む。ユーザID列はユーザを一意に特定可能なユーザIDを記憶する。氏名列はユーザの氏名を記憶する。住所列はユーザの住所を記憶する。アバター列はユーザが使用するアバターの情報を記憶する。アバターの情報は、例えばFBX(Filmbox)形式又はVRM形式の3Dモデルデータである。アバター列はメタ情報を記憶してもよい。例えばメタ情報はアバターの名称(メタバースでのユーザの名前)等である。ランク列はユーザのランクを記憶する。ランクは相談窓口を運営する企業、ここでは金融機関において、顧客であるユーザの重要度を示すものである。例えば5段階として、ランク5が最重要顧客を示す。ランクは取引回数、取引額、取引年数等から定める。秘匿レベル列はユーザが希望するプライバシー情報(プライバシーデータ)の秘匿レベルを記憶する。例えば、秘匿レベルは、「通常」、「クローズ」又は「オープン」である。「通常」は、相談窓口システム100の運営者の設定に基づき、プライバシー情報を秘匿する。「クローズ」は一切の音声を第三者に秘匿する。「オープン」は一切秘匿せず、全ての音声を第三者に公開する。本明細書におけるプライバシー情報には、個人情報や特定の機微な個人情報も含む。投資目的列はユーザが投資を検討している、又は、投資を行っている場合に、その目的を記憶する。資産状況列は、ユーザの金融資産の状況を記憶する。現金、預貯金、株式、投資信託等の保有額等を記憶する。投資経験列はユーザの投資経験について記憶する。投資経験は例えば株式や投資信託での運用を行っている年数等を記憶する。投資目的から投資経験列が記憶する情報は、金融機関での相談窓口において利用される情報であるから、他業種の相談窓口を構築する場合は、なくともよいし、他の情報を記憶する列を設けてもよい。
【0027】
3DモデルDB122はメタバースを構築するために必要となる種々の3Dモデルデータを記憶する。画像DB123はメタバース空間の3Dモデルに貼り付けられるテクスチャや、コンテンツとしての画像データ等を記憶する。動画DB124はメタバースを構成する動画や、コンテンツとしての動画データ等を記憶する。3DモデルDB122、画像DB123は、動画DB124は、メタバースを構築するために従来使われているものであり、公知であるから、より詳しい説明は省略する。
【0028】
図6はパターンDBの例を示す説明図である。パターンDB125はプライバシー保護の観点から、対話音声の中からマスクすべき箇所を抽出するためのパターンを記憶する。パターンDB125はパターンID列及びパターン列を含む。パターンID列はパターンを特定可能なパターンIDを記憶する。パターン列はマスクすべきプライバシー情報を検出するための文字列を記憶する。プライバシー情報は、例えば、生年月日、所得等、資産の贈与先、相談者の年齢が推測可能な年金受給年齢の繰上げ、繰下げについての話題等である。パターン列には、プライバシー情報に含まれると推定されるキーワード、「年齢」、「贈与」、「受給年齢」等を記憶しておいてもよい。そして、対話音声にキーワードが含まれていることを検出した場合、キーワードの前後をマスク対象とする。
【0029】
次に、メタバースサーバ1において、記憶部12に記憶された制御プログラム1Pを処理部11が読み出して実行することにより、処理部11においてソフトウェア的に実現される機能部について説明する。処理部11は、受付部11a、更新部11b、モデリング処理部11c、音声取得部11d、解析部11e、音声出力部11f、配信部11g及び行列管理部11hが実現される。
【0030】
受付部11aはユーザ端末3から操作情報を受け付ける。操作情報はアバターの動きを制御する情報などである。受付部11aは操作情報を更新部11bへ渡す。
【0031】
更新部11bは渡された操作情報に従って、アバターの情報、例えば、位置座標、姿勢情報、視線方向を更新する。更新部11bは更新した情報をモデリング処理部11cへ渡す。
【0032】
モデリング処理部11cは渡されたアバターの情報に従って、ユーザが見ているメタバースの3次元画像を更新する。モデリング処理部11cは更新した3次元画像を配信部11gへ出力する。なお、メタバースサーバ1の処理負荷を軽減するために、3次元画像を更新する際に行うレンダリングやテクスチャマッピング等の処理を、ユーザ端末3に行わせてもよい。この場合であっても、メタバースサーバ1は、ユーザ端末3から操作情報を受け付け、アバターの位置等の更新を行う。
【0033】
音声取得部11dはアバターの位置から所定の範囲内にある相談窓口を特定し、特定した相談窓口での対話音声を取得する。音声取得部11dは取得した対話音声を解析部11eへ渡す。
【0034】
解析部11eは音声取得部11dから取得した対話音声を解析する。解析部11eは音声認識により対話音声を文字列(以下、「対話文字列」という。)に変換する。解析部11eは変換した対話文字列と、パターンDB125に記憶されているパターンとを対照し、対話文字列にプライバシー情報が含まれていないかを判定する。解析部11eはプライバシー情報が含まれていると判定した場合、文字列に対応する対話音声の部分をマスクする範囲として、音声出力部11fへ出力する。
【0035】
音声出力部11fは解析部11eからの出力にしたがい、対話音声の一部をマスクした編集済みの対話音声を配信部11gへ出力する。マスクするとは、例えば、該当部分を無音とするか、ビープ音に置き換える。
【0036】
配信部11gは音声出力部11fが出力した3次元画像と、音声出力部11fが出力した音声とをストリームデータとして、待機者端末へ配信する。
【0037】
行列管理部11hは窓口に並んでいるユーザの並び順を管理している。行列管理部11hは、並んでいるユーザの属性に応じて、並び順の変更を行う。本実施の形態において、行列管理部11hは必須の構成でないので、機能の詳細は後の実施の形態にて、説明する。
【0038】
続いて情報処理について説明する。図7は配信処理の手順例を示すフローチャートである。図7に示す配信処理は、待機ユーザが対象となる処理である。メタバースサーバ1の処理部11は、メタバースでの待機ユーザの位置を更新する(ステップS1)。処理部11は処理対象となる対話音声(対象音声)があるか否かを判定する(ステップS2)。処理部11は、待機ユーザが特定の相談窓口に並んでいる場合、当該相談窓口の対話音声を対象音声であると判定する。対話音声は相談ユーザと窓口担当者とが話している音声である。相談窓口に並んでいるか否かは、例えば次のように判定する。相談窓口毎に待ち行列を作る範囲を定めておき、当該範囲に所定時間以上、立ち止まった待機ユーザは並んでいると判定する。所定時間以上、経過した時点で、ユーザに並ぶ意思があることを確認してもよい。または、相談ユーザがユーザ端末を操作して、明示的に並ぶことを宣言してもよい。この場合、待機ユーザが相談窓口に並ぶ操作をしたとき、待ち行列が長く、相談窓口の対話音声は待機ユーザに聞こえないことが自然であっても、対話音声を、待機ユーザに聞かせてもよい。相談窓口に並んで当該窓口の対話音声を聞いている待機ユーザであっても、操作により、対話音声を消えなくしたり、並んでいる状態を変えずに、他の相談窓口の対話音声を聞こえるようにしたりしてもよい。処理部11は、待機ユーザが特定の相談窓口には並んでいない場合、対象音声はないと判定する。処理部11は対象音声がないと判定した場合(ステップS2でNO)、処理をステップS1へ戻す。処理部11は対象音声があると判定した場合(ステップS2でYES)、対象となる対話音声を取得する(ステップS3)。処理部11は取得した対話音声を解析する(ステップS4)。処理部11は音声認識に技術により対話音声をテキストに変換する。処理部11はテキストとパターンDB125とを対照し、プライバシー情報があるか否かを判定する。処理部11はプライバシー情報があると判定した場合、取得した対話音声においてマスクすべき区間を判定する。処理部11は、対話音声において、マスクすべき区間の音声を無音又はビープ音等に変換した音声(出力音声)を生成する(ステップS5)。処理部11は3次元画像と出力音声とを合成したストリーミングデータを作成する(ステップS6)。処理部11は作成したストリーミングデータを待機者端末へ送信し(ステップS7)、処理をステップS1へ戻す。待機者端末はストリーミングデータを受信し、ストリーミングデータに基づき、3次元画像をヘッドマウントディスプレイ等に表示し、出力音声をスピーカ又はイアホンから出力する。配信処理は、待機ユーザに相談の順番が回ってきた場合、又は、メタバースから退出した場合に、割り込み処理等により終了する。なお、相談窓口で相談を受け付ける窓口担当者を人ではなく、ボイスボット(音声版チャットボット)としてもよい。
【0039】
相談窓口で相談をしている相談ユーザについての3次元画像及び音声の配信処理は、公知の技術により実現可能であるので、説明を省略する。窓口担当者についても、相談ユーザと同様である。
【0040】
本実施の形態は、以下の効果を奏する。相談窓口に並んでいる待機ユーザは、相談窓口にて話されている対話音声を聞くことが可能であり、対話の内容に、相談したい内容に対する回答が含まれている場合、当該内容については、相談することが不要となる。窓口担当者においては、同じような相談を受ける回数が減り、業務の効率化が期待できる。また、相談者においては、相談内容を待機ユーザに聞かれてしまうものの、プライバシー情報がマスクされ、待機ユーザに聞かれないので、安心して相談することが可能となる。
【0041】
メタバースに複数の相談窓口が設けられる場合、配信処理の一部を以下のように変更してもよい。一部の相談窓口は個室とし、第三者である待機者には対話音声が聞こえないことにする。この場合、上述の配信処理のステップS2において、待機者が並んでいる相談窓口の対話音声も処理対象ではないと判定される。
【0042】
待機ユーザが特定のいずれの相談窓口に並んでいない場合、ステップS2において、待機ユーザから所定の範囲内にある相談窓口の対話音声を対象音声であると判定する。但し、対象音声として判定された対話音声が複数となる場合は、いずれかの対話音声を処理対象とする。
【0043】
(実施の形態2)
本実施の形態においては、学習モデルを用いて、対話音声の中でマスクすべき区間の判定を行う。図8は音声翻訳モデルの構成例を示すブロック図である。音声翻訳モデル131は解析部11e及び音声出力部11fに相当する。音声翻訳モデル131は音声が入力された場合、その内容を解析し、解析した結果に基づく翻訳音声を出力する。一般的な音声翻訳モデルは英語を日本語に翻訳するなど、入力された言語と異なる言語を出力するが、音声翻訳モデル131は日本語の音声を入力した場合、第3者には秘匿すべき部分をマスクした日本語音声を出力する。音声翻訳モデル131はニューラルネットを用いた学習モデルである。例えば音声翻訳モデルはTransformer、BERT(Bidirectional Encoder Representations from Transformers)等を用いて構成する。
【0044】
本実施の形態において、音声取得部11dから取得した対話音声を音声翻訳モデル131へ入力する。音声翻訳モデル131は対話音声の中でプライバシー情報をマスクした、例えばビープ音などに置き換えた編集音声を出力する。
【0045】
音声翻訳モデル131は編集音声を配信部11gへ出力する。配信部11gはモデリング処理部11cが出力した3次元画像と、音声翻訳モデル131が出力した編集音声とを結合したストリームデータを、待機者端末へ配信する。
【0046】
本実施の形態は、実施の形態1と同様に、相談窓口に並んでいる待機ユーザは、相談窓口にて話されている対話音声を聞くことが可能であり、相談者は、相談内容を待機ユーザに聞かれてしまうものの、プライバシー情報がマスクされ、待機ユーザに聞かれないので、安心して相談することが可能となる。実施の形態1における解析部11e及び音声出力部11fによる処理の場合、処理に要する時間が必要であるため、出力に遅れが生じるが、音声翻訳モデル131を利用した場合は、ほとんど遅れを生じることなく処理が可能である。
【0047】
(実施の形態3)
本実施の形態は、待機ユーザが、聞きたいことを登録すると、似ている内容を話している相談音声が聞こえてくる機能に関する。図9は題目DBの例を示す説明図である。題目DB126は相談窓口で話されている題目を記憶する。題目DB126は窓口番号列、大項目列、中項目列、小項目列、対象列及びタグ列を含む。窓口番号列は相談窓口を特定可能な窓口番号を記憶する。大項目列、中項目列及び小項目列はそれぞれ対話の内容を端的に示す項目を記憶する。対象列は内容がどのようなユーザに適しているかを記憶する。例えば、対象列は、初心者、初級者、中級者、上級者を記憶する。タグ列は対話の内容をより具体的に示す文字列、いわゆるハッシュタグを記憶する。大項目列、中項目列、小項目列、対象列及びタグ列は、窓口担当者が適宜入力した値を記憶する。なお、タグ列の値は、解析部11eが設定してもよい。また、題目DB126は、直近の(例えば直近5分の)対話音声を文字列に変換した対話文字列を記憶してもよい。
【0048】
図10は音声変更処理の手順例を示すフローチャートである。待機ユーザは聴きたい内容(属性)を検索するための条件を設定する。ユーザ端末3の制御部31は検索条件を受け付ける(ステップS21)。制御部31は検索条件をメタバースサーバ1へ送信する(ステップS22)。メタバースサーバ1の処理部11は検索条件を受信する(ステップS23)。処理部11は題目DB126を参照し、待機ユーザが検索条件にマッチする内容を話している相談窓口を検索し、ヒットしたか否かを判定する(ステップS24)。処理部11は検索がヒットしたと判定した場合(ステップS24でYES)、ユーザ端末3へ送信する音声をヒットした相談窓口の対話音声へ変更する(ステップS25)。処理部11は音声変更後のストリームデータの送信を開始し(ステップS26)、処理を終了する。処理部11は検索がヒットしなかったと判定した場合(ステップS24でNO)、ヒットした相談窓口がなかった旨の通知をユーザ端末3へ送信する(ステップS27)。ユーザ端末3の制御部31は、通知を受信する(ステップS28)。制御部31は通知を出力し(ステップS29)、処理を終了する。通知は画像でもよいし、音声でもよい。
【0049】
本実施の形態においては、以下の効果を奏する。複数の相談窓口が設けられている場合において、対話音声の内容の検索が可能である。待機ユーザは動き回らなくとも、自分が聴きたい内容が話されている可能性が高い相談窓口の対話音声を聴くことが可能となる。
【0050】
全ての相談窓口において、待機ユーザが聴きたい内容が話されていない場合は、予め用意した過去の相談音声を、待機ユーザに提供するようにしてもよい。
【0051】
(変形例)
待機ユーザが聴きたい内容を検索するための条件を設定した場合、上述の音声変更処理を繰り返し実行してもよい。一人に相談ユーザが複数の題目について相談する可能性があるため、待機ユーザ聴きたい内容を話している相談窓口は、動的に変化する可能性がある。そこで、図10において、メタバースサーバ1の処理部11はステップS26を実行後、処理をステップS24へ戻すようにする。また、ステップS27からステップS29は実行せず、待機ユーザが聴きたい内容を話している相談窓口がない場合、待機ユーザが特定の相談窓口に並んでいたとしても、対話音声を待機ユーザには出力しないようにする。これによって、待機ユーザは自分の聴きたい内容が含まれるであろう対話音声のみを聞くことが可能となる。
【0052】
(実施の形態4)
本実施の形態は、相談窓口に並んでいる待機ユーザの並び順を変更する形態に関する。図11は待ち行列DBの例を示す説明図である。待ち行列DB127は各相談窓口に集まっているユーザの情報を記憶する。待ち行列DB127は窓口ID列、人数列、待ち時間列、着席列及び待ち列を含む。窓口ID列は相談窓口を特定する窓口IDを記憶する。人数列は相談待ちをしている待機ユーザの数を記憶する。待ち時間列は相談できるまでの平均待ち時間を記憶する。着席列は相談窓口に着席し、相談をしている相談ユーザのユーザIDを記憶する。待ち列は相談待ちをしている待機ユーザのユーザIDを、並び順に従って、記憶する。
【0053】
図12は待ち行列更新処理の手順例を示すフローチャートである。行列更新処理は相談窓口の待ち行列へ新たなユーザが加わった場合、又は、並んでいるユーザが待ち行列から離脱した場合に実行される。ユーザは新たに待ち行列に加わる場合、相談窓口を指定する。ユーザ端末3の制御部31は指定を受け付ける(ステップS41)。ユーザは並んでいる行列から離脱する場合、その旨を入力する。制御部31は離脱する旨を受け付ける(ステップS41)。制御部31はユーザID、窓口ID、及び、行列に加わるか/行列から離脱するかを示すフラグを含む更新情報を、メタバースサーバ1へ送信する(ステップS42)。メタバースサーバ1の処理部11は、更新情報を受信する(ステップS43)。処理部11はフラグを参照して、ユーザが行列に加わるのか否かを判定する(ステップS44)。処理部11は、ユーザが行列に加わると判定した場合(ステップS44でYES)、相談窓口に並んでいる待機ユーザのユーザIDを待ち行列DB127から取得する(ステップS45)。取得したユーザIDそれぞれ、及び、行列に加わるユーザのユーザIDに対応付けられたランクをユーザDB121から取得する(ステップS46)。ランクに従って、並び順をソートする(ステップS47)。処理部11はソートしたユーザIDを、待ち行列DB127に記憶する。処理部11はユーザに送信する通知を作成する(ステップS48)通知は既に並んでいて、新たなユーザが加わったことにより、並び順が変わった待機ユーザへ送信する通知を作成してもよい。逆に、ランクの高いユーザが新たに加わったことにより、順番が繰り下がった待機ユーザが気分を害さないように、待ち行列の何番目に並んでいるかを、一切通知しなくともよい。処理部11は作成した通知をユーザ端末3へ送信する(ステップS49)。ユーザ端末3の制御部31は通知を受信する(ステップS50)。制御部31は通知を表示し(ステップS51)、処理を終了する。処理部11は、ユーザが行列に加わらない、離脱すると判定した場合(ステップS44でNO)、待ち行列を更新する(ステップS52)。処理部11は、待ち行列DB127の待ち列に記憶しているユーザのユーザIDを削除する。処理部11は通知を作成する(ステップS53)。処理部11はユーザが抜けることにより、並び順が繰り上がるユーザに対する通知を作成してもよい。処理部11はステップS49以降を実行する。
【0054】
本実施の形態においては、待ち行列に加わるユーザのランクによって、並び順をソートするので、ランクの高いユーザは待ち時間が短くなるという効果を奏する。
【0055】
待ち行列に加わったユーザに対しては、順番と予想待ち時間を通知してもよい。また、既に並んでいるユーザについても、ユーザが問い合せ操作をした場合に、同様な通知をしてもよい。また、何れの相談窓口にも並んでいないユーザ向けの情報として、各相談窓口の待ち行列の人数と平均待ち時間を表示する掲示板を設けてもよい。
【0056】
並び順の変更は、ユーザの状況に基づいて、変更してもよい。例えば、並んでいる全ユーザに時間的な余裕がどの程度あるのかを申告してもらう。待ち時間が余裕時間に比べて極端に短い、時間に余裕が無いユーザについては、時間的に余裕があるユーザよりも、合理的な範囲で順番を早めてもよい。
【0057】
ランク以外のユーザ属性により、ユーザを他の相談窓口に誘導してもよい。例えば、ユーザに身体障碍があり、メタバースにおいても配慮が必要な場合である。耳が聞こえにくいが目に問題がないユーザに対しては、文字情報を充実させる。有効であるならば、相談員が発する声の周波数を変え、ユーザが聞き取りやすい音声を提供してもよい。また、文字チャットで相談可能な相談窓口へ、ユーザを誘導してもよい。
【0058】
目が見えにくいが聴くことには問題がないユーザに対しては、音声情報を充実させる。弱視等で白黒反転表示(ダークモード表示)や文字拡大表示などすると、ユーザが読める場合、ダークモード表示、文字拡大表示となるように表示出力を変更、または、ユーザ端末3の表示モードを制御してもよい。また、音声によるコミュニケーションに長けた相談員が担当する相談窓口へ、ユーザを誘導してもよい。
【0059】
(表示例)
図13はメタバース空間の例を示す説明図である。アバター130は待ち行列に並んでいない他のユーザを示す。掲示板134(モニタ)は相談窓口で話されている内容の話題を示す。話題の一つを選択すると、選択された窓口の対話音声を認識して得た文字列を表示してもよい。掲示板133は頻繁に相談される内容について話されている過去の対話音声を呼び出せるものである。ユーザが聞きたい話題を選択すると、対応する対話音声を聞くことができる。図13には相談窓口W1、相談窓口W2が表示されているが、相談窓口は1つでもよいし、3つ以上でもよい。吹き出し132はユーザが聞いている、又はユーザに聞こえている音声を示す。吹き出し135は、他ユーザが発言していることを示すが、ユーザには聞こえていないことを示す。なお、吹き出し132及び135は、対話内容を端的に示すキーワード等を表示するようにしてもよい。待ち時間表示136は、各相談窓口に設けられ、待ち行列に並んだ場合に、相談できるまでの待ち時間を示す。待ち時間に加えて、現在、相談しているユーザが、どのくらいの時間、話しているかを表示してもよい。アバター137は待ち行列を作っている他ユーザを示す。なお、待ち行列の表示については、実際に並んでいるユーザ数よりも、多くのアバターを表示しておくことにより、ランクが高いユーザが割り込んだとしても、他の待機ユーザには気づかないようにしてもよい。掲示板134、掲示板133に表示する内容を他の表示形態で提示してもよい。漫画の吹き出しのような表示形態や、文字が空間に浮いているような表示形態でもよい。この場合、視認性を確保するために、文字の背景は半透明とするのが望ましい。
【0060】
その他の表示手法としては、活発に話されている相談窓口については、背景を赤色にする又は湯気のマークを表示してもよい。また、楽しげに話されている相談窓口について、背景をオレンジ色にする又はスマイルマークを表示してもよい。これらの判定は、対話音声を認識して得られる文字列に含まれる単語を用いる、又は、対話音声より相談者又は窓口担当者の感情分析の結果を用いる。
【0061】
また、対話の内容の分析結果や、相談者の感情分析の結果、他ユーザには聞かせるべきではないと判定された相談窓口については、非表示に切り替えてもよい。また、相談窓口を非表示にはしないが、他ユーザには相談音声を聞かせないようにしてもよい。
【0062】
プライバシー情報のマスクについて、音声コミュニケーションの場合を説明したが、その他のコミュニケーションについても、同様である。ユーザが聴覚障碍者である場合、相談窓口では文字チャットで相談するようにしても良い旨を述べたが、プライバシー情報を伏せ字にした上で、チャット内容を他のユーザに公開してもよい。さらに、視覚障碍者ユーザ向けに文字チャットの内容を音声合成技術により、会話音声に変換して提供してもよい。対話音声は、音声認識技術によりテキスト化し、プライバシー情報を伏せ字にした上で、テキストを聴覚障碍者ユーザへ提供してもよい。
【0063】
(秘匿レベルを用いた配信処理)
上述の実施の形態においては、プライバシー情報は一律にマスクするとしたが、対話音声を第三者には一切聞かれたくないと考えるユーザや、プライバシー情報を含めて対話音声の全てを第三者に聞かれても構わないと考えるユーザも想定し得る。以下、相談ユーザが予め設定した秘匿レベルを用いた配信処理に付いて説明する。上述したように、秘匿レベルはユーザDB121の秘匿レベル列に記憶してある。図14は配信処理の他の手順例を示すフローチャートである。図14に示す配信処理は、図7に示した配信処理を変形したものである。以下の説明においては、図7と同様な処理については、説明を省略するか、簡略に説明する。メタバースサーバ1の処理部11は、待機ユーザの位置を更新する(ステップS61)。処理部11は対象音声があるか否かを判定する(ステップS62)。処理部11は対象音声がないと判定した場合(ステップS62でNO)、処理をステップS61へ戻す。処理部11は対象音声があると判定した場合(ステップS62でYES)、対象となる対話音声に係る対話の一方当事者である相談ユーザを特定する(ステップS63)。処理部11は対象となる相談窓口の窓口IDをキーに待ち行列DB127を検索し、ヒットしたレコードの着席列に記憶されたユーザIDを取得する。当該ユーザIDが相談ユーザを特定するユーザIDである。処理部11は相談ユーザが設定した秘匿レベルをユーザDB121から取得する(ステップS64)。処理部11は秘匿レベルが通常であるか否かを判定する(ステップS65)。処理部11は秘匿レベルが通常であると判定した場合(ステップS65でYES)、ステップS66以降を実行する。ステップS66からステップS70は、それぞれ図7のステップS3からステップS7と同様であるから説明を省略する。処理部11は秘匿レベルが通常でないと判定した場合(ステップS65でNO)、秘匿レベルがオープンであるか否かを判定する(ステップS71)。処理部11は、秘匿レベルがオープンであると判定した場合(ステップS71でYES)、取得した対話音声に何ら手を加えることなく、ステップS69を実行する。処理部11は、秘匿レベルがオープンでない、クローズと判定した場合(ステップS71でNO)、取得した音声を全てマスクした全マスク音声を生成する(ステップS72)。マスク方法をビープ音への置換とすると耳障りが悪くなるので、無音とするのが望ましい。処理部11は、音声のないストリーミングデータを作成する。
【0064】
図14による配信処理により、相談ユーザによって、プライバシー情報の秘匿レベルを変更することが可能となる。なお、秘匿レベルをオープンにしているユーザには、インセンティブを付与してもよい。
【0065】
秘匿レベルは、第1アバター(相談ユーザ)の発言と窓口担当者の発言とで、それぞれ異なる設定を可能としてもよい。例えば、第1アバターの発言はクローズとするが、窓口担当者の発言はオープンとする設定である。それにより、対話内容をすべてクローズにする場合と比較して、第1アバターの秘匿レベルを確保しつつ、窓口担当者の発言をオープンとするので、第2アバター(待機ユーザ)への情報提供が可能となる。
【0066】
各実施の形態で記載されている技術的特徴(構成要件)はお互いに組み合わせ可能であり、組み合わせすることにより、新しい技術的特徴を形成することができる。
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。また、特許請求の範囲には他の2以上のクレームを引用するクレームを記載する形式(マルチクレーム形式)を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム(マルチマルチクレーム)を記載する形式を用いて記載しても良い。
【0067】
以上の実施の形態1乃至4を含む実施形態に関し、さらに以下の付記を開示する。
【0068】
(付記1)
メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得し、
前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する
処理をコンピュータに実行させるプログラム。
【0069】
(付記2)
前記対話データに含まれるプライバシーデータを削除する編集を行い、前記編集対話データを生成する
付記1に記載のプログラム。
【0070】
(付記3)
前記第2アバターから希望する前記対話データの属性を受け付け、
前記サービス提供側アバターと前記第1アバターとの前記対話データより、受け付けた前記属性に対応する前記対話データを抽出し、
抽出した前記対話データに基づく前記編集対話データを生成する
付記1又は付記2に記載のプログラム。
【0071】
(付記4)
前記編集対話データを前記第2アバターに視認可能な状態で出力する
付記1又は付記2に記載のプログラム。
【0072】
(付記5)
前記第2アバターそれぞれの属性に基づいて、前記サービス窓口とは異なるサービス窓口への移動を促す表示を行う
付記1又は付記2に記載のプログラム。
【0073】
(付記6)
前記第1アバターを利用するユーザより予め受け付けた秘匿設定に基づき、前記編集により秘匿するプライバシーデータの秘匿レベルを変更する
付記1又は付記2に記載のプログラム。
【0074】
(付記7)
前記第1アバターに続いて並ぶ前記第2アバターが複数の場合、複数の前記第2アバターそれぞれの属性に基づいて、並び順を変更する
付記1又は付記2に記載のプログラム。
【0075】
(付記8)
メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得する取得部と、
前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する出力部と
を備えるデータ提供装置。
【0076】
(付記8)
コンピュータが、
メタバースにおけるサービス窓口でのサービス提供側アバターと第1アバターとの対話データを取得し、
前記サービス窓口に前記第1アバターに続いて並ぶ第2アバターに対し、前記対話データを編集した編集対話データを出力する
処理を行うデータ提供方法。
【0077】
(付記9)
前記第1アバター若しくは前記サービス提供側アバターの音声レベルにより、又は、前記第2アバターと前記第1アバターとの距離に応じて削除レベル変更する
付記6に記載のプログラム。
【符号の説明】
【0078】
100 :相談窓口システム
1 :メタバースサーバ
11 :処理部
11a :受付部
11b :更新部
11c :モデリング処理部
11d :音声取得部
11e :解析部
11f :音声出力部
11g :配信部
11h :行列管理部
12 :記憶部
121 :ユーザDB
122 :3DモデルDB
123 :画像DB
124 :動画DB
125 :パターンDB
126 :題目DB
127 :待ち行列DB
131 :音声翻訳モデル
14 :通信部
1P :制御プログラム
2 :窓口端末
21 :制御部
22 :主記憶部
23 :補助記憶部
24 :通信部
25 :入力部
26 :表示部
2P :制御プログラム
3 :ユーザ端末
31 :制御部
32 :主記憶部
33 :補助記憶部
34 :通信部
35 :表示パネル
36 :操作部
B :バス
N :ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14