IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ソフトバンクグループ株式会社の特許一覧

特開2025-90429データ処理装置、データ処理方法、及びデータ処理プログラム
<>
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図1
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図2
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図3A
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図3B
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図3C
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図4
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図5
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図6
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図7
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図8
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図9
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図10
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図11
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図12
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図13
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図14
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図15
  • 特開-データ処理装置、データ処理方法、及びデータ処理プログラム 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025090429
(43)【公開日】2025-06-17
(54)【発明の名称】データ処理装置、データ処理方法、及びデータ処理プログラム
(51)【国際特許分類】
   G06F 16/90 20190101AFI20250610BHJP
【FI】
G06F16/90 100
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2023205637
(22)【出願日】2023-12-05
(71)【出願人】
【識別番号】591280485
【氏名又は名称】ソフトバンクグループ株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】稲垣 仁美
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175EA01
5B175GA04
5B175GC01
(57)【要約】
【課題】ALSの当事者に対して他者とのコミュニケーションを支援することができるデータ処理装置、データ処理方法、及びデータ処理プログラムを提供する。
【解決手段】データ処理装置は、ユーザデータを取得する入力部292と、ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行う処理部294と、特定処理の結果を所定のデバイスに出力する出力部296と、を備え、入力部292は、デバイスからユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、処理部294は、上記文字データを入力したときのデータ生成モデルの出力を用いて、当該文字データが示す文字に関連する文章データを導出する処理を特定処理として行う。
【選択図】図4
【特許請求の範囲】
【請求項1】
ユーザデータを取得する入力部と、
前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行う処理部と、
前記特定処理の結果を所定のデバイスに出力する出力部と、を備え、
前記入力部は、前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、
前記処理部は、前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、
データ処理装置。
【請求項2】
前記入力部は、前記デバイスから前記ユーザデータとして、前記文章データの方向性を示す方向性データを更に取得し、
前記処理部は、前記文字データ及び前記方向性データを入力したときの前記データ生成モデルの出力を用いて、前記文章データの候補を導出する処理を前記特定処理として行う、
請求項1に記載のデータ処理装置。
【請求項3】
前記方向性データは、肯定的な方向性、否定的な方向性、疑問形の方向性、励ます方向性、優しさに関する方向性、及び感情に関する方向性の少なくとも1つの方向性を示すデータである、
請求項2に記載のデータ処理装置。
【請求項4】
前記文章データは、前記ユーザと、当該文章データに含まれる登場人物との関係性が反映されたデータである、
請求項1又は請求項2に記載のデータ処理装置。
【請求項5】
前記関係性は、家族、友人、先輩、後輩、及び恋人の少なくとも1つの関係性を含む、
請求項4に記載のデータ処理装置。
【請求項6】
前記文章データは、前記ユーザが作成した過去の文章が反映されたデータである、
請求項1又は請求項2に記載のデータ処理装置。
【請求項7】
前記過去の文章は、前記ユーザが電子メールでのやり取りの際に作成した文章、及び前記ユーザがソーシャル・ネットワーキング・サービスで発信した文章の少なくとも一方を含む、
請求項6に記載のデータ処理装置。
【請求項8】
前記文章データは、前記ユーザの口調が反映されたデータである、
請求項1又は請求項2に記載のデータ処理装置。
【請求項9】
前記ユーザの口調は、書き言葉の口調、及び話し言葉の口調の少なくとも一方を含む、
請求項8に記載のデータ処理装置。
【請求項10】
前記処理部は、前記文章データとして、前記文字データに関連する複数の文章データを選択候補として導出し、
前記出力部は、前記選択候補を前記デバイスに出力し、
前記入力部は、ユーザによる前記選択候補からの選択指示を更に取得する、
請求項1に記載のデータ処理装置。
【請求項11】
前記デバイスは、スマート眼鏡である、
請求項1に記載のデータ処理装置。
【請求項12】
ユーザデータを取得し、
前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行い、
前記特定処理の結果を所定のデバイスに出力するデータ処理方法であって、
前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、
前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、
データ処理方法。
【請求項13】
ユーザデータを取得し、
前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行い、
前記特定処理の結果を所定のデバイスに出力する処理であって、
前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、
前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、
処理をコンピュータに実行させるデータ処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の技術は、データ処理装置、データ処理方法、及びデータ処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、少なくとも一つのプロセッサにより遂行される、ペルソナチャットボット制御方法であって、ユーザ発話を受信するステップと、前記ユーザ発話を、チャットボットのキャラクターに関する説明と関連した指示文を含むプロンプトに追加するステップと前記プロンプトをエンコードするステップと、前記エンコードしたプロンプトを言語モデルに入力して、前記ユーザ発話に応答するチャットボット発話を生成するステップ、を含む、方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-180282号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら従来技術では、ALS(Amyotrophic Lateral Sclerosis、筋萎縮性側索硬化症、以下「ALS」という。)の当事者に対して他者とのコミュニケーションを支援するうえで改善の余地がある。
【課題を解決するための手段】
【0005】
本開示の技術に係る第1の態様は、ユーザデータを取得する入力部と、前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行う処理部と、前記特定処理の結果を所定のデバイスに出力する出力部と、を備え、前記入力部は、前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、前記処理部は、前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、データ処理装置である。
【0006】
本開示の技術に係る第2の態様は、ユーザデータを取得し、前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行い、前記特定処理の結果を所定のデバイスに出力するデータ処理方法であって、前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、データ処理方法である。
【0007】
本開示の技術に係る第3の態様は、ユーザデータを取得し、前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行い、前記特定処理の結果を所定のデバイスに出力する処理であって、前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、処理をコンピュータに実行させるデータ処理プログラムである。
【図面の簡単な説明】
【0008】
図1】データ処理システムの構成の一例を示す概念図である。
図2】データ処理装置及びユーザ端末の要部機能の一例を示す概念図である。
図3A】特定処理の概要を示す。
図3B】特定処理の概要を示す。
図3C】特定処理の概要を示す。
図4】データ処理装置の特定処理部の機能構成を概略的に示す。
図5】データ生成モデルを用いた処理の流れの一例を示す図である。
図6】データ処理装置による特定処理の動作フローの一例を概略的に示す。
図7】意思伝達支援画面の一例を示す図である。
図8】意思伝達支援画面の一例を示す図である。
図9】意思伝達支援画面の一例を示す図である。
図10】意思伝達支援画面の一例を示す図である。
図11】意思伝達支援画面の一例を示す図である。
図12】意思伝達支援画面の一例を示す図である。
図13】意思伝達支援画面の一例を示す図である。
図14】意思伝達支援画面の一例を示す図である。
図15】意思伝達支援画面の一例を示す図である。
図16】特定処理の全体的な内容を示す図である。
【発明を実施するための形態】
【0009】
以下、添付図面に従って本開示の技術に係るデータ処理装置、データ処理方法、及びデータ処理プログラムの実施形態の一例について説明する。
【0010】
先ず、以下の説明で使用される文言について説明する。
【0011】
以下の実施形態において、符号付きのプロセッサ(以下、単に「プロセッサ」と称する)は、1つの演算装置であってもよいし、複数の演算装置の組み合わせであってもよい。また、プロセッサは、1種類の演算装置であってもよいし、複数種類の演算装置の組み合わせであってもよい。演算装置の一例としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、GPGPU(General-Purpose computing on Graphics Processing Units)、APU(Accelerated Processing Unit)、又はTPU(Tensor Processing Unit)等が挙げられる。
【0012】
以下の実施形態において、符号付きのRAM(Random Access Memory)は、一時的に情報が格納されるメモリであり、プロセッサによってワークメモリとして用いられる。
【0013】
以下の実施形態において、符号付きのストレージは、各種プログラム及び各種パラメータ等を記憶する1つ又は複数の不揮発性の記憶装置である。不揮発性の記憶装置の一例としては、フラッシュメモリ(SSD(Solid State Drive))、磁気ディスク(例えば、ハードディスク)、又は磁気テープ等が挙げられる。
【0014】
以下の実施形態において、符号付きの通信I/F(Interface)は、通信プロセッサ及びアンテナ等を含むインタフェースである。通信I/Fは、複数のコンピュータ間での通信を司る。通信I/Fに対して適用される通信規格の一例としては、5G(5th Generation Mobile Communication System)、Wi-Fi(登録商標)、又はBluetooth(登録商標)等を含む無線通信規格が挙げられる。
【0015】
以下の実施形態において、「A及び/又はB」は、「A及びBのうちの少なくとも1つ」と同義である。つまり、「A及び/又はB」は、Aだけであってもよいし、Bだけであってもよいし、A及びBの組み合わせであってもよい、という意味である。また、本明細書において、3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「A及び/又はB」と同様の考え方が適用される。
【0016】
図1には、実施形態に係るデータ処理システム10の構成の一例が示されている。
【0017】
図1に示すように、データ処理システム10は、データ処理装置12及びユーザ端末14を備えている。データ処理装置12の一例としては、サーバが挙げられる。ユーザ端末14の一例としては、パーソナルコンピュータが挙げられる。本実施形態において、データ処理装置12は、本開示の技術に係る「データ処理装置」の一例であり、ユーザ端末14は、本開示の技術に係る「デバイス」の一例である。
【0018】
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。
【0019】
ユーザ端末14は、コンピュータ36、受付装置38、出力装置40、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、受付装置38、出力装置40、及びカメラ42も、バス52に接続されている。
【0020】
受付装置38は、タッチパネル38A及びマイクロフォン38B等を備えており、ユーザ入力を受け付ける。タッチパネル38Aは、指示体(例えば、ペン又は指等)の接触を検出することにより、指示体の接触によるユーザ入力を受け付ける。マイクロフォン38Bは、ユーザの音声を検出することにより、音声によるユーザ入力を受け付ける。後述する制御部46Aは、タッチパネル38A及びマイクロフォン38Bによって受け付けたユーザ入力を示すデータをデータ処理装置12に送信する。データ処理装置12では、後述する特定処理部290が、ユーザ入力を示すデータを取得する。
【0021】
出力装置40は、ディスプレイ40A及びスピーカ40B等を備えており、データをユーザが知覚可能な表現形(例えば、音声及び/又はテキスト)で出力することでデータをユーザに対して提示する。ディスプレイ40Aは、プロセッサ46からの指示に従ってテキスト及び画像等の可視情報を表示する。スピーカ40Bは、プロセッサ46からの指示に従って音声を出力する。カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラである。
【0022】
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。
【0023】
図2には、データ処理装置12及びユーザ端末14の要部機能の一例が示されている。
【0024】
図2に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。特定処理プログラム56は、本開示の技術に係る「データ処理プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って特定処理部290として動作することによって実現される。
【0025】
ストレージ32には、データ生成モデル58が格納されている。データ生成モデル58は、特定処理部290によって用いられる。
【0026】
ユーザ端末14では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム62が格納されている。受付出力プログラム62は、データ処理システム10によって特定処理プログラム56と併用される。プロセッサ46は、ストレージ50から受付出力プログラム62を読み出し、読み出した受付出力プログラム62をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム62に従って、制御部46Aとして動作することによって実現される。
【0027】
次に、データ処理装置12がALSの当事者に対して他者とのコミュニケーションを支援する特定処理を行う際の、特定処理部290の処理について説明する。
【0028】
ALSの当事者は、自力で話せなくなると眼球運動で操作できる意思伝達装置を使うことが多い。しかし、病気の進行が極度に進むと、操作に多くの時間を要し、「はい/いいえ」や定型文以外のことを伝えることが難しい。このため、日常会話を楽しむことや本人の経験やスキルを使ったやり取りが困難となる。
【0029】
図3Aには、従来のALSの当事者(以下、「ユーザ」ともいう。)に対する他者とのコミュニケーションを支援するための意思伝達装置の表示画面(以下、「意思伝達支援画面」という。)の一例が示されている。なお、図3Aでは、意思伝達支援画面の一例として、左側にユーザの視線によって選択可能とされたメニュー項目を表示し、右側にユーザがメニュー項目の選択指定を行う際に当該ユーザによって注視される選択ボタンを表示する場合が例示されている。
【0030】
図3Aに示す従来の意思伝達支援画面では、ユーザによる視線によって選択可能なメニュー項目として「はい・いいえ」項目、「文字を書く」項目、「定型文」項目等といった複数のメニュー項目が表示される。そして、この意思伝達支援画面では、複数のメニュー項目における何れか1つのメニュー項目の表示状態が他のメニュー項目とは異なる状態となるように、予め定められた時間(例えば、2秒)間隔で、かつ、メニュー項目の並び方向(図3Aに示す例では、上から下に向かう方向)に順次かつ繰り返し切り替えられる。なお、図3Aに示す例では、表示状態が他とは異なる状態となっているメニュー項目が選択ボタンの表示領域内に表示されている。
【0031】
この意思伝達支援画面では、ユーザによる視線の検出結果を用いて、当該視線が選択ボタンを予め定められた期間(例えば、0.5秒)以上注視した時点で表示状態が異なっているメニュー項目がユーザによって選択されたメニュー項目であると特定する。
【0032】
このような従来の意思伝達支援画面では、ユーザに対する目の負担が大きく、長文を打つことが難しい、定型文による要求や「はい/いいえ」の返答のみになりがちで日常会話をする余裕がない、といった問題があった。
【0033】
そこで、本実施形態に係るデータ処理システム10では、ユーザによる視線の検出結果を用いて、他者からの話しかけに対する返答文を示す文章データを、データ生成モデル58を用いて導出する。
【0034】
即ち、本実施形態に係るデータ処理システム10では、一例として図3Bに示すように、家族、友人等といった他者(対話の相手であり、以下、「対話者」という。)82からメッセージが届くと、当該メッセージをユーザ80が用いるユーザ端末14のディスプレイ40Aにより表示させる。
【0035】
本実施形態に係るデータ生成モデル58は、生成する文章データのキーとなる1文字から数文字までの範囲(本実施形態では、1文字から5文字までの範囲)の文字データ(以下、単に「文字データ」という。)、及び生成する文章データの方向性を示す方向性データ(以下、単に「方向性データ」という。)を入力することで当該文章データを生成するものとして予め機械学習されたものとされている。
【0036】
なお、文字データは、ユーザ80が生成したい(意図する)文章データ(以下、単に「文章データ」という。)の内容、又は、対話者82による発言に対して感じたことの代表的な単語、又は当該単語の一部や、当該単語を含む文字列を示すデータである。また、方向性データは、対話者82による発言に対するユーザ80自身の返答の内容の方向性、即ち文章データの内容の方向性を示すデータであり、肯定的、否定的、疑問形、励ます、優しい、感情的等といった予め定められた複数種類の方向性から選択的に適用されるデータである。
【0037】
ユーザ端末14のディスプレイ40Aに上記メッセージが表示されると、ユーザ80は、当該メッセージに対する返答文に対応する文字データ、及び当該返答文の方向性を示す方向性データを視線により選択的に入力する。ユーザ80によって入力された文字データ及び方向性データはデータ生成モデル58に入力されることで、当該文字データ及び方向性データに応じた返答文の候補となる文章データが生成され、ユーザ端末14のディスプレイ40Aに当該文章データが示す返答文の候補が表示される。
【0038】
ユーザ端末14のディスプレイ40Aに上記返答文の候補が表示されると、ユーザ80は、内容が意図したものである場合や、意図したものに近く、返答文として採用する場合には、当該返答文を視線により選択する。ユーザによって返答文が選択されると、当該返答文が、対話者82が用いるデバイスによって表示される。
【0039】
本実施形態に係るデータ処理システム10では、ユーザ80の視線を、カメラ42によってユーザ80の顔をリアルタイムで撮影することで得られた顔画像を用いて、従来既知のアイトラッキング技術を用いて行っているが、これに限るものではない。例えば、ユーザ80がスマート眼鏡を装着することで、当該スマート眼鏡を用いてユーザ80の視線を検出する形態としてもよい。
【0040】
図3Cには、本実施形態に係るデータ処理システム10の具体的な適用例が示されている。なお、図3Cに示す例では、対話者82が、自身が読んだ本に関してユーザ80に話しかけを行っている場合が例示されている。
【0041】
図3Cに示すように、この適用例では、まず、対話者82が「昨日ABCという本を読んだよ。とても面白かった!」といった発言を行う。これにより、当該発言の内容を示すデータがユーザ端末14に入力され、ユーザ端末14のディスプレイ40Aには当該発言の内容が表示される。
【0042】
これに対して、ユーザ80は、「その本の内容の何が面白かったんだろう?」と考えた場合には、ユーザ端末14により、自身の視線によって、一例として「ないよう」という4文字の文字データを入力すると共に、「疑問形」との方向性データを選択する。
【0043】
ユーザ80により文字データの入力及び方向性データの選択が終了すると、これらのデータがデータ処理装置12に送信され、データ生成モデル58に入力されることで、返答文の選択候補として「ABCって、どんな話だった?」、「何がそんなに面白かったの?紹介してくれる?」といった文章データが生成され、これらの選択候補の文章データが示す文章がユーザ端末14に表示される。
【0044】
そこで、ユーザ80は、採用する文章データを自身の視線により選択する。ユーザ80によって文章データが選択されると、ユーザ端末14により、当該文章データが示す文章を一例として音声により再生する。当該再生が行われると、対話者82は、「ABCの内容はね・・・」、「面白かったところは・・・」等といった返答を行う。
【0045】
以上のようなやり取りを繰り返すことで、ユーザ80と対話者82とのコミュニケーションが行われる。この際、ユーザ80は、自身の視線により、数文字程度の文字、方向性、及びデータ生成モデル58によって生成された返答文の選択候補からの実際に返答する文の選択を行うことのみによって自身の意図に応じた返答を行うことができる。この結果として、ユーザ80は対話者82とのコミュニケーションを、よりストレスのない状態で行うことができる。
【0046】
本実施形態に係る特定処理部290は、図4に示すように、入力部292、処理部294、及び出力部296を備えている。
【0047】
入力部292は、ユーザ端末14で受け付けたユーザデータを取得する。具体的には、ユーザ端末14からユーザデータとして、ユーザ80の視線を用いて入力された文字を示す文字データを取得する。
【0048】
処理部294は、データ生成モデル58を用いた特定処理を行う。具体的には、入力部292によって取得された文字データを入力したときのデータ生成モデル58の出力を用いて、当該文字データが示す文字に関連する文章データを導出する処理を特定処理として行う。
【0049】
出力部296は、特定処理の結果をユーザ端末14に送信する。ユーザ端末14では、制御部46Aが、出力装置40に対して特定処理の結果を出力させる。
【0050】
ここで、本実施形態に係る入力部292は、上述したように、ユーザ端末14からユーザデータとして、文章データの方向性を示す方向性データを更に取得し、処理部294は、文字データ及び方向性データを入力したときのデータ生成モデル58の出力を用いて、文章データの候補を導出する処理を特定処理として行う。
【0051】
なお、本実施形態では、方向性データとして、肯定的な方向性、否定的な方向性、疑問形の方向性、励ます方向性、優しさに関する方向性、及び感情に関する方向性の各方向性を示すデータを適用しているが、これに限るものではない。例えば、これらの方向性のうちの何れか1つ、又は、全てを除く複数の組み合わせのデータを方向性データとして適用する形態としてもよい。
【0052】
また、本実施形態では、文章データとして、ユーザ80と、当該文章データに含まれる登場人物との関係性が反映されたデータを適用しており、当該関係性を、家族、友人、先輩、後輩、及び恋人の各関係性を含むものとしている。但し、この形態に限るものではなく、例えば、これらの関係性のうちの何れか1つ、又は、全てを除く複数の組み合わせを上記関係性に含める形態としてもよい。
【0053】
また、本実施形態では、文章データとして、ユーザ80が作成した過去の文章が反映されたデータを適用しており、当該過去の文章を、ユーザ80が電子メールでのやり取りの際に作成した文章、及びユーザ80がソーシャル・ネットワーキング・サービス(以下、「SNS」という。)で発信した文章の双方を含むものとしている。但し、この形態に限るものではなく、例えば、これらの文章のうちの何れか一方を上記過去の文章に含める形態としてもよい。
【0054】
また、本実施形態では、文章データとして、ユーザ80の口調が反映されたデータを適用しており、当該ユーザ80の口調を、書き言葉の口調、及び話し言葉の口調の双方を含むものとしている。但し、この形態に限るものではなく、例えば、これらの口調のうちの何れか一方を上記ユーザ80の口調に含める形態としてもよい。なお、ここでいう口調の種類としては、敬語や丁寧語の使用状況等といった語尾の特徴を表す口調、句読点や引用符、括弧等の使用状況等といった文法的な特徴を表す口調、言い回しの特徴を表す口調、個人の性格を表す口調等を例示することができる。
【0055】
更に、本実施形態に係る処理部294は、文章データとして、上述した文字データに関連する複数の文章データを選択候補として導出し、出力部296は、当該選択候補をユーザ端末14に出力し、入力部292は、ユーザ80による選択候補からの選択指示を更に取得する。
【0056】
このように、本実施形態では、本開示の技術におけるデバイスとしてユーザ端末14を適用しているが、これに限るものではない。例えば、ユーザ80の視線を検出することができるスマート眼鏡を本開示の技術におけるデバイスとして適用する形態としてもよい。この形態においては、スマート眼鏡によって各種情報を表示することもできるため、ユーザ80にとっての利便性を、より向上させることができる。
【0057】
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等(本実施形態では、テキストデータ)の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等(本実施形態では、テキストデータ)のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。
【0058】
一例として図5に示すように、本実施形態では、プロンプトを3つのフェーズに分解することで、データ生成モデル58によって生成される返答文にユーザ80自身の自分らしさを反映させ、この結果として、当該返答文の精度を向上させるものとしている。
【0059】
即ち、1段階目のフェーズは解析フェーズであり、直前までの会話の履歴から発言のジャンル等を予想する、検索が必要か否かを判断して検索ワードを生成する、予め登録しておいた登場人物が話題に出ているか否かを判断する等といったことを行う。
【0060】
また、2段階目のフェーズは検索フェーズであり、解析フェーズで生成した検索ワードを用いて、ALSの当事者が以前記載した電子メールや、SNS、文書の文章等をベクトル検索して、返答文の生成に必要な情報を取得する。
【0061】
そして、3段階目のフェーズは候補生成フェーズであり、解析フェーズと検索フェーズの結果を参考に、当事者が視線により入力した数文字程度の文字データ及び方向性データから返答文の候補を生成する。
【0062】
次に、データ処理システム10の作用について説明する。
【0063】
特定処理の流れの一例について図6を参照しながら説明する。なお、図6に示す特定処理の流れは、本開示の技術に係る「データ処理方法」の一例であり、データ処理装置12のプロセッサ28によって繰り返し実行される。以下では、対話者82が、自身が所持するスマートフォン等のユーザ端末(図示省略。以下、「対話者端末」という。)を用いて、ALSの当事者が用いるユーザ端末14に対して対話を持ちかける場合について説明するが、これに限るものではない。例えば、対話者82が直接、ALSの当事者に話しかけることで対話を持ちかける形態としてもよい。この場合、対話者82によって話しかけられた内容を示すテキストデータを、データ処理装置12又はユーザ端末14により、従来既知の音声認識技術やデータ生成モデル58等によって導出して適用する形態が例示される。
【0064】
図6のステップS300で、プロセッサ28は、ユーザ端末14が対話者端末から対話の持ちかけを示す情報(対話者が最初に話しかけた内容を示す情報)を受信したか否かを判定することで、対話者82からユーザ80への対話の持ちかけがあったか否かを判定し、否定判定となった場合はステップS322に移行する一方、肯定判定となった場合はステップS302に移行する。
【0065】
ステップS302で、プロセッサ28は、ユーザ端末14が対話者端末から受信した対話の持ちかけを示す情報を用いて、予め定められた構成とされた意思伝達支援画面をディスプレイ40Aに表示するようにユーザ端末14を制御する。図7には、ステップS302の処理によってユーザ端末14のディスプレイ40Aに表示される意思伝達支援画面の一例が示されている。
【0066】
図7に示すように、この意思伝達支援画面では、対話者82とユーザ80とのやり取りの内容を表示する領域である対話表示領域70Aが、対話者82から最初に話しかけられた内容を示す、話しかけ文70A1が表示された状態で表示される。また、この意思伝達支援画面では、ユーザ80による視線によって選択的に指定可能とされた各種メニュー項目を表示する領域であるメニュー表示領域70Bが設けられている。
【0067】
なお、この意思伝達支援画面においても、図3Aに示した従来のものと同様に、複数のメニュー項目における何れか1つのメニュー項目の表示状態が他のメニュー項目とは異なる状態(図7に示す例では、網掛け状態)となるように、予め定められた時間(例えば、2秒)間隔で、かつ、メニュー項目の並び方向(図7に示す例では、上から下に向かう方向)に順次かつ繰り返し切り替えられる。
【0068】
また、この意思伝達支援画面では、ユーザ80がメニュー表示領域70Bに表示されている何れかのメニュー項目の指定を行う際に当該ユーザ80によって注視される選択ボタン70Cが表示されると共に、ユーザ80により視線によって入力された文字データが表示される領域である文字データ表示領域70Dが表示される。なお、本実施形態では、他のメニュー項目とは異なる表示状態となっているメニュー項目を示す情報が選択ボタン70Cの表示領域に表示されるものとされている。そして、本実施形態では、所望のメニュー項目を示す情報が選択ボタン70Cに表示されているタイミングで選択ボタン70Cをユーザ80が注視することで、当該所望のメニュー項目を指定する形態とされているが、これに限るものではない。例えば、所望のメニュー項目の表示領域そのものを予め定められた期間(例えば3秒間)注視することで、当該所望のメニュー項目を指定する形態としてもよい。
【0069】
図7に示す意思伝達支援画面では、話しかけ文70A1として「最近、介護の仕事が忙しくて、・・・相談させていただきたいのですが、よろしいでしょうか?」との問いかけの文章が表示されている。また、図7に示すように、この意思伝達支援画面では、メニュー表示領域70Bに対して、「はい」又は「いいえ」を指定する場合に指定される「はい・いいえ」項目、文字データを入力する場合に指定される「文字を書く」項目、及びデータ生成モデル58による補助を受ける場合に指定される「AI補助」項目が表示される。また、この意思伝達支援画面では、メニュー表示領域70Bに対して、予め登録された定型文を用いる場合に指定される「定型文」項目、適用することを決定した文章データを対話者82に対して送信する場合に指定される「送信」項目、及び文章データから一部の文字又は文字列を削除する場合に選択される「削除」項目が表示される。なお、以下では、錯綜を回避するために、「定型文」項目及び「削除」項目が指定される場合については説明を省略する。
【0070】
ステップS304で、プロセッサ28は、ユーザ80からの視線による何れかのメニュー項目の指定が行われるまで待機する。ステップS306で、プロセッサ28は、ユーザ80によって「はい・いいえ」項目が指定されたか否かを判定し、肯定判定となった場合はステップS308に移行して、予め定められた、はい・いいえ処理を実行する。
【0071】
本実施形態に係るはい・いいえ処理では、メニュー表示領域70Bに表示されている各メニュー項目に代えて、「はい」及び「いいえ」の何れか一方を視線により選択的に指定可能とする表示が行われる。そこで、ユーザ80は、対話者82による話しかけに対応する場合は「はい」を、当該話しかけに対応しない場合は「いいえ」を、各々視線により指定する。このユーザ80による指定に応じて、プロセッサ28は、一例として図7に示すように、ユーザ80によって指定された「はい」又は「いいえ」を、話しかけ文70A1に続けて表示するようにユーザ端末14を制御すると共に、当該「はい」又は「いいえ」を示す情報を対話者端末に送信する。なお、図7に示す例では、ユーザ80によって「はい」が指定され、この結果として「はい」との返答文70A2が表示された場合が例示されている。また、上記「はい」又は「いいえ」を示す情報を対話者端末に送信することで、対話者端末には、図7に示した返答文70A2と同様の文が、図7に示した対話表示領域70Aと同様に表示される。
【0072】
対話者端末において「はい」との返答文が表示されると、対話者82は、より具体的な内容の話しかけを行う。これに応じて対話者端末は、ユーザ端末14に対して、当該話しかけの内容を示す情報を送信する。ユーザ端末14に当該話しかけの内容を示す情報が受信されると、プロセッサ28は、一例として図8に示すように、当該話しかけの内容を示す、話しかけ文70A3を、返答文70A2に続けて表示するようにユーザ端末14を制御し、その後にステップS322に移行する。なお、図8に示す例では、話しかけ文70A3として、「ありがとうございます。・・・どのように関わって行けば良いでしょうか?」との文章が表示されている場合が例示されている。
【0073】
一方、ステップS306において否定判定となった場合はステップS310に移行する。ステップS310で、プロセッサ28は、一例として図9の上図に示すように、ユーザ80により、話しかけ文70A3に対する返答文を入力するべく、「文字を書く」項目が指定されたか否かを判定し、肯定判定となった場合はステップS312に移行して、予め定められた視線文字入力処理を実行する。なお、図9図15に示す例では、ディスプレイ40Aの直下にユーザ80の瞳の位置を示す画像が模式的に例示されており、当該瞳の動き(移動)を、便宜上、ユーザ80側から見た場合の瞳の動きとして描画しているが、実際のユーザ80の瞳の動きの方向は図示しているものとは逆の方向となる。
【0074】
本実施形態に係る視線文字入力処理では、プロセッサ28により、一例として図9の下図に示すように、メニュー表示領域70Bに表示されている各メニュー項目に代えて、文字を1文字ずつ視線により選択的に指定可能とする表示が行われる。そこで、ユーザ80は、上述した数文字分の文字データを視線により指定する。このユーザ80による指定に応じて、プロセッサ28は、一例として図10に示すように、ユーザ80によって指定された文字データが示す文字列を、文字データ表示領域70Dに表示するようにユーザ端末14を制御し、その後にステップS322に移行する。なお、図10に示す例では、ユーザ80により、話しかけ文70A3に対する返答文の内容のキーとなる単語として「コミュニケーション」を想定し、その先頭の3文字である「コミュ」との文字列が指定され、この結果として当該文字列が文字データ表示領域70Dに表示された場合が例示されている。
【0075】
一方、ステップS310において否定判定となった場合はステップS314に移行する。ステップS314で、プロセッサ28は、一例として図10に示すように、ユーザ80によって「AI補助」項目が指定されたか否かを判定し、肯定判定となった場合はステップS316に移行して、予め定められたAI補助処理を実行する。
【0076】
本実施形態に係るAI補助処理では、まず、プロセッサ28により、一例として図11に示すように、メニュー表示領域70Bに表示されている各メニュー項目に代えて、上述した複数種類の方向性を示す文字列が視線により選択的に指定可能とする表示が行われる。そこで、ユーザ80は、所望の方向性を示す文字列を視線により指定する。なお、図11に示す例では、ユーザ80によって「励ますように」との方向性を示す文字列が指定された場合が例示されている。
【0077】
次いで、プロセッサ28は、ユーザ80によって指定された文字列を示す文字データ及び方向性を示す方向性データを用いて、上述したように、データ生成モデル58により、当該文字データが示す文字列に関連し、かつ、当該方向性データが示す方向性となる、各々返答文の候補を示す複数の文章データを生成する。そして、プロセッサ28は、一例として図12に示すように、生成した複数の文章データにおける何れか1つの文章データが示す返答文の候補文70B1をメニュー表示領域70Bに表示するようにユーザ端末14を制御する。この際、プロセッサ28は、図12に示すように、メニュー表示領域70Bに対して、次の返答文の候補を表示させる際に指定される次候補表示指定領域70B2を表示させるように制御する。なお、図12に示す例では、候補文70B1として、「息子様とのコミュニケーションをじっくりと積み重ねる・・・あなたの暖かい理解とサポートです。」との文が表示されている。
【0078】
そこで、ユーザ80は、メニュー表示領域70Bに表示されている候補文70B1が気に入った場合は当該候補文70B1を視線で指定し、気に入らなかった場合は次候補表示指定領域70B2を視線で指定する。ユーザ80によって次候補表示指定領域70B2が指定されると、プロセッサ28は、一例として図13に示すように、データ生成モデル58で生成した残りの文章データにおける何れか1つの返答文の候補文70B3をメニュー表示領域70Bに表示するようにユーザ端末14を制御する。なお、図13に示す例では、候補文70B3として、「息子様が再び社会との接点を持つためには、・・・そして、どうか自身を過度に責めないでください。」との文が表示されている。
【0079】
これに対し、ユーザ80によって表示されている候補文が指定された場合は、当該候補文を採用するものとして、一例として図14に示すように、当該候補文を文字データ表示領域70Dに表示するようにユーザ端末14を制御し、その後にステップS322に移行する。なお、図14に示す例では、ユーザ80によって「息子様が再び社会との接点を持つためには、・・・」との候補文が指定され、この結果として当該候補文が文字データ表示領域70Dに表示された場合が例示されている。
【0080】
一方、ステップS314において否定判定となった場合はステップS318に移行する。ステップS318で、プロセッサ28は、一例として図14に示すように、ユーザ80によって「送信」項目が指定されたか否かを判定し、否定判定となった場合はステップS322に移行する一方、肯定判定となった場合はステップS320に移行して、予め定められた送信処理を実行する。
【0081】
本実施形態に係る送信処理では、プロセッサ28により、ユーザ80によって指定された候補文が最終的な返答文であるものと見なして、当該返答文を対話表示領域70Aに表示させるようにユーザ端末14を制御すると共に、当該返答文を示すデータを対話者端末に送信する。これにより、一例として図15に示すように、ユーザ端末14の意思伝達支援画面における対話表示領域70Aには、話しかけ文70A3の直下に返答文70A4が表示されると共に、対話者端末には、図15に示した返答文70A4と同様の文が、図15に示した対話表示領域70Aと同様に表示される。
【0082】
ステップS322で、プロセッサ28は、本特定処理を終了するタイミングとして予め定められた終了タイミングが到来したか否かを判定し、否定判定となった場合はステップS304に戻る一方、肯定判定となった場合は本特定処理を終了する。なお、本実施形態では、上記終了タイミングとして、ユーザ80又は対話者82が対話の終了を指示する指示入力を行ったタイミングを適用しているが、これに限るものでないことは言うまでもない。
【0083】
次に、図16を参照して、本実施形態に係る特定処理の全体的な内容について説明する。図16は、本実施形態に係る特定処理の全体的な内容を示す図である。
【0084】
図16に示すように、本実施形態に係る特定処理では、ALSの当事者がユーザ端末14を用いて、数文字程度の文字データ及び返答文の方向性を示す方向性データを入力する。これに応じて、ユーザ端末14は、当該文字データ及び方向性データをデータ処理装置12に送信する。
【0085】
データ処理装置12は、ユーザ端末14から文字データ及び方向性データを受信すると、当該文字データ及び方向性データを用いて、データ生成モデル58により、当事者による直近の会話履歴、関係者の情報、当事者の口調の特徴、及び当事者の過去の文章等を元に、返答文の候補を生成する。そして、データ処理装置12は、生成した返答文の候補をユーザ端末14に表示させ、ユーザ80は表示された候補の中から採用する返答文を選択する。
【0086】
この際に用いられる関係者の情報は、家族や友人等の関係者の呼び方や関係性を示す情報等を例示することができる。また、当事者の口調の特徴は、当事者による語尾の特徴や、言い回しの特徴等を例示することができる。更に、当事者の過去の文章は、当事者のLINE(登録商標)、過去に当事者が書いた纏まった文章等を例示することができる。
【0087】
以上説明したように、本実施形態に係るデータ処理システム10では、ユーザデータを取得する入力部292と、ユーザデータに応じた所定の推論結果を生成するデータ生成モデル58を用いた特定処理を行う処理部294と、特定処理の結果を所定のデバイスに出力する出力部296と、を備え、入力部292は、デバイスからユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、処理部294は、文字データを入力したときのデータ生成モデル58の出力を用いて、文字データが示す文字に関連する文章データを導出する処理を特定処理として行っている。従って、ALSの当事者に対して他者とのコミュニケーションを支援することができる。
【0088】
また、本実施形態に係るデータ処理システム10では、デバイスからユーザデータとして、文章データの方向性を示す方向性データを更に取得し、文字データ及び方向性データを入力したときのデータ生成モデル58の出力を用いて、文章データの候補を導出する処理を特定処理として行っている。従って、方向性データを用いない場合に比較して、より的確な文章データの候補を導出することができる。
【0089】
また、本実施形態に係るデータ処理システム10では、方向性データとして、肯定的な方向性、否定的な方向性、疑問形の方向性、励ます方向性、優しさに関する方向性、及び感情に関する方向性の少なくとも1つの方向性を示すデータを適用している。従って、適用した方向性データに応じた文章データを導出することができる。
【0090】
また、本実施形態に係るデータ処理システム10では、文章データとして、ユーザと、当該文章データに含まれる登場人物との関係性が反映されたデータを適用している。従って、上記関係性を適用しない場合に比較して、より的確な文章データを導出することができる。
【0091】
また、本実施形態に係るデータ処理システム10では、上記関係性を、家族、友人、先輩、後輩、及び恋人の少なくとも1つの関係性を含むものとしている。従って、含めた関係性を用いない場合に比較して、より的確な文章データを導出することができる。
【0092】
また、本実施形態に係るデータ処理システム10では、文章データとして、ユーザが作成した過去の文章が反映されたデータを適用している。従って、上記過去の文章を適用しない場合に比較して、よりユーザらしい文章データを導出することができる。
【0093】
また、本実施形態に係るデータ処理システム10では、上記過去の文章を、ユーザが電子メールでのやり取りの際に作成した文章、及びユーザがソーシャル・ネットワーキング・サービスで発信した文章の少なくとも一方を含むものとしている。従って、含めた過去の文章を用いない場合に比較して、よりユーザらしい文章データを導出することができる。
【0094】
また、本実施形態に係るデータ処理システム10では、文章データとして、ユーザの口調が反映されたデータを適用している。従って、文章データとして、ユーザの口調が反映されたデータを適用しない場合に比較して、よりユーザらしい文章データを導出することができる。
【0095】
また、本実施形態に係るデータ処理システム10では、ユーザの口調を、書き言葉の口調、及び話し言葉の口調の少なくとも一方を含むものとしている。従って、含めた口調を適用しない場合に比較して、よりユーザらしい文章データを導出することができる。
【0096】
更に、本実施形態に係るデータ処理システム10では、文章データとして、上記文字データに関連する複数の文章データを選択候補として導出し、当該選択候補をデバイスに出力し、ユーザによる選択候補からの選択指示を更に取得している。従って、ユーザによる選択候補からの選択指示を取得しない場合に比較して、よりユーザの好みに合致した文章データを採用することができる。
【0097】
以上、本開示に係るシステムをデータ処理装置12の機能を主として説明したが、本開示に係るシステムはサーバに実装されているとは限らない。本開示に係るシステムは、一般的な情報処理システムとして実装されていてもよい。本開示は、例えば、パーソナルコンピュータで動作するソフトウェアプログラム、スマートフォン等で動作するアプリケーションとして実装されてもよい。本開示に係る方法はSaaS(Software as a Service)形式でユーザに対して提供されてもよい。
【0098】
上記実施形態では、1台のコンピュータ22によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、コンピュータ22を含めた複数のコンピュータによる特定処理に対する分散処理が行われるようにしてもよい。
【0099】
上記実施形態では、ストレージ32に特定処理プログラム56が格納されている形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、特定処理プログラム56がUSB(Universal Serial Bus)メモリなどの可搬型のコンピュータ読み取り可能な非一時的格納媒体に格納されていてもよい。非一時的格納媒体に格納されている特定処理プログラム56は、データ処理装置12のコンピュータ22にインストールされる。プロセッサ28は、特定処理プログラム56に従って特定処理を実行する。
【0100】
また、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56を格納させておき、データ処理装置12の要求に応じて特定処理プログラム56がダウンロードされ、コンピュータ22にインストールされるようにしてもよい。
【0101】
なお、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56の全てを格納させておいたり、ストレージ32に特定処理プログラム56の全てを記憶させたりしておく必要はなく、特定処理プログラム56の一部を格納させておいてもよい。
【0102】
特定処理を実行するハードウェア資源としては、次に示す各種のプロセッサを用いることができる。プロセッサとしては、例えば、ソフトウェア、すなわち、プログラムを実行することで、特定処理を実行するハードウェア資源として機能する汎用的なプロセッサであるCPUが挙げられる。また、プロセッサとしては、例えば、FPGA(Field-Programmable Gate Array)、PLD(Programmable Logic Device)、又はASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路が挙げられる。何れのプロセッサにもメモリが内蔵又は接続されており、何れのプロセッサもメモリを使用することで特定処理を実行する。
【0103】
特定処理を実行するハードウェア資源は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせ、又はCPUとFPGAとの組み合わせ)で構成されてもよい。また、特定処理を実行するハードウェア資源は1つのプロセッサであってもよい。
【0104】
1つのプロセッサで構成する例としては、第1に、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが、特定処理を実行するハードウェア資源として機能する形態がある。第2に、SoC(System-on-a-chip)などに代表されるように、特定処理を実行する複数のハードウェア資源を含むシステム全体の機能を1つのICチップで実現するプロセッサを使用する形態がある。このように、特定処理は、ハードウェア資源として、上記各種のプロセッサの1つ以上を用いて実現される。
【0105】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路を用いることができる。また、上記の特定処理はあくまでも一例である。従って、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
【0106】
以上に示した記載内容及び図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、及び効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、及び効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容及び図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことは言うまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容及び図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。
【0107】
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
【0108】
上記に関し、更に以下の付記を開示する。
【0109】
<付記1>
ユーザデータを取得する入力部と、
前記ユーザデータに応じた所定の推論結果を生成するデータ生成モデルを用いた特定処理を行う処理部と、
前記特定処理の結果を所定のデバイスに出力する出力部と、を備え、
前記入力部は、前記デバイスから前記ユーザデータとして、ユーザの視線を用いて入力された文字を示す文字データを取得し、
前記処理部は、前記文字データを入力したときの前記データ生成モデルの出力を用いて、前記文字データが示す文字に関連する文章データを導出する処理を前記特定処理として行う、
データ処理装置。
<付記2>
前記入力部は、前記デバイスから前記ユーザデータとして、前記文章データの方向性を示す方向性データを更に取得し、
前記処理部は、前記文字データ及び前記方向性データを入力したときの前記データ生成モデルの出力を用いて、前記文章データの候補を導出する処理を前記特定処理として行う、
付記1に記載のデータ処理装置。
<付記3>
前記方向性データは、肯定的な方向性、否定的な方向性、疑問形の方向性、励ます方向性、優しさに関する方向性、及び感情に関する方向性の少なくとも1つの方向性を示すデータである、
付記2に記載のデータ処理装置。
<付記4>
前記文章データは、前記ユーザと、当該文章データに含まれる登場人物との関係性が反映されたデータである、
付記1から付記3の何れか一つに記載のデータ処理装置。
<付記5>
前記関係性は、家族、友人、先輩、後輩、及び恋人の少なくとも1つの関係性を含む、
付記4に記載のデータ処理装置。
<付記6>
前記文章データは、前記ユーザが作成した過去の文章が反映されたデータである、
付記1から付記5の何れか一つに記載のデータ処理装置。
<付記7>
前記過去の文章は、前記ユーザが電子メールでのやり取りの際に作成した文章、及び前記ユーザがソーシャル・ネットワーキング・サービスで発信した文章の少なくとも一方を含む、
付記6に記載のデータ処理装置。
<付記8>
前記文章データは、前記ユーザの口調が反映されたデータである、
付記1から付記7の何れか一つに記載のデータ処理装置。
<付記9>
前記ユーザの口調は、書き言葉の口調、及び話し言葉の口調の少なくとも一方を含む、
付記8に記載のデータ処理装置。
<付記10>
前記処理部は、前記文章データとして、前記文字データに関連する複数の文章データを選択候補として導出し、
前記出力部は、前記選択候補を前記デバイスに出力し、
前記入力部は、ユーザによる前記選択候補からの選択指示を更に取得する、
付記1から付記9の何れか一つに記載のデータ処理装置。
<付記11>
前記デバイスは、スマート眼鏡である、
付記1から付記10の何れか一つに記載のデータ処理装置。
【符号の説明】
【0110】
10 データ処理システム
12 データ処理装置
14 ユーザ端末
22 コンピュータ
24 データベース
26 通信I/F
28 プロセッサ
30 RAM
32 ストレージ
34 バス
36 コンピュータ
38 受付装置
38A タッチパネル
38B マイクロフォン
40 出力装置
40A ディスプレイ
40B スピーカ
42 カメラ
44 通信I/F
46 プロセッサ
46A 制御部
48 RAM
50 ストレージ
52 バス
54 ネットワーク
56 特定処理プログラム
58 データ生成モデル
62 受付出力プログラム
70A 対話表示領域
70B メニュー表示領域
70C 選択ボタン
70D 文字データ表示領域
80 ユーザ
82 対話者
290 特定処理部
292 入力部
294 処理部
296 出力部
図1
図2
図3A
図3B
図3C
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16