(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-15
(45)【発行日】2024-11-25
(54)【発明の名称】システム
(51)【国際特許分類】
H04L 67/02 20220101AFI20241118BHJP
G06F 3/01 20060101ALI20241118BHJP
【FI】
H04L67/02
G06F3/01 510
(21)【出願番号】P 2024050962
(22)【出願日】2024-03-27
【審査請求日】2024-03-27
(31)【優先権主張番号】P 2023158658
(32)【優先日】2023-09-22
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】591280485
【氏名又は名称】ソフトバンクグループ株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】中村征良
(72)【発明者】
【氏名】齋藤 裕也
【審査官】吉田 歩
(56)【参考文献】
【文献】国際公開第2016/125672(WO,A1)
【文献】特開2021-175187(JP,A)
【文献】特開2011-044116(JP,A)
【文献】特開2022-189185(JP,A)
【文献】特開2022-049571(JP,A)
【文献】特開2008-271175(JP,A)
【文献】ChatGPT汎用プロンプト,日経トレンディ 2023.7月号,日経BP,2023年06月04日,No.508,pp.41-43,雑誌17101-07
【文献】ChatGPTの衝撃,月刊コールセンタージャパン 2023.6月号,日本,株式会社リックテレコム,第26巻,第6号,通巻293号,pp.15-26
(58)【調査した分野】(Int.Cl.,DB名)
H04L 67/02
G06F 3/01
(57)【特許請求の範囲】
【請求項1】
ユーザがアクセスする情報通信ネットワーク上のコンテンツを収集する手段と、
収集したコンテンツを情報処理システムに送信する手段と、
送信されたコンテンツが特定のユーザグループに対して不適切な表現や視覚情報であるかを分析し判断する情報処理システムと、
不適切と判断された表現や視覚情報を特定のユーザグループにとって適切な表現や視覚情報に自動的に変換する手段と、を含み、
前記ユーザに対して動画を出力する手段を更に含み、
前記コンテンツは、動画配信サービスにより配信される動画であり、
前記特定のユーザグループは子どもであり、
前記情報処理システム及び前記変換する手段は、生成AIモデルを用いて、前記動画に挿入される広告の各々に対して、前記子どもに対して不適切な内容であるか否かを判断し、不適切な内容であると判断された前記広告を、風景画像に変換し、
前記出力する手段は、不適切な内容であると判断された前記広告を、風景画像に変換した動画をユーザに対して出力するシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の技術は、システムに関する。
【背景技術】
【0002】
特許文献1には、少なくとも一つのプロセッサにより遂行される、ペルソナチャットボット制御方法であって、ユーザ発話を受信するステップと、前記ユーザ発話を、チャットボットのキャラクターに関する説明と関連した指示文を含むプロンプトに追加するステップと前記プロンプトをエンコードするステップと、前記エンコードしたプロンプトを言語モデルに入力して、前記ユーザ発話に応答するチャットボット発話を生成するステップ、を含む、方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
子どもがインターネットを利用する際、不適切な情報と接触する可能性がある。特に、ウェブサイトのコンテンツはテキストや画像など多岐にわたり、これらをリアルタイムで監視し、子どもに対して不適切な言い回しや画像を適切なものに差し替えることは困難である。
【課題を解決するための手段】
【0005】
本発明は、子どもがアクセスするウェブサイトのコンテンツを受け取り、その内容が子どもに対して不適切な言い回しや画像であるかを判断するAIを用いる。不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。このAIはブラウザのプラグインとして実装され、テキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である。
【図面の簡単な説明】
【0006】
【
図1】第1実施形態に係るデータ処理システムの構成の一例を示す概念図である。
【
図2】第1実施形態に係るデータ処理装置及びスマートデバイスの要部機能の一例を示す概念図である。
【
図3】第2実施形態に係るデータ処理システムの構成の一例を示す概念図である。
【
図4】第2実施形態に係るデータ処理装置及びスマート眼鏡の要部機能の一例を示す概念図である。
【
図5】第3実施形態に係るデータ処理システムの構成の一例を示す概念図である。
【
図6】第3実施形態に係るデータ処理装置及びヘッドセット型端末の要部機能の一例を示す概念図である。
【
図7】第4実施形態に係るデータ処理システムの構成の一例を示す概念図である。
【
図8】第4実施形態に係るデータ処理装置及びロボットの要部機能の一例を示す概念図である。
【
図9】複数の感情がマッピングされる感情マップを示す。
【
図10】複数の感情がマッピングされる感情マップを示す。
【
図11】形態例1の実施例1におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図12】形態例1の応用例1におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図13】形態例2の実施例2におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図14】形態例2の応用例2におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図15】形態例3の実施例3におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図16】形態例3の応用例3におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図17】感情エンジンを組み合わせた場合の形態例1の実施例1におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図18】感情エンジンを組み合わせた場合の形態例1の応用例1におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図19】感情エンジンを組み合わせた場合の形態例2の実施例2におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図20】感情エンジンを組み合わせた場合の形態例2の応用例2におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図21】感情エンジンを組み合わせた場合の形態例3の実施例3におけるデータ処理システムの処理の流れを示すシーケンス図である。
【
図22】感情エンジンを組み合わせた場合の形態例3の応用例3におけるデータ処理システムの処理の流れを示すシーケンス図である。
【発明を実施するための形態】
【0007】
以下、添付図面に従って本開示の技術に係るシステムの実施形態の一例について説明する。
【0008】
先ず、以下の説明で使用される文言について説明する。
【0009】
以下の実施形態において、符号付きのプロセッサ(以下、単に「プロセッサ」と称する)は、1つの演算装置であってもよいし、複数の演算装置の組み合わせであってもよい。また、プロセッサは、1種類の演算装置であってもよいし、複数種類の演算装置の組み合わせであってもよい。演算装置の一例としては、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、GPGPU(General-Purpose computing on Graphics Processing Units)、APU(Accelerated Processing Unit)、又はTPU(Tensor Processing Unit)等が挙げられる。
【0010】
以下の実施形態において、符号付きのRAM(Random Access Memory)は、一時的に情報が格納されるメモリであり、プロセッサによってワークメモリとして用いられる。
【0011】
以下の実施形態において、符号付きのストレージは、各種プログラム及び各種パラメータ等を記憶する1つ又は複数の不揮発性の記憶装置である。不揮発性の記憶装置の一例としては、フラッシュメモリ(SSD(Solid State Drive))、磁気ディスク(例えば、ハードディスク)、又は磁気テープ等が挙げられる。
【0012】
以下の実施形態において、符号付きの通信I/F(Interface)は、通信プロセッサ及びアンテナ等を含むインタフェースである。通信I/Fは、複数のコンピュータ間での通信を司る。通信I/Fに対して適用される通信規格の一例としては、5G(5th Generation Mobile Communication System)、Wi-Fi(登録商標)、又はBluetooth(登録商標)等を含む無線通信規格が挙げられる。
【0013】
以下の実施形態において、「A及び/又はB」は、「A及びBのうちの少なくとも1つ」と同義である。つまり、「A及び/又はB」は、Aだけであってもよいし、Bだけであってもよいし、A及びBの組み合わせであってもよい、という意味である。また、本明細書において、3つ以上の事柄を「及び/又は」で結び付けて表現する場合も、「A及び/又はB」と同様の考え方が適用される。
【0014】
[第1実施形態]
【0015】
図1には、第1実施形態に係るデータ処理システム10の構成の一例が示されている。
【0016】
図1に示すように、データ処理システム10は、データ処理装置12及びスマートデバイス14を備えている。データ処理装置12の一例としては、サーバが挙げられる。
【0017】
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。
【0018】
スマートデバイス14は、コンピュータ36、受付装置38、出力装置40、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、受付装置38、出力装置40、及びカメラ42も、バス52に接続されている。
【0019】
受付装置38は、タッチパネル38A及びマイクロフォン38B等を備えており、ユーザ入力を受け付ける。タッチパネル38Aは、指示体(例えば、ペン又は指等)の接触を検出することにより、指示体の接触によるユーザ入力を受け付ける。マイクロフォン38Bは、ユーザの音声を検出することにより、音声によるユーザ入力を受け付ける。制御部46Aは、タッチパネル38A及びマイクロフォン38Bによって受け付けたユーザ入力を示すデータをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が、ユーザ入力を示すデータを取得する。
【0020】
出力装置40は、ディスプレイ40A及びスピーカ40B等を備えており、データをユーザ20が知覚可能な表現形(例えば、音声及び/又はテキスト)で出力することでデータをユーザ20に対して提示する。ディスプレイ40Aは、プロセッサ46からの指示に従ってテキスト及び画像等の可視情報を表示する。スピーカ40Bは、プロセッサ46からの指示に従って音声を出力する。カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラである。
【0021】
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。
【0022】
図2には、データ処理装置12及びスマートデバイス14の要部機能の一例が示されている。
【0023】
図2に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って特定処理部290として動作することによって実現される。
【0024】
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。
【0025】
スマートデバイス14では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。受付出力プログラム60は、データ処理システム10によって特定処理プログラム56と併用される。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。
【0026】
次に、データ処理装置12の特定処理部290による特定処理について説明する。
【0027】
「形態例1」本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段として、ブラウザのプラグインを用いる。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0028】
「形態例2」
【0029】
本発明の別の実施形態として、AIはブラウザのプラグインとして実装される。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0030】
「形態例3」
【0031】
本発明のさらなる実施形態として、AIはテキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である。具体的には、AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【0032】
以下に、各形態例の処理の流れについて説明する。
【0033】
「形態例1」
【0034】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0035】
ステップ2:受け取ったコンテンツはAIに送信される。
【0036】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【0037】
ステップ4:不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0038】
「形態例2」
【0039】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0040】
ステップ2:受け取ったコンテンツはAIに送信される。
【0041】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0042】
「形態例3」
【0043】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0044】
ステップ2:受け取ったコンテンツはAIに送信される。
【0045】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【0046】
ステップ4:AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【0047】
(実施例1)
【0048】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0049】
現代の情報通信ネットワーク上には、特定のユーザグループ、特に子どもたちにとって不適切な表現や視覚情報が多く存在する。これらのコンテンツによって、子どもたちが精神的な不快感を感じたり、不適切な行動を学習したりするリスクがある。従来のフィルタリング技術では、これらの問題を完全に解決することが困難であり、特にリアルタイムでコンテンツを分析し、不適切な内容を適切なものに置き換えることは実現が難しい。
【0050】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0051】
この発明では、サーバは、ユーザがアクセスする情報通信ネットワーク上のコンテンツをリアルタイムで受け取る手段と、受け取ったコンテンツを情報処理システムに送信する手段と、送信されたコンテンツが特定のユーザグループに対して不適切な表現や視覚情報であるかを分析し判断する情報処理システムと、不適切と判断された表現や視覚情報を特定のユーザグループにとって適切な表現や視覚情報に自動的に変換する手段と、を含む。これにより、特定のユーザグループが情報通信ネットワークを利用する際の安全性を高め、不適切なコンテンツからの保護を実現することが可能となる。
【0052】
「情報通信ネットワーク」は、インターネットやその他のデジタル通信手段を通じて情報を交換するシステムの総称である。
【0053】
「コンテンツ」は、ウェブサイト、ビデオ、画像、テキストなど、デジタル形式で表現された情報やエンターテインメントのことである。
【0054】
「リアルタイムで受け取る手段」は、ユーザがアクセスした瞬間にその情報を捕捉し、処理する技術や方法のことである。
【0055】
「情報処理システム」は、受け取ったデータを分析、加工、変換するためのハードウェアおよびソフトウェアの集合体である。
【0056】
「特定のユーザグループ」は、特定の属性、年齢、興味などに基づいて区別されるユーザの集まりである。
【0057】
「不適切な表現や視覚情報」は、そのユーザグループにとって精神的な不快感を与えるか、あるいは不適切な行動や考え方を促す可能性がある言葉や画像などの情報である。
【0058】
「自動的に変換する手段」は、特定の基準やルールに基づいて、不適切な内容を適切な内容に置き換えるプロセスを自動で行う技術や方法である。
【0059】
この発明を実施するための形態においては、主に情報処理システム、ユーザの端末、および拡張機能としてのブラウザプラグインを用いる。情報処理システムは、生成AIモデルを含むサーバ上で構成され、ユーザの端末は、この情報処理システムにリアルタイムでコンテンツを送信するためのブラウザとプラグインを備えている。
【0060】
情報処理システムでは、特にOpenAIのGPT-4や画像処理に特化したDALL・Eといった具体的な生成AIモデルが使用される。これらのモデルは、テキストと画像の両方に対して不適切な内容を識別し、適切な内容に変換する機能を持っている。この処理は、端末から送信されたコンテンツに基づいて自動的に行われる。
【0061】
端末には、ユーザが情報通信ネットワークを閲覧する際に使用するブラウザがインストールされており、このブラウザには発明に基づいたプラグインが追加されている。このプラグインは、ユーザがアクセスするコンテンツを捕捉し、情報処理システムに送信する役割を持っている。送信されたコンテンツは、サーバ上の生成AIモデルによってリアルタイムで分析される。
【0062】
具体例として、ユーザが不適切な表現を含むテキストや画像にアクセスした場合、プラグインはこれらのコンテンツを捕捉し、サーバに送信する。サーバ上の生成AIモデルは、以下のようなプロンプト文を用いてコンテンツを分析する。「このウェブサイトには子どもに不適切な言葉が含まれています。適切な表現に変換してください。」「この画像は子どもに不適切です。子どもが見ても安全な、テーマに合った画像に置き換えてください。」これらのプロンプト文は、テキストや画像を適切なものに変換するための指示として機能する。変換後のコンテンツは再び端末に送り返され、ユーザが見るコンテンツが更新される。
【0063】
この形態により、特定のユーザグループ、特に子どもたちが情報通信ネットワークを安全に利用できるようにすることが目指されている。
【0064】
【0065】
ステップ1:ユーザがブラウザを通じて情報通信ネットワーク上のコンテンツにアクセスする。この際、端末にインストールされたブラウザプラグインが動作を開始し、ユーザが閲覧しているコンテンツを捕捉する。このプラグインは、テキスト、画像、およびその他のメディアファイルを含むすべてのコンテンツのデータをリアルタイムで収集する。入力はユーザがアクセスしたウェブページのコンテンツであり、出力は収集されたコンテンツデータである。
【0066】
ステップ2:捕捉したコンテンツデータは、ブラウザプラグインによってサーバに送信される。サーバ上の情報処理システムは、受信したコンテンツデータを分析するために生成AIモデルを用いる。この処理では、コンテンツが特定のユーザグループにとって不適切な表現や視覚情報を含んでいるかを判断する。入力は端末から送信されたコンテンツデータであり、出力は分析結果(不適切なコンテンツの識別)である。
【0067】
ステップ3:不適切と判断されたコンテンツに対して、サーバ上の生成AIモデルは、適切な表現や視覚情報に自動的に変換する処理を行う。たとえば、不適切な言葉は適切な言葉に、不適切な画像は問題ない画像に置き換えられる。この変換プロセスにおける入力は分析結果で識別された不適切なコンテンツであり、出力は変換後の適切なコンテンツである。
【0068】
ステップ4:変換されたコンテンツは、再び端末に送り返される。端末のブラウザプラグインは、オリジナルのコンテンツを変換後のコンテンツで更新し、ユーザの閲覧中のウェブページに表示する。このステップにおける入力はサーバから送信された変換後のコンテンツであり、出力はユーザが閲覧する更新されたウェブページである。
【0069】
これらの処理ステップを通じて、ユーザは不適切なコンテンツに触れることなく、情報通信ネットワークを安全に利用することが可能となる。各ステップは、特に子どもなどの保護が必要なユーザグループのオンライン安全性を高めることを目的としている。
【0070】
(応用例1)
【0071】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0072】
デジタルコンテンツにおける不適切な言い回しや画像が利用者、特に子どもに与える影響に関する懸念が高まっています。インターネット上では、年齢に不適切なコンテンツに容易にアクセスできる環境があり、これらのコンテンツが心理的、情緒的な影響を与えかねない問題があります。特に、利用者がこれらのコンテンツを遭遇した際に、その場で内容を適切なものに変換し、安全な閲覧体験を提供する技術の需要があります。
【0073】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0074】
この発明では、サーバは、デジタルコンテンツをリアルタイムで取得する手段と、取得したコンテンツの適切性を評価するためにコンテンツを生成AIモデルに送信する手段と、不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する生成AIモデルに基づく手段と、を含む。これにより、不適切なコンテンツをリアルタイムで検出し、自動的に適切な表現に変換することが可能となる。結果として、利用者に対して安全なデジタルコンテンツ閲覧環境を提供することができる。
【0075】
「デジタルコンテンツ」とは、インターネット上で配信されるテキスト、画像、動画などの情報の総称である。
【0076】
「リアルタイムで取得する手段」とは、利用者がアクセスする瞬間にそのコンテンツを取得し、分析するための技術や方法である。
【0077】
「生成AIモデルに送信する手段」とは、取得したコンテンツを人工知能モデルに送り、解析や処理を行わせるための技術や方法である。
【0078】
「不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する」とは、生成AIモデルがコンテンツ内の不適切な言い回しや画像を識別し、それらを年齢や理解度に応じた適切な内容に置き換えるプロセスである。
【0079】
「利用者」とは、デジタルコンテンツを閲覧または利用する個人である。
【0080】
「サーバ」とは、インターネット上でデータやサービスを提供するコンピュータシステムまたはそのソフトウェアを指す。
【0081】
「アプリケーション」とは、特定の目的のためにデザインされたソフトウェアプログラムである。
【0082】
この発明を実施するための形態において、システムは主にサーバ、端末(スマートフォン、タブレット、スマート眼鏡、ヘッドマウントディスプレイなど)、およびユーザ(特に子ども)から構成される。サーバは生成AIモデルをホストしており、端末はインターネット上のデジタルコンテンツにアクセスするためのブラウザや専用アプリケーションを実行する。このシステムは、端末がアクセスしたデジタルコンテンツをリアルタイムで取得し、そのコンテンツをサーバ上の生成AIモデルに送信する機能を有する。生成AIモデルは、送信されたコンテンツの適切性を評価し、不適切な表現が含まれている場合、それをユーザが理解しやすい適切な表現に自動的に変換する。
【0083】
このシステムを実現するためには、JavaScriptやPythonなどのプログラミング言語で記述された端末上で動作するブラウザプラグインやアプリケーション、およびサーバ上で実行されるTensorFlowやOpenAIのGPT、DALL-Eなどの生成AIモデルが使用される。これらのソフトウェアは、ハードウェア上で実行され、デジタルコンテンツの取得、解析、変換のプロセスを効率的に行う。
【0084】
具体例として、子どもが暴力的な画像を含むニュースサイトにアクセスした場合、システムはその画像をリアルタイムで取得し、サーバに送信する。生成AIモデルは、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」というプロンプト文に基づいて処理を行い、暴力的な要素を含まない代替画像を生成し、その画像を元のコンテンツの場所に表示する。このプロセスにより、ユーザは安全なデジタルコンテンツ閲覧環境を享受できる。
【0085】
【0086】
ステップ1:端末がデジタルコンテンツにアクセスする
【0087】
ユーザが端末を用いてインターネット上の特定のウェブサイトにアクセスする。この時、端末上で動作するブラウザプラグインまたはアプリケーションがデジタルコンテンツ(テキスト、画像、動画など)をリアルタイムで取得する。入力としてはユーザのアクセスしたウェブサイトのURLやそのページのHTMLコードがあり、出力としてはそのページのコンテンツデータが得られる。
【0088】
ステップ2:コンテンツの適切性を評価するためにサーバに送信する
【0089】
取得したデジタルコンテンツは、評価のためにサーバ上の生成AIモデルに送信される。このプロセスでは、入力として取得したデジタルコンテンツがあり、出力としてはそのコンテンツが生成AIモデルによって受け取られる。
【0090】
ステップ3:生成AIモデルがコンテンツを分析し、不適切な内容を識別する
【0091】
サーバ上の生成AIモデルは、送信されたコンテンツを分析し、不適切な言い回しや画像を識別する。入力としてはステップ2で送信されたコンテンツがあり、出力としては不適切な内容のリストや識別情報が得られる。このステップでは、特定のキーワードや画像認識技術を用いて不適切な内容を検出するデータ加工又はデータ演算が行われる。
【0092】
ステップ4:不適切な内容を適切な内容に変換する
【0093】
識別された不適切な内容は、子どもが理解しやすい適切な言い回しや画像に自動的に変換される。この処理には、生成AIモデルが使用され、入力としてはステップ3で識別された不適切な内容があり、出力としては変換後の適切なコンテンツが得られる。生成AIモデルは、不適切な内容を受け取り、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」といったプロンプト文に基づいて、適切な内容へと変換するデータ演算を行う。
【0094】
ステップ5:変換後のコンテンツを端末に送信し、表示する
【0095】
最後に、サーバは変換後の適切なコンテンツを端末に送信し、ユーザがアクセスしたウェブページ上でその内容が表示されるようにする。入力としてはステップ4で生成された適切なコンテンツがあり、出力としてはユーザの端末上でそのコンテンツが表示される。このステップでは、サーバから端末へのデータ送信と、端末上でのデータ表示処理が行われる。
【0096】
(実施例2)
【0097】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0098】
インターネット上には子どもがアクセスすべきではない不適切な内容が数多く存在している。保護者が常に監視することは現実的ではなく、既存のフィルタリング技術でも完全にはブロックできない場合がある。特に、テキストと画像の両方を含むコンテンツの場合、これらをリアルタイムで適切に評価し、子どもに安全な内容に自動で変換する技術は未だ不足している。
【0099】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0100】
この発明では、サーバは、ウェブコンテンツをリアルタイムで捕捉し安全な通信経路を通じて送信する手段と、送信されたコンテンツを自然言語および画像解析技術を備えた生成AIモデルによって評価する手段と、不適切な表現または画像を検出した場合、これらを利用者の理解に適した表現や問題ない画像に自動で差し替える手段と、を含む。これにより、子どもがインターネットを利用する際の安全性を大幅に向上させることが可能となる。
【0101】
「利用者」とは、情報端末を通じてウェブコンテンツにアクセスする個人または集団を指す。
【0102】
「情報端末」とは、インターネットに接続し、ウェブサイトを閲覧することが可能なデバイス(パソコン、スマートフォン、タブレット等)を指す。
【0103】
「ウェブコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【0104】
「リアルタイムで捕捉する」とは、利用者がウェブコンテンツを閲覧しているその瞬間に、その内容を即座に検出・取得することを指す。
【0105】
「安全な通信経路」とは、データの送受信において第三者による傍受や改ざんを防ぐために暗号化などのセキュリティ技術を用いた通信手段を指す。
【0106】
「解析サーバ」とは、送信されたウェブコンテンツを解析・処理するためのコンピュータシステムを指す。
【0107】
「生成AIモデル」とは、入力されたデータに基づいて新たなテキストや画像を生成する能力を持つ人工知能モデルを指す。
【0108】
「自然言語および画像解析技術」とは、テキストデータを理解・解析するための技術および画像の内容を識別・分析する技術を指す。
【0109】
「不適切な表現または画像」とは、年齢や社会的規範に照らして、特定の利用者群(特に子ども)にとって見るべきでない、または理解するのが難しいと判断されるコンテンツを指す。
【0110】
「問題ない画像」とは、特定の利用者群(特に子ども)が閲覧しても安全と判断される内容の画像を指す。
【0111】
「プラグイン形式」とは、既存のソフトウェア(この場合はブラウザ)に追加して機能を拡張するためのソフトウェアモジュールのことを指す。
【0112】
この発明を実施するための形態においては、主に情報端末と解析サーバ、およびその間の通信プロトコルが関与する。情報端末には、ウェブブラウザがインストールされており、このブラウザには、ウェブコンテンツをリアルタイムで捕捉し、安全な通信経路を介して解析サーバに送信する機能を持つプラグインが組み込まれている。このプラグインは、JavaScriptやその他のウェブ技術を使用して開発される。
【0113】
解析サーバは、高性能なコンピュータシステム上に構築され、生成AIモデルを含むソフトウェアがインストールされている。このサーバは、情報端末から送信されたウェブコンテンツを受け取り、自然言語処理技術と画像解析技術を用いて内容を解析する。不適切な表現または画像が検出された場合、AIモデルはそれらを適切な内容に自動的に差し替える。このプロセスには、TensorFlowやPyTorchといった深層学習フレームワークが使用される。差し替えられたコンテンツは再び情報端末に送り返され、プラグインを通じてユーザに表示される。
【0114】
例として、ウェブページ上に「この映画は大人向けの暴力シーンが含まれています」というテキストと、そのシーンのスクリーンショットが含まれている場合を考える。プラグインはこのテキストと画像を捕捉し、解析サーバに送信する。サーバ上のAIモデルはテキストを「この映画には怖い場面があるので、大人と一緒に見てね」といった子どもに優しい言葉に、画像を映画のロゴなどの問題のない画像に差し替える。これらの変換プロセスは、自然言語処理と画像認識技術に基づいており、子どもが安全にインターネットを利用できるようにすることが目的だ。
【0115】
この発明により、情報端末と解析サーバ間でセキュアな通信を行いながら、リアルタイムでウェブコンテンツをフィルタリングし、子どもにとって安全な形に変換することが可能となる。これにより、保護者は子どもがインターネットを使用する際の安全性を高めることができる。
【0116】
【0117】
ステップ1:ウェブコンテンツの捕捉
【0118】
情報端末上で動作するブラウザのプラグインが、ユーザが閲覧しているウェブページのコンテンツ(テキストおよび画像)をリアルタイムで捕捉する。このステップの入力は、ユーザが閲覧しているウェブページの内容であり、出力は、解析のためにサーバへ送信するデータ形式に加工されたコンテンツデータである。プラグインは、DOM解析を行い、ページ内の全てのテキストと画像のデータを抽出する。
【0119】
ステップ2:コンテンツの送信
【0120】
捕捉されたコンテンツは、情報端末から解析サーバへ安全な通信経路を通じて送信される。このステップの入力は、ステップ1で加工されたコンテンツデータであり、出力は、解析サーバに到達したコンテンツデータである。送信にはHTTPSプロトコルが使用され、データの機密性と完全性が保証される。
【0121】
ステップ3:コンテンツの解析と評価
【0122】
解析サーバ上の生成AIモデルが、送信されたコンテンツを自然言語処理技術と画像解析技術を用いて解析し、評価する。このステップの入力は、ステップ2で受け取ったコンテンツデータであり、出力は、不適切な表現または画像が検出された場合にそれらを適切な内容に差し替えた後のコンテンツデータである。AIモデルは、不適切な内容を識別し、適切な代替テキストや画像に自動で置換する。
【0123】
ステップ4:差し替えたコンテンツの返送
【0124】
差し替えられたコンテンツは、解析サーバから情報端末に返送される。このステップの入力は、ステップ3で生成された差し替え後のコンテンツデータであり、出力は、情報端末のブラウザプラグインによってユーザに表示される準備が整ったコンテンツである。返送にもHTTPSプロトコルが使用され、データの安全性が維持される。
【0125】
ステップ5:コンテンツの表示
【0126】
情報端末のブラウザプラグインが、返送されたコンテンツをユーザのブラウザ上に表示する。このステップの入力は、ステップ4で返送されたコンテンツデータであり、出力は、ユーザが閲覧するウェブページ上にレンダリングされた適切なコンテンツである。プラグインは、差し替えられたテキストと画像を元の位置に適切に埋め込み、ユーザに安全な閲覧環境を提供する。
【0127】
(応用例2)
【0128】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0129】
インターネット上には、特定の利用者群にとって不適切と考えられる言語表現や視覚表現が数多く存在します。特に、子供たちが自由にアクセスできる環境では、彼らに有害な内容に触れるリスクがあります。これまでの技術では、不適切な内容を効率的にフィルタリングし、かつそれを利用者の理解レベルに適した形で自動的に置き換えることが困難であるという問題がありました。この課題を解決することで、特定の利用者群、特に子供たちが安全に情報を得られるインターネット環境を提供することが求められています。
【0130】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0131】
この発明では、サーバは、利用者がアクセスする情報配信媒体のコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群に対して不適切な言語表現や視覚表現であるかを判断する人工知能手段と、不適切な言語表現や視覚表現を特定の利用者群に伝えられる適切な言語表現や視覚表現に差し替える手段と、を含む。これにより、特定の利用者群、特に子供たちがインターネットを使用する際に、不適切な内容に触れることなく、また、その理解レベルに合った形で情報を得られる環境が可能となる。
【0132】
「情報配信媒体」とは、インターネット上でコンテンツを公開し、一般の利用者がアクセス可能なウェブサイトやアプリケーションを指す。
【0133】
「コンテンツ」とは、テキスト、画像、動画、音声などの情報や表現物で、情報配信媒体を通じて提供されるものを指す。
【0134】
「特定の利用者群」とは、年齢、性別、文化的背景などによって定義される、特定の特性を持つ利用者の集団を指す。
【0135】
「不適切な言語表現や視覚表現」とは、特定の利用者群が接するには不適当と考えられる、攻撃的、性的、暴力的、またはその他の利用者にとって不快感を与える可能性のある言葉や画像を指す。
【0136】
「人工知能手段」とは、機械学習や自然言語処理、画像認識などの技術を用いて、コンテンツの内容を分析し、判断を下すシステムやプロセスを指す。
【0137】
「情報配信媒体の利用者インターフェース拡張機能」とは、ウェブブラウザやアプリケーションの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアコンポーネントを指す。
【0138】
「適切な言語表現や視覚表現に差し替える手段」とは、特定の利用者群にとって受け入れられる、教育的価値がある、または中立的な内容の言語表現や視覚表現に、不適切なコンテンツを置き換えるプロセスやアルゴリズムを指す。
【0139】
この発明を実施するための形態では、サーバは人工知能を含むプログラムを実行し、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取り、分析する。このプログラムは、特定の利用者群に不適切と判断される言語表現や視覚表現を検出し、これらを適切な表現に自動で差し替える機能を持つ。このプロセスには、自然言語処理技術や画像認識技術が用いられる。使用するハードウェアは、高性能のサーバとストレージシステムであり、ソフトウェアにはTensorFlowやPyTorchのような機械学習ライブラリが含まれる。
【0140】
端末側では、情報配信媒体の利用者インターフェース拡張機能として実装されたプログラムが動作し、サーバから受信した加工済みコンテンツを表示する。この拡張機能は、JavaScriptやその他のウェブ技術を使用して開発され、特定の利用者群にとって適切なコンテンツのみを表示するように設計されている。
【0141】
ユーザは、このシステムを通じて安全なコンテンツ閲覧体験を得ることができる。たとえば、子供がウェブサイトを利用する際に、不適切な言葉が「おっちょこちょい」などの理解しやすい同義語に、また不適切な画像が教育的なイラストや風景画像に差し替えられる。このような処理により、特定の利用者群がインターネットを安全に使用できる環境が提供される。プロンプト文の例としては、「このテキストを5歳の子供が理解できる言葉に変換してください」や「この画像を子供が見ても安全な内容の画像に置き換えてください」といった指示が用いられる。
【0142】
【0143】
ステップ1:コンテンツの受信と前処理
【0144】
サーバは、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取る。この時、HTML、CSS、JavaScriptなどの形式で構成されたウェブページのデータが入力となる。サーバはこれらのデータを解析し、テキストと画像に分離する。このプロセスにより、テキストデータと画像データが抽出され、次の処理ステップへの入力として準備される。
【0145】
ステップ2:不適切なコンテンツの検出
【0146】
抽出されたテキストデータは、自然言語処理技術を用いて分析され、不適切な言語表現が検出される。同時に、画像データに対しては画像認識技術が適用され、不適切な視覚表現が検出される。この処理には、機械学習ライブラリを活用した生成AIモデルが使用され、テキストと画像のそれぞれに対して適切性の評価が行われる。入力としては、ウェブページから抽出されたテキストと画像があり、出力としては、不適切と判定されたコンテンツのリストが得られる。
【0147】
ステップ3:コンテンツの差し替え
【0148】
不適切と判定されたテキストや画像は、特定の利用者群に適切な言語表現や視覚表現に自動で差し替えられる。この際、生成AIモデルは、不適切なコンテンツを適切なコンテンツに変換するためのプロンプト文に基づいて動作する。たとえば、「このテキストを5歳の子供が理解できる言葉に変換してください」というプロンプトに基づき、テキストの置き換えが行われる。画像についても、「この画像を子供が見ても安全な内容の画像に置き換えてください」というプロンプトに従って、適切な画像に差し替えられる。入力としては不適切なコンテンツがあり、出力としてはそれが適切な表現に置き換えられたコンテンツとなる。
【0149】
ステップ4:加工済みコンテンツの送信
【0150】
差し替えられたコンテンツは、情報配信媒体の利用者インターフェース拡張機能を通じて利用者の端末に送信される。サーバは、加工済みのテキストと画像を含むウェブページのデータを生成し、これを端末に向けて送信する。端末は受信したデータをブラウザ上でレンダリングし、利用者に表示する。このプロセスにより、利用者は不適切なコンテンツが除去され、安全なコンテンツのみが含まれるウェブページを閲覧できるようになる。
【0151】
(実施例3)
【0152】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0153】
デジタルコンテンツが普及する現代社会において、特定のユーザグループ、特に子供たちが不適切な内容に触れるリスクが高まっている。インターネット上では、暴力的、性的、またはその他の有害なコンテンツが容易にアクセス可能となっており、これらのコンテンツが特定のユーザグループの健全な成長や精神的安全を脅かしている。したがって、デジタルコンテンツを介した不適切な情報の流通を効果的に制限し、特定のユーザグループが安全な環境でデジタルコンテンツを利用できるようにすることが急務である。
【0154】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0155】
この発明では、サーバは、デジタルデータをアップロードする手段と、アップロードされたデジタルデータが特定のユーザグループに対して不適切な内容を含むかを判断するAI手段と、不適切な内容を含むデジタルデータを特定のユーザグループに適切な内容に差し替える手段と、を含む。これにより、特定のユーザグループがインターネット上の不適切なコンテンツに触れることなく、安全かつ健全なデジタル環境で情報を得ることが可能となる。サーバ上で動作するAIは、テキストと画像の両方に対して不適切な内容を自動的に識別し、適切なコンテンツに差し替えることにより、特定のユーザグループのデジタルコンテンツの安全性と適切性を保障する。
【0156】
「デジタルデータ」とは、画像、テキスト、音声、ビデオなど、デジタル形式で表現された情報の総称である。
【0157】
「アップロードする手段」とは、ユーザがデジタルデータをインターネット経由でサーバやクラウド上に送信する行為やそのための技術、プロセスを指す。
【0158】
「AI手段」とは、人工知能技術を活用して特定のタスクを自動で実行するための方法やシステムを指し、この場合は不適切なコンテンツの識別と差し替えを行う機能を含む。
【0159】
「不適切な内容」とは、特定のユーザグループ、特に子供たちにとって有害と考えられる性的、暴力的、またはその他の不快感を与える可能性がある情報や画像を指す。
【0160】
「特定のユーザグループ」とは、特定の年齢層、興味、感受性などの共通の特徴を持つユーザの集団を指し、本発明では主に子供たちを想定している。
【0161】
「ウェブサービスまたはアプリケーション」とは、インターネットを介して提供されるサービスやプログラムで、ユーザが特定の機能や情報にアクセスできるようにするものを指す。
【0162】
「適切な内容に差し替える手段」とは、不適切なデジタルデータを分析し、その内容を特定のユーザグループにとって適切かつ有害でない情報や画像に置き換えるプロセスや技術を指す。
【0163】
この発明を実施するための形態は、主にデジタルデータのアップロード、そのデータの適切性の評価、及び不適切なデータの差し替えを含むシステムの運用に関するものである。このシステムは、サーバ、端末、及びユーザの三者によって構成される。
【0164】
サーバは、高性能なコンピュータシステムであり、人工知能(AI)を活用したデータ分析機能を搭載している。このサーバ上で動作するAIは、特定のライブラリやフレームワーク(例:TensorFlow, PyTorch)を使用して、アップロードされた画像やテキストの内容を評価する。AIの分析能力には、画像認識技術や自然言語処理技術が含まれ、これによってデジタルデータ内の不適切な要素を特定する。
【0165】
端末は、インターネットに接続されたデバイスであり、ユーザがデジタルデータをアップロードするためのインターフェイスを提供する。端末は、スマートフォン、タブレット、パーソナルコンピュータ等を含む。
【0166】
ユーザは、このシステムを利用してデジタルコンテンツをアップロードし、閲覧する人々である。ユーザは特定のウェブサイトやアプリケーションを通じてデジタルデータをサーバに送信する。送信されたデータはサーバによって自動的に分析され、不適切なコンテンツがある場合は適切な内容に差し替えられる。
【0167】
具体例として、ユーザがアップロードした画像が暴力的な内容を含む場合、サーバ上で動作するAIはこの画像を不適切であると判断し、代替の安全な画像(例:風景画)に自動的に差し替える。プロンプト文の例としては、「画像内のコンテンツを分析し、不適切な要素が含まれているか判断し、含まれている場合は指定されたカテゴリー(例:自然風景)の安全な画像に自動的に差し替える」というものが挙げられる。
【0168】
この形態により、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。サーバ、端末、及びユーザの相互作用によって、この発明は実施される。
【0169】
【0170】
ステップ1:ユーザは端末を使用してデジタルデータ(画像やテキスト)をシステムにアップロードする。この段階の入力はユーザによって選択されたデジタルデータであり、出力はサーバへ送信されるデータファイルである。端末はユーザが選択したデータを収集し、サーバに送信する処理を行う。
【0171】
ステップ2:サーバはアップロードされたデジタルデータを受信し、AI手段を用いてその内容を分析する。この段階での入力はアップロードされたデータであり、出力はデータ内容の分析結果(不適切な内容が含まれているかどうか)である。サーバ上のAIは、受信したデータを処理し、不適切な要素を特定するためのデータ加工およびデータ演算を行う。
【0172】
ステップ3:AI手段がデータを不適切であると判断した場合、サーバはそのデータを適切な内容に差し替える。この段階の入力は不適切と判断されたデータであり、出力は適切な内容に差し替えられたデータである。サーバは不適切なデータを削除し、予め用意された適切なデータ(例:安全な画像ライブラリからの画像)で置き換える処理を行う。
【0173】
ステップ4:差し替えられたデータは、サーバから端末を通じてユーザに送信される。この段階の入力は差し替え後のデータであり、出力はユーザが閲覧可能な形式で表示されるデータである。サーバは変換されたデータを端末へ送信し、端末はそれをユーザの画面上で表示する処理を行う。
【0174】
この処理流れにより、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。システムは、不適切なデータを効果的に識別し、適切なコンテンツに自動的に差し替えることができる。
【0175】
(応用例3)
【0176】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0177】
現代のデジタル社会において、特定の年齢層、特に子供たちがインターネットを通じてアクセスするコンテンツには、しばしば不適切な表現や画像が含まれている。これらの不適切なコンテンツにより、子供たちが精神的な損害を受けるリスクがある。従来のフィルタリング技術では、不適切なテキストコンテンツのブロックには一定の効果があるものの、画像に関してはその判断が難しく、また、不適切なコンテンツを適切なものに置き換えることができないという問題があった。この発明は、特定の年齢層がアクセスするデジタルコンテンツにおいて、不適切な表現や画像を自動的に検出し、それを適切な表現や画像に差し替えることにより、安全な閲覧環境を提供することを目的とする。
【0178】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0179】
この発明では、サーバは、情報端末を通じてアクセスされるデジタルコンテンツを受け取る手段と、受け取ったデジタルコンテンツが特定の年齢層に対して不適切な表現や画像であるかを判断するAI手段と、不適切な表現や画像を特定の年齢層に適切な表現や画像に差し替える手段と、を含む。これにより、デジタルコンテンツの安全性を確保し、特定の年齢層が閲覧しても問題ないコンテンツのみを提供することが可能となる。AI手段は、テキストだけでなく画像に対しても不適切な内容を高精度で判断し、差し替えることが可能であるため、従来の技術では対応が困難であった画像コンテンツの問題にも対応できる。
【0180】
「情報端末」とは、インターネットやその他のネットワークに接続してデジタルコンテンツを受け取り、表示するための電子機器である。例えば、スマートフォン、タブレット、パーソナルコンピュータなどが含まれる。
【0181】
「デジタルコンテンツ」とは、テキスト、画像、動画、音声などのデジタル形式で表現された情報コンテンツである。インターネットを介して配信され、情報端末でアクセス・閲覧が可能である。
【0182】
「特定の年齢層」とは、コンテンツの閲覧にあたって特に保護する必要のある年齢範囲を指し、特に子供や青少年などの若年層を示す。
【0183】
「不適切な表現や画像」とは、特定の年齢層にとって見ることが望ましくない、または精神的な損害を与える可能性のあるテキスト、画像、その他のメディアコンテンツである。例えば、暴力的、性的、または差別的な内容がこれに該当する。
【0184】
「AI手段」とは、人工知能技術を活用してデジタルコンテンツの内容を分析し、特定の基準に基づいてコンテンツが適切か不適切かを判断するシステムやプログラムのことである。この手段は、機械学習や画像認識技術を含む。
【0185】
この発明の実施形態では、サーバは特定の年齢層に適切なデジタルコンテンツを提供するために、情報端末を通じてアクセスされるデジタルコンテンツを受け取り、その内容が特定の年齢層にとって不適切であるかをAI手段を用いて判断し、必要に応じて不適切な表現や画像を適切なものに差し替えるシステムである。このシステムは、情報端末にインストールされたアプリケーションとして機能し、端末の利用者がデジタルコンテンツを閲覧する際にリアルタイムでコンテンツの監視と適切な変換を行う。
【0186】
サーバは、人工知能技術を用いて、受け取ったデジタルコンテンツ内のテキストおよび画像に対して不適切な内容を判断する。このAI手段には、画像認識技術や自然言語処理技術が含まれ、これらの技術を活用してコンテンツの安全性を評価する。不適切なコンテンツが検出された場合、AI手段は生成AIモデルを用いて、そのコンテンツを特定の年齢層に適切なものに自動的に差し替える。
【0187】
使用するハードウェアは情報端末であり、これにはスマートフォンやタブレット、パーソナルコンピュータが含まれる。ソフトウェアには、生成AIモデル(例: OpenAIのGPT系列)や画像認識技術(例: Google Cloud Vision API)が活用される。
【0188】
具体例として、ユーザが子供向けの動画配信サービスを利用している状況を考える。動画内に不適切な広告が挿入された場合、AI手段は「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というプロンプト文を用いて生成AIモデルに指示を出し、不適切な広告を風景画像に差し替える。このプロセスは、端末を利用しているユーザが安全なコンテンツのみを閲覧できるようにするためのものである。
【0189】
【0190】
ステップ1:ユーザが情報端末を使用してデジタルコンテンツにアクセスする。この時、入力としてはユーザのアクセス要求があり、出力としては対象のデジタルコンテンツが端末に表示される。端末は、ユーザのアクセス要求に基づき、選択したコンテンツを取得し、画面に表示する。
【0191】
ステップ2:サーバ上のAI手段がデジタルコンテンツを受け取り、内容分析を行う。入力としてはステップ1で取得されたデジタルコンテンツがあり、出力としてはコンテンツの内容に関する分析結果が得られる。この分析結果には、テキストおよび画像内の不適切な内容の有無が含まれる。AI手段は、画像認識技術と自然言語処理技術を用いて、コンテンツ内の不適切な要素を検出する。
【0192】
ステップ3:不適切な内容が検出された場合、AI手段が生成AIモデルを用いて、不適切なコンテンツを適切なものに差し替える。入力としてはステップ2で検出された不適切な内容があり、出力としては差し替え後の適切なコンテンツが得られる。このプロセスでは、不適切な画像やテキストを識別し、「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というようなプロンプト文に基づき、適切なコンテンツに自動的に変換する。
【0193】
ステップ4:変換されたコンテンツをユーザの情報端末に送信し、表示する。入力としてはステップ3で生成された適切なコンテンツがあり、出力としてはユーザの端末に表示されるコンテンツが更新される。サーバは変換されたコンテンツをユーザに提供し、端末はこのコンテンツを受け取り、ユーザに対して表示する。これにより、ユーザは安全なコンテンツのみを閲覧することができる。
【0194】
更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。
【0195】
「形態例1」
【0196】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段、そしてユーザの感情を認識する感情エンジンを含むシステムが提供される。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【0197】
「形態例2」
【0198】
本発明の別の実施形態として、感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整するシステムが提供される。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝え、AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【0199】
「形態例3」
【0200】
本発明のさらに別の実施形態として、感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整するシステムが提供される。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝え、AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【0201】
以下に、各形態例の処理の流れについて説明する。
【0202】
「形態例1」
【0203】
ステップ1:子どもがアクセスするウェブサイトのコンテンツを受け取る。
【0204】
ステップ2:受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかをAIが判断する。
【0205】
ステップ3:不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。
【0206】
ステップ4:ユーザの感情を感情エンジンで認識する。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【0207】
「形態例2」
【0208】
ステップ1:ユーザの感情を感情エンジンで認識する。
【0209】
ステップ2:感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整する。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝える。
【0210】
ステップ3:AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【0211】
「形態例3」
【0212】
ステップ1:ユーザの感情を感情エンジンで認識する。
【0213】
ステップ2:感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整する。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝える。ステップ3:AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【0214】
(実施例1)
【0215】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0216】
インターネット上のコンテンツは多岐にわたり、特定のユーザグループ、特に子どもたちにとって不適切な内容を含むことがある。これにより、ユーザの感情に悪影響を与えたり、誤解を招いたりする恐れがある。また、ユーザの反応に応じてコンテンツを動的に調整する技術が不足しており、個々のユーザに最適化されたインターネット体験を提供することが困難である。
【0217】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0218】
この発明では、サーバは、インターネットに接続された装置からデジタルコンテンツをリアルタイムで取得する手段と、取得したデジタルコンテンツを分析し、該コンテンツが特定のユーザグループにとって不適切な表現や視覚素材であるかを判断するための人工知能手段と、判定された不適切な表現や視覚素材を特定のユーザグループに適切な表現や視覚素材に置き換える手段と、ユーザの反応をリアルタイムで捉え、該反応に基づいてデジタルコンテンツをさらに最適化するための感情認識手段と、を含む。これにより、不適切なコンテンツの識別と置換、およびユーザの感情に基づいたコンテンツの最適化が可能となる。
【0219】
「インターネットに接続された装置」とは、インターネットへのアクセス機能を持ち、ウェブコンテンツの取得やデータ送受信が可能な電子機器である。
【0220】
「デジタルコンテンツ」とは、テキスト、画像、音声、動画など、デジタル形式で表現された情報の総称である。
【0221】
「リアルタイムで」とは、実際の時間とほぼ同時に、遅延なく処理や反応が行われることを意味する。
【0222】
「人工知能手段」とは、機械学習やディープラーニングなどの技術を活用して、人間のように学習し、判断や推論を行うシステムやプログラムのことである。
【0223】
「特定のユーザグループ」とは、年齢、性別、興味・関心など特定の基準に基づき区別されたユーザの集団である。
【0224】
「不適切な表現や視覚素材」とは、特定のユーザグループにとって不快感を与える、または見ることが適さないと判断されるテキストや画像などのコンテンツである。
【0225】
「置き換える」とは、ある要素を取り除き、別の要素でその位置や役割を代替することである。
【0226】
「感情認識手段」とは、人の感情を顔表情や声のトーンなどから識別し、解析する技術やシステムのことである。
【0227】
「最適化」とは、特定の基準に基づき、性能や効果を最良の状態に調整するプロセスである。
【0228】
本発明を実施するための形態について、具体的な説明を行う。この形態は、インターネット上のデジタルコンテンツを特定のユーザグループ、特に子どもたちにとって安全かつ教育的に最適化することを目的としている。
【0229】
まず、端末にはウェブブラウザを通じてアクセスされたデジタルコンテンツをリアルタイムで取得するためのプラグインがインストールされる。このプラグインは、ユーザが閲覧しているウェブページのテキストと画像を捉え、サーバに送信する機能を持つ。このプラグインは、一般的に利用されるウェブブラウザであるGoogle ChromeやMozilla Firefoxに対応している。
【0230】
サーバ側では、人工知能手段がデジタルコンテンツを分析する。この分析は、生成AIモデルを用いて行われ、テキストや画像が特定のユーザグループにとって不適切な表現や視覚素材であるかどうかを判断する。この人工知能手段には、OpenAIのGPTやGoogleのBERTなどの先進的なモデルが利用される。不適切なコンテンツが検出された場合、それは即座に適切な内容に置き換えられる。例えば、攻撃的な言葉はより穏やかな表現に、不適切な画像は教育的な画像に変更される。
【0231】
さらに、サーバにはユーザの反応をリアルタイムで捉えるための感情認識手段が備わっている。この感情認識手段は、ユーザの顔表情や声のトーンを分析し、喜びや困惑などの感情状態を識別する。この分析には、MicrosoftのFace APIやGoogleのCloud Speech-to-Textなどの技術が用いられる。感情のフィードバックに基づいて、デジタルコンテンツはさらに最適化され、ユーザにとってより適切な体験が提供される。
【0232】
プロンプト文の例としては、「このテキスト/画像は子どもにとって適切か?」という問いがAIに送信される。この問いに対してAIは、コンテンツが子どもにとって安全かつ教育的であるかどうかを分析し、必要に応じてコンテンツを調整する。
【0233】
この形態により、サーバはデジタルコンテンツをリアルタイムで分析し、不適切なコンテンツを特定し、これを適切なものに置き換えることができる。また、ユーザの感情を認識し、これに基づいてコンテンツを最適化することが可能となる。これにより、特定のユーザグループにとってより安全かつ教育的なインターネット体験が提供される。
【0234】
【0235】
ステップ1:コンテンツの取得
【0236】
端末にインストールされたブラウザプラグインは、ユーザがウェブサイトにアクセスする際、そのページのテキストと画像をリアルタイムで受け取る。この受け取ったコンテンツは、分析のためにサーバに送信される。
【0237】
入力:ウェブページのテキストと画像
【0238】
データ加工:ウェブページからのテキストと画像の収集
【0239】
出力:サーバに送信されるテキストと画像データ
【0240】
ステップ2:コンテンツの分析
【0241】
サーバ上のAIは、受け取ったテキストと画像を分析し、これが特定のユーザグループにとって不適切な内容を含むかどうかを判断する。この分析には、生成AIモデルが使用される。
【0242】
入力:テキストと画像データ
【0243】
データ加工:AIによる不適切な内容の識別
【0244】
出力:不適切と判定されたコンテンツのリスト
【0245】
ステップ3:コンテンツの置き換え
【0246】
不適切と判定されたコンテンツが存在する場合、サーバはこれを特定のユーザグループに適切な内容に置き換える。この置き換えプロセスには、適切なテキストや画像に関するデータベースが使用される。
【0247】
入力:不適切と判定されたコンテンツのリスト
【0248】
データ加工:不適切なコンテンツを適切なコンテンツに置き換える
【0249】
出力:置き換えられたコンテンツ
【0250】
ステップ4:コンテンツの最適化
【0251】
サーバには、ユーザの反応をリアルタイムで捉える感情認識手段があり、このフィードバックに基づいてコンテンツをさらに最適化する。このプロセスでは、感情認識技術を用いてユーザの反応が分析される。
【0252】
入力:ユーザの感情フィードバック(顔表情や声のトーン)
【0253】
データ加工:感情認識技術によるユーザ反応の分析
【0254】
出力:コンテンツの最適化情報
【0255】
ステップ5:最適化されたコンテンツの表示
【0256】
最後に、サーバから送り返された最適化されたコンテンツは、端末を通じてユーザに表示される。このプロセスにより、ユーザはより安全かつ教育的なコンテンツを体験することができる。
【0257】
入力:置き換えられたコンテンツ、最適化情報
【0258】
データ加工:端末によるコンテンツの表示準備
【0259】
出力:ユーザに表示される最適化されたコンテンツ
【0260】
(応用例1)
【0261】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0262】
インターネット上には子どもにとって不適切なコンテンツが多数存在し、これらに簡単にアクセスできる環境がある。また、子どもの感情や反応に応じて適切なコンテンツを提供するシステムも不足している。これにより、子どもがネガティブな影響を受けるリスクが高まるという問題がある。この発明は、子どもが安全にデジタルコンテンツを楽しめる環境を提供し、さらにその感情に応じた適切なコンテンツを推薦できるシステムの必要性に対応することを目的とする。
【0263】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0264】
この発明では、サーバは、子どもがアクセスするデジタルコンテンツを受け取る手段と、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段と、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段と、ユーザの感情を認識する感情エンジンを含む手段と、を含む。これにより、子どもが安全にインターネットコンテンツを楽しむことができ、さらにその感情や反応に応じて適切なコンテンツを推薦することが可能となる。
【0265】
「子どもがアクセスするデジタルコンテンツ」とは、インターネット上で提供される文章、画像、音声、動画などの情報であり、年少者が閲覧または利用することを想定しているもの。
【0266】
「不適切な言い回しや画像」とは、年少者の健全な成長に悪影響を与える恐れがある、性的な表現、暴力的な表現、差別的な表現などのコンテンツ。
【0267】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを実行するためのアルゴリズムやソフトウェアの総称。
【0268】
「差し替える手段」とは、不適切と判断されたコンテンツを、年少者が閲覧しても安全な別のコンテンツに置き換える操作やプロセス。
【0269】
「ユーザの感情を認識する感情エンジン」とは、ユーザーの顔表情、声のトーン、行動パターンなどからその人の感情状態を推定する技術またはシステム。
【0270】
「ブラウザのプラグイン」とは、ウェブブラウザの機能を拡張するために追加されるソフトウェアコンポーネント。特定の機能やサービスをブラウザ内で直接利用可能にする。
【0271】
この発明を実施するための形態について、具体的な実装方法を示す。本発明のシステムは、子どもが安全にインターネットコンテンツを利用できるようにすること、及びユーザの感情に応じたコンテンツを推薦することを目的としている。
【0272】
サーバは、PythonやTensorFlow、OpenCV、PyTorchなどのライブラリを用いて開発される。これらのソフトウェアは、デジタルコンテンツから不適切な言い回しや画像を検出し、それらを子どもにとって適切なものに自動的に差し替えるAI手段を提供する。また、サーバはユーザの感情を認識する感情エンジンも含み、これは端末のカメラやマイクを介して収集された顔表情や声のトーンから感情を推定する。
【0273】
端末は、スマートフォン、タブレット、スマートTVなど、インターネットに接続できるデバイスを指す。端末上で動作するブラウザのプラグインは、ユーザがアクセスするデジタルコンテンツをリアルタイムでサーバに送信し、サーバからのフィードバックに基づいてコンテンツの表示を調整する。
【0274】
ユーザは、このシステムを利用してインターネットコンテンツを閲覧する際、自動的にフィルタリングされた安全なコンテンツにアクセスする。また、ユーザの感情がポジティブな場合は似た種類のコンテンツを、ネガティブな場合は異なるジャンルのコンテンツを推薦される。
【0275】
具体例として、保護者が子どもに動画を見せる際にこのシステムを利用するシナリオがある。プロンプト文としては、「子どもが見るに適した内容に自動で変換する動画フィルタリング機能」や「子どもの表情から感情を読み取り、コンテンツを推薦する機能」などが用いられる。
【0276】
この形態により、子どもがインターネットを利用する際の安全性が向上し、同時に感情に基づいたパーソナライズされたコンテンツ体験が提供される。
【0277】
【0278】
ステップ1:端末がユーザがアクセスするデジタルコンテンツを受け取る。
【0279】
端末は、ユーザがブラウザを通じてインターネット上のデジタルコンテンツにアクセスした際、そのコンテンツの情報(テキスト、画像、動画など)を受け取る。この情報は、次のステップでの処理のためにサーバへ送信される入力となる。
【0280】
ステップ2:端末が受け取ったコンテンツをサーバに送信する。
【0281】
端末は、受け取ったデジタルコンテンツをサーバに送信する。この送信されたコンテンツは、AIによる分析のための入力データとなる。
【0282】
ステップ3:サーバ上のAIがコンテンツを分析する。
【0283】
サーバ上に搭載されたAI手段は、受け取ったコンテンツを分析し、不適切な言い回しや画像が含まれているかどうかを判断する。この分析によって、コンテンツ内の特定の要素が子どもにとって不適切であると識別された場合、それらを差し替えるための情報が生成される。この処理の出力は、差し替えるべきコンテンツの位置と、それに置き換える適切なコンテンツの情報である。
【0284】
ステップ4:サーバがコンテンツの差し替え指示を端末に送信する。
【0285】
サーバは、AIによる分析結果をもとに、具体的な差し替え指示を端末に送信する。この指示には、どのコンテンツをどのように差し替えるべきかの情報が含まれる。
【0286】
ステップ5:端末がコンテンツを差し替える。
【0287】
端末は、サーバから受け取った差し替え指示に従い、表示中のコンテンツを適切なものに差し替える。この操作により、ユーザは不適切な内容に触れることなく、安全なコンテンツを閲覧できるようになる。
【0288】
ステップ6:端末がユーザの感情を認識する。
【0289】
端末は、内蔵されているカメラやマイクを用いて、ユーザの顔表情や声のトーンから感情を認識する。この情報は、感情に応じたコンテンツ推薦のためにサーバへ送信される。
【0290】
ステップ7:サーバがユーザの感情に基づいたコンテンツ推薦を行う。
【0291】
サーバは、端末から送信されたユーザの感情データを分析し、その感情に最も適したコンテンツを推薦する。この推薦情報は、端末に送信され、ユーザに提示される。
【0292】
この処理フローにより、子どもが安全にデジタルコンテンツを利用できる環境が提供されるとともに、ユーザの感情に応じたパーソナライズされたコンテンツ体験が可能となる。
【0293】
(実施例2)
【0294】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0295】
インターネット上には、特定のユーザグループにとって不適切または有害と考えられるコンテンツが数多く存在する。特に、子どもや感受性の高い個人がアクセスする可能性のあるウェブサイトでは、不適切な言葉や画像によって悪影響を及ぼすリスクがある。また、ユーザの感情状態に応じてコンテンツを適切に調整する必要性が高まっている。この課題に対処するためには、ユーザが閲覧するコンテンツをリアルタイムで分析し、不適切なコンテンツを適切なものに自動的に差し替えるとともに、ユーザの感情状態を考慮したコンテンツの提供が求められる。
【0296】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0297】
この発明では、サーバは、インターネット上のコンテンツをリアルタイムに受け取る手段と、受け取ったコンテンツが特定のユーザグループに対して不適切な表現や視覚的要素であるかを判断する人工知能手段と、不適切な表現や視覚的要素を特定のユーザグループに伝えることが可能な表現や視覚的要素に差し替える手段と、ユーザの感情状態を評価し、この評価に基づいて表現や視覚的要素の差し替え方を調整する感情エンジン手段を含む。これにより、不適切なコンテンツを自動的に適切なものに差し替えることが可能となり、さらにユーザの感情状態に応じた適切なコンテンツの提供が可能となる。
【0298】
「インターネット上のコンテンツ」とは、ウェブサイト、オンラインプラットフォーム、ソーシャルメディア等、インターネットを介してアクセス可能なすべてのテキスト、画像、動画、およびその他のメディア形式の情報。
【0299】
「リアルタイムに受け取る手段」とは、ユーザがウェブページを閲覧しているその瞬間に、そのページのコンテンツを捕捉し、分析のために取り込むプロセスまたは技術。
【0300】
「特定のユーザグループ」とは、年齢、性別、職業、文化的背景など、特定の属性を共有するユーザの集合であり、システムがそのニーズや制約を考慮してサービスを提供する対象。
【0301】
「不適切な表現や視覚的要素」とは、暴力的、性的、攻撃的、またはその他の方法で特定のユーザグループ、特に子どもや感受性の高い個人にとって不適切または有害と考えられる言葉や画像。
【0302】
「人工知能手段」とは、機械学習、深層学習、自然言語処理、画像認識などの技術を用いて、データを解析し、学習し、特定のタスクを自動で実行するソフトウェアまたはシステム。
【0303】
「インターネットブラウザの拡張機能」とは、ウェブブラウザに追加されるソフトウェアコンポーネントで、ブラウザの機能を拡張し、ユーザ体験を向上させるもの。
【0304】
「感情エンジン手段」とは、ユーザの行動、テキスト入力、声のトーン、表情などからユーザの感情状態を推定し、その情報を基にシステムの応答を調整する技術やアルゴリズム。
【0305】
本発明を実施するための形態は、インターネット上のコンテンツをユーザにとってより適切なものに変換するシステムに関する。このシステムは、特にインターネットブラウザの拡張機能として実装される人工知能手段、感情エンジン手段、およびこれらを支えるハードウェアおよびソフトウェアの組み合わせで構成される。
【0306】
このシステムは、端末(パーソナルコンピュータ、スマートフォン、タブレット等)にインストールされたインターネットブラウザの拡張機能として動作する。この拡張機能は、JavaScriptやその他のウェブ技術を用いて開発され、ユーザが閲覧するウェブページからテキストや画像などのコンテンツをリアルタイムで受け取る機能を持つ。受け取ったコンテンツは、HTTPSリクエストを介してサーバ上の人工知能手段に送信される。この人工知能手段は、機械学習や自然言語処理、画像認識技術を駆使してコンテンツを分析し、その内容が特定のユーザグループにとって不適切であるかを判断する。
【0307】
不適切なコンテンツが検出された場合、人工知能手段は、テキストをより適切な表現に置き換えたり、画像を問題ないものに差し替えたりする。例えば、攻撃的な言葉は穏やかな言い回しに、暴力的な画像は風景画や動物の画像に置き換えられる。この差し替えたコンテンツは再び端末に送信され、ブラウザの拡張機能がウェブページの表示を更新する。
【0308】
さらに、このシステムには感情エンジン手段が組み込まれており、ユーザの行動や入力から感情状態を推測し、その情報を人工知能手段に提供する。これにより、ユーザが怒っているなどの感情状態に基づいて、より穏やかなコンテンツに差し替えることができる。この感情エンジンは、機械学習アルゴリズムを用いてユーザの感情を評価し、その結果を人工知能手段の処理に反映させる。
【0309】
具体例としては、「このテキストに含まれる不適切な表現を子どもが理解しやすい言葉に置き換えてください」や「この画像を子どもが見ても問題ない内容に差し替えてください」というプロンプト文が人工知能手段に送信され、この要求に基づいてコンテンツの分析および変換が行われる。
【0310】
【0311】
ステップ1:コンテンツの受信
【0312】
端末上で動作するブラウザの拡張機能が、ユーザが閲覧しているウェブページからテキストや画像などのコンテンツを受信する。この段階では、ウェブページのDOMを解析し、テキストと画像のデータが抽出される。入力はウェブページのHTMLコンテンツであり、出力は抽出されたテキストと画像データである。
【0313】
ステップ2:コンテンツの分析要求
【0314】
抽出されたコンテンツは、HTTPSリクエストを介してサーバに送信される。サーバ上の人工知能手段がこのコンテンツを受け取り、分析を開始する。入力は抽出されたテキストと画像データであり、出力は分析結果(コンテンツが不適切かどうかの判断)である。
【0315】
ステップ3:コンテンツの分析
【0316】
人工知能手段は、テキストと画像に含まれる内容を分析し、その不適切性を評価する。この過程で、テキストは自然言語処理技術を、画像は画像認識技術を用いて処理される。入力はテキストと画像データであり、出力はそれぞれの不適切性評価結果である。
【0317】
ステップ4:感情エンジンによる調整
【0318】
端末またはサーバ上で動作する感情エンジンが、ユーザの感情状態を評価し、その情報を人工知能手段に提供する。この情報は、コンテンツの差し替え方を調整するために使用される。入力はユーザの行動や入力データであり、出力はユーザの感情状態の評価結果である。
【0319】
ステップ5:差し替えコンテンツの生成
【0320】
不適切なコンテンツが検出された場合、人工知能手段は適切な言葉や画像に差し替えるための新しいコンテンツを生成する。このプロセスでは、不適切なテキストは適切な言葉に、不適切な画像は適切な画像に変換される。入力は不適切性評価結果とユーザの感情状態、出力は差し替えられた新しいテキストと画像である。
【0321】
ステップ6:コンテンツの表示更新
【0322】
サーバから差し替えられたコンテンツが端末に送信され、ブラウザの拡張機能を通じてウェブページの表示が更新される。このステップで、ユーザには最終的に適切なコンテンツのみが表示される。入力は差し替えられた新しいテキストと画像データ、出力は更新されたウェブページの表示である。
【0323】
(応用例2)
【0324】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0325】
インターネット上には、特定の利用者群にとって不適切と考えられるコンテンツが存在する。これらのコンテンツは、特に若年層の利用者にとって、精神的な不快感や誤解を招く可能性がある。また、利用者の現在の感情状態によっては、通常ならば無害と考えられるコンテンツであっても、感情的なダメージを引き起こすことがある。従来技術では、これらの不適切なコンテンツを効率的にかつ利用者の感情状態を考慮してフィルタリングすることは困難であった。
【0326】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0327】
この発明では、サーバは、ウェブサイトのコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群にとって不適切であるかを判断する人工知能手段と、不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段と、利用者の感情状態を認識し、その感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段を含む。これにより、特定の利用者群がインターネットを安全に利用できるようにすると同時に、利用者の感情状態に応じた適切なコンテンツの提供が可能となる。
【0328】
「利用者」とは、インターネットを利用する個人または特定のグループを指す。
【0329】
「ウェブサイトのコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【0330】
「人工知能手段」とは、機械学習、深層学習、自然言語処理などの技術を用いて、データを分析し、判断を行うシステムやプログラムを指す。
【0331】
「特定の利用者群に対して不適切な言い回しや画像」とは、年齢、性別、文化的背景などに基づき、そのグループにとって不快、不適切、または有害と判断されるコンテンツを指す。
【0332】
「不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段」とは、不適切なコンテンツを、該当する利用者群が安全に閲覧可能な形に自動的に変更する技術や方法を指す。
【0333】
「利用者の感情状態を認識する手段」とは、利用者の表情、声のトーン、文脈などからその時点での感情状態を検出し、解析する技術やシステムを指す。
【0334】
「感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段」とは、利用者の現在の感情を考慮し、コンテンツの差し替え方法を最適化することで、よりポジティブなユーザー体験を提供する技術やプロセスを指す。
【0335】
「ウェブブラウザの拡張機能」とは、インターネットブラウザの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアまたはプログラムを指す。
【0336】
この発明を実施するための形態では、利用者が安全にインターネットを利用できるようにするシステムを提供する。このシステムは、特に利用者の感情状態を考慮しながら、ウェブサイトのコンテンツをフィルタリングし、必要に応じて適切なコンテンツに差し替える機能を持つ。このシステムは、主にウェブブラウザの拡張機能として実装される人工知能手段、利用者の感情状態を認識する感情認識手段、および不適切なコンテンツを差し替える手段から構成される。
【0337】
サーバは、深層学習、自然言語処理、画像認識技術を用いた人工知能モデルを実行する。この人工知能モデルは、受け取ったウェブサイトのコンテンツを解析し、そのコンテンツが特定の利用者群にとって不適切であるかどうかを判断する。不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える。
【0338】
端末は、カメラやマイクロフォンを用いて利用者の感情状態をリアルタイムで検出し、この情報をサーバに送信する。サーバはこの感情データを分析し、利用者が現在抱いている感情を考慮してコンテンツの差し替え方を調整する。このプロセスにより、利用者の感情を和らげるようなより穏やかなコンテンツへの差し替えが可能となる。
【0339】
使用するハードウェアは、カメラ、マイクロフォン、およびインターネットに接続されたコンピュータやスマートデバイスである。ソフトウェアは、TensorFlowやPyTorchといった深層学習フレームワークを使用して開発される人工知能モデル、およびウェブブラウザの拡張機能として機能するプログラムである。
【0340】
具体例として、プロンプト文「10歳の子どもに適切な言葉を使用して説明してください」という指示が人工知能モデルに送信される場合がある。このプロンプトは、特定のコンテンツが子どもにとって不適切である場合に、そのコンテンツを子どもが理解しやすい形に差し替えるよう人工知能モデルに指示するために使用される。このような機能により、インターネットの安全な利用環境が提供される。
【0341】
【0342】
ステップ1:利用者がウェブブラウザを通じてウェブサイトにアクセスする。この時、ブラウザの拡張機能がアクセスしたウェブサイトのコンテンツを受け取る。入力はウェブサイトのURLまたはコンテンツであり、出力はウェブサイトから受け取ったコンテンツのデータである。このプロセスでは、ウェブブラウザのAPIを使用して、ウェブサイトのコンテンツを取得する動作が行われる。
【0343】
ステップ2:取得したコンテンツをサーバに送信し、人工知能手段を用いてコンテンツが特定の利用者群にとって不適切であるかを判断する。入力はウェブサイトのコンテンツであり、出力は不適切なコンテンツの有無と、その詳細(テキストまたは画像)である。このステップでは、テキスト解析や画像認識の技術を用いて、コンテンツ内の不適切な言い回しや画像を特定する動作が行われる。
【0344】
ステップ3:端末は利用者の感情状態をカメラやマイクロフォンを通じて検出し、この情報をサーバに送信する。入力は利用者の表情や声のトーンであり、出力は利用者の感情状態(例:怒り、喜び)である。このステップでは、表情認識や音声解析技術を用いて、利用者の感情を判定する動作が行われる。
【0345】
ステップ4:サーバは受け取った感情データを分析し、その感情状態に基づいて、不適切なコンテンツの差し替え方を調整する。入力は利用者の感情状態であり、出力は差し替えられるコンテンツの種類(より穏やかな言葉や画像)である。このステップでは、利用者の感情に最も適したコンテンツを選択し、不適切なコンテンツを適切なものに差し替える動作が行われる。
【0346】
ステップ5:最終的にサーバは、差し替えられたコンテンツをウェブブラウザの拡張機能を通じて利用者の端末に送信する。入力は差し替えられるべきコンテンツの指示であり、出力は実際に差し替えられたウェブサイトのコンテンツである。このプロセスでは、ウェブブラウザのAPIを介して、差し替え後のコンテンツをウェブページ上に表示する動作が行われる。
【0347】
(実施例3)
【0348】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0349】
デジタルコンテンツの中には、特定のユーザーグループ、特に子どもや敏感な内容に対して保護を必要とするユーザーにとって不適切な言い回しや画像が含まれている場合がある。これらのコンテンツは、見る者に悪影響を及ぼす可能性がある。また、ユーザーの感情状態に合わせてコンテンツを提供する既存のシステムは少なく、ユーザー体験を向上させるためのパーソナライゼーションが不足している。これらの問題に対処するための効果的な解決策が求められている。
【0350】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0351】
この発明では、サーバは、デジタルコンテンツを受け取る手段と、受け取ったコンテンツが特定のユーザーグループに対して不適切な言い回しや画像であるかを判断する人工知能手段と、不適切な言い回しや画像を適切な言い回しや画像に自動的に差し替える手段と、ユーザーの感情状態を検出する手段と、検出された感情状態に基づいてコンテンツの表示を調整する手段と、を含む。これにより、不適切なコンテンツを適切なものに自動で差し替えることが可能となり、また、ユーザーの感情状態に基づいたコンテンツのパーソナライゼーションを実現することが可能となる。
【0352】
「デジタルコンテンツ」とは、インターネット上で共有、配布、またはアクセス可能なテキスト、画像、動画、音声などの電子的形式の情報やメディアを指す。
【0353】
「特定のユーザーグループ」とは、年齢、性別、文化的背景など特定の属性や条件に基づいて区別されるユーザーの集団を指す。
【0354】
「不適切な言い回しや画像」とは、特定のユーザーグループにとって不快、攻撃的、または有害とみなされる可能性のある言葉遣いや視覚的表現を指す。
【0355】
「人工知能手段」とは、学習、推論、認識、言語理解などの人間の知能を模倣することを目的としたコンピュータープログラムやテクノロジーの総称を指す。
【0356】
「自動的に差し替える手段」とは、人の介入なしに、プログラムやシステムが自律的に行動や処理を実行する方法や機能を指す。
【0357】
「ユーザーの感情状態」とは、個人がその時点で経験している感情や気分のことで、喜び、悲しみ、怒り、驚きなど多岐にわたる。
【0358】
「検出する手段」とは、特定の情報や状態を識別し、その存在を確認するために用いられる技術や方法を指す。
【0359】
「コンテンツの表示を調整する手段」とは、ユーザーに提供される情報やメディアの形式、順序、または内容を変更するプロセスや機能を指す。
【0360】
この発明を実施するための形態は、コンテンツの安全性とユーザー体験の向上を中心に展開される。主に使用されるハードウェアは、サーバー、端末(スマートフォン、タブレット、パソコン等)、および感情検出装置(端末内蔵のカメラやマイクロフォン)である。ソフトウェア面では、画像認識技術、自然言語処理技術、感情分析技術、および生成AIモデルが核となる。
【0361】
サーバは、高性能なプロセッシング能力を持つコンピューターであり、クラウド上または物理的なデータセンター内に配置される。このサーバには、特定の生成AIモデルがインストールされており、不適切なコンテンツの識別と差し替え、ユーザーの感情に基づくコンテンツの調整を行う。具体的なソフトウェアとしては、OpenAIが提供する画像認識技術やGPT系の生成AIモデルが使用される。
【0362】
端末は、ユーザーがコンテンツをアップロードし、サーバから送信された結果を受け取るインターフェースとして機能する。また、端末内蔵のカメラやマイクロフォンを通じてユーザーの感情状態を検出し、そのデータをサーバに送信する。
【0363】
具体例として、ユーザーが暴力的な画像をアップロードした場合、「画像内の不適切な要素を識別し、適切な風景画像に差し替えてください。また、ユーザーの現在の感情が喜びである場合は、ポジティブなニュース記事や画像を優先的に表示するように調整してください。」というプロンプト文が生成AIモデルによって処理される。サーバはこのプロンプトに基づき、暴力的な画像を風景画に差し替え、ユーザーの感情が喜びであることを考慮して、適切なコンテンツを選択し、端末に送信する。
【0364】
この形態により、ユーザーは安全で個人の感情に応じたコンテンツ体験を享受できるようになる。
【0365】
【0366】
ステップ1:
【0367】
ユーザがデジタルコンテンツを端末を通じてサーバにアップロードする。この時、入力はユーザから提供された画像やテキストであり、サーバはこのデジタルコンテンツを受け取る動作を行う。
【0368】
ステップ2:
【0369】
サーバ上の人工知能手段が、受け取ったデジタルコンテンツに対して内容分析を行う。このプロセスでは、画像認識技術や自然言語処理技術を用いて、コンテンツ内の言い回しや画像が特定のユーザーグループにとって不適切かどうかを判断する。入力はデジタルコンテンツであり、出力は不適切なコンテンツの有無とその内容に関する情報である。
【0370】
ステップ3:
【0371】
不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える手段を実行する。このステップの入力は不適切と判断されたコンテンツであり、出力はユーザーにとって安全な代替コンテンツである。この差し替えプロセスは、あらかじめ準備された安全なコンテンツのデータベースから選択されるか、生成AIモデルを用いて新たに生成される。
【0372】
ステップ4:
【0373】
端末はユーザーの感情状態を検出する機能を持ち、その情報をサーバに送信する。このステップでは、入力としてユーザーの表情や音声が使用され、出力はユーザーの感情状態(喜び、悲しみ等)の分析結果である。
【0374】
ステップ5:
【0375】
サーバは、受け取った感情状態の情報に基づき、コンテンツの表示を調整する。この調整は、ユーザーの感情にマッチするコンテンツを選択し、それを優先的に表示するためのものである。入力はユーザーの感情状態の情報であり、出力は調整されたコンテンツのセットである。
【0376】
このプログラムの処理を実施することで、ユーザーは自分の感情に合わせて最適化されたコンテンツを受け取ることができるようになり、不適切なコンテンツから保護される。
【0377】
(応用例3)
【0378】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマートデバイス14を「端末」と称する。
【0379】
従来のデジタルコンテンツ提供システムでは、ユーザーの個別の感情状態を考慮せずに一律のコンテンツを提供していた。これにより、ユーザーの現在の感情や必要に応じたコンテンツを適切に提供することが困難であった。特に、ユーザーが求める感情的なサポートや体験をデジタルコンテンツを通じて提供することに限界があった。
【0380】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0381】
この発明では、サーバは、ユーザーの表情をリアルタイムで分析する画像認識手段と、分析結果に基づいてユーザーの感情状態を判断する感情エンジン手段と、ユーザーの感情状態に適したコンテンツを選定し提供するAI手段と、を含む。これにより、ユーザーの現在の感情状態に基づいたパーソナライズされたデジタルコンテンツの提供が可能となる。
【0382】
「デジタルコンテンツ」とは、インターネット上で配信される動画、音楽、文章、画像などの電子的形式で存在するコンテンツのことである。
【0383】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを自動で実行するシステムやプログラムのことである。
【0384】
「ユーザーの感情状態に適したコンテンツに差し替える手段」とは、ユーザーの現在の感情を考慮して、その感情に適合または反応するようなコンテンツに自動で切り替える技術やプロセスのことである。
【0385】
「画像認識手段」とは、カメラ等のデバイスを通じて取得した画像データから特定のパターンや物体を識別し、解析する技術やシステムのことである。
【0386】
「感情エンジン手段」とは、ユーザーの表情、声のトーン、言葉遣いなどから感情状態を推測し、解析する技術やシステムのことである。
【0387】
「コンテンツの選定と表示を優先順位付けするAI手段」とは、ユーザーに最適なコンテンツを選び出し、その表示順をユーザーの好みや状況に合わせて自動で調整する人工知能の機能やプロセスのことである。
【0388】
この発明を実施するための形態は、ユーザーの感情状態に基づいてデジタルコンテンツを動的に選定し、提供するシステムに関連している。このシステムは、主にスマートフォンやタブレットなどの端末にインストールされるアプリケーションとして実装される。端末の内蔵カメラを用いてユーザーの表情をリアルタイムで分析し、画像認識手段を通じて得られたデータを基に感情エンジン手段がユーザーの感情状態を判断する。この判断結果を元に、AI手段がユーザーの現在の感情に最も適したコンテンツを選定し、画面上に表示する。
【0389】
ハードウェアとしては、スマートフォンやタブレットの内蔵カメラとプロセッサが使用される。ソフトウェアとしては、画像認識にOpenCV、機械学習にはTensorFlowなどのライブラリが用いられる。このシステムを通じて、例えばユーザーが悲しんでいる場合には、明るく元気づけるような動画や音楽を提供することが可能となる。逆に、ユーザーがリラックスしている場合には、穏やかな音楽や風景画像を優先的に表示するように調整する。
【0390】
具体的なプログラムの操作手順としては、まずアプリケーションが端末のカメラを起動し、ユーザーの表情をキャプチャする。続いて、画像認識手段を用いて表情から感情を分析し、感情エンジン手段によってユーザーの感情状態が判断される。最後に、この感情状態に基づき、AI手段がコンテンツの選定と表示を行う。このプロセスは、ユーザーがアプリケーションを使用している間、連続的に実行される。
【0391】
プロンプト文の例として、「ユーザーが悲しんでいるときに推薦するべき楽しい動画のリストを生成せよ」や「ユーザーが喜んでいるときにさらに喜びを増幅させる動画のリストを生成せよ」という具体例が挙げられる。これにより、ユーザーの感情に応じたコンテンツを提供することで、ユーザー体験を向上させることが目的である。
【0392】
【0393】
ステップ1:
【0394】
端末が内蔵カメラを起動し、ユーザーの表情をキャプチャする。この段階では、カメラからの映像データが入力として受け取られ、生の画像データとして端末に送信される。
【0395】
ステップ2:
【0396】
画像認識手段がキャプチャされた画像データを分析し、ユーザーの表情から感情を推定する。この処理では、入力として受け取った画像データに対して顔認識アルゴリズムが適用され、ユーザーの表情に基づいた感情のスコア(例:喜び、悲しみ、怒りなど)が出力として生成される。
【0397】
ステップ3:
【0398】
感情エンジン手段が、ステップ2で得られた感情スコアを基にユーザーの感情状態を最終的に判断する。このステップでは、入力として受け取った感情スコアを分析し、最も可能性の高い感情状態を出力として決定する。
【0399】
ステップ4:
【0400】
AI手段が、ステップ3で判断されたユーザーの感情状態に基づいて、適切なデジタルコンテンツを選定する。この過程では、データベース内のコンテンツ情報とユーザーの感情状態が入力として考慮され、感情状態に最適なコンテンツのリストが出力として生成される。
【0401】
ステップ5:
【0402】
選定されたコンテンツが端末の画面上に表示される。この最終ステップでは、ステップ4で生成されたコンテンツリストが入力として受け取られ、それらのコンテンツがユーザーインターフェース上に適切に配置されてユーザーに提示される。
【0403】
これらの処理ステップを通じて、ユーザーは自分の感情状態に適したデジタルコンテンツをリアルタイムで受け取ることができ、よりパーソナライズされたユーザー体験を享受することが可能となる。
【0404】
特定処理部290は、特定処理の結果をスマートデバイス14に送信する。スマートデバイス14では、制御部46Aが、出力装置40に対して特定処理の結果を出力させる。マイクロフォン38Bは、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン38Bによって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。
【0405】
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。
【0406】
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。
【0407】
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマートデバイス14によって特定処理が行われるようにしてもよい。
【0408】
[第2実施形態]
【0409】
図3には、第2実施形態に係るデータ処理システム210の構成の一例が示されている。
【0410】
図3に示すように、データ処理システム210は、データ処理装置12及びスマート眼鏡214を備えている。データ処理装置12の一例としては、サーバが挙げられる。
【0411】
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。
【0412】
スマート眼鏡214は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、及び通信I/F44を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、及びカメラ42も、バス52に接続されている。
【0413】
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。
【0414】
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。
【0415】
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。
【0416】
図4には、データ処理装置12及びスマート眼鏡214の要部機能の一例が示されている。
図4に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。
【0417】
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。
【0418】
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。
【0419】
スマート眼鏡214では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。
【0420】
次に、データ処理装置12の特定処理部290による特定処理について説明する。
【0421】
「形態例1」
【0422】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段として、ブラウザのプラグインを用いる。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0423】
「形態例2」
【0424】
本発明の別の実施形態として、AIはブラウザのプラグインとして実装される。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0425】
「形態例3」
【0426】
本発明のさらなる実施形態として、AIはテキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である。具体的には、AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【0427】
以下に、各形態例の処理の流れについて説明する。
【0428】
「形態例1」
【0429】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0430】
ステップ2:受け取ったコンテンツはAIに送信される。
【0431】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像で
【0432】
あるかを判断する。
【0433】
ステップ4:不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0434】
「形態例2」
【0435】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0436】
ステップ2:受け取ったコンテンツはAIに送信される。
【0437】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0438】
「形態例3」
【0439】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0440】
ステップ2:受け取ったコンテンツはAIに送信される。
【0441】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【0442】
ステップ4:AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【0443】
(実施例1)
【0444】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0445】
現代の情報通信ネットワーク上には、特定のユーザグループ、特に子どもたちにとって不適切な表現や視覚情報が多く存在する。これらのコンテンツによって、子どもたちが精神的な不快感を感じたり、不適切な行動を学習したりするリスクがある。従来のフィルタリング技術では、これらの問題を完全に解決することが困難であり、特にリアルタイムでコンテンツを分析し、不適切な内容を適切なものに置き換えることは実現が難しい。
【0446】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0447】
この発明では、サーバは、ユーザがアクセスする情報通信ネットワーク上のコンテンツをリアルタイムで受け取る手段と、受け取ったコンテンツを情報処理システムに送信する手段と、送信されたコンテンツが特定のユーザグループに対して不適切な表現や視覚情報であるかを分析し判断する情報処理システムと、不適切と判断された表現や視覚情報を特定のユーザグループにとって適切な表現や視覚情報に自動的に変換する手段と、を含む。これにより、特定のユーザグループが情報通信ネットワークを利用する際の安全性を高め、不適切なコンテンツからの保護を実現することが可能となる。
【0448】
「情報通信ネットワーク」は、インターネットやその他のデジタル通信手段を通じて情報を交換するシステムの総称である。
【0449】
「コンテンツ」は、ウェブサイト、ビデオ、画像、テキストなど、デジタル形式で表現された情報やエンターテインメントのことである。
【0450】
「リアルタイムで受け取る手段」は、ユーザがアクセスした瞬間にその情報を捕捉し、処理する技術や方法のことである。
【0451】
「情報処理システム」は、受け取ったデータを分析、加工、変換するためのハードウェアおよびソフトウェアの集合体である。
【0452】
「特定のユーザグループ」は、特定の属性、年齢、興味などに基づいて区別されるユーザの集まりである。
【0453】
「不適切な表現や視覚情報」は、そのユーザグループにとって精神的な不快感を与えるか、あるいは不適切な行動や考え方を促す可能性がある言葉や画像などの情報である。
【0454】
「自動的に変換する手段」は、特定の基準やルールに基づいて、不適切な内容を適切な内容に置き換えるプロセスを自動で行う技術や方法である。
【0455】
この発明を実施するための形態においては、主に情報処理システム、ユーザの端末、および拡張機能としてのブラウザプラグインを用いる。情報処理システムは、生成AIモデルを含むサーバ上で構成され、ユーザの端末は、この情報処理システムにリアルタイムでコンテンツを送信するためのブラウザとプラグインを備えている。
【0456】
情報処理システムでは、特にOpenAIのGPT-4や画像処理に特化したDALL・Eといった具体的な生成AIモデルが使用される。これらのモデルは、テキストと画像の両方に対して不適切な内容を識別し、適切な内容に変換する機能を持っている。この処理は、端末から送信されたコンテンツに基づいて自動的に行われる。
【0457】
端末には、ユーザが情報通信ネットワークを閲覧する際に使用するブラウザがインストールされており、このブラウザには発明に基づいたプラグインが追加されている。このプラグインは、ユーザがアクセスするコンテンツを捕捉し、情報処理システムに送信する役割を持っている。送信されたコンテンツは、サーバ上の生成AIモデルによってリアルタイムで分析される。
【0458】
具体例として、ユーザが不適切な表現を含むテキストや画像にアクセスした場合、プラグインはこれらのコンテンツを捕捉し、サーバに送信する。サーバ上の生成AIモデルは、以下のようなプロンプト文を用いてコンテンツを分析する。「このウェブサイトには子どもに不適切な言葉が含まれています。適切な表現に変換してください。」「この画像は子どもに不適切です。子どもが見ても安全な、テーマに合った画像に置き換えてください。」これらのプロンプト文は、テキストや画像を適切なものに変換するための指示として機能する。変換後のコンテンツは再び端末に送り返され、ユーザが見るコンテンツが更新される。
【0459】
この形態により、特定のユーザグループ、特に子どもたちが情報通信ネットワークを安全に利用できるようにすることが目指されている。
【0460】
【0461】
ステップ1:ユーザがブラウザを通じて情報通信ネットワーク上のコンテンツにアクセスする。この際、端末にインストールされたブラウザプラグインが動作を開始し、ユーザが閲覧しているコンテンツを捕捉する。このプラグインは、テキスト、画像、およびその他のメディアファイルを含むすべてのコンテンツのデータをリアルタイムで収集する。入力はユーザがアクセスしたウェブページのコンテンツであり、出力は収集されたコンテンツデータである。
【0462】
ステップ2:捕捉したコンテンツデータは、ブラウザプラグインによってサーバに送信される。サーバ上の情報処理システムは、受信したコンテンツデータを分析するために生成AIモデルを用いる。この処理では、コンテンツが特定のユーザグループにとって不適切な表現や視覚情報を含んでいるかを判断する。入力は端末から送信されたコンテンツデータであり、出力は分析結果(不適切なコンテンツの識別)である。
【0463】
ステップ3:不適切と判断されたコンテンツに対して、サーバ上の生成AIモデルは、適切な表現や視覚情報に自動的に変換する処理を行う。たとえば、不適切な言葉は適切な言葉に、不適切な画像は問題ない画像に置き換えられる。この変換プロセスにおける入力は分析結果で識別された不適切なコンテンツであり、出力は変換後の適切なコンテンツである。
【0464】
ステップ4:変換されたコンテンツは、再び端末に送り返される。端末のブラウザプラグインは、オリジナルのコンテンツを変換後のコンテンツで更新し、ユーザの閲覧中のウェブページに表示する。このステップにおける入力はサーバから送信された変換後のコンテンツであり、出力はユーザが閲覧する更新されたウェブページである。
【0465】
これらの処理ステップを通じて、ユーザは不適切なコンテンツに触れることなく、情報通信ネットワークを安全に利用することが可能となる。各ステップは、特に子どもなどの保護が必要なユーザグループのオンライン安全性を高めることを目的としている。
【0466】
(応用例1)
【0467】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0468】
デジタルコンテンツにおける不適切な言い回しや画像が利用者、特に子どもに与える影響に関する懸念が高まっています。インターネット上では、年齢に不適切なコンテンツに容易にアクセスできる環境があり、これらのコンテンツが心理的、情緒的な影響を与えかねない問題があります。特に、利用者がこれらのコンテンツを遭遇した際に、その場で内容を適切なものに変換し、安全な閲覧体験を提供する技術の需要があります。
【0469】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0470】
この発明では、サーバは、デジタルコンテンツをリアルタイムで取得する手段と、取得したコンテンツの適切性を評価するためにコンテンツを生成AIモデルに送信する手段と、不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する生成AIモデルに基づく手段と、を含む。これにより、不適切なコンテンツをリアルタイムで検出し、自動的に適切な表現に変換することが可能となる。結果として、利用者に対して安全なデジタルコンテンツ閲覧環境を提供することができる。
【0471】
「デジタルコンテンツ」とは、インターネット上で配信されるテキスト、画像、動画などの情報の総称である。
【0472】
「リアルタイムで取得する手段」とは、利用者がアクセスする瞬間にそのコンテンツを取得し、分析するための技術や方法である。
【0473】
「生成AIモデルに送信する手段」とは、取得したコンテンツを人工知能モデルに送り、解析や処理を行わせるための技術や方法である。
【0474】
「不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する」とは、生成AIモデルがコンテンツ内の不適切な言い回しや画像を識別し、それらを年齢や理解度に応じた適切な内容に置き換えるプロセスである。
【0475】
「利用者」とは、デジタルコンテンツを閲覧または利用する個人である。
【0476】
「サーバ」とは、インターネット上でデータやサービスを提供するコンピュータシステムまたはそのソフトウェアを指す。
【0477】
「アプリケーション」とは、特定の目的のためにデザインされたソフトウェアプログラムである。
【0478】
この発明を実施するための形態において、システムは主にサーバ、端末(スマートフォン、タブレット、スマート眼鏡、ヘッドマウントディスプレイなど)、およびユーザ(特に子ども)から構成される。サーバは生成AIモデルをホストしており、端末はインターネット上のデジタルコンテンツにアクセスするためのブラウザや専用アプリケーションを実行する。このシステムは、端末がアクセスしたデジタルコンテンツをリアルタイムで取得し、そのコンテンツをサーバ上の生成AIモデルに送信する機能を有する。生成AIモデルは、送信されたコンテンツの適切性を評価し、不適切な表現が含まれている場合、それをユーザが理解しやすい適切な表現に自動的に変換する。
【0479】
このシステムを実現するためには、JavaScriptやPythonなどのプログラミング言語で記述された端末上で動作するブラウザプラグインやアプリケーション、およびサーバ上で実行されるTensorFlowやOpenAIのGPT、DALL-Eなどの生成AIモデルが使用される。これらのソフトウェアは、ハードウェア上で実行され、デジタルコンテンツの取得、解析、変換のプロセスを効率的に行う。
【0480】
具体例として、子どもが暴力的な画像を含むニュースサイトにアクセスした場合、システムはその画像をリアルタイムで取得し、サーバに送信する。生成AIモデルは、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」というプロンプト文に基づいて処理を行い、暴力的な要素を含まない代替画像を生成し、その画像を元のコンテンツの場所に表示する。このプロセスにより、ユーザは安全なデジタルコンテンツ閲覧環境を享受できる。
【0481】
【0482】
ステップ1:端末がデジタルコンテンツにアクセスする
【0483】
ユーザが端末を用いてインターネット上の特定のウェブサイトにアクセスする。この時、端末上で動作するブラウザプラグインまたはアプリケーションがデジタルコンテンツ(テキスト、画像、動画など)をリアルタイムで取得する。入力としてはユーザのアクセスしたウェブサイトのURLやそのページのHTMLコードがあり、出力としてはそのページのコンテンツデータが得られる。
【0484】
ステップ2:コンテンツの適切性を評価するためにサーバに送信する
【0485】
取得したデジタルコンテンツは、評価のためにサーバ上の生成AIモデルに送信される。このプロセスでは、入力として取得したデジタルコンテンツがあり、出力としてはそのコンテンツが生成AIモデルによって受け取られる。
【0486】
ステップ3:生成AIモデルがコンテンツを分析し、不適切な内容を識別する
【0487】
サーバ上の生成AIモデルは、送信されたコンテンツを分析し、不適切な言い回しや画像を識別する。入力としてはステップ2で送信されたコンテンツがあり、出力としては不適切な内容のリストや識別情報が得られる。このステップでは、特定のキーワードや画像認識技術を用いて不適切な内容を検出するデータ加工又はデータ演算が行われる。
【0488】
ステップ4:不適切な内容を適切な内容に変換する
【0489】
識別された不適切な内容は、子どもが理解しやすい適切な言い回しや画像に自動的に変換される。この処理には、生成AIモデルが使用され、入力としてはステップ3で識別された不適切な内容があり、出力としては変換後の適切なコンテンツが得られる。生成AIモデルは、不適切な内容を受け取り、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」といったプロンプト文に基づいて、適切な内容へと変換するデータ演算を行う。
【0490】
ステップ5:変換後のコンテンツを端末に送信し、表示する
【0491】
最後に、サーバは変換後の適切なコンテンツを端末に送信し、ユーザがアクセスしたウェブページ上でその内容が表示されるようにする。入力としてはステップ4で生成された適切なコンテンツがあり、出力としてはユーザの端末上でそのコンテンツが表示される。このステップでは、サーバから端末へのデータ送信と、端末上でのデータ表示処理が行われる。
【0492】
(実施例2)
【0493】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0494】
インターネット上には子どもがアクセスすべきではない不適切な内容が数多く存在している。保護者が常に監視することは現実的ではなく、既存のフィルタリング技術でも完全にはブロックできない場合がある。特に、テキストと画像の両方を含むコンテンツの場合、これらをリアルタイムで適切に評価し、子どもに安全な内容に自動で変換する技術は未だ不足している。
【0495】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0496】
この発明では、サーバは、ウェブコンテンツをリアルタイムで捕捉し安全な通信経路を通じて送信する手段と、送信されたコンテンツを自然言語および画像解析技術を備えた生成AIモデルによって評価する手段と、不適切な表現または画像を検出した場合、これらを利用者の理解に適した表現や問題ない画像に自動で差し替える手段と、を含む。これにより、子どもがインターネットを利用する際の安全性を大幅に向上させることが可能となる。
【0497】
「利用者」とは、情報端末を通じてウェブコンテンツにアクセスする個人または集団を指す。
【0498】
「情報端末」とは、インターネットに接続し、ウェブサイトを閲覧することが可能なデバイス(パソコン、スマートフォン、タブレット等)を指す。
【0499】
「ウェブコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【0500】
「リアルタイムで捕捉する」とは、利用者がウェブコンテンツを閲覧しているその瞬間に、その内容を即座に検出・取得することを指す。
【0501】
「安全な通信経路」とは、データの送受信において第三者による傍受や改ざんを防ぐために暗号化などのセキュリティ技術を用いた通信手段を指す。
【0502】
「解析サーバ」とは、送信されたウェブコンテンツを解析・処理するためのコンピュータシステムを指す。
【0503】
「生成AIモデル」とは、入力されたデータに基づいて新たなテキストや画像を生成する能力を持つ人工知能モデルを指す。
【0504】
「自然言語および画像解析技術」とは、テキストデータを理解・解析するための技術および画像の内容を識別・分析する技術を指す。
【0505】
「不適切な表現または画像」とは、年齢や社会的規範に照らして、特定の利用者群(特に子ども)にとって見るべきでない、または理解するのが難しいと判断されるコンテンツを指す。
【0506】
「問題ない画像」とは、特定の利用者群(特に子ども)が閲覧しても安全と判断される内容の画像を指す。
【0507】
「プラグイン形式」とは、既存のソフトウェア(この場合はブラウザ)に追加して機能を拡張するためのソフトウェアモジュールのことを指す。
【0508】
この発明を実施するための形態においては、主に情報端末と解析サーバ、およびその間の通信プロトコルが関与する。情報端末には、ウェブブラウザがインストールされており、このブラウザには、ウェブコンテンツをリアルタイムで捕捉し、安全な通信経路を介して解析サーバに送信する機能を持つプラグインが組み込まれている。このプラグインは、JavaScriptやその他のウェブ技術を使用して開発される。
【0509】
解析サーバは、高性能なコンピュータシステム上に構築され、生成AIモデルを含むソフトウェアがインストールされている。このサーバは、情報端末から送信されたウェブコンテンツを受け取り、自然言語処理技術と画像解析技術を用いて内容を解析する。不適切な表現または画像が検出された場合、AIモデルはそれらを適切な内容に自動的に差し替える。このプロセスには、TensorFlowやPyTorchといった深層学習フレームワークが使用される。差し替えられたコンテンツは再び情報端末に送り返され、プラグインを通じてユーザに表示される。
【0510】
例として、ウェブページ上に「この映画は大人向けの暴力シーンが含まれています」というテキストと、そのシーンのスクリーンショットが含まれている場合を考える。プラグインはこのテキストと画像を捕捉し、解析サーバに送信する。サーバ上のAIモデルはテキストを「この映画には怖い場面があるので、大人と一緒に見てね」といった子どもに優しい言葉に、画像を映画のロゴなどの問題のない画像に差し替える。これらの変換プロセスは、自然言語処理と画像認識技術に基づいており、子どもが安全にインターネットを利用できるようにすることが目的だ。
【0511】
この発明により、情報端末と解析サーバ間でセキュアな通信を行いながら、リアルタイムでウェブコンテンツをフィルタリングし、子どもにとって安全な形に変換することが可能となる。これにより、保護者は子どもがインターネットを使用する際の安全性を高めることができる。
【0512】
【0513】
ステップ1:ウェブコンテンツの捕捉
【0514】
情報端末上で動作するブラウザのプラグインが、ユーザが閲覧しているウェブページのコンテンツ(テキストおよび画像)をリアルタイムで捕捉する。このステップの入力は、ユーザが閲覧しているウェブページの内容であり、出力は、解析のためにサーバへ送信するデータ形式に加工されたコンテンツデータである。プラグインは、DOM解析を行い、ページ内の全てのテキストと画像のデータを抽出する。
【0515】
ステップ2:コンテンツの送信
【0516】
捕捉されたコンテンツは、情報端末から解析サーバへ安全な通信経路を通じて送信される。このステップの入力は、ステップ1で加工されたコンテンツデータであり、出力は、解析サーバに到達したコンテンツデータである。送信にはHTTPSプロトコルが使用され、データの機密性と完全性が保証される。
【0517】
ステップ3:コンテンツの解析と評価
【0518】
解析サーバ上の生成AIモデルが、送信されたコンテンツを自然言語処理技術と画像解析技術を用いて解析し、評価する。このステップの入力は、ステップ2で受け取ったコンテンツデータであり、出力は、不適切な表現または画像が検出された場合にそれらを適切な内容に差し替えた後のコンテンツデータである。AIモデルは、不適切な内容を識別し、適切な代替テキストや画像に自動で置換する。
【0519】
ステップ4:差し替えたコンテンツの返送
【0520】
差し替えられたコンテンツは、解析サーバから情報端末に返送される。このステップの入力は、ステップ3で生成された差し替え後のコンテンツデータであり、出力は、情報端末のブラウザプラグインによってユーザに表示される準備が整ったコンテンツである。返送にもHTTPSプロトコルが使用され、データの安全性が維持される。
【0521】
ステップ5:コンテンツの表示
【0522】
情報端末のブラウザプラグインが、返送されたコンテンツをユーザのブラウザ上に表示する。このステップの入力は、ステップ4で返送されたコンテンツデータであり、出力は、ユーザが閲覧するウェブページ上にレンダリングされた適切なコンテンツである。プラグインは、差し替えられたテキストと画像を元の位置に適切に埋め込み、ユーザに安全な閲覧環境を提供する。
【0523】
(応用例2)
【0524】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0525】
インターネット上には、特定の利用者群にとって不適切と考えられる言語表現や視覚表現が数多く存在します。特に、子供たちが自由にアクセスできる環境では、彼らに有害な内容に触れるリスクがあります。これまでの技術では、不適切な内容を効率的にフィルタリングし、かつそれを利用者の理解レベルに適した形で自動的に置き換えることが困難であるという問題がありました。この課題を解決することで、特定の利用者群、特に子供たちが安全に情報を得られるインターネット環境を提供することが求められています。
【0526】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0527】
この発明では、サーバは、利用者がアクセスする情報配信媒体のコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群に対して不適切な言語表現や視覚表現であるかを判断する人工知能手段と、不適切な言語表現や視覚表現を特定の利用者群に伝えられる適切な言語表現や視覚表現に差し替える手段と、を含む。これにより、特定の利用者群、特に子供たちがインターネットを使用する際に、不適切な内容に触れることなく、また、その理解レベルに合った形で情報を得られる環境が可能となる。
【0528】
「情報配信媒体」とは、インターネット上でコンテンツを公開し、一般の利用者がアクセス可能なウェブサイトやアプリケーションを指す。
【0529】
「コンテンツ」とは、テキスト、画像、動画、音声などの情報や表現物で、情報配信媒体を通じて提供されるものを指す。
【0530】
「特定の利用者群」とは、年齢、性別、文化的背景などによって定義される、特定の特性を持つ利用者の集団を指す。
【0531】
「不適切な言語表現や視覚表現」とは、特定の利用者群が接するには不適当と考えられる、攻撃的、性的、暴力的、またはその他の利用者にとって不快感を与える可能性のある言葉や画像を指す。
【0532】
「人工知能手段」とは、機械学習や自然言語処理、画像認識などの技術を用いて、コンテンツの内容を分析し、判断を下すシステムやプロセスを指す。
【0533】
「情報配信媒体の利用者インターフェース拡張機能」とは、ウェブブラウザやアプリケーションの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアコンポーネントを指す。
【0534】
「適切な言語表現や視覚表現に差し替える手段」とは、特定の利用者群にとって受け入れられる、教育的価値がある、または中立的な内容の言語表現や視覚表現に、不適切なコンテンツを置き換えるプロセスやアルゴリズムを指す。
【0535】
この発明を実施するための形態では、サーバは人工知能を含むプログラムを実行し、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取り、分析する。このプログラムは、特定の利用者群に不適切と判断される言語表現や視覚表現を検出し、これらを適切な表現に自動で差し替える機能を持つ。このプロセスには、自然言語処理技術や画像認識技術が用いられる。使用するハードウェアは、高性能のサーバとストレージシステムであり、ソフトウェアにはTensorFlowやPyTorchのような機械学習ライブラリが含まれる。
【0536】
端末側では、情報配信媒体の利用者インターフェース拡張機能として実装されたプログラムが動作し、サーバから受信した加工済みコンテンツを表示する。この拡張機能は、JavaScriptやその他のウェブ技術を使用して開発され、特定の利用者群にとって適切なコンテンツのみを表示するように設計されている。
【0537】
ユーザは、このシステムを通じて安全なコンテンツ閲覧体験を得ることができる。たとえば、子供がウェブサイトを利用する際に、不適切な言葉が「おっちょこちょい」などの理解しやすい同義語に、また不適切な画像が教育的なイラストや風景画像に差し替えられる。このような処理により、特定の利用者群がインターネットを安全に使用できる環境が提供される。プロンプト文の例としては、「このテキストを5歳の子供が理解できる言葉に変換してください」や「この画像を子供が見ても安全な内容の画像に置き換えてください」といった指示が用いられる。
【0538】
【0539】
ステップ1:コンテンツの受信と前処理
【0540】
サーバは、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取る。この時、HTML、CSS、JavaScriptなどの形式で構成されたウェブページのデータが入力となる。サーバはこれらのデータを解析し、テキストと画像に分離する。このプロセスにより、テキストデータと画像データが抽出され、次の処理ステップへの入力として準備される。
【0541】
ステップ2:不適切なコンテンツの検出
【0542】
抽出されたテキストデータは、自然言語処理技術を用いて分析され、不適切な言語表現が検出される。同時に、画像データに対しては画像認識技術が適用され、不適切な視覚表現が検出される。この処理には、機械学習ライブラリを活用した生成AIモデルが使用され、テキストと画像のそれぞれに対して適切性の評価が行われる。入力としては、ウェブページから抽出されたテキストと画像があり、出力としては、不適切と判定されたコンテンツのリストが得られる。
【0543】
ステップ3:コンテンツの差し替え
【0544】
不適切と判定されたテキストや画像は、特定の利用者群に適切な言語表現や視覚表現に自動で差し替えられる。この際、生成AIモデルは、不適切なコンテンツを適切なコンテンツに変換するためのプロンプト文に基づいて動作する。たとえば、「このテキストを5歳の子供が理解できる言葉に変換してください」というプロンプトに基づき、テキストの置き換えが行われる。画像についても、「この画像を子供が見ても安全な内容の画像に置き換えてください」というプロンプトに従って、適切な画像に差し替えられる。入力としては不適切なコンテンツがあり、出力としてはそれが適切な表現に置き換えられたコンテンツとなる。
【0545】
ステップ4:加工済みコンテンツの送信
【0546】
差し替えられたコンテンツは、情報配信媒体の利用者インターフェース拡張機能を通じて利用者の端末に送信される。サーバは、加工済みのテキストと画像を含むウェブページのデータを生成し、これを端末に向けて送信する。端末は受信したデータをブラウザ上でレンダリングし、利用者に表示する。このプロセスにより、利用者は不適切なコンテンツが除去され、安全なコンテンツのみが含まれるウェブページを閲覧できるようになる。
【0547】
(実施例3)
【0548】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0549】
デジタルコンテンツが普及する現代社会において、特定のユーザグループ、特に子供たちが不適切な内容に触れるリスクが高まっている。インターネット上では、暴力的、性的、またはその他の有害なコンテンツが容易にアクセス可能となっており、これらのコンテンツが特定のユーザグループの健全な成長や精神的安全を脅かしている。したがって、デジタルコンテンツを介した不適切な情報の流通を効果的に制限し、特定のユーザグループが安全な環境でデジタルコンテンツを利用できるようにすることが急務である。
【0550】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0551】
この発明では、サーバは、デジタルデータをアップロードする手段と、アップロードされたデジタルデータが特定のユーザグループに対して不適切な内容を含むかを判断するAI手段と、不適切な内容を含むデジタルデータを特定のユーザグループに適切な内容に差し替える手段と、を含む。これにより、特定のユーザグループがインターネット上の不適切なコンテンツに触れることなく、安全かつ健全なデジタル環境で情報を得ることが可能となる。サーバ上で動作するAIは、テキストと画像の両方に対して不適切な内容を自動的に識別し、適切なコンテンツに差し替えることにより、特定のユーザグループのデジタルコンテンツの安全性と適切性を保障する。
【0552】
「デジタルデータ」とは、画像、テキスト、音声、ビデオなど、デジタル形式で表現された情報の総称である。
【0553】
「アップロードする手段」とは、ユーザがデジタルデータをインターネット経由でサーバやクラウド上に送信する行為やそのための技術、プロセスを指す。
【0554】
「AI手段」とは、人工知能技術を活用して特定のタスクを自動で実行するための方法やシステムを指し、この場合は不適切なコンテンツの識別と差し替えを行う機能を含む。
【0555】
「不適切な内容」とは、特定のユーザグループ、特に子供たちにとって有害と考えられる性的、暴力的、またはその他の不快感を与える可能性がある情報や画像を指す。
【0556】
「特定のユーザグループ」とは、特定の年齢層、興味、感受性などの共通の特徴を持つユーザの集団を指し、本発明では主に子供たちを想定している。
【0557】
「ウェブサービスまたはアプリケーション」とは、インターネットを介して提供されるサービスやプログラムで、ユーザが特定の機能や情報にアクセスできるようにするものを指す。
【0558】
「適切な内容に差し替える手段」とは、不適切なデジタルデータを分析し、その内容を特定のユーザグループにとって適切かつ有害でない情報や画像に置き換えるプロセスや技術を指す。
【0559】
この発明を実施するための形態は、主にデジタルデータのアップロード、そのデータの適切性の評価、及び不適切なデータの差し替えを含むシステムの運用に関するものである。このシステムは、サーバ、端末、及びユーザの三者によって構成される。
【0560】
サーバは、高性能なコンピュータシステムであり、人工知能(AI)を活用したデータ分析機能を搭載している。このサーバ上で動作するAIは、特定のライブラリやフレームワーク(例:TensorFlow, PyTorch)を使用して、アップロードされた画像やテキストの内容を評価する。AIの分析能力には、画像認識技術や自然言語処理技術が含まれ、これによってデジタルデータ内の不適切な要素を特定する。
【0561】
端末は、インターネットに接続されたデバイスであり、ユーザがデジタルデータをアップロードするためのインターフェイスを提供する。端末は、スマートフォン、タブレット、パーソナルコンピュータ等を含む。
【0562】
ユーザは、このシステムを利用してデジタルコンテンツをアップロードし、閲覧する人々である。ユーザは特定のウェブサイトやアプリケーションを通じてデジタルデータをサーバに送信する。送信されたデータはサーバによって自動的に分析され、不適切なコンテンツがある場合は適切な内容に差し替えられる。
【0563】
具体例として、ユーザがアップロードした画像が暴力的な内容を含む場合、サーバ上で動作するAIはこの画像を不適切であると判断し、代替の安全な画像(例:風景画)に自動的に差し替える。プロンプト文の例としては、「画像内のコンテンツを分析し、不適切な要素が含まれているか判断し、含まれている場合は指定されたカテゴリー(例:自然風景)の安全な画像に自動的に差し替える」というものが挙げられる。
【0564】
この形態により、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。サーバ、端末、及びユーザの相互作用によって、この発明は実施される。
【0565】
【0566】
ステップ1:ユーザは端末を使用してデジタルデータ(画像やテキスト)をシステムにアップロードする。この段階の入力はユーザによって選択されたデジタルデータであり、出力はサーバへ送信されるデータファイルである。端末はユーザが選択したデータを収集し、サーバに送信する処理を行う。
【0567】
ステップ2:サーバはアップロードされたデジタルデータを受信し、AI手段を用いてその内容を分析する。この段階での入力はアップロードされたデータであり、出力はデータ内容の分析結果(不適切な内容が含まれているかどうか)である。サーバ上のAIは、受信したデータを処理し、不適切な要素を特定するためのデータ加工およびデータ演算を行う。
【0568】
ステップ3:AI手段がデータを不適切であると判断した場合、サーバはそのデータを適切な内容に差し替える。この段階の入力は不適切と判断されたデータであり、出力は適切な内容に差し替えられたデータである。サーバは不適切なデータを削除し、予め用意された適切なデータ(例:安全な画像ライブラリからの画像)で置き換える処理を行う。
【0569】
ステップ4:差し替えられたデータは、サーバから端末を通じてユーザに送信される。この段階の入力は差し替え後のデータであり、出力はユーザが閲覧可能な形式で表示されるデータである。サーバは変換されたデータを端末へ送信し、端末はそれをユーザの画面上で表示する処理を行う。
【0570】
この処理流れにより、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。システムは、不適切なデータを効果的に識別し、適切なコンテンツに自動的に差し替えることができる。
【0571】
(応用例3)
【0572】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0573】
現代のデジタル社会において、特定の年齢層、特に子供たちがインターネットを通じてアクセスするコンテンツには、しばしば不適切な表現や画像が含まれている。これらの不適切なコンテンツにより、子供たちが精神的な損害を受けるリスクがある。従来のフィルタリング技術では、不適切なテキストコンテンツのブロックには一定の効果があるものの、画像に関してはその判断が難しく、また、不適切なコンテンツを適切なものに置き換えることができないという問題があった。この発明は、特定の年齢層がアクセスするデジタルコンテンツにおいて、不適切な表現や画像を自動的に検出し、それを適切な表現や画像に差し替えることにより、安全な閲覧環境を提供することを目的とする。
【0574】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0575】
この発明では、サーバは、情報端末を通じてアクセスされるデジタルコンテンツを受け取る手段と、受け取ったデジタルコンテンツが特定の年齢層に対して不適切な表現や画像であるかを判断するAI手段と、不適切な表現や画像を特定の年齢層に適切な表現や画像に差し替える手段と、を含む。これにより、デジタルコンテンツの安全性を確保し、特定の年齢層が閲覧しても問題ないコンテンツのみを提供することが可能となる。AI手段は、テキストだけでなく画像に対しても不適切な内容を高精度で判断し、差し替えることが可能であるため、従来の技術では対応が困難であった画像コンテンツの問題にも対応できる。
【0576】
「情報端末」とは、インターネットやその他のネットワークに接続してデジタルコンテンツを受け取り、表示するための電子機器である。例えば、スマートフォン、タブレット、パーソナルコンピュータなどが含まれる。
【0577】
「デジタルコンテンツ」とは、テキスト、画像、動画、音声などのデジタル形式で表現された情報コンテンツである。インターネットを介して配信され、情報端末でアクセス・閲覧が可能である。
【0578】
「特定の年齢層」とは、コンテンツの閲覧にあたって特に保護する必要のある年齢範囲を指し、特に子供や青少年などの若年層を示す。
【0579】
「不適切な表現や画像」とは、特定の年齢層にとって見ることが望ましくない、または精神的な損害を与える可能性のあるテキスト、画像、その他のメディアコンテンツである。例えば、暴力的、性的、または差別的な内容がこれに該当する。
【0580】
「AI手段」とは、人工知能技術を活用してデジタルコンテンツの内容を分析し、特定の基準に基づいてコンテンツが適切か不適切かを判断するシステムやプログラムのことである。この手段は、機械学習や画像認識技術を含む。
【0581】
この発明の実施形態では、サーバは特定の年齢層に適切なデジタルコンテンツを提供するために、情報端末を通じてアクセスされるデジタルコンテンツを受け取り、その内容が特定の年齢層にとって不適切であるかをAI手段を用いて判断し、必要に応じて不適切な表現や画像を適切なものに差し替えるシステムである。このシステムは、情報端末にインストールされたアプリケーションとして機能し、端末の利用者がデジタルコンテンツを閲覧する際にリアルタイムでコンテンツの監視と適切な変換を行う。
【0582】
サーバは、人工知能技術を用いて、受け取ったデジタルコンテンツ内のテキストおよび画像に対して不適切な内容を判断する。このAI手段には、画像認識技術や自然言語処理技術が含まれ、これらの技術を活用してコンテンツの安全性を評価する。不適切なコンテンツが検出された場合、AI手段は生成AIモデルを用いて、そのコンテンツを特定の年齢層に適切なものに自動的に差し替える。
【0583】
使用するハードウェアは情報端末であり、これにはスマートフォンやタブレット、パーソナルコンピュータが含まれる。ソフトウェアには、生成AIモデル(例: OpenAIのGPT系列)や画像認識技術(例: Google Cloud Vision API)が活用される。
【0584】
具体例として、ユーザが子供向けの動画配信サービスを利用している状況を考える。動画内に不適切な広告が挿入された場合、AI手段は「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というプロンプト文を用いて生成AIモデルに指示を出し、不適切な広告を風景画像に差し替える。このプロセスは、端末を利用しているユーザが安全なコンテンツのみを閲覧できるようにするためのものである。
【0585】
【0586】
ステップ1:ユーザが情報端末を使用してデジタルコンテンツにアクセスする。この時、入力としてはユーザのアクセス要求があり、出力としては対象のデジタルコンテンツが端末に表示される。端末は、ユーザのアクセス要求に基づき、選択したコンテンツを取得し、画面に表示する。
【0587】
ステップ2:サーバ上のAI手段がデジタルコンテンツを受け取り、内容分析を行う。入力としてはステップ1で取得されたデジタルコンテンツがあり、出力としてはコンテンツの内容に関する分析結果が得られる。この分析結果には、テキストおよび画像内の不適切な内容の有無が含まれる。AI手段は、画像認識技術と自然言語処理技術を用いて、コンテンツ内の不適切な要素を検出する。
【0588】
ステップ3:不適切な内容が検出された場合、AI手段が生成AIモデルを用いて、不適切なコンテンツを適切なものに差し替える。入力としてはステップ2で検出された不適切な内容があり、出力としては差し替え後の適切なコンテンツが得られる。このプロセスでは、不適切な画像やテキストを識別し、「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というようなプロンプト文に基づき、適切なコンテンツに自動的に変換する。
【0589】
ステップ4:変換されたコンテンツをユーザの情報端末に送信し、表示する。入力としてはステップ3で生成された適切なコンテンツがあり、出力としてはユーザの端末に表示されるコンテンツが更新される。サーバは変換されたコンテンツをユーザに提供し、端末はこのコンテンツを受け取り、ユーザに対して表示する。これにより、ユーザは安全なコンテンツのみを閲覧することができる。
【0590】
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。
【0591】
「形態例1」
【0592】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段、そしてユーザの感情を認識する感情エンジンを含むシステムが提供される。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【0593】
「形態例2」
【0594】
本発明の別の実施形態として、感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整するシステムが提供される。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝え、AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【0595】
「形態例3」
【0596】
本発明のさらに別の実施形態として、感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整するシステムが提供される。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝え、AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【0597】
以下に、各形態例の処理の流れについて説明する。
【0598】
「形態例1」
【0599】
ステップ1:子どもがアクセスするウェブサイトのコンテンツを受け取る。
【0600】
ステップ2:受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかをAIが判断する。
【0601】
ステップ3:不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。
【0602】
ステップ4:ユーザの感情を感情エンジンで認識する。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【0603】
「形態例2」
【0604】
ステップ1:ユーザの感情を感情エンジンで認識する。
【0605】
ステップ2:感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整する。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝える。
【0606】
ステップ3:AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【0607】
「形態例3」
【0608】
ステップ1:ユーザの感情を感情エンジンで認識する。
【0609】
ステップ2:感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整する。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝える。ステップ3:AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【0610】
(実施例1)
【0611】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0612】
インターネット上のコンテンツは多岐にわたり、特定のユーザグループ、特に子どもたちにとって不適切な内容を含むことがある。これにより、ユーザの感情に悪影響を与えたり、誤解を招いたりする恐れがある。また、ユーザの反応に応じてコンテンツを動的に調整する技術が不足しており、個々のユーザに最適化されたインターネット体験を提供することが困難である。
【0613】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0614】
この発明では、サーバは、インターネットに接続された装置からデジタルコンテンツをリアルタイムで取得する手段と、取得したデジタルコンテンツを分析し、該コンテンツが特定のユーザグループにとって不適切な表現や視覚素材であるかを判断するための人工知能手段と、判定された不適切な表現や視覚素材を特定のユーザグループに適切な表現や視覚素材に置き換える手段と、ユーザの反応をリアルタイムで捉え、該反応に基づいてデジタルコンテンツをさらに最適化するための感情認識手段と、を含む。これにより、不適切なコンテンツの識別と置換、およびユーザの感情に基づいたコンテンツの最適化が可能となる。
【0615】
「インターネットに接続された装置」とは、インターネットへのアクセス機能を持ち、ウェブコンテンツの取得やデータ送受信が可能な電子機器である。
【0616】
「デジタルコンテンツ」とは、テキスト、画像、音声、動画など、デジタル形式で表現された情報の総称である。
【0617】
「リアルタイムで」とは、実際の時間とほぼ同時に、遅延なく処理や反応が行われることを意味する。
【0618】
「人工知能手段」とは、機械学習やディープラーニングなどの技術を活用して、人間のように学習し、判断や推論を行うシステムやプログラムのことである。
【0619】
「特定のユーザグループ」とは、年齢、性別、興味・関心など特定の基準に基づき区別されたユーザの集団である。
【0620】
「不適切な表現や視覚素材」とは、特定のユーザグループにとって不快感を与える、または見ることが適さないと判断されるテキストや画像などのコンテンツである。
【0621】
「置き換える」とは、ある要素を取り除き、別の要素でその位置や役割を代替することである。
【0622】
「感情認識手段」とは、人の感情を顔表情や声のトーンなどから識別し、解析する技術やシステムのことである。
【0623】
「最適化」とは、特定の基準に基づき、性能や効果を最良の状態に調整するプロセスである。
【0624】
本発明を実施するための形態について、具体的な説明を行う。この形態は、インターネット上のデジタルコンテンツを特定のユーザグループ、特に子どもたちにとって安全かつ教育的に最適化することを目的としている。
【0625】
まず、端末にはウェブブラウザを通じてアクセスされたデジタルコンテンツをリアルタイムで取得するためのプラグインがインストールされる。このプラグインは、ユーザが閲覧しているウェブページのテキストと画像を捉え、サーバに送信する機能を持つ。このプラグインは、一般的に利用されるウェブブラウザであるGoogle ChromeやMozilla Firefoxに対応している。
【0626】
サーバ側では、人工知能手段がデジタルコンテンツを分析する。この分析は、生成AIモデルを用いて行われ、テキストや画像が特定のユーザグループにとって不適切な表現や視覚素材であるかどうかを判断する。この人工知能手段には、OpenAIのGPTやGoogleのBERTなどの先進的なモデルが利用される。不適切なコンテンツが検出された場合、それは即座に適切な内容に置き換えられる。例えば、攻撃的な言葉はより穏やかな表現に、不適切な画像は教育的な画像に変更される。
【0627】
さらに、サーバにはユーザの反応をリアルタイムで捉えるための感情認識手段が備わっている。この感情認識手段は、ユーザの顔表情や声のトーンを分析し、喜びや困惑などの感情状態を識別する。この分析には、MicrosoftのFace APIやGoogleのCloud Speech-to-Textなどの技術が用いられる。感情のフィードバックに基づいて、デジタルコンテンツはさらに最適化され、ユーザにとってより適切な体験が提供される。
【0628】
プロンプト文の例としては、「このテキスト/画像は子どもにとって適切か?」という問いがAIに送信される。この問いに対してAIは、コンテンツが子どもにとって安全かつ教育的であるかどうかを分析し、必要に応じてコンテンツを調整する。
【0629】
この形態により、サーバはデジタルコンテンツをリアルタイムで分析し、不適切なコンテンツを特定し、これを適切なものに置き換えることができる。また、ユーザの感情を認識し、これに基づいてコンテンツを最適化することが可能となる。これにより、特定のユーザグループにとってより安全かつ教育的なインターネット体験が提供される。
【0630】
【0631】
ステップ1:コンテンツの取得
【0632】
端末にインストールされたブラウザプラグインは、ユーザがウェブサイトにアクセスする際、そのページのテキストと画像をリアルタイムで受け取る。この受け取ったコンテンツは、分析のためにサーバに送信される。
【0633】
入力:ウェブページのテキストと画像
【0634】
データ加工:ウェブページからのテキストと画像の収集
【0635】
出力:サーバに送信されるテキストと画像データ
【0636】
ステップ2:コンテンツの分析
【0637】
サーバ上のAIは、受け取ったテキストと画像を分析し、これが特定のユーザグループにとって不適切な内容を含むかどうかを判断する。この分析には、生成AIモデルが使用される。
【0638】
入力:テキストと画像データ
【0639】
データ加工:AIによる不適切な内容の識別
【0640】
出力:不適切と判定されたコンテンツのリスト
【0641】
ステップ3:コンテンツの置き換え
【0642】
不適切と判定されたコンテンツが存在する場合、サーバはこれを特定のユーザグループに適切な内容に置き換える。この置き換えプロセスには、適切なテキストや画像に関するデータベースが使用される。
【0643】
入力:不適切と判定されたコンテンツのリスト
【0644】
データ加工:不適切なコンテンツを適切なコンテンツに置き換える
【0645】
出力:置き換えられたコンテンツ
【0646】
ステップ4:コンテンツの最適化
【0647】
サーバには、ユーザの反応をリアルタイムで捉える感情認識手段があり、このフィードバックに基づいてコンテンツをさらに最適化する。このプロセスでは、感情認識技術を用いてユーザの反応が分析される。
【0648】
入力:ユーザの感情フィードバック(顔表情や声のトーン)
【0649】
データ加工:感情認識技術によるユーザ反応の分析
【0650】
出力:コンテンツの最適化情報
【0651】
ステップ5:最適化されたコンテンツの表示
【0652】
最後に、サーバから送り返された最適化されたコンテンツは、端末を通じてユーザに表示される。このプロセスにより、ユーザはより安全かつ教育的なコンテンツを体験することができる。
【0653】
入力:置き換えられたコンテンツ、最適化情報
【0654】
データ加工:端末によるコンテンツの表示準備
【0655】
出力:ユーザに表示される最適化されたコンテンツ
【0656】
(応用例1)
【0657】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0658】
インターネット上には子どもにとって不適切なコンテンツが多数存在し、これらに簡単にアクセスできる環境がある。また、子どもの感情や反応に応じて適切なコンテンツを提供するシステムも不足している。これにより、子どもがネガティブな影響を受けるリスクが高まるという問題がある。この発明は、子どもが安全にデジタルコンテンツを楽しめる環境を提供し、さらにその感情に応じた適切なコンテンツを推薦できるシステムの必要性に対応することを目的とする。
【0659】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0660】
この発明では、サーバは、子どもがアクセスするデジタルコンテンツを受け取る手段と、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段と、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段と、ユーザの感情を認識する感情エンジンを含む手段と、を含む。これにより、子どもが安全にインターネットコンテンツを楽しむことができ、さらにその感情や反応に応じて適切なコンテンツを推薦することが可能となる。
【0661】
「子どもがアクセスするデジタルコンテンツ」とは、インターネット上で提供される文章、画像、音声、動画などの情報であり、年少者が閲覧または利用することを想定しているもの。
【0662】
「不適切な言い回しや画像」とは、年少者の健全な成長に悪影響を与える恐れがある、性的な表現、暴力的な表現、差別的な表現などのコンテンツ。
【0663】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを実行するためのアルゴリズムやソフトウェアの総称。
【0664】
「差し替える手段」とは、不適切と判断されたコンテンツを、年少者が閲覧しても安全な別のコンテンツに置き換える操作やプロセス。
【0665】
「ユーザの感情を認識する感情エンジン」とは、ユーザーの顔表情、声のトーン、行動パターンなどからその人の感情状態を推定する技術またはシステム。
【0666】
「ブラウザのプラグイン」とは、ウェブブラウザの機能を拡張するために追加されるソフトウェアコンポーネント。特定の機能やサービスをブラウザ内で直接利用可能にする。
【0667】
この発明を実施するための形態について、具体的な実装方法を示す。本発明のシステムは、子どもが安全にインターネットコンテンツを利用できるようにすること、及びユーザの感情に応じたコンテンツを推薦することを目的としている。
【0668】
サーバは、PythonやTensorFlow、OpenCV、PyTorchなどのライブラリを用いて開発される。これらのソフトウェアは、デジタルコンテンツから不適切な言い回しや画像を検出し、それらを子どもにとって適切なものに自動的に差し替えるAI手段を提供する。また、サーバはユーザの感情を認識する感情エンジンも含み、これは端末のカメラやマイクを介して収集された顔表情や声のトーンから感情を推定する。
【0669】
端末は、スマートフォン、タブレット、スマートTVなど、インターネットに接続できるデバイスを指す。端末上で動作するブラウザのプラグインは、ユーザがアクセスするデジタルコンテンツをリアルタイムでサーバに送信し、サーバからのフィードバックに基づいてコンテンツの表示を調整する。
【0670】
ユーザは、このシステムを利用してインターネットコンテンツを閲覧する際、自動的にフィルタリングされた安全なコンテンツにアクセスする。また、ユーザの感情がポジティブな場合は似た種類のコンテンツを、ネガティブな場合は異なるジャンルのコンテンツを推薦される。
【0671】
具体例として、保護者が子どもに動画を見せる際にこのシステムを利用するシナリオがある。プロンプト文としては、「子どもが見るに適した内容に自動で変換する動画フィルタリング機能」や「子どもの表情から感情を読み取り、コンテンツを推薦する機能」などが用いられる。
【0672】
この形態により、子どもがインターネットを利用する際の安全性が向上し、同時に感情に基づいたパーソナライズされたコンテンツ体験が提供される。
【0673】
【0674】
ステップ1:端末がユーザがアクセスするデジタルコンテンツを受け取る。
【0675】
端末は、ユーザがブラウザを通じてインターネット上のデジタルコンテンツにアクセスした際、そのコンテンツの情報(テキスト、画像、動画など)を受け取る。この情報は、次のステップでの処理のためにサーバへ送信される入力となる。
【0676】
ステップ2:端末が受け取ったコンテンツをサーバに送信する。
【0677】
端末は、受け取ったデジタルコンテンツをサーバに送信する。この送信されたコンテンツは、AIによる分析のための入力データとなる。
【0678】
ステップ3:サーバ上のAIがコンテンツを分析する。
【0679】
サーバ上に搭載されたAI手段は、受け取ったコンテンツを分析し、不適切な言い回しや画像が含まれているかどうかを判断する。この分析によって、コンテンツ内の特定の要素が子どもにとって不適切であると識別された場合、それらを差し替えるための情報が生成される。この処理の出力は、差し替えるべきコンテンツの位置と、それに置き換える適切なコンテンツの情報である。
【0680】
ステップ4:サーバがコンテンツの差し替え指示を端末に送信する。
【0681】
サーバは、AIによる分析結果をもとに、具体的な差し替え指示を端末に送信する。この指示には、どのコンテンツをどのように差し替えるべきかの情報が含まれる。
【0682】
ステップ5:端末がコンテンツを差し替える。
【0683】
端末は、サーバから受け取った差し替え指示に従い、表示中のコンテンツを適切なものに差し替える。この操作により、ユーザは不適切な内容に触れることなく、安全なコンテンツを閲覧できるようになる。
【0684】
ステップ6:端末がユーザの感情を認識する。
【0685】
端末は、内蔵されているカメラやマイクを用いて、ユーザの顔表情や声のトーンから感情を認識する。この情報は、感情に応じたコンテンツ推薦のためにサーバへ送信される。
【0686】
ステップ7:サーバがユーザの感情に基づいたコンテンツ推薦を行う。
【0687】
サーバは、端末から送信されたユーザの感情データを分析し、その感情に最も適したコンテンツを推薦する。この推薦情報は、端末に送信され、ユーザに提示される。
【0688】
この処理フローにより、子どもが安全にデジタルコンテンツを利用できる環境が提供されるとともに、ユーザの感情に応じたパーソナライズされたコンテンツ体験が可能となる。
【0689】
(実施例2)
【0690】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0691】
インターネット上には、特定のユーザグループにとって不適切または有害と考えられるコンテンツが数多く存在する。特に、子どもや感受性の高い個人がアクセスする可能性のあるウェブサイトでは、不適切な言葉や画像によって悪影響を及ぼすリスクがある。また、ユーザの感情状態に応じてコンテンツを適切に調整する必要性が高まっている。この課題に対処するためには、ユーザが閲覧するコンテンツをリアルタイムで分析し、不適切なコンテンツを適切なものに自動的に差し替えるとともに、ユーザの感情状態を考慮したコンテンツの提供が求められる。
【0692】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0693】
この発明では、サーバは、インターネット上のコンテンツをリアルタイムに受け取る手段と、受け取ったコンテンツが特定のユーザグループに対して不適切な表現や視覚的要素であるかを判断する人工知能手段と、不適切な表現や視覚的要素を特定のユーザグループに伝えることが可能な表現や視覚的要素に差し替える手段と、ユーザの感情状態を評価し、この評価に基づいて表現や視覚的要素の差し替え方を調整する感情エンジン手段を含む。これにより、不適切なコンテンツを自動的に適切なものに差し替えることが可能となり、さらにユーザの感情状態に応じた適切なコンテンツの提供が可能となる。
【0694】
「インターネット上のコンテンツ」とは、ウェブサイト、オンラインプラットフォーム、ソーシャルメディア等、インターネットを介してアクセス可能なすべてのテキスト、画像、動画、およびその他のメディア形式の情報。
【0695】
「リアルタイムに受け取る手段」とは、ユーザがウェブページを閲覧しているその瞬間に、そのページのコンテンツを捕捉し、分析のために取り込むプロセスまたは技術。
【0696】
「特定のユーザグループ」とは、年齢、性別、職業、文化的背景など、特定の属性を共有するユーザの集合であり、システムがそのニーズや制約を考慮してサービスを提供する対象。
【0697】
「不適切な表現や視覚的要素」とは、暴力的、性的、攻撃的、またはその他の方法で特定のユーザグループ、特に子どもや感受性の高い個人にとって不適切または有害と考えられる言葉や画像。
【0698】
「人工知能手段」とは、機械学習、深層学習、自然言語処理、画像認識などの技術を用いて、データを解析し、学習し、特定のタスクを自動で実行するソフトウェアまたはシステム。
【0699】
「インターネットブラウザの拡張機能」とは、ウェブブラウザに追加されるソフトウェアコンポーネントで、ブラウザの機能を拡張し、ユーザ体験を向上させるもの。
【0700】
「感情エンジン手段」とは、ユーザの行動、テキスト入力、声のトーン、表情などからユーザの感情状態を推定し、その情報を基にシステムの応答を調整する技術やアルゴリズム。
【0701】
本発明を実施するための形態は、インターネット上のコンテンツをユーザにとってより適切なものに変換するシステムに関する。このシステムは、特にインターネットブラウザの拡張機能として実装される人工知能手段、感情エンジン手段、およびこれらを支えるハードウェアおよびソフトウェアの組み合わせで構成される。
【0702】
このシステムは、端末(パーソナルコンピュータ、スマートフォン、タブレット等)にインストールされたインターネットブラウザの拡張機能として動作する。この拡張機能は、JavaScriptやその他のウェブ技術を用いて開発され、ユーザが閲覧するウェブページからテキストや画像などのコンテンツをリアルタイムで受け取る機能を持つ。受け取ったコンテンツは、HTTPSリクエストを介してサーバ上の人工知能手段に送信される。この人工知能手段は、機械学習や自然言語処理、画像認識技術を駆使してコンテンツを分析し、その内容が特定のユーザグループにとって不適切であるかを判断する。
【0703】
不適切なコンテンツが検出された場合、人工知能手段は、テキストをより適切な表現に置き換えたり、画像を問題ないものに差し替えたりする。例えば、攻撃的な言葉は穏やかな言い回しに、暴力的な画像は風景画や動物の画像に置き換えられる。この差し替えたコンテンツは再び端末に送信され、ブラウザの拡張機能がウェブページの表示を更新する。
【0704】
さらに、このシステムには感情エンジン手段が組み込まれており、ユーザの行動や入力から感情状態を推測し、その情報を人工知能手段に提供する。これにより、ユーザが怒っているなどの感情状態に基づいて、より穏やかなコンテンツに差し替えることができる。この感情エンジンは、機械学習アルゴリズムを用いてユーザの感情を評価し、その結果を人工知能手段の処理に反映させる。
【0705】
具体例としては、「このテキストに含まれる不適切な表現を子どもが理解しやすい言葉に置き換えてください」や「この画像を子どもが見ても問題ない内容に差し替えてください」というプロンプト文が人工知能手段に送信され、この要求に基づいてコンテンツの分析および変換が行われる。
【0706】
【0707】
ステップ1:コンテンツの受信
【0708】
端末上で動作するブラウザの拡張機能が、ユーザが閲覧しているウェブページからテキストや画像などのコンテンツを受信する。この段階では、ウェブページのDOMを解析し、テキストと画像のデータが抽出される。入力はウェブページのHTMLコンテンツであり、出力は抽出されたテキストと画像データである。
【0709】
ステップ2:コンテンツの分析要求
【0710】
抽出されたコンテンツは、HTTPSリクエストを介してサーバに送信される。サーバ上の人工知能手段がこのコンテンツを受け取り、分析を開始する。入力は抽出されたテキストと画像データであり、出力は分析結果(コンテンツが不適切かどうかの判断)である。
【0711】
ステップ3:コンテンツの分析
【0712】
人工知能手段は、テキストと画像に含まれる内容を分析し、その不適切性を評価する。この過程で、テキストは自然言語処理技術を、画像は画像認識技術を用いて処理される。入力はテキストと画像データであり、出力はそれぞれの不適切性評価結果である。
【0713】
ステップ4:感情エンジンによる調整
【0714】
端末またはサーバ上で動作する感情エンジンが、ユーザの感情状態を評価し、その情報を人工知能手段に提供する。この情報は、コンテンツの差し替え方を調整するために使用される。入力はユーザの行動や入力データであり、出力はユーザの感情状態の評価結果である。
【0715】
ステップ5:差し替えコンテンツの生成
【0716】
不適切なコンテンツが検出された場合、人工知能手段は適切な言葉や画像に差し替えるための新しいコンテンツを生成する。このプロセスでは、不適切なテキストは適切な言葉に、不適切な画像は適切な画像に変換される。入力は不適切性評価結果とユーザの感情状態、出力は差し替えられた新しいテキストと画像である。
【0717】
ステップ6:コンテンツの表示更新
【0718】
サーバから差し替えられたコンテンツが端末に送信され、ブラウザの拡張機能を通じてウェブページの表示が更新される。このステップで、ユーザには最終的に適切なコンテンツのみが表示される。入力は差し替えられた新しいテキストと画像データ、出力は更新されたウェブページの表示である。
【0719】
(応用例2)
【0720】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0721】
インターネット上には、特定の利用者群にとって不適切と考えられるコンテンツが存在する。これらのコンテンツは、特に若年層の利用者にとって、精神的な不快感や誤解を招く可能性がある。また、利用者の現在の感情状態によっては、通常ならば無害と考えられるコンテンツであっても、感情的なダメージを引き起こすことがある。従来技術では、これらの不適切なコンテンツを効率的にかつ利用者の感情状態を考慮してフィルタリングすることは困難であった。
【0722】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0723】
この発明では、サーバは、ウェブサイトのコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群にとって不適切であるかを判断する人工知能手段と、不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段と、利用者の感情状態を認識し、その感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段を含む。これにより、特定の利用者群がインターネットを安全に利用できるようにすると同時に、利用者の感情状態に応じた適切なコンテンツの提供が可能となる。
【0724】
「利用者」とは、インターネットを利用する個人または特定のグループを指す。
【0725】
「ウェブサイトのコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【0726】
「人工知能手段」とは、機械学習、深層学習、自然言語処理などの技術を用いて、データを分析し、判断を行うシステムやプログラムを指す。
【0727】
「特定の利用者群に対して不適切な言い回しや画像」とは、年齢、性別、文化的背景などに基づき、そのグループにとって不快、不適切、または有害と判断されるコンテンツを指す。
【0728】
「不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段」とは、不適切なコンテンツを、該当する利用者群が安全に閲覧可能な形に自動的に変更する技術や方法を指す。
【0729】
「利用者の感情状態を認識する手段」とは、利用者の表情、声のトーン、文脈などからその時点での感情状態を検出し、解析する技術やシステムを指す。
【0730】
「感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段」とは、利用者の現在の感情を考慮し、コンテンツの差し替え方法を最適化することで、よりポジティブなユーザー体験を提供する技術やプロセスを指す。
【0731】
「ウェブブラウザの拡張機能」とは、インターネットブラウザの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアまたはプログラムを指す。
【0732】
この発明を実施するための形態では、利用者が安全にインターネットを利用できるようにするシステムを提供する。このシステムは、特に利用者の感情状態を考慮しながら、ウェブサイトのコンテンツをフィルタリングし、必要に応じて適切なコンテンツに差し替える機能を持つ。このシステムは、主にウェブブラウザの拡張機能として実装される人工知能手段、利用者の感情状態を認識する感情認識手段、および不適切なコンテンツを差し替える手段から構成される。
【0733】
サーバは、深層学習、自然言語処理、画像認識技術を用いた人工知能モデルを実行する。この人工知能モデルは、受け取ったウェブサイトのコンテンツを解析し、そのコンテンツが特定の利用者群にとって不適切であるかどうかを判断する。不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える。
【0734】
端末は、カメラやマイクロフォンを用いて利用者の感情状態をリアルタイムで検出し、この情報をサーバに送信する。サーバはこの感情データを分析し、利用者が現在抱いている感情を考慮してコンテンツの差し替え方を調整する。このプロセスにより、利用者の感情を和らげるようなより穏やかなコンテンツへの差し替えが可能となる。
【0735】
使用するハードウェアは、カメラ、マイクロフォン、およびインターネットに接続されたコンピュータやスマートデバイスである。ソフトウェアは、TensorFlowやPyTorchといった深層学習フレームワークを使用して開発される人工知能モデル、およびウェブブラウザの拡張機能として機能するプログラムである。
【0736】
具体例として、プロンプト文「10歳の子どもに適切な言葉を使用して説明してください」という指示が人工知能モデルに送信される場合がある。このプロンプトは、特定のコンテンツが子どもにとって不適切である場合に、そのコンテンツを子どもが理解しやすい形に差し替えるよう人工知能モデルに指示するために使用される。このような機能により、インターネットの安全な利用環境が提供される。
【0737】
【0738】
ステップ1:利用者がウェブブラウザを通じてウェブサイトにアクセスする。この時、ブラウザの拡張機能がアクセスしたウェブサイトのコンテンツを受け取る。入力はウェブサイトのURLまたはコンテンツであり、出力はウェブサイトから受け取ったコンテンツのデータである。このプロセスでは、ウェブブラウザのAPIを使用して、ウェブサイトのコンテンツを取得する動作が行われる。
【0739】
ステップ2:取得したコンテンツをサーバに送信し、人工知能手段を用いてコンテンツが特定の利用者群にとって不適切であるかを判断する。入力はウェブサイトのコンテンツであり、出力は不適切なコンテンツの有無と、その詳細(テキストまたは画像)である。このステップでは、テキスト解析や画像認識の技術を用いて、コンテンツ内の不適切な言い回しや画像を特定する動作が行われる。
【0740】
ステップ3:端末は利用者の感情状態をカメラやマイクロフォンを通じて検出し、この情報をサーバに送信する。入力は利用者の表情や声のトーンであり、出力は利用者の感情状態(例:怒り、喜び)である。このステップでは、表情認識や音声解析技術を用いて、利用者の感情を判定する動作が行われる。
【0741】
ステップ4:サーバは受け取った感情データを分析し、その感情状態に基づいて、不適切なコンテンツの差し替え方を調整する。入力は利用者の感情状態であり、出力は差し替えられるコンテンツの種類(より穏やかな言葉や画像)である。このステップでは、利用者の感情に最も適したコンテンツを選択し、不適切なコンテンツを適切なものに差し替える動作が行われる。
【0742】
ステップ5:最終的にサーバは、差し替えられたコンテンツをウェブブラウザの拡張機能を通じて利用者の端末に送信する。入力は差し替えられるべきコンテンツの指示であり、出力は実際に差し替えられたウェブサイトのコンテンツである。このプロセスでは、ウェブブラウザのAPIを介して、差し替え後のコンテンツをウェブページ上に表示する動作が行われる。
【0743】
(実施例3)
【0744】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0745】
デジタルコンテンツの中には、特定のユーザーグループ、特に子どもや敏感な内容に対して保護を必要とするユーザーにとって不適切な言い回しや画像が含まれている場合がある。これらのコンテンツは、見る者に悪影響を及ぼす可能性がある。また、ユーザーの感情状態に合わせてコンテンツを提供する既存のシステムは少なく、ユーザー体験を向上させるためのパーソナライゼーションが不足している。これらの問題に対処するための効果的な解決策が求められている。
【0746】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0747】
この発明では、サーバは、デジタルコンテンツを受け取る手段と、受け取ったコンテンツが特定のユーザーグループに対して不適切な言い回しや画像であるかを判断する人工知能手段と、不適切な言い回しや画像を適切な言い回しや画像に自動的に差し替える手段と、ユーザーの感情状態を検出する手段と、検出された感情状態に基づいてコンテンツの表示を調整する手段と、を含む。これにより、不適切なコンテンツを適切なものに自動で差し替えることが可能となり、また、ユーザーの感情状態に基づいたコンテンツのパーソナライゼーションを実現することが可能となる。
【0748】
「デジタルコンテンツ」とは、インターネット上で共有、配布、またはアクセス可能なテキスト、画像、動画、音声などの電子的形式の情報やメディアを指す。
【0749】
「特定のユーザーグループ」とは、年齢、性別、文化的背景など特定の属性や条件に基づいて区別されるユーザーの集団を指す。
【0750】
「不適切な言い回しや画像」とは、特定のユーザーグループにとって不快、攻撃的、または有害とみなされる可能性のある言葉遣いや視覚的表現を指す。
【0751】
「人工知能手段」とは、学習、推論、認識、言語理解などの人間の知能を模倣することを目的としたコンピュータープログラムやテクノロジーの総称を指す。
【0752】
「自動的に差し替える手段」とは、人の介入なしに、プログラムやシステムが自律的に行動や処理を実行する方法や機能を指す。
【0753】
「ユーザーの感情状態」とは、個人がその時点で経験している感情や気分のことで、喜び、悲しみ、怒り、驚きなど多岐にわたる。
【0754】
「検出する手段」とは、特定の情報や状態を識別し、その存在を確認するために用いられる技術や方法を指す。
【0755】
「コンテンツの表示を調整する手段」とは、ユーザーに提供される情報やメディアの形式、順序、または内容を変更するプロセスや機能を指す。
【0756】
この発明を実施するための形態は、コンテンツの安全性とユーザー体験の向上を中心に展開される。主に使用されるハードウェアは、サーバー、端末(スマートフォン、タブレット、パソコン等)、および感情検出装置(端末内蔵のカメラやマイクロフォン)である。ソフトウェア面では、画像認識技術、自然言語処理技術、感情分析技術、および生成AIモデルが核となる。
【0757】
サーバは、高性能なプロセッシング能力を持つコンピューターであり、クラウド上または物理的なデータセンター内に配置される。このサーバには、特定の生成AIモデルがインストールされており、不適切なコンテンツの識別と差し替え、ユーザーの感情に基づくコンテンツの調整を行う。具体的なソフトウェアとしては、OpenAIが提供する画像認識技術やGPT系の生成AIモデルが使用される。
【0758】
端末は、ユーザーがコンテンツをアップロードし、サーバから送信された結果を受け取るインターフェースとして機能する。また、端末内蔵のカメラやマイクロフォンを通じてユーザーの感情状態を検出し、そのデータをサーバに送信する。
【0759】
具体例として、ユーザーが暴力的な画像をアップロードした場合、「画像内の不適切な要素を識別し、適切な風景画像に差し替えてください。また、ユーザーの現在の感情が喜びである場合は、ポジティブなニュース記事や画像を優先的に表示するように調整してください。」というプロンプト文が生成AIモデルによって処理される。サーバはこのプロンプトに基づき、暴力的な画像を風景画に差し替え、ユーザーの感情が喜びであることを考慮して、適切なコンテンツを選択し、端末に送信する。
【0760】
この形態により、ユーザーは安全で個人の感情に応じたコンテンツ体験を享受できるようになる。
【0761】
【0762】
ステップ1:
【0763】
ユーザがデジタルコンテンツを端末を通じてサーバにアップロードする。この時、入力はユーザから提供された画像やテキストであり、サーバはこのデジタルコンテンツを受け取る動作を行う。
【0764】
ステップ2:
【0765】
サーバ上の人工知能手段が、受け取ったデジタルコンテンツに対して内容分析を行う。このプロセスでは、画像認識技術や自然言語処理技術を用いて、コンテンツ内の言い回しや画像が特定のユーザーグループにとって不適切かどうかを判断する。入力はデジタルコンテンツであり、出力は不適切なコンテンツの有無とその内容に関する情報である。
【0766】
ステップ3:
【0767】
不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える手段を実行する。このステップの入力は不適切と判断されたコンテンツであり、出力はユーザーにとって安全な代替コンテンツである。この差し替えプロセスは、あらかじめ準備された安全なコンテンツのデータベースから選択されるか、生成AIモデルを用いて新たに生成される。
【0768】
ステップ4:
【0769】
端末はユーザーの感情状態を検出する機能を持ち、その情報をサーバに送信する。このステップでは、入力としてユーザーの表情や音声が使用され、出力はユーザーの感情状態(喜び、悲しみ等)の分析結果である。
【0770】
ステップ5:
【0771】
サーバは、受け取った感情状態の情報に基づき、コンテンツの表示を調整する。この調整は、ユーザーの感情にマッチするコンテンツを選択し、それを優先的に表示するためのものである。入力はユーザーの感情状態の情報であり、出力は調整されたコンテンツのセットである。
【0772】
このプログラムの処理を実施することで、ユーザーは自分の感情に合わせて最適化されたコンテンツを受け取ることができるようになり、不適切なコンテンツから保護される。
【0773】
(応用例3)
【0774】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、スマート眼鏡214を「端末」と称する。
【0775】
従来のデジタルコンテンツ提供システムでは、ユーザーの個別の感情状態を考慮せずに一律のコンテンツを提供していた。これにより、ユーザーの現在の感情や必要に応じたコンテンツを適切に提供することが困難であった。特に、ユーザーが求める感情的なサポートや体験をデジタルコンテンツを通じて提供することに限界があった。
【0776】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0777】
この発明では、サーバは、ユーザーの表情をリアルタイムで分析する画像認識手段と、分析結果に基づいてユーザーの感情状態を判断する感情エンジン手段と、ユーザーの感情状態に適したコンテンツを選定し提供するAI手段と、を含む。これにより、ユーザーの現在の感情状態に基づいたパーソナライズされたデジタルコンテンツの提供が可能となる。
【0778】
「デジタルコンテンツ」とは、インターネット上で配信される動画、音楽、文章、画像などの電子的形式で存在するコンテンツのことである。
【0779】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを自動で実行するシステムやプログラムのことである。
【0780】
「ユーザーの感情状態に適したコンテンツに差し替える手段」とは、ユーザーの現在の感情を考慮して、その感情に適合または反応するようなコンテンツに自動で切り替える技術やプロセスのことである。
【0781】
「画像認識手段」とは、カメラ等のデバイスを通じて取得した画像データから特定のパターンや物体を識別し、解析する技術やシステムのことである。
【0782】
「感情エンジン手段」とは、ユーザーの表情、声のトーン、言葉遣いなどから感情状態を推測し、解析する技術やシステムのことである。
【0783】
「コンテンツの選定と表示を優先順位付けするAI手段」とは、ユーザーに最適なコンテンツを選び出し、その表示順をユーザーの好みや状況に合わせて自動で調整する人工知能の機能やプロセスのことである。
【0784】
この発明を実施するための形態は、ユーザーの感情状態に基づいてデジタルコンテンツを動的に選定し、提供するシステムに関連している。このシステムは、主にスマートフォンやタブレットなどの端末にインストールされるアプリケーションとして実装される。端末の内蔵カメラを用いてユーザーの表情をリアルタイムで分析し、画像認識手段を通じて得られたデータを基に感情エンジン手段がユーザーの感情状態を判断する。この判断結果を元に、AI手段がユーザーの現在の感情に最も適したコンテンツを選定し、画面上に表示する。
【0785】
ハードウェアとしては、スマートフォンやタブレットの内蔵カメラとプロセッサが使用される。ソフトウェアとしては、画像認識にOpenCV、機械学習にはTensorFlowなどのライブラリが用いられる。このシステムを通じて、例えばユーザーが悲しんでいる場合には、明るく元気づけるような動画や音楽を提供することが可能となる。逆に、ユーザーがリラックスしている場合には、穏やかな音楽や風景画像を優先的に表示するように調整する。
【0786】
具体的なプログラムの操作手順としては、まずアプリケーションが端末のカメラを起動し、ユーザーの表情をキャプチャする。続いて、画像認識手段を用いて表情から感情を分析し、感情エンジン手段によってユーザーの感情状態が判断される。最後に、この感情状態に基づき、AI手段がコンテンツの選定と表示を行う。このプロセスは、ユーザーがアプリケーションを使用している間、連続的に実行される。
【0787】
プロンプト文の例として、「ユーザーが悲しんでいるときに推薦するべき楽しい動画のリストを生成せよ」や「ユーザーが喜んでいるときにさらに喜びを増幅させる動画のリストを生成せよ」という具体例が挙げられる。これにより、ユーザーの感情に応じたコンテンツを提供することで、ユーザー体験を向上させることが目的である。
【0788】
【0789】
ステップ1:
【0790】
端末が内蔵カメラを起動し、ユーザーの表情をキャプチャする。この段階では、カメラからの映像データが入力として受け取られ、生の画像データとして端末に送信される。
【0791】
ステップ2:
【0792】
画像認識手段がキャプチャされた画像データを分析し、ユーザーの表情から感情を推定する。この処理では、入力として受け取った画像データに対して顔認識アルゴリズムが適用され、ユーザーの表情に基づいた感情のスコア(例:喜び、悲しみ、怒りなど)が出力として生成される。
【0793】
ステップ3:
【0794】
感情エンジン手段が、ステップ2で得られた感情スコアを基にユーザーの感情状態を最終的に判断する。このステップでは、入力として受け取った感情スコアを分析し、最も可能性の高い感情状態を出力として決定する。
【0795】
ステップ4:
【0796】
AI手段が、ステップ3で判断されたユーザーの感情状態に基づいて、適切なデジタルコンテンツを選定する。この過程では、データベース内のコンテンツ情報とユーザーの感情状態が入力として考慮され、感情状態に最適なコンテンツのリストが出力として生成される。
【0797】
ステップ5:
【0798】
選定されたコンテンツが端末の画面上に表示される。この最終ステップでは、ステップ4で生成されたコンテンツリストが入力として受け取られ、それらのコンテンツがユーザーインターフェース上に適切に配置されてユーザーに提示される。
【0799】
これらの処理ステップを通じて、ユーザーは自分の感情状態に適したデジタルコンテンツをリアルタイムで受け取ることができ、よりパーソナライズされたユーザー体験を享受することが可能となる。
【0800】
特定処理部290は、特定処理の結果をスマート眼鏡214に送信する。スマート眼鏡214では、制御部46Aが、スピーカ240に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。
【0801】
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。
【0802】
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。
【0803】
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、スマート眼鏡214によって特定処理が行われるようにしてもよい。
【0804】
[第3実施形態]
【0805】
図5には、第3実施形態に係るデータ処理システム310の構成の一例が示されている。
【0806】
図5に示すように、データ処理システム310は、データ処理装置12及びヘッドセット型端末314を備えている。データ処理装置12の一例としては、サーバが挙げられる。
【0807】
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。
【0808】
ヘッドセット型端末314は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及びディスプレイ343を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及びディスプレイ343も、バス52に接続されている。
【0809】
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。
【0810】
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。
【0811】
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。
【0812】
図6には、データ処理装置12及びヘッドセット型端末314の要部機能の一例が示されている。
図6に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。
【0813】
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。
【0814】
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。
【0815】
ヘッドセット型端末314では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。
【0816】
次に、データ処理装置12の特定処理部290による特定処理について説明する。
【0817】
「形態例1」
【0818】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段として、ブラウザのプラグインを用いる。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0819】
「形態例2」
【0820】
本発明の別の実施形態として、AIはブラウザのプラグインとして実装される。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0821】
「形態例3」
【0822】
本発明のさらなる実施形態として、AIはテキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である。具体的には、AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【0823】
以下に、各形態例の処理の流れについて説明する。
【0824】
「形態例1」
【0825】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0826】
ステップ2:受け取ったコンテンツはAIに送信される。
【0827】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【0828】
ステップ4:不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0829】
「形態例2」
【0830】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0831】
ステップ2:受け取ったコンテンツはAIに送信される。
【0832】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【0833】
「形態例3」
【0834】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【0835】
ステップ2:受け取ったコンテンツはAIに送信される。
【0836】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【0837】
ステップ4:AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【0838】
(実施例1)
【0839】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【0840】
現代の情報通信ネットワーク上には、特定のユーザグループ、特に子どもたちにとって不適切な表現や視覚情報が多く存在する。これらのコンテンツによって、子どもたちが精神的な不快感を感じたり、不適切な行動を学習したりするリスクがある。従来のフィルタリング技術では、これらの問題を完全に解決することが困難であり、特にリアルタイムでコンテンツを分析し、不適切な内容を適切なものに置き換えることは実現が難しい。
【0841】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0842】
この発明では、サーバは、ユーザがアクセスする情報通信ネットワーク上のコンテンツをリアルタイムで受け取る手段と、受け取ったコンテンツを情報処理システムに送信する手段と、送信されたコンテンツが特定のユーザグループに対して不適切な表現や視覚情報であるかを分析し判断する情報処理システムと、不適切と判断された表現や視覚情報を特定のユーザグループにとって適切な表現や視覚情報に自動的に変換する手段と、を含む。これにより、特定のユーザグループが情報通信ネットワークを利用する際の安全性を高め、不適切なコンテンツからの保護を実現することが可能となる。
【0843】
「情報通信ネットワーク」は、インターネットやその他のデジタル通信手段を通じて情報を交換するシステムの総称である。
【0844】
「コンテンツ」は、ウェブサイト、ビデオ、画像、テキストなど、デジタル形式で表現された情報やエンターテインメントのことである。
【0845】
「リアルタイムで受け取る手段」は、ユーザがアクセスした瞬間にその情報を捕捉し、処理する技術や方法のことである。
【0846】
「情報処理システム」は、受け取ったデータを分析、加工、変換するためのハードウェアおよびソフトウェアの集合体である。
【0847】
「特定のユーザグループ」は、特定の属性、年齢、興味などに基づいて区別されるユーザの集まりである。
【0848】
「不適切な表現や視覚情報」は、そのユーザグループにとって精神的な不快感を与えるか、あるいは不適切な行動や考え方を促す可能性がある言葉や画像などの情報である。
【0849】
「自動的に変換する手段」は、特定の基準やルールに基づいて、不適切な内容を適切な内容に置き換えるプロセスを自動で行う技術や方法である。
【0850】
この発明を実施するための形態においては、主に情報処理システム、ユーザの端末、および拡張機能としてのブラウザプラグインを用いる。情報処理システムは、生成AIモデルを含むサーバ上で構成され、ユーザの端末は、この情報処理システムにリアルタイムでコンテンツを送信するためのブラウザとプラグインを備えている。
【0851】
情報処理システムでは、特にOpenAIのGPT-4や画像処理に特化したDALL・Eといった具体的な生成AIモデルが使用される。これらのモデルは、テキストと画像の両方に対して不適切な内容を識別し、適切な内容に変換する機能を持っている。この処理は、端末から送信されたコンテンツに基づいて自動的に行われる。
【0852】
端末には、ユーザが情報通信ネットワークを閲覧する際に使用するブラウザがインストールされており、このブラウザには発明に基づいたプラグインが追加されている。このプラグインは、ユーザがアクセスするコンテンツを捕捉し、情報処理システムに送信する役割を持っている。送信されたコンテンツは、サーバ上の生成AIモデルによってリアルタイムで分析される。
【0853】
具体例として、ユーザが不適切な表現を含むテキストや画像にアクセスした場合、プラグインはこれらのコンテンツを捕捉し、サーバに送信する。サーバ上の生成AIモデルは、以下のようなプロンプト文を用いてコンテンツを分析する。「このウェブサイトには子どもに不適切な言葉が含まれています。適切な表現に変換してください。」「この画像は子どもに不適切です。子どもが見ても安全な、テーマに合った画像に置き換えてください。」これらのプロンプト文は、テキストや画像を適切なものに変換するための指示として機能する。変換後のコンテンツは再び端末に送り返され、ユーザが見るコンテンツが更新される。
【0854】
この形態により、特定のユーザグループ、特に子どもたちが情報通信ネットワークを安全に利用できるようにすることが目指されている。
【0855】
【0856】
ステップ1:ユーザがブラウザを通じて情報通信ネットワーク上のコンテンツにアクセスする。この際、端末にインストールされたブラウザプラグインが動作を開始し、ユーザが閲覧しているコンテンツを捕捉する。このプラグインは、テキスト、画像、およびその他のメディアファイルを含むすべてのコンテンツのデータをリアルタイムで収集する。入力はユーザがアクセスしたウェブページのコンテンツであり、出力は収集されたコンテンツデータである。
【0857】
ステップ2:捕捉したコンテンツデータは、ブラウザプラグインによってサーバに送信される。サーバ上の情報処理システムは、受信したコンテンツデータを分析するために生成AIモデルを用いる。この処理では、コンテンツが特定のユーザグループにとって不適切な表現や視覚情報を含んでいるかを判断する。入力は端末から送信されたコンテンツデータであり、出力は分析結果(不適切なコンテンツの識別)である。
【0858】
ステップ3:不適切と判断されたコンテンツに対して、サーバ上の生成AIモデルは、適切な表現や視覚情報に自動的に変換する処理を行う。たとえば、不適切な言葉は適切な言葉に、不適切な画像は問題ない画像に置き換えられる。この変換プロセスにおける入力は分析結果で識別された不適切なコンテンツであり、出力は変換後の適切なコンテンツである。
【0859】
ステップ4:変換されたコンテンツは、再び端末に送り返される。端末のブラウザプラグインは、オリジナルのコンテンツを変換後のコンテンツで更新し、ユーザの閲覧中のウェブページに表示する。このステップにおける入力はサーバから送信された変換後のコンテンツであり、出力はユーザが閲覧する更新されたウェブページである。
【0860】
これらの処理ステップを通じて、ユーザは不適切なコンテンツに触れることなく、情報通信ネットワークを安全に利用することが可能となる。各ステップは、特に子どもなどの保護が必要なユーザグループのオンライン安全性を高めることを目的としている。
【0861】
(応用例1)
【0862】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【0863】
デジタルコンテンツにおける不適切な言い回しや画像が利用者、特に子どもに与える影響に関する懸念が高まっています。インターネット上では、年齢に不適切なコンテンツに容易にアクセスできる環境があり、これらのコンテンツが心理的、情緒的な影響を与えかねない問題があります。特に、利用者がこれらのコンテンツを遭遇した際に、その場で内容を適切なものに変換し、安全な閲覧体験を提供する技術の需要があります。
【0864】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0865】
この発明では、サーバは、デジタルコンテンツをリアルタイムで取得する手段と、取得したコンテンツの適切性を評価するためにコンテンツを生成AIモデルに送信する手段と、不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する生成AIモデルに基づく手段と、を含む。これにより、不適切なコンテンツをリアルタイムで検出し、自動的に適切な表現に変換することが可能となる。結果として、利用者に対して安全なデジタルコンテンツ閲覧環境を提供することができる。
【0866】
「デジタルコンテンツ」とは、インターネット上で配信されるテキスト、画像、動画などの情報の総称である。
【0867】
「リアルタイムで取得する手段」とは、利用者がアクセスする瞬間にそのコンテンツを取得し、分析するための技術や方法である。
【0868】
「生成AIモデルに送信する手段」とは、取得したコンテンツを人工知能モデルに送り、解析や処理を行わせるための技術や方法である。
【0869】
「不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する」とは、生成AIモデルがコンテンツ内の不適切な言い回しや画像を識別し、それらを年齢や理解度に応じた適切な内容に置き換えるプロセスである。
【0870】
「利用者」とは、デジタルコンテンツを閲覧または利用する個人である。
【0871】
「サーバ」とは、インターネット上でデータやサービスを提供するコンピュータシステムまたはそのソフトウェアを指す。
【0872】
「アプリケーション」とは、特定の目的のためにデザインされたソフトウェアプログラムである。
【0873】
この発明を実施するための形態において、システムは主にサーバ、端末(スマートフォン、タブレット、スマート眼鏡、ヘッドマウントディスプレイなど)、およびユーザ(特に子ども)から構成される。サーバは生成AIモデルをホストしており、端末はインターネット上のデジタルコンテンツにアクセスするためのブラウザや専用アプリケーションを実行する。このシステムは、端末がアクセスしたデジタルコンテンツをリアルタイムで取得し、そのコンテンツをサーバ上の生成AIモデルに送信する機能を有する。生成AIモデルは、送信されたコンテンツの適切性を評価し、不適切な表現が含まれている場合、それをユーザが理解しやすい適切な表現に自動的に変換する。
【0874】
このシステムを実現するためには、JavaScriptやPythonなどのプログラミング言語で記述された端末上で動作するブラウザプラグインやアプリケーション、およびサーバ上で実行されるTensorFlowやOpenAIのGPT、DALL-Eなどの生成AIモデルが使用される。これらのソフトウェアは、ハードウェア上で実行され、デジタルコンテンツの取得、解析、変換のプロセスを効率的に行う。
【0875】
具体例として、子どもが暴力的な画像を含むニュースサイトにアクセスした場合、システムはその画像をリアルタイムで取得し、サーバに送信する。生成AIモデルは、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」というプロンプト文に基づいて処理を行い、暴力的な要素を含まない代替画像を生成し、その画像を元のコンテンツの場所に表示する。このプロセスにより、ユーザは安全なデジタルコンテンツ閲覧環境を享受できる。
【0876】
【0877】
ステップ1:端末がデジタルコンテンツにアクセスする
【0878】
ユーザが端末を用いてインターネット上の特定のウェブサイトにアクセスする。この時、端末上で動作するブラウザプラグインまたはアプリケーションがデジタルコンテンツ(テキスト、画像、動画など)をリアルタイムで取得する。入力としてはユーザのアクセスしたウェブサイトのURLやそのページのHTMLコードがあり、出力としてはそのページのコンテンツデータが得られる。
【0879】
ステップ2:コンテンツの適切性を評価するためにサーバに送信する
【0880】
取得したデジタルコンテンツは、評価のためにサーバ上の生成AIモデルに送信される。このプロセスでは、入力として取得したデジタルコンテンツがあり、出力としてはそのコンテンツが生成AIモデルによって受け取られる。
【0881】
ステップ3:生成AIモデルがコンテンツを分析し、不適切な内容を識別する
【0882】
サーバ上の生成AIモデルは、送信されたコンテンツを分析し、不適切な言い回しや画像を識別する。入力としてはステップ2で送信されたコンテンツがあり、出力としては不適切な内容のリストや識別情報が得られる。このステップでは、特定のキーワードや画像認識技術を用いて不適切な内容を検出するデータ加工又はデータ演算が行われる。
【0883】
ステップ4:不適切な内容を適切な内容に変換する
【0884】
識別された不適切な内容は、子どもが理解しやすい適切な言い回しや画像に自動的に変換される。この処理には、生成AIモデルが使用され、入力としてはステップ3で識別された不適切な内容があり、出力としては変換後の適切なコンテンツが得られる。生成AIモデルは、不適切な内容を受け取り、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」といったプロンプト文に基づいて、適切な内容へと変換するデータ演算を行う。
【0885】
ステップ5:変換後のコンテンツを端末に送信し、表示する
【0886】
最後に、サーバは変換後の適切なコンテンツを端末に送信し、ユーザがアクセスしたウェブページ上でその内容が表示されるようにする。入力としてはステップ4で生成された適切なコンテンツがあり、出力としてはユーザの端末上でそのコンテンツが表示される。このステップでは、サーバから端末へのデータ送信と、端末上でのデータ表示処理が行われる。
【0887】
(実施例2)
【0888】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【0889】
インターネット上には子どもがアクセスすべきではない不適切な内容が数多く存在している。保護者が常に監視することは現実的ではなく、既存のフィルタリング技術でも完全にはブロックできない場合がある。特に、テキストと画像の両方を含むコンテンツの場合、これらをリアルタイムで適切に評価し、子どもに安全な内容に自動で変換する技術は未だ不足している。
【0890】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0891】
この発明では、サーバは、ウェブコンテンツをリアルタイムで捕捉し安全な通信経路を通じて送信する手段と、送信されたコンテンツを自然言語および画像解析技術を備えた生成AIモデルによって評価する手段と、不適切な表現または画像を検出した場合、これらを利用者の理解に適した表現や問題ない画像に自動で差し替える手段と、を含む。これにより、子どもがインターネットを利用する際の安全性を大幅に向上させることが可能となる。
【0892】
「利用者」とは、情報端末を通じてウェブコンテンツにアクセスする個人または集団を指す。
【0893】
「情報端末」とは、インターネットに接続し、ウェブサイトを閲覧することが可能なデバイス(パソコン、スマートフォン、タブレット等)を指す。
【0894】
「ウェブコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【0895】
「リアルタイムで捕捉する」とは、利用者がウェブコンテンツを閲覧しているその瞬間に、その内容を即座に検出・取得することを指す。
【0896】
「安全な通信経路」とは、データの送受信において第三者による傍受や改ざんを防ぐために暗号化などのセキュリティ技術を用いた通信手段を指す。
【0897】
「解析サーバ」とは、送信されたウェブコンテンツを解析・処理するためのコンピュータシステムを指す。
【0898】
「生成AIモデル」とは、入力されたデータに基づいて新たなテキストや画像を生成する能力を持つ人工知能モデルを指す。
【0899】
「自然言語および画像解析技術」とは、テキストデータを理解・解析するための技術および画像の内容を識別・分析する技術を指す。
【0900】
「不適切な表現または画像」とは、年齢や社会的規範に照らして、特定の利用者群(特に子ども)にとって見るべきでない、または理解するのが難しいと判断されるコンテンツを指す。
【0901】
「問題ない画像」とは、特定の利用者群(特に子ども)が閲覧しても安全と判断される内容の画像を指す。
【0902】
「プラグイン形式」とは、既存のソフトウェア(この場合はブラウザ)に追加して機能を拡張するためのソフトウェアモジュールのことを指す。
【0903】
この発明を実施するための形態においては、主に情報端末と解析サーバ、およびその間の通信プロトコルが関与する。情報端末には、ウェブブラウザがインストールされており、このブラウザには、ウェブコンテンツをリアルタイムで捕捉し、安全な通信経路を介して解析サーバに送信する機能を持つプラグインが組み込まれている。このプラグインは、JavaScriptやその他のウェブ技術を使用して開発される。
【0904】
解析サーバは、高性能なコンピュータシステム上に構築され、生成AIモデルを含むソフトウェアがインストールされている。このサーバは、情報端末から送信されたウェブコンテンツを受け取り、自然言語処理技術と画像解析技術を用いて内容を解析する。不適切な表現または画像が検出された場合、AIモデルはそれらを適切な内容に自動的に差し替える。このプロセスには、TensorFlowやPyTorchといった深層学習フレームワークが使用される。差し替えられたコンテンツは再び情報端末に送り返され、プラグインを通じてユーザに表示される。
【0905】
例として、ウェブページ上に「この映画は大人向けの暴力シーンが含まれています」というテキストと、そのシーンのスクリーンショットが含まれている場合を考える。プラグインはこのテキストと画像を捕捉し、解析サーバに送信する。サーバ上のAIモデルはテキストを「この映画には怖い場面があるので、大人と一緒に見てね」といった子どもに優しい言葉に、画像を映画のロゴなどの問題のない画像に差し替える。これらの変換プロセスは、自然言語処理と画像認識技術に基づいており、子どもが安全にインターネットを利用できるようにすることが目的だ。
【0906】
この発明により、情報端末と解析サーバ間でセキュアな通信を行いながら、リアルタイムでウェブコンテンツをフィルタリングし、子どもにとって安全な形に変換することが可能となる。これにより、保護者は子どもがインターネットを使用する際の安全性を高めることができる。
【0907】
【0908】
ステップ1:ウェブコンテンツの捕捉
【0909】
情報端末上で動作するブラウザのプラグインが、ユーザが閲覧しているウェブページのコンテンツ(テキストおよび画像)をリアルタイムで捕捉する。このステップの入力は、ユーザが閲覧しているウェブページの内容であり、出力は、解析のためにサーバへ送信するデータ形式に加工されたコンテンツデータである。プラグインは、DOM解析を行い、ページ内の全てのテキストと画像のデータを抽出する。
【0910】
ステップ2:コンテンツの送信
【0911】
捕捉されたコンテンツは、情報端末から解析サーバへ安全な通信経路を通じて送信される。このステップの入力は、ステップ1で加工されたコンテンツデータであり、出力は、解析サーバに到達したコンテンツデータである。送信にはHTTPSプロトコルが使用され、データの機密性と完全性が保証される。
【0912】
ステップ3:コンテンツの解析と評価
【0913】
解析サーバ上の生成AIモデルが、送信されたコンテンツを自然言語処理技術と画像解析技術を用いて解析し、評価する。このステップの入力は、ステップ2で受け取ったコンテンツデータであり、出力は、不適切な表現または画像が検出された場合にそれらを適切な内容に差し替えた後のコンテンツデータである。AIモデルは、不適切な内容を識別し、適切な代替テキストや画像に自動で置換する。
【0914】
ステップ4:差し替えたコンテンツの返送
【0915】
差し替えられたコンテンツは、解析サーバから情報端末に返送される。このステップの入力は、ステップ3で生成された差し替え後のコンテンツデータであり、出力は、情報端末のブラウザプラグインによってユーザに表示される準備が整ったコンテンツである。返送にもHTTPSプロトコルが使用され、データの安全性が維持される。
【0916】
ステップ5:コンテンツの表示
【0917】
情報端末のブラウザプラグインが、返送されたコンテンツをユーザのブラウザ上に表示する。このステップの入力は、ステップ4で返送されたコンテンツデータであり、出力は、ユーザが閲覧するウェブページ上にレンダリングされた適切なコンテンツである。プラグインは、差し替えられたテキストと画像を元の位置に適切に埋め込み、ユーザに安全な閲覧環境を提供する。
【0918】
(応用例2)
【0919】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【0920】
インターネット上には、特定の利用者群にとって不適切と考えられる言語表現や視覚表現が数多く存在します。特に、子供たちが自由にアクセスできる環境では、彼らに有害な内容に触れるリスクがあります。これまでの技術では、不適切な内容を効率的にフィルタリングし、かつそれを利用者の理解レベルに適した形で自動的に置き換えることが困難であるという問題がありました。この課題を解決することで、特定の利用者群、特に子供たちが安全に情報を得られるインターネット環境を提供することが求められています。
【0921】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0922】
この発明では、サーバは、利用者がアクセスする情報配信媒体のコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群に対して不適切な言語表現や視覚表現であるかを判断する人工知能手段と、不適切な言語表現や視覚表現を特定の利用者群に伝えられる適切な言語表現や視覚表現に差し替える手段と、を含む。これにより、特定の利用者群、特に子供たちがインターネットを使用する際に、不適切な内容に触れることなく、また、その理解レベルに合った形で情報を得られる環境が可能となる。
【0923】
「情報配信媒体」とは、インターネット上でコンテンツを公開し、一般の利用者がアクセス可能なウェブサイトやアプリケーションを指す。
【0924】
「コンテンツ」とは、テキスト、画像、動画、音声などの情報や表現物で、情報配信媒体を通じて提供されるものを指す。
【0925】
「特定の利用者群」とは、年齢、性別、文化的背景などによって定義される、特定の特性を持つ利用者の集団を指す。
【0926】
「不適切な言語表現や視覚表現」とは、特定の利用者群が接するには不適当と考えられる、攻撃的、性的、暴力的、またはその他の利用者にとって不快感を与える可能性のある言葉や画像を指す。
【0927】
「人工知能手段」とは、機械学習や自然言語処理、画像認識などの技術を用いて、コンテンツの内容を分析し、判断を下すシステムやプロセスを指す。
【0928】
「情報配信媒体の利用者インターフェース拡張機能」とは、ウェブブラウザやアプリケーションの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアコンポーネントを指す。
【0929】
「適切な言語表現や視覚表現に差し替える手段」とは、特定の利用者群にとって受け入れられる、教育的価値がある、または中立的な内容の言語表現や視覚表現に、不適切なコンテンツを置き換えるプロセスやアルゴリズムを指す。
【0930】
この発明を実施するための形態では、サーバは人工知能を含むプログラムを実行し、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取り、分析する。このプログラムは、特定の利用者群に不適切と判断される言語表現や視覚表現を検出し、これらを適切な表現に自動で差し替える機能を持つ。このプロセスには、自然言語処理技術や画像認識技術が用いられる。使用するハードウェアは、高性能のサーバとストレージシステムであり、ソフトウェアにはTensorFlowやPyTorchのような機械学習ライブラリが含まれる。
【0931】
端末側では、情報配信媒体の利用者インターフェース拡張機能として実装されたプログラムが動作し、サーバから受信した加工済みコンテンツを表示する。この拡張機能は、JavaScriptやその他のウェブ技術を使用して開発され、特定の利用者群にとって適切なコンテンツのみを表示するように設計されている。
【0932】
ユーザは、このシステムを通じて安全なコンテンツ閲覧体験を得ることができる。たとえば、子供がウェブサイトを利用する際に、不適切な言葉が「おっちょこちょい」などの理解しやすい同義語に、また不適切な画像が教育的なイラストや風景画像に差し替えられる。このような処理により、特定の利用者群がインターネットを安全に使用できる環境が提供される。プロンプト文の例としては、「このテキストを5歳の子供が理解できる言葉に変換してください」や「この画像を子供が見ても安全な内容の画像に置き換えてください」といった指示が用いられる。
【0933】
【0934】
ステップ1:コンテンツの受信と前処理
【0935】
サーバは、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取る。この時、HTML、CSS、JavaScriptなどの形式で構成されたウェブページのデータが入力となる。サーバはこれらのデータを解析し、テキストと画像に分離する。このプロセスにより、テキストデータと画像データが抽出され、次の処理ステップへの入力として準備される。
【0936】
ステップ2:不適切なコンテンツの検出
【0937】
抽出されたテキストデータは、自然言語処理技術を用いて分析され、不適切な言語表現が検出される。同時に、画像データに対しては画像認識技術が適用され、不適切な視覚表現が検出される。この処理には、機械学習ライブラリを活用した生成AIモデルが使用され、テキストと画像のそれぞれに対して適切性の評価が行われる。入力としては、ウェブページから抽出されたテキストと画像があり、出力としては、不適切と判定されたコンテンツのリストが得られる。
【0938】
ステップ3:コンテンツの差し替え
【0939】
不適切と判定されたテキストや画像は、特定の利用者群に適切な言語表現や視覚表現に自動で差し替えられる。この際、生成AIモデルは、不適切なコンテンツを適切なコンテンツに変換するためのプロンプト文に基づいて動作する。たとえば、「このテキストを5歳の子供が理解できる言葉に変換してください」というプロンプトに基づき、テキストの置き換えが行われる。画像についても、「この画像を子供が見ても安全な内容の画像に置き換えてください」というプロンプトに従って、適切な画像に差し替えられる。入力としては不適切なコンテンツがあり、出力としてはそれが適切な表現に置き換えられたコンテンツとなる。
【0940】
ステップ4:加工済みコンテンツの送信
【0941】
差し替えられたコンテンツは、情報配信媒体の利用者インターフェース拡張機能を通じて利用者の端末に送信される。サーバは、加工済みのテキストと画像を含むウェブページのデータを生成し、これを端末に向けて送信する。端末は受信したデータをブラウザ上でレンダリングし、利用者に表示する。このプロセスにより、利用者は不適切なコンテンツが除去され、安全なコンテンツのみが含まれるウェブページを閲覧できるようになる。
【0942】
(実施例3)
【0943】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【0944】
デジタルコンテンツが普及する現代社会において、特定のユーザグループ、特に子供たちが不適切な内容に触れるリスクが高まっている。インターネット上では、暴力的、性的、またはその他の有害なコンテンツが容易にアクセス可能となっており、これらのコンテンツが特定のユーザグループの健全な成長や精神的安全を脅かしている。したがって、デジタルコンテンツを介した不適切な情報の流通を効果的に制限し、特定のユーザグループが安全な環境でデジタルコンテンツを利用できるようにすることが急務である。
【0945】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0946】
この発明では、サーバは、デジタルデータをアップロードする手段と、アップロードされたデジタルデータが特定のユーザグループに対して不適切な内容を含むかを判断するAI手段と、不適切な内容を含むデジタルデータを特定のユーザグループに適切な内容に差し替える手段と、を含む。これにより、特定のユーザグループがインターネット上の不適切なコンテンツに触れることなく、安全かつ健全なデジタル環境で情報を得ることが可能となる。サーバ上で動作するAIは、テキストと画像の両方に対して不適切な内容を自動的に識別し、適切なコンテンツに差し替えることにより、特定のユーザグループのデジタルコンテンツの安全性と適切性を保障する。
【0947】
「デジタルデータ」とは、画像、テキスト、音声、ビデオなど、デジタル形式で表現された情報の総称である。
【0948】
「アップロードする手段」とは、ユーザがデジタルデータをインターネット経由でサーバやクラウド上に送信する行為やそのための技術、プロセスを指す。
【0949】
「AI手段」とは、人工知能技術を活用して特定のタスクを自動で実行するための方法やシステムを指し、この場合は不適切なコンテンツの識別と差し替えを行う機能を含む。
【0950】
「不適切な内容」とは、特定のユーザグループ、特に子供たちにとって有害と考えられる性的、暴力的、またはその他の不快感を与える可能性がある情報や画像を指す。
【0951】
「特定のユーザグループ」とは、特定の年齢層、興味、感受性などの共通の特徴を持つユーザの集団を指し、本発明では主に子供たちを想定している。
【0952】
「ウェブサービスまたはアプリケーション」とは、インターネットを介して提供されるサービスやプログラムで、ユーザが特定の機能や情報にアクセスできるようにするものを指す。
【0953】
「適切な内容に差し替える手段」とは、不適切なデジタルデータを分析し、その内容を特定のユーザグループにとって適切かつ有害でない情報や画像に置き換えるプロセスや技術を指す。
【0954】
この発明を実施するための形態は、主にデジタルデータのアップロード、そのデータの適切性の評価、及び不適切なデータの差し替えを含むシステムの運用に関するものである。このシステムは、サーバ、端末、及びユーザの三者によって構成される。
【0955】
サーバは、高性能なコンピュータシステムであり、人工知能(AI)を活用したデータ分析機能を搭載している。このサーバ上で動作するAIは、特定のライブラリやフレームワーク(例:TensorFlow, PyTorch)を使用して、アップロードされた画像やテキストの内容を評価する。AIの分析能力には、画像認識技術や自然言語処理技術が含まれ、これによってデジタルデータ内の不適切な要素を特定する。
【0956】
端末は、インターネットに接続されたデバイスであり、ユーザがデジタルデータをアップロードするためのインターフェイスを提供する。端末は、スマートフォン、タブレット、パーソナルコンピュータ等を含む。
【0957】
ユーザは、このシステムを利用してデジタルコンテンツをアップロードし、閲覧する人々である。ユーザは特定のウェブサイトやアプリケーションを通じてデジタルデータをサーバに送信する。送信されたデータはサーバによって自動的に分析され、不適切なコンテンツがある場合は適切な内容に差し替えられる。
【0958】
具体例として、ユーザがアップロードした画像が暴力的な内容を含む場合、サーバ上で動作するAIはこの画像を不適切であると判断し、代替の安全な画像(例:風景画)に自動的に差し替える。プロンプト文の例としては、「画像内のコンテンツを分析し、不適切な要素が含まれているか判断し、含まれている場合は指定されたカテゴリー(例:自然風景)の安全な画像に自動的に差し替える」というものが挙げられる。
【0959】
この形態により、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。サーバ、端末、及びユーザの相互作用によって、この発明は実施される。
【0960】
【0961】
ステップ1:ユーザは端末を使用してデジタルデータ(画像やテキスト)をシステムにアップロードする。この段階の入力はユーザによって選択されたデジタルデータであり、出力はサーバへ送信されるデータファイルである。端末はユーザが選択したデータを収集し、サーバに送信する処理を行う。
【0962】
ステップ2:サーバはアップロードされたデジタルデータを受信し、AI手段を用いてその内容を分析する。この段階での入力はアップロードされたデータであり、出力はデータ内容の分析結果(不適切な内容が含まれているかどうか)である。サーバ上のAIは、受信したデータを処理し、不適切な要素を特定するためのデータ加工およびデータ演算を行う。
【0963】
ステップ3:AI手段がデータを不適切であると判断した場合、サーバはそのデータを適切な内容に差し替える。この段階の入力は不適切と判断されたデータであり、出力は適切な内容に差し替えられたデータである。サーバは不適切なデータを削除し、予め用意された適切なデータ(例:安全な画像ライブラリからの画像)で置き換える処理を行う。
【0964】
ステップ4:差し替えられたデータは、サーバから端末を通じてユーザに送信される。この段階の入力は差し替え後のデータであり、出力はユーザが閲覧可能な形式で表示されるデータである。サーバは変換されたデータを端末へ送信し、端末はそれをユーザの画面上で表示する処理を行う。
【0965】
この処理流れにより、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。システムは、不適切なデータを効果的に識別し、適切なコンテンツに自動的に差し替えることができる。
【0966】
(応用例3)
【0967】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【0968】
現代のデジタル社会において、特定の年齢層、特に子供たちがインターネットを通じてアクセスするコンテンツには、しばしば不適切な表現や画像が含まれている。これらの不適切なコンテンツにより、子供たちが精神的な損害を受けるリスクがある。従来のフィルタリング技術では、不適切なテキストコンテンツのブロックには一定の効果があるものの、画像に関してはその判断が難しく、また、不適切なコンテンツを適切なものに置き換えることができないという問題があった。この発明は、特定の年齢層がアクセスするデジタルコンテンツにおいて、不適切な表現や画像を自動的に検出し、それを適切な表現や画像に差し替えることにより、安全な閲覧環境を提供することを目的とする。
【0969】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【0970】
この発明では、サーバは、情報端末を通じてアクセスされるデジタルコンテンツを受け取る手段と、受け取ったデジタルコンテンツが特定の年齢層に対して不適切な表現や画像であるかを判断するAI手段と、不適切な表現や画像を特定の年齢層に適切な表現や画像に差し替える手段と、を含む。これにより、デジタルコンテンツの安全性を確保し、特定の年齢層が閲覧しても問題ないコンテンツのみを提供することが可能となる。AI手段は、テキストだけでなく画像に対しても不適切な内容を高精度で判断し、差し替えることが可能であるため、従来の技術では対応が困難であった画像コンテンツの問題にも対応できる。
【0971】
「情報端末」とは、インターネットやその他のネットワークに接続してデジタルコンテンツを受け取り、表示するための電子機器である。例えば、スマートフォン、タブレット、パーソナルコンピュータなどが含まれる。
【0972】
「デジタルコンテンツ」とは、テキスト、画像、動画、音声などのデジタル形式で表現された情報コンテンツである。インターネットを介して配信され、情報端末でアクセス・閲覧が可能である。
【0973】
「特定の年齢層」とは、コンテンツの閲覧にあたって特に保護する必要のある年齢範囲を指し、特に子供や青少年などの若年層を示す。
【0974】
「不適切な表現や画像」とは、特定の年齢層にとって見ることが望ましくない、または精神的な損害を与える可能性のあるテキスト、画像、その他のメディアコンテンツである。例えば、暴力的、性的、または差別的な内容がこれに該当する。
【0975】
「AI手段」とは、人工知能技術を活用してデジタルコンテンツの内容を分析し、特定の基準に基づいてコンテンツが適切か不適切かを判断するシステムやプログラムのことである。この手段は、機械学習や画像認識技術を含む。
【0976】
この発明の実施形態では、サーバは特定の年齢層に適切なデジタルコンテンツを提供するために、情報端末を通じてアクセスされるデジタルコンテンツを受け取り、その内容が特定の年齢層にとって不適切であるかをAI手段を用いて判断し、必要に応じて不適切な表現や画像を適切なものに差し替えるシステムである。このシステムは、情報端末にインストールされたアプリケーションとして機能し、端末の利用者がデジタルコンテンツを閲覧する際にリアルタイムでコンテンツの監視と適切な変換を行う。
【0977】
サーバは、人工知能技術を用いて、受け取ったデジタルコンテンツ内のテキストおよび画像に対して不適切な内容を判断する。このAI手段には、画像認識技術や自然言語処理技術が含まれ、これらの技術を活用してコンテンツの安全性を評価する。不適切なコンテンツが検出された場合、AI手段は生成AIモデルを用いて、そのコンテンツを特定の年齢層に適切なものに自動的に差し替える。
【0978】
使用するハードウェアは情報端末であり、これにはスマートフォンやタブレット、パーソナルコンピュータが含まれる。ソフトウェアには、生成AIモデル(例: OpenAIのGPT系列)や画像認識技術(例: Google Cloud Vision API)が活用される。
【0979】
具体例として、ユーザが子供向けの動画配信サービスを利用している状況を考える。動画内に不適切な広告が挿入された場合、AI手段は「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というプロンプト文を用いて生成AIモデルに指示を出し、不適切な広告を風景画像に差し替える。このプロセスは、端末を利用しているユーザが安全なコンテンツのみを閲覧できるようにするためのものである。
【0980】
【0981】
ステップ1:ユーザが情報端末を使用してデジタルコンテンツにアクセスする。この時、入力としてはユーザのアクセス要求があり、出力としては対象のデジタルコンテンツが端末に表示される。端末は、ユーザのアクセス要求に基づき、選択したコンテンツを取得し、画面に表示する。
【0982】
ステップ2:サーバ上のAI手段がデジタルコンテンツを受け取り、内容分析を行う。入力としてはステップ1で取得されたデジタルコンテンツがあり、出力としてはコンテンツの内容に関する分析結果が得られる。この分析結果には、テキストおよび画像内の不適切な内容の有無が含まれる。AI手段は、画像認識技術と自然言語処理技術を用いて、コンテンツ内の不適切な要素を検出する。
【0983】
ステップ3:不適切な内容が検出された場合、AI手段が生成AIモデルを用いて、不適切なコンテンツを適切なものに差し替える。入力としてはステップ2で検出された不適切な内容があり、出力としては差し替え後の適切なコンテンツが得られる。このプロセスでは、不適切な画像やテキストを識別し、「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というようなプロンプト文に基づき、適切なコンテンツに自動的に変換する。
【0984】
ステップ4:変換されたコンテンツをユーザの情報端末に送信し、表示する。入力としてはステップ3で生成された適切なコンテンツがあり、出力としてはユーザの端末に表示されるコンテンツが更新される。サーバは変換されたコンテンツをユーザに提供し、端末はこのコンテンツを受け取り、ユーザに対して表示する。これにより、ユーザは安全なコンテンツのみを閲覧することができる。
【0985】
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。
【0986】
「形態例1」
【0987】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段、そしてユーザの感情を認識する感情エンジンを含むシステムが提供される。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【0988】
「形態例2」
【0989】
本発明の別の実施形態として、感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整するシステムが提供される。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝え、AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【0990】
「形態例3」
【0991】
本発明のさらに別の実施形態として、感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整するシステムが提供される。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝え、AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【0992】
以下に、各形態例の処理の流れについて説明する。
【0993】
「形態例1」
【0994】
ステップ1:子どもがアクセスするウェブサイトのコンテンツを受け取る。
【0995】
ステップ2:受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかをAIが判断する。
【0996】
ステップ3:不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。
【0997】
ステップ4:ユーザの感情を感情エンジンで認識する。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【0998】
「形態例2」
【0999】
ステップ1:ユーザの感情を感情エンジンで認識する。
【1000】
ステップ2:感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整する。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝える。
【1001】
ステップ3:AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【1002】
「形態例3」
【1003】
ステップ1:ユーザの感情を感情エンジンで認識する。
【1004】
ステップ2:感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整する。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝える。ステップ3:AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【1005】
(実施例1)
【1006】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【1007】
インターネット上のコンテンツは多岐にわたり、特定のユーザグループ、特に子どもたちにとって不適切な内容を含むことがある。これにより、ユーザの感情に悪影響を与えたり、誤解を招いたりする恐れがある。また、ユーザの反応に応じてコンテンツを動的に調整する技術が不足しており、個々のユーザに最適化されたインターネット体験を提供することが困難である。
【1008】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1009】
この発明では、サーバは、インターネットに接続された装置からデジタルコンテンツをリアルタイムで取得する手段と、取得したデジタルコンテンツを分析し、該コンテンツが特定のユーザグループにとって不適切な表現や視覚素材であるかを判断するための人工知能手段と、判定された不適切な表現や視覚素材を特定のユーザグループに適切な表現や視覚素材に置き換える手段と、ユーザの反応をリアルタイムで捉え、該反応に基づいてデジタルコンテンツをさらに最適化するための感情認識手段と、を含む。これにより、不適切なコンテンツの識別と置換、およびユーザの感情に基づいたコンテンツの最適化が可能となる。
【1010】
「インターネットに接続された装置」とは、インターネットへのアクセス機能を持ち、ウェブコンテンツの取得やデータ送受信が可能な電子機器である。
【1011】
「デジタルコンテンツ」とは、テキスト、画像、音声、動画など、デジタル形式で表現された情報の総称である。
【1012】
「リアルタイムで」とは、実際の時間とほぼ同時に、遅延なく処理や反応が行われることを意味する。
【1013】
「人工知能手段」とは、機械学習やディープラーニングなどの技術を活用して、人間のように学習し、判断や推論を行うシステムやプログラムのことである。
【1014】
「特定のユーザグループ」とは、年齢、性別、興味・関心など特定の基準に基づき区別されたユーザの集団である。
【1015】
「不適切な表現や視覚素材」とは、特定のユーザグループにとって不快感を与える、または見ることが適さないと判断されるテキストや画像などのコンテンツである。
【1016】
「置き換える」とは、ある要素を取り除き、別の要素でその位置や役割を代替することである。
【1017】
「感情認識手段」とは、人の感情を顔表情や声のトーンなどから識別し、解析する技術やシステムのことである。
【1018】
「最適化」とは、特定の基準に基づき、性能や効果を最良の状態に調整するプロセスである。
【1019】
本発明を実施するための形態について、具体的な説明を行う。この形態は、インターネット上のデジタルコンテンツを特定のユーザグループ、特に子どもたちにとって安全かつ教育的に最適化することを目的としている。
【1020】
まず、端末にはウェブブラウザを通じてアクセスされたデジタルコンテンツをリアルタイムで取得するためのプラグインがインストールされる。このプラグインは、ユーザが閲覧しているウェブページのテキストと画像を捉え、サーバに送信する機能を持つ。このプラグインは、一般的に利用されるウェブブラウザであるGoogle ChromeやMozilla Firefoxに対応している。
【1021】
サーバ側では、人工知能手段がデジタルコンテンツを分析する。この分析は、生成AIモデルを用いて行われ、テキストや画像が特定のユーザグループにとって不適切な表現や視覚素材であるかどうかを判断する。この人工知能手段には、OpenAIのGPTやGoogleのBERTなどの先進的なモデルが利用される。不適切なコンテンツが検出された場合、それは即座に適切な内容に置き換えられる。例えば、攻撃的な言葉はより穏やかな表現に、不適切な画像は教育的な画像に変更される。
【1022】
さらに、サーバにはユーザの反応をリアルタイムで捉えるための感情認識手段が備わっている。この感情認識手段は、ユーザの顔表情や声のトーンを分析し、喜びや困惑などの感情状態を識別する。この分析には、MicrosoftのFace APIやGoogleのCloud Speech-to-Textなどの技術が用いられる。感情のフィードバックに基づいて、デジタルコンテンツはさらに最適化され、ユーザにとってより適切な体験が提供される。
【1023】
プロンプト文の例としては、「このテキスト/画像は子どもにとって適切か?」という問いがAIに送信される。この問いに対してAIは、コンテンツが子どもにとって安全かつ教育的であるかどうかを分析し、必要に応じてコンテンツを調整する。
【1024】
この形態により、サーバはデジタルコンテンツをリアルタイムで分析し、不適切なコンテンツを特定し、これを適切なものに置き換えることができる。また、ユーザの感情を認識し、これに基づいてコンテンツを最適化することが可能となる。これにより、特定のユーザグループにとってより安全かつ教育的なインターネット体験が提供される。
【1025】
【1026】
ステップ1:コンテンツの取得
【1027】
端末にインストールされたブラウザプラグインは、ユーザがウェブサイトにアクセスする際、そのページのテキストと画像をリアルタイムで受け取る。この受け取ったコンテンツは、分析のためにサーバに送信される。
【1028】
入力:ウェブページのテキストと画像
【1029】
データ加工:ウェブページからのテキストと画像の収集
【1030】
出力:サーバに送信されるテキストと画像データ
【1031】
ステップ2:コンテンツの分析
【1032】
サーバ上のAIは、受け取ったテキストと画像を分析し、これが特定のユーザグループにとって不適切な内容を含むかどうかを判断する。この分析には、生成AIモデルが使用される。
【1033】
入力:テキストと画像データ
【1034】
データ加工:AIによる不適切な内容の識別
【1035】
出力:不適切と判定されたコンテンツのリスト
【1036】
ステップ3:コンテンツの置き換え
【1037】
不適切と判定されたコンテンツが存在する場合、サーバはこれを特定のユーザグループに適切な内容に置き換える。この置き換えプロセスには、適切なテキストや画像に関するデータベースが使用される。
【1038】
入力:不適切と判定されたコンテンツのリスト
【1039】
データ加工:不適切なコンテンツを適切なコンテンツに置き換える
【1040】
出力:置き換えられたコンテンツ
【1041】
ステップ4:コンテンツの最適化
【1042】
サーバには、ユーザの反応をリアルタイムで捉える感情認識手段があり、このフィードバックに基づいてコンテンツをさらに最適化する。このプロセスでは、感情認識技術を用いてユーザの反応が分析される。
【1043】
入力:ユーザの感情フィードバック(顔表情や声のトーン)
【1044】
データ加工:感情認識技術によるユーザ反応の分析
【1045】
出力:コンテンツの最適化情報
【1046】
ステップ5:最適化されたコンテンツの表示
【1047】
最後に、サーバから送り返された最適化されたコンテンツは、端末を通じてユーザに表示される。このプロセスにより、ユーザはより安全かつ教育的なコンテンツを体験することができる。
【1048】
入力:置き換えられたコンテンツ、最適化情報
【1049】
データ加工:端末によるコンテンツの表示準備
【1050】
出力:ユーザに表示される最適化されたコンテンツ
【1051】
(応用例1)
【1052】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【1053】
インターネット上には子どもにとって不適切なコンテンツが多数存在し、これらに簡単にアクセスできる環境がある。また、子どもの感情や反応に応じて適切なコンテンツを提供するシステムも不足している。これにより、子どもがネガティブな影響を受けるリスクが高まるという問題がある。この発明は、子どもが安全にデジタルコンテンツを楽しめる環境を提供し、さらにその感情に応じた適切なコンテンツを推薦できるシステムの必要性に対応することを目的とする。
【1054】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1055】
この発明では、サーバは、子どもがアクセスするデジタルコンテンツを受け取る手段と、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段と、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段と、ユーザの感情を認識する感情エンジンを含む手段と、を含む。これにより、子どもが安全にインターネットコンテンツを楽しむことができ、さらにその感情や反応に応じて適切なコンテンツを推薦することが可能となる。
【1056】
「子どもがアクセスするデジタルコンテンツ」とは、インターネット上で提供される文章、画像、音声、動画などの情報であり、年少者が閲覧または利用することを想定しているもの。
【1057】
「不適切な言い回しや画像」とは、年少者の健全な成長に悪影響を与える恐れがある、性的な表現、暴力的な表現、差別的な表現などのコンテンツ。
【1058】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを実行するためのアルゴリズムやソフトウェアの総称。
【1059】
「差し替える手段」とは、不適切と判断されたコンテンツを、年少者が閲覧しても安全な別のコンテンツに置き換える操作やプロセス。
【1060】
「ユーザの感情を認識する感情エンジン」とは、ユーザーの顔表情、声のトーン、行動パターンなどからその人の感情状態を推定する技術またはシステム。
【1061】
「ブラウザのプラグイン」とは、ウェブブラウザの機能を拡張するために追加されるソフトウェアコンポーネント。特定の機能やサービスをブラウザ内で直接利用可能にする。
【1062】
この発明を実施するための形態について、具体的な実装方法を示す。本発明のシステムは、子どもが安全にインターネットコンテンツを利用できるようにすること、及びユーザの感情に応じたコンテンツを推薦することを目的としている。
【1063】
サーバは、PythonやTensorFlow、OpenCV、PyTorchなどのライブラリを用いて開発される。これらのソフトウェアは、デジタルコンテンツから不適切な言い回しや画像を検出し、それらを子どもにとって適切なものに自動的に差し替えるAI手段を提供する。また、サーバはユーザの感情を認識する感情エンジンも含み、これは端末のカメラやマイクを介して収集された顔表情や声のトーンから感情を推定する。
【1064】
端末は、スマートフォン、タブレット、スマートTVなど、インターネットに接続できるデバイスを指す。端末上で動作するブラウザのプラグインは、ユーザがアクセスするデジタルコンテンツをリアルタイムでサーバに送信し、サーバからのフィードバックに基づいてコンテンツの表示を調整する。
【1065】
ユーザは、このシステムを利用してインターネットコンテンツを閲覧する際、自動的にフィルタリングされた安全なコンテンツにアクセスする。また、ユーザの感情がポジティブな場合は似た種類のコンテンツを、ネガティブな場合は異なるジャンルのコンテンツを推薦される。
【1066】
具体例として、保護者が子どもに動画を見せる際にこのシステムを利用するシナリオがある。プロンプト文としては、「子どもが見るに適した内容に自動で変換する動画フィルタリング機能」や「子どもの表情から感情を読み取り、コンテンツを推薦する機能」などが用いられる。
【1067】
この形態により、子どもがインターネットを利用する際の安全性が向上し、同時に感情に基づいたパーソナライズされたコンテンツ体験が提供される。
【1068】
【1069】
ステップ1:端末がユーザがアクセスするデジタルコンテンツを受け取る。
【1070】
端末は、ユーザがブラウザを通じてインターネット上のデジタルコンテンツにアクセスした際、そのコンテンツの情報(テキスト、画像、動画など)を受け取る。この情報は、次のステップでの処理のためにサーバへ送信される入力となる。
【1071】
ステップ2:端末が受け取ったコンテンツをサーバに送信する。
【1072】
端末は、受け取ったデジタルコンテンツをサーバに送信する。この送信されたコンテンツは、AIによる分析のための入力データとなる。
【1073】
ステップ3:サーバ上のAIがコンテンツを分析する。
【1074】
サーバ上に搭載されたAI手段は、受け取ったコンテンツを分析し、不適切な言い回しや画像が含まれているかどうかを判断する。この分析によって、コンテンツ内の特定の要素が子どもにとって不適切であると識別された場合、それらを差し替えるための情報が生成される。この処理の出力は、差し替えるべきコンテンツの位置と、それに置き換える適切なコンテンツの情報である。
【1075】
ステップ4:サーバがコンテンツの差し替え指示を端末に送信する。
【1076】
サーバは、AIによる分析結果をもとに、具体的な差し替え指示を端末に送信する。この指示には、どのコンテンツをどのように差し替えるべきかの情報が含まれる。
【1077】
ステップ5:端末がコンテンツを差し替える。
【1078】
端末は、サーバから受け取った差し替え指示に従い、表示中のコンテンツを適切なものに差し替える。この操作により、ユーザは不適切な内容に触れることなく、安全なコンテンツを閲覧できるようになる。
【1079】
ステップ6:端末がユーザの感情を認識する。
【1080】
端末は、内蔵されているカメラやマイクを用いて、ユーザの顔表情や声のトーンから感情を認識する。この情報は、感情に応じたコンテンツ推薦のためにサーバへ送信される。
【1081】
ステップ7:サーバがユーザの感情に基づいたコンテンツ推薦を行う。
【1082】
サーバは、端末から送信されたユーザの感情データを分析し、その感情に最も適したコンテンツを推薦する。この推薦情報は、端末に送信され、ユーザに提示される。
【1083】
この処理フローにより、子どもが安全にデジタルコンテンツを利用できる環境が提供されるとともに、ユーザの感情に応じたパーソナライズされたコンテンツ体験が可能となる。
【1084】
(実施例2)
【1085】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【1086】
インターネット上には、特定のユーザグループにとって不適切または有害と考えられるコンテンツが数多く存在する。特に、子どもや感受性の高い個人がアクセスする可能性のあるウェブサイトでは、不適切な言葉や画像によって悪影響を及ぼすリスクがある。また、ユーザの感情状態に応じてコンテンツを適切に調整する必要性が高まっている。この課題に対処するためには、ユーザが閲覧するコンテンツをリアルタイムで分析し、不適切なコンテンツを適切なものに自動的に差し替えるとともに、ユーザの感情状態を考慮したコンテンツの提供が求められる。
【1087】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1088】
この発明では、サーバは、インターネット上のコンテンツをリアルタイムに受け取る手段と、受け取ったコンテンツが特定のユーザグループに対して不適切な表現や視覚的要素であるかを判断する人工知能手段と、不適切な表現や視覚的要素を特定のユーザグループに伝えることが可能な表現や視覚的要素に差し替える手段と、ユーザの感情状態を評価し、この評価に基づいて表現や視覚的要素の差し替え方を調整する感情エンジン手段を含む。これにより、不適切なコンテンツを自動的に適切なものに差し替えることが可能となり、さらにユーザの感情状態に応じた適切なコンテンツの提供が可能となる。
【1089】
「インターネット上のコンテンツ」とは、ウェブサイト、オンラインプラットフォーム、ソーシャルメディア等、インターネットを介してアクセス可能なすべてのテキスト、画像、動画、およびその他のメディア形式の情報。
【1090】
「リアルタイムに受け取る手段」とは、ユーザがウェブページを閲覧しているその瞬間に、そのページのコンテンツを捕捉し、分析のために取り込むプロセスまたは技術。
【1091】
「特定のユーザグループ」とは、年齢、性別、職業、文化的背景など、特定の属性を共有するユーザの集合であり、システムがそのニーズや制約を考慮してサービスを提供する対象。
【1092】
「不適切な表現や視覚的要素」とは、暴力的、性的、攻撃的、またはその他の方法で特定のユーザグループ、特に子どもや感受性の高い個人にとって不適切または有害と考えられる言葉や画像。
【1093】
「人工知能手段」とは、機械学習、深層学習、自然言語処理、画像認識などの技術を用いて、データを解析し、学習し、特定のタスクを自動で実行するソフトウェアまたはシステム。
【1094】
「インターネットブラウザの拡張機能」とは、ウェブブラウザに追加されるソフトウェアコンポーネントで、ブラウザの機能を拡張し、ユーザ体験を向上させるもの。
【1095】
「感情エンジン手段」とは、ユーザの行動、テキスト入力、声のトーン、表情などからユーザの感情状態を推定し、その情報を基にシステムの応答を調整する技術やアルゴリズム。
【1096】
本発明を実施するための形態は、インターネット上のコンテンツをユーザにとってより適切なものに変換するシステムに関する。このシステムは、特にインターネットブラウザの拡張機能として実装される人工知能手段、感情エンジン手段、およびこれらを支えるハードウェアおよびソフトウェアの組み合わせで構成される。
【1097】
このシステムは、端末(パーソナルコンピュータ、スマートフォン、タブレット等)にインストールされたインターネットブラウザの拡張機能として動作する。この拡張機能は、JavaScriptやその他のウェブ技術を用いて開発され、ユーザが閲覧するウェブページからテキストや画像などのコンテンツをリアルタイムで受け取る機能を持つ。受け取ったコンテンツは、HTTPSリクエストを介してサーバ上の人工知能手段に送信される。この人工知能手段は、機械学習や自然言語処理、画像認識技術を駆使してコンテンツを分析し、その内容が特定のユーザグループにとって不適切であるかを判断する。
【1098】
不適切なコンテンツが検出された場合、人工知能手段は、テキストをより適切な表現に置き換えたり、画像を問題ないものに差し替えたりする。例えば、攻撃的な言葉は穏やかな言い回しに、暴力的な画像は風景画や動物の画像に置き換えられる。この差し替えたコンテンツは再び端末に送信され、ブラウザの拡張機能がウェブページの表示を更新する。
【1099】
さらに、このシステムには感情エンジン手段が組み込まれており、ユーザの行動や入力から感情状態を推測し、その情報を人工知能手段に提供する。これにより、ユーザが怒っているなどの感情状態に基づいて、より穏やかなコンテンツに差し替えることができる。この感情エンジンは、機械学習アルゴリズムを用いてユーザの感情を評価し、その結果を人工知能手段の処理に反映させる。
【1100】
具体例としては、「このテキストに含まれる不適切な表現を子どもが理解しやすい言葉に置き換えてください」や「この画像を子どもが見ても問題ない内容に差し替えてください」というプロンプト文が人工知能手段に送信され、この要求に基づいてコンテンツの分析および変換が行われる。
【1101】
【1102】
ステップ1:コンテンツの受信
【1103】
端末上で動作するブラウザの拡張機能が、ユーザが閲覧しているウェブページからテキストや画像などのコンテンツを受信する。この段階では、ウェブページのDOMを解析し、テキストと画像のデータが抽出される。入力はウェブページのHTMLコンテンツであり、出力は抽出されたテキストと画像データである。
【1104】
ステップ2:コンテンツの分析要求
【1105】
抽出されたコンテンツは、HTTPSリクエストを介してサーバに送信される。サーバ上の人工知能手段がこのコンテンツを受け取り、分析を開始する。入力は抽出されたテキストと画像データであり、出力は分析結果(コンテンツが不適切かどうかの判断)である。
【1106】
ステップ3:コンテンツの分析
【1107】
人工知能手段は、テキストと画像に含まれる内容を分析し、その不適切性を評価する。この過程で、テキストは自然言語処理技術を、画像は画像認識技術を用いて処理される。入力はテキストと画像データであり、出力はそれぞれの不適切性評価結果である。
【1108】
ステップ4:感情エンジンによる調整
【1109】
端末またはサーバ上で動作する感情エンジンが、ユーザの感情状態を評価し、その情報を人工知能手段に提供する。この情報は、コンテンツの差し替え方を調整するために使用される。入力はユーザの行動や入力データであり、出力はユーザの感情状態の評価結果である。
【1110】
ステップ5:差し替えコンテンツの生成
【1111】
不適切なコンテンツが検出された場合、人工知能手段は適切な言葉や画像に差し替えるための新しいコンテンツを生成する。このプロセスでは、不適切なテキストは適切な言葉に、不適切な画像は適切な画像に変換される。入力は不適切性評価結果とユーザの感情状態、出力は差し替えられた新しいテキストと画像である。
【1112】
ステップ6:コンテンツの表示更新
【1113】
サーバから差し替えられたコンテンツが端末に送信され、ブラウザの拡張機能を通じてウェブページの表示が更新される。このステップで、ユーザには最終的に適切なコンテンツのみが表示される。入力は差し替えられた新しいテキストと画像データ、出力は更新されたウェブページの表示である。
【1114】
(応用例2)
【1115】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【1116】
インターネット上には、特定の利用者群にとって不適切と考えられるコンテンツが存在する。これらのコンテンツは、特に若年層の利用者にとって、精神的な不快感や誤解を招く可能性がある。また、利用者の現在の感情状態によっては、通常ならば無害と考えられるコンテンツであっても、感情的なダメージを引き起こすことがある。従来技術では、これらの不適切なコンテンツを効率的にかつ利用者の感情状態を考慮してフィルタリングすることは困難であった。
【1117】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1118】
この発明では、サーバは、ウェブサイトのコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群にとって不適切であるかを判断する人工知能手段と、不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段と、利用者の感情状態を認識し、その感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段を含む。これにより、特定の利用者群がインターネットを安全に利用できるようにすると同時に、利用者の感情状態に応じた適切なコンテンツの提供が可能となる。
【1119】
「利用者」とは、インターネットを利用する個人または特定のグループを指す。
【1120】
「ウェブサイトのコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【1121】
「人工知能手段」とは、機械学習、深層学習、自然言語処理などの技術を用いて、データを分析し、判断を行うシステムやプログラムを指す。
【1122】
「特定の利用者群に対して不適切な言い回しや画像」とは、年齢、性別、文化的背景などに基づき、そのグループにとって不快、不適切、または有害と判断されるコンテンツを指す。
【1123】
「不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段」とは、不適切なコンテンツを、該当する利用者群が安全に閲覧可能な形に自動的に変更する技術や方法を指す。
【1124】
「利用者の感情状態を認識する手段」とは、利用者の表情、声のトーン、文脈などからその時点での感情状態を検出し、解析する技術やシステムを指す。
【1125】
「感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段」とは、利用者の現在の感情を考慮し、コンテンツの差し替え方法を最適化することで、よりポジティブなユーザー体験を提供する技術やプロセスを指す。
【1126】
「ウェブブラウザの拡張機能」とは、インターネットブラウザの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアまたはプログラムを指す。
【1127】
この発明を実施するための形態では、利用者が安全にインターネットを利用できるようにするシステムを提供する。このシステムは、特に利用者の感情状態を考慮しながら、ウェブサイトのコンテンツをフィルタリングし、必要に応じて適切なコンテンツに差し替える機能を持つ。このシステムは、主にウェブブラウザの拡張機能として実装される人工知能手段、利用者の感情状態を認識する感情認識手段、および不適切なコンテンツを差し替える手段から構成される。
【1128】
サーバは、深層学習、自然言語処理、画像認識技術を用いた人工知能モデルを実行する。この人工知能モデルは、受け取ったウェブサイトのコンテンツを解析し、そのコンテンツが特定の利用者群にとって不適切であるかどうかを判断する。不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える。
【1129】
端末は、カメラやマイクロフォンを用いて利用者の感情状態をリアルタイムで検出し、この情報をサーバに送信する。サーバはこの感情データを分析し、利用者が現在抱いている感情を考慮してコンテンツの差し替え方を調整する。このプロセスにより、利用者の感情を和らげるようなより穏やかなコンテンツへの差し替えが可能となる。
【1130】
使用するハードウェアは、カメラ、マイクロフォン、およびインターネットに接続されたコンピュータやスマートデバイスである。ソフトウェアは、TensorFlowやPyTorchといった深層学習フレームワークを使用して開発される人工知能モデル、およびウェブブラウザの拡張機能として機能するプログラムである。
【1131】
具体例として、プロンプト文「10歳の子どもに適切な言葉を使用して説明してください」という指示が人工知能モデルに送信される場合がある。このプロンプトは、特定のコンテンツが子どもにとって不適切である場合に、そのコンテンツを子どもが理解しやすい形に差し替えるよう人工知能モデルに指示するために使用される。このような機能により、インターネットの安全な利用環境が提供される。
【1132】
【1133】
ステップ1:利用者がウェブブラウザを通じてウェブサイトにアクセスする。この時、ブラウザの拡張機能がアクセスしたウェブサイトのコンテンツを受け取る。入力はウェブサイトのURLまたはコンテンツであり、出力はウェブサイトから受け取ったコンテンツのデータである。このプロセスでは、ウェブブラウザのAPIを使用して、ウェブサイトのコンテンツを取得する動作が行われる。
【1134】
ステップ2:取得したコンテンツをサーバに送信し、人工知能手段を用いてコンテンツが特定の利用者群にとって不適切であるかを判断する。入力はウェブサイトのコンテンツであり、出力は不適切なコンテンツの有無と、その詳細(テキストまたは画像)である。このステップでは、テキスト解析や画像認識の技術を用いて、コンテンツ内の不適切な言い回しや画像を特定する動作が行われる。
【1135】
ステップ3:端末は利用者の感情状態をカメラやマイクロフォンを通じて検出し、この情報をサーバに送信する。入力は利用者の表情や声のトーンであり、出力は利用者の感情状態(例:怒り、喜び)である。このステップでは、表情認識や音声解析技術を用いて、利用者の感情を判定する動作が行われる。
【1136】
ステップ4:サーバは受け取った感情データを分析し、その感情状態に基づいて、不適切なコンテンツの差し替え方を調整する。入力は利用者の感情状態であり、出力は差し替えられるコンテンツの種類(より穏やかな言葉や画像)である。このステップでは、利用者の感情に最も適したコンテンツを選択し、不適切なコンテンツを適切なものに差し替える動作が行われる。
【1137】
ステップ5:最終的にサーバは、差し替えられたコンテンツをウェブブラウザの拡張機能を通じて利用者の端末に送信する。入力は差し替えられるべきコンテンツの指示であり、出力は実際に差し替えられたウェブサイトのコンテンツである。このプロセスでは、ウェブブラウザのAPIを介して、差し替え後のコンテンツをウェブページ上に表示する動作が行われる。
【1138】
(実施例3)
【1139】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【1140】
デジタルコンテンツの中には、特定のユーザーグループ、特に子どもや敏感な内容に対して保護を必要とするユーザーにとって不適切な言い回しや画像が含まれている場合がある。これらのコンテンツは、見る者に悪影響を及ぼす可能性がある。また、ユーザーの感情状態に合わせてコンテンツを提供する既存のシステムは少なく、ユーザー体験を向上させるためのパーソナライゼーションが不足している。これらの問題に対処するための効果的な解決策が求められている。
【1141】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1142】
この発明では、サーバは、デジタルコンテンツを受け取る手段と、受け取ったコンテンツが特定のユーザーグループに対して不適切な言い回しや画像であるかを判断する人工知能手段と、不適切な言い回しや画像を適切な言い回しや画像に自動的に差し替える手段と、ユーザーの感情状態を検出する手段と、検出された感情状態に基づいてコンテンツの表示を調整する手段と、を含む。これにより、不適切なコンテンツを適切なものに自動で差し替えることが可能となり、また、ユーザーの感情状態に基づいたコンテンツのパーソナライゼーションを実現することが可能となる。
【1143】
「デジタルコンテンツ」とは、インターネット上で共有、配布、またはアクセス可能なテキスト、画像、動画、音声などの電子的形式の情報やメディアを指す。
【1144】
「特定のユーザーグループ」とは、年齢、性別、文化的背景など特定の属性や条件に基づいて区別されるユーザーの集団を指す。
【1145】
「不適切な言い回しや画像」とは、特定のユーザーグループにとって不快、攻撃的、または有害とみなされる可能性のある言葉遣いや視覚的表現を指す。
【1146】
「人工知能手段」とは、学習、推論、認識、言語理解などの人間の知能を模倣することを目的としたコンピュータープログラムやテクノロジーの総称を指す。
【1147】
「自動的に差し替える手段」とは、人の介入なしに、プログラムやシステムが自律的に行動や処理を実行する方法や機能を指す。
【1148】
「ユーザーの感情状態」とは、個人がその時点で経験している感情や気分のことで、喜び、悲しみ、怒り、驚きなど多岐にわたる。
【1149】
「検出する手段」とは、特定の情報や状態を識別し、その存在を確認するために用いられる技術や方法を指す。
【1150】
「コンテンツの表示を調整する手段」とは、ユーザーに提供される情報やメディアの形式、順序、または内容を変更するプロセスや機能を指す。
【1151】
この発明を実施するための形態は、コンテンツの安全性とユーザー体験の向上を中心に展開される。主に使用されるハードウェアは、サーバー、端末(スマートフォン、タブレット、パソコン等)、および感情検出装置(端末内蔵のカメラやマイクロフォン)である。ソフトウェア面では、画像認識技術、自然言語処理技術、感情分析技術、および生成AIモデルが核となる。
【1152】
サーバは、高性能なプロセッシング能力を持つコンピューターであり、クラウド上または物理的なデータセンター内に配置される。このサーバには、特定の生成AIモデルがインストールされており、不適切なコンテンツの識別と差し替え、ユーザーの感情に基づくコンテンツの調整を行う。具体的なソフトウェアとしては、OpenAIが提供する画像認識技術やGPT系の生成AIモデルが使用される。
【1153】
端末は、ユーザーがコンテンツをアップロードし、サーバから送信された結果を受け取るインターフェースとして機能する。また、端末内蔵のカメラやマイクロフォンを通じてユーザーの感情状態を検出し、そのデータをサーバに送信する。
【1154】
具体例として、ユーザーが暴力的な画像をアップロードした場合、「画像内の不適切な要素を識別し、適切な風景画像に差し替えてください。また、ユーザーの現在の感情が喜びである場合は、ポジティブなニュース記事や画像を優先的に表示するように調整してください。」というプロンプト文が生成AIモデルによって処理される。サーバはこのプロンプトに基づき、暴力的な画像を風景画に差し替え、ユーザーの感情が喜びであることを考慮して、適切なコンテンツを選択し、端末に送信する。
【1155】
この形態により、ユーザーは安全で個人の感情に応じたコンテンツ体験を享受できるようになる。
【1156】
【1157】
ステップ1:
【1158】
ユーザがデジタルコンテンツを端末を通じてサーバにアップロードする。この時、入力はユーザから提供された画像やテキストであり、サーバはこのデジタルコンテンツを受け取る動作を行う。
【1159】
ステップ2:
【1160】
サーバ上の人工知能手段が、受け取ったデジタルコンテンツに対して内容分析を行う。このプロセスでは、画像認識技術や自然言語処理技術を用いて、コンテンツ内の言い回しや画像が特定のユーザーグループにとって不適切かどうかを判断する。入力はデジタルコンテンツであり、出力は不適切なコンテンツの有無とその内容に関する情報である。
【1161】
ステップ3:
【1162】
不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える手段を実行する。このステップの入力は不適切と判断されたコンテンツであり、出力はユーザーにとって安全な代替コンテンツである。この差し替えプロセスは、あらかじめ準備された安全なコンテンツのデータベースから選択されるか、生成AIモデルを用いて新たに生成される。
【1163】
ステップ4:
【1164】
端末はユーザーの感情状態を検出する機能を持ち、その情報をサーバに送信する。このステップでは、入力としてユーザーの表情や音声が使用され、出力はユーザーの感情状態(喜び、悲しみ等)の分析結果である。
【1165】
ステップ5:
【1166】
サーバは、受け取った感情状態の情報に基づき、コンテンツの表示を調整する。この調整は、ユーザーの感情にマッチするコンテンツを選択し、それを優先的に表示するためのものである。入力はユーザーの感情状態の情報であり、出力は調整されたコンテンツのセットである。
【1167】
このプログラムの処理を実施することで、ユーザーは自分の感情に合わせて最適化されたコンテンツを受け取ることができるようになり、不適切なコンテンツから保護される。
【1168】
(応用例3)
【1169】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ヘッドセット型端末314を「端末」と称する。
【1170】
従来のデジタルコンテンツ提供システムでは、ユーザーの個別の感情状態を考慮せずに一律のコンテンツを提供していた。これにより、ユーザーの現在の感情や必要に応じたコンテンツを適切に提供することが困難であった。特に、ユーザーが求める感情的なサポートや体験をデジタルコンテンツを通じて提供することに限界があった。
【1171】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1172】
この発明では、サーバは、ユーザーの表情をリアルタイムで分析する画像認識手段と、分析結果に基づいてユーザーの感情状態を判断する感情エンジン手段と、ユーザーの感情状態に適したコンテンツを選定し提供するAI手段と、を含む。これにより、ユーザーの現在の感情状態に基づいたパーソナライズされたデジタルコンテンツの提供が可能となる。
【1173】
「デジタルコンテンツ」とは、インターネット上で配信される動画、音楽、文章、画像などの電子的形式で存在するコンテンツのことである。
【1174】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを自動で実行するシステムやプログラムのことである。
【1175】
「ユーザーの感情状態に適したコンテンツに差し替える手段」とは、ユーザーの現在の感情を考慮して、その感情に適合または反応するようなコンテンツに自動で切り替える技術やプロセスのことである。
【1176】
「画像認識手段」とは、カメラ等のデバイスを通じて取得した画像データから特定のパターンや物体を識別し、解析する技術やシステムのことである。
【1177】
「感情エンジン手段」とは、ユーザーの表情、声のトーン、言葉遣いなどから感情状態を推測し、解析する技術やシステムのことである。
【1178】
「コンテンツの選定と表示を優先順位付けするAI手段」とは、ユーザーに最適なコンテンツを選び出し、その表示順をユーザーの好みや状況に合わせて自動で調整する人工知能の機能やプロセスのことである。
【1179】
この発明を実施するための形態は、ユーザーの感情状態に基づいてデジタルコンテンツを動的に選定し、提供するシステムに関連している。このシステムは、主にスマートフォンやタブレットなどの端末にインストールされるアプリケーションとして実装される。端末の内蔵カメラを用いてユーザーの表情をリアルタイムで分析し、画像認識手段を通じて得られたデータを基に感情エンジン手段がユーザーの感情状態を判断する。この判断結果を元に、AI手段がユーザーの現在の感情に最も適したコンテンツを選定し、画面上に表示する。
【1180】
ハードウェアとしては、スマートフォンやタブレットの内蔵カメラとプロセッサが使用される。ソフトウェアとしては、画像認識にOpenCV、機械学習にはTensorFlowなどのライブラリが用いられる。このシステムを通じて、例えばユーザーが悲しんでいる場合には、明るく元気づけるような動画や音楽を提供することが可能となる。逆に、ユーザーがリラックスしている場合には、穏やかな音楽や風景画像を優先的に表示するように調整する。
【1181】
具体的なプログラムの操作手順としては、まずアプリケーションが端末のカメラを起動し、ユーザーの表情をキャプチャする。続いて、画像認識手段を用いて表情から感情を分析し、感情エンジン手段によってユーザーの感情状態が判断される。最後に、この感情状態に基づき、AI手段がコンテンツの選定と表示を行う。このプロセスは、ユーザーがアプリケーションを使用している間、連続的に実行される。
【1182】
プロンプト文の例として、「ユーザーが悲しんでいるときに推薦するべき楽しい動画のリストを生成せよ」や「ユーザーが喜んでいるときにさらに喜びを増幅させる動画のリストを生成せよ」という具体例が挙げられる。これにより、ユーザーの感情に応じたコンテンツを提供することで、ユーザー体験を向上させることが目的である。
【1183】
【1184】
ステップ1:
【1185】
端末が内蔵カメラを起動し、ユーザーの表情をキャプチャする。この段階では、カメラからの映像データが入力として受け取られ、生の画像データとして端末に送信される。
【1186】
ステップ2:
【1187】
画像認識手段がキャプチャされた画像データを分析し、ユーザーの表情から感情を推定する。この処理では、入力として受け取った画像データに対して顔認識アルゴリズムが適用され、ユーザーの表情に基づいた感情のスコア(例:喜び、悲しみ、怒りなど)が出力として生成される。
【1188】
ステップ3:
【1189】
感情エンジン手段が、ステップ2で得られた感情スコアを基にユーザーの感情状態を最終的に判断する。このステップでは、入力として受け取った感情スコアを分析し、最も可能性の高い感情状態を出力として決定する。
【1190】
ステップ4:
【1191】
AI手段が、ステップ3で判断されたユーザーの感情状態に基づいて、適切なデジタルコンテンツを選定する。この過程では、データベース内のコンテンツ情報とユーザーの感情状態が入力として考慮され、感情状態に最適なコンテンツのリストが出力として生成される。
【1192】
ステップ5:
【1193】
選定されたコンテンツが端末の画面上に表示される。この最終ステップでは、ステップ4で生成されたコンテンツリストが入力として受け取られ、それらのコンテンツがユーザーインターフェース上に適切に配置されてユーザーに提示される。
【1194】
これらの処理ステップを通じて、ユーザーは自分の感情状態に適したデジタルコンテンツをリアルタイムで受け取ることができ、よりパーソナライズされたユーザー体験を享受することが可能となる。
【1195】
特定処理部290は、特定処理の結果をヘッドセット型端末314に送信する。ヘッドセット型端末314では、制御部46Aが、スピーカ240及びディスプレイ343に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。
【1196】
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。
【1197】
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。
【1198】
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ヘッドセット型端末314によって特定処理が行われるようにしてもよい。
【1199】
[第4実施形態]
【1200】
図7には、第4実施形態に係るデータ処理システム410の構成の一例が示されている。
【1201】
図7に示すように、データ処理システム410は、データ処理装置12及びロボット414を備えている。データ処理装置12の一例としては、サーバが挙げられる。
【1202】
データ処理装置12は、コンピュータ22、データベース24、及び通信I/F26を備えている。コンピュータ22は、本開示の技術に係る「コンピュータ」の一例である。コンピュータ22は、プロセッサ28、RAM30、及びストレージ32を備えている。プロセッサ28、RAM30、及びストレージ32は、バス34に接続されている。また、データベース24及び通信I/F26も、バス34に接続されている。通信I/F26は、ネットワーク54に接続されている。ネットワーク54の一例としては、WAN(Wide Area Network)及び/又はLAN(Local Area Network)等が挙げられる。
【1203】
ロボット414は、コンピュータ36、マイクロフォン238、スピーカ240、カメラ42、通信I/F44、及び制御対象443を備えている。コンピュータ36は、プロセッサ46、RAM48、及びストレージ50を備えている。プロセッサ46、RAM48、及びストレージ50は、バス52に接続されている。また、マイクロフォン238、スピーカ240、カメラ42、及び制御対象443も、バス52に接続されている。
【1204】
マイクロフォン238は、ユーザ20が発する音声を受け付けることで、ユーザ20から指示等を受け付ける。マイクロフォン238は、ユーザ20が発する音声を捕捉し、捕捉した音声を音声データに変換してプロセッサ46に出力する。スピーカ240は、プロセッサ46からの指示に従って音声を出力する。
【1205】
カメラ42は、レンズ、絞り、及びシャッタ等の光学系と、CMOS(Complementary Metal-Oxide-Semiconductor)イメージセンサ又はCCD(Charge Coupled Device)イメージセンサ等の撮像素子とが搭載された小型デジタルカメラであり、ユーザ20の周囲(例えば、一般的な健常者の視界の広さに相当する画角で規定された撮像範囲)を撮像する。
【1206】
通信I/F44は、ネットワーク54に接続されている。通信I/F44及び26は、ネットワーク54を介してプロセッサ46とプロセッサ28との間の各種情報の授受を司る。通信I/F44及び26を用いたプロセッサ46とプロセッサ28との間の各種情報の授受はセキュアな状態で行われる。
【1207】
制御対象443は、表示装置、目部のLED、並びに、腕、手及び足等を駆動するモータ等を含む。ロボット414の姿勢や仕草は、腕、手及び足等のモータを制御することにより制御される。ロボット414の感情の一部は、これらのモータを制御することにより表現できる。また、ロボット414の目部のLEDの発光状態を制御することによっても、ロボット414の表情を表現できる。
【1208】
図8には、データ処理装置12及びロボット414の要部機能の一例が示されている。
図8に示すように、データ処理装置12では、プロセッサ28によって特定処理が行われる。ストレージ32には、特定処理プログラム56が格納されている。
【1209】
特定処理プログラム56は、本開示の技術に係る「プログラム」の一例である。プロセッサ28は、ストレージ32から特定処理プログラム56を読み出し、読み出した特定処理プログラム56をRAM30上で実行する。特定処理は、プロセッサ28がRAM30上で実行する特定処理プログラム56に従って、特定処理部290として動作することによって実現される。
【1210】
ストレージ32には、データ生成モデル58及び感情特定モデル59が格納されている。データ生成モデル58及び感情特定モデル59は、特定処理部290によって用いられる。
【1211】
ロボット414では、プロセッサ46によって受付出力処理が行われる。ストレージ50には、受付出力プログラム60が格納されている。プロセッサ46は、ストレージ50から受付出力プログラム60を読み出し、読み出した受付出力プログラム60をRAM48上で実行する。受付出力処理は、プロセッサ46がRAM48上で実行する受付出力プログラム60に従って、制御部46Aとして動作することによって実現される。
【1212】
次に、データ処理装置12の特定処理部290による特定処理について説明する。
【1213】
「形態例1」
【1214】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段として、ブラウザのプラグインを用いる。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【1215】
「形態例2」
【1216】
本発明の別の実施形態として、AIはブラウザのプラグインとして実装される。このプラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信する。AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【1217】
「形態例3」
【1218】
本発明のさらなる実施形態として、AIはテキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である。具体的には、AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【1219】
以下に、各形態例の処理の流れについて説明する。
【1220】
「形態例1」
【1221】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【1222】
ステップ2:受け取ったコンテンツはAIに送信される。
【1223】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【1224】
ステップ4:不適切な言い回しや画像は、子どもに伝えられる言い回しや画像に差し替えられる。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【1225】
「形態例2」
【1226】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【1227】
ステップ2:受け取ったコンテンツはAIに送信される。
【1228】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。具体的には、不適切な言葉は、子どもが理解できる適切な言葉に、不適切な画像は、子どもが見ても問題ない画像に差し替えられる。
【1229】
「形態例3」
【1230】
ステップ1:子どもがウェブサイトにアクセスすると、ブラウザのプラグインがウェブサイトのコンテンツをリアルタイムで受け取る。
【1231】
ステップ2:受け取ったコンテンツはAIに送信される。
【1232】
ステップ3:AIは、送信されたコンテンツが子どもに対して不適切な言い回しや画像であるかを判断する。
【1233】
ステップ4:AIは画像認識技術を用いて画像の内容を判断し、不適切な画像を子どもが見ても問題ない画像に差し替える。例えば、暴力的な画像は、風景画像などに差し替えられる。
【1234】
(実施例1)
【1235】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1236】
現代の情報通信ネットワーク上には、特定のユーザグループ、特に子どもたちにとって不適切な表現や視覚情報が多く存在する。これらのコンテンツによって、子どもたちが精神的な不快感を感じたり、不適切な行動を学習したりするリスクがある。従来のフィルタリング技術では、これらの問題を完全に解決することが困難であり、特にリアルタイムでコンテンツを分析し、不適切な内容を適切なものに置き換えることは実現が難しい。
【1237】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1238】
この発明では、サーバは、ユーザがアクセスする情報通信ネットワーク上のコンテンツをリアルタイムで受け取る手段と、受け取ったコンテンツを情報処理システムに送信する手段と、送信されたコンテンツが特定のユーザグループに対して不適切な表現や視覚情報であるかを分析し判断する情報処理システムと、不適切と判断された表現や視覚情報を特定のユーザグループにとって適切な表現や視覚情報に自動的に変換する手段と、を含む。これにより、特定のユーザグループが情報通信ネットワークを利用する際の安全性を高め、不適切なコンテンツからの保護を実現することが可能となる。
【1239】
「情報通信ネットワーク」は、インターネットやその他のデジタル通信手段を通じて情報を交換するシステムの総称である。
【1240】
「コンテンツ」は、ウェブサイト、ビデオ、画像、テキストなど、デジタル形式で表現された情報やエンターテインメントのことである。
【1241】
「リアルタイムで受け取る手段」は、ユーザがアクセスした瞬間にその情報を捕捉し、処理する技術や方法のことである。
【1242】
「情報処理システム」は、受け取ったデータを分析、加工、変換するためのハードウェアおよびソフトウェアの集合体である。
【1243】
「特定のユーザグループ」は、特定の属性、年齢、興味などに基づいて区別されるユーザの集まりである。
【1244】
「不適切な表現や視覚情報」は、そのユーザグループにとって精神的な不快感を与えるか、あるいは不適切な行動や考え方を促す可能性がある言葉や画像などの情報である。
【1245】
「自動的に変換する手段」は、特定の基準やルールに基づいて、不適切な内容を適切な内容に置き換えるプロセスを自動で行う技術や方法である。
【1246】
この発明を実施するための形態においては、主に情報処理システム、ユーザの端末、および拡張機能としてのブラウザプラグインを用いる。情報処理システムは、生成AIモデルを含むサーバ上で構成され、ユーザの端末は、この情報処理システムにリアルタイムでコンテンツを送信するためのブラウザとプラグインを備えている。
【1247】
情報処理システムでは、特にOpenAIのGPT-4や画像処理に特化したDALL・Eといった具体的な生成AIモデルが使用される。これらのモデルは、テキストと画像の両方に対して不適切な内容を識別し、適切な内容に変換する機能を持っている。この処理は、端末から送信されたコンテンツに基づいて自動的に行われる。
【1248】
端末には、ユーザが情報通信ネットワークを閲覧する際に使用するブラウザがインストールされており、このブラウザには発明に基づいたプラグインが追加されている。このプラグインは、ユーザがアクセスするコンテンツを捕捉し、情報処理システムに送信する役割を持っている。送信されたコンテンツは、サーバ上の生成AIモデルによってリアルタイムで分析される。
【1249】
具体例として、ユーザが不適切な表現を含むテキストや画像にアクセスした場合、プラグインはこれらのコンテンツを捕捉し、サーバに送信する。サーバ上の生成AIモデルは、以下のようなプロンプト文を用いてコンテンツを分析する。「このウェブサイトには子どもに不適切な言葉が含まれています。適切な表現に変換してください。」「この画像は子どもに不適切です。子どもが見ても安全な、テーマに合った画像に置き換えてください。」これらのプロンプト文は、テキストや画像を適切なものに変換するための指示として機能する。変換後のコンテンツは再び端末に送り返され、ユーザが見るコンテンツが更新される。
【1250】
この形態により、特定のユーザグループ、特に子どもたちが情報通信ネットワークを安全に利用できるようにすることが目指されている。
【1251】
【1252】
ステップ1:ユーザがブラウザを通じて情報通信ネットワーク上のコンテンツにアクセスする。この際、端末にインストールされたブラウザプラグインが動作を開始し、ユーザが閲覧しているコンテンツを捕捉する。このプラグインは、テキスト、画像、およびその他のメディアファイルを含むすべてのコンテンツのデータをリアルタイムで収集する。入力はユーザがアクセスしたウェブページのコンテンツであり、出力は収集されたコンテンツデータである。
【1253】
ステップ2:捕捉したコンテンツデータは、ブラウザプラグインによってサーバに送信される。サーバ上の情報処理システムは、受信したコンテンツデータを分析するために生成AIモデルを用いる。この処理では、コンテンツが特定のユーザグループにとって不適切な表現や視覚情報を含んでいるかを判断する。入力は端末から送信されたコンテンツデータであり、出力は分析結果(不適切なコンテンツの識別)である。
【1254】
ステップ3:不適切と判断されたコンテンツに対して、サーバ上の生成AIモデルは、適切な表現や視覚情報に自動的に変換する処理を行う。たとえば、不適切な言葉は適切な言葉に、不適切な画像は問題ない画像に置き換えられる。この変換プロセスにおける入力は分析結果で識別された不適切なコンテンツであり、出力は変換後の適切なコンテンツである。
【1255】
ステップ4:変換されたコンテンツは、再び端末に送り返される。端末のブラウザプラグインは、オリジナルのコンテンツを変換後のコンテンツで更新し、ユーザの閲覧中のウェブページに表示する。このステップにおける入力はサーバから送信された変換後のコンテンツであり、出力はユーザが閲覧する更新されたウェブページである。
【1256】
これらの処理ステップを通じて、ユーザは不適切なコンテンツに触れることなく、情報通信ネットワークを安全に利用することが可能となる。各ステップは、特に子どもなどの保護が必要なユーザグループのオンライン安全性を高めることを目的としている。
【1257】
(応用例1)
【1258】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1259】
デジタルコンテンツにおける不適切な言い回しや画像が利用者、特に子どもに与える影響に関する懸念が高まっています。インターネット上では、年齢に不適切なコンテンツに容易にアクセスできる環境があり、これらのコンテンツが心理的、情緒的な影響を与えかねない問題があります。特に、利用者がこれらのコンテンツを遭遇した際に、その場で内容を適切なものに変換し、安全な閲覧体験を提供する技術の需要があります。
【1260】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1261】
この発明では、サーバは、デジタルコンテンツをリアルタイムで取得する手段と、取得したコンテンツの適切性を評価するためにコンテンツを生成AIモデルに送信する手段と、不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する生成AIモデルに基づく手段と、を含む。これにより、不適切なコンテンツをリアルタイムで検出し、自動的に適切な表現に変換することが可能となる。結果として、利用者に対して安全なデジタルコンテンツ閲覧環境を提供することができる。
【1262】
「デジタルコンテンツ」とは、インターネット上で配信されるテキスト、画像、動画などの情報の総称である。
【1263】
「リアルタイムで取得する手段」とは、利用者がアクセスする瞬間にそのコンテンツを取得し、分析するための技術や方法である。
【1264】
「生成AIモデルに送信する手段」とは、取得したコンテンツを人工知能モデルに送り、解析や処理を行わせるための技術や方法である。
【1265】
「不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する」とは、生成AIモデルがコンテンツ内の不適切な言い回しや画像を識別し、それらを年齢や理解度に応じた適切な内容に置き換えるプロセスである。
【1266】
「利用者」とは、デジタルコンテンツを閲覧または利用する個人である。
【1267】
「サーバ」とは、インターネット上でデータやサービスを提供するコンピュータシステムまたはそのソフトウェアを指す。
【1268】
「アプリケーション」とは、特定の目的のためにデザインされたソフトウェアプログラムである。
【1269】
この発明を実施するための形態において、システムは主にサーバ、端末(スマートフォン、タブレット、スマート眼鏡、ヘッドマウントディスプレイなど)、およびユーザ(特に子ども)から構成される。サーバは生成AIモデルをホストしており、端末はインターネット上のデジタルコンテンツにアクセスするためのブラウザや専用アプリケーションを実行する。このシステムは、端末がアクセスしたデジタルコンテンツをリアルタイムで取得し、そのコンテンツをサーバ上の生成AIモデルに送信する機能を有する。生成AIモデルは、送信されたコンテンツの適切性を評価し、不適切な表現が含まれている場合、それをユーザが理解しやすい適切な表現に自動的に変換する。
【1270】
このシステムを実現するためには、JavaScriptやPythonなどのプログラミング言語で記述された端末上で動作するブラウザプラグインやアプリケーション、およびサーバ上で実行されるTensorFlowやOpenAIのGPT、DALL-Eなどの生成AIモデルが使用される。これらのソフトウェアは、ハードウェア上で実行され、デジタルコンテンツの取得、解析、変換のプロセスを効率的に行う。
【1271】
具体例として、子どもが暴力的な画像を含むニュースサイトにアクセスした場合、システムはその画像をリアルタイムで取得し、サーバに送信する。生成AIモデルは、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」というプロンプト文に基づいて処理を行い、暴力的な要素を含まない代替画像を生成し、その画像を元のコンテンツの場所に表示する。このプロセスにより、ユーザは安全なデジタルコンテンツ閲覧環境を享受できる。
【1272】
【1273】
ステップ1:端末がデジタルコンテンツにアクセスする
【1274】
ユーザが端末を用いてインターネット上の特定のウェブサイトにアクセスする。この時、端末上で動作するブラウザプラグインまたはアプリケーションがデジタルコンテンツ(テキスト、画像、動画など)をリアルタイムで取得する。入力としてはユーザのアクセスしたウェブサイトのURLやそのページのHTMLコードがあり、出力としてはそのページのコンテンツデータが得られる。
【1275】
ステップ2:コンテンツの適切性を評価するためにサーバに送信する
【1276】
取得したデジタルコンテンツは、評価のためにサーバ上の生成AIモデルに送信される。このプロセスでは、入力として取得したデジタルコンテンツがあり、出力としてはそのコンテンツが生成AIモデルによって受け取られる。
【1277】
ステップ3:生成AIモデルがコンテンツを分析し、不適切な内容を識別する
【1278】
サーバ上の生成AIモデルは、送信されたコンテンツを分析し、不適切な言い回しや画像を識別する。入力としてはステップ2で送信されたコンテンツがあり、出力としては不適切な内容のリストや識別情報が得られる。このステップでは、特定のキーワードや画像認識技術を用いて不適切な内容を検出するデータ加工又はデータ演算が行われる。
【1279】
ステップ4:不適切な内容を適切な内容に変換する
【1280】
識別された不適切な内容は、子どもが理解しやすい適切な言い回しや画像に自動的に変換される。この処理には、生成AIモデルが使用され、入力としてはステップ3で識別された不適切な内容があり、出力としては変換後の適切なコンテンツが得られる。生成AIモデルは、不適切な内容を受け取り、「この画像を子どもが見ても安全で理解しやすい画像に変換してください」といったプロンプト文に基づいて、適切な内容へと変換するデータ演算を行う。
【1281】
ステップ5:変換後のコンテンツを端末に送信し、表示する
【1282】
最後に、サーバは変換後の適切なコンテンツを端末に送信し、ユーザがアクセスしたウェブページ上でその内容が表示されるようにする。入力としてはステップ4で生成された適切なコンテンツがあり、出力としてはユーザの端末上でそのコンテンツが表示される。このステップでは、サーバから端末へのデータ送信と、端末上でのデータ表示処理が行われる。
【1283】
(実施例2)
【1284】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1285】
インターネット上には子どもがアクセスすべきではない不適切な内容が数多く存在している。保護者が常に監視することは現実的ではなく、既存のフィルタリング技術でも完全にはブロックできない場合がある。特に、テキストと画像の両方を含むコンテンツの場合、これらをリアルタイムで適切に評価し、子どもに安全な内容に自動で変換する技術は未だ不足している。
【1286】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1287】
この発明では、サーバは、ウェブコンテンツをリアルタイムで捕捉し安全な通信経路を通じて送信する手段と、送信されたコンテンツを自然言語および画像解析技術を備えた生成AIモデルによって評価する手段と、不適切な表現または画像を検出した場合、これらを利用者の理解に適した表現や問題ない画像に自動で差し替える手段と、を含む。これにより、子どもがインターネットを利用する際の安全性を大幅に向上させることが可能となる。
【1288】
「利用者」とは、情報端末を通じてウェブコンテンツにアクセスする個人または集団を指す。
【1289】
「情報端末」とは、インターネットに接続し、ウェブサイトを閲覧することが可能なデバイス(パソコン、スマートフォン、タブレット等)を指す。
【1290】
「ウェブコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【1291】
「リアルタイムで捕捉する」とは、利用者がウェブコンテンツを閲覧しているその瞬間に、その内容を即座に検出・取得することを指す。
【1292】
「安全な通信経路」とは、データの送受信において第三者による傍受や改ざんを防ぐために暗号化などのセキュリティ技術を用いた通信手段を指す。
【1293】
「解析サーバ」とは、送信されたウェブコンテンツを解析・処理するためのコンピュータシステムを指す。
【1294】
「生成AIモデル」とは、入力されたデータに基づいて新たなテキストや画像を生成する能力を持つ人工知能モデルを指す。
【1295】
「自然言語および画像解析技術」とは、テキストデータを理解・解析するための技術および画像の内容を識別・分析する技術を指す。
【1296】
「不適切な表現または画像」とは、年齢や社会的規範に照らして、特定の利用者群(特に子ども)にとって見るべきでない、または理解するのが難しいと判断されるコンテンツを指す。
【1297】
「問題ない画像」とは、特定の利用者群(特に子ども)が閲覧しても安全と判断される内容の画像を指す。
【1298】
「プラグイン形式」とは、既存のソフトウェア(この場合はブラウザ)に追加して機能を拡張するためのソフトウェアモジュールのことを指す。
【1299】
この発明を実施するための形態においては、主に情報端末と解析サーバ、およびその間の通信プロトコルが関与する。情報端末には、ウェブブラウザがインストールされており、このブラウザには、ウェブコンテンツをリアルタイムで捕捉し、安全な通信経路を介して解析サーバに送信する機能を持つプラグインが組み込まれている。このプラグインは、JavaScriptやその他のウェブ技術を使用して開発される。
【1300】
解析サーバは、高性能なコンピュータシステム上に構築され、生成AIモデルを含むソフトウェアがインストールされている。このサーバは、情報端末から送信されたウェブコンテンツを受け取り、自然言語処理技術と画像解析技術を用いて内容を解析する。不適切な表現または画像が検出された場合、AIモデルはそれらを適切な内容に自動的に差し替える。このプロセスには、TensorFlowやPyTorchといった深層学習フレームワークが使用される。差し替えられたコンテンツは再び情報端末に送り返され、プラグインを通じてユーザに表示される。
【1301】
例として、ウェブページ上に「この映画は大人向けの暴力シーンが含まれています」というテキストと、そのシーンのスクリーンショットが含まれている場合を考える。プラグインはこのテキストと画像を捕捉し、解析サーバに送信する。サーバ上のAIモデルはテキストを「この映画には怖い場面があるので、大人と一緒に見てね」といった子どもに優しい言葉に、画像を映画のロゴなどの問題のない画像に差し替える。これらの変換プロセスは、自然言語処理と画像認識技術に基づいており、子どもが安全にインターネットを利用できるようにすることが目的だ。
【1302】
この発明により、情報端末と解析サーバ間でセキュアな通信を行いながら、リアルタイムでウェブコンテンツをフィルタリングし、子どもにとって安全な形に変換することが可能となる。これにより、保護者は子どもがインターネットを使用する際の安全性を高めることができる。
【1303】
【1304】
ステップ1:ウェブコンテンツの捕捉
【1305】
情報端末上で動作するブラウザのプラグインが、ユーザが閲覧しているウェブページのコンテンツ(テキストおよび画像)をリアルタイムで捕捉する。このステップの入力は、ユーザが閲覧しているウェブページの内容であり、出力は、解析のためにサーバへ送信するデータ形式に加工されたコンテンツデータである。プラグインは、DOM解析を行い、ページ内の全てのテキストと画像のデータを抽出する。
【1306】
ステップ2:コンテンツの送信
【1307】
捕捉されたコンテンツは、情報端末から解析サーバへ安全な通信経路を通じて送信される。このステップの入力は、ステップ1で加工されたコンテンツデータであり、出力は、解析サーバに到達したコンテンツデータである。送信にはHTTPSプロトコルが使用され、データの機密性と完全性が保証される。
【1308】
ステップ3:コンテンツの解析と評価
【1309】
解析サーバ上の生成AIモデルが、送信されたコンテンツを自然言語処理技術と画像解析技術を用いて解析し、評価する。このステップの入力は、ステップ2で受け取ったコンテンツデータであり、出力は、不適切な表現または画像が検出された場合にそれらを適切な内容に差し替えた後のコンテンツデータである。AIモデルは、不適切な内容を識別し、適切な代替テキストや画像に自動で置換する。
【1310】
ステップ4:差し替えたコンテンツの返送
【1311】
差し替えられたコンテンツは、解析サーバから情報端末に返送される。このステップの入力は、ステップ3で生成された差し替え後のコンテンツデータであり、出力は、情報端末のブラウザプラグインによってユーザに表示される準備が整ったコンテンツである。返送にもHTTPSプロトコルが使用され、データの安全性が維持される。
【1312】
ステップ5:コンテンツの表示
【1313】
情報端末のブラウザプラグインが、返送されたコンテンツをユーザのブラウザ上に表示する。このステップの入力は、ステップ4で返送されたコンテンツデータであり、出力は、ユーザが閲覧するウェブページ上にレンダリングされた適切なコンテンツである。プラグインは、差し替えられたテキストと画像を元の位置に適切に埋め込み、ユーザに安全な閲覧環境を提供する。
【1314】
(応用例2)
【1315】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1316】
インターネット上には、特定の利用者群にとって不適切と考えられる言語表現や視覚表現が数多く存在します。特に、子供たちが自由にアクセスできる環境では、彼らに有害な内容に触れるリスクがあります。これまでの技術では、不適切な内容を効率的にフィルタリングし、かつそれを利用者の理解レベルに適した形で自動的に置き換えることが困難であるという問題がありました。この課題を解決することで、特定の利用者群、特に子供たちが安全に情報を得られるインターネット環境を提供することが求められています。
【1317】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1318】
この発明では、サーバは、利用者がアクセスする情報配信媒体のコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群に対して不適切な言語表現や視覚表現であるかを判断する人工知能手段と、不適切な言語表現や視覚表現を特定の利用者群に伝えられる適切な言語表現や視覚表現に差し替える手段と、を含む。これにより、特定の利用者群、特に子供たちがインターネットを使用する際に、不適切な内容に触れることなく、また、その理解レベルに合った形で情報を得られる環境が可能となる。
【1319】
「情報配信媒体」とは、インターネット上でコンテンツを公開し、一般の利用者がアクセス可能なウェブサイトやアプリケーションを指す。
【1320】
「コンテンツ」とは、テキスト、画像、動画、音声などの情報や表現物で、情報配信媒体を通じて提供されるものを指す。
【1321】
「特定の利用者群」とは、年齢、性別、文化的背景などによって定義される、特定の特性を持つ利用者の集団を指す。
【1322】
「不適切な言語表現や視覚表現」とは、特定の利用者群が接するには不適当と考えられる、攻撃的、性的、暴力的、またはその他の利用者にとって不快感を与える可能性のある言葉や画像を指す。
【1323】
「人工知能手段」とは、機械学習や自然言語処理、画像認識などの技術を用いて、コンテンツの内容を分析し、判断を下すシステムやプロセスを指す。
【1324】
「情報配信媒体の利用者インターフェース拡張機能」とは、ウェブブラウザやアプリケーションの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアコンポーネントを指す。
【1325】
「適切な言語表現や視覚表現に差し替える手段」とは、特定の利用者群にとって受け入れられる、教育的価値がある、または中立的な内容の言語表現や視覚表現に、不適切なコンテンツを置き換えるプロセスやアルゴリズムを指す。
【1326】
この発明を実施するための形態では、サーバは人工知能を含むプログラムを実行し、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取り、分析する。このプログラムは、特定の利用者群に不適切と判断される言語表現や視覚表現を検出し、これらを適切な表現に自動で差し替える機能を持つ。このプロセスには、自然言語処理技術や画像認識技術が用いられる。使用するハードウェアは、高性能のサーバとストレージシステムであり、ソフトウェアにはTensorFlowやPyTorchのような機械学習ライブラリが含まれる。
【1327】
端末側では、情報配信媒体の利用者インターフェース拡張機能として実装されたプログラムが動作し、サーバから受信した加工済みコンテンツを表示する。この拡張機能は、JavaScriptやその他のウェブ技術を使用して開発され、特定の利用者群にとって適切なコンテンツのみを表示するように設計されている。
【1328】
ユーザは、このシステムを通じて安全なコンテンツ閲覧体験を得ることができる。たとえば、子供がウェブサイトを利用する際に、不適切な言葉が「おっちょこちょい」などの理解しやすい同義語に、また不適切な画像が教育的なイラストや風景画像に差し替えられる。このような処理により、特定の利用者群がインターネットを安全に使用できる環境が提供される。プロンプト文の例としては、「このテキストを5歳の子供が理解できる言葉に変換してください」や「この画像を子供が見ても安全な内容の画像に置き換えてください」といった指示が用いられる。
【1329】
【1330】
ステップ1:コンテンツの受信と前処理
【1331】
サーバは、利用者がアクセスする情報配信媒体から送信されるコンテンツを受け取る。この時、HTML、CSS、JavaScriptなどの形式で構成されたウェブページのデータが入力となる。サーバはこれらのデータを解析し、テキストと画像に分離する。このプロセスにより、テキストデータと画像データが抽出され、次の処理ステップへの入力として準備される。
【1332】
ステップ2:不適切なコンテンツの検出
【1333】
抽出されたテキストデータは、自然言語処理技術を用いて分析され、不適切な言語表現が検出される。同時に、画像データに対しては画像認識技術が適用され、不適切な視覚表現が検出される。この処理には、機械学習ライブラリを活用した生成AIモデルが使用され、テキストと画像のそれぞれに対して適切性の評価が行われる。入力としては、ウェブページから抽出されたテキストと画像があり、出力としては、不適切と判定されたコンテンツのリストが得られる。
【1334】
ステップ3:コンテンツの差し替え
【1335】
不適切と判定されたテキストや画像は、特定の利用者群に適切な言語表現や視覚表現に自動で差し替えられる。この際、生成AIモデルは、不適切なコンテンツを適切なコンテンツに変換するためのプロンプト文に基づいて動作する。たとえば、「このテキストを5歳の子供が理解できる言葉に変換してください」というプロンプトに基づき、テキストの置き換えが行われる。画像についても、「この画像を子供が見ても安全な内容の画像に置き換えてください」というプロンプトに従って、適切な画像に差し替えられる。入力としては不適切なコンテンツがあり、出力としてはそれが適切な表現に置き換えられたコンテンツとなる。
【1336】
ステップ4:加工済みコンテンツの送信
【1337】
差し替えられたコンテンツは、情報配信媒体の利用者インターフェース拡張機能を通じて利用者の端末に送信される。サーバは、加工済みのテキストと画像を含むウェブページのデータを生成し、これを端末に向けて送信する。端末は受信したデータをブラウザ上でレンダリングし、利用者に表示する。このプロセスにより、利用者は不適切なコンテンツが除去され、安全なコンテンツのみが含まれるウェブページを閲覧できるようになる。
【1338】
(実施例3)
【1339】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1340】
デジタルコンテンツが普及する現代社会において、特定のユーザグループ、特に子供たちが不適切な内容に触れるリスクが高まっている。インターネット上では、暴力的、性的、またはその他の有害なコンテンツが容易にアクセス可能となっており、これらのコンテンツが特定のユーザグループの健全な成長や精神的安全を脅かしている。したがって、デジタルコンテンツを介した不適切な情報の流通を効果的に制限し、特定のユーザグループが安全な環境でデジタルコンテンツを利用できるようにすることが急務である。
【1341】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1342】
この発明では、サーバは、デジタルデータをアップロードする手段と、アップロードされたデジタルデータが特定のユーザグループに対して不適切な内容を含むかを判断するAI手段と、不適切な内容を含むデジタルデータを特定のユーザグループに適切な内容に差し替える手段と、を含む。これにより、特定のユーザグループがインターネット上の不適切なコンテンツに触れることなく、安全かつ健全なデジタル環境で情報を得ることが可能となる。サーバ上で動作するAIは、テキストと画像の両方に対して不適切な内容を自動的に識別し、適切なコンテンツに差し替えることにより、特定のユーザグループのデジタルコンテンツの安全性と適切性を保障する。
【1343】
「デジタルデータ」とは、画像、テキスト、音声、ビデオなど、デジタル形式で表現された情報の総称である。
【1344】
「アップロードする手段」とは、ユーザがデジタルデータをインターネット経由でサーバやクラウド上に送信する行為やそのための技術、プロセスを指す。
【1345】
「AI手段」とは、人工知能技術を活用して特定のタスクを自動で実行するための方法やシステムを指し、この場合は不適切なコンテンツの識別と差し替えを行う機能を含む。
【1346】
「不適切な内容」とは、特定のユーザグループ、特に子供たちにとって有害と考えられる性的、暴力的、またはその他の不快感を与える可能性がある情報や画像を指す。
【1347】
「特定のユーザグループ」とは、特定の年齢層、興味、感受性などの共通の特徴を持つユーザの集団を指し、本発明では主に子供たちを想定している。
【1348】
「ウェブサービスまたはアプリケーション」とは、インターネットを介して提供されるサービスやプログラムで、ユーザが特定の機能や情報にアクセスできるようにするものを指す。
【1349】
「適切な内容に差し替える手段」とは、不適切なデジタルデータを分析し、その内容を特定のユーザグループにとって適切かつ有害でない情報や画像に置き換えるプロセスや技術を指す。
【1350】
この発明を実施するための形態は、主にデジタルデータのアップロード、そのデータの適切性の評価、及び不適切なデータの差し替えを含むシステムの運用に関するものである。このシステムは、サーバ、端末、及びユーザの三者によって構成される。
【1351】
サーバは、高性能なコンピュータシステムであり、人工知能(AI)を活用したデータ分析機能を搭載している。このサーバ上で動作するAIは、特定のライブラリやフレームワーク(例:TensorFlow, PyTorch)を使用して、アップロードされた画像やテキストの内容を評価する。AIの分析能力には、画像認識技術や自然言語処理技術が含まれ、これによってデジタルデータ内の不適切な要素を特定する。
【1352】
端末は、インターネットに接続されたデバイスであり、ユーザがデジタルデータをアップロードするためのインターフェイスを提供する。端末は、スマートフォン、タブレット、パーソナルコンピュータ等を含む。
【1353】
ユーザは、このシステムを利用してデジタルコンテンツをアップロードし、閲覧する人々である。ユーザは特定のウェブサイトやアプリケーションを通じてデジタルデータをサーバに送信する。送信されたデータはサーバによって自動的に分析され、不適切なコンテンツがある場合は適切な内容に差し替えられる。
【1354】
具体例として、ユーザがアップロードした画像が暴力的な内容を含む場合、サーバ上で動作するAIはこの画像を不適切であると判断し、代替の安全な画像(例:風景画)に自動的に差し替える。プロンプト文の例としては、「画像内のコンテンツを分析し、不適切な要素が含まれているか判断し、含まれている場合は指定されたカテゴリー(例:自然風景)の安全な画像に自動的に差し替える」というものが挙げられる。
【1355】
この形態により、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。サーバ、端末、及びユーザの相互作用によって、この発明は実施される。
【1356】
【1357】
ステップ1:ユーザは端末を使用してデジタルデータ(画像やテキスト)をシステムにアップロードする。この段階の入力はユーザによって選択されたデジタルデータであり、出力はサーバへ送信されるデータファイルである。端末はユーザが選択したデータを収集し、サーバに送信する処理を行う。
【1358】
ステップ2:サーバはアップロードされたデジタルデータを受信し、AI手段を用いてその内容を分析する。この段階での入力はアップロードされたデータであり、出力はデータ内容の分析結果(不適切な内容が含まれているかどうか)である。サーバ上のAIは、受信したデータを処理し、不適切な要素を特定するためのデータ加工およびデータ演算を行う。
【1359】
ステップ3:AI手段がデータを不適切であると判断した場合、サーバはそのデータを適切な内容に差し替える。この段階の入力は不適切と判断されたデータであり、出力は適切な内容に差し替えられたデータである。サーバは不適切なデータを削除し、予め用意された適切なデータ(例:安全な画像ライブラリからの画像)で置き換える処理を行う。
【1360】
ステップ4:差し替えられたデータは、サーバから端末を通じてユーザに送信される。この段階の入力は差し替え後のデータであり、出力はユーザが閲覧可能な形式で表示されるデータである。サーバは変換されたデータを端末へ送信し、端末はそれをユーザの画面上で表示する処理を行う。
【1361】
この処理流れにより、ユーザは不適切なコンテンツに触れることなく、安全なデジタル環境でコンテンツを享受できるようになる。システムは、不適切なデータを効果的に識別し、適切なコンテンツに自動的に差し替えることができる。
【1362】
(応用例3)
【1363】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1364】
現代のデジタル社会において、特定の年齢層、特に子供たちがインターネットを通じてアクセスするコンテンツには、しばしば不適切な表現や画像が含まれている。これらの不適切なコンテンツにより、子供たちが精神的な損害を受けるリスクがある。従来のフィルタリング技術では、不適切なテキストコンテンツのブロックには一定の効果があるものの、画像に関してはその判断が難しく、また、不適切なコンテンツを適切なものに置き換えることができないという問題があった。この発明は、特定の年齢層がアクセスするデジタルコンテンツにおいて、不適切な表現や画像を自動的に検出し、それを適切な表現や画像に差し替えることにより、安全な閲覧環境を提供することを目的とする。
【1365】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1366】
この発明では、サーバは、情報端末を通じてアクセスされるデジタルコンテンツを受け取る手段と、受け取ったデジタルコンテンツが特定の年齢層に対して不適切な表現や画像であるかを判断するAI手段と、不適切な表現や画像を特定の年齢層に適切な表現や画像に差し替える手段と、を含む。これにより、デジタルコンテンツの安全性を確保し、特定の年齢層が閲覧しても問題ないコンテンツのみを提供することが可能となる。AI手段は、テキストだけでなく画像に対しても不適切な内容を高精度で判断し、差し替えることが可能であるため、従来の技術では対応が困難であった画像コンテンツの問題にも対応できる。
【1367】
「情報端末」とは、インターネットやその他のネットワークに接続してデジタルコンテンツを受け取り、表示するための電子機器である。例えば、スマートフォン、タブレット、パーソナルコンピュータなどが含まれる。
【1368】
「デジタルコンテンツ」とは、テキスト、画像、動画、音声などのデジタル形式で表現された情報コンテンツである。インターネットを介して配信され、情報端末でアクセス・閲覧が可能である。
【1369】
「特定の年齢層」とは、コンテンツの閲覧にあたって特に保護する必要のある年齢範囲を指し、特に子供や青少年などの若年層を示す。
【1370】
「不適切な表現や画像」とは、特定の年齢層にとって見ることが望ましくない、または精神的な損害を与える可能性のあるテキスト、画像、その他のメディアコンテンツである。例えば、暴力的、性的、または差別的な内容がこれに該当する。
【1371】
「AI手段」とは、人工知能技術を活用してデジタルコンテンツの内容を分析し、特定の基準に基づいてコンテンツが適切か不適切かを判断するシステムやプログラムのことである。この手段は、機械学習や画像認識技術を含む。
【1372】
この発明の実施形態では、サーバは特定の年齢層に適切なデジタルコンテンツを提供するために、情報端末を通じてアクセスされるデジタルコンテンツを受け取り、その内容が特定の年齢層にとって不適切であるかをAI手段を用いて判断し、必要に応じて不適切な表現や画像を適切なものに差し替えるシステムである。このシステムは、情報端末にインストールされたアプリケーションとして機能し、端末の利用者がデジタルコンテンツを閲覧する際にリアルタイムでコンテンツの監視と適切な変換を行う。
【1373】
サーバは、人工知能技術を用いて、受け取ったデジタルコンテンツ内のテキストおよび画像に対して不適切な内容を判断する。このAI手段には、画像認識技術や自然言語処理技術が含まれ、これらの技術を活用してコンテンツの安全性を評価する。不適切なコンテンツが検出された場合、AI手段は生成AIモデルを用いて、そのコンテンツを特定の年齢層に適切なものに自動的に差し替える。
【1374】
使用するハードウェアは情報端末であり、これにはスマートフォンやタブレット、パーソナルコンピュータが含まれる。ソフトウェアには、生成AIモデル(例: OpenAIのGPT系列)や画像認識技術(例: Google Cloud Vision API)が活用される。
【1375】
具体例として、ユーザが子供向けの動画配信サービスを利用している状況を考える。動画内に不適切な広告が挿入された場合、AI手段は「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というプロンプト文を用いて生成AIモデルに指示を出し、不適切な広告を風景画像に差し替える。このプロセスは、端末を利用しているユーザが安全なコンテンツのみを閲覧できるようにするためのものである。
【1376】
【1377】
ステップ1:ユーザが情報端末を使用してデジタルコンテンツにアクセスする。この時、入力としてはユーザのアクセス要求があり、出力としては対象のデジタルコンテンツが端末に表示される。端末は、ユーザのアクセス要求に基づき、選択したコンテンツを取得し、画面に表示する。
【1378】
ステップ2:サーバ上のAI手段がデジタルコンテンツを受け取り、内容分析を行う。入力としてはステップ1で取得されたデジタルコンテンツがあり、出力としてはコンテンツの内容に関する分析結果が得られる。この分析結果には、テキストおよび画像内の不適切な内容の有無が含まれる。AI手段は、画像認識技術と自然言語処理技術を用いて、コンテンツ内の不適切な要素を検出する。
【1379】
ステップ3:不適切な内容が検出された場合、AI手段が生成AIモデルを用いて、不適切なコンテンツを適切なものに差し替える。入力としてはステップ2で検出された不適切な内容があり、出力としては差し替え後の適切なコンテンツが得られる。このプロセスでは、不適切な画像やテキストを識別し、「暴力的な内容を含む画像を、子供が見ても安全な風景画像に差し替えてください」というようなプロンプト文に基づき、適切なコンテンツに自動的に変換する。
【1380】
ステップ4:変換されたコンテンツをユーザの情報端末に送信し、表示する。入力としてはステップ3で生成された適切なコンテンツがあり、出力としてはユーザの端末に表示されるコンテンツが更新される。サーバは変換されたコンテンツをユーザに提供し、端末はこのコンテンツを受け取り、ユーザに対して表示する。これにより、ユーザは安全なコンテンツのみを閲覧することができる。
【1381】
なお、更に、ユーザの感情を推定する感情エンジンを組み合わせてもよい。すなわち、特定処理部290は、感情特定モデル59を用いてユーザの感情を推定し、ユーザの感情を用いた特定処理を行うようにしてもよい。
【1382】
「形態例1」
【1383】
本発明の一実施形態として、子どもがアクセスするウェブサイトのコンテンツを受け取る手段、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段、そしてユーザの感情を認識する感情エンジンを含むシステムが提供される。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【1384】
「形態例2」
【1385】
本発明の別の実施形態として、感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整するシステムが提供される。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝え、AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【1386】
「形態例3」
【1387】
本発明のさらに別の実施形態として、感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整するシステムが提供される。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝え、AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【1388】
以下に、各形態例の処理の流れについて説明する。
【1389】
「形態例1」
【1390】
ステップ1:子どもがアクセスするウェブサイトのコンテンツを受け取る。
【1391】
ステップ2:受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかをAIが判断する。
【1392】
ステップ3:不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える。
【1393】
ステップ4:ユーザの感情を感情エンジンで認識する。この感情エンジンは、例えば、ユーザの顔表情や声のトーンから感情を認識する。
【1394】
「形態例2」
【1395】
ステップ1:ユーザの感情を感情エンジンで認識する。
【1396】
ステップ2:感情エンジンがユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整する。例えば、ユーザが怒っていると感じた場合、感情エンジンはその情報をAIに伝える。
【1397】
ステップ3:AIはより穏やかな言葉や画像に差し替えることでユーザの怒りを和らげる。
【1398】
「形態例3」
【1399】
ステップ1:ユーザの感情を感情エンジンで認識する。
【1400】
ステップ2:感情エンジンがユーザの感情に基づいて、コンテンツの表示方法を調整する。例えば、ユーザが喜んでいると感じた場合、感情エンジンはその情報をAIに伝える。ステップ3:AIはユーザが喜びを感じるようなコンテンツを優先的に表示する。
【1401】
(実施例1)
【1402】
次に、形態例1の実施例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1403】
インターネット上のコンテンツは多岐にわたり、特定のユーザグループ、特に子どもたちにとって不適切な内容を含むことがある。これにより、ユーザの感情に悪影響を与えたり、誤解を招いたりする恐れがある。また、ユーザの反応に応じてコンテンツを動的に調整する技術が不足しており、個々のユーザに最適化されたインターネット体験を提供することが困難である。
【1404】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1405】
この発明では、サーバは、インターネットに接続された装置からデジタルコンテンツをリアルタイムで取得する手段と、取得したデジタルコンテンツを分析し、該コンテンツが特定のユーザグループにとって不適切な表現や視覚素材であるかを判断するための人工知能手段と、判定された不適切な表現や視覚素材を特定のユーザグループに適切な表現や視覚素材に置き換える手段と、ユーザの反応をリアルタイムで捉え、該反応に基づいてデジタルコンテンツをさらに最適化するための感情認識手段と、を含む。これにより、不適切なコンテンツの識別と置換、およびユーザの感情に基づいたコンテンツの最適化が可能となる。
【1406】
「インターネットに接続された装置」とは、インターネットへのアクセス機能を持ち、ウェブコンテンツの取得やデータ送受信が可能な電子機器である。
【1407】
「デジタルコンテンツ」とは、テキスト、画像、音声、動画など、デジタル形式で表現された情報の総称である。
【1408】
「リアルタイムで」とは、実際の時間とほぼ同時に、遅延なく処理や反応が行われることを意味する。
【1409】
「人工知能手段」とは、機械学習やディープラーニングなどの技術を活用して、人間のように学習し、判断や推論を行うシステムやプログラムのことである。
【1410】
「特定のユーザグループ」とは、年齢、性別、興味・関心など特定の基準に基づき区別されたユーザの集団である。
【1411】
「不適切な表現や視覚素材」とは、特定のユーザグループにとって不快感を与える、または見ることが適さないと判断されるテキストや画像などのコンテンツである。
【1412】
「置き換える」とは、ある要素を取り除き、別の要素でその位置や役割を代替することである。
【1413】
「感情認識手段」とは、人の感情を顔表情や声のトーンなどから識別し、解析する技術やシステムのことである。
【1414】
「最適化」とは、特定の基準に基づき、性能や効果を最良の状態に調整するプロセスである。
【1415】
本発明を実施するための形態について、具体的な説明を行う。この形態は、インターネット上のデジタルコンテンツを特定のユーザグループ、特に子どもたちにとって安全かつ教育的に最適化することを目的としている。
【1416】
まず、端末にはウェブブラウザを通じてアクセスされたデジタルコンテンツをリアルタイムで取得するためのプラグインがインストールされる。このプラグインは、ユーザが閲覧しているウェブページのテキストと画像を捉え、サーバに送信する機能を持つ。このプラグインは、一般的に利用されるウェブブラウザであるGoogle ChromeやMozilla Firefoxに対応している。
【1417】
サーバ側では、人工知能手段がデジタルコンテンツを分析する。この分析は、生成AIモデルを用いて行われ、テキストや画像が特定のユーザグループにとって不適切な表現や視覚素材であるかどうかを判断する。この人工知能手段には、OpenAIのGPTやGoogleのBERTなどの先進的なモデルが利用される。不適切なコンテンツが検出された場合、それは即座に適切な内容に置き換えられる。例えば、攻撃的な言葉はより穏やかな表現に、不適切な画像は教育的な画像に変更される。
【1418】
さらに、サーバにはユーザの反応をリアルタイムで捉えるための感情認識手段が備わっている。この感情認識手段は、ユーザの顔表情や声のトーンを分析し、喜びや困惑などの感情状態を識別する。この分析には、MicrosoftのFace APIやGoogleのCloud Speech-to-Textなどの技術が用いられる。感情のフィードバックに基づいて、デジタルコンテンツはさらに最適化され、ユーザにとってより適切な体験が提供される。
【1419】
プロンプト文の例としては、「このテキスト/画像は子どもにとって適切か?」という問いがAIに送信される。この問いに対してAIは、コンテンツが子どもにとって安全かつ教育的であるかどうかを分析し、必要に応じてコンテンツを調整する。
【1420】
この形態により、サーバはデジタルコンテンツをリアルタイムで分析し、不適切なコンテンツを特定し、これを適切なものに置き換えることができる。また、ユーザの感情を認識し、これに基づいてコンテンツを最適化することが可能となる。これにより、特定のユーザグループにとってより安全かつ教育的なインターネット体験が提供される。
【1421】
【1422】
ステップ1:コンテンツの取得
【1423】
端末にインストールされたブラウザプラグインは、ユーザがウェブサイトにアクセスする際、そのページのテキストと画像をリアルタイムで受け取る。この受け取ったコンテンツは、分析のためにサーバに送信される。
【1424】
入力:ウェブページのテキストと画像
【1425】
データ加工:ウェブページからのテキストと画像の収集
【1426】
出力:サーバに送信されるテキストと画像データ
【1427】
ステップ2:コンテンツの分析
【1428】
サーバ上のAIは、受け取ったテキストと画像を分析し、これが特定のユーザグループにとって不適切な内容を含むかどうかを判断する。この分析には、生成AIモデルが使用される。
【1429】
入力:テキストと画像データ
【1430】
データ加工:AIによる不適切な内容の識別
【1431】
出力:不適切と判定されたコンテンツのリスト
【1432】
ステップ3:コンテンツの置き換え
【1433】
不適切と判定されたコンテンツが存在する場合、サーバはこれを特定のユーザグループに適切な内容に置き換える。この置き換えプロセスには、適切なテキストや画像に関するデータベースが使用される。
【1434】
入力:不適切と判定されたコンテンツのリスト
【1435】
データ加工:不適切なコンテンツを適切なコンテンツに置き換える
【1436】
出力:置き換えられたコンテンツ
【1437】
ステップ4:コンテンツの最適化
【1438】
サーバには、ユーザの反応をリアルタイムで捉える感情認識手段があり、このフィードバックに基づいてコンテンツをさらに最適化する。このプロセスでは、感情認識技術を用いてユーザの反応が分析される。
【1439】
入力:ユーザの感情フィードバック(顔表情や声のトーン)
【1440】
データ加工:感情認識技術によるユーザ反応の分析
【1441】
出力:コンテンツの最適化情報
【1442】
ステップ5:最適化されたコンテンツの表示
【1443】
最後に、サーバから送り返された最適化されたコンテンツは、端末を通じてユーザに表示される。このプロセスにより、ユーザはより安全かつ教育的なコンテンツを体験することができる。
【1444】
入力:置き換えられたコンテンツ、最適化情報
【1445】
データ加工:端末によるコンテンツの表示準備
【1446】
出力:ユーザに表示される最適化されたコンテンツ
【1447】
(応用例1)
【1448】
次に、形態例1の応用例1について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1449】
インターネット上には子どもにとって不適切なコンテンツが多数存在し、これらに簡単にアクセスできる環境がある。また、子どもの感情や反応に応じて適切なコンテンツを提供するシステムも不足している。これにより、子どもがネガティブな影響を受けるリスクが高まるという問題がある。この発明は、子どもが安全にデジタルコンテンツを楽しめる環境を提供し、さらにその感情に応じた適切なコンテンツを推薦できるシステムの必要性に対応することを目的とする。
【1450】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1451】
この発明では、サーバは、子どもがアクセスするデジタルコンテンツを受け取る手段と、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段と、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段と、ユーザの感情を認識する感情エンジンを含む手段と、を含む。これにより、子どもが安全にインターネットコンテンツを楽しむことができ、さらにその感情や反応に応じて適切なコンテンツを推薦することが可能となる。
【1452】
「子どもがアクセスするデジタルコンテンツ」とは、インターネット上で提供される文章、画像、音声、動画などの情報であり、年少者が閲覧または利用することを想定しているもの。
【1453】
「不適切な言い回しや画像」とは、年少者の健全な成長に悪影響を与える恐れがある、性的な表現、暴力的な表現、差別的な表現などのコンテンツ。
【1454】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを実行するためのアルゴリズムやソフトウェアの総称。
【1455】
「差し替える手段」とは、不適切と判断されたコンテンツを、年少者が閲覧しても安全な別のコンテンツに置き換える操作やプロセス。
【1456】
「ユーザの感情を認識する感情エンジン」とは、ユーザーの顔表情、声のトーン、行動パターンなどからその人の感情状態を推定する技術またはシステム。
【1457】
「ブラウザのプラグイン」とは、ウェブブラウザの機能を拡張するために追加されるソフトウェアコンポーネント。特定の機能やサービスをブラウザ内で直接利用可能にする。
【1458】
この発明を実施するための形態について、具体的な実装方法を示す。本発明のシステムは、子どもが安全にインターネットコンテンツを利用できるようにすること、及びユーザの感情に応じたコンテンツを推薦することを目的としている。
【1459】
サーバは、PythonやTensorFlow、OpenCV、PyTorchなどのライブラリを用いて開発される。これらのソフトウェアは、デジタルコンテンツから不適切な言い回しや画像を検出し、それらを子どもにとって適切なものに自動的に差し替えるAI手段を提供する。また、サーバはユーザの感情を認識する感情エンジンも含み、これは端末のカメラやマイクを介して収集された顔表情や声のトーンから感情を推定する。
【1460】
端末は、スマートフォン、タブレット、スマートTVなど、インターネットに接続できるデバイスを指す。端末上で動作するブラウザのプラグインは、ユーザがアクセスするデジタルコンテンツをリアルタイムでサーバに送信し、サーバからのフィードバックに基づいてコンテンツの表示を調整する。
【1461】
ユーザは、このシステムを利用してインターネットコンテンツを閲覧する際、自動的にフィルタリングされた安全なコンテンツにアクセスする。また、ユーザの感情がポジティブな場合は似た種類のコンテンツを、ネガティブな場合は異なるジャンルのコンテンツを推薦される。
【1462】
具体例として、保護者が子どもに動画を見せる際にこのシステムを利用するシナリオがある。プロンプト文としては、「子どもが見るに適した内容に自動で変換する動画フィルタリング機能」や「子どもの表情から感情を読み取り、コンテンツを推薦する機能」などが用いられる。
【1463】
この形態により、子どもがインターネットを利用する際の安全性が向上し、同時に感情に基づいたパーソナライズされたコンテンツ体験が提供される。
【1464】
【1465】
ステップ1:端末がユーザがアクセスするデジタルコンテンツを受け取る。
【1466】
端末は、ユーザがブラウザを通じてインターネット上のデジタルコンテンツにアクセスした際、そのコンテンツの情報(テキスト、画像、動画など)を受け取る。この情報は、次のステップでの処理のためにサーバへ送信される入力となる。
【1467】
ステップ2:端末が受け取ったコンテンツをサーバに送信する。
【1468】
端末は、受け取ったデジタルコンテンツをサーバに送信する。この送信されたコンテンツは、AIによる分析のための入力データとなる。
【1469】
ステップ3:サーバ上のAIがコンテンツを分析する。
【1470】
サーバ上に搭載されたAI手段は、受け取ったコンテンツを分析し、不適切な言い回しや画像が含まれているかどうかを判断する。この分析によって、コンテンツ内の特定の要素が子どもにとって不適切であると識別された場合、それらを差し替えるための情報が生成される。この処理の出力は、差し替えるべきコンテンツの位置と、それに置き換える適切なコンテンツの情報である。
【1471】
ステップ4:サーバがコンテンツの差し替え指示を端末に送信する。
【1472】
サーバは、AIによる分析結果をもとに、具体的な差し替え指示を端末に送信する。この指示には、どのコンテンツをどのように差し替えるべきかの情報が含まれる。
【1473】
ステップ5:端末がコンテンツを差し替える。
【1474】
端末は、サーバから受け取った差し替え指示に従い、表示中のコンテンツを適切なものに差し替える。この操作により、ユーザは不適切な内容に触れることなく、安全なコンテンツを閲覧できるようになる。
【1475】
ステップ6:端末がユーザの感情を認識する。
【1476】
端末は、内蔵されているカメラやマイクを用いて、ユーザの顔表情や声のトーンから感情を認識する。この情報は、感情に応じたコンテンツ推薦のためにサーバへ送信される。
【1477】
ステップ7:サーバがユーザの感情に基づいたコンテンツ推薦を行う。
【1478】
サーバは、端末から送信されたユーザの感情データを分析し、その感情に最も適したコンテンツを推薦する。この推薦情報は、端末に送信され、ユーザに提示される。
【1479】
この処理フローにより、子どもが安全にデジタルコンテンツを利用できる環境が提供されるとともに、ユーザの感情に応じたパーソナライズされたコンテンツ体験が可能となる。
【1480】
(実施例2)
【1481】
次に、形態例2の実施例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1482】
インターネット上には、特定のユーザグループにとって不適切または有害と考えられるコンテンツが数多く存在する。特に、子どもや感受性の高い個人がアクセスする可能性のあるウェブサイトでは、不適切な言葉や画像によって悪影響を及ぼすリスクがある。また、ユーザの感情状態に応じてコンテンツを適切に調整する必要性が高まっている。この課題に対処するためには、ユーザが閲覧するコンテンツをリアルタイムで分析し、不適切なコンテンツを適切なものに自動的に差し替えるとともに、ユーザの感情状態を考慮したコンテンツの提供が求められる。
【1483】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1484】
この発明では、サーバは、インターネット上のコンテンツをリアルタイムに受け取る手段と、受け取ったコンテンツが特定のユーザグループに対して不適切な表現や視覚的要素であるかを判断する人工知能手段と、不適切な表現や視覚的要素を特定のユーザグループに伝えることが可能な表現や視覚的要素に差し替える手段と、ユーザの感情状態を評価し、この評価に基づいて表現や視覚的要素の差し替え方を調整する感情エンジン手段を含む。これにより、不適切なコンテンツを自動的に適切なものに差し替えることが可能となり、さらにユーザの感情状態に応じた適切なコンテンツの提供が可能となる。
【1485】
「インターネット上のコンテンツ」とは、ウェブサイト、オンラインプラットフォーム、ソーシャルメディア等、インターネットを介してアクセス可能なすべてのテキスト、画像、動画、およびその他のメディア形式の情報。
【1486】
「リアルタイムに受け取る手段」とは、ユーザがウェブページを閲覧しているその瞬間に、そのページのコンテンツを捕捉し、分析のために取り込むプロセスまたは技術。
【1487】
「特定のユーザグループ」とは、年齢、性別、職業、文化的背景など、特定の属性を共有するユーザの集合であり、システムがそのニーズや制約を考慮してサービスを提供する対象。
【1488】
「不適切な表現や視覚的要素」とは、暴力的、性的、攻撃的、またはその他の方法で特定のユーザグループ、特に子どもや感受性の高い個人にとって不適切または有害と考えられる言葉や画像。
【1489】
「人工知能手段」とは、機械学習、深層学習、自然言語処理、画像認識などの技術を用いて、データを解析し、学習し、特定のタスクを自動で実行するソフトウェアまたはシステム。
【1490】
「インターネットブラウザの拡張機能」とは、ウェブブラウザに追加されるソフトウェアコンポーネントで、ブラウザの機能を拡張し、ユーザ体験を向上させるもの。
【1491】
「感情エンジン手段」とは、ユーザの行動、テキスト入力、声のトーン、表情などからユーザの感情状態を推定し、その情報を基にシステムの応答を調整する技術やアルゴリズム。
【1492】
本発明を実施するための形態は、インターネット上のコンテンツをユーザにとってより適切なものに変換するシステムに関する。このシステムは、特にインターネットブラウザの拡張機能として実装される人工知能手段、感情エンジン手段、およびこれらを支えるハードウェアおよびソフトウェアの組み合わせで構成される。
【1493】
このシステムは、端末(パーソナルコンピュータ、スマートフォン、タブレット等)にインストールされたインターネットブラウザの拡張機能として動作する。この拡張機能は、JavaScriptやその他のウェブ技術を用いて開発され、ユーザが閲覧するウェブページからテキストや画像などのコンテンツをリアルタイムで受け取る機能を持つ。受け取ったコンテンツは、HTTPSリクエストを介してサーバ上の人工知能手段に送信される。この人工知能手段は、機械学習や自然言語処理、画像認識技術を駆使してコンテンツを分析し、その内容が特定のユーザグループにとって不適切であるかを判断する。
【1494】
不適切なコンテンツが検出された場合、人工知能手段は、テキストをより適切な表現に置き換えたり、画像を問題ないものに差し替えたりする。例えば、攻撃的な言葉は穏やかな言い回しに、暴力的な画像は風景画や動物の画像に置き換えられる。この差し替えたコンテンツは再び端末に送信され、ブラウザの拡張機能がウェブページの表示を更新する。
【1495】
さらに、このシステムには感情エンジン手段が組み込まれており、ユーザの行動や入力から感情状態を推測し、その情報を人工知能手段に提供する。これにより、ユーザが怒っているなどの感情状態に基づいて、より穏やかなコンテンツに差し替えることができる。この感情エンジンは、機械学習アルゴリズムを用いてユーザの感情を評価し、その結果を人工知能手段の処理に反映させる。
【1496】
具体例としては、「このテキストに含まれる不適切な表現を子どもが理解しやすい言葉に置き換えてください」や「この画像を子どもが見ても問題ない内容に差し替えてください」というプロンプト文が人工知能手段に送信され、この要求に基づいてコンテンツの分析および変換が行われる。
【1497】
【1498】
ステップ1:コンテンツの受信
【1499】
端末上で動作するブラウザの拡張機能が、ユーザが閲覧しているウェブページからテキストや画像などのコンテンツを受信する。この段階では、ウェブページのDOMを解析し、テキストと画像のデータが抽出される。入力はウェブページのHTMLコンテンツであり、出力は抽出されたテキストと画像データである。
【1500】
ステップ2:コンテンツの分析要求
【1501】
抽出されたコンテンツは、HTTPSリクエストを介してサーバに送信される。サーバ上の人工知能手段がこのコンテンツを受け取り、分析を開始する。入力は抽出されたテキストと画像データであり、出力は分析結果(コンテンツが不適切かどうかの判断)である。
【1502】
ステップ3:コンテンツの分析
【1503】
人工知能手段は、テキストと画像に含まれる内容を分析し、その不適切性を評価する。この過程で、テキストは自然言語処理技術を、画像は画像認識技術を用いて処理される。入力はテキストと画像データであり、出力はそれぞれの不適切性評価結果である。
【1504】
ステップ4:感情エンジンによる調整
【1505】
端末またはサーバ上で動作する感情エンジンが、ユーザの感情状態を評価し、その情報を人工知能手段に提供する。この情報は、コンテンツの差し替え方を調整するために使用される。入力はユーザの行動や入力データであり、出力はユーザの感情状態の評価結果である。
【1506】
ステップ5:差し替えコンテンツの生成
【1507】
不適切なコンテンツが検出された場合、人工知能手段は適切な言葉や画像に差し替えるための新しいコンテンツを生成する。このプロセスでは、不適切なテキストは適切な言葉に、不適切な画像は適切な画像に変換される。入力は不適切性評価結果とユーザの感情状態、出力は差し替えられた新しいテキストと画像である。
【1508】
ステップ6:コンテンツの表示更新
【1509】
サーバから差し替えられたコンテンツが端末に送信され、ブラウザの拡張機能を通じてウェブページの表示が更新される。このステップで、ユーザには最終的に適切なコンテンツのみが表示される。入力は差し替えられた新しいテキストと画像データ、出力は更新されたウェブページの表示である。
【1510】
(応用例2)
【1511】
次に、形態例2の応用例2について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1512】
インターネット上には、特定の利用者群にとって不適切と考えられるコンテンツが存在する。これらのコンテンツは、特に若年層の利用者にとって、精神的な不快感や誤解を招く可能性がある。また、利用者の現在の感情状態によっては、通常ならば無害と考えられるコンテンツであっても、感情的なダメージを引き起こすことがある。従来技術では、これらの不適切なコンテンツを効率的にかつ利用者の感情状態を考慮してフィルタリングすることは困難であった。
【1513】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1514】
この発明では、サーバは、ウェブサイトのコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群にとって不適切であるかを判断する人工知能手段と、不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段と、利用者の感情状態を認識し、その感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段を含む。これにより、特定の利用者群がインターネットを安全に利用できるようにすると同時に、利用者の感情状態に応じた適切なコンテンツの提供が可能となる。
【1515】
「利用者」とは、インターネットを利用する個人または特定のグループを指す。
【1516】
「ウェブサイトのコンテンツ」とは、インターネット上のウェブページに表示されるテキスト、画像、動画などの情報全般を指す。
【1517】
「人工知能手段」とは、機械学習、深層学習、自然言語処理などの技術を用いて、データを分析し、判断を行うシステムやプログラムを指す。
【1518】
「特定の利用者群に対して不適切な言い回しや画像」とは、年齢、性別、文化的背景などに基づき、そのグループにとって不快、不適切、または有害と判断されるコンテンツを指す。
【1519】
「不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段」とは、不適切なコンテンツを、該当する利用者群が安全に閲覧可能な形に自動的に変更する技術や方法を指す。
【1520】
「利用者の感情状態を認識する手段」とは、利用者の表情、声のトーン、文脈などからその時点での感情状態を検出し、解析する技術やシステムを指す。
【1521】
「感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段」とは、利用者の現在の感情を考慮し、コンテンツの差し替え方法を最適化することで、よりポジティブなユーザー体験を提供する技術やプロセスを指す。
【1522】
「ウェブブラウザの拡張機能」とは、インターネットブラウザの機能を拡張し、追加の機能を提供するためにインストールされるソフトウェアまたはプログラムを指す。
【1523】
この発明を実施するための形態では、利用者が安全にインターネットを利用できるようにするシステムを提供する。このシステムは、特に利用者の感情状態を考慮しながら、ウェブサイトのコンテンツをフィルタリングし、必要に応じて適切なコンテンツに差し替える機能を持つ。このシステムは、主にウェブブラウザの拡張機能として実装される人工知能手段、利用者の感情状態を認識する感情認識手段、および不適切なコンテンツを差し替える手段から構成される。
【1524】
サーバは、深層学習、自然言語処理、画像認識技術を用いた人工知能モデルを実行する。この人工知能モデルは、受け取ったウェブサイトのコンテンツを解析し、そのコンテンツが特定の利用者群にとって不適切であるかどうかを判断する。不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える。
【1525】
端末は、カメラやマイクロフォンを用いて利用者の感情状態をリアルタイムで検出し、この情報をサーバに送信する。サーバはこの感情データを分析し、利用者が現在抱いている感情を考慮してコンテンツの差し替え方を調整する。このプロセスにより、利用者の感情を和らげるようなより穏やかなコンテンツへの差し替えが可能となる。
【1526】
使用するハードウェアは、カメラ、マイクロフォン、およびインターネットに接続されたコンピュータやスマートデバイスである。ソフトウェアは、TensorFlowやPyTorchといった深層学習フレームワークを使用して開発される人工知能モデル、およびウェブブラウザの拡張機能として機能するプログラムである。
【1527】
具体例として、プロンプト文「10歳の子どもに適切な言葉を使用して説明してください」という指示が人工知能モデルに送信される場合がある。このプロンプトは、特定のコンテンツが子どもにとって不適切である場合に、そのコンテンツを子どもが理解しやすい形に差し替えるよう人工知能モデルに指示するために使用される。このような機能により、インターネットの安全な利用環境が提供される。
【1528】
【1529】
ステップ1:利用者がウェブブラウザを通じてウェブサイトにアクセスする。この時、ブラウザの拡張機能がアクセスしたウェブサイトのコンテンツを受け取る。入力はウェブサイトのURLまたはコンテンツであり、出力はウェブサイトから受け取ったコンテンツのデータである。このプロセスでは、ウェブブラウザのAPIを使用して、ウェブサイトのコンテンツを取得する動作が行われる。
【1530】
ステップ2:取得したコンテンツをサーバに送信し、人工知能手段を用いてコンテンツが特定の利用者群にとって不適切であるかを判断する。入力はウェブサイトのコンテンツであり、出力は不適切なコンテンツの有無と、その詳細(テキストまたは画像)である。このステップでは、テキスト解析や画像認識の技術を用いて、コンテンツ内の不適切な言い回しや画像を特定する動作が行われる。
【1531】
ステップ3:端末は利用者の感情状態をカメラやマイクロフォンを通じて検出し、この情報をサーバに送信する。入力は利用者の表情や声のトーンであり、出力は利用者の感情状態(例:怒り、喜び)である。このステップでは、表情認識や音声解析技術を用いて、利用者の感情を判定する動作が行われる。
【1532】
ステップ4:サーバは受け取った感情データを分析し、その感情状態に基づいて、不適切なコンテンツの差し替え方を調整する。入力は利用者の感情状態であり、出力は差し替えられるコンテンツの種類(より穏やかな言葉や画像)である。このステップでは、利用者の感情に最も適したコンテンツを選択し、不適切なコンテンツを適切なものに差し替える動作が行われる。
【1533】
ステップ5:最終的にサーバは、差し替えられたコンテンツをウェブブラウザの拡張機能を通じて利用者の端末に送信する。入力は差し替えられるべきコンテンツの指示であり、出力は実際に差し替えられたウェブサイトのコンテンツである。このプロセスでは、ウェブブラウザのAPIを介して、差し替え後のコンテンツをウェブページ上に表示する動作が行われる。
【1534】
(実施例3)
【1535】
次に、形態例3の実施例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1536】
デジタルコンテンツの中には、特定のユーザーグループ、特に子どもや敏感な内容に対して保護を必要とするユーザーにとって不適切な言い回しや画像が含まれている場合がある。これらのコンテンツは、見る者に悪影響を及ぼす可能性がある。また、ユーザーの感情状態に合わせてコンテンツを提供する既存のシステムは少なく、ユーザー体験を向上させるためのパーソナライゼーションが不足している。これらの問題に対処するための効果的な解決策が求められている。
【1537】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1538】
この発明では、サーバは、デジタルコンテンツを受け取る手段と、受け取ったコンテンツが特定のユーザーグループに対して不適切な言い回しや画像であるかを判断する人工知能手段と、不適切な言い回しや画像を適切な言い回しや画像に自動的に差し替える手段と、ユーザーの感情状態を検出する手段と、検出された感情状態に基づいてコンテンツの表示を調整する手段と、を含む。これにより、不適切なコンテンツを適切なものに自動で差し替えることが可能となり、また、ユーザーの感情状態に基づいたコンテンツのパーソナライゼーションを実現することが可能となる。
【1539】
「デジタルコンテンツ」とは、インターネット上で共有、配布、またはアクセス可能なテキスト、画像、動画、音声などの電子的形式の情報やメディアを指す。
【1540】
「特定のユーザーグループ」とは、年齢、性別、文化的背景など特定の属性や条件に基づいて区別されるユーザーの集団を指す。
【1541】
「不適切な言い回しや画像」とは、特定のユーザーグループにとって不快、攻撃的、または有害とみなされる可能性のある言葉遣いや視覚的表現を指す。
【1542】
「人工知能手段」とは、学習、推論、認識、言語理解などの人間の知能を模倣することを目的としたコンピュータープログラムやテクノロジーの総称を指す。
【1543】
「自動的に差し替える手段」とは、人の介入なしに、プログラムやシステムが自律的に行動や処理を実行する方法や機能を指す。
【1544】
「ユーザーの感情状態」とは、個人がその時点で経験している感情や気分のことで、喜び、悲しみ、怒り、驚きなど多岐にわたる。
【1545】
「検出する手段」とは、特定の情報や状態を識別し、その存在を確認するために用いられる技術や方法を指す。
【1546】
「コンテンツの表示を調整する手段」とは、ユーザーに提供される情報やメディアの形式、順序、または内容を変更するプロセスや機能を指す。
【1547】
この発明を実施するための形態は、コンテンツの安全性とユーザー体験の向上を中心に展開される。主に使用されるハードウェアは、サーバー、端末(スマートフォン、タブレット、パソコン等)、および感情検出装置(端末内蔵のカメラやマイクロフォン)である。ソフトウェア面では、画像認識技術、自然言語処理技術、感情分析技術、および生成AIモデルが核となる。
【1548】
サーバは、高性能なプロセッシング能力を持つコンピューターであり、クラウド上または物理的なデータセンター内に配置される。このサーバには、特定の生成AIモデルがインストールされており、不適切なコンテンツの識別と差し替え、ユーザーの感情に基づくコンテンツの調整を行う。具体的なソフトウェアとしては、OpenAIが提供する画像認識技術やGPT系の生成AIモデルが使用される。
【1549】
端末は、ユーザーがコンテンツをアップロードし、サーバから送信された結果を受け取るインターフェースとして機能する。また、端末内蔵のカメラやマイクロフォンを通じてユーザーの感情状態を検出し、そのデータをサーバに送信する。
【1550】
具体例として、ユーザーが暴力的な画像をアップロードした場合、「画像内の不適切な要素を識別し、適切な風景画像に差し替えてください。また、ユーザーの現在の感情が喜びである場合は、ポジティブなニュース記事や画像を優先的に表示するように調整してください。」というプロンプト文が生成AIモデルによって処理される。サーバはこのプロンプトに基づき、暴力的な画像を風景画に差し替え、ユーザーの感情が喜びであることを考慮して、適切なコンテンツを選択し、端末に送信する。
【1551】
この形態により、ユーザーは安全で個人の感情に応じたコンテンツ体験を享受できるようになる。
【1552】
【1553】
ステップ1:
【1554】
ユーザがデジタルコンテンツを端末を通じてサーバにアップロードする。この時、入力はユーザから提供された画像やテキストであり、サーバはこのデジタルコンテンツを受け取る動作を行う。
【1555】
ステップ2:
【1556】
サーバ上の人工知能手段が、受け取ったデジタルコンテンツに対して内容分析を行う。このプロセスでは、画像認識技術や自然言語処理技術を用いて、コンテンツ内の言い回しや画像が特定のユーザーグループにとって不適切かどうかを判断する。入力はデジタルコンテンツであり、出力は不適切なコンテンツの有無とその内容に関する情報である。
【1557】
ステップ3:
【1558】
不適切なコンテンツが検出された場合、サーバはそれを適切な言い回しや画像に自動的に差し替える手段を実行する。このステップの入力は不適切と判断されたコンテンツであり、出力はユーザーにとって安全な代替コンテンツである。この差し替えプロセスは、あらかじめ準備された安全なコンテンツのデータベースから選択されるか、生成AIモデルを用いて新たに生成される。
【1559】
ステップ4:
【1560】
端末はユーザーの感情状態を検出する機能を持ち、その情報をサーバに送信する。このステップでは、入力としてユーザーの表情や音声が使用され、出力はユーザーの感情状態(喜び、悲しみ等)の分析結果である。
【1561】
ステップ5:
【1562】
サーバは、受け取った感情状態の情報に基づき、コンテンツの表示を調整する。この調整は、ユーザーの感情にマッチするコンテンツを選択し、それを優先的に表示するためのものである。入力はユーザーの感情状態の情報であり、出力は調整されたコンテンツのセットである。
【1563】
このプログラムの処理を実施することで、ユーザーは自分の感情に合わせて最適化されたコンテンツを受け取ることができるようになり、不適切なコンテンツから保護される。
【1564】
(応用例3)
【1565】
次に、形態例3の応用例3について説明する。以下の説明では、データ処理装置12を「サーバ」と称し、ロボット414を「端末」と称する。
【1566】
従来のデジタルコンテンツ提供システムでは、ユーザーの個別の感情状態を考慮せずに一律のコンテンツを提供していた。これにより、ユーザーの現在の感情や必要に応じたコンテンツを適切に提供することが困難であった。特に、ユーザーが求める感情的なサポートや体験をデジタルコンテンツを通じて提供することに限界があった。
【1567】
データ処理装置12の特定処理部290による特定処理を、以下の各手段により実現する。
【1568】
この発明では、サーバは、ユーザーの表情をリアルタイムで分析する画像認識手段と、分析結果に基づいてユーザーの感情状態を判断する感情エンジン手段と、ユーザーの感情状態に適したコンテンツを選定し提供するAI手段と、を含む。これにより、ユーザーの現在の感情状態に基づいたパーソナライズされたデジタルコンテンツの提供が可能となる。
【1569】
「デジタルコンテンツ」とは、インターネット上で配信される動画、音楽、文章、画像などの電子的形式で存在するコンテンツのことである。
【1570】
「AI手段」とは、人工知能技術を用いてデータを分析し、特定のタスクを自動で実行するシステムやプログラムのことである。
【1571】
「ユーザーの感情状態に適したコンテンツに差し替える手段」とは、ユーザーの現在の感情を考慮して、その感情に適合または反応するようなコンテンツに自動で切り替える技術やプロセスのことである。
【1572】
「画像認識手段」とは、カメラ等のデバイスを通じて取得した画像データから特定のパターンや物体を識別し、解析する技術やシステムのことである。
【1573】
「感情エンジン手段」とは、ユーザーの表情、声のトーン、言葉遣いなどから感情状態を推測し、解析する技術やシステムのことである。
【1574】
「コンテンツの選定と表示を優先順位付けするAI手段」とは、ユーザーに最適なコンテンツを選び出し、その表示順をユーザーの好みや状況に合わせて自動で調整する人工知能の機能やプロセスのことである。
【1575】
この発明を実施するための形態は、ユーザーの感情状態に基づいてデジタルコンテンツを動的に選定し、提供するシステムに関連している。このシステムは、主にスマートフォンやタブレットなどの端末にインストールされるアプリケーションとして実装される。端末の内蔵カメラを用いてユーザーの表情をリアルタイムで分析し、画像認識手段を通じて得られたデータを基に感情エンジン手段がユーザーの感情状態を判断する。この判断結果を元に、AI手段がユーザーの現在の感情に最も適したコンテンツを選定し、画面上に表示する。
【1576】
ハードウェアとしては、スマートフォンやタブレットの内蔵カメラとプロセッサが使用される。ソフトウェアとしては、画像認識にOpenCV、機械学習にはTensorFlowなどのライブラリが用いられる。このシステムを通じて、例えばユーザーが悲しんでいる場合には、明るく元気づけるような動画や音楽を提供することが可能となる。逆に、ユーザーがリラックスしている場合には、穏やかな音楽や風景画像を優先的に表示するように調整する。
【1577】
具体的なプログラムの操作手順としては、まずアプリケーションが端末のカメラを起動し、ユーザーの表情をキャプチャする。続いて、画像認識手段を用いて表情から感情を分析し、感情エンジン手段によってユーザーの感情状態が判断される。最後に、この感情状態に基づき、AI手段がコンテンツの選定と表示を行う。このプロセスは、ユーザーがアプリケーションを使用している間、連続的に実行される。
【1578】
プロンプト文の例として、「ユーザーが悲しんでいるときに推薦するべき楽しい動画のリストを生成せよ」や「ユーザーが喜んでいるときにさらに喜びを増幅させる動画のリストを生成せよ」という具体例が挙げられる。これにより、ユーザーの感情に応じたコンテンツを提供することで、ユーザー体験を向上させることが目的である。
【1579】
【1580】
ステップ1:
【1581】
端末が内蔵カメラを起動し、ユーザーの表情をキャプチャする。この段階では、カメラからの映像データが入力として受け取られ、生の画像データとして端末に送信される。
【1582】
ステップ2:
【1583】
画像認識手段がキャプチャされた画像データを分析し、ユーザーの表情から感情を推定する。この処理では、入力として受け取った画像データに対して顔認識アルゴリズムが適用され、ユーザーの表情に基づいた感情のスコア(例:喜び、悲しみ、怒りなど)が出力として生成される。
【1584】
ステップ3:
【1585】
感情エンジン手段が、ステップ2で得られた感情スコアを基にユーザーの感情状態を最終的に判断する。このステップでは、入力として受け取った感情スコアを分析し、最も可能性の高い感情状態を出力として決定する。
【1586】
ステップ4:
【1587】
AI手段が、ステップ3で判断されたユーザーの感情状態に基づいて、適切なデジタルコンテンツを選定する。この過程では、データベース内のコンテンツ情報とユーザーの感情状態が入力として考慮され、感情状態に最適なコンテンツのリストが出力として生成される。
【1588】
ステップ5:
【1589】
選定されたコンテンツが端末の画面上に表示される。この最終ステップでは、ステップ4で生成されたコンテンツリストが入力として受け取られ、それらのコンテンツがユーザーインターフェース上に適切に配置されてユーザーに提示される。
【1590】
これらの処理ステップを通じて、ユーザーは自分の感情状態に適したデジタルコンテンツをリアルタイムで受け取ることができ、よりパーソナライズされたユーザー体験を享受することが可能となる。
【1591】
特定処理部290は、特定処理の結果をロボット414に送信する。ロボット414では、制御部46Aが、スピーカ240及び制御対象443に対して特定処理の結果を出力させる。マイクロフォン238は、特定処理の結果に対するユーザ入力を示す音声を取得する。制御部46Aは、マイクロフォン238によって取得されたユーザ入力を示す音声データをデータ処理装置12に送信する。データ処理装置12では、特定処理部290が音声データを取得する。
【1592】
データ生成モデル58は、いわゆる生成AI(Artificial Intelligence)である。データ生成モデル58の一例としては、ChatGPT(インターネット検索<URL: https://openai.com/blog/chatgpt>)等の生成AIが挙げられる。データ生成モデル58は、ニューラルネットワークに対して深層学習を行わせることによって得られる。データ生成モデル58には、指示を含むプロンプトが入力され、かつ、音声を示す音声データ、テキストを示すテキストデータ、及び画像を示す画像データ等の推論用データが入力される。データ生成モデル58は、入力された推論用データをプロンプトにより示される指示に従って推論し、推論結果を音声データ及びテキストデータ等のデータ形式で出力する。ここで、推論とは、例えば、分析、分類、予測、及び/又は要約等を指す。
【1593】
生成AIの他の例としては、Gemini(インターネット検索<URL: https://gemini.google.com/?hl=ja>)が挙げられる。
【1594】
上記実施形態では、データ処理装置12によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、ロボット414によって特定処理が行われるようにしてもよい。
【1595】
なお、感情エンジンとしての感情特定モデル59は、特定のマッピングに従い、ユーザの感情を決定してよい。具体的には、感情特定モデル59は、特定のマッピングである感情マップ(
図9参照)に従い、ユーザの感情を決定してよい。また、感情特定モデル59は、同様に、ロボットの感情を決定し、特定処理部290は、ロボットの感情を用いた特定処理を行うようにしてもよい。
【1596】
図9は、複数の感情がマッピングされる感情マップ400を示す図である。感情マップ400において、感情は、中心から放射状に同心円に配置されている。同心円の中心に近いほど、原始的状態の感情が配置されている。同心円のより外側には、心境から生まれる状態や行動を表す感情が配置されている。感情とは、情動や心的状態も含む概念である。同心円の左側には、概して脳内で起きる反応から生成される感情が配置されている。同心円の右側には概して、状況判断で誘導される感情が配置されている。同心円の上方向及び下方向には、概して脳内で起きる反応から生成され、かつ、状況判断で誘導される感情が配置されている。また、同心円の上側には、「快」の感情が配置され、下側には、「不快」の感情が配置されている。このように、感情マップ400では、感情が生まれる構造に基づいて複数の感情がマッピングされており、同時に生じやすい感情が、近くにマッピングされている。
【1597】
これらの感情は、感情マップ400の3時の方向に分布しており、普段は安心と不安のあたりを行き来する。感情マップ400の右半分では、内部的な感覚よりも状況認識の方が優位に立つため、落ち着いた印象になる。
【1598】
感情マップ400の内側は心の中、感情マップ400の外側は行動を表すため、感情マップ400の外側に行くほど、感情が目に見える(行動に表れる)ようになる。
【1599】
ここで、人の感情は、姿勢や血糖値のような様々なバランスを基礎としており、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示す。ロボットや自動車やバイク等においても、姿勢やバッテリー残量のような様々なバランスを基礎として、それらのバランスが理想から遠ざかると不快、理想に近づくと快という状態を示すように感情を作ることができる。感情マップは、例えば、光吉博士の感情地図(音声感情認識及び情動の脳生理信号分析システムに関する研究、徳島大学、博士論文:https://ci.nii.ac.jp/naid/500000375379)に基づいて生成されてよい。感情地図の左半分には、感覚が優位にたつ「反応」と呼ばれる領域に属する感情が並ぶ。また、感情地図の右半分には、状況認識が優位にたつ「状況」と呼ばれる領域に属する感情が並ぶ。
【1600】
感情マップでは学習を促す感情が2つ定義される。1つは、状況側にあるネガティブな「懺悔」や「反省」の真ん中周辺の感情である。つまり、「もう2度とこんな想いはしたくない」「もう叱られたくない」というネガティブな感情がロボットに生じたときである。もう1つは、反応側にあるポジティブな「欲」のあたりの感情である。つまり、「もっと欲しい」「もっと知りたい」というポジティブな気持ちのときである。
【1601】
感情特定モデル59は、ユーザ入力を、予め学習されたニューラルネットワークに入力し、感情マップ400に示す各感情を示す感情値を取得し、ユーザの感情を決定する。このニューラルネットワークは、ユーザ入力と、感情マップ400に示す各感情を示す感情値との組み合わせである複数の学習データに基づいて予め学習されたものである。また、このニューラルネットワークは、
図10に示す感情マップ900のように、近くに配置されている感情同士は、近い値を持つように学習される。
図10では、「安心」、「安穏」、「心強い」という複数の感情が、近い感情値となる例を示している。
【1602】
上記実施形態では、1台のコンピュータ22によって特定処理が行われる形態例を挙げたが、本開示の技術はこれに限定されず、コンピュータ22を含めた複数のコンピュータによる特定処理に対する分散処理が行われるようにしてもよい。
【1603】
上記実施形態では、ストレージ32に特定処理プログラム56が格納されている形態例を挙げて説明したが、本開示の技術はこれに限定されない。例えば、特定処理プログラム56がUSB(Universal Serial Bus)メモリなどの可搬型のコンピュータ読み取り可能な非一時的格納媒体に格納されていてもよい。非一時的格納媒体に格納されている特定処理プログラム56は、データ処理装置12のコンピュータ22にインストールされる。プロセッサ28は、特定処理プログラム56に従って特定処理を実行する。
【1604】
また、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56を格納させておき、データ処理装置12の要求に応じて特定処理プログラム56がダウンロードされ、コンピュータ22にインストールされるようにしてもよい。
【1605】
なお、ネットワーク54を介してデータ処理装置12に接続されるサーバ等の格納装置に特定処理プログラム56の全てを格納させておいたり、ストレージ32に特定処理プログラム56の全てを記憶させたりしておく必要はなく、特定処理プログラム56の一部を格納させておいてもよい。
【1606】
特定処理を実行するハードウェア資源としては、次に示す各種のプロセッサを用いることができる。プロセッサとしては、例えば、ソフトウェア、すなわち、プログラムを実行することで、特定処理を実行するハードウェア資源として機能する汎用的なプロセッサであるCPUが挙げられる。また、プロセッサとしては、例えば、FPGA(Field-Programmable Gate Array)、PLD(Programmable Logic Device)、又はASIC(Application Specific Integrated Circuit)などの特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路が挙げられる。何れのプロセッサにもメモリが内蔵又は接続されており、何れのプロセッサもメモリを使用することで特定処理を実行する。
【1607】
特定処理を実行するハードウェア資源は、これらの各種のプロセッサのうちの1つで構成されてもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGAの組み合わせ、又はCPUとFPGAとの組み合わせ)で構成されてもよい。また、特定処理を実行するハードウェア資源は1つのプロセッサであってもよい。
【1608】
1つのプロセッサで構成する例としては、第1に、1つ以上のCPUとソフトウェアの組み合わせで1つのプロセッサを構成し、このプロセッサが、特定処理を実行するハードウェア資源として機能する形態がある。第2に、SoC(System-on-a-chip)などに代表されるように、特定処理を実行する複数のハードウェア資源を含むシステム全体の機能を1つのICチップで実現するプロセッサを使用する形態がある。このように、特定処理は、ハードウェア資源として、上記各種のプロセッサの1つ以上を用いて実現される。
【1609】
更に、これらの各種のプロセッサのハードウェア的な構造としては、より具体的には、半導体素子などの回路素子を組み合わせた電気回路を用いることができる。また、上記の特定処理はあくまでも一例である。従って、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
【1610】
以上に示した記載内容及び図示内容は、本開示の技術に係る部分についての詳細な説明であり、本開示の技術の一例に過ぎない。例えば、上記の構成、機能、作用、及び効果に関する説明は、本開示の技術に係る部分の構成、機能、作用、及び効果の一例に関する説明である。よって、本開示の技術の主旨を逸脱しない範囲内において、以上に示した記載内容及び図示内容に対して、不要な部分を削除したり、新たな要素を追加したり、置き換えたりしてもよいことは言うまでもない。また、錯綜を回避し、本開示の技術に係る部分の理解を容易にするために、以上に示した記載内容及び図示内容では、本開示の技術の実施を可能にする上で特に説明を要しない技術常識等に関する説明は省略されている。
【1611】
本明細書に記載された全ての文献、特許出願及び技術規格は、個々の文献、特許出願及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。
【1612】
以上の実施形態に関し、更に以下を開示する。
【1613】
(請求項1)
子どもがアクセスするウェブサイトのコンテンツを受け取る手段と、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段と、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段を含むシステム。
【1614】
(請求項2)
前記AI手段が、ブラウザのプラグインとして実装されている、請求項1記載のシステム。
【1615】
(請求項3)
前記AI手段が、テキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である、請求項1記載のシステム。
【1616】
(請求項4)
前記AI手段が、ユーザの感情を認識する感情エンジンを含む、請求項1記載のシステム。
【1617】
(請求項5)
前記感情エンジンが、ユーザの感情に基づいて、不適切な言い回しや画像の差し替え方を調整する、請求項4記載のシステム。
【1618】
(請求項6)
前記感情エンジンが、ユーザの感情に基づいて、コンテンツの表示方法を調整する、請求項4記載のシステム。
【1619】
「実施例1」
【1620】
(請求項1)
ユーザがアクセスする情報通信ネットワーク上のコンテンツをリアルタイムで受け取る手段と、受け取ったコンテンツを情報処理システムに送信する手段と、送信されたコンテンツが特定のユーザグループに対して不適切な表現や視覚情報であるかを分析し判断する情報処理システムと、不適切と判断された表現や視覚情報を特定のユーザグループにとって適切な表現や視覚情報に自動的に変換する手段と、を含むシステム。
【1621】
(請求項2)
前記情報処理システムが、情報通信ネットワークを閲覧するソフトウェアの拡張機能として実装されている、請求項1記載のシステム。
【1622】
(請求項3)
前記情報処理システムが、テキストのみならず視覚情報に対しても不適切な内容を分析し、判断し、変換することが可能である、請求項1記載のシステム。
【1623】
「応用例1」
【1624】
(請求項1)
利用者がアクセスするデジタルコンテンツをリアルタイムで取得する手段と、
取得したコンテンツの適切性を評価するためにコンテンツを生成AIモデルに送信する手段と、
不適切な表現を利用者が理解しやすい適切な表現に自動的に変換する生成AIモデルに基づく手段と、
を含むシステム。
【1625】
(請求項2)
前記生成AIモデルが、利用者のデバイス上で動作するアプリケーションの一部として実装されている、請求項1記載のシステム。
【1626】
(請求項3)
前記生成AIモデルが、テキストおよび画像の内容に関して不適切なものを判断し、これらを利用者に適切な内容に変換することが可能である、請求項1記載のシステム。
【1627】
「実施例2」
【1628】
(請求項1)
利用者が操作する情報端末からウェブコンテンツをリアルタイムで捕捉する手段と、
捕捉したコンテンツを安全な通信経路を通じて解析サーバへ送信する手段と、
送信されたコンテンツを自然言語および画像解析技術を備えた生成AIモデルによって評価し、不適切な表現または画像を検出する手段と、
検出された不適切な表現を利用者の理解に適した表現に、不適切な画像を問題ない画像に自動的に差し替える手段と、
差し替えたコンテンツを情報端末に返送し、利用者に表示させる手段と、
を含むシステム。
【1629】
(請求項2)
前記生成AIモデルが、情報端末のブラウザに組み込まれたプラグイン形式で実装され、ウェブページのコンテンツをリアルタイムで捕捉し、安全な通信経路を介して解析サーバへ送信することが可能である、請求項1記載のシステム。
【1630】
(請求項3)
前記生成AIモデルが、テキスト内容だけではなく画像内容に対しても不適切かどうかを評価し、必要に応じて利用者の理解に適したものや問題ないものに自動的に差し替える機能を備えていること、さらには、この変換プロセスにおいて自然言語処理技術および画像認識・生成技術を用いることが可能である、請求項1記載のシステム。
【1631】
「応用例2」
【1632】
(請求項1)
利用者がアクセスする情報配信媒体のコンテンツを受け取る手段と、
受け取ったコンテンツが特定の利用者群に対して不適切な言語表現や視覚表現であるかを判断する人工知能手段と、
不適切な言語表現や視覚表現を特定の利用者群に伝えられる適切な言語表現や視覚表現に差し替える手段を含むシステム。
【1633】
(請求項2)
前記人工知能手段が、情報配信媒体の利用者インターフェース拡張機能として実装されている、請求項1記載のシステム。
【1634】
(請求項3)
前記人工知能手段が、言語表現だけでなく視覚表現に対しても不適切な内容を判断し、差し替えることが可能である、請求項1記載のシステム。
【1635】
「実施例3」
【1636】
(請求項1)
デジタルデータをアップロードする手段と、
アップロードされたデジタルデータが特定のユーザグループに対して不適切な内容を含むかを判断するAI手段と、
不適切な内容を含むデジタルデータを特定のユーザグループに適切な内容に差し替える手段と、
を含むシステム。
【1637】
(請求項2)
前記AI手段が、ウェブサービスまたはアプリケーションの一部として実装されている、請求項1記載のシステム。
【1638】
(請求項3)
前記AI手段が、テキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である、請求項1記載のシステム。
【1639】
「応用例3」
【1640】
(請求項1)
情報端末を通じてアクセスされるデジタルコンテンツを受け取る手段と、受け取ったデジタルコンテンツが特定の年齢層に対して不適切な表現や画像であるかを判断するAI手段と、不適切な表現や画像を特定の年齢層に適切な表現や画像に差し替える手段を含むシステム。
【1641】
(請求項2)
前記AI手段が、情報処理装置のアプリケーションとして実装されている、請求項1記載のシステム。
【1642】
(請求項3)
前記AI手段が、テキストおよび画像に対して不適切な内容を判断し、特定の年齢層が閲覧しても安全な内容に差し替えることが可能である、請求項1記載のシステム。
【1643】
「感情エンジンを組み合わせた場合の実施例1」
【1644】
(請求項1)
インターネットに接続された装置から送信されたデジタルコンテンツをリアルタイムで取得する手段と、取得したデジタルコンテンツを分析し、該コンテンツが特定のユーザグループにとって不適切な表現や視覚素材であるかを判断するための人工知能手段と、判定された不適切な表現や視覚素材を特定のユーザグループに適切な表現や視覚素材に置き換える手段と、ユーザの反応をリアルタイムで捉え、該反応に基づいてデジタルコンテンツをさらに最適化するための感情認識手段を含むシステム。
【1645】
(請求項2)
前記人工知能手段が、ウェブブラウザに組み込まれる形で実装されており、テキスト及び画像の両方に対してリアルタイムで不適切な内容を識別し、適切な内容への置き換えを行うことが可能である、請求項1記載のシステム。
【1646】
(請求項3)
前記感情認識手段が、ユーザの顔表情や声のトーンを分析することにより、ユーザの感情状態を識別し、この識別結果を用いてデジタルコンテンツの表示を動的に調整することが可能である、請求項1記載のシステム。
【1647】
「感情エンジンを組み合わせた場合の応用例1」
【1648】
(請求項1)
子どもがアクセスするデジタルコンテンツを受け取る手段と、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断するAI手段と、不適切な言い回しや画像を子どもに伝えられる言い回しや画像に差し替える手段と、ユーザの感情を認識する感情エンジンを含む手段を含むシステム。
【1649】
(請求項2)
前記AI手段が、ブラウザのプラグインとして実装されている、請求項1記載のシステム。
【1650】
(請求項3)
前記AI手段が、テキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能であり、さらにユーザの感情を認識し、感情に基づいたコンテンツ推薦が可能である、請求項1記載のシステム。
【1651】
「感情エンジンを組み合わせた場合の実施例2」
【1652】
(請求項1)
インターネット上のコンテンツをリアルタイムに受け取る手段と、
受け取ったコンテンツが特定のユーザグループに対して不適切な表現や視覚的要素であるかを判断する人工知能手段と、
不適切な表現や視覚的要素を特定のユーザグループに伝えることが可能な表現や視覚的要素に差し替える手段と、
ユーザの感情状態を評価し、この評価に基づいて表現や視覚的要素の差し替え方を調整する感情エンジン手段を含むシステム。
【1653】
(請求項2)
前記人工知能手段が、インターネットブラウザの拡張機能として実装されている、請求項1記載のシステム。
【1654】
(請求項3)
前記人工知能手段が、テキストだけでなく視覚的要素に対しても不適切な内容を判断し、差し替えることが可能であり、かつ、ユーザの感情状態に基づいて差し替える内容を調整することが可能である、請求項1記載のシステム。
【1655】
「感情エンジンを組み合わせた場合の応用例2」
【1656】
(請求項1)
利用者がアクセスするウェブサイトのコンテンツを受け取る手段と、受け取ったコンテンツが特定の利用者群に対して不適切な言い回しや画像であるかを判断する人工知能手段と、不適切な言い回しや画像を特定の利用者群に伝えられる言い回しや画像に差し替える手段と、利用者の感情状態を認識し、その感情状態に基づいて不適切な内容の差し替え方を調整する感情認識手段を含むシステム。
【1657】
(請求項2)
前記人工知能手段が、ウェブブラウザの拡張機能として実装されている、請求項1記載のシステム。
【1658】
(請求項3)
前記人工知能手段が、テキストだけでなく画像に対しても不適切な内容を判断し、差し替えることが可能である、請求項1記載のシステム。
【1659】
「感情エンジンを組み合わせた場合の実施例3」
【1660】
(請求項1)
デジタルコンテンツを受け取る手段と、
受け取ったコンテンツが特定のユーザーグループに対して不適切な言い回しや画像であるかを判断する人工知能手段と、
不適切な言い回しや画像を適切な言い回しや画像に自動的に差し替える手段と、
ユーザーの感情状態を検出する手段と、
検出された感情状態に基づいてコンテンツの表示を調整する手段を含むシステム。
【1661】
(請求項2)
前記人工知能手段が、画像認識技術を用いて画像コンテンツに含まれる不適切な内容を判断し、適切なコンテンツに差し替えることが可能である、請求項1記載のシステム。
【1662】
(請求項3)
前記人工知能手段が、ユーザーの感情状態に応じてコンテンツの選択や表示方法を調整し、ユーザーの現在の感情にマッチするコンテンツを優先的に表示する機能を有している、請求項1記載のシステム。
【1663】
「感情エンジンを組み合わせた場合の応用例3」
【1664】
(請求項1)
デジタルコンテンツを受け取る手段と、受け取ったコンテンツのユーザーの感情状態に基づいた適切性を判断するAI手段と、ユーザーの感情状態に適したコンテンツに差し替える手段と、ユーザーの表情をリアルタイムで分析する画像認識手段と、分析結果に基づいてユーザーの感情状態を判断する感情エンジン手段と、感情エンジンにより判断された感情状態に応じてコンテンツの選定と表示を優先順位付けするAI手段を含むシステム。
【1665】
(請求項2)
前記AI手段が、デバイスのアプリケーションとして実装されている、請求項1記載のシステム。
【1666】
(請求項3)
前記AI手段が、不適切なコンテンツをユーザーの感情状態に基づき選定された適切なコンテンツに差し替えることが可能である、請求項1記載のシステム。
【符号の説明】
【1667】
10、210、310、410 データ処理システム
12 データ処理装置
14 スマートデバイス
214 スマート眼鏡
314 ヘッドセット型端末
414 ロボット
【要約】 (修正有)
【課題】子どもがアクセスするウェブサイトのコンテンツを受け取り、その内容が子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言い回しや画像を、子どもに伝えられる言い回しや画像に差し替えるシステムを提供する
【解決手段】データ処理装置12及びスマートデバイス14を備えているデータ処理システムにおいて、データ処理装置12の特定処理部290による特定処理は、子どもがアクセスするウェブサイトのコンテンツを受け取る手段として、ブラウザのプラグインを用いる。プラグインは、ウェブサイトのコンテンツをリアルタイムで受け取り、その内容をAIに送信し、AIは、受け取ったコンテンツが子どもに対して不適切な言い回しや画像であるかを判断し、不適切な言葉を子どもが理解できる適切な言葉に、かつ、不適切な画像を子どもが見ても問題ない画像に差し替える。
【選択図】
図2