(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023082413
(43)【公開日】2023-06-14
(54)【発明の名称】データ処理装置
(51)【国際特許分類】
G06Q 50/18 20120101AFI20230607BHJP
【FI】
G06Q50/18 310
【審査請求】未請求
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2021196170
(22)【出願日】2021-12-02
(71)【出願人】
【識別番号】521528067
【氏名又は名称】株式会社ヨクスル
(74)【代理人】
【識別番号】100181250
【弁理士】
【氏名又は名称】田中 信介
(72)【発明者】
【氏名】林 勇志
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049CC32
(57)【要約】 (修正有)
【課題】音声データが改竄されているか否かを確認するデータ処理装置を提供する。
【解決手段】データ処理装置1は、音声データを入力する音声入力部20、音声データをテキストデータに変換するテキストデータ変換部(情報処理部10)、テキストデータをテキストファイルとして格納するテキストデータ格納部30a、テキストファイルのハッシュ値及びデータ処理装置自体の識別情報をメタ情報として生成するメタ情報生成部(情報処理部)、メタ情報をブロックチェーンネットワーク5へ送信する送信部40、ブロックチェーンネットワークからトランザクション識別情報を受信する受信部50及び受信したトランザクション識別情報をブロックチェーンネットワークに送信した後、ブロックチェーンネットワークからメタ情報を受信し、受信したメタ情報に基づいてテキストデータを復元し、テキストデータの改竄の有無を確認する改竄確認部(情報処理部)、を備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
音声データを入力する音声入力部と、
前記音声入力部で入力した前記音声データをテキストデータに変換するテキストデータ変換部と、
前記テキストデータ変換部で変換した前記テキストデータをテキストファイルとして格納するテキストデータ格納部と、
前記テキストデータ格納部に格納したテキストファイルのハッシュ値及びデータ処理装置自体の識別情報をメタ情報として生成するメタ情報生成部と、
前記メタ情報生成部で生成したメタ情報をブロックチェーンネットワークへ送信する送信部と、
前記メタ情報の送信後に前記ブロックチェーンネットワークからトランザクション識別情報を受信する受信部と、
前記受信部で受信した前記トランザクション識別情報を前記ブロックチェーンネットワークに前記送信部を介して送信した後、前記ブロックチェーンネットワークから前記受信部を介して前記メタ情報を受信し、該受信したメタ情報に基づいて前記テキストデータを復元し、前記テキストデータの改竄の有無を確認する改竄確認部と、
を備えたことを特徴とするデータ処理装置。
【請求項2】
請求項1に記載のデータ処理装置において、
前記メタ情報生成部は、
さらに、前記テキストファイルの識別情報、前記音声データの入力開始時刻、前記テキストファイルのパス、前記テキストファイルの長さ又は前記テキストデータのうち少なくとも1つをメタ情報として生成することを特徴とするデータ処理装置。
【請求項3】
請求項1又は請求項2に記載のデータ処理装置において、
前記テキストデータ変換部は、
使用不可である用語を予め登録する使用不可用語登録部を有し、
前記テキストデータに、使用不可用語登録部に登録された使用不可用語がある場合、その旨を提示部により提示することを特徴とするデータ処理装置。
【請求項4】
請求項1~請求項3の何れか1項に記載のデータ処理装置において、
前記テキストデータ変換部は、
使用を推奨する用語を予め登録する使用推奨用語登録部を有し、
前記テキストデータに、使用推奨用語登録部に登録された使用推奨用語がない場合、その旨を提示部により提示することを特徴とするデータ処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声データの改竄を防止するためのデータ処理装置に関する。
【背景技術】
【0002】
従来、著作権の管理を目的として、音楽のライブ会場における演奏を収音した音声データを音声装置で取得し、取得した音声データに含まれる1又は複数の楽曲を特定する管理サーバとを備えたシステムであって、管理サーバはブロックチェーンの台帳で管理されている特徴量と音声データから抽出した特徴量とを比較することにより楽曲を特定し、特製した楽曲の一覧を演奏リストとして著作権管理綾の管理者端末に送信する著作権管理システムがあった(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところが、上記従来の著作権管理システムでは、著作権の権利を目的としているため、楽曲が改竄されてるか否かには注目していない。したがって、取得する楽曲そのものを特定するための特徴量を、ある程度の範囲内であれば演奏された楽曲の著作権が侵害されているものと判断するための一助となっているだけであり、演奏されている楽曲に改竄があったか否かを判断することはできないという課題があった。
【0005】
本発明は、こうした課題に鑑みなされたもので、音声データが改竄されているか否かを確認することができるデータ処理システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上述の課題の少なくとも一部を解決するためになされたものであり、以下の適用例として実現することが可能である。なお、本欄における括弧内の参照符号や補足説明等は、本発明の理解を助けるために、後述する実施形態との対応関係を示したものであって、本発明を何ら限定するものではない。
【0007】
[適用例1]
適用例1に記載の発明は、
音声データを入力する音声入力部(20)と、
前記音声入力部(20)で入力した前記音声データをテキストデータに変換するテキストデータ変換部(10)と、
前記テキストデータ変換部(10)で変換した前記テキストデータをテキストファイルとして格納するテキストデータ格納部(30a)と、
前記テキストデータ格納部(30a)に格納したテキストファイルのハッシュ値及びデータ処理装置(1)自体の識別情報をメタ情報として生成するメタ情報生成部(10)と、
前記メタ情報生成部(10)で生成したメタ情報をブロックチェーンネットワーク(5)へ送信する送信部(40)と、
前記メタ情報の送信後に前記ブロックチェーンネットワーク(5)からトランザクション識別情報を受信する受信部(50)と、
前記受信部(50)で受信した前記トランザクション識別情報を前記ブロックチェーンネットワーク(5)に前記送信部(40)を介して送信した後、前記ブロックチェーンネットワーク(5)から前記受信部(50)を介して前記メタ情報を受信し、該受信したメタ情報に基づいて前記テキストデータを復元し、前記テキストデータの改竄の有無を確認する改竄確認部(10)と、
を備えたことを要旨とするデータ処理装置(1)である。
【0008】
このようなデータ処理装置(1)では、音声データがテキストデータに変換され、テキストファイルが作られる。また、テキストファイルのハッシュ値及びデータ処理装置(1)自体の識別情報をメタ情報としてブロックチェーンネットワーク(5)へ送信され、そのメタ情報に対応したトランザクション情報がブロックチェーンネットワーク(5)から受信される。
【0009】
また、受信したトランザクション情報をブロックチェーンネットワーク(5)へ送信することことによりメタ情報を、受信部(40)を介して受信し、受信したメタ情報に基づいてテキストデータを復元することができる。したがって、テキストデータ、つまり、音声データが改善されているか否かを確認することができる。
【0010】
[適用例2]
適用例2に記載のデータ処理装置(1)は、適用例1に記載のデータ処理装置(1)において、
前記メタ情報生成部(10)は、
さらに、前記テキストファイルの識別情報、前記音声データの入力開始時刻、前記テキストファイルのパス、前記テキストファイルの長さ又は前記テキストデータのうち少なくとも1つをメタ情報として生成することを要旨とする。
【0011】
このようなデータ処理装置(1)では、メタ情報の種類が増えるため、より正確に改竄の有無を確認することができる。
【0012】
[適用例3]
適用例3に記載のデータ処理装置(1)は、適用例1又は適用例2に記載のデータ処理装置(1)において、
前記テキストデータ変換部(10)は、
使用不可である用語を予め登録する使用不可用語登録部(30b)を有し、
前記テキストデータに、使用不可用語登録部(30b)に登録された使用不可用語がある場合、その旨を提示部(60)により提示することを要旨とする。
【0013】
このようなデータ処理装置(1)では、音声データに使用不可である用語、いわゆるNGワードとして登録した用語が使用されている場合にはその旨が提示されるため、再度音声データを取得するなどの対応が可能となる。したがって、便利なデータ処理装置(1)となる。
【0014】
[適用例4]
適用例4に記載のデータ処理装置(1)は、適用例1~適用例3の何れか1項に記載のデータ処理装置(1)において、
前記テキストデータ変換部(10)は、
使用を推奨する用語を予め登録する使用推奨用語登録部(30c)を有し、
前記テキストデータに、使用推奨用語登録部(30c)に登録された使用推奨用語がない場合、その旨を提示部(60)により提示することを要旨とする。
【0015】
このようなデータ処理装置(1)では、音声データに使用が推奨されている用語として登録した用語が使用されていない場合にはその旨が提示されるため、再度音声データを取得するなどの対応が可能となる。したがって、便利なデータ処理装置(1)となる。
【図面の簡単な説明】
【0016】
【
図1】データ処理装置の概略の構成をしめすブロック図である。
【
図2】情報処理部において実行される情報処理の流れを示す処理フロー図である。
【発明を実施するための形態】
【0017】
以下、本発明が適用された実施形態について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り種々の形態を取りうる。
【0018】
(データ処理装置の構成)
図1に基づき本発明を適用したデータ処理装置1の構成について説明する。
図1は、データ処理装置1の概略の構成を示すブロック図である。
図1に示すように、データ処理装置1は、情報処理部10、音声入力部20、格納部30、送信部40、受信部50及び提示部60を備えている。
【0019】
情報処理部10は、CPU10a、ROM10b、RAM10c、I/O10dなどを備えており、ROM10bや後述する格納部30に格納されたプログラムを実行し、音声入力部20、送信部40、受信部50あるいは提示部60などを制御する。
音声入力部20は、音声データを入力する装置であり、音声マイクや骨伝導マイクなどである。
【0020】
格納部30は、プログラムや各種のデータを格納しておく記憶装置であり、ハードディスクやSSDなどの外部記憶装置であり、後述するテキストデータ変換部で変換したテキストデータを格納するテキストデータ格納部30a、使用不可である用語を予め登録する使用不可用語登録部30b、使用を推奨する用語を予め登録する使用推奨用語登録部30cなどを有している。
【0021】
送信部40は、データ処理装置1からブロックチェーンネットワーク5へメタ情報、トランザクション識別情報を、ブロックチェーンネットワーク5のプロトコルに適合する形式にして送信するための装置である。
【0022】
受信部50は、ブロックチェーンネットワーク5からブロックチェーンネットワーク5のプロトコルに適合する形式に変換したメタ情報、トランザクション識別情報を受信するための装置である。
提示部60は、情報処理部で実行される処理に必要な作業員からの入力や処理の結果を提示する装置であり、キーボード、マウスなどの入力装置60a、液晶ディスプレイなどの表示装置60b、提示内容や入力結果などを印刷するためのプリンタなどの出力装置60cを備えている
【0023】
(情報処理部における処理)
次に、
図2及び
図3に基づき、情報処理部10において実行される処理内容について説明する。
図2は、情報処理部10において実行される情報処理の流れを示す処理フロー図であり、
図3は、メタ情報の種類を示す図である。
【0024】
図2に示すように、情報処理部10では、まず、S100においてCPU10aが音声入力部20から音声データを取得する。
【0025】
続くS105では,S100で入力した音声データをテキストデータに変換しテキストファイルとしてテキストデータ格納部30aに格納する。本実施形態では、テキストデータへの変換時には、Google Speech-to-Text APIを使用し、変換結果のRWAデータ(以下、テキスト結果RAWデータとも呼ぶ)とRWAデータからノイズ等を取り除いた最終的なテキスト変換結果(以下、このデータをテキストデータと呼ぶ)を得る。
【0026】
このテキスト変換の際、使用不可用語登録部30bや使用推奨用語登録部30cに格納されてるNG用語や使用推奨用語の有無を抽出し、NGワードが含まれている場合や使用推奨用語が含まれていない場には、その旨を提示部60に提示する。
【0027】
続くS110では、S105において得られたテキストデータなどから
図3に示すメタ―情報を抽出し、続くS115では、S110において抽出したメタ情報をブロックチェーンネットワーク5のプロトコルに適合する形式にし、送信部40からブロックチェーンネットワーク5へ送信する。
【0028】
続くS120では、S115において送信したメタ情報に対応したトランザクション識別情報をブロックチェーンネットワーク5から受信部50を介して受信する。
続くS125では、必要なトランザクション識別情報を、送信部40を介してブロックチェーンネットワーク5へ送信する。
【0029】
続くS130では、S125において送信したトランザクション識別情報を、ブロックチェーンネットワーク5を介して送信し、送信したトランザクション識別情報に対応したメタ情報をブロックチェーンネットワーク5から受信する。
【0030】
続くS135では、S130において受信したメタ情報から元の情報(テキストデータなど)を復元し、テキストデータ格納部30aに格納されている元データと比較し、改竄の有無を確認し、確認結果を提示部60で提示する。
【0031】
(データ処理装置の特徴)
以上に説明したデータ処理装置1は、音声データがテキストデータに変換され、テキストファイルが作られる。また、テキストファイルのハッシュ値及びデータ処理装置1自体の識別情報など各種メタ情報がブロックチェーンネットワーク5へ送信され、そのメタ情報に対応したトランザクション情報がブロックチェーンネットワーク5から受信される。
【0032】
また、受信したトランザクション情報をブロックチェーンネットワーク5へ送信することことによりメタ情報を、受信部50を介して受信し、受信したメタ情報に基づいてテキストデータを復元することができる。したがって、テキストデータ、つまり、音声データが改善されているか否かを確認することができる。
【0033】
また、メタ情報の種類を増やすことにより、より正確に改竄の有無を確認することができる。
さらに、音声データに使用不可である用語、いわゆるNGワードとして登録した用語が使用されている場合にはその旨が提示されるため、再度音声データを取得するなどの対応が可能となる。したがって、便利なデータ処理装置1となる。
【0034】
逆に、音声データに使用が推奨されている用語として登録した用語が使用されていない場合にはその旨が提示されるため、再度音声データを取得するなどの対応が可能となる。したがって、便利なデータ処理装置1となる。
【符号の説明】
【0035】
1 … データ処理装置 5 … ブロックチェーンネットワーク 10 … 情報処理部(テキストデータ変換部、メタ情報生成部、改竄確認部) 10a … CPU 10b … ROM 10c … RAM 10d … I/O 20 … 音声入力部 30 … 格納部 30a … テキストデータ格納部 30b … 使用不可用語登録部 30c … 使用推奨用語登録部 40 … 送信部 50 … 受信部 60 … 提示部 60a … 入力装置 60b … 表示装置 60c … 出力装置。