IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特開2023-173001手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム
<>
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図1
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図2
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図3
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図4
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図5
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図6
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図7
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図8
  • 特開-手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023173001
(43)【公開日】2023-12-07
(54)【発明の名称】手話単語時間長算出装置およびそのプログラム、ならびに、手話CG映像生成装置およびそのプログラム
(51)【国際特許分類】
   G06T 13/40 20110101AFI20231130BHJP
   G09B 21/00 20060101ALI20231130BHJP
【FI】
G06T13/40
G09B21/00 F
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022084923
(22)【出願日】2022-05-25
(71)【出願人】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】森田 祐介
【テーマコード(参考)】
5B050
【Fターム(参考)】
5B050BA08
5B050BA12
5B050CA07
5B050EA19
(57)【要約】
【課題】手話動作に対応した手話単語の時間長を算出することが可能な手話単語時間長算出装置を提供する。
【解決手段】手話単語時間長算出装置1は、手話単語全体の語彙数を要素数、手話単語列に出現する手話単語ごとの頻度を要素、とする単語頻度ベクトルを生成する単語頻度ベクトル生成部22と、手話単語列と手話単語列の手話動作の時間長とを対とするデータベースを用いて、単語頻度ベクトルと各手話単語の単語時間長を要素とする単語時間長ベクトルとの内積により手話単語列の時間長を表した多変数線形モデルを重回帰分析し、手話単語の時間長を算出する重回帰分析部23と、を備える
【選択図】図1
【特許請求の範囲】
【請求項1】
手話単語列と前記手話単語列の手話動作の時間長とを対とするデータベースから、個々の手話単語の手話動作の時間長を算出する手話単語時間長算出装置であって、
手話単語全体の語彙数を要素数、前記手話単語列に出現する手話単語ごとの頻度を要素、とする単語頻度ベクトルを生成する単語頻度ベクトル生成部と、
前記データベースを用いて、前記単語頻度ベクトルと各手話単語の単語時間長を要素とする単語時間長ベクトルとの内積により前記手話単語列の時間長を表した多変数線形モデルを重回帰分析し、前記手話単語の時間長を算出する重回帰分析部と、
を備えることを特徴とする手話単語時間長算出装置。
【請求項2】
前記重回帰分析部は、前記多変数線形モデルにおいて、前記手話動作の予測時間長と、前記データベースに記憶されている手話単語列の単語列時間長との誤差を最小化することで、前記手話単語の時間長を算出することを特徴とする請求項1に記載の手話単語時間長算出装置。
【請求項3】
コンピュータを、請求項1または請求項2に記載の手話単語時間長算出装置として機能させるための手話単語時間長算出プログラム。
【請求項4】
手話単語列と前記手話単語列の手話動作の時間長とを対とするデータベースから、重回帰分析により算出した個々の手話単語の手話動作の時間長を用いて、手話単語列から手話CG映像を生成する手話CG映像生成装置であって、
入力される手話単語列を構成する手話単語ごとに、手話単語に対応するモーションデータを用いて、手話動作をCGで表現した手話単語CG映像を生成する手話単語CG映像生成部と、
前記手話単語CG映像を、前記重回帰分析により算出された手話単語の手話動作の時間長となるように調整する時間長調整部と、
時間長を調整された前記手話単語CG映像を前記手話単語列の順に連結して前記手話CG映像を生成する映像連結部と、
を備えることを特徴とする手話CG映像生成装置。
【請求項5】
前記時間長調整部は、前記手話単語CG映像の時間長が対応する手話単語の時間長よりも短い場合、その時間長の差に相当するフレーム数を手話単語CG映像に均等に挿入し、前記手話単語CG映像の時間長が対応する手話単語の時間長よりも長い場合、その時間長の差に相当するフレーム数を手話単語CG映像から均等に削除することを特徴とする請求項4に記載の手話CG映像生成装置。
【請求項6】
コンピュータを、請求項4または請求項5に記載の手話CG映像生成装置として機能させるための手話CG映像生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、手話単語時間長算出装置およびそのプログラム、ならびに、手話CG生成装置およびそのプログラムに関する。
【背景技術】
【0002】
従来、聴覚障害者のために、手話通訳、手話放送といった手話サービスが一般的に行われている。
近年では、手話サービスの拡充のため、手話CG(コンピュータグラフィックス)を用いたCGアニメーションによる手話の研究が進められている。
手話CGは、基本的に、テキストを手話単語列に翻訳し、翻訳した手話単語列の個々の単語に対応する手話単語CGを連結することで生成される。
テキストを手話単語列に翻訳する手法として、例えば、放送映像(手話ニュース等)から日本語テキストと手話単語列とを書き起こした対訳対を生成し、その対訳対を用いて、任意の日本語テキストを手話単語列に翻訳する機械翻訳装置の技術が開示されている(特許文献1参照)。
また、手話単語CGを連結する手法としては、日本語テキストから変換(翻訳)した手話単語の手話モーションを、手話モーションデータベースから順番に読み出して接続することで、手話CGを生成する技術が開示されている(特許文献2参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2013-186673号公報
【特許文献2】特開2017-151757号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の手話モーションは、手話単語ごとに生成されたものである。また、従来の手法によって生成された手話CGは、翻訳された手話単語列の単語ごとに、単に手話単語CGを連結したものである。すなわち、従来の手話CGは、手話単語の順番だけが考慮され、手話動作中における単語ごとの再生時間が考慮されていない。
そのため、従来の手法で生成された手話CGを再生した場合、1つの手話単語CGが、一連の動作とは無関係な時間長で再生され、自然さに欠けるという問題がある。
このように、従来の手法で生成された手話CGは、自然さに欠けるため、聴覚に障害がある人にとって手話内容を理解し難いものとなっている。
【0005】
本発明は、このような問題に鑑みてなされたもので、一連の手話動作における個々の手話単語の時間長を算出することが可能な手話単語時間長算出装置およびそのプログラム、ならびに、手話単語ごとの時間長に対応して手話CG映像を生成することが可能な手話CG映像生成装置およびそのプログラムを提供することを課題とする。
【課題を解決するための手段】
【0006】
前記課題を解決するため、本発明に係る手話単語時間長算出装置は、手話単語列と前記手話単語列の手話動作の時間長とを対とするデータベースから、個々の手話単語の手話動作の時間長を算出する手話単語時間長算出装置であって、単語頻度ベクトル生成部と、重回帰分析部と、を備える構成とした。
【0007】
かかる構成において、手話単語時間長算出装置は、単語頻度ベクトル生成部によって、手話単語全体の語彙数を要素数、手話単語列に出現する手話単語ごとの頻度を要素、とする単語頻度ベクトルを生成する。
【0008】
そして、手話単語時間長算出装置は、重回帰分析部によって、データベースを用いて、単語頻度ベクトルと各手話単語の単語時間長を要素とする単語時間長ベクトルとの内積により手話単語列の時間長を表した多変数線形モデルを重回帰分析し、個々の手話単語の時間長を算出する。
なお、手話単語時間長算出装置は、コンピュータを、前記した各部として機能させるための手話単語時間長算出プログラムで動作させることができる。
【0009】
また、前記課題を解決するため、本発明に係る手話CG映像生成装置は、手話単語列と前記手話単語列の手話動作の時間長とを対とするデータベースから、重回帰分析により算出した個々の手話単語の手話動作の時間長を用いて、手話単語列から手話CG映像を生成する手話CG映像生成装置であって、手話単語CG映像生成部と、時間長調整部と、映像連結部と、を備える構成とした。
【0010】
かかる構成において、手話CG映像生成装置は、手話単語CG映像生成部によって、入力される手話単語列を構成する手話単語ごとに、手話単語に対応するモーションデータを用いて、手話動作をCGで表現した手話単語CG映像を生成する。これによって、手話単語ごとのCG映像が生成される。
【0011】
そして、手話CG映像生成装置は、時間長調整部によって、手話単語CG映像を、重回帰分析により算出された手話単語の手話動作の時間長となるように調整する。これによって、個々の手話単語CG映像の時間長は、一連の手話単語列の手話動作における個々の手話単語の手話動作の時間長と等しくなる。
そして、手話CG映像生成装置は、映像連結部によって、時間長を調整された手話単語CG映像を手話単語列の順に連結して手話CG映像を生成する。
なお、手話CG映像生成装置は、コンピュータを、前記した各部として機能させるための手話CG映像生成プログラムで動作させることができる。
【発明の効果】
【0012】
本発明によれば、複数の手話単語列の手話動作の時間長から、個々の手話単語の手話動作の時間長を算出することができる。また、本発明によれば、手話単語列から、個々の手話単語の動作時間が予め定めた時間長となる手話CG映像を生成することができる。
これによって、本発明は、一連の手話動作において、実際の手話動作と同じ時間長で個々の手話動作を自然に表現した手話CG映像を生成することができる。
【図面の簡単な説明】
【0013】
図1】本発明の第1実施形態に係る手話単語時間長算出装置の構成を示すブロック構成図である。
図2】単語列時間長記憶部の記憶内容を説明するための説明図である。
図3】単語時間長記憶部の記憶内容を説明するための説明図である。
図4】単語頻度ベクトル生成部が生成する単語頻度ベクトルの内容を説明するための説明図である。
図5】単語列時間長モデル化部が生成する単語時間長ベクトルの内容を説明するための説明図である。
図6】本発明の第1実施形態に係る手話単語時間長算出装置の動作を示すフローチャートである。
図7】本発明の第2実施形態に係る手話CG映像生成装置の構成を示すブロック構成図である。
図8】本発明の第2実施形態に係る手話CG映像生成装置の動作を示すフローチャートである。
図9】手話CG映像生成装置が生成する手話CG映像を模式的に説明するための説明図である。
【発明を実施するための形態】
【0014】
以下、本発明の実施形態について図面を参照して説明する。
≪第1実施形態≫
[手話単語時間長算出装置の構成]
図1を参照して、本発明の第1実施形態に係る手話単語時間長算出装置1の構成について説明する。
【0015】
手話単語時間長算出装置1は、手話単語列とその手話単語列の手話動作の時間長とを対とするデータベースから、個々の手話単語の手話動作の時間長を算出するものである。
手話単語時間長算出装置1は、記憶部10と制御部20とを備える。
【0016】
記憶部10は、ハードディスク、半導体メモリ等の一般的な記憶媒体である。
記憶部10は、単語列時間長記憶部11と単語時間長記憶部12と、を備える。
単語列時間長記憶部11および単語時間長記憶部12は、同じ記憶媒体内に領域を区分して記憶される構成であってもよいし、異なる記憶媒体に記憶される構成であってもよい。
【0017】
単語列時間長記憶部11は、コーパスとなる複数の日本語テキストTXと、日本語テキストTXを翻訳した手話単語列WSと、手話単語列WSに対応する手話動作の時間長(単語列時間長TWS)と、を予め対応付けて記憶したデータベースである。
手話単語列WSは、手話ニュース等の映像から、日本語テキストTXに対応して出現する手話単語を書き起こして生成することができる。また、単語列時間長TWSは、手話単語の書き起こしとともに、日本語テキストTXに対応する手話単語列WSの映像中の手話動作の実際の時間長を用いることができる。
【0018】
例えば、図2に示すように、ある日本語テキストTXが、「今夜までに降る雪の量は、いずれも多いところで…」の場合、それに対応する手話単語列WSは、例えば、「N,暗い,まで,雪,量,N,たくさん,場所,…」となる。なお、「N」は、うなずく動作を示す特殊記号であって、1つの単語として扱われる。
そして、手話単語列WSを構成するすべての手話単語W(N,暗い,まで,…)を手話で表現した時間を単語列時間長TWSとする。
【0019】
ここでは、説明を分かり易くするため、単語列時間長記憶部11に、日本語テキストTXと手話単語列WSと単語列時間長TWSとを対応付けて記憶している。しかし、本発明において、日本語テキストTXは必須ではない。すなわち、単語列時間長記憶部11には、少なくとも、手話単語列WSと単語列時間長TWSとが対応付けて記憶されていればよい。
また、手話単語列WSを構成する手話単語は、手話単語の語彙そのままでもよいし、語彙を識別する識別子であってもよい。
手話単語列WSの数、すなわち、日本語テキストTXの数は、十数万程度である。なお、すべての手話単語列WSによって、手話単語の語彙がすべて網羅されているものとする。手話単語の語彙数は一万程度である。
【0020】
単語時間長記憶部12は、手話単語Wと、1つの手話単語Wに対応する手話動作の時間長(単語時間長T)を記憶するものである。
単語時間長記憶部12には、語彙数分の手話単語Wと、手話単語Wごとの手話動作の単語時間長Tとが記憶される。
なお、手話単語Wは、手話単語の語彙そのままでもよいし、語彙を識別する識別子であってもよい。
【0021】
単語時間長Tは、重回帰分析部23の最適化対象のパラメータ値である。また、単語時間長Tは、単語時間長初期化部21によって初期化され、重回帰分析部23によって更新される。また、単語時間長Tは、重回帰分析部23によって参照される。
なお、ここでは、手話単語Wの単語時間長Tは、単語列時間長記憶部11に記憶されているすべての手話単語列WSにおいて、変動がないものと仮定する。すなわち、1つの手話単語Wは固有の時間長で動作すること仮定する。
【0022】
制御部20は、手話単語時間長算出装置1全体の制御を行うものである。制御部20は、ハードディスク、ROM等の記憶されたプログラム(手話単語時間長算出プログラム)をメモリに展開し、コンピュータ(CPU)がプログラムを読み込んで、以下に説明する各部として機能させる。
制御部20は、単語時間長初期化部21と、単語頻度ベクトル生成部22と、重回帰分析部23と、を備える。
【0023】
単語時間長初期化部21は、最適化対象の手話単語の時間長(単語時間長)を初期化するものである。単語時間長初期化部21は、単語時間長記憶部12に記憶される手話単語Wごとの単語時間長Tを初期化する。
単語時間長初期化部21は、図3に示すように、手話単語W,W,…,W(n:語彙数)に対して、単語時間長の初期値t1_0,t2_0,…,tn_0を設定する。
【0024】
なお、初期値には、ランダム値等、任意の値を用いればよい。しかし、時間長を最適化する点から、初期値には、手話単語の動作時間として、概ね適当な時間を用いた方が好ましい。
単語時間長初期化部21は、手話単語Wごとの単語時間長の初期値を単語時間長記憶部12に記憶する。
なお、単語時間長初期化部21は、起動時に1回だけ動作する。
【0025】
単語頻度ベクトル生成部22は、手話単語列WSごとに、手話単語全体の語彙数を要素数、手話単語列WSに出現する手話単語ごとの頻度を要素、とする単語頻度ベクトルを生成するものである。
ここでは、単語頻度ベクトル生成部22は、以下の式(1)に示すベクトル(単語頻度ベクトルv)を生成する。
【0026】
【数1】
【0027】
,c,…,c(n:語彙数)は、手話単語列WSに含まれる手話単語W,W,…,Wの数を示す。
例えば、手話単語列WSが図2で例示したものである場合、単語頻度ベクトル生成部22は、図4に示すように、手話単語列WSに含まれ手話単語の数を、手話単語と同じ要素位置に設定し、以下の式(2)に示す単語頻度ベクトルvを生成する。
【0028】
【数2】
【0029】
この場合、単語頻度ベクトルvは、手話単語「明るい」は0個、「暗い」は1個、…、「N」は2個を表すことになる。
単語頻度ベクトル生成部22は、生成した単語頻度ベクトルvを、重回帰分析部23に出力する。
【0030】
重回帰分析部23は、単語頻度ベクトルと各手話単語の単語時間長を要素とする単語時間長ベクトルとの内積により手話単語列の時間長を表した多変数線形モデルを重回帰分析し、個々の手話単語の時間長を算出するものである。
【0031】
重回帰分析部23は、手話単語全体の語彙数を要素数、手話単語の単語時間長のパラメータとなる説明変数を要素とする単語時間長ベクトルと、単語頻度ベクトルとの内積が、目的変数と等しくなる多変数線形モデルを重回帰分析する。
ここでは、重回帰分析部23は、図5に示すように、手話単語W,W,…,Wの語彙数nを要素数とし、説明変数である手話単語の時間長となるパラメータt,t,t,…,tを要素とした以下の式(3)に示す単語時間長ベクトルtを生成する。
【0032】
【数3】
【0033】
重回帰分析部23は、単語頻度ベクトル生成部22で生成された単語頻度ベクトルvと、単語時間長ベクトルtとの内積により、以下の式(4)に示す多変数線形モデルで手話動作時間を予測することができる。なお、Tは、ベクトルの転置を示す。
【0034】
【数4】
【0035】
重回帰分析部23は、手話単語列とその手話単語列の手話動作の時間長とを対とするデータベース(単語列時間長記憶部11)を用いて、重回帰分析を行う。これによって、重回帰分析部23は、多変数線形モデルの説明変数である手話単語の手話動作の時間長を算出することができる。
【0036】
重回帰分析部23における重回帰分析は、一般的な手法を用いればよい。
例えば、重回帰分析部23は、重回帰分析として、最小二乗法を用いることができる。
この場合、重回帰分析部23は、前記式(4)の多変数線形モデルにおいて、手話単語列の予測時間長(Tpred)と、単語列時間長記憶部11(データベース)に記憶されている手話単語列の単語列時間長(Ttrue)との誤差(残差平方和)が最小になるようなtの成分を算出すればよい。
なお、説明変数の数が膨大で、煩雑であるため、重回帰分析として勾配降下法を用いてもよい。すなわち、重回帰分析部23は、誤差を平均二乗誤差として、以下の式(5)に示す評価関数Eを最小化することでtの成分を算出することができる。
【0037】
【数5】
【0038】
ここで、tはi回目の更新時のそれぞれのパラメータt,t,t,…,tを示す。Nsは、単語列時間長記憶部11に記憶されている手話単語列WSの数(文章数)を示す。Ttrue(s)は、s番目の手話単語列WSの単語列時間長TWS(正解時間長Ttrue)を示す。Tpred(s)は、s番目の手話単語列WSの予測時間長Tpredを示す。
このパラメータt,t,t,…,tは、以下の式(6)により更新すればよい。
【0039】
【数6】
【0040】
ここで、αは勾配に応じてパラメータをどの程度更新するかを示す学習率(ハイパーパラメータ)である。
【0041】
以上の構成によって、手話単語時間長算出装置1は、複数の手話単語列WSの単語列時間長TWSから、手話動作に対応した手話単語の時間長を算出することができる。
【0042】
[手話単語時間長算出装置の動作]
次に、図6を参照(構成については、適宜図1参照)して、手話単語時間長算出装置1の動作について説明する。なお、単語列時間長記憶部11には、少なくとも手話単語列WSと、手話単語列WSに対応する手話動作の時間長(単語列時間長TWS)とが予め対応付けて記憶されているものとする。また、単語時間長記憶部12には、語彙数分の手話単語Wが予め記憶されているものとする。
【0043】
ステップS1において、単語時間長初期化部21は、単語時間長記憶部12に記憶される手話単語Wごとの単語時間長Tを初期化する。
ステップS2において、単語頻度ベクトル生成部22は、手話単語列WSごとに、手話単語の語彙数を要素数とし、手話単語列WSに含まれる手話単語の出現頻度を要素とする単語頻度ベクトルv(式(1)参照)を生成する。
【0044】
ステップS3において、重回帰分析部23は、手話単語の語彙数分の時間長のパラメータを要素とした単語時間長ベクトルt(式(3)参照)と、ステップS2で生成した単語頻度ベクトルvとの内積を手話単語列WSの予測時間長Tpredとする多変数線形モデル(式(4)参照)を重回帰分析し、手話単語の手話動作の時間長を算出する。
以上の動作によって、手話単語時間長算出装置1は、複数の手話単語列WSの単語列時間長TWSから、手話動作に対応した手話単語の時間長(単語時間長T)を算出することができる。
【0045】
≪第2実施形態≫
[手話CG映像生成装置の構成]
次に、図7を参照して、本発明の第2実施形態に係る手話CG映像生成装置3の構成について説明する。
【0046】
手話CG映像生成装置3は、手話単語時間長算出装置1(図1参照)で算出された手話単語ごとの単語時間長を用いて、手話単語列から手話CG映像を生成するものである。
すなわち、手話CG映像生成装置3は、手話単語列と手話単語列の手話動作の時間長とを対とするデータベースから、重回帰分析により算出した手話単語の手話動作の時間長を用いて、手話単語列から手話CG映像を生成するものである。
手話CG映像生成装置3は、記憶部30と制御部40とを備える。
【0047】
記憶部30は、ハードディスク、半導体メモリ等の一般的な記憶媒体である。
記憶部30は、モーションデータ記憶部31と単語時間長記憶部32と、を備える。
モーションデータ記憶部31および単語時間長記憶部32は、同じ記憶媒体内に領域を区分して記憶される構成であってもよいし、異なる記憶媒体に記憶される構成であってもよい。
【0048】
モーションデータ記憶部31は、手話単語Wに対応付けて、手話動作(手話モーション)を規定するモーションデータDを予め記憶したデータベースである。
モーションデータDは、手話動作における関節の動きを記述したデータである。例えば、モーションデータDは、関節を持つ骨格構造(ボーンモデル)と、各フレームにおける関節角度を羅列したデータであって、BVH(Biovision Hierarchy)形式で記述されたモーションキャプチャデータである。
モーションデータ記憶部31は、手話単語CG映像生成部41によって参照される。
【0049】
単語時間長記憶部32は、手話単語Wと、1つの手話単語Wに対応する手話動作の時間長(単語時間長)Tを予め記憶したものである。手話単語Wに対応する単語時間長Tは、図1で説明した手話単語時間長算出装置1で算出された時間長を用いる。
単語時間長記憶部32は、時間長調整部42によって参照される。
【0050】
なお、モーションデータ記憶部31および単語時間長記憶部32の手話単語Wは、手話単語の語彙そのままでもよいし、語彙を識別する識別子であってもよい。
また、モーションデータ記憶部31および単語時間長記憶部32は、手話単語Wに、モーションデータDと単語時間長Tとを対応付けた1つのデータベースであっても構わない。
【0051】
制御部40は、手話CG映像生成装置3全体の制御を行うものである。制御部40は、ハードディスク、ROM等の記憶されたプログラム(手話CG映像生成プログラム)をメモリに展開し、コンピュータ(CPU)がプログラムを読み込んで、以下に説明する各部として機能させる。
制御部40は、手話単語CG映像生成部41と、時間長調整部42と、映像連結部43と、を備える。
【0052】
手話単語CG映像生成部41は、入力される手話単語列WSを構成する手話単語ごとに、手話動作をCGで表現した手話単語CG映像Iを生成するものである。
手話単語CG映像生成部41は、モーションデータ記憶部31から、手話単語列WSを構成する手話単語Wに対応するモーションデータDを読み出す。そして、手話単語CG映像生成部41は、モーションデータDで記述された関節の動きに応じたCG映像(手話単語CG映像I)を生成する。
手話単語CG映像生成部41は、生成した手話単語CG映像Iを、手話単語とともに時間長調整部42に出力する。
【0053】
時間長調整部42は、手話単語CG映像生成部41で生成された手話単語CG映像Iの時間長を、手話単語に対応する単語時間長となるように調整するものである。
ここでは、時間長調整部42は、手話単語CG映像Iに対応する手話単語Wの単語時間長Tを単語時間長記憶部32から読み出し、手話単語CG映像Iの時間長を単語時間長Tと一致させるよう調整する。
【0054】
すなわち、時間長調整部42は、手話単語CG映像Iの時間長が対応する手話単語Wの単語時間長Tよりも短い場合、その時間長の差に相当するフレーム数を手話単語CG映像Iに均等に挿入することで、時間長を長くする。
例えば、手話単語CG映像Iのフレーム数がMフレーム、時間長の差に相当するフレーム数がmフレームの場合、時間長調整部42は、手話単語CG映像IのM/mフレームの映像区間ごとに最終フレームの後ろに最終フレームをコピーしてフレームを挿入する。
【0055】
また、時間長調整部42は、手話単語CG映像Iの時間長が対応する手話単語Wの単語時間長Tよりも長い場合、その時間長の差に相当するフレーム数を手話単語CG映像Iから均等に削除することで、時間長を短くする。
例えば、手話単語CG映像のフレーム数がMフレーム、時間長の差に相当するフレーム数がmフレームの場合、時間長調整部42は、手話単語CG映像IのM/mフレームの映像区間ごとに任意のフレーム(例えば、最終フレーム)を削除する。
【0056】
これによって、時間長調整部42は、手話単語CG映像Iの時間長を、単語時間長記憶部32に記憶されている手話単語Wに対応する単語時間長Tに合わせることができる。
時間長調整部42は、時間長を調整した手話単語CG映像Iを映像連結部43に出力する。
【0057】
映像連結部43は、時間長調整部42で時間長を調整された手話単語CG映像Iを手話単語列の順に連結するものである。
映像連結部43は、手話単語列WSの単語数分、手話単語CG映像Iを連結することで、手話単語列WSに対応する手話CG映像IWSを生成する。
以上の構成によって、手話CG映像生成装置3は、手話単語列から、実際の手話のリズムに近い動作となる手話CG映像を生成することができる。
【0058】
[手話CG映像生成装置の動作]
次に、図8を参照(構成については、適宜図7参照)して、手話CG映像生成装置3の動作について説明する。なお、モーションデータ記憶部31には、予め手話単語Wに対応付けてモーションデータDが記憶されているものとする。また、単語時間長記憶部32には、予め手話単語Wに対応付けて単語時間長Tが記憶されているものとする。
【0059】
ステップS10において、手話単語CG映像生成部41は、入力される手話単語列WSを構成する手話単語Wごとに、モーションデータ記憶部31に記憶されているモーションデータDを用いて、手話動作をCGで表現した手話単語CG映像Iを生成する。
ステップS11において、時間長調整部42は、ステップS10で生成された手話単語CG映像Iの時間長を調整する。
ここでは、時間長調整部42は、手話単語CG映像Iの時間長を、手話単語Wが対応する単語時間長記憶部32に記憶されている単語時間長Tと一致させるよう調整する。
【0060】
ステップS12において、時間長調整部42は、入力された手話単語列WSのすべての手話単語について時間長の調整が終了したか否かを判定する。
ここで、まだ、すべての手話単語について、手話単語CG映像Iの生成および時間長の調整を行っていない場合(ステップS12でNo)、時間長調整部42は、ステップS10に動作を戻し、次の手話単語について処理を続ける。
【0061】
一方、すべての手話単語について、手話単語CG映像Iの生成および時間長の調整を行った場合(ステップS12でYes)、映像連結部43は、ステップS11で時間長を調整されたすべての手話単語CG映像Iを連結する。
これによって、映像連結部43は、手話単語列に対応する手話CG映像を生成する。
以上の動作によって、手話CG映像生成装置3は、手話単語CG映像の時間長を、手話単語時間長算出装置1で算出された手話単語の時間長で調整した手話CG映像を生成することができる。
【0062】
例えば、手話CG映像生成装置3は、図2で例示した手話単語列WS「N,暗い,まで,雪,量,N,たくさん,場所,…」を入力した場合、図9に示すように、手話単語Wごとに、予め定めた単語時間長Tの手話単語CG映像Iを生成し、連結することで、手話CG映像IWSを生成する。これによって、手話CG映像生成装置3は、例えば、「N」の手話動作は0.32秒、「暗い」の手話動作は0.58秒のように、個々の手話動作の時間長に合わせて手話CG映像IWSを生成することができる。
これによって、手話CG映像生成装置3は、実際の手話のリズムに近い手話CG映像を生成することができる。
以上、本発明の実施形態について説明したが、本発明は、これらの実施形態に限定されるものではない。
例えば、手話単語時間長算出装置1、手話CG映像生成装置3は、それぞれ内部に記憶部10,30を備える構成としたが、記憶部10,30は、外部に記憶装置として分離してもよい。
【符号の説明】
【0063】
1 手話単語時間長算出装置
10 記憶部
11 単語列時間長記憶部(データベース)
12 単語時間長記憶部
20 制御部
21 単語時間長初期化部
22 単語頻度ベクトル生成部
23 重回帰分析部
3 手話CG映像生成装置
30 記憶部
31 モーションデータ記憶部
32 単語時間長記憶部
40 制御部
41 手話単語CG映像生成部
42 時間長調整部
43 映像連結部
図1
図2
図3
図4
図5
図6
図7
図8
図9