IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社コーエーテクモゲームスの特許一覧

特許7194559プログラム、情報処理方法、及び情報処理装置
<>
  • 特許-プログラム、情報処理方法、及び情報処理装置 図1
  • 特許-プログラム、情報処理方法、及び情報処理装置 図2
  • 特許-プログラム、情報処理方法、及び情報処理装置 図3
  • 特許-プログラム、情報処理方法、及び情報処理装置 図4
  • 特許-プログラム、情報処理方法、及び情報処理装置 図5
  • 特許-プログラム、情報処理方法、及び情報処理装置 図6
  • 特許-プログラム、情報処理方法、及び情報処理装置 図7A
  • 特許-プログラム、情報処理方法、及び情報処理装置 図7B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-14
(45)【発行日】2022-12-22
(54)【発明の名称】プログラム、情報処理方法、及び情報処理装置
(51)【国際特許分類】
   G10L 21/034 20130101AFI20221215BHJP
【FI】
G10L21/034
【請求項の数】 7
(21)【出願番号】P 2018199457
(22)【出願日】2018-10-23
(65)【公開番号】P2020067531
(43)【公開日】2020-04-30
【審査請求日】2021-08-03
(73)【特許権者】
【識別番号】595000427
【氏名又は名称】株式会社コーエーテクモゲームス
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】小池 雅人
【審査官】菊池 智紀
(56)【参考文献】
【文献】特開2008-065904(JP,A)
【文献】特開2004-029377(JP,A)
【文献】特開2012-104992(JP,A)
【文献】特開平11-126424(JP,A)
【文献】特開平10-254493(JP,A)
【文献】特開平05-204395(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G10L 13/00-13/10,21/0316-21/0364
G11B 20/10,27/00-27/36
A63F 13/00-13/98
IEEE Xplore
(57)【特許請求の範囲】
【請求項1】
第1のセリフの音声データの音量と、第2のセリフの音声データの音量との平均値が所定の値になるように、前記第1のセリフの音声データの音量と前記第2のセリフの音声データの音量とをそれぞれ同一の倍率で増加または減少させる第1調整部と、
前記第1のセリフの音声データの音量の平均値と前記所定の値との差が小さくなるように、前記第1のセリフの音声データの音量を、前記第1調整部により調整された前記第1のセリフの音声データの音量の平均値と前記所定の値との差に対して所定の割合、増加または減少させる第2調整部と、を有する情報処理装置。
【請求項2】
前記第2調整部は、
前記第1調整部により調整された前記第1のセリフの音声データの音量の平均値が前記所定の値よりも大きい場合、前記第1のセリフの音声データの音量を、前記第1調整部により調整された前記第1のセリフの音声データの音量の平均値と前記所定の値との差に対して前記所定の割合減少させ、
前記第1調整部により調整された前記第1のセリフの音声データの音量の平均値が前記所定の値よりも小さい場合、前記第1のセリフの音声データの音量を、前記第1調整部により調整された前記第1のセリフの音声データの音量の平均値と前記所定の値との差に対して前記所定の割合増加させる、
請求項1に記載の情報処理装置。
【請求項3】
前記所定の割合は、0.4から0.6までの範囲内の値である、
請求項1または2に記載の情報処理装置。
【請求項4】
前記第2調整部により調整された前記第2のセリフの音声データに、音量が所定の閾値以上となる時間帯がある場合、前記第2調整部により調整された前記第2のセリフの音声データの音量を、当該時間帯よりも前の時間から、時間の経過に従って小さくなる倍率で減少させる第3調整部を有する、
請求項1から3のいずれか一項に記載の情報処理装置。
【請求項5】
前記第3調整部は、
前記第2調整部により調整された前記第2のセリフの音声データの音量を、当該時間帯よりも後の時間から、時間の経過に従って大きくなる倍率で増加させる、
請求項4に記載の情報処理装置。
【請求項6】
情報処理装置が、
第1のセリフの音声データの音量と、第2のセリフの音声データの音量との平均値が所定の値になるように、前記第1のセリフの音声データの音量と前記第2のセリフの音声データの音量とをそれぞれ同一の倍率で増加または減少させる第1調整処理と、
前記第1のセリフの音声データの音量の平均値と前記所定の値との差が小さくなるように、前記第1のセリフの音声データの音量を、前記第1調整処理により調整された前記第1のセリフの音声データの音量の平均値と前記所定の値との差に対して所定の割合、増加または減少させる第2調整処理と、を実行する情報処理方法。
【請求項7】
情報処理装置に、
第1のセリフの音声データの音量と、第2のセリフの音声データの音量との平均値が所定の値になるように、前記第1のセリフの音声データの音量と前記第2のセリフの音声データの音量とをそれぞれ同一の倍率で増加または減少させる第1調整処理と、
前記第1のセリフの音声データの音量の平均値と前記所定の値との差が小さくなるように、前記第1のセリフの音声データの音量を、前記第1調整処理により調整された前記第1のセリフの音声データの音量の平均値と前記所定の値との差に対して所定の割合、増加または減少させる第2調整処理と、を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログラム、情報処理方法、及び情報処理装置に関する。
【背景技術】
【0002】
従来、コンピュータゲーム等において、ゲームの状況に応じて、ゲームのキャラクタのセリフを、予め録音されている音声(ボイス)により出力する技術が知られている(例えば、特許文献1を参照)。このセリフの音声は、例えば、スタジオで収録された後、職人の手作業により音量を手動でそれぞれ調整されていた。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2017-184842号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、職人の経験と勘に基づいて手作業により音量を調整するため、作業に手間がかかると共に、調整の品質にばらつきがあるという問題がある。
【0005】
そこで、一側面では、自動でより適切に音声を調整することができる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
一つの案では、情報処理装置が、第1のセリフの音声データの音量と、第2のセリフの音声データの音量との平均値が所定の値になるように、前記第1のセリフの音声データの音量と前記第2のセリフの音声データの音量とをそれぞれ同一の倍率で増加または減少させる第1調整部と、前記第1のセリフの音声データの音量の平均値と前記所定の値との差が小さくなるように、前記第1のセリフの音声データの音量を、前記第1調整部により調整された前記第1のセリフの音声データの音量の平均値と前記所定の値との差に対して所定の割合、増加または減少させる第2調整部と、を有する。
【発明の効果】
【0007】
一側面によれば、自動でより適切に音声を調整することができる。
【図面の簡単な説明】
【0008】
図1】実施形態に係る情報処理装置のハードウェア構成例を示す図である。
図2】実施形態に係る情報処理装置の機能ブロック図である。
図3】実施形態に係るセリフデータの一例を示す図である。
図4】実施形態に係る情報処理装置の処理の一例を示すフローチャートである。
図5】実施形態に係る各セリフの音量を調整する処理について説明する図である。
図6】実施形態に係る大音量低減処理の一例を示すフローチャートである。
図7A】実施形態に係る大音量低減処理の一例について説明する図である。
図7B】実施形態に係る大音量を低減するための倍率の一例について説明する図である。
【発明を実施するための形態】
【0009】
以下、図面に基づいて本発明の実施形態を説明する。
【0010】
<ハードウェア構成>
図1は、実施形態に係る情報処理装置10のハードウェア構成例を示す図である。図1に示す情報処理装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、インタフェース装置105、表示装置106、及び入力装置107等を有する。
【0011】
情報処理装置10での処理を実現するゲームプログラムは、記録媒体101によって提供される。ゲームプログラムを記録した記録媒体101がドライブ装置100にセットされると、ゲームプログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、ゲームプログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたゲームプログラムを格納すると共に、必要なファイルやデータ等を格納する。
【0012】
メモリ装置103は、例えば、DRAM(Dynamic Random Access Memory)、またはSRAM(Static Random Access Memory)等のメモリであり、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って情報処理装置10に係る機能を実現する。インタフェース装置105は、ネットワークに接続するためのインタフェースとして用いられる。表示装置106はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置107は、コントローラ等、キーボード及びマウス等、またはタッチパネル及びボタン等で構成され、様々な操作指示を入力させるために用いられる。
【0013】
なお、記録媒体101の一例としては、CD-ROM、DVDディスク、ブルーレイディスク、又はUSBメモリ等の可搬型の記録媒体が挙げられる。また、補助記憶装置102の一例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、又はフラッシュメモリ等が挙げられる。記録媒体101及び補助記憶装置102のいずれについても、コンピュータ読み取り可能な記録媒体に相当する。
【0014】
<機能構成>
次に、図2を参照し、情報処理装置10の機能構成について説明する。図2は、実施形態に係る情報処理装置10の機能ブロック図である。
【0015】
情報処理装置10は、記憶部11を有する。記憶部11は、例えば、補助記憶装置102等を用いて実現される。記憶部11は、セリフデータ111等を記憶する。
【0016】
図3は、実施形態に係るセリフデータ111の一例を示す図である。図3の例では、セリフデータ111には、ゲームID、キャラクタID、及びセリフID(音声ファイルID)に対応付けて、収録環境、音声ファイル、及び調整後の音声ファイルが記録されている。
【0017】
ゲームIDは、ゲームの識別情報である。なお、例えば、ゲーム専用機、パーソナルコンピュータ、スマートフォン、及びタブレット端末等の機器で当該ゲームがプレイヤーにより実行されると、ゲームの状況に応じて、声優等により発話された各セリフIDに係るセリフの音声が出力される。
【0018】
キャラクタIDは、当該ゲームにおいてセリフIDに係るセリフを話すキャラクタの識別情報である。セリフIDは、セリフの識別情報である。収録環境は、セリフIDに係るセリフを収録した環境に関する情報であり、例えば、声優等により発話された各セリフの音声を収録したスタジオ等の情報である。音声ファイルは、セリフIDに係るセリフの音声データである。調整後の音声ファイルは、当該音声データが情報処理装置10により調整された後のセリフIDに係るセリフの音声データである。
【0019】
また、情報処理装置10は、取得部12、第1調整部13、第2調整部14、及び第3調整部15を有する。これら各部は、情報処理装置10にインストールされた1以上のプログラムが、情報処理装置10のCPU104に実行させる処理により実現される。
【0020】
取得部12は、セリフデータ111に記憶されている、各セリフに対して録音された音声データを記憶部11から取得する。
【0021】
第1調整部13は、取得部12により取得された複数のセリフの音声データの音量の平均値が所定の値になるように、各セリフの音声データの音の強さ(音響インテンシティ)を、所定の倍率でそれぞれ増加または減少させる。なお、「音の強さ」とは、例えば、単位面積を通して伝わる音響パワーであり、単位はW/m等で表すことができる。また、「音量(音響インテンシティレベル)」とは、音の強さの値を、基準値との比の対数によって表現した量であり、単位はdB(デシベル)等で表すことができる。
【0022】
第2調整部14は、第1調整部13により調整された各セリフの音声データの音量を、各セリフの音声データの平均音量が当該所定の値に近づくように増加または減少させる。
【0023】
第3調整部15は、第2調整部14により調整された各セリフの音声データの音量を、最大音量が所定の閾値未満となるように調整する。
【0024】
<処理>
次に、図4及び図5を参照して、情報処理装置10の処理について説明する。図4は、実施形態に係る情報処理装置10の処理の一例を示すフローチャートである。図5は、実施形態に係る各セリフの音量を調整する処理について説明する図である。
【0025】
情報処理装置10は、セリフデータ111に記憶されている一のゲームに対するキャラクタ毎、及び収録環境毎の音声ファイル(音声データ)に対し、以下の処理をそれぞれ行う。キャラクタ毎に以下の処理を行うことにより、各キャラクタのセリフの音量が略均等化される。また、収録環境毎に以下の処理を行うことにより、収録環境の違いによるセリフの音量の違いを低減することができる。以下の説明で、セリフデータ111において、一のキャラクタ、及び一の収録環境に対応付けられた各セリフを、処理対象の各セリフと称する。
【0026】
ステップS1において、第1調整部13は、取得部12により取得された処理対象の全てのセリフの音声データの音量(dB)の平均値(平均音量)を算出する。これにより、例えば、一のキャラクタ等の全セリフの平均音量が算出される。ここで、セリフの音声データは、複数の周波数の波形が、時間的に変化するデータである。第1調整部13は、例えば、二乗平均平方根(Root Mean Square,RMS)により、平均音量を算出してもよい。または、第1調整部13は、例えば、ラウドネスに基づいて、平均音量を算出してもよい。なお、第1調整部13は、各セリフの音声データのうち、無音の区間を除去して、有音の区間での平均音量を算出してもよい。
【0027】
続いて、第1調整部13は、処理対象の全てのセリフの音声データの平均音量が所定の目標値(dB)となるように、処理対象の各セリフの音声データの音量を調整する(ステップS2)。これにより、各セリフの音量がより均等化されるため、プレイヤー(ゲームを行うユーザ)に、各セリフをより聞き取り易くすることができる。
【0028】
ここで、第1調整部13は、処理対象の各セリフの音声データの音の強さをそれぞれ同一の倍率で増加または減少させることにより、処理対象の各セリフの音声データの音量を調整してもよい。この場合、例えば、処理対象の全てのセリフの音声データの平均音量が58dBであり、平均音量の目標値が60dBであれば、第1調整部13は、処理対象の各セリフの音声データの音の強さをそれぞれ1.26倍に増加させることにより、処理対象の全てのセリフの音声データの平均音量を60dBにする。
【0029】
続いて、第2調整部14は、処理対象の各セリフの音声データ毎の平均音量をそれぞれ算出する(ステップS3)。続いて、第2調整部14は、所定の目標値と、処理対象の各セリフの音声データの平均音量との差の値を算出する(ステップS4)。
【0030】
続いて、第2調整部14は、算出した差の値に基づいて、当該差が小さくなるように、処理対象の各セリフの音声データの音量を調整する(ステップS5)。ここで、第2調整部14は、算出した差に対して所定の割合(例えば、半分。)だけ、処理対象の各セリフの音声データの音量を増加または減少させてもよい。なお、当該所定の割合は、例えば、0.4程度から0.6程度までの範囲内の値でもよい。
【0031】
例えば、当該所定の割合が0.5と設定されている場合、所定の目標値が60dBであり、処理対象のセリフの音声データの平均音量が54dBであれば、差が6dBであるから、第2調整部14は、当該セリフの音声データの平均音量を3dB増加させる。すなわち、この場合、第2調整部14は、当該セリフの音声データの音の強さを1.41倍に増加させる。この場合、図5に示すように、処理対象のセリフの音声の波形501を、所定の目標値502と、波形501の平均音量503との差の値の半分の値だけ平均音量504が増加した波形505に変更する。
【0032】
また、例えば、所定の目標値が60dBであり、処理対象のセリフの音声データの平均音量が62dBであれば、差が-2dBであるから、第2調整部14は、処理対象のセリフの音声データの平均音量を-1dB増加(1dB減少)させる。
【0033】
小さい声で発話されたセリフの音量と、大きい声で発話されたセリフの音量とが略同一になるように調整した場合、ぼそぼそしゃべっているような小さい声で発話されたセリフがすごく大きな声で発話されたような印象をユーザに与えてしまう場合がある。また、叫んでいるような大きい声で発話されたセリフがすごく小さな声で発話されたような印象をユーザに与えてしまう場合がある。ステップS5の処理により、小さい声で発話されたセリフの音量と、大きい声で発話されたセリフの音量との印象を逆転させずに、かつ、各セリフをより聞き取り易くすることができる。
【0034】
続いて、第3調整部15は、処理対象の各セリフの音声データに対して、所定の閾値以上となる音量を小さくするように調整(大音量低減処理)し(ステップS6)、処理を終了する。なお、第3調整部15は、調整した後の各セリフの音声データを、セリフデータ111の調整後の音声ファイルとして記録する。これにより、調整後の各セリフの音声データをゲーム等で利用できる。
【0035】
≪大音量低減処理≫
次に、図6図7A、及び図7Bを参照して、図4のステップS6の大音量低減処理について説明する。図6は、実施形態に係る大音量低減処理の一例を示すフローチャートである。図7Aは、実施形態に係る大音量低減処理の一例について説明する図である。図7Bは、実施形態に係る大音量を低減するための倍率の一例について説明する図である。以下の処理は、各セリフに対してそれぞれ実行される。
【0036】
ステップS101において、第3調整部15は、セリフの音声の時間経過に対する音量のうち、音量が所定の閾値以上となる時間帯が存在するか否かを判定する。なお、第3調整部15は、セリフの開始時点から終了時点までの間の音声データに対して、以下の処理を実行してもよい。または、第3調整部15は、セリフの開始時点から終了時点までの各時点において、各時点から所定時間(例えば、5秒)先の時点までの間の音声データに対して、ステップS101の処理をそれぞれ実行してもよい。
【0037】
音量が所定の閾値以上となる時間帯が存在しない場合(ステップS101でNO)、処理を終了する。
【0038】
音量が所定の閾値以上となる時間帯が存在する場合(ステップS101でYES)、第3調整部15は、当該時間帯の開始よりも前の時間から、徐々に小さくなる音の強さに対する倍率で音量を調整する(ステップS102)。続いて、第3調整部15は、当該時間帯が終了した時間から、徐々に大きくなる音の強さに対する倍率で音量を調整して元の音量まで戻し(ステップS103)、処理を終了する。
【0039】
第3調整部15は、図7Aの例では、ステップS102、及びステップS103の処理で、セリフの音声の波形701を解析し、セリフの音声の音量が閾値702以上となる時間703から時間704までの時間帯を判定する。
【0040】
そして、第3調整部15は、図7Bの音の強さに対する倍率の推移713ように、時間703よりも所定時間(例えば、2秒間)前の時間711から時間703まで、1からXまで徐々に小さくなる倍率を設定する。また、時間704から、時間704よりも所定時間(例えば、2秒間)後の時間712まで、Xから1まで徐々に大きくなる倍率を設定する。なお、第3調整部15は、当該時間帯における最少の倍率の値Xを、当該時間帯における波形701の最大値と閾値702との差に基づいて決定してもよい。この場合、例えば、第3調整部15は、当該時間帯における波形701の最大値が、閾値702以下となるように倍率の値Xを決定してもよい。具体的には、例えば、当該時間帯における波形701の最大値が70dBであり、閾値702が65dBの場合、差が5dBであるから、第3調整部15は、倍率の値Xを0.561(=1/1.78)と決定してもよい。図7Bの例では、第3調整部15は、音量が閾値702以上となる時間帯である時間703から時間704までの間、倍率の推移713において倍率の値をXで一定としている。これにより、音量を一定以下に保ちながら、音量が大きい時間帯のセリフの抑揚をより自然な感覚でユーザに認識させることができる。
【0041】
そして、第3調整部15は、図7Aのように、波形701の音量に、音の強さに対する倍率の推移713で設定された倍率を乗算することにより、音量の波形701を波形714のように調整する。これにより、音質への影響を低減しながら、音量を徐々に調整することができる。
【0042】
<変形例>
情報処理装置10の各機能部は、例えば1以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。
【0043】
以上、本発明の実施例について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
【符号の説明】
【0044】
10 情報処理装置
11 記憶部
111 セリフデータ
12 取得部
13 第1調整部
14 第2調整部
15 第3調整部
図1
図2
図3
図4
図5
図6
図7A
図7B