【文献】
長谷川 達人,過去の設定情報を活用したAndroidスマートフォンの音量設定自動化手法,情報処理学会 研究報告 モバイルコンピューティングとユビキタス通信(MBL),2013年12月12日,2013−MBL−069,P4,P5
(58)【調査した分野】(Int.Cl.,DB名)
各種のセンサ情報に基づいて推定される状況であって、音声を再生する音声出力装置を利用する利用者の状況ごとに、当該音声出力装置の音量に関連する音量操作を学習する学習部と、
前記学習部の学習結果と前記音声出力装置が音声を再生する際の前記利用者の状況とに応じて、前記音声出力装置が音声を再生する際の再生態様を決定する決定部と、
前記決定部が決定した再生態様で音声を再生するように前記音声出力装置を制御する制御部と
を有することを特徴とする情報処理装置。
前記決定部は、再生対象となる音声の種別がサウンドロゴである場合は、前記再生態様として、当該サウンドロゴを所定の音量で再生する態様を決定することを特徴とする請求項4に記載の情報処理装置。
前記決定部は、再生対象となる音声の種別が背景音である場合は、前記学習部の学習結果に応じて、前記再生態様を決定することを特徴とする請求項4または5に記載の情報処理装置。
前記決定部は、再生対象となる音声の種別がナレーションである場合は、前記再生態様として、当該ナレーションを消音状態とする態様又は音量を徐々に上昇させる態様を決定することを特徴とする請求項4〜6のうちいずれか1つに記載の情報処理装置。
各種のセンサ情報に基づいて推定される状況であって、音声を再生する音声出力装置を利用する利用者の状況ごとに、当該音声出力装置の音量に関連する音量操作を学習する学習手順と、
前記学習手順での学習結果と前記音声出力装置が音声を再生する際の前記利用者の状況とに応じて、前記音声出力装置が音声を再生する際の再生態様を決定する決定手順と、
前記決定手順で決定した再生態様で音声を再生するように前記音声出力装置を制御する制御手順と
をコンピュータに実行させるための制御プログラム。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、制御方法および制御プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、制御方法および制御プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
〔1.配信サーバの一例〕
まず、
図1を用いて、実施形態において情報処理装置の一例である配信サーバの一例について説明する。
図1は、実施形態に係る配信サーバの一例を示す図である。なお、以下の説明では、配信装置の一例である配信サーバ10によって、利用者Aの情報を収集する収集処理、端末装置100の利用者Aの情報を用いて端末装置100がコンテンツに含まれる音声を再生する際の再生態様を決定する決定処理と、決定処理によって決定された再生態様でコンテンツに含まれる音声の制御をおこなう制御処理とを実行する処理の一例を示す。
【0011】
なお、
図1に示す例では、端末装置100の利用者の一例として、利用者Aを記載したが、実施形態は、これに限定されるものではなく、情報処理装置は、任意の数の端末装置および任意の数の利用者について収集処理、決定処理および制御処理を実行することができる。
【0012】
また、以下の説明では、配信サーバ10は、端末装置100が広告に関するコンテンツを再生する際の音量を制御する処理の一例について説明するが、実施形態は、これに限定されるものではなく、音声が含まれるコンテンツであれば、音声のみのコンテンツや映画などの動画コンテンツ等任意のコンテンツについて後述する処理を適用することができる。
【0013】
なお、コンテンツは、広告だけではなく、ボランティアの募集、公共広告、公共に対する通知、その他任意のコンテンツであってもよい。すなわち、コンテンツは、利用者に興味を抱かせ、かかるコンテンツに含まれる情報またはかかるコンテンツと関連するコンテンツ(例えば、ランディングページ等)に含まれる情報を広く知らせるものであれば、文字、図形、記号、ハイパーリンク、その他任意のコンテンツを適用可能である。
【0014】
また、コンテンツは、音声商標等、企業や広告対象商品を想起させる任意の音声、すなわちサウンドロゴが含まれもよい。また、コンテンツは、人間あるいは音声合成技術により作成された言語の音声、すなわちナレーションが含まれてもよい。また、コンテンツは、BGM等、他の音声を修飾または補助する背景音や、利用者の操作やコンテンツ上の演出時に出力される効果音が含まれてもよい。また、コンテンツは、音声を含む動画像に限定されるものではなく、例えば、音声と静止画像との組み合わせ、ゲーム等音声を含む任意のコンテンツ、ライブ映像等、音声を含む任意のコンテンツが適用可能である。また、コンテンツは、利用者により投稿された動画像コンテンツや、映画やアニメ等の無償または有料のコンテンツであってもよい。
【0015】
配信サーバ10は、端末装置100に対して音声を含むコンテンツの配信を行うウェブサーバ等の情報処理装置である。例えば、配信サーバ10は、インターネット等のネットワークNを介して、利用者Aが使用する端末装置100からコンテンツの配信要求を受信すると、音声を含む動画像であるコンテンツを端末装置100へ送信する。
【0016】
端末装置100は、スマートフォンやタブレット等のスマートデバイスであり、3G(Generation)やLTE(Long Term Evolution)等の無線通信網を介して任意のサーバ装置と通信を行うことができる携帯端末装置である。また、端末装置100は、後述するように、液晶ディスプレイ等の表示面を有する。なお、端末装置100には、タッチパネルが採用されているものとする。すなわち、端末装置100の利用者は、指や専用ペンで表示面をタッチすることにより各種操作を行う。
【0017】
なお、端末装置100は、デスクトップ型のPC(Personal Computer)やノート型のPC、ネットブック、サーバ装置などの情報処理装置であってもよい。また、端末装置100は、端末装置100に設置された画面ではなく、他の情報表示装置に情報を表示する機能を有していてもよい。また、端末装置100は、マウスやキーボードなどの情報入力装置を介して各種操作を受け付けてもよい。
【0018】
ここで、端末装置100は、利用者の操作によりウェブページなどのウェブコンテンツを表示する場合は、ウェブコンテンツの配信を行うサーバに対してウェブコンテンツの配信要求を送信する。かかる場合、端末装置100は、ウェブコンテンツの配信を受け付けると、ウェブコンテンツ内に配置される動画像等のコンテンツの配信要求を配信サーバ10に送信する。
【0019】
かかる場合、配信サーバ10は、コンテンツを端末装置100に配信する。そして、端末装置100は、配信サーバ10から受け付けたコンテンツをウェブエージ内に配置し、所定の条件に従って、コンテンツの再生を行う。例えば、端末装置100は、利用者が表示されたコンテンツをタップしたりカーソルをコンテンツの表示位置と合わせる等、コンテンツの選択操作を行った場合や、コンテンツのサムネイルのうち所定の領域が画面内に表示された場合等には、コンテンツの再生を行う。すなわち、端末装置100は、コンテンツに含まれる音声データを出力するとともに、コンテンツに含まれる動画像の再生を行う。また、端末装置100は、コンテンツの再生中に利用者がコンテンツの選択操作を行った場合や、コンテンツのうち所定の領域が画面外まで移動した場合は、コンテンツの再生を一時的に停止する。
【0020】
〔2.配信サーバ10が実行する処理〕
ここで、従来技術では、端末装置100は、動画像や音声コンテンツ等、音声を含むコンテンツの再生を行う際、利用者が予め設定した音量に従って、音声の再生を行っていた。例えば、端末装置100は、画像解析等により利用者の視線を検知し、利用者の視線が画面内に向けられている場合にのみ、利用者が予め設定した音量で、音声の再生を行った。また、端末装置100は、周囲の騒音が所定の閾値よりも大きい場合には、所定の音量で音声の再生を行った。
【0021】
しかしながら、上述した従来技術では、利用者の利便性が悪化する場合がある。例えば、従来技術では、利用者が音量を消音状態に設定していない場合には、電車の中や公共の場所等で音声を出力してしまう場合がある。また、着信時等の音量とコンテンツ再生時の音量とを個別に設定する端末装置では、利用者が着信時等の音量を消音状態に設定していたとしても、コンテンツ再生時に音声を出力してしまう場合がある。
【0022】
また、ウェブページ上に音声を含む動画コンテンツを配置し、動画コンテンツが画面内に表示された場合には、動画コンテンツの再生を自動で開始する技術やウェブページの表示とともに音声を再生する技術が広がりを見せており、従来技術では、不適切な対応で音声を再生する事象が増えると予測される。
【0023】
そこで、配信サーバ10は、以下の処理を実行する。まず、配信サーバ10は、端末装置100を使用する利用者Aの情報を収集し、収集した利用者Aの情報に基づいて、利用者Aが使用する端末装置100の音量に関連する音量操作を学習する学習処理を実行する。また、配信サーバ10は、学習処理の学習結果に応じて、端末装置100がコンテンツに含まれる音声を再生する際の再生態様を決定する決定処理を実行する。そして、配信サーバ10は、決定処理で決定した再生態様でコンテンツに含まれる音声を制御する制御処理を実行する。
【0024】
〔2−1.利用者Aの情報について〕
ここで、配信サーバ10が学習処理で用いる利用者Aの情報の一例について説明する。配信サーバ10は、利用者Aの情報として、利用者Aの属性を示す属性情報や、利用者Aと関連付けられる任意のログ情報を収集する。例えば、ログ情報には、端末装置100やウェアラブルデバイス等、利用者Aが使用する情報処理装置が取得可能なログ情報や、その他任意のサーバが収集したログであって、利用者Aと関連付けられる任意のログが含まれる。具体的な例を挙げると、ログ情報には、利用者がウェブ上で行った検索や閲覧サイトの履歴を示すログ、任意の商品についての資料請求を行った旨を示すログ、ウェブ上の掲示板やウェブログ等で行われた発言の履歴を示すログ等が含まれる。すなわち、ログ情報には、インターネットを通じて取得可能な利用者Aの行動の履歴、インターネットを通じて利用者Aが入力した情報等、取得可能な任意の情報が含まれる。
【0025】
また、ログ情報には、GPS(Global Positioning System)やiBeacon等を用いて端末装置100や利用者Aが使用するウェアラブルデバイス等が取得した位置の履歴を示すログ、利用者のクレジットカードやウェブ上の銀行口座等の使用履歴、利用者が購入した商品の履歴等が含まれてもよい。すなわち、ログ情報には、利用者の現実世界における行動の履歴、いわゆるライフログが含まれてもよい。
【0026】
また、ログ情報には、端末装置100に対する操作に関連するログ、端末装置100の音量を操作する音量操作のログ、端末装置100の傾き等、端末装置100が有する各種センサが取得した端末装置100の物理的な状態に関連するログ、フェリカ(登録商標)等端末装置100が有する機能の使用履歴を示すログ、端末装置100が接続したネットワークを示すログ、端末装置100が近距離無線通信やインターネットを介して行った周囲の端末装置との通信履歴を示すログ、端末装置100が表示したウェブコンテンツの種別や内容等、端末装置100が有する任意の機能の履歴を示すログ、すなわち、端末装置100におけるログ情報が含まれていてもよい。
【0027】
また、属性情報には、利用者Aが予め登録した年齢、性別、収入、家族構成など、利用者Aや利用者Aに関連する任意の情報が含まれてもよい。また、属性情報には、ログ情報、クレジットカードや銀行口座等の使用履歴、ポイントの付与または使用の履歴、利用者Aが購入した商品の履歴、登録済みの属性情報から推定された利用者を示す属性情報が含まれてもよい。
【0028】
このように、配信サーバ10は、利用者Aに関連する任意の情報を利用者Aの情報として収集する。なお、配信サーバ10は、利用者Aの情報を任意の手法で取得することができる。例えば、配信サーバ10は、HTTPクッキー(Hyper Text Transfer Protocol Cookie)により、上述した各種情報を、端末装置100や、端末装置100がアクセスした任意のサーバから取得してもよい。また、例えば、配信サーバ10は、利用者Aの情報を収集するログサーバやその他任意のサーバ等から取得してもよい。
【0029】
〔2−2.学習処理について〕
続いて、配信サーバ10が実行する学習処理の一例について説明する。配信サーバ10は、利用者情報を収集すると、収集した利用者情報に基づいて、端末装置100の音量に関連する操作である音量操作を学習する学習処理を実行する。具体的には、配信サーバ10は、収集したログ情報や属性情報に基づいて、端末装置100に対する音量操作のパターンを学習する。例えば、配信サーバ10は、ログ情報から音量を増加させる操作、減少させる操作、消音させる操作、音量の設定値を指定する操作、音量の設定値を示す情報等の音量操作を抽出する。すなわち、音量操作とは、音量を設定する操作だけではなく、音量の設定値そのものを含む概念である。
【0030】
そして、配信サーバ10は、抽出した音量操作が行われた時刻、音量操作と前後して取得されたログ情報の共通性、音量の増加、減少または消音させる周期性、属性情報から予測される利用者の性質等から、端末装置100における音量操作と任意の条件との間に生じる共起性の学習を行う。この結果、配信サーバ10は、時刻、位置、端末装置100に対する操作、端末装置100が有する機能の使用、利用者の属性情報から予測される利用者の性質等に基づく所定の条件と、かかる条件が満たされる状態において行われる音声操作とを関連付けた学習結果を生成する。
【0031】
以下、配信サーバ10が実行する学習処理の一例について説明する。例えば、配信サーバ10は、取得した利用者Aの情報から端末装置100の状況と音量操作とを特定し、特定した端末装置100の状況とかかる状況における音量操作とを関連付けて学習する。具体的な例を挙げると、配信サーバ10は、端末装置100の傾きを示すログ情報や端末装置100に対する操作を示すログ情報等に基づいて、利用者Aが横たわっている状態や利用者Aが座っている状態等、利用者Aの状況を特定し、特定した状況における音量操作を学習する。なお、利用者Aの状況とは、利用者Aが置かれている状況であり、利用者Aの姿勢や血圧、利用者Aの位置、利用者Aが乗車している乗り物、利用者Aの周囲の雑音の大きさ等、利用者Aの生体的な情報、利用者Aの地理的な情報、利用者Aの周囲の情報等であってもよい。
【0032】
そして、配信サーバ10は、利用者Aの状況と、状況ごとに学習した音量操作とを関連付けた学習結果を作成する。なお、配信サーバ10は、上述した例以外にも、ログ情報や属性情報から特定することができる利用者Aの状態であれば、任意の状態ごとに音量操作の学習を行ってよい。
【0033】
また、他の例では、配信サーバ10は、取得した利用者Aの情報から端末装置100に対する操作と音量操作とを特定し、特定した端末装置100に対する操作と音量操作とを関連付けて学習する。具体的な例を挙げると、配信サーバ10は、端末装置100における通話履歴、ゲーム、メディアプレイヤー、メッセンジャー等のアプリケーションの起動、その他任意の操作を特定し、かかる操作が行われた際の音量操作もしくはかかる操作が行われた際と前後して行われた音量操作を学習する。そして、配信サーバ10は、特定した操作と、操作ごとに学習した音量操作とを関連付けた学習結果を作成する。なお、配信サーバ10は、例えば、第1の操作が行われた後で第2の操作が行われた際の音量操作等、複数の操作の組合せごとに音量操作を学習してもよい。
【0034】
また、他の例では、配信サーバ10は、取得した利用者Aの情報から利用者Aの位置と音量操作とを特定し、特定した位置と音量操作とを関連付けて学習する。具体的な例を挙げると、配信サーバ10は、ログ情報から端末装置100の位置や利用者Aの位置を特定し、特定した位置における音量操作を学習する。そして、配信サーバ10は、特定した位置と、位置ごとに学習した音量操作とを関連付けた学習結果を作成する。なお、配信サーバ10は、位置に係るログ情報を取得した装置ごとに、音量操作の学習を行ってもよい。
【0035】
また、他の例では、配信サーバ10は、取得した利用者Aの情報から端末装置100が接続するネットワークと音量操作とを特定し、特定したネットワークと、かかるネットワークに端末装置100が接続する際の音量操作とを関連付けて学習する。具体的な例を挙げると、配信サーバ10は、端末装置100が広域通信網に接続する際にアクセスするアクセスポイント、Wi−Fiネットワーク、端末装置100がネットワークNにアクセスする際のゲートウェイサーバのIP(Internet Protocol)アドレス等、端末装置100が接続したネットワークをログ情報から特定する。また、配信サーバ10は、特定したネットワークに接続する際の音量操作を学習する。そして、配信サーバ10は、ネットワークと、ネットワークごとに学習した音量操作とを関連付けた学習結果を作成する。
【0036】
また、他の例では、配信サーバ10は、端末装置100を用いた入退場の履歴と音量操作とを特定し、特定した入退場の履歴と音量操作とを関連付けて学習する。例えば、配信サーバ10は、フェリカ(登録商標)等、端末装置100が有する非接触型の通信機能の使用履歴から、駅の改札の入退場、バス等の公共交通機関の乗車や降車、ビル等の施設への入退場等の履歴を特定する。また、配信サーバ10は、特定した入退場の履歴ごとに音量操作を学習する。そして、配信サーバ10は、入退場等の履歴ごとに学習した音量操作と、入退場等の履歴とを関連付けた学習結果を作成する。例えば、配信サーバ10は、フェリカ(登録商標)等の機能を用いて駅の改札を入場した際と前後して行われた音量操作を学習し、駅の改札を入場した旨と、学習した音量操作とを関連付けた学習結果を作成する。
【0037】
なお、配信サーバ10は、上述した学習処理以外にも、任意の条件とかかる条件における音量操作とを関連付けて学習することができる。例えば、配信サーバ10は、所定の時間帯ごとに音量操作を学習してもよい。また、配信サーバ10は、例えば、端末装置100の使用履歴、端末装置100が再生するコンテンツ、端末装置100が表示するウェブページ、端末装置100の物理的な状態、端末装置100の周囲に位置する他の端末装置における音量等と関連付けて音量操作を学習することができる。すなわち、配信サーバ10は、端末装置100や利用者Aに係る任意の条件ごとに、音量操作を学習することができる。
【0038】
〔2−3.決定処理について〕
続いて、配信サーバ10が実行する決定処理の一例について説明する。例えば、配信サーバ10は、コンテンツの配信要求を受信した場合は、学習処理の結果学習した学習結果に応じて、コンテンツに含まれる音声を再生する際の再生態様を決定する。より具体的には、配信サーバ10は、コンテンツの配信要求を受信すると、利用者Aの情報を用いて、コンテンツを配信する際の端末装置100や利用者Aの状態等の条件を特定する。そして、配信サーバ10は、学習結果から、特定した状態と関連付けられた音量操作を特定し、特定した音量操作に応じて、コンテンツに含まれる音声を再生する際の再生態様を決定する。
【0039】
例えば、配信サーバ10は、コンテンツの配信要求を受信すると、配信要求受信時から所定の時間内に取得された利用者Aの情報を特定し、特定した利用者Aの情報から端末装置100の状況を特定する。そして、配信サーバ10は、特定した端末装置100の状況と関連付けられた音量操作を学習結果から特定し、特定した学習結果に基づいて、再生態様を決定する。例えば、配信サーバ10は、特定した音量操作が示す端末装置100の音量を特定し、特定した音量でコンテンツの音声を再生させる再生態様を決定する。
【0040】
また、他の例では、配信サーバ10は、配信要求受信時から所定の時間内に行われた端末装置100に対する操作を特定する。そして、配信サーバ10は、特定した端末装置100の操作と関連付けられた音量操作を学習結果から特定し、特定した学習結果に基づいて、再生態様を決定する。
【0041】
また、他の例では、配信サーバ10は、配信要求受信時から所定の時間内における利用者Aの位置を特定する。そして、配信サーバ10は、特定した利用者Aの位置と関連付けられた音量操作を学習結果から特定し、特定した学習結果に基づいて、再生態様を決定する。
【0042】
また、他の例では、配信サーバ10は、配信要求受信時において端末装置100が接続するネットワークを特定する。そして、配信サーバ10は、特定した端末装置100が接続するネットワークと関連付けられた音量操作を学習結果から特定し、特定した学習結果に基づいて、再生態様を決定する。
【0043】
また、他の例では、配信サーバ10は、配信要求受信時から所定の時間内に行われた端末装置100を用いた入退場の履歴を特定する。そして、配信サーバ10は、特定した端末装置100を用いた入退場の履歴と関連付けられた音量操作を学習結果から特定し、特定した学習結果に基づいて、再生態様を決定する。
【0044】
なお、配信サーバ10は、上述した学習処理以外にも、コンテンツの配信要求を受信した際における端末装置100または利用者Aに係る任意の条件について、かかる条件と関連付けて学習された音量操作に応じて、再生態様を決定することができる。例えば、配信サーバ10は、配信要求を受信した際における条件として、端末装置100の使用履歴、端末装置100が再生するコンテンツ、端末装置100が表示するウェブページ、端末装置100の物理的な状態、端末装置100の周囲に位置する他の端末装置における音量等を特定し、特定した条件と関連付けられた音量操作に応じて、再生態様を決定してもよい。また、配信サーバ10は、配信要求受信時の時刻を含む時間帯と関連付けられた音量操作に応じて、再生態様を決定してもよい。
【0045】
〔2−4.制御処理について〕
次に、配信サーバ10が実行する制御処理について説明する。例えば、配信サーバ10は、決定処理によって再生態様が決定された場合は、決定した再生態様でコンテンツに含まれる音声を制御する制御処理を実行する。具体例を説明すると、配信サーバ10は、決定した再生態様でコンテンツに含まれる音声を端末装置100に再生させる再生指示を生成する。そして、配信サーバ10は、生成した再生指示とコンテンツとを端末装置100に送信する。この結果、端末装置100は、受信したコンテンツに含まれる音声を再生指示に従って再生する。例えば、端末装置100は、受信したコンテンツの音声を、再生指示が示す音量で再生する。
【0046】
また、他の例では、配信サーバ10は、端末装置100がコンテンツの再生を行った際に、決定した再生態様で音声が再生されるように、コンテンツに含まれる音声を編集し、音声を編集したコンテンツを端末装置100に送信してもよい。例えば、配信サーバ10は、受信したコンテンツの音声を再生指示が示す音量に調整し、音量を調整したコンテンツを端末装置100に送信してもよい。
【0047】
〔2−5.配信サーバ10が実行する処理の一例について〕
次に、
図1を用いて、配信サーバ10が実行する選定処理の一例を説明する。なお、以下の説明では、配信サーバ10は、音量操作を時間帯と関連付けて学習し、コンテンツの配信要求を受け付けた時刻と関連付けられた音量操作に応じて、再生態様を決定する例について説明する。また、以下の説明では、配信サーバ10は、音量操作として、設定後の音量を「0」〜「5」までの6段階で示すログ情報や、音量を「0」に設定するログ情報を受信する例について説明する。なお音量「0」は消音状態を示し、音量「5」は最大音量を示すものとする。
【0048】
まず、配信サーバ10が有するログ情報データベース14について説明する。ログ情報データベース14には、配信サーバ10が収集したログ情報と、利用者を識別する利用者IDと、ログ情報が取得された時刻とが対応付けて登録される。
【0049】
例えば、
図1に示す例では、ログ情報データベース14には、利用者Aを識別する利用者ID「利用者A」と対応付けて、位置を示すログ情報「位置:位置A」と、時刻「2014/05/13/21:00」とを対応付けたエントリが登録されている。すなわち、ログ情報データベース14には、時刻「2014/05/13/21:00」において、利用者Aが「位置A」に所在した旨を示すログ情報が登録されている。
【0050】
また、
図1に示す例では、ログ情報データベース14には、利用者ID「利用者A」と、端末装置100に対する操作を示すログ情報「操作:再生開始」と時刻「2014/05/13/21:01」とが対応付けて登録されている。すなわち、ログ情報データベース14には、時刻「2014/05/13/21:01」において、利用者Aが所定のコンテンツの再生を指示する操作「再生開始」を端末装置100に対して行った旨を示すログ情報が登録されている。
【0051】
また、
図1に示す例では、ログ情報データベース14には、利用者ID「利用者A」と、音量操作を示すログ情報「操作:音量設定(5)」と時刻「2014/05/13/21:01」とが対応付けて登録されている。すなわち、ログ情報データベース14には、時刻「2014/05/13/21:01」において、利用者Aが音量を「5」に設定する音量操作を端末装置100に対して行った旨を示すログ情報が登録されている。また、
図1に示す例では、ログ情報データベース14には、コンテンツの再生を停止させる操作を示すログ情報「操作:再生停止」や、音量を消音状態に設定する音量操作を示すログ情報「操作:消音設定」が利用者IDおよび時刻と対応付けて登録されている。
【0052】
続いて、配信サーバ10が有する属性情報データベース15について説明する。属性情報データベース15には、配信サーバ10があらかじめ収集した利用者の属性情報が登録されている。例えば、属性情報データベース15には、利用者ID「利用者A」と、利用者Aが女性である旨を示す属性情報「性別:女性」とが対応付けて登録されている。
【0053】
続いて、配信サーバ10が有する学習結果データベース16について説明する。学習結果データベース16には、学習処理の結果、生成された学習結果として、利用者IDと、音量操作と、時間帯とが対応付けて登録されている。例えば、
図1に示す例では、利用者ID「利用者A」と音量操作「音量設定(5)」と時間帯「21:01〜10:01」とが対応付けて登録されている。また、
図1に示す例では、利用者ID「利用者A」と音量操作「消音設定」と時間帯「11:16〜11:45」とが対応付けて登録されている。
【0054】
続いて、配信サーバ10が実行する処理の一例を説明する。まず、配信サーバ10は、端末装置100からログ情報を収集し、収集したログ情報をログ情報データベース14に登録する(ステップS1)。例えば、配信サーバ10は、ログ情報データベース14に、ログ情報と関連する利用者を識別する利用者IDと、ログ情報と、ログ情報を端末装置100が取得した時刻とを対応付けて格納する。
【0055】
続いて、配信サーバ10は、利用者Aに関するログ情報や利用者Aの属性情報に基づいて、音量操作の学習を行う学習処理を実行する(ステップS2)。例えば、配信サーバ10は、利用者ID「利用者A」と対応付けられたログ情報から音量操作に関するログ情報と時刻とを抽出する。続いて、配信サーバ10は、音量操作が行われてから次の音量操作が行われるまでの時間帯を特定する。そして、配信サーバ10は、利用者ID「利用者A」と、音量操作と、かかる音量操作が行われてから次の音量操作が行われるまでの時間帯とを対応付けて学習結果データベース16に登録する。
【0056】
例えば、配信サーバ10は、音量操作「操作:音量設定(5)」が行われた時刻「21:01」から、音量操作「操作:音量設定(4)」が行われた時刻「10:01」までの時間帯「21:01〜10:01」を特定する。そして、配信サーバ10は、と特定した時間帯「21:01〜10:01」と音量操作「音量設定(5)」とを対応付けた学習結果を学習結果データベース16に登録する。また、配信サーバ10は、音量操作「操作:消音設定」が行われた時刻「11:16」から、次の音量操作が行われた時刻、例えば「11:45」までの時間帯「11:16〜11:45」を特定する。そして、配信サーバ10は、と特定した時間帯「11:16〜11:45」と音量操作「消音設定」とを対応付けた学習結果を学習結果データベース16に登録する。
【0057】
続いて、配信サーバ10は、コンテンツの配信要求を端末装置100から受信する(ステップS3)。かかる場合、配信サーバ10は、学習結果に基づいて、コンテンツに含まれる音声の再生態様を決定する決定処理を実行する(ステップS4)。例えば、配信サーバ10は、配信要求を受信した時刻が「11:20」である場合は、かかる時刻を含む時間帯「11:16〜11:45」と対応付けられた音量操作「消音設定」を特定する。この結果、配信サーバ10は、コンテンツに含まれる音声を消音状態で再生させる再生態様を決定する。
【0058】
また、他の例では、配信サーバ10は、配信要求を受信した時刻が「22:00」である場合は、かかる時刻を含む時間帯「21:01〜10:01」と対応付けられた音量操作「音量設定(5)」を特定する。そして、配信サーバ10は、コンテンツに含まれる音声を音量「5」で再生させる再生態様を決定する。
【0059】
続いて、配信サーバ10は、決定した再生態様でコンテンツに含まれる音声を制御する制御処理を実行する(ステップS5)。例えば、配信サーバ10は、消音状態でコンテンツの再生を行うよう指示する再生指示を生成する。そして、配信サーバ10は、コンテンツと、再生指示とを端末装置100に送信する(ステップS6)。この結果、端末装置100は、コンテンツに含まれる音声を再生指示に従って再生する(ステップS7)。
【0060】
このように、配信サーバ10は、端末装置100を使用する利用者Aの情報を収集し、収集した利用者Aの情報に基づいて、利用者Aが使用する端末装置100の音量に関連する音量操作を学習する。また、配信サーバ10は、学習処理の学習結果に応じて、端末装置100がコンテンツに含まれる音声を再生する際の再生態様を決定する。そして、配信サーバ10は、決定処理で決定した再生態様でコンテンツに含まれる音声を制御する。
【0061】
このため、配信サーバ10は、利用者の利便性を向上させることができる。例えば、配信サーバ10は、利用者Aが、通勤時等の所定の時間帯において電車に乗り、端末装置100の音量を消音状態に設定した旨を学習する。かかる場合、配信サーバ10は、通勤時等の所定の時間帯において音声を含むコンテンツを配信する場合は、コンテンツの音声を消音状態に制御する。この結果、配信サーバ10は、通勤時等の所定の時間帯において電車に乗る際に、利用者が端末装置100の音量を消音状態に設定し忘れたとしても、コンテンツに含まれる音声を消音状態にすることができる。
【0062】
また、配信サーバ10は、利用者Aが音量を「5」に設定した時間帯においては、利用者Aが自宅など音声を出力してもよい場所にいると判断できるため、コンテンツに含まれる音声を音量「5」に制御する。このため、配信サーバ10は、利用者Aが自宅など音声を出力してもよい場所にいると判断できる場合には、広告に関する動画コンテンツの音声等、利用者に対して聞かせたい音声を出力することができる。
【0063】
なお、配信サーバ10は、上述した各種処理を端末装置ごと、または、利用者ごとに行ってもよい。例えば、配信サーバ10は、端末装置のIPアドレス、端末装置に付されたID、クッキー等の技術を用いて、端末装置を区別し、端末装置ごとに上述した各種処理を実行してもよい。
【0064】
以下、上記した選定処理を実現する配信サーバ10の機能構成の一例について説明する。
【0065】
〔3.配信システムの構成〕
まず、
図2を用いて、実施形態に係る配信サーバ10を有する配信システムの構成について説明する。
図2は、実施形態に係る配信システムの構成例を示す図である。
図2に示すように、配信システムは、配信サーバ10と、複数の端末装置100〜103と、広告主端末110と、ウェブサーバ120とを含む。配信サーバ10、端末装置100〜103、広告主端末110、ウェブサーバ120は、ネットワークNを介して有線または無線により通信可能に接続される。なお、
図2に示す配信システムには、他にも複数台の端末装置100や、複数台の広告主端末110や、複数台のウェブサーバ120や、複数台の配信サーバ10が含まれてもよい。
【0066】
端末装置100は、ウェブページを閲覧する利用者によって利用される情報処理装置である。例えば、端末装置100は、スマートフォン等の携帯電話機や、タブレット端末や、PDA(Personal Digital Assistant)や、デスクトップ型PC(Personal Computer)や、ノート型PC等である。端末装置100は、利用者による操作にしたがって、ウェブサーバ120からウェブページを取得し、取得したウェブページを表示する。また、端末装置100は、ウェブページに後述するコンテンツの取得命令が含まれる場合には、配信サーバ10にコンテンツの配信要求を送信し、音声を含むコンテンツを取得する。そして、端末装置100は、取得したコンテンツをウェブページ内の所定の位置に配置し、条件に応じてコンテンツの再生を行う。
【0067】
広告主端末110は、広告主によって利用される情報処理装置である。例えば、広告主端末110は、デスクトップ型PCや、ノート型PCや、タブレット端末や、携帯電話機や、PDA等である。広告主端末110は、広告主による操作にしたがって、コンテンツを配信サーバ10に入稿する。例えば、広告主端末110は、コンテンツとして、音声を含む動画像または音声の広告コンテンツや、かかるコンテンツと対応するコンテンツ(例えば、ランディングページ)を取得するためのURL(Uniform Resource Locator)などを配信サーバ10に入稿する。
【0068】
なお、広告主は、広告コンテンツの入稿を代理店に依頼する場合がある。この場合、配信サーバ10に広告コンテンツを入稿するのは代理店となる。以下では、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主端末」といった表記は、広告主端末110だけでなく代理店によって利用される代理店装置を含む概念であるものとする。
【0069】
なお、配信サーバ10は、配信サーバ10が配信するコンテンツが広告コンテンツではなく利用者等によって投稿された動画像や音声等である場合は、利用者が使用する任意の利用者端末からコンテンツの登録を受け付ける。また、配信サーバ10は、コンテンツホルダー等、コンテンツの配信を統括する会社の端末からコンテンツの登録を受付けてもよい。
【0070】
ウェブサーバ120は、端末装置100にウェブページを配信するサーバ等である。例えば、ウェブサーバ120は、ポータルサイト、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関連する各種情報が配置されたポータルサイトであるウェブページを端末装置100に配信する。なお、ウェブサーバ120は、各種情報がタイル状に配置され、タイルごとに情報の更新などが行われるウェブページを端末装置100へ送信するサーバであってもよい。
【0071】
ここで、ウェブサーバ120によって配信されるウェブページには、ウェブページに配置されるコンテンツの取得命令が含まれる。例えば、ウェブページを形成するHTMLファイル等には、配信サーバ10のURL等が取得命令として記述される。この場合、端末装置100は、HTMLファイル等に記述されているURLにアクセスすることで、配信サーバ10からコンテンツを取得する。なお、かかるURLは、ポータルサイト等のウェブページに配置される広告の取得命令として記述されていてもよく、動画配信サイト等のウェブページに配置されるコンテンツの取得命令として記述されていてもよい。
【0072】
配信サーバ10は、各種コンテンツの配信を行うサーバ等である。なお、配信サーバ10は、後述する配信サーバ10の機能構成を実現するクラウドシステムであってもよい。配信サーバ10は、端末装置100からコンテンツの配信要求を受信すると、端末装置100に対して送信するコンテンツを選択し、選択したコンテンツの配信を行う。また、端末装置100は、上述した学習処理、決定処理、制御処理を実行し、端末装置100がコンテンツに含まれる音声を再生する際の態様を制御する。
【0073】
〔4.配信サーバの構成〕
次に、
図3を用いて、実施形態に係る配信サーバ10の構成について説明する。
図3は、実施形態に係る配信サーバの構成例を示す図である。
図3に示すように、配信サーバ10は、ネットワークNを介して、端末装置100および広告主端末110とデータの送受信を行う。
【0074】
ここで、配信サーバ10は、
図3に示すように、通信部11、記憶部12、制御部13を有する。なお、配信サーバ10の内部構成は、
図3に示した構成に限られず、上述した選定処理を行う構成であれば他の構成であってもよい。
【0075】
通信部11は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部11は、ネットワークNと有線または無線で接続され、端末装置100、広告主端末110との間で情報の送受信を行う。
【0076】
記憶部12は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部12は、ログ情報データベース14、属性情報データベース15、学習結果データベース16、配信情報データベース17を記憶する。
【0077】
制御部13は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、配信サーバ10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部13は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0078】
また、制御部13は、配信サーバ110内部の記憶装置に記憶されている制御プログラムがRAMを作業領域として実行されることにより、受付部18、収集部19、学習部20、決定部21、音声制御部22として動作する。
【0079】
〔4−1.ログ情報データベースの一例〕
続いて、記憶部12が記憶する情報の一例について説明する。ログ情報データベース14は、利用者のログ情報が登録されるデータベースである。例えば、
図4は、実施形態に係るログ情報データベースの一例を示す図である。
図4に示す例では、ログ情報データベース14には、利用者IDと、ログ情報と、時刻とが対応付けて格納されている。
【0080】
例えば、
図4に示す例では、ログ情報データベース14には、利用者ID「利用者A」と対応付けて、以下のログ情報と時刻とが対応付けて格納されている。例えば、ログ情報データベース14には、端末装置100が接続するネットワークを示すログ情報「ネットワーク:広域ネットワークA」と時刻「2014/05/13/20:55」、端末装置100の位置を示すログ情報「位置:位置A」と時刻「2014/05/13/21:00」等が対応付けて登録されている。また、ログ情報データベース14には、端末装置100が音声を含むコンテンツの再生を開始した旨のログ情報「操作:再生開始」と時刻「2014/05/13/21:01」、音量操作であるログ情報「操作:音量設定(5)」と時刻「2014/05/13/21:01」等が対応付けて登録されている。
【0081】
また、ログ情報データベース14には、端末装置100がコンテンツの再生を停止した旨を示すログ情報「操作:再生停止」と時刻「2014/05/14/11:15」、音量を消音状態に設定した旨を示す音量操作であるログ情報「操作:消音設定」と時刻「2014/05/14/11:16」等が対応付けて登録されている。また、ログ情報データベース14には、配信サーバ10が配信するコンテンツとは別に端末装置100がコンテンツ(例えば、ウェブページ)を表示した旨を示すログ情報「閲覧:ウェブコンテンツA」と時刻「2014/05/14/12:16」、端末装置100が有するフェリカ(登録商標)等の機能を用いて駅の改札に入場した旨を示すログ情報「機能:改札入場」と時刻「2014/05/14/21:15」、駅の改札を出場した旨を示すログ情報「機能:改札出場」と時刻「2014/05/14/22:30」等が対応付けて登録されている。
【0082】
なお、上述したログ情報以外にも、ログ情報データベース14には、端末装置100や利用者Aの位置、端末装置100に対する操作、音量操作、端末装置100の物理的な状態、端末装置100が有する機能の履歴等、任意のログ情報が登録されているものとする。
【0083】
〔4−2.属性情報データベースの一例〕
続いて、属性情報データベース15に登録されている情報の一例について説明する。
図5は、実施形態にかかる属性情報データベースの一例を示す図である。
図5に示す例では、属性情報データベース15には、利用者IDと、利用者の属性情報とが対応付けて登録されている。例えば、
図5に示す例では、属性情報データベース15には、利用者Aの利用者ID「利用者A」と、利用者Aが女性である旨を示す属性情報「性別:女性」、年齢が30代である旨を示す属性情報「年齢:30代」と、職業が会社員である旨を示す属性情報「職業:会社員」と、趣味が音楽鑑賞である旨を示す属性情報「趣味:音楽鑑賞」と、住所を示す属性情報「住所:XXXX」とが対応付けて登録されている。
【0084】
なお、属性情報データベース15には、上述した属性情報以外にも、利用者の属性を示す任意の属性情報が登録されているものとする。また、属性情報データベース15に登録される属性情報は、利用者によってあらかじめ登録された属性情報であってもよく、また、利用者に係るログ情報等から推定された利用者の属性情報が登録されていてもよい。
【0085】
〔4−3.学習結果データベースの一例〕
続いて、学習結果データベース16に登録されている情報の一例について説明する。
図6は、実施形態に係る学習結果データベースの一例を示す図である。
図6に示す例では、学習結果データベース16には、利用者IDと、音量操作と、時間帯と、条件とが対応付けて登録されている。ここで、条件とは、音量操作と関連付けて学習が行われた各種条件である。
【0086】
例えば、
図6に示す例では、学習結果データベース16には、利用者Aの利用者ID「利用者A」と、音量操作「音量操作(5)」と時間帯「21:01〜10:01」とが対応付けて登録され、利用者Aの利用者ID「利用者A」と、音量操作「消音設定」と時間帯「11:16〜11:45」とが対応付けて登録されている。また、学習結果データベース16には、利用者ID「利用者A」と、音量操作「音量操作(5)」と、条件「再生開始」とが対応付けて登録されている。また、学習結果データベース16には、音量操作「消音設定」と、条件「改札入場」とが対応付けて登録され、利用者ID「利用者A」と、音量操作「消音設定」と、条件「Wi−FiネットワークB」とが対応付けて登録されている。
【0087】
〔4−4.配信情報データベースの一例〕
続いて、配信情報データベース17に登録されている情報の一例について説明する。
図7は、実施形態に係る配信情報データベースに格納された情報の一例を示す図である。
図7に示した例では、配信情報データベース17は、広告主ID、広告コンテンツ、インプレッション数、インプレッション保証数、対価といった項目を有する。なお、配信情報データベース17は、コンテンツと利用者とのマッチングを行うための情報や、CTR(Click Through Rate)といった情報をさらに記憶してもよい。
【0088】
「広告主ID」は、広告主または広告主端末110を識別するための識別情報を示す。「広告コンテンツ」は、広告主端末110から入稿されたコンテンツ、すなわち、広告に係るコンテンツを示す。
図7では「広告コンテンツ」に「C20」〜「C60」といった概念的な情報が格納される例を示したが、実際には、音声を含む動画像、音声と画像、音声とテキストデータ、音声を含むゲーム形式の広告等、音声を含む任意のコンテンツやかかるコンテンツが所在するURL、または、これらの格納場所を示すファイルパス名などが格納される。
【0089】
「インプレッション数」は、広告コンテンツが表示された回数を示す。また、「インプレッション保証数」は、対価に対して補償されている広告コンテンツの表示回数を示す。また、「対価」は、「インプレション保証数」だけ広告コンテンツが表示された際に広告主から支払われる報酬を示す。すなわち、配信サーバ10は、広告に係るコンテンツをインプレッション保証型で配信するサーバである。
【0090】
すなわち、
図7では、広告主ID「B10」によって識別される広告主が、コンテンツC20〜C40を入稿した例を示している。また、
図7では、コンテンツ「C20」のインプレッション数が「10000」であり、インプレッション保証数が「20000」であり、インプレッション保証数だけコンテンツ「C20」が表示された際の課金額が「aaa」である例を示している。
【0091】
ここで、配信情報データベース17には、広告コンテンツとして、各コンテンツを再生する際にどのような再生態様で再生するかを指示する再生制御指示が登録される。例えば、再生制御指示には、コンテンツC20を配置する位置、コンテンツC20の再生を開始する条件、コンテンツC20を再生させる際に上述した決定処理および制御処理によって音量の制御を実行させるか否かの条件、どのような再生態様で再生させるかの指示、どのような状態でどのような再生態様が決定されるかを示す指示、ランディングページのURL等の情報が含まれているものとする。
【0092】
なお、広告コンテンツが選択される度に課金が行われるクリック課金形式で広告に係るコンテンツを配信する場合は、配信情報データベース17には、コンテンツが選択された回数や、コンテンツが選択された際の課金額等が登録される。また、配信要求を受信した際に、入札形式で広告コンテンツを選択し、選択した広告コンテンツを配信する場合は、配信情報データベース17には、1インプレッションあたりの報酬として広告主が設定した広告料金である入札価格や、CTR等が登録される。
【0093】
〔4−5.制御部が実行する処理の一例〕
図3に戻り、制御部13が有する受付部18、収集部19、学習部20、決定部21、音声制御部22が実行する処理の内容について説明する。
【0094】
受付部18は、広告主端末110からコンテンツの入稿を受け付ける。例えば、受付部18は、インプレッション保証数と広告コンテンツの入稿を受け付ける。また、受付部18は、コンテンツと再生制御指示とを受付ける。かかる場合、受付部18は、コンテンツおよび再生制御指示を、広告主IDと、受付けたインプレッション保証数とともに配信情報データベース17に登録する。なお、受付部18は、広告主端末110ではなく、配信サーバ10が提供する各種サービスの提供主によって設定されるインプレッション保証数や対価を配信情報データベース17に登録してもよい。
【0095】
収集部19は、利用者Aの情報を収集する。例えば、収集部19は、端末装置100や、図示を省略した各種ログサーバ等から、利用者Aに係るログ情報と、ログ情報が取得された時刻を収集し、収集したログ情報と時刻とを利用者ID「利用者A」と対応付けてログ情報データベース14に登録する。また、収集部19は、利用者Aが登録した属性情報を端末装置100や外部のサーバ等から収集し、収集した属性情報と利用者ID「利用者A」とを対応付けて属性情報データベース15に登録する。なお、収集部19は、利用者ID「利用者A」と対応付けられたログ情報から利用者Aの属性情報を推定し、推定した属性情報を属性情報データベース15に登録してもよい。
【0096】
学習部20は、利用者Aの情報に基づいて、利用者Aが使用する端末装置100の音量に関連する音量操作を学習する。具体的には、学習部20は、利用者ID「利用者A」と対応付けられたログ情報に基づいて、所定の条件における音量操作を特定し、所定の条件と特定した音量操作とを関連付けた学習結果を学習結果データベース16に格納する。
【0097】
例えば、学習部20は、端末装置100の状況と関連付けて音量操作を学習する。すなわち、学習部20は、ログ情報から端末装置100の状況を特定し、特定した状況における音量操作を特定する。そして、学習部20は、特定した状況と、音量操作とを対応付けて学習結果データベース16に格納する。ここで、端末装置100の状況には、端末装置100への操作、位置、端末装置100が接続するネットワーク、端末装置100を用いた入退場等、ログ情報から特定可能な任意の状況が適用可能である。
【0098】
以下、学習部20が実行する処理の具体例を説明する。例えば、学習部20は、端末装置100に対する操作履歴と関連付けて音量操作を学習する。例えば、学習部20は、端末装置100に対する操作に関するログ情報を特定する。また、学習部20は、特定したログ情報から、操作の種別ごとに、かかる操作の後で共通する音量操作が行われているか否かを判定する。そして、学習部20は、操作の後で共通する音量操作が行われている場合は、かかる操作を条件とし、共通して行われている音量操作と条件とを対応付けた学習結果を学習結果データベース16に登録する。
【0099】
例えば、
図4に示す例では、ログ情報「操作:再生開始」の後で、音量操作「操作:音量設定(5)」または音量操作「操作:音量設定(4)」が行われている。このため、学習部20は、条件「再生開始」と音量操作「音量設定(5)」とを対応付けた学習結果、または、条件「再生開始」と音量操作「音量設定(4)」とを対応付けた学習結果を学習結果データベース16に登録する。なお、学習部20は、ログ情報「操作:再生開始」の後で、音量操作「操作:音量設定(5)」または音量操作「操作:音量設定(4)」のどちらが多く行われているかに応じて、学習結果として登録する音量操作を特定してもよい。
【0100】
また、学習部20は、端末装置100の位置と関連付けて音量操作を学習する。例えば、学習部20は、ログ情報から位置を示すログ情報を特定する。また、学習部20は、特定したログ情報が示す位置において行われた音量操作を特定する。そして、学習部20は、特定した位置と音量操作とを対応付けた学習結果を学習結果データベース16に登録する。
【0101】
例えば、
図4に示す例では、位置を示すログ情報「位置:位置A」が取得されてから1分後に音量操作「操作:音量設定(5)」が行われており、位置を示すログ情報「位置:位置B」が取得されてから56分後に音量操作「操作:消音設定」が行われている。ここで、音量操作「操作:音量設定(5)」については、位置を示すログ情報「位置:位置A」が取得されてから1分後に行われているため、位置と関連付けた学習を行ってもよいと予測されるが、音量操作「操作:消音設定」については、位置を示すログ情報「位置:位置B」が取得されてから56分後に行われているため、位置と関連付けた学習が適切ではない蓋然性が高い。
【0102】
そこで、学習部20は、位置を示すログ情報が取得されてから所定の時間(例えば、20分)が経過した後の音量操作については、学習結果から除外する。この結果、例えば、学習部20は、条件「位置:位置A」と音量操作「音量設定(5)」とを対応付けた学習結果のみを学習結果データベース16に登録する。
【0103】
また、学習部20は、端末装置100が接続するネットワークと関連付けて音量操作を学習する。例えば、学習部20は、ログ情報から端末装置100が接続するネットワークを示すログ情報を特定し、特定したネットワークに接続している際に行われた音量操作を特定する。そして、学習部20は、特定したネットワークと、かかるネットワークに端末装置100が接続する際に行われた音量操作とを対応付けた学習結果を学習結果データベース16に登録する。
【0104】
例えば、
図4に示す例では、ログ情報「ネットワーク:広域ネットワークA」が取得されてから、ログ情報「ネットワーク:Wi−FiネットワークB」が取得されるまでの間に、音量操作「操作:音量設定(5)」、「操作:音量設定(4)」、「操作:消音設定」が行われている。一方、ログ情報「ネットワーク:Wi−FiネットワークB」が取得されてから、ログ情報「ネットワーク:広域ネットワークA」が取得されるまでの間は、音量操作「操作:消音設定」のみが行われている。かかる場合、学習部20は、端末装置100が「広域ネットワークA」に接続している際に適切な音量設定を判断することはできないものの、端末装置100が「Wi−FiネットワークB」に接続している間は、端末装置100の音量を「消音設定」にしてよいと判断できる。そこで、学習部20は、条件「Wi−FiネットワークB」と音量操作「消音設定」とを対応付けた学習結果を学習結果データベース16に登録する。
【0105】
また、学習部20は、端末装置100を用いた入退場の履歴と関連付けて音量操作を学習する。例えば、学習部20は、ログ情報から端末装置100を用いた入退場の履歴を示すログ情報を特定し、かかるログ情報が示す入退場と前後して行われた音量操作を特定する。そして、学習部20は、特定した入退場の履歴を示すログ情報を条件として、特定した音量操作と条件とを対応付けた学習結果を学習結果データベース16に登録する。
【0106】
例えば、
図4に示す例では、ログ情報「機能:改札入場」が取得された後、すぐに、ログ情報「操作:消音設定」が取得されている。このため、学習部20は、条件「改札入場」と音量操作「消音設定」とを対応付けた学習結果を学習結果データベース16に登録する。
【0107】
なお、学習部20は、上述した条件以外にも、任意の条件と関連付けて音量操作を学習できる。例えば、学習部20は、音量操作が行われた時間帯を特定し、特定した時間帯とかかる時間帯において行われた音量操作とを対応付けた学習結果を学習結果データベース16に登録してもよい。
【0108】
決定部21は、学習部20の学習結果に応じて、端末装置100がコンテンツに含まれる音声を再生する際の再生態様を決定する。具体的には、決定部21は、端末装置100から配信要求を受信すると、ログ情報データベース14を参照し、配信要求を受信してから所定の期間内に取得されたログ情報を特定する。また、決定部21は、特定したログ情報からコンテンツ配信時における端末装置100や利用者Aが満たす条件を特定し、特定した条件と関連付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作に応じて、再生態様を決定する。
【0109】
例えば、決定部21は、端末装置100がコンテンツを取得する際の端末装置100の状況を特定し、特定した端末装置100の状況と関連付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作でコンテンツに含まれる音声を再生させる再生態様を決定する。
【0110】
また、例えば、決定部21は、端末装置100がコンテンツを取得する際に行われた操作を特定し、特定した操作と関連付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作でコンテンツに含まれる音声を再生させる再生態様を決定する。例えば、決定部21は、端末装置100がコンテンツを取得する際にログ情報「操作:再生開始」が取得されている場合は、条件「再生開始」と関連付けられた音量操作「音量操作(5)」を学習結果データベース16から特定し、特定した音量操作に応じて、再生態様を決定する。
【0111】
また、例えば、決定部21は、端末装置100がコンテンツを取得する際の端末装置100の位置を特定し、特定した位置と関連付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作でコンテンツに含まれる音声を再生させる再生態様を決定する。
【0112】
また、例えば、決定部21は、端末装置100がコンテンツを取得する際に接続するネットワークを特定し、特定したネットワークと関連付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作でコンテンツに含まれる音声を再生させる再生態様を決定する。例えば、決定部21は、端末装置100がコンテンツを取得する際にログ情報「ネットワーク:Wi−FiネットワークB」が取得されている場合は、条件「Wi−FiネットワークB」と関連付けられた音量操作「消音設定」を学習結果データベース16から特定し、特定した音量操作に応じて、再生態様を決定する。
【0113】
また、例えば、決定部21は、端末装置100がコンテンツを取得する際と前後して行われた入退場を特定し、特定した入退場と関連付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作でコンテンツに含まれる音声を再生させる再生態様を決定する。例えば、決定部21は、端末装置100がコンテンツを取得する際にログ情報「機能:改札入場」が取得されている場合は、条件「改札入場」と関連付けられた音量操作「消音設定」を学習結果データベース16から特定し、特定した音量操作に応じて、再生態様を決定する。
【0114】
なお、決定部21は、上述した条件以外にも、端末装置100がコンテンツを取得する際の任意の条件と関連付けられた音量操作に応じて、再生態様を決定してもよい。例えば、決定部21は、配信要求を受信した際の時刻を含む時間帯と対応付けられた音量操作を学習結果データベース16から特定する。そして、決定部21は、特定した音量操作に応じて、再生態様を決定してもよい。
【0115】
また、決定部21は、端末装置100がコンテンツを取得する際と前後して行われた入退場の履歴に応じて、再生態様を決定してもよい。例えば、端末装置100を用いて駅の改札を入場した旨のログ情報が取得されてから、駅の改札を出場した旨のログ情報が取得されるまでの間は、音声を「消音設定」にしてもよいと予測される。そこで、決定部21は、配信要求を受信する前にログ情報「機能:改札入場」が取得されており、かつ、ログ情報「機能:改札出場」が取得されていない場合には、学習結果にかかわらず、音声を「消音設定」で再生させる再生態様を決定してもよい。
【0116】
音声制御部22は、決定部21が決定した再生態様でコンテンツに含まれる音声を制御する制御部である。例えば、音声制御部22は、配信要求を受信すると、配信対象となるコンテンツを配信情報データベース17から取得する。より具体的には、音声制御部22は、配信情報データベース17に登録された広告にかかるコンテンツから、各コンテンツのインプレッション数とインプレッション保証数とに応じて、各コンテンツのインプレッション数がインプレッション保証数よりも多くなるように、配信対象となるコンテンツの選択を行う。なお、音声制御部22は、端末装置100を有する利用者とのマッチングや、端末装置100の状態に応じたマッチングを考慮したコンテンツの選択を行ってもよい。
【0117】
続いて、音声制御部22は、配信情報データベース17から取得したコンテンツに含まれる音声を、決定部21が決定した再生態様で再生させる再生指示を生成する。そして、音声制御部22は、取得したコンテンツと再生指示とを端末装置100に送信する。
【0118】
なお、音声制御部22は、決定部21が決定した再生態様で音声が再生されるよう、配信情報データベース17から取得したコンテンツの音声を編集し、音声を編集したコンテンツを端末装置100に送信してもよい。すなわち、音声制御部22は、決定部21が決定した再生態様でコンテンツに含まれる音声が再生されるのであれば、任意の制御方法を採用することができる。
【0119】
〔5.変形例〕
上記した実施形態に係る配信サーバ10は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、配信サーバ10の他の実施形態について説明する。なお、以下に説明する配信サーバ10が実行する処理のうち、学習処理に対応する処理は、学習部20によって実行され、決定処理に対応する処理は、決定部21によって実行され、制御処理に対応する処理は、音声制御部22によって実行されるものとする。
【0120】
〔5−1.コンテンツの種別に応じた処理〕
例えば、配信サーバ10は、ログ情報から、配信サーバ10から配信されたコンテンツを端末装置100が再生してから所定の期間内に行われた音量操作を特定し、特定した音量操作と、配信サーバ10から配信されたコンテンツの種別とを関連付けた学習結果を生成する。また、配信サーバ10は、端末装置100から配信要求を受信すると、配信情報データベース17から配信対象となるコンテンツを選択する。そして、配信サーバ10は、選択したコンテンツの種別と関連付けられた音量操作を特定し、特定した音量操作に応じて再生態様を決定する。
【0121】
例えば、配信サーバ10は、配信サーバ10から配信されたコンテンツの種別が利用者によって投稿された動画像である際に、音量操作「操作:音量設定(5)」が多く行われている場合は、コンテンツの種別「利用者投稿画像」と音量操作「音量設定(5)」とを関連付けた学習結果を生成する。また、配信サーバ10は、配信サーバ10から配信されたコンテンツの種別がウェブページ内に配置される広告に関する動画像コンテンツである際に、音量操作「操作:消音設定」が多く行われている場合は、コンテンツの種別「広告コンテンツ」と音量操作「消音設定」とを関連付けた学習結果を生成する。
【0122】
かかる場合、配信サーバ10は、配信要求を受信した際に配信対象として選択したコンテンツの種別が、利用者によって投稿された動画像である場合は、「音量設定(5)」で音声を再生させる再生態様を決定し、選択したコンテンツの種別が、広告に関する動画像コンテンツである場合は、「消音設定」で音声を再生させる再生態様を決定する。
【0123】
なお、配信サーバ10は、登録された広告に関するコンテンツのうち、登録主が音声の制御を許可したコンテンツを配信する場合は、学習結果に応じた再生態様を決定し、登録主が音声の制御を許可していないコンテンツを配信する場合は、かかるコンテンツのみの配信を行ってもよい。また、他の例では、端末装置100は、受信したコンテンツが広告に関連するコンテンツである場合には、学習結果に応じた再生態様を決定し、受信したコンテンツがゲームや広告以外の動画像等である場合は、再生態様を決定せずにコンテンツのみを配信してもよい。
【0124】
このように、配信サーバ10は、コンテンツの種別に応じて、コンテンツに含まれる音声の再生態様を決定する。このため、配信サーバ10は、利用者の利便性を向上させることができる。
【0125】
〔5−2.表示コンテンツに応じた処理〕
また、配信サーバ10は、配信サーバ10が配信するコンテンツとは個別に端末装置100が表示するコンテンツ(以下、表示コンテンツと記載する)の種別と関連付けて音量操作を学習し、配信サーバ10がコンテンツを配信する際に端末装置100が表示する表示コンテンツと関連付けられた音量操作に応じて、再生態様を決定してもよい。例えば、配信サーバ10は、ログ情報から、端末装置100が表示するウェブコンテンツの種別ごとに、かかるウェブコンテンツを表示する際と前後して行われた音量操作を特定する。そして、配信サーバ10は、特定した音量操作とウェブコンテンツの種別とを関連付けた学習結果を生成する。
【0126】
例えば、配信サーバ10は、サッカーや野球に関連するウェブページ等、スポーツに関連するウェブコンテンツが表示されている際と前後して、音量操作「操作:音量設定(5)」が多く行われている場合は、表示コンテンツの種別「スポーツ」と音量操作「音量設定(5)」とを関連付けた学習結果を生成する。また、配信サーバ10は、ポータルサイトやニュースサイト等、ニュースに関連するウェブコンテンツが表示されている際と前後して、音量操作「操作:消音設定」が多く行われている場合は、表示コンテンツの種別「ニュース」と音量操作「消音設定」とを関連付けた学習結果を生成する。
【0127】
かかる場合、配信サーバ10は、端末装置100から配信要求を受信した場合は、クッキー等の技術を用いて、端末装置100が表示する表示コンテンツの種別を特定する。そして、配信サーバ10は、特定した表示コンテンツの種別が「スポーツ」である場合は、「音量設定(5)」で音量を再生させる再生態様を決定し、特定した表示コンテンツの種別が「ニュース」である場合は、「消音設定」で音量を再生させる再生態様を決定する。そして、配信サーバ10は、コンテンツを配信するとともに、決定した再生態様で音声を出力するよう制御する。
【0128】
このように、配信サーバ10は、表示コンテンツの種別と関連付けて音量操作を学習し、コンテンツの配信時に端末装置100が表示する表示コンテンツの種別と関連付けられた音量操作に応じた再生態様を決定する。このため、配信サーバ10は、利用者の利便性を向上させることができる。
【0129】
〔5−3.端末の物理的な状態に応じた処理〕
また、配信サーバ10は、ログ情報から、端末装置100の物理的な状態と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際の端末装置100の物理的な状態と関連付けられた音量操作に応じて、再生態様を決定してもよい。
【0130】
例えば、配信サーバ10は、端末装置100の傾き、加速度、温度、音量、明度等に基づいて、端末装置100を利用する利用者の状態を推定することができると考えられる。より具体的な例を説明すると、配信サーバ10は、端末装置100の傾きが所定の閾値よりも大きい場合には、利用者が寝ころんだ状態で端末装置100を使用しているものと推定できる。また、例えば、配信サーバ10は、端末装置100に係る加速度や衝撃が所定のパターンにある程度合致する場合には、利用者が移動しているものと推定できる。また、例えば、配信サーバ10は、GPS(Global Positioning System)やiBeacon等を用いて特定した位置や、端末装置100の移動速度等から、利用者の位置や利用者の移動手段を推定することができる。具体例を説明すると、配信サーバ10は、利用者の位置の近傍に線路が存在し、かつ、利用者の移動速度が所定の閾値よりも速い場合には、利用者が電車に乗車していると推定できる。
【0131】
そこで、配信サーバ10は、ログ情報から、端末装置100の傾き、加速度、温度、音量、明度等、端末装置100の物理的な状態ごとに、かかる状態で行われた音量操作を端末装置100の物理的な状態と関連付けて学習する。そして、配信サーバ10は、配信要求を受信した際の端末装置100の物理的な状態を特定し、特定した物理的な状態と関連付けられた音量操作に応じて、再生態様を決定する。すなわち、配信サーバ10は、端末装置100の物理的な状態から推定される利用者の状態ごとに、かかる状態における音量操作を学習し、コンテンツ配信時の端末装置100の物理的な状態から推定される利用者の状態と関連付けられた音量操作に応じて、再生態様を決定する。
【0132】
例えば、配信サーバ10は、端末装置100が測定した周囲の騒音の大きさごとに音量操作を学習し、コンテンツ配信時に測定された端末装置100の周囲の騒音の大きさと関連付けられた音量操作に応じて、再生態様を決定してもよい。この結果、配信サーバ10は、利用者の利便性を向上させることができる。
【0133】
〔5−4.周囲の端末の設定に応じた処理〕
また、配信サーバ10は、端末装置100の周囲に存在する他の端末装置の音量と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際に端末装置100の周囲に存在する他の端末装置の音量と関連付けられた音量操作に応じて、再生態様を決定してもよい。
【0134】
例えば、端末装置100は、周囲の端末装置が音を所定の音量で出力する状態である場合には、音を出力しても周囲に迷惑をかけることはないと予測される。そこで、配信サーバ10は、例えば、端末装置100の位置を示すログ情報と、他の端末装置の位置を示すログ情報とを比較し、端末装置100が所在した位置ごとに、端末装置100の周囲に位置する他の端末装置を特定する。また、配信サーバ10は、端末装置100が所在した位置ごとに、特定した他の端末装置の音量をかかる他の端末装置のログ情報から特定する。また、配信サーバ10は、端末装置100が所在した位置ごとに、かかる位置に端末装置100が所在した際の音量操作を特定する。
【0135】
そして、配信サーバ10は、端末装置100が所在した位置ごとに、特定した他の端末装置の音量と、特定した端末装置100の音量操作とを関連付けた学習結果を生成する。その後、配信サーバ10は、配信要求を受信すると、端末装置100の周囲に位置する他の端末装置の音量を特定し、特定した音量と関連付けられた端末装置100の音量操作に応じて、再生態様を決定する。
【0136】
この結果、配信サーバ10は、例えば周囲の他の端末装置が音声を出力しているので、端末装置100が音声を出力するように行われた音量操作や、周囲の他の端末装置が音声を出力していないので、端末装置100が音を出力しないよう行われた音量操作を学習できる。そして、配信サーバ10は、コンテンツの配信時に端末装置100の周囲に位置する他の端末装置における音量と関連付けられた音量操作に応じて、再生態様を決定する。このため、配信サーバ10は、周囲の他の端末装置に合わせた音量でコンテンツの再生を行わせることができるので、利用者の利便性を向上させることができる。
【0137】
なお、配信サーバ10は、周囲の他の端末装置のうち、音声を消音状態にしていない端末装置の割合や、各端末装置が設定している音量に基づく条件と、端末装置100の音量操作とを関連付けて学習してもよい。また、配信サーバ10は、所定の時間帯ごとに、端末装置100の音量操作と、周囲の他の端末装置における音量とを関連付けて学習してもよい。また、配信サーバ10は、SNS(Social Networking Service)を利用して、端末装置100の周囲に位置する他の端末装置の状態や設定を収集し、収集した状態や設定ごとに、音量操作を学習してもよい。また、配信サーバ10は、SNSに対して、端末装置100の近距離に位置する他の端末装置が投稿した情報ごとに、音量操作を学習してもよい。
【0138】
〔5−5.その他の条件について〕
また、配信サーバ10は、上述した各種条件を組み合わせた条件と、音量操作とを関連付けて学習してもよい。例えば、配信サーバ10は、所定の時間帯と入退場の履歴との組み合わせごとに音量操作を学習し、端末装置100から配信要求を受信した際における時間帯と、配信要求の受信と前後して取得された入退場の履歴との組み合わせに関連付けられた音量操作に応じて、再生態様を決定してもよい。
【0139】
また、配信サーバ10は、利用者の属性情報を考慮した条件ごとに、音量操作の学習を行ってもよい。例えば、配信サーバ10は、利用者の性別、年齢、職業、趣味、住所等の属性情報に基づく条件と上述した任意の条件との組合せに関連付けられた音量操作に応じて、再生態様の決定を行ってもよい。
【0140】
また、配信サーバ10は、上述した条件以外にも、任意の条件と関連付けて音量操作の学習を行ってよい。例えば、配信サーバ10は、コンテンツの登録主である広告主の意向や、配信サーバ10が提供するサービスの提供主の意向に応じた条件ごとに、音量操作の学習を行うことができる。また、例えば、配信サーバ10は、利用者がSNS等に投稿した情報を解析し、音楽に関する投稿であるか、ニュースに関する投稿であるか等、投稿の内容の種別と関連付けて、係る投稿を行った際の音量操作を学習する。そして、配信サーバ10は、配信要求の受信と前後して利用者が投稿した情報の内容の種別と関連付けられた音量操作に応じて、再生態様を決定してもよい。
【0141】
また、配信サーバ10は、ログ情報から、所定の条件が満たされた際に行われた音量操作そのものを学習結果とせず、かかる音量操作を統計的に解析することで得られる音量操作を学習結果としてもよい。例えば、配信サーバ10は、所定の条件が満たされた際に行われた音量操作を全て特定し、特定した音量操作の内容、結果、音量操作が行われた時刻等に応じて、かかる条件が満たされた状態に対して最適な音量操作を特定する。そして、配信サーバ10は、かかる条件と関連付けて、特定した最適な音量操作を学習結果としてもよい。すなわち、配信サーバ10は、利用者の情報から音量操作の学習を行うのであれば、任意の形態の学習を行うことができる。
【0142】
また、配信サーバ10は、利用者の生体的な情報(いわゆるバイオロジックデータ)と関連付けて音量操作を学習し、学習結果に応じた再生態様を決定してもよい。例えば、配信サーバ10は、利用者Aが使用するウェアラブルデバイスから心拍数や血圧等のバイオロジックデータを収集し、収集したバイオロジックデータと関連付けて音量操作を学習する。そして、配信サーバ10は、配信要求取得時において利用者Aから収集したバイオロジックデータと関連付けられた音量操作に応じて、再生態様を決定してもよい。
【0143】
〔5−6.再生態様について〕
上述した例では、配信サーバ10は、再生態様として、コンテンツに含まれる音声を再生する際の音量を決定したが、実施形態はこれに限定されるものではない。例えば、配信サーバ10は、フェードイン等、徐々に音量が変わる再生態様を決定してもよい。より具体的な例を説明すると、配信サーバ10は、学習結果から特定された音量操作が「消音設定」である場合は、コンテンツに含まれる音声を消音状態で再生させる再生態様を決定してもよく、コンテンツに含まれる音声を徐々に上昇させる態様(すなわち、フェードイン)で再生させる再生態様を決定してもよい。
【0144】
また、例えば、配信サーバ10は、学習結果から特定された音量操作が「消音設定」であり、かつ、配信対象となるコンテンツが広告に係るコンテンツである場合には、フェードインで音声を再生させる再生態様を決定してもよい。このような処理を実行することで、配信サーバ10は、コンテンツに含まれる音声が大音量で突然出力されるといった不適切な態様での音声の再生を防ぐことができる結果、利用者の機嫌を損なうことなく、利用者に対して試聴させたい音声を含むコンテンツの再生を行わせることができる。
【0145】
また、配信サーバ10は、適切な態様で音声を出力することができるのであれば、任意の再生態様を決定してもよい。例えば、配信サーバ10は、段階的に音量を上昇させる再生態様を決定してもよい。また、配信サーバ10は、周囲に伝播しづらい周波数帯の音声を所定の音量で出力し、その後、徐々に所定の音量で出力する周波数帯を増やす再生態様を決定してもよい。
【0146】
〔5−7.音声種別ごとの決定処理について〕
上述した例では、配信サーバ10は、コンテンツの再生時に、コンテンツに含まれる音声の出力態様を制御した。しかしながら、実施形態は、これに限定されるものではない。例えば、コンテンツに含まれる音声には、サウンドロゴ、背景音、効果音、ナレーション等、複数種別の音声が含まれる場合がある。かかる音声の中には、コンテンツの登録を行った登録主(例えば、広告主)が利用者に対して聞かせたい音声や、利用者に聞こえなくなってもよい音声等が含まれると考えられる。
【0147】
そこで、配信サーバ10は、コンテンツの音声に複数の音声が含まれる場合は、各音声の種別に応じて、各音声の再生態様をそれぞれ決定してもよい。例えば、配信サーバ10は、広告主端末110からコンテンツに含まれる音声を音声の種別ごとに登録を受け付ける。より具体的な例を説明すると、配信サーバ10は、コンテンツに含まれる動画像の再生時において同時に再生する音声データとして、サウンドロゴが含まれる音声データ、背景音が含まれる音声データ、ナレーションが含まれる音声データの登録を受け付ける。
【0148】
かかる場合、配信サーバ10は、受信した音声データの種別ごとに、再生態様を決定する。例えば、配信サーバ10は、サウンドロゴが含まれる音声データを再生する際の再生態様として、学習結果にかかわらず、音声データを所定の音量(例えば、利用者又は広告主が設定した音量)で再生する再生態様を決定する。また、端末装置100は、背景音が含まれる音声データを再生する際の再生態様を、コンテンツ配信時の条件と関連付けられた音量操作に応じて決定する。また、端末装置100は、コンテンツ配信時の条件と関連付けられた音量操作が「消音状態」である場合は、ナレーションが含まれる音声データを再生する際の再生態様として、かかる音声データをフェードインまたは消音状態で再生させる再生態様を決定する。
【0149】
なお、配信サーバ10は、登録された音声を音声解析することで、サウンドロゴが含まれる範囲を時間的に切り出し、かかる範囲の音声をサウンドロゴが含まれる音声データとしてもよい。また、配信サーバ10は、音の周波数特性等を用いて、ナレーションと背景音とを分割し、それぞれの音声データを作成してもよい。
【0150】
このように、配信サーバ10は、音声の種別ごとに再生態様を決定するので、より適切な態様でコンテンツに含まれる音声を再生させることができる。なお、配信サーバ10は、コンテンツの種別等に応じて、BGMやサウンドロゴであってもフェードイン又は消音状態で再生させる再生態様を決定してもよい。
【0151】
〔5−8.一時停止後における決定処理について〕
なお、配信サーバ10は、端末装置100がコンテンツの再生を一時停止した場合は、再度決定処理で決定した再生態様で音声を制御してもよく、再生を一時停止した際の再生態様に従って音声の再生を制御してもよい。例えば、配信サーバ10は、利用者の操作や、コンテンツの表示位置に応じた自動制御により、コンテンツの再生が一時停止した場合は、端末装置100から取得される新たなログ情報に基づいて、再生態様を新たに決定し、コンテンツの再生再開時に、新たに決定した再生態様で音声を再生するよう制御してもよい。
【0152】
例えば、配信サーバ10は、再生が一時停止したコンテンツの種別、一時停止するまでの再生時間、一時停止した後で端末装置100に対して行われた操作や端末装置100の位置等に応じて、再生態様を新たに決定してもよい。そして、配信サーバ10は、再生態様を新たに決定した場合は、コンテンツの再生再開時に、新たに決定した再生態様でコンテンツに含まれる音声を再生させる再生指示を端末装置100に送信してもよい。この結果、配信サーバ10は、電車内などで音声が出力され、利用者があわてて操作を行った際に、コンテンツの音声が何度も出力されるといった不適切な態様で音声を出力することを防ぐことができる。
【0153】
〔5−9.学習結果について〕
なお、上述した配信サーバ10は、ログ情報や属性情報に基づいて学習した学習結果を生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、配信サーバ10は、予め定められた学習結果を学習結果データベース16に登録し、登録した学習結果に応じて、再生態様を決定してもよい。具体的な例を説明すると、配信サーバ10は、条件「改札入場」と音量操作「消音状態」とが関連付けられた学習結果の登録を広告主端末110から受付けると、受付けた学習結果を更新できない情報として学習結果データベース16に登録する。かかる場合においては、配信サーバ10は、配信要求を受信した際に、利用者が端末装置100を用いて駅の改札内に入場していた場合は、ログ情報に基づく学習結果にかかわらず、コンテンツに含まれる音声の再生態様を「消音状態」にすることができる。
【0154】
〔6.配信サーバ10の処理フロー〕
次に、
図8、
図9を用いて、配信サーバ10が実行する学習処理、決定処理、制御処理の流れの一例について説明する。まず、
図8を用いて、配信サーバ10が実行する学習処理の一例を説明する。
図8は、実施形態にかかる配信サーバが実行する学習処理の一例を示すフローチャートである。
【0155】
まず、配信サーバ10は、端末装置100等から、各種ログ情報を収集する(ステップS101)。次に、配信サーバ10は、利用者の属性情報を収集する(ステップS102)。そして、配信サーバ10は、ログ情報と属性情報とを用いて、音量操作の学習を行い(ステップS103)、学習結果を学習結果データベース16に登録して(ステップS104)、処理を終了する。
【0156】
次に、
図9を用いて、配信サーバ10が実行する決定処理および制御処理の流れの一例を説明する。
図9は、実施形態に係る配信サーバが実行する決定処理および制御処理の一例を示すフローチャートである。
【0157】
まず、配信サーバ10は、端末装置100からコンテンツの配信要求を受信したか否かを判定し(ステップS201)、受信していない場合は(ステップS201:No)、再度ステップS201を実行する。そして、配信サーバ10は、端末装置100からコンテンツの配信要求を受信した場合は(ステップS201:Yes)、配信対象となるコンテンツを選択し(ステップS202)、配信要求受信時における利用者や端末装置100の条件をログ情報から特定する(ステップS203)。
【0158】
そして、配信サーバ10は、特定した条件と関連付けられた音量操作を学習結果から特定する(ステップS204)。続いて、配信サーバ10は、特定した音量操作に応じて、再生態様を決定する(ステップS205)。そして、配信サーバ10は、コンテンツと、決定した再生態様で音声を再生させる再生指示とを端末装置100に配信し(ステップS206)、処理を終了する。
【0159】
〔7.変形例〕
上記した実施形態に係る配信サーバ10は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、配信サーバ10の他の実施形態について説明する。
【0160】
〔7−1.コンテンツの種別〕
上述した配信サーバ10は、コンテンツとして、広告主が登録した広告に関するコンテンツを配信した。しかしながら、実施形態はこれに限定されるものではなく、配信サーバ10は、任意のコンテンツに対して学習処理、決定処理および制御処理を適用することができる。例えば、配信サーバ10は、広告以外にも、例えばゲームや利用者の操作を受付けるウェブページ等、任意のコンテンツに対して上述した各種処理を適用することができる。より具体的な例を説明すると、配信サーバ10は、ゲームの実行時や、フラッシュやCSS(Cascading Style Sheets)等の技術により作成されたインタラクティブ形式のウェブページの配信を行う際に、上述した各種処理を実行することで、利用者の利便性を向上させてもよい。
【0161】
また、配信サーバ10は、音声のみが含まれるコンテンツの再生時に、上述した各種処理を実行することで、利用者の利便性を向上させてもよい。
【0162】
〔7−2.ログについて〕
配信サーバ10は、実際に表示されたコンテンツや、決定処理によって決定された再生態様でコンテンツの再生が行われた際に、利用者による操作のログを取ってもよい。例えば、配信サーバ10は、決定処理によって決定された再生態様でコンテンツの再生が行われた際に、利用者が音量を変更する操作を行ったか否か、音声を変更する操作の内容といった旨を示すログを取得する。一方で、配信サーバ10は、コンテンツの再生が行われたか否か、コンテンツの再生時間、一時停止が行われたか否か、一時停止が行われたタイミング等のログを取得する。
【0163】
このように配信サーバ10が取得したログは、各広告コンテンツのCTRの更新や、インプレッション数の更新、広告主に広告効果を報告する際等に有用なログとなる。また、配信サーバ10が取得したログは、配信対象となるコンテンツに対して設定されるランディングページに配置されるコンテンツの変更に用いられてもよい。例えば、配信サーバ10は、利用者がコンテンツを選択した場合は、ランディングページを配信するサーバに対して、各種ログを通知し、かかるログの内容に応じて異なるランディングページの配信を行わせてもよい。
【0164】
また、配信サーバ10は、ログの履歴に基づいて再生態様を決定してもよい。例えば、配信サーバ10は、各コンテンツごとに、コンテンツに係るログの内容と関連付けて音量操作を学習し、コンテンツの配信を受付けると、所定の期間内に取得されたログの内容と関連付けられた音量操作に応じて再生態様を決定してもよい。
【0165】
なお、配信サーバ10は、クリック課金形式や入札形式で広告主への課金を行う場合は、上述したログに基づいて、広告主に対する課金額を変更してもよい。例えば、配信サーバ10は、上述した各種処理を実行させた際の課金額と、各種処理を行わずに所定の音量で再生させた際の課金額とに差分を設けてもよい。
【0166】
〔7−3.動作主体について〕
上記した実施形態では、配信サーバ10が学習処理、決定処理、制御処理を実行する例について記載した。しかしながら、実施形態は、これに限定されるものではない。例えば、上述した学習処理、決定処理、制御処理は、端末装置100によって実行されてもよい。また、例えば、学習処理については配信サーバ10によって実行され、決定処理および制御処理については、端末装置100が実行してもよい。例えば、端末装置100は、配信サーバ10に学習結果の問い合わせを行うことで決定処理を実行してもよい。
【0167】
〔7−4.装置構成〕
また、上記実施形態では、配信サーバ10とウェブサーバ120とが含まれる例を示したが、配信サーバ10とウェブサーバ120とは1個の装置として形成されてもよい。また、上記実施形態では、配信サーバ10から端末装置100にコンテンツが配信される例を示したが、実施形態はこれに限定されるものではなく、例えば、配信サーバ10に代えてコンテンツの配信を行うコンテンツ配信サーバがコンテンツの配信を行い、配信サーバ10が再生指示の配信を行う態様であってもよい。
【0168】
〔7−5.端末装置の操作記録〕
また、上述してきた配信サーバ10は、コンテンツが配置されているウェブページに対して、利用者がどれだけ端末装置100を操作したかという記録を収集してもよい。具体的には、配信サーバ10は、コンテンツが配置されているウェブページに対して利用者が行うスクロール操作等を記録する。
【0169】
また、配信サーバ10は、コンテンツに対するタップ操作(すなわち、選択操作)や、ウェブページをリロードした回数や、コンテンツを特定する情報について端末装置100からの発信操作(例えば、SNSへの書き込みなど)など、利用者が行う種々の操作を収集してもよい。
【0170】
かかる場合、配信サーバ10は、収集した操作履歴に関する情報を集計し、かかる情報について分析した情報をさらに取得する。例えば、配信サーバ10は、上述した各種処理を伴うコンテンツとかかる各種処理を伴わないコンテンツとについて、スクロール操作の回数やCTRなどの広告効果の指標を比較した情報などを取得する。
【0171】
ここで、上述した各種処理を伴うコンテンツが表示されるウェブページに対する操作履歴は、広告効果を示す指標となりうる。すなわち、上述した各種処理を伴うコンテンツが表示されるウェブページにおいては、利用者によってコンテンツ自体がクリックされることによりコンテンツ先のウェブページが表示されることのみならず、かかるウェブページに対して利用者がどれだけスクロール操作を行ったかという操作履歴自体が利用者のコンテンツへの興味を示す指標といえる。
【0172】
例えば、配信サーバ10は、利用者がスクロール操作を行った回数、スクロール操作が行われた量、スクロール操作が行われた時刻や時間、スクロール操作が行われてからコンテンツが選択されたか否か等を比較することで、上述した各種処理を伴うコンテンツを表示した際に、関心をどれくらい発生させたかを示す指標を提供することができる。したがって、配信サーバ10は、広告主端末110に操作履歴に関する情報を送信することにより、実施形態に係るコンテンツの表示されるウェブページに対する広告効果の指標を示すレポートとすることができる。なお、配信サーバ10は、広告主端末110に操作履歴に関する情報をそのまま送信してもよい。
【0173】
これにより、配信サーバ10は、上述した各種処理を用いて、広告に係るコンテンツを広く知らしめる処理の有用性を示すことができる。
【0174】
〔7−6.その他〕
上述した配信サーバ10は、利用者Aの情報に基づいて端末装置100における音量操作を学習し、学習結果に応じて、端末装置100がコンテンツに含まれる音声を再生する際の再生態様を決定した。しかしながら、実施形態は、これに限定されるものではない。例えば、配信サーバ10は、他のサーバ等が作成した学習結果のモデルを用いて、決定処理および制御処理のみを実行してもよい。すなわち、配信サーバ10は、利用者Aに関連する情報に基づいて学習された端末装置100の音量に関連する音量操作のモデルを用いて、コンテンツの配信要求時における利用者Aの状況に対応する音量操作を特定し、特定した音量操作に応じて、再生態様を決定する。そして、配信サーバ10は、決定した再生態様でコンテンツに含まれる音声を制御してもよい。
【0175】
例えば、図示を省略した学習サーバは、利用者Aの属性情報やログ情報を取得し、取得した属性情報やログ情報を用いて、端末装置100における音量操作の学習を行い、学習結果をモデルとして配信サーバ10に送信する。より具体的には、学習サーバは、取得した属性情報やログ情報から、利用者Aの状況と関連付けて、端末装置100における音量操作を学習し、利用者Aの状況と音量操作とを関連付けたモデルを作成する。そして、学習サーバは、作成したモデルを配信サーバ10に送信する。
【0176】
一方、配信サーバ10は、端末装置100から配信要求を受付けると、ログ情報等から利用者Aの状況を特定する。また、配信サーバ10は、特定した利用者Aの状況をモデルにあてはめ、利用者Aの状況と対応する音量操作を特定する。そして、配信サーバ10は、特定した音量操作に応じて、再生態様を決定する。その後、配信サーバ10は、決定した再生態様で、コンテンツに含まれる音声を制御する。なお、かかる決定処理および制御処理は、例えば、
図3に示す決定部21および音声制御部22により実現される。
【0177】
なお、上述した処理は、配信サーバ10ではなく、端末装置100によって実現されてもよい。すなわち、端末装置100は、学習サーバや配信サーバ10によって作成された学習結果をモデルとして取得する。また、端末装置100は、配信要求を送信する際、所定の方法で端末装置100の物理的な状況等に基づいて、利用者Aの状況を特定する。そして、端末装置100は、取得したモデルから、利用者Aの状況と対応する音量操作を特定し、特定した音量操作に応じた再生態様を決定する。その後、端末装置100は、決定した再生態様でコンテンツに含まれる音声を再生してもよい。
【0178】
ここで、配信サーバ10が使用するモデルには、利用者A、広告主、配信サーバ10が提供するサービスの提供主等によってあらかじめ設定されたモデルが含まれていてもよい。例えば、配信サーバ10が使用するモデルには、駅改札の入場履歴と、消音状態またはフェードインで音声を再生させる再生態様とがあらかじめ対応付けられていてもよい。かかるモデルを使用する場合、配信サーバ10は、配信要求を受付けてから所定の時間内に、ログ情報「機能:改札入場」が取得された場合は、消音状態またはフェードインで音声を再生させる再生態様を決定してもよい。
【0179】
〔7−7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0180】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、
図3に示した決定部21および音声制御部22は統合されてもよい。
【0181】
また、上記してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0182】
〔7−8.プログラム〕
また、上記してきた実施形態に係る配信サーバ10は、例えば
図10に示すような構成のコンピュータ1000によって実現される。以下、配信サーバ10を例に挙げて説明する。
図10は、配信サーバの機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を有する。
【0183】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0184】
HDD1400は、CPU1100によって実行されるプログラム、および、係るプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを他の機器へ送信する。
【0185】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0186】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、係るプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0187】
例えば、コンピュータ1000が実施形態に係る配信サーバ10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部13の機能を実現する。また、HDD1400には、記憶部12内のデータ、すなわちログ情報データベース14、属性情報データベース15、学習結果データベース16、配信情報データベース17が格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からこれらのプログラムを取得してもよい。
【0188】
なお、コンピュータ1000が実施形態に係る端末装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部13と同様の機能を実現し、端末装置100に上述した学習処理、決定処理、制御処理を実行させてもよい。また、HDD1400には、記憶部12と同様のデータが格納される。
【0189】
〔8.効果〕
上述したように、配信サーバ10は、利用者Aの情報に基づいて、利用者Aが使用する端末装置100の音量に関連する音量操作を学習する。また、配信サーバ10は、学習処理の学習結果に応じて、端末装置100がコンテンツに含まれる音声を再生する際の再生態様を決定する。そして、配信サーバ10は、決定した再生態様でコンテンツに含まれる音声を制御する。このため、配信サーバ10は、利用者Aが音量操作を行わずとも、利用者Aが望む態様で音声を出力させることができるので、利用者の利便性を向上させることができる。
【0190】
特に、本発明は、ニュースサイト等原則として音声が出力されないウェブページ(すなわち、記事)に音声を含む広告コンテンツを表示する記事内広告に最適である。例えば、利用者は、ニュースサイト等の記事を閲覧する際には、音声が出力されないと予測すると考えられる。しかしながら、動画コンテンツ等音声を含むコンテンツが広告コンテンツとして配信される態様が増えるに従い、利用者が記事等を閲覧する際に、予期せず音声が出力されてしまうといった状況が予測される。一方、配信サーバ10は、記事内広告として配信されるコンテンツの音声を決定した再生態様で再生するよう制御するので、例えば、利用者が音を聞かない前提で記事の閲覧を行うと想定して再生態様を決定した場合は、不適切な態様での音声の再生を防ぐことができる。
【0191】
なお、本発明は、利用者が投稿した動画像の配信サイトや、有料或いは無料の動画コンテンツ等を配信する配信サイト等、利用者が音を聞く前提の状態で広告コンテンツや動画コンテンツ等の配信を受付ける際にも有用である。
【0192】
また、配信サーバ10は、端末装置100の状況と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際の端末装置100の状況と関連付けられた音量操作に応じて、再生態様を決定する。このため、配信サーバ10は、傾きや操作履歴等、端末装置100の状態に基づく音量操作に応じた再生態様を決定することができるので、利用者の利便性を向上させることができる。
【0193】
また、配信サーバ10は、端末装置100に対する操作履歴と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際に行われた操作と関連付けられた音量操作に応じて、再生態様を決定する。すなわち、配信サーバ10は、端末装置100に対する操作履歴のパターンに応じた音量操作を学習し、コンテンツ配信時における操作履歴のパターンに対応する音量操作に応じた再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、各種操作が行われた後における音声の再生態様を適切に決定できるので、利用者の利便性を向上させることができる。
【0194】
また、配信サーバ10は、端末装置100の位置と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際の位置と関連付けられた音量操作に応じて、再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、端末装置100が職場等に位置する場合は、消音状態とし、端末装置100が利用者Aの自宅等に位置する場合は、音声を出力するといった再生態様を決定できるので、利用者の利便性を向上させることができる。
【0195】
また、配信サーバ10は、端末装置100が接続するネットワークと関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際に接続するネットワークと関連付けられた音量操作に応じて、再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、端末装置100が職場等の公共ネットワークに接続する場合は、消音状態とし、端末装置100が利用者Aの自宅等のプライベートなネットワークに接続する場合は、音声を出力するといった再生態様を決定できるので、利用者の利便性を向上させることができる。
【0196】
また、配信サーバ10は、端末装置100が再生したコンテンツの種別と関連付けて音量操作を学習し、端末装置100に対して配信されるコンテンツの種別と関連付けられた音量操作に応じて、当該コンテンツに含まれる音声を再生する際の再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、配信するコンテンツが広告にかかるコンテンツであるか、他の利用者が投稿した動画像等であるかに応じて、コンテンツの音声を再生する際の再生態様を決定できるので、利用者の利便性を向上させることができる。
【0197】
また、配信サーバ10は、端末装置100がコンテンツとは個別に表示する表示コンテンツの種別と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際に当該コンテンツとは個別に表示する表示コンテンツの種別と関連付けられた音量操作に応じて、再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、端末装置100がスポーツに関するウェブページを表示している場合は、コンテンツの音声を出力し、端末装置100がニュースに関するウェブページを表示している場合は、消音状態とするといった再生態様を決定できるので、利用者の利便性を向上させることができる。
【0198】
また、配信サーバ10は、端末装置100の物理的な状態と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際の端末装置100の物理的な状態と関連付けられた音量操作に応じて、再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、電車の中等で利用者Aが立って端末装置100を操作している場合には、コンテンツの音声を消音状態とし、利用者Aが寝ころんで端末装置100を操作している場合は、音声を出力するといった再生態様を決定できるので、利用者の利便性を向上させることができる。
【0199】
また、配信サーバ10は、端末装置100の周囲に存在する他の端末装置の音量と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際に当該端末装置100の周囲に存在する他の端末装置の音量と関連付けられた音量操作に応じて、再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、端末装置100の周囲の他の端末装置が音声を出力する場合は、コンテンツの音声を出力とし、他の端末装置が音声を出力しない場合は、消音状態にするといった再生態様を決定できるので、利用者の利便性を向上させることができる。
【0200】
また、配信サーバ10は、端末装置100を用いた入退場の履歴と関連付けて音量操作を学習し、端末装置100がコンテンツを取得する際の入退場の履歴と関連づけられた音量操作に応じて、再生態様を決定する。このため、例えば、配信サーバ10は、利用者Aが音量操作を行わずとも、駅の改札内や会社等の施設に入場した場合は、コンテンツの音声を消音状態とし、駅の改札や施設から出場した場合は、音声を出力するといった再生態様を決定できるので、利用者の利便性を向上させることができる。
【0201】
また、配信サーバ10は、コンテンツに複数の音声が含まれる場合は、各音声の種別に応じて、各音声の再生態様をそれぞれ決定する。このため、配信サーバ10は、適切な態様で、コンテンツに含まれる音声を再生できる。
【0202】
また、配信サーバ10は、コンテンツに含まれる音声の種別がサウンドロゴである場合は、再生態様として、当該サウンドロゴを所定の音量で再生する態様を決定する。このため、配信サーバ10は、コンテンツに含まれるサウンドロゴを利用者に試聴させることができる。
【0203】
また、配信サーバ10は、コンテンツに含まれる音声の種別が背景音である場合は、学習結果に応じて再生態様を決定する。ここで、背景音は、サウンドロゴやナレーションと比較して、周囲の人に対してあまり気づきを生じさせる音声ではないと考えられる。このため、配信サーバ10は、不適切な態様での音声の再生を防ぎつつ、利用者に対して音量を変更する機会を提供できる。
【0204】
また、配信サーバ10は、コンテンツに含まれる音声の種別がナレーションである場合は、再生態様として、消音状態とする態様、または、徐々に音量を上昇させる態様を決定する。ここで、ナレーションは、サウンドロゴや背景音と比較して、周囲の人に対して気づきを生じさせる音声であると考えられる。このため、配信サーバ10は、不適切な態様での音声の再生を防ぎつつ、利用者に対して音量を変更する機会を提供できる。
【0205】
また、配信サーバ10は、利用者Aに関連する情報に基づいて学習された端末装置100の音量に関連する音量操作のモデルから、コンテンツの配信要求時における利用者Aの状況に対応する音量操作を特定し、特定した音量操作に応じて、再生態様を決定する。そして、配信サーバ10は、決定した再生態様でコンテンツに含まれる音声を制御する。このため、配信サーバ10は、利用者Aが音量操作を行わずとも、利用者Aが望む態様で音声を出力させることができるので、利用者の利便性を向上させることができる。
【0206】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0207】
また、上記してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、決定部は、決定手段や決定回路に読み替えることができる。