IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ラストワンマイルの特許一覧

<>
  • 特許-情報処理装置 図1
  • 特許-情報処理装置 図2
  • 特許-情報処理装置 図3
  • 特許-情報処理装置 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-25
(45)【発行日】2022-02-02
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20220126BHJP
【FI】
G06Q30/02 438
【請求項の数】 6
(21)【出願番号】P 2019208752
(22)【出願日】2019-11-19
(65)【公開番号】P2021081983
(43)【公開日】2021-05-27
【審査請求日】2019-11-19
【審判番号】
【審判請求日】2021-02-17
【早期審査対象出願】
(73)【特許権者】
【識別番号】516300184
【氏名又は名称】株式会社ラストワンマイル
(74)【代理人】
【識別番号】100205659
【弁理士】
【氏名又は名称】齋藤 拓也
(74)【代理人】
【識別番号】100154748
【弁理士】
【氏名又は名称】菅沼 和弘
(72)【発明者】
【氏名】清水 望
(72)【発明者】
【氏名】秋月 帥謙
(72)【発明者】
【氏名】工藤 健二
(72)【発明者】
【氏名】市川 康平
(72)【発明者】
【氏名】末永 壽蔵
(72)【発明者】
【氏名】勝村 聡一郎
【合議体】
【審判長】高瀬 勤
【審判官】溝本 安展
【審判官】松田 直也
(56)【参考文献】
【文献】特開2007-241558(JP,A)
【文献】特開2012-32562(JP,A)
【文献】特開2017-130170(JP,A)
【文献】特開2002-215975(JP,A)
【文献】特開2019-125357(JP,A)
【文献】特開2017-224335(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
発話者から発話された音声の情報を、第1音声情報として取得する第1取得手段と、
前記第1取得手段により取得された前記第1音声情報に基づいて、前記発話者の発話の内容の中から、それ自体が広告として機能する1以上のキーワードの夫々を広告ワードとして検出する第1検出手段と、
前記発話者からの発話を聴いた際の受話者の反応を示す音声の情報を、第2音声情報として取得する第2取得手段と、
前記第1音声情報と前記第2音声情報とに基づき推定される前記受話者の感情の状態を示す情報を、エモーション情報として所定の時間帯毎に検出する第2検出手段と、
前記第1検出手段により検出された1以上の前記広告ワードの夫々と、これらに対応する1以上の前記エモーション情報の夫々との組み合わせに基づいて、前記広告に対する課金を行い、その課金に応じたインセンティブを前記発話者に付与する制御を実行する課金制御手段と、
を備える情報処理装置。
【請求項2】
前記第1取得手段により取得された前記第1音声情報に基づいて、前記発話者から発話された内容がテキスト化された第1テキストデータを生成するテキスト化手段をさらに備え、
前記第1検出手段は、前記第1テキストデータに基づいて、前記広告ワードを示すテキストのデータを第2テキストデータとして検出する、
請求項1に記載の情報処理装置。
【請求項3】
前記第1音声情報、又は前記第1音声情報と前記第2音声情報との組み合わせに基づいて、前記1以上の広告ワードの中に不正なものが含まれているか否かを検出する不正検出手段をさらに備える、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記不正検出手段は、前記第1音声情報、又は前記第1音声情報と前記第2音声情報との組み合わせに基づいて、前記発話者により連呼された前記広告ワードを検出し、検出された当該広告ワードが流れに乗って発話されたものでないと判断された場合には、これを前記不正な広告ワードとして検出する、
請求項3に記載の情報処理装置。
【請求項5】
前記第1取得手段により取得された前記第1音声情報と、前記第2取得手段により取得された前記第2音声情報との組み合わせに基づいて、前記発話者の評価を行う評価手段をさらに備える、
請求項1乃至4のうちいずれか1項に記載の情報処理装置。
【請求項6】
前記広告ワードには、前記広告のターゲットとなる第1ワードと、マス広告の対象とされる第2ワードとが含まれ、
前記第1検出手段は、前記広告ワードとして、前記第1ワードと前記第2ワードとを夫々検出する、
請求項1乃至5のうちいずれか1項に記載の情報処理装置
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置に関する。
【背景技術】
【0002】
SNS(Social Networking Service)におけるフレンド数やフォロワー数が多い等を理由に、世間に与える影響力の大きい行動を行う者は、「インフルエンサー」とも呼ばれている。そして、近年、インフルエンサーの情報発信能力を利用した広告や宣伝の手法である「インフルエンサー・マーケティング」を実践する企業等が増えている。インフルエンサーの影響力の度合を測定する技術も存在する(例えば特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2019-135661号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、インフルエンサー・マーケティングを行う場合、個々のインフルエンサーの相場がある程度決まっており、依頼価格が下がる要素も少ないため、インフルエンサーに依頼する際の価格が高くなる傾向にある。
このため、自社の広告や宣伝を行う企業や、広告や宣伝の代行を行う企業等においては、世間に与える影響力の大きい広告や宣伝を、より低コストで行いたいとする要望があるが、特許文献1に記載の技術を含めこのような要望に応えることができない状況である。
【0005】
本発明は、このような状況に鑑みてなされたものであり、世間に与える影響力の大きい広告や宣伝を、より低コストで行うことを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様の情報処理装置は、
発話者から発話された音声の情報を、音声情報として取得する取得手段と、
前記取得手段により取得された前記音声情報に基づいて、前記発話者の発話の内容の中から、所定の広告に関する1以上のキーワードの夫々を広告ワードとして検出する検出手段と、
前記検出手段により検出された1以上の前記広告ワードに基づいて、前記広告に対する課金を行い、その課金に応じたインセンティブを前記発話者に付与する制御を実行する課金制御手段と、
を備える。
【発明の効果】
【0007】
本発明によれば、世間に与える影響力の大きい広告や宣伝を、より低コストで行うことができる。
【図面の簡単な説明】
【0008】
図1】本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システムにより実現可能な本サービスの概要を示す図である。
図2】本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システムの構成の一例を示す図である。
図3図2に示す情報処理システムのうち、サーバのハードウェア構成の一例を示すブロック図である。
図4図3のサーバを含む情報処理システムの機能的構成のうち、発話課金処理を実行するための機能的構成の一例を示す機能ブロック図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、図面を用いて説明する。
【0010】
まず、図1を参照して、本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システム(後述する図2参照)の適用対象となるサービス(以下、「本サービス」と呼ぶ)の概要について説明する。
【0011】
図1は、本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システムにより実現可能な本サービスの概要を示す図である。
【0012】
図1に示すように、本サービスでは、サービス提供者Gと、依頼者Mと、発話者Sと、受話者Rとが登場する。
【0013】
依頼者Mは、例えば商品やサービスの提供を行う各種の企業や団体等であり、当該商品やサービスの広告や宣伝をサービス提供者に依頼し、その広告や宣伝による効果を享受する。
【0014】
発話者Sは、本サービスを利用して、広告ワードWkを発話することで、所定のインセンティブを享受することができる。
広告ワードWkとは、依頼者Mから依頼された広告や宣伝のために用いられるワードであって、当該依頼者Mやサービス提供者G等により設定されるものをいう。広告ワードWkには、例えば、依頼者Mの名称や略称を示したり想起させたりするワード、依頼者Mの商品やサービスの名称や略称を示したり想起させたりするワード等が含まれる。具体的には例えば、「〇〇(依頼者Mの企業名)は優良企業ですね」とか、「□□(依頼者Mの商品名)は使い心地が最高ですね」といった発話に含まれる「〇〇」や「□□」が広告ワードWkになり得る。
【0015】
ここで、発話者Sは、受話者Rに対して口頭による伝達を行える立場にある者であればどのような者であってもよい。
発話者Sは、例えば、一般個人であってもよい。このように、一般個人が発話者Sとして本サービスを利用できるようにすることで、数多くの一般個人の夫々が、日常のあらゆる場面で、発話者Sとして広告ワードWkを発話することになる。その結果、全体としての広告や宣伝効果は非常に大きくなるものであると期待できる。
例えば、発話者Sにより発話された音声はテキスト化(文字起こしされ)、その結果得られるテキストに広告ワードWkが存在する毎に依頼者Mに対して課金され、その課金に応じて発話者Sに所定のインセンティブ(所定の金額やポイント等)が付与される。これにより、一般個人であった発話者Sも、このような発話を繰り返すことでリアルインフルエンサーになり得る。
【0016】
受話者Rは、発話者Sから発話された広告ワードWkを聴くことになる者であり、依頼者Mの広告や宣伝の対象となる者である。
なお、受話者Rは、発話者Sと近くに存在する必要はなく、発話者Sから発話された広告ワードWkが音声信号として伝搬されて再生可能な場所であれば遠方も含め任意の場所に存在することができる。そういった点で、受話者Rは、1人である必要は特になく、複数人であってもよい。また、受話者Rは、発話者Sにとって話し相手である(受話者Rであると特定可能である)ことは必ずしも有しない。
【0017】
本サービスでは、発話者Sから受話者Rに向けて発話された1以上のワードWの中から検出された広告ワードWkの数等に応じて、依頼者Mに課金される額が決定され、その課金に応じて発話者Sに対するインセンティブの量(金額やポイント等)が決定される。
ここで、発話者Sから受話者Rに向けて発話された1以上のワードWの中から広告ワードWkを検出する際に用いられる手法は特に限定されない。
例えば発話者Sから受話者Rに向けて発話された1以上のワードWを収音(録音)した結果得られる音声データを発話ログとして記録(録音)し、その音声データに基づいて1以上のワードWをテキスト化(文字起こし)をして、その結果得られるテキストデータ全体の中から広告ワードWkを示すテキストデータkを検出する手法を採用することができる。なお、発話者Sの発話の録音には、例えば発話者Sのスマートフォン等が用いられる。
また例えば、音声データの発話ログについて解析(音声認識処理等)を行うことで、広告ワードWkを検出する手法を採用することができる。
発話ログから検出された広告ワードWkは、依頼者Mに課金する額と、発話者Sに提供されるインセンティブ(例えば支払額)とを算出する際の根拠資料として一定期間保存される。
【0018】
本サービスでは、発話ログ(音声データや文字起こしされたテキストデータ)は、ブロックチェーンBに記録される。これにより、発話ログの改ざんが困難化される。
例えば発話者Sが広告ワードWkを織り交ぜながらセミナーをしたとすると、このセミナーの内容が発話ログとしてブロックチェーンBに記録される。これにより、発話者Sがセミナーで発話した内容が勝手にカスタマイズされないようになる。
換言すると、ブロックチェーンBは、発話者Sの発話内容をいわば議事録として記憶するシステムとして活用することができる。
【0019】
本サービスには、発話ログに基づいて発話者Sの不正を検出する仕組みが設けられている。
具体的には例えば、発話者Sがトークの流れに乗って広告ワードWkを連呼するような場合であれば不正であると判断されないが、広告ワードWkを単に連呼するのみであるような場合には不正であると判断される。ただし、どのような行為が不正になるのかについては、依頼者M側で任意に設定することもできる。
また例えば、発話者Sがフィールドセールスとして訪問した場所を示す情報が記録され、発話者Sが発話した時間や場所等の属性情報に基づいて不正の有無が判断されるようにしてもよい。これにより、発話ログが不正な手法によって作成されたものかどうかを検知することが可能となる。なお、場所を示す情報としては、例えばGPS(Global Positioning System)位置情報を用いることができる。
【0020】
また、本サービスには、発話者Sを評価する仕組みが設けられている。具体的には例えば、依頼者Mの主観や発話ログの内容に基づいて発話者Sが評価される。上述の不正の検出の結果が評価に反映させるようにしてもよい。具体的には例えば不正があれば評価を下げるようにしてもよい。評価の結果は、依頼者Mに公表することもできる。
これにより、依頼者Mは、信頼のおける発話者Sに広告や宣伝を依頼することができる。
【0021】
また、上述したように、広告ワードWkを検出する際、発話ログのすべてがテキストデータに変換されて、その中から広告ワードWkを示すテキストデータkが検出される手法が採用される場合もある。
ただし、この手法が採用された場合、発話者Sの不正な行為によってテキストデータが改竄されるリスクがある。このため、本サービスでは、発話者Sの不正な行為によってテキストデータが改竄されるリスクを低減させる措置が講じられている。
即ち、本サービスでは、ブロックチェーンの技術を用いて発話ログを記録することで、テキストデータが改竄されるリスクを低減化させることができる。
これにより、例えば発話者Sがセミナーで講師として発話した内容を、改竄のリスクが低い議事録(テキストデータ)の発話ログとして記録し、その中から広告ワードWkを示すテキストデータkを検出してもよい。
【0022】
また、広告ワードWkは、依頼者Mがターゲットとする商品やサービスに関するワード(以下、「ターゲットワード」)のみならず、いわゆるマス広告に関するワード「以下、マス広告ワード」と呼ぶ)を含めることもできる。
例えば、テレビ放送の広告等において、所定の商品の名称「〇〇」をリズムに乗せて連呼させるようなマス広告を行っている場合がある。このような場合には、「〇〇」は、マス広告ワードとして設定することで、以下に示すいわゆる「抱き合わせ広告」を実現させることもできる。
【0023】
即ち、発話者Sは、依頼者Mの商品「△△」のターゲティング広告をすべくターゲットワード「△△」を織り交ぜながら発話した後、最後の5秒程度で、マス広告ワード「〇〇」を発話してもよい。
具体的には例えば、発話者Sは、「いままで新生活におすすめの「△△」の話をしてきましたが、そういえばもうひとつ新生活にぴったりの「〇〇」があることを思い出しまた。自分も「〇〇」を使ってみましたが、とてもよかったです。」といった発話をすることができる。
これにより、発話者Sは、依頼者Mの商品のターゲティング広告が功を奏さず契約が取れなかった場合であっても、マス広告ワードに対するインセンティブを享受することができる。つまり、ターゲティング広告に要したコストの少なくとも一部を穴埋めすることができる。
【0024】
さらに、発話者Sは依頼者Mのアンバサダーになることもできる。
アンバサダーとは、依頼者Mの商品やサービスのファンであり、知人に対する口コミはもとより依頼者Mのアンケートや新商品のキャンペーン等に積極的であり、広告塔にもなり得る者のことをいう。
発話者Sが依頼者Mのアンバサダーになった場合には、発話者Sが依頼者Mの商品やサービスの割引を受けられるようにすることもできる。
【0025】
広告ワードWkを発話した発話者Sの行為により依頼者Mの商品やサービスがインターネット上で一躍話題になり、各種メディアや一般消費者の話題を席巻する事態が生じることがある。
このような事態が生じた場合、本サービスでは、その原動力となった発話者Sを「無意識のアフィリエイト候補」として見出すとともに、その発話者Sに対しては、追加となるインセンティブを供与することもできる。「無意識のアフィリエイト候補」として発話者Sを見出すための手法は特に限定されないが、例えば保存されている発話ログを解析することで見出す手法を採用することができる。その際、発話ログの解析において、その発話ログが改竄されていないかについての確認も行われるようにしてもよい。
なお、発話者Sに追加的に供与されるインセンティブを誰が負担するのかについては特に限定されない。恩恵を受けた依頼者Mに追加の課金を行うことで依頼者Mが負担してもよいし、サービス提供者Gが負担してもよい。
【0026】
また、図示はしないが、本サービスは、例えばコールセンタにおけるオペレータの発話にも適用することができる。つまり、コールセンタのオペレータは、発話者Sとして本サービスを利用することができる。
この場合、オペレータのトークスクリプト画面に広告ワードWkを表示することもできる。これにより、オペレータは、広告ワードWkの発話を失念することなく、会話の流れの中で自然に広告ワードWkを発話することができる。
また、トークスクリプト画面に表示された広告ワードWkをブリンクさせることでオペレータの注意を促してもよい。これにより、オペレータに広告ワードWkを確実に発話させるようにすることができる。
また、オペレータが広告ワードWkを発話したことをリアルタイム、ニアリアルタイム、又は事後的に検知し、その回数を自動的にカウントアップして、トークスクリプト画面に表示されるようにすることもできる。これにより、オペレータに広告ワードWkを確実に発話させるようにすることができる。また、広告ワードWkの発話の回数に応じてオペレータが所定のインセンティブを享受できるようにすることで、オペレータに対し、広告ワードWkを発話する誘因を与えることができる。
【0027】
本サービスでは、発話者Sにより発話された広告ワードWkを聴いた受話者Rのエモーションが検知され、その結果がエモーションログとして記録されるようにしてもよい。
このエモーションログが解析されることで、例えば広告ワードWkを聴いた受話者Rがポジティブ(良い印象)になった時間帯、ネガティブ(悪い印象)になった時間帯等が自動的にカウントされる。受話者Rがポジティブであるか、又はネガティブであるかについては、エモーションログの解析結果に基づいて判断される。この場合、例えばエモーションログから笑声(えごえ)を検出することで判断することもできる。「笑声(えごえ)」とは、声から笑顔が容易に想像できるような声のことをいう。ある時間帯の受話者Rの声が笑声(えごえ)である場合には、その時間帯は受話者Rがポジティブ(良い印象)であるとし、その時間帯に広告ワードWkが発話された場合には、依頼者Mに追加で課金することもできる。依頼者Mに追加で課金された場合には、追加で課金された額の一部が発話者Sにインセンティブとして還元されてもよい。これにより、発話者Sの会話の能力に応じてインセンティブを供与することができるようになる。
なお、エモーションログは、音声データに限定されない。例えばカメラで受話者Rを撮像した画像のデータもエモーションログとして採用することができる。この場合、カメラで受話者Rを撮像した画像のデータに対して各種画像処理が施されることによって、受話者Rが笑顔である時間帯や、ポジティブ(良い印象)であることを示すジェスチャー(例えば積極的に頷く等)の回数等が自動的にカウントされる。
【0028】
また、図示はしないが、本サービスは、訪問販売等のフィールドセールスや、携帯電話、化粧品等の対面販売にも適用することができる。
具体的には、上述のターゲティング広告で実現化されるいわゆる「抱き合わせ広告」を、フィールドセールスや対面販売でも実現化させることができる。
即ち、発話者Sは、自社の商品のフィールドセールスや対面販売のトークの合間の雑談の中で、マス広告の対象となっている依頼者Mの商品の名称「〇〇」を発話する。具体的には例えば、発話者Sは、「そういえばテレビコマーシャルでよく見かける〇〇(依頼者Mの商品名)を使ってみましたがよかったですよ。」といった発話をする。
これにより、発話者Sは、自社の商品のフィールドセールスや対面販売が功を奏さず契約が取れなかった場合であっても、本サービスを利用する発話者Sとして所定のインセンティブを享受することができる。つまり、自社の商品のフィールドセールスに要したコストの少なくとも一部を穴埋めすることができる。
【0029】
本サービスでは、広告ワードWkを検出するために、発話者Sにより発話された音声のデータが発話ログとして記録されるが、発話ログは所定期間が経過することで自動消去される。これにより、個人情報の保護を趣旨とする各種規制に対応することができる。
【0030】
次に、図2を参照して、上述した本サービスの提供を実現化させる情報処理システム、即ち本発明の情報処理装置の一実施形態に係るサーバ1を含む、情報処理システムの構成について説明する。
図2は、本発明の情報処理装置の一実施形態に係るサーバを含む、情報処理システムの構成の一例を示す図である。
【0031】
図2に示す情報処理システムは、サーバ1と、依頼者端末2と、発話者端末3と、受話者端末4と、ブロックチェーンBとを含むように構成されている。
サーバ1、依頼者端末2、発話者端末3、受話者端末4、及びブロックチェーンBの夫々は、インターネット等の所定のネットワークNを介して相互に接続されている。
【0032】
サーバ1は、サービス提供者Gにより管理され、依頼者端末2、発話者端末3、受話者端末4、及びブロックチェーンBの夫々と適宜通信をしながら、本サービスを実現するための各種処理を実行する。
【0033】
依頼者端末2は、依頼者Mにより操作され、例えばパーソナルコンピュータ、スマートフォン、タブレット等で構成される。
発話者端末3は、発話者Sにより操作され、例えばパーソナルコンピュータ、スマートフォン、タブレット等で構成される。
【0034】
依頼者M及び発話者Sの夫々は、本サービスの利用者向けの専用のアプリケーションソフトウェア(以下、「専用アプリ」と呼ぶ)がインストールされた依頼者端末2及び発話者端末3の夫々を用いて本サービスを利用することができる。
また、依頼者M及び発話者Sの夫々は、依頼者端末2及び発話者端末3の夫々のブラウザ機能により表示される、本サービスの利用者向けの専用のWebサイト(以下、「専用サイト」と呼ぶ)から本サービスを利用することもできる。
なお、以下、断りのない限り、「依頼者Mが依頼者端末2を操作する」と表現している場合、それは、次のいずれかを意味している。即ち、依頼者Mが、依頼者端末2にインストールされた専用アプリを起動して各種操作を行うこと、又は依頼者端末2のブラウザ機能により表示される専用サイトから本サービスを利用することを意味している。
また、「発話者Sが発話者端末3を操作する」と表現している場合、それは、次のいずれかを意味している。即ち、発話者Sが、発話者端末3にインストールされた専用アプリを起動して各種操作を行うこと、又は発話者端末3のブラウザ機能により表示される専用サイトから本サービスを利用することを意味している。
【0035】
受話者端末4は、録音録画機能を有する情報処理端末である。
【0036】
ブロックチェーンBでは、伝送単位のデータブロックに、生成値を予測することが困難なハッシュ値等が付加され、時系列に沿って追加されていくことでデータの改ざんが困難化される。
【0037】
図3は、図2に示す情報処理システムのうち、サーバのハードウェア構成の一例を示すブロック図である。
【0038】
サーバ1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入出力インターフェース15と、入力部16と、出力部17と、記憶部18と、通信部19と、ドライブ20とを備えている。
【0039】
CPU11は、ROM12に記録されているプログラム、又は、記憶部18からRAM13にロードされたプログラムに従って各種の処理を実行する。
RAM13には、CPU11が各種の処理を実行する上において必要なデータ等も適宜記憶される。
【0040】
CPU11、ROM12及びRAM13は、バス14を介して相互に接続されている。このバス14にはまた、入出力インターフェース15も接続されている。入出力インターフェース15には、入力部16、出力部17、記憶部18、通信部19及びドライブ20が接続されている。
【0041】
入力部16は、例えばキーボード等により構成され、各種情報を入力する。
出力部17は、液晶等のディスプレイやスピーカ等により構成され、各種情報を画像や音声として出力する。
記憶部18は、DRAM(Dynamic Random Access Memory)等で構成され、各種データを記憶する。
通信部19は、インターネットを含むネットワークNを介して他の装置(例えば図2の依頼者端末2、発話者端末3、受話者端末4、及びブロックチェーンB等)との間で通信を行う。
【0042】
ドライブ20には、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリ等よりなる、リムーバブルメディア30が適宜装着される。ドライブ20によってリムーバブルメディア30から読み出されたプログラムは、必要に応じて記憶部18にインストールされる。
また、リムーバブルメディア30は、記憶部18に記憶されている各種データも、記憶部18と同様に記憶することができる。
【0043】
なお、図示はしないが、図2の依頼者端末2、発話者端末3、及び受話者端末4も、図3に示すハードウェア構成と基本的に同様の構成を有することができる。従って、依頼者端末2、及び発話者端末3のハードウェア構成の説明については省略する。
【0044】
このような図3のサーバ1の各種ハードウェアと各種ソフトウェアとの協働により、サーバ1における発話課金処理を含む各種処理の実行が可能になる。その結果、サービス提供者Gは、依頼者M、及び発話者Sに対し、上述の本サービスを提供することができる。
「発話課金処理」とは、上述の本サービスを提供するために実行される処理のことをいう。
以下、本実施形態に係るサーバ1において実行される、発話課金処理を実行するための機能的構成について説明する。
【0045】
図4は、図3のサーバを含む情報処理システムの機能的構成のうち、発話課金処理を実行するための機能的構成の一例を示す機能ブロック図である。
【0046】
図4に示すように、サーバ1のCPU11においては、発話課金処理の実行が制御される場合、音声取得部101と、文字起こし部102と、音声認識部103と、広告ワード検出部104と、課金制御部105と、不正検出部106と、評価部107と、エモーション検出部108とが機能する。
【0047】
音声取得部101は、発話者Sから受話者Rに向けて発話された音声の信号を音声情報(発話ログ)として取得する。
【0048】
文字起こし部102は、音声取得部101により取得された音声情報(発話ログ)に基づいて、発話者Sから発話された音声の内容がテキスト化されたテキストデータ(発話ログのテキストデータ)を生成する(文字起こしを行う)。
発話ログのテキストデータは、ブロックチェーンBに記録される。これにより、発話ログのテキストデータが改竄されるリスクを大幅に低減させることができる。
【0049】
音声認識部103は、音声取得部101により取得された音声情報(発話ログ)に基づいて、発話者Sから発話された音声の内容を認識する。
【0050】
広告ワード検出部104は、音声認識部103の認識結果又は文字起こし部102により生成された(文字起こしされた)発話ログのテキストデータにより示される発話者Sから発話された音声の内容から、1以上の広告ワードWkを検出する。
ここで、広告ワードWkには、依頼主Mから依頼された広告のターゲットとなるワード(以下、「ターゲットワード」と呼ぶ)と、マス広告の対象とされるワード(以下、「マス広告ワード」と呼ぶ)とが存在する。
このため、広告ワード検出部104には、ターゲットワードが検出されるターゲット検出部111と、マス広告ワードが検出されるマス検出部112とが設けられている。
【0051】
課金制御部105は、広告ワード検出部104により検出された1以上の広告ワードWkに基づいて、広告に対する課金を行い、その課金に応じたインセンティブを発話者Sに付与する制御を実行する。
具体的には例えば、課金制御部105は、発話ログのうち、広告ワードWkの前後5秒間に相当する部分を証拠資料(レポート)として依頼者M等に提示する。そして、その証拠資料(レポート)の内容について依頼者Mの承認が得られると、課金制御部105は、広告ワードWkの数等に応じた額を課金し、その課金に応じたインセンティブ(所定の金額やポイント等)を発話者Sに付与する制御を実行する。なお、依頼者Mに提示される証拠資料は、上述したブロックチェーンBの技術によって信頼性が担保されている。
ここで、課金の額やインセンティブの量は、必ずしも一律である必要はなく、例えばターゲットワードとマス広告ワードとに応じて変化させてもよいし、また例えば、受話者Rのエモーションに応じて変化させてもよい。
また例えば、課金制御部105は、初回登録時等の所定条件を満たす場合、広告ワードWkとは別に、課金やインセンティブを発生させることもできる。具体的には例えば、依頼者Mとその顧客との間で契約が締結された場合には、契約締結に貢献したと認められる発話をした発話者Sに対し、広告ワードWkの数とは別にインセンティブが供与されてもよい。即ち、依頼者Mの「成約数」に基づいて課金やインセンティブを発生させることもできる。
【0052】
不正検出部106は、音声取得部101により取得された音声情報(発話ログ)に基づいて、1以上の広告ワードWkの中に不正なものが含まれているか否かを検出する。
例えば不正検出部106は、依頼者Mの広告を目的とするものと偽って発話者Sから発話されたワードを、不正なものとして検出する。
【0053】
評価部107は、依頼者Mの主観や音声情報(発話ログ)等に基づいて、発話者Sの評価を行う。評価部107は、不正検出部106による不正の検出の結果を、評価に反得させるようにしてもよい。具体的には例えば評価部107は、不正検出部106により発話者Sの不正が検出された場合、その発話者Sの評価を下げるようにしてもよい。
これにより、依頼者Mは、信頼のおける発話者Sに広告や宣伝を依頼することができる。また、発話者Sは、高い評価を受けることで依頼件数が増えると考えるので、不正を行おうとする発話者Sが出てくることを防止することができる。
【0054】
エモーション検出部108は、発話者Sの発話に対する受話者Rの反応(音声や顔の表情等)を音声や画像等の各種形態のデータで受話者端末4から取得して、受話者Rのエモーションを検出する。
ここで、エモーションの検出の手法は、特に限定されず、例えば受話者Rの顔の表情やジェスチャーの解析を、AI(人工知能)によるディープラーニングを利用した各種技術(画像認識、表情解析、感情解析等)を用いて行うことで、エモーションを検出する手法を採用することができる。
【0055】
以上の機能的構成を有する本実施形態のサーバ1によれば、上述のサービスの他、例えば以下のようなサービスを実現化させることもできる。
【0056】
即ち、例えばブロックチェーンBを利用して、フィールドセールスにおける会話の音声データやテキストデータを改竄不可能な状態で記録することができる。これにより、例えば顧客との間で言った言わないのトラブルが発生した際の証拠資料として活用することができる。
【0057】
また例えば、ブロックチェーンBを利用して、選挙に立候補した者を発話者Sとして、演説や講演等で発話した内容を、改竄のリスクが低いデータで記録しておくこともできる。
この場合、例えば選挙に立候補した者が公職選挙法に違反する疑いのある行為を行った場合には、訴訟における証拠資料として活用することもできる。
【0058】
また例えば、ブロックチェーンBを利用して、会議に参加した者を発話者Sとして、会議で発話した内容を、改竄のリスクが低いデータで記録しておくこともできる。この場合、議事録のデータを改竄させない仕組みを有するサービスや、証拠となる議事録のデータそのものを作成させないようにする行為(いわゆる「オフレコ」)を禁止する仕組みを有するサービスとして提供することもできる。
【0059】
また例えば、フィールドセールスにおいて、なかなか契約に繋がらない等の課題を有する営業担当者を発話者Sとすることにより、営業時のトークを音声データの形式又はテキストデータの形式で記録することができる。これにより、営業時のトークのどこに問題があるのかを事後的に検証することもできる。
【0060】
以上、本発明の一実施形態について説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものとみなす。
【0061】
例えば、上述の実施形態では、ブロックチェーンBは、テキストデータを記録することで改竄のリスクを低減化させる構成となっているが、音声データそのものを記録することで改竄のリスクを低減化させてもよい。
【0062】
また例えば、上述の実施形態では、発話者Sがインセンティブを享受すべく積極的に広告ワードWkを発話する構成となっているが、発話者Sが積極的に広告ワードWkを発話する意思がなくてもよい。
例えば偶然に広告ワードWkに言及したような場合であっても、依頼者Mに課金されて、その少なくとも一部がインセンティブとして発話者Sに供与されてもよい。
【0063】
また例えば、上述の実施形態において広告ワードWkは、発話者Sによってポジティブな意味で発話されているが、例えばネガティブな意味で広告ワードWkを発話した場合には、インセンティブが供与されないようにすることもできる。また、所定のペナルティを加えることもできる。
【0064】
また例えば、上述の実施形態では、ブロックチェーンを利用する構成となっているが、ブロックチェーンの種類は特に限定されず、パブリックブロックチェーンであってもよいし、プライベートブロックチェーンであってもよい。実際のユースケースや、必要となるパフォーマンス、又はマーケティングの観点に基づいて任意に選択することができる。
また、上述の実施形態においてブロックチェーンB上で行われる処理の少なくとも一部を、サーバ1側で行うようにすることもできるし、サーバ1上で行われる処理の少なくとも一部を、ブロックチェーンB側で行うようにすることもできる。
【0065】
また、図2に示すシステム構成、図3に示すサーバ1のハードウェア構成は、本発明の目的を達成するための例示に過ぎず、特に限定されない。
【0066】
また、図4に示す機能ブロック図は、例示に過ぎず、特に限定されない。即ち、上述した一連の処理を全体として実行できる機能が情報処理システムに備えられていれば足り、この機能を実現するためにどのような機能ブロックを用いるのかは、特に図4の例に限定されない。
【0067】
また、機能ブロックの存在場所も、図4に限定されず、任意でよい。
例えば、図4の例において、上述の発話課金処理がサーバ1側で行われる構成となっているが、これに限定されない。依頼者端末2側又は発話者端末3側で発話課金処理の少なくとも一部が行われてもよい。基本的には依頼者端末2側で発話ログを保存するようにして、所定のタイミングでサーバ1に送信できるようにしてもよい。
即ち、発話課金処理の実行に必要となる機能ブロックは、サーバ1側が備える構成となっているが、これは例示に過ぎない。サーバ1側に配置された機能ブロックの少なくとも一部を、依頼者端末2側や発話者端末3側が備える構成としてもよい。
【0068】
また、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。
また、1つの機能ブロックは、ハードウェア単体で構成してもよいし、ソフトウェア単体で構成してもよいし、それらの組み合わせで構成してもよい。
【0069】
一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、コンピュータ等にネットワークや記録媒体からインストールされる。
コンピュータは、専用のハードウェアに組み込まれているコンピュータであってもよい。
また、コンピュータは、各種のプログラムをインストールすることで、各種の機能を実行することが可能なコンピュータ、例えばサーバの他汎用のスマートフォンやパーソナルコンピュータであってもよい。
【0070】
このようなプログラムを含む記録媒体は、ユーザにプログラムを提供するために装置本体とは別に配布される図示せぬリムーバブルメディアにより構成されるだけでなく、装置本体に予め組み込まれた状態でユーザに提供される記録媒体等で構成される。
【0071】
なお、本明細書において、記録媒体に記録されるプログラムを記述するステップは、その順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
また、本明細書において、システムの用語は、複数の装置や複数の手段等より構成される全体的な装置を意味するものとする。
【0072】
以上まとめると、本発明が適用される情報処理装置は、次のような構成を取れば足り、各種各様な実施形態を取ることができる。
即ち、本発明が適用される情報処理装置は、
発話者(例えば図1の発話者S)から発話された音声の情報を、音声情報(例えば図1の発話ログ)として取得する取得手段(例えば図4の音声取得部101)と、
前記取得手段により取得された前記音声情報に基づいて、前記発話者の発話の内容の中から、所定の広告に関する1以上のキーワードの夫々を広告ワード(例えば図1の広告ワードWk)として検出する検出手段(例えば図4の広告ワード検出部104)と、
前記検出手段により検出された1以上の前記広告ワードに基づいて、前記広告に対する課金を行い、その課金に応じたインセンティブを前記発話者に付与する制御を実行する課金制御手段(例えば図4の課金制御部105)と、
を備える。
【0073】
即ち、発話者から受話者に向けて発話された音声の内容から広告ワードが検出され、検出された広告ワードに基づいて課金が行われて、その課金に応じたインセンティブが発話者に付与される。
これにより、一般個人が発話者Sとして本サービスを利用できるようになるので、数多の一般個人の夫々が日常のあらゆる場面や場所で発話者Sとして広告ワードWkを発話することができる。
その結果、全体としての広告・宣伝効果は非常に大きくなることが期待できるので、世間に与える影響力の大きい広告や宣伝を、より低コストで行うことができる。
【符号の説明】
【0074】
1・・・サーバ、2・・・依頼者端末、3・・・発話者端末、4・・・受話者端末、11・・・CPU、12・・・ROM、13・・・RAM、14・・・バス、15・・・入出力インターフェース、16・・・入力部、17・・・出力部、18・・・記憶部、19・・・通信部、20・・・ドライブ、30・・・リムーバルメディア、101・・・音声取得部、102・・・文字起こし部、103・・・音声認識部、104・・・広告ワード検出部、105・・・課金制御部、106・・・不正検出部、107・・・評価部、108・・・エモーション検出部、111・・・ターゲット検出部、112・・・マス検出部、181・・・ユーザDB、G・・・サービス提供者、M・・・依頼者、S・・・発話者、R・・・受話者、B・・・ブロックチェーン、N・・・ネットワーク
図1
図2
図3
図4