IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 6Assets株式会社の特許一覧

特開2022-185174メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム
<>
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図1
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図2
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図3
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図4
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図5
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図6
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図7
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図8
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図9
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図10
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図11
  • 特開-メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022185174
(43)【公開日】2022-12-14
(54)【発明の名称】メッセージサービス提供方法、メッセージサービス提供プログラム及びメッセージサービスシステム
(51)【国際特許分類】
   H04M 3/42 20060101AFI20221207BHJP
   G06Q 50/00 20120101ALI20221207BHJP
   G06F 13/00 20060101ALI20221207BHJP
【FI】
H04M3/42 Z
G06Q50/00 300
G06F13/00 650B
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2021092665
(22)【出願日】2021-06-02
(71)【出願人】
【識別番号】520395363
【氏名又は名称】6Assets株式会社
(74)【代理人】
【識別番号】230116539
【弁護士】
【氏名又は名称】恩田 俊明
(72)【発明者】
【氏名】根岸 心
【テーマコード(参考)】
5B084
5K201
5L049
【Fターム(参考)】
5B084AA02
5B084AA16
5B084AB14
5B084AB39
5B084BB04
5B084BB14
5B084CB12
5B084CF12
5B084DC02
5B084DC03
5K201BA05
5K201CA03
5K201CB13
5K201CC02
5K201DC05
5K201EC06
5K201EC07
5K201EC10
5K201ED04
5K201EF10
5L049BB26
5L049CC11
(57)【要約】
【課題】音声コンテンツ投稿に関する従来技術は、単にコンテンツを投稿する便宜を図る技術に過ぎず、テキストベースや画像ベースではなく、音声コンテンツそのものには視覚性が乏しいため、ユーザに対し、音声コンテンツとしての魅力乃至価値をうまく提供しきれているとは言い難かった。
【課題を解決するための手段】ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿可能なメッセージサービスを提供する方法であって、ユーザを識別する情報であるユーザ情報を取得し、取得元となるユーザのユーザ情報と紐づけて音声を取得するとともに、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させ、音声再生UIの選択を受け付けると、受け付けた選択に応じて音声を出力するメッセージサービス提供方法などを提案する。
【選択図】図2

【特許請求の範囲】
【請求項1】
ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿可能なメッセージサービスを提供する方法であって、
ユーザを識別する情報であるユーザ情報を取得するユーザ情報取得ステップと、
取得元となるユーザのユーザ情報と紐づけて音声を取得する音声取得ステップと、
取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させるUI表示ステップと、
音声再生UIの選択を受け付ける選択受付ステップと、
受け付けた選択に応じて音声を出力する音声出力ステップと、
をコンピュータに実行させるメッセージサービス提供方法。
【請求項2】
音声取得ステップは、
取得する音声の再生時間長に応じて当該音声を編集する編集取得サブステップをさらに有する請求項1に記載のメッセージサービス提供方法。
【請求項3】
音声出力ステップは、
投稿された複数の音声メッセージを順番に連続して出力する時系列出力サブステップをさらに有する請求項1又は2に記載のメッセージサービス提供方法。
【請求項4】
選択受付ステップにて選択を受け付けると、当該選択をしたユーザのユーザ情報に応じて選択された音声の音響処理を行う事前処理ステップと、をさらに有し、
音声出力ステップは、
事前処理ステップにて処理された音声を出力する処理済音声出力サブステップを有する請求項1から3のいずれか一に記載のメッセージサービス提供方法。
【請求項5】
取得した音声を音声認識のうえ一部又は全部を文字化する文字化処理ステップをさらに有し、
UI表示ステップは、
文字化処理ステップにて処理された文字データとともに音声再生UIを表示させる文字表示サブステップをさらに有する請求項1から4のいずれか一に記載のメッセージサービス提供方法。
【請求項6】
ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿可能なメッセージサービス提供プログラムであって、
ユーザを識別する情報であるユーザ情報を取得するユーザ情報取得ステップと、
取得元となるユーザのユーザ情報と紐づけて音声を取得する音声取得ステップと、
取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させるUI表示ステップと、
音声再生UIの選択を受け付ける選択受付ステップと、
受け付けた選択に応じて音声を出力する音声出力ステップと、
をコンピュータに実行させるメッセージサービス提供プログラム。
【請求項7】
ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿利用可能なメッセージサービスシステムであって、
ユーザを識別する情報であるユーザ情報を取得するユーザ情報取得部と、
取得元となるユーザのユーザ情報と紐づけて音声を取得する音声取得部と、
取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させるUI表示部と、
音声再生UIの選択を受け付ける選択受付部と、
受け付けた選択に応じて音声を出力する音声出力部と、
を備えるメッセージサービスシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿可能なメッセージサービスの提供方法や提供プログラム及びメッセージサービスシステムなどに関する。
【背景技術】
【0002】
従来から、ソーシャルネットワークサービス(SNS)などを通じて、様々なコミュニケーションを促進するための技術が知られている。
【0003】
そしてこのようなサービスにおいては、従来からテキストベースや画像(動画)ベースの情報の送受信が行われてきたところ、近時、音声ベースの投稿を通じたサービスが展開されたり、関連する技術が開示されたりするに至っている。例えば特許文献1には、音声通話を録音し、通話相手の承諾を条件に、当該録音データを音声コンテンツとしてソーシャルメディアに公開投稿する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020―052794号
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載されている先行技術は、単にコンテンツを投稿する便宜を図る技術に過ぎず、投稿されたコンテンツに接するユーザに対して、好適な提示手段を提供しているとはいいがたかった。すなわち、テキストベースや画像ベースではなく、音声コンテンツそのものには視覚性が乏しいため、ユーザに対し、音声コンテンツとしての魅力乃至価値をうまく提供しきれているとは言い難かった。
【課題を解決するための手段】
【0006】
以上のような課題を解決すべく、本発明は、ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿可能なメッセージサービスシステムを提供する方法であって、ユーザを識別する情報であるユーザ情報を取得するユーザ情報取得ステップと、取得元となるユーザのユーザ情報と紐づけて音声を取得する音声取得ステップと、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させるUI表示ステップと、音声再生UIの選択を受け付ける選択受付ステップと、受け付けた選択に応じて音声を出力する音声出力ステップと、をコンピュータに実行させる方法などを提案する。
【0007】
また、上記方法に関連して、音声取得ステップが、取得する音声の再生時間長に応じて当該音声を編集する編集取得サブステップをさらに有する方法なども提案する。
【0008】
また、上記方法に関連して、音声出力ステップが、投稿された複数の音声メッセージを順番に連続して出力する時系列出力サブステップをさらに有する方法なども提案する。
【0009】
また、上記方法に関連して、選択受付ステップにて選択を受け付けると、当該選択をしたユーザのユーザ情報に応じて選択された音声の音響処理を行う事前処理ステップをさらに有し、音声出力ステップが、事前処理ステップにて処理された音声を出力する処理済音声出力サブステップを有する方法なども提案する。
【0010】
また、上記方法に関連して、取得した音声を音声認識のうえ一部又は全部を文字化する文字化処理ステップをさらに有し、UI表示ステップが、文字化処理ステップにて処理された文字データとともに音声再生UIを表示させる文字表示サブステップをさらに有する方法なども提案する。
【0011】
また、上記方法を実現するためのプログラムやシステムなども提案する。
【発明の効果】
【0012】
主に以上のような構成をとる本発明によって、多くのユーザに対し、投稿された音声コンテンツの視認性を向上させることができるようになる。
【図面の簡単な説明】
【0013】
図1】本発明のシステムの概略図
図2】実施形態1のシステムの機能ブロックの一例を示す図
図3】実施形態1のシステムの機能的な各構成をまとめて一のハードウェアとして実現した際の構成の一例を示す概略図
図4】実施形態1のシステムにおける処理の流れの一例を示す図
図5】実施形態2のシステムの機能ブロックの一例を示す図
図6】実施形態2のシステムにおける処理の流れの一例を示す図
図7】実施形態3のシステムの機能ブロックの一例を示す図
図8】実施形態3のシステムにおける処理の流れの一例を示す図
図9】実施形態4のシステムの機能ブロックの一例を示す図
図10】実施形態4のシステムにおける処理の流れの一例を示す図
図11】実施形態5のシステムの機能ブロックの一例を示す図
図12】実施形態5のシステムにおける処理の流れの一例を示す図
【発明を実施するための形態】
【0014】
まず図1を示す。図1は本発明の概要を示す図である。本図に示されているように、本発明は、複数のスマートフォン0101、0102、0111やタブレット0112その他の端末とネットワークを介して接続されたコンピュータ0121やサーバ0131によって実現可能である。本発明においては音声再生に技術的特徴があることから、前記スマートフォンやタブレットはいずれも、何らかの音声出力インタフェースを備えている必要がある。その意味においては、かかるインタフェースを備えていさえすれば、端末の種別は特に限定されず、他にも例えば、スマートグラス、スマートウォッチ、AR/VRゴーグルなども含まれうる。また、コンピュータ0121とサーバ0131は、図1に記載されているようにネットワークを介して接続され協働するいわゆるクラウドコンピューティングの形式にて全体として一のシステムを構成してもよいし、オンプレミス型にて一体的に構成されてももちろんよい。
【0015】
以下、本発明の各実施形態について図面とともに説明する。まず実施形態と請求項の相互の関係は、以下のとおりである。まず、実施形態1は主に請求項1、6、7などに対応する。実施形態2は主に請求項2などに対応する。実施形態3は主に請求項3などに対応する。実施形態4は主に請求項4などに対応する。実施形態5は主に請求項5などに対応する。
【0016】
なお、本発明はこれらの実施形態に何ら限定されるものではなく、技術常識に従って特許請求の範囲の各請求項に記載の技術的思想を有し、その要旨を逸脱しない範囲内において、様々な態様で実施し得る。
【0017】
<<実施形態1>>
<概要>
図2は、本実施形態のメッセージサービス提供システムの機能ブロックの一例を示す図である。同図において示されているように、本実施形態の「メッセージサービス提供システム」0200は、「ユーザ情報取得部」0201と、「音声取得部」0202と、「UI表示部」0203と、「選択受付部」0204と、「音声出力部」0205と、を有する。
【0018】
なお、以下で詳しく説明するメッセージサービス提供システムは、その機能の一又は複数の機能を複数の装置にて実現するようにも構成され得るものであって、その機能ブロックは、いずれもハードウェア又はソフトウェアとして実現され得る。コンピュータを用いるものを例にすれば、CPUやメインメモリ、GPU、TPU、画像メモリ、バス、二次記憶装置(ハードディスクや不揮発性メモリ)、キーボードやマイク、タッチパネル、タッチパネルをタッチするための電子ペンなどの各種入力デバイス、スピーカ、ディスプレイその他各種出力デバイス、その他の外部周辺装置などのハードウェア構成部、またその外部周辺装置用のインタフェース、通信用インタフェース、それらのハードウェアを制御するためのドライバプログラムやその他のアプリケーションプログラムなどが挙げられる。
【0019】
そしてメインメモリ上に展開したプログラムに従った演算処理によって、入力デバイスやその他インタフェースなどから入力されメモリやハードウェア上に保持されているデータなどが加工、蓄積されたり、前記各ハードウェアやソフトウェアを制御するための命令が作成されたりする。ここで、上記プログラムは、モジュール化された複数のプログラムとして実現されてもよいし、2以上のプログラムをクラウドコンピューティングその他の方法により組み合わせて一のプログラムとして実現されても良い。
【0020】
<機能的構成>
本実施形態のメッセージサービス提供システムを構成する各機能ブロックはいずれも、ネットワークを介して所定時間内にて構成される複数の音声メッセージを投稿可能なメッセージサービスを提供するように構成されている。具体的には、複数のユーザによって利用可能なサービスであり、各ユーザが音声メッセージを投稿可能とすることで、当該複数のユーザが、サービス上にて対話形式でコミュニケーションをとることを可能とするサービスとして構成することが考えられる。当該対話形式のコミュニケーションは、当該サービスを利用する全ての又は一部のユーザが閲覧可能であって、閲覧可能なユーザの範囲については、個々のユーザによって適宜設定可能である。
【0021】
なお本実施形態のメッセージサービス提供システムは、音声メッセージを投稿可能とすることを技術的特徴として備えているが、投稿可能な情報は音声メッセージに限定されない。音声メッセージに加え、文字や画像、動画を音声メッセージとともに、又は、選択的に投稿することも可能であり、このような構成を採用することにより、ユーザ間で、豊かな表現手段を用いたコミュニケーションを図るための環境を提供することが可能になる。
【0022】
「ユーザ情報取得部」0201は、ユーザを識別する情報であるユーザ情報を取得するように構成されている。ユーザ識別情報は、ユーザが自身の管理する端末を介して、本実施形態のメッセージサービス提供システムを利用するための申込に応じて生成され、又は取得される。具体的には、ユーザ又はシステムによって任意に設定されたIDをユーザ情報とする場合のほか、当該IDと紐づけて取得される、ユーザの氏名やメールアドレス、SNSアカウント、顔写真、プロフィールその他ユーザを識別するために用いることが可能な情報もまた、ここでいうユーザ情報として取り扱うことが可能である。
【0023】
ユーザ情報取得部では、例えば、ユーザがサービスの利用を求める場合に、あらかじめ端末を操作してログイン処理を行う際にユーザ情報を取得する。当該利用を求める都度ユーザ情報を取得する構成を採用してもよいし、いちどログイン処理が行われユーザ情報を取得したのちは、当該取得したユーザ情報を用いて、所定期間サービスの利用を可能としてもよい。
【0024】
「音声取得部」0202は、取得元となるユーザのユーザ情報と紐づけて音声を取得するように構成されている。音声取得の具体的な態様としては、ユーザの管理する端末に備えられているマイクを介して、ユーザが発した音声を取得することが考えられる。また、あらかじめユーザ端末に記録されている音声データの送信を受け付けたり、あらかじめユーザ端末などから送信を受け付け本システムの又は外部のコンテンツサーバにて取得しておいた音声データを読み出したりして取得する構成も考えられる。
【0025】
音声取得部においては、音声とともに、当該音声を取得した日時や取得した音声の時間長、周波数、波長、特定のユーザとの関連付けその他音声に付随関連する情報である音声関連情報をも取得することが可能である。音声関連情報をも用いて後記UI表示部にて音声UIを表示する構成を採用することにより、ユーザにとって、より音声の特徴を視認しやすくすることが可能となる。
【0026】
なお、ユーザから、音声を取得する際に、当該音声を再生可能とする時間又は時刻を、あらかじめユーザにて設定可能とし、当該設定に関する情報を音声関連情報として取得してもよい。当該構成を採用すれば、例えば、あるユーザに向けて、誕生日メッセージを送ったり、特定のスケジュール直前に所定のメッセージを送ったりしたいような場合、あらかじめ音声取得部にて音声を取得しておき、それらの音声を再生可能とする時間又は時刻を音声関連情報として取得し、当該情報に基づいて後記UI表示部にて音声再生UIを表示可能とすることも可能となるため、時宜にかなった音声再生の機会を担保することが可能となる。
【0027】
さらに、取得した音声については、取得後一定時間(例えば24時間)経過すると、データとして消去されるような構成を採用してもよい。音声データはその内容や声色その他の要素で入力元の個人の特定が容易であるなど、その取扱いに慎重さが求められる場合も少なくなく、当該構成を採用することにより、ユーザに対し、セキュリティの観点から安全安心して音声入力を促すことができるようになる。
【0028】
また、音声取得部においては、一のユーザからあらかじめ複数の音声を取得することも可能である。当該複数の音声をどのように処理するかについては適宜設定可能であり、実施形態3にてその一例について具体的に説明する。
【0029】
「UI表示部」0203は、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させるように構成されている。ここでいう音声再生UI表示の一例としては、端末の画面上に取得した音声を再生可能とするためのボタンその他のアイコンを表示させることが考えられる。
【0030】
なお、UI表示部においては、音声とともに取得している音声関連情報として特定のユーザとの関連付けがなされている場合に、当該関連付けられている特定のユーザに対してのみ音声再生UIを表示させるような制御を行うことも可能である。当該構成を採用することにより、例えば、プライベートな内容の音声については、特定のユーザに対してのみ音声再生UIを表示させるような処理を行うことができ、いわゆる「誤爆」のように、無用な範囲にまで音声データが流出してしまうような危険を回避することが可能になる。
【0031】
ここで、後記選択受付部において選択を受け付けた音声再生UI、後記音声出力部にて出力された音声と紐づけられた音声再生UIについては、以後も同様にユーザ端末にて表示可能としてもよいし、一回又は所定回数各処理が行われたあとあるいは一定時間(たとえば24時間)経過したあとは、ユーザ端末にて非表示とするようにUI表示部を制御する構成もあってよい。非表示とするための各処理の回数については、音声取得先であるユーザによって選択可能とすることが可能である。当該構成を採用することにより、音声に希少性を持たせ、ひいては当該音声の提供に課金その他のインセンティブを設定することが可能になる。
【0032】
さらに、もっとも直近に取得された音声を優先的に再生可能にするために、ポップアップ表示処理等を行うなどの態様で当該音声再生UIを表示する構成も考えられる。当該構成を採用すれば、最も「旬」な音声情報を、視覚的にも優先的に「聞くべき」というメッセージ性をもって提供することができ、より出力先ユーザに対する視聴動機を向上させることができる。
【0033】
「選択受付部」0204は、音声再生UIの選択を受け付けるように構成されている。具体的には、上述したボタンその他のアイコンをタップしたり、クリックしたりすることで音声再生UIの選択を受け付けることが考えられる。ここで選択受付部では、音声再生UIの選択とともに、ユーザから、音声出力の態様についての選択を受け付けることも可能である。具体的には、音声出力の大小や音声出力の時間長又は出力範囲(例えば、冒頭所定時間に限り出力、など)、出力先端末の指定などが音声出力の態様として選択可能に設定することが考えられる。当該構成を採用することにより、音声を発信するユーザだけでなく、音声を受信するユーザの便宜にもかなうことが可能になる。
【0034】
「音声出力部」0205は、受け付けた選択に応じて音声を出力するように構成されている。ここで受け付けた選択に応じて、とは、単に選択された音声を出力する、ということにとどまらず、どのようにして音声を出力するかという出力態様をも受け付けた選択に対応して制御されうることを意味する。上述した例に即して説明すると、選択を受け付けた音声を、選択された音量で出力したり、選択された範囲のみ出力したり、指定された端末に向けて送信出力したりすることが考えられる。当該構成を採用することで、音声出力先として表示機能を有さないスマートスピーカなどを選択し、当該装置にて音声出力するような処理も可能になることから、ユーザの環境やタイミングごとに異なる様々なシチュエーションにて、音声出力を楽しむことが可能となる。
【0035】
なおここで、音声出力のあとで、ユーザ端末に対し、当該音声の出力元であるユーザとの通話を可能にするための処理を行うことも考えられる。例えば、通話を開始するためのボタンを表示したり、通話を求めるかどうかの音声指示を受け付ける音声入力プログラムを起動したりすることが考えられる。どのようなタイミングで通話を可能にするための処理を行うかどうかは適宜設定可能であり、例えば、音声入力と出力とが交互に複数回繰り返されたタイミングなど、ユーザが「これなら電話で直接話した方が早いかも」と感じるであろう機会に当該処理が行われることが好ましい。当該構成を採用することにより、様々なコミュニケーション手段のうち、状況に応じて好適なものを提供可能にすることが可能となる。
【0036】
<具体的な構成>
ここで図3を示す。同図は本実施形態のメッセージサービス提供システムの機能的な各構成をまとめて一のハードウェアとして実現した際の構成の一例を示す概略図である。各装置はいずれも、それぞれ各種演算処理を実行するための「CPU」0301と、「記憶装置(記憶媒体)」0302と、「メインメモリ」0303と、「入力インタフェース」0304、「出力インタフェース」0305、「ネットワークインタフェース」0306と、を備え、入出力インタフェースを介して、例えば「タッチパネル」0307、「ディスプ
レイ」0308などの外部周辺装置と情報の送受信を行う。また、ネットワークインタフェースを介して複数の「ユーザ端末」0309や「コンテンツサーバ」0310などの外部装置と情報の送受信を行う場合があってもよい。このネットワークインタフェースの具体的な態様は有線、無線を問わず、また、通信方法も直接、間接を問わない。よって特定の外部装置ないし同装置の利用者と紐づけられた第三者の管理するサーバとの間で情報の送受信を行ういわゆるクラウドコンピューティングの形式を採用することも可能である。
【0037】
記憶装置には以下で説明するような各種プログラムが格納されており、CPUはこれら各種プログラムをメインメモリのワーク領域内に読み出して展開、実行する。なお、これらの構成は、「システムバス」0399などのデータ通信経路によって相互に接続され、情報の送受信や処理を行う(以上の構成の基本的な構成は、以下で説明する他の装置のいずれについても同様である。
【0038】
(ユーザ情報取得部の具体的な構成)
ユーザ情報取得部は、コンピュータプログラムとコンピュータハードウェアにより構成され、具体的には、CPUが記憶装置から「ユーザ情報取得プログラム」0320をメインメモリに読み出して実行し、ユーザを識別する情報であるユーザ情報を取得してメインメモリの所定のアドレスに格納する。
【0039】
(音声取得部の具体的な構成)
音声取得部は、コンピュータプログラムとコンピュータハードウェアにより構成され、具体的には、CPUが記憶装置から「音声取得プログラム」0330をメインメモリに読み出して実行し、取得元となるユーザのユーザ情報と紐づけて音声を取得してメインメモリの所定のアドレスに格納する。
【0040】
(UI表示部の具体的な構成)
UI表示部は、コンピュータプログラムとコンピュータハードウェアにより構成され、具体的には、CPUが記憶装置から「UI表示プログラム」0340をメインメモリに読み出して実行し、音声取得プログラムの実行により取得した音声をユーザ端末にて再生可能にするためのインタフェースである音声再生UIを当該ユーザ端末に表示させる処理を行う。
【0041】
(選択受付部の具体的な構成)
選択受付部は、コンピュータプログラムとコンピュータハードウェアにより構成され、具体的には、CPUが記憶装置から「選択受付プログラム」0350をメインメモリに読み出して実行し、前記UI表示プログラムの実行により音声再生UIを表示させたユーザ端末より、当該音声再生UIの選択を受け付ける。
【0042】
(音声出力部の具体的な構成)
音声出力部は、コンピュータプログラムとコンピュータハードウェアにより構成され、具体的には、CPUが記憶装置から「音声出力プログラム」0360をメインメモリに読み出して実行し、選択受付ステップの実行により受け付けた選択に応じて、音声取得プログラムの実行により取得していた音声データを読み出し、当該音声を出力する。
【0043】
<処理の流れ>
図4は、本実施形態のメッセージサービス提供システムにおける処理の流れの一例を示す図である。同図の処理の流れは以下のステップからなる。最初にステップS0401では、ユーザを識別する情報であるユーザ情報を取得する(ユーザ情報取得ステップ)。そしてステップS0402では、取得元となるユーザのユーザ情報と紐づけて音声を取得(音声取得ステップ)し、ステップS0403では、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させる(UI表示ステップ)。その後ステップS0404で音声再生UIの選択を受け付ける(選択受付ステップ)と、ステップS0405で、受け付けた選択に応じて音声を出力する(音声出力ステップ)。
【0044】
<効果>
以上の構成を採用するメッセージサービス提供システムを利用することにより、多くのユーザに対し、投稿された音声コンテンツの視認性を向上させることができるようになる。
【0045】
<<実施形態2>>
<概要>
本実施形態のメッセージサービス提供システムは、基本的には実施形態1に記載のメッセージサービス提供システムの技術的特徴と同様であるが、音声取得に際し、取得する音声の再生時間長に応じて当該音声を編集する点において更なる特徴を有している。
【0046】
<機能的構成>
図5は、本実施形態のメッセージサービス提供システムの機能ブロックの一例を示す図である。同図において示されているように、本実施形態の「メッセージサービス提供システム」0500は、「ユーザ情報取得部」0501と、「音声取得部」0502と、「UI表示部」0503と、「選択受付部」0504と、「音声出力部」0505と、を有し、音声取得部はさらに「編集取得手段」0512を有する。基本的な構成は、実施形態1の図2を用いて説明したメッセージサービス提供システムと共通するため、以下では相違点である「編集取得手段」0512の機能について説明する。
【0047】
「編集取得手段」0512は、音声取得部において、取得する音声の再生時間長に応じて当該音声を編集するように構成される。具体的には、取得する音声の再生時間長が所定時間よりも長ければ、当該音声の一部を切り出す編集処理を行うことが考えられる。より具体的には、冒頭の一部(例えば10秒以内)のみを切り出す編集処理を行ったうえで、当該編集済みの音声を取得するような処理が考えられる。
【0048】
他にも例えば、取得する音声の再生時間長が所定時間よりも長い場合に、当該音声を前記所定時間長となるよう、ピッチを速める編集処理を行うことも考えられる。当該構成を採用すれば、所定時間内にメッセージを聞き取ることができ、多忙な利用者にとっても便宜である。
【0049】
編集後には、編集前の音声と、編集後の音声とをともに関連付けて保持しておくことが考えられる。このような処理を施した音声を取得し、出力可能とすることにより、音声取得部にて比較的長時間の音声を取得した場合であっても、より直感的に認識可能な時間長で当該音声を出力し、把握可能とすることができる。
【0050】
なお、編集取得手段における音声編集を行うタイミングは、音声取得部において音声を取得したタイミングであってもよいし、選択受付部にて選択を受け付けた後、音声出力部にて音声出力する前のタイミングであってもよい。
【0051】
また、音声の編集処理をした場合、音声出力部では編集後の音声を出力することが想定されるが、編集前の音声を出力可能とする構成が別途用意されてもよい。この場合には例えば、一度編集後の音声を出力し、さらに当該出力済みの音声の編集前の音声の出力を希望する旨の情報を受信した場合、改めて編集前の音声を出力する。当該構成を採用することにより、当初は編集後の音声を聞いて概要を把握しておき、あとで時間があるタイミングを見計らって、改めて編集前の音声を聞きたい、といったユーザの需要を満たすことが可能になる。
【0052】
なおここまでは、編集取得手段においては、特定の機能に基づいて当該音声を編集する処理について説明をしてきたが、ユーザからの指示選択に応じて取得する音声の再生時間長に応じて当該音声を編集するように構成されてももちろんよい。当該構成を採用することにより、ユーザは入力した音声情報のうち、自身にとり最適な部分を抽出して出力可能とすることができるようになる。
【0053】
<具体的な構成>
本実施形態のメッセージサービス提供システムを構成する各装置のハードウェア構成は、基本的には、図3を用いて説明した実施形態1のメッセージサービス提供システムにおけるハードウェア構成と同様である。そこで以下については、これまで説明していない「編集取得手段」の具体的な処理について説明する。
【0054】
(編集取得手段の具体的な構成)
編集取得手段は、具体的にはコンピュータプログラムとコンピュータハードウェアにより構成され、音声取得プログラムの実行に際し、CPUが記憶装置から「編集取得サブプログラム」をメインメモリに読み出して実行し、取得する音声の再生時間長に応じて当該音声を編集処理しメインメモリの所定のアドレスに格納する。
【0055】
<処理の流れ>
図6は、本実施形態のメッセージサービス提供システムにおける処理の流れの一例を示す図である。同図の処理の流れは以下のステップからなる。最初にステップS0601では、ユーザを識別する情報であるユーザ情報を取得する(ユーザ情報取得ステップ)。そしてステップS0602では、取得元となるユーザのユーザ情報と紐づけて音声をその再生時間長に応じて当該音声を編集し(音声取得ステップ)、ステップS0603では、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させる(UI表示ステップ)。その後ステップS0604で音声再生UIの選択を受け付ける(選択受付ステップ)と、ステップS0605で、受け付けた選択に応じて音声を出力する(音声出力ステップ)。
【0056】
<効果>
本実施形態のメッセージサービス提供システムを用いることにより、実施形態1のメッセージサービス提供システムを用いる場合よりも、直感的に音声内容を把握することができる。
【0057】
<<実施形態3>>
<概要>
本実施形態のメッセージサービス提供システムは、基本的には実施形態1や2に記載のメッセージサービス提供システムの技術的特徴と同様であるが、音声出力に際し、投稿された複数の音声メッセージを順番に連続して出力する点を特徴としている。
【0058】
<機能的構成>
図7は、本実施形態のメッセージサービス提供システムを一のコンピュータ(装置)で実現した場合の機能ブロックの一例を示す図である。同図において示されているように、本実施形態の「メッセージサービス提供システム」0700は、「ユーザ情報取得部」0701と、「音声取得部」0702と、「UI表示部」0703と、「選択受付部」0704と、「音声出力部」0705と、を有し、音声出力部は、「時系列取得手段」0715を皿に有する。基本的な構成は、実施形態1の図2を用いて説明したメッセージサービス提供システムと共通するため、以下では相違点である「時系列出力手段」0715の機能について説明する。
【0059】
「時系列出力手段」0715は、音声出力部において、投稿された複数の音声メッセージを順番に連続して出力するように構成される。ここでいう「順番に」とは、特定の投稿者から投稿された複数の音声メッセージを基準にしてもよいし、複数の投稿者によってそれぞれ投稿された複数の音声メッセージを基準にしてもよい。そして「順番に連続して」についても、投稿者に関係なく、投稿された順番、すなわち投稿日時の古い順から連続して出力するような構成であってもよいし、一の投稿者において複数回投稿された音声メッセージのみを、投稿日時の古い順から連続して出力するような構成であってもよい。当該構成を採用することにより、利用者がいちいち音声出力のための操作をすることなく、連続して音声出力がなされ、利用者があたかも投稿者とコミュニケーションを図っているかのような環境を提供することが可能となる。
【0060】
またここでは、いちど音声出力された音声メッセージか否かで、「順番に」における出力の順番に含めるか否かを制御するような構成を採用してもよい。すなわち、複数の音声メッセージのうち、既にいちど出力済みとなっている音声メッセージがある場合には、当該音声メッセージを除いた他の音声メッセージのみを対象として順番に連続して音声を出力するような構成が考えられる。当該構成を採用することにより、何度も重複して同じ音声を聞く煩わしさを回避することができる。
【0061】
なお逆に、複数の音声メッセージのうち、既にいちど出力済みとなっている音声メッセージがある場合に、当該音声メッセージのみを対象として順番に連続して音声を出力するような構成があってもよい。当該構成を採用することにより、重要な音声メッセージを繰り返し聞きなおし、その意図を確認することができるようにもなる。
【0062】
<具体的な構成>
本実施形態のメッセージサービス提供システムを構成する各装置のハードウェア構成は、基本的には、図3を用いて説明した実施形態1のメッセージサービス提供システムにおけるハードウェア構成と同様である。そこで以下については、これまで説明していない「時系列出力手段」の具体的な処理について説明する。
【0063】
(時系列出力手段の具体的な構成)
時系列出力手段は、具体的にはコンピュータプログラムとコンピュータハードウェアにより構成され、CPUが記憶装置から音声出力プログラムを読み出す際に、「時系列出力サブプログラム」をメインメモリに読み出して実行し、投稿された複数の音声メッセージを順番に連続して出力する。
【0064】
<処理の流れ>
図8は、本実施形態のメッセージサービス提供システムにおける処理の流れの一例を示す図である。同図の処理の流れは以下のステップからなる。最初にステップS0801では、ユーザを識別する情報であるユーザ情報を取得する(ユーザ情報取得ステップ)。そしてステップS0802では、取得元となるユーザのユーザ情報と紐づけて音声を取得(音声取得ステップ)し、ステップS0803では、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させる(UI表示ステップ)。その後ステップS0804で音声再生UIの選択を受け付ける(選択受付ステップ)と、ステップS0805で、受け付けた選択に応じて音声を出力する(音声出力ステップ)。
【0065】
<効果>
本実施形態のメッセージサービス提供システムを用いることにより、実施形態1や2のメッセージサービス提供システムを用いる場合に比べて、複数の音声メッセージを細切れに聞かざるを得ない状況を回避したり、必要な音声メッセージのみをいちいち操作することなくストレスレスに聞くことが可能となる。によって音声出力を受けることが可能となる。音声を発した環境に影響を受けず好適なコミュニケーションのための音声出力をすることができる。
【0066】
<<実施形態4>>
<概要>
本実施形態のメッセージサービス提供システムは、基本的には実施形態1に記載のメッセージサービス提供システムの技術的特徴と同様であるが、音声再生UIの選択を受け付けると、当該選択をしたユーザのユーザ情報に応じて選択された音声の音響処理を行い、音声出力の際に、当該音響処理された音声を出力する点において更なる特徴を有している。
【0067】
<機能的構成>
図9は、本実施形態のメッセージサービス提供システムの機能ブロックの一例を示す図である。同図において示されているように、本実施形態の「メッセージサービス提供システム」0900は、「ユーザ情報取得部」0901と、「音声取得部」0902と、「UI表示部」0903と、「選択受付部」0904と、「音声出力部」0905と、「事前処理部」0906を融資、音声出力部は「処理済音声出力手段」0915をさらに有する。基本的な構成は、実施形態1の図2を用いて説明したメッセージサービス提供システムと共通するため、以下では相違点である「事前処理部」0906及び「処理済音声出力手段」0915の機能について説明する。
【0068】
「事前処理部」0906は、選択受付部にて音声再生UIの選択を受け付けると、当該選択をしたユーザのユーザ情報に応じて選択された音声の音響処理を行うように構成される。ここでいう「ユーザ情報に応じて」とは、例えばユーザ情報を用いて音響処理を行うことを意味しており、この場合ユーザ情報として、当該ユーザ、音声メッセージを投稿したユーザ又は他の特定の者の声色に関する音声辞書が含まれているような場合が考えられる。「他の特定の者」とは例えば有名人やキャラクターの声優、知人などが考えられ、ユーザにより適宜選択することが可能である。そしてこれらの音声辞書を使った音響処理が行われることにより、選択をしたユーザの求める声色によって音声出力を受けることが可能となる。
【0069】
音声辞書は、適宜編集・改変されてもよいし、追加、削除されてもよく、また、どのような技術思想に基づいて構成されるかについても設計事項である。外部サーバから音声辞書のデータを取得してもよいし、自ら音声辞書を保持してももちろんよい。
【0070】
また、ユーザ情報としてあるユーザが発する音声の周波数や音量などを保持しておき、当該情報を用いた音響処理を行う場合もある。具体的には、普段から小声、すなわち音量が小さいとの内容の情報をユーザ情報として有している場合には、当該ユーザから投稿された音声を出力する場合には、出力すべき音声の音量を一定の程度大きくする音響処理をあらかじめ行うようなことが考えられる。当該構成を採用することにより、音声を聞くユーザにとって、自身で調整をすることなく、快適に音声を聞くことが可能となる。
【0071】
「処理済音声出力手段」0915は、音声出力部において、事前処理部にて音響処理された音声を出力するように構成される。「事前処理部にて音響処理された音声」の具体的な性質については既に述べたとおりであるが、処理済音声出力手段においては、音響処理済みであることを示す情報とともに当該音声を出力するように構成されていることが望ましい。具体的には音声出力とともに、ディスプレイ等画面上に「音響処理済み」や「XXさんの声で再生中」などの表示をする、といった具合である。また、音声の冒頭又は最後に「音響処理済みです」などといった説明音声を付加出力してもよい。これらの構成を採用することにより、本機能がいわゆる音声出力者の「なりすまし」のような不正な手段に用いられることを回避することが可能となる。
【0072】
<具体的な構成>
本実施形態のメッセージサービス提供システムを構成する各装置のハードウェア構成は、基本的には、図3を用いて説明した実施形態1のメッセージサービス提供システムにおけるハードウェア構成と同様である。そこで以下については、これまで説明していない「事前処理部」及び「処理済音声出力手段」の具体的な処理について説明する。
【0073】
(事前処理部の具体的な構成)
事前処理部は、具体的にはコンピュータプログラムとコンピュータハードウェアにより構成され、音声出力プログラムの実行に際し、CPUが記憶装置から「事前処理プログラム」をメインメモリに読み出して実行する。
【0074】
(処理済音声出力手段の具体的な構成)
処理済音声出力手段は、具体的にはコンピュータプログラムとコンピュータハードウェアにより構成され、音声出力プログラムの実行に際し、CPUが記憶装置から「処理済音声出力手段サブプログラム」をメインメモリに読み出して実行する。
【0075】
<処理の流れ>
図10は、本実施形態のメッセージサービス提供システムにおける処理の流れの一例を示す図である。同図の処理の流れは以下のステップからなる。最初にステップS1001では、ユーザを識別する情報であるユーザ情報を取得する(ユーザ情報取得ステップ)。そしてステップS1002では、取得元となるユーザのユーザ情報と紐づけて音声を取得(音声取得ステップ)し、ステップS1003では、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させる(UI表示ステップ)。その後ステップS1004で音声再生UIの選択を受け付ける(選択受付ステップ)と、ステップS1005で、受け付けた選択に応じて音声を出力する(音声出力ステップ)。
【0076】
<効果>
本実施形態のメッセージサービス提供システムを用いることにより、実施形態1のメッセージサービス提供システムを用いる場合よりも、ユーザの求める声色を楽しめるようになる。
【0077】
<<実施形態5>>
<概要>
本実施形態のメッセージサービス提供システムは、基本的には実施形態1に記載のメッセージサービス提供システムの技術的特徴と同様であるが、取得した音声を音声認識のうえ一部又は全部を文字化し、音声再生UIを表示する際に、前記文字化処理された文字データとともに音声再生UIを表示させる点において更なる特徴を有している。
【0078】
<機能的構成>
図11は、本実施形態のメッセージサービス提供システムの機能ブロックの一例を示す図である。同図において示されているように、本実施形態の「メッセージサービス提供システム」1100は、「ユーザ情報取得部」0201と、「音声取得部」1102と、「UI表示部」1103と、「選択受付部」1104と、「音声出力部」1105と、「文字化処理部」1106と、を有し、UI表示部は「文字表示手段」1113をさらに有する。基本的な構成は、実施形態1の図2を用いて説明したメッセージサービス提供システムと共通するため、以下では相違点である「文字化処理部」1106と、「文字表示手段」1113の機能について説明する。
【0079】
「文字化処理部」1106は、取得した音声を音声認識のうえ一部又は全部を文字化するように構成される。本処理を行うためには、音声認識のための各種エンジンを備えることが必要であり、当該エンジンを用いて、取得した音声の認識処理を行う。ここでは不要な音声のノイズキャンセリング処理などが行われることになるが、それらの処理をどのように行うかについては、適宜設定されてよい。
【0080】
「文字表示手段」1113は、UI表示部において、文字化処理部にて処理された文字データとともに音声再生UIを表示させるように構成される。文字データとともに音声再生UIを表示する構成をとれば、メッセージを取得したユーザが、音声再生が難しい環境下にいるような場合であっても、当該投稿された音声メッセージの内容をあらかじめ把握することが可能になる。
【0081】
なおここで、文字データは、当該文字内容に関連したデコレーション処理を施したうえで表示出力されてもよい。具体的には、「誕生日おめでとう」や「目標達成!」などのポジティブなイメージの文字である場合には、明るい色文字としたり、ポップなフォントとしたり、背景画像を明るいイメージのものとしたりして出力することが考えられる。デコレーション処理をするにあたり文字内容を解析する処理としては、当該文字と所定の意味内容とを紐づける辞書データベースを用いた処理が考えられる。当該データベースを用いて文字内容を解析し、好適なデコレーション処理を施したうえで文字を表示出力する構成を採用することにより、音声出力先のユーザに対し、聴覚だけでなく視覚的にも豊富な情報量を提供することが可能になる。
【0082】
<具体的な構成>
本実施形態のメッセージサービス提供システムを構成する各装置のハードウェア構成は、基本的には、図3を用いて説明した実施形態1のメッセージサービス提供システムにおけるハードウェア構成と同様である。そこで以下については、これまで説明していない「文字化処理部」と、「文字表示手段」の具体的な処理について説明する。
【0083】
(文字化処理部の具体的な構成)
文字化処理部は、具体的にはコンピュータプログラムとコンピュータハードウェアにより構成され、CPUが記憶装置から「文字化処理プログラム」をメインメモリに読み出して実行する。
【0084】
(文字表示手段の具体的な構成)
文字表示手段は、具体的にはコンピュータプログラムとコンピュータハードウェアにより構成され、UI表示プログラムの実行に際し、CPUが記憶装置から「文字表示サブプログラム」をメインメモリに読み出して実行する。
【0085】
<処理の流れ>
図12は、本実施形態のメッセージサービス提供システムにおける処理の流れの一例を示す図である。同図の処理の流れは以下のステップからなる。最初にステップS1201では、ユーザを識別する情報であるユーザ情報を取得する(ユーザ情報取得ステップ)。そしてステップS1202では、取得元となるユーザのユーザ情報と紐づけて音声を取得(音声取得ステップ)し、ステップS1203では、取得した音声を再生可能にするためのインタフェースである音声再生UIを表示させる(UI表示ステップ)。その後ステップS1204で音声再生UIの選択を受け付ける(選択受付ステップ)と、ステップS1205で、受け付けた選択に応じて音声を出力する(音声出力ステップ)。
【0086】
<効果>
本実施形態のメッセージサービス提供システムを用いることにより、実施形態1のメッセージサービス提供システムを用いる場合よりも、音声出力が困難な環境でもコミュニケーションを図ることが可能となる。
【符号の説明】
【0087】
0200・・・メッセージサービス提供システム、0201・・・ユーザ情報取得部、0202・・・音声取得部、0203・・・UI表示部、0204・・・選択受付部、0205・・・音声出力部

図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12