特許第5974903号(P5974903)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ナカヨの特許一覧

<>
  • 特許5974903-予定に係る音声メモ蓄積方法 図000002
  • 特許5974903-予定に係る音声メモ蓄積方法 図000003
  • 特許5974903-予定に係る音声メモ蓄積方法 図000004
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5974903
(24)【登録日】2016年7月29日
(45)【発行日】2016年8月23日
(54)【発明の名称】予定に係る音声メモ蓄積方法
(51)【国際特許分類】
   H04M 1/247 20060101AFI20160809BHJP
【FI】
   H04M1/247
【請求項の数】1
【全頁数】10
(21)【出願番号】特願2013-1008(P2013-1008)
(22)【出願日】2013年1月8日
(65)【公開番号】特開2014-135543(P2014-135543A)
(43)【公開日】2014年7月24日
【審査請求日】2015年6月25日
(73)【特許権者】
【識別番号】000134707
【氏名又は名称】株式会社ナカヨ
(72)【発明者】
【氏名】山崎 盛輝
(72)【発明者】
【氏名】齋藤 隆
【審査官】 望月 章俊
(56)【参考文献】
【文献】 特開2004−56290(JP,A)
【文献】 特開平11−187156(JP,A)
【文献】 国際公開第2007/013521(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
H04M1/247
(57)【特許請求の範囲】
【請求項1】
マイクまたはネットワークを介して入力した音声情報を録音する音声録音手段を備える機器における、前記入力した音声情報の一部を音声メモとして蓄積する方法であって、
前記入力した音声情報を解析し前記音声メモの開始に係る予め定められた1以上の起動キーワードのいずれかを検出する起動キーワード検出ステップと、前記入力した音声情報を解析し日時およびまたは場所に係る情報を抽出する日時場所情報抽出ステップと、前記抽出した日時およびまたは場所に係る情報を記憶する日時場所情報記憶ステップと、前記入力した音声情報を解析し結論もしくは用件の末尾に係る予め定められた1以上の末尾キーワードのいずれかを検出する末尾キーワード検出ステップと、前記音声メモ前記機器が備えるもしくは前記機器と接続された情報蓄積手段に蓄積する音声メモ蓄積ステップと、を有し、
前記末尾キーワード検出ステップが前記末尾キーワードのいずれかを検出した場合または一定時間以上の無音状態を検出した場合に、前記日時場所情報抽出ステップが抽出した最新の日時およびまたは最新の場所に係る情報を含む情報を前記機器が備えるもしくは前記機器と接続された情報表示手段に表示し、登録する旨の所定の操作を検知したならば、前記音声メモ蓄積ステップは、前記抽出した最新の日時およびまたは最新の場所に係る情報と関連付けて、前記検出した起動キーワードに対応する箇所から前記検出した末尾キーワードに対応する箇所または一定時間以上の無音状態となった箇所までの間の音声情報を前記音声メモとして前記情報蓄積手段に蓄積することを特徴とする予定に係る音声メモ蓄積方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ボイスレコーダ機能を備えた情報機器や通話録音機能を備えた電話機器等の音声録音機能を有する機器における、音声録音方法および録音した音声の登録方法に関する。
【背景技術】
【0002】
会話中に発せられる特定のキーワードを検出して会話中の特定部分を録音する技術がある(例えば、特許文献1)。この技術は、例えば、コールセンタにおいて、販売員が会話中に発する特定の商品の開始キーワードを音声認識部が検出すると、部分録音用レコーダに録音を開始させ、顧客の理解が得られたら、販売員が発する上記商品の終了キーワードで、レコーダの録音を停止させるものであり、会話の開始から終了までの内、肝心の特定部分の会話のみを効率よく録音して保存しておくものである。
【0003】
しかしながら、この技術は、金融機関等における店頭販売や、顧客からの電話を受け付けるコールセンタ等において、顧客への説明や質疑に係る会話に起因する、後のトラブルの発生に備えた、会話履歴として残しておくことが目的であり、録音データ自体を通常の業務に有効活用するものではない。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2006−107044号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の課題は、音声録音機能と、スケジュールや備忘録等の行動予定や処置予定を管理する機能を備えている機器において、会話の特定部分を単に残すだけでなく、会話中の行動予定や処置予定に係る特定用語を検出し、会話中に約束される行動予定や処置予定に係る会話の部分的な録音を、音声メモとして簡単に登録できる、予定に係る音声メモ登録方法を提供することにある。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明は、マイクまたはネットワークを介して入力した音声情報を録音する音声録音手段を備える機器における、前記入力した音声情報の一部を音声メモとして蓄積する方法であって、前記入力した音声情報を解析し前記音声メモの開始に係る予め定められた1以上の起動キーワードのいずれかを検出する起動キーワード検出ステップと、前記入力した音声情報を解析し日時およびまたは場所に係る情報を抽出する日時場所情報抽出ステップと、前記抽出した日時およびまたは場所に係る情報を記憶する日時場所情報記憶ステップと、前記入力した音声情報を解析し結論もしくは用件の末尾に係る予め定められた1以上の末尾キーワードのいずれかを検出する末尾キーワード検出ステップと、前記音声メモ前記機器が備えるもしくは前記機器と接続された情報蓄積手段に蓄積する音声メモ蓄積ステップと、を有し、前記末尾キーワード検出ステップが前記末尾キーワードのいずれかを検出した場合または一定時間以上の無音状態を検出した場合に、前記日時場所情報抽出ステップが抽出した最新の日時およびまたは最新の場所に係る情報を含む情報を前記機器が備えるもしくは前記機器と接続された情報表示手段に表示し、登録する旨の所定の操作を検知したならば、前記音声メモ蓄積ステップは、前記抽出した最新の日時およびまたは最新の場所に係る情報と関連付けて、前記検出した起動キーワードに対応する箇所から前記検出した末尾キーワードに対応する箇所または一定時間以上の無音状態となった箇所までの間の音声情報を前記音声メモとして前記情報蓄積手段に蓄積することを特徴とする。

【発明の効果】
【0007】
本発明によれば、会話中に約束される行動予定や処置予定に係る特定の会話部分を音声メモとして、自動的に抽出して簡単に登録できると共に、その音声メモをスケジュールや備忘録と関連付けることが容易なので、ボイスレコーダ機能や通話録音機能を備えた機器の利便性を向上できる利点がある。
【図面の簡単な説明】
【0008】
図1】本発明の一実施の形態に係る携帯電話端末1のブロック構成図である。
図2】本発明の一実施の形態に係る情報管理部19が管理するデータを模式的に表した図である。
図3】本発明の一実施の形態に係る音声録音機器1の動作を表すフローチャート図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、通話録音機能またはボイスレコーダ機能を有する携帯電話機(以下、本装置)を例に説明する。
【0010】
図1は、本装置1のブロック構成図である。図1において、本装置1は、端末制御部10,スピーカ11,マイク12,操作部13,表示部14,録音再生制御部15,録音データ蓄積部16,音声認識処理部17,キーワード登録部18,情報管理部19、および、文字メモ蓄積部191と音声メモ蓄積部192を含むメモ管理部190から構成される。
【0011】
なお、本実施例では、文字メモ蓄積部191と音声メモ蓄積部192は本装置1に内蔵しているものとして説明するが、本装置1と接続される外部機器に内蔵されていてもよい。
【0012】
端末制御部10は、携帯電話端末としての本装置1の全般を制御する手段である。スピーカ11は、端末制御部10から出力される音声情報を可聴音としての音声に変換して出力する手段である。マイク12は、本装置1を利用するユーザの音声を音声情報に変換して端末制御部10へ出力する手段である。操作部13は、本装置1を利用するユーザによる各種キー操作情報を端末制御部10へ入力する手段である。表示部14は、本装置1を操作するユーザへ各種の情報を提示する手段である。
【0013】
録音再生制御部15は、本装置1が備えるボイスレコーダ機能または通話録音機能に係る録音再生制御を実行する手段である。録音データ蓄積部16は、録音再生制御部15が録音した音声情報を蓄積する手段である。
【0014】
音声認識処理部17は、端末制御部10を介して入力されるマイク12またはネットワーク2からの音声情報を解析し、キーワード登録部18に登録されている起動キーワードまたは末尾キーワードを検出し、検出した起動キーワードまたは末尾キーワードを端末制御部10へ通知する。
【0015】
また、音声認識処理部17は、端末制御部10を介して入力されるマイク12またはネットワーク2からの音声情報を解析し、日時情報または場所情報を抽出し、抽出した起動キーワードまたは末尾キーワードを端末制御部10へ通知する。なお、音声認識処理部17は、日時情報や場所情報に係る辞書を内蔵しており(図示せず)、公知の音声認識処理技術により、日時情報や場所情報を抽出する。また、音声認識処理部17が抽出する日時情報や場所情報を限定された範囲に制限してもよい。
【0016】
ところで、音声認識処理部17は、話者を特定しない不特定話者認識方式でもよいし、この本装置1を利用する特定の者が発する音声のみを認識できる特定話者認識方式でもよい。
【0017】
特に、特定話者認識方式の場合は、本装置1を利用する特定の者が意図的に発する言葉の音声だけ登録しておけばよく、認識処理の効率が良く、認識精度も不特定話者認識方式より高いという利点がある。また、その者のみが本願の機能を利用できるので、本装置1を一時的に他者が利用した場合でも、意図しない音声メモが残らないという利点もある。ただし、特定話者が発する言葉の音声のみを認識するので、相手が言ったキーワードに対しても、自身で復唱して発する必要がある。例えば、相手が「“それでは”、・・・と“しましょう”」に対して、「分かりました。“それでは”、・・・と“します”」のように復唱して、自身が登録したキーワードを発すればよい。これは、約束事の確認にもなり、会話を損なうものではない。
【0018】
キーワード登録部18は、待ち合わせの予定や依頼する用件の冒頭の部分に用いられる常套語(例えば、「それでは」,「そこで」等)、および、予定や用件の末尾の部分に用いられる常套語(例えば、「待っています」,「して下さい」等)を、起動キーワードおよび末尾キーワードとして、予め登録しておく手段である。
【0019】
情報管理部19は、メモ管理部190,文字メモ蓄積部191,音声メモ蓄積部192から構成され、端末制御部10から入力するコマンドに応じて、録音再生制御部15が録音する録音データを、登録,管理する手段である。なお、メモ管理部190には各種の予定メモや雑メモを登録できるが、少なくとも、日時情報を含む行動予定および処置予定は自動的に登録可能である。行動予定および処置予定の自動登録については後述する。
【0020】
図2は、本発明の一実施の形態に係る情報管理部19が管理しているデータの構成を模式的に表した図である。
【0021】
列201は、会話した日時と相手の情報を記憶しておく列であり、日時情報は端末制御部10が内蔵している時計機能(図示せず)により、自動的に入力される。また、会話した相手の情報は自動または手動で入力する。会話がネットワーク2を介した電話通話の場合は、端末制御部10が内蔵している電話帳機能(図示せず)により、相手電話番号から相手の名称等が自動的に入力される。また、音声認識処理部17に特定話者識別機能を持たせて、当該会話の相手を自動的に判定して入力するようにしてもよい。手動で入力する場合は、操作部13を操作して、相手の名称を選択またはキー操作して入力する。
【0022】
列202は、音声認識処理部17が会話中の音声データを解析して抽出した日時情報を記憶しておく列である。会話中に日時を含む音声データが複数回抽出された場合、ここでは最新の日時情報を有効としている。
【0023】
列203は、音声認識処理部17が会話中の音声データを解析して抽出した場所情報を記憶しておく列である。会話中に場所を含む音声データが複数回抽出された場合、ここでは最新の場所情報を有効としている。
【0024】
列204は、音声認識処理部17が会話中の音声データを解析して抽出した、キーワード登録部18に登録されている、録音を起動すべき起動キーワードまたは録音を停止すべき末尾キーワードである。このキーワードはこの本装置1を利用する者が意図的に発する特定の言葉もしくは特殊な言葉であってもよい。なお、列204は本実施例を説明するための便宜上の列であり、録音した音声メモと関連付けて記憶しておく必要はないが、記憶しておくと、どのキーワードで当該音声メモが録音されたかを検証できるので、登録キーワードを見直す際に便利である。
【0025】
列205は、起動キーワードで録音が起動され、末尾キーワードで録音が停止した録音データを、音声メモとして音声メモ蓄積部192に登録されている音声メモの内容を記憶しておく列である。
【0026】
列206は、音声メモの種別であり、列205の各音声メモが行動予定,処置予定,雑メモのいずれであるかを記憶しておく列である。この行動予定,処置予定,雑メモは、メモ管理部190に登録されている。録音した音声メモが行動予定,処置予定,雑メモのいずれであるかを自動的に識別する方法については後述する。
【0027】
ここで、列201〜列203は文字データであり、文字メモとして、文字メモ蓄積部191に登録される。また、列205は音声メモとして、音声メモ蓄積部192に登録される。なお、音声メモの実体(録音データ)は録音データ蓄積部16に蓄積されている。そして、これらの文字メモおよび音声メモはメモ管理部190により関連付けられる。
【0028】
さらに、情報管理部19が管理する情報は予定メモ以外の種々の情報(例えば、行動予定に係る地図、や処置予定に係る参考資料等)を管理しており、メモ管理部190の各登録内容と情報管理部19が管理する種々の情報を関連付け可能である。
【0029】
図3は、本発明の一実施の形態に係る本装置1の動作フローチャート図である。以下、図1および図2を併用して本装置1の動作を説明する。自動的に会話中の音声から音声メモを抽出する、自動音声メモモードが起動された状態で、本フローはスタートする(S300)。
【0030】
端末制御部10は、待機状態において、音声入力の有無(S301),起動キーワード検出の有無(S310),日時情報抽出の有無(S320),場所情報抽出の有無(S330),末尾キーワード検出の有無(S340),長時間無音検出の有無(S341)を循環して監視している。
【0031】
本装置1の自動音声メモモードがオンの状態において、音声認識処理部17は、端末制御部10を介して、マイク12もしくはネットワーク2からの音声情報、または録音再生制御部15が再生する音声情報の入力を監視し、音声情報が入力された場合(S301,YES)、入力してくる音声情報を解析して、音声情報中に起動キーワードに対応する音声情報の存在を監視する(S310)。
【0032】
ここで、音声認識処理部17に入力してくる音声情報は、例えば、音声パケットデータであって、そのパケットサイズは一定時間分の音声データ(データ量可変)または一定量の音声データ(録音時間可変)等、入力する音声情報の単位は任意である。
【0033】
そして、起動キーワードを検出した場合(S310,YES)、音声認識処理部17は、端末制御部10へ起動キーワードを検出した旨および検出した起動キーワードを通知し、端末制御部10は、録音再生制御部15を制御し、音声メモとしての録音をスタートさせて(S311)、S320へ進む。
【0034】
なお、図示していないが、S310でYESの場合、端末制御部10は、情報管理部19を制御して、録音再生制御部15が録音した音声メモに対応するメモ管理部190のメモリに、音声認識処理部17が検出した起動キーワードを記憶しておく(図2の列204に対応)。
【0035】
S320において、音声認識処理部17は、入力してくる音声情報を解析して、音声情報中に日時情報に対応する音声情報の存在を監視し、日時情報を抽出した場合(S320,YES)、端末制御部10へ日時情報を抽出した旨を通知し、端末制御部10は、情報管理部19を制御して、録音再生制御部15が録音した音声メモに対応するメモ管理部190のメモリ(図2の列202に対応)に、前記抽出した日時情報を記憶し(S321)、S330へ進む。
【0036】
S330において、音声認識処理部17は、入力してくる音声情報を解析して、音声情報中に場所情報に対応する音声情報の存在を監視し、場所情報を抽出した場合(S330,YES)、端末制御部10へ場所情報を抽出した旨を通知し、端末制御部10は、情報管理部19を制御して、録音再生制御部15が録音した音声メモに対応するメモ管理部190のメモリ(図2の列203に対応)に、前記抽出した場所情報を記憶し(S331)、S340へ進む。
【0037】
なお、S321およびS331における、日時情報および場所情報の記憶は上書方式による記憶であり、それ以前に記憶した内容は自動的に消去される(上書)。これにより、常に最新の日時情報および場所情報が記憶されるので、会話の途中で抽出された確定前の情報は無効となり、その後の結論で確定した、最後に発せられた日時情報および場所情報が有効となる。
【0038】
S340において、音声認識処理部17は、入力してくる音声情報を解析して、音声情報中に末尾キーワードに対応する音声情報の存在を監視し、末尾キーワードを検出した場合(S340,YES)、端末制御部10へ末尾キーワードを検出した旨および検出した末尾キーワードを通知し、端末制御部10は、録音再生制御部15を制御して、録音を停止し(S342)、S350へ進む。
【0039】
なお、図示していないが、S340でYESの場合、端末制御部10は、情報管理部19を制御して、録音再生制御部15が録音した音声メモに対応するメモ管理部190のメモリに、音声認識処理部17が検出した末尾キーワードを記憶しておく(図2の列204に対応)。
【0040】
S340において、音声認識処理部17が末尾キーワードを検出しない場合(S340,NO)、端末制御部10は予め定められた長時間無音(例えば、1分)の有無を監視し、長時間無音を検出した場合(S341,YES)、上述したS342へ進み、端末制御部10は、音声メモの録音を停止し(S342)、S350へ進む。長時間無音を検出しない場合(S341,NO)、S301に戻る。
【0041】
S350において、端末制御部10は、S321に対応する日時情報の記憶とS331に対応する場所情報の有無を判定し(S350)、日時情報が無ければ音声メモを雑メモとして登録し(S353)、日時情報があり場所情報の記憶が無いならば録音した音声メモを処置予定として登録し(S351)、日時情報と場所情報の両方の記憶が有るならば録音した音声メモを行動予定として登録し(S352)、S360へ進む。
【0042】
なお、ここでは、日時情報と場所情報を抽出した場合はどこかへ出かける行動予定と判断し、日時情報のみ抽出した場合は何らかの処置を要する処置予定と判断し、日時情報を抽出しない場合は雑メモと判断する、単純な種別の自動識別なので誤判断の可能性があるが、この登録は仮の登録であって、登録の確定前に修正可能である(後述)。
【0043】
ところで、音声メモの種別として、行動予定,処置予定,雑メモの各々について自動的に蓄積する/しないの設定は、S351,S352,S353をパスするようにフローを変更すればよい(図示せず)。
【0044】
S360において、端末制御部10は、S351またはS352で登録した音声メモに係る情報(例えば、“次の音声メモを抽出しました。登録/編集/削除しますか?”)を表示部14に表示し、S361へ進む。
【0045】
S361において、端末制御部10は、操作部13からの入力される操作情報に応じて、S351またはS352で登録した音声メモに係る情報を登録/編集/削除すると共に、記憶している日時情報と場所情報の記憶をクリアし(S362)、S301に戻る。この音声メモに係る情報の登録は、自動的に仮登録された内容を確定する作業であり、音声メモに係る情報の編集は、当該音声メモと関連付ける文字メモ(図2の列201〜列203)等の編集や、その他の情報(スケジュールや備忘録等)との関連付け等である。
【0046】
なお、日時情報と場所情報の記憶をクリアする理由は、登録済または削除済みの予定メモに係る日時情報と場所情報が後で抽出される音声メモとリンクすることを防止するためである。
【0047】
以上の動作フローによる音声メモの抽出は、自動音声メモモードが停止されるまで継続される。
【0048】
以上、本発明の一実施形態について説明した。本発明によれば、会話中に約束される行動予定や処置予定に係る、特定の会話部分を音声メモとして、自動的に抽出して簡単に登録できると共に、その音声メモをスケジュールや備忘録と関連付けることが容易なので、ボイスレコーダ機能や通話録音機能を備えた機器の利便性を向上できる利点がある。
【0049】
ところで、本発明の実施形態として、携帯電話端末を例に説明したが、本発明はこれに限定されない。本発明を適用する装置は、一般的な事務所や家庭に設置される固定電話機や、複数の内線を収容する内線電話システムを構成する電話主装置等、電話装置一般に適用可能である。さらに、電話装置以外にも、ボイスレコーダ機能を有する、パーソナルコンピュータ、パーソナルデジタルアシスタント(PDA)、ボイスレコーダ、スマートホン等、各種の情報装置に適用可能である。
【符号の説明】
【0050】
1・・・携帯電話端末
2・・・ネットワーク
10・・・端末制御部
11・・・スピーカ
12・・・マイク
13・・・操作部
14・・・表示部
15・・・録音再生制御部
16・・・録音データ蓄積部
17・・・音声認識処理部
18・・・キーワード登録部
19・・・情報管理部
190・・・メモ管理部
191・・・文字メモ蓄積部
192・・・音声メモ蓄積部

図1
図2
図3