IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ Rita合同会社の特許一覧

<>
  • 特開-第1装置、システム 図1
  • 特開-第1装置、システム 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025004350
(43)【公開日】2025-01-15
(54)【発明の名称】第1装置、システム
(51)【国際特許分類】
   H04R 1/10 20060101AFI20250107BHJP
【FI】
H04R1/10 101Z
H04R1/10 104Z
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023103977
(22)【出願日】2023-06-26
(71)【出願人】
【識別番号】523243270
【氏名又は名称】Rita合同会社
(74)【代理人】
【識別番号】100127306
【弁理士】
【氏名又は名称】野中 剛
(72)【発明者】
【氏名】野中 剛
【テーマコード(参考)】
5D005
【Fターム(参考)】
5D005BA00
(57)【要約】
【課題】 使用者の状態を視認することが可能な第1装置などを提供する。
【解決手段】 第1装置は、入力用マイクと、音声を出力する第1出力部と、撮像部と、を備える。前記第1装置は、イヤホン、ヘッドホン、ヘッドセットのいずれかである。前記第1装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される。
【選択図】図1
【特許請求の範囲】
【請求項1】
入力用マイクと、
音声を出力する第1出力部と、
撮像部と、を備えた第1装置であって、
前記第1装置は、イヤホン、ヘッドホン、ヘッドセットのいずれかであり、
前記第1装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される、第1装置。
【請求項2】
前記第1装置は、前記イヤホンであり、
前記イヤホンは、イヤーピース領域とノズル領域を含み、
前記撮像部は、前記ノズル領域に設けられる、請求項1に記載の第1装置。
【請求項3】
前記第1装置は、学習モードで、前記第1出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成し、
前記第1装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する、請求項1または請求項2に記載の第1装置。
【請求項4】
前記第1装置は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定し、
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む、請求項3に記載の第1装置。
【請求項5】
前記第1装置は、前記ヘッドホンと前記ヘッドセットのいずれかであって、ヘッドバンドを含み、
前記ヘッドバンドには、前記使用者の頭の状態を検知する検知部が設けられ、
前記頭の状態は、脳の血流量、脳波、前記頭の動きに関する情報の少なくとも1つを含む、請求項1または請求項2に記載の第1装置。
【請求項6】
前記第1装置は、学習モードで、前記第1出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成し、
前記第1装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定し、
前記検知部で得られた情報に基づいて、前記第1装置は、前記撮像部の動作を停止する、請求項1または請求項2に記載の第1装置。
【請求項7】
少なくとも前記撮像部で得られた画像信号に基づいて、前記第1装置のロック状態と前記第1装置と通信する第2装置のロック状態の少なくとも一方についての解除が行われる、請求項1または請求項2に記載の第1装置。
【請求項8】
入力用マイクと、音声を出力する第1出力部と、撮像部と、を有する第1装置と、
第2出力部を有する第2装置と、を備え、
前記第1装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成され、
前記第1装置と前記第2装置とは、無線若しくは有線で接続され、
前記第1装置と前記第2装置の少なくとも一方は、学習モードで、前記第1出力部と前記第2出力部の少なくとも一方から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成し、
前記第1装置と前記第2装置の少なくとも一方は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する、システム。
【請求項9】
前記第1装置と前記第2装置の少なくとも一方は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定し、
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む、請求項8に記載のシステム。
【請求項10】
前記第1装置と前記第2装置の少なくとも一方は、前記文字認識モードで特定した文字を、テキストエディタソフト上に書き込みする、請求項8または請求項9に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、イヤホンなどの第1装置などに関する。
【背景技術】
【0002】
従来、特許文献1のように、ヘッドセットなどが提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2023-12418号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、使用者の状態を視認することが考慮されていない。
【0005】
したがって本発明の目的は、使用者の状態を視認することが可能な第1装置などを提供することである。
【課題を解決するための手段】
【0006】
本発明に係る第1装置は、入力用マイクと、音声を出力する第1出力部と、撮像部と、を備える。
前記第1装置は、イヤホン、ヘッドホン、ヘッドセットのいずれかである。
前記第1装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される。
【0007】
イヤホンなどの第1装置を装着した使用者の状態、例えば、第1装置を装着した使用者の唇及び頬の領域の画像を得ることが可能になる。
【0008】
好ましくは、前記第1装置は、前記イヤホンである。
前記イヤホンは、イヤーピース領域とノズル領域を含む。
前記撮像部は、前記ノズル領域に設けられる。
【0009】
使用者との位置関係が殆ど変わらない状態で、撮像部を使用者の近傍に位置させることが可能になる。
【0010】
さらに好ましくは、前記第1装置は、学習モードで、前記第1出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成する。
前記第1装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する。
【0011】
使用者の顔の動き(特に、唇や頬の動き)に対応する文字をデータベースで記録しておき、音声を発せなくても、当該動きに基づいて、当該動きに対応する文字を特定することが可能になる。
【0012】
さらに好ましくは、前記第1装置は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定する。
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む。
【0013】
通話時の音声信号に含まれる文字情報と、当該通話時の画像信号との組み合わせを活用して、学習モードでの動作を頻繁に行わなくても、データベースを充実させ、文字認識モードで特定出来る文字を多くすることが可能になる。
【0014】
また、好ましくは、前記第1装置は、前記ヘッドホンと前記ヘッドセットのいずれかであって、ヘッドバンドを含む。
前記ヘッドバンドには、前記使用者の頭の状態を検知する検知部が設けられる。
前記頭の状態は、脳の血流量、脳波、前記頭の動きに関する情報の少なくとも1つを含む。
【0015】
ヘッドバンドに設けた検知部を使って、第1装置を装着した使用者の頭部の状態を把握することが可能になる。
【0016】
また、好ましくは、前記第1装置は、学習モードで、前記第1出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成する。
前記第1装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する。
前記検知部で得られた情報に基づいて、前記第1装置は、前記撮像部の動作を停止する。
【0017】
頭部の状態に基づいて、所定の状態(例えば、睡眠状態)を特定し、当該所定の状態の時に、撮像部などの動作を停止させ、不必要な電力消費を抑制出来る。
【0018】
また、好ましくは、少なくとも前記撮像部で得られた画像信号に基づいて、前記第1装置のロック状態と前記第1装置と通信する第2装置のロック状態の少なくとも一方についての解除が行われる。
【0019】
自然な動きの中で、容易にロック状態の解除判断を行うことが出来る。
【0020】
本発明に係るシステムは、入力用マイクと、音声を出力する第1出力部と、撮像部と、を有する第1装置と、第2出力部を有する第2装置と、を備える。
前記第1装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される。
前記第1装置と前記第2装置とは、無線若しくは有線で接続される。
前記第1装置と前記第2装置の少なくとも一方は、学習モードで、前記第1出力部と前記第2出力部の少なくとも一方から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成する。
前記第1装置と前記第2装置の少なくとも一方は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する。
【0021】
好ましくは、前記第1装置と前記第2装置の少なくとも一方は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定する。
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む。
【0022】
さらに好ましくは、前記第1装置と前記第2装置の少なくとも一方は、前記文字認識モードで特定した文字を、テキストエディタソフト上に書き込みする。
【0023】
特定した文字を第2装置上のテキストエディタソフト上に書き込みすることで、特定した文字を容易に記録出来る。また、テキストエディタソフト上に書き込みされた文字を編集して、誤って特定された文字を修正出来る。
【発明の効果】
【0024】
以上のように本発明によれば、使用者の状態を視認することが可能な第1装置などを提供することができる。
【図面の簡単な説明】
【0025】
図1】第1実施形態における、システムの構成図である。
図2】第2実施形態における、システムの構成図である。
【発明を実施するための形態】
【0026】
以下、第1実施形態について、図を用いて説明する(図1参照)。
なお、実施形態は、以下の実施形態に限られるものではない。また、一つの実施形態に記載した内容は、原則として他の実施形態にも同様に適用される。また、各実施形態及び各変形例は、適宜組み合わせることが出来る。
【0027】
第1実施形態におけるシステム1は、第1装置10と、第2装置20と、外部機器30を備える。
【0028】
(第1装置10)
第1装置10は、イヤーピース領域とノズル領域を含むワイヤレスイヤホンである。
第1装置10は、第1通信部11、第1操作部12、入力用マイク13、出力用マイク14、撮像部15、第1制御部16、第1出力部17を有する。
【0029】
第1通信部11と、第1操作部12と、出力用マイク14と、第1制御部16と、第1出力部17とは、第1装置10のイヤーピース領域に設けられる。
入力用マイク13と、撮像部15とは、第1装置10のノズル領域に設けられる。
ただし、第1操作部12と、出力用マイク14と、第1制御部16のいずれかが、第1装置10のノズル領域に設けられてもよい。
また、撮像部15が、第1装置10のイヤーピース領域に設けられてもよい。
【0030】
第1装置10は、右耳用と左耳用の2つで構成される。
ただし、第1装置10は、右耳用と左耳用のいずれか1つだけで構成されてもよい。
【0031】
(第1通信部11)
第1通信部11は、近距離無線通信などで、第2装置20の第2通信部21と通信する。
入力用マイク13で得られた音声信号、撮像部15で得られた画像信号は、第1通信部11を介して、第2装置20に送信される。
第1出力部17で出力する音声信号は、第1通信部11を介して、第2装置20から送信される。
【0032】
(第1操作部12)
第1操作部12は、第1出力部17で出力する音声信号の音量調整、曲の早送り若しくは巻き戻し、ノイズキャンセリング機能のオンオフ操作、使用モードの切り替え操作などのために使用される。
第1実施形態の使用モードは、第2装置20を使った通話のための通話モード、第2装置20の音楽を出力するための音楽モード、文字認識モード、学習モードを含む。
文字認識モードでは、使用者が文字を発する際の唇と頬の少なくとも一方の動きに基づいて、当該使用者が発した文字が特定される。
学習モードでは、文字認識モードで使用するデータベースを生成するため、使用者が発した音声に含まれる文字と、当該使用者が当該音声を発した際の当該使用者の唇と頬の少なくとも一方の動きが特定される。
【0033】
(入力用マイク13)
入力用マイク13は、第1装置10を装着した使用者が発した音声に基づいて、音声信号を生成する。
第1装置10が右耳用と左耳用の2つで構成される場合、入力用マイク13は、右耳用の第1装置10と左耳用の第1装置10のいずれかにだけ設けられる形態であってもよい。
【0034】
(出力用マイク14)
出力用マイク14は、第1装置10の周囲の音声に基づいて、音声信号を生成する。
出力用マイク14で得られた音声信号は、ノイズキャンセリングに使用される。
【0035】
(撮像部15)
撮像部15は、第1装置10を装着した使用者の顔、特に唇及び頬の領域の動画を撮影し、撮影した動画に対応する画像信号を生成する。
撮像部15で得られた画像信号の用途は後述する。
第1装置10が右耳用と左耳用の2つで構成される場合、撮像部15は、右耳用の第1装置10と左耳用の第1装置10のいずれかにだけ設けられる形態であってもよい。
例えば、右耳用の第1装置10と左耳用の第1装置10の一方のノズル領域の先端には、入力用マイク13が設けられ、右耳用の第1装置10と左耳用の第1装置10の他方のノズル領域の先端には、撮像部15が設けられる。
撮像部15の撮像面は、第1装置10を装着した使用者の顔、特に唇及び頬の領域を向く。
また、撮像部15のレンズの焦点距離fは、撮像部15と、第1装置10を装着した使用者の顔、特に唇及び頬の領域との距離と略等しい(f≦10cm)。
【0036】
(第1制御部16)
第1制御部16は、第1装置10の各部を制御する。
【0037】
(通話モードでの第1制御部16の動作)
通話モードの場合、第1制御部16は、入力用マイク13で得られた音声信号を、第1通信部11を介して、第2装置20に送信する。
また、第1制御部16は、第2装置20から送信された音声信号に基づく音声を、第1出力部17に出力させる。
【0038】
(音楽モードでの第1制御部16の動作)
音楽モードの場合、第1制御部16は、第2装置20から送信された音声信号に基づく音声を、第1出力部17に出力させる。
【0039】
ノイズキャンセリングを行う場合は、第1制御部16は、出力用マイク14で得られた音声信号に基づいてノイズキャンセル信号を生成する。第1制御部16は、当該ノイズキャンセル信号を、第2装置20から送信された音声信号に重畳する。第1制御部16は、重畳した音声信号に基づく音声を、第1出力部17に出力させる。
【0040】
(学習モードでの第1制御部16の動作)
学習モードの場合、第1制御部16は、入力用マイク13で得られた音声信号と、撮像部15で得られた画像信号を、第1通信部11を介して、第2装置20に送信する。
【0041】
(文字認識モードでの第1制御部16の動作)
文字認識モードの場合、第1制御部16は、撮像部15で得られた画像信号を、第1通信部11を介して、第2装置20に送信する。
【0042】
(第1出力部17)
第1出力部17は、ドライバーユニットと骨伝導振動子の少なくとも一方を含み、音声を出力する。
第1出力部17は、第1装置10を装着した使用者の耳と対向する位置に配置される。
【0043】
(第2装置20)
第2装置20は、第1装置10と通信する携帯端末である。
第2装置20は、第2通信部21、第2操作部22、第2制御部26、第2出力部27を有する。
【0044】
(第2通信部21)
第2通信部21は、近距離無線通信などで、第1装置10の第1通信部11と通信する。
第2通信部21は、ネットワークを介して、サーバーなどの外部機器30と通信する。
第1通信部11と第2通信部21との間の通信に用いられる無線通信手段、第2通信部21と外部機器30との間の通信に用いられる無線通信手段は、IEEE802.15.1(Bluetooth(登録商標))や、IEEE802.11(無線LAN)や、携帯電話回線などが考えられる。
【0045】
(第2操作部22)
第2操作部22は、第1出力部17で出力する音声信号の音量調整、曲の早送り若しくは巻き戻し、ノイズキャンセリング機能のオンオフ操作、使用モードの切り替え操作などのために使用される。
【0046】
(第2制御部26)
第2制御部26は、第2装置20の各部を制御する。
【0047】
(通話モードでの第2制御部26の動作)
通話モードの場合、第2制御部26は、第2通信部21を介して、他の通信端末及び第1装置10と音声信号などの送受信を行う。
【0048】
(音楽モードでの第2制御部26の動作)
音楽モードの場合、第2制御部26は、第2通信部21を介して、第2装置20に音声信号を送信する。
【0049】
(学習モードでの第2制御部26の動作)
学習モードの場合、第2制御部26は、所定の文字情報と、当該所定の文字情報を所定の時間内(例えば、20秒以内)に読み上げる旨の指示情報を、第2出力部27に表示させる。
【0050】
また、第2制御部26は、当該所定の時間内に、第1装置10を装着した使用者が唇を動かして発した音声に基づく音声信号を、入力用マイク13に生成させる。第2制御部26は、当該所定の時間内に、第1装置10を装着した使用者の唇及び頬の領域の動画に基づく画像信号を、撮像部15に生成させる。
第2制御部26は、当該所定の文字情報と、入力用マイク13で得られた音声信号に含まれる文字情報とが一致する場合に、当該文字情報と、当該音声信号を発した時間帯における唇及び頬の領域の画像情報との組み合わせを含むデータベースを生成し、記録部38に記録する。
【0051】
(文字認識モードでの第2制御部26の動作)
文字認識モードの場合、第2制御部26は、撮像部15で得られた画像信号と記録部38に記録したデータベースとに基づいて、使用者の顔の動きに対応する文字を特定し、特定した文字をテキストエディタソフトウエア上に書き込みする。
【0052】
(第2出力部27)
第2出力部27は、表示装置であり、特に学習モードの際に、所定の文字情報を含む支持情報を表示する。
当該所定の文字情報は、文字単位(例えば、日本語の「ア」)、単語単位(例えば、日本語の「本」、文節単位(例えば、日本語の「私は」)、文単位(例えば、日本語の「今日、私は、6時に目が覚めました。」の少なくとも1つで行われる。
文字情報と画像情報の組み合わせが多ければ多いほど、文字認識モードで正しく特定出来る文字が多くなる。
【0053】
(外部機器30)
外部機器30は、ネットワークを介して、第2装置20と通信する。
外部機器30は、第3通信部31、記録部38を有する。
【0054】
(第3通信部31)
第3通信部31は、ネットワークを介して、第2装置20と通信する。
【0055】
(記録部38)
記録部38は、学習モードで生成されたデータベースを記録する。
また、記録部38には、テキストエディタソフトがインストールされる。
また、記録部38は、当該テキストエディタソフトで書き込みされたファイルを記録する。
第1実施形態では、記録部38が、外部機器30に設けられる例を説明するが、第1装置10に設けられてもよいし、第2装置20に設けられてもよい。
【0056】
(学習モードでの各部の動作)
第2出力部27は、文字情報と、指示情報を表示する。
当該文字情報は、使用者に読み上げさせる文字を含む。
当該指示情報は、第1装置10を装着した状態で、当該文字情報に含まれる文字を所定の時間内に読み上げる旨の指示を含む。
当該所定時間の間に、入力用マイク13で得られた音声信号と、撮像部15で得られた画像信号とが、第1通信部11を介して第2装置20に送信される。
第2制御部26は、当該文字情報に含まれる文字と、入力用マイク13で得られた音声信号とを比較し、当該文字に対応する音声が正しく発せられたか否かを判断する。
正しく発せられた場合には、第2制御部26は、当該所定時間の中で、当該文字に対応する音声が発せられた時間帯において撮像部15で得られた画像信号を、当該文字に対応する画像信号として、データベースに記録する。
当該データベースへの記録は、記録部38に行われる。
【0057】
(文字認識モードでの各部の動作)
撮像部15は、第1装置10を装着した使用者が唇を動かした時の画像信号を取得する。
当該使用者は、音声を発してもよいし、音声を発せずに、音声を発する場合と同じように唇を動かすだけでもよい。
取得した画像信号は、第1通信部11を介して第2装置20に送信される。
第2制御部26は、データベースに基づいて、取得した画像信号に対応する文字を特定する。
第2制御部26は、テキストエディタソフトを起動し、当該テキストエディタソフト上に、特定した文字を書き込みする。
複数の文字列(文節、文など)を発する場合と同じように唇を動かした場合には、当該複数の文字列が特定され、当該テキストエディタソフト上に書き込みされる。
【0058】
(イヤホンなどの第1装置10に撮像部15を設けることの効果)
イヤホンなどの第1装置10を装着した使用者の状態、例えば、第1装置10を装着した使用者の唇及び頬の領域の画像を得ることが可能になる。
【0059】
(イヤホンのノズル領域に撮像部15を設けることの効果)
使用者との位置関係が殆ど変わらない状態で、撮像部15を使用者の近傍に位置させることが可能になる。
【0060】
(画像信号に対応する文字を特定することの効果)
使用者の顔の動き(特に、唇や頬の動き)に対応する文字をデータベースで記録しておき、音声を発せなくても、当該動きに基づいて、当該動きに対応する文字を特定することが可能になる。
【0061】
(通話時の音声に基づいてデータベースを上書きすることの効果)
通話時の音声信号に含まれる文字情報と、当該通話時の画像信号との組み合わせを活用して、学習モードでの動作を頻繁に行わなくても、データベースを充実させ、文字認識モードで特定出来る文字を多くすることが可能になる。
【0062】
(テキストエディタソフトに書き込みすることの効果)
特定した文字を第2装置20上のテキストエディタソフト上に書き込みすることで、特定した文字を容易に記録出来る。また、テキストエディタソフト上に書き込みされた文字を編集して、誤って特定された文字を修正出来る。
【0063】
(学習モードの応用例1)
第1実施形態では、学習モードの際に、第2出力部27に文字情報などを表示し、第1装置10を装着した使用者が唇を動かして当該文字情報を読み上げる例を説明した。
しかしながら、読み上げる文字情報の出力は、第2出力部27に加えて、若しくは、第2出力部27に代えて、第1出力部17が音声で行ってもよい。
【0064】
(学習モードの応用例2)
学習モードは、通話モードの際に行われてもよい。
この場合、通話モードでも撮像部15が動作し、入力用マイク13で得られた音声信号と、撮像部15で得られた画像信号とが、第1通信部11を介して第2装置20に送信される。
第2制御部26は、入力用マイク13で得られた音声信号に対応する文字を特定し、当該文字に対応する音声信号が発せられた時間帯において撮像部15で得られた画像信号を、当該文字に対応する画像信号として、データベースに記録する。
入力用マイク13で得られた音声信号に対応する文字の特定では、第2制御部26は、通話の内容、第1装置10の位置情報などから、可能性が高い文字の選別、及び可能性の低い文字の排除を行うのが望ましい。
例えば、通話の内容から、日本語での通話であると判断した場合に、第2制御部26は、日本語の中から、当該文字の特定を行う。
【0065】
(学習モードの応用例3)
学習モードでは、テキストエディタソフト上に書き込みする文字として特定せずに、当該テキストエディタソフトの操作指示内容として特定する文字を、データベースに記録してもよい。
例えば、当該テキストエディタソフト上で「改行」機能を動作させたい場合に、所定の動作(唇などの動き)を含む画像信号を設定し、データベースに記録する。
この場合、文字認識モードにおいて、撮像部15が所定の動作を含む画像信号を取得した場合には、当該テキストエディタソフト上で「改行」操作が行われる。
【0066】
(学習モードの応用例4)
学習モードでは、使用者が文字情報に対応する音声を発する例を説明した。
しかしながら、使用者が文字情報に対応する音声を発せずに、当該文字情報に対応する音声を発する場合と同じような唇の動きを行う形態であってもよい。
【0067】
(使用モードの切り替えの応用例)
使用モードの切り替えは、第1操作部12、第2操作部22を介した手動操作に限らない。
例えば、第1装置10において、電源はオン状態であるが、いずれの使用モードも選択されていない場合、若しくは、音楽モードである場合に、撮像部15で得られる画像信号から文字を特定出来る場合に、第1制御部16若しくは第2制御部26が自動的に文字認識モードに切り替えてもよい。
【0068】
(第2実施形態、頭の動き検知)
次に、第2実施形態について説明する(図2参照)。
第2実施形態の第1装置10は、ヘッドバンドとマイク保持領域を含むワイヤレスヘッドセットである。
入力用マイク13と撮像部15は、マイク保持領域に設けられ、ヘッドセットを構成する他の部材(例えば、ヘッドバンド)及び第1装置10を装着する使用者の唇よりも前方に突出した位置に配置される。
第1装置10のヘッドバンドには、検知部18が設けられる。
検知部18は、第1装置10を装着した使用者の頭部と対向し、当該使用者の頭の状態を検知する。
当該頭の状態は、微弱な近赤外光を用いた当該使用者の脳の血流量、脳波、頭の動きに関する情報の少なくとも1つを含む。
【0069】
(文字認識モードでの第1制御部16の動作)
文字認識モードの場合、第1制御部16は、撮像部15で得られた画像信号及び検知部18で得られた頭の状態に関する情報を、第1通信部11を介して、第2装置20に送信する。
【0070】
(文字認識モードでの第2制御部26の動作)
文字認識モードの場合、第2制御部26は、撮像部15で得られた画像信号と記録部38に記録したデータベースとに基づいて、使用者の顔の動きに対応する文字を特定し、特定した文字をテキストエディタソフトウエア上に書き込みする。
ただし、検知部18で得られた頭の状態に関する情報に基づいて、第1装置10は、撮像部15の動作を停止する。
具体的には、検知部18で得られた頭の状態に関する情報から、当該使用者が睡眠状態にあると判断した場合に、第2装置20からの指示情報に基づいて、第1装置10は、撮像部15の動作を停止する。すなわち、使用者が眠っている間は、文字認識に関する動作が停止される。
【0071】
(頭部の状態を検知することの効果)
ヘッドバンドに設けた検知部18を使って、第1装置10を装着した使用者の頭部の状態を把握することが可能になる。
【0072】
(文字認識停止制御を行うことの効果)
頭部の状態に基づいて、所定の状態(例えば、睡眠状態)を特定し、当該所定の状態の時に、撮像部15などの動作を停止させ、不必要な電力消費を抑制出来る。
【0073】
(撮像部15が前方に設けられることの効果)
撮像部15は、使用者の唇と略対向する位置に設けられるため、側方若しくは後方から唇若しくは頬の動きを特定する形態と比べて、発した文字に対応する唇若しくは頬の動きを特定しやすくなる。
【0074】
(第1装置10の応用例)
第1実施形態では、第1装置10がワイヤレスイヤホンである例を説明した。
第2実施形態では、第1装置10がワイヤレスヘッドセットである例を説明した。
しかしながら、第1装置10はワイヤレスイヤホンやワイヤレスヘッドセットに限るものではなく、ワイヤードイヤホン、ワイヤレスヘッドホン、ワイヤードヘッドホン、ワイヤードヘッドセットなどであってもよい。
第1装置10が、ワイヤードイヤホン、ワイヤードヘッドホン、ワイヤードヘッドセットのいずれかである場合、第1装置10と第2装置20とは有線で接続する。
【0075】
(第2装置20の応用例)
第1実施形態及び第2実施形態では、第2装置20が携帯端末である例を説明した。
しかしながら、第2装置20が携帯端末に限るものではなく、パーソナルコンピュータなどであってもよい。
【0076】
(文字認識などの実行主体の応用例)
第1実施形態及び第2実施形態では、学習モードにおけるデータベースの生成など、文字認識モードにおける文字の特定などを、第2装置20が行う例を説明した。
しかしながら、学習モードにおけるデータベースの生成など、文字認識モードにおける文字の特定などを、第1装置10が行ってもよい。
特に、学習モードにおける文字情報及び指示情報の出力を第1出力部17が行う場合には、第2装置20を省略してもよい。
また、第1装置10が通話機能を有する場合には、第2装置20が無い形態でも、通話モードでもデータベースの追記が可能になる。
第2装置20を省略した場合、第1装置10は、ネットワークを介して、外部機器30と通信する。
【0077】
(撮像部15を使った応用例)
第1実施形態及び第2実施形態では、撮像部15で得られた画像情報(使用者の唇と頬の少なくとも一方の動きに関する情報)が、当該動きに対応する文字の特定に使用される例を説明した。
しかしながら、撮像部15で得られた画像情報は、他の目的に使用されてもよい。
例えば、第1装置10と第2装置20の少なくとも一方のロック状態の解除に使用されてもよい。
学習モードにおいて、ロック解除に対応する画像情報(使用者の唇と頬の少なくとも一方の所定の動きに関する情報)をデータベースに記録する。
第1装置10と第2装置20の少なくとも使用開始時に、撮像部15が取得した画像情報が、データベースに記録されたロック解除に対応する画像情報と一致しているか否かが判断され、一致している場合には、第1装置10と第2装置20の少なくとも一方のロック状態が解除される。
この場合の判断は、第1装置10の第1制御部16と第2装置20の第2制御部26のいずれが行ってもよい。
【0078】
(画像信号に基づいて、ロック状態を解除することの効果)
自然な動きの中で、容易にロック状態の解除判断を行うことが出来る。
【0079】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲及び要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0080】
1 システム
10 第1装置
11 第1通信部
12 第1操作部
13 入力用マイク
14 出力用マイク
15 撮像部
16 第1制御部
17 第1出力部
18 検知部
20 第2装置
21 第2通信部
22 第2操作部
26 第2制御部
27 第2出力部
30 外部機器
31 第3通信部
38 記録部
図1
図2