特開2025-4350 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ Ｒｉｔａ合同会社の特許一覧

特開2025-4350第１装置、システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2025004350

(43)【公開日】2025-01-15

(54)【発明の名称】第１装置、システム

(51)【国際特許分類】

H04R 1/10 20060101AFI20250107BHJP

【ＦＩ】

H04R1/10 101Z

H04R1/10 104Z

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023103977

(22)【出願日】2023-06-26

(71)【出願人】

【識別番号】523243270

【氏名又は名称】Ｒｉｔａ合同会社

(74)【代理人】

【識別番号】100127306

【弁理士】

【氏名又は名称】野中剛

(72)【発明者】

【氏名】野中剛

【テーマコード（参考）】

5D005

【Ｆターム（参考）】

5D005BA00

(57)【要約】

【課題】使用者の状態を視認することが可能な第１装置などを提供する。
【解決手段】第１装置は、入力用マイクと、音声を出力する第１出力部と、撮像部と、を備える。前記第１装置は、イヤホン、ヘッドホン、ヘッドセットのいずれかである。前記第１装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される。
【選択図】図１

【特許請求の範囲】

【請求項1】

入力用マイクと、
音声を出力する第１出力部と、
撮像部と、を備えた第１装置であって、
前記第１装置は、イヤホン、ヘッドホン、ヘッドセットのいずれかであり、
前記第１装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される、第１装置。

【請求項2】

前記第１装置は、前記イヤホンであり、
前記イヤホンは、イヤーピース領域とノズル領域を含み、
前記撮像部は、前記ノズル領域に設けられる、請求項１に記載の第１装置。

【請求項3】

前記第１装置は、学習モードで、前記第１出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成し、
前記第１装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する、請求項１または請求項２に記載の第１装置。

【請求項4】

前記第１装置は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定し、
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む、請求項３に記載の第１装置。

【請求項5】

前記第１装置は、前記ヘッドホンと前記ヘッドセットのいずれかであって、ヘッドバンドを含み、
前記ヘッドバンドには、前記使用者の頭の状態を検知する検知部が設けられ、
前記頭の状態は、脳の血流量、脳波、前記頭の動きに関する情報の少なくとも１つを含む、請求項１または請求項２に記載の第１装置。

【請求項6】

前記第１装置は、学習モードで、前記第１出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成し、
前記第１装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定し、
前記検知部で得られた情報に基づいて、前記第１装置は、前記撮像部の動作を停止する、請求項１または請求項２に記載の第１装置。

【請求項7】

少なくとも前記撮像部で得られた画像信号に基づいて、前記第１装置のロック状態と前記第１装置と通信する第２装置のロック状態の少なくとも一方についての解除が行われる、請求項１または請求項２に記載の第１装置。

【請求項8】

入力用マイクと、音声を出力する第１出力部と、撮像部と、を有する第１装置と、
第２出力部を有する第２装置と、を備え、
前記第１装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成され、
前記第１装置と前記第２装置とは、無線若しくは有線で接続され、
前記第１装置と前記第２装置の少なくとも一方は、学習モードで、前記第１出力部と前記第２出力部の少なくとも一方から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成し、
前記第１装置と前記第２装置の少なくとも一方は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する、システム。

【請求項9】

前記第１装置と前記第２装置の少なくとも一方は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定し、
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む、請求項８に記載のシステム。

【請求項10】

前記第１装置と前記第２装置の少なくとも一方は、前記文字認識モードで特定した文字を、テキストエディタソフト上に書き込みする、請求項８または請求項９に記載のシステム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、イヤホンなどの第１装置などに関する。

【背景技術】

【0002】

従来、特許文献１のように、ヘッドセットなどが提案されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２３－１２４１８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、使用者の状態を視認することが考慮されていない。

【0005】

したがって本発明の目的は、使用者の状態を視認することが可能な第１装置などを提供することである。

【課題を解決するための手段】

【0006】

本発明に係る第１装置は、入力用マイクと、音声を出力する第１出力部と、撮像部と、を備える。
前記第１装置は、イヤホン、ヘッドホン、ヘッドセットのいずれかである。
前記第１装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される。

【0007】

イヤホンなどの第１装置を装着した使用者の状態、例えば、第１装置を装着した使用者の唇及び頬の領域の画像を得ることが可能になる。

【0008】

好ましくは、前記第１装置は、前記イヤホンである。
前記イヤホンは、イヤーピース領域とノズル領域を含む。
前記撮像部は、前記ノズル領域に設けられる。

【0009】

使用者との位置関係が殆ど変わらない状態で、撮像部を使用者の近傍に位置させることが可能になる。

【0010】

さらに好ましくは、前記第１装置は、学習モードで、前記第１出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成する。
前記第１装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する。

【0011】

使用者の顔の動き（特に、唇や頬の動き）に対応する文字をデータベースで記録しておき、音声を発せなくても、当該動きに基づいて、当該動きに対応する文字を特定することが可能になる。

【0012】

さらに好ましくは、前記第１装置は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定する。
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む。

【0013】

通話時の音声信号に含まれる文字情報と、当該通話時の画像信号との組み合わせを活用して、学習モードでの動作を頻繁に行わなくても、データベースを充実させ、文字認識モードで特定出来る文字を多くすることが可能になる。

【0014】

また、好ましくは、前記第１装置は、前記ヘッドホンと前記ヘッドセットのいずれかであって、ヘッドバンドを含む。
前記ヘッドバンドには、前記使用者の頭の状態を検知する検知部が設けられる。
前記頭の状態は、脳の血流量、脳波、前記頭の動きに関する情報の少なくとも１つを含む。

【0015】

ヘッドバンドに設けた検知部を使って、第１装置を装着した使用者の頭部の状態を把握することが可能になる。

【0016】

また、好ましくは、前記第１装置は、学習モードで、前記第１出力部から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成する。
前記第１装置は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する。
前記検知部で得られた情報に基づいて、前記第１装置は、前記撮像部の動作を停止する。

【0017】

頭部の状態に基づいて、所定の状態（例えば、睡眠状態）を特定し、当該所定の状態の時に、撮像部などの動作を停止させ、不必要な電力消費を抑制出来る。

【0018】

また、好ましくは、少なくとも前記撮像部で得られた画像信号に基づいて、前記第１装置のロック状態と前記第１装置と通信する第２装置のロック状態の少なくとも一方についての解除が行われる。

【0019】

自然な動きの中で、容易にロック状態の解除判断を行うことが出来る。

【0020】

本発明に係るシステムは、入力用マイクと、音声を出力する第１出力部と、撮像部と、を有する第１装置と、第２出力部を有する第２装置と、を備える。
前記第１装置が前記使用者に装着された時に、前記撮像部の撮像面が前記使用者の唇及び頬の領域を向くように前記撮像部が構成される。
前記第１装置と前記第２装置とは、無線若しくは有線で接続される。
前記第１装置と前記第２装置の少なくとも一方は、学習モードで、前記第１出力部と前記第２出力部の少なくとも一方から出力された文字情報を前記使用者が読み上げた音声に対応し、前記入力用マイクで得られた音声信号と、前記使用者が前記音声を読み上げた時に前記撮像部で得られた画像信号に基づいて、前記文字情報と前記画像信号との組み合わせを含むデータベースを生成する。
前記第１装置と前記第２装置の少なくとも一方は、文字認識モードで、前記データベースと、前記撮像部で得られた画像信号とに基づいて、前記画像信号に対応する文字を特定する。

【0021】

好ましくは、前記第１装置と前記第２装置の少なくとも一方は、通話モードで、前記使用者が発した音声に対応し、前記入力用マイクで得られた音声信号に含まれる文字情報を特定する。
前記データベースは、特定した前記文字情報と、前記使用者が前記音声を発した時に前記撮像部で得られた画像信号との組み合わせを含む。

【0022】

さらに好ましくは、前記第１装置と前記第２装置の少なくとも一方は、前記文字認識モードで特定した文字を、テキストエディタソフト上に書き込みする。

【0023】

特定した文字を第２装置上のテキストエディタソフト上に書き込みすることで、特定した文字を容易に記録出来る。また、テキストエディタソフト上に書き込みされた文字を編集して、誤って特定された文字を修正出来る。

【発明の効果】

【0024】

以上のように本発明によれば、使用者の状態を視認することが可能な第１装置などを提供することができる。

【図面の簡単な説明】

【0025】

【図1】第１実施形態における、システムの構成図である。

【図2】第２実施形態における、システムの構成図である。

【発明を実施するための形態】

【0026】

以下、第１実施形態について、図を用いて説明する（図１参照）。
なお、実施形態は、以下の実施形態に限られるものではない。また、一つの実施形態に記載した内容は、原則として他の実施形態にも同様に適用される。また、各実施形態及び各変形例は、適宜組み合わせることが出来る。

【0027】

第１実施形態におけるシステム１は、第１装置１０と、第２装置２０と、外部機器３０を備える。

【0028】

（第１装置１０）
第１装置１０は、イヤーピース領域とノズル領域を含むワイヤレスイヤホンである。
第１装置１０は、第１通信部１１、第１操作部１２、入力用マイク１３、出力用マイク１４、撮像部１５、第１制御部１６、第１出力部１７を有する。

【0029】

第１通信部１１と、第１操作部１２と、出力用マイク１４と、第１制御部１６と、第１出力部１７とは、第１装置１０のイヤーピース領域に設けられる。
入力用マイク１３と、撮像部１５とは、第１装置１０のノズル領域に設けられる。
ただし、第１操作部１２と、出力用マイク１４と、第１制御部１６のいずれかが、第１装置１０のノズル領域に設けられてもよい。
また、撮像部１５が、第１装置１０のイヤーピース領域に設けられてもよい。

【0030】

第１装置１０は、右耳用と左耳用の２つで構成される。
ただし、第１装置１０は、右耳用と左耳用のいずれか１つだけで構成されてもよい。

【0031】

（第１通信部１１）
第１通信部１１は、近距離無線通信などで、第２装置２０の第２通信部２１と通信する。
入力用マイク１３で得られた音声信号、撮像部１５で得られた画像信号は、第１通信部１１を介して、第２装置２０に送信される。
第１出力部１７で出力する音声信号は、第１通信部１１を介して、第２装置２０から送信される。

【0032】

（第１操作部１２）
第１操作部１２は、第１出力部１７で出力する音声信号の音量調整、曲の早送り若しくは巻き戻し、ノイズキャンセリング機能のオンオフ操作、使用モードの切り替え操作などのために使用される。
第１実施形態の使用モードは、第２装置２０を使った通話のための通話モード、第２装置２０の音楽を出力するための音楽モード、文字認識モード、学習モードを含む。
文字認識モードでは、使用者が文字を発する際の唇と頬の少なくとも一方の動きに基づいて、当該使用者が発した文字が特定される。
学習モードでは、文字認識モードで使用するデータベースを生成するため、使用者が発した音声に含まれる文字と、当該使用者が当該音声を発した際の当該使用者の唇と頬の少なくとも一方の動きが特定される。

【0033】

（入力用マイク１３）
入力用マイク１３は、第１装置１０を装着した使用者が発した音声に基づいて、音声信号を生成する。
第１装置１０が右耳用と左耳用の２つで構成される場合、入力用マイク１３は、右耳用の第１装置１０と左耳用の第１装置１０のいずれかにだけ設けられる形態であってもよい。

【0034】

（出力用マイク１４）
出力用マイク１４は、第１装置１０の周囲の音声に基づいて、音声信号を生成する。
出力用マイク１４で得られた音声信号は、ノイズキャンセリングに使用される。

【0035】

（撮像部１５）
撮像部１５は、第１装置１０を装着した使用者の顔、特に唇及び頬の領域の動画を撮影し、撮影した動画に対応する画像信号を生成する。
撮像部１５で得られた画像信号の用途は後述する。
第１装置１０が右耳用と左耳用の２つで構成される場合、撮像部１５は、右耳用の第１装置１０と左耳用の第１装置１０のいずれかにだけ設けられる形態であってもよい。
例えば、右耳用の第１装置１０と左耳用の第１装置１０の一方のノズル領域の先端には、入力用マイク１３が設けられ、右耳用の第１装置１０と左耳用の第１装置１０の他方のノズル領域の先端には、撮像部１５が設けられる。
撮像部１５の撮像面は、第１装置１０を装着した使用者の顔、特に唇及び頬の領域を向く。
また、撮像部１５のレンズの焦点距離ｆは、撮像部１５と、第１装置１０を装着した使用者の顔、特に唇及び頬の領域との距離と略等しい（ｆ≦１０ｃｍ）。

【0036】

（第１制御部１６）
第１制御部１６は、第１装置１０の各部を制御する。

【0037】

（通話モードでの第１制御部１６の動作）
通話モードの場合、第１制御部１６は、入力用マイク１３で得られた音声信号を、第１通信部１１を介して、第２装置２０に送信する。
また、第１制御部１６は、第２装置２０から送信された音声信号に基づく音声を、第１出力部１７に出力させる。

【0038】

（音楽モードでの第１制御部１６の動作）
音楽モードの場合、第１制御部１６は、第２装置２０から送信された音声信号に基づく音声を、第１出力部１７に出力させる。

【0039】

ノイズキャンセリングを行う場合は、第１制御部１６は、出力用マイク１４で得られた音声信号に基づいてノイズキャンセル信号を生成する。第１制御部１６は、当該ノイズキャンセル信号を、第２装置２０から送信された音声信号に重畳する。第１制御部１６は、重畳した音声信号に基づく音声を、第１出力部１７に出力させる。

【0040】

（学習モードでの第１制御部１６の動作）
学習モードの場合、第１制御部１６は、入力用マイク１３で得られた音声信号と、撮像部１５で得られた画像信号を、第１通信部１１を介して、第２装置２０に送信する。

【0041】

（文字認識モードでの第１制御部１６の動作）
文字認識モードの場合、第１制御部１６は、撮像部１５で得られた画像信号を、第１通信部１１を介して、第２装置２０に送信する。

【0042】

（第１出力部１７）
第１出力部１７は、ドライバーユニットと骨伝導振動子の少なくとも一方を含み、音声を出力する。
第１出力部１７は、第１装置１０を装着した使用者の耳と対向する位置に配置される。

【0043】

（第２装置２０）
第２装置２０は、第１装置１０と通信する携帯端末である。
第２装置２０は、第２通信部２１、第２操作部２２、第２制御部２６、第２出力部２７を有する。

【0044】

（第２通信部２１）
第２通信部２１は、近距離無線通信などで、第１装置１０の第１通信部１１と通信する。
第２通信部２１は、ネットワークを介して、サーバーなどの外部機器３０と通信する。
第１通信部１１と第２通信部２１との間の通信に用いられる無線通信手段、第２通信部２１と外部機器３０との間の通信に用いられる無線通信手段は、IEEE802.15.1（Bluetooth（登録商標））や、IEEE802.11（無線LAN）や、携帯電話回線などが考えられる。

【0045】

（第２操作部２２）
第２操作部２２は、第１出力部１７で出力する音声信号の音量調整、曲の早送り若しくは巻き戻し、ノイズキャンセリング機能のオンオフ操作、使用モードの切り替え操作などのために使用される。

【0046】

（第２制御部２６）
第２制御部２６は、第２装置２０の各部を制御する。

【0047】

（通話モードでの第２制御部２６の動作）
通話モードの場合、第２制御部２６は、第２通信部２１を介して、他の通信端末及び第１装置１０と音声信号などの送受信を行う。

【0048】

（音楽モードでの第２制御部２６の動作）
音楽モードの場合、第２制御部２６は、第２通信部２１を介して、第２装置２０に音声信号を送信する。

【0049】

（学習モードでの第２制御部２６の動作）
学習モードの場合、第２制御部２６は、所定の文字情報と、当該所定の文字情報を所定の時間内（例えば、２０秒以内）に読み上げる旨の指示情報を、第２出力部２７に表示させる。

【0050】

また、第２制御部２６は、当該所定の時間内に、第１装置１０を装着した使用者が唇を動かして発した音声に基づく音声信号を、入力用マイク１３に生成させる。第２制御部２６は、当該所定の時間内に、第１装置１０を装着した使用者の唇及び頬の領域の動画に基づく画像信号を、撮像部１５に生成させる。
第２制御部２６は、当該所定の文字情報と、入力用マイク１３で得られた音声信号に含まれる文字情報とが一致する場合に、当該文字情報と、当該音声信号を発した時間帯における唇及び頬の領域の画像情報との組み合わせを含むデータベースを生成し、記録部３８に記録する。

【0051】

（文字認識モードでの第２制御部２６の動作）
文字認識モードの場合、第２制御部２６は、撮像部１５で得られた画像信号と記録部３８に記録したデータベースとに基づいて、使用者の顔の動きに対応する文字を特定し、特定した文字をテキストエディタソフトウエア上に書き込みする。

【0052】

（第２出力部２７）
第２出力部２７は、表示装置であり、特に学習モードの際に、所定の文字情報を含む支持情報を表示する。
当該所定の文字情報は、文字単位（例えば、日本語の「ア」）、単語単位（例えば、日本語の「本」、文節単位（例えば、日本語の「私は」）、文単位（例えば、日本語の「今日、私は、６時に目が覚めました。」の少なくとも１つで行われる。
文字情報と画像情報の組み合わせが多ければ多いほど、文字認識モードで正しく特定出来る文字が多くなる。

【0053】

（外部機器３０）
外部機器３０は、ネットワークを介して、第２装置２０と通信する。
外部機器３０は、第３通信部３１、記録部３８を有する。

【0054】

（第３通信部３１）
第３通信部３１は、ネットワークを介して、第２装置２０と通信する。

【0055】

（記録部３８）
記録部３８は、学習モードで生成されたデータベースを記録する。
また、記録部３８には、テキストエディタソフトがインストールされる。
また、記録部３８は、当該テキストエディタソフトで書き込みされたファイルを記録する。
第１実施形態では、記録部３８が、外部機器３０に設けられる例を説明するが、第１装置１０に設けられてもよいし、第２装置２０に設けられてもよい。

【0056】

（学習モードでの各部の動作）
第２出力部２７は、文字情報と、指示情報を表示する。
当該文字情報は、使用者に読み上げさせる文字を含む。
当該指示情報は、第１装置１０を装着した状態で、当該文字情報に含まれる文字を所定の時間内に読み上げる旨の指示を含む。
当該所定時間の間に、入力用マイク１３で得られた音声信号と、撮像部１５で得られた画像信号とが、第１通信部１１を介して第２装置２０に送信される。
第２制御部２６は、当該文字情報に含まれる文字と、入力用マイク１３で得られた音声信号とを比較し、当該文字に対応する音声が正しく発せられたか否かを判断する。
正しく発せられた場合には、第２制御部２６は、当該所定時間の中で、当該文字に対応する音声が発せられた時間帯において撮像部１５で得られた画像信号を、当該文字に対応する画像信号として、データベースに記録する。
当該データベースへの記録は、記録部３８に行われる。

【0057】

（文字認識モードでの各部の動作）
撮像部１５は、第１装置１０を装着した使用者が唇を動かした時の画像信号を取得する。
当該使用者は、音声を発してもよいし、音声を発せずに、音声を発する場合と同じように唇を動かすだけでもよい。
取得した画像信号は、第１通信部１１を介して第２装置２０に送信される。
第２制御部２６は、データベースに基づいて、取得した画像信号に対応する文字を特定する。
第２制御部２６は、テキストエディタソフトを起動し、当該テキストエディタソフト上に、特定した文字を書き込みする。
複数の文字列（文節、文など）を発する場合と同じように唇を動かした場合には、当該複数の文字列が特定され、当該テキストエディタソフト上に書き込みされる。

【0058】

（イヤホンなどの第１装置１０に撮像部１５を設けることの効果）
イヤホンなどの第１装置１０を装着した使用者の状態、例えば、第１装置１０を装着した使用者の唇及び頬の領域の画像を得ることが可能になる。

【0059】

（イヤホンのノズル領域に撮像部１５を設けることの効果）
使用者との位置関係が殆ど変わらない状態で、撮像部１５を使用者の近傍に位置させることが可能になる。

【0060】

（画像信号に対応する文字を特定することの効果）
使用者の顔の動き（特に、唇や頬の動き）に対応する文字をデータベースで記録しておき、音声を発せなくても、当該動きに基づいて、当該動きに対応する文字を特定することが可能になる。

【0061】

（通話時の音声に基づいてデータベースを上書きすることの効果）
通話時の音声信号に含まれる文字情報と、当該通話時の画像信号との組み合わせを活用して、学習モードでの動作を頻繁に行わなくても、データベースを充実させ、文字認識モードで特定出来る文字を多くすることが可能になる。

【0062】

（テキストエディタソフトに書き込みすることの効果）
特定した文字を第２装置２０上のテキストエディタソフト上に書き込みすることで、特定した文字を容易に記録出来る。また、テキストエディタソフト上に書き込みされた文字を編集して、誤って特定された文字を修正出来る。

【0063】

（学習モードの応用例１）
第１実施形態では、学習モードの際に、第２出力部２７に文字情報などを表示し、第１装置１０を装着した使用者が唇を動かして当該文字情報を読み上げる例を説明した。
しかしながら、読み上げる文字情報の出力は、第２出力部２７に加えて、若しくは、第２出力部２７に代えて、第１出力部１７が音声で行ってもよい。

【0064】

（学習モードの応用例２）
学習モードは、通話モードの際に行われてもよい。
この場合、通話モードでも撮像部１５が動作し、入力用マイク１３で得られた音声信号と、撮像部１５で得られた画像信号とが、第１通信部１１を介して第２装置２０に送信される。
第２制御部２６は、入力用マイク１３で得られた音声信号に対応する文字を特定し、当該文字に対応する音声信号が発せられた時間帯において撮像部１５で得られた画像信号を、当該文字に対応する画像信号として、データベースに記録する。
入力用マイク１３で得られた音声信号に対応する文字の特定では、第２制御部２６は、通話の内容、第１装置１０の位置情報などから、可能性が高い文字の選別、及び可能性の低い文字の排除を行うのが望ましい。
例えば、通話の内容から、日本語での通話であると判断した場合に、第２制御部２６は、日本語の中から、当該文字の特定を行う。

【0065】

（学習モードの応用例３）
学習モードでは、テキストエディタソフト上に書き込みする文字として特定せずに、当該テキストエディタソフトの操作指示内容として特定する文字を、データベースに記録してもよい。
例えば、当該テキストエディタソフト上で「改行」機能を動作させたい場合に、所定の動作（唇などの動き）を含む画像信号を設定し、データベースに記録する。
この場合、文字認識モードにおいて、撮像部１５が所定の動作を含む画像信号を取得した場合には、当該テキストエディタソフト上で「改行」操作が行われる。

【0066】

（学習モードの応用例４）
学習モードでは、使用者が文字情報に対応する音声を発する例を説明した。
しかしながら、使用者が文字情報に対応する音声を発せずに、当該文字情報に対応する音声を発する場合と同じような唇の動きを行う形態であってもよい。

【0067】

（使用モードの切り替えの応用例）
使用モードの切り替えは、第１操作部１２、第２操作部２２を介した手動操作に限らない。
例えば、第１装置１０において、電源はオン状態であるが、いずれの使用モードも選択されていない場合、若しくは、音楽モードである場合に、撮像部１５で得られる画像信号から文字を特定出来る場合に、第１制御部１６若しくは第２制御部２６が自動的に文字認識モードに切り替えてもよい。

【0068】

（第２実施形態、頭の動き検知）
次に、第２実施形態について説明する（図２参照）。
第２実施形態の第１装置１０は、ヘッドバンドとマイク保持領域を含むワイヤレスヘッドセットである。
入力用マイク１３と撮像部１５は、マイク保持領域に設けられ、ヘッドセットを構成する他の部材（例えば、ヘッドバンド）及び第１装置１０を装着する使用者の唇よりも前方に突出した位置に配置される。
第１装置１０のヘッドバンドには、検知部１８が設けられる。
検知部１８は、第１装置１０を装着した使用者の頭部と対向し、当該使用者の頭の状態を検知する。
当該頭の状態は、微弱な近赤外光を用いた当該使用者の脳の血流量、脳波、頭の動きに関する情報の少なくとも１つを含む。

【0069】

（文字認識モードでの第１制御部１６の動作）
文字認識モードの場合、第１制御部１６は、撮像部１５で得られた画像信号及び検知部１８で得られた頭の状態に関する情報を、第１通信部１１を介して、第２装置２０に送信する。

【0070】

（文字認識モードでの第２制御部２６の動作）
文字認識モードの場合、第２制御部２６は、撮像部１５で得られた画像信号と記録部３８に記録したデータベースとに基づいて、使用者の顔の動きに対応する文字を特定し、特定した文字をテキストエディタソフトウエア上に書き込みする。
ただし、検知部１８で得られた頭の状態に関する情報に基づいて、第１装置１０は、撮像部１５の動作を停止する。
具体的には、検知部１８で得られた頭の状態に関する情報から、当該使用者が睡眠状態にあると判断した場合に、第２装置２０からの指示情報に基づいて、第１装置１０は、撮像部１５の動作を停止する。すなわち、使用者が眠っている間は、文字認識に関する動作が停止される。

【0071】

（頭部の状態を検知することの効果）
ヘッドバンドに設けた検知部１８を使って、第１装置１０を装着した使用者の頭部の状態を把握することが可能になる。

【0072】

（文字認識停止制御を行うことの効果）
頭部の状態に基づいて、所定の状態（例えば、睡眠状態）を特定し、当該所定の状態の時に、撮像部１５などの動作を停止させ、不必要な電力消費を抑制出来る。

【0073】

（撮像部１５が前方に設けられることの効果）
撮像部１５は、使用者の唇と略対向する位置に設けられるため、側方若しくは後方から唇若しくは頬の動きを特定する形態と比べて、発した文字に対応する唇若しくは頬の動きを特定しやすくなる。

【0074】

（第１装置１０の応用例）
第１実施形態では、第１装置１０がワイヤレスイヤホンである例を説明した。
第２実施形態では、第１装置１０がワイヤレスヘッドセットである例を説明した。
しかしながら、第１装置１０はワイヤレスイヤホンやワイヤレスヘッドセットに限るものではなく、ワイヤードイヤホン、ワイヤレスヘッドホン、ワイヤードヘッドホン、ワイヤードヘッドセットなどであってもよい。
第１装置１０が、ワイヤードイヤホン、ワイヤードヘッドホン、ワイヤードヘッドセットのいずれかである場合、第１装置１０と第２装置２０とは有線で接続する。

【0075】

（第２装置２０の応用例）
第１実施形態及び第２実施形態では、第２装置２０が携帯端末である例を説明した。
しかしながら、第２装置２０が携帯端末に限るものではなく、パーソナルコンピュータなどであってもよい。

【0076】

（文字認識などの実行主体の応用例）
第１実施形態及び第２実施形態では、学習モードにおけるデータベースの生成など、文字認識モードにおける文字の特定などを、第２装置２０が行う例を説明した。
しかしながら、学習モードにおけるデータベースの生成など、文字認識モードにおける文字の特定などを、第１装置１０が行ってもよい。
特に、学習モードにおける文字情報及び指示情報の出力を第１出力部１７が行う場合には、第２装置２０を省略してもよい。
また、第１装置１０が通話機能を有する場合には、第２装置２０が無い形態でも、通話モードでもデータベースの追記が可能になる。
第２装置２０を省略した場合、第１装置１０は、ネットワークを介して、外部機器３０と通信する。

【0077】

（撮像部１５を使った応用例）
第１実施形態及び第２実施形態では、撮像部１５で得られた画像情報（使用者の唇と頬の少なくとも一方の動きに関する情報）が、当該動きに対応する文字の特定に使用される例を説明した。
しかしながら、撮像部１５で得られた画像情報は、他の目的に使用されてもよい。
例えば、第１装置１０と第２装置２０の少なくとも一方のロック状態の解除に使用されてもよい。
学習モードにおいて、ロック解除に対応する画像情報（使用者の唇と頬の少なくとも一方の所定の動きに関する情報）をデータベースに記録する。
第１装置１０と第２装置２０の少なくとも使用開始時に、撮像部１５が取得した画像情報が、データベースに記録されたロック解除に対応する画像情報と一致しているか否かが判断され、一致している場合には、第１装置１０と第２装置２０の少なくとも一方のロック状態が解除される。
この場合の判断は、第１装置１０の第１制御部１６と第２装置２０の第２制御部２６のいずれが行ってもよい。

【0078】

（画像信号に基づいて、ロック状態を解除することの効果）
自然な動きの中で、容易にロック状態の解除判断を行うことが出来る。

【0079】

本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲及び要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

【符号の説明】

【0080】

１システム
１０第１装置
１１第１通信部
１２第１操作部
１３入力用マイク
１４出力用マイク
１５撮像部
１６第１制御部
１７第１出力部
１８検知部
２０第２装置
２１第２通信部
２２第２操作部
２６第２制御部
２７第２出力部
３０外部機器
３１第３通信部
３８記録部

【図1】

【図2】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版