IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コニカミノルタ株式会社の特許一覧

特許7124572画像形成装置および画像形成装置の制御プログラム
<>
  • 特許-画像形成装置および画像形成装置の制御プログラム 図1
  • 特許-画像形成装置および画像形成装置の制御プログラム 図2
  • 特許-画像形成装置および画像形成装置の制御プログラム 図3
  • 特許-画像形成装置および画像形成装置の制御プログラム 図4
  • 特許-画像形成装置および画像形成装置の制御プログラム 図5
  • 特許-画像形成装置および画像形成装置の制御プログラム 図6
  • 特許-画像形成装置および画像形成装置の制御プログラム 図7
  • 特許-画像形成装置および画像形成装置の制御プログラム 図8
  • 特許-画像形成装置および画像形成装置の制御プログラム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-16
(45)【発行日】2022-08-24
(54)【発明の名称】画像形成装置および画像形成装置の制御プログラム
(51)【国際特許分類】
   H04N 1/00 20060101AFI20220817BHJP
   G10L 15/28 20130101ALI20220817BHJP
   H04R 3/00 20060101ALI20220817BHJP
   G03G 21/14 20060101ALI20220817BHJP
【FI】
H04N1/00 350
G10L15/28 400
H04R3/00 320
H04N1/00 002B
G03G21/14
【請求項の数】 13
(21)【出願番号】P 2018165761
(22)【出願日】2018-09-05
(65)【公開番号】P2020039067
(43)【公開日】2020-03-12
【審査請求日】2021-07-15
(73)【特許権者】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】100110788
【弁理士】
【氏名又は名称】椿 豊
(72)【発明者】
【氏名】杉浦 博
(72)【発明者】
【氏名】山本 太郎
【審査官】松永 隆志
(56)【参考文献】
【文献】特開2006-013584(JP,A)
【文献】特開2005-311675(JP,A)
【文献】特開2018-121134(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H04N 1/00-1/64
G10L 15/28
H04R 3/00
G03G 21/14
(57)【特許請求の範囲】
【請求項1】
画像形成装置であって、
音声の入力を受け付ける音声入力手段と、
前記音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、
前記音声認識手段による認識結果に基づいて処理を実行する制御手段と、
前記画像形成装置が何らかの作業が必要な状態にある場合に、前記状態の種類に応じて決定された方向に、入力を受け付ける音声の方向依存性である前記音声入力手段の指向性を切り替える切替手段とを備えた、画像形成装置。
【請求項2】
画像形成装置であって、
音声の入力を受け付ける音声入力手段と、
前記音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、
前記音声認識手段による認識結果に基づいて処理を実行する制御手段と、
前記画像形成装置の状態に基づいて、入力を受け付ける音声の方向依存性である前記音声入力手段の指向性を切り替える切替手段とを備え、
前記切替手段は、少なくとも単一指向性および全指向性を含む選択肢の中から前記音声入力手段の指向性を切り替え、
前記単一指向性は、特定の入力方向からの音声の入力を受け付ける指向性であり、
前記全指向性は、前記入力方向よりも広い範囲の方向からの音声の入力を受け付ける指向性である、画像形成装置。
【請求項3】
前記切替手段は、互いに異なる複数の前記入力方向を有する複数の前記単一指向性を含む選択肢の中から前記音声入力手段の指向性を切り替える、請求項2に記載の画像形成装置。
【請求項4】
前記画像形成装置の状態が特定の状態でない場合に、前記切替手段は、前記画像形成装置の前方を前記入力方向とする前記単一指向性に、前記音声入力手段の指向性を切り替える、請求項2または3に記載の画像形成装置。
【請求項5】
前記特定の状態は、前記画像形成装置にジャムが発生した状態を含み、
前記画像形成装置にジャムが発生した場合に、前記切替手段は、前記音声入力手段の指向性を前記全指向性に切り替える、請求項4に記載の画像形成装置。
【請求項6】
前記画像形成装置に発生したジャムが解消した場合に、前記切替手段は、前記画像形成装置の前方を前記入力方向とする前記単一指向性に、前記音声入力手段の指向性を切り替える、請求項5に記載の画像形成装置。
【請求項7】
筐体と、
前記筐体に設けられ、開閉可能な扉とをさらに備え、
前記特定の状態は、前記扉の開状態を含み、
前記扉が開状態である場合に、前記切替手段は、前記扉の方向を前記入力方向とする前記単一指向性に、前記音声入力手段の指向性を切り替え、
前記扉の方向を前記入力方向とする前記単一指向性に前記音声入力手段の指向性を切り替えた後、前記画像形成装置に対する操作が行われない無操作時間が第1の時間を経過した場合に、前記切替手段は、前記音声入力手段の指向性を前記全指向性に切り替える、請求項4~6のいずれかに記載の画像形成装置。
【請求項8】
前記扉は複数であり、
前記複数の扉のうちいずれかの扉が開状態である場合に、前記切替手段は、開状態である前記扉の方向を前記入力方向とする前記単一指向性に、前記音声入力手段の指向性を切り替える、請求項7に記載の画像形成装置。
【請求項9】
筐体に設けられ、用紙を収容する収容手段であって、前記筐体から引き出し可能な収容手段をさらに備え、
前記特定の状態は、前記収容手段が引き出された状態を含み、
前記収容手段が前記筐体から引き出された場合に、前記切替手段は、前記収容手段の方向を前記入力方向とする前記単一指向性に、前記音声入力手段の指向性を切り替え、
前記収容手段の方向を前記入力方向とする前記単一指向性に前記音声入力手段の指向性を切り替えた後、前記画像形成装置に対する操作が行われない無操作時間が第2の時間を経過した場合に、前記切替手段は、前記音声入力手段の指向性を前記全指向性に切り替える、請求項4~8のいずれかに記載の画像形成装置。
【請求項10】
前記特定の状態は、作業者が前記画像形成装置に対する作業を行うための作業モードに前記画像形成装置の動作モードが遷移した状態を含み、
前記作業モードに前記画像形成装置の動作モードが遷移した場合に、前記切替手段は、前記音声入力手段の指向性を前記全指向性に切り替える、請求項4~9のいずれかに記載の画像形成装置。
【請求項11】
前記特定の状態は、前記画像形成装置に画像形成を行うことができないトラブルが発生した状態を含み、
前記画像形成装置に前記トラブルが発生した状態の場合に、前記切替手段は、前記音声入力手段の指向性を前記全指向性に切り替える、請求項4~10のいずれかに記載の画像形成装置。
【請求項12】
音声の入力を受け付ける音声入力手段と、前記音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、前記音声認識手段による認識結果に基づいて処理を実行する制御手段とを備えた画像形成装置の制御プログラムであって、
前記画像形成装置が何らかの作業が必要な状態にある場合に、前記状態の種類に応じて決定された方向に、入力を受け付ける音声の方向依存性である前記音声入力手段の指向性を切り替える切替ステップをコンピューターに実行させるための、画像形成装置の制御プログラム。
【請求項13】
音声の入力を受け付ける音声入力手段と、前記音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、前記音声認識手段による認識結果に基づいて処理を実行する制御手段とを備えた画像形成装置の制御プログラムであって、
前記画像形成装置の状態に基づいて、入力を受け付ける音声の方向依存性である前記音声入力手段の指向性を切り替える切替ステップをコンピューターに実行させるためのものであり、
前記切替ステップにおいて、少なくとも単一指向性および全指向性を含む選択肢の中から前記音声入力手段の指向性を切り替え、
前記単一指向性は、特定の入力方向からの音声の入力を受け付ける指向性であり、
前記全指向性は、前記入力方向よりも広い範囲の方向からの音声の入力を受け付ける指向性である、画像形成装置の制御プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像形成装置および画像形成装置の制御プログラムに関する。より特定的には、本発明は、音声の認識精度を向上することのできる画像形成装置および画像形成装置の制御プログラムに関する。
【背景技術】
【0002】
電子写真式の画像形成装置には、スキャナー機能、ファクシミリ機能、複写機能、プリンターとしての機能、データ通信機能、およびサーバー機能を備えたMFP(Multi Function Peripheral)、ファクシミリ装置、複写機、プリンターなどがある。
【0003】
近年、装置の使用者や作業者などが発した音声を装置が認識し、認識した音声に従う動作を行う技術が提案されている。下記特許文献1には、ユーザーが意識して操作を行わなくても、マイクの指向性を切り替えることが可能な会議装置が開示されている。この会議装置は、マイクと、アームに備え付けられたカメラとを備えている。アームが立っていてカメラによる撮影が可能な場合には、マイクは前方指向性を有する。アームが倒れていてカメラによる撮影が不可能な場合には、マイクは全指向性を有する。
【0004】
下記特許文献2には、音声認識機能を有する画像形成装置が開示されている。この画像形成装置は、音声を受け付けて音声データを生成する音声データ生成部と、ジョブ実行中に動作する可動部の動作をシミュレートしてノイズデータを生成するノイズデータ生成部と、ジョブ実行中に音声データ生成部により生成された音声データからノイズデータを除去するノイズ除去部と、ノイズ除去部によりノイズデータが除去された音声データに基づいて音声認識を行う音声認識部とを備える。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2015-188042号公報
【文献】特開2016-168707号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
使用者や作業者が発した音声を画像形成装置が認識し、認識した音声に従う動作を行う従来技術では、音声の入力を受け付けるマイクの指向性(入力を受け付ける音声の方向依存性)が固定されていた。
【0007】
たとえば、画像形成装置の周辺の広範囲からの音声を認識するために、音声の入力を受け付けるマイクとして、全指向性(広い範囲の方向からの音声の入力を受け付ける指向性)を有するマイクを採用した場合には、複数の画像形成装置が互いに近接して設置されているような状況で、画像形成装置を操作するために発せられた音声を、他の画像形成装置が誤って認識するおそれがあった。加えて、オフィスの中央などの人が多い場所に画像形成装置が設置されているような状況では、会話などの画像形成装置の操作とは無関係の音声を、画像形成装置が誤って認識するおそれがあった。
【0008】
たとえば、音声の入力を受け付けるマイクとして、画像形成装置を使用する使用者の音声を認識するために、単一指向性(特定の入力方向からの音声の入力を受け付ける指向性)を有するマイクを採用し、画像形成装置の前面(正面)からの音声の入力を受け付けるようにこのマイクを設定した場合には、ジャム発生時などに作業者から発せられた音声を認識することができないおそれがあった。すなわち、ジャム発生時には、ジャム解消のための手順に迷う作業者は、前面以外の位置(画像形成装置の側面の扉や排紙部の位置など)に移動し、そのような位置からジャム解消のための手順を問い合わせる音声を発する可能性がある。この場合に、マイクの指向性が画像形成装置の前面に向けられていると、作業者から発せられた音声を認識することができないおそれがあった。
【0009】
音声にて画像形成装置を操作する従来技術には、画像形成装置の状況によって音声の誤認識や音声を認識できない事態が起こり、音声の認識精度が低いという問題があった。
【0010】
本発明は、上記課題を解決するためのものであり、その目的は、音声の認識精度を向上することのできる画像形成装置および画像形成装置の制御プログラムを提供することである。
【課題を解決するための手段】
【0011】
本発明の一の局面に従う画像形成装置は、音声の入力を受け付ける音声入力手段と、音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、音声認識手段による認識結果に基づいて処理を実行する制御手段と、画像形成装置が何らかの作業が必要な状態にある場合に、状態の種類に応じて決定された方向に、入力を受け付ける音声の方向依存性である音声入力手段の指向性を切り替える切替手段とを備える。
【0012】
本発明の他の局面に従う画像形成装置は、音声の入力を受け付ける音声入力手段と、音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、音声認識手段による認識結果に基づいて処理を実行する制御手段と、画像形成装置の状態に基づいて、入力を受け付ける音声の方向依存性である音声入力手段の指向性を切り替える切替手段とを備え、切替手段は、少なくとも単一指向性および全指向性を含む選択肢の中から音声入力手段の指向性を切り替え、単一指向性は、特定の入力方向からの音声の入力を受け付ける指向性であり、全指向性は、入力方向よりも広い範囲の方向からの音声の入力を受け付ける指向性である。
【0013】
上記画像形成装置において好ましくは、切替手段は、互いに異なる複数の入力方向を有する複数の単一指向性を含む選択肢の中から音声入力手段の指向性を切り替える。
【0014】
上記画像形成装置において好ましくは、画像形成装置の状態が特定の状態でない場合に、切替手段は、画像形成装置の前方を入力方向とする単一指向性に、音声入力手段の指向性を切り替える。
【0015】
上記画像形成装置において好ましくは、特定の状態は、画像形成装置にジャムが発生した状態を含み、画像形成装置にジャムが発生した場合に、切替手段は、音声入力手段の指向性を全指向性に切り替える。
【0016】
上記画像形成装置において好ましくは、画像形成装置に発生したジャムが解消した場合に、切替手段は、画像形成装置の前方を入力方向とする単一指向性に、音声入力手段の指向性を切り替える。
【0017】
上記画像形成装置において好ましくは、筐体と、筐体に設けられ、開閉可能な扉とをさらに備え、特定の状態は、扉の開状態を含み、扉が開状態である場合に、切替手段は、扉の方向を入力方向とする単一指向性に、音声入力手段の指向性を切り替え、扉の方向を入力方向とする単一指向性に音声入力手段の指向性を切り替えた後、画像形成装置に対する操作が行われない無操作時間が第1の時間を経過した場合に、切替手段は、音声入力手段の指向性を全指向性に切り替える。
【0018】
上記画像形成装置において好ましくは、扉は複数であり、複数の扉のうちいずれかの扉が開状態である場合に、切替手段は、開状態である扉の方向を入力方向とする単一指向性に、音声入力手段の指向性を切り替える。
【0019】
上記画像形成装置において好ましくは、筐体に設けられ、用紙を収容する収容手段であって、筐体から引き出し可能な収容手段をさらに備え、特定の状態は、収容手段が引き出された状態を含み、収容手段が筐体から引き出された場合に、切替手段は、収容手段の方向を入力方向とする単一指向性に、音声入力手段の指向性を切り替え、収容手段の方向を入力方向とする単一指向性に音声入力手段の指向性を切り替えた後、画像形成装置に対する操作が行われない無操作時間が第2の時間を経過した場合に、切替手段は、音声入力手段の指向性を全指向性に切り替える。
【0020】
上記画像形成装置において好ましくは、特定の状態は、作業者が画像形成装置に対する作業を行うための作業モードに画像形成装置の動作モードが遷移した状態を含み、作業モードに画像形成装置の動作モードが遷移した場合に、切替手段は、音声入力手段の指向性を全指向性に切り替える。
【0021】
上記画像形成装置において好ましくは、特定の状態は、画像形成装置に画像形成を行うことができないトラブルが発生した状態を含み、画像形成装置にトラブルが発生した状態の場合に、切替手段は、音声入力手段の指向性を全指向性に切り替える。
【0022】
本発明のさらに他の局面に従う画像形成装置の制御プログラムは、音声の入力を受け付ける音声入力手段と、音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、音声認識手段による認識結果に基づいて処理を実行する制御手段とを備えた画像形成装置の制御プログラムであって、画像形成装置が何らかの作業が必要な状態にある場合に、状態の種類に応じて決定された方向に、入力を受け付ける音声の方向依存性である音声入力手段の指向性を切り替える切替ステップをコンピューターに実行させるためのものである。
本発明のさらに他の局面に従う画像形成装置の制御プログラムは、音声の入力を受け付ける音声入力手段と、音声入力手段にて入力を受け付けた音声を認識する音声認識手段と、音声認識手段による認識結果に基づいて処理を実行する制御手段とを備えた画像形成装置の制御プログラムであって、画像形成装置の状態に基づいて、入力を受け付ける音声の方向依存性である音声入力手段の指向性を切り替える切替ステップをコンピューターに実行させるためのものであり、切替ステップにおいて、少なくとも単一指向性および全指向性を含む選択肢の中から音声入力手段の指向性を切り替え、単一指向性は、特定の入力方向からの音声の入力を受け付ける指向性であり、全指向性は、入力方向よりも広い範囲の方向からの音声の入力を受け付ける指向性である。
【発明の効果】
【0023】
本発明によれば、音声の認識精度を向上することのできる画像形成装置および画像形成装置の制御プログラムを提供することができる。
【図面の簡単な説明】
【0024】
図1】本発明の一実施の形態における画像形成装置100の構成を示すブロック図である。
図2】本発明の一実施の形態における画像形成装置100の構成を模式的に示す正面図である。
図3】マイク29の指向性の切り替えの選択肢の一例を示す図である。
図4】本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートの第1の部分である。
図5】本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートの第2の部分である。
図6】本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートの第3の部分である。
図7】本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートの第4の部分である。
図8】本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートの第5の部分である。
図9】本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートの第6の部分である。
【発明を実施するための形態】
【0025】
以下、本発明の一実施の形態について、図面に基づいて説明する。
【0026】
本実施の形態では、画像形成装置がMFPである場合について説明する。画像形成装置は、MFPの他、プリンター、ファクシミリ装置、または複写機などであってもよい。
【0027】
図1は、本発明の一実施の形態における画像形成装置100の構成を示すブロック図である。
【0028】
図1を参照して、本実施の形態における画像形成装置100(画像形成装置の一例)は、CPU(Central Processing Unit)21(音声認識手段、制御手段、および切替手段の一例)と、バス22と、ROM(Read Only Memory)23と、RAM(Random Access Memory)24と、不揮発メモリ25と、ハードディスク装置26と、表示部27と、操作部28と、マイク29(音声入力手段の一例)と、音声入力部30(音声入力手段の一例)と、認証部31と、スキャナー部32と、画像処理部33と、プリンター部34と、ファクシミリ通信部35と、ネットワーク通信部36と、後処理部37と、給紙トレイセンサー38と、用紙センサー39と、扉センサー40と、給紙トレイ41(収容手段の一例)と、操作パネル42とを備えている。
【0029】
CPU21は、ROM23に格納されているプログラムに基づいて画像形成装置100全体の動作を制御する。特にCPU21は、音声認識処理用辞書を用いて、音声入力部30で生成された音声データを認識し、認識結果に基づいて各種処理を実行する。
【0030】
一例として、プリントの枚数または濃度や、用紙サイズなどのジョブの実行条件を設定する音声データを認識した場合に、CPU21は、その設定をジョブの実行条件に反映する。ジョブの実行を指示する音声データを認識した場合に、CPU21は、そのジョブを実行する。画像形成装置100の各種操作方法を問い合わせる音声データを認識した場合に、CPU21は、表示部27を通じて問合せに対して回答する。
【0031】
バス22は、CPU21と、ROM23、RAM24、不揮発メモリ25、ハードディスク装置26、表示部27、操作部28、マイク29、音声入力部30、認証部31、スキャナー部32、画像処理部33、プリンター部34、ファクシミリ通信部35、ネットワーク通信部36、後処理部37、給紙トレイセンサー38、用紙センサー39、扉センサー40、給紙トレイ41、および操作パネル42の各々とを接続している。
【0032】
ROM23は、たとえばフラッシュROMである。ROM23には、CPU21が実行する各種プログラムと、各種固定データとが格納されている。ROM23は、書換え不可能なものであってもよい。
【0033】
RAM24は、CPU21のメインメモリである。RAM23は、CPU21が各種プログラムを実行するときに必要なデータを一時的に記憶するためなどに用いられる。RAM24は、画像データを一時的に保存するための画像メモリなどとしても使用される。
【0034】
不揮発メモリ25は、電源がオフされても記憶が保持されるメモリである。不揮発メモリ25には、装置固有の情報、各種の設定情報、照合用の認証情報、表示部27に表示する各種画面の表示用データ、および音声認識処理用辞書などが保存されている。
【0035】
ハードディスク装置26には、各種の保存データが保存されている。またハードディスク装置26には、原稿のスキャン、コピーにおいて原稿を読み取って取得された画像データ、外部装置から受信して依頼されたプリントジョブに含まれている印刷データ(画像データ)、受信したファクシミリデータ、電子メール添付の画像データ、および外部記憶装置が接続されて入力された画像データなどが保存されている。なお、音声認識処理用辞書は、不揮発メモリ25の代わりにハードディスク装置26に保存されていてもよい。
【0036】
表示部27は、液晶ディスプレイなどで構成されている。表示部27は、操作画面、設定画面、確認画面、通知画面などの各種の画面を表示する。
【0037】
操作部28は、設定するジョブの動作モード(ジョブ種)を選択するモード選択キー、スタートキー、ストップキー、キャンセルキー、およびテンキーなどの各種のボタン類と、液晶ディスプレイの表面に設けられて押下された座標位置を検出するタッチパネルなどで構成されている。操作部28は、画像形成装置100に対して行われる各種の操作を受け付ける。表示部27および操作部28は、操作パネル42に設けられている。
【0038】
マイク29および音声入力部30は音声入力手段を構成する。マイク29は音声操作用であり、操作パネル42に設けられている。音声入力部30は、マイク29を通じて音声の入力を受け付け、音声データを生成する。
【0039】
認証部31は、使用者が入力した認証情報と、不揮発メモリ25に記憶されている照合用の認証情報とを比較するなどにより使用者の識別(特定)および認証を行う。
【0040】
スキャナー部32は、原稿を光学的に読み取って画像データを取得する。スキャナー部32は、たとえば、原稿に光を照射する光源と、その反射光を受けて原稿を幅方向に1ライン分読み取るラインイメージセンサと、ライン単位の読取位置を原稿の長さ方向に順次移動させる移動手段と、原稿からの反射光をラインイメージセンサに導いて結像させるレンズやミラーなどからなる光学経路と、ラインイメージセンサの出力するアナログ画像信号をデジタルの画像データに変換する変換部などを含んでいる。
【0041】
画像処理部33は、外部装置から受信した印刷データ(ベクタ形式の印刷データ)に対してラスタライズ処理を施したり、画像データに対して、画像補正、回転、拡大/縮小、または圧縮/伸張など各種の画像処理を施したりする。
【0042】
プリンター部34は、画像データに基づく画像を電子写真プロセスによって用紙上に形成して出力する。プリンター部34は、いわゆるレーザープリンターであり、たとえば、用紙の搬送装置と、感光体ドラムと、帯電装置と、入力される画像データに応じて点灯制御されるLD(Laser Diode)と、LDから射出されたレーザ光を感光体ドラム上で走査させる走査ユニットと、現像装置と、転写分離装置と、クリーニング装置と、定着装置とを含んでいる。なお、プリンター部34は、LED(Light Emitting Diode)で感光体ドラムを照射するLEDプリンターなど、他の方式のプリンターであってもよい。
【0043】
ファクシミリ通信部35は、ファクシミリ機能を有する外部装置との間で、公衆回線を通じて画像データを送受信する。
【0044】
ネットワーク通信部36は、LAN(Local Area Network)などのネットワークを通じて外部装置と通信を行う。
【0045】
後処理部37は、画像形成後の用紙に対して、折り処理、パンチ処理、ステープル処理、綴じ処理、または裁断処理などの後処理を行う。
【0046】
給紙トレイ41は、画像形成のための用紙を収容する。給紙トレイ41は単数であっても複数であってもよい。
【0047】
図2は、本発明の一実施の形態における画像形成装置100の構成を模式的に示す正面図である。なお図2では、画像形成装置100の幅方向をx軸、前方をy軸方向、高さ方向をz軸としている。x軸、y軸、およびz軸は互いに直交している。x軸およびy軸はいずれも水平面内に存在している。
【0048】
図1および図2を参照して、画像形成装置100は、筐体100a(筐体の一例)と、扉61~64(扉の一例)とをさらに備えている。筐体100aは画像形成装置100を構成する各部材を収容している。筐体100a内の最上部にはスキャナー部32が設けられている。スキャナー部32は、読取位置に原稿を搬送するADF(Auto Document Feeder)32aを含んでいる。筐体100a内の中央部であって、スキャナー部32の下部には、プリンター部34が設けられている。給紙トレイ41は、ここでは複数であり、プリンター部34の下部であって、筐体100a内の下部に設けられている。複数の給紙トレイ41の各々は筐体100a内から前方(y軸の正の方向)に引き出し可能である。給紙トレイ41が前方に引き出された場合に、給紙トレイ41は内部が露出した開状態となる。筐体100aの上部前面には操作パネル42が設けられている。使用者は、画像形成装置100の前面付近に立って、原稿のセットなどジョブを準備する動作や、操作パネル42の操作などを行う。
【0049】
扉61~64の各々は筐体100aに設けられている。扉61~64の各々は、開閉可能であり、開いた状態で筐体100a内を外部に露出する。扉61および62は、プリンター部34で発生したジャムを解消する際に開かれる扉である。扉61は筐体100aの前面に設けられており、扉62は筐体100aの左側面に設けられている。扉63は、後処理部37で発生したジャムを解消する際に開かれる扉である。扉63は筐体100aの前面に設けられている。扉64は、ADF30aで発生したジャムを解消する際に開かれる扉である。扉64は筐体100aの上面に設けられている。扉は単数であっても複数であってもよい。
【0050】
給紙トレイセンサー38は、複数の給紙トレイ41の各々の開閉状態を検知する。
【0051】
用紙センサー39は、プリンター部34で発生したジャムを検知する。
【0052】
扉センサー40は、扉61~64の各々の開閉状態を検知する。
【0053】
なお、画像形成装置100は動作モードとして、通常モードとサービスモードとを有している。サービスモードとは、作業者(サービスエンジニアなど)が画像形成装置100に対する作業を行うための作業モードである。画像形成装置100の動作モードは、操作パネル42を通じて所定の操作を受け付けた場合などに、通常モードとサービスモードとの間で遷移する。
【0054】
CPU21は、画像形成装置100の状態に基づいて、音声入力手段の(具体的にはマイク29の)指向性を切り替える。マイク29の指向性とは、マイク29が入力を受け付ける音声の方向依存性である。
【0055】
図3は、マイク29の指向性の切り替えの選択肢の一例を示す図である。なお図3では、マイク29の位置を原点としており、音声の入力を受け付ける領域にハッチングが付されている。
【0056】
図2および図3を参照して、マイク29の指向性は、CPU21の制御により、単一指向性および全指向性を含む選択肢の中から切替可能である。単一指向性とは、特定の入力方向からの音声の入力を受け付ける指向性である。全指向性とは、上記の入力方向(単一指向性を有するマイク29が音声の入力を受け付ける方向)よりも広い範囲の方向からの音声の入力を受け付ける指向性である。さらに、マイク29が単一指向性を有する場合、マイク29の指向性は、互いに異なる複数の入力方向を有する複数の単一指向性を含む選択肢の中から切替可能であってもよい。
【0057】
図3(a)は、画像形成装置100の前方を入力方向とする単一指向性を示している。開状態の給紙トレイ41および扉61は、マイク29から見て前方(具体的には、マイク29から見てy軸の正の方向)に存在する。このため、マイク29の指向性を図3(a)の状態に切り替えた場合には、音声入力部30は、画像形成装置100の使用者や、給紙トレイ41または扉61付近で作業を行う作業者からの音声の入力を感度良く受け付けることができる。
【0058】
図3(b)は、画像形成装置100の左側部を入力方向とする単一指向性を示している。扉62は、開状態となった場合に筐体100aの左側部に存在し、マイク29から見て左方(x軸の正の方向)に存在する。このため、マイク29の指向性を図3(b)の状態に切り替えた場合には、音声入力部30は、扉62付近で作業を行う作業者からの音声の入力を感度良く受け付けることができる。
【0059】
図3(c)は、画像形成装置100の右側部を入力方向とする単一指向性を示している。扉63は、マイク29から見て右方(x軸の負の方向)に存在する。このため、マイク29の指向性を図3(c)の状態に切り替えた場合には、音声入力部30は、扉63付近で作業を行う作業者からの音声の入力を感度良く受け付けることができる。
【0060】
図3(d)は、画像形成装置100の右後方を入力方向とする単一指向性を示している。扉64は、マイク29から見て右後方(x軸の負の方向とy軸の負の方向との間の方向)に存在する。このため、マイク29の指向性を図3(d)の状態に切り替えた場合には、音声入力部30は、扉64付近で作業を行う作業者からの音声の入力を感度良く受け付けることができる。
【0061】
図3(e)は、全指向性を示している。音声を発する者の位置が予測できない場合などに、マイク29の指向性を図3(e)の状態に切り替えることにより、音声入力部30は、広い範囲からの音声の入力を感度良く受け付けることができる。
【0062】
なお、図3では、マイク29がx軸およびy軸方向にのみ指向性を有している場合について示したが、マイク29はz軸方向にも指向性を有していてもよい。
【0063】
続いて、本実施の形態におけるマイク29の指向性の切替動作について説明する。
【0064】
図4図9は、本発明の一実施の形態におけるマイク29の指向性の切替動作を示すフローチャートである。
【0065】
図4を参照して、任意のタイミングで、CPU21は、画像形成装置100が特定の状態であるか否かを判別する(S100)。特定の状態は、画像形成装置100に対する何らかの作業が必要な状態であることが好ましい。特定の状態は、ここではジャムが発生した状態と、扉61~64のうちいずれかの開状態と、複数の給紙トレイ41のうちいずれかの開状態(引き出された状態)と、画像形成装置100の動作モードがサービスモードに遷移した状態と、画像形成装置100がトラブルの状態とを含んでいる。
【0066】
ステップS100において、画像形成装置100が特定の状態でないと判別した場合(S100でNO)、画像形成装置100は正常に動作可能な状態にある。この場合、CPU21は、画像形成装置100の前方を入力方向とする単一指向性に、マイク29の指向性を切り替え(S101)、処理を終了する。
【0067】
画像形成装置100を操作する使用者は、画像形成装置100においてコピージョブ、スキャンジョブ、またはプリントジョブなどの各種ジョブを実行する際、通常、画像形成装置100の前面(y軸の正の側の面)に立ってジョブの実行に関する操作を行うための音声を発する。この場合、使用者が発生する音声には、プリントの枚数または濃度や、用紙サイズなどのジョブの実行条件を設定する音声と、ジョブの実行を指示する音声などが含まれている。ステップS101の処理のように、画像形成装置100が正常に動作可能な状態である場合に、画像形成装置100の前方をマイク29の入力方向とすることにより、ジョブの実行に関する操作を行う使用者の音声を効率的にマイク29で拾うことができる。
【0068】
ステップS100において、画像形成装置100が特定の状態であると判別した場合(S100でNO)、CPU21は、用紙センサー39にてジャムの発生を検知したか否かを判別する(S200)。
【0069】
ステップS200において、ジャムの発生を検知したと判別した場合(S200でYES)、CPU21は、図5のステップS201の処理へ進む。
【0070】
ステップS200において、ジャムの発生を検知しないと判別した場合(S200でNO)、CPU21は、扉センサー40にて扉61~64のうちいずれかの開状態を検知したか否かを判別する(S300)。
【0071】
ステップS300において、扉61~64のうちいずれかの開状態を検知したと判別した場合(S300でYES)、CPU21は、図6のステップS301の処理へ進む。
【0072】
ステップS300において、扉61~64のいずれの開状態も検知しないと判別した場合(S300でNO)、CPU21は、給紙トレイセンサー38にて複数の給紙トレイ41のうちいずれかの開状態を検知したか否かを判別する(S400)。
【0073】
ステップS400において、複数の給紙トレイ41のうちいずれかの開状態を検知したと判別した場合(S400でYES)、CPU21は、図7のステップS401の処理へ進む。
【0074】
ステップS400において、複数の給紙トレイ41のうちいずれの開状態も検知しないと判別した場合(S400でNO)、CPU21は、画像形成装置100の動作モードがサービスモードに遷移したことを検知したか否かを判別する(S500)。
【0075】
ステップS500において、画像形成装置100の動作モードがサービスモードに遷移したことを検知したと判別した場合(S500でYES)、CPU21は、図8のステップS501の処理へ進む。
【0076】
ステップS500において、画像形成装置100の動作モードがサービスモードに遷移したことを検知しないと判別した場合(S500でNO)、CPU21は、画像形成装置100にトラブルが発生したと判断し(S600)、図9のステップS601の処理へ進む。
【0077】
図5を参照して、ジャムの発生を検知したと判別した場合、CPU21は、マイク29の指向性を全指向性に切り替える(S201)。
【0078】
ジャムは、画像形成装置100の様々な位置において発生する可能性がある。ジャムの発生箇所に応じて、ジャムを解消するための作業を行う作業者の位置も変わる。このため、ステップS201の処理のように、ジャムが発生した場合に、マイク29の指向性を全指向性に切り替えることにより、広い範囲から発せられた作業者の音声(主に、ジャムの解消方法を問い合わせる音声)を効率的に拾うことができる。
【0079】
次にCPU21は、扉61~64のうちいずれかの開状態を検知したか否かを判別する(S202)。扉61~64のうちいずれかの開状態を検知したと判別するまで、CPU21はステップS202の処理を繰り返す。
【0080】
ステップS202において、扉61~64のうちいずれかの開状態を検知したと判別した場合(S202でYES)、CPU21は、開いた扉の方向を入力方向とする単一指向性にマイク29の指向性を切り替える(S203)。
【0081】
ジャム処理の際に扉が開状態となった場合には、作業者はその扉を通じてジャムを解消する作業を行う可能性が高く、ジャムを解消するためのより具体的な手順(レバーの情報など)を問い合わせる音声が発せられる可能性が高い。このため、ステップS203の処理のように、扉が開かれた場合に、その扉の方向を入力方向とする単一指向性にマイク29の指向性を切り替えることにより、作業者の音声を効率的に拾うことができる。
【0082】
続いてCPU21は、扉が開状態のまま無操作時間(画像形成装置100に対する音声または手による操作が行われない時間)が所定時間を経過したか否かを判別する(S204)。
【0083】
ステップS204において、扉が開状態のまま無操作時間が所定時間を経過したと判別した場合(S204でYES)、CPU21は、マイク29の指向性を全指向性に切り替える(S206)。
【0084】
ステップS204において、扉が開状態のまま無操作時間が所定時間を経過しないと判別した場合(S204でNO)、CPU21は、扉センサー40にて開状態であった扉が閉じられたことを検知したか否かを判別する(S205)。
【0085】
ステップS205において、開状態であった扉が閉じられたことを検知しないと判別した場合(S205でNO)、CPU21はステップS204の処理へ進む。
【0086】
ステップS205において、開状態であった扉が閉じられたことを検知したと判別した場合(S205でYES)、CPU21はステップS206の処理へ進む。
【0087】
扉が開状態のまま無操作時間が所定時間を経過した場合には、作業者は別の箇所のジャムを解消する作業を行う可能性がある。開状態であった扉が閉じられた場合にも、作業者は次に別の個所のジャムを解消する作業を行う可能性がある。このため、ステップS206の処理のように、扉が開状態のまま無操作時間が所定時間を経過した場合、または開状態であった扉が閉じられた場合に、全指向性にマイク29の指向性を切り替えることにより、広い範囲から発せられた作業者の音声を効率的に拾うことができる。
【0088】
ステップS206の処理に続いて、CPU21は、用紙センサー39にてジャムの解消を検知したか否かを判別する(S207)。ジャムの解消を検知したと判別するまで、CPU21はステップS207の処理を繰り返す。
【0089】
ステップS207において、ジャムの解消を検知したと判別した場合(S207でYES)、CPU21は前方を入力方向とする単一指向性にマイク29の指向性を切り替え(S208)、処理を終了する。
【0090】
図6を参照して、扉61~64のうちいずれかの開状態を検知したと判別した場合、CPU21は、開状態の扉の方向を入力方向とする単一指向性にマイク29の指向性を切り替える(S301)。
【0091】
ジャムが発生していない状態で扉が開かれた場合、作業者は、トナー補給やステープル針の補給などのジャムの解消以外の意図を有しているものと推測され、開かれた扉に関連する操作を行うものと推測される。このため、ステップS301の処理のように、扉が開かれた場合に、その扉の方向を入力方向とする単一指向性にマイク29の指向性を切り替えることにより、作業者の音声を効率的に拾うことができる。
【0092】
次にCPU21は、扉が開状態のまま無操作時間(第1の時間の一例)が所定時間を経過したか否かを判別する(S302)。
【0093】
ステップS302において、扉が開状態のまま無操作時間が所定時間を経過したと判別した場合(S302でYES)、CPU21は、マイク29の指向性を全指向性に切り替える(S304)。
【0094】
扉が開状態のまま無操作時間が所定時間を経過した場合には、作業者は、その扉を通じてトナーボトルなどの消耗品を交換する可能性がある。この場合、作業者は、画像形成装置100の周辺に準備されている予備の消耗品のうちどの消耗品が必要であるか(たとえば、何色のトナーボトルが必要であるか)を問い合わせる音声を、画像形成装置100の周辺から発する可能性がある。このため、ステップS304の処理のように、扉が開状態のまま無操作時間が所定時間を経過した場合に、全指向性にマイク29の指向性を切り替えることにより、画像形成装置100の周辺から発せられた作業者の音声を効率的に拾うことができる。
【0095】
ステップS302において、扉が開状態のまま無操作時間が所定時間を経過しないと判別した場合(S302でNO)、CPU21は、扉センサー40にて開状態であった扉が閉じられたことを検知したか否かを判別する(S303)。
【0096】
ステップS303において、開状態であった扉が閉じられたことを検知しないと判別した場合(S303でNO)、CPU21はステップS302の処理へ進む。
【0097】
ステップS303において、開状態であった扉が閉じられたことを検知したと判別した場合(S303でYES)、CPU21はステップS306の処理へ進む。
【0098】
ステップS304の処理に続いて、CPU21は、扉センサー40にて開状態であった扉が閉じられたことを検知したか否かを判別する(S305)。開状態であった扉が閉じられたことを検知したと判別するまで、CPU21はステップS305の処理を繰り返す。
【0099】
ステップS305において、開状態であった扉が閉じられたことを検知したと判別した場合(S305でYES)、CPU21は前方を入力方向とする単一指向性にマイク29の指向性を切り替え(S306)、処理を終了する。
【0100】
図7を参照して、複数の給紙トレイ41のうちいずれかの開状態を検知したと判別した場合、CPU21は、開状態の給紙トレイ41の方向を入力方向とする単一指向性にマイク29の指向性を切り替える(S401)。
【0101】
給紙トレイ41が開かれた場合、作業者は、どのサイズの用紙をその給紙トレイ41に補給すればよいのかを問い合わせる音声を発する可能性が高い。このため、ステップS401の処理のように、給紙トレイ41が開かれた場合にその給紙トレイ41の方向を入力方向とする単一指向性にマイク29の指向性を切り替えることにより、開かれた給紙トレイ41付近から発せられた作業者の音声を効率的に拾うことができる。
【0102】
次にCPU21は、給紙トレイ41が開状態のまま無操作時間が所定時間(第2の時間の一例)を経過したか否かを判別する(S402)。
【0103】
ステップS402において、給紙トレイ41が開状態のまま無操作時間が所定時間を経過したと判別した場合(S402でYES)、CPU21は、マイク29の指向性を全指向性に切り替える(S404)。
【0104】
給紙トレイ41が開状態のまま無操作時間が所定時間を経過した場合、作業者は、画像形成装置100の周辺に準備されている予備の用紙のうちどのサイズの用紙が必要であるかを問い合わせる音声を、画像形成装置100の周辺から発する可能性がある。このため、ステップS404の処理のように、給紙トレイ41が開状態のまま無操作時間が所定時間を経過した場合に、全指向性にマイク29の指向性を切り替えることにより、画像形成装置100の周辺から発せられた作業者の音声を効率的に拾うことができる。
【0105】
ステップS402において、扉が開状態のまま無操作時間が所定時間を経過しないと判別した場合(S402でNO)、CPU21は、給紙トレイセンサー38にて開状態であった給紙トレイ41が閉じられたことを検知したか否かを判別する(S403)。
【0106】
ステップS403において、開状態であった給紙トレイ41が閉じられたことを検知しないと判別した場合(S403でNO)、CPU21はステップS402の処理へ進む。
【0107】
ステップS403において、開状態であった給紙トレイ41が閉じられたことを検知したと判別した場合(S403でYES)、CPU21はステップS406の処理へ進む。
【0108】
ステップS404の処理に続いて、CPU21は、給紙トレイセンサー38にて開状態であった給紙トレイ41が閉じられたことを検知したか否かを判別する(S405)。開状態であった給紙トレイ41が閉じられたことを検知したと判別するまで、CPU21はステップS405の処理を繰り返す。
【0109】
ステップS405において、開状態であった給紙トレイ41が閉じられたことを検知したと判別した場合(S405でYES)、CPU21は前方を入力方向とする単一指向性にマイク29の指向性を切り替え(S406)、処理を終了する。
【0110】
図8を参照して、画像形成装置100の動作モードがサービスモードに遷移したことを検知したと判別した場合、CPU21は、マイク29の指向性を全指向性に切り替える(S501)。
【0111】
サービスモードでは、サービスエンジニアがテストプリントを出力しながら、画像形成装置100の各種モーターの動きを確認したり、画像形成装置100の各種センサーを触れながら、触れたセンサーのオンオフ状態を確認したり、様々な作業を行うことが推測される。このため、サービスエンジニアが音声操作を行う位置を予測することはできない。したがって、ステップS501の処理のように、画像形成装置100の動作モードがサービスモードに遷移した場合に、全指向性にマイク29の指向性を切り替えることにより、画像形成装置100の周辺から発せられたサービスエンジニアの音声を効率的に拾うことができる。
【0112】
続いてCPU21は、サービスモードの解除(つまり、通常モードへの遷移)を検知したか否かを判別する(S502)。サービスモードの解除を検知したと判別するまで、CPU21はステップS502の処理を繰り返す。
【0113】
ステップS502において、サービスモードの解除を検知したと判別した場合(S502でYES)、CPU21は前方を入力方向とする単一指向性にマイク29の指向性を切り替え(S503)、処理を終了する。
【0114】
図9を参照して、画像形成装置100にトラブルが発生したと判断した場合、CPU21は、マイク29の指向性を全指向性に切り替える(S601)。
【0115】
ここで、トラブルとは、画像形成を行うことができない状態であり、サービスエンジニアによる作業が必要な状態である。具体的には、ファンやモーターなどの部品の故障などである。画像形成装置100にトラブルが発生した場合、サービスエンジニアが呼ばれることが推測される。サービスエンジニアはトラブルの調査および解消のために様々な作業を行うため、サービスエンジニアが音声操作を行う位置を予測することはできない。このため、ステップS601の処理のように、画像形成装置100の動作モードがサービスモードに遷移した場合に、全指向性にマイク29の指向性を切り替えることにより、画像形成装置100の周辺から発せられたサービスエンジニアの音声を効率的に拾うことができる。
【0116】
続いてCPU21は、トラブルが解消したことを検知したか否かを判別する(S602)。トラブルが解消したことは、サービスエンジニアによって操作パネルを通じて行われた所定の操作によって検知されてもよいし、各種センサーにて検知されてもよい。トラブルが解消したことを検知したと判別するまで、CPU21はステップS602の処理を繰り返す。
【0117】
ステップS602において、トラブルが解消したことを検知したと判別した場合(S602でYES)、CPU21は前方を入力方向とする単一指向性にマイク29の指向性を切り替え(S603)、処理を終了する。
【0118】
[実施の形態の効果]
【0119】
本実施の形態によれば、画像形成装置100の状態に基づいてマイク29の指向性が切り替えられるので、使用者または作業者の使用状況に基づいてより適切な指向性を採用することができる。その結果、使用者または作業者から発せられた音声を効率良く拾うことができ、音声の認識精度を向上することができる。
【0120】
[その他]
【0121】
CPU21は、ジャムの発生の有無、扉の開閉状態、収容手段の開閉状態、画像形成装置の動作モード、およびトラブルの有無のうち少なくともいずれか1つに基づいて、音声入力手段の指向性を切り替えてもよい。
【0122】
上述の実施の形態における処理は、ソフトウェアにより行っても、ハードウェア回路を用いて行ってもよい。また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD-ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザーに提供することにしてもよい。プログラムは、CPUなどのコンピューターにより実行される。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。
【0123】
上述の実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0124】
21 CPU(Central Processing Unit)(音声認識手段、制御手段、および切替手段の一例)
22 バス
23 ROM(Read Only Memory)
24 RAM(Random Access Memory)
25 不揮発メモリ
26 ハードディスク装置
27 表示部
28 操作部
29 マイク(音声入力手段の一例)
30 音声入力部(音声入力手段の一例)
31 認証部
32 スキャナー部
32a ADF(Auto Document Feeder)
33 画像処理部
34 プリンター部
35 ファクシミリ通信部
36 ネットワーク通信部
37 後処理部
38 給紙トレイセンサー
39 用紙センサー
40 扉センサー
41 給紙トレイ(収容手段の一例)
42 操作パネル
61~64 扉(扉の一例)
100 画像形成装置(画像形成装置の一例)
100a 筐体(筐体の一例)
図1
図2
図3
図4
図5
図6
図7
図8
図9