IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コニカミノルタ株式会社の特許一覧

特許7192220画像処理装置、情報処理装置及びプログラム
<>
  • 特許-画像処理装置、情報処理装置及びプログラム 図1
  • 特許-画像処理装置、情報処理装置及びプログラム 図2
  • 特許-画像処理装置、情報処理装置及びプログラム 図3
  • 特許-画像処理装置、情報処理装置及びプログラム 図4
  • 特許-画像処理装置、情報処理装置及びプログラム 図5
  • 特許-画像処理装置、情報処理装置及びプログラム 図6
  • 特許-画像処理装置、情報処理装置及びプログラム 図7
  • 特許-画像処理装置、情報処理装置及びプログラム 図8
  • 特許-画像処理装置、情報処理装置及びプログラム 図9
  • 特許-画像処理装置、情報処理装置及びプログラム 図10
  • 特許-画像処理装置、情報処理装置及びプログラム 図11
  • 特許-画像処理装置、情報処理装置及びプログラム 図12
  • 特許-画像処理装置、情報処理装置及びプログラム 図13
  • 特許-画像処理装置、情報処理装置及びプログラム 図14
  • 特許-画像処理装置、情報処理装置及びプログラム 図15
  • 特許-画像処理装置、情報処理装置及びプログラム 図16
  • 特許-画像処理装置、情報処理装置及びプログラム 図17
  • 特許-画像処理装置、情報処理装置及びプログラム 図18
  • 特許-画像処理装置、情報処理装置及びプログラム 図19
  • 特許-画像処理装置、情報処理装置及びプログラム 図20
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-12
(45)【発行日】2022-12-20
(54)【発明の名称】画像処理装置、情報処理装置及びプログラム
(51)【国際特許分類】
   G06F 3/0487 20130101AFI20221213BHJP
   H04N 1/00 20060101ALI20221213BHJP
   G03G 21/00 20060101ALI20221213BHJP
   G06F 3/16 20060101ALI20221213BHJP
【FI】
G06F3/0487
H04N1/00 350
H04N1/00 127A
G03G21/00 380
G03G21/00 386
G06F3/16 630
G06F3/16 620
【請求項の数】 20
(21)【出願番号】P 2018038691
(22)【出願日】2018-03-05
(65)【公開番号】P2019153146
(43)【公開日】2019-09-12
【審査請求日】2020-12-17
(73)【特許権者】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】100117651
【弁理士】
【氏名又は名称】高垣 泰志
(72)【発明者】
【氏名】三浦 恵
【審査官】木村 慎太郎
(56)【参考文献】
【文献】特開2007-102012(JP,A)
【文献】特開2017-062531(JP,A)
【文献】特開2016-045762(JP,A)
【文献】国際公開第2014/188512(WO,A1)
【文献】特開2005-094256(JP,A)
【文献】特開2016-218854(JP,A)
【文献】特開2015-225372(JP,A)
【文献】特開2007-010754(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/0487
H04N 1/00
G03G 21/00
G06F 3/16
(57)【特許請求の範囲】
【請求項1】
ユーザーが操作可能な操作画面を表示する表示手段と、
前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、
ユーザーによる音声入力を受け付ける音声入力手段と、
前記音声入力手段によって受け付けられる音声入力を解析し、前記複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析手段と、
前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出手段と、
前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した第1操作画面を生成する画面生成手段と、
前記画面生成手段によって生成される第1操作画面を前記表示手段に表示させる表示制御手段と、
前記表示手段に表示される操作画面に対するユーザーの操作を検知する操作検知手段と、
を備え
前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記第1画像コンテンツと変更可能な第2画像コンテンツを抽出し、
前記画面生成手段は、前記操作検知手段によって前記第1画像コンテンツに対する操作が検知された場合、前記所定の表示領域に前記第2画像コンテンツを表示することを特徴とする画像処理装置。
【請求項2】
ユーザーが操作可能な操作画面を表示する表示手段と、
前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、
ユーザーによる音声入力を受け付ける音声入力手段と、
前記音声入力手段によって受け付けられる音声入力を解析し、前記複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析手段と、
前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出手段と、
前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した第1操作画面を生成する画面生成手段と、
前記画面生成手段によって生成される第1操作画面を前記表示手段に表示させる表示制御手段と、
を備え
前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に関連する第3画像コンテンツを更に抽出し、
前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツ及び前記第3画像コンテンツを前記所定の表示領域に配置した前記第1操作画面を生成することを特徴とする画像処理装置。
【請求項3】
前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第3画像コンテンツが所定数以上である場合、前記第3画像コンテンツを配置しない前記第1操作画面を生成すると共に、前記第3画像コンテンツを配置した第2操作画面を生成し、
前記表示制御手段は、前記第2操作画面を前記表示手段に表示させることを特徴とする請求項に記載の画像処理装置。
【請求項4】
前記画像コンテンツ抽出手段によって抽出される前記第3画像コンテンツに関する通知を行う通知手段を更に備えることを特徴とする請求項又はに記載の画像処理装置。
【請求項5】
前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、ユーザーが選択したジョブに応じた第4画像コンテンツを更に抽出し、
前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第4画像コンテンツを前記所定の表示領域とは異なる表示領域に配置した前記第1操作画面を生成することを特徴とする請求項1乃至のいずれかに記載の画像処理装置。
【請求項6】
前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出されなかった画像コンテンツが配置された第3操作画面を生成し、
前記表示制御手段は、前記第3操作画面を表示させることを特徴とする請求項1乃至のいずれかに記載の画像処理装置。
【請求項7】
ユーザーが操作可能な操作画面を表示する表示手段と、
前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、
ユーザーによる音声入力を受け付ける音声入力手段と、
前記音声入力手段によって受け付けられる音声入力を解析し、前記複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析手段と、
前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出手段と、
前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した第1操作画面を生成する画面生成手段と、
前記画面生成手段によって生成される第1操作画面を前記表示手段に表示させる表示制御手段と、
を備え
前記音声入力手段は、ユーザーによる複数の音声入力を順に受け付け、
前記音声解析手段は、前記音声入力手段によって順次受け付けられる複数の音声入力を解析し、前記複数の操作項目のうちから該複数の音声入力のそれぞれに対応する複数の操作項目を順次特定し、
前記画像コンテンツ抽出手段は、前記音声解析手段によって順次特定される複数の操作項目のそれぞれに対応する複数の前記第1画像コンテンツを順次抽出し、
前記画面生成手段は、前記画像コンテンツ抽出手段によって順次抽出された複数の前記第1画像コンテンツを、ユーザーの利用頻度が高い順に並び替えて前記所定の表示領域に配置した前記第1操作画面を生成することを特徴とする画像処理装置。
【請求項8】
前記音声解析手段によって特定される複数の操作項目のうちに両立することができない操作項目の組み合わせが存在するか否かを判定する組合せ判定手段を更に備え、
前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせが存在することを通知することを特徴とする請求項に記載の画像処理装置。
【請求項9】
前記画面生成手段による制御に基づいて音声出力を行う音声出力手段を更に備え、
前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせが存在することを通知する音声出力を前記音声出力手段に実行させる制御を行うことを特徴とする請求項に記載の画像処理装置。
【請求項10】
前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせとなる複数の操作項目のうち、いずれの操作項目を有効にするかをユーザーに選択させ、ユーザーの選択を前記第1操作画面に反映させることを特徴とする請求項又はに記載の画像処理装置。
【請求項11】
前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせとなる複数の操作項目のそれぞれに対応する複数の画像コンテンツを前記所定の表示領域において互いに隣接する位置に配置した操作画面を生成することを特徴とする請求項乃至10のいずれかに記載の画像処理装置。
【請求項12】
前記音声解析手段によって特定される複数の操作項目のうちに両立することができない操作項目の組み合わせが存在するか否かを判定する組合せ判定手段と、
前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせとなる複数の操作項目のうちいずれか1つの操作項目を有効にして確認プリントを行う画像形成手段と、
を備えることを特徴とする請求項に記載の画像処理装置。
【請求項13】
前記画面生成手段は、前記音声解析手段によって特定される操作項目を有効にするか無効にするかをユーザーに選択させる画像を前記所定の表示領域に配置した前記第1操作画面を生成することを特徴とする請求項1乃至12のいずれかに記載の画像処理装置。
【請求項14】
前記画面生成手段は、前記音声解析手段によって特定される操作項目が、前記画像処理装置において実装されていない機能に関する操作項目である場合に、前記音声解析手段によって特定される操作項目が前記画像処理装置において実装されていない機能に関する操作項目であることを通知する前記第1操作画面を生成することを特徴とする請求項1乃至13のいずれかに記載の画像処理装置。
【請求項15】
ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声入力を受け付ける音声入力手段と、を備える画像処理装置と通信を行う情報処理装置であって、
前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、
前記音声入力手段が入力した音声データを、前記画像処理装置から受信する音声データ受信手段と、
前記音声データ受信手段が受信する音声データを解析し、前記複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析手段と、
前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出手段と、
前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成手段と、
前記画面生成手段が生成する操作画面を前記画像処理装置に送信する操作画面送信手段と、
前記表示手段に表示される操作画面に対するユーザーの操作を検知する操作検知手段と、
を備え
前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記第1画像コンテンツと変更可能な第2画像コンテンツを抽出し、
前記画面生成手段は、前記操作検知手段によって前記第1画像コンテンツに対する操作が検知された場合、前記所定の表示領域に前記第2画像コンテンツを表示することを特徴とする情報処理装置。
【請求項16】
ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声入力を受け付ける音声入力手段と、を備える画像処理装置と通信を行う情報処理装置であって、
前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、
前記音声入力手段が入力した音声データを、前記画像処理装置から受信する音声データ受信手段と、
前記音声データ受信手段が受信する音声データを解析し、前記複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析手段と、
前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出手段と、
前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成手段と、
前記画面生成手段が生成する操作画面を前記画像処理装置に送信する操作画面送信手段と、
を備え
前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に関連する第3画像コンテンツを更に抽出し、
前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツ及び前記第3画像コンテンツを前記所定の表示領域に配置した前記操作画面を生成することを特徴とする情報処理装置。
【請求項17】
ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声入力を受け付ける音声入力手段と、を備える画像処理装置と通信を行う情報処理装置であって、
前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、
前記音声入力手段が入力した音声データを、前記画像処理装置から受信する音声データ受信手段と、
前記音声データ受信手段が受信する音声データを解析し、前記複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析手段と、
前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応した画像コンテンツを抽出する画像コンテンツ抽出手段と、
前記画像コンテンツ抽出手段によって抽出される前記画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成手段と、
前記画面生成手段が生成する操作画面を前記画像処理装置に送信する操作画面送信手段と、
を備え
前記音声入力手段は、ユーザーによる複数の音声入力を順に受け付け、
前記音声解析手段は、前記音声入力手段によって順次受け付けられる複数の音声入力を解析し、前記複数の操作項目のうちから該複数の音声入力のそれぞれに対応する複数の操作項目を順次特定し、
前記画像コンテンツ抽出手段は、前記音声解析手段によって順次特定される複数の操作項目のそれぞれに対応する複数の前記画像コンテンツを順次抽出し、
前記画面生成手段は、前記画像コンテンツ抽出手段によって順次抽出された複数の前記画像コンテンツを、ユーザーの利用頻度が高い順に並び替えて前記所定の表示領域に配置した前記操作画面を生成することを特徴とする情報処理装置。
【請求項18】
コンピュータに、
音声データを入力する音声データ入力ステップと、
前記音声データ入力ステップによって受け付けられる音声データを解析し、操作画面において表示可能な複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析ステップと、
所定の記憶手段に記憶されている複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出ステップと、
前記画像コンテンツ抽出ステップによって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成ステップと、
前記画面生成ステップによって生成される前記操作画面のデータを出力する操作画面出力ステップと、
ユーザーによる前記操作画面に対する操作を検知する操作検知ステップと、
を実行させ
前記画像コンテンツ抽出ステップは、前記複数の画像コンテンツのうちから、前記第1画像コンテンツと変更可能な第2画像コンテンツを抽出し、
前記画面生成ステップは、前記操作検知ステップによって前記第1画像コンテンツに対する操作が検知された場合、前記所定の表示領域に前記第2画像コンテンツを表示することを特徴とするプログラム。
【請求項19】
コンピュータに、
音声データを入力する音声データ入力ステップと、
前記音声データ入力ステップによって受け付けられる音声データを解析し、操作画面において表示可能な複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析ステップと、
所定の記憶手段に記憶されている複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出ステップと、
前記画像コンテンツ抽出ステップによって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成ステップと、
前記画面生成ステップによって生成される前記操作画面のデータを出力する操作画面出力ステップと、
を実行させ
前記画像コンテンツ抽出ステップは、前記複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に関連する第3画像コンテンツを更に抽出し、
前記画面生成ステップは、前記画像コンテンツ抽出ステップによって抽出される前記第1画像コンテンツ及び前記第3画像コンテンツを前記所定の表示領域に配置した前記操作画面を生成することを特徴とするプログラム。
【請求項20】
コンピュータに、
音声データを入力する音声データ入力ステップと、
前記音声データ入力ステップによって受け付けられる音声データを解析し、操作画面において表示可能な複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析ステップと、
所定の記憶手段に記憶されている複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に対応した画像コンテンツを抽出する画像コンテンツ抽出ステップと、
前記画像コンテンツ抽出ステップによって抽出される前記画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成ステップと、
前記画面生成ステップによって生成される前記操作画面のデータを出力する操作画面出力ステップと、
を実行させ
前記音声データ入力ステップは、ユーザーによる複数の音声入力を順に受け付け、
前記音声解析ステップは、前記音声入力ステップによって順次受け付けられる複数の音声入力を解析し、前記複数の操作項目のうちから該複数の音声入力のそれぞれに対応する複数の操作項目を順次特定し、
前記画像コンテンツ抽出ステップは、前記音声解析ステップによって順次特定される複数の操作項目のそれぞれに対応する複数の前記第1画像コンテンツを順次抽出し、
前記画面生成ステップは、前記画像コンテンツ抽出ステップによって順次抽出された複数の前記第1画像コンテンツを、ユーザーの利用頻度が高い順に並び替えて前記所定の表示領域に配置した前記操作画面を生成することを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、情報処理装置及びプログラムに関し、特に音声操作時に表示部において表示される操作画面を生成するための技術に関する。
【背景技術】
【0002】
従来、MFP(Multifunction Peripheral)などと呼ばれる画像処理装置は、スキャン機能、プリント機能、コピー機能、FAX機能などの複数の機能を備えており、ユーザーによって指定されたジョブを実行する。画像処理装置は、ユーザーが操作可能な操作パネルを備えており、操作パネルにユーザーが操作可能な操作画面を表示すると共に、操作画面に対するユーザーの手動操作を受け付ける。例えば操作パネルに表示される操作画面は階層構造となっている。そのため、ユーザーは、最上層の操作画面から下位層の操作画面に対して順に操作を行っていくことにより、ジョブに関する所望の設定操作を行うことができる。
【0003】
ところで、近年、上記のような画像処理装置において、操作パネルに対する手動操作のみならず、ユーザーが発する音声を解析して音声操作を行うことを可能にした装置も普及しつつある。音声操作を行うことが可能な画像処理装置は、ユーザーの音声を解析することにより、ユーザーが操作しようとしている操作項目を特定することができる。そのため、ユーザーは、下位層の操作画面において操作可能な操作項目に対応する音声を発することにより、その操作項目に対する設定をダイレクトに行うことが可能である。つまり、音声操作の場合は、階層構造の操作画面に対する手動操作を順に行っていく必要がないため、操作効率に優れている。
【0004】
このような音声操作をさらにユーザーにとって利用しやすいものとするために、ユーザーによって行われた音声操作と連動した操作画面を操作パネルに表示させる技術が知られている(例えば、特許文献1)。このような従来の画像処理装置は、ユーザーが操作可能な全ての操作項目に対応する画像コンテンツ(操作ボタンなど)を予め1つの操作画面内に一覧表示しておき、ユーザーによって1つの操作項目に対応する音声が発せられる度に、その操作項目に対応する画像コンテンツを1つずつハイライト表示に変更していくように構成される。
【0005】
しかし、従来の画像処理装置では、1つの操作画面に多数の画像コンテンツが一覧表示されるため、ユーザーの音声操作に対応する画像コンテンツがハイライト表示されたとしても、多くの画像コンテンツの中からハイライト表示された画像コンテンツを探し出すのに時間がかかるという問題がある。またユーザーが操作可能な操作項目の数が多く、1つの操作画面内に全ての操作項目に対応する画像コンテンツを配置することができない場合、ユーザーは、ハイライト表示された画像コンテンツを探し出すのに画面遷移のための手動操作を行わなければならないこともあり、操作が煩雑になるという問題もある。さらに、ユーザーが自身で発した操作項目に対応する画像コンテンツを簡単に確認することができない場合には、ジョブの設定漏れなどが生じる可能性があり、問題となる。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2007-102012号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、上記課題を解決するためになされたものであり、ユーザーが発声した操作項目に対応する画像コンテンツを1つの操作画面に集約させて表示することにより、ジョブの設定操作などを簡単に行えるようにした画像処理装置、情報処理装置及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するため、請求項1に係る発明は、画像処理装置であって、ユーザーが操作可能な操作画面を表示する表示手段と、前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、ユーザーによる音声入力を受け付ける音声入力手段と、前記音声入力手段によって受け付けられる音声入力を解析し、前記複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析手段と、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出手段と、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した第1操作画面を生成する画面生成手段と、前記画面生成手段によって生成される第1操作画面を前記表示手段に表示させる表示制御手段と、前記表示手段に表示される操作画面に対するユーザーの操作を検知する操作検知手段と、を備え、前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記第1画像コンテンツと変更可能な第2画像コンテンツを抽出し、前記画面生成手段は、前記操作検知手段によって前記第1画像コンテンツに対する操作が検知された場合、前記所定の表示領域に前記第2画像コンテンツを表示することを特徴としている。
【0010】
請求項に係る発明は、画像処理装置であって、ユーザーが操作可能な操作画面を表示する表示手段と、前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、ユーザーによる音声入力を受け付ける音声入力手段と、前記音声入力手段によって受け付けられる音声入力を解析し、前記複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析手段と、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出手段と、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した第1操作画面を生成する画面生成手段と、前記画面生成手段によって生成される第1操作画面を前記表示手段に表示させる表示制御手段と、を備え、前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に関連する第3画像コンテンツを更に抽出し、前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツ及び前記第3画像コンテンツを前記所定の表示領域に配置した前記第1操作画面を生成することを特徴としている。
【0011】
請求項に係る発明は、請求項に記載の画像処理装置において、前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第3画像コンテンツが所定数以上である場合、前記第3画像コンテンツを配置しない前記第1操作画面を生成すると共に、前記第3画像コンテンツを配置した第2操作画面を生成し、前記表示制御手段は、前記第2操作画面を前記表示手段に表示させることを特徴としている。
【0012】
請求項に係る発明は、請求項又はに記載の画像処理装置において、前記画像コンテンツ抽出手段によって抽出される前記第3画像コンテンツに関する通知を行う通知手段を更に備えることを特徴としている。
【0013】
請求項に係る発明は、請求項1乃至のいずれかに記載の画像処理装置において、前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、ユーザーが選択したジョブに応じた第4画像コンテンツを更に抽出し、前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第4画像コンテンツを前記所定の表示領域とは異なる表示領域に配置した前記第1操作画面を生成することを特徴としている。
【0014】
請求項に係る発明は、請求項1乃至のいずれかに記載の画像処理装置において、前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出されなかった画像コンテンツが配置された第3操作画面を生成し、前記表示制御手段は、前記第3操作画面を表示させることを特徴としている。
【0017】
請求項に係る発明は、画像処理装置であって、ユーザーが操作可能な操作画面を表示する表示手段と、前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、ユーザーによる音声入力を受け付ける音声入力手段と、前記音声入力手段によって受け付けられる音声入力を解析し、前記複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析手段と、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出手段と、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した第1操作画面を生成する画面生成手段と、前記画面生成手段によって生成される第1操作画面を前記表示手段に表示させる表示制御手段と、を備え、前記音声入力手段は、ユーザーによる複数の音声入力を順に受け付け、前記音声解析手段は、前記音声入力手段によって順次受け付けられる複数の音声入力を解析し、前記複数の操作項目のうちから該複数の音声入力のそれぞれに対応する複数の操作項目を順次特定し、前記画像コンテンツ抽出手段は、前記音声解析手段によって順次特定される複数の操作項目のそれぞれに対応する複数の前記第1画像コンテンツを順次抽出し、前記画面生成手段は、前記画像コンテンツ抽出手段によって順次抽出された複数の前記第1画像コンテンツを、ユーザーの利用頻度が高い順に並び替えて前記所定の表示領域に配置した前記第1操作画面を生成することを特徴としている。
【0018】
請求項に係る発明は、請求項に記載の画像処理装置において、前記音声解析手段によって特定される複数の操作項目のうちに両立することができない操作項目の組み合わせが存在するか否かを判定する組合せ判定手段を更に備え、前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせが存在することを通知することを特徴としている。
【0019】
請求項に係る発明は、請求項に記載の画像処理装置において、前記画面生成手段による制御に基づいて音声出力を行う音声出力手段を更に備え、前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせが存在することを通知する音声出力を前記音声出力手段に実行させる制御を行うことを特徴としている。
【0020】
請求項10に係る発明は、請求項又はに記載の画像処理装置において、前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせとなる複数の操作項目のうち、いずれの操作項目を有効にするかをユーザーに選択させ、ユーザーの選択を前記第1操作画面に反映させることを特徴としている。
【0021】
請求項11に係る発明は、請求項乃至10のいずれかに記載の画像処理装置において、前記画面生成手段は、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせとなる複数の操作項目のそれぞれに対応する複数の画像コンテンツを前記所定の表示領域において互いに隣接する位置に配置した操作画面を生成することを特徴としている。
【0022】
請求項12に係る発明は、請求項に記載の画像処理装置において、前記音声解析手段によって特定される複数の操作項目のうちに両立することができない操作項目の組み合わせが存在するか否かを判定する組合せ判定手段と、前記組合せ判定手段によって、両立することができない操作項目の組み合わせが存在すると判定された場合に、両立することができない操作項目の組み合わせとなる複数の操作項目のうちいずれか1つの操作項目を有効にして確認プリントを行う画像形成手段と、を備えることを特徴としている。
【0023】
請求項13に係る発明は、請求項1乃至12のいずれかに記載の画像処理装置において、前記画面生成手段は、前記音声解析手段によって特定される操作項目を有効にするか無効にするかをユーザーに選択させる画像を前記所定の表示領域に配置した前記第1操作画面を生成することを特徴としている。
【0024】
請求項14に係る発明は、請求項1乃至13のいずれかに記載の画像処理装置において、前記画面生成手段は、前記音声解析手段によって特定される操作項目が、前記画像処理装置において実装されていない機能に関する操作項目である場合に、前記音声解析手段によって特定される操作項目が前記画像処理装置において実装されていない機能に関する操作項目であることを通知する前記第1操作画面を生成することを特徴としている。
【0025】
請求項15に係る発明は、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声入力を受け付ける音声入力手段と、を備える画像処理装置と通信を行う情報処理装置であって、前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、前記音声入力手段が入力した音声データを、前記画像処理装置から受信する音声データ受信手段と、前記音声データ受信手段が受信する音声データを解析し、前記複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析手段と、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応した画像コンテンツを抽出する画像コンテンツ抽出手段と、前記画像コンテンツ抽出手段によって抽出される画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成手段と、前記画面生成手段が生成する操作画面を前記画像処理装置に送信する操作画面送信手段と、を備えることを特徴としている。
請求項16に係る発明は、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声入力を受け付ける音声入力手段と、を備える画像処理装置と通信を行う情報処理装置であって、前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、前記音声入力手段が入力した音声データを、前記画像処理装置から受信する音声データ受信手段と、前記音声データ受信手段が受信する音声データを解析し、前記複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析手段と、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出手段と、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成手段と、前記画面生成手段が生成する操作画面を前記画像処理装置に送信する操作画面送信手段と、を備え、前記画像コンテンツ抽出手段は、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に関連する第3画像コンテンツを更に抽出し、前記画面生成手段は、前記画像コンテンツ抽出手段によって抽出される前記第1画像コンテンツ及び前記第3画像コンテンツを前記所定の表示領域に配置した前記操作画面を生成することを特徴としている。
請求項17に係る発明は、ユーザーが操作可能な操作画面を表示する表示手段と、ユーザーによる音声入力を受け付ける音声入力手段と、を備える画像処理装置と通信を行う情報処理装置であって、前記操作画面において表示可能な複数の操作項目のそれぞれに対応する複数の画像コンテンツを記憶する記憶手段と、前記音声入力手段が入力した音声データを、前記画像処理装置から受信する音声データ受信手段と、前記音声データ受信手段が受信する音声データを解析し、前記複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析手段と、前記複数の画像コンテンツのうちから、前記音声解析手段によって特定される操作項目に対応した画像コンテンツを抽出する画像コンテンツ抽出手段と、前記画像コンテンツ抽出手段によって抽出される前記画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成手段と、前記画面生成手段が生成する操作画面を前記画像処理装置に送信する操作画面送信手段と、を備え、前記音声入力手段は、ユーザーによる複数の音声入力を順に受け付け、前記音声解析手段は、前記音声入力手段によって順次受け付けられる複数の音声入力を解析し、前記複数の操作項目のうちから該複数の音声入力のそれぞれに対応する複数の操作項目を順次特定し、前記画像コンテンツ抽出手段は、前記音声解析手段によって順次特定される複数の操作項目のそれぞれに対応する複数の前記画像コンテンツを順次抽出し、前記画面生成手段は、前記画像コンテンツ抽出手段によって順次抽出された複数の前記画像コンテンツを、ユーザーの利用頻度が高い順に並び替えて前記所定の表示領域に配置した前記操作画面を生成することを特徴としている。
【0026】
請求項18に係る発明は、プログラムであって、コンピュータに、音声データを入力する音声データ入力ステップと、前記音声データ入力ステップによって受け付けられる音声データを解析し、操作画面において表示可能な複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析ステップと、所定の記憶手段に記憶されている複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出ステップと、前記画像コンテンツ抽出ステップによって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成ステップと、前記画面生成ステップによって生成される前記操作画面のデータを出力する操作画面出力ステップと、ユーザーによる前記操作画面に対する操作を検知する操作検知ステップと、を実行させ、前記画像コンテンツ抽出ステップは、前記複数の画像コンテンツのうちから、前記第1画像コンテンツと変更可能な第2画像コンテンツを抽出し、前記画面生成ステップは、前記操作検知ステップによって前記第1画像コンテンツに対する操作が検知された場合、前記所定の表示領域に前記第2画像コンテンツを表示することを特徴としている。
請求項19に係る発明は、プログラムであって、コンピュータに、音声データを入力する音声データ入力ステップと、前記音声データ入力ステップによって受け付けられる音声データを解析し、操作画面において表示可能な複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析ステップと、所定の記憶手段に記憶されている複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に対応した第1画像コンテンツを抽出する画像コンテンツ抽出ステップと、前記画像コンテンツ抽出ステップによって抽出される前記第1画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成ステップと、前記画面生成ステップによって生成される前記操作画面のデータを出力する操作画面出力ステップと、を実行させ、前記画像コンテンツ抽出ステップは、前記複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に関連する第3画像コンテンツを更に抽出し、前記画面生成ステップは、前記画像コンテンツ抽出ステップによって抽出される前記第1画像コンテンツ及び前記第3画像コンテンツを前記所定の表示領域に配置した前記操作画面を生成することを特徴としている。
請求項20に係る発明は、プログラムであって、コンピュータに、音声データを入力する音声データ入力ステップと、前記音声データ入力ステップによって受け付けられる音声データを解析し、操作画面において表示可能な複数の操作項目のうちから該音声データに対応する操作項目を特定する音声解析ステップと、所定の記憶手段に記憶されている複数の画像コンテンツのうちから、前記音声解析ステップによって特定される操作項目に対応した画像コンテンツを抽出する画像コンテンツ抽出ステップと、前記画像コンテンツ抽出ステップによって抽出される前記画像コンテンツを所定の表示領域に集約させるように配置した操作画面を生成する画面生成ステップと、前記画面生成ステップによって生成される前記操作画面のデータを出力する操作画面出力ステップと、を実行させ、前記音声データ入力ステップは、ユーザーによる複数の音声入力を順に受け付け、前記音声解析ステップは、前記音声入力ステップによって順次受け付けられる複数の音声入力を解析し、前記複数の操作項目のうちから該複数の音声入力のそれぞれに対応する複数の操作項目を順次特定し、前記画像コンテンツ抽出ステップは、前記音声解析ステップによって順次特定される複数の操作項目のそれぞれに対応する複数の前記第1画像コンテンツを順次抽出し、前記画面生成ステップは、前記画像コンテンツ抽出ステップによって順次抽出された複数の前記第1画像コンテンツを、ユーザーの利用頻度が高い順に並び替えて前記所定の表示領域に配置した前記操作画面を生成することを特徴としている。
【発明の効果】
【0027】
本発明によれば、ユーザーが発した音声に対応する画像コンテンツを1つの画面に集約表示した操作画面を生成することができるようになり、ユーザーにとって、音声操作により行ったジョブ設定を容易に確認することが可能な操作画面を表示することができる。
【図面の簡単な説明】
【0028】
図1】画像処理装置の外観構成の一例を示す斜視図である。
図2】階層的な手動操作用の操作画面の一構成例を示す図である。
図3】手動操作用の操作画面の一例を示す図である。
図4】音声入力用の操作画面の一例を示す図である。
図5】画像処理装置のハードウェア構成及び機能構成の一例を示す図である。
図6】グループ情報の一構成例を示す図である。
図7】音声入力用の操作画面の一例を示す図である。
図8】音声入力用の操作画面の一例を示す図である。
図9】音声入力用の操作画面の一例を示す図である。
図10】音声入力用の操作画面の一例を示す図である。
図11】音声入力用の操作画面の一例を示す図である。
図12】利用履歴情報の一構成例を示す図である。
図13】音声入力用の操作画面の一例を示す図である。
図14】音声入力用の操作画面の一例を示す図である。
図15】画像処理装置において行われる処理手順の一例を示すフローチャートである。
図16】画面生成処理の詳細な処理手順の一例を示すフローチャートである。
図17】画面更新処理の詳細な処理手順の一例を示すフローチャートである。
図18】第2実施形態における画像処理装置及び情報処理装置のハードウェア構成及び機能構成の一例を示す図である。
図19】第2実施形態における画像処理装置と情報処理装置との動作プロセスの例を示す図である。
図20】第2実施形態における情報処理装置において行われる処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0029】
以下、本発明に関する好ましい実施形態について図面を参照しつつ詳細に説明する。尚、以下に説明する実施形態において互いに共通する要素には同一符号を付しており、それらについての重複する説明は省略する。
【0030】
(第1実施形態)
図1は、本実施形態における画像処理装置1の外観構成の一例を示す斜視図である。画像処理装置1は、例えばMFPによって構成され、スキャン機能、プリンタ機能、コピー機能、FAX機能、BOX機能などの複数の機能を備えており、ユーザーによって指定されたジョブを実行する。例えば、画像処理装置1は、LAN(Local Area Network)などのネットワークに接続可能であり、スキャン機能によって原稿から読み取った画像データをネットワーク経由で他のコンピュータに出力したり、或いは、ネットワーク経由で他のコンピュータから画像データを受信すると、プリント機能によって画像データに基づく印刷出力を行うことが可能である。また画像処理装置1は電話回線などの通信網にも接続可能であり、通信網を介してFAXデータの送受信を行うことも可能である。尚、BOX機能とは、ストレージ機能の一種であり、画像処理装置1の内部の記憶領域(BOX)に文書などの画像データを保存する機能である。
【0031】
この画像処理装置1は、装置本体の正面側(前面側)に、ユーザーが操作可能な操作パネル10を備えている。ユーザーはこの操作パネル10を操作することにより、画像処理装置1の複数の機能のうちから使用する機能を選択し、その選択した機能に関する各種の設定操作を行うと共に、画像処理装置1に対してジョブの実行を指示することができるようになっている。
【0032】
操作パネル10は、カラー液晶ディスプレイなどで構成される表示部11と、ユーザーによる手動操作を受け付ける操作部12とを備えている。表示部11は、ユーザーに対して各種の操作画面を表示するものである。操作部12は、例えば表示部11の表示画面上に配置されるタッチパネルキーと、表示部11の表示画面の周囲に配置されるハードキーとを備えて構成される。したがって、ユーザーは表示部11に表示される操作画面を参照しながら、操作部12を指先などで手動操作することにより、画像処理装置1に対して各種の入力操作を行うことができる。
【0033】
また操作パネル10の側方には、マイクなどの音声入力部14が設けられている。音声入力部14は、ユーザーによる音声入力を受け付ける。画像処理装置1は、音声入力モードがオンであるときに音声入力部14を介してユーザーの音声を入力した場合、その入力した音声に基づいて表示部11に表示する操作画面を更新するように構成される。
【0034】
ここで画像処理装置1において操作パネル10の表示部11に表示される手動操作時の操作画面の構成例について説明する。画像処理装置1は、ユーザーが手動操作を行うための操作画面として、複数の操作画面を階層構造で保持している。図2は、ユーザーによってコピー機能が選択された場合のコピーモードにおける手動操作用の操作画面の一構成例を示す図である。図2に示すように画像処理装置1は、コピーモードにおいて複数の操作画面が階層構造で保持されている。例えば、ユーザーによってコピー機能が選択されると、画像処理装置1は、コピーモードの最上層の操作画面A10を操作パネル10の表示部11に表示する。
【0035】
このコピーモードでは、最上層の操作画面A10に対して1階層下の第1中間層に、操作画面A10から遷移する複数の操作画面A21,A22,…が設けられている。これら複数の操作画面A21,A22,…は、最上層の操作画面A10に含まれる操作項目の画像コンテンツ(操作ボタンなど)がユーザーによって操作された場合に、最上層の操作画面A10から遷移する画面であり、ユーザーによって操作された操作項目に対応する画面である。また操作画面A21に対して1階層下の第2中間層には、操作画面A21から遷移する複数の操作画面A31,A32,…が設けられている。これら複数の操作画面A31,A32,…は、第1中間層の操作画面A21に含まれる操作項目の画像コンテンツ(操作ボタンなど)がユーザーによって操作された場合に、第1中間層の操作画面A21から遷移する画面であり、ユーザーによって操作された操作項目に対応する画面である。さらに操作画面A31に対して1階層下の最下層には、操作画面A31から遷移する複数の操作画面A41,A42,…が設けられている。これら複数の操作画面A41,A42,…は、第2中間層の操作画面A31に含まれる操作項目の画像コンテンツ(操作ボタンなど)がユーザーによって操作された場合に、第2中間層の操作画面A31から遷移する画面であり、ユーザーによって操作された操作項目に対応する画面である。尚、第1中間層の他の操作画面A22,…の下位層にも複数の操作画面が設けられ、第2中間層の他の操作画面A32,…の下位層にも複数の操作画面が設けられるが、これらについては図示を省略している。また図2では、ユーザーによってコピー機能が選択された場合のコピーモードの操作画面の構成のみを示しているが、ユーザーによって他の機能が選択された他の機能モードにおいても同様の画面構成となっている。さらに図2では、コピーモードにおける操作画面が4階層である場合を例示しているが、2階層以上であれば階層数は特に限定されるものではない。また図2では省略しているが、コピーモードの操作画面の更に上位の操作画面として、ユーザーが機能を選択可能な機能選択画面が操作パネル10の表示される操作画面のトップ画面として存在している。
【0036】
上記のような画面構成において、例えばコピーモードにおける最上層の操作画面A10が表示されている状態でユーザーが操作画面A10に含まれる操作項目の画像コンテンツを手動操作すれば、図中矢印で示すように表示部11の操作画面は、ユーザーによって選択された操作項目に応じて第1中間層の操作画面A21,A22,…に遷移する。また操作パネル10の表示部11に第1中間層の操作画面A21が表示されている状態でユーザーが操作画面A21に含まれる操作項目の画像コンテンツを手動操作すれば、図中矢印で示すように表示部11の操作画面は、ユーザーによって選択された操作項目に応じて第2中間層の操作画面A31,A32,…に遷移する。さらに操作パネル10の表示部11に第2中間層の操作画面A31が表示されている状態でユーザーが操作画面A31に含まれる操作項目の画像コンテンツを手動操作すれば、図中矢印で示すように表示部11の操作画面は、ユーザーによって選択された項目に応じて最下層の操作画面A41,A42,…に遷移する。このように画像処理装置1は、ユーザーが操作部12を直接手動操作した場合には、表示部11の操作画面を階層構造に従って1階層ずつ下位層の操作画面に遷移させ、ユーザーによる更に詳細な設定操作を受け付ける。
【0037】
このような階層構造の操作画面に対し、ユーザーは、所望の操作項目の画像コンテンツ(操作ボタンなど)が表示された階層に辿り着くまで操作画面に対する操作を行い、所望の操作項目に対応する画像コンテンツが表示された階層において、その画像コンテンツに対する操作を行うことで、所望のジョブ設定をすることができるのである。
【0038】
一方、ユーザーが音声入力モードをオンにして音声入力部14に対して音声を入力した場合、画像処理装置1は音声認識処理を行い、その認識した音声に基づいて、ユーザーが操作しようとしている操作項目をダイレクトに特定し、その特定した操作項目に対応する画像コンテンツを表示部11に表示することができる。また、ユーザーがジョブの設定値を発声した場合には、その設定値をダイレクトに画像処理装置1に反映させることもできる。つまり、ユーザーが画像処理装置1に対して音声操作を行う場合には、上述した手動操作のような画面遷移を伴わないため、ユーザーは効率的にジョブ設定を行うことができるのである。以下、本実施形態における、ユーザーの音声入力に関連した操作画面について説明する。尚、以下の説明において、「操作項目」は、ジョブの設定項目、その設定項目における具体的な設定値やパラメータなどを含むものとする。
【0039】
図3は、表示部11に表示される手動操作用の操作画面のトップ画面の一例を示す図である。この操作画面は、ユーザーによって機能が選択される前に表示部11に表示されるトップ画面であり、例えば画像処理装置1に電源が投入された場合に最初に表示される画面である。例えば図3(a)に示すように、トップ画面は、機能選択画面となっており、コピー機能、スキャン機能、FAX機能及びBOX機能のうちからユーザーが所望の機能を選択することができる画面である。このトップ画面には、ユーザーが操作可能な操作ボタンとして、コピー、スキャン、FAX及びBOXのそれぞれに対応する画像コンテンツB2~B5が配置されている。またトップ画面には、ユーザーが操作可能な操作ボタンとして、音声入力モードをオンにするための画像コンテンツB1も配置されている。
【0040】
表示部11にトップ画面が表示されているとき、ユーザーは画像コンテンツB1をタッチ操作することより、画像処理装置1における音声入力モードをオン状態とすることができる。これにより、図3(a)に示す画面が、図3(b)に示す画面に遷移する。すなわち、画像処理装置1において音声入力モードがオンになると、トップ画面には、音声入力モードがオン状態であることが表示される。このように画像処理装置1は、ユーザーによる指示に基づいて音声入力モードをオンにする。ただし、これに限られるものではなく、画像処理装置1は、常時、音声入力モードをオンにしているものであっても構わない。
【0041】
音声入力モードがオンになると、画像処理装置1は、ユーザーによる音声入力を受け付ける。音声入力を受け付けると、画像処理装置1は、ユーザーによって発せられた音声を解析し、ユーザーが音声で操作しようとしている操作項目を特定する。例えば、図3(b)に示すトップ画面が表示されているときに、ユーザーによって「コピー」と発話されると、表示部11に表示される画面は、音声入力モードにおけるコピーモードの初期状態における操作画面(以下、「初期画面」と称する。)に遷移する。その後、画像処理装置1は、コピーモードにおいてユーザーの音声入力を受け付けるようになり、ユーザーの音声に基づいて、ユーザーが操作可能な操作項目をダイレクトに特定する状態となる。
【0042】
図4は、音声入力モードにおいて表示部11に表示されるコピーモードの操作画面の一例を示す図であり、図4(a)は、初期画面G0を示しており、図4(b)は、初期画面G0が更新されて表示される第1操作画面G1を示している。まず図4(a)に示すように、コピーモードの初期画面G0は、画面の略中央に、ユーザーの音声に基づいて抽出される画像コンテンツを表示するための表示領域AR1を有している。初期画面G0が表示されるときにユーザーによる音声が検知されていなければ、図4(a)に示すように、表示領域AR1には画像コンテンツが表示されず、ブランク状態となる。
【0043】
図4(a)に示すような初期画面G0が表示部11に表示されているとき、例えばユーザーが、「ツーインワン」という音声を発すると、初期画面G0が、図4(b)に示す第1操作画面G1に遷移する。第1操作画面G1では、表示領域AR1に、ユーザーが発した「ツーインワン」という音声に対応する「2in1」という画像コンテンツB9が表示された状態となる。このように、ユーザーが発した音声に対応する画像コンテンツが表示領域AR1に表示されることで、ユーザーは、自身で発した音声によって、画像処理装置1でどのような操作項目が特定されたのかを容易に確認することできる。特に、表示領域AR1には、ユーザーの音声に基づいて特定された操作項目に対応する画像コンテンツB9だけが表示されることにより、ユーザーは、自身の音声によって所望の設定項目を選択することができたか否かを容易に確認することができる。ただし、後述するように、表示領域AR1には、ユーザーが発した音声に対応する画像コンテンツだけでなく、それに関連する他の画像コンテンツなどを表示することもできる。これにより、ユーザーは、多数の画像コンテンツの中から自身の音声に基づいて特定された操作項目に対応する画像コンテンツを探し出す手間を省くことができ、操作効率が向上すると共に、ジョブの設定漏れなどを減らすことができる。
【0044】
次に、このような画像処理装置1の詳細について説明する。図5は、画像処理装置1のハードウェア構成及び機能構成の一例を示す図である。画像処理装置1は、そのハードウェア構成として、操作パネル10と、通信部13と、音声入力部14と、記憶部15と、スキャナ部16と、プリンタ部17と、FAX部18と、制御部19と、音声出力部20とを備えている。
【0045】
通信部13は、画像処理装置1をLAN(Local Area Network)などのネットワークに接続するためのインタフェースである。画像処理装置1は、この通信部13を介して、サーバーやパーソナルコンピュータなどの他の外部機器と通信を行う。
【0046】
音声入力部14は、例えば内部に振動板を備えており、ユーザーの音声による振動板の振動を電気信号に変換する。音声入力部14は、その電気信号を音声データとして制御部19へ出力する。例えば、音声入力部14は、音声入力モードがオン状態となった場合に音声データを制御部19へ出力するように構成される。
【0047】
記憶部15は、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などによって構成される不揮発性の記憶装置である。この記憶部15は、様々なプログラムやデータなどを記憶しておくものである。例えば記憶部15には、図5に示すように画像処理装置1において実行されるプログラム21と、音声入力データベース(以下、「音声入力DB」という。)30と、画像コンテンツデータベース(以下、「画像コンテンツDB」という。)31と、操作画面データベース(以下、「操作画面DB」という。)32と、グループ情報33と、組合せ情報34と、利用履歴情報35とが記憶される。
【0048】
音声入力DB30は、画像処理装置1においてユーザーが操作可能な操作項目と、その操作項目に対応する文字列データとを予め関連付けた情報を蓄積したデータベースである。この音声入力DB30は、ユーザーが発した音声に対応する操作項目を特定するために利用される。例えば、「2in1」の操作項目には、「ツーインワン」という文字列データが関連付けられる。また「両面」の操作項目には、「リョウメン」という文字列データが関連付けられる。1つの操作項目に関連付けられる文字列データは必ずしも1つに限られない。すなわち、1つの操作項目に複数の文字列データが関連付けられたものであっても良い。例えば、「2in1」の操作項目には、「ツーインワン」という文字列データの他に、「ツーページ」という文字列データが関連付けられていても良い。このように1つの操作項目に複数の文字列データを予め関連付けておくことにより、ユーザーは、複数の文字列データのうちのいずれか1つの文字列データに対応する音声を発することにより、所望の操作項目を音声操作で選択することができるようになる。
【0049】
画像コンテンツDB31は、表示部11に表示するための操作ボタンなどの画像コンテンツであって、ユーザーが操作可能な操作項目に対応する画像コンテンツを蓄積したデータベースである。画像コンテンツDB31は、ユーザーが操作可能な操作項目と、その操作項目に対応する画像コンテンツとを1対1で相互に関連付けて記憶する。音声入力モードがオンのときには、この画像コンテンツDB31から表示領域AR1に表示すべき画像コンテンツが読み出され、第1操作画面G1などが生成される。
【0050】
操作画面DB32は、手動操作用の操作画面を蓄積したデータベースであり、複数の操作画面を上述した階層構造で管理するデータベースである。音声入力モードがオフの状態でユーザーが操作パネル10に対して手動操作を行った場合、表示部11に表示される操作画面は、この操作画面DB32から読み出されて操作後の画面に更新される。
【0051】
グループ情報33は、ユーザーが操作可能な操作項目のうち、相互に設定変更可能な複数の操作項目を1つのグループに纏めた情報である。例えば、「2in1」の操作項目の場合、設定変更可能な他の操作項目として「4in1」、「8in1」、「16in1」がある。そのため、グループ情報33においては、「2in1」、「4in1」、「8in1」及び「16in1」の4つの操作項目が互いに設定変更可能な操作項目として1つのグループを形成する。つまり、グループ情報33は、1つの設定項目ごとにグループを形成し、その設定項目においてユーザーが選択可能な複数の設定値を1つに纏めたものである。
【0052】
また1つのグループに含まれる操作項目が他のグループに含まれる操作項目と関連性が有することがある。例えば、1つの操作項目と、その操作項目の詳細設定項目に対応する操作項目とは、互いに別のグループに属する場合であっても相互に関連性を有する。そのような場合、グループ情報33には、1つのグループに含まれる操作項目と、他のグループに含まれる操作項目とを相互に関連付ける情報が含まれる。
【0053】
図6は、グループ情報33の一例を示す図である。図6に示すように、例えば割付グループGD1には、「2in1」、「4in1」、「8in1」及び「16in1」の4つの操作項目D1~D4が含まれる。また第1順序グループGD2には、「左から右」及び「右から左」の2つの操作項目D5,D6が含まれる。さらに第2順序グループGD3には、「左上から横方向」、「左上から縦方向」、「右上から横方向」及び「右上から縦方向」の4つの操作項目D7~D10が含まれる。第1順序グループGD2に含まれる2つ操作項目D5,D6は、「2in1」の操作項目D1に対する詳細設定項目に該当し、「2in1」の操作項目D1と関連性を有している。そのため、グループ情報33では、「2in1」の操作項目D1と、第1順序グループGD2に含まれる2つの操作項目D5,D6とが相互に関連付けられる。また第2順序グループGD3に含まれる4つの操作項目D7~D10は、「4in1」、「8in1」及び「16in1」の3つの操作項目D2~D4の詳細設定項目に該当し、3つの操作項目D2~D4のそれぞれと関連性を有している。そのため、グループ情報33では、「4in1」、「8in1」及び「16in1」の3つの操作項目D2~D4のそれぞれと、第2順序グループGD3に含まれる4つの操作項目D7~D10とが相互に関連付けられる。このような複数のグループ間の関連付けにより、ユーザーが操作可能な複数の操作項目が有機的に関連付けられることになる。したがって、割付グループGD1に含まれる1つの操作項目が特定された場合、グループ情報33を参照することにより、特定された1つの操作項目に関連する他のグループの操作項目を更に特定することができる。
【0054】
組合せ情報34は、画像処理装置1において両立させることができない設定となる操作項目の組み合わせが登録された情報である。すなわち、組合せ情報34には、グループ情報33において同一グループに含まれる複数の操作項目の組み合わせが登録されると共に、グループ情報33において互いに異なるグループに含まれる複数の操作項目の組み合わせのうち、画像処理装置1において両立させた状態に設定することができない組み合わせが登録される。例えば、上述した割付グループGD1に含まれる、「2in1」、「4in1」、「8in1」及び「16in1」の4つの操作項目D1~D4の組み合わせは、それぞれ画像処理装置1において両立させた状態に設定することができない。そのため、組合せ情報34には、それら4つの操作項目D1~D4の組み合わせが予め登録される。
【0055】
利用履歴情報35は、音声入力モードにおいてユーザーによって行われたジョブの設定に関する履歴をユーザー毎に記録した情報である。
【0056】
スキャナ部16は、ユーザーによってコピー機能、スキャン機能、FAX送信機能などが選択された場合に動作し、ユーザーによってセットされた原稿の画像を光学的に読み取って画像データを生成するものである。プリンタ部17は、ユーザーによってコピー機能又はプリント機能が選択された場合、或いは、FAX部18が公衆電話回線からFAXデータを受信した場合に動作し、入力する画像データに基づいて印刷用紙などに画像形成を行って印刷出力するものである。FAX部18は、公衆電話回線を介してFAXデータの送受信を行うものである。
【0057】
音声出力部20は、例えばスピーカーによって構成され、音声信号に基づく音声出力を行う。例えば、音声出力部20は、表示部11に表示される操作画面に関する音声ガイダンスを出力するためのものである。この音声ガイダンスは、操作画面に対する操作を補助するための音声を出力したり、ユーザーによる操作内容をユーザーに対して確認するための音声を出力する。
【0058】
制御部19は、図示を省略するCPUやメモリなどを備えて構成され、CPUがプログラム21を実行することにより、音声解析部23、画像コンテンツ抽出部24、組合せ判定部25、画面生成部26、表示制御部27、ジョブ制御部28及び操作検知部29として機能する。これら各部は、画像処理装置1において音声入力モードがオンとなった場合に、ユーザーによって発せられる音声の入力を受け付け、ユーザーの音声に対応する操作項目を特定すると共に、その特定した操作項目に関連付けられている画像コンテンツを1つの操作画面に集約させて表示部11に表示するように機能する。以下、これら各部の詳細について説明する。
【0059】
音声解析部23は、音声入力部14から出力される音声データを解析して、ユーザーの音声入力に対応する操作項目を特定する処理部である。まず音声解析部23は、音声入力部14から入力する音声データに対してA/D変換やフィルタリングなどを行い、ユーザーの音声成分のみを抽出し、ユーザーの音声を文字列データに変換する。次に音声解析部23は、音声入力DB30を参照し、文字列データに対応する操作項目を特定する。これにより、ユーザーが発した音声に対応する1つの操作項目が特定されることになる。例えば、ユーザーによって「ツーインワン」という音声が発せられた場合、音声解析部23は、「2in1」の操作項目を特定する。音声解析部23は、音声データに対応する操作項目を特定すると、特定した操作項目(以下、「特定操作項目」と称する。)を画像コンテンツ抽出部24及び組合せ判定部25に通知する。音声解析部23は、音声入力モードにおいて、ユーザーによる音声を検知する度に、上記のような処理を行う。
【0060】
画像コンテンツ抽出部24は、音声入力モードにおいて操作画面に表示すべき操作ボタンなどの画像コンテンツを画像コンテンツDB31から抽出する処理部である。画像コンテンツ抽出部24は、音声解析部23によってユーザーの発した音声に対応する操作項目が特定された場合に画像コンテンツを抽出する処理を行う。また、画像コンテンツ抽出部24は、ユーザーによってコピー機能などの機能操作が行われた場合にも画像コンテンツを抽出する処理を行う。
【0061】
まず音声解析部23によってユーザーの音声に対応する操作項目が特定された場合の画像コンテンツ抽出処理について説明する。画像コンテンツ抽出部24は、音声解析部23から特定操作項目が通知されると、画像コンテンツDB31から、その特定操作項目に対応する画像コンテンツを第1画像コンテンツとして抽出する。例えば、音声解析部23によって「2in1」の操作項目が特定された場合、画像コンテンツ抽出部24は、「2in1」の操作項目に対応する画像コンテンツを第1画像コンテンツとして抽出する。そして画像コンテンツ抽出部24は、特定操作項目に対応する第1画像コンテンツを画面生成部26へ出力する。
【0062】
また、画像コンテンツ抽出部24は、特定操作項目に対応する第1画像コンテンツを抽出するとき、グループ情報33を参照し、特定操作項目と同じグループに含まれる他の操作項目を特定する。そして画像コンテンツ抽出部24は、画像コンテンツDB31から、特定操作項目と同じグループに含まれる他の操作項目に対応する画像コンテンツを第2画像コンテンツとして抽出する。つまり、画像コンテンツ抽出部24は、特定操作項目と相互に設定変更可能な他の操作項目に対応する第2画像コンテンツをさらに抽出するのである。例えば、音声解析部23によって「2in1」の操作項目が特定された場合、画像コンテンツ抽出部24は、「4in1」、「8in1」及び「16in1」といった他の操作項目に対応する画像コンテンツを第2画像コンテンツとして抽出する。そして画像コンテンツ抽出部24は、他の操作項目に対応する第2画像コンテンツを、図示を省略するメモリなどに一時的に記憶させておく。
【0063】
また、画像コンテンツ抽出部24は、グループ情報33を参照し、特定操作項目が別のグループと関連付けられているか否かを判断する。特定操作項目が別のグループと関連付けられている場合、特定操作項目には詳細設定項目が存在することになる。そのため、特定操作項目が別のグループと関連付けられている場合、画像コンテンツ抽出部24は、その別のグループに含まれる操作項目を全て特定し、その特定した操作項目の画像コンテンツを第3画像コンテンツとして画像コンテンツDB31から抽出する。例えば特定操作項目が「2in1」の操作項目D1である場合、画像コンテンツ抽出部24は、グループ情報33を参照し、第1順序グループGD2に含まれる「左から右」の操作項目D5及び「右から左」の操作項目D6に対応する画像コンテンツを第3画像コンテンツとして抽出する。そして画像コンテンツ抽出部24は、抽出した第3画像コンテンツを画面生成部26へ出力する。
【0064】
次に、ユーザーによってコピー機能などの機能選択が行われた場合の画像コンテンツ抽出処理について説明する。画像コンテンツ抽出部24は、音声入力モードにおいてユーザーによってコピー機能などの機能選択が行われた場合、ユーザーによって選択された機能における基本的な操作項目を特定し、その操作項目に対応する画像コンテンツを第4画像コンテンツとして画像コンテンツDB31から抽出する。例えば、「モノクロ」や「カラー」などのカラー設定を変更するための操作項目はコピー機能における基本的な操作項目である。そのため、ユーザーによってコピー機能が選択された場合、画像コンテンツ抽出部24は、「モノクロ」や「カラー」などの基本的な操作項目に対応する画像コンテンツを第4画像コンテンツとして抽出する。さらにこのとき、画像コンテンツ抽出部24は、図4(a)に示す追加ボタンに対応する画像コンテンツB8も第4画像コンテンツとして抽出する。そして画像コンテンツ抽出部24は、抽出した第4画像コンテンツを画面生成部26へ出力する。尚、このような第4画像コンテンツは、ユーザーによって発せられた音声とは関係しない場合であっても画像コンテンツ抽出部24によって抽出される。
【0065】
組合せ判定部25は、音声解析部23によって特定された特定操作項目が複数ある場合に、それら複数の特定操作項目のうちに、画像処理装置1において互いに両立させた状態に設定することができない組み合わせとなる操作項目が存在するか否かを判定する処理部である。ユーザーによって操作項目に対応する音声が順次発せられ、音声解析部23においてそれらの音声が順次解析されていくと、特定操作項目が次第に増加していく。組合せ判定部25は、音声解析部23によって特定操作項目が特定される度に、既に特定されている特定操作項目との関係において互いに両立させた状態に設定することができない組み合わせとなる操作項目が存在するか否かを判定する。すなわち、組合せ判定部25は、特定操作項目が複数ある場合、組合せ情報34を参照することにより、それら複数の特定操作項目の中に互いに両立しない設定となる組み合わせとなるものが存在するか否かを判定するのである。例えば、特定操作項目として、「2in1」の操作項目と、「4in1」の操作項目とは、画像処理装置1において互いに両立させた状態に設定することができない。そのため、「2in1」の操作項目及び「4in1」の操作項目の双方がユーザーの音声に基づいて特定された特定操作項目に含まれる場合、組合せ判定部25は、それら2つの操作項目を互いに両立させることができない組み合わせとなる操作項目として判定する。そして既に特定されている複数の操作項目の中に互いに両立させることができない組み合わせとなる操作項目がある場合、組合せ判定部25は、両立することができない組み合わせが存在することを示す両立不可情報をジョブ制御部28及び画面生成部26へ出力する。
【0066】
表示制御部27は、表示部11における表示画面を制御する処理部である。表示制御部27は、画面生成部26から出力される操作画面データ6に基づき、画面生成部26によって生成される操作画面を表示部11に表示させる制御を行う。例えば、画面生成部26によって操作画面が更新されると、表示制御部27は、それに応じて表示部11に表示している操作画面も更新する。
【0067】
ジョブ制御部28は、画像処理装置1におけるジョブの実行を制御する処理部である。ジョブ制御部28は、ユーザーによってジョブの実行開始指示が与えられた場合に機能し、スキャナ部16、プリンタ部17及びFAX部18のそれぞれを駆動し、ユーザーによって指定されたジョブの実行を制御する。ジョブ制御部28は、ユーザーの手動操作又は音声操作によって指定されたジョブ設定を反映させたうえでジョブの実行を開始する。
【0068】
また、ジョブ制御部28は、ジョブの実行開始時に組合せ判定部25から両立不可情報を入力している場合、互いに両立させることができない組み合わせである複数の特定操作項目のうちのいずれか1つの操作項目を有効にジョブ設定に反映させたうえでジョブを実行する。このとき、互いに両立させることができない複数の特定操作項目の中に、画像処理装置1におけるデフォルト設定に対応する操作項目が含まれていれば、そのデフォルト設定に対応する操作項目をジョブ設定に反映させることが好ましい。またユーザーによって指定されたジョブがプリントジョブである場合、ジョブ制御部28は、互いに両立させることができない複数の特定操作項目のうちのいずれか1つの操作項目を有効に反映させてジョブを実行するとき、複数枚の印刷出力を行う場合であっても、最初の1枚のみを印刷出力する確認プリントとしてプリントジョブを実行する。これにより、ユーザーは、最初の1枚のプリント結果を見て、続きを印刷するかどうかを決定することができる。万一、ジョブ設定を誤っていたと気付いた場合には続きを印刷する必要がないため、印刷用紙の無駄を削減することができる。
【0069】
操作検知部29は、操作画面に対して行われるユーザーの手動操作を検知する処理部である。例えば、操作検知部29は、ユーザーによってジョブの実行指示操作が行われた場合は、ジョブ制御部28に対してジョブの実行を指示する。また、操作画面に表示されている画像コンテンツがユーザーによって操作された場合、操作検知部29は、ユーザーによって操作された画像コンテンツを特定し、その特定した画像コンテンツに基づき、画面生成部26及びジョブ制御部28などに対して操作情報を出力する。これにより、表示部11に表示される操作画面が更新されたり、或いは、画像処理装置1においてジョブの実行が開始されたりする。
【0070】
画面生成部26は、表示部11に表示される操作画面を生成する処理部である。例えば音声入力モードがオフのとき、画面生成部26は、操作画面DB32から表示部11に表示すべき操作画面を読み出して表示部11に表示する。
【0071】
また音声入力モードがオンになると、画面生成部26は、上述した初期画面G0を生成して表示制御部27へ出力する。これにより、表示部11には、音声入力モードにおける初期画面G0が表示されるようになる。このとき、ユーザーによって既にコピー機能などの機能が選択されていれば、画面生成部26は、画像コンテンツ抽出部24によって抽出される第4画像コンテンツを取得する。そのため、画面生成部26は、図4(a)に示すようにユーザーによって選択された機能における基本的な操作項目に対応する画像コンテンツB7、及び、追加ボタンに対応する画像コンテンツB8を、表示領域AR1とは異なる表示領域に配置した初期画面G0を生成する。尚、画面生成部26は、ユーザーによって選択された機能における基本的な操作項目に対応する画像コンテンツB7を表示するとき、画像処理装置1におけるデフォルト設定に対応する画像コンテンツB7を表示する。例えば、第4画像コンテンツとして「モノクロ」と「カラー」の画像コンテンツが抽出されており、画像処理装置1のデフォルト設定が「モノクロ」である場合、画面生成部26は、「モノクロ」の画像コンテンツを配置した初期画面G0を生成する。このように、ユーザーによって選択された機能における基本的な操作項目に対応する画像コンテンツB7を予め初期画面G0に表示しておくことにより、ユーザーは、その基本的な設定を行うために自身で音声を発する必要がないことを把握することができる。上記のようにして、表示部11には、図4(a)に示すような初期画面G0が表示されるようになる。
【0072】
画面生成部26は、上記のような初期画面G0を生成した後、画像コンテンツ抽出部24から第1画像コンテンツを取得すると、その第1画像コンテンツを表示領域AR1に配置した操作画面を生成する。つまり、図4(a)に示す初期画面G0を図4(b)に示す第1操作画面G1に更新するのである。そして画面生成部26は、第1画像コンテンツを配置した第1操作画面G1を表示制御部27へ出力する。これにより、表示部11に表示される画面は、図4(a)の初期画面G0から図4(b)に示す第1操作画面G1に更新される。
【0073】
また図4(b)に示すように第1画像コンテンツを表示領域AR1に配置した第1操作画面G1を表示するとき、画面生成部26は、音声出力部20を介して、特定操作項目に対応する文字列データに応じた音声ガイダンスを出力するようにしても良い。特定操作項目に対応する文字列データに応じた音声ガイダンスを出力することにより、ユーザーは、自身で発した音声と同一音声であるか否かを確認することができ、画像処理装置1において正しい特定操作項目が認識されたか否かを把握することができる。
【0074】
図4(b)に示す第1操作画面G1が表示部11に表示されているとき、ユーザーによって表示領域AR1内の画像コンテンツB9に対する操作がなされると、画面生成部26は、操作検知部29から出力される操作情報により、画像コンテンツB9が操作されたことを把握することができる。そして画面生成部26は、ユーザーによる操作に基づき、第1操作画面G1を更新する。
【0075】
図7は、第1操作画面G1の更新例を示す図である。例えば、上述したようにユーザーによって表示領域AR1内の画像コンテンツB9に対する操作がなされた場合、画面生成部26は、画像コンテンツ抽出部24によって予め抽出されている画像コンテンツB9に関連する第2画像コンテンツをメモリなどから読み出す。すなわち、画面生成部26は、画像コンテンツB9と相互に設定変更可能な第2画像コンテンツを読み出すのである。そして画面生成部26は、画像コンテンツB9と相互に設定変更可能な第2画像コンテンツを配置したプルダウンメニューB9aを生成し、そのプルダウンメニューB9aをユーザーによって操作された画像コンテンツB9の近傍位置に配置することにより第1操作画面G1を更新する。これにより、表示部11に表示される第1操作画面G1は、図7(a)に示すような画面に更新される。したがって、ユーザーは、自身の発声によって表示されている画像コンテンツB9を、プルダウンメニューB9aの中に含まれる第2画像コンテンツに変更することができる。例えば、ユーザーがプルダウンメニューB9aの中から「4in1」の画像コンテンツを選択したとすると、操作検知部29は、ユーザーによって「4in1」が選択されたことを示す操作情報を画面生成部26に出力する。その操作情報に基づき、画面生成部26は、「2in1」の第1画像コンテンツB9を「4in1」の第2画像コンテンツB9bに変更し、第1操作画面G1を新たに生成する。その結果、表示部11に表示される第1操作画面G1は、図7(a)に示すような画面から、図7(b)に示すような画面に更新される。すなわち、ユーザーは、第1操作画面G1に対して所定の操作を行うことにより、第1画像コンテンツと第2画像コンテンツとを変更することができるのである。尚、ユーザーの操作によって第1操作画面G1を図7(a)に示す状態から図7(b)に示す状態へ更新すると、画面生成部26は、「2in1」の画像コンテンツB9を第2画像コンテンツとして管理し、「4in1」の画像コンテンツB9bを第1画像コンテンツとして管理するようになる。
【0076】
また画面生成部26は、画像コンテンツ抽出部24によって特定操作項目の詳細設定項目に対応する第3画像コンテンツが抽出されている場合、その第3画像コンテンツを、表示領域AR1内の位置であって、特定操作項目に対応する第1画像コンテンツの近傍位置に配置した操作画面を生成する。例えば、ユーザーの音声に対応する特定操作項目として「2in1」の操作項目が特定された場合、上述したように画像コンテンツ抽出部24によって、第1順序グループGD2に含まれる「左から右」の操作項目D5及び「右から左」の操作項目D6に対応する画像コンテンツが第3画像コンテンツとして抽出される。これらの操作項目D5,D6はグループ情報33において同一グループに含まれており、画像処理装置1において互いに両立させた状態に設定することができない項目である。そのため、画面生成部26は、複数の第3画像コンテンツが抽出されている場合、それら複数の第3画像コンテンツの中から、画像処理装置1におけるデフォルト設定に対応する第3画像コンテンツを、特定操作項目に対応する第1画像コンテンツの近傍位置に配置した操作画面を生成する。
【0077】
図8は、第3画像コンテンツが抽出されている場合に画面生成部26によって生成される第1操作画面G1の例を示す図である。例えば、第1順序グループGD2に含まれる「左から右」の操作項目D5及び「右から左」の操作項目D6のうち、画像処理装置1におけるデフォルト設定が「左から右」の操作項目D5である場合、画面生成部26は、図8(a)に示すように、「2in1」の特定操作項目に対応する画像コンテンツB9の近傍位置に、操作項目D5に対応する「順序:左から右」という第3画像コンテンツB10を配置した第1操作画面G1を生成する。尚、ここでは、画像処理装置1のデフォルト設定に基づいて複数の第3画像コンテンツのうちから1つの第3画像コンテンツを選択する場合を例示したが、1つの第3画像コンテンツを選択する方法はこれに限られない。例えば、画面生成部26は、利用履歴情報35を参照し、複数の第3画像コンテンツのうち、ジョブの設定に反映された実績が最も多いコンテンツ、すなわち、利用頻度が最も高いコンテンツを選択するものであってもよい。
【0078】
図8(a)に示すように、特定操作項目に対応する第1画像コンテンツB9の近傍位置に、特定操作項目の詳細設定項目に対応する第3画像コンテンツB10が表示されると、ユーザーは、第3画像コンテンツB10に対する操作を行うことにより、詳細設定項目の設定変更を行うことができる。図8(b)は、そのような設定変更を行う例を示している。画面生成部26は、操作検知部29から出力される操作情報に基づき、第3画像コンテンツB10が操作されたことを検知すると、第3画像コンテンツB10と相互に設定変更可能な他の第3画像コンテンツを配置したプルダウンメニューB10aを生成し、そのプルダウンメニューB10aをユーザーによって操作された画像コンテンツB10の近傍位置に配置することにより第1操作画面G1を更新する。これにより、表示部11に表示される第1操作画面G1は、図8(b)に示すような画面に更新される。ユーザーは、プルダウンメニューB10aの中に含まれる他の第3画像コンテンツを選択する操作を行えば、第3画像コンテンツB10を別の第3画像コンテンツに変更することが可能であり、特定操作項目の詳細設定項目を設定変更することができる。そして画面生成部26は、ユーザーの操作に基づき、ユーザーによって選択された他の第3画像コンテンツを配置した第1操作画面G1を新たに生成する。これにより、表示部11に表示される画面は、ユーザーの操作に基づいて更新される。
【0079】
ところで、グループ情報33において、複数のグループが、特定操作項目と関連性を有するグループとして登録されていることがある。つまり、特定操作項目に対応する詳細設定項目として、複数種類の項目が存在することがある。そのような場合、画面生成部26は、特定操作項目に対応する第1画像コンテンツの近傍位置に、複数種類の詳細設定項目のそれぞれに対応した第3画像コンテンツを配置した第1操作画面を生成する。ただし、特定操作項目と関連性を有する他のグループの数が所定数以上である場合、各グループから1つの第3画像コンテンツを選択して表示するとしても、表示領域AR1内に全ての第3画像コンテンツを表示させることが困難になる。また特定操作項目に対応する詳細設定目の数が増加すると、操作画面において表示される個々の画像コンテンツの視認性が低下する可能もある。
【0080】
そこで、画面生成部26は、特定操作項目と関連性を有する他のグループの数が所定数以上である場合、特定操作項目に対応する第1画像コンテンツの近傍位置に、詳細設定ボタンに対応する画像コンテンツを配置し、ユーザーによって詳細設定ボタンが操作されると、操作画面を詳細設定画面に遷移させるようにしても良い。図9は、詳細設定画面に遷移させる例を示す図である。例えば図9(a)に示すように、ユーザーによって「リョウメン」という音声が発せられ、表示領域AR1に「両面」の特定操作項目に対応する第1画像コンテンツB11が表示されることを仮定する。この場合、「両面」の特定操作項目と関連性を有する他のグループとして、所定数以上のグループが存在する場合、画面生成部26は、「両面」の特定操作項目に対応する第1画像コンテンツB11の近傍位置に、詳細設定ボタンに対応する画像コンテンツB12を配置した第1操作画面G1を生成する。これにより、表示部11には、図9(a)に示すような第1操作画面G1が表示されるようになる。
【0081】
図9(a)に示す第1操作画面G1が表示されているとき、ユーザーによって詳細設定ボタンに対応する画像コンテンツB12が操作されると、画面生成部26は、図9(b)に示すような、「両面」の特定操作項目に対応する詳細設定画面を、第2操作画面G2として生成する。そして、画面生成部26は、生成した第2操作画面G2を表示制御部27へ出力する。これにより、表示部11には、図9(b)に示す第2操作画面G2が表示されるようになる。ユーザーは、第2操作画面G2に配置された第3画像コンテンツに対する操作を行うことで、これらの操作項目に対する設定操作を行うことができる。このような第2操作画面G2が生成されることにより、第1操作画面G1における所定の表示領域AR1に配置される画像コンテンツの数が膨大になることを防ぐことができると共に、視認性に優れた第2操作画面G2を表示することができるのである。
【0082】
尚、上記のように特定操作項目の詳細設定項目に相当する第3画像コンテンツが抽出されている場合には、ユーザーに対して詳細設定項目に対する操作を促すため、詳細設定項目が存在することをユーザーに通知するようにすることが好ましい。このような通知の一態様として、例えば、画面生成部26が第3画像コンテンツを配置した画面を生成することに伴い、音声出力部に対して音声信号を出力し、音声ガイダンスによって通知するようにしても良い。
【0083】
また画像処理装置1の利用頻度が比較的少ないユーザーにとっては、画像処理装置1に対して所望のジョブ設定を反映させるためにどのような音声を発すれば良いか分からないことがある。そのような場合、ユーザーは、初期画面G0又は第1操作画面G1において表示される追加ボタンに対応する画像コンテンツB8を操作することにより、ユーザーの音声によって認識された操作項目とは関係しない他の操作項目の設定操作を行うことができるようになる。すなわち、ユーザーによって追加ボタンに対応する画像コンテンツB8が操作されたことが検知されると、画像コンテンツ抽出部24は、現在の機能において、未だ抽出していない他の画像コンテンツを抽出し、画面生成部26へ出力する。そして画面生成部26は、画像コンテンツ抽出部24から出力される画像コンテンツだけを配置した第3操作画面G3を生成し、表示制御部27へ出力する。これにより、表示部11には、ユーザーの音声入力が検知されたタイミングで抽出されなかった画像コンテンツだけを集約させた第3操作画面G3が表示されるようになる。
【0084】
図10は、第3操作画面G3の一例を示す図である。例えば図9(a)に示す第1操作画面G1が表示されているときに、ユーザーによって追加ボタンに対応する画像コンテンツB8が操作されると、画面生成部26は、図10に示すような第3操作画面G3を生成する。この第3操作画面G3では、第1操作画面G1において表示されていなかった画像コンテンツであって、ユーザーによって選択されているコピー機能の他の操作項目に関する画像コンテンツが表示される。そのため、ユーザーは、それら他の操作項目に関する設定操作を行うことができるようになる。これにより、ユーザーによるジョブの設定操作時に設定漏れなどが生じることを防止することができるようになる。尚、第3操作画面G3に複数の画像コンテンツを配置する際、画面生成部26は、例えば利用履歴情報35を参照することにより、ユーザーによって過去に設定変更がなされた操作項目に対応する画像コンテンツから順に配置することが好ましい。
【0085】
次に、画面生成部26によって生成される他の画面例について説明する。画面生成部26は、特定操作項目に対応する第1画像コンテンツを配置した第1操作画面G1を生成するとき、ユーザーがワンタッチで特定操作項目の設定を無効にすることが可能な画面を生成することもできる。図11は、ユーザーが簡単に無効操作を行うことができる第1操作画面G1の例を示す図である。例えば音声入力モードにおいて、ユーザーが「ツーインワン」・「リョウメン」・「ニブ」と連続的に発声すると、画面生成部26は、図11(a)に示すような第1操作画面G1を生成する。この第1操作画面G1は、第1画像コンテンツB9,B11,B13の左側の近傍位置にチェックボックスB20が配置された画面構成となっている。すなわち、上記の例では、3つの特定操作項目が特定され、3つの特定操作項目のそれぞれに対応する第1画像コンテンツB9,B11,B13が表示される。そのため、画面生成部26は、それら3つの第1画像コンテンツB9,B11,B13のそれぞれの近傍位置に対して個別にチェックボックスB20を配置する。特定操作項目は、ユーザーによる音声が検知された時点では、ユーザーによる設定が有効な状態として表示される。そのため、チェックボックスB20には、チェックマークが表示される。ユーザーは、特定操作項目の設定を無効にしたい場合、その特定操作項目に対応するチェックボックスB20をワンタッチ操作すれば良い。この場合、画面生成部26は、ユーザーの操作に基づいてチェックボックスB20からチェックマークを外した第1操作画面G1に更新し、ユーザーがワンタッチ操作を行った特定操作項目の設定が無効になったことを表示する。したがって、特定操作項目の近傍にチェックボックスB20が配置されることにより、ユーザーは手軽に設定内容を変更することができるのである。
【0086】
また、画面生成部26は、特定操作項目についての設定機能が画像処理装置1に実装されていない場合であっても、その特定操作項目に対応する第1画像コンテンツを第1操作画面に表示することができる。ただし、特定操作項目についての設定機能が画像処理装置1に実装されていない場合、画面生成部26は、その特定操作項目に対応する第1画像コンテンツを表示領域AR1に配置するときには、通常とは異なる表示態様に変更して配置することが好ましい。例えば、画像処理装置1にステープル機能が実装されていない場合、ユーザーの「ステープル」という音声が検知されると、画面生成部26は、図11(b)に示すように、「ステープル」の特定操作項目に対応する第1画像コンテンツB21を通常とは異なる表示態様に変更して配置する。表示態様の変更例としては、例えばグレーアウトさせた態様に変更するものなどがある。このように、画像処理装置1に実装されていない設定機能に対応する音声が検知された場合、画面生成部26が、特定操作項目に対応する第1画像コンテンツの表示態様を変更することにより、ユーザーは、自身で指定した設定機能が使用できないことを一見して把握することができるという利点がある。また画面生成部26は、図11(b)に示す第1操作画面G1を生成することに伴い、音声出力部20を介して、ステープル機能が実装されていないことを音声出力することにより、ユーザーに通知するようにしても良い。
【0087】
また、画面生成部26は、ユーザーの音声に基づいて複数の特定操作項目が特定された場合、それら複数の特定操作項目のそれぞれに対応する第1画像コンテンツの配置順序をユーザーの利用頻度に応じて変更し、第1操作画面G1を逐次更新するようにしても良い。例えば、複数の第1画像コンテンツを、ユーザーの利用頻度が高い順に並べ替えて表示領域AR1に配置するのである。この場合、画面生成部26は、利用履歴情報35を参照することができる、ユーザーの利用頻度を特定することができる。
【0088】
図12は、利用履歴情報35の一例を示す図である。図12に示すように、利用履歴情報35には、ユーザーによって各操作項目が操作された利用回数が記録されている。尚、この利用回数は、音声入力モードがオンの場合に限らず、オフの場合の利用回数を含むものであっても構わない。したがって、利用履歴情報25を参照すれば、ユーザーが各操作項目を操作した回数を把握することができる。
【0089】
画面生成部26は、上記のような利用履歴情報35を参照することにより、複数の特定操作項目のそれぞれに対応する第1画像コンテンツを、ユーザーの利用頻度に応じて並べ替えるのである。例えば、ユーザーの音声が「ツーインワン」、「リョウメン」、「ニブ」という順で発せられた場合において、画面生成部26がユーザーの発声順に第1画像コンテンツを配置すると、図13(a)のような第1操作画面G1が生成される。これに対し、複数の特定操作項目の配置順序をユーザーの利用頻度に応じて変更する場合、画面生成部26は、利用履歴情報35を参照し、「2in1」、「両面」及び「2部」の操作項目がユーザーによって操作された利用回数が多い順に、第1画像コンテンツの配置順序を入れ替える。この場合、画面生成部26は、図13(b)に示すような第1操作画面G1を生成する。つまり、表示領域AR1において、ユーザーの利用回数が多い特定操作項目の第1画像コンテンツが利用回数の少ない特定操作項目の第1画像コンテンツよりも上位に表示されるのである。これにより、ユーザーの利用頻度の高い画像コンテンツを見やすい位置に配置することができるため、ユーザーにとって操作しやすい操作画面が提供されるようになる。
【0090】
また、複数の特定操作項目の中に、画像処理装置1において互いに両立させた状態に設定することができない組み合わせが存在する場合、画面生成部26は、それら特定操作項目の組み合わせの中から1つの特定操作項目をユーザーが選択できる画面を生成する。図14は、ユーザーが複数の特定操作項目の中から1つの特定操作項目を選択できるようにした画面例を示す図である。例えば図14(a)に示すように、画面生成部26は、画像処理装置1において互いに両立させた状態に設定することができない複数の特定操作項目の第1画像コンテンツB31,B11を表示領域AR1に配置するとき、表示領域AR1において第1画像コンテンツB31,B11を互いに隣接する位置に並べて配置する。これにより、ユーザーにとって、互いに両立させた状態に設定することができない複数の特定操作項目を確認しやすくなるという利点がある。また画面生成部26は、互いに隣接する位置に配置した第1画像コンテンツB31,B11の近傍位置に、ユーザーが択一的操作を行うことが可能なラジオボタンなどの画像コンテンツB32を配置する。図14(a)に示すような第1操作画面G1が表示されることにより、ユーザーは、「片面」と「両面」とを同時に有効な設定とすることができないことを把握することができる。そしてユーザーは、ラジオボタンなどの画像コンテンツB32に対する操作を行うことにより、複数の操作項目のうちのいずれか一方を有効に設定し、他方を無効に設定することができ、第1操作画面G1に操作の結果を反映させることができる。またこの他にも、例えば図14(b)に示すように、画面生成部26は、第1操作画面G1とは別に、画像処理装置1において互いに両立させた状態に設定することができない複数の特定操作項目のうちからユーザーにいずれか一方を選択させる選択画面G4を生成し、選択画面G4を表示部11に表示させるようにしても良い。尚、画面生成部26は、画像処理装置1において互いに両立させた状態に設定することができない組み合わせが存在することを検知した場合に、音声出力部20を介して、そのような組み合わせが存在することを音声ガイダンスで出力することにより、ユーザーに通知するようにしても良い。
【0091】
次に画像処理装置1における具体的な動作の一例について説明する。図15は、画像処理装置1において行われる処理手順の一例を示すフローチャートである。この処理は、音声入力モードがオンとなることによって開始される処理である。画像処理装置1は、この処理を開始すると、まず音声入力モードがオン状態となった否かを判断する(ステップS1)。音声入力モードがオン状態となっていない場合(ステップS1でNO)、画像処理装置1による処理が終了する。一方、音声入力モードがオン状態となった場合(ステップS1でYES)、画像処理装置1は、画面生成部26を機能させて音声入力モードにおける初期画面G0を生成し、表示制御部27を機能させて初期画面G0を表示部11に表示させる(ステップS2)。つまり、表示領域AR1がブランク状態の初期画面G0を表示するのである。
【0092】
次に、画像処理装置1はユーザーによる音声入力があったかどうかを判断する(ステップS3)。音声入力がない場合(ステップS3でNO)、ステップS10までの処理をスキップする。一方、音声入力があった場合(ステップS3でYES)、画像処理装置1は、音声解析部23を機能させて音声解析を行い(ステップS4)、ユーザーの音声に対応する操作項目(特定操作項目)を特定する(ステップS5)。次に、画像処理装置1は画像コンテンツ抽出部24を機能させる。画像コンテンツ抽出部24は、画像コンテンツDB31から特定操作項目に対応する第1画像コンテンツを抽出する。また画像コンテンツ抽出部24は、グループ情報33を参照し、特定操作項目と相互に設定変更することが可能な第2画像コンテンツを抽出すると共に、特定操作項目と関連性を有する別のグループに含まれている操作項目に対応した第3画像コンテンツを抽出する(ステップS7)。次に、画像処理装置1は、画面生成部26を機能させ、ユーザーの音声入力に応じた画面生成処理を行わせる(ステップS8)。
【0093】
図16は、画面生成部26によって実行される画面生成処理(ステップS8)の詳細な処理手順の一例を示すフローチャートである。画面生成部26は、画面生成処理を開始すると、現在の表示画面が初期画面G0であるか否かを判断する(ステップS20)。初期画面G0でない場合は(ステップS20でNO)、処理はステップS21に進む。すなわち、初期画面G0でない場合は、既に表示領域AR1において少なくとも1つの特定操作項目に対応する第1画像コンテンツが表示されていることになる。そのため、今回新たに表示しようとする第1画像コンテンツと合わせると、表示領域AR1には、複数の第1画像コンテンツが表示されることなる。そのため、画像処理装置1は、組合せ判定部25を機能させ、既に表示されている第1画像コンテンツと、今回表示しようとしている第1画像コンテンツのそれぞれに対応する操作項目が画像処理装置1において互いに両立させて設定することが可能であるか否かを判断する(ステップS21)。両立可能である場合(ステップS21でYES)、画像処理装置1による処理は、ステップS23へ進む。一方、両立不可能である場合(ステップS21でNO)、画面生成部26は、両立することができない操作項目のいずれか一方をユーザーに選択させるためのラジオボタンなどの画像コンテンツを表示領域AR1に配置する(ステップS22)。次に、画面生成部26は、表示領域AR1に、今回の表示対象である、第1画像コンテンツを配置する(ステップS23)。
【0094】
画面生成部26は、今回特定された特定操作項目に対応する設定機能が画像処理装置1に実装されているか否かを判断し(ステップS24)、未実装であれば(ステップS24でNO)、ステップS23で配置した第1画像コンテンツの表示態様を通常とは異なる態様に変更する(ステップS25)。尚、今回特定された特定操作項目に対応する設定機能が画像処理装置1に実装されている場合には(ステップS24でYES)、第1画像コンテンツの表示態様を通常の表示態様のままで維持する。
【0095】
次に画面生成部26は、利用履歴情報35を参照して、表示領域AR1に配置されている第1画像コンテンツの配置順序を利用頻度が高い順に並び替える(ステップS26)。尚、表示領域AR1に配置されている第1画像コンテンツの数が1つだけの場合、ステップS26の処理は行う必要がない。
【0096】
次に、画面生成部26は、画像コンテンツ抽出部24によって第3画像コンテンツが抽出されているか否かを判断する(ステップS27)。第3画像コンテンツが抽出されていなければ(ステップS27でNO)、ステップS31へ進む。これに対し、第3画像コンテンツが抽出されている場合(ステップS27でYES)、画面生成部26は、所定数以上の第3画像コンテンツが抽出されたか否かを判断する(ステップS28)。画面生成部26は、第3画像コンテンツが所定数以上抽出されていれば(ステップS28でYES)、詳細設定ボタンに対応する画像コンテンツB12を配置する(ステップS29)。これに対し、所定数以上抽出されていない場合(ステップS28でNO)、画面生成部26は、特定操作項目の近傍位置に、第3画像コンテンツを配置する(ステップS30)。このようにして第1操作画面G1が生成される。その後、画面生成部26は、画像コンテンツを配置した第1操作画面G1の操作画面データを生成し、表示制御部27へ出力する(ステップS31)。以上で、画面生成処理(ステップS8)が終了する。
【0097】
図15に戻り、画像処理装置1は、表示制御部27を機能させ、画面生成部26によって生成された第1操作画面G1を表示部11に表示させる(ステップS9)。次に、画像処理装置1は、操作検知部29によってユーザーによる操作が検知されたかどうかを確認する(ステップS10)。ユーザーの操作が検知されていない場合(ステップS10でNO)、画像処理装置1による処理はステップS3に戻る。そのため、ユーザーが音声入力を連続的に行った場合には、上述したステップS3~S9の処理が繰り返し行われることとなる。その結果、第1操作画面G1に表示される第1画像コンテンツが次第に増加していく。
【0098】
一方、操作検知部29によってユーザーの操作が検知されている場合(ステップS10でYES)、画像処理装置1は、その操作が画面更新を必要とする操作であるか否かを確認する(ステップS11)。画面更新を必要とする操作である場合(ステップS11でYES)、画像処理装置1は、画面生成部26を機能させて画面更新処理を実行させる(ステップS12)。
【0099】
図17は、画面生成部26によって実行される画面更新処理(ステップS12)の詳細な処理手順の一例を示すフローチャートである。画面生成部26は、画面更新処理を開始すると、ユーザーによって行われた操作が第1画像コンテンツに対する操作であるか否かを確認する(ステップS40)。ユーザーによって行われた操作が第1画像コンテンツに対する操作であり、プルダウンメニューに表示された第2画像コンテンツを選択する操作である場合は(ステップS40でYES)、画面生成部26は、第1画像コンテンツをユーザーによって選択された第2画像コンテンツに変更する(ステップS41)。一方、ユーザーによって行われた操作が第1画像コンテンツに対する操作でない場合は(ステップS40でNO)、画面生成部26は、その操作が第3画像コンテンツに対する操作であるか否かを確認する(ステップS42)。ユーザーによって行われた操作が第3画像コンテンツに対する操作であり、プルダウンメニューに表示された他の第3画像コンテンツを選択する操作である場合(ステップS42でYES)、画面生成部26は、第3画像コンテンツをユーザーによって選択された他の第3画像コンテンツに変更する(ステップS43)。一方、ユーザーによって行われた操作が第3画像コンテンツに対する操作でない場合は(ステップS42でNO)、画面生成部26は、その操作が詳細設定ボタンに対応する画像コンテンツB12に対する操作であるか否かを確認する(ステップS44)。ユーザーによって行われた操作が画像コンテンツB12に対する操作である場合(ステップS44でYES)、画面生成部26は、複数の第3画像コンテンツを配置した第2操作画面G2を生成する(ステップ45)。一方、ユーザーによって行われた操作が画像コンテンツB12に対する操作でない場合(ステップS44でNO)、画面生成部26は、追加ボタンに対応する画像コンテンツB8に対する操作であると判定する(ステップS46)。画面生成部26は、画像コンテンツ抽出部24によって抽出されていない画像コンテンツを配置した第3操作画面G3を生成する(ステップS47)。その後、画面生成部26は、上記のようにして生成した操作画面の操作画面データ6を表示制御部27に出力する(ステップS48)。以上で、画面更新処理(ステップS12)が終了する。
【0100】
再び図15に戻り、画像処理装置1は、表示制御部27を機能させて画面生成部26によって生成された操作画面を表示部11に表示させる(ステップS13)。これにより、表示部11に表示される操作画面は、ユーザーの操作に応じて更新されることになる。
【0101】
次に、画像処理装置1は、ユーザーによる操作がジョブの実行を指示するものであるか否かを判断する(ステップS14)。ユーザーによる操作がジョブの実行を指示するものでない場合(ステップS14でNO)、画像処理装置1による処理はステップS3に戻る。そして上述した処理を繰り返す。
【0102】
一方、ユーザーによる操作がジョブの実行を指示するものである場合(ステップS14でYES)、画像処理装置1は、ジョブ制御部28を機能させて各操作項目における設定をジョブ設定に反映させる(ステップS15)。ジョブ制御部28は、ユーザーによって選択された画像コンテンツに対応する設定値をジョブ設定に反映させるのである。その後、ジョブ制御部28はスキャナ部16、プリンタ部17及びFAX部18のそれぞれを駆動し、ユーザーによって指定されたジョブの実行を制御する。(ステップS16)。ジョブの実行が完了すると、画像処理装置1は音声入力モードがオン状態となったことに伴う処理を終了させる。
【0103】
以上のように本実施形態の画像処理装置1は、ユーザーが操作可能な操作画面を表示する表示部11と、画像コンテンツDB31を記憶する記憶部15と、ユーザーによる音声入力を受け付ける音声入力部14と、音声入力部14によって受け付けられる音声入力を解析し、複数の操作項目のうちから該音声入力に対応する操作項目を特定する音声解析部23と、画像コンテンツDB31から特定操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出部24と、画像コンテンツ抽出部24によって抽出される第1画像コンテンツを所定の表示領域AR1に配置した第1操作画面G1を生成する画面生成部26と、画面生成部26によって生成される第1操作画面G1を表示部11に表示させる表示制御部27と、を備えている。したがって、ユーザーが発した音声に対応する第1画像コンテンツを1つの画面に集約した第1操作画面G1を表示部11に表示することが可能である。そのため、ユーザーは第1操作画面G1を確認することで、自身の設定したジョブ設定の確認・変更が容易になり、ジョブ設定の漏れを減らすことができるのである。このとき、ユーザーが発した操作項目とは関係しない画像コンテンツは表示されないため、ユーザーは、自身で発声した操作項目に対応する画像コンテンツを簡単に確認することが可能である。それ故、操作効率が向上すると共に、ジョブの設定漏れなどが生じることを未然に防止することができるようになる。
【0104】
すなわち、本実施形態の画像処理装置1は、音声入力モードになると、操作画面における所定の表示領域AR1をブランク状態にして表示しておき、その後、ユーザーの音声に対応する操作項目が特定される度に、その特定された操作項目に対応する第1画像コンテンツを表示領域AR1に対して追加的に表示させていくのである。このような表示形態とすることにより、ユーザーは、自身の音声によって順次追加されていく操作項目が正しく認識されているかを1つずつ簡単に確認してくことが可能であり、ジョブの設定を音声操作で行う場合に、誤設定や設定漏れなどが生じ難くなるのである。
【0105】
(第2実施形態)
次に本発明の第2実施形態について説明する。上記第1実施形態では、画像処理装置1において、ユーザーの音声に対応する第1画像コンテンツを配置した第1操作画面G1を生成する例について説明した。これに対し、本実施形態では、音声入力モードにおいて表示部11に表示する画面を、画像処理装置1とは異なる情報処理装置100において生成する例について説明する。
【0106】
図18は、本実施形態における画像処理システム200の一構成例を示す図である。この画像処理システム200は、画像処理装置1aと、情報処理装置100とを備えており、これらが互いに通信可能な構成である。
【0107】
画像処理装置1aは、第1実施形態と同様に、MFPによって構成される装置である。この画像処理装置1aが第1実施形態で説明した画像処理装置1と異なる点は、ユーザーの音声に基づく音声データを情報処理装置100へ送信し、情報処理装置100から第1操作画面G1などの操作画面データを取得して表示部11に表示するように構成されている点にある。そのため、画像処理装置1aは、情報処理装置100と通信を行う通信部13に対して音声入力部14を接続した構成であり、音声入力部14においてユーザーの音声に基づく音声データが生成されると、その音声データを、通信部13を介して情報処理装置100へ送信するように構成される。また画像処理装置1aは、制御部19bを通信部13に接続しており、情報処理装置100から送信される操作画面データを制御部19bが受信できるようにしている。尚、本実施形態における制御部19bは、第1実施形態において説明した、音声解析部23、組合せ判定部25、画像コンテンツ抽出部24及び画面生成部26を備えていない構成として良い。
【0108】
情報処理装置100は、画像処理装置1aと通信を行うことにより、画像処理装置1aから受信する音声データに基づいて画像処理装置1aにおいて表示すべき操作画面を生成し、その操作画面に関する操作画面データを画像処理装置1aへ送信するように構成される。情報処理装置100は、1つの画像処理装置1aだけでなく、他の画像処理装置とも通信を行うことが可能である。すなわち、情報処理装置100は、複数の画像処理装置のそれぞれから音声データを受信し、各画像処理装置に対して操作画面データを送信することが可能である。このような情報処理装置100は、そのハードウェア構成として、通信部101と、制御部19aと、記憶部15とを備えている。
【0109】
通信部101は、画像処理装置1aと通信を行うためのインタフェースである。情報処理装置100は、この通信部101を介して、複数の画像処理装置のそれぞれと通信を行うことが可能である。
【0110】
記憶部15は、ハードディスクドライブ(HDD)やソリッドステートドライブ(SSD)などによって構成される不揮発性の記憶装置である。この記憶部15は、様々なプログラムやデータなどを記憶しておくものである。例えば記憶部15には、第1実施形態で説明した、音声入力DB30、画像コンテンツDB31、操作画面DB32、グループ情報33、組合せ情報34及び利用履歴情報35を記憶する。また記憶部15は、これ以外にも、例えば、図18に示すように情報処理装置100において実行されるプログラム21と、装置情報103とを記憶している。装置情報103には、例えば、複数の画像処理装置のそれぞれに関する識別情報、IPアドレス、機能情報などが記憶される。識別情報は、複数の画像処理装置のそれぞれを識別するための情報である。IPアドレスは、複数の画像処理装置のそれぞれと通信を行う際の宛先となる情報である。機種情報は、複数の画像処理装置のそれぞれにおいて実装されている設定機能などが予め登録された情報である。
【0111】
制御部19aは、図示を省略するCPUやメモリなどを備えて構成され、CPUがプログラム21を実行することにより、装置判別部102、音声解析部23、画像コンテンツ抽出部24、組合せ判定部25、画面生成部26及び表示制御部27として機能する。
【0112】
装置判別部102は、音声入力モードがオン状態となった画像処理装置1aと通信を開始する時に、装置情報103を参照して、通信相手である画像処理装置1aを特定し、画像処理装置1aにおいて実装されている設定機能などを特定する処理部である。
【0113】
尚、音声解析部23、画像コンテンツ抽出部24、組合せ判定部25、画面生成部26及び表示制御部27は、それぞれ、第1実施形態において説明したものと同様である。
【0114】
次に、上記のような情報処理装置100と画像処理装置1aで行われる動作について説明する。図19は、情報処理装置100及び画像処理装置1aで行われる動作プロセスを示す図である。まず、画像処理装置1aに対するユーザーの操作によって、画像処理装置1aが音声入力モードに移行する(プロセスP1)。画像処理装置1aは、音声入力モードに移行すると、情報処理装置100との接続状態CNを確立させる。接続状態CNが確立されると、情報処理装置100は、画像処理装置1aの表示部11に表示させる画面として初期画面G0を生成し(プロセスP2)、初期画面G0の操作画面データ6を画像処理装置1aへ送信する(プロセスP3)。操作画面データ6を受信した画像処理装置1aは、操作画面データ6に基づく初期画面G0を表示部11に表示する(プロセスP4)。表示部11に初期画面G0を表示した状態の画像処理装置1aは、ユーザーによる音声入力を受け付ける(プロセスP5)。ユーザーの音声入力を検知すると、画像処理装置1aは、ユーザーの音声に対応する音声データ5を生成し、その音声データ5を情報処理装置100へ送信する(プロセスP6)。音声データ5を受信した情報処理装置100は、音声解析部23を機能させて音声データ5の解析を行い、音声データ5に対応する操作項目を特定する(プロセスP7)。このとき、音声解析部23は、音声入力DB30に基づいて音声解析を行う。
【0115】
情報処理装置100は、音声データ5を解析することによって特定した操作項目(特定操作項目)に対応する第1画像コンテンツを画像コンテンツDB31から抽出し(プロセスP8)、第1画像コンテンツを配置した第1操作画面G1を生成する(プロセスP9)。このとき、情報処理装置100は、画像コンテンツ抽出部24及び画面生成部26などを機能させる。そして第1実施形態と同様の第1操作画面G1を生成する。つまり、情報処理装置100は、特定操作項目に対応する第1画像コンテンツを表示領域AR1に配置した第1操作画面G1を生成するのである。また情報処理装置100は、第1操作画面G1を生成するとき、第1実施形態で説明したように第3画像コンテンツなどを配置するようにしても良い。
【0116】
また、情報処理装置100は、装置情報103を参照し、特定操作項目に対応する設定機能が画像処理装置1aに実装されているか否かを判断し、特定操作項目に対応する設定機能が画像処理装置1aに実装されていない場合には、第1画像コンテンツの表示態様を通常とは異なる態様に変更した第1操作画面G1を生成する。
【0117】
その後、情報処理装置100は、第1操作画面G1の操作画面データ6を画像処理装置1aに送信する(プロセスP10)。第1操作画面G1の操作画面データ6を受信した画像処理装置1aは、操作画面データ6に基づき、第1操作画面G1を表示部11に表示する(プロセスP11)。尚、画像処理装置1aにおいてユーザーによる音声入力が連続的に行われる場合には、上述した処理(プロセスP5~P11)の処理が繰り返し行われる。
【0118】
次に、表示部11に第1操作画面G1を表示している状態において、画像処理装置1aは、ユーザーによる操作を検知すると(プロセスP12)、ユーザーによって行われた操作を示す操作情報7を情報処理装置100へ送信する。情報処理装置100は、操作情報7を受信すると、その操作情報7に基づく操作画面を生成する(プロセスP14)。つまり、ユーザーの操作を反映させた操作画面を生成するのである。尚、この場合に生成される具体的な操作画面は、第1実施形態で説明したものと同様である。そして情報処理装置100は、操作情報7に基づいて生成した操作画面の操作画面データ6を画像処理装置1aに送信する(プロセスP15)。画像処理装置1aは、操作情報7を送信した後、情報処理装置100から新たな操作画面データ6を受信すると、その操作画面データ6に基づく操作画面を表示部11に表示する(プロセスP16)。これにより、画像処理装置1aの表示部11において表示される操作画面は、ユーザーの操作を反映させた画面に更新される。
【0119】
次に情報処理装置100における具体的な動作の一例について説明する。図20は、情報処理装置100において行われる処理手順の一例を示すフローチャートである。この処理は、情報処理装置100が画像処理装置1aとの接続状態を確立することに伴って開始される処理である。情報処理装置100は、この処理を開始すると、まず画像処理装置1aとの接続状態CNを確立させたかどうかを判断する(ステップS100)。画像処理装置1aとの接続状態CNを確立させた場合(ステップS100でYES)、情報処理装置100は、画面生成部26を機能させて初期画面G0を生成する(ステップS101)。情報処理装置100は、初期画面G0を生成すると、初期画面G0の操作画面データ6を画像処理装置1aに送信する(ステップS102)。
【0120】
次に情報処理装置100は、画像処理装置1aから音声データ5を受信したか否かを判断する(ステップS103)。画像処理装置1aから音声データ5を受信していない場合(ステップS103でNO)、情報処理装置100による処理はステップS105に進む。一方、画像処理装置1aから音声データ5を受信している場合(ステップS103でYES)、情報処理装置100は、音声解析部23を機能させて音声解析を行い(ステップS4)、ユーザーが発した音声に対応する操作項目(特定操作項目)を特定する(ステップS5)。次に、画像処理装置1は、画像コンテンツ抽出部24を機能させ、特定操作項目に基づいて画像コンテンツを抽出する(ステップS7)。このとき、情報処理装置100は、グループ情報33を適宜参照し、特定操作項目に対応する第1画像コンテンツだけでなく、第2画像コンテンツや第3画像コンテンツも抽出する。次に、情報処理装置100は、画面生成部26を機能させて画面生成処理を行わせる(ステップS8)。尚、この画面生成処理の詳細は、図16に示したものと同様である。
【0121】
情報処理装置100は、第1操作画面G1を生成すると、その第1操作画面G1の操作画面データ6を生成し、画像処理装置1aへ送信する(ステップS104)。次に、情報処理装置100は、画像処理装置1aから操作情報7を受信したかどうかを判断する(ステップS105)。画像処理装置1aから操作情報7を受信していない場合(ステップS105でNO)、情報処理装置100による処理はステップS103に戻る。したがって、ユーザーが音声入力を連続的に行えば、第1操作画面G1において表示される特定操作項目が順次増加していく。
【0122】
一方、画像処理装置1aから操作情報7を受信している場合(ステップS105でYES)、情報処理装置100は、操作情報7を解析し、画面更新を必要とする操作であるか否かを確認する(ステップS11)。ユーザーの操作が画面更新を必要とする操作である場合(ステップS11でYES)、情報処理装置100は、画面生成部26を機能させ、画面更新処理を実行させる(ステップS12)。この画面更新処理の詳細は、図17に示したものと同様である。
【0123】
情報処理装置100は、操作画面を更新すると、その更新した操作画面の操作画面データ6を画像処理装置1aへ送信する(ステップS106)次に、情報処理装置100は、操作情報7を解析し、ユーザーの操作がジョブの実行を指示するものであるか否かを確認する(ステップS14)。ユーザーの操作がジョブの実行を指示するものでない場合(ステップS14でNO)、情報処理装置100による処理はステップS103に戻る。一方、ユーザーの操作がジョブの実行を指示するものである場合(ステップS14でYES)、情報処理装置100は、画像処理装置1aとの接続状態CNを切断し、画像処理装置1aと連携して行う処理を終了する。
【0124】
以上のように本実施形態の情報処理装置100は、画像コンテンツDB31を記憶する記憶部15と、画像処理装置1aが入力した音声データ5を画像処理装置1aから受信し、画面生成部26が生成した第1操作画面G1の操作画面データ6を送信する通信部101と、画像処理装置1aから受信する音声データ5を解析し、複数の操作項目のうちから音声データ5に対応する操作項目を特定する音声解析部23と、画像コンテンツDB31から特定操作項目に対応する第1画像コンテンツを抽出する画像コンテンツ抽出部24と、画像コンテンツ抽出部24によって抽出される第1画像コンテンツを所定の表示領域AR1に配置した第1操作画面G1を生成する画面生成部26と、を備えている。したがって、情報処理装置100は、画像処理装置1aに対してユーザーが発した音声に対応する第1画像コンテンツを1つの画面に集約した第1操作画面G1を生成し、その第1操作画面G1の操作画面データ6を画像処理装置1aに送信することが可能である。そのため、このような第1操作画面G1を生成することができない画像処理装置1aであっても、本実施形態の情報処理装置100と通信を行うことにより、このような第1操作画面G1を表示部11に表示することが可能である。そのため、ユーザーは第1操作画面G1を確認することで、容易に自身の所望するジョブ設定の確認・変更が可能となり、ジョブ設定の漏れを減らすことができるのである。
【0125】
(変形例)
以上、本発明に関する幾つかの実施形態について説明した。しかし、本発明は、上記各実施形態において説明した内容のものに限られるものではなく、種々の変形例が適用可能である。
【0126】
上記実施形態では、プログラム21が画像処理装置1又は情報処理装置100に予めインストールされている場合を例示した。しかし、プログラム21は、画像処理装置1又は情報処理装置100に予めインストールされているものに限られず、それ単独で取引の対象となるものであっても構わない。この場合、プログラム21は、インターネットなどを介してユーザー自身がダウンロードする形態で画像処理装置1又は情報処理装置100に提供されるものであっても良いし、CD-ROMなどのコンピュータ読み取り可能な記録媒体に記録された状態で画像処理装置1又は情報処理装置100に提供されるものであっても構わない。
【符号の説明】
【0127】
1 画像処理装置
5 音声データ
6 操作画面データ
7 操作情報
11 表示部(表示手段)
14 音声入力部(音声入力手段)
15 記憶部(記憶手段)
17 プリンタ部(画像形成手段)
20 音声出力部(音声出力手段)
21 プログラム
23 音声解析部(音声解析手段)
24 画像コンテンツ抽出部(画像コンテンツ抽出手段)
25 組合せ判定部(組合せ判定手段)
26 画面生成部(画面生成手段)
27 表示制御部(表示制御手段)
28 ジョブ制御部
29 操作検知部(操作検知手段)
31 画像コンテンツDB
100 情報処理装置
101 通信部(音声データ受信手段、操作画面送信手段)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20