IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コニカミノルタ株式会社の特許一覧

特許7408925ジョブ処理システム、音声通知方法、およびコンピュータプログラム
<>
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図1
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図2
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図3
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図4
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図5
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図6
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図7
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図8
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図9
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図10
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図11
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図12
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図13
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図14
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図15
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図16
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図17
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図18
  • 特許-ジョブ処理システム、音声通知方法、およびコンピュータプログラム 図19
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-25
(45)【発行日】2024-01-09
(54)【発明の名称】ジョブ処理システム、音声通知方法、およびコンピュータプログラム
(51)【国際特許分類】
   G06F 3/16 20060101AFI20231226BHJP
   H04N 1/00 20060101ALI20231226BHJP
   G10L 13/10 20130101ALI20231226BHJP
   G10L 15/22 20060101ALI20231226BHJP
【FI】
G06F3/16 540
H04N1/00 350
G10L13/10 114
G10L15/22 460D
G06F3/16 670
G06F3/16 620
【請求項の数】 15
(21)【出願番号】P 2019104461
(22)【出願日】2019-06-04
(65)【公開番号】P2020197973
(43)【公開日】2020-12-10
【審査請求日】2022-05-17
(73)【特許権者】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】100125117
【弁理士】
【氏名又は名称】坂田 泰弘
(74)【代理人】
【識別番号】100086933
【弁理士】
【氏名又は名称】久保 幸雄
(72)【発明者】
【氏名】南 啓太
【審査官】菅原 浩二
(56)【参考文献】
【文献】特開2001-022370(JP,A)
【文献】特開2006-038705(JP,A)
【文献】国際公開第2017/130486(WO,A1)
【文献】米国特許出願公開第2019/0019512(US,A1)
【文献】特開2003-058360(JP,A)
【文献】特開2012-194215(JP,A)
【文献】特開2000-194386(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
H04N 1/00
G10L 13/10
G10L 15/22
(57)【特許請求の範囲】
【請求項1】
音声による、ジョブ設定の第一の指令および前記ジョブ設定の内容の出力の第二の指令を受け付ける、受付手段と、
前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、
これから実行されるジョブについて前記第二の指令が前記受付手段によって受け付けられた受付回数が所定の値を超えていない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、超えている場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、
を有することを特徴とするジョブ処理システム。
【請求項2】
音声による、ジョブ設定の第一の指令、前記ジョブ設定の内容の出力の第二の指令、およびジョブの実行の指令である第三の指令を受け付ける、受付手段と、
前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、
前記第三の指令が前記受付手段によって受け付けられた第一の回数に対する、前記受付手段によって前記第二の指令が受け付けられた第二の回数の割合が所定の値を超えていない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、超えている場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、
を有することを特徴とするジョブ処理システム。
【請求項3】
音声による、ジョブ設定の第一の指令および前記ジョブ設定の内容の出力の第二の指令を受け付ける、受付手段と、
前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、
前記メッセージを表示するディスプレイと、
前記第二の指令が前記受付手段によって受け付けられた受付回数が所定の値を超え、かつ、前記ディスプレイにおいて本来の時間を経過しても前記メッセージが表示されない、という要件を満たさない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、満たす場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、
を有することを特徴とするジョブ処理システム。
【請求項4】
音声による、ジョブ設定の第一の指令および前記ジョブ設定の内容の出力の第二の指令を受け付ける、受付手段と、
前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、
これから実行されるジョブの設定内容についての前記第二の指令が所定の時間内に前記受付手段によって受け付けられた受付回数が所定の値以内でない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、前記受付回数が前記所定の値以内である場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、
を有することを特徴とするジョブ処理システム。
【請求項5】
音声による、ジョブ設定の第一の指令および前記ジョブ設定の内容の出力の第二の指令を受け付ける、受付手段と、
前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、
所定の時間内に前記第二の指令が複数回、前記受付手段によって受け付けられる出来事が起きた発生回数が所定の値以内でない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、前記発生回数が前記所定の値以内である場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、
を有することを特徴とするジョブ処理システム。
【請求項6】
ジョブ制御装置に関する情報を音声で知らせる音声通知方法であって、
音声による、ジョブ設定の第一の指令を受け付け、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付け、
これから実行されるジョブについて前記第二の指令が受け付けられた受付回数が所定の値を超えていない場合は音声で、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを第一の速度で音声再生装置に再生させ、超えている場合は音声で前記メッセージを前記第一の速度よりも速い第二の速度で前記音声再生装置に再生させる、
ことを特徴とする音声通知方法。
【請求項7】
ジョブ制御装置に関する情報を音声で知らせる音声通知方法であって、
音声による、ジョブ設定の第一の指令を受け付け、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付け、
音声による、ジョブの実行の指令である第三の指令を受け付け、
前記第三の指令が受け付けられた第一の回数に対する、前記第二の指令が受け付けられた第二の回数の割合が所定の値を超えていない場合は音声で、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを第一の速度で音声再生装置に再生させ、超えている場合は音声で前記メッセージを前記第一の速度よりも速い第二の速度で前記音声再生装置に再生させる、
ことを特徴とする音声通知方法。
【請求項8】
ジョブ制御装置に関する情報を音声で知らせる音声通知方法であって、
音声による、ジョブ設定の第一の指令を受け付け、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付け、
前記第二の指令が受け付けられた受付回数が所定の値を超え、かつ、前記ジョブ制御装置用のディスプレイにおいて本来の時間を経過しても受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージが前記ディスプレイに表示されない、という要件を満たさない場合は前記メッセージを第一の速度で音声再生装置に再生させ、満たす場合は前記メッセージを前記第一の速度よりも速い第二の速度で前記音声再生装置に再生させる、
ことを特徴とする音声通知方法。
【請求項9】
ジョブ制御装置に関する情報を音声で知らせる音声通知方法であって、
音声による、ジョブ設定の第一の指令を受け付け、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付け、
これから実行されるジョブの設定内容についての前記第二の指令が所定の時間内に受け付けられた受付回数が所定の値以内でない場合は音声で、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを第一の速度で音声再生装置に再生させ、前記受付回数が前記所定の値以内である場合は音声で前記メッセージを前記第一の速度よりも速い第二の速度で前記音声再生装置に再生させる、
ことを特徴とする音声通知方法。
【請求項10】
ジョブ制御装置に関する情報を音声で知らせる音声通知方法であって、
音声による、ジョブ設定の第一の指令を受け付け、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付け、
所定の時間内に前記第二の指令が複数回、受け付けられる出来事が起きた発生回数が所定の値以内でない場合は音声で、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを第一の速度で音声再生装置に再生させ、前記発生回数が前記所定の値以内である場合は音声で前記メッセージを前記第一の速度よりも速い第二の速度で前記音声再生装置に再生させる、
ことを特徴とする音声通知方法。
【請求項11】
ジョブ実行装置を制御するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
音声による、ジョブ設定の第一の指令を受け付ける、第一の受付処理を実行させ、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付ける、第二の受付処理を実行させ、
これから実行されるジョブについて前記第二の指令が受け付けられた受付回数が所定の値を超えていない場合は、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージが音声で第一の速度で再生されるように再生手段を制御し、超えている場合は前記メッセージが音声で前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する第一の制御処理を実行させ、
前記ジョブを実行する旨の第三の指令を受け付けた場合に前記ジョブが実行されるように前記ジョブ実行装置を制御する第二の制御処理を実行させる、
ことを特徴とするコンピュータプログラム。
【請求項12】
ジョブ実行装置を制御するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
音声による、ジョブ設定の第一の指令を受け付ける、第一の受付処理を実行させ、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付ける、第二の受付処理を実行させ、
音声による、ジョブの実行の指令である第三の指令を受け付ける、第三の受付処理を実行させ、
前記第三の指令が受け付けられた第一の回数に対する、前記第二の指令が受け付けられた第二の回数の割合が所定の値を超えていない場合は、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージが音声で第一の速度で再生されるように再生手段を制御し、超えている場合は前記メッセージが音声で前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する第一の制御処理を実行させ、
前記ジョブを実行する旨の第三の指令を受け付けた場合に前記ジョブが実行されるように前記ジョブ実行装置を制御する第二の制御処理を実行させる、
ことを特徴とするコンピュータプログラム。
【請求項13】
ジョブ実行装置を制御するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
音声による、ジョブ設定の第一の指令を受け付ける、第一の受付処理を実行させ、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付ける、第二の受付処理を実行させ、
前記第二の指令が受け付けられた受付回数が所定の値を超え、かつ、当該コンピュータ用のディスプレイにおいて本来の時間を経過しても受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージが前記ディスプレイに表示されない、という要件を満たさない場合は、受け付けた前記メッセージが音声で第一の速度で再生されるように再生手段を制御し、満たす場合は前記メッセージが音声で前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する第一の制御処理を実行させ、
前記ジョブを実行する旨の第三の指令を受け付けた場合に前記ジョブが実行されるように前記ジョブ実行装置を制御する第二の制御処理を実行させる、
ことを特徴とするコンピュータプログラム。
【請求項14】
ジョブ実行装置を制御するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
音声による、ジョブ設定の第一の指令を受け付ける、第一の受付処理を実行させ、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付ける、第二の受付処理を実行させ、
これから実行されるジョブの設定内容についての前記第二の指令が所定の時間内に受け付けられた受付回数が所定の値以内でない場合は、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージが音声で第一の速度で再生されるように再生手段を制御し、前記受付回数が前記所定の値以内である場合は前記メッセージが音声で前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する第一の制御処理を実行させ、
前記ジョブを実行する旨の第三の指令を受け付けた場合に前記ジョブが実行されるように前記ジョブ実行装置を制御する第二の制御処理を実行させる、
ことを特徴とするコンピュータプログラム。
【請求項15】
ジョブ実行装置を制御するコンピュータに用いられるコンピュータプログラムであって、
前記コンピュータに、
音声による、ジョブ設定の第一の指令を受け付ける、第一の受付処理を実行させ、
音声による、前記ジョブ設定の内容の出力の第二の指令を受け付ける、第二の受付処理を実行させ、
所定の時間内に前記第二の指令が複数回、受け付けられる出来事が起きた発生回数が所定の値以内でない場合は、受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージが音声で第一の速度で再生されるように再生手段を制御し、前記発生回数が前記所定の値以内である場合は前記メッセージが音声で前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する第一の制御処理を実行させ、
前記ジョブを実行する旨の第三の指令を受け付けた場合に前記ジョブが実行されるように前記ジョブ実行装置を制御する第二の制御処理を実行させる、
ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ジョブを実行する装置で用いられる音声UIに関する。
【背景技術】
【0002】
音声UI(User Interface)の技術が普及している。音声UIによると、ユーザは、音声によって装置に指令を与えたり、情報を音声によって受け取ったりすることができる。
【0003】
特に近年、AI(Artificial Intelligence)、音声処理、IoT(Internet of Things)、およびクラウドコンピューティングなどの進歩に伴い、音声UIがますます発達している。その一例が、スマートスピーカである。さらに、音声UIの適用先が増えている。
【0004】
特許文献1に記載される複合装置は、各種操作用の複数のアイテムを読み上げ画面として表示し、読み上げ画面の各アイテムに対する音声ガイダンスを出力する。この際、複合装置は、判定値保持部に記憶されている読み上げ画面の読み上げ制限値と判定値保持部に記憶されている読み上げ画面を複数に分割したガイダンスウィンドウ毎に割り付けられた読み上げ速度係数に基づいて各ガイダンスウィンドウの読み上げ速度を算出し、該算出した読み上げ速度に従って各ガイダンスウィンドウの音声ガイダンスを音声辞書保持部、音声合成部及び音声出力部によって行う。
【0005】
特許文献2に記載される記憶支援システムにおいて、音声単位取得部は、原音声を所定の区切り条件で以て分割して音声単位を取得する。速度調整部及び音声再生部は、この音声単位のうち、人間の短期記憶の限度以上の長さを有する音声単位に関し、その再生時間が所定時間内に収まるように再生速度を上げて再生する。学習者は、各音声単位が音声出力部を通して出力された後に、同じ音声を繰り返して発声する。関連画像表示部は、音声単位の再生と同時に、その意味に対応した画像を表示部上に表示させることで、学習者が概念を理解できるように支援することもできる。
【0006】
特許文献3に記載される音声案内装置は、使用者により任意の音声を登録可能な入力手段としてのマイクとこのマイクにより入力された音声を登録する記憶手段としての音声ICと、この音声ICに登録された音声を再生する出力手段としてのスピーカと、これら各手段を制御する制御手段としての制御装置を備え、制御装置は、音声ICに登録された音声を出力手段にて再生することにより、音声案内を行うと共に、この音声案内を再生する際、選択可能な通常モードと高齢者モードを有する。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2009-296103号公報
【文献】特開2010-191235号公報
【文献】特開2010-230245号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来、音声UIは、ジョブを実行する装置を操作するために主に視覚障碍者によって使用されていたが、上述のように音声UIの発達に伴い、様々なユーザによって使用されるようになっている。そこで、ユーザごとに使用しやすい音声UIが求められる
本発明は、このような課題に鑑み、ジョブを実行する装置とともに使用される音声UIを従来よりも使用しやすくすることを目的とする。
【課題を解決するための手段】
【0009】
本発明の一形態に係るジョブ処理システムは、音声による、ジョブ設定の第一の指令および前記ジョブ設定の内容の出力の第二の指令を受け付ける、受付手段と、前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、これから実行されるジョブについて前記第二の指令が前記受付手段によって受け付けられた受付回数が所定の値を超えていない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、超えている場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、を有する。
【0010】
本発明の他の一形態に係るジョブ処理システムは、音声による、ジョブ設定の第一の指令前記ジョブ設定の内容の出力の第二の指令、およびジョブの実行の指令である第三の指令を受け付ける、受付手段と、前記受付手段により受け付けた前記第二の指令に係る前記ジョブ設定の内容に関するメッセージを、音声によって出力する再生手段と、前記第三の指令が前記受付手段によって受け付けられた第一の回数に対する、前記受付手段によって前記第二の指令が受け付けられた第二の回数の割合が所定の値を超えていない場合は前記メッセージが第一の速度で再生されるように前記再生手段を制御し、超えている場合は前記メッセージが前記第一の速度よりも速い第二の速度で再生されるように前記再生手段を制御する、制御手段と、を有する。
【発明の効果】
【0011】
本発明によると、ジョブを実行する装置とともに使用される音声UIをユーザにとって従来よりも使用しやすくすることができる。
【図面の簡単な説明】
【0012】
図1】画像処理システムの全体的な構成の例を示す図である。
図2】画像形成装置のハードウェア構成の例を示す図である。
図3】スマートスピーカのハードウェア構成の例を示す図である。
図4】サーバのハードウェア構成の例を示す図である。
図5】画像形成装置、スマートスピーカ、およびサーバそれぞれの機能的構成の例を示す図である。
図6】画像形成装置の全体的な処理の流れの例を説明するためのフローチャートである。
図7】スマートスピーカの全体的な処理の流れの例を説明するためのフローチャートである。
図8】サーバの全体的な処理の流れの例を説明するためのフローチャートである。
図9】画像形成装置、スマートスピーカ、およびサーバそれぞれの機能的構成の例を示す図である。
図10】設定確認回数およびジョブ指示回数の例を示す図である。
図11】画像形成装置の全体的な処理の流れの例を説明するためのフローチャートである。
図12】サーバの全体的な処理の流れの例を説明するためのフローチャートである。
図13】サーバの全体的な処理の流れの例を説明するためのフローチャートである。
図14】画像形成装置、スマートスピーカ、およびサーバそれぞれの機能的構成の例を示す図である。
図15】フラグの例を示す図である。
図16】速度決定処理の流れの例を説明するためのフローチャートである。
図17】画像形成装置の全体的な処理の流れの例を説明するためのフローチャートである。
図18】サーバの全体的な処理の流れの例を説明するためのフローチャートである。
図19】画像形成装置に設定されているジョブの条件を示す画面の例を示す図である。
【発明を実施するための形態】
【0013】
〔第一の実施形態〕
図1は、画像処理システム4の全体的な構成の例を示す図である。図2は、画像形成装置1のハードウェア構成の例を示す図である。図3は、スマートスピーカ2のハードウェア構成の例を示す図である。図4は、サーバ3のハードウェア構成の例を示す図である。図5は、画像形成装置1、スマートスピーカ2、およびサーバ3それぞれの機能的構成の例を示す図である。
【0014】
画像処理システム4は、図1に示すように、画像形成装置1、スマートスピーカ2、サーバ3、および通信回線48などによって構成される。画像処理システム4は、画像に関する処理を行うシステムであって、画像をシートに印刷したり、シートに記されている画像を電子化して保存しまたは送信したりする。
【0015】
画像処理システム4の各装置は、通信回線48を介して通信を行うことができる。通信回線48として、インターネット、イーサネット(登録商標)回線、または無線LAN(Local Area Network)などが用いられる。
【0016】
画像形成装置1は、一般に「MFP(Multi Function Peripheral)」または「複合機」などと呼ばれる装置であって、コピー、ネットワークプリント、ファクシミリ、スキャン、およびドキュメントサーバなどの機能を集約した装置である。
【0017】
ネットワークプリント機能は、パーソナルコンピュータまたはスマートフォンなどの端末装置からプリントサーバを介して画像ファイルを受信し画像をシートに印刷する機能である。
【0018】
画像形成装置1は、図2に示すように、CPU(Central Processing Unit)10a、RAM(Random Access Memory)10b、ROM(Read Only Memory)10c、補助記憶装置10d、ネットワークインタフェース10e、モデム10f、USB(Universal Serial Bus)ボード10g、タッチパネルディスプレイ10h、操作キーパネル10i、スキャンユニット10j、プリントユニット10k、およびフィニッシャ10mなどによって構成される。
【0019】
ネットワークインタフェース10eは、TCP/IP(Transmission Control Protocol/Internet Protocol)などのプロトコルでスマートスピーカ2およびサーバ3などと通信する。ネットワークインタフェース10eとして、NIC(Network Interface Card)または無線LANボードなどが用いられる。
【0020】
モデム10fは、ファクシミリ端末との間でG3などのプロトコルで画像データをやり取りする。
【0021】
USBボード10gは、USBの規格に基づいてUSBメモリまたはカードリーダライタなどの周辺機器と通信する。スマートスピーカ2をUSBケーブルでUSBボード10gに繋ぎ、スマートスピーカ2と通信してもよい。
【0022】
タッチパネルディスプレイ10hは、画像形成装置1の筐体の正面側に設けられており、ユーザに対するメッセージを示す画面、ユーザがコマンドまたは情報を入力するための画面、およびCPU10aが実行した処理の結果を示す画面などを表示する。また、タッチパネルディスプレイ10hは、タッチされた位置を示す信号をCPU10aへ送る。
【0023】
操作キーパネル10iは、いわゆるハードウェアキーボードであって、テンキー、スタートキー、ストップキー、およびファンクションキーなどによって構成される。
【0024】
スキャンユニット10jは、シートに記されている画像を読み取って画像データを生成する。
【0025】
プリントユニット10kは、スキャンユニット10jによって読み取られた画像のほか、ネットワークインタフェース10e、モデム10f、またはUSBボード10gによって他の装置から受信した画像データに示される画像をシートに印刷する。
【0026】
フィニッシャ10mは、プリントユニット10kによって画像が印刷されたシートに対して、必要に応じて後処理を施す。後処理は、ステープルで綴じる処理、パンチ穴を開ける処理、または折り曲げる処理などである。
【0027】
ROM10cまたは補助記憶装置10dには、コピーおよびネットワークプリントなど上述の各機能を実現するためのプログラムが記憶されている。特に、音声操作サービスをスマートスピーカ2およびサーバ3と連携してユーザへ提供するための連携プログラム100(図5参照)が記憶されている。「音声操作サービス」は、音声でユーザがコマンドを入力できるようにしたり音声でユーザに設定の内容などを案内したりするサービスである。
【0028】
これらのプログラムは、RAM10bにロードされ、CPU10aによって実行される。補助記憶装置10dとして、HDD(Hard Disk Drive)またはSSD(Solid State Drive)などが用いられる。
【0029】
スマートスピーカ2は、音声による対話型の操作に対応した音声UI(User Interface)であって、「AI(Artificial Intelligence)スピーカ」と呼ばれることもある。
【0030】
スマートスピーカ2は、図3に示すように、CPU20a、RAM20b、ROM20c、ネットワークインタフェース20d、マイクロフォン20e、A/D(analogue/digital)変換器20f、D/A(digital/analogue)変換器20g、およびスピーカ20hなどによって構成される。
【0031】
ROM20cには、音声操作サービスのための連携プログラム200(図5参照)が記憶されている。連携プログラム200は、RAM20bにロードされ、CPU20aによって実行される。
【0032】
ネットワークインタフェース20dは、NICまたは無線LANボードであって、画像形成装置1およびサーバ3などと通信する。
【0033】
マイクロフォン20eは、ユーザの音声を集音しアナログ信号に変換する。A/D変換器20fは、ユーザの音声のアナログ信号をデジタル信号に変換する。
【0034】
D/A変換器20gは、サーバ3から送信されてきた、音声のデジタル信号をアナログ信号に変換する。スピーカ20hは、D/A変換器20gによって得られたアナログ信号に基づいて音声を出力する。
【0035】
サーバ3は、ドキュメントのデータを管理したり種々のジョブを画像形成装置1に与えたりする。サーバ3として、いわゆるサーバ機またはクラウドサーバなどが用いられる。以下、サーバ3としてサーバ機が用いられる場合を例に説明する。
【0036】
サーバ3は、図4に示すように、CPU30a、RAM30b、ROM30c、補助記憶装置30d、およびネットワークインタフェース30eなどによって構成される。
【0037】
ROM30cまたは補助記憶装置30dには、音声操作サービスのための連携プログラム300(図5参照)が記憶されている。連携プログラム300は、RAM30bにロードされ、CPU30aによって実行される。
【0038】
ネットワークインタフェース30eは、NICであって、画像形成装置1およびスマートスピーカ2などと通信する。
【0039】
連携プログラム100によると、図5に示す条件設定部101、設定内容回答部102、およびジョブ実行部103などが画像形成装置1に実現される。
【0040】
連携プログラム200によると、指示データ送信部201および音声再生制御部202などがスマートスピーカ2に実現される。
【0041】
連携プログラム300によると、カウンタ301、コマンド等特定部302、条件設定指令部303、メッセージ生成部304、再生速度決定部305、音声データ生成部306、音声データ送信部307、およびジョブ開始指令部308などがサーバ3に実現される。
【0042】
以下、図5に示す、画像形成装置1、スマートスピーカ2、およびサーバ3それぞれの機能について説明する。
【0043】
ユーザは、画像形成装置1に対するコマンドを声でスマートスピーカ2に入力することができる。この際に適宜、パラメータも入力する。例えば、コピーの条件を設定する場合は、「コピー 3部 両面 設定」のように、ジョブの種類および条件のパラメータに続けて「設定」というコマンドをスマートスピーカ2へ向かって発声する。または、コピーを開始する場合は、「コピー 開始」のように、ジョブの種類のパラメータに続けて「開始」というコマンドをスマートスピーカ2へ向かって発声する。または、コピーについて設定した条件を音声で出力する場合は、「コピー 条件出力」のように、ジョブの種類のパラメータに続けて「条件出力」というコマンドをスマートスピーカ2へ向かって発声する。
【0044】
すると、スマートスピーカ2において、マイクロフォン20eによってユーザの声が集音され、A/D変換器20fによってデジタル信号に変換される。
【0045】
そして、指示データ送信部201は、デジタル信号をコマンドデータ5Aとしてサーバ3へ送信する。
【0046】
サーバ3において、カウンタ301は、受付回数Xaを変数として有し、条件出力のコマンドを受け付けた回数をカウントする。受付回数Xaの初期値は、「0」である。また、後述するように、カウンタ301は、受付回数Xaを所定のタイミングで「0」にリセットする。
【0047】
コマンド等特定部302は、コマンドデータ5Aを受信すると、コマンドデータ5Aを公知の音声認識の技術を用いて解析することによって、ユーザがスマートスピーカ2に入力したパラメータおよびコマンドを特定し、そのパラメータおよびコマンドを示すテキストデータ5Bを生成する。
【0048】
条件設定指令部303は、テキストデータ5Bに示されるコマンドが画像形成装置1に条件を設定するコマンドである場合に、設定指令データ5Cを生成し画像形成装置1へ送信する。
【0049】
設定指令データ5Cには、テキストデータ5Bにパラメータとして示されるジョブの種類および条件が示される。例えば、テキストデータ5Bに「コピー 3部 両面 設定」が示される場合は、「コピー 3部 両面」を示すデータが設定指令データ5Cとして画像形成装置1へ送信される。
【0050】
画像形成装置1において、条件設定部101は、サーバ3から設定指令データ5Cを受信すると、設定指令データ5Cに示されるジョブの種類および条件に基づいて設定を行う。例えば、設定指令データ5Cに「コピー 3部 両面」と示される場合は、コピーの部数および印刷面の条件としてそれぞれ「3部」および「両面」を設定する。
【0051】
サーバ3において、メッセージ生成部304は、テキストデータ5Bに示されるコマンドが、スマートスピーカ2からメッセージを音声で出力させるコマンドである場合に、そのメッセージをテキストで表わすメッセージデータ5Dを生成する。
【0052】
例えば、テキストデータ5Bに示されるコマンドが「条件出力」である場合に、メッセージ生成部304は、次のようにメッセージデータ5Dを生成する。なお、この場合において、カウンタ301は、再生速度決定部305が再生速度Sを決定する処理を開始する前に受付回数Xaに「1」を足す。
【0053】
メッセージ生成部304は、現在設定されている条件を画像形成装置1へ問い合わせる。この際に、テキストデータ5Bにパラメータとして示されるジョブの種類を示す条件問合データ5Eを画像形成装置1へ送信する。例えば、テキストデータ5Bに「コピー 条件出力」が示される場合は、「コピー」を示すデータを条件問合データ5Eとして画像形成装置1へ送信する。
【0054】
画像形成装置1において、設定内容回答部102は、サーバ3から条件問合データ5Eを受信すると、条件問合データ5Eに示される種類のジョブについて現在設定されている条件をチェックし、その条件を示す条件回答データ5Fをサーバ3へ送信する。
【0055】
条件回答データ5Fには、そのジョブに関するすべての項目の条件が示されていてもよいし、デフォルト値とは異なる条件のみが示されていてもよい。
【0056】
例えば、コピーについての項目が「読取解像度」、「部数」、「印刷面」、「カラー」、および「拡大縮小」であり、各項目のデフォルト値が「200dpi」、「1部」、「片面」、「オートカラー」、および「100%」であり、かつ、部数および印刷面の条件として現在「3部」および「両面」が設定されている場合は、「読取解像度=200dpi,部数=3部,印刷面=両面,カラー=オートカラー,拡大縮小=100%」を示すデータを条件回答データ5Fとして送信してもよい。または、「部数=3部,印刷面=両面」を示すデータを条件回答データ5Fとして送信してもよい。
【0057】
サーバ3において、メッセージ生成部304は、条件回答データ5Fを受信すると、条件回答データ5Fに示される条件を表わすメッセージのデータをメッセージデータ5Dとして生成する。例えば、「読取解像度は200dpi、部数は3部、印刷面は両面、カラーはオートカラー、拡大縮小は100%です。」のようなメッセージのデータをメッセージデータ5Dとして生成する。
【0058】
なお、条件回答データ5Fにデフォルト値とは異なる条件のみが示されている場合は、デフォルト値を補ってメッセージデータ5Dを生成してもよい。例えば、条件回答データ5Fに「部数=3部,印刷面=両面」のみが示される場合は、デフォルト値「読取解像度=200dpi,カラー=オートカラー,拡大縮小=100%」を補い、「読取解像度は200dpi、部数は3部、印刷面は両面、カラーはオートカラー、拡大縮小は100%です。」というメッセージのテキストデータをメッセージデータ5Dとして生成してもよい。各種類のジョブの各項目のデフォルト値は、予めサーバ3の所定のディレクトリに記憶させておけばよい。
【0059】
または、テキストデータ5Bに示されるコマンドが「条件出力」以外の、スマートスピーカ2からメッセージを音声で出力させるコマンドである場合は、メッセージ生成部304は、そのコマンドに応じてメッセージデータ5Dを生成する。例えば、「現在時刻出力」である場合は、現在の時刻を示すデータをメッセージデータ5Dとして生成する。現在の時刻は、サーバ3の時計またはNTP(Network Time Protocol)サーバなどに確認すればよい。
【0060】
再生速度決定部305は、メッセージを再生する速度(以下、「再生速度S」と記載する。)を次のように決定する。受付回数Xaが所定の回数Ta未満である場合は、再生速度Sを中速に決定する。「中速」は、一般的な会話の速度であって、例えば、300文字/分である。受付回数Xaが所定の回数Ta以上である場合は、再生速度Sを高速に決定する。「高速」は、中速よりも速く、例えば、450文字/分である。「所定の回数Ta」は、管理者が任意に設定することができるが、例えば、2回、である。
【0061】
このように再生速度Sを決定する理由は、次の通りである。これから実行させるジョブについて設定されている条件を所定の回数以上確認するユーザは、視覚障碍者またはタッチパネルディスプレイ10hを使用しない人であると考えられる。このようなユーザは、スマートスピーカ2によって再生される音声を聞き慣れているので、標準的な速度で音声が再生されると遅く感じる。そこで、再生速度決定部305は、受付回数Xaが所定の回数Ta以上であればログインユーザが視覚障碍者またはタッチパネルディスプレイ10hを使用しない人であると推定し、再生速度Sを高速に決定する。
【0062】
音声データ生成部306は、メッセージ生成部304によって生成されたメッセージデータ5Dに示されるメッセージを、再生速度決定部305によって決定された再生速度Sで読み上げるための音声データ5Gを生成する。音声データ5Gは、公知の音声合成技術によって生成すればよい。
【0063】
なお、メッセージがジョブの条件に関するものでない場合(つまり、テキストデータ5Bに示されるコマンドが「条件出力」でない場合)は、再生速度決定部305による処理をスキップし、音声データ生成部306は、再生速度Sに関わらず中速でメッセージが読み上げられるように音声データ5Gを生成してもよい。
【0064】
音声データ送信部307は、音声データ生成部306によって生成された音声データ5Gをスマートスピーカ2へ送信する。
【0065】
スマートスピーカ2において、音声再生制御部202は、音声データ5Gをサーバ3から受信すると、音声データ5Gに基づいてメッセージが音声として再生されるように処理を行う。具体的には、D/A変換器20gによって音声データ5Gをアナログ信号に変換し、スピーカ20hによってアナログ信号に基づいて音声を出力する。これにより、受付回数Xaに応じた速度の音声でメッセージがユーザに伝えられる。
【0066】
サーバ3において、ジョブ開始指令部308は、テキストデータ5Bに示されるコマンドが、画像形成装置1にジョブを開始させるものである場合は、ジョブを開始するように画像形成装置1に指令する。この際に、ジョブ指令データ5Hを画像形成装置1へ送信する。ジョブ指令データ5Hには、テキストデータ5Bにパラメータとして示される種類が示される。例えば、テキストデータ5Bに「コピー 開始」が示される場合は、「コピー」を示すデータがジョブ指令データ5Hとして送信される。
【0067】
画像形成装置1において、ジョブ実行部103は、サーバ3からジョブ指令データ5Hを受信すると、ジョブ指令データ5Hに示される種類のジョブが、その種類について現在設定されている条件に従って実行されるように、画像形成装置1の各部を制御する。
【0068】
なお、ジョブ開始指令部308によって画像形成装置1に対してジョブの開始が指令されたら、カウンタ301は、受付回数Xaを「0」にリセットする。また、画像形成装置1において、ジョブの設定値がデフォルト値にリセットされる。
【0069】
また、所定の時間(例えば、10分)以上、スマートスピーカ2からデータが送信されてこなかった場合、画像形成装置1においてジョブの設定値がデフォルト値にリセットされた場合、および受付回数Xaをリセットするためのコマンドがテキストデータ5Bに示される場合にも、カウンタ301は、受付回数Xaを「0」にリセットしてもよい。
【0070】
図6は、画像形成装置1の全体的な処理の流れの例を説明するためのフローチャートである。図7は、スマートスピーカ2の全体的な処理の流れの例を説明するためのフローチャートである。図8は、サーバ3の全体的な処理の流れの例を説明するためのフローチャートである。
【0071】
次に、画像形成装置1、スマートスピーカ2、およびサーバ3それぞれの全体的な処理の流れを、フローチャートを参照しながら説明する。
【0072】
画像形成装置1は、図6に示す手順の処理を連携プログラム100に基づいて実行する。スマートスピーカ2は、図7に示す手順の処理を連携プログラム200に基づいて実行する。サーバ3は、図8に示す手順の処理を連携プログラム300に基づいて実行する。
【0073】
ユーザは、スマートスピーカ2に向かって発声することによって、画像形成装置1にジョブの条件を設定したり、画像形成装置1に設定されている条件を確認したり、画像形成装置1にジョブを実行させたりすることができる。
【0074】
スマートスピーカ2は、ユーザが発した声をデジタル化することによってコマンドデータ5Aを生成しサーバ3へ送信する(図7の#721)。
【0075】
サーバ3は、コマンドデータ5Aを受信するごとに、コマンドデータ5Aをテキストデータ5Bに変換する(図8の#731)。そして、テキストデータ5Bに示される内容つまりユーザが発声した内容に応じて次のように処理を行う。
【0076】
テキストデータ5Bに示されるコマンドが画像形成装置1に条件を設定するコマンドである場合は(#732でYes)、サーバ3は、設定指令データ5Cを画像形成装置1へ送信することによって、条件を設定するように画像形成装置1へ指令する(#733)。設定指令データ5Cには、テキストデータ5Bにパラメータとして示されるジョブの種類および条件が示される。
【0077】
画像形成装置1は、サーバ3からデータを受信するごとに次のように処理を行う。設定指令データ5Cを受信した場合は(図6の#711でYes)、設定指令データ5Cに示される種類のジョブの条件として、設定指令データ5Cに示される条件を設定する(#712)。
【0078】
または、テキストデータ5Bに示されるコマンドがスマートスピーカ2からメッセージを音声で出力させるコマンドである場合は(#734でYes)、サーバ3は、メッセージデータ5Dを次のように生成する。
【0079】
ジョブの条件を音声で出力させる場合は(#735でYes)、サーバ3は、受付回数Xaに「1」を足す(#736)。さらに、サーバ3は、画像形成装置1へジョブの条件を問い合わせ、画像形成装置1からの回答に基づいてメッセージデータ5Dを生成する(#737)。
【0080】
問合せの際に、サーバ3は、条件問合データ5Eを画像形成装置1へ送信する。条件問合データ5Eには、テキストデータ5Bに示される種類が示される。
【0081】
画像形成装置1は、条件問合データ5Eを受信すると(#713でYes)、条件回答データ5Fをサーバ3へ送信する(#714)。条件回答データ5Fには、条件問合データ5Eに示される種類のジョブについて設定されている条件が示される。そして、メッセージデータ5Dがサーバ3によって条件回答データ5Fに基づいて生成される。
【0082】
一方、ジョブの条件以外の事項を音声で出力させる場合は(#735でNo)、サーバ3は、その事項を示すデータをメッセージデータ5Dとして生成する(#738)。
【0083】
サーバ3は、受付回数Xaが所定の回数Ta(例えば、2回)未満であれば(#739でYes)、再生速度Sを中速に決定し(#740)、所定の回数Ta以上であれば(#739でNo)、再生速度Sを高速に決定する(#741)。
【0084】
そして、サーバ3は、メッセージデータ5Dに示されるメッセージを再生速度Sで読み上げるための音声データ5Gを生成し、スマートスピーカ2へ送信する(#742)。なお、メッセージデータ5Dがステップ#738で生成されたものである場合は、ステップ#739~#741の処理をスキップし、中速で読み上げるためのデータを音声データ5Gとして生成してもよい。
【0085】
スマートスピーカ2は、音声データ5Gを受信すると(#722)、音声データ5Gに基づいてメッセージを音声で再生する(#723)。
【0086】
または、テキストデータ5Bに示されるコマンドが画像形成装置1にジョブを開始させるものである場合は(#743でYes)、サーバ3は、ジョブを開始するように画像形成装置1に指令する(#744)。この際に、ジョブ指令データ5Hを画像形成装置1へ送信する。ジョブ指令データ5Hには、テキストデータ5Bにパラメータとして示される種類が示される。そして、受付回数Xaをリセットする(#745)。
【0087】
画像形成装置1は、サーバ3からジョブ指令データ5Hを受信すると(#715でYes)、ジョブ指令データ5Hに示される種類のジョブを、現在設定されている条件に従って実行する(#716)。
【0088】
なお、画像形成装置1は、ステップ#716の前すなわちジョブを開始する前に、そのジョブについて設定されている条件をスマートスピーカ2から音声によって出力させてもよい。そして、ユーザが「OK」または「了解」などを音声でスマートスピーカ2に入力しまたはタッチパネルディスプレイ10hに手で入力した場合に、画像形成装置1は、そのジョブを開始してもよい。ユーザが「NG」または「キャンセル」などをスマートスピーカまたはタッチパネルディスプレイ10hへ入力した場合は、そのジョブを中止しまたは保留し、ステップ#711へ戻ればよい。
【0089】
または、サーバ3が、ステップ#744の前すなわちジョブ指令データ5Hを送信する前に、同様に条件をスマートスピーカ2から音声によって出力させ、ユーザがユーザが「OK」または「了解」などを同様に入力した場合にジョブ指令データ5Hを送信してもよい。
【0090】
〔第二の実施形態〕
図9は、画像形成装置1、スマートスピーカ2、およびサーバ3それぞれの機能的構成の例を示す図である。図10は、設定確認回数Xbおよびジョブ指示回数Xcの例を示す図である。
【0091】
第一の実施形態では、再生速度決定部305は、受付回数Xaが所定の回数Ta未満であるか否かによって再生速度Sを決定した。しかし、「条件出力」のコマンドを受ける頻度が所定の頻度未満であるか否かによって再生速度Sを決定してもよい。以下、この仕組みを説明する。第一の実施形態と重複する点は、説明を省略する。
【0092】
画像処理システム4の全体的な構成は、第一の実施形態と同様であり、図1に示した通りである。画像形成装置1、スマートスピーカ2、およびサーバ3のハードウェアの構成も第一の実施形態と同様であり、それぞれ、図2図3、および図4に示した通りである。
【0093】
画像形成装置1のROM10cまたは補助記憶装置10dには、連携プログラム100の代わりに連携プログラム150が記憶されている。連携プログラム150によると、図9に示す条件設定部151、設定内容回答部152、ジョブ実行部153、およびログイン通知部154などが画像形成装置1に実現される。
【0094】
サーバ3のROM30cまたは補助記憶装置30dには、連携プログラム300の代わりに連携プログラム350が記憶されている。連携プログラム350によると、図9に示すカウンタ351、コマンド等特定部352、条件設定指令部353、メッセージ生成部354、再生速度決定部355、音声データ生成部356、音声データ送信部357、ジョブ開始指令部358、およびログイン処理部359などがサーバ3に実現される。
【0095】
スマートスピーカ2のROM20cには、第一の実施形態と同様に、連携プログラム200が記憶されている。
【0096】
画像形成装置1において、条件設定部151、設定内容回答部152、およびジョブ実行部153は、それぞれ、第一の実施形態の条件設定部101、設定内容回答部102、およびジョブ実行部103(図5参照)と同様の処理を行う。
【0097】
各ユーザには予め、それぞれを識別するためのユニークなIDであるユーザコードが与えられている。
【0098】
ログイン通知部154は、ユーザが画像形成装置1にログインした際に、このユーザのユーザコードを示すログイン通知データ5Jをサーバ3へ送信する。また、ユーザが画像形成装置1からログアウトした際に、このユーザのユーザコードを示すログアウト通知データ5Kをサーバ3へ送信する。
【0099】
なお、ユーザは、スマートスピーカ2に対して所定の言葉を発声することによって、画像形成装置1にログインすることができる。例えば、ログインおよびログアウトの際に、それぞれ「ログイン」および「ログアウト」と発声する。
【0100】
すると、スマートスピーカ2は、音声を集音して電子データ化し、画像形成装置1へ送信する。画像形成装置1には予め、ユーザごとの声紋が記憶されている。画像形成装置1は、声紋およびスマートスピーカ2から受信した電子データに基づいてユーザを判別し、ユーザを画像形成装置1にログインさせまたはログアウトさせる。
【0101】
そのほか、ユーザは、タッチパネルディスプレイ10hに自分のユーザコードおよびパスワードを入力することによって画像形成装置1へログインし、所定のコマンドを入力することによって画像形成装置1からログアウトすることができる。または、画像形成装置1にカードリーダが備わっている場合は、自分のIC(Integrated Circuit)カードに記録されているユーザコードをカードリーダに読み取らせることによって、画像形成装置1へログインしまたは画像形成装置1からログアウトすることができる。
【0102】
サーバ3において、ログイン処理部359は、ログイン通知データ5Jを画像形成装置1から受信すると、ログイン通知データ5Jに示されるユーザコードのユーザをサーバ3にもログインさせる。また、ログアウト通知データ5Kを画像形成装置1から受信すると、ログアウト通知データ5Kに示されるユーザコードのユーザをサーバ3からもログアウトさせる。以下、サーバ3にログインした状態であるユーザを「ログインユーザ」と記載する。
【0103】
カウンタ351は、予め、図10に示すようにユーザごとに設定確認回数Xbおよびジョブ指示回数Xcをユーザコードに対応付けて有している。設定確認回数Xbおよびジョブ指示回数Xcの初期値はともに「0」である。設定確認回数Xbおよびジョブ指示回数Xcの意味および使い方は、後に順次、説明する。
【0104】
コマンド等特定部352は、第一の実施形態のコマンド等特定部302と同様に、コマンドデータ5Aを受信すると、ユーザがスマートスピーカ2に入力したパラメータおよびコマンドを特定し、テキストデータ5Bを生成する。
【0105】
コマンド等特定部352によってテキストデータ5Bが生成されると、テキストデータ5Bに示されるコマンドに応じて条件設定指令部353、メッセージ生成部354、またはジョブ開始指令部358によって処理が行われる。各部の処理の方法は、条件設定指令部303、メッセージ生成部304、またはジョブ開始指令部308による処理の方法と同様である。
【0106】
カウンタ351は、コマンド等特定部352によってテキストデータ5Bが生成されると、テキストデータ5Bに示されるコマンドが「条件出力」である場合は、ログインユーザのユーザコードに対応する設定確認回数Xbに「1」を足す。または、テキストデータ5Bに示されるコマンドが、画像形成装置1にジョブを開始させるものである場合は、ログインユーザのユーザコードに対応するジョブ指示回数Xcに「1」を足す。
【0107】
再生速度決定部355は、ログインユーザの設定確認回数Xbおよびジョブ指示回数Xcに基づいて再生速度Sを次のように決定する。ジョブ指示回数Xcに対する設定確認回数Xbの割合が所定の割合Ra未満である場合、つまり、Xb/Xc<Ra、である場合は、再生速度Sを中速に決定する。一方、Xb/Xc≧Ra、である場合は、再生速度Sを高速に決定する。なお、所定の割合Raは、管理者が任意に設定することができる。
【0108】
このように再生速度Sを決定する理由は、次の通りである。これから実行させるジョブについて設定されている条件を確認する頻度の多いユーザは、視覚障碍者またはタッチパネルディスプレイ10hを使用しない人であると考えられる。このようなユーザは、スマートスピーカ2によって再生される音声を聞き慣れているので、標準的な速度で音声が再生されると遅く感じる。そこで、再生速度決定部305は、ジョブ指示回数Xcに対する設定確認回数Xbの割合が所定の割合Ra以上であれば、ログインユーザが視覚障碍者またはタッチパネルディスプレイ10hを使用しない人であると推定し、再生速度Sを高速に決定する。
【0109】
音声データ生成部356は、音声データ生成部306と同様に、メッセージ生成部354によって生成されたメッセージデータ5Dおよび再生速度決定部355によって決定された再生速度Sに基づいて音声データ5Gを生成する。
【0110】
音声データ送信部357は、音声データ生成部356によって生成された音声データ5Gをスマートスピーカ2へ送信する。
【0111】
図11は、画像形成装置1の全体的な処理の流れの例を説明するためのフローチャートである。図12図13は、サーバ3の全体的な処理の流れの例を説明するためのフローチャートである。
【0112】
次に、画像形成装置1およびサーバ3それぞれの、第二の実施形態における全体的な処理の流れを、フローチャートを参照しながら説明する。
【0113】
画像形成装置1は、図11に示す手順の処理を連携プログラム150に基づいて実行する。サーバ3は、図12図13に示す手順の処理を連携プログラム350に基づいて実行する。
【0114】
画像形成装置1は、所定のイベントが起きるごとに次のように処理を行う。ユーザが画像形成装置1にログインすると(図11の#751)、そのユーザのユーザコードを示すデータをログイン通知データ5Jとしてサーバ3へ送信する(#752)。
【0115】
ステップ#753~#758の処理は、図6のステップ#711~#716の処理と同様である。
【0116】
または、ユーザが画像形成装置1からログアウトすると(#759)、そのユーザのユーザコードを示すデータをログアウト通知データ5Kとしてサーバ3へ送信する(#760)。
【0117】
サーバ3は、画像形成装置1またはスマートスピーカ2からデータを受信するごとに、次のように処理を行う。
【0118】
サーバ3は、画像形成装置1からログイン通知データ5Jを受信すると(図12の#771でYes)、ログイン通知データ5Jに示されるユーザコードのユーザをサーバ3にログインさせる(#772)。
【0119】
または、スマートスピーカ2からコマンドデータ5Aを受信すると(#773でYes)、コマンドデータ5Aをテキストデータ5Bに変換する(#774)。そして、テキストデータ5Bに示される内容つまりユーザが発声した内容に応じて次のように処理を行う。
【0120】
ステップ#775~#781の処理は基本的に第一の実施形態のステップ#732~#738(図8参照)の処理と同様である。ただし、コマンドがジョブの条件の出力のコマンドである場合に(#778でYes)、画像形成装置1は、受付回数Xaではなくログインユーザの設定確認回数Xbに「1」を足す(#779)。
【0121】
サーバ3は、ステップ#780または#781でメッセージデータ5Dを生成すると、Xb/Xc<Ra、であれば(#782でYes)、再生速度Sを中速に決定する(#783)。Xb/Xc≧Ra、であれば(#782でNo)、再生速度Sを高速に決定する(#784)。なお、設定確認回数Xbおよびジョブ指示回数Xcはいずれも、ログインユーザのものである。
【0122】
そして、サーバ3は、メッセージデータ5Dに示されるメッセージを再生速度Sで読み上げるための音声データ5Gを生成し、スマートスピーカ2へ送信する(図13の#785)。なお、メッセージデータ5Dがステップ#781で生成されたものである場合は、ステップ#782~#784の処理をスキップし、中速で読み上げるためのデータを音声データ5Gとして生成してもよい。
【0123】
または、テキストデータ5Bに示されるコマンドが画像形成装置1にジョブを開始させるものである場合は(#786でYes)、サーバ3は、第一の実施形態と同様にジョブ指令データ5Hを画像形成装置1へ送信する(#787)。そして、ログインユーザのジョブ指示回数Xcに「1」を足す(#788)。
【0124】
サーバ3は、画像形成装置1からログアウト通知データ5Kを受信すると(#789でYes)、ログアウト通知データ5Kに示されるユーザコードのユーザをサーバ3からログインさせる(#790)。
【0125】
〔第三の実施形態〕
図14は、画像形成装置1、スマートスピーカ2、およびサーバ3それぞれの機能的構成の例を示す図である。図15は、フラグF1の例を示す図である。図16は、速度決定処理の流れの例を説明するためのフローチャートである。
【0126】
第一の実施形態では受付回数Xaに基づいて再生速度Sを決定し、第二の実施形態ではジョブ指示回数Xcに対する設定確認回数Xbの割合に基づいて再生速度Sを決定した。第三の実施形態では、ユーザの属性に基づいて再生速度Sを決定する。以下、この仕組みについて説明する。第一の実施形態または第二の実施形態と重複する点については、説明を省略する。
【0127】
画像処理システム4の全体的な構成は、第一の実施形態と同様であり、図1に示した通りである。画像形成装置1、スマートスピーカ2、およびサーバ3のハードウェアの構成も第一の実施形態と同様であり、それぞれ、図2図3、および図4に示した通りである。
【0128】
ただし、画像形成装置1のUSBボード10gには、ビデオカメラ10Rが接続されている。ビデオカメラ10Rは、デジタルビデオカメラであって、ユーザが画像形成装置1を使用している際の様子の動画像を撮影する。動画像のデータは、USBボード10gを介して画像形成装置1へ入力され、サーバ3へ送信される。そして、後述する再生速度決定部375(図14参照)において用いられる。なお、ビデオカメラ10Rは画像形成装置1に固定されているものとする。
【0129】
画像形成装置1のROM10cまたは補助記憶装置10dには、連携プログラム100、150の代わりに連携プログラム170が記憶されている。連携プログラム170によると、図14に示す条件設定部171、設定内容回答部172、ジョブ実行部173、ログイン通知部174、および動画像送信部175などが画像形成装置1に実現される。
【0130】
サーバ3のROM30cまたは補助記憶装置30dには、連携プログラム300、350の代わりに連携プログラム370が記憶されている。連携プログラム370によると、図14に示すユーザ属性記憶部371、コマンド等特定部372、条件設定指令部373、メッセージ生成部374、再生速度決定部375、音声データ生成部376、音声データ送信部377、ジョブ開始指令部378、およびログイン処理部379などがサーバ3に実現される。
【0131】
スマートスピーカ2のROM20cには、第一の実施形態および第二の実施形態と同様に、連携プログラム200が記憶されている。
【0132】
画像形成装置1において、条件設定部171、設定内容回答部172、およびジョブ実行部173、およびログイン通知部174は、それぞれ、第一の実施形態または第二の実施形態の条件設定部101、151、設定内容回答部102、152、ジョブ実行部103、153、およびログイン通知部154(図5図9参照)と同様の処理を行う。
【0133】
動画像送信部175は、ビデオカメラ10Rから入力された動画像のデータを動画像データ5Lとしてサーバ3へ送信する。なお、動画像データ5Lには、画像形成装置1にログインしているユーザのユーザコードが対応付けられる。
【0134】
サーバ3において、ユーザ属性記憶部371は、予め、図15に示すようにユーザごとにフラグF1をユーザコードに対応付けて記憶している。フラグF1は、視覚障碍者であるか否かを示し、「1」が視覚障碍者であることを意味する。フラグF1の初期値は「0」である。
【0135】
ログイン処理部379は、第二の実施形態のログイン処理部359と同様に、ログインおよびログアウトの処理を行う。
【0136】
コマンド等特定部372は、第一の実施形態または第二の実施形態のコマンド等特定部302、352と同様に、コマンドデータ5Aを受信すると、ユーザがスマートスピーカ2に入力したパラメータおよびコマンドを特定し、テキストデータ5Bを生成する。
【0137】
コマンド等特定部372によってテキストデータ5Bが生成されると、テキストデータ5Bに示されるコマンドに応じて条件設定指令部373、メッセージ生成部374、またはジョブ開始指令部378によって処理が行われる。各部の処理の方法は、条件設定指令部303、353、メッセージ生成部304、354、またはジョブ開始指令部308、358による処理の方法と同様である。
【0138】
再生速度決定部375は、図16に示す方法で再生速度Sを決定する。ログインユーザのフラグF1をユーザ属性記憶部371から読み出す(#801)。フラグF1の値が「1」である場合は(#802でYes)、再生速度Sを高速に設定する(#803)。
【0139】
フラグF1の値が「0」である場合は(#802でNo)、コマンド等特定部372によって生成されたテキストデータ5Bに示されるコマンドが「条件出力」でなければ(#804でNo)、再生速度決定部375は、再生速度Sを中速に設定する(#805)。一方、テキストデータ5Bに示されるコマンドが「条件出力」であれば(#804でYes)、ログインユーザの動画像データ5Lを解析することによって、ログインユーザがタッチパネルディスプレイ10hを見ながらスマートスピーカ2に音声を入力しているか否かを判別する(#806)。
【0140】
タッチパネルディスプレイ10hを見ているか否かは、公知の方法によって判別すればよい。例えば、ログインユーザの顔の位置および姿勢と、ビデオカメラ10Rの位置および姿勢と、タッチパネルディスプレイ10hの位置および姿勢との関係に基づいて判別することができる。ログインユーザの顔の位置および姿勢は、動画像データ5Lによって再現される動画像から算出することができる。
【0141】
サーバ3は、ログインユーザがタッチパネルディスプレイ10hを見ながら音声を入力していると判別した場合は(#807でYes)、再生速度Sを中速に決定する(#808)。タッチパネルディスプレイ10hを見ずに音声を入力していると判別した場合は(#807でNo)、再生速度Sを高速に決定するとともに(#809)、ログインユーザのフラグF1を「1」に更新する(#810)。
【0142】
音声データ生成部376は、音声データ生成部306、356と同様に、メッセージ生成部374によって生成されたメッセージデータ5Dおよび再生速度決定部375によって決定された再生速度Sに基づいて音声データ5Gを生成する。
【0143】
音声データ送信部377は、音声データ生成部376によって生成された音声データ5Gをスマートスピーカ2へ送信する。
【0144】
図17は、画像形成装置1の全体的な処理の流れの例を説明するためのフローチャートである。図18は、サーバ3の全体的な処理の流れの例を説明するためのフローチャートである。
【0145】
次に、画像形成装置1およびサーバ3それぞれの、第三の実施形態における全体的な処理の流れを、フローチャートを参照しながら説明する。
【0146】
画像形成装置1は、図17に示す手順の処理を連携プログラム170に基づいて実行する。サーバ3は、図18に示す手順の処理を連携プログラム370に基づいて実行する。
【0147】
画像形成装置1は、所定のイベントが起きるごとに図17に示すように処理を行う。図17図11と比較して分かるように、基本的には、第二の実施形態における処理の流れと同じである。ただし、第三の実施形態では、画像形成装置1は、ビデオカメラ10Rによって得られた動画像を動画像データ5Lとしてサーバ3へ送信する(図17の#853)。
【0148】
なお、画像形成装置1は、ユーザが画像形成装置1にログインしてからログアウトするまでの間、ストリーミングの技術によって動画像データ5Lを一部分ずつリアルタイムに送信もよいし、サーバ3において動画像データ5Lが必要になった時点で、この時点までの動画像を纏めたデータを動画像データ5Lとして送信してもよい。
【0149】
サーバ3は、画像形成装置1またはスマートスピーカ2からデータを受信するごとに、図18に示すように処理を行う。
【0150】
図18図12図13と比較して分かるように、基本的には、第二の実施形態における処理の流れと同じである。ただし、第三の実施形態では、サーバ3は、設定確認回数X2およびジョブ指示回数X3の代わりにログインユーザの動画像データ5Lに基づいて再生速度Sを決定する(図18の#880)。再生速度Sを決定する具体的な方法は、前に図16で説明した通りである。
【0151】
第一ないし第三の実施形態によると、ログインユーザに応じて再生速度Sが決定されメッセージが再生されるので、スマートスピーカ2をログインユーザにとって従来よりも使用しやすくすることができる。
【0152】
〔変形例〕
図19は、画像形成装置1に設定されているジョブの条件を示す画面90の例を示す図である。
【0153】
第一ないし第三の実施形態では、所定の回数Taが2回である場合を例示したが、所定の回数Taは、1回であってもよいし、3回以上であってもよい。
【0154】
または、所定の要件を満たす場合は、受付回数Xaが所定の回数Ta以上であるか否かに関わらず、再生速度決定部305は、再生速度Sを特定の速度に決定してもよい。これについては、後に順次、説明する。
【0155】
第一ないし第三の実施形態では、画像形成装置1に設定されているジョブの条件などのメッセージをスマートスピーカ2が音声によって出力したが、さらに、タッチパネルディスプレイ10hが文字列または図19のようなGUI(Graphical User Interface)の画面90を表示させることによって出力してもよい。
【0156】
この場合は、サーバ3は、メッセージデータ5Dを画像形成装置1へ送信する。画像形成装置1は、メッセージデータ5Dを受信すると、メッセージデータ5Dに示されるメッセージを文字列で表わす画面を生成し、タッチパネルディスプレイ10hによって表示する。画面を表示するにはメッセージデータ5Dを音声化する必要がなく、かつ、メッセージデータ5Dは音声データ5Gよりもサイズが小さいので、メッセージは、スマートスピーカ2よりも早くタッチパネルディスプレイ10hから出力される。
【0157】
しかし、画像形成装置1のCPU10aの処理の負荷または画像形成装置1とサーバ3との間のトラフィックの影響により、本来の、画像形成装置1へメッセージデータ5Dを送信してから画面が表示されるまでに要する所要時間Tcを経過しても、画面が表示されないことがある。このような場合は、スマートスピーカ2から出力される音声の聞き取りに慣れていないユーザが、このような不具合が生じているために、ジョブの条件を音声で確認しようとしている可能性がある。
【0158】
そこで、このような場合は、サーバ3は、再生速度Sを高速に決定したとしても、中速でメッセージが再生されるように音声データ5Gを生成し、スマートスピーカ2へ送信してもよい。
【0159】
画像形成装置1に設定されているジョブの条件がタッチパネルディスプレイ10hに表示されている状態であるにも関わらず、この条件を確認するためにユーザがスマートスピーカ2に向かって条件の出力の指令を入力する場合がある。このような場合は、ユーザが視覚障碍者またはタッチパネルディスプレイ10hを使用しない人であると考えられる。
【0160】
そこで、このような場合は、受付回数Xaに関わらず、再生速度決定部305は、再生速度Sを高速に決定してもよい。
【0161】
第二の実施形態では、図12図13のフローチャートに示した通り、サーバ3は、設定確認回数Xbへの「1」の加算を、再生速度Sを決定する前に行ったが、再生速度Sを決定した後に行ってもよい。
【0162】
第三の実施形態では、サーバ3は、ログインユーザがタッチパネルディスプレイ10hを見ながらスマートスピーカ2に音声を入力している場合に、ログインユーザが視覚障害者であると判別し、ログインユーザのフラグF1を「1」に更新したが、ログインユーザとタッチパネルディスプレイ10hとの位置関係が所定の関係である場合に、ログインユーザが視覚障害者であると判別し、ログインユーザのフラグF1を「1」に更新してもよい。例えば、ログインユーザがスマートスピーカ2に音声を入力している際の、ログインユーザとタッチパネルディスプレイ10hとの距離が所定の距離(例えば、2メートル)以上であれば、視覚障害者であると判別してもよい。または、ログインユーザがスマートスピーカ2に音声を入力している際に、タッチパネルディスプレイ10hの見えにくい位置(例えば、画像形成装置1の背面側または側面側)にログインユーザがいれば、視覚障害者であると判別してもよい。または、ログインユーザとタッチパネルディスプレイ10hとの距離がログインユーザとスマートスピーカ2との距離よりも長い場合に、視覚障害者であると判別してもよい。
【0163】
なお、ログインユーザとタッチパネルディスプレイ10hとの位置関係および上述の各距離は、近接センサまたはRFID(Radio Frequency Identification)などの公知の技術によって求めればよい。
【0164】
ところで、ユーザが条件出力のコマンドを音声で所定の時間(例えば、1分間)に複数回、入力する場合がある。このような場合は、再生速度が速いためにユーザがメッセージを聞き漏らしていることが考えられる。そこで、このような場合は、第一ないし第三の実施形態において、サーバ3は、再生速度Sを中速に決定すればよい。または、中速よりも遅い速さ(低速)に決定してもよい。または、このような場合が1回ではなく複数回(例えば、3回)以上あった場合に、再生速度Sを中速または低速に決定してもよい。
【0165】
第一ないし第三の実施形態において、サーバ3は、予め決められた事項については、決定した再生速度Sに関わらず中速または低速で再生されるように音声データ5Gを生成してもよい。例えば、ジョブの条件のうちデフォルト値については再生速度Sで再生され、ユーザが変更したものについては中速または低速で再生されるように音声データ5Gを生成してもよい。または、「スキャンデータの送信先は、abced@example.com です。」というメッセージの中の電子メールアドレスつまり「abced@example.com」については中速または低速で再生されそれ以外の部分については高速で再生されるように音声データ5Gを生成してもよい。
【0166】
第一ないし第三の実施形態において、ユーザが「ゆっくり」または「もっとゆっくり」のように再生速度を音声でスマートスピーカ2に入力した場合は、サーバ3は、決定した再生速度Sに関わらず、入力された再生速度でメッセージが再生されるように音声データ5Gを生成すればよい。
【0167】
第一ないし第三の実施形態では、サーバ3が音声データ5Gを生成したがスマートスピーカ2が生成してもよい。この場合は、サーバ3は、スマートスピーカ2へメッセージデータ5Dを送信するとともに、再生速度Sをスマートスピーカ2へ通知すればよい。
【0168】
第一ないし第三の実施形態では、スマートスピーカ2およびサーバ3は、画像形成装置1を介さずに通信したが、画像形成装置1を介して通信してもよい。または、音声の入出力を行うハードウェアが画像形成装置1に備わっている場合は、連携プログラム200を画像形成装置1にインストールし、このハードウェアをスマートスピーカ2として機能させてもよい。
【0169】
第一ないし第三の実施形態では、ジョブの条件を画像形成装置1に設定したが、サーバ3に設定してもよい。この場合は、各項目のデフォルト値をサーバ3に記憶させておき、ジョブの実行が指令された際に、ユーザがスマートスピーカ2を介して音声で指定した条件と条件が指定されなかった項目のデフォルト値とを画像形成装置1へ通知すればよい。
【0170】
第一ないし第三の実施形態では、ユーザは「コピー 3部 両面 設定」または「コピー 条件出力」のようにパラメータまたはコマンドのみを音声で入力したが、「コピーの条件を3部、両面に設定して下さい。」または「コピーの設定を教えて。」のような話し言葉で入力できるようにしてもよい。この場合は、サーバ3は、言語解析の公知の技術によってパラメータおよびコマンドを話し言葉から抽出すればよい。また、サーバ3は、コマンドを受け付けた際に適宜、「コピーの条件を3部、両面に設定するのですね。よろしいですか。」または「承知しました。」のように確認を求めるメッセージまたはコマンドを受け付けたことを知らせるメッセージをスマートスピーカ2から音声で出力させてもよい。
【0171】
その他、画像処理システム4、画像形成装置1、スマートスピーカ2、サーバ3の全体または各部の構成、処理内容、処理順序、データベースの構成などは、本発明の趣旨に沿って適宜変更することができる。
【符号の説明】
【0172】
4 画像処理システム(ジョブ処理システム)
1 画像形成装置(ジョブ実行手段)
10h タッチパネルディスプレイ(ディスプレイ)
2 スマートスピーカ(再生手段、音声入力手段、音声再生装置)
3 サーバ(制御手段)
305 再生速度決定部(音声制御手段)
306 音声データ生成部(音声制御手段)
307 音声データ送信部(音声制御手段)
308 ジョブ開始指令部(ジョブ制御手段)
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19