IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コニカミノルタ株式会社の特許一覧

特許7456168機械学習方法、搬送装置、画像形成装置、および機械学習プログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-18
(45)【発行日】2024-03-27
(54)【発明の名称】機械学習方法、搬送装置、画像形成装置、および機械学習プログラム
(51)【国際特許分類】
   B65H 7/14 20060101AFI20240319BHJP
   B65H 9/00 20060101ALI20240319BHJP
   G03G 15/00 20060101ALI20240319BHJP
   G06N 20/00 20190101ALI20240319BHJP
   G03G 15/20 20060101ALI20240319BHJP
   G03G 21/14 20060101ALI20240319BHJP
【FI】
B65H7/14
B65H9/00 J
G03G15/00 450
G06N20/00
G03G15/20 555
G03G21/14
【請求項の数】 13
(21)【出願番号】P 2020012743
(22)【出願日】2020-01-29
(65)【公開番号】P2021116186
(43)【公開日】2021-08-10
【審査請求日】2022-12-20
(73)【特許権者】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】110000671
【氏名又は名称】IBC一番町弁理士法人
(72)【発明者】
【氏名】斎藤 浩一
(72)【発明者】
【氏名】菅井 駿
(72)【発明者】
【氏名】小輪▲瀬▼ 一彦
(72)【発明者】
【氏名】桐山 知宏
【審査官】松林 芳輝
(56)【参考文献】
【文献】特開2019-163099(JP,A)
【文献】特開平09-086725(JP,A)
【文献】特開2019-034836(JP,A)
【文献】特開2007-065313(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B65H 7/00-7/20
B65H 9/00-9/20
B65H 13/00-15/02
B65H 43/00-43/08
G03G 13/20
G03G 13/34
G03G 15/00
G03G 15/20
G03G 15/36
G03G 21/00
G03G 21/02
G03G 21/14
G03G 21/20
G06F 18/00-18/40
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、
前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、
前記搬送路における被搬送媒体の位置を検出する位置検出部と、
前記搬送部材を駆動する駆動源と、
を備え搬送装置であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、
前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、
前記ステップ(b)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、
を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、前記報酬値を用いて機械学習することで、学習モデルを生成する、機械学習方法で学習した学習モデルを用いて、前記被搬送媒体の前記スキュー状態、前記位置、および前記搬送部材の駆動速度から、前記被搬送媒体の搬送を制御する、搬送装置と、
前記搬送装置で搬送した被搬送媒体に画像を形成する画像形成部と、
を備え、
前記搬送路において、前記スキュー状態の補正制御を行う区間、または前記補正制御を行う区間よりも前に、前記被搬送媒体に形成する前記画像形成部の画像形成開始タイミングが係る場合、
前記学習モデルを学習する際に、スキュー状態の補正制御に要する補正時間を計測し、
前記学習モデルを用いて、前記被搬送媒体の搬送を制御するときに、前記補正時間に応じて、予め前記画像形成開始タイミングを設定する、画像形成装置。
【請求項2】
搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、
前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、
前記搬送路における被搬送媒体の位置を検出する位置検出部と、
前記搬送部材を駆動する駆動源と、
を備えた搬送装置であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、
前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、
前記ステップ(b)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、
を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、前記報酬値を用いて機械学習することで、学習モデルを生成する、機械学習方法で学習した学習モデルを用いて、前記被搬送媒体の前記スキュー状態、前記位置、および前記搬送部材の駆動速度から、前記被搬送媒体の搬送を制御する、搬送装置と、
前記搬送装置で搬送した被搬送媒体に画像を形成する画像形成部と、
を備え、
前記学習モデルを学習する際に、スキュー状態の補正制御に要する補正時間を計測し、
前記補正時間が所定時間よりも短い場合には、
前記学習モデルを用いて、前記被搬送媒体の搬送を制御するときに、前記補正制御完了時に、前記画像形成部の定着装置の温度情報を取得し、該温度情報に応じて、前記被搬送媒体の搬送を制御する、画像形成装置。
【請求項3】
搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、
前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、
前記搬送路における被搬送媒体の位置を検出する位置検出部と、
前記搬送部材を駆動する駆動源と、
を備えた搬送装置であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、
前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、
前記ステップ(b)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、
を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、前記報酬値を用いて機械学習することで、学習モデルを生成する、機械学習方法で学習した学習モデルを用いて、前記被搬送媒体の前記スキュー状態、前記位置、および前記搬送部材の駆動速度から、前記被搬送媒体の搬送を制御する、搬送装置と、
前記搬送装置で搬送した被搬送媒体に画像を形成する画像形成部と、
を備え、
前記学習モデルを学習する際に、スキュー状態の補正制御に要する補正時間を計測し、
前記補正時間が所定時間よりも長い場合には、
前記学習モデルを用いて、前記被搬送媒体の搬送を制御するときに、前記画像形成部の定着装置の制御温度を、用紙定着時の印字温度に切り替えるタイミングを、前記補正時間の長さに応じて、遅延させる、画像形成装置。
【請求項4】
前記機械学習方法では、前記位置検出部により、前記搬送路を搬送される前記被搬送媒体の位置が所定位置に到達したタイミングで、前記機械学習を開始する、請求項1から請求項3のいずれかに画像形成装置。
【請求項5】
前記搬送部材には、前記搬送路における前記被搬送媒体の搬送方向に沿って並んだ、2組以上の搬送ローラー対が含まれ、
前記機械学習方法において、前記搬送方向に並んだ2組以上の前記搬送ローラー対を用いて、前記スキュー状態の補正制御を行う場合には、
前記到達したタイミングは、前記補正制御に用いる複数の前記搬送ローラー対のうち、最下流の前記搬送ローラー対に、前記被搬送媒体の先端が、到達したタイミングである、請求項に記載の画像形成装置。
【請求項6】
前記機械学習方法では、前記到達したタイミングから、前記被搬送媒体が所定量だけ搬送された時点で、1つのエピソードの学習を終了する、請求項に記載の画像形成装置。
【請求項7】
前記機械学習方法では、ユーザーから前記所定量の設定変更を受け付けるステップを含む、請求項に記載の画像形成装置。
【請求項8】
前記搬送部材には、前記搬送路における前記被搬送媒体の搬送方向に直交する幅方向に並んだ、2組以上の搬送ローラー対が含まれ、
前記機械学習方法において、前記幅方向に並んだ2組以上の前記搬送ローラー対を用いて、前記スキュー状態の補正制御を行う場合には、
前記到達したタイミングは、前記補正制御に用いる前記幅方向に並んだ複数の前記搬送ローラー対の全てに、前記被搬送媒体の先端が、到達したタイミングである、請求項に記載の画像形成装置。
【請求項9】
前記機械学習方法では、前記幅方向に並んだ複数の前記搬送ローラー対の何れかから、前記被搬送媒体が抜けたタイミングで、1つのエピソードの学習を終了する、請求項に記載の画像形成装置。
【請求項10】
前記機械学習をする周期は、目標とする前記スキューの補正精度と、前記被搬送媒体を搬送する速度から算出した周期である、請求項1から請求項のいずれかに記載の画像形成装置。
【請求項11】
前記報酬値を算出するステップでは、
所定の周期で、学習を実施し、前回サイクルでのスキュー状態と、今回のサイクルでのスキュー状態を比較し、
前記スキュー状態から算出した今回のサイクルでのスキュー量の方が、前回サイクルでのスキュー量よりも小さい場合、正の報酬値を与える、請求項1から請求項10のいずれかに記載の画像形成装置。
【請求項12】
前記報酬値を算出するステップでは、
所定の周期で、学習を実施し、1つ前の前回サイクルでのスキュー状態と、今回のサイクルでのスキュー状態を比較し、
前記スキュー状態から算出した今回のサイクルでのスキュー量の方が、前回サイクルでのスキュー量よりも大きい場合、負の報酬値を与える、請求項1から請求項11のいずれかに記載の画像形成装置。
【請求項13】
前記報酬値を算出するステップでは、
所定の周期で、学習を実施し、1つ前の前回サイクルでのスキュー状態と、今回のサイクルでのスキュー状態を比較し、
前記スキュー状態から算出した今回のサイクルでのスキュー量の方が、前回サイクルでのスキュー量が同じ場合、ゼロの報酬値を与える、請求項1から請求項12のいずれかに記載の画像形成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被搬送媒体の搬送の制御に関する機械学習方法、搬送装置、画像形成装置、および機械学習プログラムに関する。
【背景技術】
【0002】
商用のカラー印刷業界においては、電子写真方式の画像形成装置が広く活用されている。カラー印刷業界に対応するPP(プロダクションプリント)の分野では、オフィスで用いられる場合に比べて多様な種類の用紙への適応が求められる。そして、これらの多様な用紙に対して高品質な印刷を行うために、用いる用紙の種類に応じて、搬送条件を設定し、印刷を行う画像形成装置がある。
【0003】
しかしながら、用紙の種類や使用状況の組み合わせは膨大であり、あらゆる組み合わせを想定した制御を設計するためには多大な開発工数が必要になる。従来は、人手による設計に頼っているため、考えられる組み合わせ条件のうち、一部の条件、すなわち、最悪な条件や代表的な条件について検討し、その特定な条件下おいて、正常な範囲内で用紙搬送が行えるように制御設計を行っている。しかしながら、この方法では、想定していない使用条件下では最適な制御にならない場合があり、十分な顧客満足度が得られない。
【0004】
特許文献1では、シートの斜送(スキュー)を防ぐシート搬送装置が開示されている。このシート搬送装置は、シートの傾き検知手段と、傾き補正手段と、を備え、検知手段の検知信号に基づき、傾いた状態のシートを挟持した状態で補正手段を、斜めに移動させることで、シートの傾きを補正している。
【先行技術文献】
【特許文献】
【0005】
【文献】特開2005-41603号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、画像形成装置では、使用により複数の部品が劣化する。例えば、用紙の搬送を行う搬送ローラーが摩耗等により劣化し、外径が変化した場合には、搬送ローラーの搬送速度(1回転当たりの搬送量)が変化する。特許文献1に開示された技術では、このような状況下では、用紙のスキューの補正が正しく行えず、搬送路の端部に用紙が接触したような場合には、用紙損傷や用紙搬送ジャム等の不具合を生じさせてしまう虞がある。
【0007】
このような使用条件をも考慮して、設計することも考えられるが、搬送ローラー等の部品の劣化状態に応じて、用紙の搬送速度等の搬送状態を常に監視し、この搬送状態に応じた条件を設定しなければならず、設計に要する作業量が膨大になり、現実的でない。
【0008】
本発明は、上記事情に鑑みてなされたものであり、被搬送媒体の搬送におけるスキュー補正制御を適正に行える学習モデルを生成する機械学習方法、ならびに生成された学習モデルを用いた搬送装置、および画像形成装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明の上記目的は、下記の手段によって達成される。
【0010】
(1)搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、
前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、
前記搬送路における被搬送媒体の位置を検出する位置検出部と、
前記搬送部材を駆動する駆動源と、
を備え搬送装置であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、
前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、
前記ステップ(b)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、
を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、前記報酬値を用いて機械学習することで、学習モデルを生成する、機械学習方法で学習した学習モデルを用いて、前記被搬送媒体の前記スキュー状態、前記位置、および前記搬送部材の駆動速度から、前記被搬送媒体の搬送を制御する、搬送装置と、
前記搬送装置で搬送した被搬送媒体に画像を形成する画像形成部と、
を備え、
前記搬送路において、前記スキュー状態の補正制御を行う区間、または前記補正制御を行う区間よりも前に、前記被搬送媒体に形成する前記画像形成部の画像形成開始タイミングが係る場合、
前記学習モデルを学習する際に、スキュー状態の補正制御に要する補正時間を計測し、
前記学習モデルを用いて、前記被搬送媒体の搬送を制御するときに、前記補正時間に応じて、予め前記画像形成開始タイミングを設定する、画像形成装置。
(2)搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、
前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、
前記搬送路における被搬送媒体の位置を検出する位置検出部と、
前記搬送部材を駆動する駆動源と、
を備えた搬送装置であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、
前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、
前記ステップ(b)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、
を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、前記報酬値を用いて機械学習することで、学習モデルを生成する、機械学習方法で学習した学習モデルを用いて、前記被搬送媒体の前記スキュー状態、前記位置、および前記搬送部材の駆動速度から、前記被搬送媒体の搬送を制御する、搬送装置と、
前記搬送装置で搬送した被搬送媒体に画像を形成する画像形成部と、
を備え、
前記学習モデルを学習する際に、スキュー状態の補正制御に要する補正時間を計測し、
前記補正時間が所定時間よりも短い場合には、
前記学習モデルを用いて、前記被搬送媒体の搬送を制御するときに、前記補正制御完了時に、前記画像形成部の定着装置の温度情報を取得し、該温度情報に応じて、前記被搬送媒体の搬送を制御する、画像形成装置。
(3)搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、
前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、
前記搬送路における被搬送媒体の位置を検出する位置検出部と、
前記搬送部材を駆動する駆動源と、
を備えた搬送装置であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、
前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、
前記ステップ(b)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、
を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、前記報酬値を用いて機械学習することで、学習モデルを生成する、機械学習方法で学習した学習モデルを用いて、前記被搬送媒体の前記スキュー状態、前記位置、および前記搬送部材の駆動速度から、前記被搬送媒体の搬送を制御する、搬送装置と、
前記搬送装置で搬送した被搬送媒体に画像を形成する画像形成部と、
を備え、
前記学習モデルを学習する際に、スキュー状態の補正制御に要する補正時間を計測し、
前記補正時間が所定時間よりも長い場合には、
前記学習モデルを用いて、前記被搬送媒体の搬送を制御するときに、前記画像形成部の定着装置の制御温度を、用紙定着時の印字温度に切り替えるタイミングを、前記補正時間の長さに応じて、遅延させる、画像形成装置。
【0011】
前記機械学習方法では、前記位置検出部により、前記搬送路を搬送される前記被搬送媒体の位置が所定位置に到達したタイミングで、前記機械学習を開始する、上記(1)から上記(3)のいずれかに画像形成装置。



【0012】
)前記搬送部材には、前記搬送路における前記被搬送媒体の搬送方向に沿って並んだ、2組以上の搬送ローラー対が含まれ、
前記機械学習方法において、前記搬送方向に並んだ2組以上の前記搬送ローラー対を用いて、前記スキュー状態の補正制御を行う場合には、
前記到達したタイミングは、前記補正制御に用いる複数の前記搬送ローラー対のうち、最下流の前記搬送ローラー対に、前記被搬送媒体の先端が、到達したタイミングである、上記()に記載の画像形成装置。
【0013】
前記機械学習方法では、前記到達したタイミングから、前記被搬送媒体が所定量だけ搬送された時点で、1つのエピソードの学習を終了する、上記()に記載の画像形成装置。
【0014】
前記機械学習方法では、ユーザーから前記所定量の設定変更を受け付けるステップを含む、上記()に記載の画像形成装置。
【0015】
)前記搬送部材には、前記搬送路における前記被搬送媒体の搬送方向に直交する幅方向に並んだ、2組以上の搬送ローラー対が含まれ、
前記機械学習方法において、前記幅方向に並んだ2組以上の前記搬送ローラー対を用いて、前記スキュー状態の補正制御を行う場合には、
前記到達したタイミングは、前記補正制御に用いる前記幅方向に並んだ複数の前記搬送ローラー対の全てに、前記被搬送媒体の先端が、到達したタイミングである、上記()に記載の画像形成装置。
【0016】
前記機械学習方法では、前記幅方向に並んだ複数の前記搬送ローラー対の何れかから、前記被搬送媒体が抜けたタイミングで、1つのエピソードの学習を終了する、上記()に記載の画像形成装置。
【0017】
10)前記機械学習をする周期は、目標とする前記スキューの補正精度と、前記被搬送媒体を搬送する速度から算出した周期である、上記(1)から上記()のいずれかに記載の画像形成装置。
【0018】
11)前記報酬値を算出するステップでは、
所定の周期で、学習を実施し、前回サイクルでのスキュー状態と、今回のサイクルでのスキュー状態を比較し、
前記スキュー状態から算出した今回のサイクルでのスキュー量の方が、前回サイクルでのスキュー量よりも小さい場合、正の報酬値を与える、上記(1)から上記(10)のいずれかに記載の画像形成装置。
【0019】
12)前記報酬値を算出するステップでは、
所定の周期で、学習を実施し、1つ前の前回サイクルでのスキュー状態と、今回のサイクルでのスキュー状態を比較し、
前記スキュー状態から算出した今回のサイクルでのスキュー量の方が、前回サイクルでのスキュー量よりも大きい場合、負の報酬値を与える、上記(1)から上記(11)のいずれかに記載の画像形成装置。
【0020】
13)前記報酬値を算出するステップでは、
所定の周期で、学習を実施し、1つ前の前回サイクルでのスキュー状態と、今回のサイクルでのスキュー状態を比較し、
前記スキュー状態から算出した今回のサイクルでのスキュー量の方が、前回サイクルでのスキュー量が同じ場合、ゼロの報酬値を与える、上記(1)から上記(12)のいずれかに記載の画像形成装置。
【発明の効果】
【0027】
本発明によれば、搬送路に沿って被搬送媒体を搬送する複数の搬送部材と、前記搬送路を搬送される被搬送媒体のスキュー状態を検出する状態検出部と、前記搬送路における被搬送媒体の位置を検出する位置検出部と、前記搬送部材を駆動する駆動源と、を備える搬送装置に関する機械学習方法であって、
被搬送媒体を搬送する複数の前記搬送部材の駆動速度、該被搬送媒体の位置、および該被搬送媒体のスキュー状態を入力するステップ(a)と、前記ステップ(a)の入力に応じて、学習モデルを用いて決定した前記駆動源の駆動制御に関する行動情報を出力するステップ(b)と、前記ステップ(c)の出力した後の前記被搬送媒体の前記スキュー状態に応じて報酬値を算出するステップ(c)と、を有し、
現段階での複数の前記搬送部材の駆動速度、前記被搬送媒体の位置、および該被搬送媒体のスキュー状態から、該スキュー状態が所定量になるように、次に出力すべき複数の前記搬送部材の前記駆動速度を、報酬値を用いて機械学習することで、前記学習モデルを生成する、機械学習方法とする。これにより、被搬送媒体の搬送におけるスキュー補正制御を適正に行える学習モデルを生成できる。
【図面の簡単な説明】
【0028】
図1】機械学習装置、および本実施形態に係る画像形成装置を示す概略図である。
図2】機械学習装置のハードウェア構成を示すブロック図である。
図3】画像形成装置のハードウェア構成を示すブロック図である。
図4】搬送装置の構成を示す概略図である。
図5】搬送される用紙のスキュー状態を示す模式図である。
図6】他の例における搬送装置の構成を示す概略図である。
図7】別の例における搬送装置の構成を示す概略図である。
図8】機械学習装置の機能を示すブロック図である。
図9】機械学習装置の学習処理を示すフローチャートである。
図10】一実施例に係るテーブルタイプの学習モデルの例を示す図である。
図11図9のステップS204の報酬付与処理を示すサブルーチンフローチャートである。
図12】一実施例に係るニューラルネットワークタイプの学習モデルの例を示す図である。
図13】学習周期の決定手順を説明するための模式図である。
図14A】幅方向に並んだ2組の搬送ローラー対で補正制御を行う場合における機械学習の始期を説明する図である。
図14B】機械学習の終期を説明する図である。
図15A】搬送方向に並んだ2組の搬送ローラー対で補正制御を行う場合における機械学習の始期を説明する図である。
図15B】機械学習の終期を説明する図である。
図16】機械学習の始期、終期の判定を組み込んだ、変形例における学習処理を示すフローチャートである。
図17】スキュー状態の補正制御に要する時間に応じて、画像形成開始タイミング等の変更を行う処理を示す図である。
図18】スキュー状態の補正制御に要する時間に応じて、搬送動作開始タイミングの変更を行う処理を示す図である。
図19】第1の変形例に係る機械学習装置、および画像形成装置の構成を示す概略図である。
図20】第2の変形例に係る機械学習部、および画像形成装置の構成を示す概略図である。
図21】第3の変形例に係る機械学習部、および画像形成装置の構成を示す概略図である。
図22】第4の変形例に係る機械学習装置、および画像形成装置の構成を示す概略図である。
図23】第5の変形例に係る機械学習装置、および画像形成装置の構成を示す概略図である。
図24】第6の変形例に係る機械学習装置、および画像形成装置の構成を示す概略図である。
図25】第7の変形例に係る機械学習部、および画像形成装置の構成を示す概略図である。
図26】第8の変形例に係る機械学習装置、および画像形成装置の構成を示す概略図である。
【発明を実施するための形態】
【0029】
以下、添付した図面を参照して、本発明の実施形態を説明する。なお、図面の説明において同一の要素には同一の符号を付し、重複する説明を省略する。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
【0030】
図1は、機械学習装置10、および本実施形態に係る画像形成装置30を示す概略図である。図2は、機械学習装置10のハードウェア構成を示すブロック図である。図3は、画像形成装置30のハードウェア構成を示すブロック図である。
【0031】
画像形成装置30は、搬送装置35を含み、搬送装置35により用紙(被搬送媒体)を搬送し、搬送した用紙上に画像を形成する。用紙の搬送は、搬送部材(後述の搬送ローラー対、定着ローラー等)により行われる。画像形成装置30と機械学習装置10は、ネットワークを介して接続されている。機械学習装置10は、後述するように用紙搬送に関する行動を学習し、機械学習モデルを生成する。生成した機械学習モデルは、画像形成装置30に送られる。画像形成装置30は、取得したこの機械学習モデルを、用紙を搬送する際の制御に用いる。
【0032】
(機械学習装置10)
図2に示すように、機械学習装置10は、制御部11、記憶部12、およびネットワークI/F(インターフェース)13を備える。これらの構成部品は信号をやり取りするためのバス等の信号線を介して相互に接続されている。機械学習装置10は、オンプレミスサーバーであってもよく、あるいは商用のクラウドサービスを利用したクラウドサーバーであってもよい。
【0033】
制御部11は、複数のCPU、複数のGPU(Graphics Processing Unit)、RAM、ROM、等を含みプログラムにしたがって、各装置の制御や、機械学習を行う。制御部11で行われる機械学習については後述する。
【0034】
記憶部12は、予め各種プログラムや各種データを格納しておく半導体メモリーや、ハードディスク等の磁気メモリーから構成される。機械学習により学習した機械学習モデルは、この記憶部12に記憶され、適当なタイミングで、画像形成装置30に送られる。
【0035】
ネットワークI/F13は、送受信部として機能する。ネットワークI/F13は、画像形成装置30等の他の機器とネットワークを経由したデータの送受信を行うインターフェースである。例えば、Ethernet、Bluetooth(登録商標)、IEEE802.11(Wi-Fi)、等の規格による通信を行う機器が用いられる。
【0036】
(画像形成装置30)
図3に示すように、画像形成装置30は、制御部31、記憶部32、操作パネル33、画像形成部34、搬送装置35、およびネットワークI/F36を備える。これらの構成部品は信号をやり取りするためのバス等の信号線を介して相互に接続されている。
【0037】
制御部31は、1つまたは複数のCPU、1つまたは複数のGPU(Graphics Processing Unit)、RAM、ROM、等を含みプログラムにしたがって上記各部の制御や各種の演算処理を行う。
【0038】
記憶部32は、予め各種プログラムや各種データを格納しておく半導体メモリーや、ハードディスク等の磁気メモリーから構成される。記憶部32には、機械学習装置10が生成した学習モデル(学習済みモデル)が記憶される。記憶部32にはファームウェアが含まれ、この学習モデルは、専用ソフトで書き込むことでファームウェアに記憶されてもよい。また、記憶部32には、機器状態情報が記憶される。この機械状態情報は、少なくとも用紙の搬送に影響する機械、電気部品の状態を示す情報である。例えば、各搬送ローラー対の搬送速度(1回転当たりの搬送量)が含まれる。この搬送速度は、例えば、モーターの回転量と、搬送路上の複数箇所に配置したセンサーの出力から逐次算出できる。この算出は、特定のモードで実施するようにしてもよく、通常の印刷時において逐次モニターすることで、複数枚の用紙の搬送履歴から算出するようにしてもよい。
【0039】
操作パネル33は、タッチパネル、テンキー、スタートボタン、ストップボタン等を備えており、各種情報の表示および各種指示の入力に使用される。操作パネル33を介して、ユーザーは、機械学習時における搬送量(後端位置)の設定を行うことで、スキュー補正の学習を行う1つのエピソードの区間の設定を行える。
【0040】
画像形成部34は、例えば帯電、露光、現像、転写、および定着の各工程を含む電子写真式プロセス等の周知の作像プロセスを用いて、各種データに基づく画像を用紙上に形成する。画像形成部34は、感光体ドラムへの露光を行う書込部341、および用紙上に形成されたトナー画像の加熱、加圧工程による定着処理を行う定着装置342を含む。
【0041】
画像形成部34においては、画像形成開始タイミングに合わせて、書込部による露光(書き出し)の開始タイミングと、レジストローラー(後述の搬送ローラー対r2)による用紙搬送タイミングが同期される。これにより、転写位置において、トナー画像と用紙との位置合わせがなされる。また、定着装置342は、定着ローラーの温度を測定する温度センサーと、定着ローラーを加熱するヒーターを備える。温度センサーの温度情報に基づいて、定着ローラーが制御温度になるようヒーターへの通電を制御する。用紙が定着装置の定着ローラーのニップ部を通過するタイミングでは、定着印字温度になるように制御される。例えば、定着印字温度とそれ以外の制御温度との差は、100℃以上である。定着ローラーは、ヒーターを動作させてから、すなわち、定着制御温度を、定着印字温度に上げてから、その制御温度になるまでディレイがある。そのため、用紙が定着ニップを通過する用紙定着時に、実際に定着印字温度になるように、ディレイを見込んだ所定時間(数十msecから数百msec)前に、制御温度を定着印字温度に変更する。
【0042】
ネットワークI/F36は、上述のネットワークI/F13と同様の構成であり、説明を省略する。
【0043】
(搬送装置35)
図4は、搬送装置35の構成を示す概略図である。図3図4を参照すると、搬送装置35は、複数の給紙トレイ、搬送路、この搬送路に沿って配置した複数の搬送ローラー対、これらの搬送ローラー対を駆動する複数の駆動源、および複数のセンサーs1~sxを備える。駆動源は、例えば駆動モーターM1~Mxである。駆動源として、駆動モーターの搬送ローラー対への駆動力の伝達のON/OFFを切り替えるクラッチを含めてもよい。
【0044】
図4は、用紙搬送において学習対象とする区間に対応する。この区間の搬送路においては、幅方向に沿って並んだ2組以上の搬送ローラー対(搬送ローラー対r11、r12)が含まれる。図4(a)は断面図で、図4(b)は上面図である。なお、図4(b)においては、一部の搬送ローラーの図示、および搬送路350よりも上側の構成部品に図示は省略している。
【0045】
図4の例においては、搬送路350には、複数の搬送ローラー対r00、r11、r12、r20、r30が配置され、これらはそれぞれ駆動モーターM1、M2、M3により駆動される。なお、図4の例では、搬送ローラー対r00、r30に関する駆動モーターの図示を省略している。この搬送路350としては、画像形成装置30内のいずれの搬送路に適用できる。例えば、給送トレイと画像形成部34の転写位置との間の搬送路に適用可能であり、後処理装置を有する場合には、画像形成装置本体と、後処理部との間の搬送路に適用できる。
【0046】
搬送路350は、上ガイド板と、下ガイド板で構成される。下ガイド板には、穴が設けられており、各穴には、センサーs11~s44が配置される。センサーs11~s44それぞれは、例えば発光部と、受光部を備える光学式のセンサーであり、設置された箇所において、搬送路上に用紙90が存在すること(または存在しないこと)を検出する。図4(b)に示すように、センサーs11~s44は、搬送方向、およびこれに直交する幅方向において格子状に点在する。これらのセンサーの搬送路上の2次元座標(搬送方向、および幅方向)は、予め登録されている。これらのセンサーの出力により直接的、または間接的に搬送する用紙90の位置情報、およびスキュー状態を検出する。したがって、複数のセンサーs11~s41は、協働することで、スキュー状態を検出する状態検出部、および位置検出部として機能する。なお、センサーの数はあくまでも例示であり、任意の数のセンサーを用いることができる。
【0047】
幅方向に並ぶ2組の搬送ローラー対r11、r12は、個別に駆動モーターM1、M2それぞれにより駆動される。図5は、搬送される用紙90のスキュー状態を示す模式図であり、図4(b)に対応する図である。以下においては、スキュー量は、用紙90の先端(用紙90は完全な矩形と仮定)の辺に平行な仮想線と、幅方向に平行な線とで形成される角度とする。しかしながら、スキュー量は、用紙90の幅方向の一方の辺、もしくは両方の辺、または後端の辺から算出するようにしてもよく、これらの4辺の組み合わせから算出するようにしてもよい。図5に示すように搬送される用紙90がスキュー量θで、左側に傾いていた場合には、相対的に左側の搬送ローラー対r12の搬送速度を、右側の搬送ローラー対r11よりも速くなるように設定することで、スキュー補正を行う。すなわちスキュー量(の絶対値)を小さくする。
【0048】
図6は、他の例における搬送装置35の構成を示す概略図である。図6では、用紙90の状態を検知するセンサーとして画像センサーs5、s6を用いる。画像センサーs5、s6は、例えば多数の撮像素子を幅方向に並べたCIS(Contact Image Sensor)であり、搬送路350の上側に配置される。搬送される用紙90を撮影することでエッジを検出する。図6では、2組の画像センサーs5、s6を、搬送方向に並べた例を示している。このように図4等に示した光学センサーに代えて、あるいはこれとともに、図6のような画像センサーs5、s6を用い、これらを、用紙90のスキュー状態を検出する状態検出部、および位置を検出する位置検出部として機能させてもよい。なお、この他のセンサーの例として静電式のセンサーを用いてもよい。
【0049】
(学習対象とする別の区間の例)
図7は、別の例における搬送装置35の構成を示す概略図である。図4から図6に示す例では、学習対象とする区間の搬送路350には、幅方向に並んだ2組の(独立して駆動する)搬送ローラー対が含まれる例を示した。図7に示す例では、学習対象とする区間の搬送路351には、搬送方向に並んだ2組以上の搬送ローラー対r0~r3が含まれる。特に搬送ローラー対r2は、レジストローラーであり、停止した搬送ローラー対r2に用紙90を突き当てて、一時停止させる。これにより、用紙90の先端の向きを、搬送ローラー対r2の軸方向に向きに沿わせることで、スキュー補正を行う。用紙90の先端が搬送ローラー対r2に突き当たるタイミングに対する、搬送ローラー対r1の停止タイミングを制御することで、スキュー補正の量を調整できる。一時停止した用紙90は、その後、画像形成開始タイミングに合わせて(あるいは画像形成開始タイミングから所定時間後に)搬送ローラー対r1、r2をほぼ同じタイミングで回転開始することで、再搬送される。
【0050】
以上で説明したような、搬送装置35における搬送路350、351において、各センサーの検知データ、および駆動源の駆動状態の情報のうち、少なくとも一部の情報が、環境の状態(ステート)を示す入力パラメータとなる。なお、駆動状態を示す情報には、駆動モーターの制御信号、制御電流、クロック周波数、回転数を示すエンコーダー信号、等がある。また報酬値に関連する情報には、スキュー状態(スキュー量)がある。また、行動(アクション)示す出力パラメータとしては駆動源の制御信号、制御電流、周波数などの制御情報が含まれる。以下に説明する機械学習装置10は、この入力パラメータ、出力パラメータ、および報酬値との関係を学習することより、学習モデルを生成する。
【0051】
機械学習装置10は、予め定めたルールにしたがって、ある状態の時にある行動を取ったときの報酬を計算し、報酬の総和を最適化するように、予め定めた計算式にしたがって行動価値(Q値)を算出してQテーブルを更新する。これにより行動を学習し、学習結果に基づいて行動を決定(行動価値が最も高い行動を選択)する。
【0052】
ここで、学習係数をη、時間割引率をγ、時刻tにおける報酬をRとすると、行動価値(Q(s,a))は、例えば、以下のQ学習の式(1)によって計算できる。
【0053】
【数1】
【0054】
(機械学習方法)
以下、図8から図12を参照し、本実施形態に係る機械学習方法について説明する。図8は、機械学習装置10の機能を示すブロック図である。図9は、機械学習装置10で実行される学習処理を示すフローチャートである。図10は、一実施例に係るテーブルタイプの学習モデルの例を示す図である。
【0055】
図8に示すように、機械学習装置10の制御部11は、学習ブロック110、および状態制御ブロック150として機能する。
【0056】
学習ブロック110には、行動選択部111、状態観測部112、報酬計算部113、および学習部114が含まれる。状態制御ブロック150には、観測情報生成部151が含まれる。図8に示す一例では、機械学習装置10の状態制御ブロック150は、画像形成装置30から記憶部32に記憶されている機器状態情報を取得し、これにより画像形成装置30の搬送装置35の状態を再現(シミュレート)するようにしてもよい。なお、以下に示す例では、時間ステップとして、0.1~10msecの範囲内のいずれかの値、例えば1msecを用いる。この時間ステップの設定については後述する(後述の図13)。なお、図8図9に示す本実施形態では、1つの時間ステップが、1つのエピソードに対応する。
【0057】
(ステップS201)
図9を参照すると、本ステップでは、行動選択部111は、現時点(今回サイクル)の時間ステップにおける状態に基づいて、各搬送ローラー対を駆動する駆動源に対して駆動制御に関する行動情報(速度指示ともいう)を決定し、出力する。以下においては、この行動情報をアクションともいう。
【0058】
図10(b)に示すテーブルは、行動情報の例である。同図では、2つの搬送ローラーA、Bの駆動速度に関して、複数のアクションa1~a8を取り得る。この2つの搬送ローラーそれぞれは、図4の幅方向に並んだ2組の搬送ローラー対r11、r12、あるいは、図7の搬送方向に並んだ2組の搬送ローラー対r1、r2に相当する。このアクションの選択は、図10(c)に示すQテーブルに基づいて、今回の状態(ステート)を参照することで行える。初期においては、Qテーブル内の数値は、ランダムな数値を入れてもよく、所定の数値を入れるようにしてもよい。例えば後者であれば所定値として、取り得るアクションの数で等分した数値(14個のアクションであればそれぞれ1/14)を入れる。学習が進んでいない初期状態においては、ε-greedy法によりアクションを一定の割合でランダムに選択するようにしてもよい。例えば、固定値のεを用いる(例えば0以上1未満で0.1~0.3の範囲の任意の値)。または学習が進むにつれて、εが小さくなるように設定した計算式、例えば、学習回数が所定値に到達する毎に1/2になるようにしたり、現時点の状態(s)から得られる行動価値Q(st,)の最大値で除算した計算式により算出したりするようにしてもよい。
【0059】
(ステップS202)
状態制御ブロック150は、ステップS201で受けた行動情報に基づいて、各搬送ローラー対を駆動する。具体的には、搬送ローラーA、Bを速度指示に基づく速度で駆動する。
【0060】
(ステップS203)
観測情報生成部151は、搬送路の環境における、(1)各搬送ローラー対を駆動する速度状態、(2)搬送中の用紙の位置情報、および(3)搬送中の用紙のスキュー状態の情報を生成する(以下、これらを観測情報という)。生成したこれらの観測情報は、学習ブロック110の状態観測部112に渡される。図10(a)は、1つのステート内のパターンを示すテーブルである。例えば、図4に示す例において、搬送路350に配置された複数のセンサーs11~s41、および駆動源の駆動状態の情報(エンコーダ信号等)、図10(a)のSensor1~14のいずれかにそれぞれ対応する。図10(a)に例示したテーブルではセンサーの数は14個であり、取り得る状態は2通り、すなわちそのセンサーの位置での用紙90の有無(ON/OFF)としており、この時の総ステート数は、16384通り(=2^14)となる。
【0061】
(ステップS204)
報酬計算部113は、スキュー状態を用いて報酬値を算出する。図11は、このステップS204の報酬値の付与処理を示すサブルーチンフローチャートである。
【0062】
(ステップS251)
報酬計算部113は、状態観測部112から、今回サイクルの用紙のスキュー状態を取得する。
【0063】
(ステップS252)
報酬計算部113は、メモリーに保持している前回サイクルのスキュー状態と、ステップS251で取得した今回サイクルのスキュー状態とを比較する。前回サイクルの状態データは、今回サイクルの状態データよりも1時間ステップ(例えば1msec)前の状態である。
【0064】
比較(絶対値の比較)により処理を、
前回のスキュー量<今回のスキュー量であれば(悪化)、ステップS253に進め、
前回のスキュー量=今回のスキュー量であれば(維持)、ステップS254に進め、
前回のスキュー量>今回のスキュー量であれば(改善)、ステップS255に進める。
【0065】
(ステップS253)
報酬計算部113は、ここでは報酬値=-1を与える。
【0066】
(ステップS254)
報酬計算部113は、ここでは報酬値=0(ゼロ)を与える。
【0067】
(ステップS255)
報酬計算部113は、ここでは報酬値=+1を与える。
【0068】
(ステップS256)
報酬計算部113は、次の時間ステップで処理に用いるため、今回のスキュー状態を、前回のスキュー状態として、メモリーに設定(保持)する。以上によりサブルーチン処理を終了し、図9の処理に戻る(リターン)。なお、図11に示す報酬付与処理は、あくまでも例示であり、改善の場合のみ正報酬を与え、これ以外はゼロの報酬としてもよく、あるいは、算出関数も用いてスキュー量の大きさに応じた報酬値を与えるようにしてもよい。
【0069】
(ステップS205)
図11に示す処理の後、再び図9に示す処理に戻る。ステップS205では、学習部114は、観測情報、行動情報、および/または報酬値から、学習モデルを更新する。例えば、図10に示す例では、報酬値と、上述したQ学習の式(1)を用いて行動価値(Q値)を算出することによって行動を学習し、Qテーブルを更新する。また、別な学習モデルとしてニューラルネットワークタイプの学習モデルに適用してもよい。
【0070】
図12は、一実施例に係るニューラルネットワークタイプの学習モデルの例を示す図である。あるタイミング(例えば前回の時間ステップ)での観測情報(s:1ステート内のパターン)を入力として、ニューラルネットワークにより、出力(a:各アクション(行動情報))とそのときのQ(s,a)を得る。そして学習部114は、このQ(s,a)が、「Rt+1+γmaxQ(st+1,at+1)」に近づくように(差分Eを小さく)、パラメータを調整する。例えば、バックプロパゲーション(Back-propagation、誤差逆伝搬法)という処理を行うことにより、比較結果の誤差が小さくなるように、パラメータを調整し、更新することで学習を行う。以上までの処理が、1つのエピソードの学習である。
【0071】
(ステップS206)
制御部11は、所定回数(例えば、数万回)の学習が完了していなければ(NO)、処理をステップS201に戻し、以降の処理を繰り返す。所定回数に達していれば(YES)、処理をステップS207に進める。
【0072】
(ステップS207)
機械学習装置10の制御部11は、更新した学習結果を記憶部12に出力し、学習モデルを更新し、学習処理を終了する(エンド)。
【0073】
このように、本実施形態に係る機械学習方法では、現段階での複数の搬送部材の駆動速度、被搬送媒体の位置、および被搬送媒体のスキュー状態から、スキュー状態が所定量になるように、次に出力すべき複数の搬送部材の駆動速度を、報酬値を用いて機械学習することで、前記学習モデルを生成する。このようにすることで、被搬送媒体の搬送におけるスキュー補正制御を適正に行える学習モデルを生成できる。
【0074】
(学習周期(時間ステップ)の決定手順)
図13は、学習周期の決定手順を説明するための模式図である。用紙90の搬送速度、例えば100mm/msec、1ステップ(機械学習の時間ステップ)の期間をt[msec]とする。この場合、1ステップ当たりの搬送量、すなわちスキュー補正単位=100tとなる。スキュー補正は、搬送ローラー対の配置間隔(一般に、最小サイズの送り方向用紙長さで決定される)である50~100mmの範囲内で制御する必要がある。そのため、補正精度を考慮して、スキュー補正は、50mm単位で制御を行うことが好ましい。このため、1ステップは、0.5ms(=50/100)となる。このような手順により1ステップが決定される。なお、搬送速度は、あくまでも例示であり、適宜設定することが可能である。
【0075】
(1エピソードの始期、終期のタイミング)
(幅方向に並んだ搬送ローラー対の場合)
図14A、14Bは、図4に示したような、幅方向に並んだ2組の搬送ローラー対でスキュー補正制御を行う場合における、機械学習における1エピソードの始期と終期を説明するための模式図である。
【0076】
学習の始期は、図14Aに示すように、用紙90の先端が、幅方向に並ぶ搬送ローラー対r11、r12のニップ中心位置c1に到達したタイミングとする。なお、この到達したタイミングとは、用紙90が斜めにスキューした状態で搬送された場合には、最も遅い側の先端が、ニップ中心位置c1に到達したタイミングである。なお、この判定は、搬送方向に直交する幅方向において、各搬送ローラー対r11、r12それぞれの全ニップ範囲で判定してもよく、それぞれのニップ範囲の中心位置で判定するようにしてもよい(以下の図15A等でも同様)。
【0077】
学習の終期は、図14Bに示すように、用紙90の後端が、幅方向に並ぶ搬送ローラー対r11、r12のニップ中心位置c1を通過したタイミングとする。なお、この通過したタイミングとは、用紙90が斜めにスキューした状態で搬送された場合には、最も速い側の後端が、ニップ中心位置c1に通過したタイミング、すなわち、複数の搬送ローラー対のうちのいずれか1つのニップ中心位置c1を通過したタイミングである。
【0078】
(搬送方向に並んだ搬送ローラー対の場合)
図15A、15Bは、図7で示したような、搬送方向に並んだ2組の搬送ローラー対でスキュー補正制御を行う場合における、機械学習における1エピソードの始期と終期を説明するための模式図である。
【0079】
学習の始期は、図15Aに示すように、用紙90の先端が、搬送方向に並ぶ搬送ローラー対r1、r2のうち、最下流の搬送ローラー対r2のニップ中心位置c2に到達したタイミングとする。なお、この到達したタイミングとは、用紙90が斜めにスキューした状態で搬送された場合には、最も進んだ側の先端が、ニップ中心位置c1に到達したタイミングである。
【0080】
学習の終期は、図15Bに示すように、用紙90の後端が始期の時点の位置x10から所定量(dx2)だけ搬送した位置x20に到達したタイミングである。この判定は、用紙90の先端が所定量だけ搬送することで判定してもよい。なお、この所定量は、予め設定されたものであるが、ユーザーにより設定を受け付ける処理を設けてもよい。具体的には、操作パネル33(またはネットワークに接続されたPC)を介して、ユーザーからの設定変更を受け付ける。変更された設定は、記憶部32に記憶され、機械学習装置10により参照される。
【0081】
(変形例における学習処理)
図16は、以上で説明した始期、終期の判定を組み込んだ変形例における学習処理を示すフローチャートである。
【0082】
(ステップS300)
機械学習装置10の制御部11は、開始条件を満たすか否かを判定する。この判定は、図14A(または図15A)で示した手順により行える。用紙先端が、所定位置に到達し、開始条件を満たす場合(YES)には、処理をステップS301に進める。
【0083】
(ステップS301~S305)
ここでは、機械学習装置10の制御部11は、ステップS301~S305の処理を行う。これらの処理は図9のステップS201~S205にそのまま対応する処理であり、説明を省略する。
【0084】
(ステップS306)
ここでは、機械学習装置10の制御部11は、終了条件を満たすか否かを判定する。この判定は、図14B(または図15B)で示した手順により行える。用紙後端が、所定位置に到達し、終了条件を満たす場合(YES)には、処理をステップS307に進める。終了条件を満たさない場合(NO)、処理をステップS301以下の処理を繰り返し、次の時間ステップの処理を行う。
【0085】
(ステップS307、S308)
ここでは、機械学習装置10の制御部11は、ステップS307、S308の処理を行う。これらの処理は、図9のステップS205、S206にそのまま対応する処理であり、説明を省略する。
【0086】
このように始期、終期を設定し、その間の区間で機械学習する。これにより、スキュー状態の補正に関連する区間のみを学習できるので、機械学習に要する時間、処理数を低減でき、効率よく機械学習できる。
【0087】
(学習モデルを用いた画像形成装置での制御)
次に、以上までのような機械学習により学習した学習モデルを画像形成装置30に適用した場合の処理の一例について説明する。
【0088】
(学習後の補正時間Yの方が長い場合)
図17は、スキュー状態の補正制御に要する時間に応じて、画像形成開始タイミング等の変更を行う処理を示す図である。画像形成装置30の制御部31は、機械学習装置10から、学習モデル(学習済みモデル)を取得し、これを記憶部32に記憶させる。また、画像形成装置30は、さらに、スキュー状態の補正制御に要する補正時間Y[ms]のデータも機械学習装置10から取得する。この補正時間は、機械学習装置10側で計測したものである。制御部31は、この補正時間Yと、製造業者(開発者)が設定した設計上の補正時間X[ms]とを比較する。この補正時間Xは、予め記憶部32に記憶されている。最初に、この学習後の補正時間Y>補正時間Xの場合での処理について説明する。
【0089】
図17(a)には、学習モデルを使わずに、設計値通りの設定で搬送制御をした場合のシーケンス動作を示しており、図17(b)は、学習モデルを用いてスキュー補正に関する搬送制御を実行した場合のシーケンス動作を示している。これらの図では、共通して、横軸には時間を、縦軸には用紙搬送方向における用紙位置を示しており、1枚の用紙を搬送した場合の状態をプロットしている(以下の図18も同様)。同図においては、スキュー状態の補正制御を、図7に示したような搬送方向に並んだ搬送部材により行う場合を想定している。この場合、スキュー状態の補正制御を行う補正区間(図17中の矢印)は、図15A、15Bに示したように、用紙90の先端が、停止状態の搬送ローラー対r2(レジストローラー)に到達して、停止している区間である。この場合、補正区間よりも前に画像形成開始タイミングが係る。この画像形成開始タイミングに同期して、画像形成部34の書込部341による書き出しが開始され、および搬送ローラー対r2、r1を駆動する駆動源の再駆動が行われる。
【0090】
図17(b)に示すように、画像形成装置30の制御部31は、補正時間Yが、補正時間Xよりも長い場合には、Y-X時間分だけ、画像形成開始タイミングを遅延させる。また、定着装置342の制御温度を上述の定着印字温度に切り替えるタイミングを、このY-X時間分だけ遅延させる。このように制御することで、学習モデルを用いて用紙の搬送制御を行う場合に、問題なく制御できる。なお、図17(b)に示す例では、補正区間に、画像形成開始タイミングが係ることになる。
【0091】
(学習後の補正時間Zの方が短い場合)
次に、学習後の補正時間Z<設計上の補正時間Xの場合での処理について説明する。図18は、スキュー状態の補正制御に要する時間に応じて、搬送動作開始タイミングの変更を行う処理を示す図である。
【0092】
図18(a)に示すように、定着装置342において、定着制御温度を待機温度(例えば100℃)から定着印字温度(例えば200℃)に切り替えた後、目標温度(印字温度)に到達するまで約2secのディレイが生じる。この場合、スキュー補正時間がXからZへと短くなる場合に、タイミングを補正せず、設計値を適用すると、図18(b)の破線に示すように、定着温度がT2(200-T2>100[℃])の時点で、用紙90の再搬送を開始することになる。このため、用紙が定着ニップに到達する時点で、定着温度が定着印字温度まで十分に昇温しておらず、狙いの定着性能が得られない。そこで、補正制御完了時に定着装置の定着温度(温度センサーの出力(温度情報))を取得し、定着温度がT3(ただし200-T3<100[℃]の関係式を満たす)になるまで、用紙90をレジストローラー(搬送ローラー対r2)の位置で停止させたままにする。このように制御することで、学習モデルを用いて用紙の搬送制御を行う場合に、問題なく制御できる。なお、図18と同様な制御を、画像形成開始タイミングにも適用してもよい。具体的には、補正時間の差分(X-Z)に応じて、画像形成開始タイミングを早くする。
【0093】
(機械学習装置10の変形例)
次に、機械学習装置10の各変形例について説明する。
【0094】
(第1の変形例)
図19は、第1の変形例に係る機械学習装置10、および画像形成装置30の構成を示す概略図である。図8に示した機械学習装置10では、観測情報生成部151は、画像形成装置30の環境をシミュレートし、行動選択部111から受けた行動情報に基づいて、観測情報を生成した。一方で、図19に示す第1の変形においては、実際の画像形成装置30の装置内の環境下において、観測された状態に対して機械学習装置10側で行動を選択する。そして画像形成装置30では、機械学習装置10側で選択された行動に基づいて、実行に移す。すなわち、画像形成装置30は搬送部材を駆動する駆動源の動作を制御する。そして、画像形成装置30は、センサーs1~sx、駆動モーターM1~Mx等から得られた環境の状態変化を、機器動作情報として機械学習装置10に送る。
【0095】
機械学習装置10の状態制御ブロックでは、取得したこれらの機器動作情報から、(1)各搬送ローラー対を駆動する速度状態、(2)搬送中の用紙の位置情報、および(3)搬送中の用紙のスキュー状態の観測情報を生成する。これらの観測情報は、機器動作情報に含まれる直接センシングデータから得られる場合(例えば速度状態、位置情報)と、機器動作情報の間接センシングデータ(例えばセンサーs1~sx)に基づいて、観測情報生成部151が生成する用紙のスキュー状態の情報が含まれる。図19に示すような構成によりスキュー補正に関する搬送制御を機械学習できる。
【0096】
(第2、第3の変形例)
図20図21はそれぞれ第2、第3の変形例に係る機械学習部10b、および画像形成装置30の構成を示す概略図である。同図に示す機械学習部10bは、独立した装置ではないため、機械学習部という名称を用いるが、実質的には、図8、または図19に示したような機械学習装置10と同じ構成であり、同じ機能を担う。
【0097】
図20に示す第2の変形例においては、画像形成装置30の制御部31内のエンジン制御SoC(System-on-a-Chip)において、機械学習部10bを機能させることで、画像形成装置30において、機械学習により学習モデルを生成する。そして生成した学習モデルを用いて、搬送制御を行う。
【0098】
図21に示す第3の変形例においては、機械学習用の専用の機械学習CPUを配置し、その機械学習CPUにより機械学習を行い、学習モデルを生成する。
【0099】
(第4の変形例)
図22は、第4の変形例に係る機械学習装置10c、および画像形成装置30の構成を示す概略図である。第4の変形例における機械学習装置10は、観測情報生成更新部152を含む。これは、より精度よく搬送動作に関する環境をシミュレートするために、機器の状態を表現するための観測情報生成部更新情報を取得し、これにより、観測情報生成更新部152は、観測情報生成を更新する。観測情報生成部151は、この更新された観測情報生成を用いて観測情報を生成する。
【0100】
(第5、第6の変形例)
図23図24それぞれは、第5、第6の変形例に係る機械学習装置10、および画像形成装置30の構成を示す概略図である。第4の変形例で示した観測情報生成更新部の機能は、第5の変形例では、制御部31内のエンジン制御SoCが担い、第6の変形例では、制御部31内の機械学習CPUが担う。
【0101】
(第7、第8の変形例)
図25図26それぞれは、第7、第8の変形例に係る機械学習部10b、および画像形成装置30の構成を示す概略図である。図7の変形例では、機械学習部10b、および観測情報更新部の機能は、制御部31内のエンジン制御SoCが担う。図8の変形例では、機械学習部10b、および観測情報更新部の機能は、制御部31内の機械学習CPUが担う。
【0102】
このように第1~第8の変形例のいずれかの構成においては、図1図12等で示した実施形態と同様に、機械学習を行うことでスキュー補正に関する搬送制御を機械学習した学習モデルを生成でき、これを画像形成装置30の記憶部32に記憶し、利用することで、搬送制御を適切に行える。
【0103】
以上に説明した、機械学習装置10(機械学習部10b)、画像形成装置30の構成は、上述の実施形態の特徴を説明するにあたって主要構成を説明したのであって、上述の構成に限られず、特許請求の範囲内において、下記のように種種改変することができる。また、一般の機械学習装置、または画像形成装置が備える構成を排除するものではない。
【0104】
また、上述した各実施形態では、搬送装置35は、画像形成装置30の内部構成として説明したがこれに限られず、搬送装置35を独立の装置としたり、画像形成した用紙に対して後処理を行う後処理装置の内部構成として構成したりしてもよい。このような場合であっても、機械学習装置10で学習した学習モデルを利用することで適切な搬送制御を行える。
【0105】
また、上述した機械学習装置、画像形成装置における各種処理を行う手段および方法は、専用のハードウェア回路、またはプログラムされたコンピューターのいずれによっても実現することが可能である。上記プログラムは、例えば、USBメモリーやDVD(Digital Versatile Disc)-ROM等のコンピューター読み取り可能な記録媒体によって提供されてもよいし、インターネット等のネットワークを介してオンラインで提供されてもよい。この場合、コンピューター読み取り可能な記録媒体に記録されたプログラムは、通常、ハードディスク等の記憶部に転送され記憶される。また、上記プログラムは、単独のアプリケーションソフトとして提供されてもよいし、一機能としてその検出部等の装置のソフトウエアに組み込まれてもよい。
【符号の説明】
【0106】
10 機械学習装置
11 制御部
110学習ブロック
111 状態観測部
112 状態観測部
113 報酬計算部
114 学習部
150 状態制御ブロック
151 観測情報生成部
152
12 記憶部
13 ネットワークI/F
30 画像形成装置
31 制御部
32 記憶部
33 操作パネル
34 画像形成部
35 搬送装置
350、351 搬送路
M1、M2、M3、M4、M5、Mx 駆動源
s1、s2、s3、s4、s5、s6、sx センサー
r00、r10、r20、r30、r11、r12 搬送ローラー対
36 ネットワークI/F
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14A
図14B
図15A
図15B
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26