(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-28
(45)【発行日】2023-12-06
(54)【発明の名称】給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置
(51)【国際特許分類】
B65H 3/48 20060101AFI20231129BHJP
B65H 3/10 20060101ALI20231129BHJP
B65H 7/06 20060101ALI20231129BHJP
【FI】
B65H3/48 320A
B65H3/10 B
B65H7/06
(21)【出願番号】P 2020019212
(22)【出願日】2020-02-06
【審査請求日】2022-12-20
(73)【特許権者】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】110000925
【氏名又は名称】弁理士法人信友国際特許事務所
(72)【発明者】
【氏名】藤田 祐史
【審査官】杉山 豊博
(56)【参考文献】
【文献】特開平05-201564(JP,A)
【文献】特開2010-120756(JP,A)
【文献】特開2014-047062(JP,A)
【文献】特開平01-187137(JP,A)
【文献】特開2016-052937(JP,A)
【文献】特開2013-193850(JP,A)
【文献】特開2010-037099(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B65H 3/48
B65H 3/10
B65H 7/06
(57)【特許請求の範囲】
【請求項1】
空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、
前記浮上させた用紙を吸着して搬送する吸着搬送部と、
駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部と、
前記用紙の浮上を検出する浮上検出部材と、
強化学習を実施することにより、前記駆動制御プログラムを更新するための制御情報を作成する学習装置と備え、
前記学習装置は、
前記浮上検出部材での検出結果に基づいて報酬を付与することによって、前記強化学習を実施する
給紙装置システム。
【請求項2】
前記学習装置は、
前記ファンからの空気の吹き出しを開始してから、前記浮上検出部材が前記用紙の浮上を検出するまでの浮上時間に応じて前記報酬を付与する
請求項1に記載の給紙装置システム。
【請求項3】
前記浮上検出部材は、前記吸着搬送部に対する前記用紙の吸着を検知する吸着センサーを含み、
前記学習装置は、
前記ファンからの空気の吹き出しを開始してから、前記吸着センサーによって前記用紙が前記吸着搬送部に吸着したことを検知する浮上完了高さまでの浮上時間に基づいて前記報酬を付与する
請求項1または2に記載の給紙装置システム。
【請求項4】
前記浮上検出部材は、前記用紙束の上部から前記吸着搬送部までの間の前記用紙の浮上高さを検知する浮上高さセンサーを含み、
前記学習装置は、前記浮上高さセンサーで検知された前記用紙の浮上高さ毎の浮上時間に基づいて、前記報酬を付与する強化学習を実施する
請求項1~3のうちの何れか1項に記載の給紙装置システム。
【請求項5】
前記学習装置は、前記浮上時間が、所定の時間範囲の場合に、前記報酬として正の報酬を付与する
請求項2~4のうちの何れか1項に記載の給紙装置システム。
【請求項6】
前記学習装置は、前記浮上時間が、所定の時間範囲外の場合に、前記報酬として負の報酬を付与する
請求項2~5のうちの何れか1項に記載の給紙装置システム。
【請求項7】
前記所定の時間範囲は、前記用紙の種類、サイズ、坪量、および表面の平滑度毎に設定された値である
請求項5または6に記載の給紙装置システム。
【請求項8】
前記学習装置は、
予め設定した浮上時間に対して、前記浮上検出部材での検出結果に基づく浮上時間が近いほど大きな正の報酬を付与し、前記浮上時間が遠いほど大きな負の報酬を付与する
請求項2~7のうちの何れか1項に記載の給紙装置システム。
【請求項9】
前記給紙トレイ上における前記用紙束の載置位置を規制するための規制部材を備え、
前記学習装置は、前記給紙トレイ上に載置された前記用紙束に対する前記規制部材の位置および前記ファンの風量のうちの少なくとも一方を行動として、前記強化学習を実施する
請求項1~8のうちの何れか1項に記載の給紙装置システム。
【請求項10】
複数の前記ファンを備え、
前記複数のファンのうちの少なくとも一つは、前記空気の吹き出し方向が可変なものであって、前記用紙を浮上させる機能と、前記用紙束から浮上させた複数の用紙間に空気を吹き込んで前記複数の用紙を分離させる機能との切り替えが自在な機能切替ファンであり、
前記学習装置は、さらに前記複数のファンのそれぞれのオン/オフおよび風量、および前記機能切替ファンの機能のうちの少なくとも1つを前記行動として追加した強化学習を実施する
請求項9項に記載の給紙装置システム。
【請求項11】
前記学習装置で作成した制御情報に基づいて、前記駆動制御プログラムを更新する更新処理部を備えた
請求項1~10のうちの何れか1項に記載の給紙装置システム。
【請求項12】
前記浮上検出部材は、前記用紙の浮上高さを画像で読み取る
請求項1~11のうちの何れか1項に記載の給紙装置システム。
【請求項13】
前記学習装置は、前記用紙の種類、サイズ、および坪量のうちに何れか1つでも変更された場合に、前記強化学習を開始する
請求項1~12のうちの何れか1項に記載の給紙装置システム。
【請求項14】
前記学習装置は、前記給紙トレイの開閉を検知した場合に、前記強化学習を開始する
請求項1~13のうちの何れか1項に記載の給紙装置システム。
【請求項15】
前記学習装置は、前記強化学習において正の報酬が所定回数連続した場合に、前記強化学習を終了させる
請求項1~14のうちの何れか1項に記載の給紙装置システム。
【請求項16】
前記ファンは、前記吸着搬送部による前記用紙の搬送方向に直行する前記用紙の幅方向から、前記給紙トレイ上の用紙束に対して空気を吹き出す
請求項1~15のうちの何れか1項に記載の給紙装置システム。
【請求項17】
前記学習装置は、ネットワーク上のサーバーに設けられたものであり、
前記ファンと前記吸着搬送部とを備えた複数の給紙装置本体によって、前記学習装置が共有される
請求項1~16のうちの何れか1項に記載の給紙装置システム。
【請求項18】
請求項1~17のうちの何れか1項に記載の給紙装置システムの学習装置が、前記ファンと前記吸着搬送部とを備えた給紙装置本体に対して一体に組み込まれた
給紙装置。
【請求項19】
空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、前記浮上させた用紙を吸着して搬送する吸着搬送部と、駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部と、前記用紙の浮上を検出する浮上検出部材と、強化学習を実施することにより、前記駆動制御プログラムを更新するための制御情報を作成する学習装置とを備えた給紙装置の制御プログラムであって、
前記学習装置に対して、前記浮上検出部材での検出結果に基づいて報酬を付与することによる前記強化学習を実施させる
給紙装置制御プログラム。
【請求項20】
請求項1~17のうちの何れか1項に記載の給紙装置システムと、
前記給紙装置システムから給紙された用紙に画像を形成する画像形成部とを備えた
画像形成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置に関する。
【背景技術】
【0002】
複写機、プリンタ装置、ファクシミリ装置、印刷機、複合機等の画像形成装置には、用紙を積層した用紙束から一枚の用紙を取り出して搬送する給紙装置が装備されている。このような給紙装置の一つとして、用紙束から用紙を浮上させるための空気を吹き出すファン、および浮上した用紙を1枚ずつに分離するための空気を吹き出すファンを備え、分離した最上部の用紙を吸着ベルトに吸着させて搬送する方式のものがある。
【0003】
このような方式の給紙装置においては、一度に複数枚の用紙が搬送される重送が発生した場合、用紙詰まり等の異常発生の原因となる。そこで、用紙の搬送状況を検出する検出手段と、検出手段の検出結果に応じてファンから吹き出す空気の流量を調整する調整手段を設けることにより、空気の流量を適正化して重送を抑止する構成が提案されている(下記特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、検出手段での検出結果に応じてファンから吹き出す空気の流量を調整する構成では、経験に基づいて予め設定された仕様に基づき、予め設定されたパターンにしたがった流量調整しか行うことができない。このため、実際に使用される多種多様な種類の用紙や、様々な装置環境に対して装置性能を満足するような調整を実施することは難しかった。
【0006】
そこで本発明は、用紙の種類や装置の設置環境によらずに、高精度な用紙供給を実施することが可能な給紙装置システム、給紙装置、および給紙装置制御プログラムを提供することを目的とする。また本発明は、これらの給紙装置システム、給紙装置、給紙装置制御プログラムを用いることにより、複数枚の用紙に対して連続した円滑な画像形成が可能な画像形成装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
このような目的を達成するための本発明は、空気の吹き出しによって給紙トレイ上の用紙束から用紙を浮上させる機能を有するファンと、前記浮上させた用紙を吸着して搬送する吸着搬送部と、駆動制御プログラムに基づいて前記ファンと前記吸着搬送部の駆動を制御する駆動制御部と、前記用紙の浮上を検出する浮上検出部材と、強化学習を実施することにより、前記駆動制御プログラムを更新するための制御情報を作成する学習装置と備え、前記学習装置は、前記浮上検出部材での検出結果に基づいて報酬を付与することによって、前記強化学習を実施する給紙装置システムである。
【発明の効果】
【0008】
本発明によれば、用紙の種類や装置の設置環境によらずに、高精度な用紙供給を実施することが可能な給紙装置システム、給紙装置、および給紙装置制御プログラムを提供すること、および複数枚の用紙に対して連続した円滑な画像形成が可能な画像形成装置を提供することができる。
【図面の簡単な説明】
【0009】
【
図1】本発明の実施形態に係る給紙装置システムの概略構成図である。
【
図2】本実施形態の給紙装置本体の概略断面図である。
【
図3】本実施形態の給紙装置本体の要部拡大図である。
【
図4】本発明の実施形態に係る給紙装置システムのブロック図である。
【
図5】本実施形態の給紙装置本体の駆動の概要を説明する図(その1)である。
【
図6】本実施形態の給紙装置本体の駆動の概要を説明する図(その2)である。
【
図7】本実施形態の給紙装置本体の駆動の概要を説明する図(その3)である。
【
図8】本実施形態に係る給紙装置システムによって実施される学習処理の手順を示すフローチャートである。
【
図9】本実施形態に係る強化学習における行動の一例を示す図である。
【
図10】本実施形態に係る強化学習において報酬の計算処理に用いる浮上完了高さまでの浮上時間[t]を説明する図(その1)である。
【
図11】本実施形態に係る強化学習において報酬の計算処理に用いる浮上完了高さまでの浮上時間[t]を説明する図(その2)である。
【
図12】浮上完了高さまでの浮上時間[t]に基づく報酬の計算処理においてする報酬の付与を説明するためのグラフである。
【
図13】浮上完了高さまでの浮上時間[t]に基づく報酬の計算処理を示すフローチャートである。
【
図14】強化学習における報酬の計算処理の他の例を説明する図である。
【
図15】各浮上高さでの浮上時間[t]に基づく報酬の計算処理においてする報酬の付与を説明するためのグラフである。
【
図16】本実施形態に係る強化学習における行動の学習処理を示すフローチャートである。
【
図17】本実施形態に係る強化学習の一例を説明するQテーブルの図である。
【
図18】本実施形態に係る給紙装置システムによって実施される駆動制御プログラムの更新処理を示すフローチャートである。
【
図19】本実施形態に係る給紙装置システムを有する画像形成装置の一例を示す構成図である。
【発明を実施するための形態】
【0010】
以下、本発明の給紙装置システム、給紙装置、給紙装置制御プログラム、および画像形成装置を実施するための形態を、図面に基づいて説明する。なお以下の説明において、各図に共通の部材には同一の符号を付し、重複する説明は省略する。
【0011】
≪給紙装置システム≫
図1は、本発明の実施形態に係る給紙装置システム1の概略構成図である。また
図2は、本実施形態の給紙装置本体10の概略断面図であって、
図1のA-A’断面に相当する図である。これらの図に示す給紙装置システム1は、給紙装置本体10と、学習装置20(
図1のみに図示)とを備える。
【0012】
このうち給紙装置本体10は、積層複数の用紙Pを積層した用紙束Pbに空気を吹き付けることで用紙Pを浮上させて分離し、分離した1枚の用紙Pを搬送方向Xに搬送する空気分離方式のものである。このような給紙装置本体10は、用紙Pが積載される給紙トレイ11、用紙規制部材12、側方ファン13L,13R、先端ファン14、吸着搬送部15、用紙搬送部16(
図2のみに図示)、制御部17、および入力部18(
図1のみに図示)を備えている。また給紙装置本体10は、上昇検知センサーUS(
図2のみに図示)、用紙Pの浮上高さセンサーLS1~LSn、規制部材位置センサーBS,FS(
図1のみに図示)、吸着センサーASおよび開閉センサーOpS(
図2のみに図示)を備えている。
【0013】
一方、学習装置20は、給紙装置本体10を駆動するためのファームウェアである駆動制御プログラムを更新するための強化学習を実施するものである。この学習装置20は、複数の給紙装置本体10によって共有される構成のものであってもよい。さらに学習装置20は、給紙装置本体10または複数の給紙装置本体10を備えた給紙システムに組み込まれ、これらと共に給紙装置を構成してもよい。
【0014】
以下、
図1および
図2に基づき、必要に応じて他の図を参照しつつ、本実施形態に係る給紙装置システム1の詳細を、給紙装置本体10の構成要素から順に説明し、次いで給紙装置本体10の駆動の概要を説明し、その後、学習装置20の詳細を説明する。
【0015】
<給紙トレイ11>
給紙トレイ11は、図示しない昇降機構によって、図中の白抜き矢印に示すように昇降可能となっている。すなわち、用紙Pは給紙トレイ11上に昇降可能に収容されている。また、給紙トレイ11は、以降に説明する上昇検知センサーUSでの検知結果に基づく昇降機構の制御により、上部に積載された用紙束Pbの高さが所定の高さに維持される。所定の高さとは、以降に説明する側方ファン13L,13R、および先端ファン14からの空気の吹き付けによる用紙Pの浮上および用紙Pの分離に最適な高さである。
【0016】
<用紙規制部材12>
用紙規制部材12は、給紙トレイ11上における用紙Pの載置位置を規制する部材であって、給紙トレイ11上に積載された用紙Pの四方向に配置されている。このような用紙規制部材12は、前端規制部材12A、後端規制部材12B、側部規制部材12L,12Rである。
【0017】
[前端規制部材12A]
前端規制部材12Aは、給紙トレイ11上に積載された用紙Pの搬送方向Xの前方に配置され、用紙Pの搬送方向Xの前端位置を規制している。ここで用紙Pの搬送方向Xとは、以降に説明する吸着搬送部15が用紙Pを搬送する方向である。このような前端規制部材12Aは、例えば板状の部材であって、上端部を切り欠いた前端開口121(
図2のみに図示)を有する。この前端開口121は、以降に説明する先端ファン14から吹き出された空気を、用紙束Pbの前端側から給紙トレイ11上に積載された用紙Pの用紙束Pbの上部に吹き付けるための開口となっている。
【0018】
なお、前端規制部材12Aは、次に説明する先端ファン14を収容する箱状の筐体であってもよい。この場合、前端規制部材12Aは、給紙トレイ11側に向く部分と、給紙トレイ11側において上方に向く部分とに設けられ、これらの部分は連通していてもよい。
【0019】
[後端規制部材12B]
後端規制部材12Bは、給紙トレイ11上に積載された用紙Pの搬送方向Xの後端側に配置さている。この後端規制部材12Bは、用紙Pの搬送方向Xに移動自在に構成された板状の部材であって、給紙トレイ11上に積載された用紙Pを、搬送方向Xの後端側から軽く押圧することによって用紙Pの搬送方向Xの後端位置を規制している。
【0020】
このような後端規制部材12Bは、後端部材駆動機構1201(
図2のみに図示)を備え、この後端部材駆動機構1201によって用紙Pの搬送方向Xに移動自在である。後端部材駆動機構1201は、以降に説明する制御部17からの指示によって、後端規制部材12Bを所定の位置に移動させる。
【0021】
[側部規制部材12L,12R]
側部規制部材12L,12Rは、給紙トレイ11上に積載された用紙Pの幅方向Yの両側に配置されている。用紙Pの幅方向Yとは、給紙トレイ11上に積載された用紙Pの搬送方向Xに対して垂直な方向である。これらの側部規制部材12L,12Rは、幅方向Yに移動自在に設けられており、給紙トレイ11上に積載された用紙Pの用紙幅に対応して、用紙Pを両側から軽く押圧することによって用紙Pの両側位置を規制する。
【0022】
このような側部規制部材12L,12Rは、側部駆動機構1202(
図2のみに図示)を備え、この側部駆動機構1202によって幅方向Yに移動自在である。側部駆動機構1202は、以降に説明する制御部17からの指示によって、側部規制部材12L,12Rを所定の位置に移動させる。
【0023】
またこれらの側部規制部材12L,12Rは、次に説明する側方ファン13L,13Rを収容する筐体として構成されている。このような側部規制部材12L,12Rは、給紙トレイ11側に向く上方部分に側部開口122を有し、給紙トレイ11上に積載された用紙Pの用紙束Pbの上部に、用紙束Pbの幅方向Yの両側方から空気を吹き付ける構成となっている。
【0024】
<側方ファン13L,13R>
側方ファン13L,13Rは、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして用いられるものであり、側部規制部材12L,12Rの内部に収容されている。各側方ファン13L,13Rは、送風管131を有し、送風管131の吹出口132は、側部規制部材12L,12Rの側部開口122に一致して設けられている。これにより、側方ファン13L,13Rは、用紙Pの搬送方向Xに直交する幅方向Yの両側から用紙束Pbの上部に空気を吹き付け、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして機能する。このような側方ファン13L,13Rは、以降に説明する制御部17からの指示に基づいて、オン/オフおよび風量の調整が自在である。
【0025】
なお、各側方ファン13L,13Rの吹出口132からの空気の吹き出し方向は、幅方向Yに完全に一致している必要はなく、次に説明する先端ファン14からの空気の吹き出しとのバランスを考慮し、必要に応じた角度で搬送方向Xに向けられていていることとする。また各側方ファン13L,13Rの吹出口132からの空気の吹き出しの高さ方向、すなわち搬送方向Xおよび幅方向Yに対して垂直な方向の角度も同様である。
【0026】
以上のような側方ファン13L,13Rは、側部規制部材12L,12R内に収容されているため、用紙Pのサイズが変更された場合でも、側部規制部材12L,12Rを移動させることによって、側方ファン13L,13Rも一緒に移動することになる。なお、本例では、2つの側方ファン13L,13Rを用紙Pの両側に設ける構成を採っているが、片側だけに側方ファン13L,13Rを設ける構成としてもよい。
【0027】
<先端ファン14>
先端ファン14は、用紙束Pbから浮上した複数の用紙Pを捌いて分離させるための分離ファン、および用紙束Pbの上部の用紙Pを浮上させる浮上ファンとで機能を切り替えて用いられる機能切替ファンである。このような先端ファン14は、前端規制部材12Aに近接して配置されている。前端規制部材12Aが、筐体として構成されている場合であれば、先端ファン14は前端規制部材12Aの内部に収容されていることとする。このような先端ファン14は、送風管141を有する。送風管141の吹出口142(
図2のみに図示)は、前端規制部材12Aの前端開口121に一致して設けられている。
【0028】
図3は、本実施形態の給紙装置本体10の要部拡大図であって、先端ファン14の上部を含む部分を拡大した概要図である。この図に示すように、先端ファン14は、送風管141の吹出口142側に、先端ファン14からの空気の吹き出し角度を制御するための先端シャッター143を備えている。先端シャッター143は、切替駆動部144を備える。切替駆動部144は、ソレノイドであって、以降に説明する制御部17(
図1および
図2参照)による制御に基づいて駆動し、先端ファン14からの空気の吹き出し角度を可変とし、先端ファン14の機能を、用紙Pの浮上用と分離用とで切り替える。
【0029】
より具体的には、切替駆動部144の駆動により、送風管141の吹出口142側の下方を先端シャッター143で閉じることにより、
図3中の実線矢印に示すように、先端ファン14からの空気の吹き出し角度が上方側となる。これにより、先端ファン14は、上方に浮上した複数の用紙P間に空気を吹き込んで用紙Pを分離する分離ファンとして機能するようになる。
【0030】
これに対し、切替駆動部144の駆動により、送風管141の吹出口142側の上方を先端シャッター143で閉じる(
図3中の二点鎖線の状態とする)ことにより、
図3中の破線矢印で示すように、先端ファン14からの空気の吹き出し角度が水平側となる。これにより、先端ファン14は、用紙Pの搬送方向Xから用紙束Pbの上部に空気を吹き付け、用紙束Pbの上部の用紙Pを浮上させる浮上ファンとして機能するようになる。
【0031】
以上のように、先端ファン14は、送風管141の吹出口142側に配置した先端シャッター143を切替駆動部144によって駆動することにより、分離ファンまたは浮上ファンのいずれか一方に切り替えられる。このような先端ファン14は、以降に説明する制御部17からの指示に基づいて、分離ファンと浮上ファンとの機能の切り替えと、オン/オフ、および風量の調整が自在である。
【0032】
<吸着搬送部15>
図1および
図2に戻り、吸着搬送部15は、用紙Pの搬送方向Xの前端部上方に配置されている。この吸着搬送部15は、駆動ローラー151、2つの従動ローラー152A,152B、吸着ベルト153、および吸引装置154を有する。
【0033】
駆動ローラー151は、用紙Pの幅方向Yに軸を向けた状態で、用紙Pの搬送方向Xの上流側に配置されている。従動ローラー152A,152Bは、用紙Pの積層方向に並べて配置されている。これらの従動ローラー152A,152Bは、駆動ローラー151に対して軸を平行に保った状態で、駆動ローラー151に対して用紙Pの搬送方向Xの下流側に所定の距離だけ離間して配置されている。
【0034】
吸着ベルト153は、無端状のものであって、駆動ローラー151と、従動ローラー152A,152Bとにわたって巻回されている。この吸着ベルト153は、多数の小径の貫通孔153a(
図1のみに図示)を有する。
【0035】
吸引装置154は、駆動ローラー151と、従動ローラー152A,152Bとの間で、これらに巻回された吸着ベルト153の内周部に配置されている。吸引装置154は、吸着ベルト153に穿設された貫通孔153aを介して用紙Pを上方から吸引する。すなわち、吸着搬送部15は、吸引装置154によって吸着ベルト153に用紙Pを吸着させつつ、駆動ローラー151の駆動による吸着ベルト153の回動によって用紙Pを搬送方向Xに搬送する。
【0036】
この吸引装置154は、用紙Pの搬送方向(X方向)に沿って2つの吸引ダクトに分割され、一方の吸引ダクトのみで用紙Pを吸引する場合と、2つの吸引ダクトで用紙Pを吸引する場合とに切り換え可能な構成となっていてもよい。
【0037】
以上のような吸着搬送部15は、以降に説明する制御部17からの指示に基づいて、駆動ローラー151による用紙Pの搬送のオン/オフ、および吸引装置154による用紙Pの吸着のオン/オフが自在である。
【0038】
<用紙搬送部16>
図2に示すように、用紙搬送部16は、吸着搬送部15における用紙Pの搬送方向Xの下流側に配置されている。この用紙搬送部16は、下方ガイド部材161、上方ガイド部材162、下方搬送ローラー163、および上方搬送ローラー164を備える。
【0039】
下方ガイド部材161および上方ガイド部材162は、例えば板状のものであって、吸着搬送部15から搬送された用紙Pの経路を、上下方向から間隔を設けて挟むように配置されている。また下方ガイド部材161は、下方搬送ローラー163を回動自在に支持する。上方ガイド部材162は、上方搬送ローラー164を回動自在に支持する。
【0040】
下方搬送ローラー163および上方搬送ローラー164は、それぞれが下方ガイド部材161と上方ガイド部材162とに対して回動自在に支持された状態で、用紙Pを挟持するニップ部を形成する。これらの下方搬送ローラー163および上方搬送ローラー164は、ニップした用紙Pを搬送方向Xに排出する。
【0041】
<制御部17>
図4は、本発明の実施形態に係る給紙装置システム1のブロック図である。以下、
図4に基づき、先の
図1~
図3を参照しつつ、制御部17の構成を説明する。制御部17は、以降に説明する入力部18、上昇検知センサーUS、用紙Pの浮上高さセンサーLS1~LSn、規制部材位置センサーBS,FS、吸着センサーAS、および開閉センサーOpSに接続され、これらで検知した信号が入力される。また制御部17は、側方ファン13L,13R、先端ファン14、先端ファン14に設けた切替駆動部144、吸着搬送部15、用紙搬送部16に接続され、これらの駆動を制御する。さらに制御部17は、後端規制部材12Bおよび側部規制部材12L,12Rのそれぞれの駆動機構に接続され、後端規制部材12Bおよび側部規制部材12L,12Rの位置を制御する。さらに制御部17は、以降に説明する学習装置20に接続され、学習装置20との間での通信が可能である。
【0042】
このような制御部17は、マイクロコンピューターなどの計算機によって構成されている。計算機は、いわゆるコンピューターとして用いられるハードウェアであって、ここでの図示を省略したCPU(Central Processing Unit)、RAM(Random Access Memory)、およびROM(Read Only Memory)やHDD(hard disk drive)のような不揮発性の記憶部を備える。また計算機は、RTC(real-time clock)および通信インタフェースを備えている。
【0043】
以上のような計算機によって構成された制御部17は、機能要素として駆動制御部171と、学習情報収集部172と、学習情報通知部173と、更新処理部174とを有する。これらの各機能要素によって実行される手順は、ROMに保存されたプログラム、または外部装置からRAMにロードされて保存されたプログラムであることとする。以下、これらの各機能要素を説明する。
【0044】
[駆動制御部171]
駆動制御部171は、入力部18からの指示、上昇検知センサーUS、用紙Pの浮上高さセンサーLS1~LSn、規制部材位置センサーBS,FS、吸着センサーAS、および開閉センサーOpSから入力された信号に基づいて、給紙装置本体10の各駆動部分の駆動を制御する。駆動制御部171による給紙装置本体10の各駆動部分の駆動の制御は、駆動制御プログラムに従って実施される。
【0045】
駆動制御プログラムは、例えば(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能の切り替え、(4)側方ファン13L,13Rの風量、(5)先端ファン14の風量、(6)後端規制部材12Bの位置、および(7)側部規制部材12L,12Rの位置の制御を含む。また駆動制御プログラムは、(8)吸着搬送部15における駆動ローラー151の駆動、および(9)用紙搬送部16の駆動の制御を含む。
【0046】
以上の駆動制御プログラムに従った駆動制御部171による制御の手順は、以降の給紙装置本体10の駆動の概要において説明する。
【0047】
[学習情報収集部172]
学習情報収集部172は、学習装置20で実施する強化学習に必要な情報を、学習情報として収集する。このような学習情報は、給紙装置本体10の駆動情報、および用紙Pに関する用紙情報である。
【0048】
このうち駆動情報は、上昇検知センサーUS、用紙Pの浮上高さセンサーLS1~LSn、規制部材位置センサーBS,FS、吸着センサーAS、および開閉センサーOpSが検知したセンシングデータであって、給紙装置本体10の装置状態を示す装置情報を含む。また駆動情報は、駆動制御部171によって実施される駆動制御プログラムを含む。
【0049】
また用紙情報は、給紙装置本体10において給紙した用紙Pについての用紙情報、および次に給紙を実施する用紙Pについての用紙情報である。これらの用紙情報は、例えば用紙Pの種類、サイズ、坪量、および平滑度(表面性)である。用紙Pの種類は、普通紙、上質紙、表面が平滑な塗工紙、OHPフィルム、トレース用紙、厚手紙、光沢紙などを例示することができる。また用紙Pの種類には、用紙Pの平滑度のような表面性に関する情報や、封筒であるか否かなどの情報が含まれていてもよい。用紙Pのサイズは、用紙Pの搬送方向Xおよび幅方向Yの大きさであり、A4サイズ、B5サイズ、B4サイズ、A3サイズなどを例示することができる。用紙Pの坪量は、用紙Pの1m2当たりの重量である。
【0050】
このような用紙情報は、次に説明する入力部18から入力されるか、またはこの給紙装置本体10が、メディアセンサーを備えている場合は、メディアセンサーでの測定結果を反映した情報であってよい。メディアセンサーは、例えば坪量であれば超音波センサーの音の跳ね返りや透過型センサーの受光機が受ける光の減衰程度で測ることができる。平滑度であればCMOSセンサーなどで用紙を斜めから撮影し、用紙の端部の凹凸から測定することができる。
【0051】
学習情報収集部172は、これらの学習情報を、駆動制御部171から収集してもよいし、上昇検知センサーUS、用紙Pの浮上高さセンサーLS1~LSn、規制部材位置センサーBS,FS、吸着センサーAS、および開閉センサーOpSから直接収集してもよい。この学習情報収集部172による学習情報の収集の手順は、駆動制御プログラムを更新するための更新プログラムに従って実施される。この更新プログラムは、この給紙装置システム1によって実施される給紙装置制御プログラムの一部であり、以降の給紙装置の制御方法において詳細に説明する。
【0052】
[学習情報通知部173]
学習情報通知部173は、学習情報収集部172で収集した学習情報を、以次に説明する学習装置20に通知する。この学習情報通知部173による学習情報の通知の手順は、上述した更新プログラムに従って実施される手順である。
【0053】
[更新処理部174]
更新処理部174は、以次に説明する学習装置20から出力された制御情報に基づいて、駆動制御部171において実行される駆動制御プログラムを更新する。この更新処理部174による駆動制御プログラムの更新の手順は、上述した更新プログラムに従って実施される手順である。
【0054】
<入力部18>
入力部18は、給紙装置本体10による給紙開始の指示、および給紙装置本体10で給紙する用紙Pの種類、サイズ、坪量、および平滑度(表面性)を入力する。このような入力部18は、例えば図示したタッチパネル式の操作部のようにユーザーが任意に指定操作する構成のものであってよい。なお、用紙Pの種類、サイズ、坪量、および平滑度(表面性)は、上述したメディアセンサーなどを用いて自動的に判別される構成であってもよい。この場合、用紙Pの種類、サイズ、坪量、および平滑度(表面性)を判別するためのメディアセンサーも、入力部18として含んでよい。
【0055】
<上昇検知センサーUS>
上昇検知センサーUSは、用紙Pが積載された給紙トレイ11の上昇を制御するためのセンサーである。このような上昇検知センサーUSは、給紙トレイ11上に積載された用紙束Pbの最上部が、所定の高さ位置にまで上昇したことを検知する。所定の高さとは、先にも説明したように、側方ファン13L,13R、および先端ファン14からの空気の吹き付けにより、給紙トレイ11上に積載された用紙Pの浮上および用紙Pの分離に最適な高さである。
【0056】
<浮上高さセンサーLS1~LSn>
図3に示すように、浮上高さセンサーLS1~LSnは、給紙トレイ11上の用紙束Pbからの用紙Pの浮上を検出するための浮上検出部材に含まれる。浮上高さセンサーLS1~LSnは、用紙Pの積層方向である高さ方向Hに沿って複数配置され、用紙Pの浮上高さ[h]を検知する。ここでは、用紙束Pbの上端から、吸着搬送部15における吸着ベルト153の下端面までの間に、用紙束Pbの上端側から順に浮上高さセンサーLS1~LSnを配置した。これらの浮上高さセンサーLS1~LSnは、例えば浮上した用紙Pが各浮上高さセンサーLS1~LSnと一致する高さとなった場合にオン状態となり、それ以外はオフ状態となり、これにより用紙Pの浮上高さが検知される構成となっている。なお、浮上高さセンサーLS1~LSnは、用紙束Pbから吸着搬送部15までの間の用紙Pの浮上高さを検知できれば、個々に設けられたセンサーに限定されることはなく、複数の撮像素子を有して用紙Pの浮上高さを画像で読み取るラインセンサーのような撮像装置であってもよい。
【0057】
<規制部材位置センサーBS,FS>、
規制部材位置センサーBS,FSは、後端規制部材12Bの位置を検知する後端規制部材位置センサーBSと、側部規制部材12L,12Rの位置を検知する側部規制部材位置センサーFSである。
【0058】
このうち後端規制部材位置センサーBSは、後端規制部材12Bの位置を検知する。後端規制部材位置センサーBSが検知する後端規制部材12Bの位置は、例えば給紙トレイ11上に積載された用紙束Pbに対する後端規制部材12Bの位置である。後端規制部材位置センサーBSは、検知した後端規制部材12Bの位置情報を、制御部17に送る。
【0059】
また側部規制部材位置センサーFSは、側部規制部材12L,12Rの位置を検知する。側部規制部材位置センサーFSが検知する側部規制部材12L,12Rの位置は、例えば給紙トレイ11上に積載された用紙束Pbに対する側部規制部材12L,12Rの位置である。側部規制部材位置センサーFSは、検知した側部規制部材12L,12Rの位置情報を、制御部17に送る。
【0060】
<吸着センサーAS>
吸着センサーASは、用紙束Pbの上部から浮上した用紙Pが、吸着搬送部15の吸着ベルト153に吸着したことを検知する。吸着センサーASは、給紙トレイ11上の用紙束Pbからの用紙Pの浮上を検出するための浮上検出部材に含まれる。このような吸着センサーASは、例えば吸着ベルト153の内周側から、吸着ベルト153の下面に臨む位置に配置されている。
【0061】
<開閉センサーOpS>
開閉センサーOpSは、給紙トレイ11上への用紙Pの出し入れを検知する。このような開閉センサーOpSは、一例として後端規制部材12Bに設けられ、後端規制部材12Bの移動を検知することによって、給紙トレイ11上への用紙Pの出し入れを検知する構成であるが、これに限定されることはない。
【0062】
なお、ここでの図示は省略したが、この給紙装置本体10には、さらに用紙Pの搬送方向Xの先端位置を検知するための用紙位置センサーや、吸着搬送部15によって搬送された用紙Pが1枚であるか複数枚積層されているかを検知するための重送センサーを有していることとする。
【0063】
<給紙装置本体10の駆動の概要>
次に、駆動制御プログラムに従った駆動制御部171での制御による給紙装置本体10の駆動の概要を説明する。
図5~
図7は、本実施形態の給紙装置本体の駆動の概要を説明する図(その1)~(その3)である。以下、これらの図に基づいて、上述した構成の給紙装置本体10の駆動の概要を説明する。
【0064】
先ず
図5に示すように、吸着搬送部15の駆動ローラー151をオフ、吸引装置154をオン状態としておく。この状態で、側方ファン13L,13Rをオン状態として、用紙束Pbの上部に、側方ファン13L,13Rからの空気を吹き出し、用紙束Pbの上部の用紙Pを浮上させる。この際、切替駆動部144の切り替えにより、先端ファン14を浮上ファンに切り替えた状態で、先端ファン14をオン状態として用紙Pの浮上を補助する。そして、最上部の用紙Pが、吸着センサーASに達すると、側方ファン13L,13Rをオフ状態とする。
【0065】
次に、
図6に示すように、側方ファン13L,13Rをオフ状態とし、先端ファン14をオン状態とし、切替駆動部144の切り替えにより、先端ファン14を分離ファンに切り替える。これにより、分離ファンとして機能させた先端ファン14により、浮上した複数枚の用紙P間に空気を吹き込んで用紙P間を捌いて分離し、1枚の用紙Pのみを吸着搬送部15の吸着ベルト153に吸着させる。
【0066】
この状態で、
図7に示すように、側方ファン13L,13Rと共に、先端ファン14をオフ状態とし、所定のタイミングで吸着搬送部15の駆動ローラー151をオン状態とする。これにより、吸着ベルト153に吸着させた1枚の用紙Pを、搬送方向Xに搬送する。また吸着搬送部15によって搬送方向Xに搬送された用紙Pは、
図2に示した用紙搬送部16によって、さらに搬送方向Xに搬送される。
【0067】
以上説明した給紙装置本体10の駆動手順は、給紙装置本体10の駆動の概要であって、駆動制御部171が有する駆動制御プログラムは、(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能の切り替え、(4)側方ファン13L,13Rの風量、(5)先端ファン14の風量、(6)後端規制部材12Bの位置、および(7)側部規制部材12L,12Rの位置などを、精密に制御する。このような駆動制御プログラムは、次に説明する学習装置20からの出力に基づき、更新プログラムに従って適宜のタイミングで更新される。
【0068】
<学習装置20>
図4に戻り、学習装置20は、給紙装置本体10の駆動制御部171が有する駆動制御プログラムを更新するための制御情報を、強化学習によって作成するためのものである。このような学習装置20は、計算機によって構成されている。計算機は、上述したコンピューターとして用いられるハードウェアである。
【0069】
この学習装置20において実施する制御情報の作成の手順は、以降の給紙装置の制御方法において詳細に説明する。この学習装置20において実施する制御情報の作成手順は、学習プログラムとしてROMに保存されたプログラムであるか、または外部装置からRAMや他の記憶部にロードされて保存されたプログラムである。このような学習プログラムは、この給紙装置システム1によって実施される給紙装置制御プログラムの一部である。
【0070】
またこのような学習装置20は、給紙装置本体10に対して近接して、または給紙装置本体10と一体に設けられて給紙装置を構成してもよいが、これに限定されることはない。すなわち学習装置20は、ネットワーク上のサーバーに設けられ、複数の給紙装置本体10によって共有されるものであってもよい。
【0071】
以上のような学習装置20は、機能要素として学習情報取得部21、報酬計算部22、学習部23、および制御情報出力部24を有する。以下、これらの各機能要素を説明する。
【0072】
[学習情報取得部21]
学習情報取得部21は、給紙装置本体10の制御部17から通知された学習情報を取得する。この学習情報取得部21が取得した学習情報は、報酬計算部22と学習部23とに出力される。
【0073】
[報酬計算部22]
報酬計算部22は、学習情報取得部21から出力された学習情報に基づいて、次の学習部23において実施する学習のための報酬の計算を実施する。この報酬計算部22における報酬の計算手順は、予め定めたルールに従って実施される。このような報酬の計算は、以降の給紙装置の制御方法において詳細に説明する。
【0074】
[学習部23]
学習部23は、学習情報取得部21で取得した学習情報と、報酬計算部22において計算した報酬の計算結果とに基づく学習を実施する。この学習部23において実施する学習は、学習における行動価値を算出することにより、行動価値が最も高くなるような行動を学習する。また学習部23は、学習結果から、給紙装置本体10において実施する次の行動を決定する。
【0075】
ここで次の行動とは、学習に基づいて決定した行動価値が最も高い行動であって、給紙装置本体10の駆動を制御するための駆動制御プログラムにおいて更新の対象となる制御パラメーターのタイミングや値に相当する。具体的には、駆動制御プログラムにおける(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能の切り替え、(4)側方ファン13L,13Rの風量、(5)先端ファン14の風量、(6)後端規制部材12Bの位置、および(7)側部規制部材12L,12Rの位置のうちの少なくとも何れか1つである。この学習部23における学習の手順は、以降の給紙装置の制御方法において詳細に説明する。
【0076】
[制御情報出力部24]
制御情報出力部24は、学習部23での学習結果に基づいて決定した次の行動を、制御プログラムの更新情報として給紙装置本体10に出力する。
【0077】
≪給紙装置制御プログラムによる給紙装置の制御方法≫
次に、以上のような構成の給紙装置システム1によって実施される給紙装置の制御方法を説明する。ここで説明する給紙装置の制御方法は、
図1~
図4を用いて説明した給紙装置システム1における給紙装置本体10の制御部17と、学習装置20とが、給紙装置制御プログラムを実行することによって実現される。給紙装置制御プログラムは、給紙装置本体10の制御部17が実行する駆動制御プログラムを更新するためのプログラムである。この給紙装置制御プログラムは、給紙装置本体10の制御部17が実行する更新プログラムと、学習装置20が実行する学習プログラムとを含む。
【0078】
ここでは先ず、学習装置20において実施される学習プログラムによる学習処理の手順を説明し、次に給紙装置本体10の制御部17において実施される更新プログラムによる更新処理の手順を説明する。
【0079】
<学習処理の手順>
図8は、本実施形態に係る給紙装置システムによって実施される学習処理の手順を示すフローチャートである。ここで説明する学習処理の手順は、給紙装置制御プログラムの一部である学習プログラムの手順であって、学習装置20によって実施される。以下、
図8のフローチャートに示す順に、
図1~
図4および必要に応じて他の図を参照しつつ、学習処理の手順を説明する。
【0080】
[ステップS1]
ステップS1において、学習情報取得部21は、給紙装置本体10の制御部17から学習情報を取得したか否かを判断し、取得した(Yes)と判断されるまで待機する。ここで学習情報取得部21が取得する学習情報は、制御部17の学習情報収集部172が収集して学習情報通知部173から通知された情報であって、上述したような給紙装置本体10の駆動情報、および用紙Pに関する用紙情報を含む。
【0081】
学習情報取得部21は、制御部17から通知された学習情報を取得した(Yes)と判断した場合に、次のステップS2に進む。
【0082】
[ステップS2]
ステップS2において、学習情報取得部21は、取得した学習情報を、報酬計算部22と学習部23とに伝達する。この場合、報酬計算部22には、駆動情報と、給紙装置本体10において給紙した用紙Pについての用紙情報を伝達する。また学習部23には、駆動情報と、次に給紙を実施する用紙Pについての用紙情報を伝達する。
【0083】
[ステップS3]
ステップS3において、報酬計算部22は、学習情報取得部21が取得した学習情報に基づいて、強化学習における報酬の計算を実施する。この場合、報酬計算部22は、学習情報の通知があった給紙装置本体10について、強化学習における各状態の場合の各行動においての各報酬を計算する。以下、強化学習における状態と行動、および報酬の計算の具体例を説明する。
【0084】
-強化学習における状態と行動-
この場合の強化学習における状態は、用紙Pの高さ位置であることとする。この高さ位置は、ここでは例えば、給紙トレイ11上に積載された用紙束Pbの最上部の高さ位置であって、上昇検知センサーUSで検知された所定の高さ位置であることとする。
【0085】
またこの場合の強化学習における行動は、(1)側方ファン13L,13Rのオン/オフ、(2)先端ファン14のオン/オフ、(3)先端ファン14の機能の切り替え、(4)側方ファン13L,13Rの風量、(5)先端ファン14の風量、(6)後端規制部材12Bの位置、および(7)側部規制部材12L,12Rの位置のうちの少なくとも何れか1つである。なお、強化学習における行動は、給紙装置本体10の駆動を制御するための駆動制御プログラムにおいて更新の対象となる制御パラメーターに相当する。
【0086】
図9は、本実施形態に係る強化学習における行動の一例を示す図である。
図9に示すように、強化学習における行動は、複数の行動を組み合わせてもよく、例えば規制部材の位置と、浮上ファンの風量との組み合わせを行動1~行動110とした。
【0087】
ここで、規制部材の位置とは、(6)後端規制部材12Bの位置、および(7)側部規制部材12L,12Rの位置の少なくとも一方である。また浮上ファンの風量とは、例えば(4)側方ファン13L,13Rの風量と、(5)先端ファン14の風量のうちで先端ファン14を浮上ファンとして用いている場合の風量との合計としてもよく、(4)側方ファン13L,13Rの風量のみとしてもよい。
【0088】
なお、行動として採用されなかった制御パラメーターは、予め設定された基準値として、以降の学習処理を進める。
【0089】
-報酬について(その1)-
本実施形態に係る強化学習の報酬は、浮上検出部材である吸着センサーASにおいての用紙Pの検出結果に基づいて算出される。より詳しくは、本実施形態に係る強化学習の報酬は、浮上ファンでの送風を開始してから、吸着搬送部15に対する用紙Pの吸着が吸着センサーASにおいて検出されるまでの間の浮上時間[t]に基づいて算出される。ここでの浮上ファンは、例えば側方ファン13L,13R、および浮上ファンとして機能させた先端ファン14であることとする。
【0090】
図10,
図11は、本実施形態に係る強化学習において報酬の計算処理に用いる浮上完了高さまでの浮上時間[t]を説明する図(その1),(その2)である。
【0091】
ここで浮上完了高さ[hn]までの浮上時間[t]とは、これらの図に示すように、浮上ファンとしての側方ファン13L,13R、および先端ファン14の送風を開始してから、吸着センサーASが吸着搬送部15への用紙Pの吸着を検知するまでの時間としてよい。
【0092】
このような浮上完了高さ[hn]までの浮上時間[t]は、浮上ファンとしての側方ファン13L,13R、および先端ファン14の送風に依存し、給紙装置本体10による用紙Pの供給状態を表す指標となる。
【0093】
すなわち
図10に示すように、浮上ファンの風量が大きい場合、所定の高さ位置にある用紙束Pbの上部からは、より多くの用紙Pが、より短時間で浮上して吸着搬送部15に吸着される。これにより、複数枚の用紙Pが搬送される連れ送りと、これによる複数の用紙Pが同時に供給される重送ジャムが発生し易くなる。
【0094】
一方、
図11に示すように、浮上ファンの風量が小さい場合、所定の高さ位置にある用紙束Pbの上部からは、少ない枚数の用紙Pが、比較的長い時間をかけて浮上する。このため、所定時間内に吸着搬送部15に用紙Pが達しない場合や、吸着搬送部15に用紙Pが達しない場合もある。これにより、浮上ファンの風量が小さい場合には、吸着搬送部15による用紙Pの搬送が実施されない空送りジャムが発生し易くなる。
【0095】
以上のように、浮上完了高さ[hn]までの浮上時間[t]は、用紙Pの供給状態を表す指標となる。そこで、本実施形態における学習処理においては、浮上完了高さ[hn]までの浮上時間[t]に基づいて報酬を算出する強化学習を行う。
【0096】
次に、浮上完了高さまでの浮上時間[t]に基づく報酬の算出を説明する。
図12は、浮上完了高さ[hn]までの浮上時間[t]に基づく報酬の計算処理においてする報酬の付与を説明するためのグラフである。この図に示すように、報酬の算出においては先ず、浮上完了高さまでの浮上時間[t]に対して、重送ジャムやノーフィードジャムが最も発生し難い目標時間[Tg]を事前に設定する。そして、目標時間[Tg]に対する近さによって報酬を付与する。
【0097】
この場合、例えば目標時間[Tg]を含む所定の時間範囲[Tth]を設定する。
【0098】
この所定の目標時間[Tg]は、例えば重送ジャムやノーフィードジャムが発生しないことが確認されている範囲である。所定の時間範囲[Tth]は、目標時間[Tg]を中心とした範囲であってもよいが、これに限定されることはない。
【0099】
なお、以上の目標時間[Tg]、および所定の時間範囲[Tth]は、用紙Pの種類毎、サイズ毎、坪量毎、および平滑度毎に、予め設定された値であって、給紙装置本体10において給紙した用紙Pについての用紙情報に基づいて設定される。
【0100】
そして、本ステップS3(
図8参照)における報酬の計算処理においては、次に説明するように、浮上完了高さ[hn]までの浮上時間[t]が所定の時間範囲[Tth]となる行動に対しては、正の報酬を与える。ここで所定の時間範囲[Tth]となるとは、所定の時間範囲[Tth]の境界上を含んでよい。浮上完了高さまでの浮上時間[t]が所定の時間範囲[Tth]外となる状態と行動の組み合わせに対しては、負の報酬を与える。
【0101】
-報酬の計算処理(その1)-
次に、報酬計算部22が実施する報酬の計算処理の手順を説明する。
図13は、浮上完了高さまでの浮上時間[t]に基づく報酬の計算処理を示すフローチャートであって、
図8のステップS3における報酬の計算処理の手順を示す図である。以下、
図13に従って報酬の計算処理の手順を説明する。
【0102】
=ステップS301=
ステップS301において、報酬計算部22は、学習情報取得部21から伝達された学習情報に基づいて、過去に給紙を実施した、ある用紙情報を有する用紙Pの浮上完了高さまでの浮上時間[t]を測定する。この際、報酬計算部22は、浮上ファンとしての側方ファン13R,13Lおよび先端ファン14がオンした時点から、吸着センサーASが用紙Pの吸着を検知するまでの時間を、浮上完了高さ[hn]までの浮上時間[t]として測定する。
【0103】
=ステップS302=
ステップS302において、報酬計算部22は、取得した浮上完了高さ[hn]までの浮上時間[t]が所定の時間範囲[Tth]であるか否かを判断する。そして範囲内である(Yes)と判断した場合にはステップS303に進み、範囲内ではない(No)と判断した場合にはステップS304に進む。
【0104】
=ステップS303=
ステップS303において、報酬計算部22は、ステップS303において浮上完了高さ[hn]までの浮上時間[t]を取得したある状態の場合のある行動に対して正の報酬を付与し、処理を終了させる。
【0105】
=ステップS304=
ステップS304において、報酬計算部22は、ステップS303において浮上完了高さ[hn]まで浮上時間[t]を取得したある状態の場合のある行動に対して負の報酬を付与し、処理を終了させる。
【0106】
なお、学習情報取得部21から伝達される学習情報が、1枚の用紙Pの給紙についての情報である場合、報酬計算部22は、学習情報取得部21から学習情報が伝達される毎に、上述したステップS301~ステップS304を実施する。一方、学習情報取得部21から伝達される学習情報が、複数の用紙Pの給紙についての情報である場合、報酬計算部22は、全ての給紙の学習情報に基づいて、上述したステップS301~ステップS304を実施する。その後は、
図8のステップS4に進む。
【0107】
-報酬について(その2)-
本実施形態に係る強化学習の報酬は、各浮上高さ[h]で算出されてもよい。
図14は、強化学習における報酬の計算処理の他の例を説明する図である。
図14に示すように、各浮上高さでの浮上時間[t]は、用紙Pの浮上高さセンサーLS1~LSnのオン/オフによって検知される。例えば、浮上高さセンサーLS1がオンとなった後、その上部の浮上高さセンサーLS2がオンとなるまでの間の時間が、浮上高さ[h1]~[h2]での浮上時間[t]として測定される。
【0108】
このように、用紙Pの浮上が完了する以前の各浮上高さ[h]での浮上時間[t]についても、報酬を算出することにより、さらに精細な駆動制御プログラムの更新が可能である。
【0109】
-報酬の計算処理(その2)-
図15は、各浮上高さでの浮上時間[t]に基づく報酬の計算処理においてする報酬の付与を説明するためのグラフである。
図15に示すように、この場合であっても、報酬の算出においては先ず、各浮上高さ[h]での浮上時間[t]に対して、重送ジャムやノーフィードジャムが最も発生し難い目標時間[Tg]を事前に設定する。そして、目標時間[Tg]を含む所定の時間範囲[Tth]を設定し、各浮上高さ[h]での浮上時間[t]が所定の時間範囲[Tth]となる行動に対しては、正の報酬を与え、各浮上高さ[h]での浮上時間[t]が所定の時間範囲[Tth]外となる行動に対しては、負の報酬を与える。
【0110】
このように、各浮上高さ[h]での浮上時間[t]に基づいて報酬を算出する場合は、
図13に示すフローにおけるステップS301で、各浮上高さ[h]での浮上時間[t]を測定すればよい。またこの場合、全ての浮上高さ[h1]~[hn]について、
図13に示したステップS301~ステップS304を実施することで、1枚の用紙に関する報酬の計算処理を終了させる。
【0111】
この場合であっても、学習情報取得部21から伝達される学習情報が、1枚の用紙Pの給紙についての情報であれば、報酬計算部22は、学習情報取得部21から学習情報が伝達される毎に、上述したステップS301~ステップS304を実施する。一方、学習情報取得部21から伝達される学習情報が、複数の用紙Pの給紙についての情報である場合、報酬計算部22は、全ての給紙の学習情報に基づいて、上述したステップS301~ステップS304を実施する。その後は、
図8のステップS4に進む。
【0112】
なお、上述した2つの報酬の計算処理は、1つの所定の時間範囲[Tth]を設定して報酬を付与する判断を実施した。しかしながら、各報酬の計算処理においては、複数段階の時間範囲を設定して報酬の計算を実施してもよい。この場合、目標時間[Tg]に近い時間範囲ほど、大きな正の報酬を与え、目標時間[Tg]から遠い時間範囲ほど大きな負の報酬を与える構成としてもよい。
【0113】
[ステップS4]
以上のようなステップS3の後のステップS4において、学習部23は、学習情報取得部21から伝達された学習情報と、報酬計算部22で算出した各用紙情報を有する用紙Pの各状態の場合の各行動においての各報酬に基づいて、行動の学習を実施する。ここでは、予め定めたルールに従って、ある状態の時にある行動を取った時の報酬を計算し、報酬の総和を最適化するように行動価値を算出してQテーブルを更新して行動を学習する。
【0114】
図16は、本実施形態に係る強化学習における行動の学習処理を示すフローチャートであって、
図8のステップS4における行動の学習処理の手順を示す図である。このフローチャートは、
図14および
図15を用いて説明した、各浮上高さでの浮上時間[t]に基づく報酬の計算処理を実施した場合の手順を示している。以下、
図16に従って、各浮上高さでの浮上時間[t]に基づく報酬の計算処理を実施した場合の行動の学習処理の手順を説明する。
【0115】
=ステップS401=
ステップS401において、学習部23は、n=nの処理を実施する。
【0116】
=ステップS402=
ステップS402において、学習部23は、次の行動の設定を行う。この際、学習部23は、行動1~行動110(
図9参照)の中から、予め定めたルールにしたがって次の行動を設定する。
【0117】
=ステップS403=
ステップS403において、学習部23は、学習情報取得部21から伝達された学習情報に基づいて、設定した行動を実行する。この場合、学習部23は、次に給紙を実施する用紙Pの用紙情報に基づいて、ステップS402で設定した行動を実行した場合の用紙供給のシミュレーションを実施する。なお、ここでは、給紙装置本体10に対して実際に用紙供給を実施させてもよい。
【0118】
=ステップS404=
ステップS404において、学習部23は、ステップS403で実施した行動においての浮上高さセンサーLSn-1がオンとなった後、その上部の浮上高さセンサーLSnがオンとなるまでの間の時間を、浮上時間[t]として測定する。ここで、浮上高さセンサーLSnは、吸着センサーASを兼ねてもよい。
【0119】
=ステップS405=
ステップS405において、学習部23は、ステップS404でのある状態である行動をとった場合の報酬を判断する。この際、学習部23は、報酬計算部22で実施した報酬の計算結果に基づいて、テップS403の行動を実施した場合の報酬を判断する。また学習部23は、判断した報酬にもとづいて、Qテーブルを更新する。
【0120】
図17は、本実施形態に係る強化学習の一例を説明するQテーブルの図である。Qテーブルは、強化学習の状態と行動の関係を学習する際に利用するテーブルであり、状態と行動の組み合わせに対応する行動価値(Q値)を示している。この
図17に示すように、この場合の強化学習における状態は、浮上高さセンサーLS1~LSnのオン/オフによって検知される用紙Pの浮上高さとなる。またこの場合の状態と組み合わせる行動1~行動110は、
図9に示した通りである。
【0121】
Qテーブルは、学習を開始する前の初期の状態においては、各状態および各行動におけるQ値が初期値(例えば0.5)となっている。学習部23は、本ステップS405で判断した報酬に従い、該当する状態および行動のQ値を更新する。
【0122】
学習部23は、例えば正の報酬と判断された場合には、該当する状態および行動のQ値に、所定の値(例えば0.005)を加算する。一方、負の報酬と判断された場合には、該当する状態および行動のQ値から、所定の値(例えば0.005)を減算する。
【0123】
=ステップS406=
ステップS406において、学習部23は、ステップS405での判断が負の報酬で合ったか否かを判断し、負の報酬であった(YES)と判断した場合には、ステップS402に戻る。一方、負の報酬ではない(NO)と判断した場合には、ステップS407に進む。
【0124】
=ステップS407=
ステップS407において、学習部23は、正の報酬が所定回数連続したか否かの判断を実施する。所定回数連続した(YES)と判断した場合には、次のステップS408に進む。一方、所定回数連続していな(NO)と判断した場合には、ステップS402に戻る。
【0125】
=ステップS408=
ステップS408において、学習部23は、n=n-1の処理を実施し、次のステップS409に進む。
【0126】
=ステップS409=
ステップS409において、学習部23は、n=0であるか否かの判断を実施し、n=0である(YES)と判断した場合には、処理を終了させる。一方、n=0ではない(NO)と判断した場合には、ステップS402に戻り、n=0となるまで処理を繰り返し、n=0となった場合に、行動の学習処理を終了させ、
図8のステップS5に進む。
【0127】
[ステップS5]
図8に戻り、ステップS5において、学習部23は、ステップS4での行動の学習結果にも続いて、次の行動を選択する。この際、学習部23は、ステップS4での行動の学習において、最終的に更新されたQテーブル(
図17参照)に基づいて、各状態においてQ値が最も大きい行動を選択する。
【0128】
[ステップS6]
ステップS6において、制御情報出力部24は、ステップS5で選択した次の行動を、制御情報として給紙装置本体10に出力する。そして、学習装置20による学習処理を終了させる。
【0129】
<駆動制御プログラムの更新処理の手順>
図18は、本実施形態に係る給紙装置システムによって実施される駆動制御プログラムの更新処理を示すフローチャートである。ここで説明する駆動制御プログラムの更新処理の手順は、給紙装置制御プログラムの一部である更新プログラムの手順であって、給紙装置本体10の制御部17によって実施される。以下、
図18のフローチャートに示す順に、
図1~
図4および必要に応じて他の図を参照しつつ、駆動制御プログラムの更新処理の手順を説明する。
【0130】
[ステップS001]
ステップS001において、学習情報収集部172は、給紙装置本体10において、用紙Pの変更があったか否かの判断を実施する。ここで、用紙Pの変更とは、給紙装置本体10から給紙する用紙Pの種類、サイズ、坪量、および平滑度(表面性)の少なくとも何れかが、変更されたか否かを意味している。
【0131】
ここで、用紙Pのサイズが変更された場合いは、用紙Pの搬送方向Xの重心位置に対する側方ファン13L,13Rの位置が変わるため、紙全体を持ち上げるための風量が変わってくる。坪量は紙の重さを示すため重さに応じた風量設定が必要である。平滑度は紙の表面の凹凸具合を示すため、束になった用紙を浮上させるために紙と紙の隙間にエアを送り込む必要があり、平滑度に応じて紙と紙の間にエアを送り込むための風量設定が必要である。ただし、入力部18としてメディアセンサーを有していて用紙Pの平滑度の測定ができるのであれば、紙種について考慮する必要はあまりない。紙種は普通紙や上質紙、塗工紙などがあるが、これらの種類による特性は紙の表面性であり、平滑度の測定が可能であるならば考慮する必要がないが、平滑度の測定ができない場合、これらの紙種に応じて風量を設定する必要がある。
【0132】
学習情報収集部172は、例えば、入力部18から駆動制御部171に入力された情報に基づいて、給紙装置本体10から給紙する用紙Pの種類、サイズ、坪量、および平滑度(表面性)の少なくとも何れかが、変更されたか否かの判断を実施する。そして、変更された(Yes)と判断した場合に、次のステップS002に進み、変更されていない(No)と判断された場合には、次のステップS001’に進む。
【0133】
[ステップS001’]
ステップS001’において、学習情報収集部172は、トレイの開閉があったか否かの判断を実施する。ここで、トレイとは用紙Pが載置される給紙トレイ11であり、学習情報収集部172は、例えば開閉センサーOpSから駆動制御部171に入力された情報に基づいて、この判断を実施する。そして、開閉された(Yes)と判断した場合に、次のステップS002に進む。用紙Pが変更されていない場合、つまり用紙Pの種類、サイズ、坪量、および平滑度(表面性)などが変更されていない場合であっても、給紙トレイ11が開閉された場合、用紙Pの給紙トレイ11上への載置状態が変わっている可能性があるので、同様に学習を開始する。一方、本ステップS001’において、開閉されていない(No)と判断された場合には、ステップS001に戻る。
【0134】
[ステップS002]
ステップ002において、学習情報収集部172は、駆動制御部171から学習情報を収集する。ここで学習情報収集部172が収集する学習情報は、先に説明した通りの情報であって、給紙装置本体10に関する駆動情報、および用紙Pに関する用紙情報である。
【0135】
[ステップS003]
ステップS003において、学習情報通知部173は、学習情報収集部172が収取した学習情報を、学習装置20に通知する。
【0136】
[ステップS004]
ステップS004において、更新処理部174は、学習装置20から制御情報を受信したか否かの判断を実施する。ここで更新処理部174が受信する制御情報は、先に説明した学習装置20における学習処理において、学習装置20の制御情報出力部24が出力した制御情報である(
図8のステップS6)。更新処理部174は、制御情報を受信した(Yes)と判断されるまで待機する。制御情報を受信した(Yes)と判断された場合に、次のステップS005に進む。
【0137】
[ステップS005]
ステップS005において、更新処理部174は、学習装置20から受信した制御情報に基づいて、駆動制御部171のファームウェアである駆動制御プログラムの更新を実施し、処理を終了させる。
【0138】
≪画像形成装置≫
図19は、本実施形態に係る給紙装置システムを有する画像形成装置の一例を示す構成図である。
【0139】
上述した本例の給紙装置システム1は、画像形成装置へ用紙を供給する給紙装置の制御システムとして好適に用いられる。このような画像形成装置として、複写機、プリンタ装置、ファクシミリ装置、印刷機、複合機等を例示することができる。以下に、本実施形態に係る給紙装置システム1を適用した画像形成装置(本発明の画像形成装置)が例えば複写機の場合を例に挙げて説明する。
【0140】
この図に示す画像形成装置100は、画像形成装置本体200、画像読取装置300、自動原稿送り装置400、および給紙装置500を有する構成となっている。
【0141】
画像形成装置本体200は、例えば、給紙カセット201、給紙部202、画像形成部203、および排紙部204を備える。給紙カセット201は、複数枚の用紙Pを収容する。給紙部202は、給紙カセット201に収容された用紙Pを、給紙カセット201から取り出して画像形成部203に搬送する。
【0142】
画像形成部203は、画像読取装置300から送信された画像信号に基づいて、給紙部202から搬送された用紙Pに画像を形成する部分である。この画像形成部203は、画像形成方式が限定されることはなく、例えば電子写真方式、またはインクジェット方式のものが適用される。一例として、電子写真方式の画像形成部203であれば、トナー画像形成ユニット、中間転写ベルト、および定着部などを備え、用紙Pの一主面上にトナー画像を形成する。またインクジェット方式の画像形成部203であれば、インクジェットヘッドを備え、用紙Pの一主面上にインク画像を形成する。
【0143】
排紙部204は、画像形成部203において画像が形成された用紙Pを、排紙する。
【0144】
画像読取装置300は、自動原稿送り装置400から搬送された原稿から、光学的に画像を読み取り、読み取った画像信号を処理して画像形成部に送信する。
【0145】
自動原稿送り装置400は、原稿台を備え、原稿台上に載置された原稿を画像読取装置300に搬送する。
【0146】
給紙装置500は、画像形成装置本体200に接続されて、画像形成装置本体200に用紙Pを給紙する。この給紙装置500は、先に説明した給紙装置本体10を複数備え、各給紙装置本体10から画像形成装置本体200の給紙部202に、用紙Pを1枚ずつ分離しつつ給紙する。
【0147】
これらの各給紙装置本体10は、先に説明した学習装置20との間で通信が可能なものである。これらの各給紙装置本体10は、例えば共通の駆動制御部171によって駆動制御されるものであってよいが、先に説明した学習装置20による学習は、給紙装置本体10毎に実施されることとする。またこの場合、学習装置20は、他の画像形成装置100に設けられた給紙装置500の各給紙装置本体10と共有されるものであってよい。
【0148】
また給紙装置500は、複数の給紙装置本体10と共に1つの学習装置20を装置内に組み込んだ構成のものであってもよい。
【0149】
≪実施形態の効果≫
以上説明した実施形態によれば、浮上高さセンサーLS1~LSnや吸着センサーASなどの浮上検出部材での検出結果に応じて報酬を判断する強化学習に基づいて、給紙装置本体10の駆動制御プログラムを更新する構成である。先にも述べたように、浮上検出部材での検出結果から得られる浮上時間[t]は、用紙Pの供給状態を正確に表す指標である。このため、この強化学習に基づいて、給紙装置本体10の駆動制御プログラムを更新することにより、用紙の種類や装置の設置環境によらずに、重送や空送りの発生なく、度高精度な用紙供給を実施することが可能になる。
【0150】
また、このような高精度な用紙供給が実施される給紙装置システムを用いた画像形成装置100によれば、複数枚の用紙Pに対して連続した円滑な画像形成が可能となる。
【符号の説明】
【0151】
1…給紙装置システム
10…給紙装置本体
11…給紙トレイ
12…規制部材
12B…後端規制部材
12L,12R…側部規制部材
13L,13R…側方ファン
14…先端ファン(機能切替ファン)
15…吸着搬送部
171…駆動制御部
174…更新処理部
20…学習装置
100…画像形成装置
203…画像形成部
500…給紙装置
LS1~LSn…浮上高さセンサー(浮上検出部材)
AS…吸着センサー(浮上検出部材)
P…用紙
Pb…用紙束
X…搬送方向
Y…幅方向
[hn]…浮上完了高さ
[t]…浮上時間
[Tth]…所定の時間範囲