(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】画像形成装置及び画像形成装置の制御プログラム
(51)【国際特許分類】
H04N 1/00 20060101AFI20241111BHJP
G06F 40/58 20200101ALI20241111BHJP
G06V 30/00 20220101ALI20241111BHJP
G10L 13/00 20060101ALI20241111BHJP
G10L 13/02 20130101ALI20241111BHJP
【FI】
H04N1/00 C
G06F40/58
G06V30/00 S
G10L13/00 100G
G10L13/02 130Z
H04N1/00 E
(21)【出願番号】P 2020152708
(22)【出願日】2020-09-11
【審査請求日】2023-05-25
(73)【特許権者】
【識別番号】000003562
【氏名又は名称】東芝テック株式会社
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100179062
【氏名又は名称】井上 正
(74)【代理人】
【識別番号】100075672
【氏名又は名称】峰 隆司
(74)【代理人】
【識別番号】100153051
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100162570
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】加藤 裕之
【審査官】鈴木 肇
(56)【参考文献】
【文献】特開2020-067695(JP,A)
【文献】特開2002-215534(JP,A)
【文献】特開2011-090100(JP,A)
【文献】特開平11-119790(JP,A)
【文献】特開2003-131773(JP,A)
【文献】米国特許出願公開第2003/0218642(US,A1)
【文献】特開2010-277189(JP,A)
【文献】特開2014-119771(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/20 -40/58
G06V 30/00 -30/12
G06V 30/18 -30/222
G06V 30/226-30/32
G06V 30/42 -30/424
G10L 13/00 -13/10
G10L 19/00 -99/00
H04N 1/00
(57)【特許請求の範囲】
【請求項1】
画像データを媒体に印刷する画像形成部と、
OCR処理においてテキストデータとして認識する言語を示す原文言語に基づきスキャンされた原稿画像
に対して前記OCR処理
を行い、翻訳前テキストデータを生成
するOCR処理部と、
機械翻訳処理における前記翻訳前テキストデータの言語を示す訳文言語に基づき、前記翻訳前テキストデータに基づく
前記機械翻訳処理の結果である翻訳後テキストデータを取得する機械翻訳処理部と、
前記翻訳後テキストデータに基づいて音声データを生成する音声合成処理部と、
プロセッサと、
を具備し、
前記プロセッサは、
予め設定された出力方法設定に基づいて、印刷を行うか、音声データの生成を行うかを決定し、
印刷を行う場合、前記翻訳後テキストデータ及び前記原稿画像に基づいて翻訳原稿画像データを生成し、前記画像形成部により前記翻訳原稿画像データを印刷し、
音声データの生成を行う場合、前記翻訳後テキストデータに基づいて前記音声合成処理部により音声データを生成する音声合成処理を実行する、
画像形成装置であって、
前記プロセッサは、
前記原文言語及び前記訳文言語を示す設定である言語設定と、前記出力方法設定
とを外部の記録媒体に保存させ、
外部の前記記録媒体から取得した情報に基づいて
前記言語設定及び前記出力方法設定を設定する、
画像形成装置。
【請求項2】
前記音声データに基づいて音声を出力する音声出力部をさらに具備し、
前記出力方法設定は、前記音声データをメール送信するか、前記音声データを記録媒体に保存するか、前記音声データを前記音声出力部により音声出力するかをさらに示し、
前記プロセッサは、前記音声データのメール送信、前記音声データの記録媒体への保存、及び前記音声データの前記音声出力部による音声出力のいずれかを、前記出力方法設定に基づいて実行する請求項1に記載の画像形成装置。
【請求項3】
前記プロセッサは、予め設定された音声モデル設定に基づいて、前記音声合成処理に用いる音声モデルを決定する請求項2に記載の画像形成装置。
【請求項4】
前記プロセッサは、
前記出力方法設定を含む情報が変換された読取画像を外部の前記記録媒体に印刷するように前記画像形成部を制御することで、前記出力方法設定を外部の前記記録媒体に保存させ、
前記原稿画像に前記読取画像が含まれていた場合に、前記読取画像より前記出力方法設定の情報を取得し、前記出力方法設定を設定する、
請求項1乃至3のいずれか1項に記載の画像形成装置。
【請求項5】
画像データを媒体に印刷する画像形成部と、プロセッサと、を具備する画像形成装置の前記プロセッサを、
OCR処理においてテキストデータとして認識する言語を示す原文言語に基づきスキャンされた原稿画像
に対して前記OCR処理
を行い、翻訳前テキストデータを生成
し、
機械翻訳処理における前記翻訳前テキストデータの言語を示す訳文言語に基づき、前記翻訳前テキストデータに基づく
前記機械翻訳処理の結果である翻訳後テキストデータを取得し、
予め設定された出力方法設定に基づいて、印刷を行うか、音声データの生成を行うかを決定し、
印刷を行う場合、前記翻訳後テキストデータ及び前記原稿画像に基づいて翻訳原稿画像データを生成し、前記画像形成部により前記翻訳原稿画像データを印刷し、
音声データの生成を行う場合、前記翻訳後テキストデータに基づいて音声データを生成する音声合成処理を実行する、
ように機能させる制御プログラムであって、
前記プロセッサを、
前記原文言語及び前記訳文言語を示す設定である言語設定と、前記出力方法設定
とを外部の記録媒体に保存させ、
外部の前記記録媒体から取得した情報に基づいて
前記言語設定及び前記出力方法設定を設定する、
ように機能させる制御プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、画像形成装置及び画像形成装置の制御プログラムに関する。
【背景技術】
【0002】
画像形成装置は、印刷要求に応じて印刷を実行する。画像形成装置は、紙などの紙葉類を搬送する搬送部及び紙葉類に対して画像を形成し、画像を形成した紙葉類を排出する。また、画像形成装置は、紙葉類(原稿)を読み取り、画像データを生成することができる。
【0003】
また、画像形成装置は、取得した画像データに基づいて、種々の処理を行うアプリケーションを有する。例えば、画像形成装置は、原稿の画像データから文字を認識しテキストデータを取得するOCR(Optical character recognition)処理を行うアプリケーションを有する。また例えば、画像形成装置は、テキストデータを任意の言語に翻訳する機械翻訳処理を行うアプリケーションを有する。画像形成装置は、機械翻訳処理の結果を用いて翻訳結果を媒体(例えば紙媒体)に印刷して出力する翻訳コピー印刷を行うことができる。しかしながら、翻訳結果の出力方法が、紙媒体への印刷に限られるという課題がある。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明が解決しようとする課題は、利便性の高い画像形成装置及び画像形成装置の制御プログラムを提供することである。
【課題を解決するための手段】
【0006】
一実施形態に係る画像形成装置は、画像形成部と、OCR処理部と、機械翻訳処理部と、音声合成処理部と、プロセッサと、を具備する。画像形成部は、画像データを媒体に印刷する。OCR処理部は、OCR処理においてテキストデータとして認識する言語を示す原文言語に基づきスキャンされた原稿画像に対して前記OCR処理を行い、翻訳前テキストデータを生成する。機械翻訳処理部は、機械翻訳処理における前記翻訳前テキストデータの言語を示す訳文言語に基づき、前記翻訳前テキストデータに基づく前記機械翻訳処理の結果である翻訳後テキストデータを取得する。音声合成処理部は、前記翻訳後テキストデータに基づいて音声データを生成する。プロセッサは、予め設定された出力方法設定に基づいて、印刷を行うか、音声データの生成を行うかを決定し、印刷を行う場合、前記翻訳後テキストデータ及び前記原稿画像に基づいて翻訳原稿画像データを生成し、前記画像形成部により前記翻訳原稿画像データを印刷し、音声データの生成を行う場合、前記翻訳後テキストデータに基づいて前記音声合成処理部により音声データを生成する音声合成処理を実行する。プロセッサは、前記原文言語及び前記訳文言語を示す設定である言語設定と、前記出力方法設定とを外部の記録媒体に保存させ、外部の前記記録媒体から取得した情報に基づいて前記言語設定及び前記出力方法設定を設定する。
【図面の簡単な説明】
【0007】
【
図1】
図1は、一実施形態に係る画像形成装置の構成例について説明する為の図である。
【
図2】
図2は、一実施形態に係る画像形成装置の動作の例について説明する為の図である。
【
図3】
図3は、一実施形態に係る画像形成装置の動作の例について説明する為の図である。
【
図4】
図4は、一実施形態に係る画像形成装置の画面の表示例について説明する為の図である。
【
図5】
図5は、一実施形態に係る画像形成装置の画面の表示例について説明する為の図である。
【
図6】
図6は、一実施形態に係る画像形成装置の画面の表示例について説明する為の図である。
【
図7】
図7は、一実施形態に係る画像形成装置の画面の表示例について説明する為の図である。
【
図8】
図8は、一実施形態に係る画像形成装置の画面の表示例について説明する為の図である。
【
図9】
図9は、一実施形態に係る画像形成装置の画面の表示例について説明する為の図である。
【
図10】
図10は、一実施形態に係る画像形成装置における設定を記録媒体に保存する例について説明する為の図である。
【発明を実施するための形態】
【0008】
以下、実施の形態について図面を参照して説明する。
図1は、一実施形態に係る画像形成システム1の例について説明する為の説明図である。
【0009】
画像形成システム1は、クラウドサーバ11及び画像形成装置12を備える。クラウドサーバ11と画像形成装置12とは、例えば公衆回線などのネットワーク13を介して接続されている。画像形成システム1は、画像形成装置12がクラウドサーバ11にデータを送信し、クラウドサーバ11が受信したデータに基づく処理を実行し、処理結果を画像形成装置12に送信するシステムである。
【0010】
本実施形態では、画像形成システム1は、画像形成装置12がクラウドサーバ11にテキストデータを送信し、クラウドサーバ11が受信したテキストデータに基づき機械翻訳処理を実行するとして説明する。
【0011】
クラウドサーバ11は、プロセッサとメモリと通信インタフェースとを備えるサーバ装置である。クラウドサーバ11は、プロセッサがメモリのプログラムを実行することにより、機械翻訳処理を行う。例えば、クラウドサーバ11は、画像形成装置12から翻訳前のテキストデータ(翻訳前テキストデータ)を受け取った場合、予め設定された言語辞書を用いて機械翻訳処理を行い、任意の言語のテキストデータ(翻訳後テキストデータ)を生成する。クラウドサーバ11は、生成した翻訳後テキストデータを画像形成装置12に送信する。
【0012】
画像形成装置12は、例えば、印刷媒体などの記録媒体を搬送しながら画像形成等の各種処理を行う複合機(MFP)である。画像形成装置12は、トナーカートリッジから補給されたトナーを用いて、印刷媒体に画像を形成する構成を備える。また、画像形成装置12は、画像が印刷された印刷媒体(原稿)から画像を読み取る構成を備える。
【0013】
画像形成装置12は、例えば、印刷媒体などの記録媒体を搬送しながら画像形成等の各種処理を行うマルチファンクションプリンタ(MFP)である。画像形成装置12は、例えば、印刷媒体などの記録媒体を搬送しながら画像形成等の各種処理を行うLEDアレイを走査する固体走査方式のプリンタ(例えばLEDプリンタ)である。また、画像形成装置12は、インクを吐出するインクジェットヘッドを走査するインクジェット方式のプリンタ(インクジェットプリンタ)、または他の方式のプリンタであってもよい。
【0014】
画像形成装置12は、感光ドラムを帯電させ、感光ドラムに対して印刷用の画像データに応じた光を照射することにより、感光ドラムに静電潜像を形成する。画像形成装置12は、感光ドラムに形成された潜像にトナーを付着させ、潜像に付着したトナーを印刷媒体に転写して印刷媒体上にトナー像を形成する。また、画像形成装置12は、トナー像が転写された印刷媒体に熱及び圧力を与えることにより、印刷媒体にトナー像を定着させる。
【0015】
画像形成装置12は、システムコントローラ21、通信インタフェース22、ディスプレイ23、操作インタフェース24、画像読取部25、搬送部26、画像形成部27、OCR処理部28、機械翻訳処理部29、音声合成処理部30、音声出力部31、及び二次元コード解析部32を備える。システムコントローラ21、通信インタフェース22、ディスプレイ23、操作インタフェース24、画像読取部25、搬送部26、画像形成部27、OCR処理部28、機械翻訳処理部29、音声合成処理部30、音声出力部31、及び二次元コード解析部32は、図示されない筐体に収容される。
【0016】
システムコントローラ21は、画像形成装置12の制御を行う。システムコントローラ21は、例えば、プロセッサ41及びメモリ42を備える。
【0017】
プロセッサ41は、演算処理を実行する演算素子(たとえば、CPU)である。プロセッサ41は、システムコントローラ21の動作の主体となる。プロセッサ41は、メモリ42に記憶されているプログラムなどのデータに基づいて種々の処理を行う。プロセッサ41は、メモリ42に格納されているプログラムを実行することにより、種々の動作を実行可能な制御部として機能する。
【0018】
メモリ42は、プログラム及びプログラムで用いられるデータなどを記憶する記憶装置である。また、メモリ42は、プロセッサ41の処理中のデータなどを一時的に格納する。メモリ42は、不揮発性メモリとして構成される。
【0019】
通信インタフェース22は、ネットワークを介して、印刷ジョブを供給するクライアント装置などとの通信を中継するインタフェースである。また、通信インタフェース22は、データを保存するための記録媒体(例えばUSBメモリなど)とシステムコントローラとの通信を中継する。
【0020】
ディスプレイ23は、システムコントローラ21または図示されないグラフィックコントローラなどの表示制御部から入力される映像信号に応じて画面を表示する。例えば、ディスプレイ23は、画像形成装置12の種々の設定の為の画面を表示する。
【0021】
操作インタフェース24は、種々の操作部材を有する。操作インタフェース24は、操作部材の操作に応じた操作信号をシステムコントローラ21に供給する。操作部材は、例えば、タッチセンサ、テンキー、電源キー、用紙フィードキー、種々のファンクションキー、またはキーボードなどである。タッチセンサは、例えば、抵抗膜式タッチセンサ、または静電容量式タッチセンサ等である。タッチセンサは、ある領域内において指定された位置を示す情報を取得する。タッチセンサは、ディスプレイ23と一体にタッチパネルとして構成されることにより、ディスプレイ23に表示された画面上のタッチされた位置を示す信号をシステムコントローラ21に入力する。
【0022】
画像読取部25は、原稿から画像を読み取る構成である。画像読取部25は、例えば、スキャナと自動原稿送り機(ADF)とを備える。スキャナは、原稿が配置されるガラス板の原稿と対向する側から、原稿を読み取る。画像読取部25は、例えば、スキャナを移動させつつ、スキャナにより画像を取得することにより、原稿の全体の画像を取得する。また、画像読取部25は、例えば、ADFにより原稿をスキャナの読取位置に通過させつつ、スキャナにより画像を取得することにより、原稿の全体の画像を取得する。即ち、画像読取部25は、原稿をスキャンして電子ファイル化し、原稿画像のデータを取得する。
【0023】
搬送部26は、印刷用の媒体(印刷媒体)を画像形成部27に供給するとともに、画像形成部27により画像が形成された印刷媒体を筐体から排出する構成である。搬送部26は、印刷媒体を収容する図示されない給紙カセットに収容されている印刷媒体を、一枚ずつ画像形成部27に供給する。また、搬送部26は、画像形成部27により画像が形成された印刷媒体を、筐体外部の排紙トレイに排出する。
【0024】
画像形成部27は、システムコントローラ21の制御に基づいて印刷媒体に画像を形成する。画像形成部27は、プロセスユニット、露光器、転写機構、及び定着器を備える。画像形成部27は、トナーの色毎にプロセスユニット及び露光器を備える。トナーの色は、例えば、シアン(C)、マゼンダ(M)、イエロー(Y)、ブラック(K)などである。画像形成部27は、CMYKの各色のトナー像を媒体に定着させることにより、媒体にカラーの画像を形成する。
【0025】
プロセスユニットは、感光ドラム、帯電チャージャ、及び現像器を備える。
【0026】
感光ドラムは、円筒状のドラムと、ドラムの外周面に形成された感光層とを備える感光体である。感光ドラムは、図示されない駆動機構によって一定の速度で回転する。
【0027】
帯電チャージャは、感光ドラムの表面を一様に帯電させる。例えば、帯電チャージャは、帯電ローラを用いて、感光ドラムに電圧を印加することにより、感光ドラムを一様な負極性の電位に帯電させる。
【0028】
現像器は、トナーを感光ドラムに付着させる装置である。現像器は、現像剤容器、撹拌機構、現像ローラ、及びドクターブレードなどを備える。
【0029】
現像剤容器は、トナーカートリッジから送り出されたトナーを受け取り、収容する容器である。現像剤容器内には、予めキャリアが収容されている。トナーカートリッジから送り出されたトナーは、撹拌機構によってキャリアと撹拌されることにより、トナーとキャリアとが混合された現像剤を構成する。キャリアは、現像器の製造時に現像剤容器内に収容される。
【0030】
現像ローラは、現像剤容器内で回転することにより、表面に現像剤を付着させる。ドクターブレードは、現像ローラの表面と所定の間隔を隔てて配置された部材である。ドクターブレードは、回転する現像ローラの表面に付着した現像剤の一部を除去する。これにより、現像ローラの表面に、ドクターブレードと現像ローラの表面との間隔に応じた厚さの現像剤の層が形成される。
【0031】
露光器は、複数の発光素子を備える。露光器は、発光素子から光を、帯電した感光ドラムに照射することにより、感光ドラム上に潜像を形成する。発光素子は、例えば発光ダイオード(LED)などである。1つの発光素子は、感光ドラム上の1点に光を照射するように構成されている。複数の発光素子は、感光ドラムの回転軸と平行な方向である主走査方向に配列されている。
【0032】
露光器は、主走査方向に配列された複数の発光素子により感光ドラム上に光を照射することにより、感光ドラム上に1ライン分の潜像を形成する。さらに、露光器は、回転する感光ドラムに連続して光を照射することにより、複数ラインの潜像を形成する。
【0033】
上記の構成において、帯電チャージャにより帯電された感光ドラムの表面に、露光器から光が照射されると、静電潜像が形成される。現像ローラの表面に形成された現像剤の層が、感光ドラムの表面に近接すると、現像剤に含まれるトナーが、感光ドラムの表面に形成された潜像に付着する。これにより、感光ドラムの表面にトナー像が形成される。
【0034】
転写機構は、感光ドラムの表面に形成されたトナー像を、印刷媒体に転写する構成である。転写機構は、1次転写ベルト、2次転写ローラ、及び他の複数のローラを備える。転写機構は、1次転写ベルトの外周面に、感光ドラムの表面に形成されたトナー像を受け取る。転写機構は、1次転写ベルトの外周面のトナー像を、2次転写ローラと1次転写ベルトの外周面とが密着した転写ニップまで搬送する。転写機構は、搬送部26により供給された印刷媒体を転写ニップに通過させることにより、1次転写ベルトの外周面のトナー像を印刷媒体に転写させる。
【0035】
定着器は、印刷媒体に転写されたトナー像を印刷媒体に定着させる構成である。定着器は、印刷媒体に熱を与える加熱部材(ヒートローラ)と、印刷媒体に圧力を与える加圧部材(プレスローラ)と、ヒートローラを加熱するヒータとを備える。プレスローラは、ヒートローラに圧力を加えることにより、プレスローラとヒートローラとが密着した定着ニップを形成する。定着器は、転写機構によってトナー像が転写された印刷媒体を、定着ニップに通過させることにより、印刷媒体に対して熱及び圧力を与える。これにより、定着器は、印刷媒体上に形成されたトナー像を定着させる。定着ニップを通過した印刷媒体は、搬送部26によって排紙トレイに排出される。
【0036】
OCR処理部28は、OCR処理を実行する構成である。OCR処理部28は、OCR処理を実行するためのハードウエアとして画像形成装置12に組み込まれていてもよいし、メモリ42に保存され、プロセッサ41により実行されるプログラムとして画像形成装置12に組み込まれていてもよい。
【0037】
OCR処理部28は、画像読取部25により取得した原稿画像に対してOCR処理を行い、テキストデータ(翻訳前テキストデータ)を取得(または生成)する。OCR処理部28は、後述する言語設定に基づき、テキストとして認識する言語を決定する。
【0038】
機械翻訳処理部29は、機械翻訳処理を実行する構成である。機械翻訳処理部29は、予め図示されないストレージなどに記憶された言語辞書を用いて機械翻訳処理を実行するハードウエアとして画像形成装置12に組み込まれていてもよい。また、機械翻訳処理部29は、プロセッサ41により実行されるプログラムとしてメモリ42に保存される形で画像形成装置12に組み込まれていてもよい。また、機械翻訳処理部29は、クラウドサーバ11に機械翻訳処理を実行させるためのクラウドサーバ11とのデータの送受信を行う構成であってもよい。
【0039】
機械翻訳処理部29は、機械翻訳処理によって、翻訳前テキストデータから翻訳後のテキストデータ(翻訳後テキストデータ)を取得(または生成)する。機械翻訳処理部29は、後述する言語設定に基づき、翻訳前テキストデータ(原文言語のテキストデータ)から翻訳後テキストデータ(訳文言語のテキストデータ)を取得する。
【0040】
音声合成処理部30は、音声合成処理を実行する構成である。音声合成処理部30は、音声合成処理(text to speech :TTS)を実行するためのハードウエアとして画像形成装置12に組み込まれていてもよいし、メモリ42に保存され、プロセッサ41により実行されるプログラムとして画像形成装置12に組み込まれていてもよい。
【0041】
音声合成処理部30は、音声合成処理によって、テキストデータから音声データを生成する。音声データは、例えば男性モデル、女性モデルなどの種々の音声モデルに基づいて生成される。音声合成処理部30は、後述する音声モデル設定に基づき、音声データの生成に用いる音声モデルを決定する。
【0042】
音声出力部31は、音声出力を行う構成である。音声出力部31は、例えばスピーカである。音声出力部31は、音声データに基づいて音声出力を行う。
【0043】
二次元コード解析部32は、例えばQRコード(登録商標)などの二次元コードの解析(復号)を行う構成である。二次元コード解析部32は、二次元コードの復号を行うためのハードウエアとして画像形成装置12に組み込まれていてもよいし、メモリ42に保存され、プロセッサ41により実行されるプログラムとして画像形成装置12に組み込まれていてもよい。二次元コード解析部32は、二次元コードを復号し、元のデータを取得する。
【0044】
次に、画像形成装置における各種の設定について説明する。
システムコントローラ21のプロセッサ41は、メモリ42内に、OCR処理、機械翻訳処理、音声合成処理、及び処理結果の出力方法などに関する種々の設定を記憶する。具体的には、メモリ42に記憶される設定は、「言語設定」、「音声モデル設定」、及び「出力方法設定」である。
【0045】
図2及び
図3は、「言語設定」の設定のための画面の例について説明するための説明図である。
【0046】
「言語設定」は、「原文言語」、及び「訳文言語」を示す設定である。「原文言語」は、OCR処理においてテキストデータとして認識する言語を示す。また、「原文言語」は、機械翻訳処理における翻訳前テキストデータの言語を示す。「訳文言語」は、機械翻訳処理における翻訳後テキストデータの言語を示す。
【0047】
即ち、OCR処理部28は、「言語設定」の「原文言語」に基づいて、テキストデータとして認識する言語を決定する。
【0048】
また、機械翻訳処理部29は、「言語設定」の「原文言語」及び「訳文言語」に基づいて、どの言語からどの言語に機械翻訳を行うのかを決定する。
【0049】
プロセッサ41は、所定の操作に基づいて、
図2に示される原文言語設定用の画面をディスプレイ23に表示させる。原文言語設定用の画面は、原文言語を選択するためのメニュー表示を含む。プロセッサ41は、画面上の言語の選択に応じて、「原文言語」を設定する。
【0050】
また、プロセッサ41は、所定の操作に基づいて、
図3に示される訳文言語設定用の画面をディスプレイ23に表示させる。訳文言語設定用の画面は、訳文言語を選択するためのメニュー表示を含む。プロセッサ41は、画面上の言語の選択に応じて、「訳文言語」を設定する。なお、プロセッサ41は、複数の言語を「訳文言語」として設定する構成であってもよい。
【0051】
図4は、「音声モデル設定」の設定のための画面の例について説明するための説明図である。
【0052】
「音声モデル設定」は、音声合成処理に用いる音声モデルを示す設定である。
【0053】
即ち、音声合成処理部30は、「音声モデル設定」に基づいて、音声データの生成に用いる音声モデルを決定する。
【0054】
プロセッサ41は、所定の操作に基づいて、
図4に示される音声モデル設定用の画面をディスプレイ23に表示させる。音声モデル設定用の画面は、音声モデルを選択するためのメニュー表示を含む。プロセッサ41は、画面上の音声モデルの選択に応じて、「音声モデル設定」を設定する。なお、プロセッサ41は、複数の音声モデルを「音声モデル設定」として設定する構成であってもよい。
【0055】
図5は、「出力方法設定」の設定のための画面の例について説明するための説明図である。
【0056】
「出力方法設定」は、翻訳結果の出力方法を示す設定である。本実施形態の画像形成装置12における翻訳結果の出力方法は、例えば、「印刷(翻訳コピー印刷)」、「音声合成(スピーカにより出力)」、「音声合成(記録媒体に保存)」、及び「音声合成(メールで送信)」などがある。
【0057】
「印刷(翻訳コピー印刷)」を行う場合、プロセッサ41は、原稿画像と、機械翻訳処理の結果(翻訳後テキストデータ)とに基づいて、翻訳原稿画像データを生成する。プロセッサ41は、翻訳原稿画像データに基づいて媒体に印刷を行うように、搬送部26及び画像形成部27を制御する。
【0058】
翻訳原稿画像データは、原稿画像上に翻訳後テキストデータが重畳された画像である。プロセッサ41は、翻訳後テキストデータを重畳する位置を、OCR処理の結果に基づいて特定する。これにより、プロセッサ41は、原稿画像上の文字が翻訳後テキストデータに置き換えられた翻訳原稿画像データを生成する。
【0059】
「音声合成(スピーカにより出力)」を行う場合、プロセッサ41は、「音声モデル設定」で示された音声モデルを用いて、翻訳後テキストデータに基づく音声合成処理を行うように音声合成処理部を制御する。プロセッサ41は、生成した音声データをスピーカから出力するように、音声出力部を制御する。
【0060】
「音声合成(記録媒体に保存)」を行う場合、プロセッサ41は、「音声モデル設定」で示された音声モデルを用いて、翻訳後テキストデータに基づく音声合成処理を行うように音声合成処理部を制御する。プロセッサ41は、通信インタフェース22を介して、生成した音声データを記録媒体に保存する。
【0061】
「音声合成(メールで送信)」を行う場合、プロセッサ41は、「音声モデル設定」で示された音声モデルを用いて、翻訳後テキストデータに基づく音声合成処理を行うように音声合成処理部を制御する。プロセッサ41は、通信インタフェース22を介して、生成した音声データが添付されたメールを送信する。
【0062】
プロセッサ41は、所定の操作に基づいて、
図5に示される出力方法設定用の画面をディスプレイ23に表示させる。出力方法設定用の画面は、出力方法として、「印刷(翻訳コピー印刷)」、「音声合成(スピーカにより出力)」、「音声合成(記録媒体に保存)」、及び「音声合成(メールで送信)」を選択するためのメニュー表示を含む。プロセッサ41は、画面上の出力方法の選択に応じて、「出力方法設定」を設定する。なお、プロセッサ41は、複数の出力方法を「出力方法設定」として設定する構成であってもよい。また、プロセッサ41は、
図5の例の他に、翻訳後テキストデータに基づく点字出力、翻訳後テキストデータに基づき自動生成された手話の動画の出力などを出力方法として選択可能に構成されていてもよい。
【0063】
また、
図5において、「音声合成(記録媒体に保存)」が選択された場合、プロセッサ41は、
図6に示すように、保存するデータを選択するための画面をディスプレイ23に表示させる。
図6の画面は、保存するデータとして「原稿画像(原稿画像データ)」、「翻訳後テキストデータ」、「音声データ」、及び「翻訳原稿画像データ」を選択するためのメニュー表示を含む。プロセッサ41は、画面上の選択に応じて、保存するデータを設定する。なお、プロセッサ41は、複数のデータを保存するデータとして設定する構成であってもよい。
【0064】
また、
図5において、「音声合成(メールで送信)」が選択された場合、プロセッサ41は、
図7に示すように、メールに添付するデータを選択し、メールアドレスを入力するための画面をディスプレイ23に表示させる。
図7の画面は、メールに添付するデータとして「原稿画像(原稿画像データ)」、「翻訳後テキストデータ」、「音声データ」、及び「翻訳原稿画像データ」を選択するためのメニュー表示を含む。プロセッサ41は、画面上の選択に応じて、メールに添付するデータを設定する。なお、プロセッサ41は、複数のデータをメールに添付するデータとして設定する構成であってもよい。
【0065】
なお、記録媒体に保存するデータ、及びメールに添付するデータは、上記の「原稿画像(原稿画像データ)」、「翻訳後テキストデータ」、「音声データ」、及び「翻訳原稿画像データ」に限定されない。さらに種々のデータが選択されてもよい。例えば、プロセッサ41は、翻訳原稿画像データと音声データとが組み合わされて生成されたマルチメディアファイルが選択可能に構成されていてもよい。
【0066】
次に、画像形成装置12における機械翻訳処理の流れについて説明する。
図8及び
図9は、画像形成装置12における機械翻訳処理について説明するためのフローチャートである。なお、本例は、原稿を読み取り、画像形成装置12内で機械翻訳を行い、機械翻訳の結果を出力するものとして説明する。また、上記の「言語設定」、「音声モデル設定」、及び「出力方法設定」が既に設定されているとして説明する。しかしながら、「言語設定」、「音声モデル設定」、及び「出力方法設定」は、
図8及び
図9の機械翻訳処理の実行時に、その都度設定されるものであってもよい。
【0067】
画像読取部25は、原稿を読み取り原稿画像データを取得する(ACT11)。
【0068】
OCR処理部28は、「言語設定」の「原文言語」を読み出す(ACT12)。OCR処理部28は、OCR処理を実行する(ACT13)。これにより、OCR処理部28は、「原文言語」の翻訳前テキストデータを取得する。
【0069】
機械翻訳処理部29は、「言語設定」の「原文言語」及び「訳文言語」を読み出す(ACT14)。機械翻訳処理部29は、図示されないストレージ装置に記憶された言語辞書を用いて、翻訳前テキストデータに対する機械翻訳処理を実行する(ACT15)。即ち、機械翻訳処理部29は、翻訳前テキストデータから「訳文言語」が示す言語のテキストデータである翻訳後テキストデータを生成する。
なお、機械翻訳処理部29は、「言語設定」の「原文言語」を読み出すのではなく、翻訳前テキストデータから「原文言語」を決定する構成であってもよい。
【0070】
プロセッサ41は、「出力方法設定」を読み出す(ACT16)。プロセッサ41は、「出力方法設定」で示された出力方法が、「印刷(翻訳コピー印刷)」であるか否か判断する(ACT17)。
【0071】
プロセッサ41は、「出力方法設定」で示された出力方法が、「印刷(翻訳コピー印刷)」であると判断した場合(ACT17、YES)、翻訳原稿画像データを生成する(ACT18)。即ち、プロセッサ41は、原稿画像上に翻訳後テキストデータを重畳し、翻訳原稿画像データを生成する。
【0072】
プロセッサ41は、翻訳原稿画像データを媒体に印刷するように、画像形成部27を制御し(ACT19)、
図8の処理を終了する。
【0073】
また、プロセッサ41は、ACT17で、「出力方法設定」で示された出力方法が、「印刷(翻訳コピー印刷)」ではないと判断した場合(ACT17、NO)、
図9のACT21の処理に移行する。プロセッサ41は、音声データの生成を行うか否か、即ち、音声合成処理を行うか否か判断する(ACT21)。プロセッサ41は、「出力方法設定」で示された出力方法が、「音声合成(スピーカにより出力)」、「音声合成(記録媒体に保存)」、及び「音声合成(メールで送信)」のいずれかである場合、音声データの生成を行うと判断する。
【0074】
プロセッサ41は、音声データの生成を行わないと判断した場合(ACT21、NO)、出力方法設定に応じた出力方法で処理を実行する(ACT22)。即ち、プロセッサ41は、上記のマルチメディアファイルの作成、点字出力、または他の方法により翻訳結果の出力を行い、
図8及び
図9の処理を終了する。
【0075】
プロセッサ41は、音声データの生成を行うと判断した場合(ACT21、YES)、「音声モデル設定」を読み出す(ACT23)。プロセッサ41は、読み出した「音声モデル設定」と、ACT15で生成された翻訳後テキストデータとに基づいて、音声合成処理を行うように音声合成処理部30を制御する(ACT24)。これにより、音声合成処理部30は、翻訳後テキストデータに応じた音声データを生成する。
【0076】
次に、プロセッサ41は、「出力方法設定」が「音声合成(スピーカにより出力)」を示すか否か(ACT25)、「音声合成(記録媒体に保存)」を示すか否か(ACT26)、及び「音声合成(メールで送信)」を示すか否か(ACT27)をそれぞれ判断する。
【0077】
プロセッサ41は、「出力方法設定」が「音声合成(スピーカにより出力)」を示すと判断した場合(ACT25、YES)、ACT24で生成した音声データにより音声出力処理を行うように、音声出力部31を制御する(ACT28)。
【0078】
また、プロセッサ41は、「出力方法設定」が「音声合成(記録媒体に保存)」を示すと判断した場合(ACT26、YES)、ACT24で生成した音声データを記録媒体に保存する(ACT29)。なお、プロセッサ41は、
図6の設定に従って、音声データの他に「原稿画像(原稿画像データ)」及び「翻訳後テキストデータ」などを記録媒体に同時に保存してもよい。
【0079】
また、プロセッサ41は、記録媒体に保存するデータとして「翻訳原稿画像データ」が選択されている場合、翻訳原稿画像データを生成し、記録媒体に同時に保存してもよい。
【0080】
また、プロセッサ41は、「出力方法設定」が「音声合成(メールで送信)」を示すと判断した場合(ACT27、YES)、ACT24で生成した音声データを添付したメールを送信する(ACT30)。なお、プロセッサ41は、
図7の設定に従って、メールの宛先を決定する。また、プロセッサ41は、
図7の設定に従って、音声データの他に「原稿画像(原稿画像データ)」及び「翻訳後テキストデータ」などをメールに添付してもよい。
【0081】
また、プロセッサ41は、メールに添付するデータとして「翻訳原稿画像データ」が選択されている場合、翻訳原稿画像データを生成し、メールに添付してもよい。
【0082】
上記したように、画像形成装置12のプロセッサは、予め設定された出力方法設定に基づいて、印刷を行うか、音声データの生成を行うかを決定する。プロセッサ41は、印刷を行う場合、翻訳後テキストデータ及び原稿画像に基づいて翻訳原稿画像データを生成し、画像形成部27により翻訳原稿画像データを印刷する。また、プロセッサ41は、音声データの生成を行う場合、翻訳後テキストデータに基づいて音声合成処理部30により音声データを生成する音声合成処理を実行する。これにより、画像形成装置12は、OCR処理した原稿の翻訳結果に基づき、印刷を行うか音声データの生成を行うかを選択することができる。これにより、画像形成装置12の利便性を向上させることができる。
【0083】
さらに、プロセッサ41は、生成した音声データに基づいて、音声出力を行うか、記録媒体への保存を行うか、メール送信を行うかを選択することができる。これにより、画像形成装置12は、翻訳結果を様々な方法で出力することができる。
【0084】
なお、上記の実施形態では、種々の設定(例えば上記の「言語設定」、「音声モデル設定」、及び「出力方法設定」)が予め画像形成装置12に設定されている、または、機械翻訳処理の実行時に、その都度設定されると説明したが、この構成に限定されない。画像形成装置12は、「言語設定」、「音声モデル設定」、及び「出力方法設定」などの設定を記録媒体に保存する構成であってもよい。また、画像形成装置12は、記録媒体から読み出した情報に基づいて、「言語設定」、「音声モデル設定」、及び「出力方法設定」などを設定する構成であってもよい。
【0085】
具体的には、画像形成装置12のプロセッサ41は、既に設定されている「言語設定」、「音声モデル設定」、及び「出力方法設定」に基づいて、二次元コードを生成する。さらに、プロセッサ41は、二次元コードを紙媒体に印刷するように画像形成部27を制御する。この結果、
図10に示される設定シート51が画像形成装置12から出力される。
【0086】
設定シート51には、二次元コード52と、設定内容を示す文字列とが印刷されている。二次元コード52は、「言語設定」、「音声モデル設定」、及び「出力方法設定」などを含む情報が変換されたものである。文字列は、「言語設定」、「音声モデル設定」、及び「出力方法設定」を示すものである。設定シート51は、例えば、
図8及び
図9の処理を行う際に、原稿と一緒に読み込まれることにより、画像形成装置12に「言語設定」、「音声モデル設定」、及び「出力方法設定」を指定することができる。
【0087】
即ち、プロセッサ41は、読み込んだ原稿内に設定シート51が含まれている場合、設定シート51を画像読取部25により読み取った画像から、二次元コード52を特定する。プロセッサ41は、二次元コード解析部32により二次元コード52を復号し、「言語設定」、「音声モデル設定」、及び「出力方法設定」の情報を取得する。プロセッサ41は、取得した「言語設定」、「音声モデル設定」、及び「出力方法設定」と、画像読取部25により読み取った原稿画像と、に基づいて、OCR処理、機械翻訳処理、印刷処理、及び音声合成処理などを行う。
【0088】
これにより、画像形成装置12は、処理ごとに人手によって設定を行うことなく、任意の設定でOCR処理、機械翻訳処理、印刷処理、及び音声合成処理などを行うことができる。この結果、画像形成装置12の利便性をさらに向上させることができる。
【0089】
なお、二次元コード52は、「言語設定」、「音声モデル設定」、及び「出力方法設定」などの設定を含むのではなく、識別情報を含む構成であってもよい。この場合、画像形成装置12のメモリ42に、「言語設定」、「音声モデル設定」、及び「出力方法設定」と、識別情報と、が対応付けられて記憶される。画像形成装置12のプロセッサ41は、二次元コード52から識別情報を取得し、取得した識別情報に対応付けられた設定をメモリ42から読み出し、OCR処理、機械翻訳処理、印刷処理、及び音声合成処理などの処理を行ってもよい。
【0090】
また、「言語設定」、「音声モデル設定」、及び「出力方法設定」などの設定は、二次元コード52に変換されて紙媒体に印刷される(保存される)のではなく、他の記録媒体に保存されてもよい。例えば、「言語設定」、「音声モデル設定」、及び「出力方法設定」などの設定が、ICカードまたはスマートフォンなどの情報処理端末に保存されてもよい。この場合、画像形成装置12は、ICカードまたはスマートフォンなどの情報処理端末と通信を行う無線通信部を備える。画像形成装置12は、無線通信部によってICカードまたはスマートフォンなどの情報処理端末から取得した情報に基づいて、「言語設定」、「音声モデル設定」、及び「出力方法設定」などを設定してもよい。
【0091】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
なお、以下に本願の出願当初の特許請求の範囲の記載を付記する。
[C1]
画像データを媒体に印刷する画像形成部と、
スキャンされた原稿画像からOCR処理により生成された翻訳前テキストデータに基づく機械翻訳処理の結果である翻訳後テキストデータを取得する機械翻訳処理部と、
前記翻訳後テキストデータに基づいて音声データを生成する音声合成処理部と、
プロセッサと、
を具備し、
前記プロセッサは、
予め設定された出力方法設定に基づいて、印刷を行うか、音声データの生成を行うかを決定し、
印刷を行う場合、前記翻訳後テキストデータ及び前記原稿画像に基づいて翻訳原稿画像データを生成し、前記画像形成部により前記翻訳原稿画像データを印刷し、
音声データの生成を行う場合、前記翻訳後テキストデータに基づいて前記音声合成処理部により音声データを生成する音声合成処理を実行する、
画像形成装置。
[C2]
前記音声データに基づいて音声を出力する音声出力部をさらに具備し、
前記出力方法設定は、前記音声データをメール送信するか、前記音声データを記録媒体に保存するか、前記音声データを前記音声出力部により音声出力するかをさらに示し、
前記プロセッサは、前記音声データのメール送信、前記音声データの記録媒体への保存、及び前記音声データの前記音声出力部による音声出力のいずれかを、前記出力方法設定に基づいて実行する[C1]に記載の画像形成装置。
[C3]
前記プロセッサは、予め設定された音声モデル設定に基づいて、前記音声合成処理に用いる音声モデルを決定する[C2]に記載の画像形成装置。
[C4]
前記プロセッサは、
前記出力方法設定を記録媒体に保存し、
前記記録媒体から取得した情報に基づいて前記出力方法設定を設定する、
[C1]乃至[C3]のいずれか1項に記載の画像形成装置。
[C5]
画像データを媒体に印刷する画像形成部と、プロセッサと、を具備する画像形成装置の制御プログラムであって、
前記制御プログラムを実行することにより、前記プロセッサは、
スキャンされた原稿画像からOCR処理により生成された翻訳前テキストデータに基づく機械翻訳処理の結果である翻訳後テキストデータを取得し、
予め設定された出力方法設定に基づいて、印刷を行うか、音声データの生成を行うかを決定し、
印刷を行う場合、前記翻訳後テキストデータ及び前記原稿画像に基づいて翻訳原稿画像データを生成し、前記画像形成部により前記翻訳原稿画像データを印刷し、
音声データの生成を行う場合、前記翻訳後テキストデータに基づいて音声データを生成する音声合成処理を実行する、
制御プログラム。
【符号の説明】
【0092】
1…画像形成システム、11…クラウドサーバ、12…画像形成装置、13…ネットワーク、21…システムコントローラ、22…通信インタフェース、23…ディスプレイ、24…操作インタフェース、25…画像読取部、26…搬送部、27…画像形成部、28…OCR処理部、29…機械翻訳処理部、30…音声合成処理部、31…音声出力部、32…二次元コード解析部、41…プロセッサ、42…メモリ。