(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-20
(45)【発行日】2023-11-29
(54)【発明の名称】情報処理装置、情報処理方法及びプログラム
(51)【国際特許分類】
G06F 3/16 20060101AFI20231121BHJP
G06F 40/186 20200101ALI20231121BHJP
B41J 29/38 20060101ALI20231121BHJP
【FI】
G06F3/16 630
G06F3/16 650
G06F3/16 640
G06F3/16 680
G06F3/16 620
G06F40/186
B41J29/38
(21)【出願番号】P 2020063716
(22)【出願日】2020-03-31
【審査請求日】2023-03-10
(73)【特許権者】
【識別番号】000005267
【氏名又は名称】ブラザー工業株式会社
(74)【代理人】
【識別番号】110000992
【氏名又は名称】弁理士法人ネクスト
(72)【発明者】
【氏名】坂 涼司
【審査官】星野 裕
(56)【参考文献】
【文献】特開2019-20873(JP,A)
【文献】特開2019-99960(JP,A)
【文献】特開2019-215485(JP,A)
【文献】特開2000-207166(JP,A)
【文献】特開2018-72508(JP,A)
【文献】特表2005-500591(JP,A)
【文献】特開2009-301266(JP,A)
【文献】特開2006-139789(JP,A)
【文献】国際公開第02/077790(WO,A2)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G06F 40/186
B41J 29/38
(57)【特許請求の範囲】
【請求項1】
通信インタフェースと、
テキストデータを入力するためのテキスト入力欄を1つ以上含むテンプレートを複数記憶する記憶装置と、
制御装置と、
を備え、
前記制御装置は、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識し、
前記認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、
前記記憶装置から前記指定されたテンプレートを読み出し、
前記認識された音声の内容から、前記発音文字列に対応するテキストデータを抽出し、
前記読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出されたテキストデータを入力し、
前記テキスト入力欄に前記テキストデータが入力されたテンプレートを印刷用画像データに変換し、
前記変換された印刷用画像データを前記画像形成装置に送信する、
情報処理装置。
【請求項2】
前記複数のテンプレートのそれぞれには、名前を付けることができ、
前記テンプレートの指定は、前記テンプレートに付けられた名前を呼ぶことにより行う、
請求項1に記載の情報処理装置。
【請求項3】
前記複数のテンプレートのそれぞれには、そのテンプレートを使用できるユーザが指定され、
前記ユーザのそれぞれには、声紋が登録されており、
前記制御装置は、
前記入力された音声に基づいて声紋認識を行い、
前記指定されたテンプレートが、前記認識された声紋を有するユーザに使用が許可されたテンプレートである場合、前記記憶装置から前記指定されたテンプレートを読み出す、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記制御装置は、
前記指定されたテンプレートが、前記認識された声紋を有するユーザに使用が許可されたテンプレートでない場合、前記指定されたテンプレートが使用が許可されないテンプレートであることを発音する音声データを、前記通信インタフェースを介して前記スマートスピーカに送信する、
請求項3に記載の情報処理装置。
【請求項5】
前記テキスト入力欄が複数含まれるテンプレートについては、前記複数のテキスト入力欄にそれぞれ名前を付けることができ、
前記複数のテキスト入力欄のそれぞれに発音文字列を入力する指示を行う場合、テキスト入力欄を名前を呼ぶことで指示し、文字列を発音することでその文字列の入力を指示し、
前記制御装置は、
前記読み出されたテンプレートに含まれる前記複数のテキスト入力欄のうち、前記呼ばれた名前のテキスト入力欄に、前記入力を指示された文字列を示すテキストデータを入力する、
請求項1乃至4のいずれか1項に記載の情報処理装置。
【請求項6】
前記制御装置は、
前記通信インタフェースを介して接続されたディスプレイに、前記変換された印刷用画像データをプレビュー表示し、
前記プレビュー表示に対して、ユーザが他の候補をプレビュー表示する指示を発音した場合、
前記発音文字列に対応する他の候補のテキストデータを抽出し、
前記読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出された他の候補のテキストデータを入力する、
請求項1乃至5のいずれか1項に記載の情報処理装置。
【請求項7】
通信インタフェースと、テキストデータを入力するためのテキスト入力欄を1つ以上含むテンプレートを複数記憶する記憶装置と、を備えた情報処理装置を用いた情報処理方法であって、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する認識処理と、
前記認識処理によって認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、
前記記憶装置から前記指定されたテンプレートを読み出す読出処理と、
前記認識された音声の内容から、前記発音文字列に対応するテキストデータを抽出する抽出処理と、
前記読出処理によって読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出されたテキストデータを入力する入力処理と、
前記テキスト入力欄に前記テキストデータが入力されたテンプレートを印刷用画像データに変換する変換処理と、
前記変換処理によって変換された印刷用画像データを画像形成装置に送信する送信処理と、
を含む情報処理方法。
【請求項8】
通信インタフェースと、テキストデータを入力するためのテキスト入力欄を1つ以上含むテンプレートを複数記憶する記憶装置と、を備えた情報処理装置のコンピュータが実行可能なプログラムであって、
前記コンピュータに、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する認識処理と、
前記認識処理によって認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、
前記記憶装置から前記指定されたテンプレートを読み出す読出処理と、
前記認識された音声の内容から、前記発音文字列に対応するテキストデータを抽出する抽出処理と、
前記読出処理によって読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出されたテキストデータを入力する入力処理と、
前記テキスト入力欄に前記テキストデータが入力されたテンプレートを印刷用画像データに変換する変換処理と、
前記変換処理によって変換された印刷用画像データを画像形成装置に送信する送信処理と、
を実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、画像形成装置を音声により制御する技術に関するものである。
【背景技術】
【0002】
特許文献1には、所定のフレーズを発音すると、ゲームコンテンツを指定し、そのゲームコンテンツに基づいた印刷を印刷装置に行わせる印刷システムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1に記載の印刷システムでは、テキスト入力欄を含むテンプレートに音声指示された文字列を入力して印刷したいという要望に応えることはできない。
【0005】
本願は、テキスト入力欄を含むテンプレートに音声指示された文字列を簡便に入力して印刷することが可能となる技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本願の情報処理装置は、通信インタフェースと、テキストデータを入力するためのテキスト入力欄を1つ以上含むテンプレートを複数記憶する記憶装置と、制御装置と、を備え、制御装置は、通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識し、認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、記憶装置から指定されたテンプレートを読み出し、認識された音声の内容から、発音文字列に対応するテキストデータを抽出し、読み出されたテンプレートに含まれるテキスト入力欄に、抽出されたテキストデータを入力し、テキスト入力欄にテキストデータが入力されたテンプレートを印刷用画像データに変換し、変換された印刷用画像データを画像形成装置に送信する。
【発明の効果】
【0007】
本願によれば、テキスト入力欄を含むテンプレートに音声指示された文字列を簡便に入力して印刷することが可能となる。
【図面の簡単な説明】
【0008】
【
図1】本願の一実施形態に係る画像形成システムの構成を示すブロック図である。
【
図2】
図1の画像形成システムによって実行される印刷制御処理のシーケンス図である。
【
図3】テンプレートの一例((a),(c))と、テンプレートに基づいて印刷した印刷画像の一例((b),(d))を示す図である。
【
図4】ユーザ毎に使用できるテンプレートを限定した様子を示す図である。
【発明を実施するための形態】
【0009】
以下、本願の実施の形態を図面に基づいて詳細に説明する。
【0010】
図1は、本願の一実施形態に係る画像形成システム1000の構成を示している。画像形成システム1000は、プリンタ200と、スマートスピーカ300と、アプリケーションサーバ400と、無線のアクセスポイント50とにより主として構成されている。なお、本実施形態の画像形成システム1000では、プリンタ200とスマートスピーカ300は、同じユーザによって利用される。
【0011】
アクセスポイント50は、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線LANのアクセスポイントとしての機能を実現する。アクセスポイント50は、LAN70に接続されている。LAN70は、例えば、イーサネット(登録商標)規格に準拠して構築された有線ネットワークである。LAN70は、インターネット80に接続されている。アプリケーションサーバ400は、インターネット80に接続されている。
【0012】
プリンタ200は、例えば、CPUとメモリを含む制御部210と、制御部210の制御に従って印刷を行う印刷機構250と、ブルートゥースIF260と、を備えている。印刷機構250は、シートに画像を印刷する機構であり、電子写真方式、インクジェット方式、サーマル方式等の印刷機構である。ブルートゥースIF260は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、スマートスピーカ300との通信のために用いられる。
【0013】
スマートスピーカ300は、ユーザが発話した音声に応じて特定の処理を実行する装置である。特定の処理は、例えば、音声データを生成して、アプリケーションサーバ400に送信する処理を含む。スマートスピーカ300は、CPUとメモリとを含む制御部310と、表示部340と、音声入出力部350と、ブルートゥースIF360と、無線LANIF380と、を備えている。
【0014】
表示部340は、液晶ディスプレイや有機ELディスプレイなどの表示装置、表示装置を駆動する駆動回路などにより構成されている。
【0015】
音声入出力部350は、スピーカとマイクとを含み、音声の入力と音声の出力に関する処理を実行する。例えば、音声入出力部350は、制御部310の制御に従って、ユーザが発話した音声を検出し、その音声を示す音声データを生成する。また、音声入出力部350は、入力された音声データに応じた音声をスピーカから発生する。
【0016】
無線LANIF380は、アンテナを含み、例えば、IEEE802.11a/b/g/nの規格に従った通信方式を用いて無線通信を行う。これにより、スマートスピーカ300は、アクセスポイント50を介してLAN70及びインターネット80に接続され、アプリケーションサーバ400と通信可能に接続される。
【0017】
ブルートゥースIF360は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、プリンタ200との通信のために用いられる。これにより、プリンタ200は、ブルートゥースIF260、スマートスピーカ300のブルートゥースIF360、スマートスピーカ300の無線LANIF380、アクセスポイント50、LAN70及びインターネット80を介して、アプリケーションサーバ400と通信可能に接続される。
【0018】
アプリケーションサーバ400は、例えば、いわゆるクラウドサービスを提供する事業者が運営するサーバである。アプリケーションサーバ400は、アプリケーションサーバ400全体を制御するCPU410と、ROM、RAM、HDD、SSD及び光ディスクドライブなどを含む記憶部420と、を備えている。アプリケーションサーバ400は、さらに、インターネット80と接続するためのネットワークIF480を備えている。なお、
図1では、アプリケーションサーバ400は、概念的に1個のサーバとして図示されているが、互いに通信可能に接続された複数個のサーバを含む、いわゆるクラウドサーバであってもよい。
【0019】
記憶部420は、データ記憶領域422及び制御プログラム領域424を含んでいる。データ記憶領域422は、CPU410が処理を行う際に必要なデータなどを記憶する記憶領域として、また、CPU410が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域として機能する。データ記憶領域422には、複数個のテンプレートを含むテンプレート群422aも記憶されている。制御プログラム領域424は、OS、情報処理プログラム、その他各種のアプリやファームウェアなどを記憶する領域である。情報処理プログラムには、音声解析プログラム424a及び印刷関連プログラム424bが含まれる。音声解析プログラム424aは、例えば、アプリケーションサーバ400の運営者によって、アプリケーションサーバ400にアップロードされることによって提供される。印刷関連プログラム424bは、例えば、アプリケーションサーバ400のリソースを利用して印刷サービスを提供する事業者、例えば、プリンタ200を製造する事業者によって、アプリケーションサーバ400にアップロードされることによって提供される。なお、音声解析プログラム424aの全部または一部が、プリンタ200を製造する事業者によって提供されてもよい。あるいは、印刷関連プログラム424bの全部または一部がアプリケーションサーバ400を運営する事業者によって提供されてもよい。
【0020】
アプリケーションサーバ400、特にCPU410は、音声解析プログラム424aを実行することによって、音声解析処理部424a′(
図2参照)として機能する。音声解析処理部424a′は、音声認識処理や形態素解析処理を実行する。音声認識処理は、音声データを解析して、音声データによって示される発話の内容を示すテキストデータを生成する処理である。形態素解析処理は、そのテキストデータを解析して、発話の内容に含まれる単語などの構成単位(形態素と呼ばれる)の抽出や、抽出された形態素の種別(例えば、品詞の種別)の特定を行う処理である。
【0021】
また、アプリケーションサーバ400、特にCPU410は、印刷関連プログラム424bを実行することによって、印刷関連処理部424b′(
図2参照)として機能する。印刷関連処理部424b′は、音声データを解析して得られるテキストデータを用いて、プリンタ200に動作指示を行うコマンドを生成する処理などを実行する。
【0022】
図2は、画像形成システム1000によって実行される印刷制御処理のシーケンスを示している。印刷制御処理は、スマートスピーカ300とアプリケーションサーバ400とが協働して、プリンタ200に印刷を実行させる処理である。
【0023】
図2において、まずS2で、ユーザが発話する。ユーザは、アプリケーションサーバ400に既に登録されているテンプレートを用いて印刷したいと思ったので、スマートスピーカ300に対して、例えば「“名前”テンプレートで“田中太郎”を印刷して」と指示する。印刷制御処理は、スマートスピーカ300がその発話された音声を検出した場合に、開始する。
【0024】
S4では、スマートスピーカ300は、ユーザによって発話された音声を示す音声データを生成する。つまり、「“名前”テンプレートで“田中太郎”を印刷して」との音声がスマートスピーカ300に入力されると、スマートスピーカ300は、その音声を示す音声データを生成する。
【0025】
次に、S6では、スマートスピーカ300は、その音声データと登録済みのユーザIDとをアプリケーションサーバ400の音声解析処理部424a′に送信する。音声データの送信には、公知のプロトコル、例えば、HTTPが用いられる。なお、スマートスピーカ300には、ユーザの声紋が登録できるようになっており、スマートスピーカ300は、入力された音声に基づいて声紋認識を行い、認識した声紋と登録されている声紋とが一致した場合に、ユーザIDを送信する。したがって、スマートスピーカ300からユーザIDが送信されたときには、その前段階で既に、声紋認識はなされている。
【0026】
アプリケーションサーバ400がその音声データとユーザIDとを受信すると、S8にて、アプリケーションサーバ400の音声解析処理部424a′は、受信された音声データを解析する。具体的には、音声解析処理部424a′は、音声データに対して音声認識処理を実行し、音声データによって示される音声を示すテキストデータを生成する。例えば、「“名前”テンプレートで“田中太郎”を印刷して」との音声を示す音声データを受信した場合には、音声解析処理部424a′は、その音声の内容を示すテキストデータを生成する。音声解析処理部424a′は、さらに、そのテキストデータに対して形態素解析処理を実行する。これにより、生成されたテキストデータから、例えば、「“名前”テンプレート」、「“田中太郎”」、「印刷して」などの単語が抽出されるとともに、これらの単語の品詞種別(例えば、名詞、動詞)が特定される。音声解析処理部424a′は、形態素解析結果として、抽出された単語に品詞種別を対応付けたリストを生成する。
【0027】
次に、S10では、音声解析処理部424a′は、生成されたテキストデータと、形態素解析結果と、スマートスピーカ300から受信されたユーザIDと、を、印刷関連処理部424b′に渡す。具体的には、音声解析処理部424a′は、例えば、データ記憶領域422内の所定領域にテキストデータと形態素解析結果とユーザIDとを格納して、印刷関連プログラム424bをコールする。
【0028】
音声解析処理部424a′からテキストデータと形態素解析結果とユーザIDとを受け取ると、S12にて、印刷関連処理部424b′は、テキストデータと形態素解析結果とを用いて、テンプレート読出処理を実行する。具体的には、印刷関連処理部424b′は、“名前”という名称のテンプレートを上記テンプレート群422aから検索する。
図3(a)は、“名前”テンプレートT1の一例を示している。“名前”テンプレートT1は、テキストデータ入力ボックスT11と、バックグラウンド画像T12とによって構成されている。
【0029】
次に、S14では、印刷関連処理部424b′は、読み出した“名前”テンプレートT1のテキストデータ入力ボックスT11に“田中太郎”を入力する。そして、印刷関連処理部424b′は、S16にて、“田中太郎”が入力された“名前”テンプレートT1を印刷用画像データに変換し、S18にて、スマートスピーカ300に送信する。
【0030】
S20では、スマートスピーカ300は、プリンタ200に、受信した印刷用画像データと、その印刷指示を行う印刷指示コマンドを送信する。プリンタ200は、印刷用画像データと印刷指示コマンドを受信し、S22にて、印刷用画像データに基づいて印刷を実行する。
図3(b)は、“名前”テンプレートT1のテキストデータ入力ボックスT11に“田中太郎”のテキストデータを入力して印刷した印刷画像P1の一例を示している。印刷画像P1は、バックグラウンド画像P12内のテキストデータ入力ボックスT11の領域内に“田中太郎”の文字列画像P11が挿入されたものとなっている。このように、ユーザは、「“名前”テンプレートで“田中太郎”を印刷して」と発音するだけで、プリンタ200に“田中太郎”の名前の入った印刷画像P1を印刷させることができる。
【0031】
図3(c)は、“名刺”テンプレートT2の一例を示している。“名刺”テンプレートT2は、上記
図3(a)の“名前”テンプレートT1に対して、複数個(図示例では、3個)のテキストデータ入力ボックスT21~T23を含んでいる点が異なっている。この3個のテキストデータ入力ボックスT21~T23に3種類のテキストデータを入力する場合、ユーザは、入力する文字列を区切りながら発音する。区切る方法としては、例えば、無音の発音区間を入れて、スマートスピーカ300に区切りであることを知らせる方法が考えられる。
【0032】
そして、印刷関連処理部424b′は、区切られた3種類の文字列を、テキストデータ入力ボックスT21~T23のうち、優先順位の早いものから順に入力して行く。具体的には、印刷関連処理部424b′は、最初に発音された文字列、つまり会社名(例えば“ABC株式会社”)を示す文字列をテキストデータ入力ボックスT21に入力し、次に発音された文字列、つまり役職名(例えば“課長”)を示す文字列をテキストデータ入力ボックスT22に入力し、最後に発音された文字列、つまり氏名(例えば“田中太郎”)を示す文字列をテキストデータ入力ボックスT23に入力する。なお、優先順位は、予め固定的に決まっていてもよいし、予め決まっているものを後からユーザが変更できるようにしてもよい。
【0033】
図3(d)は、
図3(c)の“名刺”テンプレートT2に基づいて印刷した印刷画像P2の一例を示している。印刷画像P2は、テキストデータ入力ボックスT21の位置に“ABC株式会社”の画像P21が挿入され、テキストデータ入力ボックスT22の位置に“課長”の画像P22が挿入され、テキストデータ入力ボックスT23の位置に“田中太郎”の画像P23が挿入された画像になっている。
【0034】
各テンプレートには、“名前”テンプレートT1や“名刺”テンプレートT2のように、名称が付けられている。したがって、ユーザは、その名称を呼ぶだけで、使いたいテンプレートをアプリケーションサーバ400のデータ記憶領域422から読み出して、印刷に使うことができる。テンプレートは、ユーザ自身が作成し、それをアプリケーションサーバ400に登録するようにしてもよい。この場合、ユーザが、画像形成システム1000に含まれない端末装置、例えばスマートフォンやPC等を用いてテンプレートを作成した後、アプリケーションサーバ400にアクセスし、登録するようにすればよい。
【0035】
また、“名刺”テンプレートT2のように、複数個のテキストデータ入力ボックスを含む場合、各テキストデータ入力ボックスに名称を付けることができるようにし、ユーザは、名称を呼んでテキストデータ入力ボックスを選択し、そのテキストデータ入力ボックスに発音した文字列を入力するようにしてもよい。これにより、ユーザは、入力したいテキストデータ入力ボックスを指定して、文字列を入力することができる。
【0036】
図4は、テンプレート毎に使用できるユーザが制限されている場合のテーブルデータ422bの一例を示している。
図4には、“名前”テンプレートT1に属するテンプレートとして、テンプレートA~Fの6種類が例示されている。例えば、テンプレートAは、ユーザAとユーザCは使用できるが、ユーザBは使用できない。このようなテーブルデータ422bは、例えば、アプリケーションサーバ400のデータ記憶領域422に記憶されている。
【0037】
このように、テンプレート毎にユーザが制限されている場合、アプリケーションサーバ400の印刷関連処理部424b′は、上記S12で、テンプレートを読み出すとき、発話したユーザに使用が許可されているテンプレートのみを読み出す。上記S6では、スマートスピーカ300は、アプリケーションサーバ400に音声データと一緒にユーザIDも送信しているので、印刷関連処理部424b′は、テーブルデータ422bを参照して、ユーザIDが示すユーザに許可されているテンプレートを読み出すことができる。なお、読み出しが指示されたテンプレートがそのユーザに使用が許可されておらず、テンプレートを読み出すことができない場合、アプリケーションサーバ400は、指示されたテンプレートが使用が許可されていないテンプレートであることを知らせるための音声データを生成し、スマートスピーカ300に送信することが好ましい。
【0038】
また、発話により文字列を入力する場合、ユーザの意図通りの文字列が入力されるとは限らない。例えば、かな漢字変換によって変換された漢字が、ユーザの意図通りの漢字ではない場合がある。この場合に、実際に印刷してみないと、ユーザの意図通りの漢字が入力されたかどうか分からないとすれば、印刷代や労力に無駄が生ずる。
【0039】
これに対処するために、スマートスピーカ300が、上記S18で、印刷用画像データを受信したとき、その印刷用画像データを上記表示部340にプレビュー表示させるようにすればよい。この場合、プレビュー表示された印刷用画像データが気に入らなければ、ユーザは、他の候補をプレビュー表示するように、スマートスピーカ300に発話すればよい。
【0040】
この発話により、スマートスピーカ300は、他の印刷用画像データを送信するようにアプリケーションサーバ400に指示する。これに応じて、アプリケーションサーバ400の印刷関連処理部424b′は、前回の発話に含まれる発音文字列、つまり、かな漢字変換の「かな」に相当する文字列を他の漢字に変換して、テンプレートのテキストデータ入力ボックスに入力し、他の印刷用画像データを生成する。そして、印刷関連処理部424b′は、生成した他の印刷用画像データをスマートスピーカ300に送信する。
【0041】
スマートスピーカ300は、受信した他の印刷用画像データを表示部340にプレビュー表示する。そして、プレビュー表示された印刷用画像データがユーザの意図通りのものになるまで、上記手順を繰り返す。
【0042】
以上説明したように、本実施形態のアプリケーションサーバ400は、ネットワークIF480と、テキストデータを入力するためのテキスト入力欄を1つ以上含むテンプレートを複数記憶する記憶部420と、CPU410と、を備えている。CPU410は、ネットワークIF480を介して接続された、音声を入力及び出力するスマートスピーカから、プリンタ200のユーザが発話することにより入力された音声の内容を認識し、認識された音声の内容が、テンプレートT1を指定し、かつそのテンプレートT1に含まれるテキストデータ入力ボックスT11へ発音文字列を入力する内容である場合、記憶部420から指定されたテンプレートT1を読み出し、認識された音声の内容から、発音文字列に対応するテキストデータを抽出し、読み出されたテンプレートT1に含まれるテキストデータ入力ボックスT11に、抽出されたテキストデータを入力し、テキストデータ入力ボックスT11にテキストデータが入力されたテンプレートT1を印刷用画像データに変換し、変換された印刷用画像データをプリンタ200に送信する。
【0043】
このように、本実施形態のアプリケーションサーバ400では、例えば「“名前”テンプレートで“田中太郎”を印刷して」と発音するだけで、プリンタ200に“田中太郎”の名前の入った印刷画像P1の印刷を指示することができるので、テキストデータ入力ボックスT11を含むテンプレートT1に音声指示された文字列を簡便に入力して印刷することが可能となる。
【0044】
ちなみに、本実施形態において、アプリケーションサーバ400は、「情報処理装置」の一例である。ネットワークIF480は、「通信インタフェース」の一例である。記憶部420は、「記憶装置」の一例である。CPU410は、「制御装置」の一例である。プリンタ200は、「画像形成装置」の一例である。テキストデータ入力ボックスT11は、「テキスト入力欄」の一例である。
【0045】
また、複数のテンプレートのそれぞれには、名前を付けることができ、テンプレートの指定は、テンプレートに付けられた名前を呼ぶことにより行う。これにより、テンプレートの指定をより簡便に行うことができる。
【0046】
また、複数のテンプレートのそれぞれには、そのテンプレートを使用できるユーザが指定され、ユーザのそれぞれには、声紋が登録されており、CPU410は、入力された音声に基づいて声紋認識を行い、指定されたテンプレートが、認識された声紋を有するユーザに使用が許可されたテンプレートである場合、記憶部420から指定されたテンプレートを読み出す。これにより、指定されたテンプレートがユーザ自ら作成し、登録したテンプレートであって、他人に公開したくないテンプレートである場合、指定されたテンプレートは、そのユーザのみに使用が許可されるので、便利である。
【0047】
また、CPU410は、指定されたテンプレートが、認識された声紋を有するユーザに使用が許可されたテンプレートでない場合、指定されたテンプレートの使用が許可されないテンプレートであることを発音する音声データを、ネットワークIF480を介してスマートスピーカ300に送信する。これにより、ユーザは指定されたテンプレートが読み出されない理由を音声によって知ることができるので、便利である。
【0048】
また、テキストデータ入力ボックスT21~T23が複数含まれるテンプレートについては、複数のテキストデータ入力ボックスT21~T23にそれぞれ名前を付けることができ、複数のテキストデータ入力ボックスT21~T23のそれぞれに発音文字列を入力する指示を行う場合、テキストデータ入力ボックスT21~T23の名前を呼ぶことで指示し、文字列を発音することでその文字列の入力を指示し、CPU410は、読み出されたテンプレートに含まれる複数のテキストデータ入力ボックスT21~T23のうち、呼ばれた名前のテキストデータ入力ボックスに、入力を指示された文字列を示すテキストデータを入力する。これにより、ユーザは、入力したいテキストデータ入力ボックスを指定して、文字列を入力することができるので、便利である。
【0049】
また、CPU410は、ネットワークIF480を介して接続されたディスプレイに、変換された印刷用画像データをプレビュー表示し、プレビュー表示に対して、ユーザが他の候補をプレビュー表示する指示を発音した場合、発音文字列に対応する他の候補のテキストデータを抽出し、読み出されたテンプレートに含まれるテキストデータ入力ボックスT11に、抽出された他の候補のテキストデータを入力する。これにより、印刷用画像データに基づいて実際に印刷する前に、ユーザはその印刷用画像データが意図通りのものであるか否かを確認できるので、印刷代や労力を省くことができる。
【0050】
なお、本発明は上記実施形態に限定されるものでなく、その趣旨を逸脱しない範囲で様々な変更が可能である。
【0051】
(1)上記実施形態では、音声データを解析する処理は、アプリケーションサーバ400の音声解析処理部424a′が実行している。これに代えて、音声データを解析する処理の一部または全部は、スマートスピーカ300が実行してもよい。また、音声データを解析する処理の一部または全部は、印刷関連処理部424b′が実行してもよい。例えば、音声解析処理部424a′は、音声認識処理を行ってテキストデータを生成する処理だけを行い、単語を抽出する形態素解析処理は、印刷関連処理部424b′が実行してもよい。また、印刷関連処理部424b′の処理の一部または全部は、スマートスピーカ300が実行してもよいし、プリンタ200が実行してもよい。
【0052】
(2)上記実施形態では、画像形成装置として、プリンタ200を採用したが、これに限らず、印刷機能にスキャン機能やファックス機能を加えた複合機を採用してもよい。この場合には、例えば、スマートスピーカ300に入力される音声に応じて、その複合機に印刷を行わせることができる。
【0053】
(3)アプリケーションサーバ400は、クラウドサーバであるが、LAN70に接続され、インターネット80に接続されないローカルサーバであってもよい。この場合には、スマートスピーカ300からアプリケーションサーバ400にユーザIDなどの識別情報を送信せず、音声データだけを送信してもよい。
【0054】
(4)スマートスピーカ300とプリンタ200とを接続するインタフェースは、ブルートゥースIF160に限らず、例えば、USBなどの有線インタフェースであってもよいし、NFC(Near field communicationの略)などの他の無線インタフェースであってもよい。
【0055】
(5)上記実施形態において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。
【符号の説明】
【0056】
50…アクセスポイント、70…LAN、80…インターネット、200…プリンタ、210…制御部、250…印刷機構、260,360…ブルートゥースIF、300…スマートスピーカ、310…制御部、340…表示部、350…音声入出力部、380…無線LANIF、400…アプリケーションサーバ、410…CPU、420…記憶部、424a…音声解析プログラム、424b…印刷関連プログラム、424b′…印刷関連処理部、424a′…音声解析処理部、480…ネットワークIF、1000…画像形成システム。