特許7388272 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ブラザー工業株式会社の特許一覧

特許7388272情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-11-20

(45)【発行日】2023-11-29

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06F 3/16 20060101AFI20231121BHJP

G06F 40/186 20200101ALI20231121BHJP

B41J 29/38 20060101ALI20231121BHJP

【ＦＩ】

G06F3/16 630

G06F3/16 650

G06F3/16 640

G06F3/16 680

G06F3/16 620

G06F40/186

B41J29/38

【請求項の数】 8

(21)【出願番号】P 2020063716

(22)【出願日】2020-03-31

(65)【公開番号】P2021163163

(43)【公開日】2021-10-11

【審査請求日】2023-03-10

(73)【特許権者】

【識別番号】000005267

【氏名又は名称】ブラザー工業株式会社

(74)【代理人】

【識別番号】110000992

【氏名又は名称】弁理士法人ネクスト

(72)【発明者】

【氏名】坂涼司

【審査官】星野裕

(56)【参考文献】

【文献】特開２０１９－２０８７３（ＪＰ，Ａ）

【文献】特開２０１９－９９９６０（ＪＰ，Ａ）

【文献】特開２０１９－２１５４８５（ＪＰ，Ａ）

【文献】特開２０００－２０７１６６（ＪＰ，Ａ）

【文献】特開２０１８－７２５０８（ＪＰ，Ａ）

【文献】特表２００５－５００５９１（ＪＰ，Ａ）

【文献】特開２００９－３０１２６６（ＪＰ，Ａ）

【文献】特開２００６－１３９７８９（ＪＰ，Ａ）

【文献】国際公開第０２／０７７７９０（ＷＯ，Ａ２）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ３／１６

Ｇ０６Ｆ４０／１８６

Ｂ４１Ｊ２９／３８

(57)【特許請求の範囲】

【請求項1】

通信インタフェースと、
テキストデータを入力するためのテキスト入力欄を１つ以上含むテンプレートを複数記憶する記憶装置と、
制御装置と、
を備え、
前記制御装置は、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識し、
前記認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、
前記記憶装置から前記指定されたテンプレートを読み出し、
前記認識された音声の内容から、前記発音文字列に対応するテキストデータを抽出し、
前記読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出されたテキストデータを入力し、
前記テキスト入力欄に前記テキストデータが入力されたテンプレートを印刷用画像データに変換し、
前記変換された印刷用画像データを前記画像形成装置に送信する、
情報処理装置。

【請求項2】

前記複数のテンプレートのそれぞれには、名前を付けることができ、
前記テンプレートの指定は、前記テンプレートに付けられた名前を呼ぶことにより行う、
請求項１に記載の情報処理装置。

【請求項3】

前記複数のテンプレートのそれぞれには、そのテンプレートを使用できるユーザが指定され、
前記ユーザのそれぞれには、声紋が登録されており、
前記制御装置は、
前記入力された音声に基づいて声紋認識を行い、
前記指定されたテンプレートが、前記認識された声紋を有するユーザに使用が許可されたテンプレートである場合、前記記憶装置から前記指定されたテンプレートを読み出す、
請求項１又は２に記載の情報処理装置。

【請求項4】

前記制御装置は、
前記指定されたテンプレートが、前記認識された声紋を有するユーザに使用が許可されたテンプレートでない場合、前記指定されたテンプレートが使用が許可されないテンプレートであることを発音する音声データを、前記通信インタフェースを介して前記スマートスピーカに送信する、
請求項３に記載の情報処理装置。

【請求項5】

前記テキスト入力欄が複数含まれるテンプレートについては、前記複数のテキスト入力欄にそれぞれ名前を付けることができ、
前記複数のテキスト入力欄のそれぞれに発音文字列を入力する指示を行う場合、テキスト入力欄を名前を呼ぶことで指示し、文字列を発音することでその文字列の入力を指示し、
前記制御装置は、
前記読み出されたテンプレートに含まれる前記複数のテキスト入力欄のうち、前記呼ばれた名前のテキスト入力欄に、前記入力を指示された文字列を示すテキストデータを入力する、
請求項１乃至４のいずれか１項に記載の情報処理装置。

【請求項6】

前記制御装置は、
前記通信インタフェースを介して接続されたディスプレイに、前記変換された印刷用画像データをプレビュー表示し、
前記プレビュー表示に対して、ユーザが他の候補をプレビュー表示する指示を発音した場合、
前記発音文字列に対応する他の候補のテキストデータを抽出し、
前記読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出された他の候補のテキストデータを入力する、
請求項１乃至５のいずれか１項に記載の情報処理装置。

【請求項7】

通信インタフェースと、テキストデータを入力するためのテキスト入力欄を１つ以上含むテンプレートを複数記憶する記憶装置と、を備えた情報処理装置を用いた情報処理方法であって、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する認識処理と、
前記認識処理によって認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、
前記記憶装置から前記指定されたテンプレートを読み出す読出処理と、
前記認識された音声の内容から、前記発音文字列に対応するテキストデータを抽出する抽出処理と、
前記読出処理によって読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出されたテキストデータを入力する入力処理と、
前記テキスト入力欄に前記テキストデータが入力されたテンプレートを印刷用画像データに変換する変換処理と、
前記変換処理によって変換された印刷用画像データを画像形成装置に送信する送信処理と、
を含む情報処理方法。

【請求項8】

通信インタフェースと、テキストデータを入力するためのテキスト入力欄を１つ以上含むテンプレートを複数記憶する記憶装置と、を備えた情報処理装置のコンピュータが実行可能なプログラムであって、
前記コンピュータに、
前記通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識する認識処理と、
前記認識処理によって認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、
前記記憶装置から前記指定されたテンプレートを読み出す読出処理と、
前記認識された音声の内容から、前記発音文字列に対応するテキストデータを抽出する抽出処理と、
前記読出処理によって読み出されたテンプレートに含まれる前記テキスト入力欄に、前記抽出されたテキストデータを入力する入力処理と、
前記テキスト入力欄に前記テキストデータが入力されたテンプレートを印刷用画像データに変換する変換処理と、
前記変換処理によって変換された印刷用画像データを画像形成装置に送信する送信処理と、
を実行させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本願は、画像形成装置を音声により制御する技術に関するものである。

【背景技術】

【0002】

特許文献１には、所定のフレーズを発音すると、ゲームコンテンツを指定し、そのゲームコンテンツに基づいた印刷を印刷装置に行わせる印刷システムが記載されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１９－１８５６１８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかし、特許文献１に記載の印刷システムでは、テキスト入力欄を含むテンプレートに音声指示された文字列を入力して印刷したいという要望に応えることはできない。

【0005】

本願は、テキスト入力欄を含むテンプレートに音声指示された文字列を簡便に入力して印刷することが可能となる技術を提供することを目的とする。

【課題を解決するための手段】

【0006】

上記目的を達成するため、本願の情報処理装置は、通信インタフェースと、テキストデータを入力するためのテキスト入力欄を１つ以上含むテンプレートを複数記憶する記憶装置と、制御装置と、を備え、制御装置は、通信インタフェースを介して接続された、音声を入力及び出力するスマートスピーカから、画像形成装置のユーザが発話することにより入力された音声の内容を認識し、認識された音声の内容が、テンプレートを指定し、かつそのテンプレートに含まれるテキスト入力欄へ発音文字列を入力する内容である場合、記憶装置から指定されたテンプレートを読み出し、認識された音声の内容から、発音文字列に対応するテキストデータを抽出し、読み出されたテンプレートに含まれるテキスト入力欄に、抽出されたテキストデータを入力し、テキスト入力欄にテキストデータが入力されたテンプレートを印刷用画像データに変換し、変換された印刷用画像データを画像形成装置に送信する。

【発明の効果】

【0007】

本願によれば、テキスト入力欄を含むテンプレートに音声指示された文字列を簡便に入力して印刷することが可能となる。

【図面の簡単な説明】

【0008】

【図1】本願の一実施形態に係る画像形成システムの構成を示すブロック図である。

【図2】図１の画像形成システムによって実行される印刷制御処理のシーケンス図である。

【図3】テンプレートの一例（（ａ），（ｃ））と、テンプレートに基づいて印刷した印刷画像の一例（（ｂ），（ｄ））を示す図である。

【図4】ユーザ毎に使用できるテンプレートを限定した様子を示す図である。

【発明を実施するための形態】

【0009】

以下、本願の実施の形態を図面に基づいて詳細に説明する。

【0010】

図１は、本願の一実施形態に係る画像形成システム１０００の構成を示している。画像形成システム１０００は、プリンタ２００と、スマートスピーカ３００と、アプリケーションサーバ４００と、無線のアクセスポイント５０とにより主として構成されている。なお、本実施形態の画像形成システム１０００では、プリンタ２００とスマートスピーカ３００は、同じユーザによって利用される。

【0011】

アクセスポイント５０は、例えば、ＩＥＥＥ８０２．１１ａ／ｂ／ｇ／ｎの規格に従った通信方式を用いて無線ＬＡＮのアクセスポイントとしての機能を実現する。アクセスポイント５０は、ＬＡＮ７０に接続されている。ＬＡＮ７０は、例えば、イーサネット（登録商標）規格に準拠して構築された有線ネットワークである。ＬＡＮ７０は、インターネット８０に接続されている。アプリケーションサーバ４００は、インターネット８０に接続されている。

【0012】

プリンタ２００は、例えば、ＣＰＵとメモリを含む制御部２１０と、制御部２１０の制御に従って印刷を行う印刷機構２５０と、ブルートゥースＩＦ２６０と、を備えている。印刷機構２５０は、シートに画像を印刷する機構であり、電子写真方式、インクジェット方式、サーマル方式等の印刷機構である。ブルートゥースＩＦ２６０は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、スマートスピーカ３００との通信のために用いられる。

【0013】

スマートスピーカ３００は、ユーザが発話した音声に応じて特定の処理を実行する装置である。特定の処理は、例えば、音声データを生成して、アプリケーションサーバ４００に送信する処理を含む。スマートスピーカ３００は、ＣＰＵとメモリとを含む制御部３１０と、表示部３４０と、音声入出力部３５０と、ブルートゥースＩＦ３６０と、無線ＬＡＮＩＦ３８０と、を備えている。

【0014】

表示部３４０は、液晶ディスプレイや有機ＥＬディスプレイなどの表示装置、表示装置を駆動する駆動回路などにより構成されている。

【0015】

音声入出力部３５０は、スピーカとマイクとを含み、音声の入力と音声の出力に関する処理を実行する。例えば、音声入出力部３５０は、制御部３１０の制御に従って、ユーザが発話した音声を検出し、その音声を示す音声データを生成する。また、音声入出力部３５０は、入力された音声データに応じた音声をスピーカから発生する。

【0016】

無線ＬＡＮＩＦ３８０は、アンテナを含み、例えば、ＩＥＥＥ８０２．１１ａ／ｂ／ｇ／ｎの規格に従った通信方式を用いて無線通信を行う。これにより、スマートスピーカ３００は、アクセスポイント５０を介してＬＡＮ７０及びインターネット８０に接続され、アプリケーションサーバ４００と通信可能に接続される。

【0017】

ブルートゥースＩＦ３６０は、アンテナを含み、ブルートゥース方式に準拠した近距離無線通信を行うためのインタフェースであり、プリンタ２００との通信のために用いられる。これにより、プリンタ２００は、ブルートゥースＩＦ２６０、スマートスピーカ３００のブルートゥースＩＦ３６０、スマートスピーカ３００の無線ＬＡＮＩＦ３８０、アクセスポイント５０、ＬＡＮ７０及びインターネット８０を介して、アプリケーションサーバ４００と通信可能に接続される。

【0018】

アプリケーションサーバ４００は、例えば、いわゆるクラウドサービスを提供する事業者が運営するサーバである。アプリケーションサーバ４００は、アプリケーションサーバ４００全体を制御するＣＰＵ４１０と、ＲＯＭ、ＲＡＭ、ＨＤＤ、ＳＳＤ及び光ディスクドライブなどを含む記憶部４２０と、を備えている。アプリケーションサーバ４００は、さらに、インターネット８０と接続するためのネットワークＩＦ４８０を備えている。なお、図１では、アプリケーションサーバ４００は、概念的に１個のサーバとして図示されているが、互いに通信可能に接続された複数個のサーバを含む、いわゆるクラウドサーバであってもよい。

【0019】

記憶部４２０は、データ記憶領域４２２及び制御プログラム領域４２４を含んでいる。データ記憶領域４２２は、ＣＰＵ４１０が処理を行う際に必要なデータなどを記憶する記憶領域として、また、ＣＰＵ４１０が処理を行う際に生成される種々の中間データを一時的に格納するバッファ領域として機能する。データ記憶領域４２２には、複数個のテンプレートを含むテンプレート群４２２ａも記憶されている。制御プログラム領域４２４は、ＯＳ、情報処理プログラム、その他各種のアプリやファームウェアなどを記憶する領域である。情報処理プログラムには、音声解析プログラム４２４ａ及び印刷関連プログラム４２４ｂが含まれる。音声解析プログラム４２４ａは、例えば、アプリケーションサーバ４００の運営者によって、アプリケーションサーバ４００にアップロードされることによって提供される。印刷関連プログラム４２４ｂは、例えば、アプリケーションサーバ４００のリソースを利用して印刷サービスを提供する事業者、例えば、プリンタ２００を製造する事業者によって、アプリケーションサーバ４００にアップロードされることによって提供される。なお、音声解析プログラム４２４ａの全部または一部が、プリンタ２００を製造する事業者によって提供されてもよい。あるいは、印刷関連プログラム４２４ｂの全部または一部がアプリケーションサーバ４００を運営する事業者によって提供されてもよい。

【0020】

アプリケーションサーバ４００、特にＣＰＵ４１０は、音声解析プログラム４２４ａを実行することによって、音声解析処理部４２４ａ′（図２参照）として機能する。音声解析処理部４２４ａ′は、音声認識処理や形態素解析処理を実行する。音声認識処理は、音声データを解析して、音声データによって示される発話の内容を示すテキストデータを生成する処理である。形態素解析処理は、そのテキストデータを解析して、発話の内容に含まれる単語などの構成単位（形態素と呼ばれる）の抽出や、抽出された形態素の種別（例えば、品詞の種別）の特定を行う処理である。

【0021】

また、アプリケーションサーバ４００、特にＣＰＵ４１０は、印刷関連プログラム４２４ｂを実行することによって、印刷関連処理部４２４ｂ′（図２参照）として機能する。印刷関連処理部４２４ｂ′は、音声データを解析して得られるテキストデータを用いて、プリンタ２００に動作指示を行うコマンドを生成する処理などを実行する。

【0022】

図２は、画像形成システム１０００によって実行される印刷制御処理のシーケンスを示している。印刷制御処理は、スマートスピーカ３００とアプリケーションサーバ４００とが協働して、プリンタ２００に印刷を実行させる処理である。

【0023】

図２において、まずＳ２で、ユーザが発話する。ユーザは、アプリケーションサーバ４００に既に登録されているテンプレートを用いて印刷したいと思ったので、スマートスピーカ３００に対して、例えば「“名前”テンプレートで“田中太郎”を印刷して」と指示する。印刷制御処理は、スマートスピーカ３００がその発話された音声を検出した場合に、開始する。

【0024】

Ｓ４では、スマートスピーカ３００は、ユーザによって発話された音声を示す音声データを生成する。つまり、「“名前”テンプレートで“田中太郎”を印刷して」との音声がスマートスピーカ３００に入力されると、スマートスピーカ３００は、その音声を示す音声データを生成する。

【0025】

次に、Ｓ６では、スマートスピーカ３００は、その音声データと登録済みのユーザＩＤとをアプリケーションサーバ４００の音声解析処理部４２４ａ′に送信する。音声データの送信には、公知のプロトコル、例えば、ＨＴＴＰが用いられる。なお、スマートスピーカ３００には、ユーザの声紋が登録できるようになっており、スマートスピーカ３００は、入力された音声に基づいて声紋認識を行い、認識した声紋と登録されている声紋とが一致した場合に、ユーザＩＤを送信する。したがって、スマートスピーカ３００からユーザＩＤが送信されたときには、その前段階で既に、声紋認識はなされている。

【0026】

アプリケーションサーバ４００がその音声データとユーザＩＤとを受信すると、Ｓ８にて、アプリケーションサーバ４００の音声解析処理部４２４ａ′は、受信された音声データを解析する。具体的には、音声解析処理部４２４ａ′は、音声データに対して音声認識処理を実行し、音声データによって示される音声を示すテキストデータを生成する。例えば、「“名前”テンプレートで“田中太郎”を印刷して」との音声を示す音声データを受信した場合には、音声解析処理部４２４ａ′は、その音声の内容を示すテキストデータを生成する。音声解析処理部４２４ａ′は、さらに、そのテキストデータに対して形態素解析処理を実行する。これにより、生成されたテキストデータから、例えば、「“名前”テンプレート」、「“田中太郎”」、「印刷して」などの単語が抽出されるとともに、これらの単語の品詞種別（例えば、名詞、動詞）が特定される。音声解析処理部４２４ａ′は、形態素解析結果として、抽出された単語に品詞種別を対応付けたリストを生成する。

【0027】

次に、Ｓ１０では、音声解析処理部４２４ａ′は、生成されたテキストデータと、形態素解析結果と、スマートスピーカ３００から受信されたユーザＩＤと、を、印刷関連処理部４２４ｂ′に渡す。具体的には、音声解析処理部４２４ａ′は、例えば、データ記憶領域４２２内の所定領域にテキストデータと形態素解析結果とユーザＩＤとを格納して、印刷関連プログラム４２４ｂをコールする。

【0028】

音声解析処理部４２４ａ′からテキストデータと形態素解析結果とユーザＩＤとを受け取ると、Ｓ１２にて、印刷関連処理部４２４ｂ′は、テキストデータと形態素解析結果とを用いて、テンプレート読出処理を実行する。具体的には、印刷関連処理部４２４ｂ′は、“名前”という名称のテンプレートを上記テンプレート群４２２ａから検索する。図３（ａ）は、“名前”テンプレートＴ１の一例を示している。“名前”テンプレートＴ１は、テキストデータ入力ボックスＴ１１と、バックグラウンド画像Ｔ１２とによって構成されている。

【0029】

次に、Ｓ１４では、印刷関連処理部４２４ｂ′は、読み出した“名前”テンプレートＴ１のテキストデータ入力ボックスＴ１１に“田中太郎”を入力する。そして、印刷関連処理部４２４ｂ′は、Ｓ１６にて、“田中太郎”が入力された“名前”テンプレートＴ１を印刷用画像データに変換し、Ｓ１８にて、スマートスピーカ３００に送信する。

【0030】

Ｓ２０では、スマートスピーカ３００は、プリンタ２００に、受信した印刷用画像データと、その印刷指示を行う印刷指示コマンドを送信する。プリンタ２００は、印刷用画像データと印刷指示コマンドを受信し、Ｓ２２にて、印刷用画像データに基づいて印刷を実行する。図３（ｂ）は、“名前”テンプレートＴ１のテキストデータ入力ボックスＴ１１に“田中太郎”のテキストデータを入力して印刷した印刷画像Ｐ１の一例を示している。印刷画像Ｐ１は、バックグラウンド画像Ｐ１２内のテキストデータ入力ボックスＴ１１の領域内に“田中太郎”の文字列画像Ｐ１１が挿入されたものとなっている。このように、ユーザは、「“名前”テンプレートで“田中太郎”を印刷して」と発音するだけで、プリンタ２００に“田中太郎”の名前の入った印刷画像Ｐ１を印刷させることができる。

【0031】

図３（ｃ）は、“名刺”テンプレートＴ２の一例を示している。“名刺”テンプレートＴ２は、上記図３（ａ）の“名前”テンプレートＴ１に対して、複数個（図示例では、３個）のテキストデータ入力ボックスＴ２１～Ｔ２３を含んでいる点が異なっている。この３個のテキストデータ入力ボックスＴ２１～Ｔ２３に３種類のテキストデータを入力する場合、ユーザは、入力する文字列を区切りながら発音する。区切る方法としては、例えば、無音の発音区間を入れて、スマートスピーカ３００に区切りであることを知らせる方法が考えられる。

【0032】

そして、印刷関連処理部４２４ｂ′は、区切られた３種類の文字列を、テキストデータ入力ボックスＴ２１～Ｔ２３のうち、優先順位の早いものから順に入力して行く。具体的には、印刷関連処理部４２４ｂ′は、最初に発音された文字列、つまり会社名（例えば“ＡＢＣ株式会社”）を示す文字列をテキストデータ入力ボックスＴ２１に入力し、次に発音された文字列、つまり役職名（例えば“課長”）を示す文字列をテキストデータ入力ボックスＴ２２に入力し、最後に発音された文字列、つまり氏名（例えば“田中太郎”）を示す文字列をテキストデータ入力ボックスＴ２３に入力する。なお、優先順位は、予め固定的に決まっていてもよいし、予め決まっているものを後からユーザが変更できるようにしてもよい。

【0033】

図３（ｄ）は、図３（ｃ）の“名刺”テンプレートＴ２に基づいて印刷した印刷画像Ｐ２の一例を示している。印刷画像Ｐ２は、テキストデータ入力ボックスＴ２１の位置に“ＡＢＣ株式会社”の画像Ｐ２１が挿入され、テキストデータ入力ボックスＴ２２の位置に“課長”の画像Ｐ２２が挿入され、テキストデータ入力ボックスＴ２３の位置に“田中太郎”の画像Ｐ２３が挿入された画像になっている。

【0034】

各テンプレートには、“名前”テンプレートＴ１や“名刺”テンプレートＴ２のように、名称が付けられている。したがって、ユーザは、その名称を呼ぶだけで、使いたいテンプレートをアプリケーションサーバ４００のデータ記憶領域４２２から読み出して、印刷に使うことができる。テンプレートは、ユーザ自身が作成し、それをアプリケーションサーバ４００に登録するようにしてもよい。この場合、ユーザが、画像形成システム１０００に含まれない端末装置、例えばスマートフォンやＰＣ等を用いてテンプレートを作成した後、アプリケーションサーバ４００にアクセスし、登録するようにすればよい。

【0035】

また、“名刺”テンプレートＴ２のように、複数個のテキストデータ入力ボックスを含む場合、各テキストデータ入力ボックスに名称を付けることができるようにし、ユーザは、名称を呼んでテキストデータ入力ボックスを選択し、そのテキストデータ入力ボックスに発音した文字列を入力するようにしてもよい。これにより、ユーザは、入力したいテキストデータ入力ボックスを指定して、文字列を入力することができる。

【0036】

図４は、テンプレート毎に使用できるユーザが制限されている場合のテーブルデータ４２２ｂの一例を示している。図４には、“名前”テンプレートＴ１に属するテンプレートとして、テンプレートＡ～Ｆの６種類が例示されている。例えば、テンプレートＡは、ユーザＡとユーザＣは使用できるが、ユーザＢは使用できない。このようなテーブルデータ４２２ｂは、例えば、アプリケーションサーバ４００のデータ記憶領域４２２に記憶されている。

【0037】

このように、テンプレート毎にユーザが制限されている場合、アプリケーションサーバ４００の印刷関連処理部４２４ｂ′は、上記Ｓ１２で、テンプレートを読み出すとき、発話したユーザに使用が許可されているテンプレートのみを読み出す。上記Ｓ６では、スマートスピーカ３００は、アプリケーションサーバ４００に音声データと一緒にユーザＩＤも送信しているので、印刷関連処理部４２４ｂ′は、テーブルデータ４２２ｂを参照して、ユーザＩＤが示すユーザに許可されているテンプレートを読み出すことができる。なお、読み出しが指示されたテンプレートがそのユーザに使用が許可されておらず、テンプレートを読み出すことができない場合、アプリケーションサーバ４００は、指示されたテンプレートが使用が許可されていないテンプレートであることを知らせるための音声データを生成し、スマートスピーカ３００に送信することが好ましい。

【0038】

また、発話により文字列を入力する場合、ユーザの意図通りの文字列が入力されるとは限らない。例えば、かな漢字変換によって変換された漢字が、ユーザの意図通りの漢字ではない場合がある。この場合に、実際に印刷してみないと、ユーザの意図通りの漢字が入力されたかどうか分からないとすれば、印刷代や労力に無駄が生ずる。

【0039】

これに対処するために、スマートスピーカ３００が、上記Ｓ１８で、印刷用画像データを受信したとき、その印刷用画像データを上記表示部３４０にプレビュー表示させるようにすればよい。この場合、プレビュー表示された印刷用画像データが気に入らなければ、ユーザは、他の候補をプレビュー表示するように、スマートスピーカ３００に発話すればよい。

【0040】

この発話により、スマートスピーカ３００は、他の印刷用画像データを送信するようにアプリケーションサーバ４００に指示する。これに応じて、アプリケーションサーバ４００の印刷関連処理部４２４ｂ′は、前回の発話に含まれる発音文字列、つまり、かな漢字変換の「かな」に相当する文字列を他の漢字に変換して、テンプレートのテキストデータ入力ボックスに入力し、他の印刷用画像データを生成する。そして、印刷関連処理部４２４ｂ′は、生成した他の印刷用画像データをスマートスピーカ３００に送信する。

【0041】

スマートスピーカ３００は、受信した他の印刷用画像データを表示部３４０にプレビュー表示する。そして、プレビュー表示された印刷用画像データがユーザの意図通りのものになるまで、上記手順を繰り返す。

【0042】

以上説明したように、本実施形態のアプリケーションサーバ４００は、ネットワークＩＦ４８０と、テキストデータを入力するためのテキスト入力欄を１つ以上含むテンプレートを複数記憶する記憶部４２０と、ＣＰＵ４１０と、を備えている。ＣＰＵ４１０は、ネットワークＩＦ４８０を介して接続された、音声を入力及び出力するスマートスピーカから、プリンタ２００のユーザが発話することにより入力された音声の内容を認識し、認識された音声の内容が、テンプレートＴ１を指定し、かつそのテンプレートＴ１に含まれるテキストデータ入力ボックスＴ１１へ発音文字列を入力する内容である場合、記憶部４２０から指定されたテンプレートＴ１を読み出し、認識された音声の内容から、発音文字列に対応するテキストデータを抽出し、読み出されたテンプレートＴ１に含まれるテキストデータ入力ボックスＴ１１に、抽出されたテキストデータを入力し、テキストデータ入力ボックスＴ１１にテキストデータが入力されたテンプレートＴ１を印刷用画像データに変換し、変換された印刷用画像データをプリンタ２００に送信する。

【0043】

このように、本実施形態のアプリケーションサーバ４００では、例えば「“名前”テンプレートで“田中太郎”を印刷して」と発音するだけで、プリンタ２００に“田中太郎”の名前の入った印刷画像Ｐ１の印刷を指示することができるので、テキストデータ入力ボックスＴ１１を含むテンプレートＴ１に音声指示された文字列を簡便に入力して印刷することが可能となる。

【0044】

ちなみに、本実施形態において、アプリケーションサーバ４００は、「情報処理装置」の一例である。ネットワークＩＦ４８０は、「通信インタフェース」の一例である。記憶部４２０は、「記憶装置」の一例である。ＣＰＵ４１０は、「制御装置」の一例である。プリンタ２００は、「画像形成装置」の一例である。テキストデータ入力ボックスＴ１１は、「テキスト入力欄」の一例である。

【0045】

また、複数のテンプレートのそれぞれには、名前を付けることができ、テンプレートの指定は、テンプレートに付けられた名前を呼ぶことにより行う。これにより、テンプレートの指定をより簡便に行うことができる。

【0046】

また、複数のテンプレートのそれぞれには、そのテンプレートを使用できるユーザが指定され、ユーザのそれぞれには、声紋が登録されており、ＣＰＵ４１０は、入力された音声に基づいて声紋認識を行い、指定されたテンプレートが、認識された声紋を有するユーザに使用が許可されたテンプレートである場合、記憶部４２０から指定されたテンプレートを読み出す。これにより、指定されたテンプレートがユーザ自ら作成し、登録したテンプレートであって、他人に公開したくないテンプレートである場合、指定されたテンプレートは、そのユーザのみに使用が許可されるので、便利である。

【0047】

また、ＣＰＵ４１０は、指定されたテンプレートが、認識された声紋を有するユーザに使用が許可されたテンプレートでない場合、指定されたテンプレートの使用が許可されないテンプレートであることを発音する音声データを、ネットワークＩＦ４８０を介してスマートスピーカ３００に送信する。これにより、ユーザは指定されたテンプレートが読み出されない理由を音声によって知ることができるので、便利である。

【0048】

また、テキストデータ入力ボックスＴ２１～Ｔ２３が複数含まれるテンプレートについては、複数のテキストデータ入力ボックスＴ２１～Ｔ２３にそれぞれ名前を付けることができ、複数のテキストデータ入力ボックスＴ２１～Ｔ２３のそれぞれに発音文字列を入力する指示を行う場合、テキストデータ入力ボックスＴ２１～Ｔ２３の名前を呼ぶことで指示し、文字列を発音することでその文字列の入力を指示し、ＣＰＵ４１０は、読み出されたテンプレートに含まれる複数のテキストデータ入力ボックスＴ２１～Ｔ２３のうち、呼ばれた名前のテキストデータ入力ボックスに、入力を指示された文字列を示すテキストデータを入力する。これにより、ユーザは、入力したいテキストデータ入力ボックスを指定して、文字列を入力することができるので、便利である。

【0049】

また、ＣＰＵ４１０は、ネットワークＩＦ４８０を介して接続されたディスプレイに、変換された印刷用画像データをプレビュー表示し、プレビュー表示に対して、ユーザが他の候補をプレビュー表示する指示を発音した場合、発音文字列に対応する他の候補のテキストデータを抽出し、読み出されたテンプレートに含まれるテキストデータ入力ボックスＴ１１に、抽出された他の候補のテキストデータを入力する。これにより、印刷用画像データに基づいて実際に印刷する前に、ユーザはその印刷用画像データが意図通りのものであるか否かを確認できるので、印刷代や労力を省くことができる。

【0050】

なお、本発明は上記実施形態に限定されるものでなく、その趣旨を逸脱しない範囲で様々な変更が可能である。

【0051】

（１）上記実施形態では、音声データを解析する処理は、アプリケーションサーバ４００の音声解析処理部４２４ａ′が実行している。これに代えて、音声データを解析する処理の一部または全部は、スマートスピーカ３００が実行してもよい。また、音声データを解析する処理の一部または全部は、印刷関連処理部４２４ｂ′が実行してもよい。例えば、音声解析処理部４２４ａ′は、音声認識処理を行ってテキストデータを生成する処理だけを行い、単語を抽出する形態素解析処理は、印刷関連処理部４２４ｂ′が実行してもよい。また、印刷関連処理部４２４ｂ′の処理の一部または全部は、スマートスピーカ３００が実行してもよいし、プリンタ２００が実行してもよい。

【0052】

（２）上記実施形態では、画像形成装置として、プリンタ２００を採用したが、これに限らず、印刷機能にスキャン機能やファックス機能を加えた複合機を採用してもよい。この場合には、例えば、スマートスピーカ３００に入力される音声に応じて、その複合機に印刷を行わせることができる。

【0053】

（３）アプリケーションサーバ４００は、クラウドサーバであるが、ＬＡＮ７０に接続され、インターネット８０に接続されないローカルサーバであってもよい。この場合には、スマートスピーカ３００からアプリケーションサーバ４００にユーザＩＤなどの識別情報を送信せず、音声データだけを送信してもよい。

【0054】

（４）スマートスピーカ３００とプリンタ２００とを接続するインタフェースは、ブルートゥースＩＦ１６０に限らず、例えば、ＵＳＢなどの有線インタフェースであってもよいし、ＮＦＣ（Near field communicationの略）などの他の無線インタフェースであってもよい。

【0055】

（５）上記実施形態において、ハードウェアによって実現されていた構成の一部をソフトウェアに置き換えるようにしてもよく、逆に、ソフトウェアによって実現されていた構成の一部をハードウェアに置き換えるようにしてもよい。

【符号の説明】

【0056】

５０…アクセスポイント、７０…ＬＡＮ、８０…インターネット、２００…プリンタ、２１０…制御部、２５０…印刷機構、２６０，３６０…ブルートゥースＩＦ、３００…スマートスピーカ、３１０…制御部、３４０…表示部、３５０…音声入出力部、３８０…無線ＬＡＮＩＦ、４００…アプリケーションサーバ、４１０…ＣＰＵ、４２０…記憶部、４２４ａ…音声解析プログラム、４２４ｂ…印刷関連プログラム、４２４ｂ′…印刷関連処理部、４２４ａ′…音声解析処理部、４８０…ネットワークＩＦ、１０００…画像形成システム。

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版