(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-01
(45)【発行日】2024-11-12
(54)【発明の名称】情報処理装置、情報処理システム、制御方法、並びにプログラム
(51)【国際特許分類】
G06F 3/16 20060101AFI20241105BHJP
G10L 15/22 20060101ALI20241105BHJP
G03G 21/00 20060101ALI20241105BHJP
B41J 29/38 20060101ALI20241105BHJP
【FI】
G06F3/16 540
G10L15/22 200V
G06F3/16 610
G03G21/00 390
B41J29/38
(21)【出願番号】P 2020106388
(22)【出願日】2020-06-19
【審査請求日】2023-06-06
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】100125254
【氏名又は名称】別役 重尚
(72)【発明者】
【氏名】笠原 良介
【審査官】田川 泰宏
(56)【参考文献】
【文献】特開2011-014996(JP,A)
【文献】特開2006-065520(JP,A)
【文献】特開2019-096295(JP,A)
【文献】特開2014-215927(JP,A)
【文献】米国特許出願公開第2020/0177746(US,A1)
【文献】特開2019-200472(JP,A)
【文献】特開2018-047643(JP,A)
【文献】特開2015-079432(JP,A)
【文献】特開2020-087377(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/16
G10L 15/22
G03G 21/00
B41J 29/38
(57)【特許請求の範囲】
【請求項1】
スマートスピーカと連携する情報処理装置であって、
ユーザの識別情報を取得する第1の取得手段と、
前記取得した識別情報に紐づく言語情報と、国情報と、を取得する第2の取得手段と、
前記取得した言語情報から1つの言語を特定し、特定された前記言語のうち前記国情報に対応する前記言語を特定する特定手段と、
前記スマートスピーカの音声設定を前記特定手段により特定された前記国情報に対応する前記言語に設定するよう前記スマートスピーカに対し要求する要求手段と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記音声設定には、音量設定が少なくとも含まれることを特徴とする請求項1記載の情報処理装置。
【請求項3】
ユーザが操作可能な操作パネルをさらに有し、
前記第2の取得手段が取得した前記言語情報に基づいて、前記操作パネルに表示される言語を変更する、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記第1の取得手段は、前記ユーザの識別情報を近距離無線通信によって取得する、ことを特徴とする請求項1乃至3の何れか一項に記載の情報処理装置。
【請求項5】
情報処理装置と、スマートスピーカと、スマートスピーカの設定を管理するサーバとが連携する情報処理システムであって、
前記情報処理装置は、
ユーザの識別情報を取得する第1の取得手段と、
前記取得した識別情報に紐づく言語情報と、国情報と、を取得する第2の取得手段と、
前記取得した言語情報から1つの言語を特定し、特定された前記言語のうち前記国情報に対応する前記言語を特定する特定手段と、
前記スマートスピーカの音声設定を前記特定手段により特定された前記国情報に対応する前記言語に設定するよう前記サーバに要求する第1の要求手段とを備え、
前記サーバは、
前記第1の要求手段による要求に基づいて前記スマートスピーカに対し音声設定の変更を要求する第2の要求手段を備え、
前記スマートスピーカは、
前記第2の要求手段による要求に基づいて自機の音声設定を変更する変更手段を備えることを特徴とする情報処理システム。
【請求項6】
スマートスピーカと連携する情報処理装置の制御方法であって、
ユーザの識別情報を取得する第1の取得ステップと、
前記取得した識別情報に紐づく言語情報と、国情報と、を取得する第2の取得ステップと、
前記取得した言語情報から1つの言語を特定し、特定された前記言語のうち前記国情報に対応する前記言語を特定する特定ステップと、
前記スマートスピーカの音声設定を前記特定ステップにおいて特定された前記国情報に対応する前記言語に設定するよう前記スマートスピーカに対し要求する要求ステップと、
を有することを特徴とする制御方法。
【請求項7】
情報処理装置と、スマートスピーカと、スマートスピーカの設定を管理するサーバとが連携する情報処理システムの制御方法であって、
前記情報処理装置において、
ユーザの識別情報を取得する第1の取得ステップと、
前記取得した識別情報に紐づく言語情報と、国情報と、を取得する第2の取得ステップと、
前記取得した言語情報から1つの言語を特定し、特定された前記言語のうち前記国情報に対応する前記言語を特定する特定ステップと、
前記スマートスピーカの音声設定を前記特定ステップにおいて特定された前記国情報に対応する前記言語に設定するよう前記サーバに要求する第1の要求ステップとを実行し、
前記サーバにおいて、
前記第1の要求ステップにおける要求に基づいて前記スマートスピーカに対し音声設定の変更を要求する第2の要求ステップを実行し、
前記スマートスピーカにおいて、
前記第2の要求ステップにおける要求に基づいて自機の音声設定を変更する変更ステップを実行することを特徴とする制御方法。
【請求項8】
請求項
6又は
7記載の制御方法を実行することを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム、制御方法、並びにプログラムに関し、特に、音声による操作が可能なスマートスピーカと連携する情報処理装置、これらを含む情報処理システム、制御方法、並びにプログラムに関する。
【背景技術】
【0002】
スマートスピーカと連携するプリンタ等の事務機器が普及してきている(例えば、特許文献1参照)。
【0003】
このようなスマートスピーカを快適に使いこなすには、スマートスピーカの設定を適切に調節することが望ましい。その一方、これと連携する事務機器は、オフィス内に置かれる場合、様々なユーザによって利用される。そのため、連携機能を利用するユーザによって、スマートスピーカの快適な操作環境は人によって異なる。例えば、ユーザがスマートスピーカに発話する際の言語、およびスマートスピーカがユーザに対する発話に用いるべき言語は、ユーザによって異なる。そのため、利用ユーザ毎に適切にスマートスピーカの設定をおこなうことが望ましい。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、異なるユーザがスマートスピーカの利用を開始する毎に、そのユーザの指示で設定を変更するのは手間である。
【0006】
そこで、本発明の目的は、ユーザにとって聞き取りやすいスマートスピーカの音声設定とすることができる情報処理装置、情報処理システム、制御方法、並びにプログラムを提供することである。
【課題を解決するための手段】
【0007】
本発明の請求項1に係る情報処理装置は、スマートスピーカと連携する情報処理装置であって、ユーザの識別情報を取得する第1の取得手段と、前記取得した識別情報に紐づく言語情報と、国情報と、を取得する第2の取得手段と、前記取得した言語情報から1つの言語を特定し、特定された前記言語のうち前記国情報に対応する前記言語を特定する特定手段と、前記スマートスピーカの音声設定を前記特定手段により特定された前記国情報に対応する前記言語に設定するよう前記スマートスピーカに対し要求する要求手段と、を備えることを特徴とする。
【0008】
本発明の請求項5に係る情報処理システムは、情報処理装置と、スマートスピーカと、スマートスピーカの設定を管理するサーバとが連携する情報処理システムであって、前記情報処理装置は、ユーザの識別情報を取得する第1の取得手段と、前記取得した識別情報に紐づく言語情報と、国情報と、を取得する第2の取得手段と、前記取得した言語情報から1つの言語を特定し、特定された前記言語のうち前記国情報に対応する前記言語を特定する特定手段と、前記スマートスピーカの音声設定を前記特定手段により特定された前記国情報に対応する前記言語に設定するよう前記サーバに要求する第1の要求手段とを備え、前記サーバは、前記第1の要求手段による要求に基づいて前記スマートスピーカに対し音声設定の変更を要求する第2の要求手段を備え、前記スマートスピーカは、前記第2の要求手段による要求に基づいて自機の音声設定を変更する変更手段を備えることを特徴とする。
【発明の効果】
【0009】
本発明によれば、ユーザにとって聞き取りやすいスマートスピーカの音声設定とすることができる。
【図面の簡単な説明】
【0010】
【
図1】本発明の実施形態に係る情報処理システム全体構成の一例を示す図である。
【
図2】
図1におけるMFPのハードウェアの概略構成例を示すブロック図である。
【
図3】
図1におけるスマートスピーカのハードウェアの概略構成例を示すブロック図である。
【
図4】
図1におけるクラウドサーバのコントローラ部のハードウェアの概略構成例を示すブロック図である。
【
図5】MFPのデバイス制御プログラムの機能構成を示すブロック図である。
【
図6】スマートスピーカの音声デバイス制御プログラムの機能構成を示すブロック図である。
【
図7】クラウドサーバの音声データ変換制御プログラムの機能構成を示すブロック図である。
【
図8】情報処理システムにおいて実行される実施例1に係るユーザログイン時の制御シーケンスである。
【
図9】
図8のステップS801~S803においてMFPが実行する、ログイン実行時処理のフローチャートである。
【
図10】
図9のステップS905においてMFPが実行する、ロケール情報取得処理のフローチャートである。
【
図11】
図9のステップS906においてMFPが実行する、音量設定情報取得処理のフローチャートである。
【
図12】
図8のステップS804においてクラウドサーバが実行する、音声デバイス制御設定変更処理のフローチャートである。
【
図13】
図8のステップS805においてスマートスピーカが実行する、音声制御設定変更処理のフローチャートである。
【
図14】情報処理システムにおいて実行される実施例2に係るユーザログイン時の制御シーケンスである。
【
図15】情報処理システムにおいて実行される実施例2に係るジョブ実行時の制御シーケンスである。
【
図16】
図14のステップS1401~S1403においてMFPが実行する、ログイン実行時処理のフローチャートである。
【
図17】
図14のステップS1404においてクラウドサーバが実行する、利用可能ジョブ種変更処理のフローチャートである。
【
図18】
図15のステップS1506においてクラウドサーバが実行するジョブ実行処理の一部である、ジョブ投入処理のフローチャートである。
【
図19】MFPにおいてユーザ認証が成功した場合に実行される、ステップS910での操作パネルのホーム画面の表示切替を示す図である。
【
図20】MFP内で保持されるログインユーザ情報テーブルを示す図である。
【
図21】MFP内で保持される国設定テーブル、ロケールコードテーブル、ロケールコードルックアップテーブル、音量設定テーブル、及び音量設定ルックアップテーブルを示す図である。
【
図22】MFPからクラウドサーバに送信される音声制御情報の例を示す図である。
【
図23】クラウドサーバからスマートスピーカに送信される音声デバイス制御情報の例を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明の実施形態について図面を用いて説明する。
【0012】
<全体構成>
図1は、本発明の実施形態に係る情報処理システム100の全体構成の一例を示す図である。
【0013】
図1において、情報処理システム100は、情報処理装置として、プリントやスキャン機能を有する複合機(以下、MFPという)101、音声制御装置としてスマートスピーカ102、及びクラウドサーバ103を含む。MFP101及びスマートスピーカ102は、ネットワーク104を介して通信可能である。また、クラウドサーバ103は、ゲートウェイ105及びネットワーク104を介して、MFP101及びスマートスピーカ102と通信可能である。
【0014】
情報処理システム100において、クラウドサーバ103は、例えば「ジョブ実行」「ジョブ設定」といったスマートスピーカ102からMFP101を操作するためのサービスを保持する。また、クラウドサーバ103は、スマートスピーカ102からネットワーク104を介して所定の音声データを受信する。
【0015】
クラウドサーバ103は音声データを受信すると、音声データに対応したサービスを実行し、ネットワーク104を介してそのサービスが生成したデバイス操作データをMFP101に送信する。
【0016】
MFP101はクラウドサーバ103よりデバイス操作データを受信すると、デバイス操作データに対応した処理を実行する。MFP101は、ネットワーク104を介してクラウドサーバ103に実行した処理の応答を送信する。
【0017】
クラウドサーバ103はMFP101より実行した処理の応答を受信すると、応答メッセージデータを生成してネットワーク104を介してスマートスピーカ102に送信する。
【0018】
スマートスピーカ102はクラウドサーバ103より応答メッセージデータを受信すると、応答メッセージデータに対応した音声を発声する。
【0019】
MFP101は、MFP他装置データ107及びMFP自装置データ106等の情報を保持する。
【0020】
MFP他装置データ107は、サービスを利用するユーザのアカウント情報や、各サービスの結果をクラウドサーバ103に通知するための応答通知用URL情報等から成る。
【0021】
MFP自装置データ106は、MFP101にネットワーク経由でアクセスするためのIPアドレスやMACアドレス等から成る。
【0022】
スマートスピーカ102は、スマートスピーカ他装置データ109及びスマートスピーカ自装置データ108等の情報を保持する。
【0023】
スマートスピーカ他装置データ109は、サービスを利用するアカウント情報、サービス起動ワード、サービス起動ワードに対応するクラウドサーバ103のサービスURL等から成る。
【0024】
スマートスピーカ自装置データ108は、スマートスピーカ102にネットワーク経由でアクセスするためのIPアドレスやMACアドレス等から成る。
【0025】
クラウドサーバ103は、MFP101、スマートスピーカ102がサービスをネットワーク経由でクラウドサーバ103のサービスを利用するためのサービスURL情報を保持する。
【0026】
クラウドサーバ103は、クラウドサーバ自装置データ110及びクラウドサーバ他装置データ111等の情報を保持する。
【0027】
クラウドサーバ自装置データ110は、MFP101が各サービスの結果をクラウドサーバ103に通知するための応答通知用URL情報から成る。
【0028】
クラウドサーバ他装置データ111は、サービスを利用するユーザのアカウント、情報処理システム100において利用するMFP101、スマートスピーカ102のIPアドレス及びMACアドレス等から成る。
【0029】
クラウドサーバ103は、クラウドサーバ他装置データ111に保持されているIPアドレス、MACアドレスを利用してMFP101、スマートスピーカ102と通信を行う。
【0030】
ネットワーク104は、スマートスピーカ102で取得した音声データを、クラウドサーバ103へ送信する。また、ネットワーク104は、クラウドサーバ103からスマートスピーカ102に各種データを送信し、クラウドサーバ103からプリントジョブやスキャンジョブなどの各種データを送受信する。
【0031】
ゲートウェイ105は、例えば、IEEE802.11規格シリーズに準拠した無線LANルータなどである。ただし、他の無線通信方式に従って動作する能力を有してもよい。また、無線LANルータではなく、10BASE-T、100BASE-T、1200BASE-Tなどに代表されるEthernet規格に準拠した有線LANルータなどであってもよく、他の有線通信方式に従って動作する能力を有してもよい。尚、前記IEEE802.11規格シリーズとは、IEEE802.11aやIEEE802.11b等のように、IEEE802.11に属する一連の規格を含む。
【0032】
尚、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
【0033】
<MFPの構成>
図2は、MFP101のハードウェアの概略構成例を示すブロック図である。
【0034】
図2において、MFP101は、コントローラ部200、これに接続する操作パネル209、プリントエンジン211、スキャナ213、及びカードリーダ214を備える。
【0035】
コントローラ部200は、CPU202、RAM203、ROM204、ストレージ205、ネットワークI/F206、ディスプレイコントローラ207、操作I/F208、プリントコントローラ210、及びスキャンコントローラ212を備える。各構成は、システムバス201に接続されており、互いに通信可能である。
【0036】
CPU202は、MFP101全体の動作を制御する。CPU202は、ROM204またはストレージ205に記憶された制御プログラムを読み出して、読取制御や印刷制御などの各種制御を行う。
【0037】
RAM203は、揮発性メモリであり、CPU202の主記憶メモリ及びワークエリアや、ROM204に記憶された各種制御プログラムを展開するための一時記憶領域として用いられる。
【0038】
ROM204は、不揮発性メモリであり、CPU202で実行可能な制御プログラムを記憶する。
【0039】
ストレージ205は、RAM203と比較して大容量な記憶デバイス(例えばハードディスクドライブ:HDD)であり、印刷データ、画像データ、各種プログラム、及び各種設定情報(MFP他装置データ107及びMFP自装置データ106等)を記憶する。尚、ストレージ205はソリッドステートドライブ(SSD)などでもよく、ハードディスクドライブと同等の機能を有する他の記憶装置に置き換えてもよい。
【0040】
尚、本実施形態のMFP101では、1つのCPU202が1つのメモリ(RAM203)を用いて後述するフローチャートに示す各処理を実行するものとするが、他の様態であっても構わない。例えば複数のCPU、RAM、ROM、及びストレージを協働させて後述するフローチャートに示す各処理を実行することもできる。また、ASIC(Application Specific Integrated Circuit)やFPGA(Field-Programmable Gate Array)等のハードウェア回路を用いて一部の処理を実行するようにしてもよい。
【0041】
ネットワークI/F206は、ネットワーク104を介してMFP101を外部の装置と通信させるためのインタフェースである。また、MFP101は、ネットワークI/F206を介して受信した印刷データを、ストレージ205又はROM204に記憶された印刷データを解析するためのソフトウェアモジュール(PDL解析部、不図示)によって解析する。PDL解析部は、様々な種類のページ記述言語(Page Description Language)で表現された印刷データに基づいてプリントエンジン211で印刷するためのデータを生成する。
【0042】
ディスプレイコントローラ207は、操作パネル209とカードリーダ214と接続される。操作I/F208によって制御された画面を操作パネル209に表示し、ユーザが操作パネル209を操作すると、CPU202はディスプレイコントローラ207を介してユーザ操作に対応したイベントを取得する。
【0043】
操作パネル209は、タッチパネルにより構成され、操作I/F208によって制御された画面を表示すると共に、その画面へのユーザ入力を検知する。
【0044】
プリントコントローラ210は、プリントエンジン211と接続される。印刷すべき画像データはプリントコントローラ210を介してプリントエンジン211に転送される。プリントエンジン211は制御コマンド及び印刷すべき画像データを受信し、この画像データに基づいた画像をシート上に形成する。プリントエンジン211の印刷方式は、電子写真方式であってもよいし、インクジェット方式であってもよい。電子写真方式の場合は、感光体上に静電潜像を形成した後トナーにより現像し、そのトナー像をシートに転写し、転写されたトナー像を定着することにより画像を形成する。一方、インクジェット方式の場合は、インクを吐出してシートに画像を形成する。
【0045】
スキャンコントローラ212は、スキャナ213と接続される。スキャナ213はシート上の画像を読み取って、画像データを生成する。スキャナ213によって生成された画像データはストレージ205に記憶される。また、MFP101では、スキャナ213により生成された画像データをプリントエンジン211に転送することでシート上に画像を形成することができる。スキャナ213は、原稿フィーダ(不図示)を有しており、原稿フィーダに載置されたシートを1枚ずつ搬送させながら読み取ることが可能である。
【0046】
カードリーダ214は、ユーザによりその近傍にスマートカードが近づけられた際、スマートカードから情報を読み取ってユーザ認証を行う。カードリーダ214でユーザ認証が成功すると、ユーザはMFP101においてコピー、プリント、スキャンといった複数の機能を利用することが可能となる。
【0047】
<スマートスピーカの構成>
図3は、スマートスピーカ102のハードウェア構成例を示すブロック図である。
【0048】
図3において、スマートスピーカ102は、コントローラ部300と、これに付随するデバイスとして、音声入力デバイスとしてのマイクロフォン308、音声出力デバイスとしてのスピーカ310、及び通知デバイスとしてのLED312とを備える。
【0049】
コントローラ部300は、CPU302、RAM303、ROM304、ストレージ305、ネットワークI/F306、マイクI/F307、オーディオコントローラ309、および表示コントローラ311を含む。各構成は、システムバス301に接続されており、互いに通信可能である。
【0050】
CPU302はコントローラ部300全体の動作を制御する中央演算装置である。
【0051】
RAM303は、揮発性メモリであり、CPU302の主記憶メモリ及びワークエリアや、ストレージ305に記憶された各種制御プログラムを展開するための一時記憶領域として用いられる。
【0052】
ROM304は、不揮発性メモリであり、CPU302の起動用プログラムが格納されている。
【0053】
ストレージ305は、RAM303と比較して大容量な記憶デバイス(例えばSDカード)である。ストレージ305にはコントローラ部300が実行する、スマートスピーカ102の制御用プログラムが格納されている。尚、ストレージ305はSDカード以外のフラッシュROMなどに置き換えてもよく、SDカードと同等の機能を有する他の記憶デバイスに置き換えてもよい。
【0054】
CPU302は電源ON等の起動時、ROM304に格納されている起動用プログラムを実行する。この起動用プログラムを実行することにより、CPU302は、ストレージ305に格納されている制御用プログラムを読み出し、RAM303上に展開する。CPU302は起動用プログラムを実行すると、続けてRAM303上に展開した制御用プログラムを実行し、制御を行う。また、CPU302は制御用プログラム実行時に用いるデータもRAM303上に格納して読み書きを行う。ストレージ305上にはさらに、制御用プログラム実行時に必要な各種設定などを格納することができ、CPU302によって読み書きされる。
【0055】
ネットワークI/F306は、ネットワーク104を介してスマートスピーカ102を外部の装置と通信させるためのインタフェースである。ネットワークI/F306は、IEEE802.11規格シリーズに準拠した無線通信方式に従って通信を行うための回路やアンテナを含んで構成される。ただし、無線通信方式でなくEthernet規格に準拠した有線通信方式であってもよく、無線通信方式に限定するものではない。
【0056】
マイクI/F307は、マイクロフォン308に接続され、マイクロフォン308から入力されたユーザが発した音声を、符号化された音声データに変換し、CPU302の指示に応じてRAM303に保持する。
【0057】
マイクロフォン308は、本実施形態においては、スマートフォンなどに搭載される小型のMEMSマイクロフォンであるが、ユーザの音声を取得できるものであれば他のデバイスに置き換えてもよい。また、マイクロフォン308は、ユーザが発した音声の到来方向を算出できるように、3個以上を所定の位置に配して用いることが好ましい。ただし、マイクロフォン308が1個であっても本実施形態に係る情報処理システム100は実現でき、3個以上にこだわるものではない。
【0058】
オーディオコントローラ309は、スピーカ310に接続され、CPU302の指示に応じて音声データをアナログ音声信号に変換し、スピーカ310を通じて音声を出力する。
【0059】
スピーカ310は、ユーザが発した音声に対してスマートスピーカ102が応答していることを示す応答音、及び、クラウドサーバ103によって合成された音声を再生する。スピーカ310は音声を再生するための汎用のデバイスである。
【0060】
表示コントローラ311は、LED312に接続され、CPU302の指示に応じてLED312の表示を制御する。ここでは、表示コントローラ311は、スマートスピーカ102がユーザの音声を正しく入力していることを示すためのLED312の点灯制御を主に行う。LED312は、例えば、ユーザが可視可能な青色などのLEDである。LED312は汎用のデバイスである。尚、スマートスピーカ102において、LED312の代わりに、文字や絵を表示可能なディスプレイ装置を用いてもよい。
【0061】
<クラウドサーバのハードウェア構成>
図4は、クラウドサーバ103のコントローラ部400のハードウェアの概略構成例を示すブロック図である。
【0062】
図4に示すように、コントローラ部400は、CPU402、RAM403、ROM404、ストレージ405、ネットワークI/F406を含む。各構成は、システムバス401に接続されており、互いに通信可能である。
【0063】
CPU402は、コントローラ部400全体の動作を制御する中央演算装置である。
【0064】
RAM403は、揮発性メモリである。
【0065】
ROM404は、不揮発性メモリであり、CPU402の起動用プログラムが格納されている。
【0066】
ストレージ405は、RAM403と比較して大容量な記憶装置(例えばハードディスクドライブ:HDD)である。ストレージ405にはコントローラ部400が実行する、クラウドサーバ103の制御用プログラムが格納されている。尚、ストレージ405はソリッドステートドライブ(SSD)などでもよく、ハードディスクドライブと同等の機能を有する他の記憶装置に置き換えてもよい。
【0067】
CPU402は電源ON等の起動時、ROM404に格納されている起動用プログラムを実行する。この起動用プログラムを実行することにより、CPU402は、ストレージ405に格納されている制御用プログラムを読み出し、RAM403上に展開する。CPU402は起動用プログラムを実行すると、続けてRAM403上に展開した制御用プログラムを実行し、制御を行う。また、CPU402は制御用プログラム実行時に用いるデータもRAM403上に格納して読み書きを行う。ストレージ405上にはさらに、制御用プログラム実行時に必要な各種設定を格納することができ、CPU402によって読み書きされる。
【0068】
ネットワークI/F406は、ネットワーク104を介してクラウドサーバ103を外部の装置と通信させるためのインタフェースである。
【0069】
<MFPのデバイス制御プログラムの機能構成>
図5は、MFP101のデバイス制御プログラム500の機能構成を示すブロック図である。
【0070】
デバイス制御プログラム500は、前述したROM204に格納される制御プログラムの1つであり、CPU202がその起動時にRAM203上に展開して実行する。
【0071】
図5に示すように、デバイス制御プログラム500は、データ送受信部501、データ解析部502、ジョブ制御部503、データ管理部504、表示部505、操作対象判定部506、スキャン部507、及びプリンタ部508を備える。
【0072】
データ送受信部501は、ネットワークI/F206を介して、ネットワーク104に直接又は間接的に接続するスマートスピーカ102及びクラウドサーバ103とTCP/IPによるデータの送受信を行う。データ送受信部501は、クラウドサーバ103が生成するデバイス操作データを受信する。また、データ送受信部501は、ジョブ実行結果、デバイス操作結果の応答の画面表示内容が更新されたことを示す画面更新通知、及び、ジョブの状態を示すジョブ実行状態通知をクラウドサーバ103へ送信する。画面更新通知やジョブ実行状態通知の内容に関しては
図8、
図14のシーケンスを用いて後述する。
【0073】
データ解析部502は、データ送受信部501が受信したデバイス操作データや操作対象判定部506から受信したジョブパラメータ及びジョブ開始指示をデバイス制御プログラム500内の各モジュールが通信するコマンドに変換する。その後、データ解析部502は、その変換後のコマンドをジョブ制御部503、データ管理部504、及び表示部505のうちの少なくとも1つの対応するデバイスに送信する。
【0074】
ジョブ制御部503は、プリンタ部508に対し、プリントコントローラ210を介したプリントエンジン211の制御指示を行うと共に、スキャン部507に対し、スキャンコントローラ212を介したスキャナ213の制御指示を行う。例えば、表示部505が操作パネル209にコピー機能画面を表示中に、操作対象判定部506がその画面中のスタートキーの押下を検知した場合、データ解析部502は操作対象判定部506からコピージョブのジョブパラメータとジョブ開始指示を受信する。データ解析部502は、受信したジョブパラメータからスキャンジョブパラメータを含むスキャンコマンド及びプリンタジョブパラメータを含むプリントコマンドを生成する。その後、データ解析部502は、生成したスキャンコマンドをスキャン部507へ送信し、プリントコマンドをプリンタ部508へ送信する。これにより、スキャナ213によって読取られた画像データをプリントエンジン211でシートに印刷するよう制御する。尚、スキャン、及び、プリント制御の仕組みについては、主旨ではないため、これ以上の説明は割愛する。
【0075】
データ管理部504は、デバイス制御プログラム500の実行において生成した作業データや、各デバイス制御に必要な設定パラメータ(MFP設定情報)など様々なデータをRAM203およびストレージ205上の所定の領域へ保存し、管理する。例えば、後述するジョブ制御部503で生成する各種ジョブのパラメータ設定項目及びその設定値の組み合わせから成るジョブデータや、操作パネル209に表示する言語の情報である表示言語設定情報などがデータ管理部504で保存・管理される。また、データ管理部504は、ゲートウェイ105との通信に必要な認証情報、クラウドサーバ103と通信するために必要なデバイス情報などを保存し、管理する。データ管理部504は、また、MFP101で画像形成する対象の画像データを保存し、管理する。また、データ管理部504は、表示部505が画面表示制御に用いる画面制御情報と、操作対象判定部506が操作対象を判定するために用いる操作対象判定情報とを、表示部505が表示制御する操作パネル209の画面ごとに管理する。
【0076】
さらに、データ管理部504は、ログインユーザ情報テーブル2001及びユーザログインフラグを保持し管理する。ここで、ログインユーザ情報テーブル2001は、
図20に示すように、ユーザの識別ID(識別情報)、ユーザ名、ユーザの使用言語情報、及びユーザの利用機能制限情報が含まれるユーザ毎のレコード情報のリストからなる。尚、ログインユーザ情報テーブル2001には、ユーザ毎にスマートスピーカ102の喋るスピード(早い~遅い)、性別(男性、女性、無性)、音声の高低(高い~低い)、キャラクター(子供、老人、ロボット)等のスマートスピーカ情報を含んでもよい。またデータ管理部504は、
図21の国設定テーブル2101、ロケールコードテーブル2102、ロケールコードルックアップテーブル2103も保持し、管理する。尚、国設定テーブル2101は、その中の1つの国が選択された状態でRAM203に保存される。
【0077】
また、データ管理部504は、音量設定テーブル2104及び音量設定ルックアップテーブル2105をRAM203に保持し、管理する。
【0078】
表示部505は、ディスプレイコントローラ207を介して、操作パネル209の制御を行う。より具体的には、ユーザが操作可能なUI部品(ボタン、プルダウンリスト、チェックボックスなど)を操作パネル209に表示する。表示部505は、操作パネル209の画面をデータ管理部504に保存されている画面表示制御情報及び言語設定に基づいて更新する。具体的には、この画面更新の際、データ管理部504に保存されている言語設定に対応する言語辞書をストレージ205から取得し、その言語辞書を元にしたテキストデータからなる画面に操作パネル209の画面が更新される。
【0079】
操作対象判定部506は、操作I/F208を介して、操作パネル209上のタッチされた座標を取得し、その座標に位置するUI部品をユーザが現在操作している対象として判定する。また、ユーザの持つスマートカードがカードリーダ214の通信可能エリア内に入った場合、そのスマートカードをユーザが現在操作している対象として判定する。
【0080】
さらに、操作対象判定部506は、操作対象として判定したUI部品に対応する画面表示制御情報を読み出し、当該情報に基づいて操作受付時の処理内容を決定する。例えば、操作対象判定部506は、表示部505に対して操作パネル209の画面の表示内容の更新指示を出したり、ユーザ操作により設定されたジョブのパラメータおよび当該ジョブの開始指示をデータ解析部502に送信したりする。
【0081】
スキャン部507は、ジョブ制御部503から送信されたスキャンジョブパラメータ設定に基づいて、スキャンコントローラ212を介してスキャナ213でスキャンを実行し、読み取った画像データをデータ管理部504に保存する。
【0082】
プリンタ部508は、ジョブ制御部503から送信されたプリントジョブパラメータ設定に基づいて、プリントコントローラ210を介してプリントエンジン211で印刷を実行する。
【0083】
<スマートスピーカの音声デバイス制御プログラムの機能構成>
図6は、スマートスピーカ102の音声デバイス制御プログラム600の機能構成を示すブロック図である。
【0084】
音声デバイス制御プログラム600は、前述したストレージ305に格納される制御プログラムの1つであり、CPU302がスマートスピーカ102の起動時にRAM303上に展開して実行する。
【0085】
図6に示すように、音声デバイス制御プログラム600は、データ送受信部601、データ管理部602、音声制御部603、音声取得部604、音声再生部605、表示部606、音声操作開始検知部607、及び発話終了判定部608を備える。
【0086】
データ送受信部601は、ネットワークI/F306を介して、ネットワーク104に直接又は間接的に接続するMFP101及びクラウドサーバ103とTCP/IPによるデータの送受信を行う。データ送受信部601は、音声取得部604で取得されたユーザの発した音声データをクラウドサーバ103に送信し、また、ユーザへの応答となる、クラウドサーバ103上で生成される音声合成データをクラウドサーバ103から受信する。
【0087】
データ管理部602は、音声デバイス制御プログラム600の実行において生成した作業データなど様々なデータをストレージ305上の所定の領域へ保存し、管理する。ここでデータ管理部602で保存・管理されるデータには、音声再生部605で再生する音声の音量設定データや、ゲートウェイ105との通信に必要な認証情報が含まれる。さらにデータ管理部602は、MFP101、及び、クラウドサーバ103と通信するために必要な各デバイス情報などを保存し、管理する。
【0088】
音声取得部604は、マイクロフォン308で取得されるスマートスピーカ102の近辺にいるユーザのアナログ音声を、音声データに変換した後、RAM303上に一時保存する。音声取得部604は、ユーザのアナログ音声は、例えば、MP3などの所定のフォーマットにおいて変換した後、クラウドサーバ103に送信するための符号化された音声データとしRAM303上に一時的に保存する。音声取得部604の処理開始及びその終了のタイミングは音声制御部603によって管理される。また、音声データの符号化は汎用のストリーミング用フォーマットでもよい。この場合、音声取得部604は符号化された音声データを順次、データ送受信部601に送信し、MFP101及びクラウドサーバ103の少なくとも一方にその音声データを送信するようにしてもよい。
【0089】
音声再生部605は、データ送受信部601が受信した音声合成データ(音声メッセージ)を、オーディオコントローラ309を介してスピーカ310で再生する。音声再生部605の音声再生のタイミングは音声制御部603によって管理される。
【0090】
表示部606は、表示コントローラ311を介して、LED312の表示を行う。例えば、音声操作開始検知部607で音声操作が開始したことを検知した場合にLED312を点灯制御する。表示部606の表示のタイミングは音声制御部603によって管理される。
【0091】
音声操作開始検知部607は、ユーザの発したウェイクワード、または、スマートスピーカ102の操作開始キー(不図示)の押下を検知し、音声制御部603へ操作開始通知を送信する。ここで、ウェイクワードとは、予め決められている音声ワードである。音声操作開始検知部607は、マイクロフォン308で取得されるスマートスピーカ102の近辺にいるユーザのアナログ音声から、常時ウェイクワードを検知する。ユーザはウェイクワードを話し、続いて自身が行いたいことを話すことでMFP101の操作を行うことができる。音声操作開始検知部607がウェイクワードを検知してからの音声処理については後述する。
【0092】
発話終了判定部608は、音声取得部604での処理の終了タイミングを判定する。例えば、音声取得部604でユーザのアナログ音声が取得された後、ユーザの発話が無い時間(以降、空白時間と呼ぶ)が所定時間(例えば3秒)となったときにユーザの発話が終了したと判定し、音声制御部603へ発話終了通知を送信する。尚、終了タイミングの判定は、空白時間に基づいて行う他、ユーザが発した所定の語句に基づいて行ってもよい。例えば、「はい」、「いいえ」、「OK」、「キャンセル」、「終了」、「スタート」、「開始」などをその所定の語句に予め設定しておくことができる。これにより、かかる所定の語句のいずれかがユーザにより発せられた場合は、空白時間が所定時間を経過する前にユーザの発話が終了したと判定してもよい。また、終了タイミングの判定は、スマートスピーカ102ではなく、クラウドサーバ103で行うようにしてもよく、ユーザの発話内容の意味や文脈から発話の終了を判定するようにしてもよい。
【0093】
音声制御部603は、音声デバイス制御プログラム600における制御の中心であり、音声デバイス制御プログラム600内の他の各モジュールが相互に連携して動作するよう制御する。具体的には、音声取得部604、音声再生部605、表示部606の処理開始・終了の制御を行う。また、音声取得部604で音声データが取得された後、音声データをデータ送受信部601でクラウドサーバ103へ送信するよう制御する。また、クラウドサーバ103からの音声合成データをデータ送受信部601で受信後、音声再生部605で音声合成データを再生するよう制御する。
【0094】
ここで、音声取得部604、音声再生部605、表示部606の処理開始・終了のタイミングについて述べる。
【0095】
音声制御部603は、音声操作開始検知部607からの操作開始通知を受信すると、音声取得部604の処理を開始する。また、発話終了判定部608からの発話終了通知を受信すると、音声取得部604の処理を終了する。
【0096】
例えば、ユーザがウェイクワードを発話し、続いて「コピーしたい」と発話したとする。このとき、音声操作開始検知部607が、ウェイクワードのアナログ音声を検知し、音声制御部603に操作開始通知を送信する。音声制御部603は、操作開始通知を受信すると、音声取得部604に処理を開始させ、ユーザとの対話セッションを開始する。これにより処理を開始した音声取得部604は、ユーザが発声した「コピーしたい」というアナログ音声を取得し、音声データへ変換した後その変換後の音声データをRAM303上に一時保存する。
【0097】
その後、発話終了判定部608が、音声取得部604が「コピーしたい」というアナログ音声を取得した後の空白時間が所定時間となったと判定すると、発話終了通知を音声制御部603に送信する。音声制御部603は、発話終了通知を受信すると、音声取得部604に処理を終了させる。以下、音声制御部603が音声取得部604に処理を開始させてから終了させるまでのスマートスピーカ102の状態を発話処理状態と呼ぶ。音声制御部603は、発話処理状態中にLED312を点灯表示させるよう表示部606を制御する。
【0098】
音声制御部603は、発話終了判定部608より発話終了通知を受信すると、音声取得部604がRAM202上に一時保存された音声データをデータ送受信部601でクラウドサーバ103へ送信する。その後、データ送受信部601がクラウドサーバ103からの応答メッセージを受信するのを待つ。ここでクラウドサーバ103からの応答メッセージには、例えば、応答であることを示すヘッダ部と、音声合成データとが含まれる。音声制御部603は、データ送受信部601でクラウドサーバ103からの応答メッセージを受信すると、音声再生部605で応答メッセージに含まれる音声合成データ(例えば「コピー画面を表示します」)を再生する。その後、音声制御部603は、データ送受信部601でクラウドサーバ103から応答メッセージと同時に対話セッション終了通知を受信すると、音声再生部605で応答メッセージに含まれる音声合成データ(例えば「コピーを終了しました」)を再生する。また受信した対話セッション終了通知に応じて、音声制御部603は、ユーザとの対話セッションを終了する。尚、音声制御部603が、発話終了判定部608からの発話終了通知を受信してから、クラウドサーバ103から対話セッション終了通知を受信するまでの状態を応答処理状態と呼ぶ。音声制御部603は、応答処理状態中にLED312を点滅表示させるよう表示部606を制御する。
【0099】
応答処理状態の終了後も、ユーザとの対話セッションが継続している間は、ユーザは再度ウェイクワードを発話せずとも、「コピーしたい」と発話した後に続けてMFP101においてユーザが行いたいことを発話することができる。尚、対話セッションの終了は、クラウドサーバ103が判定して、スマートスピーカ102に対話セッション終了通知を送信する。音声制御部603は、クラウドサーバ103から対話セッション終了通知が送信されると、ユーザとの対話セッションを終了するようデータ送受信部601を制御する。以下、音声制御部603がデータ送受信部601に対話セッションを終了させてから次の対話セッションを開始させるまでのスマートスピーカ102の状態を待機状態と呼ぶ。また、スマートスピーカ102の起動後、音声制御部603が音声操作開始検知部607からの操作開始通知を受信するまでは、常時待機状態である。音声制御部603は、待機状態の間、LED312を消灯させるよう表示部606を制御する。
【0100】
<クラウドサーバの音声データ変換制御プログラムの機能構成>
図7は、クラウドサーバ103の音声データ変換制御プログラム700の機能構成を示すブロック図である。
【0101】
音声データ変換制御プログラム700は、前述したストレージ405に格納される制御プログラムの1つであり、CPU402がクラウドサーバ103の起動時にRAM403上に展開して実行する。
【0102】
図7に示すように、音声データ変換制御プログラム700は、データ送受信部701、データ管理部702、デバイス操作データ生成部703、及び音声データ変換部710を備える。また音声データ変換部710は、音声認識部705、形態素解析部706、グループID判定部707、及び音声合成部708を備える。
【0103】
データ送受信部701は、ネットワークI/F406及びクラウドサーバ103の外部のゲートウェイ105を介して、ネットワーク104に接続するMFP101及びスマートスピーカ102とTCP/IPによるデータの送受信を行う。データ送受信部701は、スマートスピーカ102からユーザの音声データを受信する。また、データ送受信部701は、グループID判定部707で判定されたグループIDや音声認識部705で音声認識処理して生成されるテキストデータを送信する。
【0104】
データ管理部702は、音声データ変換制御プログラム700の実行において生成した作業データや、音声データ変換部710で用いられる音声認識処理用データなど様々なデータをストレージ405上の所定の領域へ保存し、管理する。尚、データ管理部702で保存・管理される音声認識処理用データには、音声認識部705での音声データのテキスト変換用の音響モデルや言語モデルや、形態素解析部706でのテキストの形態素解析用の辞書が含まれる。また、グループID判定部707でのグループIDの判定用のグループIDリストや、音声合成部708での音声合成用の音声データベースも、データ管理部702で管理される音声認識処理用データに含まれる。さらにデータ管理部702は、スマートスピーカ102、及び、MFP101と通信するために必要な各デバイス情報などを保存し、管理する。
【0105】
音声認識部705は、データ送受信部701よりユーザの音声データが入力されると、その音声データをテキストに変換するための音声認識処理を行う。音声認識処理は、音響モデルを用いてユーザの音声データを音素に変換し、さらに言語モデルを用いて音素を実際のテキストデータに変換する。尚、本実施形態においては、ユーザの音声データの言語は複数存在してよい。そのため、音声認識部705は、入力された音声データの言語を判定して、その判定された言語に沿ったテキストデータに変換する第一の音声認識方式を用いても良い。また、音声認識部705は、入力された音声データを複数の言語の音響モデルを用いて音素に変換し、夫々の音響モデルに対応する言語モデルを用いて、複数の言語ごとのテキストデータに変換して出力する第二の音声認識方式を用いても良い。第二の音声認識方式の場合、複数の言語形式で入力された音声データをテキストデータに変換するため、音声認識部705は音声認識処理の結果として、テキストデータとその言語形式から成る複数の音声認識データを出力する。以下、本実施形態においては第二の音声認識方式が用いられる場合について説明する。
【0106】
本実施例では、音声認識部705は、入力された音声データを、日本語及び英語の2つの言語形式で音声認識する。この結果、1つ以上のカナから構成されるテキストデータと言語設定「日本語」から成る音声認識データと、1つ以上のアルファベットから構成されるテキストデータと言語設定「英語」から成る音声認識データとが、音声認識部705より出力する。
【0107】
但し、音声データがテキストに変換されるのであれば、音声認識部705で用いられる音声認識処理はこれに限定されない。音声認識処理の詳細は主旨ではないため、これ以上の説明は割愛する。
【0108】
形態素解析部706は、音声認識部705から出力された音声認識データに含まれるテキストデータを、その言語設定に沿って形態素解析する。具体的には、形態素解析部706は、言語設定の文法や、品詞などの情報をもつ辞書からテキストデータに含まれる形態素列を導出し、さらに各形態素の品詞などを判別する。形態素解析部706は、例えば、JUMAN、茶筒、MeCab等の公知の形態素解析ソフトウェアを用いて実現することができる。
【0109】
形態素解析ソフトウェアに関しては公知の技術であるため、ここでの詳細な記載は行わない。
【0110】
<実施例1>
<ログイン時の制御シーケンス>
図8は、情報処理システム100において実行される本実施例に係るユーザログイン時の制御シーケンスである。
【0111】
本処理は、情報処理システム100を構成するMFP101、スマートスピーカ102、クラウドサーバ103間でのデータのやり取りにより実行される。より具体的には、MFP101にユーザがログインする認証動作時にMFP101が内部に保持する設定情報をクラウドサーバ103およびスマートスピーカ102に通知することで、それぞれの設定が変更される。
【0112】
図8で示すシーケンスの例では、MFP101、クラウドサーバ103、スマートスピーカ102は互いに通信可能な状態である。また、MFP101は初期設定を完了し、電源ONの起動後にコピー、スキャン、プリントといった機能を呼び出し可能なホーム画面を標準言語設定で表示している状態である。ここで、本実施例の標準言語設定は日本語である。
【0113】
以下、MFP101を実行主体とする動作は、実際は
図5を用いて上述したデバイス制御プログラム500をCPU202が実行することにより行われる。また、スマートスピーカ102を実行主体とする動作は、実際は
図6を用いて上述した音声デバイス制御プログラム600をCPU302が実行することにより行われる。同様に、クラウドサーバ103を実行主体とする動作は、実際は
図7を用いて上述した音声データ変換制御プログラム700をCPU402が実行することにより行われる。
【0114】
まず、ステップS801では、MFP101は、ユーザよりログイン操作を受け付ける(第1の取得手段)。本実施例では、ログイン操作とは、スマートカードをカードリーダ214に近づけるユーザ操作を指すが、これに限定されない。例えば、ユーザ名およびパスワード、個人識別番号(PIN)、もしくはユーザと関連付けられた他の情報を操作パネル209に入力するユーザ操作がログイン操作であってもよい。
【0115】
ステップS802では、まず、MFP101は、ステップS801で受け付けたログイン操作に応じてログイン処理を行う。その結果、ユーザの認証に成功すると、次にMFP101は、音声制御情報を取得する(第2の取得手段)。ここで、音声制御情報とは、ストレージ205に保持している情報から、認証に成功したユーザのユーザ情報や、MFP101で保持しているMFP設定情報のうちクラウドサーバ103やスマートスピーカ102へ通知する情報からなる。また、MFP101は、取得したユーザ情報にユーザの使用言語が含まれる場合、操作パネル209の表示言語をユーザの使用言語へと変更することで、スマートスピーカ102の音声設定の変更をクラウドサーバ103に要求する(第1の要求手段)。
【0116】
ステップS803では、MFP101は、ステップS802で取得した音声制御情報を、ネットワークI/F407を通してクラウドサーバ103に送信する。ステップS801~S803の処理の詳細は
図9を用いて後述する。
【0117】
ステップS804では、クラウドサーバ103は、データ送受信部701でステップS803において送信された音声制御情報を受信すると、その音声制御情報に応じて音声データ処理に関する設定値(以下、音声デバイス制御情報という)を変更する。ステップS804の処理の詳細は
図12のフローチャートを用いて後述する。
【0118】
ステップS805では、クラウドサーバ103は、ステップS804で変更された音声デバイス制御情報をデータ送受信部701でスマートスピーカ102に送信する。これにより、クラウドサーバ103は、スマートスピーカ102に対して音声設定の変更を要求する(要求手段,第2の要求手段)。
【0119】
ステップS806では、スマートスピーカ102は、データ送受信部601でステップS805において送信された音声デバイス制御情報を受信すると、これに応じて音声制御部603のロケール設定や音量設定等の設定を変更する(変更手段)。ステップS805の処理の詳細は
図13のフローチャートを用いて後述する。
【0120】
図9は、
図8のステップS801~S803においてMFP101が実行する、ログイン実行時処理のフローチャートである。以下説明する通り、ステップS901,S907の処理が夫々、ステップS801,S803の処理に該当し、
図9のそれ以外のステップの処理がステップS802の処理に該当する。
【0121】
ステップS901では、ステップS801の処理を実行する。すなわち、ユーザの持つスマートカードがカードリーダ214の通信可能エリア内に入ると、操作対象判定部506がカードリーダ214によりそのスマートカードを検知し、ユーザ情報を取得する。次に、操作対象判定部506はデータ管理部504に保持されているログインユーザ情報テーブル2001と、取得したユーザ情報を照合する。
【0122】
ステップS902では、データ解析部502は、ステップS901での照合の結果、一致する情報がある場合、データ解析部502はユーザの認証に成功したと判断し、ステップS903へ遷移する。そうでない場合、データ解析部502はユーザの認証に成功しなかったと判断し、ステップS912へ遷移する。
【0123】
ステップS903では、データ管理部504は、ユーザログインフラグをユーザがログイン状態であることを示すONに変更し、その変更後のユーザログインフラグをRAM203に保存する。
【0124】
ステップS904では、データ管理部504は、ユーザ情報をログインユーザ情報テーブル2001から取得する。例えば、ログインユーザが識別IDが1のユーザである場合、識別IDが1のレコード情報をユーザ情報としてログインユーザ情報テーブル2001から取得し、RAM203に保存する。
【0125】
ステップS905では、データ解析部502は、ステップS904でデータ管理部504が取得したユーザ情報及びMFP101で保持しているMFP設定情報から、ロケール情報を取得するロケール情報取得処理を実行する。ロケール情報取得処理の詳細は
図10のフローチャートを用いて後述する。データ解析部502は、取得したロケール情報をRAM203に保存する。
【0126】
ステップS906では、データ解析部502は、MFP101で保持しているMFP設定情報から音量設定情報を取得する。音量設定情報取得処理の詳細は後述の
図11のフローチャートを用いて後述する。データ解析部502は、取得した音量設定情報をRAM203に保存する。
【0127】
ステップS907では、ステップS803の処理を実行する。すなわち、データ送受信部501は、ステップS903~S906でRAM203に保存された、ユーザログインフラグ、ユーザ情報、ロケール情報、及び音量設定情報を含む音声制御情報を、クラウドサーバ103に送信する。本実施例では、この送信の際、
図22に示すJsonデータ方式を用いるが、かかるデータ方式に限定されない。例えばXMLといったデータ方式を用いても良い。また、ログインユーザ情報テーブルにスマートスピーカ情報が含まれる場合、音声制御情報にスマートスピーカ情報を含めるようにしてもよい。
【0128】
ステップS908では、データ解析部502はステップS904でデータ管理部504が取得したユーザ情報に、使用言語情報が設定されているかを判断する。設定されている場合はステップS909へ遷移する。設定されていない場合はステップS910へと遷移する。
【0129】
ステップS909では、データ解析部502は、データ管理部504で保存・管理されている、操作パネル209に表示する言語の情報である表示言語設定情報を、ユーザ情報に設定されている使用言語情報に基づき変更する。
【0130】
ステップS910では、表示部505は、RAM203の表示言語設定情報を参照し、ディスプレイコントローラ207を介して操作パネル209のホーム画面の表示を切り替え、本処理を終了する。これにより、操作パネル209のホーム画面の表示言語は、ログインユーザの使用言語に切り替わる。この切り替えについては
図19を用いて後述する。
【0131】
ステップS911では、表示部505は、ディスプレイコントローラ207を制御して操作パネル209にログインエラー発生画面を表示し、本処理を終了する。
【0132】
図10は、
図9のステップS905においてMFP101が実行する、ロケール情報取得処理のフローチャートである。
【0133】
ステップS1001では、ユーザ情報、すなわち、データ管理部504がステップS904でRAM203に保存したレコード情報から、使用言語情報を取得する。ここでは、識別IDが1のユーザがログインしている場合、ステップS1001にて
図20のログインユーザ情報テーブルから識別IDが1に紐づく使用言語情報として「En」を取得した場合について、以下説明する。
【0134】
ステップS1002では、データ管理部504がRAM203に保持・管理している国設定テーブル2101において選択されている国設定情報を取得する。
【0135】
ステップS1003では、データ解析部502がステップS1001,S1002で取得した使用言語情報「En」と国設定情報の組み合わせのロケール情報が、RAM203に保持されているロケールコードテーブル2102にあるか否か判断する。この判断の結果、ある場合はステップS1005に遷移し、ない場合はステップS1004へ遷移する。例えば、ステップS1002で取得した国設定情報が「アメリカ」である場合、これと使用言語情報「En」の組み合わせである、「en-US:英語(アメリカ)」がロケールコードテーブル2102にあると判断される。また、ステップS1002で取得した国設定情報が「カナダ」である場合、これと使用言語情報「En」の組み合わせである、「en-CA:英語(カナダ)」がロケールコードテーブル2102にあると判断される。一方、例えばステップS1002で取得した国設定情報が「日本」である場合、これと使用言語情報「En」の組み合わせであるロケール情報はロケールコードテーブル2102にないと判断される。
【0136】
ステップS1004では、データ解析部502がステップS1001で取得した使用言語情報である「En」に対応するロケール情報が、RAM203に保持されているロケールコードルックアップテーブル2103にあるか否かを判断する。
図21に示すように、ロケールコードルックアップテーブル2103には、「En」に対応するロケール情報「en-US」があるので、この場合はステップS1005へと遷移する。一方、ステップS1001で取得した使用言語情報がロケールコードルックアップテーブル2103にない場合、ステップS1006へ遷移する。
【0137】
ステップS1005では、データ解析部502がステップS1003でロケールコードテーブル2102にあったロケール情報もしくはステップS1004でロケールコードルックアップテーブル2103にあったロケール情報を取得する。この時、これまでにロケール設定として保持していたロケール情報をデフォルトのロケール情報としてRAM203へ保持し、本処理を終了する。
【0138】
ステップS1006では、データ解析部502がデフォルトのロケール情報を取得し、本処理を終了する。
【0139】
図11は、
図9のステップS906においてMFP101が実行する、音量設定情報取得処理のフローチャートである。
【0140】
ステップS1101では、データ解析部502が、RAM203に保持されている音量設定テーブル2104の情報を取得する。
【0141】
ステップS1102では、データ解析部502がRAM203上のカウンタnを0に初期化する。
【0142】
ステップS1103では、データ解析部502が音量設定テーブル2104のn行目のレコードデータを取得する。
【0143】
ステップS1104では、データ解析部502が音量設定テーブル2104のn行目のレコードデータにある音量設定値をRAM203上に用意した音量合計値に加算する。
【0144】
ステップS1105では、データ解析部502がRAM203上のカウンタnを1加算する。
【0145】
ステップS1106では、nがN-1である場合、データ解析部502は音量設定テーブル2104の全ての行のレコードデータの参照は終了したと判断し、ステップS1107へ遷移する。一方、nがN-1未満の場合、レコードデータの参照を継続すべく、ステップS1103へ戻る。尚、Nは、音量設定テーブル2104の全レコードデータ数(本実施例では7)である。
【0146】
このように、ステップS1103~S1106までの動作を繰り返し行い、すべてのレコードデータにある音量設定値を合計した音量合計値を算出する。
【0147】
ステップS1107では、データ解析部502は、上記算出された音量合計値をNで割った音量平均値を算出する。
【0148】
ステップS1108では、データ解析部502がステップS1107で算出された音量平均値を入力値とした場合の出力値を、音量設定ルックアップテーブル2105から取得する。
【0149】
ステップS1109では、データ解析部502がステップS1108で取得した出力値を音量設定情報として取得し、本処理を終了する。
【0150】
図11の処理によれば、
図21の音量設定テーブル2104にあるMFP101側で保持している通知音や警告音の平均値を算出し、その平均値からスマートスピーカ102側で必要となる音量を推測して設定する。これにより、スマートスピーカ102側の音量を適切に設定することができる。
【0151】
図12は、
図8のステップS804においてクラウドサーバ103が実行する、音声デバイス制御設定変更処理のフローチャートである。
【0152】
本処理は、データ送受信部701が、ステップS907でデータ送受信部501が送信した音声制御情報をネットワークI/F406を通じて受信した際に、CPU402により開始される処理である。
【0153】
ステップS1201では、音声認識部705がデータ送受信部701で受信した音声制御情報のユーザログインフラグがONかOFFかを確認する。確認の結果、ONの場合は(ステップS1201でYES)、ステップS1202へ遷移する一方、OFFの場合は(ステップS1201でNO)、ステップS1209へ遷移する。
【0154】
ステップS1202では、音声認識部705がデータ送受信部701で受信した音声制御情報にロケール情報があるか否かを判断する。判断の結果、ある場合は(ステップS1202でYES)、ステップS1203へ遷移する一方、無い場合は(ステップS1202でNO)、ステップS1205へ遷移する。
【0155】
ステップS1203では、音声認識部705が、音声制御情報にあったロケール情報に基づき、RAM403が保持しているロケール設定を変更する。この時、変更前のロケール設定は、標準言語設定としてRAM403へ保持しておく。
【0156】
ステップS1204では、データ管理部702が、ステップS1203で変更されたロケール設定を、スマートスピーカ102へ送信するデータとしてRAM403へ保持する。
【0157】
ステップS1205では、音声認識部705が、データ送受信部701で受信した音声制御情報に音量設定情報があるか否かを判断する。判断の結果、ある場合は(ステップS1205でYES)、ステップS1206へ遷移する一方、無い場合は(ステップS1205でNO)、ステップS1207へ遷移する。
【0158】
ステップS1206では、データ管理部702が、音声制御情報にあった音量設定情報に、スマートスピーカ102へ送信するデータとしてRAM403が保持している音量設定を変更する。この時、変更前の音量設定は、標準音量設定としてRAM403へ保持しておく。
【0159】
ステップS1207では、音声認識部705が、データ送受信部701で受信した音声制御情報のユーザ情報に利用機能制限情報があるか否かを判断する。判断の結果、ある場合は(ステップS1207でYES)、ステップS1208へ遷移する一方、無い場合は(ステップS1207でNO)、ステップS1210へ遷移する。
【0160】
ステップS1208では、データ管理部702が、音声制御情報にあった利用機能制限情報に基づき、RAM403が保持しているジョブ種の制限設定を変更する。この時、変更前のジョブ種の制限設定は、標準ジョブ種設定としてRAM403へ保持しておく。その後、ステップS1210へ遷移する。
【0161】
ステップS1209では、RAM403から標準言語設定及び標準音量設定を取得する。その後、取得した標準言語設定及び標準音量設定に基づき、スマートスピーカ102へ送信するデータとしてRAM403が保持しているロケール設定及び音量設定を変更し、ステップS1210へ遷移する。また、RAM403に保持されている標準ジョブ種設定に、RAM403が保持しているジョブ種の制限設定を変更する。
【0162】
ステップS1210では、音声認識部705が、RAM403にスマートスピーカ102へ送信するデータが存在するか判断する。判断の結果、ある場合は(ステップS1210でYES)、ステップS1211へ遷移する一方、無い場合は(ステップS1210でNO)、本処理をそのまま終了する。
【0163】
ステップS1211では、データ送受信部701が、RAM403にスマートスピーカ102へ送信するデータとして保持されているデータを音声デバイス制御情報としてネットワークI/F406から送信し、本処理を終了する。この時送信するデータ方式としては
図23に示したJsonデータ方式を1つの例として示すが、これに限らずとも良い。例えばXMLといった方式でも良い。
【0164】
図13は、
図8のステップS805においてスマートスピーカ102が実行する、音声制御設定変更処理のフローチャートである。
【0165】
本処理は、データ送受信部601が、ステップS1211でデータ送受信部701が送信した音声デバイス制御情報をネットワークI/F306を通じて受信した際に、CPU302により開始される処理である。
【0166】
ステップS1301では、音声制御部603が、データ送受信部601で受信した音声デバイス制御情報にロケール設定が存在するか判断する。判断の結果、ある場合は(ステップS1301でYES)、ステップS1302へ遷移する一方、無い場合は(ステップS1301でNO)、ステップS1303へ遷移する。
【0167】
ステップS1302では、音声制御部603が、音声デバイス制御情報のロケール設定にRAM303が保持しているロケール設定を変更する。
【0168】
ステップS1303では、音声制御部603が、データ送受信部601で受信した音声デバイス制御情報に音量設定が存在するか判断する。判断の結果、ある場合は(ステップS1303でYES)、ステップS1304へ遷移する一方、無い場合は(ステップS1301でNO)、本処理を終了する。
【0169】
ステップS1304では、音声制御部603が、音声デバイス制御情報の音量設定に、RAM303が保持している音量設定を変更し、本処理を終了する。
【0170】
図19は、MFP101でユーザ認証が成功した場合に実行される、ステップS910での操作パネル209のホーム画面の表示切替を示す図である。
【0171】
ここでは、操作パネル209に標準言語設定である日本語のホーム画面1901が表示された状態で、ユーザがカードリーダ214にスマートカードを近づけた結果、MFP101がそのユーザのユーザ認証に成功した場合について説明する。
【0172】
スマートカードから取得したユーザ情報に含まれる使用言語情報が「En」である場合、ステップS909においてMFP101における表示言語設定情報が英語に変更される。この場合、ステップS910において表示部505はディスプレイコントローラ207を制御し、操作パネル209に表示されるホーム画面1901を、表示言語が英語のホーム画面1902に切り替える。
【0173】
一方、スマートカードから取得したユーザ情報に含まれる使用言語情報が「Jp」である場合、ステップS909においてMFP101における表示言語設定情報が日本語に変更される。この場合、ステップS910において表示部505はディスプレイコントローラ207を制御し、操作パネル209に表示されるホーム画面1901を、表示言語が日本語のホーム画面1901のままとする。
【0174】
以上説明した通り、本実施例では、ログインユーザが使用する言語でスマートスピーカ102におけるウェイクワードの判定やクラウドサーバ103における音声認識を行うことが可能となるため、ユーザビリティの向上に付与する。
【0175】
<実施例2>
実施例1では、MFP101へのログイン時のユーザ認証がMFP101内で実行された。これに対し本実施例では、MFP101へのログイン時のユーザ認証がクラウドサーバ103で実行される。これにより本実施例では、従来はMFP101で判断していたログインユーザごとに利用可能なジョブ種類の判断をクラウドサーバ103上で実行可能となる。
【0176】
<ログイン時の制御シーケンス>
図14は、情報処理システム100において実行される本実施例に係るユーザログイン時の制御シーケンスである。
【0177】
本処理は、情報処理システム100を構成するMFP101、スマートスピーカ102、クラウドサーバ103間でのデータのやり取りにより実行される。より具体的には、MFP101にユーザがログインする認証動作時にMFP101が内部に保持する設定情報をクラウドサーバ103に通知することで、その設定が変更される。
【0178】
図14で示すシーケンスの例では、MFP101、クラウドサーバ103は互いに通信可能な状態である。また、MFP101は初期設定を完了し、電源ONの起動後にコピー、スキャン、プリントといった機能を呼び出し可能なホーム画面を標準言語設定で表示している状態である。ここで、本実施例の標準言語設定は日本語である。
【0179】
実施例1と同様、以下、MFP101を実行主体とする動作は、実際は
図5を用いて上述したデバイス制御プログラム500をCPU202が実行することにより行われる。また、スマートスピーカ102を実行主体とする動作は、実際は
図6を用いて上述した音声デバイス制御プログラム600をCPU302が実行することにより行われる。同様に、クラウドサーバ103を実行主体とする動作は、実際は
図7を用いて上述した音声データ変換制御プログラム700をCPU402が実行することにより行われる。
【0180】
まず、ステップS1401では、MFP101は、ユーザよりログイン操作を受け付ける。本実施例では、ログイン操作とは、スマートカードをカードリーダ214に近づけるユーザ操作を指すが、これに限定されない。例えば、ユーザ名およびパスワード、個人識別番号(PIN)、もしくはユーザと関連付けられた他の情報を操作パネル209に入力するユーザ操作がログイン操作であってもよい。
【0181】
ステップS1402では、まず、MFP101は、ステップS1401で受け付けたログイン操作に応じてログイン処理を行う。その結果、ユーザ認証に成功すると、次にMFP101は、音声制御情報を取得する。ここで、音声制御情報とは、ストレージ205に保持している情報から、認証に成功したユーザのユーザ情報や、MFP101で保持しているMFP設定情報のうちクラウドサーバ103やスマートスピーカ102へ通知する情報からなる。また、MFP101は、取得したユーザ情報にユーザの使用言語が含まれる場合、操作パネル209の表示言語をユーザの使用言語へと変更する。
【0182】
ステップS1403では、MFP101は、ステップS1402で取得した音声制御情報を、ネットワークI/F407を通してクラウドサーバ103に送信する。ステップS1401~S1403の処理の詳細は
図16を用いて後述する。
【0183】
ステップS1404では、クラウドサーバ103は、データ送受信部701でステップS803において送信された音声制御情報を受信すると、その音声制御情報に応じてスマートスピーカ102に対して音声操作するユーザの利用可能ジョブ種を変更する。ステップS1404の処理の詳細は
図17のフローチャートを用いて後述する。
【0184】
尚、
図14では不図示だが、本実施例においても
図12と同様の処理により、音声制御情報に応じて音声デバイス制御情報を生成し、スマートスピーカ102に送信する。
【0185】
<ジョブ実行の制御シーケンス>
図15は、情報処理システム100において実行される本実施例に係るジョブ実行時の制御シーケンスである。
【0186】
本処理は、情報処理システム100を構成するMFP101、スマートスピーカ102、クラウドサーバ103間でのデータのやりとりにより実行される。より具体的には、本制御シーケンスでは、スマートスピーカ102がユーザから音声操作を受けると、その音声操作に応じてMFP101が各処理を実行し、その後スマートスピーカ102がその実行結果を示す応答をユーザに音声で返す。
【0187】
尚、
図15で示すシーケンスの例では、
図14のユーザログイン時の制御シーケンスが終了しており、且つスマートスピーカ102、MFP101、クラウドサーバ103は互いに通信可能な状態である。さらに、MFP101は、ログインユーザの使用言語でホーム画面1901を表示している状態である。また、スマートスピーカ102の音声操作開始検知部607は、自機の近辺にいるユーザのアナログ音声からマイクロフォン308で常時ウェイクワードを検知する状態である。
【0188】
まず、ステップS1501では、スマートスピーカ102は、ユーザによる音声操作開始指示操作を音声操作開始検知部607で検知する。本実施例では、音声操作開始指示操作とは、ユーザがスマートスピーカ102に対してウェイクワードを発声する操作を指すがこれに限定されない。例えば、スマートスピーカ102の操作開始キーのユーザ押下が音声操作開始指示操作であってもよい。
【0189】
ステップS1502では、スマートスピーカ102は、表示部606でスマートスピーカ102が発話処理状態となったことを示すべくLED312を点灯させると同時に、音声取得部604に処理を開始させ、ユーザとの対話セッションを開始する。
【0190】
ステップS1503では、スマートスピーカ102は、ユーザによるジョブ実行指示の操作を音声取得部604(検知手段)で検知する。ここでジョブ実行指示の操作とは、発話処理状態中にユーザが情報処理システム100でジョブを実行させるべく、例えば、「4部コピーをして」や「Four Copies」と発声する操作を指す。音声取得部604(変換手段)は、ジョブ実行指示の操作のアナログ音声を取得すると、これを音声データに変換してRAM303上に一時保存する。その後、空白時間が所定時間経過し、発話終了判定部608がユーザの発話が終了したと判定した場合、ステップS1504に進む。
【0191】
ステップS1504では、スマートスピーカ102は、表示部606でスマートスピーカ102が応答処理状態となることを示すべくLED312を点滅させると同時に音声取得部604に処理を終了させる。
【0192】
ステップS1505では、スマートスピーカ102は、データ送受信部601で、ステップS1503においてRAM303上で一時保存された音声データをクラウドサーバ103に送信する。
【0193】
ステップS1506では、クラウドサーバ103は、データ送受信部701で受信した音声データに基づくジョブ実行処理を開始する。
【0194】
ジョブ実行処理は、音声認識処理及び言語判定処理と、それ以降に実行されるジョブ投入処理により構成される。
【0195】
音声認識処理とは、音声認識部705が、データ送受信部701で受信した音声データから、上述した第二の音声認識方式を用いてテキストデータとその言語形式から成る複数の音声認識データを出力する処理である。
【0196】
言語判定処理とは、形態素解析部706(特定手段)が、音声認識処理より出力された音声認識データに含まれるテキストデータを、その言語設定に沿って形態素解析する処理である。これにより、ステップS1503のジョブ実行指示操作において、ユーザが実行を指示したジョブのジョブ種類や各種キーワードが特定される。
【0197】
ジョブ投入処理は、オペレーション判定処理、ジョブ情報生成処理、利用可能ジョブ判定処理、及びMFP101へのジョブ情報の送信を行う。さらにその後、ジョブ投入処理では、MFP101からのジョブ実行開始通知及びジョブ実行終了通知の受信、これらの通知に応じた音声合成処理及びその音声合成データのスマートスピーカ102への送信を実行する。ジョブ投入処理の詳細は
図18のフローチャートを用いて後述する。
【0198】
ステップS1507では、MFP101は、ステップS1506で開始したジョブ実行処理においてクラウドサーバ103から送信された言語設定付ジョブ情報に応じた処理を行う。
【0199】
ステップS1508では、スマートスピーカ102は、データ送受信部601で、ステップS1506で開始したジョブ実行処理においてクラウドサーバ103から送信された音声合成データを受信する。
【0200】
ステップS1509では、スマートスピーカ102は、音声再生部605で、ステップS1508で受信した音声合成データ(例えば「コピーを開始します」という音声合成データ)を、スピーカ310を通じて再生する。
【0201】
ステップS1510では、スマートスピーカ102は、データ送受信部601で、ステップS1506で開始したジョブ実行処理においてクラウドサーバ103から送信された音声合成データ及び対話セッション終了通知を受信する。ここで、対話セッション終了通知とは、クラウドサーバ103からスマートスピーカ102に対して、ユーザとの対話セッションを終了するよう指示する通知である。
【0202】
ステップS1511では、スマートスピーカ102は、音声再生部605で、ステップS1510で受信した音声合成データ(例えば「コピーを終了しました」という音声合成データ)を、スピーカ310を通じて再生する。
【0203】
ステップS1512では、スマートスピーカ102は、表示部606でスマートスピーカ102が応答処理状態を終了し、待機状態となることを示すべくLED312を消灯させる。
【0204】
ステップS1513では、スマートスピーカ102は、待機状態へ移行し、ユーザとの対話セッションを終了する。
【0205】
尚、
図15のシーケンスにおいて、スマートスピーカ102が応答処理状態である(すなわち、LED312が点滅中である)場合であっても、音声操作開始検知部607はウェイクワードを検知する。これにより、ユーザは、応答処理状態にあるスマートスピーカ102に対してウェイクワードの発話に続いて機能呼び出し指示操作として「キャンセル」、または「中止」などと発声することで、対話セッションを強制的に終了することができる。
【0206】
図16は、
図14のステップS1401~S1403においてMFP101が実行する、ログイン実行時処理のフローチャートである。以下説明する通り、ステップS1601,S1606の処理が夫々、ステップS1401,S1403の処理に該当し、
図16のそれ以外のステップの処理がステップS1402の処理に該当する。
【0207】
ステップS1601では、ステップS1401の処理を実行する。すなわち、ユーザの持つスマートカードがカードリーダ214の通信可能エリア内に入ると、操作対象判定部506がカードリーダ214によりそのスマートカードを検知し、ユーザ情報を取得する。次に、操作対象判定部506はデータ管理部504に保持されているログインユーザ情報テーブル2001と、取得したユーザ情報を照合する。
【0208】
ステップS1602では、データ解析部502は、ステップS1601での照合の結果、一致する情報がある場合、データ解析部502はユーザの認証に成功したと判断し、ステップS1603へ遷移する。そうでない場合、データ解析部502はユーザの認証に成功しなかったと判断し、ステップS1607へ遷移する。
【0209】
ステップS1603では、データ管理部504は、ユーザログインフラグをユーザがログイン状態であることを示すONに変更し、その変更後のユーザログインフラグをRAM203に保存する。
【0210】
ステップS1604では、データ管理部504は、ユーザ情報をログインユーザ情報テーブル2001から取得する。例えば、ログインユーザが識別IDが1のユーザである場合、識別IDが1のレコード情報をユーザ情報としてログインユーザ情報テーブル2001から取得し、RAM203に保存する。
【0211】
ステップS1605では、データ解析部502は、ステップS1604でデータ管理部504が取得したユーザ情報からログインユーザの利用可能ジョブ種を取得する。例えば、ログインユーザが識別IDが1のユーザである場合、ログインユーザの利用可能ジョブ種の情報としてSEND/PRINT/SCAN/FAXを取得し、RAM203に保存する。また、データ解析部502は、ステップS905,S906と同様の処理により、ロケール情報、音量設定情報を取得し、RAM203に保存する。
【0212】
ステップS1606では、ステップS1403の処理を実行する。すなわち、データ送受信部501は、ステップS1603,S1605でRAM203に保存された、ユーザログインフラグ、ログインユーザの利用可能ジョブ種の情報、ロケール情報、及び音量設定情報を含む音声制御情報を、クラウドサーバ103に送信する。その後、本処理を終了する。
【0213】
ステップS1607では、表示部505は、ディスプレイコントローラ207を制御して操作パネル209にログインエラー発生画面を表示し、本処理を終了する。
【0214】
図17は、
図14のステップS1404においてクラウドサーバ103が実行する、利用可能ジョブ種変更処理のフローチャートである。
【0215】
本処理は、データ送受信部701が、ステップS1606でデータ送受信部501が送信した音声制御情報をネットワークI/F406を通じて受信した際に、CPU402により開始される処理である。
【0216】
ステップS1701では、音声認識部705がデータ送受信部701で受信した音声制御情報をユーザログインフラグがONかOFFか確認する。確認の結果、ONの場合は(ステップS1701でYES)、ステップS1702へ遷移する一方、OFFの場合は(ステップS1701でNO)、ステップS1704へ遷移する。
【0217】
ステップS1702では、音声認識部705が、データ送受信部701で受信した音声制御情報にログインユーザの利用可能ジョブ種の情報があるか否かを判断する。判断の結果、ある場合は(ステップS1702でYES)、ステップS1703へ遷移する一方、無い場合は(ステップS1702でNO)、ステップS1705へ遷移する。
【0218】
ステップS1703では、データ管理部702が、音声制御情報にあったログインユーザの利用可能ジョブ種の情報に基づき、RAM403が保持している利用可能ジョブ種の設定を変更する。この時、変更前の利用可能ジョブ種の設定は、標準ジョブ種設定としてRAM403へ保持し、本処理を終了する。
【0219】
ステップS1704では、RAM403に保持されている標準ジョブ種設定に、RAM403が保持している利用可能ジョブ種の設定を変更し、本処理を終了する。
【0220】
図18は、
図15のステップS1506においてクラウドサーバ103が実行するジョブ実行処理の一部である、ジョブ投入処理のフローチャートである。
【0221】
本処理は、クラウドサーバ103が、ステップS1505でスマートスピーカ102からユーザからのジョブ実行指示の操作の音声データを受信し、音声認識処理でこれをテキストデータとし、言語判定処理でテキストデータを形態素解析した後に実行される。
【0222】
まず、ステップS1801で、CPU402は、オペレーション判定処理を実行する。具体的には、言語判定処理での形態素解析結果に、RAM403に保存されているグループIDリストのジョブ必須設定キーワードが揃っているかどうかを判断する。ジョブ必須設定キーワードは、ステップS1503でのジョブ実行指示の操作を行う際に必ずユーザが設定しなければならない設定を示すキーワードである。例えば、形態素解析結果にジョブ種類として「EMAILSEND」が含まれる場合、形態素解析結果には宛先を意味するキーワード(例えば「CNF00004」)ジョブ必須設定キーワードがなければならない。尚、ジョブ必須設定キーワードはジョブ種類によって異なり、ジョブ必須設定キーワードが無いジョブ種類もあれば、複数のジョブ必須設定キーワードが存在するジョブ種類もあっても良い。
【0223】
ステップS1801でジョブ必須設定キーワードが揃っていると判断された場合、ステップS1802に遷移し、CPU402(生成手段)は、形態素解析結果に基づきジョブ情報生成処理を実行する。この処理により、MFP101がジョブを実行するためのデバイス操作データである言語設定付ジョブ情報が生成される。
【0224】
ステップS1803で、CPU402は、利用可能ジョブ判定処理を実行する。具体的には、RAM403が保持している利用可能ジョブ種の設定に、形態素解析結果に含まれるジョブ種類が含まれる場合、ステップS1804に遷移し、そうでない場合、ステップS1809に遷移する。
【0225】
ステップS1804で、データ送受信部701(送信手段)はステップS1802で生成した言語設定付ジョブ情報を、ネットワークI/F406を介してMFP101に送信する。MFP101はこの言語設定付ジョブ情報を受信すると、
図15のステップS1507の処理を開始する。
【0226】
ステップS1805で、データ送受信部701はネットワークI/F406を介してMFP101からのジョブ終了通知の受信を待ち、この受信があったときにステップS1806に遷移する。尚、
図18においては不図示だが、データ送受信部701がMFP101からジョブ実行開始通知を受信した場合、CPU402は、ジョブ開始通知に対応したテキストメッセージであるジョブ開始音声を生成してスマートスピーカ102に送信してもよい。ジョブ開始音声の例として、「ジョブが開始しました」が挙げられる。
【0227】
ステップS1806でジョブ終了通知を受信すると、CPU402は受信したジョブ終了通知に対応したジョブ終了音声メッセージを生成し、RAM403上の音声データにセットする。ここで、ジョブ終了通知がジョブが正常に終了した旨の通知である場合は、「ジョブが終了しました」という音声メッセージがジョブ終了音声メッセージとして生成される。一方、ジョブ終了通知がMFP101で用紙Jamやエラーが発生した旨の通知である場合は、「エラー終了しました」という音声メッセージがジョブ終了音声メッセージとして生成される。
【0228】
ステップS1807で、データ送受信部701はネットワークI/F406を介して、RAM403上にセットされた音声データをスマートスピーカ102に送信し、本処理を終了する。ここで、RAM403上にセットされた音声データとは、ステップS1806又は後述のステップS1808,S1809のうちのいずれかにおいてRAM403上にセットされた音声データを指す。
【0229】
ステップS1801でジョブ必須設定キーワードが揃っていないと判断された場合、ステップS1808に遷移する。ステップS1808では、CPU402はジョブ必須設定キーワードの入力を促すためのテキストメッセージであるジョブ設定誘導音声メッセージを生成し、RAM403上の音声データにセットする。ジョブ設定誘導音声メッセージの一例として、ユーザがEMAILSENDを指定した状態で宛先が指定されていない場合に、「送信先の宛先を入力してください」が挙げられる。
【0230】
ステップS1803でログインユーザが利用可能なジョブ種類ではないと判断された場合、ステップS1809に遷移する。ステップS1809では、CPU402はジョブ利用が不可であることを通知するテキストメッセージであるジョブ利用不可音声メッセージを生成し、RAM403上の音声データにセットする。ジョブ利用不可音声メッセージの一例として、ユーザが利用不可となっているSENDを指定した状態で宛先が指定されていない場合に、「その機能は利用できません」が挙げられる。
【0231】
以上説明した通り、ログインユーザごとに利用可能なジョブ種類の判定をクラウドサーバ103で行うことが可能となる。
【0232】
尚、本実施形態に係る情報処理システム100においては、MFP101とクラウドサーバ103は別装置としたが、一体化された情報処理装置であってもよい。
【0233】
また、本実施形態に係る情報処理システム100においては、クラウドサーバ103がスマートスピーカ102の設定を管理したが、クラウド上ではないサーバがスマートスピーカ102の設定を管理してもよい。
【0234】
(他の実施形態)
本発明は、以下の処理を実行することによっても実現される。即ち上述した実施形態の機能を実現するソフトウェア(プログラム)をネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(又はCPUやMPU等)がプログラムコードを読み出して実行する処理である。この場合、そのプログラム、及び該プログラムを記憶(格納)した記録媒体は本発明を構成することになる。
【符号の説明】
【0235】
100 情報処理システム
101 MFP
102 スマートスピーカ
103 クラウドサーバ
104 ネットワーク
105 ゲートウェイ
214 カードリーダ
500 デバイス制御プログラム
600 音声デバイス制御プログラム
700 音声データ変換制御プログラム