IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特開-情報処理装置及びプログラム 図1
  • 特開-情報処理装置及びプログラム 図2
  • 特開-情報処理装置及びプログラム 図3
  • 特開-情報処理装置及びプログラム 図4
  • 特開-情報処理装置及びプログラム 図5
  • 特開-情報処理装置及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024074811
(43)【公開日】2024-05-31
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
   G06F 21/32 20130101AFI20240524BHJP
   G10L 17/00 20130101ALI20240524BHJP
   G06V 40/10 20220101ALI20240524BHJP
   H04N 1/00 20060101ALI20240524BHJP
【FI】
G06F21/32
G10L17/00 400
G06V40/10
H04N1/00 350
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2024038082
(22)【出願日】2024-03-12
(62)【分割の表示】P 2020110697の分割
【原出願日】2020-06-26
(71)【出願人】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110000752
【氏名又は名称】弁理士法人朝日特許事務所
(72)【発明者】
【氏名】秋山 実
(57)【要約】
【課題】操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第1認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制する情報処理装置及びプログラムを提供する。
【解決手段】画像処理システムにおいて、情報処理装置はプロセッサを備える。プロセッサは、音声を用いた認証方法とは異なる他の認証方法による第1認証において識別された第1利用者の登録された第1の音声を取得し、操作において第2利用者が発した第2の音声を取得し、第1の音声の特徴と第2の音声の特徴とを比較して、第2利用者が第1認証において識別された第1利用者であることを確認する第2認証を行い、第2認証に成功すると、第2の音声に関連付けられた操作に応じて処理を実行する。
【選択図】図5
【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
音声を用いた認証方法とは異なる他の認証方法による第1認証において識別された第1利用者の登録された第1の音声を取得し、
操作において第2利用者が発した第2の音声を取得し、
前記第1の音声の特徴と前記第2の音声の特徴とを比較して、前記第2利用者が前記第1認証において識別された前記第1利用者であることを確認する第2認証を行い、
前記第2認証に成功すると、前記第2の音声に関連付けられた操作に応じて処理を実行し、
前記第2認証に失敗すると、操作部を用いた操作を受け付け、
前記第2認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行し、
前記第2認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信する
ことを特徴とする情報処理装置。
【請求項2】
前記第2の音声は、特定の操作に関連付けられており、
前記第2の音声の特徴に前記第1の音声の特徴が含まれる場合には、前記第2認証が成功する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記プロセッサは、前記第2の音声が前記処理に用いられる複数の設定値のうち一部の設定値を設定する操作に関連付けられている場合には、前記一部の設定値と予め定められた他の設定値とに従って、前記処理を実行する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記他の設定値は、前記第1認証において識別された前記第1利用者について予め定められている
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記プロセッサは、前記第2認証に成功した場合には、前記第2の音声の認識処理を行うサーバ装置に前記第2の音声を送信する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記プロセッサは、前記第2認証に失敗した場合には、前記第2の音声の認識処理を行うサーバ装置に前記第2の音声を送信しない
ことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
コンピュータに、
音声を用いた認証方法とは異なる他の認証方法による第1認証において識別された第1利用者の登録された第1の音声を取得するステップと、
操作において第2利用者が発した第2の音声を取得するステップと、
前記第1の音声の特徴と前記第2の音声の特徴とを比較して、前記第2利用者が前記第1認証において識別された前記第1利用者であることを確認する第2認証を行うステップと、
前記第2認証に成功すると、前記第2の音声に関連付けられた操作に応じて処理を実行するステップと、
前記第2認証に失敗すると、操作部を用いた操作を受け付けるステップと、
前記第2認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行するステップと、
前記第2認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信するステップと
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
音声を用いて利用者の認証や装置の操作を行う技術が知られている。例えば特許文献1には、利用者の音声を認識してキーワードを抽出し、このキーワードと声紋パターンファイルに登録されたキーワードとが一致すると、利用者と対話形式にやり取りを行い、利用者の音声の指示に従って画像形成の動作を行う技術が記載されている。特許文献2には、ユーザの音声を取得して声紋認証し、この音声を音声認識して得られたテキストデータに従って処理を実行する技術が記載されている。特許文献3には、人が近づいてくると音声を受信して音声認識を行ってコマンドを生成し、コマンドの実行に必要となる機能部に電力を供給させる技術が記載されている。特許文献4には、サービスセンタが移動機から通信網を介して商品等の発注内容を示す情報を含む音声データを受信すると、入力される音声データから発注内容を認識し、入力される音声データから商品等の発注を行ったユーザの本人認証を行う技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007-193138号公報
【特許文献2】特開2007-188001号公報
【特許文献3】特開2017-28355号公報
【特許文献4】特開2002-279245号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
利用者の認証後、音声を用いた操作が行われる場合がある。この場合、利用開始の際に利用者の認証を行うだけでは、一旦利用者が認証された後に、第三者がこの利用者になりすまして音声を用いた操作を行う虞がある。このような利用者のなりすましを抑制するには、例えば利用開始の際に利用者の認証を行うのに加えて、利用者が操作のために発した音声を用いて利用者の認証を行うことが考えられる。しかし、この場合に、例えば利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行うと、利用者の認証に要する処理の負荷が大きくなる。
操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第1認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制することを目的とする。
【課題を解決するための手段】
【0005】
請求項1に係る発明は、プロセッサを備え、前記プロセッサは、音声を用いた認証方法とは異なる他の認証方法による第1認証において識別された第1利用者の登録された第1の音声を取得し、操作において第2利用者が発した第2の音声を取得し、前記第1の音声の特徴と前記第2の音声の特徴とを比較して、前記第2利用者が前記第1認証において識別された前記第1利用者であることを確認する第2認証を行い、前記第2認証に成功すると、前記第2の音声に関連付けられた操作に応じて処理を実行し、前記第2認証に失敗すると、操作部を用いた操作を受け付け、前記第2認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行し、前記第2認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信することを特徴とする情報処理装置である。
【0006】
請求項2に係る発明は、請求項1に記載の情報処理装置において、前記第2の音声は、特定の操作に関連付けられており、前記第2の音声の特徴に前記第1の音声の特徴が含まれる場合には、前記第2認証が成功することを特徴とする。
【0007】
請求項3に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記第2の音声が前記処理に用いられる複数の設定値のうち一部の設定値を設定する操作に関連付けられている場合には、前記一部の設定値と予め定められた他の設定値とに従って、前記処理を実行することを特徴とする。
【0008】
請求項4に係る発明は、請求項3に記載の情報処理装置において、前記他の設定値は、前記第1認証において識別された前記第1利用者について予め定められていることを特徴とする。
【0009】
請求項5に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記第2認証に成功した場合には、前記第2の音声の認識処理を行うサーバ装置に前記第2の音声を送信することを特徴とする。
【0010】
請求項6に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記第2認証に失敗した場合には、前記第2の音声の認識処理を行うサーバ装置に前記第2の音声を送信しないことを特徴とする。
【0011】
請求項7に係る発明は、コンピュータに、音声を用いた認証方法とは異なる他の認証方法による第1認証において識別された第1利用者の登録された第1の音声を取得するステップと、操作において第2利用者が発した第2の音声を取得するステップと、前記第1の音声の特徴と前記第2の音声の特徴とを比較して、前記第2利用者が前記第1認証において識別された前記第1利用者であることを確認する第2認証を行うステップと、前記第2認証に成功すると、前記第2の音声に関連付けられた操作に応じて処理を実行するステップと、前記第2認証に失敗すると、操作部を用いた操作を受け付けるステップと、前記第2認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行するステップと、前記第2認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信するステップとを実行させるためのプログラムである。
【発明の効果】
【0012】
請求項1に係る発明によれば、操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第1認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。
請求項2に係る発明によれば、第2の音声が利用者が音声で行った複数の操作のうち特定の操作に関連付けられている場合でも、第2の音声から第1の音声に対応する部分を抽出して第2認証を行う構成に比して、第2認証の処理の負荷が軽減される。
請求項1、7に係る発明によれば、第2認証に失敗した場合に操作部を用いて行われた操作が分かる。
請求項3に係る発明によれば、利用者が処理に用いられる全ての設定値を設定する操作を音声で行わなくても、処理を実行することができる。
請求項4に係る発明によれば、利用者が処理に用いられる全ての設定値を設定する操作を音声で行わなくても、処理を実行することができる。
請求項5に係る発明によれば、サーバ装置に不要な音声が送信されるのが防止される。
請求項6に係る発明によれば、サーバ装置に不要な音声が送信されるのが防止される。
請求項7に係る発明によれば、操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第1認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。
【図面の簡単な説明】
【0013】
図1】実施形態に係る画像処理システム10の構成を示す図である。
図2】画像処理装置100の構成の一例を示す図である。
図3】サーバ装置200の一例を示す図である。
図4】音声認証辞書205の一例を示す図である。
図5】画像処理システム10の動作の一例を示すシーケンスチャートである。
図6】利用者の音声の周波数特性を示す画像21の一例を示す図である。
【発明を実施するための形態】
【0014】
1.構成
図1は、実施形態に係る画像処理システム10の構成を示す図である。画像処理システム10は、音声を用いて利用者を認証するとともに、音声を用いた利用者の操作を受け付ける。より詳細には、利用を開始する際に利用者の一次認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制するために、一次認証の後、利用者が操作を行うために発した音声を用いて二次認証が行われる。画像処理システム10は、画像処理装置100と、サーバ装置200とを備える。画像処理装置100とサーバ装置200とは、通信回線300を介して接続されている。通信回線300には、例えばインターネットが含まれる。
【0015】
図2は、画像処理装置100の構成の一例を示す図である。画像処理装置100は、コピー機能、プリント機能、スキャン機能等の画像を処理する複数の機能を有する機器である。また、画像処理装置100は、音声を用いて利用者の認証を行う機能を有する。画像処理装置100は、本発明に係る「情報処理装置」の一例である。画像処理装置100は、プロセッサ101と、メモリ102と、通信制御部103と、カードリーダ104と、マイクロフォン105と、操作部106と、表示部107と、画像処理部108と、画像読取部109と、画像形成部110とを備える。これらの部位は、バス111を介して接続されている。
【0016】
プロセッサ101は、プログラムを実行することにより、画像処理装置100の各部を制御し、画像処理装置100の機能を実現する処理を行う。プロセッサ101には、例えばCPU(Central Processing Unit)が用いられる。また、プロセッサ101は、プログラムを実行することにより、音声認証部112として機能する。音声認証部112は、音声を用いて利用者を認証する。メモリ102は、プロセッサ101が実行するプログラムを記憶している。メモリ102には、例えばRAM(Random Access Memory)及びROM(Read Only Memory)が用いられる。また、メモリ102には、HDD(Hard Disk Drive)やSSD(Solid State Drive)等のストレージが含まれてもよい。通信制御部103は、通信回線300を介して接続された他の装置とのデータ通信を制御する。他の装置には、サーバ装置200の他、利用者や管理者が使用する端末装置(図示せず)が含まれてもよい。
【0017】
カードリーダ104は、IC(Integrated Circuit)カードからカード情報を読み取る。このカード情報は、利用を開始する際に行われる一次認証に用いられる。カードリーダ104には、例えばNFC(Near Field Communication)リーダが用いられる。マイクロフォン105は、利用者が発した音声を取得する。この音声は、画像処理装置100の操作及び一次認証の後に行われる二次認証に用いられる。操作部106は、利用者の操作を受け付ける。操作部106は、二次認証に失敗した場合に、画像処理装置100の操作に用いられる。操作部106には、例えばタッチパネル及び操作ボタンが用いられる。表示部107は、利用者との情報のやり取りに用いられる各種の画面を表示する。表示部107には、例えば液晶ディスプレイが用いられる。画像処理部108は、画像に各種の画像処理を施す。画像処理部108には、例えば画像処理回路が用いられる。画像読取部109は、原稿画像を読み取ってデジタル形式の画像に変換する。画像読取部109によりスキャン機能が実現される。画像読取部109には、例えばイメージスキャナが用いられる。画像形成部110は、画像を媒体上に形成する。画像形成部110によりプリント機能が実現される。また、画像読取部109と画像形成部110とによりコピー機能が実現される。画像形成部110には、例えばプリンターが用いられる。
【0018】
図3は、サーバ装置200の一例を示す図である。サーバ装置200は、ICカードを用いた利用者の一次認証と、利用者の音声の内容を認識する音声認識処理とを行う。この音声認識処理は、既知の音声認識技術を用いて行われる。特に自然言語の音声認識処理は処理の負荷が大きいため、本実施形態では画像処理装置100ではなく処理の性能が高いサーバ装置200において音声認識処理が行われる。サーバ装置200は、プロセッサ201と、メモリ202と、通信制御部203とを備える。これらの部位は、バス204を介して接続されている。
【0019】
プロセッサ201は、プログラムを実行することにより、サーバ装置200の各部を制御し、サーバ装置200の機能を実現する処理を行う。プロセッサ201には、例えばCPUが用いられる。メモリ202は、プロセッサ201が実行するプログラムと、音声認識処理や利用者の認証に用いられる各種のデータとを記憶している。音声認識処理に用いられるデータには、自然言語辞書が含まれる。利用者の認証に用いられるデータには、音声認証辞書205が含まれる。メモリ202には、例えばRAM及びROMが用いられる。また、メモリ202には、HDDやSSD等のストレージが含まれてもよい。通信制御部203は、通信回線300を介して接続された画像処理装置100とのデータ通信を制御する。
【0020】
図4は、音声認証辞書205の一例を示す図である。音声認証辞書205は、利用者IDと、特定の操作に用いられる利用者の音声の特徴とが含まれる。利用者IDは、利用者を一意に識別する情報である。各利用者IDには、その利用者IDに対応する利用者の音声の特徴が関連付けられている。利用者の音声の特徴は、利用者が発した特定の操作に用いられる音声の特徴を示す。画像処理装置100においては、画像処理装置100が有する複数の機能の中から一の機能を選択する操作が必ず行われる。このような基本操作が特定の操作として用いられる。特定の操作には、予め操作語が定められている。例えば特定の操作の操作語には、画像処理装置100のコピー機能を選択する操作に用いられる「コピー」という操作語と、スキャン機能を選択する操作に用いられる「スキャン」という操作語と、プリント機能を選択する操作に用いられる「プリント」という操作語とが含まれる。この場合、利用者は、例えば画像処理装置100を利用する前に、「コピー」という操作語を示す音声と、「スキャン」という操作語を示す音声と、「プリント」という操作語を示す音声とを予め登録する。利用者により音声が登録されると、この音声がフーリエ変換され、周波数特性を示す画像が生成される。このようにして生成された画像と、利用者以外の不特定多数の人の音声をフーリエ変換して得られた周波数特性を示す画像とを機械学習することにより、利用者の音声の特徴が抽出される。音声の特徴は、例えば声紋である。なお、新たな利用者が追加された場合には、新たな利用者により登録された音声の特徴が音声認証辞書205に追加される。
【0021】
2.動作
以下の説明において、プロセッサ101又は102が処理の主体として記載される場合、それぞれ、メモリ102又は202に記憶されたプログラムと、このプログラムを実行するプロセッサ101又は102との協働により、プロセッサ101又は102が演算を行い又は他のハードウェア要素の動作を制御することにより、この処理が実現されることを示す。
【0022】
図5は、画像処理システム10の動作の一例を示すシーケンスチャートである。この動作は、例えば利用者が画像処理装置100を利用するときに開始される。画像処理装置100の利用を開始する際、利用者は、自分のICカードをカードリーダ104にかざす。ステップS11において、画像処理装置100のプロセッサ101はカードリーダ104によりこのICカードからカード情報を読み取る。これにより、カード情報が取得される。ステップS12において、プロセッサ101は、取得されたカード情報を通信制御部103によりサーバ装置200に送信する。
【0023】
ステップS13において、サーバ装置200のプロセッサ201は、通信制御部203によりカード情報を受信すると、このカード情報を用いて一次認証を行う。一次認証は、利用者の音声を用いた認証方法とは異なる他の認証方法により利用者が識別されるため、本発明に係る「第1認証」の一例である。メモリ202には予め、登録された利用者の利用者IDに関連付けて、その利用者のICカードに記録されたカード情報が記憶されている。利用者のICカードから取得されたカード情報が、メモリ202に記憶されたカード情報に含まれている場合、そのカード情報に関連付けられた利用者IDの利用者が識別され、一次認証は成功する。一次認証において識別された利用者は、本発明に係る「第1利用者」の一例である。一方、利用者のICカードから取得されたカード情報が、メモリ202に記憶されたカード情報に含まれていない場合、一次認証は失敗する。
【0024】
ステップS14において、プロセッサ201は、一次認証に成功したか否かを判定する。一次認証に失敗した場合(ステップS14の判定がNO)、プロセッサ201はステップS15に進み、一次認証に失敗したことを示す認証結果を画像処理装置100に送信する。この認証結果を受信すると、ステップS16において、画像処理装置100のプロセッサ101は、認証に失敗したことを示すメッセージを表示部107に表示させた後、以降の処理を行わずにこの動作を終了する。この場合、利用者は、画像処理装置100を利用することができない。
【0025】
一方、上述したステップS14において一次認証に成功した場合(ステップS14の判定がYES)、プロセッサ201はステップS17に進み、一次認証において識別された利用者の情報を通信制御部203により画像処理装置100に送信する。この利用者の情報には、利用者の音声認証情報と、利用者の電子メールアドレスとが含まれる。例えば一次認証において利用者Aが識別された場合、図4に示される音声認証辞書205から利用者Aの利用者IDに関連付けられた音声の特徴が抽出され、抽出された音声の特徴が利用者の音声認証情報として画像処理装置100に送信される。利用者の音声認証情報は、利用者の登録された音声の特徴を含むため、本発明に係る「第1の音声」の一例である。このとき、他の利用者の音声の特徴については画像処理装置100に送信されない。また、メモリ202には予め、各利用者の利用者IDと関連付けて、その利用者の電子メールアドレスが記憶されている。例えば一次認証において利用者Aが識別された場合、利用者Aの利用者IDに関連付けられた電子メールアドレスが画像処理装置100に送信される。
【0026】
ステップS18において、画像処理装置100のプロセッサ101は、通信制御部103により利用者の情報を受信すると、この利用者の情報に含まれる音声認証情報を音声認証部112に設定する。ステップS19において、プロセッサ101は、音声を用いた操作を促すメッセージを表示部107に表示させる。利用者は、音声を用いて画像処理装置100を操作する。この操作において音声を発する利用者は、本発明に係る「第2利用者」の一例である。この操作に用いられる音声には、例えば機能を選択する特定の操作の操作語と、機能の設定値を設定する操作の操作語とが含まれる。利用者が音声で発する言葉は、自然言語であってもよい。例えば原稿画像をカラーで三枚コピーする場合、利用者は「カラーコピーを三枚」という音声を発する。ステップS20において、プロセッサ101は、利用者が発した音声をマイクロフォン105により取得する。この音声は、本発明に係る「第2の音声」の一例である。取得された利用者の音声は、メモリ102に記憶される。
【0027】
ステップS21において、プロセッサ101は、取得された利用者の音声を用いて二次認証を行う。この二次認証では、画像処理装置100を音声で操作する利用者が、一次認証において識別された利用者であることが確認される。この二次認証は、本発明に係る「第2認証」の一例である。例えば、まず利用者の音声がフーリエ変換され、周波数特性を示す画像21が生成される。図6は、利用者の音声の周波数特性を示す画像21の一例を示す図である。続いて、生成された画像21が示す音声の特徴と、利用者の音声認証情報に含まれる音声の特徴とが比較される。図6に示す例では、画像21が示す音声の特徴には、利用者の音声認証情報に含まれる「コピー」という音声の特徴が含まれる。この場合、二次認証は成功する。一方、画像21が示す音声の特徴に利用者の音声認証情報に含まれるいずれの操作語を示す音声の特徴も含まれない場合には、二次認証は失敗する。
【0028】
ステップS22において、プロセッサ101は、二次認証に成功したか否かを判定する。二次認証に失敗した場合(ステップS22の判定がNO)、プロセッサ101はステップS23に進み、手動操作を促すメッセージを表示部107に表示させる。この場合、利用者は、操作部106を用いて画像処理装置100を操作する。例えば操作部106を用いて原稿画像をカラーで三枚コピーすることを指示する操作を行う。ステップS24において、プロセッサ101は、操作部106を用いた利用者の手動操作を受け付ける。ステップS25において、プロセッサ101は、この手動操作に従って処理を実行する。例えば画像読取部109及び画像形成部110により原稿画像がカラーで三枚コピーされる。ステップS26において、プロセッサ101は、操作部106を用いた手動操作の内容を示す操作情報を利用者の電子メールアドレス宛に送信する。この操作情報には、手動操作に応じて処理された画像を示す画像情報が含まれてもよい。この電子メールアドレスは、サーバ装置200から受信した利用者の情報に含まれる。この電子メールアドレスは、本発明に係る「予め定められた送信先」の一例である。
【0029】
このように、二次認証に失敗した場合にも、利用者の操作に応じた処理が実行されるのは、一次認証には成功しているため、例えば風邪をひいた場合や喉の調子が悪い場合等、利用者の音声が一時的に登録の際の音声と異なる場合に画像処理装置100が利用できなくなると、利便性が悪くなるためである。ただし、この場合には、利用者が行った操作の内容を示す操作情報が利用者の電子メールアドレス宛に送信されるため、仮に第三者が利用者になりすまして画像処理装置100を操作した場合に、利用者は第三者が自分になりすまして不正な操作を行ったことが分かる。
【0030】
一方、上述したステップS22において二次認証に成功した場合(ステップS22の判定がYES)、プロセッサ101はステップS27に進み、メモリ102に記憶された利用者の音声を通信制御部103によりサーバ装置200に送信する。すなわち、利用者の音声は、二次認証に成功した場合に限り、サーバ装置200に送信される。二次認証に失敗した場合には、利用者の音声はサーバ装置200に送信されない。
【0031】
ステップS28において、サーバ装置200のプロセッサ201は、通信制御部203により利用者の音声を受信すると、この音声に音声認識処理を施す。音声認識処理では、音声をテキストに変換され、自然言語辞書を用いて音声の内容を認識することにより、操作語が抽出される。そして、この操作語に応じて操作コマンドが生成される。メモリ202には予め、各操作語と関連付けて操作コマンドが記憶されている。この関連付けに基づいて、操作語から操作コマンドが生成される。例えば「カラーコピーを三枚」という音声から「カラー」という操作語と「コピー」という操作語と「三枚」という操作語とが抽出された場合、原稿画像をカラーで三枚コピーすることを指示する操作コマンドが生成される。
【0032】
ここで、コピー処理の設定には、枚数や色以外にも、原稿の読み取り面や解像度等の複数の設定値が存在する。しかし、利用者は、これらの設定値の一部を設定する操作の操作語だけを音声で発する場合がある、この場合、利用者の音声には、一部の設定値を設定する操作の操作語だけが含まれ、他の設定値を設定する操作の操作語は含まれない。そこで、利用者の音声に含まれない操作語に対応する設定値については、予め定められた設定値が用いられる。この設定値は、例えば初期値であってもよいし、利用者により予め定められた設定値であってもよい。利用者により予め定められた設定値は、例えば予めサーバ装置200のメモリ202に記憶され、利用者の情報としてサーバ装置200から画像処理装置100に送信されてもよい。この場合、利用者の音声に含まれる操作語に対応する一部の設定値と予め定められた他の設定値とに基づいて、操作コマンドが生成される。例えば利用者が操作において「カラーコピーを三枚」という音声を発した場合において、予め定められた原稿の読み取り面が片面であり、解像度が200dpiであるときは、原稿画像の片面を200dpi、カラーで三枚コピーすることを指示する操作コマンドが生成される。
【0033】
ステップS29において、プロセッサ201は、生成された操作コマンドを通信制御部203により画像処理装置100に送信する。ステップS30において、画像処理装置100のプロセッサ101は、通信制御部103により操作コマンドを受信すると、この操作コマンドに従って処理を実行する。例えば操作コマンドに従って、画像読取部109及び画像形成部110により、原稿画像の片面を200dpi、カラーで三枚コピーする処理が行われる。処理が完了すると、この動作は終了する。
【0034】
以上説明した実施形態によれば、一次認証が行われた後、利用者が操作において発した音声を用いて二次認証が行われるため、一次認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。また、一次認証において識別された利用者の音声認証情報を用いて二次認証が行われるため、音声認証辞書205に含まれる全利用者の音声の特徴と照合して二次認証を行う構成に比して、二次認証の処理の負荷が軽減され、二次認証に要する時間が短くなる。また、二次認証では、音声認証辞書205に含まれる全利用者の音声の特徴と照合してどの利用者の音声であるかを識別するのではなく、一次認証において識別された利用者の音声認証情報に含まれる音声の特徴と照合して、この利用者の音声であるか否かを判定すればよいため、二次認証の処理の負荷が軽減され、二次認証に要する時間が短くなるとともに、誤認証が減る。このように、二次認証の処理の負荷が軽減されることにより、画像処理装置100において二次認証を行い得る。また、利用者の音声認識情報を用いて二次認証が行われるため、新たな利用者が追加された場合には、新たな利用者の音声を登録するだけでよく、既存の利用者の音声を機械学習し直さなくてもよい。
【0035】
また、特定の操作の操作語を示す利用者の音声の特徴に、予め登録された、特定の操作の操作語を示す利用者の音声の特徴が含まれる場合には二次認証が成功するため、例えば利用者の音声を単語単位に分割し、分割された単語の中から特定の操作の操作語を抽出する処理を行わなくてもよい。従って、このような処理を行う構成に比して、二次認証の処理の負荷が軽減される。さらに、利用者の音声に処理に用いられる複数の設定値のうち一部の設定値を設定する操作の操作語だけが含まれている場合にも、一部の設定値と予め定められた他の設定値とに基づいて操作コマンドが生成されるため、利用者が処理に用いられる全ての設定値を設定する操作を音声で行わなくても、処理を実行することができる。
【0036】
さらに、二次認証に失敗した場合には、利用者が操作部106を用いて行った操作の内容を示す操作情報が利用者の電子メールアドレス宛に送信されるため、二次認証に失敗した場合に操作部106を用いて行われた操作が分かる。さらに、二次認証に失敗した場合には、利用者の音声がサーバ装置200に送信されないため、サーバ装置200に不要な音声が送信されるのが防止される。この場合、利用者の音声が画像処理装置100の外部に出力されないため、情報セキュリティが強化される。
【0037】
3.変形例
本発明は、上述した実施形態に限定されない。上述した実施形態は以下の例のように変形して実施されてもよい。このとき、以下の2以上の変形例が組み合わせて実施されてもよい。
【0038】
上述した実施形態において、一次認証の認証方法は、ICカードを用いた認証方法に限定されない。一次認証の認証方法は、利用者の音声を用いた認証方法とは異なる他の認証方法、すなわち利用者の音声を用いない認証方法であれば、どのような認証方法であってもよい。例えば一次認証の認証方法は、カメラにより撮影された利用者の顔画像を用いた認証方法や、指紋、瞳の中の虹彩、手の静脈等の利用者の生体情報を用いた認証方法であってもよい。
【0039】
上述した実施形態において、二次認証に失敗した場合に、操作部106を用いた利用者の操作の内容を示す操作情報が送信される送信先は、利用者の電子メールアドレスに限定されない。例えばこの操作情報の送信先は、画像処理装置100の管理者が使用する端末装置であってもよい。また、二次認証に失敗した場合に、必ずしも処理の実行が許可されなくてもよい。例えば二次認証に失敗した場合に、処理の実行が禁止されてもよい。
【0040】
上述した実施形態において、一の操作に複数の操作語が定められていてもよい。例えばプリント機能を選択する操作を行う場合に、利用者によっては「プリント」という音声を発したり、「印刷」という音声を発したりする場合がある。いずれの場合にも、プリント機能を選択する操作が行われるように、プリント機能を選択する操作には、「プリント」という操作語と「印刷」という操作語との両方が関連付けられていてもよい。また、この場合、利用者が「プリント」という音声と「印刷」という音声のいずれを発した場合にも二次認証が行われるように、利用者は予め「プリント」という操作語を示す音声と「印刷」という操作語を示す音声の両方を登録する。この場合、音声認証辞書205には、「プリント」という操作語を示す音声の特徴と、「印刷」という操作語を示す音声の特徴とが両方とも含まれる。
【0041】
上述した実施形態において、本発明に係る情報処理装置は、画像処理装置100に限定されない。本発明に係る情報処理装置は、プリンター、イメージスキャナ、コピー機、ファクシミリ機、スマートフォン、タブレット端末、パーソナルコンピュータ、オーディオ機器、ゲーム機等、音声を用いた認証を行うとともに音声を用いた操作を受け付ける装置であれば、どのような装置であってもよい。この場合、特定の操作は、情報処理装置を用いて処理を実行するときに、利用者が必ず行う操作であることが好ましい。例えばパーソナルコンピュータにおいては、処理を実行する際に、ファイルを開く操作が必ず行われる。この場合、特定の操作は、ファイルを開く操作であってもよい。また、特定の操作の操作語は、人、時間、又は場所によってばらつきが少ない言葉であることが好ましい。
【0042】
上述した実施形態において、画像処理装置100の構成は例示であり、この例に限定されない。例えば音声認証部112は、プロセッサ101に代えて、専用回路により実現されてもよい。また、画像処理装置100とサーバ装置200とは、必ずしも別々に設けられなくてもよい。例えば画像処理装置100がサーバ装置200の機能を有していてもよい。この場合、サーバ装置200は設けられなくてもよい。
【0043】
上述した実施形態において、画像処理装置100において行われる処理の少なくとも一部が他の装置において行われてもよい。さらに、上述した画像処理装置100の処理の順序は例示であり、矛盾の無い限り、順序を入れ替えてもよい。
【0044】
上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス等)を含むものである。
【0045】
また上記実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
【0046】
本発明は、画像処理装置100において実行されるプログラムとして提供されてもよい。画像処理装置100は、本発明に係る「コンピュータ」の一例である。このプログラムは、インターネットなどの通信回線を介してダウンロードされてもよいし、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供されてもよい。
【符号の説明】
【0047】
10:画像処理システム、100:画像処理装置、101:プロセッサ、102:メモリ、103:通信制御部、104:カードリーダ、105:マイクロフォン、106:操作部、107:表示部、108:画像処理部、109:画像読取部、110:画像形成部、112:音声認証部、200:サーバ装置、201:プロセッサ、202:メモリ、203:通信制御部
図1
図2
図3
図4
図5
図6