特開2024-74811 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

特開2024-74811情報処理装置及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024074811

(43)【公開日】2024-05-31

(54)【発明の名称】情報処理装置及びプログラム

(51)【国際特許分類】

G06F 21/32 20130101AFI20240524BHJP

G10L 17/00 20130101ALI20240524BHJP

G06V 40/10 20220101ALI20240524BHJP

H04N 1/00 20060101ALI20240524BHJP

【ＦＩ】

G06F21/32

G10L17/00 400

G06V40/10

H04N1/00 350

【審査請求】有

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2024038082

(22)【出願日】2024-03-12

(62)【分割の表示】P 2020110697の分割

【原出願日】2020-06-26

(71)【出願人】

【識別番号】000005496

【氏名又は名称】富士フイルムビジネスイノベーション株式会社

(74)【代理人】

【識別番号】110000752

【氏名又は名称】弁理士法人朝日特許事務所

(72)【発明者】

【氏名】秋山実

(57)【要約】

【課題】操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第１認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制する情報処理装置及びプログラムを提供する。
【解決手段】画像処理システムにおいて、情報処理装置はプロセッサを備える。プロセッサは、音声を用いた認証方法とは異なる他の認証方法による第１認証において識別された第１利用者の登録された第１の音声を取得し、操作において第２利用者が発した第２の音声を取得し、第１の音声の特徴と第２の音声の特徴とを比較して、第２利用者が第１認証において識別された第１利用者であることを確認する第２認証を行い、第２認証に成功すると、第２の音声に関連付けられた操作に応じて処理を実行する。
【選択図】図５

【特許請求の範囲】

【請求項1】

プロセッサを備え、
前記プロセッサは、
音声を用いた認証方法とは異なる他の認証方法による第１認証において識別された第１利用者の登録された第１の音声を取得し、
操作において第２利用者が発した第２の音声を取得し、
前記第１の音声の特徴と前記第２の音声の特徴とを比較して、前記第２利用者が前記第１認証において識別された前記第１利用者であることを確認する第２認証を行い、
前記第２認証に成功すると、前記第２の音声に関連付けられた操作に応じて処理を実行し、
前記第２認証に失敗すると、操作部を用いた操作を受け付け、
前記第２認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行し、
前記第２認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信する
ことを特徴とする情報処理装置。

【請求項2】

前記第２の音声は、特定の操作に関連付けられており、
前記第２の音声の特徴に前記第１の音声の特徴が含まれる場合には、前記第２認証が成功する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記プロセッサは、前記第２の音声が前記処理に用いられる複数の設定値のうち一部の設定値を設定する操作に関連付けられている場合には、前記一部の設定値と予め定められた他の設定値とに従って、前記処理を実行する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項4】

前記他の設定値は、前記第１認証において識別された前記第１利用者について予め定められている
ことを特徴とする請求項３に記載の情報処理装置。

【請求項5】

前記プロセッサは、前記第２認証に成功した場合には、前記第２の音声の認識処理を行うサーバ装置に前記第２の音声を送信する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項6】

前記プロセッサは、前記第２認証に失敗した場合には、前記第２の音声の認識処理を行うサーバ装置に前記第２の音声を送信しない
ことを特徴とする請求項１に記載の情報処理装置。

【請求項7】

コンピュータに、
音声を用いた認証方法とは異なる他の認証方法による第１認証において識別された第１利用者の登録された第１の音声を取得するステップと、
操作において第２利用者が発した第２の音声を取得するステップと、
前記第１の音声の特徴と前記第２の音声の特徴とを比較して、前記第２利用者が前記第１認証において識別された前記第１利用者であることを確認する第２認証を行うステップと、
前記第２認証に成功すると、前記第２の音声に関連付けられた操作に応じて処理を実行するステップと、
前記第２認証に失敗すると、操作部を用いた操作を受け付けるステップと、
前記第２認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行するステップと、
前記第２認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信するステップと
を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置及びプログラムに関する。

【背景技術】

【0002】

音声を用いて利用者の認証や装置の操作を行う技術が知られている。例えば特許文献１には、利用者の音声を認識してキーワードを抽出し、このキーワードと声紋パターンファイルに登録されたキーワードとが一致すると、利用者と対話形式にやり取りを行い、利用者の音声の指示に従って画像形成の動作を行う技術が記載されている。特許文献２には、ユーザの音声を取得して声紋認証し、この音声を音声認識して得られたテキストデータに従って処理を実行する技術が記載されている。特許文献３には、人が近づいてくると音声を受信して音声認識を行ってコマンドを生成し、コマンドの実行に必要となる機能部に電力を供給させる技術が記載されている。特許文献４には、サービスセンタが移動機から通信網を介して商品等の発注内容を示す情報を含む音声データを受信すると、入力される音声データから発注内容を認識し、入力される音声データから商品等の発注を行ったユーザの本人認証を行う技術が記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００７－１９３１３８号公報

【特許文献2】特開２００７－１８８００１号公報

【特許文献3】特開２０１７－２８３５５号公報

【特許文献4】特開２００２－２７９２４５号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

利用者の認証後、音声を用いた操作が行われる場合がある。この場合、利用開始の際に利用者の認証を行うだけでは、一旦利用者が認証された後に、第三者がこの利用者になりすまして音声を用いた操作を行う虞がある。このような利用者のなりすましを抑制するには、例えば利用開始の際に利用者の認証を行うのに加えて、利用者が操作のために発した音声を用いて利用者の認証を行うことが考えられる。しかし、この場合に、例えば利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行うと、利用者の認証に要する処理の負荷が大きくなる。
操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第１認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制することを目的とする。

【課題を解決するための手段】

【0005】

請求項１に係る発明は、プロセッサを備え、前記プロセッサは、音声を用いた認証方法とは異なる他の認証方法による第１認証において識別された第１利用者の登録された第１の音声を取得し、操作において第２利用者が発した第２の音声を取得し、前記第１の音声の特徴と前記第２の音声の特徴とを比較して、前記第２利用者が前記第１認証において識別された前記第１利用者であることを確認する第２認証を行い、前記第２認証に成功すると、前記第２の音声に関連付けられた操作に応じて処理を実行し、前記第２認証に失敗すると、操作部を用いた操作を受け付け、前記第２認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行し、前記第２認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信することを特徴とする情報処理装置である。

【0006】

請求項２に係る発明は、請求項１に記載の情報処理装置において、前記第２の音声は、特定の操作に関連付けられており、前記第２の音声の特徴に前記第１の音声の特徴が含まれる場合には、前記第２認証が成功することを特徴とする。

【0007】

請求項３に係る発明は、請求項１に記載の情報処理装置において、前記プロセッサは、前記第２の音声が前記処理に用いられる複数の設定値のうち一部の設定値を設定する操作に関連付けられている場合には、前記一部の設定値と予め定められた他の設定値とに従って、前記処理を実行することを特徴とする。

【0008】

請求項４に係る発明は、請求項３に記載の情報処理装置において、前記他の設定値は、前記第１認証において識別された前記第１利用者について予め定められていることを特徴とする。

【0009】

請求項５に係る発明は、請求項１に記載の情報処理装置において、前記プロセッサは、前記第２認証に成功した場合には、前記第２の音声の認識処理を行うサーバ装置に前記第２の音声を送信することを特徴とする。

【0010】

請求項６に係る発明は、請求項１に記載の情報処理装置において、前記プロセッサは、前記第２認証に失敗した場合には、前記第２の音声の認識処理を行うサーバ装置に前記第２の音声を送信しないことを特徴とする。

【0011】

請求項７に係る発明は、コンピュータに、音声を用いた認証方法とは異なる他の認証方法による第１認証において識別された第１利用者の登録された第１の音声を取得するステップと、操作において第２利用者が発した第２の音声を取得するステップと、前記第１の音声の特徴と前記第２の音声の特徴とを比較して、前記第２利用者が前記第１認証において識別された前記第１利用者であることを確認する第２認証を行うステップと、前記第２認証に成功すると、前記第２の音声に関連付けられた操作に応じて処理を実行するステップと、前記第２認証に失敗すると、操作部を用いた操作を受け付けるステップと、前記第２認証に失敗した場合には、前記操作部を用いた前記操作に応じて処理を実行するステップと、前記第２認証に失敗した場合には、前記操作部を用いた前記操作を示す操作情報を予め定められた送信先に送信するステップとを実行させるためのプログラムである。

【発明の効果】

【0012】

請求項１に係る発明によれば、操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第１認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。
請求項２に係る発明によれば、第２の音声が利用者が音声で行った複数の操作のうち特定の操作に関連付けられている場合でも、第２の音声から第１の音声に対応する部分を抽出して第２認証を行う構成に比して、第２認証の処理の負荷が軽減される。
請求項１、７に係る発明によれば、第２認証に失敗した場合に操作部を用いて行われた操作が分かる。
請求項３に係る発明によれば、利用者が処理に用いられる全ての設定値を設定する操作を音声で行わなくても、処理を実行することができる。
請求項４に係る発明によれば、利用者が処理に用いられる全ての設定値を設定する操作を音声で行わなくても、処理を実行することができる。
請求項５に係る発明によれば、サーバ装置に不要な音声が送信されるのが防止される。
請求項６に係る発明によれば、サーバ装置に不要な音声が送信されるのが防止される。
請求項７に係る発明によれば、操作に用いられる利用者の音声を全利用者の音声の特徴と照合して利用者の認証を行う構成に比して、少ない処理の負荷で、利用者の第１認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。

【図面の簡単な説明】

【0013】

【図1】実施形態に係る画像処理システム１０の構成を示す図である。

【図2】画像処理装置１００の構成の一例を示す図である。

【図3】サーバ装置２００の一例を示す図である。

【図4】音声認証辞書２０５の一例を示す図である。

【図5】画像処理システム１０の動作の一例を示すシーケンスチャートである。

【図6】利用者の音声の周波数特性を示す画像２１の一例を示す図である。

【発明を実施するための形態】

【0014】

１．構成
図１は、実施形態に係る画像処理システム１０の構成を示す図である。画像処理システム１０は、音声を用いて利用者を認証するとともに、音声を用いた利用者の操作を受け付ける。より詳細には、利用を開始する際に利用者の一次認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制するために、一次認証の後、利用者が操作を行うために発した音声を用いて二次認証が行われる。画像処理システム１０は、画像処理装置１００と、サーバ装置２００とを備える。画像処理装置１００とサーバ装置２００とは、通信回線３００を介して接続されている。通信回線３００には、例えばインターネットが含まれる。

【0015】

図２は、画像処理装置１００の構成の一例を示す図である。画像処理装置１００は、コピー機能、プリント機能、スキャン機能等の画像を処理する複数の機能を有する機器である。また、画像処理装置１００は、音声を用いて利用者の認証を行う機能を有する。画像処理装置１００は、本発明に係る「情報処理装置」の一例である。画像処理装置１００は、プロセッサ１０１と、メモリ１０２と、通信制御部１０３と、カードリーダ１０４と、マイクロフォン１０５と、操作部１０６と、表示部１０７と、画像処理部１０８と、画像読取部１０９と、画像形成部１１０とを備える。これらの部位は、バス１１１を介して接続されている。

【0016】

プロセッサ１０１は、プログラムを実行することにより、画像処理装置１００の各部を制御し、画像処理装置１００の機能を実現する処理を行う。プロセッサ１０１には、例えばＣＰＵ（Central Processing Unit）が用いられる。また、プロセッサ１０１は、プログラムを実行することにより、音声認証部１１２として機能する。音声認証部１１２は、音声を用いて利用者を認証する。メモリ１０２は、プロセッサ１０１が実行するプログラムを記憶している。メモリ１０２には、例えばＲＡＭ（Random Access Memory）及びＲＯＭ（Read Only Memory）が用いられる。また、メモリ１０２には、ＨＤＤ（Hard Disk Drive）やＳＳＤ（Solid State Drive）等のストレージが含まれてもよい。通信制御部１０３は、通信回線３００を介して接続された他の装置とのデータ通信を制御する。他の装置には、サーバ装置２００の他、利用者や管理者が使用する端末装置（図示せず）が含まれてもよい。

【0017】

カードリーダ１０４は、ＩＣ（Integrated Circuit）カードからカード情報を読み取る。このカード情報は、利用を開始する際に行われる一次認証に用いられる。カードリーダ１０４には、例えばＮＦＣ（Near Field Communication）リーダが用いられる。マイクロフォン１０５は、利用者が発した音声を取得する。この音声は、画像処理装置１００の操作及び一次認証の後に行われる二次認証に用いられる。操作部１０６は、利用者の操作を受け付ける。操作部１０６は、二次認証に失敗した場合に、画像処理装置１００の操作に用いられる。操作部１０６には、例えばタッチパネル及び操作ボタンが用いられる。表示部１０７は、利用者との情報のやり取りに用いられる各種の画面を表示する。表示部１０７には、例えば液晶ディスプレイが用いられる。画像処理部１０８は、画像に各種の画像処理を施す。画像処理部１０８には、例えば画像処理回路が用いられる。画像読取部１０９は、原稿画像を読み取ってデジタル形式の画像に変換する。画像読取部１０９によりスキャン機能が実現される。画像読取部１０９には、例えばイメージスキャナが用いられる。画像形成部１１０は、画像を媒体上に形成する。画像形成部１１０によりプリント機能が実現される。また、画像読取部１０９と画像形成部１１０とによりコピー機能が実現される。画像形成部１１０には、例えばプリンターが用いられる。

【0018】

図３は、サーバ装置２００の一例を示す図である。サーバ装置２００は、ＩＣカードを用いた利用者の一次認証と、利用者の音声の内容を認識する音声認識処理とを行う。この音声認識処理は、既知の音声認識技術を用いて行われる。特に自然言語の音声認識処理は処理の負荷が大きいため、本実施形態では画像処理装置１００ではなく処理の性能が高いサーバ装置２００において音声認識処理が行われる。サーバ装置２００は、プロセッサ２０１と、メモリ２０２と、通信制御部２０３とを備える。これらの部位は、バス２０４を介して接続されている。

【0019】

プロセッサ２０１は、プログラムを実行することにより、サーバ装置２００の各部を制御し、サーバ装置２００の機能を実現する処理を行う。プロセッサ２０１には、例えばＣＰＵが用いられる。メモリ２０２は、プロセッサ２０１が実行するプログラムと、音声認識処理や利用者の認証に用いられる各種のデータとを記憶している。音声認識処理に用いられるデータには、自然言語辞書が含まれる。利用者の認証に用いられるデータには、音声認証辞書２０５が含まれる。メモリ２０２には、例えばＲＡＭ及びＲＯＭが用いられる。また、メモリ２０２には、ＨＤＤやＳＳＤ等のストレージが含まれてもよい。通信制御部２０３は、通信回線３００を介して接続された画像処理装置１００とのデータ通信を制御する。

【0020】

図４は、音声認証辞書２０５の一例を示す図である。音声認証辞書２０５は、利用者ＩＤと、特定の操作に用いられる利用者の音声の特徴とが含まれる。利用者ＩＤは、利用者を一意に識別する情報である。各利用者ＩＤには、その利用者ＩＤに対応する利用者の音声の特徴が関連付けられている。利用者の音声の特徴は、利用者が発した特定の操作に用いられる音声の特徴を示す。画像処理装置１００においては、画像処理装置１００が有する複数の機能の中から一の機能を選択する操作が必ず行われる。このような基本操作が特定の操作として用いられる。特定の操作には、予め操作語が定められている。例えば特定の操作の操作語には、画像処理装置１００のコピー機能を選択する操作に用いられる「コピー」という操作語と、スキャン機能を選択する操作に用いられる「スキャン」という操作語と、プリント機能を選択する操作に用いられる「プリント」という操作語とが含まれる。この場合、利用者は、例えば画像処理装置１００を利用する前に、「コピー」という操作語を示す音声と、「スキャン」という操作語を示す音声と、「プリント」という操作語を示す音声とを予め登録する。利用者により音声が登録されると、この音声がフーリエ変換され、周波数特性を示す画像が生成される。このようにして生成された画像と、利用者以外の不特定多数の人の音声をフーリエ変換して得られた周波数特性を示す画像とを機械学習することにより、利用者の音声の特徴が抽出される。音声の特徴は、例えば声紋である。なお、新たな利用者が追加された場合には、新たな利用者により登録された音声の特徴が音声認証辞書２０５に追加される。

【0021】

２．動作
以下の説明において、プロセッサ１０１又は１０２が処理の主体として記載される場合、それぞれ、メモリ１０２又は２０２に記憶されたプログラムと、このプログラムを実行するプロセッサ１０１又は１０２との協働により、プロセッサ１０１又は１０２が演算を行い又は他のハードウェア要素の動作を制御することにより、この処理が実現されることを示す。

【0022】

図５は、画像処理システム１０の動作の一例を示すシーケンスチャートである。この動作は、例えば利用者が画像処理装置１００を利用するときに開始される。画像処理装置１００の利用を開始する際、利用者は、自分のＩＣカードをカードリーダ１０４にかざす。ステップＳ１１において、画像処理装置１００のプロセッサ１０１はカードリーダ１０４によりこのＩＣカードからカード情報を読み取る。これにより、カード情報が取得される。ステップＳ１２において、プロセッサ１０１は、取得されたカード情報を通信制御部１０３によりサーバ装置２００に送信する。

【0023】

ステップＳ１３において、サーバ装置２００のプロセッサ２０１は、通信制御部２０３によりカード情報を受信すると、このカード情報を用いて一次認証を行う。一次認証は、利用者の音声を用いた認証方法とは異なる他の認証方法により利用者が識別されるため、本発明に係る「第１認証」の一例である。メモリ２０２には予め、登録された利用者の利用者ＩＤに関連付けて、その利用者のＩＣカードに記録されたカード情報が記憶されている。利用者のＩＣカードから取得されたカード情報が、メモリ２０２に記憶されたカード情報に含まれている場合、そのカード情報に関連付けられた利用者ＩＤの利用者が識別され、一次認証は成功する。一次認証において識別された利用者は、本発明に係る「第１利用者」の一例である。一方、利用者のＩＣカードから取得されたカード情報が、メモリ２０２に記憶されたカード情報に含まれていない場合、一次認証は失敗する。

【0024】

ステップＳ１４において、プロセッサ２０１は、一次認証に成功したか否かを判定する。一次認証に失敗した場合（ステップＳ１４の判定がＮＯ）、プロセッサ２０１はステップＳ１５に進み、一次認証に失敗したことを示す認証結果を画像処理装置１００に送信する。この認証結果を受信すると、ステップＳ１６において、画像処理装置１００のプロセッサ１０１は、認証に失敗したことを示すメッセージを表示部１０７に表示させた後、以降の処理を行わずにこの動作を終了する。この場合、利用者は、画像処理装置１００を利用することができない。

【0025】

一方、上述したステップＳ１４において一次認証に成功した場合（ステップＳ１４の判定がＹＥＳ）、プロセッサ２０１はステップＳ１７に進み、一次認証において識別された利用者の情報を通信制御部２０３により画像処理装置１００に送信する。この利用者の情報には、利用者の音声認証情報と、利用者の電子メールアドレスとが含まれる。例えば一次認証において利用者Ａが識別された場合、図４に示される音声認証辞書２０５から利用者Ａの利用者ＩＤに関連付けられた音声の特徴が抽出され、抽出された音声の特徴が利用者の音声認証情報として画像処理装置１００に送信される。利用者の音声認証情報は、利用者の登録された音声の特徴を含むため、本発明に係る「第１の音声」の一例である。このとき、他の利用者の音声の特徴については画像処理装置１００に送信されない。また、メモリ２０２には予め、各利用者の利用者ＩＤと関連付けて、その利用者の電子メールアドレスが記憶されている。例えば一次認証において利用者Ａが識別された場合、利用者Ａの利用者ＩＤに関連付けられた電子メールアドレスが画像処理装置１００に送信される。

【0026】

ステップＳ１８において、画像処理装置１００のプロセッサ１０１は、通信制御部１０３により利用者の情報を受信すると、この利用者の情報に含まれる音声認証情報を音声認証部１１２に設定する。ステップＳ１９において、プロセッサ１０１は、音声を用いた操作を促すメッセージを表示部１０７に表示させる。利用者は、音声を用いて画像処理装置１００を操作する。この操作において音声を発する利用者は、本発明に係る「第２利用者」の一例である。この操作に用いられる音声には、例えば機能を選択する特定の操作の操作語と、機能の設定値を設定する操作の操作語とが含まれる。利用者が音声で発する言葉は、自然言語であってもよい。例えば原稿画像をカラーで三枚コピーする場合、利用者は「カラーコピーを三枚」という音声を発する。ステップＳ２０において、プロセッサ１０１は、利用者が発した音声をマイクロフォン１０５により取得する。この音声は、本発明に係る「第２の音声」の一例である。取得された利用者の音声は、メモリ１０２に記憶される。

【0027】

ステップＳ２１において、プロセッサ１０１は、取得された利用者の音声を用いて二次認証を行う。この二次認証では、画像処理装置１００を音声で操作する利用者が、一次認証において識別された利用者であることが確認される。この二次認証は、本発明に係る「第２認証」の一例である。例えば、まず利用者の音声がフーリエ変換され、周波数特性を示す画像２１が生成される。図６は、利用者の音声の周波数特性を示す画像２１の一例を示す図である。続いて、生成された画像２１が示す音声の特徴と、利用者の音声認証情報に含まれる音声の特徴とが比較される。図６に示す例では、画像２１が示す音声の特徴には、利用者の音声認証情報に含まれる「コピー」という音声の特徴が含まれる。この場合、二次認証は成功する。一方、画像２１が示す音声の特徴に利用者の音声認証情報に含まれるいずれの操作語を示す音声の特徴も含まれない場合には、二次認証は失敗する。

【0028】

ステップＳ２２において、プロセッサ１０１は、二次認証に成功したか否かを判定する。二次認証に失敗した場合（ステップＳ２２の判定がＮＯ）、プロセッサ１０１はステップＳ２３に進み、手動操作を促すメッセージを表示部１０７に表示させる。この場合、利用者は、操作部１０６を用いて画像処理装置１００を操作する。例えば操作部１０６を用いて原稿画像をカラーで三枚コピーすることを指示する操作を行う。ステップＳ２４において、プロセッサ１０１は、操作部１０６を用いた利用者の手動操作を受け付ける。ステップＳ２５において、プロセッサ１０１は、この手動操作に従って処理を実行する。例えば画像読取部１０９及び画像形成部１１０により原稿画像がカラーで三枚コピーされる。ステップＳ２６において、プロセッサ１０１は、操作部１０６を用いた手動操作の内容を示す操作情報を利用者の電子メールアドレス宛に送信する。この操作情報には、手動操作に応じて処理された画像を示す画像情報が含まれてもよい。この電子メールアドレスは、サーバ装置２００から受信した利用者の情報に含まれる。この電子メールアドレスは、本発明に係る「予め定められた送信先」の一例である。

【0029】

このように、二次認証に失敗した場合にも、利用者の操作に応じた処理が実行されるのは、一次認証には成功しているため、例えば風邪をひいた場合や喉の調子が悪い場合等、利用者の音声が一時的に登録の際の音声と異なる場合に画像処理装置１００が利用できなくなると、利便性が悪くなるためである。ただし、この場合には、利用者が行った操作の内容を示す操作情報が利用者の電子メールアドレス宛に送信されるため、仮に第三者が利用者になりすまして画像処理装置１００を操作した場合に、利用者は第三者が自分になりすまして不正な操作を行ったことが分かる。

【0030】

一方、上述したステップＳ２２において二次認証に成功した場合（ステップＳ２２の判定がＹＥＳ）、プロセッサ１０１はステップＳ２７に進み、メモリ１０２に記憶された利用者の音声を通信制御部１０３によりサーバ装置２００に送信する。すなわち、利用者の音声は、二次認証に成功した場合に限り、サーバ装置２００に送信される。二次認証に失敗した場合には、利用者の音声はサーバ装置２００に送信されない。

【0031】

ステップＳ２８において、サーバ装置２００のプロセッサ２０１は、通信制御部２０３により利用者の音声を受信すると、この音声に音声認識処理を施す。音声認識処理では、音声をテキストに変換され、自然言語辞書を用いて音声の内容を認識することにより、操作語が抽出される。そして、この操作語に応じて操作コマンドが生成される。メモリ２０２には予め、各操作語と関連付けて操作コマンドが記憶されている。この関連付けに基づいて、操作語から操作コマンドが生成される。例えば「カラーコピーを三枚」という音声から「カラー」という操作語と「コピー」という操作語と「三枚」という操作語とが抽出された場合、原稿画像をカラーで三枚コピーすることを指示する操作コマンドが生成される。

【0032】

ここで、コピー処理の設定には、枚数や色以外にも、原稿の読み取り面や解像度等の複数の設定値が存在する。しかし、利用者は、これらの設定値の一部を設定する操作の操作語だけを音声で発する場合がある、この場合、利用者の音声には、一部の設定値を設定する操作の操作語だけが含まれ、他の設定値を設定する操作の操作語は含まれない。そこで、利用者の音声に含まれない操作語に対応する設定値については、予め定められた設定値が用いられる。この設定値は、例えば初期値であってもよいし、利用者により予め定められた設定値であってもよい。利用者により予め定められた設定値は、例えば予めサーバ装置２００のメモリ２０２に記憶され、利用者の情報としてサーバ装置２００から画像処理装置１００に送信されてもよい。この場合、利用者の音声に含まれる操作語に対応する一部の設定値と予め定められた他の設定値とに基づいて、操作コマンドが生成される。例えば利用者が操作において「カラーコピーを三枚」という音声を発した場合において、予め定められた原稿の読み取り面が片面であり、解像度が２００ｄｐｉであるときは、原稿画像の片面を２００ｄｐｉ、カラーで三枚コピーすることを指示する操作コマンドが生成される。

【0033】

ステップＳ２９において、プロセッサ２０１は、生成された操作コマンドを通信制御部２０３により画像処理装置１００に送信する。ステップＳ３０において、画像処理装置１００のプロセッサ１０１は、通信制御部１０３により操作コマンドを受信すると、この操作コマンドに従って処理を実行する。例えば操作コマンドに従って、画像読取部１０９及び画像形成部１１０により、原稿画像の片面を２００ｄｐｉ、カラーで三枚コピーする処理が行われる。処理が完了すると、この動作は終了する。

【0034】

以上説明した実施形態によれば、一次認証が行われた後、利用者が操作において発した音声を用いて二次認証が行われるため、一次認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。また、一次認証において識別された利用者の音声認証情報を用いて二次認証が行われるため、音声認証辞書２０５に含まれる全利用者の音声の特徴と照合して二次認証を行う構成に比して、二次認証の処理の負荷が軽減され、二次認証に要する時間が短くなる。また、二次認証では、音声認証辞書２０５に含まれる全利用者の音声の特徴と照合してどの利用者の音声であるかを識別するのではなく、一次認証において識別された利用者の音声認証情報に含まれる音声の特徴と照合して、この利用者の音声であるか否かを判定すればよいため、二次認証の処理の負荷が軽減され、二次認証に要する時間が短くなるとともに、誤認証が減る。このように、二次認証の処理の負荷が軽減されることにより、画像処理装置１００において二次認証を行い得る。また、利用者の音声認識情報を用いて二次認証が行われるため、新たな利用者が追加された場合には、新たな利用者の音声を登録するだけでよく、既存の利用者の音声を機械学習し直さなくてもよい。

【0035】

また、特定の操作の操作語を示す利用者の音声の特徴に、予め登録された、特定の操作の操作語を示す利用者の音声の特徴が含まれる場合には二次認証が成功するため、例えば利用者の音声を単語単位に分割し、分割された単語の中から特定の操作の操作語を抽出する処理を行わなくてもよい。従って、このような処理を行う構成に比して、二次認証の処理の負荷が軽減される。さらに、利用者の音声に処理に用いられる複数の設定値のうち一部の設定値を設定する操作の操作語だけが含まれている場合にも、一部の設定値と予め定められた他の設定値とに基づいて操作コマンドが生成されるため、利用者が処理に用いられる全ての設定値を設定する操作を音声で行わなくても、処理を実行することができる。

【0036】

さらに、二次認証に失敗した場合には、利用者が操作部１０６を用いて行った操作の内容を示す操作情報が利用者の電子メールアドレス宛に送信されるため、二次認証に失敗した場合に操作部１０６を用いて行われた操作が分かる。さらに、二次認証に失敗した場合には、利用者の音声がサーバ装置２００に送信されないため、サーバ装置２００に不要な音声が送信されるのが防止される。この場合、利用者の音声が画像処理装置１００の外部に出力されないため、情報セキュリティが強化される。

【0037】

３．変形例
本発明は、上述した実施形態に限定されない。上述した実施形態は以下の例のように変形して実施されてもよい。このとき、以下の２以上の変形例が組み合わせて実施されてもよい。

【0038】

上述した実施形態において、一次認証の認証方法は、ＩＣカードを用いた認証方法に限定されない。一次認証の認証方法は、利用者の音声を用いた認証方法とは異なる他の認証方法、すなわち利用者の音声を用いない認証方法であれば、どのような認証方法であってもよい。例えば一次認証の認証方法は、カメラにより撮影された利用者の顔画像を用いた認証方法や、指紋、瞳の中の虹彩、手の静脈等の利用者の生体情報を用いた認証方法であってもよい。

【0039】

上述した実施形態において、二次認証に失敗した場合に、操作部１０６を用いた利用者の操作の内容を示す操作情報が送信される送信先は、利用者の電子メールアドレスに限定されない。例えばこの操作情報の送信先は、画像処理装置１００の管理者が使用する端末装置であってもよい。また、二次認証に失敗した場合に、必ずしも処理の実行が許可されなくてもよい。例えば二次認証に失敗した場合に、処理の実行が禁止されてもよい。

【0040】

上述した実施形態において、一の操作に複数の操作語が定められていてもよい。例えばプリント機能を選択する操作を行う場合に、利用者によっては「プリント」という音声を発したり、「印刷」という音声を発したりする場合がある。いずれの場合にも、プリント機能を選択する操作が行われるように、プリント機能を選択する操作には、「プリント」という操作語と「印刷」という操作語との両方が関連付けられていてもよい。また、この場合、利用者が「プリント」という音声と「印刷」という音声のいずれを発した場合にも二次認証が行われるように、利用者は予め「プリント」という操作語を示す音声と「印刷」という操作語を示す音声の両方を登録する。この場合、音声認証辞書２０５には、「プリント」という操作語を示す音声の特徴と、「印刷」という操作語を示す音声の特徴とが両方とも含まれる。

【0041】

上述した実施形態において、本発明に係る情報処理装置は、画像処理装置１００に限定されない。本発明に係る情報処理装置は、プリンター、イメージスキャナ、コピー機、ファクシミリ機、スマートフォン、タブレット端末、パーソナルコンピュータ、オーディオ機器、ゲーム機等、音声を用いた認証を行うとともに音声を用いた操作を受け付ける装置であれば、どのような装置であってもよい。この場合、特定の操作は、情報処理装置を用いて処理を実行するときに、利用者が必ず行う操作であることが好ましい。例えばパーソナルコンピュータにおいては、処理を実行する際に、ファイルを開く操作が必ず行われる。この場合、特定の操作は、ファイルを開く操作であってもよい。また、特定の操作の操作語は、人、時間、又は場所によってばらつきが少ない言葉であることが好ましい。

【0042】

上述した実施形態において、画像処理装置１００の構成は例示であり、この例に限定されない。例えば音声認証部１１２は、プロセッサ１０１に代えて、専用回路により実現されてもよい。また、画像処理装置１００とサーバ装置２００とは、必ずしも別々に設けられなくてもよい。例えば画像処理装置１００がサーバ装置２００の機能を有していてもよい。この場合、サーバ装置２００は設けられなくてもよい。

【0043】

上述した実施形態において、画像処理装置１００において行われる処理の少なくとも一部が他の装置において行われてもよい。さらに、上述した画像処理装置１００の処理の順序は例示であり、矛盾の無い限り、順序を入れ替えてもよい。

【0044】

上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えばＣＰＵ：Central Processing Unit等）や、専用のプロセッサ（例えばＧＰＵ：Graphics Processing Unit、ＡＳＩＣ:Application Specific Integrated Circuit、ＦＰＧＡ：Field Programmable Gate Array、プログラマブル論理デバイス等）を含むものである。

【0045】

また上記実施形態におけるプロセッサの動作は、１つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。

【0046】

本発明は、画像処理装置１００において実行されるプログラムとして提供されてもよい。画像処理装置１００は、本発明に係る「コンピュータ」の一例である。このプログラムは、インターネットなどの通信回線を介してダウンロードされてもよいし、磁気記録媒体（磁気テープ、磁気ディスクなど）、光記録媒体（光ディスクなど）、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供されてもよい。

【符号の説明】

【0047】

１０：画像処理システム、１００：画像処理装置、１０１：プロセッサ、１０２：メモリ、１０３：通信制御部、１０４：カードリーダ、１０５：マイクロフォン、１０６：操作部、１０７：表示部、１０８：画像処理部、１０９：画像読取部、１１０：画像形成部、１１２：音声認証部、２００：サーバ装置、２０１：プロセッサ、２０２：メモリ、２０３：通信制御部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版