IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許-情報処理装置及びプログラム 図1
  • 特許-情報処理装置及びプログラム 図2
  • 特許-情報処理装置及びプログラム 図3
  • 特許-情報処理装置及びプログラム 図4
  • 特許-情報処理装置及びプログラム 図5
  • 特許-情報処理装置及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-13
(45)【発行日】2024-02-21
(54)【発明の名称】情報処理装置及びプログラム
(51)【国際特許分類】
   G06F 21/32 20130101AFI20240214BHJP
   G06F 3/16 20060101ALI20240214BHJP
   G06F 3/0482 20130101ALI20240214BHJP
   H04N 1/00 20060101ALI20240214BHJP
【FI】
G06F21/32
G06F3/16 640
G06F3/16 630
G06F3/16 650
G06F3/0482
H04N1/00 838
【請求項の数】 8
(21)【出願番号】P 2020105260
(22)【出願日】2020-06-18
(65)【公開番号】P2021197060
(43)【公開日】2021-12-27
【審査請求日】2023-03-16
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110000752
【氏名又は名称】弁理士法人朝日特許事務所
(72)【発明者】
【氏名】三角 晃
【審査官】宮司 卓佳
(56)【参考文献】
【文献】特開2006-048208(JP,A)
【文献】特開2006-048209(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 21/32
G06F 3/16
G06F 3/0482
H04N 1/00
(57)【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
一連の複数の操作において利用者が発した複数の音声をそれぞれ取得し、
前記複数の音声のうち前記複数の操作の最初の操作に対応する音声又は前記複数の音声とは異なる音声を用いて、第1認証を行い、
前記第1認証に成功した場合には、前記複数の音声のうち前記複数の操作の一部である特定の操作に対応する音声が前記第1認証で認証された利用者の音声であることを確認する第2認証を行い、
前記第2認証が行われると、前記複数の音声の認識結果に関連付けられた複数の操作に応じた処理を実行する
ことを特徴とする情報処理装置。
【請求項2】
前記プロセッサは、前記第2認証に失敗した場合には、前記複数の操作を示す操作情報を予め定められた送信先に送信する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記特定の操作は、前記複数の操作に含まれる各操作の特徴、各操作において発せられる音声の言葉の長さ、又は各操作の選択肢の数に応じて決定される
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記特定の操作は切り替えられる
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記プロセッサは、
前記複数の音声のうち、前記複数の操作の最初の操作に対応する音声を用いて、前記第1認証を行い、
前記第1認証に成功した場合には、前記第2認証を行う
ことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記プロセッサは、
前記複数の音声とは異なる音声を用いて前記第1認証を行い、
前記第1認証に成功した場合には、前記第2認証を行う
ことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記プロセッサは、
前記第1認証に失敗した場合には、音声を用いた認証方法とは異なる他の認証方法により前記利用者を識別する第3認証を行い、
前記第3認証に成功した場合には、前記特定の操作に対応する前記音声が前記第3認証で認証された利用者の音声であることを確認する第2認証を行い、
前記第3認証に成功した場合には、前記複数の操作を示す操作情報を予め定められた送信先に送信する
ことを特徴とする請求項5又は6に記載の情報処理装置。
【請求項8】
コンピュータに、
一連の複数の操作において利用者が発した複数の音声をそれぞれ取得するステップと、
前記複数の音声のうち前記複数の操作の最初の操作に対応する音声又は前記複数の音声とは異なる音声を用いて、第1認証を行うステップと、
前記第1認証に成功した場合には、前記複数の音声のうち前記複数の操作の一部である特定の操作に対応する音声が前記第1認証で認証された利用者の音声であることを確認する第2認証を行うステップと、
前記第2認証が行われると、前記複数の音声の認識結果に関連付けられた複数の操作に応じた処理を実行するステップと
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及びプログラムに関する。
【背景技術】
【0002】
音声を用いて利用者の認証を行う技術が知られている。例えば特許文献1には、声紋認識の認証レベルに応じた画像形成装置の機能の使用を許可する技術が記載されている。特許文献2には、コンピュータを用いて入力された音声によって個人を特定する個人認証システムが記載されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2016-144086号公報
【文献】特開2003-323197号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
音声を用いた利用者の認証と併せて、音声を用いた操作が行われる場合がある。この場合、利用開始の際に利用者の認証を行うだけでは、一旦利用者が認証された後に、第三者がこの利用者になりすまして音声を用いた操作を行う虞がある。このような利用者のなりすましを抑制するには、例えば利用開始の際に利用者の認証を行うのに加えて、利用者が操作のために発した音声を用いて利用者の認証を行うことが考えられる。しかし、例えば画像処理装置の操作のように一連の複数の操作が行われる場合には、これらの操作の全てについてそれぞれ利用者が発した音声を用いて利用者の認証を行うと、利用者の認証に要する処理の負荷が大きくなる。
本発明は、一連の複数の操作の全てについてそれぞれ利用者が発した音声を用いて利用者の認証を行う構成に比して、少ない処理の負荷で、最初の利用者の認証が行われた後に第三者がこの利用者になりすまして操作を行うことを抑制することを目的とする。
【課題を解決するための手段】
【0005】
請求項1に係る発明は、プロセッサを備え、前記プロセッサは、一連の複数の操作において利用者が発した複数の音声をそれぞれ取得し、前記複数の音声のうち前記複数の操作の最初の操作に対応する音声又は前記複数の音声とは異なる音声を用いて、第1認証を行い、前記第1認証に成功した場合には、前記複数の音声のうち前記複数の操作の一部である特定の操作に対応する音声が前記第1認証で認証された利用者の音声であることを確認する第2認証を行い、前記第2認証が行われると、前記複数の音声の認識結果に関連付けられた複数の操作に応じた処理を実行することを特徴とする情報処理装置である。
【0006】
請求項2に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記第2認証に失敗した場合には、前記複数の操作を示す操作情報を予め定められた送信先に送信することを特徴とする。
【0007】
請求項3に係る発明は、請求項1に記載の情報処理装置において、前記特定の操作は、前記複数の操作に含まれる各操作の特徴、各操作において発せられる音声の言葉の長さ、又は各操作の選択肢の数に応じて決定されることを特徴とする。
【0008】
請求項4に係る発明は、請求項3に記載の情報処理装置において、前記特定の操作は切り替えられることを特徴とする。
【0009】
請求項5に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記複数の音声のうち、前記複数の操作の最初の操作に対応する音声を用いて、前記第1認証を行い、前記第1認証に成功した場合には、前記第2認証を行うことを特徴とする。
【0010】
請求項6に係る発明は、請求項1に記載の情報処理装置において、前記プロセッサは、前記複数の音声とは異なる音声を用いて前記第1認証を行い、前記第1認証に成功した場合には、前記第2認証を行うことを特徴とする。
【0011】
請求項7に係る発明は、請求項5又は6に記載の情報処理装置において、前記プロセッサは、前記第1認証に失敗した場合には、音声を用いた認証方法とは異なる他の認証方法により前記利用者を識別する第3認証を行い、前記第3認証に成功した場合には、前記特定の操作に対応する前記音声が前記第3認証で認証された利用者の音声であることを確認する第2認証を行い、前記第3認証に成功した場合には、前記複数の操作を示す操作情報を予め定められた送信先に送信することを特徴とする。
【0012】
請求項8に係る発明は、コンピュータに、一連の複数の操作において利用者が発した複数の音声をそれぞれ取得するステップと、前記複数の音声のうち前記複数の操作の最初の操作に対応する音声又は前記複数の音声とは異なる音声を用いて、第1認証を行うステップと、前記第1認証に成功した場合には、前記複数の音声のうち前記複数の操作の一部である特定の操作に対応する音声が前記第1認証で認証された利用者の音声であることを確認する第2認証を行うステップと、前記第2認証が行われると、前記複数の音声の認識結果に関連付けられた複数の操作に応じた処理を実行するステップとを実行させるためのプログラムである。
【発明の効果】
【0013】
請求項1に係る発明によれば、一連の複数の操作の全てについてそれぞれ利用者が発した音声を用いて利用者の認証を行う構成に比して、少ない処理の負荷で、最初の利用者の認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。
請求項2に係る発明によれば、最初の利用者の認証が行われた後に、第三者がこの利用者になりすまして操作を行った場合でも、第三者により行われた操作が分かる。
請求項3に係る発明によれば、利用者の認証に適した操作に対応する音声を用いて第2認証を行うことができる。
請求項4に係る発明によれば、特定の操作が不変である構成に比して、情報セキュリティが強化される。
請求項5に係る発明によれば、利用者は操作に対応する音声以外の音声を発しなくても、情報処理装置を利用することができる。
請求項6に係る発明によれば、利用者は手動で操作を行わなくても、情報処理装置の利用を開始することができる。
請求項7に係る発明によれば、音声を用いた第1認証に失敗したものの、音声を用いない認証方法による第3認証に成功して、音声を用いた操作が行われた場合でも、利用者により行われた操作が分かる。
請求項8に係る発明によれば、一連の複数の操作の全てについてそれぞれ利用者が発した音声を用いて利用者の認証を行う構成に比して、少ない処理の負荷で、最初の利用者の認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。
【図面の簡単な説明】
【0014】
図1】実施形態に係る画像処理装置100の構成を示す図である。
図2】操作語辞書131の一例を示す図である。
図3】認証語辞書132の一例を示す図である。
図4】画像処理装置100における画面遷移の一例を示す図である。
図5】画像処理装置100の動作の一例を示すフローチャートである。
図6】画像処理装置100における画面遷移の別の例を示す図である。
【発明を実施するための形態】
【0015】
1.構成
図1は、本実施形態に係る画像処理装置100の構成を示す図である。画像処理装置100は、コピー機能、プリント機能、スキャン機能等の画像を処理する複数の機能を有する機器である。画像処理装置100は、音声を用いた利用者の認証を行うとともに音声を用いた操作を受け付ける。画像処理装置100は、本発明に係る「情報処理装置」の一例である。画像処理装置100は、プロセッサ110と、メモリ120と、ストレージ130と、通信インターフェース140と、マイクロフォン150と、入力インターフェース155と、表示パネル160と、表示制御部165と、画像読取部170と、画像形成部180とを備える。これらの部位は、バス190を介して接続されている。
【0016】
プロセッサ110は、プログラムを実行することにより、画像処理装置100の各部を制御し、画像処理装置100の機能を実現する処理を行う。プロセッサ110には、例えばCPU(Central Processing Unit)が用いられる。また、プロセッサ110は、プログラムを実行することにより、音声認証部111と、音声認識部112として機能する。音声認証部111は、音声を用いて利用者を認証する。音声認識部112は、利用者の音声の内容を認識する。この音声認識は、既知の音声認識技術を用いて行われる。メモリ120は、プロセッサ110が実行するプログラムを記憶する。メモリ120には、例えばRAM(Random Access Memory)及びROM(Read Only Memory)が用いられる。ストレージ130は、音声を用いた操作に用いられる操作語辞書131と、音声を用いた利用者の認証に用いられる認証語辞書132とを記憶している。ストレージ130には、例えばHDD(Hard Disk Drive)又はSSD(Solid State Drive)が用いられる。通信インターフェース140は、通信回線を介して接続された他の装置(図示せず)とデータ通信を行う。他の操作には、例えば利用者や管理者が使用する端末装置が含まれる。
【0017】
マイクロフォン150は、利用者の認証又は操作のために利用者が発した音声を取得する。入力インターフェース155は、マイクロフォン150が取得した音声の入力を受け付ける。表示パネル160は、利用者との情報のやり取りに用いられる各種の画面を表示する。表示パネル160には、例えば液晶ディスプレイが用いられる。また、表示パネル160は、例えばタッチパネルを含み、画像処理装置100に対する利用者の操作を受け付けてもよい。表示制御部165は、表示パネル160の表示を制御する。画像読取部170は、原稿画像を読み取って画像データに変換する。画像読取部170には、例えばイメージスキャナが用いられる。画像形成部180は、画像データに応じた画像を媒体上に形成する。画像形成部180には、例えばプリンターが用いられる。
【0018】
図2は、操作語辞書131の一例を示す図である。操作語辞書131は、全利用者で共用される。操作語辞書131は、操作IDと、操作語と、操作コマンドとが含まれる。操作IDは、画像処理装置100が受け付ける操作を識別する情報である。画像処理装置100は、一連の複数の操作を受け付ける。図2に示される例では、画像処理装置100が受け付ける処理には、機能を選択する操作、コピー機能の設定項目を選択する操作、排出先を設定する操作、枚数を設定する操作、及び処理の実行を指示する操作が含まれる。各操作IDには、その操作を音声で行うときに用いられる操作語が関連付けられている。操作語は、音声で操作を行うときに用いられる予め定められた言葉である。操作に複数の選択肢がある場合には、これらの選択肢のそれぞれについて予め操作語が定められる。図2に示される例では、機能を選択する操作について、「コピー」という操作語と、「プリント」という操作語と、「スキャン」という操作語とが定められている。各操作語には、その利用者がその操作語を音声で発したときに、実行される操作コマンドが関連付けられている。操作コマンドは、利用者の音声を用いた操作に応じて行われる命令である。図2に示される例では、利用者が機能を選択する操作を行う際に、「コピー」という操作語を音声で発すると、コピー機能が選択される。
【0019】
図3は、認証語辞書132の一例を示す図である。認証語辞書132は、利用者毎に作成される。認証語辞書132は、利用者IDと、操作IDと、認証語を示す音声とが含まれる。利用者IDは、利用者を一意に識別する情報である。各利用者IDには、画像処理装置100が受け付ける一連の複数の操作の一部である特定の操作の操作IDが対応付けられている。この特定の操作は、例えば画像処理装置100に対して行われる複数の操作に含まれる各操作の特徴に応じて予め決定される。例えば画像処理装置100においては、コピー機能、プリント機能、及びファクシミリ機能のいずれの機能を利用する場合であっても機能を選択する操作、枚数を設定する操作、処理の実行を指示する操作が必ず行われる。すなわち、これらの操作は、画像処理装置100の複数の機能に共通する必須の操作である。この場合、これらの操作が特定の操作として決定され、図3に示されるように、これらの操作の操作IDが認証語辞書132に含まれる。一方、例えばコピー機能の設定項目を選択する操作や排出先を設定する操作については特定の操作ではないため、これらの操作の操作IDは認証語辞書132に含まれない。
【0020】
各操作IDには、その操作を音声で行うときに用いられる操作語を示す音声が認証語を示す音声として関連付けられている。認証語を示す音声は、特定の操作において利用者が発する操作語を示す音声である。図2に示されるように、機能を選択する操作には、「コピー」という操作語と、「プリント」という操作語と、「スキャン」という操作語とが用いられる。そのため、図3に示されるように、認証語辞書132には、利用者Aの利用者IDと機能を選択する操作の操作IDとの組に関連付けられて、利用者Aが発した「コピー」という操作語を示す音声と、「プリント」という操作語を示す音声と、「スキャン」という操作語を示す音声とが含まれる。認証語を示す音声は、利用者が発した音声をデジタル形式に変換したものであってもよいし、利用者が発した音声から抽出された特徴であってもよい。この特徴には、例えば声紋が用いられる。なお、新たな利用者が追加された場合には、新たな利用者により発せられた、認証語として用いられる全ての操作語を示す音声が取得されて認証語辞書132に追加される。
【0021】
2.動作
以下の説明において、プロセッサ110が処理の主体として記載される場合、メモリ120に記憶されたプログラムと、このプログラムを実行するプロセッサ110との協働により、プロセッサ110が演算を行い又は他のハードウェア要素の動作を制御することにより、この処理が実現されることを示す。
【0022】
図4は、画像処理装置100における画面遷移の一例を示す図である。画像処理装置100の表示パネル160には、操作毎に、その操作を受け付ける画面が表示される。図4に示される例では、まずログイン画面200が表示される。ログイン画面200は、機能を選択する操作を受け付ける。このログイン画面200においてコピー機能を選択する操作が行われた場合には、ログイン画面200に続いて、コピー機能のメニュー画面210、排出先の設定画面220、枚数の設定画面260、及び確認画面270が順番に表示される。コピー機能のメニュー画面210、排出先の設定画面220、枚数の設定画面260、及び確認画面270はそれぞれ、コピー機能の設定項目を選択する操作、排出先を設定する操作、枚数を設定する操作、及び処理の実行を指示する操作を受け付ける。ただし、コピー機能のメニュー画面210において、カラーモード、倍率、又は用紙サイズの設定に進むことを指示する操作が行われた場合には、コピー機能のメニュー画面210に続いて、カラーモードの設定画面211、倍率の設定画面212、又は用紙サイズの設定画面213が表示され、その後に排出先の設定画面220が表示される。カラーモードの設定画面211、倍率の設定画面212、及び用紙サイズの設定画面213はそれぞれ、カラーモードを設定する操作、倍率を設定する操作、用紙サイズを設定する操作を受け付ける。
【0023】
一方、ログイン画面200において、プリント機能を選択する操作が行われた場合には、ログイン画面200に続いて、プリント機能のメニュー画面230、枚数の設定画面260、及び確認画面270が順番に表示される。プリント機能のメニュー画面230は、プリント機能の設定項目を選択する操作を受け付ける。また、ログイン画面200において、スキャン機能を選択する操作が行われた場合には、ログイン画面200に続いて、スキャン機能のメニュー画面240、格納先の設定画面250、枚数の設定画面260、及び確認画面270が順番に表示される。スキャン機能のメニュー画面240及び格納先の設定画面250はそれぞれ、スキャン機能の設定項目を選択する操作及び格納先を設定する操作を受け付ける。各画面には、その画面が受け付ける操作に用いられる操作語が含まれる。
【0024】
図4に示される複数の画面のうち、ログイン画面200、枚数の設定画面260、及び確認画面270は、画像処理装置100に対して行われる一連の複数の操作の中から予め決定された特定の操作を受け付ける。そのため、ログイン画面200、枚数の設定画面260、及び確認画面270が受け付ける操作に用いられる操作語は、認証語として用いられる。その他の画面が受け付ける操作に用いられる操作語は認証語として用いられない。図4では、認証語を兼ねる操作語は二重線を付して表され、認証語ではない操作語は一重線を付して表されている。また、ログイン画面200に対して行われる機能を選択する操作は、画像処理装置100に対して行われる一連の複数の操作のうち最初の操作であるため、この操作に用いられる操作語は、ログイン認証の認証語として用いられる。
【0025】
図5は、画像処理装置100の動作の一例を示すフローチャートである。図5に示されるプロセスは、例えば利用者が画像処理装置100を利用するときに開始される。ここでは、利用者Aが画像処理装置100を利用するものとする。
【0026】
ステップS11において、プロセッサ110は、表示制御部165により表示パネル160にログイン画面200を表示させる。図4に示される例では、ログイン画面200には、コピー機能を選択する操作に用いられる「コピー」という操作語と、プリント機能を選択する操作に用いられる「プリント」という操作語と、スキャン機能を選択する操作に用いられる「スキャン」という操作語とが含まれる。
【0027】
ステップS12において、プロセッサ110は、音声を用いてログイン認証を行うことを促すメッセージをログイン画面200上に表示させる。図4に示される例では、機能を選択する操作に用いられる「コピー」、「プリント」、「スキャン」という操作語は、ログイン認証の認証語として用いられる。例えば利用者Aがコピー機能を利用する場合には、「コピー」という操作語を示す音声を発する。
【0028】
ステップS13において、プロセッサ110は、ログイン画面200の操作において利用者が発した音声をマイクロフォン150にて取得する。例えば利用者が「コピー」という操作語を示す音声を発した場合には、この音声が取得される。また、プロセッサ110は、この音声の内容を認識し、操作語辞書131を参照してその認識結果に応じた操作コマンドを認識する。まず音声に音声認識処理が施され、音声認識の結果である操作語が認識される。例えば「コピー」という操作語を示す音声に音声認識処理が施され、「コピー」という操作語が認識される。続いて、操作語辞書131において、認識された操作語に関連付けられた操作コマンドが認識される。図2に示される例では、機能を選択する操作の操作IDと「コピー」という操作語との組に関連付けられたコピー機能を選択する操作コマンドが認識される。
【0029】
ステップS14において、プロセッサ110は、ステップS13において取得された利用者の音声を用いてログイン認証を行う。ログイン認証では、利用者が認証される。このログイン認証は、本発明に係る「第1認証」の一例である。まず利用者の音声の特徴と、認証語辞書132に含まれる機能を選択する操作に用いられる操作語の各利用者の音声の特徴とを比較することにより、利用者が識別される。例えば「コピー」という操作語を示す利用者の音声の特徴が、図3に示される認証語辞書132において利用者Aという利用者IDと機能を選択する操作の操作IDとの組に関連付けられた「コピー」という操作語を示す音声の特徴と合致する場合には、利用者Aが識別される。このように利用者が識別された場合には、ログイン認証は成功する。また、利用者が識別された場合には、この利用者の利用者IDがメモリ120に記憶される。一方、例えば「コピー」という操作語を示す利用者の音声の特徴が、図3に示される認証語辞書132に含まれるいずれの音声の特徴とも合致しない場合には、利用者が識別されない。このように利用者が識別されない場合には、ログイン認証は失敗する。
【0030】
ステップS15において、プロセッサ110は、ログイン認証に成功したか否かを判定する。例えばログイン認証に失敗した場合(ステップS15の判定がNO)、プロセッサ110は、ステップS16に進み、予め定められた管理者にワンタイムパスワードを発行してもよいかを問い合わせる。ワンタイムパスワードとは、一度限り有効なパスワードをいう。この問合せは、例えば管理者が使用する端末装置(図示せず)に問合せの内容を示す情報を送信することにより行われる。この問合せに応じてワンタイムパスワードを発行してもよいことを示す応答が行われた場合、プロセッサ110は、ステップS17に進み、ワンタイムパスワードを発行して利用者に通知する。この通知は、例えば表示パネル160にワンタイムパスワードを表示することにより行われてもよいし、利用者が使用する端末装置(図示せず)にワンタイムパスワードを送信することにより行われてもよい。
【0031】
ワンタイムパスワードが通知されると、利用者は、例えば表示パネル160に対してワンタイムパスワードを入力する操作を行う。ステップS18において、プロセッサ110は、この操作に応じてワンタイムパスワードを取得する。ステップS19において、プロセッサ110は、このワンタイムパスワードを用いてログイン認証を行う。ワンタイムパスワードを用いたログイン認証は、音声を用いたログイン認証方法とは異なる認証方法により行われる利用者の認証であり、本発明に係る「第3認証」の一例である。利用者により入力されたワンタイムパスワードが画像処理装置100により発行されたものである場合には、ログイン認証は成功する。また、この場合、ワンタイムパスワードによって利用者が識別される場合には、この利用者の利用者IDがメモリ120に記憶される。一方、利用者により入力されたワンタイムパスワードが画像処理装置100により発行されたものではない場合には、ログイン認証は失敗する。
【0032】
ステップS20において、プロセッサ110は、ワンタイムパスワードを用いたログイン認証に成功したか否かを判定する。例えばワンタイムパスワードを用いたログイン認証に失敗した場合(ステップS20の判定がNO)、以降の処理は行われずに図5に示されるプロセスは終了する。一方、例えばワンタイムパスワードを用いたログイン認証に成功した場合(ステップS20の判定がYES)、プロセッサ110は、ステップS21に進み、操作履歴の記録を開始してからステップS22に進む。また、操作履歴の記録が開始されると、以降、利用者により操作の内容を示す操作情報がメモリ120又はストレージ130に記憶される。この操作情報には、操作に応じて行われた処理に用いられる画像データも含まれる。
【0033】
ステップS22において、プロセッサ110は、表示制御部165により表示パネル160に次の操作画面を表示させる。例えばログイン画面200の操作に用いられる利用者の音声の認識結果に応じてコピー機能を選択する操作コマンドが認識された場合には、図4に示されるコピー機能のメニュー画面210が表示される。このコピー機能のメニュー画面210には、カラーモードの設定に進むことを指示する操作に用いられる「カラーモード」という操作語と、倍率の設定に進むことを指示する操作に用いられる「倍率」という操作語と、用紙サイズの設定に進むことを指示する操作に用いられる「用紙サイズ」という操作語と、次の画面に進むことを指示する操作に用いられる「次へ」という操作語とが含まれる。例えばカラーモード、倍率、用紙サイズの設定値を変更しない場合には、利用者は、「次へ」という操作語を示す音声を発する。
【0034】
ステップS23において、プロセッサ110は、ステップS22において表示された操作画面の操作において利用者が発した操作語を示す音声をマイクロフォン150にて取得する。例えば利用者が「次へ」という操作語を示す音声を発した場合には、この音声が取得される。また、プロセッサ110は、上述したステップS13と同様に、この音声の内容を認識し、操作語辞書131を参照してその認識結果に応じた操作コマンドを認識する。図2に示される例では、コピー機能の設定項目を選択する操作の操作IDと「次へ」という操作語との組に関連付けられた次の画面に進むことを指示する操作コマンドが認識される。
【0035】
ステップS24において、プロセッサ110は、利用者の音声により示される操作語が認証語であるか否かを判定する。例えば利用者の音声により示される「次へ」という操作語は、コピー機能の設定項目を選択する操作に用いられる。しかし、図3に示される例では、認証語辞書132の操作IDには、コピー機能の設定項目を選択する操作の操作IDが含まれていない。これは、コピー機能の設定項目を選択する操作は特定の操作ではないため、この操作に用いられる「次へ」という操作語は認証語として用いられないことを示す。この場合、利用者の音声により示される操作語が認証語ではないと判定され(ステップS24の判定がNO)、プロセッサ110はステップS28に進む。
【0036】
ステップS28において、プロセッサ110は、処理を開始する指示が行われたか否かを判定する。例えばコピー機能のメニュー画面210の操作に用いられる利用者の音声の認識結果に応じて次の画面に進むことを指示する操作コマンドが認識された場合には、処理を開始する指示が行われていないと判定される(ステップS28の判定がNO)。この場合、プロセッサ110は、上述したステップS22に戻る。
【0037】
この場合、ステップS22では、次の排出先の設定画面220が表示される。そして、排出先の設定画面220について、上述したステップS23以降の処理が繰り返される。この場合、利用者は設定画面220の操作に用いられる操作語を示す音声を発する。上述したコピー機能のメニュー画面210と同様に、排出先の設定画面220は、その操作に用いられる操作語は認証語ではなく、この操作語を示す音声から認識される操作コマンドも処理の開始を指示するコマンドではない。したがって、上述したステップS24及びS28の判定がいずれもNOになり、再びステップS22に戻る。
【0038】
一方、上述したコピー機能のメニュー画面210の操作において、利用者が「カラーモード」、「倍率」、又は「用紙サイズ」という操作語を示す音声を発した場合には、ステップS22では、上述した排出先の設定画面220に代えてカラーモードの設定画面211、倍率の設定画面212、又は用紙サイズの設定画面213が表示される。そして、カラーモードの設定画面211、倍率の設定画面212、又は用紙サイズの設定画面213について、上述したステップS23以降の処理が繰り返される。上述したコピー機能のメニュー画面210と同様に、カラーモードの設定画面211、倍率の設定画面212、及び用紙サイズの設定画面213はいずれも、その操作に用いられる操作語は認証語ではなく、この操作語を示す音声から認識される操作コマンドも処理の開始を指示するコマンドではない。したがって、上述したステップS24及びS28の判定がいずれもNOになり、再びステップS22に戻る。この場合、ステップS22では、再びコピー機能のメニュー画面210が表示される。
【0039】
また、上述したログイン画面200の操作において、利用者が「プリント」という操作語を示す音声を発した場合には、ステップS22において、上述したコピー機能のメニュー画面210に代えてプリント機能のメニュー画面230が表示される。そして、プリント機能のメニュー画面230について、上述したステップS23以降の処理が繰り返される。一方、上述したログイン画面200の操作において、利用者が「スキャン」という操作語を示す音声を発した場合には、ステップS22において、上述したコピー機能のメニュー画面210に代えてスキャン機能のメニュー画面240及び格納先の設定画面250が順番に表示される。そして、スキャン機能のメニュー画面240及び格納先の設定画面250についてそれぞれ、上述したステップS23以降の処理が繰り返される。上述したコピー機能のメニュー画面210と同様に、プリント機能のメニュー画面230、スキャン機能のメニュー画面240、及び格納先の設定画面250はいずれも、その操作に用いられる操作語は認証語ではなく、この操作語を示す音声から認識される操作コマンドも処理の開始を指示するコマンドではない。したがって、上述したステップS24及びS28の判定がいずれもNOになり、再びステップS22に戻る。
【0040】
排出先の設定画面220、プリント機能のメニュー画面230、又は格納先の設定画面250が表示された後、ステップS22では、次の枚数の設定画面260が表示される。例えば枚数の設定画面260の操作において利用者が「1」という操作語を示す音声を発した場合、ステップS23では、この音声が取得され認識される。図2に示される例では、枚数を設定する操作の操作IDと「1」という操作語との組に関連付けられた1枚を指定する操作コマンドが認識される。ステップS24では、この「1」という操作語は枚数を指定する操作に用いられるところ、図3に示される例では、認証語辞書132の操作IDには、この枚数を指定する操作の操作IDが含まれるため、この操作語は認証語として用いられると判定される(ステップS24の判定がYES)。この場合、プロセッサ110は、ステップS25に進む。
【0041】
ステップS25において、プロセッサ110は、認証語を示す利用者の音声を用いて、追加認証を行う。この追加認証では、認証語を示す音声を発した利用者が、ログイン認証において認識された利用者であることが確認される。この追加認証は、本発明に係る「第2認証」の一例である。この追加認証は、上述したログイン認証と同様に行われる。例えば「1」という操作語を示す利用者の音声の特徴が、図3に示される認証語辞書132において利用者Aという利用者IDと枚数を設定する操作の操作IDとの組に関連付けられた「1」という操作語を示す音声の特徴と合致する場合には、利用者Aが識別される。このように、ログイン認証において識別された利用者が追加認証において識別された場合には、追加認証は成功する。なお、ログイン認証において識別された利用者は、メモリ120に記憶された利用者IDにより示される。一方、ログイン認証において識別された利用者と異なる利用者が追加認証において識別された場合又は利用者が識別されない場合には、追加認証は失敗する。
【0042】
ステップS26において、プロセッサ110は、追加認証に成功したか否かを判定する。例えば追加認証に失敗した場合には(ステップS26の判定がNO)、プロセッサ110は、ステップS27に進み、操作履歴の記録を開始してから、ステップS28に進む。操作履歴の記録が開始されると、上述したステップS21と同様に、以降、利用者により行われる操作の内容を示す操作情報がメモリ120又はストレージ130に記憶される。一方、例えば追加認証に成功した場合には(ステップS26の判定がYES)、プロセッサ110は、そのままステップS28に進む。ステップS28では、例えば枚数の設定画面260の操作において発せられた利用者の音声から1枚を指定する操作コマンドが認識された場合には、処理を開始する指示が行われていないと判定される(ステップS28の判定がNO)。この場合、プロセッサ110は、上述したステップS22に戻る。
【0043】
この場合、ステップS22では、次の確認画面270が表示される。例えば利用者が「はい」という操作語を示す音声を発した場合、ステップS23ではこの音声が取得され認識される。図2に示される例では、処理の実行を指示する操作の操作IDと「はい」という操作語との組に関連付けられた処理を開始する操作コマンドが認識される。ステップS24では、この「はい」という操作語は処理の実行を指示する操作に用いられるところ、図3に示される例では、認証語辞書132の操作IDには、この処理の実行を指示する操作の操作IDが含まれるため、この操作語は認証語として用いられると判定される(ステップS24の判定がYES)。ステップS25では、例えば「はい」という操作語を示す利用者の音声の特徴が、図3に示される認証語辞書132において利用者Aという利用者IDと処理の実行を指示する操作の操作IDとの組に関連付けられた「はい」という操作語を示す音声の特徴と合致する場合には、利用者Aが識別される。この場合、ステップS26では、追加認証に成功したと判定される(ステップS26の判定がYES)。このように、図4に示される例では、ログイン認証に成功した後、追加認証が二回行われる。ステップS28では、例えば確認画面270の操作において発せられた利用者の音声から処理を開始する操作コマンドが認識された場合には、処理を開始する指示が行われたと判定される(ステップS28の判定がYES)。この場合、プロセッサ110は、ステップS29に進む。
【0044】
ステップS29において、プロセッサ110は、利用者の音声から認識された操作コマンドに従って処理を実行する。例えばコピー機能を選択する操作コマンド、第1排出部を指定する操作コマンド、1枚を指定する操作コマンド、及び処理を開始する操作コマンドが認識された場合には、画像読取部170及び画像形成部180により、これらの操作コマンドに従って、原稿画像を1枚コピーして第1排出部に出力するコピー処理が実行される。
【0045】
ステップS30において、プロセッサ110は、利用者の操作が終了したか否かを判定する。例えばコピー処理が実行された後、利用者が続けて処理を行うことを示す操作を行った場合には、利用者の操作が終了していないと判定される(ステップS30の判定がNO)。この場合、プロセッサ110は、ステップS22に戻り、次の操作画面を表示パネル160に表示させる。この次の操作画面は、例えばログイン画面200であってもよい。一方、例えばコピー処理が実行された後、利用者が続けて処理を行うことを示す操作を行わなかった場合には、利用者の操作が終了したと判定される(ステップS30の判定がYES)。この場合、プロセッサ110は、ステップS31に進む。このとき、上述したステップS21又はS27において操作履歴の記録が行われている場合には、操作履歴の記録が終了する。
【0046】
ステップS31において、プロセッサ110は、操作情報が記憶されているか否かを判定する。例えばメモリ120又はストレージ130に操作情報が記憶されていない場合には(ステップS30の判定がNO)、そのままログアウトして図5に示されるプロセスは終了する。一方、メモリ120又はストレージ130に操作情報が記憶されている場合には(ステップS30の判定がYES)、プロセッサ110は、ステップS32に進み、この操作情報を予め定められた送信先に送信する。この予め定められた送信先は、例えば管理者の使用する端末装置(図示せず)又は利用者の上司等の利用者に関連する他の利用者が使用する端末装置(図示せず)である。操作情報が送信されると、ログアウトして図5に示されるプロセスは終了する。
【0047】
図6は、画像処理装置100における画面遷移の別の例を示す図である。図6に示される例では、まずログイン画面200が表示される。このログイン画面200においてコピー機能を選択する操作が行われた場合には、ログイン画面200に続いて、コピー機能のメニュー画面210、カラーモードの設定画面211、倍率の設定画面212、用紙サイズの設定画面213、枚数の設定画面260、及び確認画面270が順番に表示される。一方、ログイン画面200においてプリント機能を選択する操作が行われた場合には、ログイン画面200に続いて、プリント機能のメニュー画面230、カラーモードの設定画面211、枚数の設定画面260、及び確認画面270が順番に表示される。また、ログイン画面200においてスキャン機能を選択する操作が行われた場合には、ログイン画面200に続いて、スキャン機能のメニュー画面240、カラーモードの設定画面211、格納先の設定画面250、枚数の設定画面260、及び確認画面270が順番に表示される。
【0048】
図6に示される複数の画面のうち、ログイン画面200、カラーモードの設定画面211、枚数の設定画面260、及び確認画面270は、画像処理装置100に対して行われる一連の複数の操作の中から予め決定された特定の操作を受け付ける。これは、図6に示される例では、ログイン画面200、枚数の設定画面260、及び確認画面270が受け付ける操作に加えて、カラーモードの設定画面211が受け付けるカラーモードを設定する操作についても、画像処理装置100のコピー機能、プリント機能、及びスキャン機能に共通する必須の操作であるため、特定の操作として決定されるためである。この場合、ログイン画面200、カラーモードの設定画面211、枚数の設定画面260、及び確認画面270が受け付ける操作に用いられる操作語は、認証語として用いられる。その他の画面が受け付ける操作を音声で行うときに用いられる操作語は認証語に用いられない。図6では、図4と同様に、認証語を兼ねる操作語は二重線を付して表され、認証語ではない操作語は一重線を付して表されている。また、ログイン画面200に対して行われる機能を選択する操作は、画像処理装置100に対して行われる一連の複数の操作のうち最初の操作であるため、この操作に用いられる操作語は、ログイン認証の認証語として用いられる。
【0049】
図6に示される例では、ログイン画面200の操作において利用者により発せられた操作語を示す音声を用いて、ログイン認証が行われる。また、カラーモードの設定画面211、枚数の設定画面260、確認画面270の操作に用いられる操作語は認証語として用いられるため、利用者により発せられた操作語を示す音声を用いて追加処理が行われる。他の画面については、その操作に用いられる操作語は認証語として用いられないため、利用者により発せられた操作語を示す音声を用いて追加認証は行われない。このように、図6に示される例では、ログイン認証に成功した後、追加認証が三回行われる。
【0050】
上述した実施形態によれば、ログイン認証が行われた後、少なくとも一回は追加認証が行われるため、ログイン認証が行われた後に第三者がこの利用者になりすまして操作を行うことが抑制される。その結果、情報セキュリティが強化される。また、画像処理装置100に対して行われる複数の操作の一部である特定の操作について、その操作に用いられる操作語を示す音声を用いて利用者の認証が行われるため、画像処理装置100に対して行われる全ての操作について、その操作に用いられる操作語を示す音声を用いて利用者の認証が行われる場合に比して、処理の負荷が軽減される。
【0051】
さらに、画像処理装置100に対して行われる複数の操作の一部である特定の操作について、その操作に用いられる操作語を示す音声を用いて利用者の認証が行われるため、画像処理装置100に対して行われる全ての操作について、その操作に用いられる操作語を示す音声を用いて利用者の認証が行われる場合に比して、認証語辞書132に含まれる認識語を示す音声の数が少なくなり、認証語辞書132のデータ容量が削減される。さらに、操作語辞書131は全利用者で共用されるため、音声認識に用いられる辞書を利用者毎に作成する場合に比べて、操作語辞書131のデータ容量が削減される。このように、操作語辞書131及び認証語辞書132のデータ容量が削減されることにより、操作語辞書131及び認証語辞書132の読み込み時間が短くなり、音声認識及び音声を用いる利用者の認証に要する時間が短くなる。
【0052】
さらに、ログイン認証に失敗した場合には、ワンタイムパスワードを用いてログイン認証が行われ、このログイン認証に成功した場合には、利用者の操作履歴が記録され、利用者の操作の内容を示す操作情報が予め定められた送信先に送信されるため、このような場合でも、利用者により行われた操作が分かる。さらに、追加認証に失敗した場合には、利用者の操作履歴が記録され、利用者の操作の内容を示す操作情報が予め定められた送信先に送信されるため、ログイン認証が行われた後に、第三者がこの利用者になりすまして操作を行った場合でも、第三者により行われた操作が分かる。
【0053】
さらに、各操作の特徴に応じて特定の操作が決定されるため、利用者の認証に適した操作に対応する音声を用いて追加認証が行われる。さらに、画像処理装置100に対して行われる最初の操作に用いられる操作語を示す音声を用いてログイン認証が行われるため、利用者は画像処理装置100の操作に用いられる操作語を示す音声以外の音声を発しなくても、画像処理装置100を利用することができる。
【0054】
3.変形例
本発明は、上述した実施形態に限定されない。上述した実施形態は以下の例のように変形して実施されてもよい。このとき、以下の2以上の変形例が組み合わせて実施されてもよい。
【0055】
上述した実施形態において、特定の操作は、各操作において発せられる音声の言葉の長さに応じて決定されてもよい。例えば画像処理装置100に対して行われる複数の操作のうち、操作語を示す音声の長さが基準値以下となる操作が特定の操作として決定されてもよい。例えば数字、「はい」又は「いいえ」という操作語は、文字数が少ないため、操作語を示す音声の長さが短い。このような操作語を用いる操作が特定の操作として決定されてもよい。音声を用いた利用者の認証においては、音声の長さが短い程、利用者の認証精度が向上する。この変形例によれば、利用者の認証に用いられる音声の長さが短くなるため、利用者の認証精度が向上する。また、特定の操作は、各操作において行われる操作の選択肢の数に応じて決定されてもよい。また、画像処理装置100に対して行われる複数の操作のうち、選択肢の数が基準値以下の操作が特定の操作として決定されてもよい。例えば、「はい」又は「いいえ」という操作語を用いる操作は、操作の選択肢が二つしかないため、このような操作語を用いる操作が特定の操作として決定されてもよい。この変形例によれば、認証語辞書132に含まれる認証語を示す音声の数が少なくなるため、認証語辞書132のデータ量が削減される。
【0056】
上述した実施形態において、特定の操作は切り替えられてもよい。例えば三つの特定の操作の候補が予め決められている場合、これらの候補の中から選択された二つの候補が特定の操作として用いられてもよい。この選択は、ランダムに行われてもよいし、順番に従って行われてもよい。この変形例によれば、特定の操作が不変である構成に比して、情報セキュリティが強化される。
【0057】
また、利用者、利用者の役職、又は画像処理装置100の設置場所によって、特定の操作の数が変更されてもよい。この特定の操作の数は、追加認証が行われる回数に対応する。特定の操作の数が増えると、追加認証が行われる回数も増える。例えば三つの特定の操作の候補が予め決められている場合、信頼性の高い利用者については、これらの候補の中から選択された一つの候補が特定の操作として用いられてもよい。一方、それ以外の利用者については、これらの三つの候補が特定の操作として用いられてもよい。同様に、信頼性の高い役職の利用者については、これらの候補の中から選択された一つの候補が特定の操作として用いられてもよい。一方、それ以外の役職の利用者については、これらの三つの候補が特定の操作として用いられてもよい。また、画像処理装置100の設置場所が会社等の出入りする人が限られている場所である場合には、これらの候補の中から選択された一つの候補が特定の操作として用いられてもよい。一方、画像処理装置100の設置場所がオープンスペース等の不特定多数の人が出入りする場所である場合には、これらの三つの候補が特定の操作として用いられてもよい。この変形例によれば、情報セキュリティのレベルを変えることができる。
【0058】
上述した実施形態において、画像処理装置100の操作に用いられる操作語を示す音声とは異なる音声を用いてログイン認証が行われてもよい。この場合、ログイン認証には、例えば利用者の名前や利用者により予め設定されたログイン認証用の言葉を示す音声が用いられてもよい。この変形例によれば、利用者は手動で操作を行わなくても、音声を発するだけで、画像処理装置100の利用を開始することができる。
【0059】
上述した実施形態において、ログイン認証に失敗した場合に行われるログイン認証の認証方法は、ワンタイムパスワードを用いた認証方法に限定されない。この認証方法は、音声を用いた認証方法と異なる他の認証方法であればどのような認証方法であってもよい。例えばこの認証方法は、ICカード(integrated circuit)を用いた認証方法やカメラにより撮影された利用者の顔画像を用いた認証方法であってもよい。
【0060】
上述した実施形態において、追加認証に失敗した場合において、利用者が識別されないときとログイン認証において識別された利用者とは異なる利用者が識別されたときとで、その後の処理が異なってもよい。例えばログイン認証において識別された利用者とは異なる利用者が追加認証において識別された場合には、上述した実施形態のように、操作履歴の記録を開始してから処理が継続されてもよい。一方、追加認証において利用者が識別されない場合には、例えばログアウトしてプロセスが終了してもよい。
【0061】
上述した実施形態において、画像処理装置100の構成は例示であり、この例に限定されない。例えば操作語辞書131及び認証語辞書132は、ストレージ130に代えてメモリ120に記憶されてもよい。音声認証部111及び音声認識部112は、プロセッサ110に代えて、専用回路により実現されてもよい。
【0062】
上述した実施形態において、画像処理装置100において行われる処理の少なくとも一部が他の装置において行われてもよい。さらに、上述した画像処理装置100の処理の順序は例示であり、矛盾の無い限り、順序を入れ替えてもよい。
【0063】
上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えばCPU:Central Processing Unit等)や、専用のプロセッサ(例えばGPU:Graphics Processing Unit、ASIC:Application Specific Integrated Circuit、FPGA:Field Programmable Gate Array、プログラマブル論理デバイス等)を含むものである。
【0064】
また上記実施形態におけるプロセッサの動作は、1つのプロセッサによって成すのみでなく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。また、プロセッサの各動作の順序は上記各実施形態において記載した順序のみに限定されるものではなく、適宜変更してもよい。
【0065】
本発明は、画像処理装置100において実行されるプログラムとして提供されてもよい。画像処理装置100は、本発明に係る「コンピュータ」の一例である。このプログラムは、インターネットなどの通信回線を介してダウンロードされてもよいし、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどの、コンピュータが読取可能な記録媒体に記録した状態で提供されてもよい。
【符号の説明】
【0066】
100:画像処理装置、110:プロセッサ、111:音声認証部、112:音声認識部、120:メモリ、130:ストレージ、131:操作語辞書、132:認証語辞書、140:通信インターフェース、150:マイクロフォン、155:入力インターフェース、160:表示パネル、165:表示制御部、170:画像読取部、180:画像形成部
図1
図2
図3
図4
図5
図6