IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士ゼロックス株式会社の特許一覧

<>
  • 特許-情報処理装置及び情報処理プログラム 図1
  • 特許-情報処理装置及び情報処理プログラム 図2
  • 特許-情報処理装置及び情報処理プログラム 図3
  • 特許-情報処理装置及び情報処理プログラム 図4
  • 特許-情報処理装置及び情報処理プログラム 図5
  • 特許-情報処理装置及び情報処理プログラム 図6
  • 特許-情報処理装置及び情報処理プログラム 図7
  • 特許-情報処理装置及び情報処理プログラム 図8
  • 特許-情報処理装置及び情報処理プログラム 図9
  • 特許-情報処理装置及び情報処理プログラム 図10
  • 特許-情報処理装置及び情報処理プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-02
(45)【発行日】2023-10-11
(54)【発明の名称】情報処理装置及び情報処理プログラム
(51)【国際特許分類】
   G06F 3/16 20060101AFI20231003BHJP
   G10L 15/00 20130101ALI20231003BHJP
   G10L 17/00 20130101ALI20231003BHJP
   G10L 15/10 20060101ALI20231003BHJP
【FI】
G06F3/16 650
G10L15/00 200F
G10L17/00 200C
G10L15/10 500Z
【請求項の数】 15
(21)【出願番号】P 2020015709
(22)【出願日】2020-01-31
(65)【公開番号】P2021124779
(43)【公開日】2021-08-30
【審査請求日】2022-12-23
(73)【特許権者】
【識別番号】000005496
【氏名又は名称】富士フイルムビジネスイノベーション株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】治田 貴文
【審査官】岩橋 龍太郎
(56)【参考文献】
【文献】特開2009-104025(JP,A)
【文献】米国特許出願公開第2016/0372110(US,A1)
【文献】特開平07-013591(JP,A)
【文献】特開2007-226388(JP,A)
【文献】特開2019-160151(JP,A)
【文献】特開2005-284492(JP,A)
【文献】特開2012-146209(JP,A)
【文献】特開2006-163096(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 3/01
G06F 3/16
G10L 15/00-17/26
(57)【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
サービスを実行させる指示を発話により受け付け、
受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行
更に前記プロセッサは、
前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、どちらの設定を選択するかを更に受け付ける、
情報処理装置。
【請求項2】
プロセッサを備え、
前記プロセッサは、
サービスを実行させる指示を発話により受け付け、
受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行い、
更に前記プロセッサは、
前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、前記予定情報を用いて決定した前記設定で前記サービスを実行させる制御を行う、
情報処理装置。
【請求項3】
前記発話の状態は、前記発話の音声の高さ、大きさ、及び速度の少なくとも1つの状態である、
請求項1又は請求項2に記載の情報処理装置。
【請求項4】
前記プロセッサは、
前記発話の音声が大きいほど、より多い回数で、受け付けた前記サービスを実行させる制御を行う、
請求項に記載の情報処理装置。
【請求項5】
前記プロセッサは、
前記発話の音声が大きいほど、より大きな設定値で、受け付けた前記サービスを実行させる制御を行う、
請求項に記載の情報処理装置。
【請求項6】
前記プロセッサは、
過去の発話を用いて、前記設定を決定する、
請求項1~の何れか1項に記載の情報処理装置。
【請求項7】
前記プロセッサは、
前記指示を行った発話者を特定し、
当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する、
請求項に記載の情報処理装置。
【請求項8】
前記プロセッサは、
前記サービスを実行させる指示を発話により受け付けた際に、声を用いた認証により、当該指示を行った発話者を特定し、
当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する、
請求項に記載の情報処理装置。
【請求項9】
前記予定情報は、受け付けた前記サービスに関する予定情報である、
請求項の何れか1項に記載の情報処理装置。
【請求項10】
前記プロセッサは、
前記サービス及び決定した前記設定の内容を提示する制御を更に行う、
請求項1~の何れか1項に記載の情報処理装置。
【請求項11】
前記プロセッサは、
前記サービス及び前記設定の提示に応じた、前記指示を行った発話者による発話を更に受け付ける、
請求項10に記載の情報処理装置。
【請求項12】
前記プロセッサは、
前記発話と並行して生じていた雑音の音量が予め定めたレベルより大きい場合に、前記提示する制御を行う、
請求項10又は請求項11に記載の情報処理装置。
【請求項13】
前記プロセッサは、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で画像形成装置に対して実行させる制御を行う、
請求項1~12の何れか1項に記載の情報処理装置。
【請求項14】
サービスを実行させる指示を発話により受け付け、
受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行
前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、どちらの設定を選択するかを更に受け付ける、
処理をコンピュータに実行させるための情報処理プログラム。
【請求項15】
サービスを実行させる指示を発話により受け付け、
受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行い、
前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行い、
前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、前記予定情報を用いて決定した前記設定で前記サービスを実行させる制御を行う、
処理をコンピュータに実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理プログラムに関する。
【背景技術】
【0002】
特許文献1には、話者の発話内容を認識する音声認識手段、及びその認識結果に応じた応答音声を合成音声により提供する応答制御手段を備えた音声対話装置において、前記話者による発話速度を検出する話速検出手段を備え、前記応答制御手段は、前記音声認識手段が話者の発話の終了を検出した時点から前記応答音声の提供を開始するまでの応答時間を、前記話速検出手段により検出された発話速度に応じて変化させることを特徴とする音声対話装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2012-128440号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来、制御対象装置に対して発話によりサービスの実行を指示する場合に、発話者がサービスの設定を発話するのは手間がかかる、という問題点があった。
【0005】
本発明は、発話者が実行を指示する場合に、サービスの設定を発話する場合に比較して、当該発話のための手間を削減できる情報処理装置及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために、第1態様に係る情報処理装置は、プロセッサを備え、前記プロセッサが、サービスを実行させる指示を発話により受け付け、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行う。
【0007】
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記発話の状態が、前記発話の音声の高さ、大きさ、及び速度の少なくとも1つの状態であるものである。
【0008】
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記プロセッサが、前記発話の音声が大きいほど、より多い回数で、受け付けた前記サービスを実行させる制御を行う。
【0009】
また、第4態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記プロセッサが、前記発話の音声が大きいほど、より大きな設定値で、受け付けた前記サービスを実行させる制御を行う。
【0010】
また、第5態様に係る情報処理装置は、第1態様~第4態様の何れか1態様に係る情報処理装置において、前記プロセッサが、過去の発話を用いて、前記設定を決定する。
【0011】
また、第6態様に係る情報処理装置は、第5態様に係る情報処理装置において、前記プロセッサが、前記指示を行った発話者を特定し、当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する。
【0012】
また、第7態様に係る情報処理装置は、第6態様に係る情報処理装置において、前記プロセッサが、前記サービスを実行させる指示を発話により受け付けた際に、声を用いた認証により、当該指示を行った発話者を特定し、当該指示を行った発話者から過去に受け付けた前記発話を用いて、前記設定を決定する。
【0013】
また、第8態様に係る情報処理装置は、第1態様~第7態様の何れか1態様に係る情報処理装置において、前記プロセッサが、前記指示を行った発話者の予定情報を用いて決定した設定で前記サービスを実行させる制御を行う。
【0014】
また、第9態様に係る情報処理装置は、第8態様に係る情報処理装置において、前記プロセッサが、前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、どちらの設定を選択するかを更に受け付ける。
【0015】
また、第10態様に係る情報処理装置は、第8態様に係る情報処理装置において、前記プロセッサが、前記発話の状態を用いて決定した前記設定及び前記予定情報を用いて決定した前記設定が異なる場合に、前記予定情報を用いて決定した前記設定で前記サービスを実行させる制御を行う。
【0016】
また、第11態様に係る情報処理装置は、第8態様~第10態様の何れか1態様に係る情報処理装置において、前記予定情報が、受け付けた前記サービスに関する予定情報であるものである。
【0017】
また、第12態様に係る情報処理装置は、第1態様~第11態様の何れか1態様に係る情報処理装置において、前記プロセッサが、前記サービス及び決定した前記設定の内容を提示する制御を更に行う。
【0018】
また、第13態様に係る情報処理装置は、第12態様に係る情報処理装置において、前記プロセッサが、前記サービス及び前記設定の提示に応じた、前記指示を行った発話者による発話を更に受け付ける。
【0019】
また、第14態様に係る情報処理装置は、第12態様又は第13態様に係る情報処理装置において、前記プロセッサが、前記発話と並行して生じていた雑音の音量が予め定めたレベルより大きい場合に、前記提示する制御を行う。
【0020】
また、第15態様に係る情報処理装置は、第1態様~第14態様の何れか1態様に係る情報処理装置において、前記プロセッサが、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で画像形成装置に対して実行させる制御を行う。
【0021】
更に、上記目的を達成するために、第16態様に係る情報処理プログラムは、サービスを実行させる指示を発話により受け付け、受け付けた前記サービスを、前記発話の状態を用いて決定した設定で実行させる制御を行う処理をコンピュータに実行させる。
【発明の効果】
【0022】
第1態様及び第16態様によれば、発話者が実行を指示する場合に、サービスの設定を発話する場合に比較して、当該発話のための手間を削減できる、という効果を有する。
【0023】
第2態様によれば、発話から簡易に得られる状態で設定を決定できる、という効果を有する。
【0024】
第3態様によれば、発話の音声の大きさによってサービスの実行回数を決定することができる、という効果を有する。
【0025】
第4態様によれば、発話の音声の大きさによってサービスの設定値を決定することができる、という効果を有する。
【0026】
第5態様によれば、過去の発話を用いない場合に比較して、サービスの設定を高精度に決定することができる、という効果を有する。
【0027】
第6態様によれば、指示を行った発話者を特定しない場合に比較して、サービスの設定を高精度に決定することができる、という効果を有する。
【0028】
第7態様によれば、声を用いた認証を行わない場合に比較して、指示を行った発話者を高精度に特定できる、という効果を有する。
【0029】
第8態様によれば、発話者の予定を考慮したサービスの設定を行うことができる、という効果を有する。
【0030】
第9態様によれば、発話者の要望に応じたサービスの設定を適用することができる、という効果を有する。
【0031】
第10態様によれば、発話者の予定を優先してサービスの設定を決定することができる、という効果を有する。
【0032】
第11態様によれば、予定情報が、受け付けたサービスとは無関係の情報である場合に比較して、より合理的にサービスの設定を行うことができる、という効果を有する。
【0033】
第12態様によれば、実行させるサービス及び設定を、発話者に対して事前に確認させることができる、という効果を有する。
【0034】
第13態様によれば、サービスを指示した発話者による設定の変更を受け付けることができる、という効果を有する。
【0035】
第14態様によれば、雑音の音量が予め定めたレベルより大きい場合に、誤認識による無駄なサービスの実行を回避することができる、という効果を有する。
【0036】
第15態様によれば、発話者が画像形成に関するサービスの設定を発話する場合に比較して、当該発話のための手間を削減できる、という効果を有する。
【図面の簡単な説明】
【0037】
図1】第1及び第2実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
図2】第1実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。
図3】実施形態に係る発話状態情報データベースの構成の一例を示す模式図である。
図4】実施形態に係る予定情報データベースの構成の一例を示す模式図である。
図5】実施形態に係る情報処理の流れの一例を示すフローチャートである。
図6】第1実施形態に係る設定決定処理の流れの一例を示すフローチャートである。
図7】第2実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。
図8】第2実施形態に係る設定決定処理の流れの一例を示すフローチャートである。
図9】第3実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。
図10】第3実施形態に係る情報処理装置の機能的な構成の一例を示すブロック図である。
図11】第3実施形態に係る設定決定処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0038】
以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。なお、ここでは、情報処理装置としてパーソナルコンピュータを適用した場合について説明する。また、ここでは、情報処理装置及び制御対象装置が別体で構成されている場合について説明するが、これらが一体で構成されていてもよい。
【0039】
[第1実施形態]
図1に示すように、本実施形態に係る情報処理装置10は、CPU(Central Processing Unit:プロセッサ)11、一時記憶領域としてのメモリ12、不揮発性の記憶部13、及び通信インタフェース(I/F)部18を備えている。CPU11、メモリ12、記憶部13、及び通信I/F部18はバスB1を介して互いに接続されている。
【0040】
記憶部13はHDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現される。記憶媒体としての記憶部13には、情報処理プログラム13A及び設定決定プログラム13Bが記憶されている。CPU11は、情報処理プログラム13A及び設定決定プログラム13Bを記憶部13から読み出してメモリ12に展開し、情報処理プログラム13A及び設定決定プログラム13Bが有するプロセスを順次実行する。また、記憶部13には、発話状態情報データベース13C及び予定情報データベース13Dが記憶されている。発話状態情報データベース13C及び予定情報データベース13Dについては詳細を後述する。
【0041】
本実施形態では、制御対象装置として画像形成装置を適用しており、通信I/F部18には、音声入出力装置80及び画像形成装置90が接続されている。従って、CPU11は、音声入出力装置80及び画像形成装置90と各種情報を送受信することができる。なお、本実施形態では、音声入出力装置80として、スマートスピーカを適用しているが、スマートフォン及び携帯情報端末装置等の音声の入力及び出力を行うことができる他の装置を適用する形態としてもよい。また、本実施形態では、画像形成装置90として、印刷機能、画像読取機能及びファクシミリ機能等を有するデジタル複合機を適用しているが、これに限らないことは言うまでもない。
【0042】
次に、本実施形態に係る情報処理装置10の機能的な構成について説明する。図2に示すように、情報処理装置10は、受付部11A、特定部11B、決定部11C、及び制御部11Dを含む。情報処理装置10のCPU11が、情報処理プログラム13A及び設定決定プログラム13Bを実行することで、受付部11A、特定部11B、決定部11C、及び制御部11Dとして機能する。
【0043】
本実施形態に係る受付部11Aは、画像形成装置90を用いるサービスを実行させる指示を音声入出力装置80を介して発話により受け付ける。なお、ここで言う「サービス」には、無償で行う処理に加えて有償で行う処理も含まれる。また、本実施形態では、上記サービスとして印刷サービスを適用するが、この形態に限るものではなく、例えば画像読取サービス及びファクシミリ送信サービス等を適用する形態としてもよい。
【0044】
また、本実施形態に係る特定部11Bは、受付部11Aで受け付けた指示を行った発話者を特定する。なお、本実施形態に係る特定部11Bは、受付部11Aで上記サービスを実行させる指示を発話により受け付けた際に、従来既知の発声内容依存型の話者認識方法を適用して上記発話者を特定しているが、この形態に限定されるものではない。例えば、発声内容独立型の話者認識方法等の技術を適用して上記発話者を特定する形態としてもよいし、声を用いた認証ではなく、画像形成装置90に備えられたタッチパネル等の入力部を介して入力された情報によって上記発話者を特定する形態としてもよい。
【0045】
また、本実施形態に係る決定部11Cは、過去の発話を用いて、上記サービスの設定を決定する。なお、本実施形態では、上記設定の対象として、印刷画像の解像度、印刷用紙のサイズ、及び1枚の印刷用紙に印刷する原稿の枚数を適用しているが、これに限らない。例えば、これらの設定の対象に加えて印刷の速度及びカラー印刷の要否等の他の設定の対象を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。また、本実施形態に係る決定部11Cは、上記指示を行った発話者から過去に受付部11Aで受け付けた発話を用いて、上記設定を決定しているが、この形態に限定されるものではない。例えば、情報処理装置10のユーザ等により予め登録された発話を用いて、上記設定を決定する形態としてもよい。
【0046】
また、本実施形態に係る制御部11Dは、受付部11Aで受け付けたサービス及び決定した当該サービスの設定の内容を提示する制御を更に行う。なお、本実施形態では、上記発話と並行して生じていた雑音の音量が予め定めたレベルより大きい場合に、上記提示する制御を行う形態を適用しているが、この形態に限らず、例えば、受付部11Aでサービスを実行させる指示を受け付ける度に上記提示する制御を行う形態を適用してもよい。
【0047】
また、本実施形態では、上記サービス及び上記設定の提示を、音声入出力装置80を介した音声の出力により行う形態としているが、これに限らない。例えば、画像形成装置90に備えられた液晶ディスプレイ等の表示部によって上記サービス及び上記設定を表示する形態としてもよい。
【0048】
また、本実施形態では、上記予め定めたレベルとして、上記雑音の音量が当該値以上である場合は、当該雑音と並行して行われた発話の認識が困難であるものとして、予め実機を用いた実験や、コンピュータ・シミュレーション等によって得られた値を適用しているが、これに限定されるものではない。例えば、情報処理装置10のユーザ等によって、情報処理に求められるサービスの認識精度や、情報処理装置10の用途等に応じて、予め設定しておく形態としてもよい。
【0049】
また、本実施形態に係る受付部11Aは、上記サービス及び上記設定の提示に応じた、当該サービスの実行の指示を行った発話者による発話を更に受け付ける。
【0050】
また、本実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた発話の状態を用いて決定した設定で実行させる制御を画像形成装置90に行う。なお、本実施形態では、上記発話の状態として、対応する発話の音声の高さ、大きさ、及び速度を適用しているが、これに限らない。例えば、これらの状態に加えて訛りの有無(例えば、関東弁か、関西弁か等)や、発話の感情(嬉しいか、悲しいか等)等の他の状態を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。また、本実施形態に係る制御部11Dは、上記発話の音声の高さが高い程、印刷画像の解像度を高く設定し、上記発話の音声の大きさが大きい程、印刷用紙のサイズを大きく設定し、発話の音声の速度が速い程、1枚の印刷用紙に印刷する原稿の枚数を多く設定する形態(本実施形態では、3段階の設定)としているが、これに限らない。例えば、上記発話が関西弁の場合は、印刷の速度を速くする等、これらの発話の状態と、設定と、の組み合わせ以外の組み合わせを適用する形態としてもよい。
【0051】
また、本実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた指示を行った発話者の予定情報を用いて決定した設定も適用して実行させる制御を画像形成装置90に行う。なお、本実施形態では、上記予定情報を用いて決定した設定の対象として、1枚の印刷用紙に印刷する原稿の枚数を適用しているが、これに限らない。例えば、印刷画像の解像度及び印刷用紙のサイズ等の他の設定を対象として適用してもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
【0052】
また、本実施形態に係る制御部11Dは、上記発話の状態を用いて決定した上記設定及び上記予定情報を用いて決定した上記設定が異なる場合に、上記予定情報を用いて決定した上記設定で上記サービスを実行させる制御を画像形成装置90に行う。なお、本実施形態では、上記予定情報として、受付部11Aで受け付けた上記サービスに関する予定情報を適用しているが、これに限らないことは言うまでもない。
【0053】
次に、本実施形態に係る発話状態情報データベース13Cについて説明する。図3に示すように、本実施形態に係る発話状態情報データベース13Cは、発話者、日時、及び発話状態の各情報が関連付けられて記憶される。
【0054】
上記発話者は、受付部11Aで受け付けたサービスの実行の指示を行った発話者を示す情報であり、上記日時は、対応する発話者による上記実行の指示を行った日時を示す情報である。また、上記発話状態は、対応する発話者による、上記実行の指示を行った際の発話の状態を示す情報である。
【0055】
次に、本実施形態に係る予定情報データベース13Dについて説明する。図4に示すように、本実施形態に係る予定情報データベース13Dは、発話者、日時、及び予定の各情報が関連付けられて記憶されている。
【0056】
上記発話者は、発話状態情報データベース13Cの発話者と同一の情報であり、上記日時は、対応する発話者の予定がある日時を示す情報であり、上記予定は、対応する日時に実施する予定の名称を示す情報である。図4に示す例では、例えば、発話者Aは、2019年12月5日の9時から17時までの間に出張を予定していることを表している。
【0057】
次に、図5を参照して、情報処理を実行する際の情報処理装置10の作用を説明する。情報処理装置10のCPU11が情報処理プログラム13Aを実行することで図5に示す情報処理が実行される。なお、ここでは、錯綜を回避するため、発話状態情報データベース13C及び予定情報データベース13Dが、一例として図3及び図4に示すように構築されている場合について説明する。
【0058】
ステップ200で、CPU11は、サービスを実行させる指示が、何れかの発話者による発話によって行われるまで待機する。ステップ202で、CPU11は、ステップ200の処理により受け付けた発話によって指示されたサービスを、従来既知の音声認識技術を用いて特定し、ステップ204で、CPU11は、当該発話の状態を特定する。本実施形態では、上記発話の状態を特定する方法として、上記発話の音声の高さは上記音声の周波数を用いて特定し、上記発話の音声の大きさは上記音声の音圧を用いて特定し、上記発話の音声の速度は、従来既知の音声認識技術によって特定した上記発話の文字数を発話時間で除算することで特定する形態を適用する。
【0059】
次のステップ206で、CPU11は、実行させるサービスの設定を決定するための処理である設定決定処理を実行する。情報処理装置10のCPU11が設定決定プログラム13Bを実行することで図6に示す設定決定処理が実行される。以下、図6を参照して、本実施形態に係る設定決定処理について説明する。
【0060】
ステップ400で、CPU11は、ステップ200の処理によって受け付けた発話を行った発話者(以下、「対象発話者」という。)を特定し、特定した対象発話者による発話状態を示す全ての値を発話状態情報データベース13Cから読み出す。そして、CPU11は、予め定められた時間帯別で、かつ、読み出した発話状態を示す値における、高さ、大きさ、及び速度の各状態別に平均値を算出することで、時間帯別で、かつ、各状態別の閾値Tを導出する。なお、本実施形態では、上記時間帯として午前及び午後を適用しているが、これに限らない。例えば、情報処理装置10のユーザ等によって、情報処理装置10の用途等に応じて、上記時間帯を予め設定しておく形態としてもよい。
【0061】
以下では、「高さ」に関する閾値Tを閾値Tvと表し、「大きさ」に関する閾値Tを閾値Tlと表し、「速度」に関する閾値Tを閾値Tsと表す。
【0062】
ステップ402で、CPU11は、ステップ204の処理によって特定した発話の音声の高さが、この時刻の時間帯に対応する閾値Tv(以下、単に「閾値Tv」という。)と同じであるか否かを判定し、肯定判定となった場合はステップ406に移行して、CPU11は、印刷画像の解像度の設定を300dpiとし、後述するステップ412に移行する。一方、ステップ402で否定判定となった場合は、ステップ404に移行して、CPU11は、ステップ204の処理によって特定した発話の音声の高さが閾値Tvより大きいか否かを判定し、肯定判定となった場合はステップ408に移行して、CPU11は、印刷画像の解像度の設定を600dpiとし、後述するステップ412に移行する。一方、ステップ404で否定判定となった場合は特定した発話の音声の高さが閾値Tvより小さいものとみなしてステップ410に移行し、CPU11は、印刷画像の解像度の設定を200dpiとして、ステップ412に移行する。
【0063】
ステップ412で、CPU11は、ステップ204の処理によって特定した発話の音声の大きさが、この時刻の時間帯に対応する閾値Tl(以下、単に「閾値Tl」という。)と同じであるか否かを判定し、肯定判定となった場合はステップ416に移行して、CPU11は、印刷用紙のサイズの設定をA4とし、後述するステップ422に移行する。一方、ステップ412で否定判定となった場合は、ステップ414に移行して、CPU11は、ステップ204の処理によって特定した発話の音声の大きさが閾値Tlより大きいか否かを判定し、肯定判定となった場合はステップ418に移行して、CPU11は、印刷用紙のサイズの設定をA3とし、後述するステップ422に移行する。一方、ステップ414で否定判定となった場合は特定した発話の音声の大きさが閾値Tvより小さいものとみなしてステップ420に移行し、CPU11は、印刷用紙のサイズの設定をB5として、ステップ422に移行する。
【0064】
例えば、発話者が、「コピーして。」と比較的大きな声で発話して、当該発話の音声の大きさが閾値Tlより大きい場合、印刷用紙のサイズの設定をA3とする。一方、発話者が、「コピーして。」と比較的小さな声で発話して、当該発話の音声の大きさが閾値Tlより小さい場合、印刷用紙のサイズの設定をB5とする。
【0065】
ステップ422で、CPU11は、ステップ204の処理によって特定した発話の音声の速度が、この時刻の時間帯に対応する閾値Ts(以下、単に「閾値Ts」という。)と同じであるか否かを判定し、肯定判定となった場合はステップ426に移行して、CPU11は、1枚の印刷用紙に2枚分の原稿をまとめて印刷する設定とし、後述するステップ432に移行する。一方、ステップ422で否定判定となった場合は、ステップ424に移行して、CPU11は、ステップ204の処理によって特定した発話の音声の速度が閾値Tsより大きいか否かを判定し、肯定判定となった場合はステップ428に移行して、CPU11は、1枚の印刷用紙に全ての原稿をまとめて印刷する設定とし、後述するステップ432に移行する。一方、ステップ424で否定判定となった場合は特定した発話の音声の速度が閾値Tsより小さいものとみなしてステップ430に移行し、CPU11は、原稿の枚数と同じ枚数で印刷する設定として、ステップ432に移行する。
【0066】
なお、これらの印刷サービスのための具体的な設定値はいずれも一例であることは言うまでもない。上記設定値を、画像形成装置90が設定可能な範囲内で情報処理装置10のユーザ等により変更することができる形態としてもよい。
【0067】
ステップ432で、CPU11は、対象発話者の日時及び予定を示す全ての情報を予定情報データベース13Dから読み出す。ステップ434で、CPU11は、予定情報データベース13Dから読み出した情報に、この時点に対象発話者が実施する予定で、かつ、画像形成装置90による印刷を伴う予定(例えば、会議、来客対応等)が含まれているか否かを判定し、否定判定となった場合は本設定決定処理を終了する一方、肯定判定となった場合は、ステップ436へ移行して、CPU11は、1枚の印刷用紙に全ての原稿をまとめて印刷する設定とし、本設定決定処理を終了する。設定決定処理が終了すると、情報処理(図5参照。)のステップ208に移行する。
【0068】
ステップ208で、CPU11は、発話者によるサービスを実行させる指示と並行して生じていた雑音の音量が予め定められた閾値Tn以上であるか否かを判定し、肯定判定となった場合は、後述するステップ212に移行する一方、否定判定となった場合はステップ210に移行する。
【0069】
ステップ210で、CPU11は、対象発話者が本情報処理を初めて実行するか否かを判定し、否定判定となった場合は後述するステップ220へ移行する一方、肯定判定となった場合はステップ212へ移行する。ステップ212で、CPU11は、特定したサービス、及び設定決定処理で決定した設定を、音声入出力装置80を介した音声の出力により提示し、ステップ214へ移行する。ここで、対象発話者は、提示された内容で、特定したサービスを実行してよいか否かを示す発話を行う。また、対象発話者は、提示された内容で、指示したサービスを実行してはいけない場合には、改めて、サービス及び設定の内容を発話する。そこで、ステップ214で、CPU11は、対象発話者によるステップ212で提示したサービス及び設定に応じた発話が音声入出力装置80に対して行われるまで待機する。
【0070】
ステップ216で、CPU11は、ステップ214の処理により受け付けた発話の内容を従来既知の音声認識技術を用いて特定して、提示した内容でサービスを実行してよいか否かを判定し、否定判定となった場合はステップ218へ移行して、CPU11は、特定したサービス及び設定に再設定し、ステップ212へ戻る。一方、ステップ216で肯定判定となった場合は、ステップ220へ移行して、CPU11は、以上の処理によって決定した設定でサービスを実行させる制御を画像形成装置90に行う。ステップ222で、CPU11は、ステップ204の処理によって特定した対象発話者による発話状態を示す全ての値を、この時点の日時を示す情報と共に発話状態情報データベース13Cに登録し、本情報処理を終了する。
【0071】
なお、本実施形態では、上記発話の状態を用いて決定した設定及び上記予定情報を用いて決定した設定が異なる場合に、CPU11が、上記予定情報を用いて決定した設定で上記サービスを実行させる制御を画像形成装置90に行う形態について説明したが、これらの設定のうちどちらの設定を選択するかを更に受け付ける形態としてもよい。この場合の形態例としては、図6に示す設定決定処理において、ステップ422~ステップ430の処理、及びステップ432~ステップ436の処理の何れか一方の処理を、選択結果に応じて実行する形態を例示することができる。
【0072】
[第2実施形態]
上記第1実施形態では、受け付けた発話の状態に応じた設定を、閾値を用いて決定する形態について説明したが、本第2実施形態では、閾値を用いることなく設定を決定する場合の形態例について説明する。なお、本第2実施形態に係る情報処理装置のハードウェア構成については、上記第1実施形態に係る構成(図1参照。)と同一であるため、ここでの説明を省略する。
【0073】
まず、図7を参照して、本第2実施形態に係る情報処理装置10の機能的な構成について説明する。なお、図7における図2と同様の要素には図2と同一の符号を付する。図7に示すように、本第2実施形態では、情報処理装置10に特定部11B及び決定部11Cが含まれていない点のみが上記第1実施形態と異なっている。
【0074】
次に、図8を参照して、本第2実施形態に係る情報処理装置10の作用として、設定決定処理を実行する際の情報処理装置10の作用について説明する。なお、図5に示す情報処理は、設定決定処理を除いて第1実施形態と同様であるため、ここでの説明は省略する。また、図8に示す設定決定処理における、図6に示す設定決定処理と同一の処理を実行するステップについては図6と同一のステップ番号を付して、その説明を省略する。
【0075】
図8に示す設定決定処理と図6に示す設定決定処理とでは、ステップ400~ステップ430の処理に代えて、ステップ401~ステップ421の処理が適用されている点が異なっている。
【0076】
すなわち、図8のステップ401で、CPU11は、図5のステップ204の処理によって特定した発話の音声の高さが高い程、印刷画像の解像度を高く設定する。本第2実施形態では、上記印刷画像の解像度を、発話の音声の高さを入力情報とし、印刷画像の解像度を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
【0077】
ステップ411で、CPU11は、図5のステップ204の処理によって特定した発話の音声の大きさが大きい程、印刷用紙のサイズを大きく設定する。本第2実施形態では、上記印刷用紙のサイズを、発話の音声の大きさを入力情報とし、印刷用紙のサイズを出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
【0078】
ステップ421で、CPU11は、図5のステップ204の処理によって特定した発話の音声の速度が速い程、1枚の印刷用紙に印刷する原稿の枚数を多く設定する。本第2実施形態では、上記原稿の枚数を、発話の音声の速度を入力情報とし、上記原稿の枚数を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
【0079】
なお、本第2実施形態では、発話の音声が大きいほど、より大きな設定値で、受け付けたサービスを実行させる制御を行う場合の形態例として、制御対象装置として画像形成装置90を適用した場合の形態例について説明したが、この形態に限定されるものではない。例えば、当該制御を行う場合の形態例として、制御対象装置として音楽再生装置を適用する場合、以下の形態としてもよい。
【0080】
即ち、この場合、例えば、音声入出力装置80(ここでは、スマートスピーカ)を介して「音楽を流して」と比較的大きな声で発話された場合、音楽を流すというサービスが実行され、設定値として、音楽を流す音量を通常の音量(例えば、音声入出力装置80や、音声入出力装置80と連携している端末装置等に設定されている初期の音量や、それまでに流していた音量等)より上げて音楽を流すように音声入出力装置80を制御する。一方で、音声入出力装置80を介して「音楽を流して」と比較的小さな声で発話された場合、音楽を流すというサービスが実行され、設定値として、音楽を流す音量を上記通常の音量より下げて音楽を流すように音声入出力装置80を制御する。
【0081】
更に、この形態例において、音楽が流れ始めた後等に音声入出力装置80を介して「音量を上げて」と比較的大きな声で発話された場合、それまでより音量を上げるというサービスが実行され、設定値として、音量を上げる幅を通常よりも大きくするように音声入出力装置80を制御する。この場合、例えば、通常は1段階ずつ音量を上げていくが、通常よりも大きい段階(例えば、2段階)ずつ上げていく形態としてもよい。一方で、音声入出力装置80を介して「音量を上げて」と比較的小さな声で発話された場合、それまでより音量を上げるというサービスが実行され、設定値として、音量を上げる幅を通常よりも小さくするように音声入出力装置80を制御する。この場合、例えば、通常は1段階ずつ音量を上げていくが、通常よりも小さい段階(例えば、0.5段階)ずつ上げていく形態としてもよい。
【0082】
[第3実施形態]
上記第1実施形態及び上記第2実施形態では、制御対象装置として画像形成装置90を適用する形態について説明したが、本第3実施形態では、制御対象装置として掃除用ロボット100を適用する形態例について説明する。
【0083】
まず、図9を参照して、本第3実施形態に係る情報処理装置のハードウェア構成について説明する。なお、図9における図1と同様の要素には図1と同一の符号を付する。図9に示すように、本第3実施形態では、通信I/F部18に掃除用ロボット100が接続されている点が上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、掃除用ロボット100として、自走機能及び掃除機能等を有する自走式掃除機を適用しているが、これに限らないことは言うまでもない。
【0084】
次に、図10を参照して、本第3実施形態に係る情報処理装置10の機能的な構成について説明する。なお、図10における図2と同様の要素には図2と同一の符号を付する。図10に示すように、本第3実施形態では、制御部11Dに掃除用ロボット100が接続されている点のみが上記第2実施形態と異なっている。
【0085】
本第3実施形態に係る受付部11Aは、掃除用ロボット100を用いるサービスを発話により受け付ける点のみが上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、上記サービスとして吸引掃除サービスを適用するが、この形態に限るものではなく、例えば拭き取り掃除サービス等を適用する形態としてもよい。
【0086】
また、本第3実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた発話の状態を用いて決定した設定で実行させる制御を掃除用ロボット100に行う点が、上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、上記設定の対象として、同一の箇所を吸引掃除する回数及び吸引掃除を実施する部屋の数を適用しているが、これに限らない。例えば、これらの設定に加えて掃除用ロボット100の吸引力の大きさや吸引掃除を開始するまでの時間等の他の設定の対象を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
【0087】
また、本第3実施形態に係る制御部11Dは、受付部11Aで受け付けた発話の音声の大きさを用いて同一の箇所を吸引掃除する回数を、上記音声の速度を用いて吸引掃除を実施する部屋の数を、それぞれ決定する形態としている点が上記第1実施形態及び上記第2実施形態と異なっている。なお、これらの発話の状態と、設定と、の組み合わせ以外の組み合わせを適用する形態としてもよい。
【0088】
また、本第3実施形態に係る制御部11Dは、受付部11Aで受け付けたサービスを、受付部11Aで受け付けた指示を行った発話者の予定情報を用いて決定した設定で実行させる制御を掃除用ロボット100に行う点が上記第1実施形態及び上記第2実施形態と異なっている。なお、本第3実施形態では、上記予定情報を用いて決定した設定の対象として、同一の箇所を吸引掃除する回数を適用しているが、これに限らない。例えば、吸引掃除を実施する部屋の数を適用してもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
【0089】
次に、図11を参照して、本第3実施形態に係る情報処理装置10の作用として、設定決定処理を実行する際の情報処理装置10の作用について説明する。なお、図5に示す情報処理は、設定決定処理を除いて第1実施形態と同様であるため、ここでの説明は省略する。
【0090】
ステップ600で、CPU11は、図5のステップ204の処理によって特定した発話の音声の大きさが大きい程、掃除用ロボット100が同一の箇所を吸引掃除する回数を多く設定する。なお、本第3実施形態では、上記吸引掃除する回数を、発話の音声の大きさを入力情報とし、上記吸引掃除する回数を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
【0091】
ステップ602で、CPU11は、図5のステップ204の処理によって特定した発話の音声の速度が速い程、掃除用ロボット100が吸引掃除を実施する部屋の数を多く設定する。なお、本第3実施形態では、上記部屋の数を、発話の音声の速度を入力情報とし、上記部屋の数を出力情報とする、予め定めたルックアップテーブルを用いて設定する形態を適用しているが、当該ルックアップテーブルと同様の入出力情報とされる演算式等により設定する形態を適用してもよい。
【0092】
ステップ604で、CPU11は、対象発話者の日時及び予定を示す全ての情報を予定情報データベース13Dから読み出す。ステップ606で、CPU11は、予定情報データベース13Dから読み出した情報に、この時点に対象発話者が実施する予定で、かつ、掃除用ロボット100による吸引掃除を伴う予定(例えば、来客対応等)が含まれているか否かを判定し、否定判定となった場合は本設定決定処理を終了する一方、肯定判定となった場合は、ステップ608へ移行して、CPU11は、掃除用ロボット100が同一の箇所を吸引掃除する回数を2回とし、本設定決定処理を終了する。設定決定処理が終了すると、情報処理(図5参照。)のステップ208に移行する。
【0093】
なお、これらの吸引掃除サービスのための具体的な設定値はいずれも一例であることは言うまでもない。上記設定値を、掃除用ロボット100が設定可能な範囲内で情報処理装置10のユーザ等により変更することができる形態としてもよい。
【0094】
以上、実施の形態を説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。発明の要旨を逸脱しない範囲で上記実施の形態に多様な変更又は改良を加えることができ、該変更又は改良を加えた形態も本発明の技術的範囲に含まれる。
【0095】
また、上記実施の形態は、クレーム(請求項)にかかる発明を限定するものではなく、また実施の形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。前述した実施の形態には種々の段階の発明が含まれており、開示される複数の構成要件の組み合わせにより種々の発明が抽出される。実施の形態に示される全構成要件から幾つかの構成要件が削除されても、効果が得られる限りにおいて、この幾つかの構成要件が削除された構成が発明として抽出され得る。
【0096】
また、上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ(例えば、CPU等)や、専用のプロセッサ(例えば、GPU: Graphics Processing Unit、ASIC: Application Specific Integrated Circuit、FPGA: Field Programmable Gate Array、プログラマブル論理デバイス、等)を含むものである。
【0097】
また、上記実施形態では、制御対象装置の例として、画像形成装置、音楽再生装置、及び掃除用ロボットを適用したが、これらに限定するものではなく、風呂沸かし器、照明装置、テレビ、及び空調装置等を含めてもよいし、これらの個別、または複数の組み合わせを適用する形態としてもよい。
【0098】
また、上記実施形態では、情報処理プログラム13A及び設定決定プログラム13Bが記憶部13に予めインストールされている場合について説明したが、これに限定されるものではない。例えば、情報処理プログラムが、CD-ROM(Compact Disc Read Only Memory)等の記憶媒体に格納されて提供される形態、又はネットワークを介して提供される形態としてもよい。
【0099】
さらに、上記実施形態では、情報処理及び設定決定処理を、プログラムを実行することにより、コンピュータを利用してソフトウェア構成により実現する場合について説明したが、本発明はこれに限定されるものではない。例えば、情報処理及び設定決定処理を、ハードウェア構成や、ハードウェア構成とソフトウェア構成の組み合わせによって実現する形態としてもよい。
【0100】
その他、上記実施形態で説明した情報処理装置10の構成(図1図2図9、及び図10参照。)は一例であり、本発明の主旨を逸脱しない範囲内において不要な部分を削除したり、新たな部分を追加したりしてもよいことは言うまでもない。
【0101】
また、上記実施形態で説明した情報処理の流れ(図5参照。)及び設定決定処理の流れ(図6図8、及び図11参照。)も一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
【符号の説明】
【0102】
10 情報処理装置
11 CPU
11A 受付部
11B 特定部
11C 決定部
11D 制御部
12 メモリ
13 記憶部
13A 情報処理プログラム
13B 設定決定プログラム
13C 発話状態情報データベース
13D 予定情報データベース
18 通信I/F部
80 音声入出力装置
90 画像形成装置
100 掃除用ロボット
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11