特開2024-169870 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 京セラドキュメントソリューションズ株式会社の特許一覧

特開2024-169870ジョブ命令生成システム、ジョブ命令生成プログラムおよび音声操作システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024169870

(43)【公開日】2024-12-06

(54)【発明の名称】ジョブ命令生成システム、ジョブ命令生成プログラムおよび音声操作システム

(51)【国際特許分類】

G10L 15/22 20060101AFI20241129BHJP

G10L 15/00 20130101ALI20241129BHJP

【ＦＩ】

G10L15/22 470Z

G10L15/00 200Z

【審査請求】未請求

【請求項の数】5

【出願形態】ＯＬ

(21)【出願番号】P 2023086689

(22)【出願日】2023-05-26

(71)【出願人】

【識別番号】000006150

【氏名又は名称】京セラドキュメントソリューションズ株式会社

(74)【代理人】

【識別番号】100140796

【弁理士】

【氏名又は名称】原口貴志

(72)【発明者】

【氏名】▲高▼橋稔

(72)【発明者】

【氏名】中嶋宏佑

(72)【発明者】

【氏名】川中康平

(57)【要約】

【課題】音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができるジョブ命令生成システム、ジョブ命令生成プログラムおよび音声操作システムを提供する。
【解決手段】ジョブ命令生成システムは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換するスマートスピーカーによる音声認識の誤りを訂正するための誤り訂正モデルを管理し、スマートスピーカーから受信したテキストデータにおける音声認識の誤りを、誤り訂正モデルを使用して訂正し（Ｓ７３）、画像形成装置が解釈可能なジョブの命令を、音声認識の誤りを訂正したテキストデータに基づいて生成する（Ｓ７４）ことを特徴とする。
【選択図】図７

【特許請求の範囲】

【請求項1】

受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスによる前記音声認識の誤りを訂正するための誤り訂正情報を管理し、
前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、前記誤り訂正情報を使用して訂正し、
画像形成装置が解釈可能なジョブの命令を、前記誤りを訂正した前記テキストデータに基づいて生成することを特徴とするジョブ命令生成システム。

【請求項2】

前記誤り訂正情報を前記音声受付デバイスの種類毎に管理し、
前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、この音声受付デバイスの種類に応じた前記誤り訂正情報を使用して訂正することを特徴とする請求項１に記載のジョブ命令生成システム。

【請求項3】

前記音声受付デバイスの種類と、前記音声受付デバイスのユーザーの識別情報との対応関係を管理し、
前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、このテキストデータに関連して前記音声受付デバイスから受信した前記識別情報に対応付けられた前記音声受付デバイスの種類に応じた前記誤り訂正情報を使用して訂正することを特徴とする請求項２に記載のジョブ命令生成システム。

【請求項4】

受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスによる前記音声認識の誤りを訂正するための誤り訂正情報を管理する動作と、
前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、前記誤り訂正情報を使用して訂正する動作と、
画像形成装置が解釈可能なジョブの命令を、前記誤りを訂正した前記テキストデータに基づいて生成する動作と
をコンピューターに実現させることを特徴とするジョブ命令生成プログラム。

【請求項5】

受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスと、
画像形成装置が解釈可能なジョブの命令を生成するジョブ命令生成システムと
を備え、
前記ジョブ命令生成システムは、前記音声受付デバイスによる前記音声認識の誤りを訂正するための誤り訂正情報を管理し、
前記ジョブ命令生成システムは、前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、前記誤り訂正情報を使用して訂正し、
前記ジョブ命令生成システムは、前記誤りを訂正した前記テキストデータに基づいて前記命令を生成することを特徴とする音声操作システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、音声受付デバイスによって生成されたテキストデータに基づいて、画像形成装置が解釈可能なジョブの命令を生成するジョブ命令生成システム、ジョブ命令生成プログラムおよび音声操作システムに関する。

【背景技術】

【0002】

従来、音声受付デバイスとしてのスマートスピーカーを介して画像形成装置を操作する音声操作システムが知られている（例えば、特許文献１参照。）。特許文献１に記載された音声操作システムにおいて、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）などのネットワークを介して画像形成装置に接続されているクラウドサービス装置が、スマートスピーカーに入力された音声に基づいて、画像形成装置が解釈可能なジョブの命令を生成し、生成した命令を画像形成装置に送信する。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２０２０－０８７３４７号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１に記載された音声操作システムにおいては、スマートスピーカーに入力された音声を示す音声データをクラウドサービス装置が音声認識によってテキストデータに変換するので、音声データを音声認識によってテキストデータに変換するスマートスピーカーに対応していないという問題がある。また、前記特許文献１に記載された音声操作システムにおいては、音声認識に誤りがある場合に、ユーザーの意図通りに画像形成装置が動作しないという問題がある。

【0005】

そこで、本発明は、音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができるジョブ命令生成システム、ジョブ命令生成プログラムおよび音声操作システムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本発明のジョブ命令生成システムは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスによる前記音声認識の誤りを訂正するための誤り訂正情報を管理し、前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、前記誤り訂正情報を使用して訂正し、画像形成装置が解釈可能なジョブの命令を、前記誤りを訂正した前記テキストデータに基づいて生成することを特徴とする。

【0007】

この構成により、本発明のジョブ命令生成システムは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスから受信したテキストデータにおける音声認識の誤りを、誤り訂正情報を使用して訂正し、画像形成装置が解釈可能なジョブの命令を、音声認識の誤りを訂正したテキストデータに基づいて生成するので、音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができる。

【0008】

本発明のジョブ命令生成システムは、前記誤り訂正情報を前記音声受付デバイスの種類毎に管理し、前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、この音声受付デバイスの種類に応じた前記誤り訂正情報を使用して訂正しても良い。

【0009】

この構成により、本発明のジョブ命令生成システムは、音声受付デバイスから受信したテキストデータにおける音声認識の誤りを、この音声受付デバイスの種類に応じた誤り訂正情報を使用して訂正するので、音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができる。

【0010】

本発明のジョブ命令生成システムは、前記音声受付デバイスの種類と、前記音声受付デバイスのユーザーの識別情報との対応関係を管理し、前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、このテキストデータに関連して前記音声受付デバイスから受信した前記識別情報に対応付けられた前記音声受付デバイスの種類に応じた前記誤り訂正情報を使用して訂正しても良い。

【0011】

この構成により、本発明のジョブ命令生成システムは、音声受付デバイスから受信したテキストデータにおける音声認識の誤りを、このテキストデータに関連して音声受付デバイスから受信したユーザーの識別情報に対応付けられた音声受付デバイスの種類に応じた誤り訂正情報を使用して訂正するので、音声受付デバイスから音声受付デバイスの種類が通知されなくても、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができる。

【0012】

本発明のジョブ命令生成プログラムは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスによる前記音声認識の誤りを訂正するための誤り訂正情報を管理する動作と、前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、前記誤り訂正情報を使用して訂正する動作と、画像形成装置が解釈可能なジョブの命令を、前記誤りを訂正した前記テキストデータに基づいて生成する動作とをコンピューターに実現させることを特徴とする。

【0013】

この構成により、本発明のジョブ命令生成プログラムを実行するコンピューターは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスから受信したテキストデータにおける音声認識の誤りを、誤り訂正情報を使用して訂正し、画像形成装置が解釈可能なジョブの命令を、音声認識の誤りを訂正したテキストデータに基づいて生成するので、音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができる。

【0014】

本発明の音声操作システムは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスと、画像形成装置が解釈可能なジョブの命令を生成するジョブ命令生成システムとを備え、前記ジョブ命令生成システムは、前記音声受付デバイスによる前記音声認識の誤りを訂正するための誤り訂正情報を管理し、前記ジョブ命令生成システムは、前記音声受付デバイスから受信した前記テキストデータにおける前記誤りを、前記誤り訂正情報を使用して訂正し、前記ジョブ命令生成システムは、前記誤りを訂正した前記テキストデータに基づいて前記命令を生成することを特徴とする。

【0015】

この構成により、本発明の音声操作システムは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換する音声受付デバイスからジョブ命令生成システムが受信したテキストデータにおける音声認識の誤りを、ジョブ命令生成システムが誤り訂正情報を使用して訂正し、画像形成装置が解釈可能なジョブの命令を、音声認識の誤りを訂正したテキストデータに基づいてジョブ命令生成システムが生成するので、音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができる。

【発明の効果】

【0016】

本発明のジョブ命令生成システム、ジョブ命令生成プログラムおよび音声操作システムは、音声データを音声認識によってテキストデータに変換する音声受付デバイスが使用される場合に、ユーザーの意図通りに画像形成装置が動作する可能性を向上することができる。

【図面の簡単な説明】

【0017】

【図1】本発明の一実施の形態に係る音声操作システムのブロック図である。

【図2】図１に示すスマートスピーカーのブロック図である。

【図3】１台のコンピューターによって構成される場合の図１に示すジョブ命令生成システムのブロック図である。

【図4】ＭＦＰである場合の図１に示す画像形成装置のブロック図である。

【図5】画像形成装置を操作するための音声操作を受け付ける場合の図２に示すスマートスピーカーの動作の一例のフローチャートである。

【図6】画像形成装置を操作するための音声操作を受け付ける場合のスマートスピーカーの動作の、図５に示す例とは異なる一例のフローチャートである。

【図7】スマートスピーカーからテキストデータを受信した場合の図３に示すジョブ命令生成システムの動作のフローチャートである。

【発明を実施するための形態】

【0018】

以下、本発明の実施の形態について、図面を用いて説明する。

【0019】

まず、本発明の一実施の形態に係る音声操作システムの構成について説明する。

【0020】

図１は、本実施の形態に係る音声操作システム１０のブロック図である。

【0021】

図１に示すように、音声操作システム１０は、ユーザーから入力された音声を受け付ける音声受付デバイスとしてのスマートスピーカー２０を備えている。音声操作システム１０は、スマートスピーカー２０と同様の構成のスマートスピーカーをスマートスピーカー２０以外に少なくとも１つ備えても良い。スマートスピーカーは、受け付けた音声を示す音声データを音声認識によってテキストデータに変換するものである。

【0022】

音声操作システム１０は、スマートスピーカーによって生成されたテキストデータに基づいて、後述の画像形成装置が解釈可能なジョブの命令（以下「ジョブ命令」という。）を生成するジョブ命令生成システム３０を備えている。ジョブ命令生成システム３０は、１台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。

【0023】

音声操作システム１０は、例えばプリンター専用機、ＭＦＰ（ＭｕｌｔｉｆｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）などの画像形成装置４０を備えている。音声操作システム１０は、画像形成装置４０と同様の構成の画像形成装置を画像形成装置４０以外に少なくとも１つ備えても良い。

【0024】

音声操作システム１０において、スマートスピーカーは、ジョブ命令生成システム３０と例えばＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、インターネットなどのネットワーク１１を介して通信可能である。

【0025】

音声操作システム１０において、ジョブ命令生成システム３０は、画像形成装置と例えばネットワーク１１を介して互いに通信可能である。

【0026】

図２は、スマートスピーカー２０のブロック図である。

【0027】

図２に示すように、スマートスピーカー２０は、種々の操作が入力される例えばボタンなどの操作デバイスである操作部２１と、スピーカー２２と、マイク２３と、ＬＡＮ、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部２４と、各種の情報を記憶する例えば半導体メモリー、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）などの不揮発性の記憶デバイスである記憶部２５と、スマートスピーカー２０全体を制御する制御部２６とを備えている。

【0028】

記憶部２５は、音声データに基づいてテキストデータを生成するためのテキストデータ生成プログラム２５ａを記憶している。テキストデータ生成プログラム２５ａは、例えば、スマートスピーカー２０の製造段階でスマートスピーカー２０にインストールされていても良いし、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリーなどの外部の記憶媒体からスマートスピーカー２０に追加でインストールされても良いし、ネットワーク上からスマートスピーカー２０に追加でインストールされても良い。

【0029】

記憶部２５は、音声データを音声認識によってテキストデータに変換するための機械学習モデルであるテキストデータ変換モデル２５ｂを記憶している。

【0030】

記憶部２５は、スマートスピーカー２０の種類を示すスピーカー種類情報２５ｃを記憶している。スマートスピーカー２０の種類としては、スマートスピーカー２０の機種が採用されても良いし、スマートスピーカー２０のメーカーの種類が採用されても良い。

【0031】

記憶部２５は、スマートスピーカー２０のユーザーの識別情報としてのユーザー識別情報２５ｄを記憶している。ユーザー識別情報２５ｄは、例えば、スマートスピーカー２０のユーザーの電子メールアドレスでも良い。

【0032】

制御部２６は、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）と、プログラムおよび各種のデータを記憶しているＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）と、制御部２６のＣＰＵの作業領域として用いられるメモリーとしてのＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）とを備えている。制御部２６のＣＰＵは、記憶部２５または制御部２６のＲＯＭに記憶されているプログラムを実行する。

【0033】

制御部２６は、テキストデータ生成プログラム２５ａを実行することによって、音声データに基づいてテキストデータを生成するテキストデータ生成部２６ａを実現する。

【0034】

図３は、１台のコンピューターによって構成される場合のジョブ命令生成システム３０のブロック図である。

【0035】

図３に示すように、ジョブ命令生成システム３０は、種々の操作が入力される例えばキーボード、マウスなどの操作デバイスである操作部３１と、種々の情報を表示する例えばＬＣＤ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ）などの表示デバイスである表示部３２と、ＬＡＮ、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部３３と、各種の情報を記憶する例えば半導体メモリー、ＨＤＤなどの不揮発性の記憶デバイスである記憶部３４と、ジョブ命令生成システム３０全体を制御する制御部３５とを備えている。

【0036】

記憶部３４は、テキストデータに基づいてジョブ命令を生成するためのジョブ命令生成プログラム３４ａを記憶している。ジョブ命令生成プログラム３４ａは、例えば、ジョブ命令生成システム３０の製造段階でジョブ命令生成システム３０にインストールされていても良いし、ＵＳＢメモリーなどの外部の記憶媒体からジョブ命令生成システム３０に追加でインストールされても良いし、ネットワーク上からジョブ命令生成システム３０に追加でインストールされても良い。

【0037】

記憶部３４は、ユーザーの識別情報としてのユーザー識別情報と、ユーザーが使用するスマートスピーカーの種類を示すスピーカー種類情報との対応関係を示すユーザースピーカー対応関係情報３４ｂを記憶している。すなわち、ジョブ命令生成システム３０は、スマートスピーカーの種類と、スマートスピーカーのユーザーのユーザー識別情報との対応関係を管理している。なお、制御部３５は、ユーザー識別情報と、スピーカー種類情報との対応関係を、ユーザーからの指示に応じてユーザースピーカー対応関係情報３４ｂに登録しても良いし、ユーザー識別情報と、スピーカー種類情報との対応関係を、これらの情報を記憶しているスマートスピーカーから通知されてユーザースピーカー対応関係情報３４ｂに登録しても良い。

【0038】

記憶部３４は、スマートスピーカーによる音声認識の誤りを訂正するための誤り訂正情報としての機械学習モデルである誤り訂正モデル３４ｃを記憶している。記憶部３４は、誤り訂正モデルを、誤り訂正モデル３４ｃ以外にも少なくとも１つ記憶することが可能である。記憶部３４は、誤り訂正モデルをスマートスピーカーの種類毎に記憶している。すなわち、ジョブ命令生成システム３０は、誤り訂正モデルをスマートスピーカーの種類毎に管理している。誤り訂正モデルは、スマートスピーカーによって音声認識で生成されたテキストデータと、このテキストデータに対する正解データとを含む学習データを大量に使用した機械学習によって生成されても良い。

【0039】

記憶部３４は、テキストデータを解釈してジョブ命令を生成するための機械学習モデルであるジョブ命令生成モデル３４ｄを記憶している。

【0040】

制御部３５は、例えば、ＣＰＵと、プログラムおよび各種のデータを記憶しているＲＯＭと、制御部３５のＣＰＵの作業領域として用いられるメモリーとしてのＲＡＭとを備えている。制御部３５のＣＰＵは、記憶部３４または制御部３５のＲＯＭに記憶されているプログラムを実行する。

【0041】

制御部３５は、ジョブ命令生成プログラム３４ａを実行することによって、テキストデータに基づいてジョブ命令を生成するジョブ命令生成部３５ａを実現する。

【0042】

図４は、ＭＦＰである場合の画像形成装置４０のブロック図である。

【0043】

図４に示すように、画像形成装置４０は、種々の操作が入力される例えばボタンなどの操作デバイスである操作部４１と、種々の情報を表示する例えばＬＣＤなどの表示デバイスである表示部４２と、用紙などの記録媒体に画像を印刷する印刷デバイスであるプリンター４３と、原稿から画像を読み取る読取デバイスであるスキャナー４４と、ＬＡＮ、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである通信部４５と、図示していない外部のファクシミリ装置と公衆電話回線などの通信回線経由でファックス通信を行うファックスデバイスであるファックス通信部４６と、各種の情報を記憶する例えば半導体メモリー、ＨＤＤなどの不揮発性の記憶デバイスである記憶部４７と、画像形成装置４０全体を制御する制御部４８とを備えている。

【0044】

記憶部４７は、ジョブを実行するためのジョブ実行プログラム４７ａを記憶している。ジョブ実行プログラム４７ａは、例えば、画像形成装置４０の製造段階で画像形成装置４０にインストールされていても良いし、ＵＳＢメモリーなどの外部の記憶媒体から画像形成装置４０に追加でインストールされても良いし、ネットワーク上から画像形成装置４０に追加でインストールされても良い。

【0045】

制御部４８は、例えば、ＣＰＵと、プログラムおよび各種のデータを記憶しているＲＯＭと、制御部４８のＣＰＵの作業領域として用いられるメモリーとしてのＲＡＭとを備えている。制御部４８のＣＰＵは、記憶部４７または制御部４８のＲＯＭに記憶されているプログラムを実行する。

【0046】

制御部４８は、ジョブ実行プログラム４７ａを実行することによって、ジョブを実行するジョブ実行部４８ａを実現する。

【0047】

次に、スマートスピーカーを介して画像形成装置が操作される場合の音声操作システム１０の動作について説明する。

【0048】

以下においては、画像形成装置を操作するための音声操作を受け付けるスマートスピーカーがスマートスピーカー２０であるものとして説明する。また、スマートスピーカー２０によって受け付けられた音声操作の対象の画像形成装置が画像形成装置４０であるものとして説明する。

【0049】

まず、画像形成装置４０を操作するための音声操作を受け付ける場合のスマートスピーカー２０の動作について説明する。

【0050】

図５は、画像形成装置４０を操作するための音声操作を受け付ける場合のスマートスピーカー２０の動作の一例のフローチャートである。

【0051】

ユーザーは、画像形成装置４０に対する操作内容を示す音声をスマートスピーカー２０のマイク２３に入力することができる。

【0052】

スマートスピーカー２０のテキストデータ生成部２６ａは、マイク２３に音声が入力されると、図５に示すように、マイク２３に入力された音声を受け付ける（Ｓ６１）。

【0053】

テキストデータ生成部２６ａは、Ｓ６１の処理が終了すると、Ｓ６１において受け付けた音声を示す音声データをテキストデータ変換モデル２５ｂを使用してテキストデータに変換する（Ｓ６２）。例えば、Ｓ６１において受け付けた音声が「両面でコピー」である場合に、テキストデータ生成部２６ａは、「両面でコピー」というテキストデータではなく、「両面でコーヒー」というテキストデータをＳ６２において誤って生成する可能性がある。

【0054】

テキストデータ生成部２６ａは、Ｓ６２の処理が終了すると、Ｓ６２において生成したテキストデータと、スピーカー種類情報２５ｃと同一の内容のスピーカー種類情報とをジョブ命令生成システム３０に送信して（Ｓ６３）、図５に示す動作を終了する。

【0055】

図６は、画像形成装置４０を操作するための音声操作を受け付ける場合のスマートスピーカー２０の動作の、図５に示す例とは異なる一例のフローチャートである。

【0056】

スマートスピーカー２０のテキストデータ生成部２６ａは、マイク２３に音声が入力されると、図５に示す動作に代えて、図６に示す動作を実行しても良い。

【0057】

図６に示す動作は、Ｓ６３（図５参照。）の処理に代えて、Ｓ６４の処理を実行する点を除いて、図５に示す動作と同様である。

【0058】

図６に示すように、テキストデータ生成部２６ａは、Ｓ６２の処理が終了すると、Ｓ６２において生成したテキストデータと、ユーザー識別情報２５ｄと同一の内容のユーザー識別情報とをジョブ命令生成システム３０に送信して（Ｓ６４）、図６に示す動作を終了する。

【0059】

次に、スマートスピーカー２０からテキストデータを受信した場合のジョブ命令生成システム３０の動作について説明する。

【0060】

図７は、スマートスピーカー２０からテキストデータを受信した場合のジョブ命令生成システム３０の動作のフローチャートである。

【0061】

ジョブ命令生成システム３０のジョブ命令生成部３５ａは、Ｓ６３（図５参照。）またはＳ６４（図６参照。）においてスマートスピーカー２０から送信されてきたテキストデータを受信すると、図７に示すように、スマートスピーカー２０からテキストデータとともにユーザー識別情報を受信したか否かを判断する（Ｓ７１）。

【0062】

ジョブ命令生成部３５ａは、スマートスピーカー２０からテキストデータとともにユーザー識別情報を受信したとＳ７１において判断すると、スマートスピーカー２０からテキストデータとともに受信したユーザー識別情報にユーザースピーカー対応関係情報３４ｂにおいて対応付けられているスピーカー種類情報を特定する（Ｓ７２）。

【0063】

ジョブ命令生成部３５ａは、スマートスピーカー２０からテキストデータとともにユーザー識別情報を受信していない、すなわち、スマートスピーカー２０からテキストデータとともにスピーカー種類情報を受信したとＳ７１において判断するか、Ｓ７２の処理が終了すると、スマートスピーカー２０からテキストデータとともに受信したスピーカー種類情報、または、Ｓ７２において特定したスピーカー種類情報に示されるスマートスピーカーの種類に応じた誤り訂正モデルを使用して、スマートスピーカー２０から受信したテキストデータにおける音声認識の誤りを訂正する（Ｓ７３）。例えば、スマートスピーカー２０から受信したテキストデータが「両面でコーヒー」というテキストデータである場合に、ジョブ命令生成部３５ａは、Ｓ７３において「両面でコピー」というテキストデータを生成する。

【0064】

ジョブ命令生成部３５ａは、Ｓ７３の処理が終了すると、Ｓ７３において生成したテキストデータをジョブ命令生成モデル３４ｄを使用してジョブ命令に変換する（Ｓ７４）。例えば、Ｓ７３において生成したテキストデータが「両面でコピー」である場合に、ジョブ命令生成部３５ａは、Ｓ７４において「ジョブ種別：コピー」、「印刷面：両面」を含んだジョブ命令を生成する。

【0065】

ジョブ命令生成部３５ａは、Ｓ７４の処理が終了すると、Ｓ７４において生成したジョブ命令を画像形成装置４０に送信して（Ｓ７５）、図７に示す動作を終了する。

【0066】

画像形成装置４０のジョブ実行部４８ａは、Ｓ７５においてジョブ命令生成システム３０から送信されてきたジョブ命令を受信すると、受信したジョブ命令に応じたジョブを実行する。例えば、Ｓ７５においてジョブ命令生成システム３０から送信されてきたジョブ命令が「ジョブ種別：コピー」、「印刷面：両面」を含んだジョブ命令である場合に、ジョブ実行部４８ａは、両面コピーのジョブを実行する。

【0067】

以上に説明したように、ジョブ命令生成システム３０は、Ｓ６１において受け付けた音声を示す音声データをＳ６２において音声認識によってテキストデータに変換するスマートスピーカー２０から受信したテキストデータにおける音声認識の誤りを、誤り訂正モデルを使用して訂正し（Ｓ７３）、画像形成装置が解釈可能なジョブの命令を、音声認識の誤りを訂正したテキストデータに基づいて生成する（Ｓ７４）ので、音声データを音声認識によってテキストデータに変換するスマートスピーカー２０が使用される場合に、ユーザーの意図通りに画像形成装置４０が動作する可能性を向上することができる。

【0068】

特に、ジョブ命令生成システム３０は、スマートスピーカー２０から受信したテキストデータにおける音声認識の誤りを、スマートスピーカー２０の種類に応じた誤り訂正モデルを使用して訂正する（Ｓ７３）ので、音声データを音声認識によってテキストデータに変換するスマートスピーカー２０が使用される場合に、ユーザーの意図通りに画像形成装置４０が動作する可能性を向上することができる。

【0069】

なお、スマートスピーカー２０における音声認識に誤りが生じるためにユーザーの意図通りに画像形成装置４０が動作しない場合には、スマートスピーカー２０における音声認識自体の精度を改善することも考えられる。しかしながら、スマートスピーカー２０における音声認識自体の精度の改善は、スマートスピーカー２０のメーカー以外の者によって実現することは通常困難である。ジョブ命令生成システム３０は、スマートスピーカー２０における音声認識自体の精度を改善しなくても、ユーザーの意図通りに画像形成装置４０が動作する可能性を向上することができる。

【0070】

ジョブ命令生成システム３０は、スマートスピーカー２０から受信したテキストデータにおける音声認識の誤りを、このテキストデータに関連してスマートスピーカー２０から受信したユーザー識別情報に対応付けられたスマートスピーカーの種類に応じた誤り訂正モデルを使用して訂正する（Ｓ７１でＹＥＳ、Ｓ７２およびＳ７３）ので、スマートスピーカー２０からスマートスピーカー２０の種類が通知されなくても、ユーザーの意図通りに画像形成装置４０が動作する可能性を向上することができる。

【0071】

なお、ジョブ命令生成システム３０は、本実施の形態において、スマートスピーカーの種類に応じた誤り訂正モデルを使用する。しかしながら、ジョブ命令生成システム３０は、スマートスピーカーの種類によらない１つの誤り訂正モデルのみを使用しても良い。

【0072】

本発明の誤り訂正情報は、本実施の形態において誤り訂正モデルである。しかしながら、本発明の誤り訂正情報は、機械学習モデル以外の情報でも良い。例えば、本発明の誤り訂正情報は、「コーヒー」という文字列を「コピー」という文字列に単純に置換するための情報など、特定の文字列を特定の文字列に単純に置換するための情報でも良い。ジョブ命令生成システム３０は、機械学習モデルが誤り訂正情報である場合、テキストデータにおける文章中の単語の位置など、文章の特徴を踏まえてテキストデータを訂正するので、特定の文字列を特定の文字列に単純に置換するための情報が誤り訂正情報である場合と比較して、テキストデータの訂正の精度を向上することができる。

【符号の説明】

【0073】

１０音声操作システム
２０スマートスピーカー（音声受付デバイス）
２５ｃスピーカー種類情報（音声受付デバイスの種類を示す情報）
２５ｄユーザー識別情報（ユーザーの識別情報）
３０ジョブ命令生成システム（コンピューター）
３４ａジョブ命令生成プログラム
３４ｂユーザースピーカー対応関係情報（音声受付デバイスの種類と、音声受付デバイスのユーザーの識別情報との対応関係を示す情報）
３４ｃ誤り訂正モデル（誤り訂正情報）
４０画像形成装置

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版