特開2024-27395 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-27395辞書登録プログラム、辞書登録方法及び情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024027395

(43)【公開日】2024-03-01

(54)【発明の名称】辞書登録プログラム、辞書登録方法及び情報処理装置

(51)【国際特許分類】

G10L 15/06 20130101AFI20240222BHJP

G10L 15/22 20060101ALI20240222BHJP

【ＦＩ】

G10L15/06 300J

G10L15/22 470Z

【審査請求】未請求

【請求項の数】6

【出願形態】ＯＬ

(21)【出願番号】P 2022130162

(22)【出願日】2022-08-17

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】前河利治

(72)【発明者】

【氏名】三小田聡

(57)【要約】

【課題】辞書登録作業を効率化する辞書登録プログラム、辞書登録方法及び情報処理装置を提供する。
【解決手段】音声データに対して辞書を用いて音声認識を行うことで得られる、文字認識結果文と読み情報とを取得し、文字認識結果文に含まれる形態素に対する第１の修正が検出された場合に、文字毎の読み情報を基に第１の修正が加えられた形態素の文字認識結果と形態素に含まれる各文字の読み情報とを対応付け、修正が確定したことに応じて、形態素についての、第１の修正後の文字認識結果と読み情報との対応を前記辞書に登録する。
【選択図】図４

【特許請求の範囲】

【請求項1】

音声データに対して辞書を用いて音声認識を行うことで得られる、前記音声データを文字に起こした認識結果文と読み情報とを取得し、
前記認識結果文に含まれる形態素に対する第１の修正が検出された場合に、文字毎の読み情報を基に前記第１の修正が加えられた前記形態素の認識結果と前記形態素に含まれる各文字の読み情報とを対応付け、
修正が確定したことに応じて、前記形態素についての、前記第１の修正後の前記認識結果と前記読み情報との対応を前記辞書に登録する
処理をコンピュータに実行させることを特徴とする辞書登録プログラム。

【請求項2】

カーソルの移動及び文字の消去の操作情報を基に、前記第１の修正により修正された文字を特定し、特定した文字毎の読み情報を基に前記第１の修正が加えられた前記形態素の認識結果と前記形態素に含まれる各文字の読み情報とを対応付けする処理を前記コンピュータに実行させることを特徴とする請求項１に記載の辞書登録プログラム。

【請求項3】

前記認識結果文を前記形態素に分割し、前記第１の修正が加えられた前記形態素の前記認識結果文における位置及び文字数を保持し、
前記認識結果文における位置及び前記文字数で示される文字に対する第２の修正が検出された場合に、前記第１の修正及び前記第２の修正が加えられた前記形態素の認識結果と前記形態素に含まれる各文字の読み情報とを対応付け、
修正が確定したことに応じて、前記形態素についての、前記第１の修正及び前記第２の修正後の前記認識結果と前記読み情報との対応を前記辞書に登録する
処理を前記コンピュータに実行させることを特徴とする請求項１に記載の辞書登録プログラム。

【請求項4】

漢字変換辞書を用いて、前記形態素の認識結果と前記形態素に含まれる各文字の読み情報とを対応付ける処理を前記コンピュータに実行させることを特徴とする請求項１に記載の辞書登録プログラム。

【請求項5】

情報処理装置が、
音声データに対して辞書を用いて音声認識を行うことで得られる、前記音声データを文字に起こした認識結果文と読み情報とを取得し、
前記認識結果文に含まれる形態素に対する第１の修正が検出された場合に、文字毎の読み情報を基に前記第１の修正が加えられた前記形態素の認識結果と前記形態素に含まれる各文字の読み情報とを対応付け、
修正が確定したことに応じて、前記形態素についての、前記第１の修正後の前記認識結果と前記読み情報との対応を前記辞書に登録する
処理を実行することを特徴とする辞書登録方法。

【請求項6】

音声データに対して辞書を用いて音声認識を行うことで得られる、前記音声データを文字に起こした認識結果文と読み情報とを取得する音声解析部と、
前記認識結果文に含まれる形態素に対する第１の修正が検出された場合に、文字毎の読み情報を基に前記第１の修正が加えられた前記形態素の認識結果と前記形態素に含まれる各文字の読み情報とを対応付ける修正管理部と、
修正が確定したことに応じて、前記形態素についての、前記第１の修正後の前記認識結果と前記読み情報との対応を前記辞書に登録する登録部と
を備えたことを特徴とする情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、辞書登録プログラム、辞書登録方法及び情報処理装置に関する。

【背景技術】

【0002】

近年、会議の議事録の作成や携帯型端末装置を利用したメモ書きなどをより容易に行うための技術として、発言などの音声をテキスト化してテキスト文を自動作成するシステムが数多く提案されている。このようなテキスト文を自動生成するシステムでは、マイクなどの収音装置から入力された音声を、音声認識ツールを用いてテキスト化する方法が採られることが一般的である。

【0003】

ただし、音声解析ツールの解析精度は十分ではないため、出力されたテキスト文に誤変換が含まれることが多い。そこで、自動生成されたテキスト文を正確な文章として利用するために、手入力での訂正作業が行われている。誤変換の訂正作業には、誤変換の用語の特定及び正しい文字列への修正といった作業が含まれ、解析精度が低く誤変換が多ければ、作業工数が増加して作業者の訂正作業が煩雑となる。

【0004】

そこで、解析精度を上げて誤変換を少なくするために、音声解析ツールに辞書登録されていない使用環境特有の用語を新たに辞書登録して、登録した単語の優先度を上げることが行われる。使用環境特有の用語としては、例えば、人名や、会社特有の用語や、新しいＩＴ（Information Technology）用語などが考えられる。このような登録を行なうことで、使用環境に応じた精度の高い音声解析が可能となり、正確な文章を自動生成する確率を向上させることができる。

【0005】

ただし、新たな用語の辞書登録を手入力で行う場合、多くの候補となり得る単語の中からどの単語を登録するかを決定することになり、作業者にとって手間のかかる作業となる。そこで、使用環境特有の単語の辞書登録を行う場合に、音声解析ツールにより生成されたテキスト文に対する作業者による用語の修正に基づいて、修正後の用語を自動的に辞書登録する方法が採られる。このような用語の修正には、使用環境特有の用語の修正が多く含まれると考えられるため、使用環境に応じた新たな用語の登録を自動で行えることになる。これにより、新たな用語の辞書登録の業務を効率化させることができる。

【0006】

なお、音声認識の技術として、音声認識を行ない音声に含まれ検索に用いるキーワードを抽出して表示し、利用者から修正指示を受けたキーワードの１文字違いの単語を表示して訂正候補として選択可能に提供する技術が提案されている。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２００５－２７５２２８号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、テキスト文に対する修正の入力に基づいて用語を自動登録する場合、作業者が音声解析ツールに応じたエディタを用いてテキスト文を修正することになる。このように、テキスト文に対する修正は作業者により手作業で行われることから、タイプミスが発生する場合がある。タイプミスが発生した場合、新しい用語の自動登録を行なう装置は、どの単語が登録対象であったのかが判別できなくなるおそれがある。例えば、２文字の用語を修正する際に２文字の修正がなされた後にタイプミスのために再度１文字修正された場合に、音声解析ツールは、修正対象とした元の用語を１文字と判定するおそれがある。そのため、単にテキスト文に対する修正結果を自動登録する方法では、適切な辞書登録が行われず、辞書登録作業を効率化することは困難である。

【0009】

開示の技術は、上記に鑑みてなされたものであって、辞書登録作業を効率化する辞書登録プログラム、辞書登録方法及び情報処理装置を提供することを目的とする。

【課題を解決するための手段】

【0010】

本願の開示する辞書登録プログラム、辞書登録方法及び情報処理装置の一つの態様において、コンピュータは、音声データに対して辞書を用いて音声認識を行うことで得られる、文字認識結果文と読み情報とを取得し、前記文字認識結果文に含まれる形態素に対する第１の修正が検出された場合に、文字毎の読み情報を基に前記第１の修正が加えられた前記形態素の文字認識結果と前記形態素に含まれる各文字の読み情報とを対応付け、修正が確定したことに応じて、前記形態素についての、前記第１の修正後の前記文字認識結果と前記読み情報との対応を前記辞書に登録する処理を実行する。

【発明の効果】

【0011】

１つの側面では、本発明は、辞書登録作業を効率化することができる。

【図面の簡単な説明】

【0012】

【図1】図１は、音声テキスト化システムの構成図である。

【図2】図２は、実施例に係る音声テキスト化システムのブロック図である。

【図3】図３は、修正対象のテキストの一例を示す図である。

【図4】図４は、テキストの修正処理の一例を示す図である。

【図5】図５は、文字と読み方との対応付け処理を示す図である。

【図6】図６は、実施例に係る辞書登録処理のフローチャートである。

【図7】図７は、サーバのハードウェア構成図である。

【発明を実施するための形態】

【0013】

以下に、本願の開示する辞書登録プログラム、辞書登録方法及び情報処理装置の実施例を図面に基づいて詳細に説明する。なお、以下の実施例により本願の開示する辞書登録プログラム、辞書登録方法及び情報処理装置が限定されるものではない。

【実施例0014】

図１は、音声テキスト化システムの構成図である。本実施例では、図１に示すように、サーバ１０と利用者端末装置２０Ａ及び２０Ｂなどのクライアントを有するクライアントサーバシステムを用いて構築された音声テキスト化システム１について説明する。ここで、サーバ１０は、クラウド上に配置されてもよい。また、音声テキスト化システム１は、サーバ１０の機能と利用者端末装置２０Ａ及び２０Ｂなどのクライアントの機能とがまとめて組み込まれた１つのコンピュータであってもよい。

【0015】

情報処理装置であるサーバ１０は、特定のミーティングルームに設置された利用者端末装置２０Ａ及び収音装置３０Ａと接続される。また、サーバ１０は、他のミーティングルームに設置された利用者端末装置２０Ｂ及び収音装置３０Ｂに接続される。

【0016】

収音装置３０Ａは、例えば、マイクロフォンである。収音装置３０Ａは、ミーティングルームにおいて会議などで発せられた音声を収集する。そして、収音装置３０Ａは、収集した音声をサーバ１０に送信する。収音装置３０Ｂは、例えば、ＩＣレコーダである。収音装置３０Ｂは、他のミーティングルームにおいて発せられた音声を収集する。そして、収音装置３０Ｂは、収集した音声をサーバ１０に送信する。

【0017】

利用者端末装置２０Ａは、収音装置３０Ａで収集された音声のテキスト化されたデータをサーバ１０から受信してモニタなどに表示する。次に、利用者端末装置２０Ａは、表示されたテキスト文に対して利用者から加えられた修正の入力を受ける。そして、利用者端末装置２０Ａは、修正情報をサーバ１０へ送信する。

【0018】

同様に、利用者端末装置２０Ｂは、収音装置３０Ｂで収集された音声のテキスト化されたデータをサーバ１０から受信してモニタなどに表示する。次に、利用者端末装置２０Ｂは、表示されたテキスト文に対して利用者から加えられた修正の入力を受ける。そして、利用者端末装置２０Ｂは、修正情報をサーバ１０へ送信する。利用者端末装置２０Ａ及び収音装置３０Ａと利用者端末装置２０Ｂ及び収音装置３０Ｂとは同様の機能を有する。そこで、以下では、利用者端末装置２０Ａと利用者端末装置２０Ｂとを区別しない場合は利用者端末装置２０と呼び、収音装置３０Ａと収音装置３０Ｂとを区別しない場合は収音装置３０と呼ぶ。

【0019】

サーバ１０は、音声データを収音装置３０から受信する。次に、サーバ１０は、音声解析ツールを用いて音性認識を行なって、音声データをテキスト化してテキスト文を生成する。そして、サーバ１０は、テキスト文を利用者端末装置２０へ送信する。

【0020】

その後、サーバ１０は、送信したテキスト文に対する修正情報を利用者端末装置２０から受信する。そして、サーバ１０は、修正された用語を辞書登録して、その後の音声データのテキスト化に利用する。以下にサーバ１０の処理の詳細について説明する。

【0021】

図２は、実施例に係る音声テキスト化システムのブロック図である。図２に示すように、サーバ１０は、通信制御部１１、音声解析部１２、辞書１３、修正管理部１４、記憶部１５、登録部１６及び漢字変換辞書１７を有する。

【0022】

通信制御部１１は、利用者端末装置２０との間の通信を制御する。通信制御部１１は、音声データを収音装置３０から受信する。そして、通信制御部１１は、受信した音声データを音声解析部１２へ出力する。その後、通信制御部１１は、音声データをテキスト化したテキスト文の入力を音声解析部１２から受ける。そして、通信制御部１１は、テキスト文を利用者端末装置２０へ送信する。

【0023】

また、通信制御部１１は、テキスト文の編集開始の通知を編集対象のテキスト文のデータとともに利用者端末装置２０から受ける。そして、通信制御部１１は、編集対象のテキスト文のデータを修正管理部１４へ出力する。また、通信制御部１１は、用語に分割されたテキスト文の入力を修正管理部１４から受ける。そして、通信制御部１１は、用語に分割されたテキスト文を利用者端末装置２０へ送信する。さらに、通信制御部１１は、編集対象のテキスト文に対する修正処理の操作情報を利用者端末装置２０から受信する。そして、通信制御部１１は、修正処理の操作情報を修正管理部１４へ出力する。

【0024】

その後、通信制御部１１は、編集終了の通知を利用者端末装置２０から受ける。そして、通信制御部１１は、編集終了の通知を登録部１６へ出力する。

【0025】

辞書１３は、音声解析で使用される辞書である。辞書１３には、用語毎にその読み方とその読み方が変換された漢字を含む文字とが対応付けて登録される。

【0026】

音声解析部１２は、音声データの入力を通信制御部１１から受ける。そして、音声解析部１２は、音声データの音声認識を実行し、辞書１３を用いて音声データをテキスト化したテキスト文を生成するとともに、テキスト文の各文字の読み方を取得する。この生成されたテキスト文が、「認識結果文」の一例である。すなわち、音声解析部１２は、音声データに対して辞書１３を用いて音声認識を行い、音声データを文字に起こした認識結果文と読み情報とを取得する。その後、音声解析部１２は、音声データに対応するテキスト文のデータを通信制御部１１へ出力する。

【0027】

漢字変換辞書１７は、漢字とその漢字に対応する１つ又は複数の読みとが対応付けられて登録された辞書である。

【0028】

修正管理部１４は、テキスト文の編集開始の通知が利用者端末装置２０からサーバ１０へ送られると、編集対象のテキスト文のデータの入力を通信制御部１１から受ける。次に、修正管理部１４は、形態素解析などにより取得したテキスト文を品詞に分割する。この品詞が、「形態素」の一例にあたる。これにより、修正管理部１４は、修正対象となった用語がテキスト文のどの位置にあるかを把握することが可能となる。

【0029】

図３は、修正対象のテキストの一例を示す図である。テキスト１０１は正しいテキストである。テキスト１０２は、本来であればテキスト１０１として認識されるはずの音声が音声解析による誤った認識により作成されたテキストである。テキスト１０２は、修正管理部１４により品詞に分割された状態を示す。テキスト１０２における各品詞は、スラッシュにより分割されて表されている。テキスト１０２では、テキスト１０１に示すように「古屋」が正解である用語が、「古谷」と誤って認識されている。この場合、利用者は、テキスト１０２の「古谷」を「古屋」に修正することになる。

【0030】

修正管理部１４は、通信制御部１１を介して品詞に分割したテキスト文を利用者端末装置２０へ送信する。利用者は、この修正管理部１４から送られた品詞に分割されたテキスト文を用いて修正を行なう。ただし、この品詞に分割したテキスト文の送信は行わずに、利用者には、分割を気にせずに分割前のテキスト文を用いて修正を行わせてもよい。

【0031】

修正管理部１４は、利用者端末装置２０から送信された修正処理の操作情報の入力を通信制御部１１から受けて、登録対象となる用語を読みと共に記憶部１５に記憶させる。以下に、修正管理部１４による登録する用語の決定処理の詳細について説明する。

【0032】

修正管理部１４は、修正箇所のカーソル位置の入力を受ける。ここで、利用者は、用語の修正を行う場合、修正対象となる用語を含む分割された品詞の末尾にカーソルを設定する。ただし、修正管理部１４が、利用者が指定した適当なカーソル位置の入力を受けて、そのカーソル位置にあたる用語の末尾にカーソル位置を移動して利用者端末装置２０に表示させてもよい。また、利用者が分割前のテキスト文を用いて修正を行う場合にも、修正管理部１４が、利用者が指定した適当なカーソル位置の入力を受けて、そのカーソル位置にあたる用語の末尾にカーソル位置を移動して利用者端末装置２０に表示させてもよい。

【0033】

例えば、図３に示したテキスト１０２の場合は「古谷」が修正対象となるので、修正管理部１４が、「古谷」という用語の末尾にカーソルが設定されたことを認識する。

【0034】

次に、修正管理部１４は、修正対象の用語の末尾のカーソル位置からの利用者による操作情報の入力を受ける。例えば、矢印キーによるカーソルの移動が行われた場合、修正管理部１４は、末尾からの移動位置を特定する。さらに、バックスペースキーやデリートキーが押下された場合、修正管理部１４は、文字の消去を認識する。例えば、２回連続でバックスペースキーが押下された場合、修正管理部１４は、直前のカーソル位置から前の２文字の消去を認識して、修正対象の単語として特定する。ここでは、用語の中に修正対象の単語及びそれ以外の文字が含まれる場合も想定して説明する。そして、修正管理部１４は修正対象の単語のテキスト文における位置及び文字数を修正対象情報として記憶部１５に記憶させる。すなわち、特定の用語に対する最初の修正が「第１の修正」の一例にあたり、修正管理部１４は、カーソルの移動及び文字の消去の操作情報を基に、第１の修正により修正された文字を特定する。

【0035】

図４は、テキストの修正処理の一例を示す図である。まず、古谷という単語１１１が消去されたことで、修正管理部１４は、図３のテキスト１０２における「古谷」の位置が修正対象の単語の位置であり且つ修正対象の単語の文字数が２文字であることを認識して、それらの情報を記憶部１５に修正対象情報として記憶させる。

【0036】

次に、修正管理部１４は、修正対象の単語の読み方の入力を受ける。そして、修正管理部１４は、修正対象の単語の読みを含む修正対象の用語の読みを記憶部１５に記憶させる。さらに、修正管理部１４は、入力された読み方が変換された後の文字の入力を受ける。そして、修正管理部１４は、修正対象の単語の変換語の文字を含む修正対象の用語を記憶部１５に記憶させる。さらに、修正管理部１４は、漢字変換辞書１７を参照して、変換後の文字と修正対象の単語の読み方との対応から各文字と読みとの対応を特定する。変換後の文字が、「修正が加えられた形態素の認識結果」の一例にあたる。すなわち、修正管理部１４は、文字毎の読み情報を基に修正が加えられた形態素の認識結果と形態素に含まれる各文字の読み情報とを対応付ける。

【0037】

例えば、図４において、修正管理部１４は、「ｋｏ－ｙａ」という読み方１２１の入力を受ける。さらに、修正管理部１４は、ステップＳ１０１で行われた変換により、変換後の文字として「小屋」という単語１１２の入力を受ける。

【0038】

図５は、文字と読み方との対応付け処理を示す図である。修正管理部１４は、「小屋」という単語１１２のそれぞれの読み方１３１及び１３２を漢字変換辞書１７から取得する。次に、修正管理部１４は、記憶部１５が保持する修正対象の単語の読み方を参照して、読み方が「ｋｏ－ｙａ」であることを確認する。そして、修正管理部１４は、「小」の読み方１３１の中に「ｋｏ」があることを確認して、読み方の「ｋｏ－ｙａ」のうち「ｋｏ」という読み方１３３を「小」に対応付ける。また、修正管理部１４は、「屋」の読み方１３１の中に「ｙａ」があることを確認して、読み方の「ｋｏ－ｙａ」のうち「ｙａ」という読み方１３４を「屋」に対応付ける。

【0039】

ここで、例えば入力された修正対象の単語の変換後の文字がタイプミスだった場合、利用者は、再度修正操作を繰り返す。この再度の修正操作が、「第２の修正」の一例にあたる。その場合、修正管理部１４は、矢印キーによるカーソルの移動による移動位置の特定を再度行う。そして、バックスペースキーやデリートキーが押下されることで、修正管理部１４は、文字の消去を再度認識する。この際、修正管理部１４は、記憶部１５に格納された修正対象情報に含まれるテキスト文における位置に修正位置が一致を確認して、既に修正対象とした単語への修正であることを認識する。そして、修正管理部１４は、既に修正対象とされた単語の特定の文字が消去されたと認識する。さらに、修正管理部１４は、修正された文字に対応する読み方から修正対象の単語の読み方の消去された部分を特定して、既に修正対象とされた単語の消去された部分以外の残りの読み方を認識する。

【0040】

例えば、図４において、修正管理部１４は、「小屋」という単語１１２のうち「小」が消去されたことを認識する。この際、修正管理部１４は、ステップＳ１０２に示すように読み方１２１のうち「ｋｏ」が消去されたことを特定し、残りの読み方が読み方１２２に示す「ｙａ」となったことを認識する。

【0041】

次に、修正管理部１４は、タイプミスで消去された文字の再修正の読みの入力を受けて、残りの読み方に再修正の読みを付加して修正対象の単語の読み方を完成させる。その後、修正管理部１４は、修正対象の単語の読み方を含む修正対象の用語の読み方を再度完成させて記憶部１５に記憶させて更新する。さらに、修正管理部１４は、入力された読み方が変換された後の文字の入力を受ける。そして、修正管理部１４は、修正対象の単語の変換語の文字を含む修正対象の用語をその用語の読み方に対応させて記憶部１５に記憶させて更新する。すなわち、修正管理部１４は、認識結果文における位置及び文字数で示される文字に対する第２の修正が検出された場合に、第１の修正及び第２の修正が加えられた形態素の認識結果と形態素に含まれる各文字の読み情報とを対応付ける。

【0042】

例えば、図４において、修正管理部１４は、ステップＳ１０３に示すように、読み方１２２の状態で再修正の読みとして「ｋｏ」の入力を受けて、「ｋｏ－ｙａ」という修正対象の単語の読み方１２３を再度完成させる。さらに、修正管理部１４は、ステップＳ１０４で行われた変換による、変換後の文字として「古」という文字の入力を受けて、修正対象の単語１１３が「古屋」であると認識する。そして、修正管理部１４は、「古屋」と「ｋｏ－ｙａ」とを対応付けて記憶部１５に記憶させる。

【0043】

修正管理部１４は、編集完了の通知を受けるまで以上の修正対象の用語及びその用語の読み方の登録を繰り返す。ここで、利用者は、テキスト文に含まれる複数の用語の修正を行った後に、編集完了の通知を行なってもよい。すなわち、修正管理部１４は、編集開始から編集完了までに、修正対象となった複数の用語及びその用語の読み方の登録を行う場合もある。その後、修正管理部１４は、通信制御部１１を介して編集完了の通知を受けた時に、記憶部１５に保存された修正対象情報を削除する。

【0044】

記憶部１５は、記憶装置である。記憶部１５は、修正対象の単語のテキスト文における位置及び文字数を含む修正対象情報を一時的に保持する。さらに、記憶部１５は、修正対象の用語の最終的な修正が加えられた認識結果及び読み方を保持する。

【0045】

登録部１６は、テキスト文の編集完了の通知を通信制御部１１から受ける。そして、登録部１６は、記憶部１５が保持する修正対象の用語及びその用語の読み方を取得する。その後。登録部１６は、取得した用語及びその用語の読み方を新たな用語として辞書１３に登録する。すなわち、登録部１６は、修正が確定したことに応じて、形態素についての、修正が加えられた認識結果と読み情報との対応を前記辞書に登録する。

【0046】

次に、利用者端末装置２０について説明する。利用者端末装置２０は、入力装置２１、通信制御部２２、表示装置２３及び入出力制御部２４を有する。利用者は、入力装置２１及び表示装置２３を用いて利用者端末装置２０へのデータや命令の入力を行なう。

【0047】

通信制御部２２は、サーバ１０との間の通信を制御する。通信制御部２２は、サーバ１０から受信した情報を入出力制御部２４へ出力する。また、通信制御部２２は、入出力制御部２４から入力された情報をサーバ１０へ送信する。

【0048】

入出力制御部２４は、入力装置２１から入力されたデータや命令の処理及び表装置２の表示制御を行なう。例えば、入出力制御部２４は、サーバ１０から送信された音声データをテキスト化したテキスト文のデータを通信制御部２２から取得する。そして、通信制御部１１は、取得したテキスト文のデータを表示装置２３へ出力して表示させる。

【0049】

また、入出力制御部２４は、テキスト文の編集開始の通知を編集対象のテキスト文の情報とともに入力装置２１から受ける。そして、入出力制御部２４は、テキスト文の編集開始の通知を編集対象のテキスト文のデータとともにサーバ１０へ通信制御部２２を介して送信する。その後、入出力制御部２４は、サーバ１０から送信された品詞に分割されたテキスト文を通信制御部２２から取得する。そして、入出力制御部２４は、品詞に分割されたテキスト文を表示装置２３へ出力して表示させる。さらに、入出力制御部２４は、修正対象のテキスト文に対する修正処理の操作情報の入力を入力装置２１から受ける。そして、通信制御部２２は、操作結果を表示装置２３へ出力して表示に反映させるとともに、修正処理の操作情報をサーバ１０へ送信する。他にも、入出力制御部２４は、サーバ１０から送信された他の情報を表示装置２３へ出力して表示させてもよい。その後、入出力制御部２４は、テキスト文の編集終了の通知の入力を入力装置２１から受ける。そして、入出力制御部２４は、テキスト文の編集終了の通知をサーバ１０へ通信制御部２２を介して送信する。

【0050】

表示装置２３は、例えば、モニタやディスプレイである。表示装置２３は、入出力制御部２４から入力されたデータを表示して利用者に画像として提供する。例えば、表示装置２３は、音声データをテキスト化したテキスト文を表示する。また、表示装置２３は、品詞に分割されたテキスト文を表示する。さらに、表示装置２３は、入出力制御部２４から入力された操作結果を反映させて表示する画像を更新する。

【0051】

入力装置２１は、例えば、キーボードやマウスである。入力装置２１は、利用者による操作を受けて、操作情報を入出力制御部２４へ出力する。例えば、入力装置２１は、編集開始の通知や編集終了の通知を入出力制御部２４へ出力する。また、入力装置２１は、利用者により行われた修正処理における操作の操作情報を入出力制御部２４へ出力する。

【0052】

図６は、実施例に係る辞書登録処理のフローチャートである。次に、図６を参照して、本実施例に係る地所登録処理の流れを説明する。

【0053】

音声解析部１２は、収音装置３０から送信された音声データの入力を受ける。そして、音声解析部１２は、取得した音声データを用いて音声解析を実行する（ステップＳ１）。

【0054】

そして、音声解析部１２は、辞書１３を用いて音声データをテキスト化したテキスト文を生成する。その後、音声解析部１２は、生成したテキスト文を利用者端末装置２０へ送信してテキスト文を表示装置２３に表示させる（ステップＳ２）。

【0055】

その後、修正管理部１４は、利用者端末装置２０から送信された編集開始の通知を受ける（ステップＳ３）。

【0056】

次に、修正管理部１４は、修正対象のテキスト文を品詞単位で分割して、品詞に分割したテキスト文を利用者端末装置２０へ送信して表示装置２３に表示させる。その後、修正箇所に対するカーソルの設定の情報の入力を受けて、修正管理部１４は、テキスト文における修正対象の単語の位置及び文字数の情報を含む修正対象情報を記憶部１５に記憶させる（ステップＳ４）。

【0057】

その後、修正管理部１４は、修正処理の操作情報の入力を受けて、修正対象の単語の文字の修正を行なう（ステップＳ５）。

【0058】

そして、修正管理部１４は、修正した単語を含む修正対象の用語及びその用語の読み方を記憶部１５に登録して更新する（ステップＳ６）。

【0059】

その後、修正管理部１４及び登録部１６は、編集終了の通知を受信したか否かにより編集が終了したか否かを判定する（ステップＳ７）。編集が終了していない場合（ステップＳ７：否定）、辞書登録処理は、ステップＳ５へ戻る。

【0060】

これに対して、編集が終了した場合（ステップＳ７：肯定）、修正管理部１４は、修正対象情報を記憶部１５から削除する。また、登録部１６は、記憶部１５が保持する修正対象の用語の修正後の認識結果及びその用語の読み方を取得する。その後。登録部１６は、取得した用語及びその用語の読み方を新たな用語として辞書１３に登録する（ステップＳ８）。

【0061】

以上に説明したように、本実施例に係る情報処理装置は、音声データを音声解析して生成したテキスト文を品詞ごとに分割して利用者に提供し、利用者による用語の修正操作を受けて、修正された用語及びその用語の読み方を辞書に新たに登録する。その後、情報処理装置は、新たな用語が登録された辞書を用いて音声解析を実行する。これにより、辞書登録作業を効率化することができる。さらに、利用者が用語の修正を音声テキスト化システムの使用環境に応じて実行することで、使用環境に応じた新たな用語が辞書に自動登録されるため、音声解析の精度を使用環境に合わせて向上させることが可能となる。

【0062】

（ハードウェア構成）
図７は、サーバのハードウェア構成図である。図１及び２に示したサーバ１０は、例えば、図７に示すように、ＣＰＵ（Central Processing Unit）９１、メモリ９２、ハードディスク９３及びネットワークインタフェース９４を有する。ＣＰＵ９１は、バスを介して、メモリ９２、ハードディスク９３及びネットワークインタフェース９４に接続される。

【0063】

ネットワークインタフェース９４は、サーバ１０と外部装置との通信のためのインタフェースである。ネットワークインタフェース９４は、例えば、ＣＰＵ９１と利用者端末装置２０との間の通信を中継する。ネットワークインタフェース９４は、図２に例示した通信制御部１１の機能を実現する。

【0064】

ハードディスク９３は、補助記憶装置である。ハードディスク９３は、例えば、図２に例示した、辞書１３及び漢字変換辞書１７を記憶する。また、ハードディスク９３は、例えば、記憶部１５の機能を実現する。さらに、ハードディスク９３は、図２に例示した、通信制御部１１、音声解析部１２、修正管理部１４及び登録部１６の機能を実現するプログラムを含む各種プログラムを格納する。

【0065】

メモリ９２は、主記憶装置である。メモリ９２は、例えば、ＤＲＡＭ（Dynamic Random Access Memory）を用いることができる。

【0066】

ＣＰＵ９１は、ハードディスク９３から各種プログラムを読み出してメモリ９２に展開して実行する。これにより、ＣＰＵ９１は、図２に例示した、通信制御部１１、音声解析部１２、修正管理部１４及び登録部１６の機能を実現することができる。

【符号の説明】

【0067】

１音声テキスト化システム
１０サーバ
１１通信制御部
１２音声解析部
１３辞書
１４修正管理部
１５記憶部
１６登録部
１７漢字変換辞書
２０利用者端末装置
２１入力装置
２２通信制御部
２３表示装置
２４入出力制御部

【図1】