特許7474295 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機インフォメーションシステムズ株式会社の特許一覧

特許7474295情報処理システム、情報処理方法、およびプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-04-16

(45)【発行日】2024-04-24

(54)【発明の名称】情報処理システム、情報処理方法、およびプログラム

(51)【国際特許分類】

G06F 40/56 20200101AFI20240417BHJP

G10L 15/10 20060101ALI20240417BHJP

G06F 40/279 20200101ALI20240417BHJP

【ＦＩ】

G06F40/56

G10L15/10 200W

G06F40/279

【請求項の数】 6

(21)【出願番号】P 2022139175

(22)【出願日】2022-09-01

(65)【公開番号】P2024034722

(43)【公開日】2024-03-13

【審査請求日】2022-09-01

(73)【特許権者】

【識別番号】394013002

【氏名又は名称】三菱電機インフォメーションシステムズ株式会社

(74)【代理人】

【識別番号】100161207

【弁理士】

【氏名又は名称】西澤和純

(74)【代理人】

【識別番号】100206081

【弁理士】

【氏名又は名称】片岡央

(74)【代理人】

【識別番号】100188673

【弁理士】

【氏名又は名称】成田友紀

(74)【代理人】

【識別番号】100188891

【弁理士】

【氏名又は名称】丹野拓人

(72)【発明者】

【氏名】白浜広彬

(72)【発明者】

【氏名】田口進也

(72)【発明者】

【氏名】清水俊介

(72)【発明者】

【氏名】中村伊知郎

(72)【発明者】

【氏名】鶴田季丸

【審査官】松尾真人

(56)【参考文献】

【文献】特開２０２１－１７９６７３（ＪＰ，Ａ）

【文献】特開２０２１－０４７８１７（ＪＰ，Ａ）

【文献】特開２０２０－０３５０１９（ＪＰ，Ａ）

【文献】特開２０２２－０５５３０５（ＪＰ，Ａ）

【文献】特開２０２０－０７１６７５（ＪＰ，Ａ）

【文献】特開２０１９－２０４４４５（ＪＰ，Ａ）

【文献】gagan3012/keytotext，GitHub，2021年10月05日，［2023年11月7日検索］，インターネット＜URL：https://github.com/gagan3012/keytotext/tree/deepsource-fix-9d924e52＞

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ４０／００－４０／５８

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｑ１０／００－９９／００

Ｇ１０Ｌ１５／１０

(57)【特許請求の範囲】

【請求項1】

音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得部と、
前記キーワードを含む複数の第１文章を生成する第１文章生成部と、
前記生成した複数の第１文章の候補をそれぞれ提示する第１文章候補提示部と、
ユーザによる前記第１文章の選択結果に基づいて、前記第１文章を含む第２文章を生成する第２文章生成部と、
を備え、
前記第１文章生成部は、取得した一又は複数のキーワードを入力として、少なくともベースモデルとカスタマイズモデルとのいずれかに基づく学習モデルによる機械学習により、複数の前記第１文章を生成する、
情報処理システム。

【請求項2】

前記生成した第２文章を前記ユーザが編集可能に出力する出力部をさらに備える、
請求項１に記載の情報処理システム。

【請求項3】

前記テキストデータから抽出された一又は複数のキーワードを提示するキーワード候補提示部、
をさらに備え、
前記第１文章生成部は、ユーザが選択した一又は複数のキーワードのすべてを含む複数の前記第１文章を生成する、
請求項１に記載の情報処理システム。

【請求項4】

前記キーワード取得部は、所定分量のテキストデータごとに前記キーワードを取得し、
前記第１文章生成部は、前記所定分量のテキストデータごとの前記キーワードを含む複数の前記第１文章を生成する、
請求項１に記載の情報処理システム。

【請求項5】

情報処理装置のコンピュータが、
音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得過程と、
前記キーワードを含む複数の第１文章を生成する第１文章生成過程と、
前記生成した複数の第１文章の候補をそれぞれ提示する第１文章候補提示過程と、
ユーザによる前記第１文章の選択結果に基づいて、前記第１文章を含む第２文章を生成する第２文章生成過程と、
を有し、
前記第１文章生成過程において、取得した一又は複数のキーワードを入力として、少なくともベースモデルとカスタマイズモデルとのいずれかに基づく学習モデルによる機械学習により、複数の前記第１文章を生成する、
情報処理方法。

【請求項6】

情報処理装置のコンピュータに、
音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得ステップと、
前記キーワードを含む複数の第１文章を生成する第１文章生成ステップと、
前記生成した複数の第１文章の候補をそれぞれ提示する第１文章候補提示ステップと、
ユーザによる前記第１文章の選択結果に基づいて、前記第１文章を含む第２文章を生成する第２文章生成ステップと、
を実行させ、
前記第１文章生成ステップにおいて、取得した一又は複数のキーワードを入力として、少なくともベースモデルとカスタマイズモデルとのいずれかに基づく学習モデルによる機械学習により、複数の前記第１文章を生成する、
プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理システム、情報処理方法、およびプログラムに関する。

【背景技術】

【0002】

特許文献１には、音声データから生成されたテキストデータからキーワードおよび高頻度語を抽出し、抽出したキーワードと高頻度語によって議事録を生成する技術が開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２２－１３５８６号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、特許文献１に記載の技術は、話し言葉から書き言葉への変換などの議事録としての体裁を整えるなどの作業が必要であり、工数がかかるという課題がある。
また、機械学習による議事録生成もあるが、機械学習による議事録生成では、入力テキストデータと当該入力テキストデータに対応する出力文章との組を大量に学習する必要があり、また、機密性の高い文章を学習データに用いることが困難である。そのため、専門用語が多用される議事録生成は困難であった。
このように、音声認識により生成されたテキストデータから効率的に議事録を生成することができないという課題があった。

【0005】

本発明は、上記の点に鑑みてなされたものであり、音声認識により生成されたテキストデータから効率的に議事録を生成することができる情報処理システム、情報処理方法、およびプログラムを提供することを課題とする。

【課題を解決するための手段】

【0006】

本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得部と、前記キーワードを含む第１文章を生成する第１文章生成部と、を備える情報処理システムである。

【0007】

また、本発明の一態様は、情報処理装置のコンピュータが、音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得過程と、前記キーワードを含む第１文章を生成する第１文章生成過程と、を有する情報処理方法である。

【0008】

また、本発明の一態様は、情報処理装置のコンピュータに、音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得ステップと、前記キーワードを含む第１文章を生成する第１文章生成ステップと、を実行させるためのプログラムである。

【発明の効果】

【0009】

本発明によれば、音声認識により生成されたテキストデータから効率的に議事録を生成することができる。

【図面の簡単な説明】

【0010】

【図1】本発明の第１の実施形態に係る情報処理システムの構成の一例を示すシステム構成図である。

【図2】本発明の第１の実施形態に係る変換装置の構成の一例を示すブロック図である。

【図3】本発明の第１の実施形態に係るキーワード抽出装置の構成の一例を示すブロック図である。

【図4】本発明の第１の実施形態に係る情報処理装置の機能構成の一例を示すブロック図である。

【図5】本発明の第１の実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。

【図6】本発明の第１の実施形態に係る情報処理システムにおける情報処理の一例を示すフローチャートである。

【図7】本発明の第１の実施形態に係る情報処理装置における表示画面の一例を示す図である。

【発明を実施するための形態】

【0011】

（第１の実施形態）
以下、図面を参照しながら本発明の第１の実施形態について説明する。
＜情報処理システムの構成＞
まず、情報処理システムの構成について説明する。
図１は、本発明の第１の実施形態に係る情報処理システムの構成の一例を示すシステム構成図である。
情報処理システムは、変換装置１と、キーワード抽出装置２と、情報処理装置３と、を含んで構成される。変換装置１と、キーワード抽出装置２と、情報処理装置３とは、ネットワークＮＷを介して通信可能に相互接続される。

【0012】

変換装置１は、音声データをテキストデータに変換する機能を有する。変換装置１は、音声データが入力されると、音声認識により音声データをテキストデータに変換する。変換装置１は、変換したテキストデータを、ネットワークＮＷを介してキーワード抽出装置２に送信する。

【0013】

キーワード抽出装置２は、テキストデータからキーワードを抽出する機能を有する。キーワード抽出装置２は、変換装置１からテキストデータを受信すると、当該テキストデータから所定数のキーワードを抽出する。キーワード抽出装置２は、抽出した所定数のキーワードをキーワード候補として、ネットワークＮＷを介して情報処理装置３に送信する。

【0014】

情報処理装置３は、キーワード候補の中から選択されたキーワードを含む一または複数の文章を生成する機能を有する。当該キーワードを含む一または複数の文章には、キーワード候補の中から選択された一または複数のキーワードのすべてが含まれる。ここで、以下の説明では、当該キーワードを含む複数の文章を第１文章の候補と称して説明する。また、以下の説明では、第１文章の候補から選択された１つの文章を第１文章と称して説明する。

【0015】

なお、第１文章が１つの文章のみである場合には、当該１つの文章が第１文書の候補であり、また第１文章でもある。

【0016】

第１文章候補および第１文章は、テキストデータの所定分量ごとに生成される。所定分量は、例えば、一文ごと、複数文ごと、音声データの所定時間分に対応するテキストデータごと、テキストデータの所定文字数ごとなどである。

【0017】

なお、所定分量は、所定分量の設定情報を情報処理装置３が予め記憶していてもよいし、後述する情報処理を開始するときにユーザから所定分量として文の区切りの設定を受け付け、受け付けた設定を所定分量の設定情報として情報処理装置３が記憶してもよい。所定分量の設定情報は、所定分量を設定するための情報である。
なお、情報処理装置３は、キーワードが変更された場合、あるいは第１文章が選択された場合には、新たなキーワードを含む第１文章の候補を生成する。ここで、第１文章は、第２文章、例えば議事録を生成するための雛型となる雛型文章である。当該雛型文章は、選択されたキーワードを入力すると機械学習によって生成される文章である。

【0018】

情報処理装置３は、選択されたキーワードごとの第１文章を含む第２文章を生成する。換言すれば、情報処理装置３は、複数の第１文章の組み合わせによって第２文章を生成する。当該第２文章は、ユーザによって編集可能である。

【0019】

このように、本実施形態に係る情報処理システムは、音声認識によって生成されたテキストデータからキーワード候補を抽出する。情報処理システムは、キーワード候補の中から選択されたすべてのキーワードを含む第１文章候補を生成する。情報処理システムは、選択されたキーワードごとに生成された第１文章候補の中から選択された第１文章を含む第２の文章を編集可能に生成する。

【0020】

これにより、情報処理システムは、機械学習による学習結果と、選択されたキーワードとに基づいて、雛形となる第１文章を生成することができるため、効率的に議事録を生成することができる。

【0021】

＜変換装置１の構成＞
次いで、変換装置１について説明する。
図２は、本発明の第１の実施形態に係る変換装置１の構成の一例を示すブロック図である。
変換装置１は、通信部１１と、制御部１２と、記憶部１３と、を含んで構成される。

【0022】

＜通信部１１＞
通信部１１は、ネットワークを介して他の装置と通信する機能を有する。通信部１１は、他の装置から受信したデータを制御部１２に出力する。また、通信部１１は、制御部１２から入力されるデータを、他の装置に送信する。
＜記憶部１３＞
記憶部１３は、各種データ、アプリケーション、プログラムを記憶する機能を有する。

【0023】

＜制御部１２＞
制御部１２は、変換装置１を制御する機能を有する。制御部１２は、記憶部１３に記憶された各種データ、アプリケーション、プログラムなどを読み出して変換装置１を制御する。

【0024】

より詳細に制御部１２の処理について説明する。
制御部１２は、音声データ取得部１２１と、音声認識部１２２と、テキストデータ出力部１２３と、を含んで構成される。

【0025】

＜音声データ取得部１２１＞
音声データ取得部１２１は、音声データを取得する機能を有する。音声データ取得部１２１は、音声データを、入力部（非図示）を介して取得する。なお、音声データは、通信部１１を介して他の装置から送信された音声データを受信することで取得してもよいし、予め記憶部１３に記憶された音声データを読み出すことで取得してもよい。音声データ取得部１２１は、取得した音声データを音声認識部１２２に出力する。

【0026】

＜音声認識部１２２＞
音声認識部１２２は、音声データを音声認識よりテキストデータに変換する機能を有する。音声認識は、音声認識エンジンによって実行される。音声認識部１２２は、変換した（生成した）テキストデータを、テキストデータ出力部１２３に出力する。

【0027】

＜テキストデータ出力部１２３＞
テキストデータ出力部１２３は、音声認識部１２２が生成したテキストデータを出力する機能を有する。テキストデータ出力部１２３は、テキストデータを、通信部１１を介してキーワード抽出装置２に送信する。

【0028】

＜キーワード抽出装置２＞
次いで、キーワード抽出装置２について説明する。
図３は、本発明の第１の実施形態に係るキーワード抽出装置２の構成の一例を示すブロック図である。
キーワード抽出装置２は、通信部２１と、制御部２２と、記憶部２３と、を含んで構成される。

【0029】

＜通信部２１＞
通信部２１は、ネットワークを介して他の装置と通信する機能を有する。通信部２１は、他の装置から受信したデータを制御部２２に出力する。また、通信部２１は、制御部２２から入力されるデータを、他の装置に送信する。

【0030】

＜記憶部２３＞
記憶部２３は、各種データ、アプリケーション、プログラムを記憶する機能を有する。

【0031】

＜制御部２２＞
制御部２２は、キーワード抽出装置２を制御する機能を有する。制御部２２は、記憶部２３に記憶された各種データ、アプリケーション、プログラムなどを読み出してキーワード抽出装置２を制御する。より詳細に制御部２２の処理について説明する。
制御部２２は、テキストデータ取得部２２１と、設定情報取得部２２２と、テキスト抽出部２２３と、キーワード抽出部２２４と、キーワード出力部２２５と、を含んで構成される。

【0032】

＜テキストデータ取得部２２１＞
テキストデータ取得部２２１は、テキストデータを、通信部２１を介して変換装置１から取得する機能を有する。テキストデータ取得部２２１は、取得したテキストデータをテキスト抽出部２２３に出力する。

【0033】

＜設定情報取得部２２２＞
設定情報取得部２２２は、記憶部２３から設定情報を取得する機能を有する。設定情報は、キーワードを抽出する対象となるテキストデータの所定分量の情報、抽出キーワード数の情報である。抽出キーワード数の情報は、キーワード抽出部２２４がテキストデータから抽出するキーワード数に関する情報である。設定情報取得部２２２は、設定情報を記憶部２３から読み出す。設定情報取得部２２２は、読み出した設定情報をテキスト抽出部２２３、およびキーワード抽出部２２４に出力する。

【0034】

＜テキスト抽出部２２３＞
テキスト抽出部２２３は、テキストデータ取得部２２１が取得したテキストデータから所定分量ごとのテキストを抽出する機能を有する。テキスト抽出部２２３は、抽出した所定分量ごとのテキストに対応するテキストデータをキーワード抽出部２２４に出力する。

【0035】

＜キーワード抽出部２２４＞
キーワード抽出部２２４は、テキスト抽出部２２３から入力されたテキストデータからキーワードを抽出する機能を有する。キーワード抽出部２２４は、テキストデータごとに設定情報で示されるキーワード数のキーワードを抽出する。キーワード抽出部２２４は、抽出したキーワードをキーワード出力部２２５に出力する。

【0036】

ここで、キーワード抽出部２２４によるキーワードの抽出には、ｔｅｒｍｆｒｅｑｕｅｎｃｙ－ｉｎｖｅｒｓｅｄｏｃｕｍｅｎｔｆｒｅｑｕｅｎｃｙ（ＴＦ－ＩＤＦ）やＰｏｓｉｔｉｏｎＲａｎｋ、ｂｉｄｉｒｅｃｔｉｏｎａｌｅｎｃｏｄｅｒｒｅｐｒｅｓｅｎｔａｔｉｏｎｓｆｒｏｍｔｒａｎｓｆｏｒｍｅｒｓ（ＢＥＲＴ）などを用いる。ＴＦ－ＩＤＦは、文章内における単語の出現回数や出現頻度などに比例して増加する値であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを示す統計量（数値）である。ＰｏｓｉｔｉｏｎＲａｎｋは、単語ごと重要度を算出し、高い重要度の単語を使ってキーフレーズを抽出するアルゴリズムである。ＢＥＲＴは、自然言語処理の事前学習用ためのＴｒａｎｓｆｏｒｍｅｒベースの機械学習手法である。すなわち、キーワード抽出部２２４は、ＴＦ－ＩＤＦやＰｏｓｉｔｉｏｎＲａｎｋなどの単語の出現回数、単語の出現頻度に基づくキーワード抽出手段やＢＥＲＴなどの前後の文脈から算出される単語の重要度に基づくキーワード抽出手段などを用いて、テキスト抽出部２２３から入力されたテキストデータごとに設定情報で示されるキーワード数のキーワードを抽出する。なお、キーワード抽出手段は、一例であり、ＭｕｌｔｉｐａｒｔｉｔｅＲａｎｋ、ＴｏｐｉｃＲａｎｋ、ＹＡＫＥ、ＳＧＲａｎｋ、ｓＣＡＫＥなど、一般的なその他のキーワード抽出手段を用いてもよい。

【0037】

＜キーワード出力部２２５＞
キーワード出力部２２５は、キーワードを出力する機能を有する。キーワード出力部２２５は、キーワード抽出部２２４から入力されたキーワードを、通信部２１を介して情報処理装置３に送信する。

【0038】

＜情報処理装置３＞
次いで、情報処理装置３について説明する。
図４は、本発明の第１の実施形態に係る情報処理装置３の機能構成の一例を示すブロック図である。
情報処理装置３は、通信部３１と、制御部３２と、記憶部３３と、を含んで構成させる。制御部３２は、キーワード取得部３２１と、キーワード候補提示部３２２と、第１文章生成部３２３と、第１文章候補提示部３２４と、第２文章生成部３２５と、出力部３２６と、学習部３２７と、を含んで構成される。

【0039】

＜通信部３１＞
通信部３１は、ネットワークを介して他の装置と通信する機能を有する。通信部３１は、他の装置から受信したデータを制御部３２に出力する。また、通信部３１は、制御部３２から入力されるデータを、他の装置に送信する。
＜記憶部３３＞
記憶部３３は、各種データ、アプリケーション、プログラムを記憶する機能を有する。

【0040】

＜制御部３２＞
制御部３２は、情報処理装置３を制御する機能を有する。制御部３２は、記憶部３３に記憶された各種データ、アプリケーション、プログラムなどを読み出して情報処理装置３を制御する。

【0041】

＜キーワード取得部３２１＞
キーワード取得部３２１は、キーワードを取得する機能を有する。キーワード取得部３２１は、通信部３１を介してキーワード抽出装置２から受信したキーワードを取得する。キーワード取得部３２１は、取得したキーワードを、キーワード候補として記憶部３３に記憶させる。また、キーワード取得部３２１は、取得したキーワードをキーワード候補としてキーワード候補提示部３２２に出力する。

【0042】

＜キーワード候補提示部３２２＞
キーワード候補提示部３２２は、キーワード候補を提示してキーワードを選択させる機能を有する。キーワード候補提示部３２２は、キーワード取得部３２１から入力された一又は複数のキーワード候補を、出力部３２６を介してユーザに提示する。キーワード取得部３２１は、キーワードが複数存在する場合、キーワード抽出装置２によるキーワード抽出時のキーワードの重要度、キーワードの出現頻度、キーワードの出現回数などにより、キーワードの重要度が高い順、キーワードの出現頻度が高い順、或いはキーワードの出現回数が多い順にキーワードごとの順位付けを行い、順位の高いキーワードから高い順に所定数のキーワードを提示する。所定数は、予め定められたキーワード数であってもよいし、キーワード候補として提示可能な数であってもよいし、キーワード候補すべてであってもよい。

【0043】

キーワード候補提示部３２２は、キーワード候補の提示に基づいて、ユーザによるキーワードの選択操作を受け付ける。キーワード候補提示部３２２は、提示したキーワード候補に対してユーザが一または複数のキーワードを選択したことに基づいて、選択されたキーワード候補を選択キーワードとして第１文章生成部３２３に出力する。キーワード候補提示部３２２は、ユーザによって選択キーワードが変更されたことに基づいて、選択キーワードを第１文章生成部３２３に出力する。

【0044】

なお、キーワード候補提示部３２２は、キーワード候補の他に、ユーザが入力した任意キーワードをキーワード候補として提示してもよい。
このようにすることで、任意キーワードを含むキーワード候補の中から選択キーワードを選択、変更可能であるため、従来のような発話（テキストデータ）内に出現する単語に限られず、ユーザの意図に沿った表現を用いることができる。そのため、効率的に議事録を生成することができる。

【0045】

＜第１文章生成部３２３＞
第１文章生成部３２３は、入力された選択キーワードに基づいて、選択キーワードを含む第１文章を生成する機能を有する。第１文章生成部３２３は、キーワード候補提示部３２２から入力された選択キーワードに基づいて、当該選択キーワードを含む第１文章を生成する。選択キーワードを含む第１文章は、選択キーワードのすべてを含む文章である。第１文章生成部３２３は、同じ選択キーワードを用いた異なる第１文章を複数種類生成する。第１文章生成部３２３は、生成した第１文章を、第１文章候補として第１文章候補提示部３２４に出力する。

【0046】

ここで、第１文章の生成は、生成型のＴｒａｎｓｆｏｒｍｅｒモデルを用いて選択キーワードを含む第１文章を生成する。生成型のＴｒａｎｓｆｏｒｍｅｒモデルは、例えばＧｅｎｅｒａｔｉｖｅＰｒｅｔｒａｉｎｅｄＴｒａｎｓｆｏｒｍｅｒ（ＧＰＴ）である。ＧＰＴは、Ｔｒａｎｓｆｏｒｍｅｒと呼ばれる深層学習を用いて文章を自動生成する自己回帰言語モデルである。ＧＰＴは、ある単語の次に続く単語を学習データでの出現確率分布に基づいて繰り返し予測することで第１文章を生成する。ＧＰＴは、キーワードを入力とし、出力を第１文章とする学習モデルを用いる。当該学習モデルは、ベースモデルと呼ばれる汎用型学習モデルおよび、ファインチューニングと呼ばれる専用学習モデル（カスタマイズモデルともいう）の一方または両方である。カスタマイズモデルは、顧客、業種、部署、分野、テーマなどに適した専用学習モデルである。

【0047】

このようにすることで、従来は入力とする音声認識によるテキストデータと、出力となる議事録とを組として、大量の組を用いて学習することが必要であったが、入力とするキーワードと、出力となる第１文章とを対として学習すればよいため、効率的に機械学習させることができる。また、大量の組を用いて学習する場合、機密情報を含む議事録などを用いることが困難であったが、キーワードと第１文章との対を学習すればよいため、専用学習モデルを用いて学習することができる。そのため、ユーザが所望する分野に適した第１文章を生成することができる。

【0048】

＜第１文章候補提示部３２４＞
第１文章候補提示部３２４は、第１文章候補を提示し、その結果として第１文章の選択操作を受け付ける機能を有する。第１文章候補提示部３２４は、第１文章生成部３２３から入力された第１文章候補を、出力部３２６を介してユーザに提示する。第１文章候補提示部３２４は、第１文章候補の中からユーザが第１文章を選択したことに基づいて、選択された第１文章を第２文章生成部３２５に出力する。また、第１文章候補提示部３２４は、選択された第１文章を、当該第１文章に含まれるキーワードと対応付けて記憶部３３に記憶させる。

【0049】

＜第２文章生成部３２５＞
第２文章生成部３２５は、選択された第１文章によって、当該第１文章を含む第２文章を生成する機能を有する。第２文章は、所定分量のテキストデータごとに選択された第１文章を含み、第１文章群によって生成される文章である。第２文章生成部３２５は、第２文章を出力部３２６に出力する。

【0050】

＜出力部３２６＞
出力部３２６は、キーワード候補提示部３２２、第１文章候補提示部３２４、第２文章生成部３２５から出力される各種情報を出力する機能を有する。出力部３２６は、表示装置を備え、当該表示装置にキーワード候補、第１文章候補、第２文章などを表示させる。

【0051】

＜学習部３２７＞
学習部３２７は、第１文章を生成するための学習モデルを学習する機能を有する。学習部３２７が用いる学習モデルは、ベースモデルおよびカスタマイズモデルによって、予め学習されているものとする。学習モデルは、キーワードを入力とし、出力として第１文章を得る学習モデルである。学習部３２７は、記憶部３３に記憶されたキーワードと、当該キーワードを含む第１文章とを読み出して強化学習する。

【0052】

＜ハードウェア構成＞
次いで、情報処理装置３のハードウェア構成について説明する。なお、変換装置１、キーワード抽出装置２のハードウェア構成については、説明を省略するが、図５を用いて説明するブロック図と同様の構成を有する。
図５は、本発明の第１の実施形態に係る情報処理装置３のハードウェア構成の一例を示すブロック図である。
情報処理装置３は、ＣＰＵ３０１と、記憶媒体インタフェース部３０２と、記憶媒体３０３と、入力装置３０４と、出力装置３０５と、ＲＯＭ３０６（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）と、ＲＡＭ３０７（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）と、補助記憶部３０８と、ネットワークインタフェース部３０９と、を備える。ＣＰＵ３０１と、記憶媒体インタフェース部３０２と、入力装置３０４と、出力装置３０５と、ＲＯＭ３０６と、ＲＡＭ３０７と、補助記憶部３０８と、ネットワークインタフェース部３０９とは、バスを介して相互に接続される。
なお、ここで言うＣＰＵ３０１は、プロセッサ一般のことを示すものであって、狭義のいわゆるＣＰＵと呼ばれるデバイスのことだけではなく、例えばＧＰＵやＤＳＰ等も含む。また、ここで言うＣＰＵ３０１は、一つのプロセッサで実現されることに限られず、同じ、または異なる種類の複数のプロセッサを組み合わせることで実現されてもよい。

【0053】

＜ＣＰＵ３０１＞
ＣＰＵ３０１は、補助記憶部３０８、ＲＯＭ３０６およびＲＡＭ３０７が記憶するプログラムを読み出して実行し、また、補助記憶部３０８、ＲＯＭ３０６およびＲＡＭ３０７が記憶する各種データを読み出し、補助記憶部３０８、ＲＡＭ３０７に対して各種データを書き込むことにより、情報処理装置３を制御する。また、ＣＰＵ３０１は、記憶媒体インタフェース部３０２を介して記憶媒体３０３が記憶する各種データを読み出し、また、記憶媒体３０３に各種データを書き込む。
＜記憶媒体３０３＞
記憶媒体３０３は、光磁気ディスク、フレキシブルディスク、フラッシュメモリなどの可搬記憶媒体であり、各種データを記憶する。

【0054】

＜記憶媒体インタフェース部３０２＞
記憶媒体インタフェース部３０２は、記憶媒体３０３の読み書きを行うインタフェースである。

【0055】

＜入力装置３０４＞
入力装置３０４は、マウス、キーボード、タッチパネル、音量調整ボタン、電源ボタン、設定ボタン、赤外線受信部などの入力装置である。

【0056】

＜出力装置３０５＞
出力装置３０５は、表示部、スピーカなどの出力装置である。

【0057】

＜ＲＯＭ３０６、ＲＡＭ３０７＞
ＲＯＭ３０６、ＲＡＭ３０７は、変換装置１の各機能部を動作させるためのプログラムや各種データを記憶する。

【0058】

＜補助記憶部３０８＞
補助記憶部３０８は、ハードディスクドライブ、フラッシュメモリなどであり、情報処理装置３の各機能部を動作させるためのプログラム、各種データを記憶する。

【0059】

＜ネットワークインタフェース部３０９＞
ネットワークインタフェース部３０９は、通信インタフェースを有し、無線通信によりネットワークＮＷに接続される。

【0060】

例えば、情報処理装置３の機能構成における制御部３２は、ＣＰＵ３０１に対応し、記憶部３３は、ＲＯＭ３０６、またはＲＡＭ３０７、または補助記憶部３０８、またはそれらの何れかの組み合わせに対応し、出力部３２６は、出力装置３０５に対応し、通信部３１は、ネットワークインタフェース部３０９に対応する。

【0061】

＜フローチャート＞
次いで、情報処理システムによる情報処理の一例について説明する。
図６は、本発明の第１の実施形態に係る情報処理システムにおける情報処理の一例を示すフローチャートである。
ステップＳ１００において、変換装置１は、音声認識により音声データをテキストデータに変換する。変換装置１は、変換したテキストデータをキーワード抽出装置２に送信する。
ステップＳ１０２において、キーワード抽出装置２は、所定分量のテキストデータからキーワードを抽出する。キーワード抽出装置２は、抽出したキーワードを情報処理装置３に送信する。

【0062】

ステップＳ１０４において、情報処理装置３は、キーワード抽出装置２が抽出したキーワードをキーワード候補として取得する。
ステップＳ１０６において、情報処理装置３は、キーワード候補を、出力部３２６を介してユーザに提示する。

【0063】

ステップＳ１０８において、情報処理装置３は、提示したキーワード候補の中からユーザ操作によるキーワードの選択を受け付ける。
ステップＳ１１０において、情報処理装置３は、ユーザによるキーワード選択操作が完了したか否かを判定する。キーワードの選択操作が完了している場合（ステップＳ１１０：ＹＥＳ）、情報処理装置３は、ステップＳ１１２の処理を実行する。一方、キーワードの選択操作が完了していない場合（ステップＳ１１０：ＮＯ）、情報処理装置３は、ステップＳ１０８の処理を実行する。ここで、選択操作が完了しているか否かは、ユーザ操作による操作信号が入力されなくなってから所定時間の経過によって判定してもよいし、キーワード選択以降の処理が実行されていることに基づいて判定されてもよい。

【0064】

ステップＳ１１２において、情報処理装置３は、選択された選択キーワードのすべてを含む第１文章を、複数種類生成する。
ステップＳ１１４において、情報処理装置３は、生成した複数種類の第１文章を第１文章候補として、出力部３２６を介してユーザに提示する。
ステップＳ１１６において、情報処理装置３は、第１文章候補の中からユーザに選択された第１文章によって第２文章を生成する。そして、キーワード抽出装置２はステップＳ１０２からの処理を繰り返すことで次の所定分量のテキストデータに対するキーワード候補を抽出し、続けて情報処理装置３は、次の所定分量のテキストデータに対するキーワード候補に対してステップＳ１０４からステップＳ１１６までの処理を繰り返し実行する。情報処理装置３は、テキストデータに対する最後の第１文章を含む第２文章を生成すると図６に係る処理を終了する。

【0065】

なお、ステップＳ１０８において、情報処理装置３は、提示したキーワード候補の中からユーザ操作によるキーワードの選択に加えて、または代えて、ユーザ操作により任意キーワードを入力させ、当該任意キーワードを選択キーワードとして用いてもよい。

【0066】

＜表示画面例＞
次いで、表示画面例について説明する。
図７は、本発明の第１の実施形態に係る情報処理装置の出力部に表示される表示画面例である。
図示する表示画面例は、第１画面Ｇ１と第２画面Ｇ２との２画面による表示画面例である。図示する例は、所定分量のテキストデータから抽出されたキーワードを用いて第１文章を生成し、選択された第１文章によって第２文章の部分Ｂを生成している場合の一例である。
第１画面Ｇ１には、キーワード候補を表す見出し語ＫＷＣ「キーワード候補」と表示される。
キーワード候補のそれぞれは、表示ウインドウｗ１に表示される。一例として、キーワードＫＷ１「機械学習」、キーワードＫＷ２「逼迫」がキーワード候補として表示される。

【0067】

ここで、キーワード候補を増加させる場合、チェックボックスＣＢ「キーワードを増やす」に対して「レ」をマークすることにより、表示ウインドウｗ１に表示されるキーワード候補を増加させることが可能である。図示する例では、チェックボックスＣＢに対する「レ」をマークしたことに基づいて、表示ウインドウｗ１にキーワードＫＷ３「データ収集」がキーワード候補として追加表示された場合の一例を示している。

【0068】

また、第１画面Ｇ１には、キーワード候補の中から選択されたキーワードを表す見出し語ＫＷＳ「選択キーワード」が表示される。選択キーワードは、表示ウインドウｗ２に表示される。例えば、キーワード候補の中からキーワードを選択するには、表示ウインドウｗ１に表示された各キーワードを、表示ウインドウｗ２にドラッグ＆ドロップさせる。表示ウインドウｗ２に移動されたキーワードが選択されたキーワードであることを表す。
図示する例では、キーワードＫＷ１「機械学習」、キーワードＫＷ２「逼迫」が選択キーワードとして選択された場合を示す。

【0069】

また、第１画面Ｇ１には、第１文章候補を表す見出し語ＳＮＣ「第１文章候補」と表示される。第１文章候補のそれぞれは、アイテムＳＮ１，ＳＮ２、ＳＮ３として表示される。
アイテムＳＮ１には、第１文章候補として、「候補Ａ」「機械学習を活用したＰｏＣを実施。懸念事項として、データ収集の対応工数が逼迫しており・・・・」と、選択キーワードに基づいて生成された第１文章が表示される。
アイテムＳＮ２には、第１文章候補として、「候補Ｂ」「社員の業務が逼迫しているため、機械学習を活用したアプリケーションを導入することで効率化を・・・」と、選択キーワードに基づいて生成された別の第１文章が表示される。
ここで、「候補Ａ」「候補Ｂ」とは、上述したように同じキーワードによって生成される異なる第１文章である。

【0070】

第２画面Ｇ２には、選択された第１文章を表す見出し語ＳＮＳ「選択第１文章」と表示される。
第１文章候補の中から第１文章を選択するには、第１文章候補のそれぞれを表すアイテムＳＮ１，ＳＮ２、ＳＮ３などを領域ＳＮにドラッグ＆ドロップさせる。
一例として、領域ＳＮには、選択された第１文章として「候補Ａ」「機械学習を活用したＰｏＣを実施。懸念事項として、データ収集の対応工数が逼迫しており・・・・」が表示される。

【0071】

また、第２画面Ｇ２には、第２文章を表す見出し語ＳＮＤ「第２文章」と表示される。
それぞれの第１文章によって生成される第２文章は、表示ウインドウｗ３に表示される。
図示する例では、選択された第１文章が表示ウインドウｗ３における部分Ｂ「機械学習を活用したＰｏＣを実施。懸念事項として、データ収集の対応工数が逼迫しており・・・・」ＳＳ２に表示される。

【0072】

なお、部分Ａ「・・・・」ＳＳ１には、テキストデータのうち、部分Ｂのキーワードに対応するテキストデータよりも前の部分の所定分量のテキストデータによって生成された第１文章が表示される。また、部分Ｃには、テキストデータのうちの次の部分の所定分量のテキストデータから抽出されるキーワードに基づく第１文章が表示される。
ここで、第２文章は、例えば、部分Ａ、部分Ｂ、部分Ｃの各部分の第１文章の順番を入れ替えることが可能である。例えば、部分Ｃ、部分Ｂ、部分Ａの順番に変更するなど、第２文章の編集が可能である。

【0073】

なお、ユーザ操作により任意キーワードを入力させ、当該任意キーワードを選択キーワードとして用いてもよい。この場合、情報処理装置３は、例えば、表示ウインドウｗ２に、キーワードＫＷ１「機械学習」、キーワードＫＷ２「逼迫」、に加えて、ユーザによって入力された任意キーワードを選択キーワードとして表示させ、任意キーワードを含むすべての選択キーワードを含む第１の文章を生成すればよい。

【0074】

このように、本実施形態に係る情報処理装置３は、音声データに対する音声認識によるテキストデータから抽出されたキーワードを取得するキーワード取得部３２１と、キーワードを含む第１文章を生成する第１文章生成部３２３と、を備える。

【0075】

これにより、音声認識により生成されたテキストデータ抽出したキーワードを用いて、機械学習によって文章を生成することができるため、効率的に議事録を生成することができる。

【0076】

また、情報処理装置３は、生成した第１文章の候補を複数提示する第１文章候補提示部３２４と、ユーザによる第１文章の選択結果に基づいて、第１文章を含む第２文章を生成する第２文章生成部３２５と、をさらに備える。

【0077】

同じキーワードから生成される複数種類の第１文章の中からユーザが意図する文章を選択することができるため、効率的に第２文章を生成することができる。そのため、効率的に議事録を生成することができる。

【0078】

また、情報処理装置３は、生成した第２文章をユーザが編集可能に出力する出力部３２６をさらに備える。

【0079】

これにより、ユーザの利便性を向上させることができる。また、第２文章の品質を向上させることができる。

【0080】

また、情報処理装置３は、テキストデータから抽出された一又は複数のキーワードを提示するキーワード候補提示部３２２、をさらに備え、第１文章生成部３２３は、ユーザが選択した一又は複数のキーワードのすべてを含む第１文章を一または複数生成する。

【0081】

このようにすることで、ユーザが意図するキーワードを用いた第１文章を生成することができるため、効率的に第２文章を生成することができる。また、テキストデータから抽出されるキーワードが口語体であっても、文語体のキーワードに変更することも可能であるため、効率的に第２文章を生成することができる。また、ユーザの利便性を向上させることができる。

【0082】

また、第１文章生成部３２３は、取得した前記一又は複数のキーワードを入力として、少なくとも汎用モデルとカスタマイズモデルとのいずれかに基づく学習モデルによる機械学習により、第１文章を生成する。

【0083】

これにより、キーワードと、キーワードを含む文章との組のみを学習すればよいため、学習効率を向上させることができる。

【0084】

また、キーワード取得部３２１は、所定分量ごとのテキストデータからキーワードを取得し、第１文章生成部３２３は、所定分量のテキストデータごとのキーワードを含む第１文章を生成する。
これにより、情報処理システムは、所定分量の区切りのテキストデータの範囲に対応するキーワードを取得して第１文章を生成することができるため、ユーザの意図する第１文章を生成することができる。また、ユーザが意図する第１文章の生成精度を向上させることができる。

【0085】

以上、図面を参照してこの発明の実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。

【0086】

例えば、上述した実施形態では、変換装置１、キーワード抽出装置２、情報処理装置３のようにそれぞれの装置によって構成される一例について説明したが、これらの装置の一部またはすべてを組み合わせた装置によって本発明の一態様を実現してもよい。

【0087】

なお、本発明の一態様における変換装置１、キーワード抽出装置２、情報処理装置３で動作するプログラムは、本発明の一態様に関わる上記の各実施形態や変形例で示した機能を実現するように、１つ、または複数の、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）等のプロセッサを制御するプログラム（コンピュータを機能させるプログラム）であっても良い。そして、これらの各装置で取り扱われる情報は、その処理時に一時的にＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）に蓄積され、その後、フラッシュメモリやＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）等の各種ストレージに格納され、必要に応じてＣＰＵ等によって読み出し、修正・書き込みが行われても良い。

【0088】

なお、上述した各実施形態や変形例における変換装置１、キーワード抽出装置２、情報処理装置３の一部又は全部を１つ、または複数のプロセッサを備えたコンピュータで実現するようにしても良い。その場合、この制御機能を実現するためのプログラムをコンピュータが読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現しても良い。

【0089】

なお、ここでいう「コンピュータシステム」とは、変換装置１、キーワード抽出装置２、情報処理装置３に内蔵されたコンピュータシステムであって、ＯＳや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ＲＯＭ、ＣＤ－ＲＯＭ等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。

【0090】

さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。

【0091】

また、上述した各実施形態や変形例における変換装置１、キーワード抽出装置２、情報処理装置３の一部、又は全部を典型的には集積回路であるＬＳＩとして実現してもよいし、チップセットとして実現してもよい。また、上述した各実施形態や変形例における換装置１、キーワード抽出装置２、情報処理装置３の各機能ブロックは個別にチップ化してもよいし、一部、又は全部を集積してチップ化してもよい。また、集積回路化の手法は、ＬＳＩに限らず専用回路、および／または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりＬＳＩに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いることも可能である。

【0092】

以上、この発明の一態様として各実施形態や変形例に関して図面を参照して詳述してきたが、具体的な構成は各実施形態や変形例に限られるものではなく、この発明の要旨を逸脱しない範囲の設計変更等も含まれる。また、本発明の一態様は、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。また、上記各実施形態や変形例に記載された要素であり、同様の効果を奏する要素同士を置換した構成も含まれる。

【符号の説明】

【0093】

１変換装置
１１通信部
１２制御部
１２１音声データ取得部
１２２音声認識部
１２３テキストデータ出力部
１３記憶部
２キーワード抽出装置
２１通信部
２２制御部
２２１テキストデータ取得部
２２２設定情報取得部
２２３テキスト抽出部
２２４キーワード抽出部
２２５キーワード出力部
２３記憶部
３情報処理装置
３１通信部
３２制御部
３２１キーワード取得部
３２２キーワード候補提示部
３２３第１文章生成部
３２４第１文章候補提示部
３２５第２文章生成部
３２６出力部
３２７学習部
３３記憶部
３０１ＣＰＵ
３０２記憶媒体インタフェース部
３０３記憶媒体
３０４入力装置
３０５出力装置
３０６ＲＯＭ
３０７ＲＡＭ
３０８補助記憶部
３０９ネットワークインタフェース部

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

【図7】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版