(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025023364
(43)【公開日】2025-02-17
(54)【発明の名称】録画データ文字起こしシステム、録画データ文字起こしシステムのプログラム
(51)【国際特許分類】
H04N 7/15 20060101AFI20250206BHJP
G06Q 50/10 20120101ALI20250206BHJP
G10L 15/00 20130101ALI20250206BHJP
【FI】
H04N7/15 150
G06Q50/10
H04N7/15
G10L15/00 200U
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023125317
(22)【出願日】2023-08-01
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年5月2日に「サテライトオフィス 企業活用GPT導入支援」ページに掲載 https://www.sateraito.jp/sateraito_AI/ 令和5年5月11日にサテライトオフィス・チャットボットマネージャーのマニュアルページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/home/notification/ai 令和5年5月12日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年5月14日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=gmMe8PO9Kc8 令和5年5月15日に「サテライトオフィス 企業活用GPT導入支援」ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/ 令和5年5月16日にサテライトオフィス・プレスリリースに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年5月16日に@Pressページに掲載 https://www.atpress.ne.jp/news/355628 令和5年5月16日にCNET Japanページに掲載 https://japan.cnet.com/release/30858336/ 令和5年5月16日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30858336/ 令和5年5月18日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=LuXn70q6XMg
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年5月19日に「サテライトオフィス 企業活用GPT導入支援」ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/ 令和5年5月19日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年5月22日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=jFqFoe6gGdI 令和5年5月26日に「サテライトオフィス 企業活用GPT導入支援」ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/ 令和5年5月26日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年5月27日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年5月29日にサテライトAI.AIボード(ChatGPT対応)のマニュアルページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/home/aiboard?hl=ja 令和5年5月29日に@Pressページに掲載 https://www.atpress.ne.jp/news/356912 令和5年5月29日にCNET Japanページに掲載 https://japan.cnet.com/release/30862289/ 令和5年5月29日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30862289/ 令和5年6月3日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=Y_2R1roB5V0
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年6月3日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年6月4日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年6月6日にサテライトオフィス・プレスリリースに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年6月6日に@Pressページに掲載 https://www.atpress.ne.jp/news/357892 令和5年6月6日にCNET Japanページに掲載 https://japan.cnet.com/release/30865181/ 令和5年6月6日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30865181/ 令和5年6月9日に「サテライトオフィス 企業活用GPT導入支援」ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/ 令和5年6月9日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=3mZH_D51XiA 令和5年6月9日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=Mkp3_O7fY7k 令和5年6月15日にサテライトオフィス・プレスリリースに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年6月15日に@Pressページに掲載 https://www.atpress.ne.jp/news/358818 令和5年6月15日にCNET Japanページに掲載 https://japan.cnet.com/release/30867808/
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年6月15日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30867808/ 令和5年6月17日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年6月21日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年6月21日に@Pressページに掲載 https://www.atpress.ne.jp/news/359508 令和5年6月21日にCNET Japanページに掲載 https://japan.cnet.com/release/30869962/ 令和5年6月21日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30869962/ 令和5年6月23日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年6月23日に@Pressページに掲載 https://www.atpress.ne.jp/news/359643 令和5年6月23日にCNET Japanページに掲載 https://japan.cnet.com/release/30870444/ 令和5年6月23日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30870444/ 令和5年6月27日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年6月27日に@Pressページに掲載 https://www.atpress.ne.jp/news/360124
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年6月27日にCNET Japanページに掲載 https://japan.cnet.com/release/30871733/ 令和5年6月27日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30871733/ 令和5年6月30日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年6月30日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年6月30日に@Pressページに掲載 https://www.atpress.ne.jp/news/360617 令和5年6月30日にCNET Japanページに掲載 https://japan.cnet.com/release/30873028/ 令和5年6月30日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30873028/ 令和5年7月1日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年7月5日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年7月5日に@Pressページに掲載 https://www.atpress.ne.jp/news/361143 令和5年7月5日にCNET Japanページに掲載 https://japan.cnet.com/release/30874639/
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年7月5日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30874639/ 令和5年7月7日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年7月7日に@Pressページに掲載 https://www.atpress.ne.jp/news/361443 令和5年7月7日にCNET Japanページに掲載 https://japan.cnet.com/release/30875550/ 令和5年7月7日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30875550/ 令和5年7月8日にサテライトAI・AIボード(ChatGPT対応)ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/01.html 令和5年7月8日に「サテライトAI.AIボード(ChatGPT対応)」サービスの利用者マニュアルページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/home/aiboard 令和5年7月8日にサテライトAI・社内チャットAI(ChatGPT対応)ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/02.html 令和5年7月8日にサテライトAI・社内情報AI(ChatGPT対応)ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/03.html 令和5年7月8日にサテライトAI・AIボイス(ChatGPT対応)ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/05.html
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年7月8日にサテライトAI・AIメール(ChatGPT対応)ページに掲載および資料をアップロード https://www.sateraito.jp/sateraito_AI/06.html 令和5年7月16日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine 令和5年7月17日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffce/site/manual/mailmagazine 令和5年7月19日にサテライトオフィス・プレスリリースページに掲載 https://www.sateraito.jp/pressrelease/index.html 令和5年7月19日に@Pressページに掲載 https://www.atpress.ne.jp/news/362644 令和5年7月19日にCNET Japanページに掲載 https://japan.cnet.com/release/30878765/ 令和5年7月19日にZDNet Japanページに掲載 https://japan.zdnet.com/release/30878765/ 令和5年7月23日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和5年7月25日にマイナビニュースページに掲載 https://news.mynavi.jp/techplus/kikaku/sateraito_AI-1/ 令和5年7月27日にサテライトAI・AIボード(ChatGPT対応)ページに動画を掲載 https://www.sateraito.jp/sateraito_AI/01.html 令和5年7月27日7にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=8R0h9HJa-jw&t=6s 令和5年7月27日にYouTubeページに動画をアップロード https://www.youtube.com/watch?v=fjyqXzfqLkY 令和5年7月30日にメール情報配信一覧ページに掲載 https://sites.sateraito.jp/sateraitooffice/site/manual/mailmagazine
(71)【出願人】
【識別番号】516346218
【氏名又は名称】株式会社サテライトオフィス
(74)【代理人】
【識別番号】100168538
【弁理士】
【氏名又は名称】加藤 来
(72)【発明者】
【氏名】原口 豊
(72)【発明者】
【氏名】原口 優
【テーマコード(参考)】
5C164
5L049
5L050
【Fターム(参考)】
5C164FA10
5C164PA44
5C164SB04S
5C164VA13P
5L049CC11
5L050CC11
(57)【要約】
【課題】ユーザーがオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データの全体を視聴することなく、簡単に確認することができる録画データ文字起こしシステムを提供する。
【解決手段】録画データ文字起こしシステム100は、ユーザー端末110Aとサーバ120とを備え、ユーザー端末110Aがサーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、ユーザー端末110Aまたはサーバ120がオンラインミーティングの録画データRDを作成し、ユーザー端末110Aにおいて所定操作があったとき、サーバ120が、事前学習済み人工知能手段131を用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成し、生成して得た生成テキストデータをデータベース121に保存する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ユーザー端末とサーバとを備えて録画データの音声について文字起こしをする録画データ文字起こしシステムであって、
前記ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、前記ユーザー端末またはサーバがオンラインミーティングの録画データを作成し、
前記ユーザー端末において所定操作があったとき、または、所定設定がある場合、前記サーバが、事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成し、生成して得た生成テキストデータをデータベースに保存する構成であることを特徴とする録画データ文字起こしシステム。
【請求項2】
前記ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、前記サーバがオンラインミーティングの録画データを作成してサーバの記憶部に保存し、
前記ユーザー端末のブラウザにおいて所定操作として所定領域への録画データのファイルアイコンのドラッグ操作、または、ファイル選択用ウィンドウにおける録画データの選択操作があったとき、前記ユーザー端末が、前記録画データおよび文字起こしを実行する旨の指示命令情報をサーバへ送信し、
前記サーバが、前記録画データおよび指示命令情報に基づいて事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行する構成であることを特徴とする請求項1に記載の録画データ文字起こしシステム。
【請求項3】
前記ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、前記サーバがオンラインミーティングの録画データを作成してサーバの記憶部に保存するとともに、録画データのURL情報を記載した電子メールでユーザー端末へ通知し、
前記ユーザー端末のブラウザにおいて所定操作として電子メールをブラウザにおける所定メールフォルダ・トレイへ移動する操作、または、電子メールを所定電子メールアドレスへ転送する操作があったとき、前記ユーザー端末が、前記URL情報および文字起こしを実行する旨の指示命令情報をサーバへ送信し、
前記サーバが、前記URL情報および指示命令情報に基づいて事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行する構成であることを特徴とする請求項1に記載の録画データ文字起こしシステム。
【請求項4】
前記サーバが、前記事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して、録画データの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータに基づいて事前学習済み人工知能手段を用いてオンラインミーティング内容について、タイトル、参加者、概要、参加メンバーの意図および課題の各項目情報を有した議事録テキストデータを生成し、生成して得た議事録生成テキストデータをデータベースに保存する構成であることを特徴とする請求項2に記載の録画データ文字起こしシステム。
【請求項5】
前記サーバが、前記事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して、録画データの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータに基づいて事前学習済み人工知能手段を用いて音声内容の要約テキストデータを生成し、生成して得た要約生成テキストデータをデータベースに保存する構成であることを特徴とする請求項4に記載の録画データ文字起こしシステム。
【請求項6】
前記サーバと通信自在な管理者端末の管理画面において、ユーザー識別情報によってユーザー端末のブラウザにおいてサーバのデータベースにアクセス可能なユーザーについて設定自在な構成であることを特徴とする請求項5に記載の録画データ文字起こしシステム。
【請求項7】
前記サーバが、前記事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成する際、前記事前学習済み人工知能手段が、前記オンラインミーティングを行ったユーザーについてのユーザー識別情報およびどのユーザー端末のマイクから入力された音声かについての入力端末情報に基づいて音声の主を特定して、音声主情報を生成テキストデータに含めて生成する構成であることを特徴とする請求項1乃至請求項6のいずれか1つに記載の録画データ文字起こしシステム。
【請求項8】
前記ユーザー端末のブラウザにおいて音声内容の生成テキストデータについて検索自在であり、検索操作があったとき、前記ユーザー端末が、入力された検索条件情報をサーバへ送信し、
前記サーバが、受信した検索条件情報およびデータベースの生成テキストデータに基づいて事前学習済み人工知能手段を用いて回答テキストデータを生成し、生成して得た回答生成テキストデータをユーザー端末へ送信し、
前記ユーザー端末が、受信した回答生成テキストデータをブラウザに表示する構成であることを特徴とする請求項7に記載の録画データ文字起こしシステム。
【請求項9】
録画データの音声について文字起こしをする録画データ文字起こしシステムのプログラムであって、
ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、ユーザー端末またはサーバがオンラインミーティングの録画データを作成する録画データ作成ステップと、
前記ユーザー端末において所定操作があったか否かを判定する、または、所定設定があるか否かを判定する所定操作・所定設定有無判定ステップと、
前記ユーザー端末において所定操作があったとき、または、所定設定がある場合、前記サーバが、事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成する文字起こし実行ステップと、
前記サーバが、生成して得た生成テキストデータをデータベースに保存する文字起こしテキスト保存ステップとを有していることを特徴とする録画データ文字起こしシステムのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ユーザー端末とサーバとを備えて録画データの音声について文字起こしをする録画データ文字起こしシステム、および、そのプログラムに関する。
【背景技術】
【0002】
従来、利用制限がある追加機能を利用可能なテレビ会議システムであって、追加機能に対して利用制限がない第1ユーザーと、追加機能に対して利用制限がある第2ユーザーとがテレビ会議に参加する場合において、第2ユーザーのテレビ会議へ参加人数が、予め定められた参加可能数以下の場合、追加機能の使用を許可し、第2ユーザーのテレビ会議へ参加人数が、参加可能数を超えている場合、追加機能の使用を制限する制限部を備えたテレビ会議システムが知られている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上述した従来のテレビ会議システムは、課金を行うことで追加機能であるテレビ会議の録画機能が使用可能となる構成であったため、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に確認するためには、会議後に時間をかけて録画データの全体を視聴する必要があり、簡単に確認することが困難であるという問題があった。
【0005】
そこで、本発明は、前述したような従来技術の問題を解決するものであって、すなわち、本発明の目的は、ユーザーがオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データの全体を視聴することなく、簡単に確認することができる録画データ文字起こしシステム、および、そのプログラムを提供することである。
【課題を解決するための手段】
【0006】
本請求項1に係る発明は、ユーザー端末とサーバとを備えて録画データの音声について文字起こしをする録画データ文字起こしシステムであって、前記ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、前記ユーザー端末またはサーバがオンラインミーティングの録画データを作成し、前記ユーザー端末において所定操作があったとき、または、所定設定がある場合、前記サーバが、事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成し、生成して得た生成テキストデータをデータベースに保存する構成であることにより、前述した課題を解決するものである。
【0007】
本請求項2に係る発明は、請求項1に記載された録画データ文字起こしシステムの構成に加えて、前記ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、前記サーバがオンラインミーティングの録画データを作成してサーバの記憶部に保存し、前記ユーザー端末のブラウザにおいて所定操作として所定領域への録画データのファイルアイコンのドラッグ操作、または、ファイル選択用ウィンドウにおける録画データの選択操作があったとき、前記ユーザー端末が、前記録画データおよび文字起こしを実行する旨の指示命令情報をサーバへ送信し、前記サーバが、前記録画データおよび指示命令情報に基づいて事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行する構成であることにより、前述した課題をさらに解決するものである。
【0008】
本請求項3に係る発明は、請求項1に記載された録画データ文字起こしシステムの構成に加えて、前記ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、前記サーバがオンラインミーティングの録画データを作成してサーバの記憶部に保存するとともに、録画データのURL情報を記載した電子メールでユーザー端末へ通知し、前記ユーザー端末のブラウザにおいて所定操作として電子メールをブラウザにおける所定メールフォルダ・トレイへ移動する操作、または、電子メールを所定電子メールアドレスへ転送する操作があったとき、前記ユーザー端末が、前記URL情報および文字起こしを実行する旨の指示命令情報をサーバへ送信し、前記サーバが、前記URL情報および指示命令情報に基づいて事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行する構成であることにより、前述した課題をさらに解決するものである。
【0009】
本請求項4に係る発明は、請求項2に記載された録画データ文字起こしシステムの構成に加えて、前記サーバが、前記事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して、録画データの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータに基づいて事前学習済み人工知能手段を用いてオンラインミーティング内容について、タイトル、参加者、概要、参加メンバーの意図および課題の各項目情報を有した議事録テキストデータを生成し、生成して得た議事録生成テキストデータをデータベースに保存する構成であることにより、前述した課題をさらに解決するものである。
【0010】
本請求項5に係る発明は、請求項4に記載された録画データ文字起こしシステムの構成に加えて、前記サーバが、前記事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して、録画データの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータに基づいて事前学習済み人工知能手段を用いて音声内容の要約テキストデータを生成し、生成して得た要約生成テキストデータをデータベースに保存する構成であることにより、前述した課題をさらに解決するものである。
【0011】
本請求項6に係る発明は、請求項5に記載された録画データ文字起こしシステムの構成に加えて、前記サーバと通信自在な管理者端末の管理画面において、ユーザー識別情報によってユーザー端末のブラウザにおいてサーバのデータベースにアクセス可能なユーザーについて設定自在な構成であることにより、前述した課題をさらに解決するものである。
【0012】
本請求項7に係る発明は、請求項1乃至請求項6のいずれか1つに記載された録画データ文字起こしシステムの構成に加えて、前記サーバが、前記事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成する際、前記事前学習済み人工知能手段が、前記オンラインミーティングを行ったユーザーについてのユーザー識別情報およびどのユーザー端末のマイクから入力された音声かについての入力端末情報に基づいて音声の主を特定して、音声主情報を生成テキストデータに含めて生成する構成であることにより、前述した課題をさらに解決するものである。
【0013】
本請求項8に係る発明は、請求項7に記載された録画データ文字起こしシステムの構成に加えて、前記ユーザー端末のブラウザにおいて音声内容の生成テキストデータについて検索自在であり、検索操作があったとき、前記ユーザー端末が、入力された検索条件情報をサーバへ送信し、前記サーバが、受信した検索条件情報およびデータベースの生成テキストデータに基づいて事前学習済み人工知能手段を用いて回答テキストデータを生成し、生成して得た回答生成テキストデータをユーザー端末へ送信し、前記ユーザー端末が、受信した回答生成テキストデータをブラウザに表示する構成であることにより、前述した課題をさらに解決するものである。
【0014】
本請求項9に係る発明は、録画データの音声について文字起こしをする録画データ文字起こしシステムのプログラムであって、ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、ユーザー端末またはサーバがオンラインミーティングの録画データを作成する録画データ作成ステップと、前記ユーザー端末において所定操作があったか否かを判定する、または、所定設定があるか否かを判定する所定操作・所定設定有無判定ステップと、前記ユーザー端末において所定操作があったとき、または、所定設定がある場合、前記サーバが、事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成する文字起こし実行ステップと、前記サーバが、生成して得た生成テキストデータをデータベースに保存する文字起こしテキスト保存ステップとを有していることにより、前述した課題を解決するものである。
【発明の効果】
【0015】
本発明の録画データ文字起こしシステムは、ユーザー端末とサーバとを備えていることにより、ユーザー端末とサーバとの間において通信することができるばかりでなく、以下のような特有の効果を奏することができる。
【0016】
本請求項1に係る発明の録画データ文字起こしシステムによれば、オンラインミーティングであるテレビ会議の内容が生成テキストデータで保存されるため、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データの全体を視聴することなく、簡単に確認することができる。
【0017】
本請求項2に係る発明の録画データ文字起こしシステムによれば、請求項1に係る発明が奏する効果に加えて、録画データのファイルアイコンを直接選択する操作によって録画データが特定されるため、ユーザーの所定操作をシンプルにするとともに録画データの誤選択を回避することができる。
【0018】
本請求項3に係る発明の録画データ文字起こしシステムによれば、請求項1に係る発明が奏する効果に加えて、ユーザーは電子メールによる通知を受けて電子メールをブラウザにおける所定メールフォルダ・トレイへ移動する操作、または、電子メールを所定電子メールアドレスへ転送する操作をするだけで録画データの音声について文字起こしが実行されるため、ユーザーの所定操作をシンプルにすることができる。
【0019】
本請求項4に係る発明の録画データ文字起こしシステムによれば、請求項2に係る発明が奏する効果に加えて、オンラインミーティングであるテレビ会議の内容のタイトル、参加者、概要、参加メンバーの意図および課題の各項目情報を有した議事録が議事録生成テキストデータで保存されるため、ユーザーはオンラインミーティングであるテレビ会議の内容の議事録について会議後にテレビ会議の内容全体の生成テキストデータを確認することなく簡単に確認することができる。
さらに、何が課題であるかが議事録生成テキストデータにおいて明記されるため、たとえテレビ会議において課題が曖昧になってしまった場合であっても、事前学習済み人工知能手段によってはっきりと課題を指摘してもらえ、人から指摘されるときと比べて確認したユーザーは素直に問題点などの課題を聞き入れることができる。
【0020】
本請求項5に係る発明の録画データ文字起こしシステムによれば、請求項4に係る発明が奏する効果に加えて、オンラインミーティングであるテレビ会議の内容の要約が要約生成テキストデータで保存されるため、ユーザーはオンラインミーティングであるテレビ会議の内容の要約について会議後にテレビ会議の内容全体の生成テキストデータを確認することなく簡単に確認することができる。
【0021】
本請求項6に係る発明の録画データ文字起こしシステムによれば、請求項5に係る発明が奏する効果に加えて、例えば、企業内のユーザーのみにアクセス権を与えて企業内のユーザーのユーザー端末のみがテレビ会議の内容の生成テキストデータや要約生成テキストデータを表示可能となるため、管理者が指定したユーザーのみで生成テキストデータや要約生成テキストデータを共有することができる。
【0022】
本請求項7に係る発明の録画データ文字起こしシステムによれば、請求項1乃至請求項6のいずれか1つに係る発明が奏する効果に加えて、会話の中で話をした人の情報と話の内容の情報とがセットで生成テキストデータに含まれるため、ユーザーはオンラインミーティングであるテレビ会議の内容について会議後に誰が何を話したかを話した人の声の調子の善し悪しや声色に関わらず簡単に確認することができる。
【0023】
本請求項8に係る発明の録画データ文字起こしシステムによれば、請求項7に係る発明が奏する効果に加えて、例えば、ユーザーが検索条件情報として「○○の件を話していた人は誰ですか?」と質問して検索した場合、検索条件情報に基づいて生成テキストデータに含まれた音声主情報と話の内容情報とのセットの情報から回答生成テキストデータが生成されるため、ユーザーは、例えば、「XX部のAさんです。」の旨の回答生成テキストデータを得ることができる。
【0024】
本請求項9に係る発明の録画データ文字起こしシステムのプログラムによれば、請求項1に係る発明が奏する効果と同様、オンラインミーティングであるテレビ会議の内容が生成テキストデータで保存されるため、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データの全体を視聴することなく、簡単に確認することができる。
【図面の簡単な説明】
【0025】
【
図1】本発明の実施例である録画データ文字起こしシステムの概念を示す図。
【
図2】本発明の実施例である録画データ文字起こしシステムの動作例を示すチャート図。
【
図3】本発明の実施例である録画データ文字起こしシステムのユーザー端末のブラウザにおける録画設定の例を示す図。
【
図4】本発明の実施例である録画データ文字起こしシステムのユーザー端末のブラウザにおける録画データについての電子メールの通知の例を示す図。
【
図5】(A)(B)は所定操作として録画データのファイルアイコンをドラッグ操作する様子を示す図および所定操作としてファイル選択用ウィンドウにおいて録画データのファイルを選択する様子を示す図。
【
図6】(A)(B)は所定操作として電子メールを所定フォルダに移動させる様子を示す図および所定操作として電子メールを所定電子メールアドレスへ転送する様子を示す図。
【
図7】(A)(B)は録画データの例を示す図および生成テキストデータの例を示す図。
【
図8】(A)(B)はテレビ会議の議事録生成テキストデータの例を示す図および要約生成テキストデータの例を示す図。
【
図9】本発明の実施例である録画データ文字起こしシステムの管理者端末としてのユーザー端末のブラウザの管理画面の例を示す図。
【
図10】本発明の実施例である録画データ文字起こしシステムのユーザー端末のブラウザの検索画面の例を示す図。
【発明を実施するための形態】
【0026】
本発明の録画データ文字起こしシステムは、ユーザー端末とサーバとを備え、ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、ユーザー端末またはサーバがオンラインミーティングの録画データを作成し、ユーザー端末において所定操作があったとき、または、所定設定がある場合、サーバが、事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成し、生成して得た生成テキストデータをデータベースに保存する構成であることにより、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データの全体を視聴することなく、簡単に確認することができるものであれば、その具体的な実施態様は、如何なるものであっても構わない。
また、本発明の録画データ文字起こしシステムのプログラムは、ユーザー端末がサーバを介して他のユーザー端末と通信してオンラインミーティングを行った際、ユーザー端末またはサーバがオンラインミーティングの録画データを作成する録画データ作成ステップと、ユーザー端末において所定操作があったか否かを判定する、または、所定設定があるか否かを判定する所定操作・所定設定有無判定ステップと、ユーザー端末において所定操作があったとき、または、所定設定がある場合、サーバが、事前学習済み人工知能手段を用いて録画データの音声についての文字起こしを実行して録画データの音声内容のテキストデータを生成する文字起こし実行ステップと、サーバが、生成して得た生成テキストデータをデータベースに保存する文字起こしテキスト保存ステップとを有していることにより、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データの全体を視聴することなく、簡単に確認することができるものであれば、その具体的な実施態様は、如何なるものであっても構わない。
【0027】
例えば、ユーザー端末は、デスクトップ型パーソナルコンピュータ端末、ノート型パーソナルコンピュータ端末、スマートフォン端末、タブレット端末などの情報を送受信するものであって、所謂インターネットである広域ネットワーク、ローカルネットワーク、電話回線などを含む通信ネットワークによりサーバと接続自在なものであれば如何なるものであっても構わない。
また、サーバは、それぞれ1つのサーバやクラウド上の複数のサーバでもよい。
事前学習済み人工知能手段は、大規模言語モデルとも呼ばれる対話型の例えばChatGPT(Generative Pre-trained Transformer)(以下、チャットGPT)などにより構成され、1つのサーバやクラウド上の複数のサーバに設けられた構成でもよい。
【実施例0028】
以下に、本発明の実施例である録画データ文字起こしシステム100について、
図1乃至
図10に基づいて説明する。
ここで、
図1は、本発明の実施例である録画データ文字起こしシステム100の概念を示す図であり、
図2は、本発明の実施例である録画データ文字起こしシステム100の動作例を示すチャート図であり、
図3は、本発明の実施例である録画データ文字起こしシステム100のユーザー端末110Aのブラウザ111における録画設定の例を示す図であり、
図4は、本発明の実施例である録画データ文字起こしシステム100のユーザー端末110Aのブラウザ111における録画データRDについての電子メールMLの通知の例を示す図であり、
図5(A)は、所定操作として録画データRDのファイルアイコンをドラッグ操作する様子を示す図であり、
図5(B)は、所定操作としてファイル選択用ウィンドウDR3において録画データRDのファイルを選択する様子を示す図であり、
図6(A)は、所定操作として電子メールMLを所定フォルダに移動させる様子を示す図であり、
図6(B)は、所定操作として電子メールMLを所定電子メールアドレスへ転送する様子を示す図であり、
図7(A)は、録画データRDの例を示す図であり、
図7(B)は、生成テキストデータGTの例を示す図であり、
図8(A)は、テレビ会議の議事録生成テキストデータMTの例を示す図であり、
図8(B)は、要約生成テキストデータGT1の例を示す図であり、
図9は、本発明の実施例である録画データ文字起こしシステム100の管理者端末としてのユーザー端末110Aのブラウザ111の管理画面116の例を示す図であり、
図10は、本発明の実施例である録画データ文字起こしシステム100のユーザー端末110Aのブラウザ111の検索画面117の例を示す図である。
【0029】
本発明の実施例である録画データ文字起こしシステム100は、
図1に示すように、ユーザー端末110Aと、他のユーザー端末110Bと、サーバの一例として第1サーバ120および第2サーバ130とを備えている。
そして、録画データ文字起こしシステム100は、録画データRDの音声について文字起こしをするように設けられている。
より具体的には、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行ったとする。
【0030】
その際、ユーザー端末110Aまたは第1サーバ120が、オンラインミーティングの録画データRDを作成する。
さらに、ユーザー端末110Aにおいて所定操作があったとき、または、所定設定がある場合、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成する。
そして、第1サーバ120が、生成して得た生成テキストデータGTをデータベース121に保存するように構成されている。
【0031】
これにより、オンラインミーティングであるテレビ会議の内容が生成テキストデータGTで保存される。
その結果、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データRDの全体を視聴することなく、簡単に確認することができる。
【0032】
続いて、録画データ文字起こしシステム100の動作例について、より詳しく説明する。
図2に示すように、ステップS1では、ビデオ通話録画開始判定ステップとして、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行い、録画開始操作があったか否か、または、録画設定されていてオンラインミーティングが開始されたか否かを、ユーザー端末110Aまたは第1サーバ120が判定する。
より具体的には、
図3に示すように、ユーザー端末110Aのブラウザ111が、ビデオ通話システムのビデオ通話画面112を表示している。
そして、ビデオ通話の相手である他のユーザー端末110Bのユーザーと通話を開始する。
【0033】
この際、例えば、ビデオ通話画面112における設定ボタンの操作により、ブラウザ111が、設定ウィンドウ113を表示する。
そして、設定ウィンドウ113に表示された複数の項目のうち、「録画する」旨の項目がユーザーの操作によって選択された場合、録画開始操作があったかと判定してステップS2へ進み、他方、まだ録画開始操作がないと判定した場合はステップS1を繰り返す。
なお、予め通話開始とともに録画するように設定されている場合、ビデオ通話画面112においてユーザー端末110Aと他のユーザー端末110Bとが通信開始した場合、オンラインミーティングが開始されたと判定してステップS2へ進み、他方、まだ録画設定も、録画開始操作もないと判定した場合はステップS1を繰り返す。
【0034】
ステップS2では、録画データ作成ステップとして、ユーザー端末110Aまたは第1サーバ120がオンラインミーティングの録画データRDを作成する。
より具体的には、ユーザー端末110Aのブラウザ111に表示されたビデオ通話画面112および音声について録画して録画データRDを作成する。
なお、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bとビデオ通話であるオンラインミーティングをするので、ユーザー端末110Aが、録画データRDを作成してもよいし、第1サーバ120が録画データRDを作成してもよい。
【0035】
ステップS3では、所定操作・所定設定有無判定ステップとして、ユーザー端末110Aにおいて文字起こしをするための所定操作があったか否かを判定する、または、所定設定があるか否かを判定する。
より具体的には、一例として、第1サーバ120が、録画データRDを作成したとする。
この場合、一例として、オンラインミーティングが録画されてオンラインミーティングが終了した後に、録画データRDの作成が、完了する。
そして、第1サーバ120がオンラインミーティングの録画データRDを第1サーバ120の記憶部に保存する。
一例として、これとともに、第1サーバ120が、録画データRDのURL情報AC(Uniform Resource Locator情報)を記載した電子メールMLでユーザー端末110Aへ通知する。
【0036】
ここで、Uniform Resource Locator情報とは、サーバなどの記憶領域に保存されたファイルへアクセスする際のファイルの保存場所を特定するための情報であって、インターネット上のリソースを特定するための情報をいう。
すると、
図4に示すように、ユーザー端末110Aのブラウザ111が電子メール画面114を表示した際に、電子メール画面114の受信トレイ114aにおいて、録画データRDのURL情報ACが記載された電子メールMLが表示される。
【0037】
そして、文字起こしをするための所定操作の一例として、
図5(A)に示すように、ブラウザ111が文字起こしファイル読み込み画面DRを表示しているときに、例えば、図示しない読み込みボタンを操作すると、ブラウザ111が、ファイル指定・ドラッグ操作用ウィンドウDR1をポップアップ表示する。
ファイル指定・ドラッグ操作用ウィンドウDR1には、所定領域としてのドラッグ領域DR2が設けられている。
【0038】
そして、ユーザーが、一例としてマウスを用いて第1サーバ120の記憶部のドライブから、録画データRDのファイルアイコンを、ドラッグ領域DR2へ移動させるドラッグ操作をしたとする。
このように、所定操作として所定領域としてのドラッグ領域DR2へ録画データRDのファイルアイコンがドラッグされた場合、所定操作があったと判定してステップS4へ進み、他方、まだないと判定した場合はステップS3を繰り返す。
【0039】
なお、文字起こしをするための所定操作の一例として、
図5(B)に示すように、ドラッグ操作をせずに、ファイル指定・ドラッグ操作用ウィンドウDR1のドラッグ領域DR2をクリック操作すると、ブラウザ111が、ファイル選択用ウィンドウDR3をポップアップ表示して、ファイル選択用ウィンドウDR3にファイル一覧が表示される。
このファイル一覧の中から所望の録画データRDを選択して指定してもよい。
【0040】
また、文字起こしをするための所定操作の一例として、
図6(A)に示すように、録画データRDのURL情報ACが記載された電子メールMLをブラウザ111の電子メール画面114における受信トレイ114aから所定メールフォルダ・トレイの一例である文字起こしフォルダ114b(文字起こしトレイ)へ移動する操作があった場合、所定操作があったと判定してステップS4へ進み、他方、まだないと判定した場合はステップS3を繰り返す。
【0041】
さらに、文字起こしをするための所定操作の一例として、
図6(B)に示すように、録画データRDのURL情報ACが記載された電子メールMLにおいて転送ボタンを操作すると、ブラウザ111が、転送メールウィンドウ115を表示する。
そして、転送メールウィンドウ115における宛先欄に、所定電子メールアドレスの一例として第1サーバ120のボット122宛のアドレスであるボット用メールアドレスADが入力されて、ボット用メールアドレスADへ転送する操作があった場合、所定操作があったと判定してステップS4へ進み、他方、まだないと判定した場合はステップS3を繰り返す。
例えば、転送メールウィンドウ115において、ボット用アイコン115aを表示し、ボット用アイコン115aが操作されると、転送メールウィンドウ115における宛先欄に所定電子メールアドレスの一例として第1サーバ120のボット122宛のアドレスであるボット用メールアドレスADが入力されるように構成してもよい。
さらにこれに加えて、ボット用アイコン115aが操作されると、所謂、プロンプトである文字起こしを実行する旨の指示命令情報PTの一例として「文字起こし、よろしく!」の旨が入力されるように構成してもよい。
【0042】
なお、文字起こしをするための所定操作について、技術的思想の上位概念としては、録画データRDの作成が完了するのを待たずに行ってもよい。
例えば、ビデオ通話画面112において、文字起こし開始のボタンを設けて、その文字起こし開始のボタンが操作されることにより、文字起こしをするための所定操作ありと判定してもよい。
【0043】
また、所定設定の一例として、録画データRDの作成完了のタイミングや作成と同時進行で、字起こしをする設定が選択されていてもよい。
さらに、所定設定の一例として、録画データRDのURL情報ACが記載された電子メールMLが、電子メール画面114におけるメールのフィルター設定によって受信トレイ114aではなく、直接所定メールフォルダの一例である文字起こしフォルダ114b(文字起こしトレイ)に入るように設定してもよい。
また、所定設定の一例として、録画データRDのURL情報ACが記載された電子メールMLが、電子メール画面114におけるメールのフィルター設定によって、プロンプトである文字起こしを実行する旨の指示命令情報PTの一例として「文字起こし、よろしく!」の旨が入力されて、所定電子メールアドレスの一例であるボット用メールアドレスADへ転送するように設定してもよい。
【0044】
ステップS4では、文字起こし実行ステップとして、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成する。
より具体的には、
図7(A)に示す録画データRDから音声を抽出して
図7(B)に示す録画データRDの音声内容の生成テキストデータGTを生成する。
【0045】
ステップS5では、文字起こしテキスト保存ステップとして、第1サーバ120が、生成して得た生成テキストデータGTをデータベース121に保存する。
これにより、前述したように、オンラインミーティングであるテレビ会議の内容が生成テキストデータGTで保存される。
その結果、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データRDの全体を視聴することなく、簡単に確認することができる。
【0046】
さらに本実施例では、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、第1サーバ120がオンラインミーティングの録画データRDを作成して第1サーバ120の記憶部の一例であるデータベース121やドライブに保存する。
そして、
図5(A)に示すように、ユーザー端末110Aのブラウザ111において所定操作として所定領域の一例であるファイル指定・ドラッグ操作用ウィンドウDR1のドラッグ領域DR2への録画データRDのファイルアイコンのドラッグ操作があったとき、ユーザー端末110Aが、録画データRDおよび文字起こしを実行する旨の指示命令情報PTを第1サーバ120へ送信する。
【0047】
なお、
図5(B)に示すように、所定操作としてファイル選択用ウィンドウDR3における録画データRDの選択操作があったとき、ユーザー端末110Aが、録画データRDおよび文字起こしを実行する旨の指示命令情報PTを第1サーバ120へ送信するように構成してもよい。
そして、第1サーバ120が、録画データRDおよび指示命令情報PTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行するように構成されている。
これにより、録画データRDのファイルアイコンを直接選択する操作によって録画データRDが特定される。
その結果、ユーザーの所定操作をシンプルにするとともに録画データRDの誤選択を回避することができる。
【0048】
また本実施例では、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、第1サーバ120がオンラインミーティングの録画データRDを作成して第1サーバ120の記憶部の一例であるデータベース121に保存するように構成してもよい。
これとともに、
図4に示すように、第1サーバ120が、録画データRDのURL情報ACを記載した電子メールMLでユーザー端末110Aへ通知する。
【0049】
さらに、
図6(A)に示すように、ユーザー端末110Aのブラウザ111において所定操作として電子メールMLをブラウザ111における所定メールフォルダ・トレイの一例である文字起こしフォルダ114bへ移動する操作があったとき、ユーザー端末110Aが、URL情報ACおよび文字起こしを実行する旨の指示命令情報PTを第1サーバ120へ送信する。
なお、
図6(B)に示すように、ユーザー端末110Aのブラウザ111において所定操作として電子メールMLを所定電子メールアドレスの一例であるボット用メールアドレスADへ転送する操作があったとき、ユーザー端末110Aが、URL情報ACおよび文字起こしを実行する旨の指示命令情報PTを第1サーバ120へ送信するように構成してもよい。
【0050】
そして、第1サーバ120が、URL情報ACおよび指示命令情報PTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行するように構成されている。
【0051】
これにより、ユーザーは電子メールMLによる通知を受けて電子メールMLをブラウザ111における所定メールフォルダの一例である文字起こしフォルダ114bへ移動する操作、または、電子メールMLを所定電子メールアドレスの一例であるボット用メールアドレスADへ転送する操作をするだけで録画データRDの音声について文字起こしが実行される。
その結果、ユーザーの所定操作をシンプルにすることができる。
【0052】
また本実施例では、
図7(A)~
図8(B)に示すように、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いてテレビ会議内容について、タイトル、参加者、概要、参加メンバーの意図および課題の各項目情報を有した議事録テキストデータを生成する。
そして、第1サーバ120が、生成して得た議事録生成テキストデータMTをデータベース121に保存するように構成されている。
【0053】
これにより、オンラインミーティングであるテレビ会議の内容のタイトル、参加者、概要、参加メンバーの意図、課題の各項目情報を有した議事録が議事録生成テキストデータMTで保存される。
その結果、ユーザーはオンラインミーティングであるテレビ会議の内容の議事録について会議後にテレビ会議の内容全体の生成テキストデータGTを確認することなく簡単に確認することができる。
さらに、何が課題であるかが議事録生成テキストデータMTにおいて明記される。
その結果、たとえテレビ会議において課題が曖昧になってしまった場合であっても、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTによってはっきりと課題を指摘してもらえ、人から指摘されるときと比べて確認したユーザーは素直に問題点などの課題を聞き入れることができる。
【0054】
さらに本実施例では、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して、録画データRDの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータGTに基づいて事前学習済み人工知能手段131の一例であるチャットGPTを用いて音声内容の要約テキストデータを生成する。
そして、第1サーバ120が、生成して得た要約生成テキストデータGT1をデータベース121に保存するように構成されている。
【0055】
これにより、オンラインミーティングであるテレビ会議の内容の要約が要約生成テキストデータGT1で保存される。
その結果、ユーザーはオンラインミーティングであるテレビ会議の内容の要約について会議後にテレビ会議の内容全体の生成テキストデータGTを確認することなく簡単に確認することができる。
【0056】
さらに本実施例では、
図9に示すように、第1サーバ120と通信自在な管理者端末の一例であるユーザー端末110Aのブラウザ111において、ユーザーが管理者として録画データ文字起こしシステム100にログインすると、管理画面116が表示される。
そして、管理画面116において、ユーザー識別情報IDの一例である電子メールアドレスによってユーザー端末110Aのブラウザ111において第1サーバ120のデータベース121にアクセス可能なユーザーについて設定自在に構成されている。
【0057】
これにより、例えば、企業内のユーザーのみにアクセス権を与えて企業内のユーザーのユーザー端末110Aのみがテレビ会議の内容の生成テキストデータGT、議事録生成テキストデータMTや要約生成テキストデータGT1を表示可能となる。
その結果、管理者が指定したユーザーのみで生成テキストデータGT、議事録生成テキストデータMTや要約生成テキストデータGT1を共有することができる。
【0058】
また本実施例では、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成する際、事前学習済み人工知能手段131の一例であるチャットGPTが、オンラインミーティングを行ったユーザーについてのユーザー識別情報IDおよびどのユーザー端末110Aのマイクから入力された音声かについての入力端末情報に基づいて音声の主を特定する。
【0059】
例えば、録画データRDでは、現在話している人のユーザー端末110Aのカメラで撮影した映像枠が太枠になる。
これは、オンラインミーティングの際に、ユーザー端末110Aのマイクから入力レベルが所定値以上になったとき、または、入力レベルが所定値以上で、かつ、参加者の中で一番が高くなったとき、ユーザー端末110Aのカメラで撮影した映像枠が太枠になるように設定されているからである。
【0060】
ここで、録画データRDには、オンラインミーティングを行ったユーザーについてのユーザー識別情報IDがタグ付けされている。
また、録画データRDには、どのユーザー端末のマイクから入力された音声かについての入力端末情報が含まれている。
例えば、映像枠が太枠になっているユーザー端末110Aのマイクからの入力に、入力端末情報の一例として人間の耳で聞き取れない周波数帯で識別可能な周波数信号などの入力端末の識別信号を加えてもよい。
また、第1サーバ120が録画データRDを作成する際、録画データRDに、入力端末情報の一例として、映像枠が太枠になっているユーザー端末110Aの識別情報を加えてもよい。
【0061】
これらの構成によって、事前学習済み人工知能手段131の一例であるチャットGPTが、オンラインミーティングを行ったユーザーについてのユーザー識別情報IDおよびどのユーザー端末110Aのマイクから入力された音声かについての入力端末情報に基づいて音声の主を特定することができる。
つまり、録画データRDに映っている顔で音声の主を特定しない構成であるため、ユーザー端末110Aのカメラや他のユーザー端末110Bのカメラをオフにしていた場合であっても、音声の主を特定することができる。
そして、
図7(B)および
図8(A)に示すように、事前学習済み人工知能手段131の一例であるチャットGPTが、音声主情報VCを生成テキストデータGTや議事録生成テキストデータMTに含めて生成するように構成されている。
【0062】
これにより、会話の中で話をした人の情報と話の内容の情報とがセットで生成テキストデータGTに含まれる。
その結果、ユーザーはオンラインミーティングであるテレビ会議の内容について会議後に誰が何を話したかを話した人の声の調子の善し悪しや声色に関わらず簡単に確認することができる。
【0063】
さらに本実施例では、ユーザー端末110Aのブラウザ111の検索画面117において音声内容の生成テキストデータGT、議事録生成テキストデータMTや要約生成テキストデータGT1について検索自在である。
例えば、
図10に示すように、ユーザーが録画データ文字起こしシステム100にログインすると、ユーザー端末110Aのブラウザ111が、検索画面117を表示する。
検索画面117には、トーク表示領域117aと、共有情報表示領域117bとが設けられている。
【0064】
このうち、トーク表示領域117aには、第1サーバ120のボット122を介した第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTとユーザーとのやりとりが所謂、チャット形式(トーク画面形式)で表示される。
ここで、チャット形式とは、1つの画面で1人または複数の相手(ボット122を含む)とのテキストやファイルのデータのやりとりを時系列に表示する画面形式をいう。
ユーザーによる入力は、キーボード入力によるテキストデータの入力でもよいし、マイクアイコンボタンを操作することにより、ユーザー端末110Aのマイクがアクティブになり、マイクによる音声入力でもよい。
【0065】
音声入力の場合、音声データがユーザー端末110Aによってテキストデータに変換されてテキストデータが入力欄に入力される。
また、ボット122を介した第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTからの返事の出力は、テキストデータの出力でもよいし、ユーザー端末110Aのスピーカーによる音声出力でもよい。
【0066】
他方、共有情報表示領域117bには、一例として、事前学習済み人工知能手段131の一例であるチャットGPTからの返事に基づいて、正解の可能性が最も高い録画データRD、要約データである要約生成テキストデータGT1、文字起こしテキストデータである生成テキストデータGT、議事録データである議事録生成テキストデータMTが表示されるように設けられている。
【0067】
そして、検索操作があったとき、ユーザー端末110Aが、入力された検索条件情報SCを第1サーバ120へ送信する。
すると、第1サーバ120が、受信した検索条件情報SCおよびデータベース121の生成テキストデータGTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて回答テキストデータを生成し、生成して得た回答生成テキストデータGT2をユーザー端末110Aへ送信する。
ユーザー端末110Aが、受信した回答生成テキストデータGT2をブラウザ111の検索画面117に表示するように構成されている。
【0068】
これにより、例えば、ユーザーが検索条件情報SCとして「社内で、XXX機能について興味を持っている人っていますか?」と質問して検索した場合、検索条件情報SCに基づいて生成テキストデータGTに含まれた音声主情報VCと話の内容情報とのセットの情報から回答生成テキストデータGT2が生成される。
その結果、ユーザーは、例えば、「はい、います。企画部の鈴木えみさんです。」の旨の回答生成テキストデータGT2を得ることができる。
【0069】
さらに、ユーザーが検索条件情報SCとして「いつ話していましたか?」と質問して検索した場合、検索条件情報SCに基づいて生成テキストデータGTに含まれた音声主情報VCと話の内容情報とのセットの情報から回答生成テキストデータGT2が生成される。
その結果、ユーザーは、例えば、「2023年8月2日のビデオ会議で、○○プロジェクトでXXX機能を使えそうな旨、話していました。」の旨の回答生成テキストデータGT2を得ることができる。
【0070】
これとともに、共有情報表示領域117bにおいて、該当する可能性が最も高い録画データRD、要約データである要約生成テキストデータGT1、文字起こしテキストデータである生成テキストデータGT、議事録生成テキストデータMTが表示される。
この際、生成テキストデータGTにおいて、キーワードとなる「XXX機能」をハイライト表示する構成としてもよい。
これにより、キーワードがどの箇所で、誰によって使用されたが一目でわかるようにハイライト表示される。
その結果、ユーザーは、事前学習済み人工知能手段131の一例であるチャットGPTからの回答を鵜呑みにせず、自分で簡単に確認することができる。
【0071】
また、ユーザーが検索条件情報SCとして「鈴木さんのXXX機能の話を誰が聞いていましたか?」と質問して検索した場合、録画データRDにタグ付けされたオンラインミーティングに参加した他のユーザーについてのユーザー識別情報IDに基づいて、例えば、「営業部の田中一郎さん1人です。」の旨の回答生成テキストデータGT2を得ることができる。
つまり、ある話題について、話していた人だけでなく、聞いていた人についても検索することができる。
【0072】
このようにして得られた本発明の実施例である録画データ文字起こしシステム100は、ユーザー端末110Aと、他のユーザー端末110Bと、サーバの一例である第1サーバ120および第2サーバ130とを備え、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、ユーザー端末110Aまたは第1サーバ120がオンラインミーティングの録画データRDを作成し、ユーザー端末110Aのブラウザ111において所定操作があったとき、または、所定設定がある場合、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成し、生成して得た生成テキストデータGTをデータベース121に保存する構成であることにより、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データRDの全体を視聴することなく、簡単に確認することができる。
【0073】
さらに、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、第1サーバ120がオンラインミーティングの録画データRDを作成してサーバの記憶部に保存し、ユーザー端末110Aのブラウザ111において所定操作として所定領域への録画データRDのファイルアイコンのドラッグ操作、または、ファイル選択用ウィンドウDR3における録画データRDの選択操作があったとき、ユーザー端末110Aが、録画データRDおよび文字起こしを実行する旨の指示命令情報PTを第1サーバ120へ送信し、第1サーバ120が、録画データRDおよび指示命令情報PTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行する構成であることにより、ユーザーの所定操作をシンプルにするとともに録画データRDの誤選択を回避することができる。
【0074】
また、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、第1サーバ120がオンラインミーティングの録画データRDを作成してサーバの記憶部に保存するとともに、録画データRDのURL情報ACを記載した電子メールMLでユーザー端末110Aへ通知し、ユーザー端末110Aのブラウザ111の電子メール画面114において所定操作として電子メールMLをブラウザ111における所定メールフォルダ・トレイの一例である文字起こしフォルダ114bへ移動する操作、または、電子メールMLを所定電子メールアドレスの一例であるボット用メールアドレスADへ転送する操作があったとき、ユーザー端末110Aが、URL情報ACおよび文字起こしを実行する旨の指示命令情報PTを第1サーバ120へ送信し、第1サーバ120が、URL情報ACおよび指示命令情報PTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行する構成であることにより、ユーザーの所定操作をシンプルにすることができる。
【0075】
さらに、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131を用いて録画データRDの音声についての文字起こしを実行して、録画データRDの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータGTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いてオンラインミーティング内容について、タイトル、参加者、概要、参加メンバーの意図および課題の各項目情報を有した議事録テキストデータを生成し、生成して得た議事録生成テキストデータMTをデータベース121に保存する構成であることにより、ユーザーはオンラインミーティングであるテレビ会議の内容の議事録について会議後にテレビ会議の内容全体の生成テキストデータGTを確認することなく簡単に確認することができ、さらに、たとえテレビ会議において課題が曖昧になってしまった場合であっても、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTによってはっきりと課題を指摘してもらえ、人から指摘されるときと比べて確認したユーザーは素直に問題点などの課題を聞き入れることができる。
【0076】
また、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して、録画データRDの音声内容のテキストデータを生成した際、生成して得た音声内容の生成テキストデータGTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて音声内容の要約テキストデータを生成し、生成して得た要約生成テキストデータGT1をデータベース121に保存する構成であることにより、ユーザーはオンラインミーティングであるテレビ会議の内容の要約について会議後にテレビ会議の内容全体の生成テキストデータGTを確認することなく簡単に確認することができる。
【0077】
さらに、第1サーバ120と通信自在な管理者端末の一例であるユーザー端末110Aのブラウザ111に表示された管理画面116において、ユーザー識別情報IDによってユーザー端末110Aのブラウザ111において第1サーバ120のデータベース121にアクセス可能なユーザーについて設定自在な構成であることにより、管理者が指定したユーザーのみで生成テキストデータGTや要約生成テキストデータGT1を共有することができる。
【0078】
また、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成する際、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTが、オンラインミーティングを行ったユーザーについてのユーザー識別情報IDおよびどのユーザー端末110Aのマイクから入力された音声かについての入力端末情報に基づいて音声の主を特定して、音声主情報VCを生成テキストデータGTに含めて生成する構成であることにより、ユーザーはオンラインミーティングであるテレビ会議の内容について会議後に誰が何を話したかを話した人の声の調子の善し悪しや声色に関わらず簡単に確認することができる。
【0079】
さらに、ユーザー端末110Aのブラウザ111の検索画面117において音声内容の生成テキストデータGTについて検索自在であり、検索操作があったとき、ユーザー端末110Aが、入力された検索条件情報SCを第1サーバ120へ送信し、第1サーバ120が、受信した検索条件情報SCおよびデータベース121の生成テキストデータGTに基づいて第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて回答テキストデータを生成し、生成して得た回答生成テキストデータGT2をユーザー端末110Aへ送信し、ユーザー端末110Aが、受信した回答生成テキストデータGT2をブラウザ111の検索画面117に表示する構成であることにより、ユーザーは、例えば、検索条件情報SCとして「○○の件を話していた人は誰ですか?」と質問して検索した場合、「XX部のAさんです。」の旨の回答生成テキストデータGT2を得ることができる。
【0080】
また、本発明の実施例である録画データ文字起こしシステム100のプログラムは、ユーザー端末110Aが第1サーバ120を介して他のユーザー端末110Bと通信してオンラインミーティングを行った際、ユーザー端末110Aまたは第1サーバ120がオンラインミーティングの録画データRDを作成する録画データ作成ステップS2と、ユーザー端末110Aにおいて所定操作があったか否かを判定する、または、所定設定があるか否かを判定する所定操作・所定設定有無判定ステップS3と、ユーザー端末110Aにおいて所定操作があったとき、または、所定設定がある場合、第1サーバ120が、第2サーバ130の事前学習済み人工知能手段131の一例であるチャットGPTを用いて録画データRDの音声についての文字起こしを実行して録画データRDの音声内容のテキストデータを生成する文字起こし実行ステップS4と、第1サーバ120が、生成して得た生成テキストデータGTをデータベース121に保存する文字起こしテキスト保存ステップS5とを有していることにより、ユーザーはオンラインミーティングであるテレビ会議の内容について、会議後に時間をかけて録画データRDの全体を視聴することなく、簡単に確認することができるなど、その効果は甚大である。