(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-08-30
(45)【発行日】2024-09-09
(54)【発明の名称】情報処理方法、プログラム及び情報処理システム
(51)【国際特許分類】
G06Q 50/10 20120101AFI20240902BHJP
G06F 16/908 20190101ALI20240902BHJP
G06N 3/0475 20230101ALI20240902BHJP
G06N 20/00 20190101ALI20240902BHJP
【FI】
G06Q50/10
G06F16/908
G06N3/0475
G06N20/00
(21)【出願番号】P 2023211291
(22)【出願日】2023-12-14
【審査請求日】2023-12-15
【早期審査対象出願】
(73)【特許権者】
【識別番号】517255566
【氏名又は名称】株式会社エクサウィザーズ
(72)【発明者】
【氏名】坂根 裕
(72)【発明者】
【氏名】春田 真
【審査官】上田 智志
(56)【参考文献】
【文献】特開2022-061606(JP,A)
【文献】特開2014-149786(JP,A)
【文献】貴島 逸斗,ChatGPTの正体に迫る 11の疑問,日経コンピュータ no.1092 NIKKEI COMPUTER,日本,日経BP Nikkei Business Publications,Inc.,2023年04月13日
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00、
G06N 3/0475、20/00
G06F 16/00、40/00
(57)【特許請求の範囲】
【請求項1】
情報処理装置が実行する情報処理方法であって、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、
テキストデータを学習させかつ前記処理指示情報を入力すると、前記処理指示情報に応じた処理結果を出力する学習済みモデルを利用して前記使用情報を基に前記処理指示情報に対応する処理を実行する処理ステップと、
を含み、
前記使用情報取得ステップにおいて、前記処理指示情報から判定される出力の方向性に基いて前記使用情報を取得する、
情報処理方法。
【請求項2】
前記使用情報取得ステップにおいて、前記使用情報の取得時に当該使用情報のメタデータを利用する、
請求項1に記載の情報処理方法。
【請求項3】
前記使用情報取得ステップにおいて、前記使用情報の取得時に当該使用情報に関連するログデータを利用する、
請求項1に記載の情報処理方法。
【請求項4】
前記使用情報取得ステップにおいて、情報を入力すると当該情報が前記使用情報に該当するか否かを判定するための指標情報を取得するため、情報を入力すると当該情報の前記指標情報を出力するように学習された
、前記学習済みモデル
又は前記学習済みモデルとは別の学習済みモデ
ルへ前記情報源の情報を入力し
、出力された前記指標情報を前記使用情報の取得時に利用する、
請求項1に記載の情報処理方法。
【請求項5】
前記処理ステップにおける処理結果と当該処理結果に紐付けられた前記処理指示情報とを前記情報処理装置の記憶部に格納する格納ステップを有し、
前記処理指示取得ステップにおいて新たな処理指示情報を取得した際に当該処理指示情報と前記記憶部に格納された前記処理結果に紐付けられた前記処理指示情報との関連性が所定の基準以上である場合に前記処理結果を出力する、
請求項1に記載の情報処理方法。
【請求項6】
情報処理装置に、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、
テキストデータを学習させかつ前記処理指示情報を入力すると、前記処理指示情報に応じた処理結果を出力する学習済みモデルを利用して前記使用情報を基に処理を実行する処理ステップと、
を含み、
前記使用情報取得ステップにおいて、前記処理指示情報から判定される出力の方向性に基いて前記使用情報を取得する、
情報処理方法を実行させるためのプログラム。
【請求項7】
情報処理装置が実行する情報処理システムであって、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、
テキストデータを学習させかつ前記処理指示情報を入力すると、前記処理指示情報に応じた処理結果を出力する学習済みモデルを利用して前記使用情報を基に処理を実行する処理ステップと、
を行い、
前記使用情報取得ステップにおいて、前記処理指示情報から判定される出力の方向性に基いて前記使用情報を取得する、
情報処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、プログラム及び情報処理システムに関する。
【背景技術】
【0002】
特許文献1には、機械学習モデルの予測精度を向上させる情報処理装置が開示されている。この情報処理装置では、機械学習モデルの訓練に用いる正解ラベルの信頼度を評価するための信頼度判定モデルの訓練において、情報の鮮度含む付加情報を収集して利用することで、正解ラベルの信頼度をより正確に評価する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ところで、訓練された学習済みモデルへ入力するデータ(使用情報)によって学習済みモデルが出力する処理結果が変わることは知られているが、処理を指示する処理指示情報に基いて所望する処理結果が得られるように使用情報を制御することが求められている。
【0005】
本発明は、所望する処理結果を効果的に得ることを目的とする。
【課題を解決するための手段】
【0006】
一実施形態に係る情報処理方法によれば、情報処理装置が実行する情報処理方法であって、処理を指示する処理指示情報を取得する処理指示取得ステップと、前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、前記使用情報を基に学習済みモデルを利用して処理を実行する処理ステップと、を含む。
【0007】
一実施形態に係るプログラムによれば、情報処理装置に、処理を指示する処理指示情報を取得する処理指示取得ステップと、前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、前記使用情報を基に学習済みモデルを利用して処理を実行する処理ステップと、を含む情報処理方法を実行させる。
【0008】
一実施形態に係る情報処理システムによれば、処理を指示する処理指示情報を取得する処理指示取得ステップと、前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、前記使用情報を基に学習済みモデルを利用して処理を実行する処理ステップと、を行う。
【発明の効果】
【0009】
一実施形態によれば、所望する処理結果を効果的に得ることができる。
【図面の簡単な説明】
【0010】
【
図1】第一実施形態に係る情報処理システムの構成の一例を示す図である。
【
図2】第一実施形態に係るサーバのハードウェア構成の一例を示す図である。
【
図3】第一実施形態に係るサーバの機能構成の一例を示す図である。
【
図4】第一実施形態に係る情報処理システムの処理の流れの一例を示す図である。
【
図5】第一実施形態に係る情報処理システムにおける使用情報の指標情報について複数のパターンを模式的に示す図である。
【
図6】第二実施形態に係るサーバの機能構成の一例を示す図である。
【
図7】第二実施形態に係る情報処理システムの処理の流れの一例を示す図である。
【発明を実施するための形態】
【0011】
(第一実施形態)
以下、
図1~
図5を用いて、本発明に係る情報処理システムの第一実施形態について説明する。なお、各図において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されており、実際の比率とは異なる場合がある。
【0012】
(システム概要)
まず、本実施形態に係る情報処理システム10の概要について説明する。本実施形態に係る情報処理システム10は、処理を指示する処理指示情報としてのプロンプトを大規模言語モデル等の学習済みモデルへ入力すると、当該プロンプトに対応して学習済みモデルが処理結果を生成し、当該処理結果を出力するシステムである。すなわち、情報処理システム10は、ユーザUによりプロンプトを入力されると、当該プロンプトを基に所定の情報源から処理に必要な使用情報を取得して学習済みモデルを利用して処理を行い、処理結果を生成する。詳細については後述する。
【0013】
(システム構成)
図1は、本実施形態に係る情報処理システム10の構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム10は、ネットワークNを介して相互に通信可能に接続された、情報処理装置としてのサーバ12と、利用者端末14と、を備える。ネットワークNは、例えば、有線LAN(Local Area Network)、無線LAN、インターネット、公衆回線網、モバイルデータ通信網、又はこれらの組み合わせである。
【0014】
利用者端末14は、ユーザUにより各種情報の入力及び表示のための操作を行う情報処理装置の一例である。利用者端末14は、PC(Personal Computer)、スマートフォン、タブレット端末、サーバ装置、マイクロコンピュータ、ウェアラブルデバイス、又はこれらの組み合わせであってもよい。
【0015】
サーバ12は、利用者端末14から入力された情報を取得し、当該情報を基に処理を行い結果を出力する情報処理装置の一例である。サーバ12は、PC(Personal Computer)、スマートフォン、タブレット端末、サーバ装置、マイクロコンピュータ、又はこれらの組み合わせであってもよい。サーバ12の具体的な構成及び作用については、後述する。
【0016】
(ハードウェア構成)
図2は、サーバ12のハードウェア構成を示すブロック図である。サーバ12は、バスBを介して相互に通信可能に接続された、プロセッサ120と、メモリ122と、ストレージ124と、通信I/F126と、入出力I/F128と、ドライブ装置134と、を備える。
【0017】
プロセッサ120は、ストレージ124に記憶された各種プログラムをメモリ122に展開して実行することにより、サーバ12の各構成を制御し、サーバ12の機能を実現する。プロセッサ120が実行するプログラムは、OS(Operating System)及び後述するプログラム220を含むが、これに限られない。プロセッサ120がこれらプログラムを実行することにより、本実施形態に係る状態可視化方法の一部が実現される。プロセッサ120は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、又はこれらの組み合わせである。
【0018】
メモリ122は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、又はこれらの組み合わせである。ROMは、例えば、PROM(Programmable ROM)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、又はこれらの組み合わせである。RAMは、例えば、DRAM(Dynamic RAM)、SRAM(Static RAM)、MRAM(Magnetoresistive RAM)、又はこれらの組み合わせである。
【0019】
ストレージ124は、OS、後述する各種プログラム、及び各種のデータを記憶する。ストレージ124は、例えば、フラッシュメモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)、SCM(Storage Class Memories)、又はこれらの組み合わせである。
【0020】
通信I/F126は、サーバ12を、ネットワークNを介して、利用者端末14や撮影装置16を含む外部装置に接続し、通信を制御するためのインタフェースである。通信I/F126は、例えば、Bluetooth(登録商標)、Wi-Fi(登録商標)、ZigBee(登録商標)、Ethernet(登録商標)、又は光通信(例えば、Fibre Channel)に準拠したアダプタであるが、これに限られない。
【0021】
入出力I/F128は、サーバ12に入力装置132及び出力装置130を接続するためのインタフェースである。入力装置132は、例えば、マウス、キーボード、タッチパネル、マイク、スキャナ、カメラ、各種センサ、操作ボタン、又はこれらの組み合わせである。出力装置130は、例えば、ディスプレイ、プロジェクタ、プリンタ、スピーカ、バイブレータ、又はこれらの組み合わせである。
【0022】
ドライブ装置134は、ディスクメディア136のデータを読み書きする。ドライブ装置134は、例えば、磁気ディスクドライブ、光学ディスクドライブ、光磁気ディスクドライブ、又はこれらの組み合わせである。ディスクメディア109は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、FD(Floppy Disk)、MO(Magneto-Optical disk)、BD(Blu-ray(登録商標) Disc)、又はこれらの組み合わせである。
【0023】
なお、本実施形態において、プログラムは、サーバ12の製造段階でメモリ122又はストレージ124に書き込まれてもよいし、ネットワークNを介してサーバ12に提供されてもよいし、ディスクメディア136などの非一時的でコンピュータ読み取り可能な記録媒体を介してサーバ12に提供されてもよい。
【0024】
また、利用者端末14のハードウェア構成については、上述したサーバ12のハードウェア構成と略同一の構成とされているため、詳細な説明については省略する。
【0025】
(機能構成)
次に、サーバ12の機能構成について説明する。
図3は、サーバ12の機能構成の一例を示す図である。各種プログラムを実行する際に、サーバ12は上記のハードウェア資源を用いて、各種の機能を実現する。サーバ12は、サーバ12が実現する機能構成として、通信部20と、記憶部22と、制御部24と、を有している。各機能構成は、プロセッサ120がメモリ122又はストレージ124に記憶されたプログラム220を読み出し、実行することで実現される。
【0026】
通信部20は、通信I/F126により実現される。通信部20は、ネットワークNを介して、利用者端末14との間で情報の送受信を行う。通信部20は、利用者端末14から入力された情報を受信する。また、通信部20は、利用者端末14に対して情報を送信し、利用者端末14からユーザUによるリクエストを受信する。
【0027】
記憶部22は、メモリ122及びストレージ124により実現される。記憶部22には、プログラム220と、学習済みモデル222と、プロンプト224と、使用情報226と、処理結果228と、が格納される。
【0028】
学習済みモデル222は、少なくとも一つの学習済み機械学習モデルにより構成されている。この学習済みモデル222は、一例として、大規模言語モデルとされ、インターネット上の記事、書籍及びウェブサイトなどからの大量のテキストデータを学習させたモデルとされており、プロンプトとしてテキストデータを入力すると、当該プロンプトに応じたテキストデータを生成し出力する。本実施形態の学習済みモデル222における大規模言語モデルは、プロンプトの内容に基づく出力結果の方向性を判定する。なお、この出力結果とは、想定される出力結果を指す。
【0029】
ここで、方向性とは、出力結果の性質又は特性(以下、単に「性質」と称する。)を示すものであり、学習済みモデル222は一例として、以下の2つの性質について判定する。すなわち、1つ目の性質は「情報源に基づいた厳密な」性質(以下、単に「厳密」と称する。)であり、この性質に沿った出力結果は具体的な情報源から抽出または導出された明確な情報に基づいたものである。一方、2つ目の性質は「広範で創造的な」性質(以下、単に「創造性」と称する。)であり、この性質に沿った出力結果は特定の情報源に限定されず、幅広い情報から洞察を引き出し、新たな視点や解釈を提供するものである。学習済みモデル222は、方向性の判定によって、出力結果の性質として相反するものである「厳密」と「創造性」がどの程度であるか、を判定する。すなわち、プロンプトにおいて「前回の経営会議の内容に基づいて回答してください」との旨の指示がされた場合、学習済みモデル222は、前回の経営会議の議事録等の情報源に基づいた厳密な性質の出力結果が必要と判定して、出力結果の方向性を「厳密」と判定する。一方、プロンプトにおいて「近年の経済や技術動向を考慮して回答してください」との旨の指示がされた場合、学習済みモデル222は、特定の情報源に限定されない創造的な性質の出力結果が必要と判定して、出力結果の方向性を「創造性」と判定する。なお、上述した「厳密」と「創造性」の判定はあくまで一例であり、これ以外のプロンプトについてもその内容に基づいて方向性が適宜判定されることは言うまでもない。また、これ以外の性質により方向性の判定を実施してもよい。さらに、それぞれの性質の有無だけを判定するのではなく、「厳密度80、創造性度20」などのように性質がどの程度求められているかその程度を数値等で判定してもよい。さらにまた、出力結果を複数の部分に分け、部分ごとに性質を判定してもよい。具体的な例として、出力結果において事実に基づく回答をする第一部分と、前記部分に対する考察を行う第二部分とに分け、第一部分を「厳密」、第二部分を「創造性」と判定することなどが挙げられる。
【0030】
また、学習済みモデル222は、プロンプトに基づいて、処理に必要な使用情報の候補を決定する。具体的には、学習済みモデル222は、プロンプトに基いて行う処理に対して必要となる情報の特性(その情報が一般的な常識から来るものなのか、それとも専門的な知識から来るものなのかなど)を評価し、その特性が外部の情報源などから取得することが必要と判定されると、情報源を検索して処理に必要となる情報を使用情報の候補として決定する。なお、情報源は、各種情報が格納された記憶部22であってもよいし、書籍、インターネット上の情報などの外部の情報ソース等であってもよい。また、使用情報は、これら情報源に格納されたテキスト情報を含む各種情報であり、 詳細は後述する。
【0031】
さらに、学習済みモデル222は、候補とした使用情報の指標情報の少なくとも一部を生成する。この指標情報の少なくとも一部は、一例として、情報の鮮度情報とされており、この鮮度情報は、使用情報の内容及び処理内容に応じて変化する。すなわち、鮮度情報とは、言い換えると「時間軸上における情報の価値」であり、大きく分けて時間の経過と共に価値が低減するパターン(以下、単に「低下パターン」と称する。)と、時間の経過に対して価値が一定となるパターン(以下、単に「一定パターン」と称する。)と、時間の経過と共に価値が上昇するパターン(以下、単に「上昇パターン」と称する。)と、に分けられる。それぞれのパターンについて以下、説明する。なお、ここでいう「情報の価値」とは、当該情報がユーザUの所望する処理結果にどれだけ寄与するかを表すものであり、情報の価値が高い場合は所望する処理結果の出力に高く寄与しているものである。
【0032】
低下パターンは、略一定の割合で価値が低下するパターン(
図5(A)参照)と、急激に低下するパターン(
図5(B)参照)とがある。略一定の割合で価値が低下するパターンの情報は、具体的には一般的なニュース情報、定期的に新しいモデルがリリースされる製品情報、イベント等の結果情報などが該当する。これらの情報は、時間の経過と共に価値が徐々に低下する時限性を有する情報である。また、急激に低下するパターンの情報は、具体的には株情報、天気予報、事故や災害など状況の変化が激しい事象に関連するニュース情報などが該当する。
【0033】
一定パターン(
図5(C)参照)の情報は、具体的には歴史的事実や科学的な原理に関する情報などが該当する。これらの情報は、時間の経過による価値の変化が比較的少ない情報である。
【0034】
上昇パターンは、略一定の割合で価値が上昇するパターン(
図5(D)参照)と、急激に上昇するパターン(
図5(E)参照)とがある。略一定の割合で価値が上昇するパターンの情報は、具体的には歴史的なデータ、古典文学、制限された数しか生産されていない商品や古書といった情報など、当初はそれほど価値を認められないことがあるものの時間の経過とともにその重要性や価値が再認識され価値が上昇する情報である。また、急激に上昇するパターンの情報は、具体的には過去の芸術作品や収集品に関する情報、予見性のある分析や予測に関する情報、特定の技術や理論に関する情報、ヴィンテージ商品に関する情報など、初めはあまり注目されなかったものの、作者が亡くなったり、過去の予見が後日当たるなどといった事象をきっかけに注目を浴びることで価値が急激に上昇する情報である。なお、各パターンの具体的な情報は、上述したものに限らない。
【0035】
また、上述した3つのパターンは一例であり、定期的なイベントに関する情報など周期的にその価値が変動するパターンなどそれ以外のパターンが含まれてもよい。また、上述したパターンが組み合わされたパターンが含まれてもよい。すなわち、価値が上昇する情報が所定のタイミング後に一定又は低下するものや、価値が一定だった情報が所定のタイミング後に上昇又は低下するもの、価値が低下する情報が所定のタイミング後に一定又は上昇するものなどが挙げられる。これらを換言すると、学習済みモデル222は、「取得したプロンプトに応じてその価値が変化する使用情報を、鮮度情報という指標にて評価を行う」とも表現できる。
【0036】
プロンプト224は、ユーザUが入力したプロンプトを示す情報である。プロンプト224は、自然言語とされており、一例として、ユーザUのアカウント情報と紐付けられて格納されている。
【0037】
使用情報226は、処理において必要な使用情報である。この使用情報226は、前述のように書籍、インターネット、記憶部22などの情報源から取得される情報であり、テキスト情報や画像情報などが含まれる。なお、使用情報226は、非構造化データと、構造化データとが含まれている。ここで、「非構造化データ」とは、あらかじめ定義された方法で構造化されることなく保存されるデータをいう。一方、「構造化データ」は、ファイルやレコードの中の決まったフィールドに存在するデータをいう。「構造化データ」には「半構造化データ」も含まれる。使用情報226は、記憶部22内の図示しないデータレイクに格納可能とされており、当該データレイクから後述する使用情報226の指標情報を利用して取得が可能とされている。
【0038】
処理結果228は、プロンプトに基いて使用情報を利用して処理を実行した結果を示す情報である。処理結果228は、テキスト情報や画像情報を含む各種情報であり、プロンプト及び使用情報に紐付けられて格納されている。
【0039】
制御部24は、プロセッサ120がメモリ122(
図2参照)からプログラム220を読み出して実行し、他のハードウェア構成と協働することにより実現される。制御部24は、情報取得部242と、情報処理部244と、出力部246と、を備える。
【0040】
情報取得部242は、情報処理部244での処理において必要となる各種情報を取得する。具体的には、処理を指示するプロンプト224、処理に必要な非構造化データを含む使用情報226を取得する。また、情報取得部242は、使用情報226の指標情報を取得する(詳細は後述する)。これらの取得する情報は、記憶部22の格納された情報であってもよいし、外部のデータソース等から取得されたものであってもよい。
【0041】
情報処理部244は、プロンプトの内容に基づく出力結果の方向性の判定、使用情報226の指標情報の取得及び生成、出力結果の方向性と使用情報との一致度合の判定、及びプロンプトに基く処理の実行を行う。出力結果の方向性判定は、前述のようにユーザUにより入力されたプロンプトに対応して想定される出力結果の性質を学習済みモデル222を利用して判定する。
【0042】
情報処理部244は、使用情報226の指標情報のうち鮮度情報を、前述のように学習済みモデル222を利用して生成する。また、情報処理部244は、情報取得部242が取得する使用情報の指標情報としてのメタデータ及びログデータについても利用可能とされている。メタデータは、使用情報226の内容、出典、作成者、タイムスタンプ、などのデータの特性や属性を説明する情報とされている。ログデータは、使用情報226の記録やアクセスなどを行った日時、それを行った実行者、リクエスト及びレスポンス情報、エラー情報などの一定の操作をするたびに生成される時間とともに記録される情報とされている。これらメタデータ及びログデータは、予め使用情報226に紐付けられて利用可能とされている。情報処理部244は、指標情報である鮮度情報、メタデータ及びログデータの少なくとも一方を利用して利用情報と出力結果の方向性との一致判定を行う(詳細は後述する)。
【0043】
情報処理部244は、出力結果の方向性と使用情報226との一致度合の判定を行う。すなわち、方向性に対して、使用情報226の候補がプロンプトに基づく処理にマッチするか否かその一致度合を使用情報226の指標情報から判定する。具体的な例として、方向性が「厳密」と判定された場合、使用情報226の候補が正確であるか、完全であるか、最新であるか、信頼性が高いか、明確であるか、追跡可能であるか、一貫性があるか、などの観点から指標情報を利用して使用情報226の一致度合の判定をする。
【0044】
すなわち、正確であるか否かは、一例として、メタデータから当該使用情報226の更新日時が最近のものであるか、またその日時の記録が正確に行われているか、登録者が信頼度の高い人物や機関であるか、メタデータが予め定義された形式や規格に従っているか、ログデータからエラーメッセージや異常なパターンを探しシステムの異常を示す兆候がないか、鮮度情報から上昇パターン又は低下パターンの場合に当該パターンとなった要因を追跡し内容と矛盾が無いか、などの基準に基づいて判定される。
【0045】
完全であるか否かは、必要なメタデータの要素が全て存在しているか、収集すべき全てのログデータが存在しているか、鮮度情報から価値の上昇または低下が発生した具体的な時間帯やそれが発生した状況など、情報価値の変動の全体像を捉えるための重要な要素またはビットが含まれているか、などの基準に基づいて判定される。
【0046】
最新であるか否かは、メタデータから最新の情報を反映しているか、ログデータがリアルタイムまたは最新のデータかどうか、鮮度情報から最新の情報価値の変動を反映しているか、所定の値以上の情報価値であるか、などの基準に基づいて判定される。
【0047】
信頼性が高いか否かは、メタデータからデータソースの信頼性やメタデータの生成プロセスの評価結果や、ログデータが信頼性の高い手段で収集されており改ざんのリスクがないか、鮮度情報がいずれのパターンにおいても情報価値の変動が少ないか、などの基準に基づいて判定される。
【0048】
明確であるか否かは、メタデータが明確な説明や規約に従って定義されているか、ログデータが一貫した書式で記録されており明確に解釈できるか、鮮度情報から情報価値が低下、一定、または上昇している要因を明確に解釈できるか、などの基準に基づいて判定される。
【0049】
追跡可能であるか否かは、メタデータからデータ元が明示されているか、さらにそのデータ元に問い合わせることが可能であるか、ログデータから各ログエントリが時間とともに追跡可能であるか(時刻情報が含まれているか)、鮮度情報から各情報価値の変動が時間とともに追跡可能であること、つまり、その変動の発生した時点が明示されているか、などの基準に基づいて判定される。
【0050】
一貫性があるか否かは、メタデータからメタデータ間で一貫性があるか、またそれらが定義された規則や規格に従っているか、ログデータからログデータが一貫した書式とパターンで生成されているか、鮮度情報から情報価値の変動が一貫しているか、などの基準に基づいて判定される。なお、上述した判定基準は一例であり、そのほかの判定基準により判定されてもよい。
【0051】
情報処理部244は、出力結果の方向性と使用情報226との一致度合が所定以上である場合、当該使用情報を基にプロンプトに対応する処理を学習済みモデル222を利用して実施する。一方、情報処理部244は、出力結果の方向性と使用情報226との一致度合が所定以上でない場合、再度使用情報226を検索し、検索結果として使用情報226の候補を情報取得部242を介して取得する。
【0052】
出力部246は、情報処理部244の処理結果を利用者端末14に出力するように制御する。
【0053】
(情報処理システム10が実行する処理)
次に、情報処理システム10の作用について説明する。
図4は、情報処理システム10による処理の流れの一例を示すフローチャートである。プロセッサ120がストレージ124に記憶されたプログラム220を読み出して、メモリ122に展開して実行することにより、処理が行われる。なお、図示しないが、プロセッサ120は、情報処理システム10の作動終了操作情報、又は実行中の判定処理において利用者端末14より操作終了の情報(これらを単に「終了操作」と称する)を受信した場合は、処理中のプログラム220に基づく処理を終了する。
【0054】
プロセッサ120は、ユーザU等から入力されるプロンプトが取得できたか否かを判定する(ステップS100)。プロンプトが入力されていない場合や入力途中等のようにプロンプトが取得できない場合(ステップS100:NO)、プロセッサ120は、ステップS100の処理を繰り返す。一方、プロンプトが取得された場合(ステップS100:YES)、プロセッサ120は、プロンプトの内容に基いて出力すべき結果の方向性を判定する(ステップS102)。なお、上述したステップS100が請求項1に記載の「処理指示取得ステップ」に相当する。
【0055】
プロセッサ120は、プロンプトに基いた処理において必要となる使用情報の候補を決定すると共に、当該候補とされた使用情報の指標情報を取得する(ステップS104)。その後、プロセッサ120は、取得した指標情報からステップS102にて判定した方向性と一致する使用情報の有無を判定する(ステップS106)。方向性が一致する使用情報がない場合(ステップS106:NO)、プロセッサ120は、当該使用情報を除いた上でプロンプトに基いた処理において必要となる使用情報の候補を再度決定し(ステップS107)、ステップS104へ処理を移行する。一方、方向性が一致する使用情報がある場合(ステップS106:YES)、プロセッサ120は、当該使用情報を取得して(ステップS108)、プロンプトに基き当該使用情報を利用した情報処理を行う(ステップS110)。その後、プロセッサ120は、処理結果を出力し(ステップS112)、処理を終了する。この出力には、利用者端末14のディスプレイへの表示、外部ツール、センサ及びデータソース等への処理の実行などが含まれる。なお、上述したステップS108が請求項1に記載の「使用情報取得ステップ」、ステップS110が請求項1に記載の「処理ステップ」に相当する。
【0056】
(第一実施形態の作用効果)
本実施形態に係る情報処理システム10によれば、処理を指示するプロンプト(処理指示情報)を取得する処理指示取得ステップと、処理指示情報に基いて、情報源から処理に必要な使用情報226を取得する使用情報取得ステップと、使用情報226を基に学習済みモデル222を利用してプロンプト224に対応する処理を実行する処理ステップと、を実行する。これにより、プロンプト224に基づく使用情報226を利用した処理が実行されることから、所望する処理結果を効果的に得ることができる。
【0057】
また、情報処理システム10は、使用情報取得ステップにおいて、プロンプト224から判定される出力の方向性に基いて使用情報226を取得することから、適切な使用情報226に基づいてプロンプト224に対応する処理を実行することができる。これにより、所望する処理結果をより効果的に得ることができる。
【0058】
さらに、情報処理システム10は、使用情報取得ステップにおいて、使用情報226の取得時に当該使用情報226のメタデータを利用することから、使用情報226を効率的かつ適切に選択することができる。これにより、所望する処理結果をさらに効果的に得ることができる。
【0059】
さらにまた、情報処理システム10は、使用情報取得ステップにおいて、使用情報226の取得時に当該使用情報226に関連するログデータを利用することから、使用情報226を客観的な記録に基づいて選択することができる。これにより、所望する処理結果を一層効果的に得ることができる。
【0060】
また、情報処理システム10は、使用情報取得ステップにおいて、情報を入力すると当該情報の指標情報を出力するように学習された学習済みモデル222へ情報源の情報を入力し、学習済みモデル222から出力された指標情報を使用情報226の取得時に利用することから、メタデータやログデータが無いデータにおいても使用情報226を適切に選択することができる。これにより、所望する処理結果をより一層効果的に得ることができる。
【0061】
(第二実施形態)
次に、
図6、
図7を用いて、本発明の第二実施形態に係る情報処理システム40について説明する。第二実施形態に係る情報処理システム40は、基本的な構成は第一実施形態と同様とされ、処理結果を格納する格納ステップと、格納された処理結果と新たなプロンプト224との関連性が所定の基準以上である場合に格納された処理結果の出力と、を実行する点に特徴がある。なお、第一実施形態と同一の構成ついては、同一符号を付してその説明を省略する。
【0062】
(機能構成)
情報処理システム40における情報処理装置としてのサーバ50の機能構成について説明する。
図6は、サーバ50の機能構成の一例を示す図である。各種プログラムを実行する際に、サーバ50は第一実施形態のサーバ12と同一のハードウェア資源を用いて、各種の機能を実現する。サーバ50は、サーバ50が実現する機能構成として、通信部20と、記憶部60と、制御部70と、を有している。各機能構成は、プロセッサ120がメモリ122又はストレージ124に記憶されたプログラム600を読み出し、実行することで実現される。
【0063】
制御部70は、プロセッサ120がメモリ122(
図2参照)からプログラム600を読み出して実行し、他のハードウェア構成と協働することにより実現される。制御部70は、情報取得部242と、情報処理部700と、出力部246と、を備える。
【0064】
情報処理部700は、第一実施形態の情報処理部244と同様に、プロンプトの内容に基づく出力結果の方向性の判定、使用情報226の指標情報の取得及び生成、出力結果の方向性と使用情報との一致度合の判定、及びプロンプトに基く処理の実行を行う。また、情報処理部700は、プロンプト224に対応する処理結果を、プロンプト224と使用情報226がある場合は使用情報226とを紐づけて、記憶部60に格納する。
【0065】
さらに、情報処理部244は、新たなプロンプト224を取得した際に、当該プロンプト224と記憶部60に格納された処理結果との関連性が所定の基準以上である場合に処理結果を出力する。この所定の基準は、一例として、新たなプロンプト224と記憶部60に格納された処理結果に紐付けられているプロンプト224とが類似と判定される基準とされており、具体的には、新たなプロンプト224と記憶部60に格納された処理結果に紐付けられているプロンプト224とをベクトル変換してコサイン類似度やユークリッド距離等の値に設定されている。ここで、所定の基準以上であれば類似度がより高いことを表している。なお、所定の基準は、上述したもののみならず、単語ベースの類似度や、意味ベースの類似度など、他の基準であってもよい。また、所定の基準は、新たなプロンプト224と記憶部60に格納された処理結果に紐付けられているプロンプト224との比較のみならず、新たなプロンプト224と記憶部60に格納された処理結果自体との比較における類似判定としてもよい。さらに、所定の基準は、類似と判定されるもののみならず、つながりがあるものや共通性があるもの、影響関係にあるもの、などと判定されるものであってもよいし、これ以外ものであってもよい。
【0066】
(情報処理システム40が実行する処理)
次に、情報処理システム40の作用について説明する。
図7は、情報処理システム40による処理の流れの一例を示すフローチャートである。プロセッサ120がストレージ124に記憶されたプログラム600を読み出して、メモリ122に展開して実行することにより、処理が行われる。なお、第一実施形態と同一の処理については、同一符号を付してその説明を省略する。
【0067】
ステップS100の処理後、プロセッサ120は、取得したプロンプト224と、記憶部60に格納された処理結果に紐付けられているプロンプト224との関連性を判定し(ステップS200)、判定した関連性が所定の基準以上であるか否かを判定する(ステップS202)。所定の基準以上ではない場合(ステップS202:NO)、プロセッサ120は、ステップS102へ処理を移行する。一方、所定の基準以上である場合(ステップS202:YES)、プロセッサ120は、記憶部60に格納された処理結果に紐付けられているプロンプト224に対応する処理結果を取得し(ステップS204)、ステップS112へ処理を移行する。
【0068】
ステップS110の処理後、プロセッサ120は、当該処理結果と、それに対応するプロンプト224と、使用情報226がある場合は使用情報226と、を互いに紐づけて記憶部60に格納し(ステップS206)、ステップS112へ処理を移行する。なお、ステップS206の処理が請求項6に記載の「格納ステップ」に相当する。
【0069】
(第二実施形態の作用効果)
本実施形態に係る情報処理システム40においても、処理結果を格納する格納ステップと、格納された処理結果と新たなプロンプト224との関連性が所定の基準以上である場合に格納された処理結果の出力と、を実行する点等以外は第一実施形態と同様の構成とされているので、第一実施形態と同様の作用効果が得られる。また、情報処理システム40は、処理ステップにおける処理結果をサーバ50の記憶部60に格納する格納ステップを有し、処理指示取得ステップにおいて新たなプロンプト224を取得した際に当該プロンプト224と記憶部60に格納された処理結果との関連性が所定の基準以上である場合に処理結果を出力することから、過去に処理されたプロンプト224と関連性がある新たなプロンプト224が入力された場合に学習済みモデル222を利用した処理の実行を回避することができる。これにより、処理結果の安定化や、学習済みモデル222を利用することに起因する処理コストの低減を図ることができる。
【0070】
なお、上述した第一、第二実施形態において、使用情報226の指標情報として、メタデータ、ログデータ及び鮮度情報の少なくとも一方とされているが、これに限らず、アノテーションデータなどその他のデータを指標情報として利用してもよい。また、学習済みモデル222が使用情報226の内容から当該使用情報226の鮮度情報を生成する構成とされているが、この鮮度情報の生成について、使用情報226の内容のみならず、メタデータやログデータ等の情報を利用して鮮度情報を生成してもよい。また、学習済みモデル222は、指標情報として鮮度情報のみならず、使用情報226の内容の要約などといった、処理において必要な情報として判定するための情報を生成してもよい。そして、情報処理システム10、40は、これらの情報をルールベース及び学習済みモデル222の少なくとも一方にて判定して情報源から処理に必要な使用情報226を取得する構成としてもよい。
【0071】
さらに、使用情報226の鮮度情報について、プロンプトに基づく処理を行う学習済みモデル222にて生成される情報とされているが、これに限らず、鮮度情報を含む指標情報を、プロンプトに基づく処理を行う学習済みモデル222とは別の学習済みモデルにて生成するよう構成してもよい。この構成の場合、指標情報を生成するために最適化された学習済みモデルを利用することができるので、使用情報226の取得をより精度高く行うことができる。なお、鮮度情報を出力する学習済みモデルは、一例として時間スタンプ付き情報、生産元情報、更新頻度情報、利用者の反応情報及びトピック・分野の性質情報等の少なくとも一方を用いたのデータセットを利用して機械学習を行ったモデルである。ここで、時間スタンプ付き情報は、対象情報がいつ生成されたかを示すタイムスタンプが付加された情報であり、情報の鮮度を直接的に評価することを可能にする。生産元情報は、対象情報がどこから来たものかを示す情報であり、一例として、新聞の記事はその発行日に新鮮度が最も高く、時間の経過とともに鮮度が低下するが、歴史的なデータや文化的なデータは時間が経つほど情報価値が高まるなど、情報の鮮度を評価することを可能にするものである。更新頻度情報は、対象情報がどれくらい頻繁に更新されるかを示す情報であり、一例として、更新頻度が高い情報であれば情報の価値が高い、などの情報の鮮度を評価することを可能にするものである。利用者の反応情報は、一例として、クリック数、表示時間、シェア数及びコメント等といった、対象情報にどのように反応したかを示す情報であり、反応情報が多い情報は情報価値が高いといった情報の鮮度を評価することを可能にするものである。トピック・分野の性質情報は、一例として、科学技術分野では新しい研究や発表が行われるたびに情報が更新されるが、文学や歴史のような分野では情報はそれほど頻繁には更新されない、などといった分野毎の背景を加味して情報の鮮度を評価することを可能にするものである。
【0072】
さらにまた、上述した第一及び第二実施形態でのステップS106におけるプロセッサ120が行う処理において、取得した指標情報からステップS102にて判定した方向性と一致する使用情報の有無を判定する構成とされているが、これに限らず、取得した指標情報における方向性との一致度を算出してこの一致度が高い順に指標情報に対応する使用情報を取得して処理に用いる構成としてもよいし、この一致度による判定と前述した使用情報の有無を判定とを組み合わせてもよい。
【0073】
(変形例1)
さらに、上述した情報処理システムを異なる視点で捉えると、本実施形態に係る情報処理システムの解決しようとする課題(目的)を、「処理のコスト低減を図る」と捉えることもできる。
【0074】
上記のように課題を捉えると、課題を解決するための手段としての発明は、例えば以下のようになる。
「情報処理装置が実行する情報処理方法であって、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報を基に学習済みモデルを利用して前記処理指示情報に対応する処理を実行する処理ステップと、
前記処理ステップにおける処理結果を前記情報処理装置の記憶部に格納する格納ステップを有し、
前記処理指示取得ステップにおいて新たな処理指示情報を取得した際に当該処理指示情報と前記記憶部に格納された前記処理結果との関連性が所定の基準以上である場合に前記処理結果を出力する、
情報処理方法。」
【0075】
上記構成によれば、処理ステップにおける処理結果を情報処理装置の記憶部に格納する格納ステップを有し、処理指示取得ステップにおいて新たな処理指示情報(すなわち、プロンプト)を取得した際に当該処理指示情報と記憶部に格納された処理結果との関連性が所定の基準以上である場合に処理結果を出力することから、過去に処理された処理指示情報と関連性がある新たな処理指示情報が入力された場合に学習済みモデルを利用した処理の実行を回避することができる。これにより、処理結果の安定化や、学習済みモデルを利用することに起因する処理コストの低減を図ることができる。
【0076】
<付記>
本実施形態は、以下の開示を含む。
【0077】
(付記1)
情報処理装置が実行する情報処理方法であって、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、
前記使用情報を基に学習済みモデルを利用して前記処理指示情報に対応する処理を実行する処理ステップと、
を含む情報処理方法。
【0078】
(付記2)
前記使用情報取得ステップにおいて、前記処理指示情報から判定される出力の方向性に基いて前記使用情報を取得する、
付記1に記載の情報処理方法。
【0079】
(付記3)
前記使用情報取得ステップにおいて、前記使用情報の取得時に当該使用情報のメタデータを利用する、
付記1に記載の情報処理方法。
【0080】
(付記4)
前記使用情報取得ステップにおいて、前記使用情報の取得時に当該使用情報に関連するログデータを利用する、
付記1に記載の情報処理方法。
【0081】
(付記5)
前記使用情報取得ステップにおいて、情報を入力すると当該情報の指標情報を出力するように学習された学習済みモデルへ前記情報源の情報を入力し、当該学習済みモデルから出力された前記指標情報を前記使用情報の取得時に利用する、
付記1に記載の情報処理方法。
【0082】
(付記6)
前記処理ステップにおける処理結果を前記情報処理装置の記憶部に格納する格納ステップを有し、
前記処理指示取得ステップにおいて新たな処理指示情報を取得した際に当該処理指示情報と前記記憶部に格納された前記処理結果との関連性が所定の基準以上である場合に前記処理結果を出力する、
付記1に記載の情報処理方法。
【0083】
(付記7)
情報処理装置に、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、
前記使用情報を基に学習済みモデルを利用して処理を実行する処理ステップと、
を含む情報処理方法を実行させるためのプログラム。
【0084】
(付記8)
情報処理装置が実行する情報処理システムであって、
処理を指示する処理指示情報を取得する処理指示取得ステップと、
前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、
前記使用情報を基に学習済みモデルを利用して処理を実行する処理ステップと、
を行う情報処理システム。
【0085】
今回開示された実施形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。また、本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0086】
10 情報処理システム
12 サーバ(情報処理装置)
22 記憶部
50 サーバ(情報処理装置)
60 記憶部
220 プログラム
222 学習済みモデル
224 プロンプト(処理指示情報)
226 使用情報
224 ポリシー情報
500 情報処理システム
600 プログラム
【要約】 (修正有)
【課題】学習済みモデルを利用して、所望する処理結果を効果的に得る情報処理方法、プログラム及び情報処理システムを提供する。
【解決手段】情報処理装置が実行する情報処理方法であって、処理を指示する処理指示情報を取得する処理指示取得ステップと、前記処理指示情報に基いて、情報源から処理に必要な使用情報を取得する使用情報取得ステップと、前記使用情報を基に学習済みモデルを利用して処理を実行する処理ステップと、を含む。これにより、所望する処理結果を効果的に得ることができる。
【選択図】
図3