(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-04-17
(45)【発行日】2024-04-25
(54)【発明の名称】情報処理システム、情報処理方法
(51)【国際特許分類】
G06N 10/00 20220101AFI20240418BHJP
G06N 5/022 20230101ALI20240418BHJP
【FI】
G06N10/00
G06N5/022
(21)【出願番号】P 2023128856
(22)【出願日】2023-08-07
【審査請求日】2023-09-11
【早期審査対象出願】
(73)【特許権者】
【識別番号】521366104
【氏名又は名称】Linked Ideal合同会社
(74)【代理人】
【識別番号】110004163
【氏名又は名称】弁理士法人みなとみらい特許事務所
(72)【発明者】
【氏名】久保寺 誠
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特開2018-147238(JP,A)
【文献】国際公開第2022/059107(WO,A1)
【文献】KHANDELWAL, Ankit ほか,Quantum-Enhanced Topological Data Analysis: A Peep from an Implementation Perspective,arXiv[online],2023年02月19日,[retrieved on 2023.12.6], Retrieved from the Internet: <URL: https://arxiv.org/pdf/2302.09553.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
量子コンピュータによる知識データベース照合を可能とする情報処理システムであって、
文章取得部と、変換部と、指示部と、を備え、
前記文章取得部は、複数の文章を取得し、
前記変換部は、前記文章の命題に基づき、命題間の論理関係を変換したグラフラプラシアンを取得し、
前記変換部は、文章をベクトル化した文章ベクトルを点群データとしてマッピングし、各点の半径の変化によって連結する文章ベクトル間の同一性を分析結果として出力する分析部と、
前記文章ベクトルと、前記分析結果と、に基づき前記グラフラプラシアンを生成するグラフ変換部と、を備え、
前記指示部は、前記グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を前記量子コンピュータに対して出力する、情報処理システム。
【請求項2】
量子コンピュータによる知識データベース照合を可能とする情報処理システムであって、
文章取得部と、変換部と、指示部と、
回路生成部と、を備え、
前記文章取得部は、複数の文章を取得し、
前記変換部は、前記文章の命題に基づき、命題間の論理関係を変換したグラフラプラシアンを取得し、
前記指示部は、前記グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を前記量子コンピュータに対して出力
し、
前記回路生成部は、前記量子エンコーディング指示に対して、量子エンコードされた情報を処理する量子回路を多分木となる遺伝子ツリーに基づき生成し、
前記量子回路は、ユニタリゲートを有する親ノードと、量子ビットもしくは、単一量子ビットに対するユニタリゲートもしくは、1つ以上の制御ビットを有するユニタリゲートのいずれかの子ノードと、により構成される遺伝子ツリーを生成する制約条件に基づき生成される、情報処理システム。
【請求項3】
前記量子エンコーディング指示に対する量子計算結果として固有値を前記量子コンピュータから取得し、前記固有値から論理関係の有無を判定する照合部を備える、請求項1
又は請求項2に記載の情報処理システム。
【請求項4】
前記量子エンコーディング指示に必要な情報を格納する知識データベースを備え、
前記照合部は、照合対象とする文章と、グラフデータ又はグラフラプラシアンを含む量子エンコーディング指示に必要な情報と、を照合し、照合結果である前記量子エンコーディング指示に必要な情報を用いて量子エンコーディング指示を出力する、
請求項3に記載の情報処理システム。
【請求項5】
前記量子エンコーディング指示に対する量子計算結果として固有値を取得し、前記固有値から導出される0次元ベッチ数が1でないとき、論理的繋がりがないものとして判定する照合部を備える、
請求項1に記載の情報処理システム。
【請求項6】
前記回路生成部は、ターミナルノードを除くノードをユニタリゲートとする遺伝子ツリーを生成する制約条件に基づき量子回路を生成する、
請求項2に記載の情報処理システム。
【請求項7】
前記回路生成部は、ノード数が少ない量子回路を高くかつ相互作用させる量子ビットの配置の近さを評価する評価関数を用いて、生成された量子回路を評価する、
請求項2又は請求項6に記載の情報処理システム。
【請求項8】
量子コンピュータによる知識データベース照合を可能とする情報処理方法であって、
コンピュータが、複数の文章を取得
する工程と、
前記文章の命題に基づき、命題間の論理関係を変換したグラフラプラシアンを取得
する工程と、
前記グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を前記量子コンピュータに対して出力する
工程と、を実行し、
前記グラフラプラシアンを取得する工程では、前記コンピュータが、文章をベクトル化した文章ベクトルを点群データとしてマッピングし、各点の半径の変化によって連結する文章ベクトル間の同一性を分析結果として出力し、
前記文章ベクトルと、前記分析結果と、に基づき前記グラフラプラシアンを生成する、
情報処理方法。
【請求項9】
量子コンピュータによる知識データベース照合を可能とする情報処理方法であって、
コンピュータが、複数の文章を取得
する工程と、
前記文章の命題に基づき、命題間の論理関係を変換したグラフラプラシアンを取得
する工程と、
前記グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を前記量子コンピュータに対して出力する
工程と、
前記量子エンコーディング指示に対して、量子エンコードされた情報を処理する量子回路を多分木となる遺伝子ツリーに基づき生成する工程と、を実行し、
前記量子回路は、ユニタリゲートを有する親ノードと、量子ビットもしくは、単一量子ビットに対するユニタリゲートもしくは、1つ以上の制御ビットを有するユニタリゲートのいずれかの子ノードと、により構成される遺伝子ツリーを生成する制約条件に基づき生成される、情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、量子コンピュータによる処理に適合した知識データベースを構築する情報処理システム、情報処理方法に関する。
【背景技術】
【0002】
知識データベース(ナレッジベース)は、業務の経験やノウハウなどを一か所に集約することで、データの検索性や活用性を向上する目的で構築されたデータベースである。知識データベースでは、知識間の関係性に基づいてデータベース化され、その関係性をコンピュータ処理により検索する種々の技術が提案されている。
【0003】
特許文献1では、ファジイ推論に必要な推論規則を学習し、学習結果によってファジイ推論を行うファジイ推論技術を開示される。特許文献1では、知識情報間の因果関係をファジイ推論規則として学習することで、曖昧さを含む知識情報からの推論規則の獲得が数分以下で可能になり、その真理値や有効度を用いてファジイ推論を実行することができることを開示している。
【先行技術文献】
【特許文献】
【0004】
【非特許文献】
【0005】
【文献】Kubra Yeter-Aydeniz et al (2019). “Quantum topological data analysis with continuous variables”
【文献】Ankit Khandelwal and M Girish Chandra (2023). “Quantum-Enhanced Topological Data Analysis: A Peep from an Implementation Perspective”
【発明の概要】
【発明が解決しようとする課題】
【0006】
上述したように、知識間の繋がりを含むデータベース検索では、コンピュータ処理に時間がかかることが課題であった。特に、近年では情報量が増加しており、それらの関係性は複雑化する傾向にある。
【0007】
量子コンピュータは、量子計算の特徴を活用するアルゴリズムによって、古典コンピュータと比較して優位な計算能力を発揮することができる。量子コンピュータにより優位な計算能力を発揮するためには、計算の対象となる情報を量子エンコーディングして変換することが課題であった。
【0008】
本発明は、上述した課題に鑑みてなされたものであって、量子コンピュータにより優位に計算可能な量子エンコーディングによる知識データベース照合を可能とする技術を提供することを解決すべき課題とする。また、量子エンコーディングを使用した知識データベースの検索に優位な量子回路を生成する技術を提供することを解決すべき課題とする。
【課題を解決するための手段】
【0009】
上述した課題を解決するために、本発明は、文章取得部と、変換部と、指示部と、を備え、前記文章取得部は、複数の文章を取得し、前記変換部は、前記文章の命題に基づき、命題間の論理関係を変換したグラフラプラシアンを取得し、前記指示部は、前記グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を前記量子コンピュータに対して出力する。
【0010】
このような構成とすることで、文章を量子コンピュータにより計算可能な情報に変換することができる。
【0011】
本発明の好ましい形態では、前記量子エンコーディング指示に対する量子計算結果として固有値を前記量子コンピュータから取得し、前記固有値から論理関係の有無を判定する照合部を備える。
このような構成とすることで、量子コンピュータにより固有値を高速に計算し、その結果によって、対象とする文章の論理関係の有無を判定することができる。
【0012】
本発明の好ましい形態では、
前記量子エンコーディング指示に必要な情報を格納する知識データベースを備え、前記照合部は、照合対象とする文章と、グラフデータ又はグラフラプラシアンを含む量子エンコーディング指示に必要な情報と、を照合し、照合結果である前記量子エンコーディングに必要な情報を用いて量子エンコーディング指示を出力する。
このような構成とすることで、照合したい文章に対応する量子エンコーディングに必要な情報を用いて量子エンコーディング指示を行うことができる。
【0013】
本発明の好ましい形態では、前記変換部は、文章をベクトル化した文章ベクトルを点群データとしてマッピングし、各点の半径を変化によって連結する文章ベクトル間の同一性を分析結果として出力する分析部と、前記文章ベクトルと、前記分析結果と、に基づき前記グラフラプラシアンを生成するグラフ変換部と、を備える。
本発明の好ましい形態では、前記量子エンコーディング指示に対する量子計算結果として固有値を取得し、前記固有値から0次元ホモロジー群のベッチ数が1でないとき、論理的繋がりがないものとして判定する照合部を備える。
このような構成とすることで、幾何学的な分析によって蓄積された命題の語義の曖昧性の幅を調整することができる。また、ベッチ数から幾何学的な連結がないことが分析できた場合、文章の論理関係の繋がりがないものとして判定することで、それ以上の論理関係の演算が不要であるため、演算コストを削減することができる。
【0014】
本発明の好ましい形態では、前記量子エンコードされた情報を処理する量子回路を多分木となる遺伝子ツリーに基づき生成する回路生成部を備え、前記回路生成部は、ユニタリゲートを有する親ノードと、量子ビットもしくは、単一量子ビットに対するユニタリゲートもしくは、1つ以上の制御ビットを有するユニタリゲートのいずれかの子ノードと、により構成される遺伝子ツリーを生成する制約条件に基づき量子回路を生成する。
本発明の好ましい形態では、前記回路生成部は、ターミナルノードを除くノードをユニタリゲートとする遺伝子ツリーを生成する制約条件に基づき量子回路を生成する。
本発明の好ましい形態では、前記回路生成部は、ノード数が少ない量子回路を高く評価する評価関数を用いて、生成された量子回路を評価する。
このような構成とすることで、量子エンコーディングされた文章の処理に適合した量子回路を生成することができる。
【発明の効果】
【0015】
本発明によれば、量子コンピュータによる知識データベース照合を可能とする技術を提供することができる。
【図面の簡単な説明】
【0016】
【
図3】本実施形態の知識データベース構築にかかる処理シーケンス。
【
図4】本実施形態の知識データベース照合にかかる処理シーケンス。
【
図7】本実施形態の知識データベース構築にかかる処理フローチャート。
【
図9】ノードとエッジによるグラフデータの概要図。
【
図10】本実施形態の知識データベース照合にかかる処理フローチャート。
【
図11】本実施形態の制御ユニタリゲートを含む量子回路の構成例。
【
図12】本実施形態の量子回路生成にかかる処理フローチャート。
【発明を実施するための形態】
【0017】
以下、図面を用いて、本発明の実施形態に関する情報処理システムについて説明する。なお、以下に示す実施形態は本発明の一例であり、本発明を以下の実施形態に限定するものではなく、様々な構成を採用することもできる。
【0018】
本実施形態では、情報処理システム、情報処理装置および、情報処理プログラムの構成、動作等について説明するが、同様の構成の方法、コンピュータのプログラムおよび当該プログラムを記録したプログラム記録媒体等も、同様の作用効果を奏する。プログラム記録媒体を用いれば、例えば、コンピュータに当該プログラムをインストールすることができる。以下で説明する本実施形態にかかる一連の処理は、コンピュータで実行可能なプログラムとして提供され、CD-ROMやフレキシブルディスクなどの非一過性コンピュータ可読記録媒体、更には通信回線を経て提供可能である。
【0019】
情報処理システムは、コンピュータ装置により構成される。コンピュータ装置は、CPU(Central Processing Unit)などの演算装置および記憶装置を有する。当該コンピュータ装置は、記憶装置に格納される情報処理プログラムを、演算装置により実行することで、当該コンピュータ装置を情報処理装置として機能させることができる。情報処理方法は、情報処理装置を含むコンピュータ装置の処理により実現される。
【0020】
本実施形態において、文章は命題として解釈される。文章同士は、命題による論理関係を有する。命題とは、例えば、「AはBである」、「CはAである」などである。このような命題に基づいて「CはBである」という論理関係が導出される。このような命題の論理関係を表すデータを量子エンコーディングすることで、量子コンピュータによる高速な量子計算を実現する。
【0021】
図1は、情報処理システム1のブロック図を示す。情報処理システム1は、情報処理装置2と、量子コンピュータ3と、利用者端末4と、知識データベースNBと、を備え、通信可能に接続されている。
図1では、利用者端末4は1つのみ示しているが、複数存在してもよい。量子コンピュータ3は、情報処理装置2に搭載される構成であってもよい。
【0022】
情報処理装置2は、機能構成要素として、文章取得部21と、変換部22と、指示部23と、記憶処理部24と、照合部25と、回路生成部26と、を備える。また、変換部22は、ベクトル変換部221と、分析部222と、グラフ変換部223と、を有する。
【0023】
本実施形態において、量子コンピュータ3は、任意のハードウェア(例えば超伝導量子回路や光量子回路)により量子ビットを構成し、量子ビットに対して量子ゲート操作を行うことにより量子計算を行う。量子コンピュータ3は、量子回路に基づいて量子計算を行う。
【0024】
利用者端末4は、知識データベースNBに蓄積したい文章、知識データベースNBで照合したい文章の入力を受け付ける。利用者端末4は、文章を情報処理装置2に送信することで、文章の蓄積による知識データベースNBを構築することができる。利用者端末4は、照合したい文章を情報処理装置2に送信することで、照合結果を参照することができる。なお、本実施形態において、文章はコンピュータ処理可能なテキストデータとして処理されるものとする。
【0025】
図2(a)は、情報処理装置2のハードウェア構成図を示す。情報処理装置2は、ハードウェア構成として、制御装置201と、記憶装置202と、通信装置203と、を備える。本実施形態において、情報処理装置2は、サーバ装置、パーソナルコンピュータなどのコンピュータ装置を用いることができる。なお、情報処理装置2は、複数のコンピュータ装置により構成され、全体として上述の機能構成要素(21-26)を実現できればよく、
図2(a)に示す構成に限定されるものではない。
【0026】
制御装置201は、CPUやGPU(Graphics Processing Unit)などの1つ以上のプロセッサにより構成され、情報処理プログラムやOS(Operating System)、その他のアプリケーションを実行することで、情報処理装置2における全体処理を制御する。記憶装置202は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ、RAM(Random Access Memory)などであって、情報処理プログラムおよび各種データを記憶する。通信装置203は、通信ネットワークとの通信制御を行い、利用者端末4や量子コンピュータ3などとのデータ通信を実現する。
【0027】
図2(b)は、利用者端末4のハードウェア構成図を示す。利用者端末4は、ハードウェア構成として、制御装置401と、記憶装置402と、通信装置403と、入力装置404と、出力装置405と、を備える。本実施形態において、利用者端末4は、スマートフォン、パーソナルコンピュータ、タブレット端末などを用いることができる。
【0028】
制御装置401は、CPUなどの1つ以上のプロセッサにより構成され、端末用プログラム、OS、その他のアプリケーションなどを実行することで、利用者端末4における全体処理を制御する。記憶装置402は、HDD、SSD、フラッシュメモリ、RAMなどであって、ブラウザアプリケーション、および各種データを記憶する。通信装置403は、通信ネットワークとの通信制御を行い、少なくとも情報処理装置2とのデータ通信を実現する。入力装置404は、利用者による入力操作を受け付ける入力インターフェイスであって、マイク、タッチパネル、マウス、キーボードなどにより構成される。出力装置405は、表示出力するディスプレイなどにより構成される。
【0029】
<知識データベース構築>
図3は、知識データベースを構築する工程における情報処理システム1の処理シーケンスを示す。
【0030】
利用者端末4は、文章を情報処理装置2に対して送信する(S101)。情報処理装置2は、利用者端末4より受信した文章を知識データベースNBに格納する(S102)。また、情報処理装置2は、利用者端末4より受信した文章をベクトル化した文章ベクトルを知識データベースNBに格納する(S103)。また、情報処理装置2は、利用者端末4より受信した文章をグラフ化したグラフデータ及び/又はグラフラプラシアンを知識データベースNBに格納する(S104)。
【0031】
<知識データベース照合>
図4は、知識データベースを構築する工程によって構築された知識データベースを照合する工程における情報処理システム1の処理シーケンスを示す。本実施形態において、知識データベースの照合とは、利用者が照合したい文章(対象文章)を入力すると、当該対象文章が命題として解釈され、知識データベースNBに格納された文章に基づき照合されることで、その命題の真偽判定結果を得ることができるというものである。なお、従来の知識データベースと同様に、任意の検索クエリなどによる文章の検索、閲覧をすることも当然可能なものとする。
【0032】
利用者端末4は、照合対象の文章を情報処理装置2に対して送信する(S201)。情報処理装置2は、受信した文章をベクトル化した上で照合要求を知識データベースNBに送信する(S202)。なお、情報処理装置2は、受信した文章又は文章ベクトルを知識データベースNBに格納してもよい。情報処理装置2は、照合結果をグラフデータ又はグラフラプラシアンとして受信する(S203)。なお、情報処理装置2は、対応する照合結果を取得できない場合、照合不可とする結果を利用者端末4に出力する。また、情報処理装置2は、照合結果としてグラフデータを取得した場合、グラフラプラシアン化を行うものとする。情報処理装置2は、グラフラプラシアンをユニタリ行列に適用するための量子エンコーディン指示を量子コンピュータ3に対して出力する(S204)。量子コンピュータ3は、量子エンコーディング指示にしたがって量子位相推定の計算を行う(S205)。情報処理装置2は、量子エンコーディング指示に対する量子位相推定の量子計算結果を受信する(S206)。情報処理装置2は、量子位相推定結果について照合判定を行う(S207)。情報処理装置2は、照合判定結果に基づく出力を利用者端末4に送信する(S208)。ここで、照合判定に基づく出力は、命題の真偽結果を含む。命題の真偽結果は、命題に論理的繋がりがあり真である、命題に論理的繋がりがあるものの偽である、論理的繋がりがなく偽である可能性が高い、又は、偽とみなす、などである。
【0033】
本実施形態において、文章は、知識グラフとして表される。文章は、ノードとして扱われる。文章同士の論理関係は、エッジとして扱われる。エッジは、具体的には、論理演算子であるAND、OR、NOT、IMP(→)などを表す。
【0034】
図5は、本実施形態における文章同士の論理関係の概要図を示す。
図5では、文章A、文章B、文章Cが、「A AND B ⇒ C」の論理関係を持つものとする。文章A~Cは、それぞれノードN1~N3として表される。エッジE1は、ANDの論理関係を表す。エッジE2は、結論の論理関係を表す。ここで、文章DのノードN4は、文章A~Cとエッジによる繋がりを持たないため、論理関係を持たないものとして扱われる。
【0035】
文章及び文章間の論理関係は、文章をベクトル化した文章ベクトルによって表すことができる。文章のベクトル化は、既存の自然言語処理モデルを使用することができ、文章を自然言語処理モデルに入力することで、文章ベクトルが出力される。文章ベクトルは、多次元ベクトルであって、類似する文章は、類似のベクトルを有するため、近いベクトル空間上にマッピングされている。また、文章間に論理関係を有する複数の文章ベクトルは、当該論理関係に対応した比較的近いベクトル空間上にそれぞれマッピングされることになる。例えば、類似の文章ベクトル同士の論理関係は、包含関係IMPとすることができる。
【0036】
一方の文章に含まれる命題と、他方の文章に含まれる命題が類似するものである場合、これらの命題は同一と解釈されることが好ましい場面が想定される。また、文章間の論理関係についても、類似する命題を拡大して解釈することで、従前は論理関係を持たなかった命題同士が論理関係を持つものとして解釈されることが好ましい場面が想定される。
【0037】
本実施形態において、文章の命題に拡大した解釈の幅を持たせるために、幾何学的分析手法を採用する。より具体的には、パーシステントホモロジーを応用した分析手法によって、文章ベクトルが解釈される。パーシステントホモロジーの詳細説明は、非特許文献1を参照されたい。パーシステントホモロジーによる分析手法では、例えば、ベクトル空間に対してn次ホモロジー群を考えることができる。この分析によると、0次ホモロジー群からはベクトル空間における連結成分の数、1次ホモロジー群からはベクトル空間における1次元の穴(輪)の数、2次ホモロジー群からはベクトル空間における2次元の穴(空洞)の数、などの情報が得られる。これらの幾何学的分析により得られる情報は、ベッチ数と呼ばれる。ベッチ数は、連続的変形によって同一とみなされる構造を、同一として分類するような分析などに用いられる。
【0038】
本実施形態の分析手法は、ベッチ数に基づいて、ベクトル空間にマッピングされる文章ベクトル同士の論理関係の解釈に応用するものである。具体的には、0次元ベッチ数は、連結成分の数を表しており、0次元ベッチ数が1であれば、分析対象の構造的な連結成分は1つであることが分析できる。すなわち、分析対象は、論理関係として一連の繋がりを持つ可能性があると分析できる。逆に、0次元ベッチ数が2以上であれば、分析対象は、論理関係として分断され、繋がりを持たないものとして分析できる。したがって、0次元ベッチ数を取得することで、論理関係の有無を判定することができる。
【0039】
図6は、パーシステントホモロジーの概要説明図である。ここでは、ベクトル空間において、文章ベクトルが点としてマッピングされるものとみなす。すなわち、文章ベクトルは、ベクトル空間において点群データとみなされる。
【0040】
図6(a)は、ベクトル空間上にマッピングされた文章ベクトルに対応する点群データを示す。パーシステントホモロジーでは、これら点群の各点を徐々に膨らませていく。
図6(b)は、点群データの各点を膨らませた過程を示す。ここでは、一部の点同士が連結することで、連結成分の個数が減少したものと解釈される。
図6(c)では、更に点群データの各点を膨らませることで、全ての点が繋がりを持ち、トーラスを形成したものとなる。
図6(a)~(c)のように、各点を膨らませることで、最終的に、トーラスが形成されることで穴の数が1となり、ベッチ数が変容することになる。ベッチ数が変容することで、文章の命題及び文章同士の論理関係の解釈も同じく変容することになり、文章の語義の曖昧性の幅を調整することができるものと把握される。
【0041】
図7は、情報処理装置2における知識データベースNBの構築の詳細処理のフローチャートを示す。
【0042】
文章取得部21は、利用者端末4より知識データベースNBに蓄積する知識に関する文章を取得する(S301)。
【0043】
ベクトル変換部221は、取得した文章を文章ベクトルに変換し、ベクトル空間にマッピングする(S302)。ベクトル空間にマッピングされた文章ベクトルを分散表現と呼ぶ。分散表現は、知識データベースNBに格納されるものとする。
【0044】
分析部222は、文章ベクトル同士の類似度を判定する。本実施形態において、文章ベクトルの類似度は、コサイン類似度によって判定される。コサイン類似度では、2つの文章ベクトルが-1から1の範囲の値で正規化される。コサイン類似度が、1であれば文章ベクトル同士がなす角度が0度であり、文章ベクトル同士の類似度が高いと判定される。コサイン類似度が、-1であれば文章ベクトル同士がなす角度が180度であり、文章ベクトル同士の類似度が低いと判定される。なお、文章ベクトル同士の類似度の判定は、コサイン類似度による判定に限定されず、ユークリッド距離、KLダイバージェンスなどの手法などを採用し得る。
【0045】
分析部222は、前述の分析手法の通り、ベクトル空間にマッピングされた文章ベクトルを点群データとして、半径rによって、各点を膨らませる。ここで、半径rは、上述した文章の類似度の調整に用いられる数値として定義されるものであって、文章の解釈の幅をどの程度まで広げるかによって、任意に設定可能である。例えば、同一とみなしたいターゲットとなる2つの類似する命題が存在する場合、それら命題が対応するそれぞれの文章ベクトルの点同士がベクトル空間上で連結する半径rが設定される。半径rがゼロであれば、厳密に一致する文章同士のみの同一性しか許さず、文章ベクトル同士の距離に対して、一定以上(この数字を半径rにする。)であれば語義の曖昧性を含めて同一視をすることが可能となる。
【0046】
本実施形態において、半径rは定数として設定されるが、利用者端末4を介して任意の半径rが設定されてもよい。また、半径rは、照合要求に対する照合結果を取得できない場合、より大きな値として再度照合要求を行う構成とすることができる。半径rは、知識データベースNBに格納する知識の属性や用途などに応じて異なる定数が設定されてもよい。
【0047】
分析部222は、半径rの調整によって変容するベッチ数を分析結果とすることができる。ベッチ数は、点群データを構成する点群による構造体の幾何学的特徴を表す。分析部222は、点群データの幾何学的な変容によって、命題の同一性を分析結果とすることができる。
【0048】
グラフ変換部223は、文章の命題に基づき、命題間の論理関係をグラフ化するグラフ変換を行う(S303)。具体的には、グラフ変換部223は、ベクトル空間にマッピングされた文章ベクトルに基づいて、グラフデータを生成する。また、グラフ変換部223は、グラフデータを更に変換したグラフラプラシアンを生成する。ここで、グラフ変換部223は、分析部222の分析結果を用いて、2つの類似する命題を同一の命題として、グラフデータを生成することができる。
【0049】
本実施形態において、グラフデータは、始点データと、終点データと、により構成される。
図8(a)は、グラフデータの構成例を示す。命題A~Cの論理的つながりは、例えば、「A≒B」という論理関係と、「BはCである」という論理関係と、を有する。命題Aを始点データとした場合、グラフデータの1行目は、始点データとして命題A、終点データとして命題Bを有する。命題Bを始点データとして場合、グラフデータの2行目は、始点データとして命題B、終点データとして命題A及び命題Cを有する。なお、「BはCである」という論理関係は、逆の論理関係が成立しないため、始点データとして命題Cを有するグラフデータの行は、生成されない。
【0050】
グラフ変換部223は、類似する命題Aと命題Bを同一の命題であるとする分析結果を取得できる場合、
図8(b)に示すグラフデータとすることができる。
図8では、グラフデータの1行目は、始点データとして命題B、終点データとして命題Cを有し、「BはCである」という論理関係を示している。ここで、命題Aと命題Bは同一の命題とされるため、
図8(a)の1行目のグラフデータは存在しない。
図8(b)に示すように分析部222による分析結果があることで、「A≒B」という論理関係を示す文章ベクトルがなくても、グラフ変換部223は、
図8(a)と同等のグラフデータを生成することができる。これによって、知識データベースNBに格納される文章が少数であっても、命題を拡大して解釈した照合を可能とする。
【0051】
ノードとエッジにより表されるデータの量子エンコーディングについて、非特許文献2を参照しながら説明する。ここでは、
図9に示すノードとエッジにより表せるデータを考える。本実施形態では、これらのデータは、グラフデータに対応する。
図9によると、対象となるデータは、ノードN1~N5により構成され、ノードN1~N3は、部分構造体kを構成する。この全体の構造体Kは、式(1)として示される。
【0052】
【0053】
式(2)、(3)は、構造体の、2次元単体の境界作用素∂2を示す。1次元単体の境界作用素∂1の各列は、ノードN1~N5の関係を表すものであり、例えば、1列目は、ノードN1、N2の関係を表している。2次元単体の強化作用素∂2は、部分構造体kを表すものである。
【0054】
【0055】
これらの境界作用素から式(4)に示すグラフラプラシアンΔ1が得られる。
【0056】
【0057】
グラフラプラシアンΔ1は、量子計算に必要なデータ長とするためにパディングされる。ここでは、グラフラプラシアンΔ1は、6x6行列であるため、2のべき乗である8x8行列としてパディングされる。なお、対象データの行列サイズに対応するパディングが適宜なされるものとする。パディングされたグラフラプラシアンΔ1´は、式(5)に示される。
【0058】
【0059】
グラフラプラシアンΔ1は、エルミート行列となる。エルミート行列におけるゼロ固有値の固有空間の次元は、ベッチ数になる。ゼロ固有値とは、行列のカーネル次元であり行列の固有値が0の重複度である。式(5)では、ゼロ固有値が1となり、この例で求められる1次元ベッチ数は、1となる。しかし、一般的に行列の次元が大きくなるほど計算は困難となる。量子コンピュータは、量子位相推定アルゴリズムにより固有値を高速に求めることができる。
【0060】
次に、グラフラプラシアンΔ1を、式(6)に示すパウリ演算子のテンソル積の線形結合であるエルミート行列Hに変換する。
【0061】
【0062】
エルミート行列Hを用いることで、式(7)に示すユニタリ行列Uを表すことができる。この変換において、エルミート行列のカーネル次元情報は保存されるため、このユニタリ行列のカーネル次元を求めれば固有値、すなわちベッチ数を導出することができる。量子コンピュータは、ユニタリ行列Uに対して高速な固有値推定アルゴリズム(位相推定アルゴリズムともいう)が知られており、これにより、対象のデータをユニタリ行列に変換することで、量子コンピュータによる高速計算が可能となる。量子回路の制御ユニタリゲートでは、制御ユニタリ演算子Uが配置される。量子回路は、制御ユニタリゲートのべき乗ゲートが複数配置されることになる。
【0063】
【0064】
以上に説明したように、グラフ変換部223は、グラフデータを更にグラフラプラシアンに変換することで、文章をグラフ化し、量子コンピュータ3による量子エンコーディングに必要な情報を生成することができる。
【0065】
記憶処理部24は、量子エンコーディングに必要な情報を知識データベースNBに格納する(S304)。量子エンコーディングに必要な情報は、グラフデータ又は、グラフラプラシアンである。知識データベースNBは、文章と、当該文章に対応する文章ベクトル及びグラフデータを少なくとも格納する。知識データベースNBは、更に、対応するグラフラプラシアンを格納することが好ましい。知識データベースNBは、照合対象の文章又は文章ベクトルによる照合要求に対する、照合結果となるグラフデータ又はグラフラプラシアンを格納する。本実施形態において、照合結果としてグラフデータを取得できれば、その後グラフラプラシアン化し、量子エンコーディング指示を出力することができるが、照合結果としてグラフラプラシアンを取得することで、照合段階におけるグラフデータをグラフラプラシアン化する処理を省略することができるため、より好ましい。
【0066】
一態様として、ベクトル変換部221は、知識データベースNBに格納される文章にベクトル化処理することで、文章ベクトルを生成する。また、グラフ変換部223は、知識データベースNBに格納される文章ベクトルにグラフ化処理することで、グラフデータを生成する。また、指示部23は、知識データベースNBに格納されるグラフデータからグラフラプラシアンを生成し、当該グラフラプラシアンに基づく量子エンコーディングを量子コンピュータ3によって処理させることで、量子エンコードされた情報を生成する。それぞれのデータ処理のタイミングは、新規の文章を取得したタイミングに限定されず、知識データベースNBに一定のデータが蓄積されたタイミングに適宜実行されるものであってよい。これによって、文章間の論理関係が任意のタイミングで更新可能となる。
【0067】
図10は、情報処理装置2における知識データベースNBの照合の詳細処理のフローチャートを示す。
【0068】
はじめに、文章取得部21は、利用者端末4を介して照合の対象となる対象文章を取得する(S401)。本実施形態において、対象文章は、利用者が真偽を知りたい情報を文章として入力されたものである。例えば、知識データベースNBが社内業務に係る知識を蓄積するものであれば、真偽が不明な社内業務を文章として入力することで、それが正しいものであるか否かを示す照合結果が出力として得られる。
【0069】
ベクトル変換部221は、対象文章を文章ベクトル(対象文章ベクトル)に変換する(S402)。照合部25は、変換した対象文章ベクトルについて知識データベースNBに照合要求する(S403)。
【0070】
分析部222は、対象文章ベクトルをパーシステントホモロジー上の点群データとして、語義の曖昧性をベクトル間の距離の逆数rによって各点を膨らませる分析処理を実行してもよい。分析部222は、利用者端末4を介して命題の解釈の抽象度に関する指示入力を受け付けてもよい。分析部222は、指示入力された抽象度に応じて点群データの半径rを決定する。
【0071】
照合部25は、知識データベースNBより照合結果を取得する(S404)。照合結果は、知識データベースNBに格納される対象文章ベクトルに対応する文章ベクトルのグラフデータ又はグラフラプラシアンである。照合結果としてグラフデータが取得される場合、グラフ変換部223は、取得したグラフデータをグラフラプラシアンに変換する。
【0072】
指示部23は、取得したグラフラプラシアンに基づき量子エンコーディング指示を量子コンピュータ3に対して出力する(S405)。具体的に、指示部23は、グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を生成する。量子コンピュータ3は、量子エンコーディング指示にしたがって、量子位相推定を行うことができる。
【0073】
量子コンピュータ3は、照合対象の量子エンコーディング指示から量子位相推定を行い、計算結果を情報処理装置2に送信する。計算結果は、量子エンコードされたユニタリ行列の固有値である。
【0074】
照合部25は、量子コンピュータ3よりユニタリ行列の固有値を含む計算結果を取得する(S406)。
【0075】
照合部25は、固有値から論理関係の有無を判定する(S407)。具体的に、照合部25は、固有値から0次元ベッチ数を取得し、0次元ベッチ数が1であれば、論理的繋がりありと判定し(S407でYES)、続くS408で論理計算を行う。照合部25は、0次元ベッチ数が2以上であれば、論理的繋がりなしと判定し(S407でNO)、論理計算を省略できる。古典コンピュータによる論理計算は、計算コストがかかるものであったが、量子コンピュータ3による量子位相推定によって、論理関係がない照合対象を論理計算から除外できるため、計算コストを削減することができる。
【0076】
照合部25は、論理的繋がりありと判定された照合対象について論理計算を行う(S408)。論理計算は、照合結果のグラフデータなどの論理関係を参照することで実行される。照合部25は、論理計算の結果として、照合対象の文章の命題の真偽判定結果を出力する。真偽判定結果の偽は、論理関係がないことを示す結果であるが、S407の論理的繋がりなしの判定結果と区別して結果が出力されてもよい。S407の論理的繋がりなしの判定結果は、厳密には真偽を問えず、論理的な繋がりがないことから偽となる可能性が高い、或いは、偽であるものとして推定する結果を示すものである。
【0077】
照合部25は、計算結果に基づく出力を生成し、利用者端末4に送信する(S409)。照合結果に基づく出力は、対象文章の論理的なつながりの有無を示す情報を含む。また、照合結果に基づく出力は、論理関係ありの場合に知識データベースNBに格納された情報から文章を命題としときの真偽判定結果と論理的なつながりを形成する文章を含んでもよい。これによって、利用者は、根拠となる文章を参照するなどして、蓄積された知識を有効に活用することができる。
【0078】
<量子回路生成>
本実施形態において、量子コンピュータ3を構成する量子回路は、制御ユニタリゲートを含む。
図11は、制御ユニタリゲートを含む量子回路QCの構成図の一例を示す。量子回路QCは、量子位相推定回路QC1と、量子重ね合わせ状態準備回路QC2と、を備える。量子回路QCは、アダマールゲートや測定、更には、制御ユニタリゲートG1~G3などの量子ゲートにより構成される。
【0079】
本実施形態において、量子位相推定回路QC1は、量子位相推定の演算に用いられる。特に、制御ユニタリゲートG1~G3は、量子位相推定の演算に用いられる量子ゲートであって、量子計算の速度などに影響を与える。
【0080】
図11に示す量子位相推定回路QC1は、簡略化されているが、実際の量子回路は長大となる。そのため、量子回路は、できるだけ短い回路かつ効率的な量子ゲートの配置などにより効率化されることが好ましい。
【0081】
回路生成部26は、量子位相推定を処理する量子回路を生成する。回路生成部26は、遺伝的アルゴリズムに基づき遺伝子ツリーを生成することで量子回路を生成する。
【0082】
図11は、量子回路生成に係る処理フローチャートを示す。回路生成部26は、
図12に示す処理フローチャートにしたがって、遺伝的アルゴリズムによる量子回路を生成する。
【0083】
はじめに、回路生成部26は、ランダムに親となる量子回路データを生成する(S501)。回路生成部26は、評価関数によって生成された遺伝子ツリーである量子回路データの適応度を評価する(S502)。回路生成部26は、高い適応度として評価された親となる量子回路データを選択する(S503)。回路生成部26は、一定の割合で遺伝子ツリーとして生成された量子回路データを任意に二つとりノードを部分的交換して量子回路データを生成する(S504)。回路生成部26は、一定の割合で遺伝子ツリーとして生成された量子回路データを任意に一つ取り、ノード一つをランダム選択したノードと置換して量子回路データを生成する(S505)。回路生成部26は、終了条件を満たさないと判定する場合(S506でNO)、S502に戻り処理を繰り返し実行する。回路生成部26は、終了条件を満たすと判定する場合(S506でYES)、処理を完了する。生成された量子回路データに基づいて、量子位相推定回路QC1が設計される。
【0084】
本実施形態における遺伝子アルゴリズムの制約条件を説明する。遺伝子ツリーは、多分木であって、親となる親ノードから分岐する子ノードにより構成される。ノードは、1量子ビットゲート、又は、n番目の量子ビットとする。ターミナルノードは、量子ビットとする。複数の量子ビットを扱う量子ビットゲートは、制御ユニタリゲートとする。制御ユニタリゲートを親ノードとする場合、子ノードは、複数の量子ビットとする。親ノードが量子ゲートである場合、当該量子ゲートは、子ノードの量子ビットを処理する。ターミナルノードを除くノードは、ユニタリゲートとする。ユニタリゲートは、本実施形態における量子位相推定演算可能なゲートである。制御ユニタリゲートは、複数の入力信号を扱うユニタリゲートを指すものである。
【0085】
本実施形態における評価関数は、以下の特徴を有する。評価関数は、Pauli Stringsの基底ベクトルに対して可能な量子状態の重ね合わせをインプットとして与えた場合、得られるべき測定結果と得られた測定結果との差異を評価し、0に近いほど、高い適合度の遺伝子ツリーであると評価する。差異を計算するものとしてL1ノルム、L2ノルムなどを採用可能であるが、特にL2ノルムが好適である。評価関数は、できるだけ短い回路へ遺伝子的アルゴリズムを収束させるためノード数が少ないほど、高い適合度の遺伝子ツリーであると評価する。評価関数は、できるだけ近くの量子ビット同士の相互作用を促す配置へ遺伝子的アルゴリズムを収束させるため、制御対象の量子ビットと、当該量子ビットを制御する量子ゲートと、の距離が近いほど、高い適合度の遺伝子ツリーであると評価する。評価関数は、複数の量子ビットを子ノードとして持つ場合、同一の量子ビットを子ノードとして持つ場合、低い適合度の遺伝子ツリーであると評価する。評価関数は、高コストであるTゲートが少ないほど、高い適合度の遺伝子ツリーであると評価する。
【0086】
本実施形態において、回路生成部26は、パウリ演算子のテンソル積ごとに遺伝的アルゴリズムを適用した量子回路データを生成することができる。回路生成部26は、テンソル積ごとに生成した量子回路データを統合することで、グラフラプラシアンをユニタリ行列に適用した量子エンコーディングに用いる量子回路とする。量子エンコーディング用の量子回路を一度に遺伝的アルゴリズムで生成しようとするとアルゴリズムが収束しない場合や生成に時間が掛かる等の問題が発生する。テンソル積の計算用回路を統合する手法とすることで、上述の問題点を解消することができる。
【0087】
回路生成部26は、上述した制約条件及び評価関数によって遺伝子ツリーによる量子回路データを生成する。回路生成部26は、制御ユニタリゲートを親ノードとして生成したとき、少なくとも2つ以上の入力信号となる量子ビットに関する子ノードを生成する。このとき、子ノードは、2つ以上生成される。これによって、本実施形態にかかる量子位相推定の演算に用いられる制御ユニタリゲートの配置を含む効率的な量子回路を生成することができる。
【符号の説明】
【0088】
1 情報処理システム
2 情報処理装置
21 文章取得部
22 変換部
221 ベクトル変換部
222 分析部
223 グラフ変換部
23 指示部
24 記憶処理部
25 照合部
26 回路生成部
3 量子コンピュータ
4 利用者端末
NB ナレッジベース
【要約】 (修正有)
【課題】量子コンピュータによる知識データベース照合を可能とする情報処理システム及び情報処理方法を提供する。
【解決手段】情報処理システムにおいて、情報処理装置は、文章取得部と、変換部と、指示部と、照合部と、を備える。文章取得部は、複数の文章を取得し、変換部は、前記文章の命題に基づき、命題間の論理関係を変換したグラフラプラシアンを取得する。指示部は、グラフラプラシアンをユニタリ行列に適用するための量子エンコーディング指示を量子コンピュータに対して出力する。照合部は、照合対象とする文章と、グラフデータ又はグラフラプラシアンを含む量子エンコーディング指示に必要な情報と、を照合し、照合結果である前記量子エンコーディングに必要な情報を用いて量子エンコーディング指示を出力する。
【選択図】
図1