(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5700369
(24)【登録日】2015年2月27日
(45)【発行日】2015年4月15日
(54)【発明の名称】擬似乱数生成装置、擬似乱数生成方法及びそのプログラム
(51)【国際特許分類】
G06F 7/58 20060101AFI20150326BHJP
【FI】
G06F7/58 A
【請求項の数】5
【全頁数】12
(21)【出願番号】特願2010-293811(P2010-293811)
(22)【出願日】2010年12月28日
(65)【公開番号】特開2012-141774(P2012-141774A)
(43)【公開日】2012年7月26日
【審査請求日】2013年10月9日
(73)【特許権者】
【識別番号】504165591
【氏名又は名称】国立大学法人岩手大学
(73)【特許権者】
【識別番号】000133526
【氏名又は名称】株式会社チノー
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】100143568
【弁理士】
【氏名又は名称】英 貢
(72)【発明者】
【氏名】伊藤 孝徳
(72)【発明者】
【氏名】伊藤 菊一
(72)【発明者】
【氏名】長田 洋
(72)【発明者】
【氏名】石橋 政三
【審査官】
緑川 隆
(56)【参考文献】
【文献】
特開2008−197847(JP,A)
【文献】
特許第3658623(JP,B2)
【文献】
特開2003−076272(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 7/58
(57)【特許請求の範囲】
【請求項1】
離散的配列データから擬似乱数を生成する擬似乱数生成装置であって、
複数要素の離散的配列データのうちの一部をライブラリ用配列データとし、前記離散的配列データのうちの前記ライブラリ用配列データとは異なる他の部分を乱数判定用データとして、前記ライブラリ用配列データ及び前記乱数判定用データにおけるそれぞれの要素に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成するデータ数列変換部と、
前記ライブラリ用配列データ数列を用いて、決定論的非線形予測に基づいて予測した予測データを生成する非線形時系列解析部と、
前記予測データと順次取り出した前記乱数判定用データ数列の比較を行い、非ランダムな状態が任意に設定した回数連続したとき、前記離散的配列データ全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定する乱数予測可能性判定部と、
前記擬似乱数列の候補を擬似乱数として順次外部に送出する乱数生成部と、
を備え、前記離散的配列データは、塩基配列データからなることを特徴とする、擬似乱数生成装置。
【請求項2】
ネットワークを通じてインターネット上に配備されるゲノム・データベースから、前記離散的配列データである塩基配列データをダウンロードする塩基配列データダウンロード要求部を更に備えることを特徴とする、請求項1に記載の擬似乱数生成装置。
【請求項3】
前記乱数予測可能性判定部は、前記予測データと前記乱数判定用データ数列の比較から、前記離散的配列データ全体に対してランダム性が失われたとして評価した場合、前記ゲノム・データベースから別の塩基配列データをダウンロードするよう前記塩基配列データダウンロード要求部に指示を与える手段を有し、
前記塩基配列データダウンロード要求部は、前記乱数予測可能性判定部からの指示に応じて、前記ゲノム・データベースから別の塩基配列データをダウンロードする手段を有することを特徴とする、請求項2に記載の擬似乱数生成装置。
【請求項4】
離散的配列データから擬似乱数を生成する擬似乱数生成方法であって、
複数要素の離散的配列データのうちの一部をライブラリ用配列データとし、前記離散的配列データのうちの前記ライブラリ用配列データとは異なる他の部分を乱数判定用データとして、前記ライブラリ用配列データ及び前記乱数判定用データにおけるそれぞれの要素に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成するステップと、
前記ライブラリ用配列データ数列を用いて、決定論的非線形予測に基づいて予測した予測データを生成するステップと、
前記予測データと前記乱数判定用データ数列の比較を行い、非ランダムな状態が任意に設定した回数連続したとき、前記離散的配列データ全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定するステップと、
前記擬似乱数列の候補を擬似乱数として順次外部に送出するステップと、
を含み、前記離散的配列データは、塩基配列データからなることを特徴とする、擬似乱数生成方法。
【請求項5】
離散的配列データから擬似乱数を生成する擬似乱数生成装置として構成するコンピュータに、
複数要素の離散的配列データのうちの一部をライブラリ用配列データとし、前記離散的配列データのうちの前記ライブラリ用配列データとは異なる他の部分を乱数判定用データとして、前記ライブラリ用配列データ及び前記乱数判定用データにおけるそれぞれの要素に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成するステップと、
前記ライブラリ用配列データ数列を用いて、決定論的非線形予測に基づいて予測した予測データを生成するステップと、
前記予測データと前記乱数判定用データ数列の比較を行い、非ランダムな状態が任意に設定した回数連続したとき、前記離散的配列データ全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定するステップと、
前記擬似乱数列の候補を擬似乱数として順次外部に送出するステップと、
を実行させ、前記離散的配列データは、塩基配列データからなることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、離散的配列データから強度設定可能な擬似乱数を生成する擬似乱数生成装置、擬似乱数生成方法及びそのプログラムに関する。
【背景技術】
【0002】
従来から、擬似乱数は様々な用途に用いられ、代表的には、暗号や認証などの利用が知られている。従来の擬似乱数生成技術は、例えば線形フィードバック則や、非線形フィードバック則を用いた決定論的予測方式とするものが多い。
【0003】
通常、必要とされる擬似乱数列のビット数が増加するにつれて、擬似乱数生成の構成要素の必要数も増大するという問題があり、結果として、生成される擬似乱数列が制限され、乱数性能(乱数強度)も制限されてしまうことが知られている。この問題を解決する技法として、S段からなる複数の擬似乱数生成回路が、それぞれNビット(Nは2以上の整数)の擬似乱数データを生成し、このS段の擬似乱数生成回路のそれぞれから擬似乱数データ(X1〜X4)を受け取り、受け取ったS個の擬似乱数データのうち任意の擬似乱数データの組み合わせを擬似乱数列として出力する技術が知られている(例えば、特許文献1参照)。
【0004】
また、生成された擬似乱数列について、決定論的非線形予測に基づいて予測データを生成し、当該擬似乱数系列のランダム性を評価する技法が知られている(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2010−2959号公報
【特許文献2】特許第3658623号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
現在、コンピュータ・プログラム等で用いられている乱数は疑似乱数と呼ばれるもので、ある程度の周期や分布の偏りを持つことが知られている。また、前述したように、擬似乱数の生成にあたって、必要とされる擬似乱数列のビット数が増加するにつれて、擬似乱数生成の構成要素の必要数も増大するという問題があり、結果として、生成される擬似乱数列が制限され、乱数性能(乱数強度)も制限されてしまう問題がある。さらに、擬似乱数の乱数列の評価方法は多く存在しており、いずれが最も優れているかを決定するのは困難であり、どの方法にも一長一短がある状況ではあるが、生成される擬似乱数列が制限されることなく、乱数性能(乱数強度)も制限されることなく、乱数系列を評価しながら擬似乱数を生成する技法が望まれている。
【0007】
そこで、本発明は、上述の問題を鑑みて為されたものであり、離散的配列データから強度設定可能な擬似乱数を生成する擬似乱数生成装置、擬似乱数生成方法及びそのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明では、予め用意された離散的配列データを用いて、生成される擬似乱数列が制限されることなく、乱数性能(乱数強度)も制限されることなく、乱数系列を評価しながら擬似乱数を生成する。特に、この離散的配列データとして、核酸塩基であるDNA(cDNA、 cpDNA、gDNA、msDNA、mtDNAを含み、以下DNAという。)又はRNA(mRNA (pre-mRNA/hnRNA)、 tRNA、rRNA、aRNA、gRNA、miRNA、ncRNA、piRNA、shRNA、siRNA、stRNA、snRNA、snoRNA、 stRNA、ta-siRNA、tmRNAを含み、以下RNAという。)の塩基配列データ(以下、「塩基配列データ」という。)が優れた擬似乱数列を生成することができる。例えば、インターネット上の塩基配列データバンク(例:DDBJ: DNA Data Bank of Japan)のデータベースに蓄積されている塩基配列のような自然に存在する配列を利用することで、周期性や分布の偏りといった問題を解決しつつ、これら塩基配列から任意の強さの数値配列を抽出することにより、擬似乱数列を生成する。
【0009】
即ち、本発明の擬似乱数生成装置は、離散的配列データから擬似乱数を生成する擬似乱数生成装置であって、複数要素の離散的配列データのうちの一部をライブラリ用配列データとし、前記離散的配列データのうちの前記ライブラリ用配列データとは異なる他の部分を乱数判定用データとして、前記ライブラリ用配列データ及び前記乱数判定用データにおけるそれぞれの要素に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成するデータ数列変換部と、前記ライブラリ用配列データ数列を用いて、決定論的非線形予測に基づいて予測した予測データを生成する非線形時系列解析部と、前記予測データと順次取り出した前記乱数判定用データ数列の比較を行い、非ランダムな状態が
任意に設定した回数連続したとき、前記離散的配列データ全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定する乱数予測可能性判定部と、前記擬似乱数列の候補を擬似乱数として順次外部に送出する乱数生成部と、を備え
、前記離散的配列データは、塩基配列データからなることを特徴とする。
【0011】
また、本発明の擬似乱数生成装置において、ネットワークを通じてインターネット上に配備されるゲノム・データベースから、前記離散的配列データである塩基配列データをダウンロードする塩基配列データダウンロード要求部を更に備えることを特徴とする。
【0012】
また、本発明の擬似乱数生成装置において、前記乱数予測可能性判定部は、前記予測データと前記乱数判定用データ数列の比較から、前記離散的配列データ全体に対してランダム性が失われたとして評価した場合、前記ゲノム・データベースから別の塩基配列データをダウンロードするよう前記塩基配列データダウンロード要求部に指示を与える手段を有し、前記塩基配列データダウンロード要求部は、前記乱数予測可能性判定部からの指示に応じて、前記ゲノム・データベースから別の塩基配列データをダウンロードする手段を有することを特徴とする。
【0013】
さらに、本発明の擬似乱数生成方法は、離散的配列データから擬似乱数を生成する擬似乱数生成方法であって、複数要素の離散的配列データのうちの一部をライブラリ用配列データとし、前記離散的配列データのうちの前記ライブラリ用配列データとは異なる他の部分を乱数判定用データとして、前記ライブラリ用配列データ及び前記乱数判定用データにおけるそれぞれの要素に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成するステップと、前記ライブラリ用配列データ数列を用いて、決定論的非線形予測に基づいて予測した予測データを生成するステップと、前記予測データと前記乱数判定用データ数列の比較を行い、非ランダムな状態が
任意に設定した回数連続したとき、前記離散的配列データ全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定するステップと、前記擬似乱数列の候補を擬似乱数として順次外部に送出するステップと、を含
み、前記離散的配列データは、塩基配列データからなることを特徴とする。
【0014】
また、本発明のプログラムは、離散的配列データから擬似乱数を生成する擬似乱数生成装置として構成するコンピュータに、複数要素の離散的配列データのうちの一部をライブラリ用配列データとし、前記離散的配列データのうちの前記ライブラリ用配列データとは異なる他の部分を乱数判定用データとして、前記ライブラリ用配列データ及び前記乱数判定用データにおけるそれぞれの要素に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成するステップと、前記ライブラリ用配列データ数列を用いて、決定論的非線形予測に基づいて予測した予測データを生成するステップと、前記予測データと前記乱数判定用データ数列の比較を行い、非ランダムな状態が
任意に設定した回数連続したとき、前記離散的配列データ全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定するステップと、前記擬似乱数列の候補を擬似乱数として順次外部に送出するステップと、を実行させ
、前記離散的配列データは、塩基配列データからなることを特徴とするプログラムである。
【発明の効果】
【0015】
本発明によれば、これら塩基配列から任意の強さの数値配列を抽出することにより、擬似乱数列を生成するため、生成される擬似乱数列が制限されることなく、乱数性能(乱数強度)も制限されることなく、周期性や分布の偏りといった問題を解決しつつ、擬似乱数列を生成することができるようになる。
【図面の簡単な説明】
【0016】
【
図1】本発明による一実施例の擬似乱数生成装置を用いて擬似乱数を生成するシステム例を示す図である。
【
図2】本発明による一実施例の擬似乱数生成装置のブロック図である。
【
図3】本発明による一実施例の擬似乱数生成装置の動作フロー図である。
【
図4】本発明による一実施例の擬似乱数生成装置で用いる塩基配列データの一例を示す図である。
【
図5】本発明による一実施例の擬似乱数生成装置で生成した擬似乱数列の一例を示す図である。
【
図6】本発明による一実施例の擬似乱数生成装置で生成した擬似乱数列の自己相関関数を示す図である。
【
図7】本発明による一実施例の擬似乱数生成装置で生成した擬似乱数列のヒストグラムを示す図である。
【
図8】本発明による一実施例の擬似乱数生成装置で生成した擬似乱数列のヒストグラムの分析例を示す図である。
【発明を実施するための形態】
【0017】
以下、本発明による一実施例の擬似乱数生成装置及びその方法を説明する。
【0018】
〔システム構成〕
図1は、本発明による一実施例の擬似乱数生成装置を用いて擬似乱数を生成するシステム例を示す図である。本実施例の擬似乱数生成装置10は、パーソナルコンピュータを用いて実現することができる(詳細は後述する)。擬似乱数生成装置10は、インターネット上に配備されるゲノム・データベース20から、既に蓄積されている塩基配列データのような自然に存在する離散的な配列データDをダウンロードしておき、この配列データDを数列に変換して、例えば特許文献2に開示されるような、非線形時系列解析プログラム(決定論的非線形予測手法)を用いて常時又は定期的にランダム性の検定を行うことによって、ランダム性を有する部分を判定又は抽出する。このランダム性の判定に関して、ダウンロードして得られた実際の配列データDのうちの一部の配列データをライブラリデータ(以下、「ライブラリ用配列データ」と称する)とし、このライブラリ用配列データの数列を用いて決定論的非線形予測手法により予測データを生成し、実際の配列データDのうちの他の部分で乱数判定用に順次取り出した配列データ(以下、「乱数判定用データ」と称する)の数列を比較する。
【0019】
また、擬似乱数生成装置10は、決定論的非線形予測手法により予測した予測データと、実際の配列データから順次取り出した乱数判定用データ数列の比較結果から、非ランダムな状態がM回連続したとき、ダウンロードした配列データD全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補とする。
【0020】
擬似乱数生成装置10は、予測データと乱数判定用データ数列の比較から、ダウンロードした配列データD全体に対してランダム性が失われたとして評価した場合、新たにインターネット上のゲノム・データベース20から別の塩基配列データ(配列データD)をダウンロードし、再びランダム性の評価及び乱数判定用データの抽出を行う。これにより、例えば常時、擬似乱数列を送出することが要求される用途においても、擬似乱数列を維持し続けることができる。尚、擬似乱数生成装置10は、1つ以上ダウンロードした配列データDについて、既に評価を行なったか否かを管理しており、一旦、ランダム性が失われたとして評価した配列データDについて、基本的には擬似乱数の生成には使用しない(ただし、例えば数10年以上など、予め期間を定めることもできる)。
【0021】
以下、より具体的に、本発明による一実施例の擬似乱数生成装置の構成と、その動作について説明する。
【0022】
〔装置構成〕
図2は、本発明による一実施例の擬似乱数生成装置のブロック図である。擬似乱数生成装置10は、制御部100と、記憶部200とを備える。制御部100は、塩基配列データダウンロード要求部101と、塩基配列データ数列変換部102と、非線形時系列解析部103と、乱数予測可能性判定部104と、乱数生成部105とを備える。尚、本発明に係る制御部100の各機能を説明するが、擬似乱数生成装置10が備える他の機能を排除することを意図したものではないことに留意する。擬似乱数生成装置10は、コンピュータとして構成することができ、制御部100の各機能を実現する処理内容を記述したプログラム及びこれらのデータ(塩基配列データ等)を、当該コンピュータの記憶部200における所定の領域に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで、擬似乱数生成装置10の各機能を実現することができる。
【0023】
塩基配列データダウンロード要求部101は、乱数生成の開始として、ネットワークを通じてインターネット上に配備されるゲノム・データベース20から、既に蓄積されている塩基配列データのような自然に存在する離散的な配列データDをダウンロードする機能を有する。また、塩基配列データダウンロード要求部101は、乱数予測可能性判定部104による予測データと乱数判定用データの比較から、ダウンロードした配列データD全体に対してランダム性が失われたとして評価された場合、新たにインターネット上のゲノム・データベース20から別の塩基配列データをダウンロードする機能を有する。
【0024】
塩基配列データ数列変換部102は、ダウンロードして得られた実際の配列データDのうちの一部の配列データ(例えば、先頭の配列)をライブラリ用配列データとして設定し、このライブラリ用配列データと、実際の配列データDのうちの他の部分(例えば、先頭以外の配列)で乱数判定用に順次取り出す配列データを乱数判定用データとして設定し、ライブラリ用配列データ及び乱数判定用データにおけるそれぞれの塩基に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成する機能を有する。
【0025】
非線形時系列解析部103は、数値列に変換されたライブラリ用配列データ数列を用いて、例えば特許文献2に開示されるような、非線形時系列解析プログラム(決定論的非線形予測手法)を用いて予測した予測データを生成する機能を有する。
【0026】
乱数予測可能性判定部104は、非線形時系列解析部103によって生成された予測データと順次取り出した乱数判定用データ数列の比較を行い、非ランダムな状態がM回連続したとき、ダウンロードした配列データD全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データ数列を擬似乱数列の候補として設定する機能を有する。また、乱数予測可能性判定部104は、予測データと乱数判定用データの比較から、ダウンロードした配列データD全体に対してランダム性が失われたとして評価した場合、新たにインターネット上のゲノム・データベース20から別の塩基配列データをダウンロードするよう塩基配列データダウンロード要求部101に指示を与える機能を有する。
【0027】
乱数生成部105は、乱数予測可能性判定部104によって設定される擬似乱数列の候補を擬似乱数として順次外部に送出する機能を有する。
【0028】
〔装置動作〕
図3は、本発明による一実施例の擬似乱数生成装置の動作フロー図である。先ず、塩基配列データダウンロード要求部101は、ネットワークを通じてインターネット上に配備されるゲノム・データベース20から、既に蓄積されている塩基配列データの離散的な配列データDをダウンロードする(ステップS1)。ダウンロードされる塩基配列データの離散的な配列データDの例は、
図4に示される。
【0029】
次に、塩基配列データ数列変換部102は、ダウンロードして得られた実際の配列データDのうちの一部の配列データ(例えば、先頭の配列)をライブラリ用配列データとして設定し、このライブラリ用配列データと、実際の配列データDのうちの他の部分(例えば、先頭以外の配列)の配列データを乱数判定用データとして設定し、ライブラリ用配列データ及び乱数判定用データにおけるそれぞれの塩基に対して、所定ビットの数列を割り当てることにより数値列に変換し、ライブラリ用配列データ数列及び乱数判定用データ数列を生成する(ステップS2,S3)。尚、ダウンロードして得られた実際の配列データDの全部を所定ビットの数列を割り当てることにより数値列に変換した後、ライブラリ用配列データと乱数判定用データを決定して設定するように構成してもよいことは勿論である。
【0030】
例えば、配列データDの最初の1000点を、予測データを実行するためのライブラリデータとして設定することができる。また、例えば、A=0b00、G=0b01、T=0b10,C=0b11として設定し、配列データDから5つの要素を取り出し、10ビット整数値を作ることができる。抽出するアルゴリズムをユーザが別途指定することで、同一の塩基配列データでもユーザ固有の乱数を作成することができる。
【0031】
次に、非線形時系列解析部103は、数値列に変換されたライブラリ用配列データを用いて、決定論的非線形予測手法により予測した予測データを生成する(ステップS4)。
【0032】
次に、乱数予測可能性判定部104は、非線形時系列解析部103によって生成された予測データと順次取り出した乱数判定用データ数列の比較を行い、非ランダムな状態がM回連続したとき、ダウンロードした配列データD全体に対してランダム性が失われたとして評価し、それ以外は、当該乱数判定用データを擬似乱数列の候補として設定する(ステップS5)。尚、乱数予測可能性判定部104は、予測データと乱数判定用データ数列の比較から、ダウンロードした配列データD全体に対してランダム性が失われたとして評価した場合、新たにインターネット上のゲノム・データベース20から別の塩基配列データをダウンロードするよう塩基配列データダウンロード要求部101に指示を与え、この指示に応じて、塩基配列データダウンロード要求部101は、新たにインターネット上のゲノム・データベース20から別の塩基配列データをダウンロードし、上記ステップS1からの処理を繰り返すことができる(ステップS6)。
【0033】
乱数生成部105は、乱数予測可能性判定部104によって設定される擬似乱数列の候補を擬似乱数として順次外部に送出する(ステップS7)。
【0034】
非ランダムな状態がM回連続したか否かに用いるパラメータM(≧1)は、擬似乱数生成装置10を利用するユーザが任意に決定することのできるパラメータである。このMの値によって、得られるランダム配列の強さを決定することができる。つまり、Mの値が小さいほど強いランダム性を有し、Mの値が大きくなるにつれて得られるデータのランダム性は弱くなることから、本願明細書中、このパラメータMを「乱数の強度」と呼ぶことにする。このように、擬似乱数生成装置10は、インターネット上のゲノム・データベース20を利用し、周期性や分布の偏りなどのランダム性の強さをパラメータMで任意に設定できる擬似乱数列を提供することができる。
【0035】
以上のように、擬似乱数生成装置10は、自然にある配列を利用し非線形時系列解析プログラム(決定論的非線形予測手法)を用いて常時又は定期的にランダム性を評価しつつ乱数列を生成することができるため、ランダム性に対する信頼性が高い擬似乱数列を生成することができる。また、Mという1つのパラメータで、乱数の強度を変えて、ユーザの望む乱数列を得ることができる。
【0036】
尚、塩基配列のような自然に存在する離散的な配列のランダム性を利用することで乱数列を得る点に関して、そのような配列の収集・ダウンロードの代わりに、予め記憶部200に多数の配列データを格納しておき、この記憶部200から順に取り出すようにすることもできる。また、塩基配列データから乱数を作り出すアルゴリズムに関して、汎用性のためユーザの独自の方法をインプリメントすることができるだけでなく、一意的に決定しておくこともできることは勿論である。さらに、塩基配列以外のデータに関しても適用範囲を拡げられる可能性もある。
【0037】
尚、擬似乱数生成装置10によって生成される擬似乱数列がランダム性を有しているか否かについて、別の検証方法で検証したので説明する。
図5は、本発明による一実施例の擬似乱数生成装置で生成した擬似乱数列の一例を示す図であり、配列データD(80万点以上の塩基を持つ)の最初の1000点を、予測データを実行するためのライブラリデータとして設定することができる。また、例えば、アデニン:A=0b00、グアニン:G=0b01、チミン:T(又はウラシル:U)=0b10,シトシン:C=0b11として設定し、配列データDから5つの要素を取り出し、10ビット整数値を乱数として作成した例である(尚、横軸はデータ点数153点を、縦軸は、10ビット整数値の最大値が1.0となるように正規化して表している)。
【0038】
この
図5に示す擬似乱数列の自己相関関数を算出した結果を
図6に示す。
図6の結果から、相関係数R
2値=0.0121が得られ、相関がほとんどないことが分かる。また、
図7には、この
図5に示す擬似乱数列のヒストグラムを示し、
図8には、そのヒストグラムの分析結果を示している。カイ2乗検定を行なった結果、有位水準95%の棄却域[16.91898,∞]に入らないので(つまり、12.42484<16.91898であるので)、有意な差があるといえずランダム性があるといえる。
【0039】
このように、擬似乱数生成装置10によって生成される擬似乱数列が極めて高いランダム性を有する擬似乱数であることが客観的にも検証することができた。
【0040】
上述の実施例では、1つの配列データDから1つの擬似乱数列を得る例を説明したが、複数の乱数列が必要な場合は、上記非線形時系列解析を再び行うことで得ることができる。
【産業上の利用可能性】
【0041】
本発明によれば、これら塩基配列データから任意の強さの数値配列を抽出することにより、擬似乱数列を生成するため、生成される擬似乱数列が制限されることなく、乱数性能(乱数強度)も制限されることなく、周期性や分布の偏りといった問題を解決しつつ、擬似乱数列を生成することができるようになるから、任意長の乱数列を逐次要求する用途に有用である。
【符号の説明】
【0042】
10 擬似乱数生成装置
20 ゲノム・データベース
100 制御部
101 塩基配列データダウンロード要求部
102 塩基配列データ数列変換部
103 非線形時系列解析部
104 乱数予測可能性判定部
105 乱数生成部
200 記憶部