特許7468650 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7468650情報処理装置、情報処理方法、及び、プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-04-08

(45)【発行日】2024-04-16

(54)【発明の名称】情報処理装置、情報処理方法、及び、プログラム

(51)【国際特許分類】

G06F 16/90 20190101AFI20240409BHJP

G06F 17/16 20060101ALI20240409BHJP

G06N 20/00 20190101ALI20240409BHJP

【ＦＩ】

G06F16/90

G06F17/16 G

G06N20/00 130

【請求項の数】 9

(21)【出願番号】P 2022532182

(86)(22)【出願日】2020-06-25

(86)【国際出願番号】 JP2020025048

(87)【国際公開番号】W WO2021260888

(87)【国際公開日】2021-12-30

【審査請求日】2022-11-30

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100107331

【弁理士】

【氏名又は名称】中村聡延

(74)【代理人】

【識別番号】100104765

【弁理士】

【氏名又は名称】江上達夫

(74)【代理人】

【識別番号】100131015

【弁理士】

【氏名又は名称】三輪浩誉

(72)【発明者】

【氏名】大道修

【審査官】原秀人

(56)【参考文献】

【文献】特開２０１７－２２４０７０（ＪＰ，Ａ）

【文献】特表２０１５－５１３７４９（ＪＰ，Ａ）

【文献】特表２０１８－５２０４４３（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１３／０１８５２３９（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｆ１７／１６

Ｇ０６Ｆ９／３８

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

決定木に含まれる全ての条件判定ノードが実行する命令を統一命令に変換する命令統一手段と、
複数の入力データを取得する取得手段と、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する条件判定手段と、
を備え、
前記命令統一手段は、前記全ての条件判定ノードが実行する命令の各々を、各条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令に変換し、前記第１の閾値及び前記第２の閾値を決定することで、前記統一命令に変換する情報処理装置。

【請求項2】

前記命令統一手段は、各条件判定ノードが実行する命令に基づいて、前記第１の閾値及び前記第２の閾値を決定する請求項１に記載の情報処理装置。

【請求項3】

前記命令統一手段は、前記判定対象値が所定値より小さいかを判定する命令を、前記判定対象値が、マイナス無限大以上であり、かつ、前記所定値より小さい隣接値以下であるかを判定する命令に変換する請求項１又は２に記載の情報処理装置。

【請求項4】

前記命令統一手段は、前記判定対象値が所定値より大きいかを判定する命令を、前記判定対象値が、前記所定値より大きい隣接値以上であり、かつ、プラス無限大以下であるかを判定する命令に変換する請求項３に記載の情報処理装置。

【請求項5】

前記命令統一手段は、前記判定対象値が所定値と一致するかを判定する命令を、判定対象値が、前記所定値以下であり、かつ、前記所定値以上であるかを判定する命令に変換する請求項１乃至４のいずれか一項に記載の情報処理装置。

【請求項6】

前記命令統一手段は、前記判定対象値が所定値以下であるかを判定する命令を、前記判定対象値が、マイナス無限大以上であり、かつ、前記所定値以下であるかを判定する命令に変換する請求項１乃至５のいずれか一項に記載の情報処理装置。

【請求項7】

前記命令統一手段は、前記判定対象値が所定値以上であるかを判定する命令を、前記判定対象値が、前記所定値以上であり、かつ、プラス無限大以下であるかを判定する命令に変換する請求項６に記載の情報処理装置。

【請求項8】

コンピュータにより実行される情報処理方法であって、
決定木に含まれる全ての条件判定ノードが実行する命令を統一命令に変換する変換処理を行い、
複数の入力データを取得し、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力し、
前記変換処理は、前記全ての条件判定ノードが実行する命令の各々を、各条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令に変換し、前記第１の閾値及び前記第２の閾値を決定することで、前記統一命令に変換する情報処理方法。

【請求項9】

決定木に含まれる全ての条件判定ノードが実行する命令を統一命令に変換する変換処理を行い、
複数の入力データを取得し、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する処理をコンピュータに実行させ、
前記変換処理は、前記全ての条件判定ノードが実行する命令の各々を、各条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令に変換し、前記第１の閾値及び前記第２の閾値を決定することで、前記統一命令に変換するプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、決定木を用いた推論処理に関する。

【背景技術】

【0002】

近年、大量のデータを高速に処理することが求められている。データ処理を高速化する手法の一つに、処理の並列化がある。例えば、複数のデータを独立して操作できる繰り返し処理は、展開して並列処理することが可能である。並列処理の方式として、ＳＩＭＤ（ＳｉｎｇｌｅＩｎｔｒｕｃｔｉｏｎＭｕｌｔｉｐｌｅＤａｔａ）方式が知られている。ＳＩＭＤは、一つの命令を複数のデータに対して一斉に実行することで処理を高速化する並列処理の方式である。ＳＩＭＤ方式のプロセッサとしては、ベクトルプロセッサ、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などが挙げられる。

【0003】

特許文献１は、決定木を用いた推論に並列処理を適用した手法を記載している。特許文献１では、決定木の各ノードの識別情報や条件判定結果を２進数で表現し、各階層の条件判定をまとめて処理できるようにしている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１３－１１７８６２号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかし、特許文献１の手法では、全データを用いて全ての条件判定ノードの処理を実行してしまうため、処理の効率が良くない。

【0006】

本発明の１つの目的は、決定木を用いた推論処理を並列処理により高速化することにある。

【課題を解決するための手段】

【0007】

本発明の一つの観点は、情報処理装置であって、
決定木に含まれる全ての条件判定ノードが実行する命令を統一命令に変換する命令統一手段と、
複数の入力データを取得する取得手段と、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する条件判定手段と、
を備え、
前記命令統一手段は、前記全ての条件判定ノードが実行する命令の各々を、各条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令に変換し、前記第１の閾値及び前記第２の閾値を決定することで、前記統一命令に変換する。

【0008】

本発明の他の観点は、コンピュータにより実行される情報処理方法であって、
決定木に含まれる全ての条件判定ノードが実行する命令を統一命令に変換する変換処理を行い、
複数の入力データを取得し、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力し、
前記変換処理は、前記全ての条件判定ノードが実行する命令の各々を、各条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令に変換し、前記第１の閾値及び前記第２の閾値を決定することで、前記統一命令に変換する。

【0009】

本発明のさらに他の観点は、プログラムであって、
決定木に含まれる全ての条件判定ノードが実行する命令を統一命令に変換する変換処理を行い、
複数の入力データを取得し、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する処理をコンピュータに実行させ、
前記変換処理は、前記全ての条件判定ノードが実行する命令の各々を、各条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令に変換し、前記第１の閾値及び前記第２の閾値を決定することで、前記統一命令に変換する。

【発明の効果】

【0010】

本発明によれば、決定木を用いた推論処理を並列処理により高速化することができる。

【図面の簡単な説明】

【0011】

【図1】第１実施形態に係る情報処理装置の構成を示すブロック図である。

【図2】決定木推論の一例を示す。

【図3】条件判定ノードの比較命令を統一する方法を示す。

【図4】決定木モデルの一例を示す。

【図5】決定木モデルの第１層で行われる並列処理を示す。

【図6】決定木モデルの第２層で行われる並列処理を示す。

【図7】決定木モデルの第３層で行われる並列処理を示す。

【図8】決定木モデルの第４層の状態を示す。

【図9】情報処理装置のハードウェア構成を示すブロック図である。

【図10】情報処理装置の機能構成を示すブロック図である。

【図11】並列処理部により実行される条件判定処理のフローチャートである。

【図12】第２実施形態に係る情報処理装置の機能構成を示すブロック図である。

【発明を実施するための形態】

【0012】

以下、図面を参照して、本発明の好適な実施形態について説明する。
［第１実施形態］
（基本構成）
図１は、本発明の第１実施形態に係る情報処理装置の構成を示す。情報処理装置１００は、決定木モデルを用いた推論（以下、「決定木推論」と呼ぶ。）を行う。具体的に、情報処理装置１００は、入力データを用いて決定木推論を行い、推論結果として入力データに対する予測値を出力する。ここで、情報処理装置１００は、決定木推論の処理のうちの一部を並列処理により実行し、処理を高速化する。なお、並列処理することを「ベクトル化」とも呼ぶ。

【0013】

（原理説明）
図２は、決定木推論の一例を示す。この例は、債権回収の予測問題であり、多数の債権者の属性情報を入力データとし、決定木モデルを用いて債権回収の可否を推論する。図示のように、入力データは、各債権者の特徴量として、「年収（特徴量１）」、「年齢（特徴量２）」、「定職（特徴量３）」を含む。決定木モデルは、これらの入力データを用いて、各債権者の債権回収の可否を予測する。

【0014】

図２の決定木モデルは、ノードＮ１～Ｎ７により構成される。ノードＮ１は根ノードであり、ノードＮ２、Ｎ４、Ｎ６、Ｎ７は葉ノードである。また、ノードＮ１、Ｎ３、Ｎ５は条件判定ノードである。

【0015】

まず、根ノードＮ１では、債権者が定職を有するか否かが判定される。債権者が定職を有しない場合、処理は葉ノードＮ２に進み、債権回収は否（ＮＯ）と予測される。一方、債権者が定職を有する場合、処理は条件判定ノードＮ３に進み、債権者の年収が４８０万円以上であるか否かが判定される。債権者の年収が４８０万円以上である場合、処理は葉ノードＮ４に進み、債権回収は可（ＹＥＳ）と予測される。債権者の年収が４８０万円未満である場合、処理は条件判定ノードＮ５へ進み、債権者の年齢が５１歳以上であるか否かが判定される。債権者の年齢が５１歳以上である場合、処理は葉ノードＮ６へ進み、債権回収は可（ＹＥＳ）と予測される。一方、債権者の年齢が５１歳未満である場合、処理は葉ノードＮ７へ進み、債権回収は否（ＮＯ）と予測される。こうして、各債権者の債権回収の可否が予測値として出力される。

【0016】

さて、決定木推論に並列処理を適用する場合、どの部分を並列処理するかが問題となる。入力データのデータ行を並列に処理する方法が考えられるが、各データ行が異なる子ノードに下りていくことがあるため、条件判定ノードにおける比較命令が揃わず、そのままでは並列処理ができない。そこで、本実施形態では、各条件判定ノードで実行される比較命令を強制的に統一する。具体的には、各条件判定ノード毎に異なる比較命令を、１つの比較命令に変換する。この際、比較命令の変換に伴い、比較命令が規定する閾値を変更する。これにより、決定木に含まれる全ての条件判定ノードの比較命令を同一の命令に統一することができ、並列処理が可能となる。

【0017】

図３は、条件判定ノードの比較命令を統一する方法を示す。決定木の条件判定ノードで行われる比較命令としては、基本的に一致判定と大小判定があり、図３に示すように、５つの比較命令に分類される。
（１）一致判定（value＝＝category）
判定の対象となる値（以下、「判定対象値」と呼ぶ。）「value」がカテゴリ値「category」と一致するか否かの判定
（２）大小判定（value＜threshold）
判定対象値「value」が閾値「threshold」より小さいか否かの判定
（３）大小判定（value≦threshold）
判定対象値「value」が閾値「threshold」以下かの判定
（４）大小判定（threshold＜value）
判定対象値「value」が閾値「threshold」より大きいかの判定
（５）大小判定（threshold≦value）
判定対象値「value」が閾値「threshold」以上かの判定

【0018】

本実施形態では、情報処理装置１００は、上記の５つの比較命令を、以下の形式の１つの比較命令（以下、「統一命令」とも呼ぶ。）に変換する。
Ｘ≦value≦Ｙ（Ｘ，Ｙは閾値）
なお、上記の「Ｘ」は第１の閾値に相当し、「Ｙ」は第２の閾値に相当する。

【0019】

具体的に、図３に示すように、５つの比較命令は以下のように変換できる。
（１）一致判定（value＝＝category）
同一のカテゴリ値「category」を用いて、「category≦value≦category」に変換できる。
（２）大小判定（value＜threshold）
閾値「マイナス無限大（－∞）」と閾値「threshold」を用いて、「－∞≦value≦prev（threshold）」に変換できる。
（３）大小判定（value≦threshold）
閾値「マイナス無限大（－∞）」と閾値「threshold」を用いて、「－∞≦value≦threshold」に変換できる。
（４）大小判定（threshold＜value）
閾値「next（threshold)」と閾値「無限大（∞）」を用いて、「next（threshold）≦value≦∞」に変換できる。
（５）大小判定（threshold≦value）
閾値「threshold」と閾値「無限大（∞）」を用いて、「threshold≦value≦∞」に変換できる。

【0020】

なお、関数prev()、next()は、直感的には、εを適当な微小正数とした場合、それぞれprev()＝ｘ－ε、next()＝ｘ＋εで表される。比較命令で用いる閾値は実数型であるが、有限精度の表現である以上、ある値ａに対して「ａとｂの間には表現可能な値がない」ような値ｂが存在する。prev(threshold)の値は、thresholdより小さく、かつ、thresholdとの間に表現可能な値がない値である。また、next(threshold)の値は、thresholdより大きく、かつ、thresholdとの間に表現可能な値がない値である。言い換えると、prev(threshold)の値は、所定の分解能（例えば、３２ビット、６４ビットなど）の離散値のうち、thresholdより小さく、かつ、thresholdに隣接する値（以下、「隣接値」とも呼ぶ。）である。同様に、next(threshold)の値は、所定の分解能の離散値のうち、thresholdより大きく、かつ、thresholdに隣接する値である。なお、実際には、prev(threshold)やnext(threshold)の値は、例えばＣ言語の標準ライブラリにおける「nextafter（）」という関数を用いて求めることができる。

【0021】

このように、決定木の条件判定ノードで用いられる各比較命令を同一の比較命令に統一することにより、決定木において各データ行が異なる子ノードに下りていく場合でも、全ての条件判定ノードの比較命令を並列処理することが可能となる。

【0022】

（具体例）
次に、条件判定ノードが実行する比較命令を統一して並列処理する具体例を説明する。図４は、決定木モデルの一例を示す。この例では、決定木モデルはノード１～１１、１４～１５を有し、ノード１～５、７は条件判定ノードであり、ノード６、８～１１、１４～１５は葉ノードである。各条件判定ノードには、前述の一致判定又は４つの大小判定のいずれかが設定されている。各条件判定ノードにおいて、判定結果が「true」である場合、処理は図中左側の子ノードに進み、判定結果が「false」である場合、処理は図中右側の子ノードに進む。また、推論対象のデータとしては、それぞれが特徴量Ａ～Ｃを有する８つのデータ（データ番号１～８）が用意されている。

【0023】

図５は、決定木モデルの第１層で行われる並列処理を示す。第１層では、現在地（現在地ノード）１において、特徴量Ａを用いて［Ａ］＜５の比較命令が実行される。なお、図４～図８における［Ａ］、［Ｂ］、［Ｃ］の表記は、それぞれ特徴量Ａ、特徴量Ｂ、特徴量Ｃを示すものとする。この場合、情報処理装置１００は、ノード１の比較命令［Ａ］＜５を、図３を参照して説明した統一命令「Ｘ≦value≦Ｙ」の形式に変換する。具体的に、情報処理装置１００は、ノード１における比較命令［Ａ］＜５を、統一命令「－∞≦［Ａ］≦４．９９９・・」に変換する。図５における「現在の状態」の欄に、統一命令を用いて行われる比較演算を示す。そして、情報処理装置１００は、各データ１～８について、統一命令「－∞≦［Ａ］≦４．９９９・・」を演算し、判定結果「true」又は「false」を出力する。こうして決定木モデルの第１層の推論処理が終了し、処理は第２層に移行する。

【0024】

図６は、決定木モデルの第２層で行われる並列処理を示す。第２層では、ノード２に進んだデータについては、特徴量Ｂを用いて［Ｂ］＝＝１の比較命令が実行される。また、ノード３に進んだデータについては、特徴量Ｃを用いて［Ｃ］＜０．５の比較命令が実行される。この場合、情報処理装置１００は、ノード２の比較命令［Ｂ］＝＝１を、統一命令「１≦［Ｂ］≦１」に変換する。また、情報処理装置１００は、ノード３の比較命令［Ｃ］＜０．５を、統一命令「－∞≦［Ｃ］≦０．４９９・・」に変換する。そして、情報処理装置１００は、データ１、２、４、６について統一命令「１≦［Ｂ］≦１」を演算し、データ３、５、７、８について、統一命令「－∞≦［Ｃ］≦０．４９９・・」を演算して判定結果を出力する。こうして決定木モデルの第２層の推論処理が終了し、処理は第３層に移行する。

【0025】

図７は、決定木モデルの第３層で行われる並列処理を示す。第３層では、ノード４に進んだデータについては、特徴量Ａを用いて［Ａ］＜１の比較命令が実行される。ノード５に進んだデータについては、特徴量Ｃを用いて［Ｃ］＜０．５の比較命令が実行される。ノード６は葉ノードであるので、ノード６について処理は行われない。ノード７に進んだデータについては、特徴量Ｂを用いて［Ｂ］＝＝１の比較命令が実行される。この場合、情報処理装置１００は、ノード４の比較命令［Ａ］＜１を統一命令「－∞≦［Ａ］≦０．９９９・・」に変換し、ノード５の比較命令［Ｃ］＜０．５を統一命令「－∞≦［Ｃ］≦０．４９９・・」に変換し、ノード７の比較命令［Ｂ］＝＝１を統一命令「１≦［Ｂ］≦１」に変換する。そして、情報処理装置１００は、データ１、４について統一命令「－∞≦［Ａ］≦０．９９９・・」を演算し、データ２、６について統一命令「－∞≦［Ｃ］≦０．４９９・・」を演算し、データ７、８について統一命令「１≦［Ｂ］≦１」を演算して判定結果を出力する。こうして決定木モデルの第３層の推論処理が終了し、処理は第４層に移行する。

【0026】

図８は、決定木モデルの第４層の状態を示す。第４層では、ノード８～１１、１４～１５の全てが葉ノードであるので、全データ１～８が葉ノードに到達したことになる。よって、推論処理は終了する。「現在の状態」では全データ１～８が葉ノードに到達したことが示されている。

【0027】

以上のように、本実施形態の情報処理装置１００によれば、決定木の各条件判定ノードに設定された異なる比較命令を、閾値を調整することにより統一命令に変換するので、各データに対する条件判定ノードが異なっていても、全てのデータについて並列処理が可能となる。

【0028】

（ハードウェア構成）
図９は、情報処理装置１００のハードウェア構成を示すブロック図である。図示のように、情報処理装置１００は、入力ＩＦ（ＩｎｔｅｒＦａｃｅ）１１と、プロセッサ１２と、メモリ１３と、記録媒体１４と、データベース（ＤＢ）１５と、を備える。

【0029】

入力ＩＦ１１は、データの入出力を行う。具体的に、入力ＩＦ１１は、外部から入力データを取得し、入力データに基づいて情報処理装置１００が生成した推論結果を出力する。

【0030】

プロセッサ１２は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などのコンピュータであり、予め用意されたプログラムを実行することにより、情報処理装置１００の全体を制御する。特に、プロセッサ１２は、データの並列処理を行う。並列処理を実現する方法としては、ＧＰＵなどのＳＩＭＤプロセッサを利用する方法がある。情報処理装置１００がＳＩＭＤプロセッサを利用して並列処理を行う場合、プロセッサ１２をＳＩＭＤプロセッサとしてもよいし、プロセッサ１２とは別のプロセッサとしてＳＩＭＤプロセッサを設けてもよい。また、後者の場合、情報処理装置１００は、並列処理が可能な演算をＳＩＭＤプロセッサに実行させ、それ以外の演算をプロセッサ１２に実行させる。

【0031】

メモリ１３は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などにより構成される。メモリ１３は、プロセッサ１２により実行される各種のプログラムを記憶する。また、メモリ１３は、プロセッサ１２による各種の処理の実行中に作業メモリとしても使用される。

【0032】

記録媒体１４は、ディスク状記録媒体、半導体メモリなどの不揮発性で非一時的な記録媒体であり、情報処理装置１００に対して着脱可能に構成される。記録媒体１４は、プロセッサ１２が実行する各種のプログラムを記録している。

【0033】

ＤＢ１５は、入力ＩＦ１１から入力されるデータを記憶する。具体的に、ＤＢ１５には、入力ＩＦ１１が取得した入力データが記憶される。また、ＤＢ１５には、推論に用いる決定木モデルの情報が記憶される。具体的には、学習済みの決定木モデルの木構造を示す情報、及び、各ノードについてのノード設定（条件判定ノード設定、及び、葉ノード設定）が記憶される。

【0034】

（機能構成）
図１０は、情報処理装置１００の機能構成を示すブロック図である。情報処理装置１００は、命令統一部２１と、入力データ読込部２２と、並列処理部２３と、結果出力部２４とを備える。また、命令統一部２１は、閾値読込部２１ａと、比較命令読込部２１ｂと、命令変換部２１ｃとを備える。

【0035】

命令統一部２１は、決定木に含まれる各条件判定ノードについて比較命令を取得し、前述のような統一命令に変換する処理を行う。具体的に、閾値読込部２１ａは、各条件判定ノードについての閾値（threshold）又はカテゴリ値（category）を読み込み、命令変換部２１ｃへ出力する。比較命令読込部２１ｂは各条件判定ノードについての比較命令を読み込み、命令変換部２１ｃへ出力する。例えば、図４に示す条件判定ノード１の場合、閾値読込部２１ａは閾値「５」を読み込み、比較命令読込部２１ｂは比較命令［Ａ］＜thresholdを読み込む。また、図４に示す条件判定ノード２の場合、閾値読込部２１ａはカテゴリ値「１」を読み込み、比較命令読込部２１ｂは比較命令［Ｂ］＝＝categoryを読み込む。

【0036】

命令変換部２１ｃは、入力された閾値又はカテゴリ値と、比較命令とに基づいて、その比較命令を「Ｘ≦value≦Ｙ」の形式の統一命令に変換する。ここで、入力された比較命令が一致判定である場合、命令変換部２１ｃは、入力されたカテゴリ値をそのまま閾値Ｘ、Ｙとして使用する。一方、入力された比較命令が大小判定である場合、命令変換部２１ｃは統一命令に合わせて閾値を変更する。即ち、命令変換部２１ｃは、入力された比較命令が「Ｘ≦value≦Ｙ」の形式となるように、入力された閾値から、統一命令における閾値Ｘ、Ｙを作る。例えば、図４に示す条件判定ノード１の場合、命令変換部２１ｃは、ノード１の比較命令［Ａ］＜５を統一命令「Ｘ≦［Ａ］≦Ｙ」の形式に変換し、閾値Ｘ、Ｙをそれぞれ「－∞」、「４．９９９・・」と決定する。その結果、命令変換部２１ｃは、ノード１における比較命令［Ａ］＜５を、統一命令「－∞≦［Ａ］≦４．９９９・・」に変換する。こうして、命令統一部２１は、決定木モデルに含まれる全ての条件判定ノードの比較命令を統一命令に変換し、並列処理部２３へ出力する。

【0037】

入力データ読込部２２は、決定木モデルによる推論の対象となる入力データを読み込み、並列処理部２３へ出力する。図４の例では、入力データ読込部２２は、データ１～８を読み込む。並列処理部２３は、入力された統一命令を用いて、全ての入力データを並列処理し、条件判定結果を生成する。具体的に、並列処理部２３は、図５～７の「現在の状態」の欄に示すように、統一命令を用いて、各入力データ１～８について並列処理により条件判定を行う。そして、並列処理部２３は、得られた条件判定結果を結果出力部２４へ出力する。結果出力部２４は、入力された条件判定結果を外部装置などへ出力する。

【0038】

なお、上記の構成において、命令統一部２１は命令統一手段の一例であり、入力データ読込部２２は取得手段の一例であり、並列処理部２３は条件判定手段の一例である。

【0039】

（条件判定処理）
図１１は、並列処理部２３により実行される条件判定処理のフローチャートである。この処理は、図９に示すプロセッサ１２が予め用意されたプログラムを実行することにより実現される。なお、この処理に先立ち、図１０に示す命令統一部２１は、推論に使用する決定木モデルに含まれる全ての条件判定ノードについて、上記のように比較命令を統一命令に変換する前処理を実施しているものとする。

【0040】

まず、並列処理部２３は、全データの現在地（現在地ノード）に根ノードをセットする（ステップＳ１）。次に、並列処理部２３は、葉ノードに到達していないデータがある間、ステップＳ４～Ｓ７の並列処理を繰り返す（ステップＳ３）。ステップＳ４～Ｓ７の並列処理では、並列処理部２３は、ｉ番目のデータであるデータ［ｉ］の現在地ノード番号を「ｍ」にセットする（ステップＳ４）。これにより、各データについて現在地ノードが設定される。

【0041】

次に、並列処理部２３は、現在地ノード［ｍ］の統一命令の左閾値をＸ［ｉ］にセットし、右閾値をＹ［ｉ］にセットし、現在地ノード［ｍ］の統一命令が参照する特徴量番号を「ｊ」にセットする（ステップＳ５）。これにより、各データについて実行すべき統一命令が得られる。そして、並列処理部２３は、各データについて統一命令を実行する。具体的に、並列処理部２３は、（Ｘ［ｉ］≦データ［ｉ］［ｊ］）、かつ、（データ［ｉ］［ｊ］≦Ｙ［ｉ］）が成立するか否かを判定し、データ［ｉ］の条件判定結果に「true」又は「false」をセットする（ステップＳ６）。次に、並列処理部２３は、データ［ｉ］の条件判定結果に対応する現在地ノード［ｍ］の子ノードを、データ［ｉ］の現在地にセットする（ステップＳ７）。

【0042】

こうして、並列処理部２３は、ステップＳ４～Ｓ７の並列処理を全データに対して実行する。並列処理部２３は、葉ノードに到達していないデータがある限り、決定木モデルにおいて現在地を下層側へ移動しつつ、ステップＳ４～Ｓ７の並列処理を実行し、全てのデータが葉ノードに到達した時点で、処理を終了する。

【0043】

［第２実施形態］
図１２は、第２実施形態に係る情報処理装置７０の機能構成を示すブロック図である。情報処理装置７０は、条件判定ノードと葉ノードを有する決定木に基づいて決定木推論を行う。情報処理装置７０は、命令統一手段７１と、取得手段７２と、条件判定手段７３とを備える。命令統一手段７１は、決定木に含まれる条件判定ノードが実行する命令を、並列処理に適するように統一して統一命令を生成する。取得手段７２は、複数の入力データを取得する。条件判定手段７３は、各条件判定ノードについて、統一命令を用いて複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する。

【0044】

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。

【0045】

（付記１）
決定木に含まれる条件判定ノードが実行する命令を、並列処理に適するように統一して統一命令を生成する命令統一手段と、
複数の入力データを取得する取得手段と、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する条件判定手段と、
を備える情報処理装置。

【0046】

（付記２）
前記命令統一手段は、前記決定木に含まれる全ての条件判定ノードが前記統一命令を実行するように、各条件判定ノードの閾値を変更する付記１に記載の情報処理装置。

【0047】

（付記３）
前記統一命令は、前記条件判定ノードにおける判定対象値が、第１の閾値以上であり、かつ、第２の閾値以下であるかを判定する比較命令である付記２に記載の情報処理装置。

【0048】

（付記４）
前記命令統一手段は、前記判定対象値が所定値より小さいかを判定する命令を、前記判定対象値が、マイナス無限大以上であり、かつ、前記所定値より小さい隣接値以下であるかを判定する命令に変換する付記３に記載の情報処理装置。

【0049】

（付記５）
前記命令統一手段は、前記判定対象値が所定値より大きいかを判定する命令を、前記判定対象値が、前記所定値より大きい隣接値以上であり、かつ、プラス無限大以下であるかを判定する命令に変換する付記４に記載の情報処理装置。

【0050】

（付記６）
前記命令統一手段は、前記判定対象値が所定値と一致するかを判定する命令を、判定対象値が、前記所定値以下であり、かつ、前記所定値以上であるかを判定する命令に変換する付記３乃至５のいずれか一項に記載の情報処理装置。

【0051】

（付記７）
前記命令統一手段は、前記判定対象値が所定値以下であるかを判定する命令を、前記判定対象値が、マイナス無限大以上であり、かつ、前記所定値以下であるかを判定する命令に変換する付記３乃至６のいずれか一項に記載の情報処理装置。

【0052】

（付記８）
前記命令統一手段は、前記判定対象値が所定値以上であるかを判定する命令を、前記判定対象値が、前記所定値以上であり、かつ、プラス無限大以下であるかを判定する命令に変換する付記７に記載の情報処理装置。

【0053】

（付記９）
前記条件判定手段は、ＳＩＭＤ方式の並列処理を行う付記１乃至８のいずれか一項に記載の情報処理装置。

【0054】

（付記１０）
決定木に含まれる条件判定ノードが実行する命令を、並列処理に適するように統一して統一命令を生成し、
複数の入力データを取得し、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する情報処理方法。

【0055】

（付記１１）
決定木に含まれる条件判定ノードが実行する命令を、並列処理に適するように統一して統一命令を生成し、
複数の入力データを取得し、
各条件判定ノードについて、前記統一命令を用いて前記複数の入力データに対する条件判定を並列処理で行い、条件判定結果を出力する処理をコンピュータに実行させるプログラムを記録した記録媒体。

【0056】

以上、実施形態及び実施例を参照して本発明を説明したが、本発明は上記実施形態及び実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

【符号の説明】

【0057】

１２プロセッサ
２１命令統一部
２１ａ閾値読込部
２１ｂ比較命令読込部
２１ｃ命令変換部
２２入力データ読込部
２３並列処理部
２４結果出力部
１００情報処理装置

【図1】