特許7460742 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特許7460742情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-03-25

(45)【発行日】2024-04-02

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06N 3/04 20230101AFI20240326BHJP

G06N 3/0464 20230101ALI20240326BHJP

G06N 3/088 20230101ALI20240326BHJP

G06Q 10/083 20240101ALI20240326BHJP

【ＦＩ】

G06N3/04 100

G06N3/0464

G06N3/088

G06Q10/083

【請求項の数】 9

(21)【出願番号】P 2022207273

(22)【出願日】2022-12-23

【審査請求日】2022-12-23

(73)【特許権者】

【識別番号】399037405

【氏名又は名称】楽天グループ株式会社

(74)【代理人】

【識別番号】100079108

【弁理士】

【氏名又は名称】稲葉良幸

(74)【代理人】

【識別番号】100109346

【弁理士】

【氏名又は名称】大貫敏史

(74)【代理人】

【識別番号】100117189

【弁理士】

【氏名又は名称】江口昭彦

(74)【代理人】

【識別番号】100134120

【弁理士】

【氏名又は名称】内藤和彦

(74)【代理人】

【識別番号】100139066

【弁理士】

【氏名又は名称】伊藤健太郎

(72)【発明者】

【氏名】ゴーシュサム

(72)【発明者】

【氏名】劉雲青

【審査官】渡辺一帆

(56)【参考文献】

【文献】KIPF, T N. et al.，"Semi-Supervised Classification with Graph Convolutional Networks"，arXiv.org [online]，2017年，pp. 1-14，[retrieved on 2024.02.26], Retrieved from the Internet: <URL: https://arxiv.org/abs/1609.02907v4>，<DOI: 10.48550/arXiv.1609.02907>

【文献】HUDSON, B et al.，"Graph Neural Network Guided Local Search for the Traveling Salesperson Problem"，arXiv.org [online]，2022年04月，pp. 1-20，[retrieved on 2024.02.26], Retrieved from the Internet: <URL: https://arxiv.org/abs/2110.05291v3>，<DOI: 10.48550/arXiv.2110.05291>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／０２－３／１０

Ｇ０６Ｑ１０／０８３－１０／０８３７

(57)【特許請求の範囲】

【請求項1】

複数の配送先を複数のグループに分類する情報処理装置であって、
前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行う学習部と、
前記学習部により学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力する出力部と、
を有する情報処理装置。

【請求項2】

前記学習部は、前記第１損失関数に加えて、各配送先が所定グループに属する確率の合計値と、１グループあたりの平均配送先数との差分に基づく値を、前記複数のグループの各々について算出した値の合計値が小さいほど損失が少なくなるように定義される第２損失関数を用いて、前記教師なし学習による学習を行う、
請求項１に記載の情報処理装置。

【請求項3】

前記学習部は、前記第１損失関数に加えて、各配送先が前記複数のグループのいずれかに属する確率の最大値が、前記確率として取り得る値の最大値に近いほど損失が小さくなるように定義される第３損失関数を用いて、前記教師なし学習による学習を行う、
請求項１に記載の情報処理装置。

【請求項4】

前記学習部は、前記第１損失関数に加えて、
各配送先が所定グループに属する確率の合計値と、１グループあたりの平均配送先数との差分に基づく値を、前記複数のグループの各々について算出した値の合計値が小さいほど損失が少なくなるように定義される第２損失関数と、
各配送先が前記複数のグループのいずれかに属する確率の最大値が、前記確率として取り得る値の最大値に近いほど損失が小さくなるように定義される第３損失関数と
を用いて、前記教師なし学習による学習を行う、
請求項１に記載の情報処理装置。

【請求項5】

前記特徴行列には、前記複数の配送先の特徴として、配送を希望する時間帯に関する情報が含まれる、
請求項１に記載の情報処理装置。

【請求項6】

前記特徴行列には、前記複数の配送先の特徴として、配送を希望する時間帯と配送車両の稼働時間とが重複する割合に関する情報が含まれる、
請求項５に記載の情報処理装置。

【請求項7】

前記特徴行列には、前記複数の配送先の特徴として、配送拠点から配送先への方向若しくは配送先から前記配送拠点への方向に関する情報と、前記複数の配送先の各々と前記配送拠点との間の距離に関する情報とが含まれる、
請求項１に記載の情報処理装置。

【請求項8】

複数の配送先を複数のグループに分類する情報処理装置が実行する情報処理方法であって、
前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行うステップと、
学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力するステップと、
を含む情報処理方法。

【請求項9】

複数の配送先を複数のグループに分類するコンピュータに、
前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行うステップと、
学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力するステップと、
を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

【背景技術】

【0002】

グラフ分割とは、頂点（vertex）及び頂点間を結ぶエッジ（edge）の集合で構成されるグラフを複数の部分集合に分割することである。グラフ分割を行うアルゴリズムは多数知られており、例えば、Kernighan-Linアルゴリズム、Fiduccia-Mattheysesアルゴリズム、Spectral Bisection methodなどが挙げられる。また、最近では、ニューラルネットワークである、グラフ畳み込みニューラルネットワークを用いたアルゴリズムも提案されている（例えば非特許文献１参照）。

【先行技術文献】

【非特許文献】

【0003】

【文献】Thomas N. Kipf, Max Welling, Semi-Supervised Classification with Graph Convolutional Networks, [online], 2017, [2022年11月24日検索]、インターネット<URL http://arxiv.org/abs/1609.02907>

【発明の概要】

【発明が解決しようとする課題】

【0004】

非特許文献１に記載の技術を用いてグラフ分割を行う場合、グラフ畳み込みニューラルネットワークを、教師データを用いて学習させることが必要である。しかしながら、グラフ畳み込みニューラルネットワークを利用して現実世界の問題を解決しようとしても、そもそも教師データを予め用意することが困難であることが考えられる。

【0005】

そこで、本開示は、教師データを用意することなく、グラフ畳み込みニューラルネットワークを利用したグラフ分割を可能にする情報処理装置、情報処理方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本開示の一態様に係る情報処理装置は、複数の配送先を複数のグループに分類する情報処理装置であって、前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行う学習部と、前記学習部により学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力する出力部と、を有する。

【発明の効果】

【0007】

本開示によれば、教師データを用意することなく、グラフ畳み込みニューラルネットワークを利用したグラフ分割を可能にする情報処理装置、情報処理方法及びプログラムを提供することができる。

【図面の簡単な説明】

【0008】

【図1】本実施形態に係る配送管理システムの一例を示す図である。

【図2】情報処理装置のハードウェア構成例を示す図である。

【図3】情報処理装置の機能ブロック構成例を示す図である。

【図4】情報処理装置が実行する処理手順の一例を示すフローチャートである。

【図5】グラフを説明するための図である。

【図6】複数の配送先を複数のグループに分類した結果を示す図である。

【発明を実施するための形態】

【0009】

添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。

【0010】

＜システム構成＞
図１は、本実施形態に係る配送管理システムの一例を示す図である。配送管理システム１は、情報処理装置１０と端末２０とを含む。情報処理装置１０と端末２０とは、無線又は有線の通信ネットワークＮを介して接続され、相互に通信を行うことができる。

【0011】

情報処理装置１０は、荷物の配送を管理する装置であり、複数の配送先を複数のグループに分類（クラスタリング）する処理を行う。また、情報処理装置１０は、各グループに分類された複数の配送先について、例えば巡回セールスマン問題（traveling salesman problem）を解くアルゴリズム等を利用することで、効率的に荷物を配送することが可能な配送ルートを決定するようにしてもよい。情報処理装置１０は、１又は複数の物理的なサーバ等から構成されていてもよいし、ハイパーバイザー（hypervisor）上で動作する仮想的なサーバを用いて構成されていてもよいし、クラウドサーバを用いて構成されていてもよい。

【0012】

端末２０は、ユーザが操作する端末であり、例えば、スマートフォン、タブレット端末、携帯電話機、パーソナルコンピュータ（ＰＣ）、ノートＰＣ等である。端末２０の画面には、情報処理装置１０から出力される各種のデータが表示される。また、ユーザは、端末２０を介して情報処理装置１０を操作することができる。

【0013】

情報処理装置１０は、複数の配送先を、グラフ分割アルゴリズムを用いて複数のグループに分類する。具体的には、情報処理装置１０は、グラフ畳み込みニューラルネットワーク（GCN：Graph Convolutional Neural Network）を利用することで、配送先の分類を行う。なお、以降、グラフ畳み込みニューラルネットワークを、単に、グラフ畳み込みネットワーク、GCNと呼称する。

【0014】

従来、ＧＣＮを利用してグラフ分割を行う場合、予め教師データを用意してＧＣＮを学習させる必要があった。しかしながら、荷物の配送先は日々異なることから、予め教師データを用意することは困難である。そこで、本実施形態では、情報処理装置１０は、ＧＣＮを学習させる際に利用する損失関数（Loss Function）を工夫することで、教師データを用いずにＧＣＮを学習させるようにした。

【0015】

＜ハードウェア構成＞
図２は、情報処理装置１０のハードウェア構成例を示す図である。情報処理装置１０は、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphical Processing Unit）等のプロセッサ１１、メモリ（例えばＲＡＭ又はＲＯＭ）、ＨＤＤ（Hard Disk Drive）及び／又はＳＳＤ（Solid State Drive）等の記憶装置１２、有線又は無線通信を行うネットワークＩＦ（Network Interface）１３、入力操作を受け付ける入力装置１４、及び情報の出力を行う出力装置１５を有する。入力装置１４は、例えば、キーボード、タッチパネル、マウス及び／又はマイク等である。出力装置１５は、例えば、ディスプレイ、タッチパネル及び／又はスピーカ等である。

【0016】

＜機能ブロック構成＞
図３は、情報処理装置１０の機能ブロック構成例を示す図である。情報処理装置１０は、記憶部１００と、受付部１０１と、学習部１０２と、出力部１０３とを含む。記憶部１００は、情報処理装置１０が備える記憶装置１２を用いて実現することができる。また、受付部１０１と、学習部１０２と、出力部１０３とは、情報処理装置１０のプロセッサ１１が、記憶装置１２に記憶されたプログラムを実行することにより実現することができる。また、当該プログラムは、記憶媒体に格納することができる。当該プログラムを格納した記憶媒体は、コンピュータ読み取り可能な非一時的な記憶媒体（Non-transitory computer readable medium）であってもよい。非一時的な記憶媒体は特に限定されないが、例えば、ＵＳＢ（Universal Serial Bus）メモリ又はＣＤ－ＲＯＭ（Compact Disc Read-Only Memory）等の記憶媒体であってもよい。

【0017】

記憶部１００は、配送先に関する各種データ（以下、「配送先データ」と言う。）と、学習モデルとを記憶する。学習モデルには、ＧＣＮのモデル構造を決定する情報及び各種のパラメータ値が含まれる。

【0018】

受付部１０１は、端末２０から、各種のデータ入力を受け付ける。例えば、受付部１０１は、配送先データの入力等を受け付ける。

【0019】

学習部１０２は、配送先データ及び所定の損失関数を利用して学習モデルを学習させる。具体的には、学習部１０２は、複数の配送先の接続関係を示す隣接行列を用いて定められ、当該複数の配送先の特徴を示す特徴行列を入力とするＧＣＮを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される損失関数（以下、「第１損失関数」と言う。）を用いて教師なし学習による学習を行う。

【0020】

出力部１０３は、学習モデルから出力される情報を出力する。具体的には、出力部１０３は、学習部１０２により学習されたＧＣＮに特徴行列を入力することで得られる、複数の配送先の各々が属するグループに関する情報を出力する。

【0021】

＜処理手順＞
図４は、情報処理装置１０が実行する処理手順の一例を示すフローチャートである。図４を用いて、情報処理装置１０が、教師データを用いずにＧＣＮを学習させることで、配送先を分類する方法を具体的に説明する。

【0022】

ステップＳ１０で、受付部１０１は、配送先データの入力を受け付ける。配送先データには、例えば、配送先の位置情報（緯度及び経度等）、配送希望時間帯（例えば１４時～１６時等）、配送先と配送拠点（Depot）の間の関係に関する情報等が含まれる。受付部１０１は、受け付けた配送先データを記憶部１００に格納する。

【0023】

ステップＳ１１で、学習部１０２は、配送先データから、ＧＣＮに入力する隣接行列及び特徴行列を生成する。

【0024】

ここで、グラフについて説明する。グラフは、複数の頂点及び頂点間を結ぶエッジの集合で構成され、数式１で表現することができる。なお、グラフは、グラフネットワークとも呼ばれる。

【数1】

Ｖは頂点（vertex）の集合を意味しており、Ｅはエッジ（edge）の集合を意味する。

【0025】

図５にグラフの一例を示す。図５に示すグラフは、５つの頂点（ｖ１～ｖ５）と、各頂点を結ぶ７つのエッジ（ｅ１２、ｅ１４、ｅ２３、ｅ２４、ｅ３４、ｅ３５、ｅ４５、）とから構成されている。また、各頂点には、特徴量を関連づけることができる。本実施形態では、頂点、エッジ及び頂点の特徴量を、それぞれ配送先、配送先間の距離及び配送先の特徴とみなしてグラフを定義し、ＧＣＮを用いてグラフ分割を行うことで、配送先を複数のグループに分割する。

【0026】

次に、隣接行列Ａ（Adjacency Matrix）について説明する。隣接行列Ａは、エッジ間の接続関係を示しており、１の場合はエッジ間が接続されており、０の場合はエッジ間が接続されていないことを示す。本実施形態における隣接行列Ａの成分Ａ_ｉｊは、数式２で表現することができる。なお、ｉ及びｊは配送先を示す。例えば配送先が１００箇所である場合、ｉ及びｊは、それぞれ１～１００の整数で表される。

【数2】

ω_i,jは配送先ｉ及び配送先ｊ間の距離を示し、θは所定の閾値を示す。配送先間の距離は、ユーグリッド距離（Euclidean distance）、球面距離（havesine distance）又は地図上の実際の距離であってもよい。ユーグリッド距離はＬ２ノルムとも呼ばれる。地図上の実際の距離は、例えば、ＯＳＲＭ（Open Source Routing Machine）と呼ばれる既存のライブラリを利用して取得するようにしてもよい。

【0027】

また、θの値は任意であるが、例えば、配送先間の距離が離れており、同一のグループに分類すべきでないと考えられる距離に設定されてもよい。配送先ｉ及びｊ間の距離がθの値よりも大きい場合、Ａ_ｉｊは０になることから、グラフにおける頂点ｉ及びｊの間にはエッジが接続されていないものとして表現されることになる。

【0028】

なお、２つの配送先間の距離がθ以下である場合であっても、当該２つの配送先間に、配送を行う車両（トラック等）が通過できないような障害（例えば河川等）が存在する場合、学習部１０２は、当該２つの配送先に対応するＡ_ｉｊの値を０に設定するようにしてもよい。例えば、受付部１０１は、ユーザから、２つの配送先間に障害が存在することの指定を受け付け、学習部１０２は、隣接行列の成分のうち、受付部１０１で受け付けた２つの配送先の間に対応するＡ_ｉｊの値を０に設定するようにしてもよい。

【0029】

次に、次数行列Ｄ（Degree matrix）について説明する。次数行列Ｄは、各頂点にいくつのエッジが接続されているのかを示す対角行列である。本実施形態における次数行列Ｄの成分Ｄ_ｉｊは、数式３で表現することができる。

【数3】

Ｎは頂点の数を示す。例えば、図５において、頂点ｖ１には２つのエッジ（ｅ１２、ｅ１４）が接続されていることから、次数行列Ｄの成分Ｄ_１１の値は２になる。

【0030】

次に、特徴行列Ｘ（Feature matrix）について説明する。特徴行列Ｘは、各頂点に関連づけられる特徴量を示している。例えば、頂点の数を１～ｎとし、ｉを特徴量の識別子とすると、頂点１～ｎのそれぞれの特徴量Ｘ_ｉは、以下の数式４で表現される。

【数4】

また、特徴量の数がｐ個である場合、すなわち、特徴量の識別子ｉは１～ｐで表される場合、特徴行列Ｘは、数式５で表現される。

【数5】

本実施形態では、配送先に関連づけられる特徴量には、荷物の受取人が配送を希望する時間帯を含めてもよい。つまり、特徴行列Ｘには、複数の配送先の特徴として、配送を希望する時間帯に関する情報が含まれていてもよい。配送を希望する時間帯に関する情報は、例えば、１：８時～１２時、２：１２時～１４時、３：１４時～１６時、４：１６時～１８、５：１８時～２０時のように正の整数で表現されてもよい。

【0031】

また、配送先に関連づけられる特徴量には、配送を希望する時間帯のうち配送車両の稼働時間が含まれる時間の割合に関する情報（「オーバーラップ率」と呼んでもよい）を含めてもよい。つまり、特徴行列Ｘには、複数の配送先の特徴として、配送を希望する時間帯のうち配送車両の稼働時間が含まれる時間の割合に関する情報が含まれていてもよい。当該情報は、０～１の値で表現される。０の場合は、配送を希望する時間帯のうち配送車両の稼働時間が含まれる時間は無いことを示す。また、１の場合は、配送を希望する全ての時間帯が配送車両の稼働時間に含まれることを示す。例えば、配送希望時間帯が８時から１２時であり、配送車両の稼働時間が１０時から１６時である場合、配送希望時間帯（４時間）のうち配送車両の稼働時間が含まれる時間は２時間（１０時～１２時）であるから、２時間÷４時間＝０．５になる。

【0032】

また、配送先に関連づけられる特徴量には、配送拠点（Depot）から配送先への方向（又はその逆）に関する情報と、複数の配送先の各々と配送拠点との間の距離に関する情報とを含めてもよい。つまり、特徴行列Ｘには、複数の配送先の特徴として、配送拠点から配送先への方向若しくは配送先から配送拠点への方向に関する情報と、複数の配送先の各々と配送拠点との間の距離に関する情報とが含まれていてもよい。当該距離に関する情報は、ユーグリッド距離（Euclidean distance）、球面距離（havesine distance）又は地図上の実際の距離であってもよい。

【0033】

特徴行列Ｘに含まれる特徴量は上記に限定されず、配送先に関するものであれば、どのような特徴量が含まれていてもよい。

【0034】

ここで、隣接行列Ａ、次数行列Ｄ及び特徴行列Ｘの具体例を数式６～８に示す。なお、数式６～８に示す行列は、頂点が３つであり各頂点間がエッジで接続されているグラフに対応する。

【数6】

【数7】

【数8】

数式８に示す特徴行列Ｘは、１つの頂点（配送先）に４つの特徴量が関連づけられていることを示す。例えば、特徴行列Ｘの１列目には、０．５、０．１及び０．２の３つの値が存在する。これは、頂点１（配送先１）における１つ目の特徴量は０．５であり、頂点２（配送先２）における１つ目の特徴量は０．１であり、頂点３（配送先３）における１つ目の特徴量は０．２であることを示している。同様に、２列目には、０．２、０．６及び０．９の３つの値が存在する。これは、頂点１（配送先１）における２つ目の特徴量は０．２であり、頂点２（配送先２）における２つ目の特徴量は０．６であり、頂点３（配送先３）における２つ目の特徴量は０．９であることを示している。

【0035】

ステップＳ１２で、学習部１０２は、損失関数（Loss Function）を用いてＧＣＮの学習を行う。例えば、学習部１０２は、ニューラルネットワークを学習させるためのライブラリ等にＧＣＮのモデルと使用する損失関数とを設定することで、ＧＣＮを学習させることができる。数式９に、本実施形態に係るＧＣＮの例を示す。

【数9】

Ｋは１から始まる正の整数であり、ＧＣＮにおける隠れ層の階層を示す。また、ｈ^（Ｋ）はＫ番目の隠れ層を示す。σは活性化関数である。ここで、Ａ´は、数式１０で定義される。

【数10】

Ｉ_ｎは単位行列である。

【0036】

本実施形態では、隠れ層が２層であるＧＣＮを用いて学習を行う。数式１１は入力層を示し、数式１２は１つ目の隠れ層を示し、数式１３は、出力層を示す。

【数11】

【数12】

【数13】

数式１１におけるｎは配送先の数を示し、ｐは特徴量の数を示す。また、数式１２及び数式１３におけるＷは重みを示す。また、ｌ_０は、１つ目の隠れ層におけるニューロンの数であり、ｃは、ＧＣＮが出力可能なグループの数である。

【0037】

数式１１に示すように、ＧＣＮの入力層には特徴行列の成分が入力される。また、ＧＣＮの出力層からは、配送先ごとに各グループに属する確率が出力される。例えば、配送先の数が１００であり、出力可能なグループの数が５である場合、配送先ごとに５つの確率（グループ１に属する確率、グループ２に属する確率、グループ３に属する確率、グループ４に属する確率、グループ５に属する確率）が出力される。なお、出力される確率の最大値は１であってもよいが、本実施形態がこれに限定されるものではない。

【0038】

続いて、学習部１０２は、損失関数を用いてＧＣＮを学習させる処理を行う。前述した通り、学習部１０２は、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて、教師なし学習による学習を行う。第１損失関数を用いることで、配送先間の距離が短く、かつ、類似する特徴を有する配送先が同一のグループに属するようにＧＣＮを学習させることができる。
数式１４及び数式１５は、第１損失関数の一例を示す。

【数14】

【数15】

数式１４及び１５について、ｋは、グループの番号を示す。Ｃはグループの集合を示す。ｉ及びｊは配送先を示す。Ｖは配送先の集合を示す。Ｐ_ｉｋは、配送先ｉがグループｋに属する確率を示す。Ｐ_ｊｋは、配送先ｊがグループｋに属する確率を示す。ｐは特徴量の数を示し、ｍは特徴量の番号を示す。もし特徴量が３種類である場合、ｐ＝３であり、ｍは１～３の整数になる。なお、Ｐ_ｉｋ及びＰ_ｉｊには、ＧＣＮの出力層から出力される値が入力される。γ_ｉｊは、配送先ｉ及び配送先ｊの間の距離である。配送先間の距離は、ユーグリッド距離）、球面距離又は地図上の実際の距離であってもよい。地図上の実際の距離は、例えば、ＯＳＲＭと呼ばれる既存のライブラリを利用して取得するようにしてもよい。Ｘ_ｍ（ｉ）は配送先ｉのｍ番目の特徴量を示し、Ｘ_ｍ（ｊ）は配送先ｊのｍ番目の特徴量を示す。λ_１とλ_２は、ユーザにより定義可能なスケーリングファクターであり、配送管理システム１を利用するユーザにより任意に設定することができる。

【0039】

数式１５の前半部分「λ_１γ_ｉｊ」は、配送先ｉ及び配送先ｊの間の距離が小さいほど小さな値になる。また、数式１５の後半部分（λ_１γ_ｉｊ以外の部分）は、配送先ｉ及び配送先ｊの間について各特徴量の差分が小さいほど、小さな値になる。また、配送先ｉ及び配送先ｊが同一グループに属する場合、Ｐ_ｉｋ×Ｐ_ｊｋの値は大きくなる。そのため、数式１４におけるＰ_ｉｋ×Ｐ_ｊｋ×ω_ｉｊの値は、同一グループに属する配送先ｉ及び配送先の間の距離が小さいほど小さな値になり、同一グループに属する配送先ｉ及び配送先ｊの間の特徴量の差分が小さいほど小さな値になることがわかる。

【0040】

また、学習部１０２は、第１損失関数に加えて、各配送先が所定グループに属する確率の合計値と、１グループあたりの平均配送先数との差分に基づく値を、複数のグループの各々について算出した値の合計値が小さいほど損失が少なくなるように定義される第２損失関数を用いて、教師なし学習による学習を行うようにしてもよい。なお、「各配送先が所定グループに属する確率の合計値と、１グループあたりの平均配送先数との差分に基づく値」は、当該差分を二乗した値でもよいし、当該差分の絶対値でもよいし、当該差分の二乗の平方根であってもよい。第２損失関数を用いることで、各グループに属する配送先の数がグループ間で平均化されるようにＧＣＮを学習させることができる。数式１６は、第２損失関数の一例を示す。

【数16】

数式１６において、ｋは、グループの番号を示す。Ｃはグループの集合を示す。例えばＧＣＮの出力可能なグループ数が１０である場合、Ｃ＝１０になる。ｉは配送先を示す。Ｖは配送先の集合を示す。配送先の数が５００である場合、Ｖ＝５００になる。Ｐ_ｉｋは、配送先ｉがグループｋに属する確率を示す。ΣＰ_ｉｋは、各配送先がグループｋに属する確率を全ての配送先について合計した値を示す。また、｜Ｖ｜／｜Ｃ｜は、１グループあたりの平均配送先数を示す。

【0041】

また、学習部１０２は、第１損失関数に加えて、各配送先が複数のグループのいずれかに属する確率の最大値が、確率として取り得る値の最大値（例えば１であるが、これに限定されない）に近いほど損失が小さくなるように定義される第３損失関数を用いて、教師なし学習による学習を行うようにしてもよい。第３損失関数を用いることで、配送先が各グループに属する確率の最大値が、確率として取り得る値の最大値に近づくように、ＧＣＮを学習させることができる。例えば、ＧＣＮを学習させる前の状態では、ある配送先がグループ１～３に属する確率は（０．３、０．３、０．４）であると出力されたとする。この場合、第３損失関数を用いてＧＣＮを学習させることで、例えば（０．１、０．１、０．８）のように、どのグループに属するのかが明確になるような出力結果を得ることができる。数式１７に第３損失関数の一例を示す。

【数17】

数式１７について、ｉ及びｊは配送先を示す。Ｖは配送先の集合を示す。Ｐ_ｉｊは、配送先ｉがいずれかのグループに属する確率の最大値と、配送先ｊがいずれかのグループに属する確率の最大値とを乗算した値を示す。例えば、配送先ｉ＝１が各グループに属する確率のうちグループ３に属する確率（Ｐ３）が最も大きい値であり、配送先ｊ＝２が各グループに属する確率のうちグループ５に属する確率Ｐ５が最も大きい値である場合、Ｐ_ｉｊ（ｉ＝１、ｊ＝２）は、Ｐ３×Ｐ５になる。

【0042】

また、学習部１０２は、第１損失関数に加えて、第２損失関数と、第３損失関数とを用いて、教師なし学習による学習を行うようにしてもよい。数式１８に、第１損失関数、第２損失関数及び第３損失関数を用いる場合の損失関数の一例を示す。

【数18】

ステップＳ１３で、出力部１０３は、学習部１０２により学習されたＧＣＮに特徴行列を入力することで得られる、複数の配送先の各々が属するグループに関する情報を出力する。例えば、配送先が１００箇所であり、ＧＣＮが出力可能なグループ数が５である場合、配送先ごとに各グループに属する確率が出力される。配送先に対し出力された複数の確率（ここでは５つの確率）のうち最も確率の大きいグループが、当該配送先が属するグループを意味する。

【0043】

＜具体例＞
図６は、複数の配送先を複数のグループに分類した結果を示す図である。地点Ｄは配送拠点（Deport）である。図６の例では、複数の配送先が、１０個のグループに分類されていることがわかる。

【0044】

＜まとめ＞
以上説明した実施形態によれば、損失関数のみを利用してＧＣＮを学習させることで、教師データを用意することなく、複数の配送先を複数のグループに分類することが可能になる。

【0045】

以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態で説明したフローチャート、シーケンス、実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。

【0046】

＜付記＞
本実施形態は、以下の通り表現されてもよい。

【0047】

＜付記１＞
複数の配送先を複数のグループに分類する情報処理装置であって、
前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行う学習部と、
前記学習部により学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力する出力部と、
を有する情報処理装置。

【0048】

＜付記２＞
前記学習部は、前記第１損失関数に加えて、各配送先が所定グループに属する確率の合計値と、１グループあたりの平均配送先数との差分に基づく値を、前記複数のグループの各々について算出した値の合計値が小さいほど損失が少なくなるように定義される第２損失関数を用いて、前記教師なし学習による学習を行う、
付記１に記載の情報処理装置。

【0049】

＜付記３＞
前記学習部は、前記第１損失関数に加えて、各配送先が前記複数のグループのいずれかに属する確率の最大値が、前記確率として取り得る値の最大値に近いほど損失が小さくなるように定義される第３損失関数を用いて、前記教師なし学習による学習を行う、
付記１に記載の情報処理装置。

【0050】

＜付記４＞
前記学習部は、前記第１損失関数に加えて、
各配送先が所定グループに属する確率の合計値と、１グループあたりの平均配送先数との差分に基づく値を、前記複数のグループの各々について算出した値の合計値が小さいほど損失が少なくなるように定義される第２損失関数と、
各配送先が前記複数のグループのいずれかに属する確率の最大値が、前記確率として取り得る値の最大値に近いほど損失が小さくなるように定義される第３損失関数と
を用いて、前記教師なし学習による学習を行う、
付記１に記載の情報処理装置。

【0051】

＜付記５＞
前記特徴行列には、前記複数の配送先の特徴として、配送を希望する時間帯に関する情報が含まれる、
付記１～４のいずれか一項に記載の情報処理装置。

【0052】

＜付記６＞
前記特徴行列には、前記複数の配送先の特徴として、配送を希望する時間帯と配送車両の稼働時間とが重複する割合に関する情報が含まれる、
付記１～５のいずれか一項に記載の情報処理装置。

【0053】

＜付記７＞
前記特徴行列には、前記複数の配送先の特徴として、配送拠点から配送先への方向若しくは配送先から前記配送拠点への方向に関する情報と、前記複数の配送先の各々と前記配送拠点との間の距離に関する情報とが含まれる、
付記１～６のいずれか一項に記載の情報処理装置。

【0054】

＜付記８＞
複数の配送先を複数のグループに分類する情報処理装置が実行する情報処理方法であって、
前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行うステップと、
学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力するステップと、
を含む情報処理方法。

【0055】

＜付記９＞
複数の配送先を複数のグループに分類するコンピュータに、
前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行うステップと、
学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力するステップと、
を実行させるためのプログラム。

【符号の説明】

【0056】

１…配送管理システム、１０…情報処理装置、１１…プロセッサ、１２…記憶装置、１３…ネットワークＩＦ、１４…入力装置、１５…出力装置、２０…端末、１００…記憶部、１０１…受付部、１０２…学習部、１０３…出力部

【要約】

【課題】教師データを用意することなく、グラフ畳み込みニューラルネットワークを利用したグラフ分割を可能にすること。
【解決手段】複数の配送先を複数のグループに分類する情報処理装置であって、前記複数の配送先の接続関係を示す隣接行列を用いて定められ、前記複数の配送先の特徴を示す特徴行列を入力とするグラフ畳み込みニューラルネットワークを、同一のグループに属する配送先間の距離に関する値が小さいほど、かつ、同一のグループに属する配送先間の特徴の差分が小さいほど損失が少なくなるように定義される第１損失関数を用いて教師なし学習による学習を行う学習部と、前記学習部により学習された前記グラフ畳み込みニューラルネットワークに前記特徴行列を入力することで得られる、前記複数の配送先の各々が属するグループに関する情報を出力する出力部と、を有する情報処理装置を提供する。
【選択図】図３

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版