(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5965267
(24)【登録日】2016年7月8日
(45)【発行日】2016年8月3日
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
G06Q 50/10 20120101AFI20160721BHJP
G06Q 10/04 20120101ALI20160721BHJP
【FI】
G06Q50/10
G06Q10/04
【請求項の数】4
【全頁数】10
(21)【出願番号】特願2012-213919(P2012-213919)
(22)【出願日】2012年9月27日
(65)【公開番号】特開2014-67361(P2014-67361A)
(43)【公開日】2014年4月17日
【審査請求日】2015年1月26日
(73)【特許権者】
【識別番号】505194686
【氏名又は名称】株式会社日立ソリューションズ西日本
(74)【代理人】
【識別番号】100091096
【弁理士】
【氏名又は名称】平木 祐輔
(74)【代理人】
【識別番号】100102576
【弁理士】
【氏名又は名称】渡辺 敏章
(74)【代理人】
【識別番号】100108394
【弁理士】
【氏名又は名称】今村 健一
(72)【発明者】
【氏名】冨山 全徳
(72)【発明者】
【氏名】石田 夏樹
【審査官】
大野 朋也
(56)【参考文献】
【文献】
特表2008−530660(JP,A)
【文献】
特開2006−323586(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00−99/00
(57)【特許請求の範囲】
【請求項1】
第1の領域における第1の度数分布の第1の代表値と、前記第1の領域とは異なる第2の領域の第2の度数分布の第2の代表値とを比較する代表値比較部と、
前記代表値比較部において、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換部と、
前記分布変換部で変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較部で比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるように前記第2の代表値を求める処理を継続する分布推定部と
を有することを特徴とする情報処理装置。
【請求項2】
前記分布推定部で推定された前記第2の代表値と度数分布とに基づいて、前記第2の度数分布の度数を算出する度数分布算出部を有することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
地域情報データベースを備えた情報処理装置であって、
前記地域情報データベースに予め格納されている上位区画の地域とその下位区画にあたる地域の2つの平均値の比較処理を行う比較部と、
その比較結果をもとに上位区画の地域の度数分布から下位区画の地域の度数分布に近づける変換方法を求める変換部と、
前記変換方法を用いて上位区画の地域の度数分布から下位区画の度数分布を推定する処理を行う推定部と、
推定した度数分布から母集団の平均値を求めるためのブートストラップ処理を行うブートストラップ処理部と、を備えることを特徴とする情報処理装置。
【請求項4】
第1の領域における第1の度数分布の第1の代表値と、前記第1の領域とは異なる第2の領域の第2の度数分布の第2の代表値とを比較する代表値比較ステップと、
前記代表値比較ステップにおいて、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換ステップと、
前記分布変換ステップで変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較ステップで比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるように前記第2の代表値を求める処理を継続する分布推定ステップと
を有することを特徴とする情報処理方法をコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理技術に関し、異なる領域の度数分布に基づいて度数を推定するための情報処理技術に関し、例えば、地域情報から移住者の特徴を推定する分析活動を支援するための情報を作成する技術に関するものである。
【背景技術】
【0002】
度数分布表は、学術的、実用的に広く用いられている。
例えば、企業の営業活動において顧客との取引関係を深め、顧客ロイヤルティを高めるために、地域情報から地域の持つ独自性、異質性を見極めることを目的として各地域の特徴をつかむ分析作業が求められている。このため、地域別に集計した人口統計や金融関連情報、消費購買力情報から地域の特徴をつかむ上で有用な情報を抽出する分析技術が求められている。
【0003】
従来から、地域の情報を利用した営業活動支援を目的とした分析手法は存在している。例えば、下記特許文献1では商品の購入者が居住する地域の情報にもとづいて販売実績情報を分析することにより、商品の販売者にとって有用な情報を生成するものである。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−169699号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、一般的に地域情報をもとに分析を行う際には地域の細分化を行う必要がある。これは、市場を細分化して小さく見ることでその細やかな変化に目を凝らし、その地域のニーズを見出すためである。このため、地域情報をもとに分析を行う際には都道府県・市区町村といった大きな括りではなく、町丁別といった小さな単位にまで細分化することが有効である。
【0006】
しかしながら、地域情報を収集したデータベースには市区町村単位までしか詳細な情報がなく、町丁別単位では詳細な情報が欠落している状態のものがある。
【0007】
このため、地域情報の分析が市区町村といった上位区画地域単位のみで行われ、町丁別といった下位区画地域単位の市場の変化を見出すことができず適切な判断・改善行動をとることができない状態になってしまう。
【0008】
それ以外にも、実験などにより求められた特性を階調として、各階調毎の度数を求めて度数分布とした際に、異なる測定領域間で度数分布のデータを補間できれば、有用である。
【0009】
本発明は、大きな領域とそれとは異なる小さな領域等との間の度数分布の関連を求め、度数分布を補間する情報処理を行うことを目的とする。
【課題を解決するための手段】
【0010】
本発明の一観点によれば、第1の領域における第1の度数分布の第1の代表値と、前記第1領域とは異なる第2の領域の第2の度数分布の第2の代表値とを比較する代表値比較部と、前記代表値比較部において、第1の代表値と第2の代表値との一致度が低い場合に、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換部と、前記分布変換部で変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較部で比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるまで前記第2の代表値を求める処理を継続する分布推定部とを有することを特徴とする情報処理装置が提供される。
【0011】
前記分布推定部で推定された第2の代表値と度数分布とに基づいて、前記第2の度数分布の度数を算出する度数分布算出部を有することを特徴とする。
【0012】
また、本発明は、地域情報データベースを備えた情報処理装置であって、前記地域情報データベースに予め格納されている上位区画の地域とその下位区画にあたる地域の2つの平均値の比較処理を行う比較部と、その比較結果をもとに上位区画の地域の度数分布から下位区画の地域の度数分布に近づける変換方法を求める変換部と、前記変換方法を用いて上位区画の地域の度数分布から下位区画の度数分布を推定する処理を行う推定部と、推定した度数分布から母集団の平均値を求めるためのブートストラップ処理を行うブートストラップ処理部と、を備えることを特徴とする情報処理装置である。これにより、下位区画の地域の度数分布の推定を精度良く行うことができる。
【0013】
本発明の他の観点によれば、第1の領域における第1の度数分布の第1の代表値と、前記第1領域とは異なる第2の領域の第2の度数分布の第2の代表値とを比較する代表値比較ステップと、前記代表値比較ステップにおいて、第1の代表値と第2の代表値との一致度が低い場合には、前記第1の度数分布と前記第2の度数分布との分布の偏りを少なくする方向に第2の度数分布を変換する分布変換ステップと、前記分布変換ステップで変換された変換後の前記第2の度数分布を基に新たな第2の代表値を求め、前記新たな第2の代表値と前記第1の代表値とを前記代表値比較部で比較し、前記第1の代表値と前記新たな第2の代表値との一致度が高くなるまで前記第2の代表値を求める処理を継続する分布推定ステップと、を有することを特徴とする情報処理方法が提供される。
【0014】
本発明は、上記に記載の情報処理方法をコンピュータに実行させるためのプログラムであっても良く、当該プログラムを記録するコンピュータ読み取り可能な記録媒体であっても良い。
【発明の効果】
【0015】
本発明によれば、次のような効果がある。
異なる領域の属性値情報に欠落情報部分が存在しても、一方の度数分布、属性平均値、他方の属性平均値をもとに欠落情報部分を推定して利用者に提供することで、特徴分析を推定することができる。
【図面の簡単な説明】
【0016】
【
図1】本発明の一実施の形態による情報処理装置を含むシステム構成図である。
【
図2】本実施の形態による情報処理に用いられる度数分布の一例を示す図である。
【
図3】本実施の形態による情報処理の流れを示すフローチャート図である。ホストシステム内で行われる情報処理の概要を示すフローチャートである。
【
図4】
図4(a)は、上位区画地域にあたるA県B市といった市区町村単位による預貯金額情報を集計したデータを示している。
図4(b)は、A県B市の下位区画地域にあたるA県B市のC町といった町丁単位による預貯金額情報を集計したデータを示している。
【
図5】ホストシステム13における
図4(b)の預貯金額別の該当人口数の推定を例とした処理の概要を示すフローチャート図である。
【
図6】E(a)とE(b)の比較結果による変換式f(x)の違いを示したイメージ図である。
【
図7】算出されたA県B市C町の預貯金額別の人口分布h(b)から欠落情報部分の推定を行う処理のイメージ図である。
【
図8】本実施の形態による情報処理に用いられる度数分布の例を示す図であり、対象は半導体基板上に多数形成されたLEDであり、階級が発光波長帯であり、度数が半導体基板上の該当する発光波長帯を有するLEDの個数である。
【発明を実施するための形態】
【0017】
以下、本発明の実施の形態による情報処理技術について図面に参照しながら詳細に説明する。
図1は、本発明の一実施の形態による情報処理装置を含むシステム構成図である。本実施の形態による情報システムは、地域情報などの特性(ある特性値がどの程度の度数存在するか)に関する度数分布(確率分布)情報データベース、ここでは例として
図4で後述するように地域情報データベース11を備えたパーソナルコンピュータなどのホストシステム13を設け、このホストシステム13と利用者との情報のやり取りを行うパーソナルコンピュータやスマートフォンなどの情報入出力装置12が接続されている。ホストシステム13には、地域情報データベースなどの度数分布情報データベースに格納された第1の領域、例えば上位区画の地域と第2の領域、例えばその下位区画の地域の2つの平均値などの代表値(平均値、中央値など)の比較処理を行う代表値比較部131と、第1の領域(第1群)である上位区画の地域の度数分布から第2の領域で(第2群)ある下位区画の地域の度数分布を推定するための分布変更値、例えば変換式を算出する分布変更値算出部(変換式算出部)132を設け、変換式などを用いて第1の領域である上位区画の地域の度数分布を変換処理し第2の領域である下位区画の地域の度数分布の推定を行う分布変換部(変換処理部)133を備え、推定された第2の領域である下位区画の地域の度数分布から第2の領域である下位区画の地域全体の平均値を算出するための分布推定処理(ブートストラップ処理)を行う分布推定部(ブートストラップ処理部)134を設け、推定された第2の領域である下位区画の地域の度数分布から第2の領域である下位区画の地域の不明な属性値などの度数分布を算出する度数分布(不明値)算出部135を備えている。
【0018】
図2は、本実施の形態による情報処理に用いられる度数分布の一例を示す図である。
図2(a)は、1群の度数分布表であり、階級とそれに属する度数との関係と、合計度数と、代表値(ここでは平均値)とが示されている。
図2(b)は、2群の度数分布表であり、階級とそれに属する度数との関係と、合計度数と、代表値(ここでは平均値)とが示されている。一例としては、
図8に示すように、1群(
図8(a))は、例えば、半導体基板(1ウエハ)上に多数形成されたLEDであり、階級が発光波長帯であり、度数が半導体基板上のその発光波長帯を有するLEDの個数である。2群(
図8(b))は、例えば、半導体基板上に多数形成されたLEDのうちある領域(例えば中央の領域)であり、階級が発光波長帯であり、度数が半導体基板上の中央の領域の発光波長帯を有するLEDの個数である。階級と度数とは、度数分布を作成可能なあらゆる特性等に適用することができる。
【0019】
図3は、本実施の形態による情報処理の流れを示すフローチャート図である。まず、
図2(a)、
図2(b)に示すデータのうち、2群のy1’からy4’までのデータが未知であり、合計度数と代表値(平均値)は既知であるとする。これらのデータが、度数分布情報データベース11内に格納されているとする。
【0020】
図3に示すように、処理が開始されると(ステップS1)、ステップS2で、1群の度数分布g(a)と1群2群の代表値E(a)、E(b)とを度数分布情報データベース11から取得してホストシステム13に入力する。ステップS3で、代表値比較部131が、E(a)、E(b)を比較し、E(a)が(b)とほぼ等しい場合には(ステップS3でYES)、度数分布(不明値)算出部135が、ステップS4で、第1群の度数分布を第2群の度数分布にそのまま適用することで、第2群の欠落情報を推定し、処理を終了する(ステップS6)。ステップS3でNoの場合には、ステップS7に進み、代表値比較部131が、E(a)>E(b)であるか否かを判定する。YESの場合には、ステップS8に進み、分布変換部133が、分布変更値算出部132が算出した変更値により、第2群の度数分布を低諧調側に変換する。そして、ステップS9において、変換した度数分布を基に代表値E’(a)を求める。ステップS7でNoの場合には、ステップS10に進み、第2群の度数分布を高諧調側に変換する。そして、ステップS9において、変換した度数分布を基に代表値E’(a)を求める。
【0021】
次いで、分布推定部134により処理が繰り返され、ステップS11において、E(a)をE’(a)、g(a)をg’(a)に置き換えて、ステップS3に戻る。ステップS3でE(a)が(b)とほぼ等しいと代表値比較部131が判定すると、ステップS4からステップS5に進み、度数分布算出部135が最終的な度数分布を求め、処理が終了する。
【0022】
以上のように、第1群の度数分布と、第1、第2群の代表値から、第2群の欠落情報、すなわち、y
1’からy
4’を精度よく推測することができる。
図8で示した例では、平均値が330nmから360nmになるため、度数分布が1群から2群になると、長波長側に分布がずれる方向に変換される。
【0023】
本実施の形態によれば、異なる領域の属性値情報に欠落情報部分が存在しても、一方の度数分布、属性平均値、他方の属性平均値をもとに欠落情報部分を推定して利用者に提供することで、特徴分析を推定することができる。
【0024】
次に、より具体的な例について説明する。
図4(a)は、上位区画地域にあたるA県B市といった市区町村単位による預貯金額情報を集計したデータを示している。
図4(b)は、A県B市の下位区画地域にあたるA県B市のC町といった町丁単位による預貯金額情報を集計したデータを示している。
図4(b)における「―」は該当データがないこと、すなわち欠落情報があることを示しており、つまりA県B市C町といった下位の町丁単位では預貯金額別に該当人口数が集計されておらず、地域の人口合計数と預貯金額の平均値のみしか集計されていないことを示している。このように、下位区画地域において集計されていない情報部分を欠落情報として取り扱う。以下では、この
図4(b)の欠落情報であるA県B市C町の預貯金額別の該当人口数の推定を目的とした処理手順について説明する。
【0025】
図5は、ホストシステム13における
図4(b)の預貯金額別の該当人口数の推定を例とした処理の概要を示すフローチャート図である。ホストシステム13における処理の初期設定として、まずg(a)にA県B市単位で集計した預貯金額別の人口分布を、h(b)を推定の対象となるA県B市C町単位で集計した預貯金額別の人口分布として設定する(ステップ301)。次に、g(a)とh(b)の関係性を判断するためにA県B市の預貯金額の代表値の一例である平均値E(a)とA県B市C町の預貯金額の代表値の一例である平均値E(b)の比較を行う(ステップ302、ステップ303)。預貯金額の平均値の比較結果がE(a)≒E(b)の際には、A県B市とA県B市C町の預貯金額別の人口分布の形状がほぼ同じと判断してh(b)=g(a)と見なして次のステップ310に進む(ステップ304)。預貯金額の平均値の比較結果がE(a)>E(b)、E(a)<E(b)の際には、A県B市の預貯金額別人口分布g(a)を変換することでA県B市C町の預貯金額別人口分布h(b)の推定を行うために、変換式f(x)の生成を行う。変換式f(x)は、A県B市の預貯金額別人口分布g(a)とA県B市C町の預貯金額別人口分布h(b)の関係を示したものであり、h(b)=g(a)の際にはf(x)=xとなるものである。預貯金額の平均値の比較結果がE(a)>E(b)の際には、平均値が大きいA県B市の預貯金額別人口分布g(a)を全体的にマイナス側に移動させることで平均値を下げてE(a)をE(b)に近づける。
【0026】
このため、A県B市の預貯金額別人口分布g(a)からA県B市C町の預貯金額別人口分布h(b)に変換処理で利用する変換式f(x)はf(x)=xに比べて上に凸となる。これをもとに、変換式f(x)を生成する(ステップ305)。預貯金額の平均値の比較結果がE(a)<E(b)の際には、平均値が小さいA県B市の預貯金額別人口分布g(a)を全体的にプラス側に移動させることで平均値を上げてE(a)をE(b)に近づける。このため、A県B市の預貯金額別人口分布g(a)からA県B市C町の預貯金額別人口分布h(b)に変換処理で利用する変換式f(x)はf(x)=xに比べて下に凸となる。これをもとに、変換式f(x)を生成する(ステップ306)。
【0027】
図6は、E(a)とE(b)の比較結果による変換式f(x)の違いを示したイメージ図である。上図(42)がE(a)>E(b)の際の上に凸の変換式f(x)のイメージであり、下図(43)がE(a)<E(b)の際の下に凸の変換式f(x)のイメージである。次に、生成した変換式f(x)を利用してA県B市の預貯金額別の人口分布g(a)をもとにしてA県B市C町の預貯金額別の推定人口分布g’(a)を求める(ステップ307)。次に、求めたg’(a)から母集団であるA県B市C町の預貯金額の平均値E’(a)を求めるためにブートストラップ法を利用する(ステップ308)。次に、A県B市C町の預貯金額別の推定人口分布g’(a)をg(a)に、A県B市C町の預貯金額の平均値E’(a)をE(a)に置き換え、再び数値比較部を通して実際のA県B市C町の預貯金額の平均値E(a)を比較することで評価を行う(ステップ302)。以上の処理を繰り返して、E(a)≒E(b)を導きA県B市C町の預貯金額別の人口分布h(b)の推定が終了したら(ステップ302でYES)、ステップ304を介してA県B市C町の預貯金額別の人口分布h(b)の推定を行うことでA県B市C町の預貯金額別人口の欠落情報部分の推定を行い(ステップ310)、処理を終了する。
【0028】
図7は、算出されたA県B市C町の預貯金額別の人口分布h(b)から欠落情報部分の推定を行う処理のイメージ図である。初めにA県B市C町の預貯金額別の人口分布h(b)51をもとにA県B市C町の預貯金額別に人口の推定比率52を求める。次に、A県B市C町の預貯金額別の人口推定比率52にA県B市C町の合計人口53を組合せることでA県B市C町の預貯金額別の推定人口54を算出する。この情報処理を通して、欠落情報であったA県B市C町の預貯金額別の該当人口数を推定して利用者に提供を行う。
【0029】
本実施の形態によれば、下位区画地域の属性値情報に欠落情報部分が存在しても、上位区画地域の度数分布、属性平均値、下位区画地域の属性平均値をもとに欠落情報部分を推定して利用者に提供することで、地域情報を利用してより詳細な地域の特徴分析を行うことが可能となる。
【0030】
尚、上記の実施の形態において、添付図面に図示されている構成等については、これらに限定されるものではなく、本発明の効果を発揮する範囲内で適宜変更することが可能である。その他、本発明の目的の範囲を逸脱しない限りにおいて適宜変更して実施することが可能である。また、本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれるものである。
【産業上の利用可能性】
【0031】
本発明は、情報処理装置として利用可能である。
【符号の説明】
【0032】
11…地域情報データベース
12…入出力装置
13…ホストシステム
131…代表値比較部
132…変換式算出部
133…変換処理部
134…ブートストラップ処理部
135…不明値算出部
21…A県B市の預貯金情報データ例
22…A県B市C町の預貯金情報データ例
41…f(x)=xの図
42…f(x)=xを上に凸にした図
43…f(x)=xを下に凸にした図
51…算出したA県B市C町の預貯金額別の人口分布
52…A県B市C町の預貯金額別人口推定比率
53…A県B市C町の合計人口
54…A県B市C町の預貯金額別の推定人口