(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024093614
(43)【公開日】2024-07-09
(54)【発明の名称】情報処理システム、情報処理方法、プログラム
(51)【国際特許分類】
G06F 16/28 20190101AFI20240702BHJP
G06F 16/906 20190101ALI20240702BHJP
【FI】
G06F16/28
G06F16/906
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022210122
(22)【出願日】2022-12-27
(71)【出願人】
【識別番号】390002761
【氏名又は名称】キヤノンマーケティングジャパン株式会社
(71)【出願人】
【識別番号】592135203
【氏名又は名称】キヤノンITソリューションズ株式会社
(74)【代理人】
【識別番号】100189751
【弁理士】
【氏名又は名称】木村 友輔
(74)【代理人】
【識別番号】100227857
【弁理士】
【氏名又は名称】中山 圭
(72)【発明者】
【氏名】中山 正明
(72)【発明者】
【氏名】四條 信太郎
【テーマコード(参考)】
5B175
【Fターム(参考)】
5B175AA02
5B175DA10
5B175FA03
5B175FB03
5B175HB03
(57)【要約】
【課題】 単一列の情報ではマッピングすることが難しい列について、適切なマッピングを行う仕組みを提供すること
【解決手段】 データ列同士の相関関係に基づきデータ列をグループ分けするグループ分け手段と、
単一のデータ列の値に基づき、第1の表におけるデータ列と第2の表におけるデータ列との対応関係を特定する第1の特定手段と、
前記第1の特定手段により対応関係を特定できなかった第1の表における未特定データ列について、同一のグループに属するデータ列と対応関係が特定された第2の表のデータ列に基づき、第2の表におけるデータ列との対応関係を特定する第2の特定手段と、
を備えることを特徴とする情報処理システム。
【選択図】
図1
【特許請求の範囲】
【請求項1】
データ列同士の相関関係に基づきデータ列をグループ分けするグループ分け手段と、
単一のデータ列の値に基づき、第1の表におけるデータ列と第2の表におけるデータ列との対応関係を特定する第1の特定手段と、
前記第1の特定手段により対応関係を特定できなかった第1の表における未特定データ列について、同一のグループに属するデータ列と対応関係が特定された第2の表のデータ列に基づき、第2の表におけるデータ列との対応関係を特定する第2の特定手段と、
を備えることを特徴とする情報処理システム。
【請求項2】
前記第2の特定手段は、前記第1の特定手段により対応関係を特定できなかった第1の表における未特定データ列について、同一のグループに属するデータ列と対応関係が特定された第2の表のデータ列が属するグループのデータ列と対応関係を特定することを特徴とする請求項1に記載の情報処理システム。
【請求項3】
前記第2の特定手段により特定された対応関係の修正を受け付ける修正受付手段をさらに備え、
前記第2の特定手段は、前記修正受付手段により受け付けた修正により特定された対応関係に基づき、第1の表における未特定データ列について第2の表におけるデータ列との対応関係を特定することを特徴とする請求項1に記載の情報処理システム。
【請求項4】
前記第1の表は、EDIにおける自社形式のデータであり、前記第2の表はEDIにおける標準形式のデータであることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理システム。
【請求項5】
情報処理システムのグループ分け手段が、データ列同士の相関関係に基づきデータ列をグループ分けするグループ分け工程と、
前記情報処理システムの第1の特定手段が、単一のデータ列の値に基づき、第1の表におけるデータ列と第2の表におけるデータ列との対応関係を特定する第1の特定工程と、
前記情報処理システムの第2の特定手段が、前記第1の特定工程により対応関係を特定できなかった第1の表における未特定データ列について、同一のグループに属するデータ列と対応関係が特定された第2の表のデータ列に基づき、第2の表におけるデータ列との対応関係を特定する第2の特定工程と、
を備えることを特徴とする情報処理方法。
【請求項6】
コンピュータを、
データ列同士の相関関係に基づきデータ列をグループ分けするグループ分け手段と、
単一のデータ列の値に基づき、第1の表におけるデータ列と第2の表におけるデータ列との対応関係を特定する第1の特定手段と、
前記第1の特定手段により対応関係を特定できなかった第1の表における未特定データ列について、同一のグループに属するデータ列と対応関係が特定された第2の表のデータ列に基づき、第2の表におけるデータ列との対応関係を特定する第2の特定手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法、プログラムに関する。
【背景技術】
【0002】
企業間の受発注業務等の取り引きは、EDIを用いて行われることが多くなっており、EDIでは、各種データの形式を自社形式から、標準形式に変換して行われることが多い。データを自社形式から標準形式へ変換するにあたって、データ列の対応関係を定義(マッピング)する必要がある。マッピング処理を手作業で行うのはユーザ負荷が大きいため、自動でのマッピングが望まれている。
【0003】
2つの表形式データの列の対応関係を自動で判別する技術は、スキーママッチング技術と呼ばれている。スキーママッチング技術は、EDIでの利用の他、データベースの統合や機械学習用データ作成などにも用いられる技術である。
【0004】
スキーママッチング技術においては、単一列の値の情報だけでは自社形式から標準形式への列の対応関係が適切に判断できない場合がある。
【0005】
例えば、
図3では、2表の列の内、「サイズ名称」列や「カラー名称」列は、列の値に共通項があるため、単一列の値から自動マッピングができると期待できる。しかし、「サイズコード」列・「カラーコード」列は、列の値に共通項はあるが、値が両列共に{0,1,2,(3)}から構成されているため、この二つの列を区別することができない。
【0006】
特許文献1では、単一列の値だけでは対応付けできない列に対して、複数列を考慮することで対応付けさせる手法が開示されている。
【先行技術文献】
【特許文献】
【0007】
【発明の開示】
【発明が解決しようとする課題】
【0008】
特許文献1は、対応付けを行う2表間で、カラムペアの「相関ルール」が変化しないことを前提にしている。例えば、
図3の自社形式の「カラーコード→カラー名称」の対応関係は、「0→黒、1→白、2→赤」であるが、この関係が標準形式側でも成り立つことを前提にしている。
【0009】
しかし、EDI分野における変換では、2表はそれぞれ別の会社のデータであり、「カラー名称」にどのような「カラーコード」を付けるかは会社によって異なると考えられる。すなわち、「カラー名称」と「カラーコード」の相関ルールは2表で異なるため、先行技術を用いることができない。
【0010】
そこで本発明は、単一列の情報ではマッピングすることが難しい列について、適切なマッピングを行う仕組みを提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明は、データ列同士の相関関係に基づきデータ列をグループ分けするグループ分け手段と、
単一のデータ列の値に基づき、第1の表におけるデータ列と第2の表におけるデータ列との対応関係を特定する第1の特定手段と、
前記第1の特定手段により対応関係を特定できなかった第1の表における未特定データ列について、同一のグループに属するデータ列と対応関係が特定された第2の表のデータ列に基づき、第2の表におけるデータ列との対応関係を特定する第2の特定手段と、
を備えることを特徴とする。
【発明の効果】
【0012】
本発明によれば、単一列の情報ではマッピングすることが難しい列について、適切なマッピングを行うことが可能となる。
【図面の簡単な説明】
【0013】
【
図1】本発明の情報処理システムの構成の一例を示す図
【
図2】クライアント端末101、サーバ装置102として適用可能な情報処理装置のハードウェア構成の一例を示すブロック図
【
図3】単一列の値の情報からマッピングをした場合の課題を説明する図
【
図4】自社形式データと標準形式データとのマッピング処理を示すフローチャート
【
図5】自社形式データのアップロード画面の一例を示す図
【
図6】ステップS104の処理の詳細を示したフローチャート
【
図7】ステップS201の処理の詳細を示したフローチャート
【
図12】相関関係を用いた自動マッピングが行われた場合に表示されるメッセージの一例
【
図13】マッピング結果に対する修正受付画面の一例
【発明を実施するための形態】
【0014】
図1は本発明の情報処理システムの構成例を示す図である。
【0015】
図1に示す通り、クライアント端末101とサーバ装置102とが通信可能に接続されている。
【0016】
クライアント端末101は、ユーザからの操作や指示を受け付け、当該指示に基づく要求をサーバ装置102等に送信する機能を備える。また、サーバ装置102等から取得した情報を表示部に表示する等によりユーザに通知する機能を備える。
【0017】
サーバ装置102は、クライアント端末101から取得した要求に基づき、各種情報をクライアント端末101に送信する。
【0018】
図2は、本発明のクライアント端末101、サーバ装置102として適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。
【0019】
図2に示すように、情報処理装置は、システムバス200を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、記憶装置204、入力コントローラ205、音声コントローラ206、ビデオコントローラ207、メモリコントローラ208、よび通信I/Fコントローラ209が接続される。
【0020】
CPU201は、システムバス200に接続される各デバイスやコントローラを統括的に制御する。
【0021】
ROM202あるいは外部メモリ213は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。
【0022】
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ213からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。
【0023】
入力コントローラ205は、キーボード210や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。
【0024】
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。
【0025】
ビデオコントローラ207は、ディスプレイ212などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。
【0026】
なおビデオコントローラ207は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。
【0027】
メモリコントローラ208は、外部メモリ213へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。
【0028】
通信I/Fコントローラ209は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の4G回線、5G回線等を用いた通信が可能である。
【0029】
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ212上での表示を可能としている。また、CPU201は、ディスプレイ212上の不図示のマウスカーソル等でのユーザ指示を可能とする。
【0030】
次に
図4のフローチャートを用いて、自動マッピング処理について説明する。
図4のフローチャートに示す各処理はサーバ装置102のCPU201が所定の制御プログラムを読み出して実行する処理である。
【0031】
ステップS101では、標準形式のサンプルファイルを取得する。標準形式は、会社に依存しない共通形式のファイルであり、予めサンプルファイルをEDIシステムに組み込んでおくものとする。その標準形式のサンプルファイルをメモリに読み込む。
【0032】
ステップS102では、自社形式のサンプルファイルをアップロードする。自社形式は、標準形式と異なり、会社特有の形式のため、予めサンプルファイルをEDIシステムに組み込んでおくことができない。そのため、ユーザが自社形式のサンプルファイルをアップロードし、サンプルファイルをメモリに読み込む。
【0033】
図5はサンプルファイルのアップロード画面の一例である。
【0034】
ステップS103では、ステップS101、ステップS102で用意した2表のサンプルファイルを用いて、単一列の値情報による自動マッピングを行う。
【0035】
図3の例で説明すると、「カラー名称」列・「サイズ名称」列はマッピングされることが期待できる。他方、「カラーコード」列と「サイズコード」列はどちらがどのコードかを区別することができず、マッピング候補が複数残ってしまう。
【0036】
ステップS104では、相関関係を利用した自動マッピングを行う。ステップS104の詳細については、
図6のフローチャートで説明する。
【0037】
ステップS201では、表毎に各列を相関関係を用いてグループ化する。相関関係を用いてグループ化を行う手法については、
図7のフローチャートに示す通り、数値エンコードしてから相関係数を利用する手法を説明するが、特許文献1で利用された「相関ルール」を用いても良いし、クラメールの連関係数を用いてもいずれの方法であっても良い。
【0038】
ステップS301では、表毎に各列を数値にエンコードする。
図8の様に、各列のユニーク値の出現順に数値を割り振っていく。例えば、「サイズコード」列であれば、「2→0,1→1,0→2」
「サイズ名称」列であれば、「L→0,M→1,S→2」の様に割り振る。
【0039】
ステップS302では、表毎に相関係数を計算する。
図9の様に、各列を数値にエンコードした表の相関係数を計算する。相関係数は、「サイズコード」や「カラーコード」の様に無関係な列同士では小さな値(
図9では「0.79」)をとり、相関関係がある「サイズコード」や「サイズ名称」は大きな値(
図9では「1」)をとる。
【0040】
ステップS303では、表毎に相関係数が閾値以上の列をグループ化する。
図9の様に、相関係数が大きい列同士をグループ化する。具体的には「サイズコード」と「サイズ名称」が同じグループ(サイズグループ)となり、「カラーコード」と「カラー名称」が同じグループ(カラーグループ)となっている。
【0041】
【0042】
ステップS202では、マッピング候補列が複数ある列について、同一グループの他列がマッピング候補列の同一グループに属する列とマッピングしている場合に、そのマッピング候補列とマッピングさせる。すなわち、
図10の様に単一列の値を使ったマッピング処理においては、自社形式の「サイズコード」列は、標準形式側の「サイズコード」列と「カラーコード」列がマッピング候補列となるが、自社形式側の「サイズコード」列と同一グループにある「サイズ名称」列が標準形式側の「サイズ名称」列とマッピングしており、標準形式側では「サイズ名称」列と「サイズコード」列が同一グループに属しているため、自社形式の「サイズコード」列は、標準形式側の「カラーコード」列ではなく、標準形式側の「サイズコード」列とマッピングさせるべきということが分かる。
【0043】
このようにして、単一列の値からだけでは、複数のマッピング候補が生じて区別できない列を、相関関係を利用することで、自動マッピングさせることができるようになる。
【0044】
【0045】
ステップS105では、クライアント端末101の表示部に自動マッピングの結果を表示するよう制御する。自動マッピング結果の表示画面は、
図11の様に自社形式の各列名、当該列の値サンプル、システムによるマッピング結果が表示される。また、相関関係を用いた自動マッピングが行われた場合には、
図12の様にその旨を表示するダイアログを表示しても良い。
【0046】
ステップS106では、システムによるマッピング結果を修正するか否かの指示を受け付ける。
【0047】
修正する指示を受けつけた場合(S106:Yes)は処理をステップS108に移行し、受け付けていない場合(S106:No)は、本フローチャートの処理を終了する。
【0048】
ステップS107では、マッピング結果の修正を受け付ける。
【0049】
修正は、
図13の様にシステムによるマッピング結果をクリックし、プルダウンリストから選択するUI等が考えられる。修正後、ステップS104に移行する。
【0050】
人手による修正により、ある列同士がマッピングされた時に、その列の同一グループの別の列がマッピング出来るようにならないかを判断する。
【0051】
すなわち、ステップS202の説明では、「サイズ名称」列は単一列の値情報から自動マッピングできたと仮定したが、もし自動マッピングができなかったとしても、人手で「サイズ名称」列をマッピングさせれば、「サイズコード」列同士をマッピングさせることができる。
【0052】
その後の処理は、S105、S106と移行し、マッピングの修正がなくなれば、本フローチャートの処理を終了する。
【0053】
以上、実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
【0054】
また、本発明におけるプログラムは、
図3に示すフローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は
図3の処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは
図3の各装置の処理方法ごとのプログラムであってもよい。
【0055】
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。
【0056】
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。
【0057】
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。
【0058】
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0059】
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0060】
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
【0061】
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
【符号の説明】
【0062】
101 クライアント端末
102 サーバ装置
103 LAN