IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社DATAFLUCTの特許一覧

特開2023-79180情報処理システム、情報処理方法及び情報処理プログラム
<>
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図1
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図2
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図3
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図4
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図5
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図6
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図7
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図8
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図9
  • 特開-情報処理システム、情報処理方法及び情報処理プログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023079180
(43)【公開日】2023-06-07
(54)【発明の名称】情報処理システム、情報処理方法及び情報処理プログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20230531BHJP
   G06Q 30/0202 20230101ALI20230531BHJP
【FI】
G06Q50/10
G06Q30/02 310
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022183471
(22)【出願日】2022-11-16
(62)【分割の表示】P 2022037736の分割
【原出願日】2022-03-11
(31)【優先権主張番号】P 2021192392
(32)【優先日】2021-11-26
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】521456117
【氏名又は名称】株式会社DATAFLUCT
(74)【代理人】
【識別番号】110002789
【氏名又は名称】弁理士法人IPX
(72)【発明者】
【氏名】久米村 隼人
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB01
5L049CC11
(57)【要約】      (修正有)
【課題】適切な学習器の選択を可能とする情報処理システム、情報処理方法及び情報処理プログラムを提供する。
【解決手段】情報処理システムは、制御部を備える。制御部は、次の各ステップを実行するように構成される。データ受付ステップでは、第1の入力データの入力を受け付ける。学習器特定ステップでは、受け付けた第1の入力データに応じて複数の学習器を特定する。モデル表示ステップでは、第1の入力データに基づき、特定された学習器が生成する学習モデルに関するモデル情報を、学習モデルごとに比較可能な態様で表示させる。
【選択図】図5
【特許請求の範囲】
【請求項1】
情報処理システムであって、
制御部を備え、
前記制御部は、次の各ステップを実行するように構成され、
データ受付ステップでは、第1の入力データの入力を受け付け、
学習器特定ステップでは、受け付けた前記第1の入力データに応じて複数の学習器を特定し、
モデル表示ステップでは、前記第1の入力データに基づき、特定された前記学習器が生成する学習モデルに関するモデル情報を、前記学習モデルごとに比較可能な態様で表示させる、もの。
【請求項2】
請求項1に記載の情報処理システムにおいて、
前記モデル情報は、少なくとも前記学習モデルの予測精度に関する精度情報を含み、
前記モデル表示ステップでは、生成される前記学習モデルごとの前記精度情報を比較可能に表示させる、もの。
【請求項3】
請求項1に記載の情報処理システムにおいて、
さらに、学習器選択受付ステップでは、特定された前記学習器に対する選択をユーザより受け付け、
前記モデル表示ステップでは、特定された前記学習器のうち、前記選択により選択された前記学習器を用いて生成される前記モデル情報を表示させる、もの。
【請求項4】
請求項1に記載の情報処理システムにおいて、
さらに、データ処理ステップでは、入力された前記第1の入力データを、特定された前記学習器に入力可能な態様である第2の入力データに変換する変換処理を実行し、
前記モデル情報は、前記学習器によって前記第2の入力データを用いて生成される前記学習モデルに関する、もの。
【請求項5】
請求項4に記載の情報処理システムにおいて、
さらに、処理表示ステップでは、前記第1の入力データと前記第2の入力データとの差異点を認識可能な態様で表示させる、もの。
【請求項6】
請求項5に記載の情報処理システムにおいて、
さらに、処理条件表示ステップでは、少なくとも入力された前記第1の入力データと、特定された前記学習器と、に基づき、前記変換処理が行われる条件を認識可能な態様で表示させる、もの。
【請求項7】
請求項1に記載の情報処理システムにおいて、
さらに、分析手法選択受付ステップでは、複数の分析手法のうちの前記学習モデルの生成に用いられる少なくとも1つの選択を受け付ける、もの。
【請求項8】
請求項7に記載の情報処理システムにおいて、
前記分析手法は、分類分析、回帰分析、及び時系列分析のうちの少なくとも1つを含む、もの。
【請求項9】
請求項1に記載の情報処理システムにおいて、
前記第1の入力データは、少なくともユーザが保有する保有データを含む、もの。
【請求項10】
請求項1に記載の情報処理システムにおいて、
前記第1の入力データは、少なくとも構造化データを含む、もの。
【請求項11】
情報処理方法であって、
請求項1~請求項10の何れか1つに記載の情報処理システムの各ステップを含む、もの。
【請求項12】
情報処理プログラムであって、
コンピュータに、請求項1~請求項10の何れか1つに記載の情報処理システムの各ステップを実行させる、もの。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理システム、情報処理方法及び情報処理プログラムに関する。
【背景技術】
【0002】
従来技術として、学習器に関する下記の文献が挙げられる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-177428号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
学習器から生成される学習モデルは、同一の入力データを用いたとしても学習器のアルゴリズム等によって異なることがある。そのため、ユーザは、学習モデルを用いた予測精度の向上のために、入力データに応じて学習器を適切に選択する必要がある。しかし、適切な学習器の選択には、データサイエンスに関する知見が比較的高い水準で求められることがある。
【課題を解決するための手段】
【0005】
(1)本発明の一態様によれば、情報処理システムが提供される。この情報処理システムは、制御部を備える。制御部は、次の各ステップを実行するように構成される。データ受付ステップでは、第1の入力データの入力を受け付ける。学習器特定ステップでは、受け付けた第1の入力データに応じて複数の学習器を特定する。モデル表示ステップでは、第1の入力データに基づき、特定された学習器が生成する学習モデルに関するモデル情報を、学習モデルごとに比較可能な態様で表示させる。
【0006】
かかる情報処理システムによれば、ユーザに要求されるデータサイエンスに関する知見の水準を、これまでより下げることができる。
【図面の簡単な説明】
【0007】
図1】情報処理システム1を表す構成図である。
図2】情報処理装置2のハードウェア構成を示すブロック図である。
図3】ユーザ端末3のハードウェア構成を示すブロック図である。
図4】制御部23が備える機能部の一例を示す。
図5】情報処理システム1において実行される情報処理の流れの一例を示すアクティビティ図である。
図6】表示部34に表示される受付ウィンドウ4の一例である。
図7】表示部34に表示されるデータウィンドウ5及び変換処理ウィンドウ6の一例である。
図8】第2の表示モード6bの場合に表示部34に表示される変換処理ウィンドウ6の一例を示す図である。
図9】表示部34に表示されるモデル情報表示ウィンドウ7の一例を示す図である。
図10】表示部34に表示されたモデル検索ウィンドウ8及びモデル比較ウィンドウ9の一例である。
【発明を実施するための形態】
【0008】
以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事項は、互いに組み合わせ可能である。
【0009】
ところで、本実施形態に登場するソフトウェアを実現するためのプログラムは、コンピュータが読み取り可能な非一時的な記録媒体(Non-Transitory Computer-Readable Medium)として提供されてもよいし、外部のサーバからダウンロード可能に提供されてもよいし、外部のコンピュータで当該プログラムを起動させてクライアント端末でその機能を実現(いわゆるクラウドコンピューティング)するように提供されてもよい。
【0010】
また、本実施形態において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、例えば電圧・電流を表す信号値の物理的な値、0又は1で構成される2進数のビット集合体としての信号値の高低、又は量子的な重ね合わせ(いわゆる量子ビット)によって表され、広義の回路上で通信・演算が実行されうる。
【0011】
また、広義の回路とは、回路(Circuit)、回路類(Circuitry)、プロセッサ(Processor)、及びメモリ(Memory)等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)、プログラマブル論理デバイス(例えば、単純プログラマブル論理デバイス(Simple Programmable Logic Device:SPLD)、複合プログラマブル論理デバイス(Complex Programmable Logic Device:CPLD)、及びフィールドプログラマブルゲートアレイ(Field Programmable Gate Array:FPGA))等を含むものである。
【0012】
1.ハードウェア構成
本節では、ハードウェア構成について説明する。
【0013】
<情報処理システム1>
図1は、情報処理システム1を表す構成図である。情報処理システム1は、情報処理装置2と、ユーザ端末3と、データベースDB1と、を備える。情報処理装置2と、ユーザ端末3と、データベースDB1と、は、電気通信回線を通じて通信可能に構成されている。一実施形態において、情報処理システム1とは、1つ又はそれ以上の装置又は構成要素からなるものである。仮に例えば、情報処理装置2のみからなる場合であれば、情報処理システム1は、情報処理装置2となりうる。以下、これらの構成要素について説明する。
【0014】
<情報処理装置2>
図2は、情報処理装置2のハードウェア構成を示すブロック図である。情報処理装置2は、通信部21と、記憶部22と、制御部23とを備え、これらの構成要素が情報処理装置2の内部において通信バス20を介して電気的に接続されている。各構成要素についてさらに説明する。
【0015】
通信部21は、USB、IEEE1394、Thunderbolt(登録商標)、有線LANネットワーク通信等といった有線型の通信手段が好ましいものの、無線LANネットワーク通信、3G/LTE/5G等のモバイル通信、BLUETOOTH(登録商標)通信等を必要に応じて含めてもよい。すなわち、これら複数の通信手段の集合として実施することがより好ましい。すなわち、情報処理装置2は、通信部21及びネットワークを介して、外部から種々の情報を通信してもよい。
【0016】
記憶部22は、前述の記載により定義される様々な情報を記憶する。これは、例えば、制御部23によって実行される情報処理装置2に係る種々のプログラム等を記憶するソリッドステートドライブ(Solid State Drive:SSD)等のストレージデバイスとして、あるいは、プログラムの演算に係る一時的に必要な情報(引数、配列等)を記憶するランダムアクセスメモリ(Random Access Memory:RAM)等のメモリとして実施されうる。記憶部22は、制御部23によって実行される情報処理装置2に係る種々のプログラムや変数等を記憶している。
【0017】
制御部23は、情報処理装置2に関連する全体動作の処理・制御を行う。制御部23は、例えば不図示の中央処理装置(Central Processing Unit:CPU)である。制御部23は、記憶部22に記憶された所定のプログラムを読み出すことによって、情報処理装置2に係る種々の機能を実現する。すなわち、記憶部22に記憶されているソフトウェアによる情報処理が、ハードウェアの一例である制御部23によって具体的に実現されることで、制御部23に含まれる各機能部として実行されうる。これらについては、次節においてさらに詳述する。なお、制御部23は単一であることに限定されず、機能ごとに複数の制御部23を有するように実施してもよい。またそれらの組合せであってもよい。
【0018】
<ユーザ端末3>
図3は、ユーザ端末3のハードウェア構成を示すブロック図である。ユーザ端末3は、通信部31と、記憶部32と、制御部33と、表示部34と、入力部35とを備え、これらの構成要素がユーザ端末3の内部において通信バス30を介して電気的に接続されている。通信部31、記憶部32及び制御部33の説明は、情報処理装置2における各部の説明と同様のため省略する。
【0019】
表示部34は、ユーザ端末3筐体に含まれるものであってもよいし、外付けされるものであってもよい。表示部34は、ユーザが操作可能なグラフィカルユーザインターフェース(Graphical User Interface:GUI)の画面を表示する。これは例えば、CRTディスプレイ、液晶ディスプレイ、有機ELディスプレイ及びプラズマディスプレイ等の表示デバイスを、ユーザ端末3の種類に応じて使い分けて実施することが好ましい。
【0020】
入力部35は、ユーザ端末3の筐体に含まれるものであってもよいし、外付けされるものであってもよい。例えば、入力部35は、表示部34と一体となってタッチパネルとして実施されてもよい。タッチパネルであれば、ユーザは、タップ操作、スワイプ操作等を入力することができる。もちろん、タッチパネルに代えて、スイッチボタン、マウス、QWERTYキーボード等を採用してもよい。すなわち、入力部35がユーザによってなされた操作入力を受け付ける。当該入力が命令信号として、通信バス30を介して制御部33に転送され、制御部33が必要に応じて所定の制御や演算を実行しうる。
【0021】
<データベースDB1>
データベースDB1は、外部データD0を記憶する。外部データD0は、例えば公衆がアクセス可能なデータであっても、特定のユーザのみがアクセス可能なデータであってもよい。また、外部データD0は、本情報処理システム1を使用するユーザのみがアクセス可能なデータであってもよい。データベースDB1は、単一の記憶デバイスにより実現されていても、複数の記憶デバイスにより実現されていてもよい。外部データD0が表す内容は、例えば衛生観測結果、気候観測結果、統計資料、カレンダー情報など、任意である。
【0022】
2.機能構成
図4は、制御部23が備える機能部の一例を示す。図4に示すように、制御部23は、データ受付部231と、学習器特定部232と、学習器選択受付部233と、分析手法選択受付部234と、データ処理部235と、モデル表示部236と、処理表示部237と、処理条件表示部238と、を備える。
【0023】
データ受付部231は、第1の入力データD1の入力を受け付ける。第1の入力データD1は、情報処理装置2に入力されるデータである。第1の入力データD1は、複数のデータ点を含みうる。第1の入力データD1は、データセットということもできる。第1の入力データD1は、少なくともユーザが保有する保有データを含む。なお、第1の入力データD1は、ユーザ以外が保有するデータ、例えばデータベースDB1に記憶されたデータ、を含んでもよい。第1の入力データD1は、少なくとも構造化データを含む。構造化データは、予め定められた構造となるように標準化されたデータである。なお、第1の入力データD1は、構造化データ以外のデータ、例えば非構造化データ、又は半構造化データを含んでもよい。非構造化データは、構造化データのように標準化された構造を持たない任意の形式のデータである。半構造化データは、非構造化データと、当該非構造化データを識別可能なタグと、の組み合わせからなる。半構造化データの形式は、例えば、グラフ型、キーバリュー型、ドキュメント型、カラム型などである。なお、入力データ受付部231が受け付ける第1の入力データD1は1つに限られず、複数であってもよい。
【0024】
学習器特定部232は、受け付けた第1の入力データD1に応じて複数の学習器MLを特定する。
学習器は、入力されるデータを用いて学習モデルM1を生成する。学習モデルM1は、少なくとも1つの入力x1に基づいて、少なくとも1つの出力y1を生成する。入力x1は、説明変数とも言われる。また、出力y1は、評価関数とも言われる。
【0025】
学習器選択受付部233は、特定された学習器MLに対する選択をユーザより受け付ける。
【0026】
分析手法選択受付部234は、複数の分析手法のうちの学習モデルM1の生成に用いられる少なくとも1つの選択を受け付ける。分析手法は、任意であるが、例えば分類分析、回帰分析、時系列分析、レコメンド分析、異常検知、クラスタリング、画像解析、及びテキスト解析のうちの少なくとも1つを含む。分析手法としては、教師あり学習、教師なし学習、強化学習など任意のアルゴリズムのものを採用可能である。
【0027】
データ処理部235は、変換処理を実行する。変換処理とは、データ受付部231に入力された第1の入力データD1を、特定された学習器MLに入力可能な態様である第2の入力データD2に変換する処理である。変換処理は、例えば、第1の入力データD1の一部の削除、欠損値の補完、外れ値の削除、第1の入力データD1の規格化など、任意の処理を含みうる。変換処理は、データ整形ともいわれる。
変換処理は、第1の入力データD1に含まれる複数の入力x1の結合処理、分離処理、補正などを含んでもよい。例えば、変換処理は、第1の入力データD1が時系列を表す年、月、及び日をそれぞれ異なる入力x1として有する場合に、これらの複数の入力x1を1つの入力に結合する処理を含みうる。また、変換処理は、複数の入力データ受付部231にて複数の第1の入力データD1を受け付けた場合、これらの第1の入力データD1の結合処理を行ってもよい。別例として、変換処理は、入力x1の追加処理、特徴量の追加などを含んでもよい。例えば、データ処理部235は、第1の入力データD1に応じてデータベースDB1から任意の外部データD0を取得し、当該外部データD0を第1の入力データD1に追加してもよい。データ処理部235は、追加された外部データD0に基づき、特徴量の追加を行ってもよい。
変換処理は、第1の入力データD1の内容に基づいて、制御部23によって自動で実行可能な処理を含む。なお、変換処理は、ユーザによる指定に基づいて実行可能な処理を含んでもよい。また、本実施形態では、変換処理は、第1の入力データD1を所定の変換条件と比較することで特定される自動変換処理を含む。変換条件とは、例えば第1の入力データD1の容量、第1の入力データD1の統計情報の分散値が閾値未満か否か、第1の入力データD1の統計情報に基づく外れ値の有無などである。変換条件は、変換処理が行われる必要性を示唆するものでもある。
また、変換処理は、入力データ受付部231に入力された第1の入力データD1の形式を、特定された学習器MLのそれぞれに適合する形式に変換する処理を含む。第1の入力データD1の形式は、例えば、第1の入力データD1の名称、文字コード、改行コード、表記言語、区切り文字などを含む。
例えば、特定された学習器MLに入力可能な入力データDの文字コードがUTF-8であるにも関わらず、第1の入力データD1の文字コードがShift-JISの場合、データ処理部235は、当該第1の入力データD1を、文字コードがUTF-8に変更された第2の入力データD2に変換する変換処理を実行する。
別例として、変換処理は、特定された複数の学習器MLに入力可能な第2の入力データD2のそれぞれに対して名称を付与する処理を含みうる。このとき、変換処理は、制御部23が第2の入力データD2を一意に特定可能な名称を、第2の入力データD2に付与することが好ましい。これにより、第2の入力データD2の管理が容易となる。なお、名称の付与は、第1の入力データD1の名称を変更することによって行われてもよい。
別例として、第1の入力データD1がBOM(Byte Order Mark)を含む場合、変換処理は、当該BOMの除去を含んでもよい。これにより、意図しないエラーが抑制しやすくなる。
別例として、変換処理は、第1の入力データD1に含まれる入力x1のうち、学習モデルM1の生成に用いられないものを除去する処理を含んでもよい。データ処理部235は、例えば、入力x1の形式、分布に基づいて、当該入力x1が学習モデルM1の生成に用いられるか否かを判定すればよい。これにより、第2の入力データD2の容量が軽減されるため、学習モデルM1の生成に必要な時間が短縮される。なお、変換処理の特定は、変換処理を行う必要がない場合などには、行う変換処理がないことを特定することを含みうる。
制御部23は、さらに、特定され、又は選択された分析手法に基づき、変換処理を特定してもよい。例えば、選択された分析手法が時系列分析である場合、制御部23によって特定される変換処理は、時系列を表す複数の入力x1を1つに結合する変換処理、各データ点の時間間隔が異なる場合、時間間隔を調整するようにデータ点の補完、削除、又は補正を行う変換処理、外部データD0としてのカレンダー情報、気象情報、又は人口統計情報を第1の入力データD1と結合し、時系列を表す入力x1と関連付ける変換処理などを含む。
【0028】
モデル表示部236は、第1の入力データD1に基づき、モデル情報IF1を、学習モデルごとに比較可能な態様で表示部34に表示させる。詳細には、モデル表示部236は、特定された学習器MLのうち、選択により選択された学習器MLを用いて生成されるモデル情報IF1を表示部34に表示させる。
【0029】
モデル情報IF1は、学習モデルM1に関する情報である。例えば、モデル情報IF1は、学習モデルM1の生成に用いられた第1の入力データD1の名称、容量、学習モデルM1が生成された日時などを含みうる。第1の入力データD1の名称とは、例えば、第1の入力データD1のファイル名である。本実施形態では、モデル情報IF1は、少なくとも学習モデルM1の予測精度に関する精度情報を含む。分析手法が回帰分析の場合、精度情報は、例えば、決定係数(R2スコア)、平均二乗誤差(MSE:Means Squared Error)、平均絶対誤差(MAE:Means Absolute Error)、平均二乗偏差(RMSE:Root Mean Squared Error)、二乗平均平方根誤差(RMSE:Root Mean Squared Error)、対数平均二乗誤差(RMLSE:Root Mean Squared Logarithmic Error)、平均絶対パーセント誤差(MAPE:Mean Absolute Percentage Error)などの指標を含む。分析手法が分類分析の場合、精度情報は、正解率(Accuracy)、再現率(Recall)、適合率(Precision)、特異度(Specificity)、F値(F-measure)、重み付きF値、マシューズ相関係数(MCC:Matthews Correlation Coefficient)、カッパ係数(Kappa)、ログ損失(Logloss)、AUC:Area Under the Curve、PR-AUC:Area Under the Precision-Recall curveなどの指標を含む。上記精度情報は、二値分類に用いられるものに限られず、2より大きい他クラス分類に用いられるものであってもよい。分析手法が時系列分析の場合、精度情報は、例えば、変動係数(Coefficient of Variation)、動的時間伸縮法での平均絶対誤差(Dynamic Time Warping MAE)、MAPE、対称平均絶対パーセント誤差(SMAPE:Symmetric MAPE)、加重SMAPE、平均絶対スケール誤差(MASE:Mean Absolute Scaled Error)、MARRE: Mean Absolute Ranged Relative Error、Overall Percentage error、R2、rho-risk RMSLEなどの指標を含む。精度情報は、各パラメータの統計値、例えば、MAEの中央値(MAE median)、MAEの平均値(MAE mean)などを含んでもよい。ある分析手法の指標が、他の分析手法の指標として用いられてもよい。
【0030】
処理表示部237は、第1の入力データD1と第2の入力データD2との差異点を認識可能な態様で、表示部34に表示させる。例えば、処理表示部237は、第1の入力データD1と第2の入力データD2との差異点512を、第1の入力データD1と第2の入力データD2との共通点511と異なる態様で表示させる。例えば、処理表示部237は、両者を色彩、形状、模様の少なくとも1つが異なる態様で表示させる。別例として、処理表示部237は、矢印等の所定の目印を、第1の入力データD1と第2の入力データD2の差異点512に対応付けて表示させてもよい。
【0031】
処理条件表示部238は、少なくとも入力された第1の入力データD1と、特定された学習器MLと、に基づき、変換処理が行われる条件を認識可能な態様で表示させる。本実施形態において、変換処理が行われる条件とは、上述した変換条件に相当する。
【0032】
モデル表示部236は、第1の入力データD1に基づき、特定された学習器MLが生成する学習モデルM1に関するモデル情報IF1を、学習モデルM1ごとに比較可能な態様で表示部34に表示させる。本実施形態のモデル表示部236は、少なくとも、生成される学習モデルM1ごとの精度情報を比較可能に表示させる。例えば、モデル表示部236は、それぞれの学習モデルM1に関するモデル情報IF1を、表示部34に一覧可能に表示させる。
【0033】
3.情報処理の詳細
本節では、前述した情報処理システム1において実行される情報処理について説明する。なお、当該情報処理は、アクティビティ図に図示されない、任意の例外処理を含みうる。例外処理は、当該情報処理の中断や、各処理の省略を含む。当該情報処理にて行われる選択又は入力は、ユーザによる操作に基づくものでも、ユーザの操作に依らず自動で行われるものでもよい。
【0034】
図5は、情報処理システム1において実行される情報処理の流れの一例を示すアクティビティ図である。図5に示すように、アクティビティA001にて、データ受付部231は、第1の入力データD1の入力を受け付ける。
【0035】
次にアクティビティA002にて、学習器特定部232は、第1の入力データD1に応じて複数の学習器MLを特定する。
【0036】
次にアクティビティA003にて、学習器選択受付部233は、アクティビティA002にて特定された学習器MLの選択を受け付ける。
【0037】
学習器MLの選択を受け付けた後、処理がアクティビティA004に進み、分析手法選択受付部234は、分析手法の選択を受け付ける。分析手法は、予め定められたものでも、特定され、又は選択された学習器MLに応じて特定されるものでもよい。
【0038】
分析手法の選択を受け付けた後、処理がアクティビティA005に進み、制御部23は、分析手法選択受付部234によって選択された学習器MLに応じて、変換処理を特定する。詳細には、制御部23は、さらに、特定され、又は選択された分析手法に基づき、変換処理を特定する。例えば、アクティビティA004にて選択された分析手法が時系列分析である場合、制御部23によって特定される変換処理は、時系列を表す複数の入力x1を1つに結合する変換処理、各データ点の時間間隔が異なる場合、時間間隔を調整するようにデータ点の補完、削除、又は補正を行う変換処理、外部データD0としてのカレンダー情報、気象情報、又は人口統計情報を第1の入力データD1と結合し、時系列を表す入力x1と関連付ける変換処理などを含む。
なお、変換処理の特定は、変換処理を行う必要がない場合などには、行う変換処理がないことを特定することを含みうる。
【0039】
制御部23は、当該変換処理が行われる条件、すなわち変換条件を特定してもよい。例えば、制御部23は、少なくとも第1の入力データD1と、アクティビティA002で特定され、又はアクティビティA005で選択された学習器MLと、に基づいて、変換条件を特定してもよい。例えば、制御部23は、第1の入力データD1を示す統計情報に基づき、変換条件を特定する。第1の入力データD1に関する統計情報とは、例えばデータ点の分布、平均値、分散、標準偏差、最大値、最小値、中央値、最頻値、再尤度、共分散、相関係数、R2値などを含む。変換処理が外れ値の除去の場合、制御部23は、あるデータ点と平均値との差分の絶対値が標準偏差の2倍以上である場合、当該データ点を外れ値と判断する。この場合、あるデータ点と平均値との差分の絶対値が標準偏差の2倍以上であることが、変換条件に相当する。
【0040】
次に処理がアクティビティA006に進み、制御部23は、アクティビティA005にて特定された変換処理の選択を受け付ける。
【0041】
次に処理がアクティビティA007に進み、処理表示部237は、アクティビティA006にて特定された変換処理に関する情報を表示部34に表示させる。変換処理に関する情報とは、例えば、変換処理の具体的内容、変換処理による第1の入力データD1の変化、変換処理によって生成される第2の入力データD2などである。例えば、処理表示部237は、特定された変換処理に基づき、第1の入力データD1と第2の入力データD2との差異点を、ユーザが認識可能な態様で表示部34に表示させる。これにより、ユーザは、第1の入力データD1に対して行われる変換処理の内容を直感的に認識しやすくなる。なお、この段階では第2の入力データD2は、実際に生成されている必要はなく、例えば第1の入力データD1と変換処理とに基づいて生成されることが予想されるものでもよい。
【0042】
アクティビティA007では、さらに処理条件表示部238が、変換処理が行われる条件を認識可能な態様で表示部34に表示させてもよい。これにより、変換処理のブラックボックス化が抑制される。
【0043】
次に処理がアクティビティA008に進み、制御部23は、第1の入力データD1に対して、アクティビティA006にて選択された変換処理を実行する。これにより、第2の入力データD2が生成される。
【0044】
次に処理がアクティビティA009に進み、制御部23は、第2の入力データD2を、アクティビティA003にて選択された学習器MLのそれぞれに入力する。このとき、制御部23は、選択された分析手法に基づき、学習器MLでの学習アルゴリズムを指定してもよい。これにより、学習器MLのそれぞれは、第1の入力データD1に基づいて学習モデルM1を生成する。詳細には、学習器MLは、第2の入力データD2を用いて学習モデルM1を生成する。なお、学習器MLは、情報処理システム1に含まれる任意の部材に保存されているものでも、情報処理システム1と電気通信回線を介して通信可能な外部装置に保存されているものでもよい。なお、外部装置の図示は省略されている。
【0045】
次に処理がアクティビティA010に進み、制御部23は、学習器MLのそれぞれから生成される学習モデルM1を取得する。
【0046】
次に処理がアクティビティA011に進み、モデル表示部236は、モデル情報IF1を表示部34に表示させる。
【0047】
4.表示部34に表示される内容の一例
本節では、上記情報処理に基づいて表示部34に表示される内容の一例について説明する。本実施形態では、ユーザが、第1の入力データD1を用いて、商品の売上価格の予測を行う場面を用いて説明する。本実施形態の表示部34には、受付ウィンドウ4と、データウィンドウ5と、変換処理ウィンドウ6と、モデル情報表示ウィンドウ7と、モデル検索ウィンドウ8と、モデル比較ウィンドウ9と、が表示され得る。
【0048】
4-1.受付ウィンドウ4の一例
まず、受付ウィンドウ4の詳細について説明する。図6は、表示部34に表示される受付ウィンドウ4の一例である。図6に示すように、受付ウィンドウ4は、入力データ受付エリア41と、学習器選択エリア42と、分析手法選択エリア43と、受付操作表示エリア44と、を含む。
【0049】
入力データ受付エリア41には、第1の入力データD1の入力を受け付けるユーザインタフェースが表示される。以下、説明の便宜上、ユーザインタフェースを単にUIという。入力データ受付エリア41は、インポートボタン411と、データ名表示エリア412と、を含む。
【0050】
ユーザは、インポートボタン411を操作することにより、第1の入力データD1をデータ受付部231に入力する。このとき、データ受付部231は、ユーザによるインポートボタン411の操作に基づき、ユーザによる第1の入力データD1の入力を受け付ける。
【0051】
データ名表示エリア412には、入力された第1の入力データD1の名称が表示される。
【0052】
学習器選択エリア42には、学習モデルM1の生成に用いられる学習器MLを選択可能なUIが表示される。学習器選択エリア42に表示される学習器MLは、学習器特定部232によって、データ受付部231が受け付けた第1の入力データD1に応じて特定される。例えば、学習器特定部232は、第1の入力データD1の容量、フォーマット、識別子に応じて、学習器選択エリア42に表示される学習器MLを特定する。本実施形態の学習器選択エリア42は、データ受付部231が第1の入力データD1の入力を受け付けた場合に学習器MLを選択可能なアクティブ状態となる。
学習器選択エリア42は、予測対象選択エリア421と、複数の学習器表示エリア422と、学習器選択表示エリア423と、第1の受付操作ボタン424と、を含む。
【0053】
予測対象選択エリア421は、学習モデルM1の出力y1となるパラメータを指定可能に構成されている。予測対象選択エリア421は、例えばプルタブ、リスト、ボタンなど、任意の対応で実現可能である。図6では、出力y1として、売上価格が指定されている。なお、指定される出力y1は1つに限られず、複数であってもよい。
【0054】
学習器表示エリア422には、アクティビティA002にて特定された学習器MLを選択可能なUIが表示される。例えば、学習器表示エリア422には、複数の学習器MLを区別可能な情報が表示される。当該区別可能な情報とは、学習器MLの名称、種類、アルゴリズムなど、任意の情報を含みうる。なお、特定された学習器MLの数が学習器表示エリア422の数より小さい場合、学習器表示エリア422の一部には、学習器MLの情報がないことが表示されてもよい。
【0055】
学習器選択表示エリア423には、学習器表示エリア422のそれぞれに対応する学習器MLが選択されているか否かが表示される。学習器選択表示エリア423の具体的態様はユーザが視覚的に把握可能であれば任意である。例えば、学習器選択表示エリア423には、チェックボックスでのチェックの有無、色彩の変化、濃淡の変化、枠線の変化などが表示される。
【0056】
第1の受付操作ボタン424は、ユーザの操作により、選択された学習器MLで後述する分析手法の選択を行うか否かを決定可能なUIである。分析手法の選択を行わないための操作が行われた場合、例えば、学習器選択エリア42に代わり入力データ受付エリア41がアクティブとなり、再度第1の入力データD1の受付が可能となる。
【0057】
一方、第1の受付操作ボタン424に対して分析手法の選択を行うための操作が行われた場合、分析手法選択エリア43がアクティブになる。分析手法選択エリア43には、ユーザが分析手法を選択可能なUIが表示される。分析手法選択エリア43は、分析手法選択ボタン431と、モデル名表示エリア432と、第2の受付操作ボタン433と、を含む。
【0058】
分析手法選択ボタン431は、ユーザによる操作に応じて、分析手法の選択を受付可能に構成されている。分析手法選択ボタン431は、例えばユーザのクリック操作、タップ操作、フリック操作を受付可能に構成されている。本実施形態では、分析手法選択ボタン431は、設定されている分析手法の数に応じて複数存在する。選択されている分析手法選択ボタン431の表示態様は、選択されていない分析手法選択ボタン431の表示態様と異なっていてもよい。これにより、ユーザは、どの分析手法が選択されているかを把握しやすくなる。
【0059】
モデル名表示エリア432は、入力データ受付エリア41で受け付けられた第1の入力データD1と、学習器選択エリア42にて選択された学習器MLと、分析手法選択エリア43で選択された分析手法と、に基づき生成される学習モデルM1の名称を表示可能に構成されている。なお、モデル名表示エリア432は、ユーザが当該学習モデルM1の名称を入力可能に構成されていてもよい。
【0060】
第2の受付操作ボタン433は、ユーザが上記学習モデルM1の生成を行うか否かを決定可能に構成されている。第2の受付操作ボタン433の操作に基づき学習モデルM1の生成を行わない決定がされた場合、分析手法選択エリア43に代えて、入力データ受付エリア41又は学習器選択エリア42がアクティブとなる。
【0061】
4-2.データウィンドウ5の一例
一方、第2の受付操作ボタン433の操作に基づき学習モデルM1の生成を行う決定がされた場合、データウィンドウ5及び変換処理ウィンドウ6が表示部34に表示される。図7は、表示部34に表示されるデータウィンドウ5及び変換処理ウィンドウ6の一例である。
【0062】
データウィンドウ5は、第1の入力データD1に関する情報を表示可能に構成されている。第1の入力データD1に関する情報とは、例えば、第1の入力データD1の名称、第1の入力データD1のデータ点の数、容量、第1の入力データD1に含まれるデータ点の内容などである。データウィンドウ5は、変数名表示エリア50と、集計グラフ表示エリア51と、集計情報表示エリア52と、個別情報表示エリア53と、を含む。
【0063】
変数名表示エリア50では、第1の入力データD1に含まれる入力x1を識別可能な情報が表示される。例えば、変数名表示エリア50では、第1の入力データD1から入力x1のそれぞれの名称に相当する情報が表示される。
【0064】
集計グラフ表示エリア51では、入力データ視覚情報が表示される。入力データ視覚情報は、第1の入力データD1に関する情報が視覚的に表示されたものである。入力データ視覚情報は、例えばヒストグラム、折れ線グラフ、円グラフ、又はバブルチャートなどを用いて表示される。入力データ視覚情報は、これらの組み合わせを用いて表示されてもよい。例えば、入力データ視覚情報は、第1の入力データD1の統計情報を含む。詳細には、入力データ視覚情報は、入力x1ごとの第1の入力データD1の統計情報を含む。本実施形態では、入力データ視覚情報は、第1の入力データD1のデータ点の分布のヒストグラムとして集計情報表示エリア52に表示されている。また、入力データ視覚情報は、これらの表示態様の組み合わせとして集計情報表示エリア52に表示されてもよい。例えば、上記ヒストグラム及び上記折れ線グラフは、集計情報表示エリア52に一覧可能に表示されていてもよい。また、上記ヒストグラム及び上記折れ線グラフは、集計情報表示エリア52に重畳して表示されていてもよい。
集計グラフ表示エリア51では、第1の入力データD1と第2の入力データD2との差異点512を認識可能な態様で表示されている。差異点512は、第1の入力データD1と第2の入力データD2との差分に対応するともいえる。第1の入力データD1と第2の入力データD2との差異点512は、第1の入力データD1と第2の入力データD2との共通点511と異なる態様で表示される。例えば、処理表示部237は、両者を色彩、形状、模様の少なくとも1つが異なる態様で表示させる。別例として、処理表示部237は、矢印等の所定の目印を、第1の入力データD1と第2の入力データD2の差異点512に対応付けて表示させてもよい。
【0065】
集計情報表示エリア52では、第1の入力データD1に関する統計情報が表示されている。集計情報表示エリア52にて表示される統計情報は、例えば最大値、最小値、平均値、標準偏差である。また、当該統計情報は、第1の入力データD1の欠損値の数を表示してもよい。統計情報は、数値や文字列として表示されても、ヒストグラムなどの視覚情報として表示されてもよい。
【0066】
個別情報表示エリア53では、第1の入力データD1に含まれるデータ点の情報が表示される。詳細には、個別情報表示エリア53では、入力x1ごとのデータ点の情報が表示される。個別情報表示エリア53での表示態様は任意であるが、例えば、入力x1ごとのデータ点の情報が、テーブル形式で表示される。
【0067】
4-3.変換処理ウィンドウ6について
変換処理ウィンドウ6では、少なくとも、第1の入力データD1に対して行う変換処理に関する情報が表示される。本実施形態では、変換処理ウィンドウ6は、データウィンドウ5と一覧可能に表示されるが、データウィンドウ5と別々に表示されてもよい。変換処理ウィンドウ6の表示モードは、第1の表示モード6aと、第2の表示モード6bと、を含む。第1の表示モード6aでは、変換処理ウィンドウ6は、第1の入力データ情報表示エリア61と、生成条件表示エリア62と、自動変換処理表示エリア63と、処理条件表示エリア64と、第1の処理実行ボタン65と、手動変換移行ボタン66と、処理保存ボタン67と、を含む。
【0068】
第1の入力データ情報表示エリア61には、第1の入力データD1又は第2の入力データD2に関する情報が表示される。本実施形態では、変換処理によって生成される第2の入力データD2に関する情報が表示される。第2の入力データD2に関する情報とは、例えば、第2の入力データD2の容量、第2の入力データD2のサイズ、第1の入力データD1と第2の入力データD2との容量の差分などである。
【0069】
生成条件表示エリア62には、学習モデルM1の生成条件が表示される。学習モデルM1の生成条件とは、例えば、予測対象選択エリア421にて選択された予測対象、学習器表示エリア422にて選択された学習器ML、学習器MLで用いられるアルゴリズムなど任意である。
【0070】
自動変換処理表示エリア63は、処理表示部237で特定される自動変換処理の内容を表示する。変換処理の内容とは、例えば、第1の入力データD1の一部の削除、欠損値の補完、外れ値の削除、第1の入力データD1の規格化などである。第1の入力データD1の一部の削除とは、説明変数として用いられる可能性の低い入力x1を削除することである。このような入力x1としては、例えば各データ点のID番号などである。なお、データウィンドウ5にて表示される第1の入力データD1のうち、変換処理による変更部分は、インジケータL1によって示唆される。インジケータL1は、例えば色彩、形状、模様の差異に基づいて、変換処理によって変更部分を示唆する。インジケータL1は、変更部分に対応する領域を、他の領域と異なる輪郭線で示唆するものでもよい。
【0071】
処理条件表示エリア64には、自動変換処理表示エリア63にて表示される自動変換処理の変換条件が表示される。詳細には、処理条件表示エリア64には、自動変換処理のそれぞれに対応する変換条件が、当該自動変換処理ごとに表示される。
【0072】
第1の処理実行ボタン65は、制御部23に自動変換処理表示エリア63に表示された自動変換処理を実行させるためのUIである。ユーザは、第1の処理実行ボタン65を操作することによって制御部23に当該自動変換処理を実行させることができる。
【0073】
手動変換移行ボタン66は、ユーザの操作に応じて、変換処理ウィンドウ6の表示モードを第1の表示モード6aから第2の表示モード6bに遷移させるものである。第2の表示モード6bは、ユーザが手動で変換処理を指定可能な表示モードである。図8は、第2の表示モード6bの場合に表示部34に表示される変換処理ウィンドウ6の一例を示す図である。手動変換移行ボタン66が操作されることにより、変換処理ウィンドウ6は、手動変換処理指定エリア661と、手動変換処理保存エリア662と、を含む表示モードに遷移する。このとき、処理条件表示エリア64及び第1の処理実行ボタン65が非表示となってもよい。これにより、ユーザが手動での変換処理の指定に重要度の低い表示を減らし、操作の便宜の向上を図ることができる。
【0074】
手動変換処理指定エリア661は、自動変換処理と異なる変換処理をユーザが指定可能に構成されている。以下、説明の便宜上、手動変換処理指定エリア661にて指定された変換処理を、手動変換処理という。例えば、変換処理が外れ値の除去の場合、手動変換処理指定エリア661には外れ値の候補が表示される。ユーザは、当該候補のなかから変換処理で除去されるものを指定する。また、変換処理が欠損値の補完の場合、手動変換処理指定エリア661には、自動変換処理で補完される欠損値の候補が表示される。ユーザは、当該候補のなかから変換処理で補完されるものを指定する。これらの指定は、例えば、手動変換処理保存エリア662に含まれるチェックボックス、スライダー、ボタンなどの視覚情報に対する操作によって実現可能である。
【0075】
なお、指定された手動変換処理を含む変換処理によって生成される第2の入力データD2が変化することがある。この場合、手動変換処理を含む変換処理によって生成される第2の入力データD2と、第1の入力データD1と、の共通点511及び差異点512は、集計グラフ表示エリア51に表示されてもよい。また、集計グラフ表示エリア51には、手動変換処理前後での第2の入力データD2の差異点が、上述した共通点511及び差異点512と異なる態様で表示されてもよい。これにより、ユーザは、指定した手動変換処理の内容を視覚的に把握可能となる。また、当該表示は、手動変換処理の指定と連動して行われることが好ましい。これにより、手動変換処理の指定が第1の入力データD1に与える影響の把握が容易となる。
【0076】
手動変換処理保存エリア662は、ユーザによる操作に基づき、手動変換処理を保存するか否かを決定可能なUIである。手動変換処理を保存しない決定が行われた場合、当該手動変換処理が破棄される。その後、変換処理ウィンドウ6の表示モードが第2の表示モード6bから第1の表示モード6aに遷移する。一方、手動変換処理を保存する決定が行われた場合、当該手動変換処理が変換処理として更新される。その後、変換処理ウィンドウ6の表示モードが第2の表示モード6bから第1の表示モード6aに遷移する。
【0077】
処理保存ボタン67は、ユーザの操作に基づいて変換処理の内容を保存するか否かを決定可能なUIである。変換処理の内容を保存しない決定がされた場合、制御部23は、第1の入力データD1に対して変換処理を行わず、情報処理を終了する。このとき、制御部23は、表示部34に、再度受付ウィンドウ4を表示させてもよい。
【0078】
一方、変換処理の内容を保存する決定がされた場合、第1の入力データD1に対して変換処理が実行される。この場合、手動変換処理の指定が行われていた場合、第1の入力データD1に対して手動変換処理が行われる。一方、手動変換処理の指定が行われていない場合、第1の入力データD1に対して自動変換処理が行われる。これにより、第2の入力データD2が生成される。なお、生成された第2の入力データD2は、記憶部22に保存されてもよい。その後、学習条件に基づいて第2の入力データD2を、特定された学習器MLのそれぞれに入力することで、学習器MLのそれぞれから学習モデルM1が生成される。その後、学習モデルM1についてのモデル情報表示ウィンドウ7が表示部34に表示される。
【0079】
4-4.モデル情報表示ウィンドウ7について
次に、表示部34に表示されるモデル情報表示ウィンドウ7の一例について説明する。図9は、表示部34に表示されるモデル情報表示ウィンドウ7の一例を示す図である。モデル情報表示ウィンドウ7には、生成された学習モデルM1に関する情報が表示される。本実施形態では、生成された学習モデルM1の1つに関する情報が表示される。モデル情報表示ウィンドウ7は、第2の入力データ情報表示エリア71と、モデル情報表示エリア72と、シミュレーション実行ボタン73と、を含む。
【0080】
第2の入力データ情報表示エリア71には、学習器MLに入力された入力データに関する情報が表示される。本実施形態では、第2の入力データD2に関する情報が表示される。例えば、第2の入力データ情報表示エリア71には、第2の入力データD2の容量、サイズなどが表示される。
【0081】
モデル情報表示エリア72には、生成された学習モデルM1に関するモデル情報IF1が表示される。本実施形態では、モデル情報表示エリア72には、少なくとも学習モデルM1の予測精度に関する精度情報を含む。モデル情報表示エリア72は、複数の精度情報表示エリア721と、寄与度表示エリア722と、寄与度一覧表示ボタン725と、を含む。
【0082】
精度情報表示エリア721には、学習モデルM1の精度情報が表示される。本実施形態では、精度情報表示エリア721のそれぞれには、異なる精度情報が表示される。具体的には、精度情報表示エリア721のそれぞれには、決定係数、平均二乗誤差、平均二乗偏差が、個別に表示されている。精度情報表示エリア721には、各精度情報の数値、各精度情報の意味、各精度情報の評価方法、各精度情報の改善方法などが表示されうる。
【0083】
寄与度表示エリア722には、学習モデルM1の説明変数、すなわち、学習モデルM1の生成に用いられた入力x1ごとの出力y1への寄与度が表示される。寄与度は、例えば学習モデルM1における入力x1ごとの係数に基づいて導出される。寄与度は、増加寄与度と減少寄与度とを含む。増加寄与度は、入力x1の寄与度のうち出力y1の増加に関与する成分である。減少寄与度は、入力x1の寄与度のうち出力y1の減少に関与する成分である。この場合、学習モデルM1における入力x1ごとの係数は、増加寄与度に対応する成分と、減少寄与度に対応する成分と、を含みうる。寄与度表示エリア722は、増加寄与度が表示される増加寄与度表示エリア723と、減少寄与度が表示される減少寄与度表示エリア724と、を含む。
【0084】
増加寄与度表示エリア723及び減少寄与度表示エリア724には、増加寄与度と減少寄与度とが区別可能に表示される。また、増加寄与度表示エリア723及び減少寄与度表示エリア724には、増加寄与度と減少寄与度とが比較可能に表示される。例えば、増加寄与度表示エリア723及び減少寄与度表示エリア724には、増加寄与度と減少寄与度とが横棒グラフとして比較可能かつ一覧可能に表示される。本実施形態では、寄与度表示エリア722には、全部の入力x1のうちの一部の寄与度が表示される。具体的には、寄与度表示エリア722には、全部の入力x1のうち、寄与度が高いものから順に所定の序数、例えば5番目、までのものが表示される。これにより、ユーザは、が出力y1に影響を与えやすい入力x1を認識しやすくなる。
【0085】
寄与度一覧表示ボタン725は、全部の入力x1のうちの一部の寄与度のみが表示されている場合に、ユーザによる操作に基づいて入力x1の寄与度の表示数を増加させるUIである。寄与度一覧表示ボタン725の操作に基づいて、全部の入力x1の寄与度が表示されてもよい。
【0086】
シミュレーション実行ボタン73は、ユーザによる操作に基づいて、学習モデルM1を用いた予測シミュレーションを実行するためのUIである。例えば、予測シミュレーションは、所定の条件を満たす出力y1に対応する入力x1の探索である。所定の条件とは、例えば、出力y1が予め定められた閾値以上となることや、所定の試行回数において出力y1が最大又は最大となること、などである。入力x1が学習モデルM1に入力されると、出力y1が得られる。このとき、予め定められた定義域内で入力x1を変化させることで、入力x1の変化に応じて出力y1が変化する。これにより、出力y1が所定の条件を満たす場合における入力x1が導出される。例えば、出力y1が売上価格である場合で、所定の条件が売上価格の最大化の場合、ユーザは、当該予測シミュレーションにより、売上価格が最大となる入力x1を得ることができる。
【0087】
4-5.モデル検索ウィンドウ8及びモデル比較ウィンドウ9について
制御部23は、表示部34にモデル検索ウィンドウ8及びモデル比較ウィンドウ9を表示させてもよい。図10は、表示部34に表示されたモデル検索ウィンドウ8及びモデル比較ウィンドウ9の一例である。
【0088】
モデル検索ウィンドウ8は、過去に生成された学習モデルM1を検索可能なUIを含む。具体的には、モデル検索ウィンドウ8は、検索条件入力エリア81と、検索結果表示エリア82と、検索ウィンドウ終了ボタン83と、を含む。
【0089】
検索条件入力エリア81は、検索に用いられる検索条件を受付可能に構成されている。検索条件は、例えば、学習モデルM1の名称、アルゴリズム、出力y1の名称などのキーワード、学習モデルM1の学習条件、学習モデルM1が生成された時期など、任意である。また、検索条件入力エリア81は、ユーザによる操作に基づいて、受け付けられた検索条件をもとに学習モデルM1の検索を実行可能に構成されている。
【0090】
検索結果表示エリア82には、検索条件入力エリア81が受け付けた検索条件に基づく検索結果が表示される。検索結果表示エリア82には、検索条件に適合する過去の学習モデルM1が一覧可能に表示される。検索結果表示エリア82には、当該過去の学習モデルM1のモデル情報IF1の少なくとも一部がユーザに視認可能に表示されていてもよい。これにより、検索結果の一覧性が向上する。検索結果表示エリア82に表示される過去の学習モデルM1は、ユーザにより指定可能に構成されている。ユーザによる学習モデルM1の指定は、チェックボックス等のインジケータにより視認可能に表示される。以下、説明の便宜上、検索結果表示エリア82にて指定された学習モデルM1を、指定学習モデルM2という。
【0091】
検索ウィンドウ終了ボタン83は、ユーザの操作に基づき過去の学習モデルM1の検索を終了するUIである。
【0092】
モデル比較ウィンドウ9では、指定学習モデルM2のモデル情報IF1を比較可能に表示される。モデル比較ウィンドウ9は、比較モデル表示エリア91と、パラメータ選択エリア92と、比較結果表示エリア93と、シミュレーション実行ボタン94と、を含む。
【0093】
比較モデル表示エリア91では、検索結果表示エリア82にて指定された学習モデルM1のモデル情報IF1の少なくとも一部が表示される。比較モデル表示エリア91では、ユーザが、比較モデル表示エリア91に表示される指定学習モデルM2のうちの1つを指定可能に構成されている。
【0094】
パラメータ選択エリア92では、ユーザが指定学習モデルM2の生成及び評価に用いられるパラメータを選択可能に構成されている。本実施形態では、2つのパラメータを選択可能に構成されている。指定学習モデルM2の生成及び評価に用いられるパラメータは、モデル情報IF1に含まれる各種精度情報や、指定学習モデルM2の学習条件などが含まれる。以下、説明の便宜上、パラメータ選択エリア92にて選択されるパラメータを、選択パラメータという。
【0095】
比較結果表示エリア93では、指定学習モデルM2のそれぞれの選択パラメータを一覧可能な視覚情報が表示される。視覚情報とは、例えば、散布図、ヒストグラム、相関図、三次元プロット図など、任意である。これにより、指定学習モデルM2の精度比較を容易に行うことができる。
【0096】
シミュレーション実行ボタン94は、ユーザによる操作に基づき、指定学習モデルM2を用いた予測シミュレーションを実行するUIである。予測シミュレーションに用いられる指定学習モデルM2は、例えば比較モデル表示エリア91にて指定される指定学習モデルM2である。
【0097】
本実施形態では、モデル比較ウィンドウ9は、モデル検索ウィンドウ8と一覧可能に表示されている。これにより、検索結果と指定学習モデルM2との比較が容易となる。
【0098】
5.その他
前述の実施形態に係る情報処理システム1に関して、以下のような態様を採用してもよい。
【0099】
第1の入力データD1及び第2の入力データD2は、それぞれ外部データD0としてデータベースDB1に記憶されてもよい。これらの外部データD0は、所定の条件のもと、他のユーザに提供可能であってもよい。
【0100】
制御部23は、データウィンドウ5、変換処理ウィンドウ6、モデル情報表示ウィンドウ7の少なくとも1つに、第1の入力データD1に対して行われた変換処理の履歴、いわゆる変換処理のバージョン、を表示させてもよい。これにより、変換処理と精度情報との関係性の類推が容易となる。また、制御部23は、変換処理のバージョンの管理を行ってもよい。
【0101】
制御部23は、例えば、第1の入力データD1が所定の品質条件を満たさない場合、表示部34に警告を表示させてもよい。品質条件とは、例えば、第1の入力データD1のデータ点の数、容量、外れ値の割合などである。品質条件を満たさない場合とは、例えば、第1の入力データD1のデータ点の数が所定の値未満である場合、第1の入力データD1の外れ値が所定の基準数より多い場合などである。当該警告は、受付ウィンドウ4、データウィンドウ5、変換処理ウィンドウ6、モデル情報表示ウィンドウ7、モデル検索ウィンドウ8、及びモデル比較ウィンドウ9のうちの少なくとも1つでも、それ以外のウィンドウでもよい。なお、当該警告は、表示部34に表示されるものに限られず、音、振動、光など任意の態様で実現可能である。
【0102】
情報処理装置2は、オンプレミス形態であってもよく、クラウド形態であってもよい。クラウド形態の情報処理装置2としては、例えば、SaaS(Software as a Service)、クラウドコンピューティングという形態で、上述の機能や処理を提供してもよい。
【0103】
以上の実施形態では、情報処理装置2が種々の記憶・制御を行ったが、情報処理装置2に代えて、複数の外部装置が用いられてもよい。すなわち、ブロックチェーン技術等を用いて、第1の入力データD1、第2の入力データD2、学習モデルM1を分散して複数の外部装置に記憶させてもよい。
【0104】
次に記載の各態様で提供されてもよい。
【0105】
(2)前記情報処理システムにおいて、前記モデル情報は、少なくとも前記学習モデルの予測精度に関する精度情報を含み、前記モデル表示ステップでは、生成される前記学習モデルごとの前記精度情報を比較可能に表示させる、もの。
【0106】
このような構成によれば、ユーザは第1の入力データに適した学習モデルを、精度情報に基づき判断することが可能となる。したがって、ユーザに要求されるデータサイエンスに関する知見の水準を、さらに下げることができる。
【0107】
(3)前記情報処理システムにおいて、さらに、学習器選択受付ステップでは、特定された前記学習器に対する選択をユーザより受け付け、前記モデル表示ステップでは、特定された前記学習器のうち、前記選択により選択された前記学習器を用いて生成される前記モデル情報を表示させる、もの。
【0108】
このような構成によれば、ユーザは、ユーザ自身の利用態様に合わせて、学習モデルを生成させる学習器を選択することができるため、利便性の向上を図ることができる。
【0109】
(4)前記情報処理システムにおいて、さらに、データ処理ステップでは、入力された前記第1の入力データを、特定された前記学習器に入力可能な態様である第2の入力データに変換する変換処理を実行し、前記モデル情報は、前記学習器によって前記第2の入力データを用いて生成される前記学習モデルに関する、もの。
【0110】
このような構成によれば、ユーザが第1の入力データを、特定された学習器のそれぞれに入力可能な第2の入力データに変換する労力を軽減することができる。
【0111】
(5)前記情報処理システムにおいて、さらに、処理表示ステップでは、前記第1の入力データと前記第2の入力データとの差異点を認識可能な態様で表示させる、もの。
【0112】
このような構成によれば、ユーザは、第1の入力データと第2の入力データとの差異点に基づき、変換処理を把握することができる。したがって、ユーザにとって学習モデルがブラックボックス化する可能性を低減することができる。
【0113】
(6)前記情報処理システムにおいて、さらに、処理条件表示ステップでは、少なくとも入力された前記第1の入力データと、特定された前記学習器と、に基づき、前記変換処理が行われる条件を認識可能な態様で表示させる、もの。
【0114】
このような構成によれば、ユーザは、変換処理が行われる根拠を条件として認識することができるため、学習モデルがブラックボックス化する可能性をさらに低減することができる。
【0115】
(7)前記情報処理システムにおいて、さらに、分析手法選択受付ステップでは、複数の分析手法のうちの前記学習モデルの生成に用いられる少なくとも1つの選択を受け付ける、もの。
【0116】
このような構成によれば、ユーザが学習モデルの利用態様に応じて分析手法を選択することができるため、さらなる利便性の向上を図ることができる。
【0117】
(8)前記情報処理システムにおいて、前記分析手法は、分類分析、回帰分析、及び時系列分析のうちの少なくとも1つを含む、もの。
【0118】
このような構成によれば、分析手法のなかでも特に汎用性の高い、分類分析、回帰分析、及び時系列分析のうちの少なくとも1つを用いることが可能となるため、さらなる利便性の向上を図ることができる。
【0119】
(9)前記情報処理システムにおいて、前記第1の入力データは、少なくともユーザが保有する保有データを含む、もの。
【0120】
このような構成によれば、保有データに含まれるユーザ固有の条件が学習モデルに反映可能となるため、さらなる予測精度の向上を図ることができる。
【0121】
(10)前記情報処理システムにおいて、前記第1の入力データは、少なくとも構造化データを含む、もの。
【0122】
このような構成によれば、第1の入力データの構造に基づき、学習モデルの予測精度のさらなる向上を図ることができる。
【0123】
(11)情報処理方法であって、前記情報処理システムの各ステップを含む、もの。
【0124】
(12)情報処理プログラムであって、コンピュータに、前記情報処理システムの各ステップを実行させる、もの。
もちろん、この限りではない。
【0125】
さらに、以下のような観点にも留意されたい。
【0126】
深層学習(Deep Learning、DL)をはじめとする機械学習(Machine Learning、ML)の技術を様々な局面で利用しようとする動きが加速し、一種のブームとも言える状況が生まれている。しかしこのような盛り上がりに反し、ML導入のプロジェクトの85%が失敗し、MLやAI(Artificial Intelligence、人工知能)技術を活用できている企業は10%、情報系企業ですら17%にとどまると言われる。
【0127】
これには様々な原因がある。第1にMLやAIがいかなる問題に対して有効かの理解が簡単ではないこと、第2にMLを使うためにはどういうデータを用意すればよいのか、どのようにデータの加工と前処理をすればよいのかが経験と勘に依存すること、第3にデータを大量に準備することが容易ではないこと、第4にMLやAIのモデルをどう構築したらよいのかの理解が簡単ではなく、しかも経験と勘に依存すること、第5にMLの一手法であるDLからなぜ欲する出力を得られるのかの理解が困難なこと、第6に以上のように理解が進まない結果として満足できる性能を得ることができないことなどが挙げられる。
【0128】
上述のとおり、MLを成功裏に活用するためには様々な障害が存在する反面、インターネット上には多くのMLサービスやAIサービスが存在し、どれを使えばよいのか分からないというカオス的状況にもある。
【0129】
その上、上記のMLサービス、AIサービスを使いこなすためにはたくさんのパラメータを入力しなければならず、パラメータの意味の理解も難しく、MLやAIの専門家でなければ使いこなせないという現実も存在する。いわば、MLサービスやAIサービスは専門家以外にも使える民主化されたサービスとはなっていなかった。
【0130】
前述の状況を鑑み、専門的な知識を有していなくても使いこなすことができ、入力データを準備さえすれば3ステップでMLサービスを使うことができ、得られた結果に対する解析を提供し、さらには予測も行うことのできる技術を提供することにより、誰でもMLサービスを利用できる環境を創出することが本発明の目的である。これによりMLサービスが民主化される。
【0131】
上記課題を解決するための技術的思想は、インターネット上に存在する多くのML(以下AutoMLと呼ぶ)サービスへ接続するためのラッピング・インターフェースシステムを提供することである。これにより、データの収集、前処理、アップロードなどのデータ準備(ステップ1)、モデル構築と複数のMLの並行的実行(ステップ2)、各MLの性能比較と実業務への導入(ステップ3)の3ステップでMLの導入が可能となる。
【0132】
そのためにまずアカウント設定やパラメータ入力手順等を一元化し、次に各AutoMLへとフォーマット変換を施す。これにより10~15ステップが必要であったアカウント作成を3ステップで行うことが可能となる。
【0133】
次に、社内外のデータを収集する。このために必要な社内外データへのアクセスポイントに対して自動的に、あるいはユーザーの介入と補助を得ながら接続が行なわれ、データが収集される。
【0134】
続いて、入力データの加工を行う。以下に限られないが、これにはデータのクレンジングとして日付データなどの形式の一元的形式への変換、欠損の多いデータ項目の処理などを行い、原データから統計的処理を含む前処理を適用して目的に適したデータに変換すること、クエリを使用してデータ抽出やデータ結合などを行うことなどが含まれる。
【0135】
このとき、必要に応じて加工後のデータを表示して確認と修正を行ってもよい。
【0136】
次に、MLモデルの準備を行う。インターネット上に存在する各種MLサービスの利用に限られず、GUI(Graphical User Interface)ベースによってプログラミングを行わずに独自モデルを構築する方法、インターネット上に存在する各種MLサービスの修正を行って独自モデルを構築する方法、および既に構築されているがインターネット上には公開されていないMLモデルを本発明システムへインポートを行う方法等によって行われる。
【0137】
さらには、プログラミングすることなく、MLや統計分析を可能にする機能も提供される。加えて、どのようなテンプレートでモデル構築を行えば精度の高いモデルが構築できるかについて、入力データからリコメンドする機能も提供される。
【0138】
MLに入力されるデータを学習データと予測データに分割し、学習データによって学習したMLに予測データを入力してもよい。予測データはML性能比較等のためにこれ以降使われる。
【0139】
入力データとMLモデルの準備が終了したら、学習データを用いて学習が開始される。
このとき複数のMLを並行的に実行させてもよい。
【0140】
学習が終わったら、予測データが自動的あるいはユーザーの指示によって各MLサービスに投入され、結果を得る。このとき複数のAutoMLが並行的に実行されていれば、即座に性能比較ができる。
【0141】
各AutoMLサービスの結果を表示する。これにはグラフィカルな可視化を含み、各MLサービスの予測精度レベル(決定係数)、項目の寄与度の比較などが表示される。
【0142】
上記のデータ収集~結果の表示と比較までを繰り返し、実業務に投入が可能だとユーザーによって判断されたら、運用が開始される。
【0143】
運用において、用意されたAPI(Application Program Interface)によってアプリケーションプログラムから本システムへ問い合わせを行うことによって結果がアプリケーションプログラムによって活用すること、あるいは本システムから直接結果を表示することも本発明の範囲である。
【0144】
運用の自動化のためにKubeflowを含むMLプラットフォームを利用しても良い。
【0145】
上記一連の操作をパイプライン化し、操作の単純化を図っても良い。パイプライン化することにより自由度は下がるが全体の見通しが良くなり、専門家でなくても扱うことが可能となる。もし自由度を上げる必要があるときには、詳細画面を開く等によって専門的な項目設定を行っても良い。
【0146】
さらにはパイプラインの流れに沿って各種変更や操作履歴の記録と閲覧が可能となり、MLサービスやモデル選択の根拠を示すことが可能となる。
【0147】
採用すべきMLモデルとそれに必要なデータ前処理方法が決定された後に、実業務に導入される。例えば、MLの出力として売上予測が欲しい場合、直接本発明システムによって表示される画面を見ても良いし、必要に応じて本発明システムが提供するAPIを介してアプリケーションプログラムから情報提供のリクエストが出され、それによってアプリケーションプログラムの画面に表示されても良い。
【0148】
そこで、上記課題を解決するために、第1の態様に係る情報処理方法は、アカウント設定、パラメータ入力手順設定のうち少なくともいずれかを含む初期設定作業を一元化する第1のステップと、インターネット上に存在し得る自動機械学習サービスへ接続するためのフォーマット変換を施す第2のステップと、社内外のデータが収集される第3のステップと、前記収集されたデータを加工する第4のステップと、使用されるべき自動機械学習サービスの準備を行う第5のステップと、前記第4のステップにおいて加工されたデータを学習データと予測データとに分割し、前記学習データを前記第5のステップにおいて準備が行われた自動機械学習サービスによって学習させる第6のステップとを具備することを特徴とする。
【0149】
また、上記課題を解決するために、第2の態様に係る情報処理装置は、アカウント設定、パラメータ入力手順設定のうち少なくともいずれかを含む初期設定作業を一元化することのできる一元化部と、インターネット上に存在し得る自動機械学習サービスへ接続するためのフォーマット変換を施すフォーマット変換部と、社内外のデータが収集されるデータ収集部と、前記収集されたデータを加工するデータ加工部と、使用されるべき自動機械学習サービスの準備を行う準備部と、前記データ加工部によって加工されたデータを学習データと予測データとに分割し、前記学習データを前記準備部によって準備が行われた自動機械学習サービスによって学習させる学習部とを具備することを特徴とする。
【0150】
上記2つの態様によれば、深層学習をはじめとする機械学習技術の専門家でなくても、学習データを準備さえすれば学習モデルの選択および/または構築ができ、複数の学習モデルの結果から性能の比較ができ、複数の学習モデルから最適なものを選択でき、それを実業務に投入し、投入後の運用をサポートすることができることとなる。
【0151】
第3の態様として、第2の態様において、前記収集され準備された入力データをインターネット上に存在する多くの自動機械学習サービスに応じた変換を行うようにしてもよい。この態様によれば、機械学習サービス毎に異なる入力データを準備するプロセスを省くことが可能となる。なお、この第3の態様は第1の態様に対して重畳的に用いることもできる。
【0152】
第4の態様として、第2の態様において、入力データの単純な形式変換、欠損データもしくは重複・不要データの処理を含むデータクレンジング、原データからの特徴量の抽出、統計的処理を含む前処理を適用して目的に適したデータへの変換、クエリを使用したデータ抽出もしくはデータ結合を含むデータ変換、のうちの少なくともいずれかを実行するようにしてもよい。この態様によれば、入力データの単純な形式変換、欠損データもしくは重複・不要データの処理を含むデータクレンジング、原データからの特徴量の抽出、統計的処理を含む前処理を適用して目的に適したデータへの変換、クエリを使用したデータ抽出もしくはデータ結合を含むデータ変換、を簡単な指示を与えることにより実行することが可能となる。なお、この第4の態様は第1の態様に対して重畳的に用いることもできる。
【0153】
第5の態様として、第2の態様において、インターネット上に存在する複数の機械学習サービスあるいは機械学習モデルを一覧できる一覧部と、前記一覧部にて一覧される複数の機械学習サービスあるいは機械学習モデルのうちのいずれかへの接続が選択される選択部と、前記選択部によって選択されたことにより一括して複数の機械学習サービスあるいは機械学習モデルへのデータ投入、平行的実行、結果の取得及び比較、のうちの少なくともいずれかを実行する実行部とをさらに備えるようにしてもよい。なお、この第5の態様は第1の態様に対して重畳的に用いることもできる。
【0154】
第6の態様として、第2の態様において、前記学習部及び/もしくは前記準備部は、グラフィカル・ユーザー・インターフェース手段によって行われるようにしてもよい。この態様によれば、上記の機械学習サービスを選択することに加え、グラフィカル・ユーザー・インターフェースをベースにした手法でユーザー独自の機械学習モデルを構築することができ、および/または、公開情報として存在する機械学習モデルをインポートすることができる。なお、この第6の態様は第1の態様に対して重畳的に用いることもできる。
【0155】
第7の態様として、第2の態様において、前記学習部において前記加工されたデータが前記学習データと前記予測データとに分割されるにおいては、機械学習への入力データを学習用データと性能比較および/または予測データに分割されるようにしてもよい。この態様によれば、前記機械学習への入力データを学習用データと性能比較および/または予測データに分割して利用することができる。なお、この第7の態様は第1の態様に対して重畳的に用いることもできる。
【0156】
第8の態様として、第2の態様において、同一入力データによって実行した複数の機械学習サービスあるいは機械学習モデルの性能を比較するための指標を提供する指標提供部をさらに備えるようにしてもよい。なお、この第8の態様は第1の態様に対して重畳的に用いることもできる。
【0157】
第9の態様として、第8の態様において、前記指標として、決定係数、平均絶対誤差、平均二乗偏差、項目寄与度、モデルの予測と実際の比較、残差ヒストグラム、のうちの少なくともいずれかを含む機械学習サービスと機械学習モデルの性能の比較を行うための指標が提示されるようにしてもよい。なお、この第9の態様は第1の態様に対して第8の態様が重畳された態様に対して重畳的に用いることもできる。
【0158】
第10の態様として、第2の態様において、複数の機械学習サービスと前記複数のうちのそれぞれの機械学習モデルの結果とから選択する選択部をさらに備えるようにしてもよい。この態様によれば、複数の機械学習サービスと前記複数のうちのそれぞれの機械学習モデルの結果とから最適なものが選択されて実業務への投入を行うことができる。なお、この第10の態様は第1の態様に対して重畳的に用いることもできる。
【0159】
第11の態様として、第2の態様において、前記機械学習サービスと前記機械学習モデルの精度の維持及び/もしくは管理とを行うことのできる維持管理部をさらに備えるようにしてもよい。この態様によれば、実投入後に前記機械学習サービスと前記機械学習モデルの精度の維持及び/もしくは管理とを行うことのできる機能が提供される。
なお、この第11の態様は第1の態様に対して重畳的に用いることもできる。
【0160】
第12の態様として、第2の態様において、前記データの収集・準備、複数の機械学習サービスと機械学習モデルの平行的実行、機械学習サービスと機械学習モデルの性能比較、実業務への投入の操作をパイプライン化するパイプライン部をさらに備えるようにしてもよい。この態様によれば、上記データの収集・準備、複数の機械学習サービスと機械学習モデルの平行的実行、機械学習サービスと機械学習モデルの性能比較、実業務への投入の操作がパイプライン化され、全体の見通しをよくすることができる。なお、この第12の態様は第1の態様に対して重畳的に用いることもできる。
【0161】
第13の態様として、第12の態様において、前記パイプライン化された処理の様々な中間段階で、必要に応じてユーザーが介入することを許容するユーザー介入部をさらに具備するようにしてもよい。この態様によれば、パイプライン化された処理の様々な中間段階で、必要に応じてユーザーが介入して詳細な設定や操作が行われてもよいこととなる。なお、この第13の態様は第1の態様に対して第12の態様が重畳された態様に対して重畳的に用いることもできる。
【0162】
第14の態様として、第2の態様において、前記機械学習サービスあるいは前記機械学習モデルの処理結果を得るために、アプリケーションプログラムからアプリケーションプログラムインターフェースを介して前記データの要求が行われるデータ要求部をさらに具備するようにしてもよい。この態様によれば、実業務へ投入された機械学習サービスあるいは機械学習モデルの処理結果を得るために、アプリケーションプログラムからアプリケーションプログラムインターフェースを介して本発明システムに対してデータの要求が行われ、それぞれのアプリケーションプログラムで表示を含む処理がされてもよいこととなる。なお、この第14の態様は第1の態様に対して重畳的に用いることもできる。
【0163】
第15の態様として、第2の態様において、前記一元化部、前記フォーマット変換部、前記データ収集部、前記データ加工部、前記準備部、前記学習部、のうちの少なくともいずれかにおける画面がデータの収集と準備に係る画面、機械学習モデルの選択・構築・実行に係る画面、各学習モデルの性能比較に係る画面、機械学習モデルの選択を決定して実業務への導入する画面、の少なくともいずれかを含む画面遷移を有するようにしてもよい。この態様によれば、データの準備とアップロードから複数のML間の性能の比較と実業務への導入までの各ステップにおいて、複数の画面を用いてユーザーと情報がやり取りされるが、これらの画面がデータの収集と準備(前処理、アップロード等)に関わる画面、機械学習モデルの選択・構築・実行に関わる画面、(モデル構築、MLの実行)、各学習モデルの性能比較に関する画面、そして機械学習モデルの選択を決定して実業務への導入する画面を含む画面遷移を有するから、画面遷移定義において学習プロセスが設計できることとなる。なお、この第15の態様は第1の態様に対して重畳的に用いることもできる。
【0164】
また、上記課題を解決するために、第16の態様に係るプログラムは、コンピュータを、専門家の介在無しに、収集された学習データをそれぞれの機械学習サービスや機械学習モデルに合致するように変換するデータ加工・変換部と、欠損データや重複・不要データの処理を含むデータクレンジング部と、原データからの特徴量の抽出を行う特徴量抽出部と、統計的処理を含む前処理を適用して目的に適したデータへの変換やクエリを使用したデータ抽出やデータ結合を含むデータ変換を行うデータ結合・分割部と、データの正規化・標準化を行う正規化・標準化部と、複数の機械学習サービスや機械学習モデルを選択するサービス・モデル選択部と、機械学習モデルを構築するためのノーコード開発部と、平行的に複数の機械学習サービスや機械学習モデルを実行するシミュレーション部と、結果を表示し比較するモデル評価部と、最適な機械学習サービスあるいは機械学習モデルを選択するモデル選択部と、選択モデルを実業務へ投入し運用する投入・運用部と、上記一連の各部の機能をサポートするサポート部と、として機能させることを特徴とする。
【0165】
上記態様によれば、専門家の介在無しに、収集された学習データをそれぞれの機械学習サービスや機械学習モデルに合致するように変換するデータ加工・変換部、欠損データや重複・不要データの処理を含むデータクレンジング部、原データからの特徴量の抽出を行う特徴量抽出部、統計的処理を含む前処理を適用して目的に適したデータへの変換やクエリを使用したデータ抽出やデータ結合を含むデータ変換を行うデータ結合・分割部、データの正規化・標準化を行う正規化・標準化部、複数の機械学習サービスや機械学習モデルを選択するサービス・モデル選択部、プログラミングをすることなしに独自の機械学習モデルを構築するノーコード開発部、平行的に複数の機械学習サービスや機械学習モデルを実行するシミュレーション部、結果を表示し比較するモデル評価部、最適な機械学習サービスあるいは機械学習モデルを選択するモデル選択部、選択モデルを実業務へ投入し運用する投入・運用部、およびこれら一連をサポートするサポート部、として機能することが可能となる。
【0166】
第17の態様として、第16の態様に係るプログラムが記憶された記録媒体として実現することもできる。
【0167】
最後に、本開示に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。当該新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。当該実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0168】
1 :情報処理システム
2 :情報処理装置
3 :ユーザ端末
4 :受付ウィンドウ
5 :データウィンドウ
6 :変換処理ウィンドウ
6a :第1の表示モード
6b :第2の表示モード
7 :モデル情報表示ウィンドウ
8 :モデル検索ウィンドウ
9 :モデル比較ウィンドウ
20 :通信バス
21 :通信部
22 :記憶部
23 :制御部
30 :通信バス
31 :通信部
32 :記憶部
33 :制御部
34 :表示部
35 :入力部
41 :入力データ受付エリア
42 :学習器選択エリア
43 :分析手法選択エリア
44 :受付操作表示エリア
50 :変数名表示エリア
51 :集計グラフ表示エリア
52 :集計情報表示エリア
53 :個別情報表示エリア
61 :第1の入力データ情報表示エリア
62 :生成条件表示エリア
63 :自動変換処理表示エリア
64 :処理条件表示エリア
65 :第1の処理実行ボタン
66 :手動変換移行ボタン
67 :処理保存ボタン
71 :第2の入力データ情報表示エリア
72 :モデル情報表示エリア
73 :シミュレーション実行ボタン
81 :検索条件入力エリア
82 :検索結果表示エリア
83 :検索ウィンドウ終了ボタン
91 :比較モデル表示エリア
92 :パラメータ選択エリア
93 :比較結果表示エリア
94 :シミュレーション実行ボタン
231 :データ受付部
232 :学習器特定部
233 :学習器選択受付部
234 :分析手法選択受付部
235 :データ処理部
236 :モデル表示部
237 :処理表示部
238 :処理条件表示部
411 :インポートボタン
412 :データ名表示エリア
421 :予測対象選択エリア
422 :学習器表示エリア
423 :学習器選択表示エリア
424 :第1の受付操作ボタン
431 :分析手法選択ボタン
432 :モデル名表示エリア
433 :第2の受付操作ボタン
511 :共通点
512 :差異点
661 :手動変換処理指定エリア
662 :手動変換処理保存エリア
721 :精度情報表示エリア
722 :寄与度表示エリア
723 :増加寄与度表示エリア
724 :減少寄与度表示エリア
725 :寄与度一覧表示ボタン
A001 :アクティビティ
A002 :アクティビティ
A003 :アクティビティ
A004 :アクティビティ
A005 :アクティビティ
A006 :アクティビティ
A007 :アクティビティ
A008 :アクティビティ
A009 :アクティビティ
A010 :アクティビティ
A011 :アクティビティ
D0 :外部データ
D1 :第1の入力データ
D2 :第2の入力データ
DB1 :データベース
IF1 :モデル情報
L1 :インジケータ
M1 :学習モデル
M2 :指定学習モデル
ML :学習器
x1 :入力
y1 :出力
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10