(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-11
(45)【発行日】2022-10-19
(54)【発明の名称】文字列データ処理システム
(51)【国際特許分類】
G06F 16/35 20190101AFI20221012BHJP
【FI】
G06F16/35
(21)【出願番号】P 2018096375
(22)【出願日】2018-05-18
【審査請求日】2021-03-19
(73)【特許権者】
【識別番号】591281666
【氏名又は名称】株式会社大塚商会
(74)【代理人】
【識別番号】100088214
【氏名又は名称】生田 哲郎
(74)【代理人】
【識別番号】100205084
【氏名又は名称】吉浦 洋一
(72)【発明者】
【氏名】大塚 裕司
(72)【発明者】
【氏名】地主 隆宏
【審査官】鹿野 博嗣
(56)【参考文献】
【文献】米国特許出願公開第2012/0134576(US,A1)
【文献】特開2014-215883(JP,A)
【文献】特開2001-188726(JP,A)
【文献】北田 俊輔、彌冨 仁,CE-CLCNN:Character Encoderを用いたCharacter-level Convolutional Neural Networksによるテキスト分類,言語処理学会第24回年次大会 発表論文集 [online],日本,言語処理学会,2018年03月05日,p.1179~1182,[検索日:2022年3月2日] Internet<URL:http://www.anlp.jp/proceedings/annual_meeting/2018/pdf_dir/B6-5.pdf>
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/35
(57)【特許請求の範囲】
【請求項1】
システムログから成る文字列データを分類する文字列データ処理システムであって,
入力を受け付けた文字列データを画像データに変換する画像化処理部と,
前記変換した画像データに基づく画像解析処理により,前記文字列データの分類を行う画像解析処理部と,
前記画像解析により,前記文字列データが所定のラベルに分類された場合,あらかじめ定めた情報を通知する出力処理部,
を有することを特徴とする文字列データ処理システム。
【請求項2】
前記画像解析処理として,
あらかじめ記憶している分類ごとの画像データと,処理対象とする画像データとの類似度を比較し,類似度が高い画像データが対応する分類に,前記処理対象とする画像データを分類する,
ことを特徴とする請求項1に記載の文字列データ処理システム。
【請求項3】
前記画像解析処理は,AIコンピュータシステムにおいて実行する処理であって,
画像データに分類ごとのラベルを付して学習をさせておき,
処理対象とする画像データにおける特徴量を特定することで,前記処理対象とする画像データを分類する,
ことを特徴とする請求項1または請求項2に記載の文字列データ処理システム。
【請求項4】
コンピュータを,
入力を受け付けたシステムログから成る文字列データを画像データに変換する画像化処理部,
前記変換した画像データに基づく画像解析処理により,前記文字列データの分類を行う画像解析処理部,
前記画像解析により,前記文字列データが所定のラベルに分類された場合,あらかじめ定めた情報を通知する出力処理部,
として機能させる
ことを特徴とする文字列データ処理プログラム。
【請求項5】
請求項
4に記載の文字列データ処理プログラムを備えるネットワーク機器。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は,文字列データについて,自動で分類処理を行う文字列データ処理システムに関する。
【背景技術】
【0002】
さまざまな文字列データは,その内容に応じて分類がされていることが好ましい。人であれば,文字列データをその文意に基づいて理解することができるが,文字列データの分類には時間がかかり,コンピュータほどの処理速度を期待することはできない。
【0003】
そこでコンピュータによって,文字列データを自動的に分類するため,自然言語解析の研究がなされている。自然言語解析の技術を用いれば,文字列データにおける文字列を構造データ(数値データ)に変換して判別するので,迅速な処理が可能となる。自然言語解析に関する技術として,下記非特許文献1がある。
【0004】
また,近年,AI(artificial intelligence:人工知能)の技術が発達をしていることから,AIを用いて文書分類を行うことも研究されている。AIを用いて文書分類を行う技術として,下記非特許文献2がある。
【先行技術文献】
【非特許文献】
【0005】
【文献】竹元義美,福島俊一,山田洋志,”辞書およびパターンマッチルールの増強と品質強化に基づく日本語固有表現抽出”,情報処理学会論文誌 Vol.42 No.6,p.1580~p.1591
【文献】難波英嗣,”人工知能による文書分類”,情報の科学と技術 66巻6号,p.277~p.281
【発明の概要】
【発明が解決しようとする課題】
【0006】
非特許文献1のように,自然言語解析の技術を用いて文字列データを分類する場合,構造データ化,既知の単語を定義し,その単語の重要度を決めるなどの前処理が必要となる。また,処理対象から除外すべき文字列などのルールも一つ一つ定義しておかなければならない。そのため,作業に時間を要する。さらに,自然言語解析の場合,文意がある場合には適用することができるが,たとえばコンピュータのシステムログのように,文意がない文字列データに対しては適用することができない。
【0007】
また,非特許文献2のように,AIを用いた文書分類の場合,文字列データをそのままAIに処理させているので,精度が高くない問題がある。
【課題を解決するための手段】
【0008】
そこで本発明者は上記課題に鑑み,文字列データの分類を,従来とは異なる観点で行う文字列データ処理システムを発明した。
【0009】
第1の発明は,文字列データを分類する文字列データ処理システムであって,入力を受け付けた文字列データを画像データに変換する画像化処理部と,前記変換した画像データに基づく画像解析処理により,前記文字列データの分類を画像解析コンピュータに行わせる画像解析依頼処理部と,を有する文字列データ処理システムである。
【0010】
第2の発明は,文字列データを分類する文字列データ処理システムであって,入力を受け付けた文字列データを画像データに変換する画像化処理部と,前記変換した画像データに基づく画像解析処理により,前記文字列データの分類を行う画像解析処理部と,を有する文字列データ処理システムである。
【0011】
これらの発明では,文字列データを文字列としてそのまま処理をするのではなく,画像データに変換をしてその類似度により,分類を行っている。そのため,従来の自然言語解析を行う必要がないので,自然言語解析における課題が発生しない。また,AIコンピュータシステムでは,文字列を入力した場合の処理の精度は高くないが,画像認識の処理の精度は文字列の処理よりは高い。そのため,AIコンピュータシステムを用いた場合であっても,従来の文字列の処理より,高い精度の結果を得ることができる。
【0012】
上述の発明において,前記画像解析処理として,あらかじめ記憶している分類ごとの画像データと,処理対象とする画像データとの類似度を比較し,類似度が高い画像データが対応する分類に,前記処理対象とする画像データを分類する,文字列データ処理システムのように構成することができる。
【0013】
上述の発明において,前記画像解析処理は,AIコンピュータシステムにおいて実行する処理であって,画像データに分類ごとのラベルを付して学習をさせておき,処理対象とする画像データにおける特徴量を特定することで,前記処理対象とする画像データを分類する,文字列データ処理システムのように構成することができる。
【0014】
画像解析処理としては各種の方法を用いることができるが,これらの発明を用いて処理をすることが好ましい。
【0015】
上述の発明において,前記画像化処理部は,前記文字列データについてテキストマイニング技法を用いて画像データに変換する,文字列データ処理システムのように構成することができる。
【0016】
第1の発明の文字列データ処理システムは,本発明のプログラムをコンピュータに読み込ませて実行することで実現できる。すなわち,コンピュータを,入力を受け付けた文字列データを画像データに変換する画像化処理部,前記変換した画像データに基づく画像解析処理により,前記文字列データの分類を画像解析コンピュータに行わせる画像解析依頼処理部,として機能させる文字列データ処理プログラムのように構成することができる。
【0017】
第2の発明の文字列データ処理システムは,本発明のプログラムをコンピュータに読み込ませて実行することで実現できる。すなわち,コンピュータを,入力を受け付けた文字列データを画像データに変換する画像化処理部,前記変換した画像データに基づく画像解析処理により,前記文字列データの分類を行う画像解析処理部,として機能させる文字列データ処理プログラムのように構成することができる。
【0018】
上述の発明において,前記文字列データはシステムログであって,前記文字列データ処理プログラムは,前記画像解析により,前記文字列データが所定のラベルに分類された場合,あらかじめ定めた情報を通知する出力処理部,として機能させる文字列データ処理プログラムのように構成することができる。
【0019】
システムログは,ある程度決められた範囲の文字列が同じフォーマットでログとして出力される。そのため,画像化した際の画像データに一定の傾向が発生しやすいと考えられる。そのため,本発明を用いると効果が高い。
【0020】
上述の文字列データ処理プログラムは,ネットワーク機器に備えるとよい。それによって,ネットワーク機器のシステムログの監視,検知を行うことができる。
【発明の効果】
【0021】
本発明の文字列データ処理システムでは,従来のように,文字列データをそのまま処理するのではなく,画像データに変換し,その画像データの類似性に基づいて分類を行うことができる。これによって,従来よりも容易に,かつログデータのように文意がない場合であっても,自動的に分類をすることができる。また,文字列データをそのままAIに処理させる場合には精度が高くないが,画像情報に変換することで,精度を高めて分類をすることができる。
【図面の簡単な説明】
【0022】
【
図1】本発明の文字列データ処理システムの全体の構成の一例を模式的に示すブロック図である。
【
図2】本発明の文字列データ処理システムで用いるコンピュータのハードウェア構成の一例を模式的に示すブロック図である。
【
図3】本発明の文字列データ処理システムの処理プロセスの一例を示すフローチャートである。
【
図4】画像解析コンピュータを学習するための,正常時のシステムログの文字列データの一例を示す図である。
【
図5】
図4の文字列データを共起ネットワークにより変換した画像データの一例を示す図である。
【
図6】画像解析コンピュータを学習するための,異常時のシステムログの文字列データの一例を示す図である。
【
図7】
図6の文字列データを共起ネットワークにより変換した画像データの一例を示す図である。
【
図8】処理対象として読み込ませる文字列データであるシステムログの一例を示す図である。
【
図9】
図8の文字列データを共起ネットワークにより変換した画像データの一例を示す図である。
【
図11】実施例2における正常時のシステムログの文字列データの一例を示す図である。
【
図12】
図11の文字列データを自己組織化マップにより変換した画像データの一例を示す図である。
【
図13】実施例2における異常時のシステムログの文字列データの一例を示す図である。
【
図14】
図13の文字列データを自己組織化マップにより変換した画像データの一例を示す図である。
【
図15】本発明の文字列データ処理システムの全体の構成のほかの一例を模式的に示すブロック図である。
【発明を実施するための形態】
【0023】
本発明の文字列データ処理システム1の全体のシステム構成の一例を
図1に,文字列データ処理システム1で用いるコンピュータのハードウェア構成の一例を
図2に示す。
【0024】
文字列データ処理システム1は,制御コンピュータ2と画像解析コンピュータ3とを用いる。これらの各コンピュータは,プログラムの演算処理を実行するCPUなどの演算装置70と,情報を記憶するRAMやハードディスクなどの記憶装置71と,ディスプレイなどの表示装置72と,情報の入力を行う入力装置73と,演算装置70の処理結果や記憶装置71に記憶する情報の通信をする通信装置74とを有している。なお,コンピュータがタッチパネルディスプレイを備えている場合には表示装置72と入力装置73とが一体的に構成されていてもよい。タッチパネルディスプレイは,たとえばタブレット型コンピュータやスマートフォンなどの可搬型通信端末などで利用されることが多いが,それに限定するものではない。
【0025】
タッチパネルディスプレイは,そのディスプレイ上で,直接,所定の入力デバイス(タッチパネル用のペンなど)や指などによって入力を行える点で,表示装置72と入力装置73の機能が一体化した装置である。
【0026】
文字列データ処理システム1は一台のコンピュータによって実現されていてもよいが,その機能が複数のコンピュータによって実現されていてもよい。この場合のコンピュータとして,たとえばクラウドサーバであってもよい。
図1の文字列データ処理システム1では,制御コンピュータ2と画像解析コンピュータ3とが別々のコンピュータの場合を示しているが,同一のコンピュータにそれぞれの機能が一体的に構築されていてもよい。本発明の各手段は,その機能が論理的に区別されているのみであって,物理上あるいは事実上は同一の領域を為していても良い。
【0027】
また,画像解析コンピュータ3(画像解析処理部25)は,あらかじめ学習している画像データとそれに対応づけられたラベルとに基づいて,入力された画像データがどのラベルであるかを解析するコンピュータシステムである。この際に,入力された一つの画像データに対して,一つのラベルのみを結果として返してもよいし,各ラベルの確信度(精度)を結果として返してもよい。画像解析コンピュータ3としては,公知の画像解析処理用のコンピュータシステムを用いることができる。画像解析コンピュータ3における画像解析の手法には限定はなく,さまざまな手法が適用できる。画像解析コンピュータ3として,複数の企業が提供する画像解析用のコンピュータシステム,とくに画像解析用のAIコンピュータシステムを用いることもできる。画像解析用のAIコンピュータシステムの一例としては,IBM社が提供する「Watson Visual Recognition」,Google社が提供する「Cloud Vision API」,マイクロソフト社が提供する「Computer Vision API」などがある。なお,上記は一例であり,どのような画像解析用のコンピュータシステムであっても用いることができる。
【0028】
制御コンピュータ2は,文字列データ入力受付処理部21と画像化処理部22と画像解析依頼処理部23と出力処理部24とを有する。
【0029】
文字列データ入力受付処理部21は,文字列データの入力を受け付ける。文字列データとしては,システムログのデータ,文書データなど,文字列(文字,数字,記号などにより構成されるデータ列)によって構成されるデータであれば足りる。好ましくはテキストファイルであることがよいが,それに限定するものではない。
【0030】
画像化処理部22は,文字列データを画像化する処理を実行する。文字列データを画像化するにはさまざまな方法を用いることができるが,たとえば文字列データをそのまま画像データに変換をしてもよいし,文字列データにおける文字列に含まれる特徴量に基づいて画像データに変換をしてもよい。文字列に含まれる特徴量に基づいて画像データに変換する処理としては,たとえばテキストマイニング技法における共起ネットワーク,自己組織マップなどを用いることができるが,それに限定するものではない。
【0031】
共起ネットワークとは,文字列データ中の文字列(単語)の出現パターンの似通った単語を線で接続したネットワークであって,出現数が多い単語ほど大きく,また共起の程度が強いほど太い線で描画される。
【0032】
自己組織化マップとは,大脳皮質の視覚野をモデル化したものであって,教師なし学習によって入力データを任意の次元に写像するモデルである。
【0033】
画像解析依頼処理部23は,画像化処理部22で変換した画像データを画像解析コンピュータ3に送り,画像解析処理を行わせる。
【0034】
画像解析コンピュータ3で行わせる画像解析処理としては,制御コンピュータ2から受け付けた画像データについて,あらかじめ定められた分類のどれに該当するかの画像解析処理を実行する。画像解析処理としては,あらかじめ記憶している分類ごとの画像データと,入力させた画像データとの類似度を比較し,類似度が高い画像データが対応する分類に,当該入力した画像データを分類する。
【0035】
また,画像解析コンピュータ3として,画像解析用のAIコンピュータシステムを用いる場合には,画像データに分類ごとのラベルを付して教師データとして学習をさせておく。そして,学習済の画像解析用のAIコンピュータシステムに対して,入力された画像データを入力することで,学習済の画像解析用のAIコンピュータシステムが当該画像データにおける特徴量を特定し,画像データを分類する。画像解析処理としては,入力した画像データがどれに分類されるかの結果を返せればよく,上記に限定するものではない。
【0036】
出力処理部24は,画像解析コンピュータ3から画像解析処理の結果を受け付け,その出力を行う。たとえば画像解析コンピュータ3における分類の結果と,入力した文字列データとを対応づけて表示を行う。出力処理部24は,画像解析に基づく分類の結果の表示を行うほか,所定の項目(ラベル)に分類されるなど,所定の条件を充足した場合には,あらかじめ定めた担当者が利用するコンピュータや電子メールアドレスに対して,分類結果など,あらかじめ定めた情報を通知するようにしてもよい。
【実施例1】
【0037】
つぎに本発明の文字列データ処理システム1の処理プロセスの一例を
図3のフローチャートを用いて説明する。なお,以下の説明では,文字列データとしてシステムログのデータを用い,分類として,「正常」,「異常」の2種類である場合を説明するが,それに限定するものではない。また,画像解析コンピュータ3としては,公知の画像解析用のAIコンピュータシステムを用い,画像化処理部22における画像化処理として,共起ネットワークを用いる場合を説明する。
【0038】
まず,画像解析用のAIコンピュータシステムを学習させるため,正常時のシステムログの文字列データの入力を,制御コンピュータ2の文字列データ入力受付処理部21で受け付け,画像化処理部22における共起ネットワークによる画像化処理を実行し画像データに変換する。そして変換した画像データに「正常」のラベルを付して,画像解析用のAIコンピュータシステムに学習をさせておく。正常時のシステムログの文字列データの一例を
図4に示す。また
図4の文字列データに画像化処理を実行した画像データの一例を
図5に示す。なお,ここでのシステムログは,分析対象とするサーバやネットワーク機器など,分析対象と同一のサーバやネットワーク機器からのシステムログであることがよい。
【0039】
同様に,画像解析用のAIコンピュータシステムを学習させるため,異常時のシステムログの文字列データの入力を,制御コンピュータ2の文字列データ入力受付処理部21で受け付け,画像化処理部22における共起ネットワークによる画像化処理を実行し画像データに変換する。そして変換した画像データに「異常」のラベルを付して,画像解析用のAIコンピュータシステムに学習をさせておく。異常時のシステムログの文字列データの一例を
図6に示す。また
図6の文字列データに画像化処理を実行した画像データの一例を
図7に示す。なお,ここでのシステムログは,分析対象とするサーバやネットワーク機器など,分析対象と同一のサーバやネットワーク機器からのシステムログであることがよい。
【0040】
このように,正常時のシステムログの文字列データに基づいて,共起ネットワークによる画像化処理を実行した画像データと,異常時のシステムログの文字列データに基づいて,共起ネットワークによる画像化処理を実行した画像データとを,それぞれ複数,たとえばそれぞれ50枚以上について,画像解析コンピュータ3に学習をさせておく。なお,学習量としては50枚以上に限定をするものではなく,50枚未満であってもよいが,画像データ数が多いほど精度が向上するので,画像データ数は多い方が好ましい。
【0041】
以上のように,画像解析コンピュータ3における学習が行われた後,サーバやネットワーク機器などから出力されるシステムログの文字列データの入力を,制御コンピュータ2の文字列データ入力受付処理部21で受け付ける。(S100)。文字列データ入力受付処理部21に入力した,分析対象の文字列データの一例が,
図8とする。
【0042】
そして文字列データ入力受付処理部21で入力を受け付けた文字列データについて,画像化処理部22が,共起ネットワークによる画像化処理を実行し,画像データに変換をする(S110)。
図8の文字列データを,共起ネットワークにより画像データに変換したものが
図9である。
【0043】
そして,画像解析依頼処理部23は,S110で変換した画像データを画像解析コンピュータ3に送り,画像解析処理を実行させる。そして,画像解析コンピュータ3は,制御コンピュータ2から受け付けた画像データに対して画像解析処理を実行する(S120)。
【0044】
画像解析コンピュータ3は,画像データを画像解析した結果,すなわちどのラベルに分類したかを示す情報を制御コンピュータ2に返す。画像解析の結果として,もっとも高い類似度で分類された一つのラベルを返してもよいし,各ラベルについて確信度の情報を結果として返してもよい。
【0045】
そして出力処理部24は,画像解析コンピュータ3から受け付けた画像解析の結果である,入力した画像データに対する出力結果となるラベル,たとえば「正常」,「異常」を出力する(S130)。
【0046】
以上のような処理を実行することで,文字列データに対する分類を自動的に行うことができる。
【0047】
なお,文字列データがシステムログの場合,「異常」である結果を受け付けると,出力処理部24は,所定の担当者,たとえばシステム管理者が利用するコンピュータに異常が検知されたことを示す情報を通知してもよい。また画像解析の結果が,分類とそれに対する確信度を含む場合には,もっとも高い確信度を有する分類が「異常」であり,その確信度が所定値,たとえば70%以上である場合には,異常であるとして,出力処理部24は,所定の担当者,たとえばシステム管理者が利用するコンピュータに異常が検知されたことを示す情報を通知してもよい。
【0048】
正常時のシステムログの文字列データと,異常時のシステムログの文字列データとをサンプルデータとし,画像化処理部22における画像化処理として共起ネットワークを用い,また,画像解析コンピュータ3である画像解析用のAIコンピュータシステムとして,IBM社のWatson Visual recognitionを用いて,本発明の評価テストをした。
【0049】
まず画像解析用のAIコンピュータシステムの学習のため,正常時および異常時の文字列データをともに50個ずつ入力し,それらを画像化処理部22で共起ネットワークにより画像データに変換をして画像解析用のAIコンピュータシステムに学習をさせた。このような前処理のもと,正常時の文字列データを10個,異常時の文字列データを10個,それぞれ,文字列データ入力受付処理部21に入力し,画像化処理部22で共起ネットワークにより画像データに変換させ,変換した画像データを画像解析用のAIコンピュータシステムに入力して,画像解析処理を実行させた。
【0050】
その結果,画像解析用のAIコンピュータシステムからは,
図10に示す表の通りの解析結果が得られた。
図10(a)が正常時の文字列データから変換した画像データを入力した場合であり,
図10(b)が異常時の文字列データから変換した画像データを入力した場合である。正常時の文字列データから変換した画像データを入力した場合,画像解析用のAIコンピュータシステムは,正常の確信度の平均が90%(異常の確信度の平均が7%)として出力をしており,また異常時の文字列データから変換した画像データを入力した場合,画像解析用のAIコンピュータシステムは,異常の確信度の平均が92%(正常の確信度の平均が0%)として出力をしている。このことから,正常時および異常時の双方でも精度90%以上で出力されており,本発明の有効性が確かめられた。システムログは,ある程度決められた範囲の文字列が同じフォーマットでログとして出力される。そのため,画像化した際の画像データに一定の傾向が発生しやすいと考えられる。そのため,本発明を用いると効果が高い。
【実施例2】
【0051】
実施例1では,画像化処理部22は共起ネットワークにより文字列データを画像データに変換をしていたが,自己組織化マップにより文字列データを画像データに変換をしてもよい。
【0052】
文字列データ入力受付処理部21で入力を受け付けた正常時の文字列データが
図11であったとする。この場合,画像化処理部22で自己組織化マップにより変換した画像データが
図12である。
【0053】
また,文字列データ入力受付処理部21で入力を受け付けた異常時の文字列データが
図13であったとする。この場合,画像化処理部22で自己組織化マップにより変換した画像データが
図14である。
【0054】
なお,正常時および異常時のシステムログの文字列データについて,それぞれ自己組織化マップにより変換した画像データを生成しておき,それらを画像解析コンピュータ3,たとえば画像解析用のAIコンピュータシステムにあらかじめ学習をさせておくことは,実施例1と同様である。この場合も,それぞれ50枚以上の画像データを学習させておく。なお,学習量としては50枚以上に限定をするものではなく,50枚未満であってもよいが,画像データ数が多いほど精度が向上するので,画像データ数は多い方が好ましい。
【実施例3】
【0055】
上述の各実施例では,画像解析コンピュータ3を用いる場合を説明したが,制御コンピュータ2において画像解析処理を実行してもよい。この場合,制御コンピュータ2は,画像解析依頼処理部23の代わりに,画像解析処理部25を備える。この場合の文字列データ処理システム1の全体のシステム構成の一例を
図15に示す。
【0056】
画像解析処理部25は,画像解析コンピュータ3と同様の処理を実行する。すなわち,画像解析処理部25は,画像化処理部22が変換した画像データについて,あらかじめ定められた分類のどれに該当するかの画像解析処理を実行する。画像解析処理としては,あらかじめ記憶している複数の分類ごとの画像データと,入力させた画像データとの類似度を比較し,類似度が高い画像データが対応する分類に,当該入力した画像データを分類する。
【0057】
また,画像解析処理部25が画像解析用のAIコンピュータシステムとして機能する場合には,画像データに分類ごとのラベルを付して教師データとして学習をさせておく。そして,画像解析処理部25である学習済の画像解析用のAIコンピュータシステムに対して,変換した画像データを入力することで,画像解析処理部25が当該画像データにおける特徴量を特定し,画像データを分類する。画像解析処理としては,入力した画像データがどれに分類されるかの結果を返せればよく,上記に限定するものではない。
【0058】
そして本実施例3のように,制御コンピュータ2に画像解析処理部25を設けたとしても,実施例1,実施例2と同様に,本発明の効果を達成することができる。
【実施例4】
【0059】
本発明の文字列データ処理システム1は,文字列データを分類する目的であれば,いかなるシステムに用いることができるが,たとえば文字列データとしてシステムログとする場合には,たとえばサーバやルータなどのネットワーク機器に適用することができる。たとえばサーバやルータなどのネットワーク機器に,本発明の文字列データ処理システム1の機能を備えるほか,独立したコンピュータシステムとして備えていてもよい。また,サーバのほか,企業などの組織で使用されているコンピュータに備え,当該コンピュータにおけるログの分析に用いることもできる。
【0060】
また,本発明の文字列データ処理システム1をメールサーバなどに備えることで,SPAMメール(迷惑メール)と,それ以外の正常なメールとを区別する目的に利用することもできる。
【産業上の利用可能性】
【0061】
本発明の文字列データ処理システム1では,従来のように,文字列データをそのまま処理するのではなく,画像データに変換し,その画像データの類似性に基づいて分類を行うことができる。これによって,従来よりも容易に,かつログデータのように文意がない場合であっても,自動的に分類をすることができる。また,文字列データをそのままAIに処理させる場合には精度が高くないが,画像情報に変換することで,精度を高めて分類をすることができる。
【符号の説明】
【0062】
1:文字列データ処理システム
2:制御コンピュータ
3:画像解析コンピュータ
21:文字列データ入力受付処理部
22:画像化処理部
23:画像解析依頼処理部
24:出力処理部
25:画像解析処理部
70:演算装置
71:記憶装置
72:表示装置
73:入力装置
74:通信装置