IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 村田機械株式会社の特許一覧

<>
  • 特開-ログ解析装置 図1
  • 特開-ログ解析装置 図2
  • 特開-ログ解析装置 図3
  • 特開-ログ解析装置 図4
  • 特開-ログ解析装置 図5
  • 特開-ログ解析装置 図6
  • 特開-ログ解析装置 図7
  • 特開-ログ解析装置 図8
  • 特開-ログ解析装置 図9
  • 特開-ログ解析装置 図10
  • 特開-ログ解析装置 図11
  • 特開-ログ解析装置 図12
  • 特開-ログ解析装置 図13
  • 特開-ログ解析装置 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023179925
(43)【公開日】2023-12-20
(54)【発明の名称】ログ解析装置
(51)【国際特許分類】
   G06F 11/34 20060101AFI20231213BHJP
   H01L 21/02 20060101ALI20231213BHJP
【FI】
G06F11/34 176
G06F11/34 152
H01L21/02 Z
【審査請求】有
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2022092868
(22)【出願日】2022-06-08
(71)【出願人】
【識別番号】000006297
【氏名又は名称】村田機械株式会社
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【弁理士】
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100176245
【弁理士】
【氏名又は名称】安田 亮輔
(74)【代理人】
【識別番号】100183081
【弁理士】
【氏名又は名称】岡▲崎▼ 大志
(72)【発明者】
【氏名】井元 慎一郎
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042MA08
5B042MA11
5B042MA13
5B042MC15
5B042MC40
(57)【要約】
【課題】トラブル発生時のユーザのログ解析をより効率的に支援できる。
【解決手段】ログ解析装置1は、対象期間T内に搬送システム2においてイベント毎に出力された文字列からなる複数のログ情報31を取得するログ情報取得部12と、複数のログ情報31に基づいて、一連のイベント毎又は予め定められた長さの設定期間毎に、それぞれ一以上のログ情報31が結合された複数のログ文章33を生成する文章生成部13と、ログ文章33毎に、複数のログ文章33に基づいて設定された複数のトピックの各々に分類される度合いを示す第1スコアを算出する第1スコア算出部15と、ログ文章33毎に、第1スコアに基づいて、ログ文章33を複数のトピックのうちのいずれか一つのトピックに分類することの困難さの度合いを示す第2スコアを算出する第2スコア算出部16と、ログ文章33毎に算出された第2スコアをユーザに対して表示する表示部17と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
対象期間内に一以上の装置を含むシステムにおいてイベント毎に出力された文字列からなる複数のログ情報を取得するログ情報取得部と、
前記複数のログ情報に基づいて、一連のイベント毎又は予め定められた長さの設定期間毎に、それぞれ一以上の前記ログ情報が結合された複数のログ文章を生成する文章生成部と、
前記ログ文章毎に、前記複数のログ文章に基づいて設定された複数の主題の各々に分類される度合いを示す第1スコアを算出する第1スコア算出部と、
前記ログ文章毎に、前記第1スコアに基づいて、前記ログ文章を前記複数の主題のうちのいずれか一つの主題に分類することの困難さの度合いを示す第2スコアを算出する第2スコア算出部と、
前記ログ文章毎に算出された前記第2スコアをユーザに対して表示する表示部と、
を備えるログ解析装置。
【請求項2】
前記対象期間は、
前記システムにおいて解析対象のトラブルが発生していた期間を含むトラブル期間と、
前記トラブル期間よりも長く、且つ、前記システムにおいて前記トラブルが発生していなかった正常期間と、を含む、
請求項1に記載のログ解析装置。
【請求項3】
前記文章生成部は、前記ログ情報のうち予め不要な情報として定められた部分を除外して、前記ログ文章を生成する、
請求項1に記載のログ解析装置。
【請求項4】
前記文章生成部により生成された複数のログ文章に基づいて、各前記ログ文章が前記複数の主題の各々に分類される確率を示す確率分布を出力するモデルを生成するモデル生成部を更に備え、
前記第1スコア算出部は、前記複数のログ文章の各々について、前記モデルから出力される前記確率分布を前記第1スコアとして算出し、
前記第2スコア算出部は、前記ログ文章毎の前記第1スコアに基づいて、前記ログ文章毎のエントロピーを前記第2スコアとして算出する、
請求項1に記載のログ解析装置。
【請求項5】
前記表示部は、前記ログ文章に割り当てられた識別子と、前記ログ文章の前記第2スコアと、の組に対応する点がプロットされた散布図を生成及び表示する、
請求項1に記載のログ解析装置。
【請求項6】
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の前記第2スコアと、の組に対応する点がプロットされた散布図を生成及び表示する、
請求項1に記載のログ解析装置。
【請求項7】
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の少なくとも一つの前記主題に対応する前記第1スコアと、の組に対応する点がプロットされた散布図を生成及び表示する、
請求項1に記載のログ解析装置。
【請求項8】
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の少なくとも二以上の前記主題に対応する前記第1スコアと、の組に対応する点がプロットされた前記散布図を生成及び表示し、
前記表示部は、前記主題毎に区別可能な態様で、各前記点を前記散布図上に表示する、
請求項7に記載のログ解析装置。
【請求項9】
前記表示部は、前記散布図にプロットされた所定の点を選択するユーザ操作を受け付けた場合に、前記選択された点に対応する前記ログ文章を構成する前記ログ情報に関する詳細情報を生成及び表示する、
請求項5~8のいずれか一項に記載のログ解析装置。
【請求項10】
前記表示部は、前記散布図と共に、前記複数の主題の各々に対応する内容を視覚的に示す表示情報を生成及び表示する、
請求項7又は8に記載のログ解析装置。
【請求項11】
前記文章生成部により生成された複数のログ文章に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルであって、それぞれ各前記ログ文章が前記複数の主題の各々に分類される確率を示す確率分布を出力する前記複数のモデルを生成するモデル生成部を更に備え、
前記第1スコア算出部は、前記複数のログ文章の各々について、前記複数のモデルの各々から出力される前記確率分布を、前記モデル毎の前記第1スコアとして算出し、
前記第2スコア算出部は、
前記ログ文章毎の前記第1スコアに基づいて前記ログ文章毎のエントロピーを算出する処理を前記モデル毎に実行し、
前記ログ文章毎に、前記複数のモデルの各々について算出されたエントロピーの平均値を前記第2スコアとして算出する、
請求項1~8のいずれか一項に記載のログ解析装置。
【請求項12】
前記文章生成部により生成された複数のログ文章に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルであって、各前記ログ文章が前記モデル毎に設定される複数の主題の各々に分類される確率を示す確率分布を出力する前記複数のモデルを生成するモデル生成部と、
前記複数のモデルのうちから一の代表モデルを選定するモデル選定部と、
を更に備え、
前記第1スコア算出部は、前記複数のログ文章の各々について、前記複数のモデルの各々から出力される前記確率分布を、前記モデル毎の前記第1スコアとして算出し、
前記モデル選定部は、
前記ログ文章及び前記モデルの組み合わせ毎のエントロピーを取得し、
前記ログ文章毎に、複数の前記モデルの各々に対応するエントロピーの平均値を取得し、
前記ログ文章及び前記モデルの組み合わせ毎に、各前記モデルに対応するエントロピーと各前記ログ文章に対応する前記平均値との誤差に関する指標である誤差値を算出し、
複数の前記ログ文章の各々について算出された前記誤差値の総和が最小となる前記モデルを代表モデルとして選定し、
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の少なくとも一つの前記主題に対応する前記代表モデルの前記第1スコアと、の組に対応する点がプロットされた散布図を表示する、
請求項7又は8に記載のログ解析装置。
【請求項13】
前記装置は、物品を搬送する搬送車であり、
前記一連のイベントは、コントローラによって前記搬送車に割り付けられる一の搬送指令に対応して実行される一連の処理である、
請求項1~8のいずれか一項に記載のログ解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ログ解析装置に関する。
【背景技術】
【0002】
半導体製造工場等において、半導体ウェハが収納されるカセット等の物品を搬送する搬送車の走行を制御する搬送システムが知られている。このような搬送システムでトラブル(障害)が発生した場合、トラブルの原因を特定するために、搬送システムにおいて出力及び記録された文字列からなるログ情報の解析が必要になることがある。
【0003】
例えば特許文献1には、上記のようなログ解析に関連する手法として、半導体ウェハにエッチングや成膜等を施す基板処理装置にトラブルが発生した場合に、予め登録(記憶)されたトラブルに関連するキーワードを用いて基板処理装置で得られたログ情報を検索し、検索されたログ情報を強調表示する仕組みが開示されている。上記仕組みによれば、トラブルについて予め登録されたキーワードを用いることにより、ユーザ(作業者)がトラブルに関連するログを知らなくても、必要なログを自動的に検索及び強調表示できる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2008-140248号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記特許文献1に記載の手法では、予めトラブルの種類毎にキーワードを用意しておく必要がある。また、上記特許文献1に記載の手法では、未知のトラブル(すなわち、予めキーワードが登録されていないトラブル)に関連するログ情報を抽出することはできない。
【0006】
本発明は、トラブル発生時のユーザのログ解析を容易且つ正確に支援できるログ解析装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明に係るログ解析装置は、対象期間内に一以上の装置を含むシステムにおいてイベント毎に出力された文字列からなる複数のログ情報を取得するログ情報取得部と、複数のログ情報に基づいて、一連のイベント毎又は予め定められた長さの設定期間毎に、それぞれ一以上のログ情報が結合された複数のログ文章を生成する文章生成部と、ログ文章毎に、複数のログ文章に基づいて設定された複数の主題の各々に分類される度合いを示す第1スコアを算出する第1スコア算出部と、ログ文章毎に、第1スコアに基づいて、ログ文章を複数の主題のうちのいずれか一つの主題に分類することの困難さの度合いを示す第2スコアを算出する第2スコア算出部と、ログ文章毎に算出された第2スコアをユーザに対して表示する表示部と、を備える。
【0008】
上記ログ解析装置では、一連のイベント又は設定期間の単位で一以上のログ情報が結合されたログ文章毎に、複数の主題の各々に分類される度合い(第1スコア)が算出されると共に、一つの主題に分類することが困難な度合い(第2スコア)が算出される。通常のシステムでは、処理が正常に行われる期間においては、有限個のログ文章のパターンのいずれかに対応する一連の処理が繰り返し実行されることが多い。このため、いずれかの主題に分類されるログ文章(すなわち、第2スコアが比較的低いログ文章)は、正常な事象(例えば、上述したログ文章のパターンのうちの一つ)に対応している可能性が高い。これに対して、トラブル等の特異的な事象に対応するログ文章は、上述したログ文章のパターンのいずれにも分類されないため、正常な事象に対応するログ文章と比較して高い第2スコアが算出される可能性が高い。このようなログ文章毎の第2スコアがユーザに対して表示されることにより、ユーザは、個々のログ情報を詳細に確認することなく、トラブル等の特異的な事象に対応する可能性が高いログ文章(すなわち、第2スコアが比較的高いログ文章)を、容易に把握することができる。また、上記仕組みにおいては、イベント単位(すなわち、ログ情報単位)で見ると特異性がなくてもログ文章単位で見ると特異性のある事象を把握することが可能となる。また、上記仕組みにおいては、トラブルに関連するログ情報を抽出するために、発生し得るトラブルに関連するキーワードの事前作成等の作業は不要である。従って、上記ログ解析装置によれば、トラブル発生時のユーザのログ解析を容易且つ正確に支援できる。また、処理が正常に行われている期間においては、ログ文章の主題毎の分類によって、システム内の処理の動向を容易に把握できる。
【0009】
対象期間は、システムにおいて解析対象のトラブルが発生していた期間を含むトラブル期間と、トラブル期間よりも長く、且つ、システムにおいてトラブルが発生していなかった正常期間と、を含んでもよい。上記構成によれば、対象期間内に取得された複数のログ情報から生成される複数のログ文章の中に、上述したログ文章のパターンのいずれかに対応する十分な数のログ文章を確保し易くなる。これにより、より確実に、トラブルに関連するログ文章の第2スコアをトラブルに関連しないログ文章の第2スコアよりも高くすることができる。
【0010】
文章生成部は、ログ情報のうち予め不要な情報として定められた部分を除外して、ログ文章を生成してもよい。上記構成によれば、個々のログ文章の内容を簡素化することにより、ログ文章を記憶するために必要な記憶領域を低減できると共に、ログ文章に対する演算処理(例えば、第1スコア算出部の処理)に必要な計算量を低減できる。
【0011】
上記ログ解析装置は、文章生成部により生成された複数のログ文章に基づいて、各ログ文章が複数の主題の各々に分類される確率を示す確率分布を出力するモデルを生成するモデル生成部を更に備えてもよく、第1スコア算出部は、複数のログ文章の各々について、モデルから出力される確率分布を第1スコアとして算出してもよく、第2スコア算出部は、ログ文章毎の第1スコアに基づいて、ログ文章毎のエントロピーを第2スコアとして算出してもよい。上記構成によれば、各ログ文章が各主題に分類される確率を示す確率分布に基づいて算出されるエントロピーを、一つの主題に分類することの困難さの度合いを示す具体的な指標として得ることができる。また、エントロピーの大きさに基づいて、ログ文章の特異性(トラブルに関連している蓋然性)を容易に把握することが可能となる。
【0012】
表示部は、ログ文章に割り当てられた識別子と、ログ文章の第2スコアと、の組に対応する点がプロットされた散布図を生成及び表示してもよい。上記構成によれば、ユーザに、複数のログ文章のうち特に第2スコアが大きいログ文章(すなわち、当該ログ文章に対応する点)を視覚的且つ容易に把握させることができる。すなわち、ユーザは、他のログ文章と比較して第2スコアが大きい特異なログ文章(言い換えれば、特異な事象であるトラブルに関連する可能性が高いログ文章)を、容易に発見することができる。これにより、トラブル発生時のユーザのログ解析を効果的に支援することができる。
【0013】
表示部は、ログ文章を構成するログ情報が記録された時点と、ログ文章の第2スコアと、の組に対応する点がプロットされた散布図を生成及び表示してもよい。上記構成によれば、ユーザに、時系列に沿って複数のログ文章の第2スコアの変化を視覚的且つ容易に把握させることができる。すなわち、ユーザは、他のログ文章と比較して第2スコアが大きい特異なログ文章(言い換えれば、トラブルに関連する可能性が高いログ文章)を容易に発見できると共に、当該ログ文章が発生した時点を容易に把握することができる。これにより、トラブル発生時のユーザのログ解析を効果的に支援することができる。
【0014】
表示部は、ログ文章を構成するログ情報が記録された時点と、ログ文章の少なくとも一つの主題に対応する第1スコアと、の組に対応する点がプロットされた散布図を生成及び表示してもよい。上記構成によれば、ユーザに、個別の主題に分類されるログ文章(すなわち、特定の主題に対応する確率値が大きいログ文章)の発生時期を視覚的且つ容易に把握させることができる。すなわち、ユーザは、どの主題に対応するイベントがどの時期に発生していたかを容易に把握することができる。
【0015】
表示部は、ログ文章を構成するログ情報が記録された時点と、ログ文章の少なくとも二以上の主題に対応する第1スコアと、の組に対応する点がプロットされた散布図を生成及び表示してもよく、表示部は、主題毎に区別可能な態様で、各点を散布図上に表示してもよい。上記構成によれば、散布図上に複数の主題に対応する点を混在させつつ、各点がどの主題に対応するかをユーザに視覚的に把握させることができる。
【0016】
表示部は、散布図にプロットされた所定の点を選択するユーザ操作を受け付けた場合に、選択された点に対応するログ文章を構成するログ情報に関する詳細情報を生成及び表示してもよい。上記構成によれば、ユーザが興味を持ったログ文章(すなわち、選択された点に対応するログ文章33)の詳細情報をユーザに提示することにより、トラブル発生時のユーザのログ解析を効果的に支援することができる。
【0017】
表示部は、散布図と共に、複数の主題の各々に対応する内容を視覚的に示す表示情報を生成及び表示してもよい。上記構成によれば、例えば、トラブルに関連する主題が複数の主題のうちの一の主題として設定された場合に、ユーザにトラブル(すなわち、一の主題に関連するイベント)の発生期間と当該トラブルに関連するログ文章とを視覚的且つ容易に把握させることができる。
【0018】
上記ログ解析装置は、文章生成部により生成された複数のログ文章に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルであって、それぞれ各ログ文章が複数の主題の各々に分類される確率を示す確率分布を出力する複数のモデルを生成するモデル生成部を更に備えてもよく、第1スコア算出部は、複数のログ文章の各々について、複数のモデルの各々から出力される確率分布を、モデル毎の第1スコアとして算出してもよく、第2スコア算出部は、ログ文章毎の第1スコアに基づいてログ文章毎のエントロピーを算出する処理をモデル毎に実行してもよく、ログ文章毎に、複数のモデルの各々について算出されたエントロピーの平均値を第2スコアとして算出してもよい。上記構成によれば、複数のモデルの出力から求まるエントロピーの平均値を第2スコアとして用いることにより、ログ解析のロバスト性(頑健性)を向上させることができる。例えば、モデル生成部により生成された一のモデルから適切な出力結果が得られなかったとしても、複数のモデルの出力結果の平均値を採用することにより、当該一のモデルの不具合を吸収し、適切な結果(第2スコア)をユーザに提示することが可能となる。
【0019】
上記ログ解析装置は、文章生成部により生成された複数のログ文章に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルであって、各ログ文章がモデル毎に設定される複数の主題の各々に分類される確率を示す確率分布を出力する複数のモデルを生成するモデル生成部と、複数のモデルのうちから一の代表モデルを選定するモデル選定部と、を更に備えてもよく、第1スコア算出部は、複数のログ文章の各々について、複数のモデルの各々から出力される確率分布を、モデル毎の第1スコアとして算出してもよく、モデル選定部は、ログ文章及びモデルの組み合わせ毎のエントロピーを取得してもよく、ログ文章毎に、複数のモデルの各々に対応するエントロピーの平均値を取得してもよく、ログ文章及びモデルの組み合わせ毎に、各モデルに対応するエントロピーと各ログ文章に対応する平均値との誤差に関する指標である誤差値を算出してもよく、複数のログ文章の各々について算出された誤差値の総和が最小となるモデルを代表モデルとして選定してもよく、表示部は、ログ文章を構成するログ情報が記録された時点と、ログ文章の少なくとも一つの主題に対応する代表モデルの第1スコアと、の組に対応する点がプロットされた散布図を表示してもよい。上記構成によれば、複数のモデルのうち全文章(複数のログ文章)について最も平均的なエントロピーを出力したモデル(すなわち、誤差値の総和が最小となるモデル)を代表モデルとして選定することができる。これにより、複数のモデルの中で他のモデルと大きく挙動が異なるモデル(すなわち、複数のモデルの中でイレギュラーなモデルであり、適切な出力結果が得られない可能性が高いモデル)が代表モデルとして選定されることを防止することができる。その結果、ユーザに対して適切な出力結果(すなわち、平均的なモデルである代表モデルの出力結果)を提示することができる。
【0020】
装置は、物品を搬送する搬送車であってもよく、一連のイベントは、コントローラによって搬送車に割り付けられる一の搬送指令に対応して実行される一連の処理であってもよい。上記構成によれば、物品を搬送する搬送車を備える搬送システムにおいて、搬送指令毎に結合されたログ文章に対する解析を実行することにより、搬送システムにおいてトラブルが発生した際のログ解析を容易に行うことが可能となる。
【発明の効果】
【0021】
本発明によれば、トラブル発生時のユーザのログ解析を容易且つ正確に支援できるログ解析装置を提供することができる。
【図面の簡単な説明】
【0022】
図1】第1実施形態のログ解析装置の機能構成を示すブロック図である。
図2】ログ解析装置のハードウェア構成の一例を示すブロック図である。
図3】ログ情報及びログ文章の一例を示す図である。
図4】モデルの生成手順の一例を示す図である。
図5】ログ文章毎にトピックモデルにより得られる確率分布及びエントロピーの一例を示す図である。
図6図5の例に対応するログ文章毎の確率分布を示すグラフである。
図7】ログ文章毎のエントロピーを示す散布図の一例を示す図である。
図8】ログ記録順に各ログ文章のエントロピーをプロットした散布図の一例を示す図である。
図9】ログ記録順に各ログ文章の所定のトピックの確率値をプロットした散布図の一例を示す図である。
図10】第1実施形態のログ解析装置の動作の一例を示すフローチャートである。
図11】第2実施形態のログ解析装置の機能構成を示すブロック図である。
図12】第2実施形態の複数のモデルの生成手順の一例を示す図である。
図13】ログ文章及びトピックモデルの組み合わせ毎の算出結果の一例を示す図である。
図14】第2実施形態のログ解析装置の動作の一例を示すフローチャートである。
【発明を実施するための形態】
【0023】
以下、図面を参照して本発明の一実施形態について説明する。なお、図面の説明においては、同一又は同等の要素には同一の符号を付し、重複する説明を省略する場合がある。
【0024】
[第1実施形態]
図1は、第1実施形態に係るログ解析装置1の機能構成の一例を示す図である。ログ解析装置1は、搬送システム2(システム)においてイベントが発生する毎に出力(記録)されるログ情報を解析することにより、搬送システム2においてトラブルが発生した際のユーザ(作業者)のログ解析を支援する装置である。図1に示されるように、ログ解析装置1は、ログDB11と、ログ情報取得部12と、文章生成部13と、モデル生成部14と、第1スコア算出部15と、第2スコア算出部16と、表示部17と、を備える。
【0025】
図2に示されるように、ログ解析装置1は、一以上のCPU(Central Processing Unit)等のプロセッサ101と、主記憶装置である一以上のRAM(Random Access Memory)102及び一以上のROM(Read Only Memory)103と、ユーザが操作入力を行うためのキーボード等の入力装置104と、ユーザに情報を提示するディスプレイ等の出力装置105と、外部装置と通信を行うための通信モジュール106と、HDD及びSSD等の補助記憶装置107と、を含むコンピュータシステムとして構成され得る。
【0026】
ログ解析装置1は、単一のサーバ装置によって構成されてもよいし、複数のサーバ装置によって構成されてもよい。ログ解析装置1の各機能は、例えば、RAM102等のメモリに所定のプログラムを読み込ませ、プロセッサ101の制御のもとで入力装置104及び出力装置105を動作させると共に通信モジュール106を動作させ、RAM102及び補助記憶装置107におけるデータの読み出し及び書き込みを行うことで実現される。
【0027】
搬送システム2は、コントローラ21と、複数の搬送車22(一以上の装置)と、を含む。搬送システム2は、例えば半導体製造工場等において、複数枚の半導体ウェハが収容されるカセット(例えば、FOUP(Front Opening Unified Pod))等の物品の搬送制御を行うためのシステムである。搬送車22は、例えば、工場内に敷設されたレール(軌道)に沿って走行可能に構成されると共に、物品を搬送可能に構成された無人搬送車である。搬送車22は、例えば天井走行車、有軌道台車等である。搬送車22の具体例としては、天井走行式無人搬送車(OHT:Overhead Hoist Transfer)が挙げられる。
【0028】
コントローラ21は、複数の搬送車22のうちから選定された特定の搬送車22に搬送指令を割り付けることにより、各搬送車の走行動作を制御する。搬送指令は、工場内のある場所(例えば、FOUPを保管するストッカ、FOUP内の半導体ウェハに対する処理を実行する処理装置等)から他の場所へと物品を搬送することを指示する情報である。搬送指令は、例えば、搬送対象の物品を識別する識別情報(物品ID)と、当該物品をピックアップする地点(From地点)と、当該物品の搬送先の地点(To地点)と、を含む情報である。コントローラ21は、予め定められた選択基準に基づいて、搬送指令の割付先となる搬送車22を決定する。例えば、コントローラ21は、From地点から最も近い空き搬送車を優先して、搬送指令を割り付ける。また、コントローラ21は、予め定められたルート探索アルゴリズム(例えば公知の最短経路検索アルゴリズム等)を実行することにより、搬送指令を実行するための走行経路を決定し、当該走行経路を搬送車22に通知する。これにより、搬送指令が割り付けられた搬送車22は、当該走行経路に基づいて走行する。
【0029】
コントローラ21は、イベントが発生する毎にログ情報を出力する。イベントとは、搬送システム2において発生した事象(予めログ出力対象として定められた事象)の単位であり、例えば、コントローラ21又は搬送車22によって実行された一回の操作又は処理等に対応する。ログ情報は、イベントの内容を示す文字列からなる情報である。コントローラ21により出力されるログ情報は、ログDB11に蓄積(記録)される。
【0030】
図1に示されるように、ログ解析装置1は、搬送システム2のコントローラ21とは異なる装置として構成され得る。上記構成によれば、コントローラ21の外部にあるログ解析装置1でログ解析処理が実行されるため、ログ解析処理の計算負荷をコントローラ21が負担する必要がないという利点が得られる。すなわち、ログ解析処理の実行によって、コントローラ21の処理負荷が増大しないという利点が得られる。ただし、ログ解析装置1は、搬送システム2のコントローラ21に組み込まれてもよい。
【0031】
ログ解析装置1は、搬送システム2においてトラブルが発生した場合に、当該トラブルに関連する可能性が高いログ文章(一以上のログ情報が結合された文章)を抽出し、ユーザに視覚的に分かり易い態様で提示する機能を有する。以下、上記機能を実現するためにログ解析装置1が備える各機能的構成要素について説明する。
【0032】
ログDB11は、搬送システム2においてイベント毎に出力されたログ情報(本実施形態では、コントローラ21により出力されたログ情報)を記憶する。ログDB11は、例えば、上述した補助記憶装置107によって実現される。ただし、ログDB11は、必ずしもログ解析装置1に実装される必要はなく、ログ解析装置1からアクセス可能な外部装置に実装されてもよい。
【0033】
ログ情報取得部12は、対象期間T内に搬送システム2において出力された複数のログ情報を取得する。本実施形態では、対象期間Tは、トラブル期間T1及び正常期間T2の両方を含んだ期間(すなわち、T=T1+T2)である。
【0034】
トラブル期間T1とは、搬送システム2において解析対象のトラブルが発生していた期間を含む期間である。例えば、トラブル期間T1は、トラブルが発生したと判断された時点からトラブルが解消したと判断された時点までの期間である。すなわち、トラブル期間T1は、トラブルに関連する一以上のログ情報が出力された可能性が高い期間である。トラブルとは、搬送システム2において発生した何らかの障害、不調、故障、事故等であり、搬送システム2の正常な動作を妨げ得る事象全般を意味する。トラブルの例としては、設計時に想定されていなかった搬送制御パターンによる潜在バグの発現、搬送システム2内の通信負荷の上昇による通信遅延、多数の搬送車22が特定の場所に密集することによる搬送経路のグリッドロック、電源盤故障や電気回路故障等の電気的不具合による搬送異常、搬送車22の意図しない動作停止、搬送車22同士の衝突等が挙げられる。
【0035】
正常期間T2は、搬送システム2においてトラブルが発生していなかった期間(すなわち、搬送システム2が正常に稼働していた期間)であり、トラブル期間T1よりも十分に長い期間である。なお、トラブル期間T1と正常期間T2とは、時間的に分離していてもよい。すなわち、トラブル期間T1と正常期間T2とは、必ずしも時間的に連続している必要はない。
【0036】
図3の上段部は、対象期間T内にログDB11に記録された複数のログ情報31の例を示している。ログDB11には、イベント発生毎に、1行(1レコード)のログ情報31が記録される。図3の例では、ログ情報31は、イベント発生時点(ログ記録時点)を示す時刻情報(タイムスタンプ)と、イベントの種類を識別するイベントコードと、イベント内容を示す内容情報と、を予め定められた特定文字(例えば、カンマ「,」)で区切った構成(すなわち、「時刻情報,イベントコード,内容情報」)を有する。内容情報は、例えば、後述する搬送ID、イベント関連変数(コントローラ21の内部状態により変化する変数)等を含み得る。図3の1行目のログ情報31は、時刻情報「01:00:00」と、イベントコード「C101」と、内容情報「イベント101です。T_ID=0001 vhl=211 Mode=0 Kind=10」と、を含んでいる。
【0037】
本実施形態では、ログ情報31は、特定のジョブ(本実施形態では搬送指令)に紐付くイベントに対応する第1ログ情報31Aと、特定のジョブに紐付かないイベントに対応する第2ログ情報31Bと、に分類される。
【0038】
第1ログ情報31Aは、コントローラ21において生成された特定の搬送指令を識別するための搬送ID(T_ID)を含んだログ情報31である。特定の搬送指令に紐付く第1ログ情報31Aは、当該特定の搬送指令がアクティブな期間(すなわち、当該特定の搬送指令が発生してから当該特定の搬送指令に対応する物品搬送が完了するまでの期間)のみにおいて記録される。
【0039】
第2ログ情報31Bは、上述した搬送IDを含まないログ情報31である。第2ログ情報31Bは、例えば、搬送指令と紐付かないコントローラ21の内部処理(内部イベント)に関する情報を含むログ情報31である。第1ログ情報31Aの発生期間が限定的であるのに対して、第2ログ情報31Bは、搬送システム2が稼働中の全期間において定期又は不定期に発生し得る。
【0040】
文章生成部13は、複数のログ情報31に基づいて、一連のイベント毎又は予め定められた長さの設定期間毎に、一以上のログ情報31が結合されたログ文章33を生成する。また、文章生成部13は、ログ情報31のうち予め不要な情報として定められた部分(以下単に「不要部分」という。)を除外して、ログ文章33を生成する。不要部分の例としては、後述のスコア算出に使用しない(不要な)情報として予め定められた部分が挙げられる。一例として、文章生成部13により生成されたログ文章33は、ログDB11に記憶される。
【0041】
図3の中段部は、対象期間T内に記録された各ログ情報31に対して、不要部分を除外すると共に記載を簡略化する加工がされた後のログ情報32の例を示している。図3の例では、1行目のログ情報31の時刻情報と、内容情報のうちイベントコード「C101」と実質的に同一の情報である文字列「イベント101です。」と、搬送特性に影響を与えない部分(例えば、トラブルの有無によって記載が変化しない部分)である文字列「vhl=211」(当該イベントに関連した搬送車22を識別する台車番号を示す部分)とが、不要部分31aとして除去される。
【0042】
文章生成部13は、ログ情報31から不要部分31aを除外する(言い換えれば、不要部分31aに該当しない部分のみを抽出する)と共に、「Mode=」、「Kind=」等の記載を「Mod」、「Kind」等の簡略記載に変更する。また、文章生成部13は、搬送IDを含む第1ログ情報31Aについては、搬送IDの記載位置を文頭に移すことで、「T_ID=」の文字列を除去する。一方、文章生成部13は、搬送IDを含まない第2ログ情報31Bについては、文頭に予め定められた文字列(本実施形態では「NaN」)を追加する。このような処理により、図3の上段部に示されるログ情報31は、図3の中段部に示されるように記載が簡略化されると共に、文頭によって種別(すなわち、第1ログ情報31A又は第2ログ情報31Bのいずれであるか)を判別可能な形式に変換されたログ情報32が得られる。
【0043】
なお、図3の例では、ログ情報31に含まれる「Mode=0」、「Kind=10」等の変数を示す部分は不要部分として除去されていないが、例えば、全てのログ情報31において共通の値をとる変数の記載(例えば「x=0」等の文字列)が存在する場合には、そのような変数についての記載も不要部分31aとして除去されてもよい。
【0044】
文章生成部13は、例えば、以下の第1方法又は第2方法により、ログ文章33を生成する。
【0045】
(第1方法)
文章生成部13は、一連のイベント毎に、一以上のログ情報31を一つにまとめることで、ログ文章33を生成する。一連のイベントは、コントローラ21によって搬送車22に割り付けられる一の搬送指令に対応して実行される一連の処理を含む。従って、本実施形態では、文章生成部13は、同一の搬送IDを含む複数の第1ログ情報31A(本実施形態では、第1ログ情報31Aから得られたログ情報32)を時系列に沿って一つにまとめることにより、一連のイベント単位で一以上のログ情報32が結合されたログ文章33が得られる。なお、同一の搬送IDを含む第1ログ情報31Aが一つしか存在しない場合には、当該搬送IDに対応するログ文章33は、当該第1ログ情報31A(本実施形態では、当該第1ログ情報31Aから得られたログ情報32)と同一となってもよい。
【0046】
図3の例では、搬送ID「0001」に紐付く4つのログ情報32Aが時系列に沿って結合されることにより、一連のイベント(搬送ID「0001」に対応する搬送指令に関する一連の処理)に対応するログ文章33Aが生成される。また、搬送ID「0002」に紐付く2つのログ情報32Bが時系列に沿って結合されることにより、一連のイベント(搬送ID「0002」に対応する搬送指令に関する一連の処理)に対応するログ文章33Bが得られる。
【0047】
(第2方法)
文章生成部13は、予め定められた長さの設定期間毎に、一以上のログ情報31を一つにまとめることで、ログ文章33を生成する。上述したように、搬送IDを含まない第2ログ情報31Bは、搬送IDをキーとして結合することができない。また、第2ログ情報31Bは、搬送システム2が稼働中の全期間において発生する。そこで、文章生成部13は、対象期間Tを任意の設定期間(例えば60秒)毎に区切り、同一の期間に含まれる一以上の第2ログ情報31B(本実施形態では、当該第2ログ情報31Bから得られたログ情報32)を時系列に沿って一つにまとめることにより、設定期間単位で一以上のログ情報32が結合されたログ文章33が得られる。
【0048】
図3の例では、設定期間(60秒間)毎に区切られた一つの期間「01:00:00~01:00:59」に含まれる2つのログ情報32Cが時系列に沿って結合されることにより、当該期間「01:00:00~01:00:59」」に対応するログ文章33Cが生成される。なお、図3には図示していないが、対象期間Tに含まれる上記以外の期間(例えば、「01:01:00~01:01:59」」、「01:02:00~01:02:59」等)についても、上記と同様の処理が実行されることにより、各期間に対応するログ文章33が生成される。
【0049】
モデル生成部14は、文章生成部13により生成された複数のログ文章33に基づいてモデルMを生成する。例えば、モデルMは、入力された全体の文章から予め設定された数のトピック(主題)を抽出し、個別の文章がどのトピックに分類されるかを示す確率分布(第1スコア)を出力するように構成されたトピックモデルである。言い換えれば、モデルMは、モデルMの構築(学習)に用いられた各文章の各トピックへの依存度(関連度)を確率値として出力する。モデルMは、特定の形態に限定されないが、モデルMの具体例として、ディリクレ分布に従う確率分布を出力するように構成されるLDA(Latent Dirichlet Allocation)モデルが挙げられる。
【0050】
ここで、第1方法によって生成されたログ文章33(すなわち、搬送IDを含み、搬送ID毎に生成された「IDあり文章」)と第2方法によって生成されたログ文章33(すなわち、搬送IDを含まず、設定期間毎に生成された「IDなし文章」)とでは、文章中に含まれる単語(イベントID、各種変数等)の種類及び値が大きく異なる。このような場合、モデル生成部14は、IDあり文章に適用する第1のモデルと、IDなし文章に適用する第2のモデルと、を別々に生成してもよい。また、文章生成部13により生成されるログ文章33が3つ以上の種類に大別される場合には、モデル生成部14は、3つ以上の種類の各々に対応する3つ以上のモデルを生成してもよい。
【0051】
なお、上記種類毎のモデル生成方法及びその後のモデルを用いた処理は、全種類で共通であるため、以下の説明では、一の種類(IDあり文章)に適用されるモデルMに着目して説明を行う。すなわち、以下の説明において登場するログ文章33は、対象期間Tに取得されたログ情報31(第1ログ情報31A)から第1方法によって生成されたIDあり文章であり、第2方法によって生成されたIDなし文章を含まないものとする。
【0052】
図4を参照して、モデル生成部14によるモデル生成処理の一例について説明する。図4において、「Doc_A」、「Doc_B」、及び「Doc_C」は、搬送IDに対応する文字列である。以下の説明では、これらの搬送IDに対応するログ文章33のことを単に「Doc_A」等と表記する。
【0053】
図4に示されるように、モデル生成部14は、まず、対象期間Tに取得されたログ情報31から得られた複数のログ文章33の各々に対して自然言語処理の一種であるTF-IDF処理を実行する。例えば、TF-IDF処理は、各ログ文章33に含まれる各単語(例えば、スペースで区切られた「C101」、「Mod0」等の単語)のtf(t,d)と、全てのログ文章33に含まれる単語毎のidf(t)と、を算出する処理である。tf(t,d)は、文章dにおける単語tの出現頻度(TF:Term Frequency)である。idf(t)は、全てのログ文章33における単語tの希少性を表す逆文書頻度(IDF:Inverse Document Frequency)である。このようなTF及びIDFは、公知の計算手法によって算出される。
【0054】
続いて、モデル生成部14は、上記のようなTF-IDF処理が実行された後の複数のログ文章33(すなわち、複数のログ文章33と、当該複数のログ文章33から得られたTF及びIDFと、を合わせた情報)と、任意に設定されたモデルパラメータと、に基づいて、モデルMを生成する。このようなモデル生成処理は、トピックモデルを生成するための公知の機械学習アルゴリズム(本実施形態では、LDAアルゴリズム)によって実行される。
【0055】
モデルパラメータは、トピック数と、ランダムシードと、を含む。トピック数は、モデルMにより抽出されるトピック数を定めた値である。ランダムシードは、モデル生成にランダム性を与える乱数の種である。すなわち、トピック数が同一であっても、ランダムシードが異なれば、モデルMの出力が変化する。つまり、モデルパラメータ(本実施形態では、トピック数とランダムシードとの組み合わせ)が異なれば、生成されるモデルMの内容が変化する。
【0056】
第1スコア算出部15は、ログ文章33毎に、複数のログ文章33(すなわち、対象期間Tのログ情報31に基づいて文章生成部13によって生成された複数のログ文章33)に基づいて設定された複数のトピック(主題)の各々に分類される度合いを示す第1スコアを算出する。ここで、複数のトピックは、複数のログ文章33に対する自然言語処理によって設定される。例えば、複数のトピックは、複数のログ文章33の各々に含まれる各単語の出現頻度に基づいて設定され得る。本実施形態では、複数のトピックは、上述したモデル生成部14が複数のログ文章33に基づいて生成したモデルMによって抽出される。すなわち、上述したモデル生成部14によるモデル生成処理の過程において、モデルパラメータ(トピック数)により指定された数のトピックが設定される。また、第1スコア算出部15は、モデルMを利用することにより、複数のログ文章33の各々についてモデルMから出力される確率分布を、第1スコアとして算出する。
【0057】
図5は、トピック数を「10」に指定して生成されたモデルMから、3つのログ文章「Doc_A」、「Doc_B」、「Doc_C」の各々について得られた(出力された)確率分布及びエントロピーの一例を示す図である。図6は、図5の例に対応する各ログ文章「Doc_A」、「Doc_B」、「Doc_C」の確率分布を示すグラフである。この例では、モデルMによって、10個のトピック(Topic_0~Topic_9)が抽出(設定)されると共に、各ログ文章が各トピックに分類される確率を示す確率分布が得られる。
【0058】
第2スコア算出部16は、ログ文章33毎に、第1スコア(本実施形態では、第1スコア算出部15により算出された確率分布)に基づいて、ログ文章33を複数のトピックのうちのいずれか一つのトピックに分類することの困難さの度合いを示す第2スコアを算出する。
【0059】
ここで、上述したように、対象期間Tは、トラブル期間T1と共に十分の長さの正常期間T2を含んでいる。正常期間T2において実行された搬送指令(すなわち、正常に実行された搬送指令)に関連するログ情報31から生成されたログ文章33は、いくつかのパターンに分類されると想定される。例えば、正常に搬送が実行された場合のログ文章のパターンは、搬送指令が割り付けられた搬送車22がコントローラ21によって指示された走行経路に従って搬送が当初の予定通りに実行されたパターン、搬送指令が最初に割り付けられた搬送車22から別の搬送車22に再割付がされた後に搬送が実行されたパターン等の有限個のログ文章のパターンに集約されると考えられる。このため、対象期間Tに正常に実行された複数の搬送指令(すなわち、搬送指令に関する一連のイベント)の中には、互いに同一のトピックに分類される搬送指令が複数含まれている可能性が高い。従って、正常に実行された搬送指令に関するログ文章33については、モデルMによって、図5及び図6に示される「Doc_A」のように特定のトピック(この例ではTopic_9)に偏った確率分布が得られることが期待できる。
【0060】
一方、トラブルに関連するログ文章33(すなわち、正常ではない特異な事象に対応するログ文章33)については、上述したような正常なログ文章のパターンのいずれにも分類されないため、図5及び図6に示される「Doc_B」又は「Doc_C」のように特定のトピックに偏らない確率分布が得られる可能性が高い。また、どのトピックに分類されるか不明な程度が大きいログ文章33ほど、複数のトピックについての確率分布から下記式(1)に基づいて算出されるエントロピー(情報量)は大きくなる。下記式(1)において、mは、トピックを識別するトピック番号である。Pは、トピック番号mに対応するトピックの確率値である。nは、トピック数である。
【0061】
エントロピー=-Σ{P×log(P)} …(1)
【0062】
図5及び図6の例では、各ログ文章33のエントロピーは、「-{(P×log10)+(P×log10)+…+(P×log10)}」により算出される。このように算出されるエントロピーは、確率分布が特定の一つのトピックに偏っている程小さくなる。言い換えれば、エントロピーは、ログ文章33が特定の一つのトピックに明確に分類されない度合いが大きい程(つまり、ログ文章33を特定の一つのトピックに分類することの困難さの度合いが大きい程)、大きくなる。実際、図5及び図6の例では、特定の一つのトピックに偏っている度合いの大きさの順は、「Doc_A」、「Doc_B」、「Doc_C」の順になっている。これに対して、エントロピーの大きさの順は、「Doc_C(0.762)」、「Doc_B(0.617)」、「Doc_A(0.356)」と、上記順とは逆になっている。
【0063】
以上のことから、エントロピーを上述した第2スコアとして用いることができる。そこで、本実施形態では、第2スコア算出部16は、ログ文章33毎の第1スコア(確率分布)に基づいて上記式(1)により算出されるログ文章33毎のエントロピーを、第2スコアとして算出する。
【0064】
表示部17は、ログ文章33毎に算出された第2スコアを表示する。表示部17は、例えば、ディスプレイ等の出力装置105の画面上に、視覚的に把握可能な態様で、ログ文章33毎の第2スコアを表示する。以下、いくつかの表示例について説明する。
【0065】
(第1の表示例)
図7に示されるように、表示部17は、ログ文章33に割り当てられた識別子(文章ID)と、ログ文章33の第2スコア(本実施形態ではエントロピー)と、の組に対応する点Pがプロットされた散布図SP1を生成及び表示してもよい。散布図SP1の横軸は文章IDを表し、散布図SP1の縦軸はエントロピーを表している。
【0066】
第1の表示例によれば、ユーザに、複数のログ文章33のうち特にエントロピーが大きいログ文章33(すなわち、当該ログ文章33に対応する点P)を視覚的且つ容易に把握させることができる。すなわち、ユーザは、他のログ文章33と比較してエントロピーが大きい特異なログ文章33(言い換えれば、特異な事象であるトラブルに関連する可能性が高いログ文章33)を、容易に発見することができる。これにより、トラブル発生時のユーザのログ解析を効果的に支援することができる。
【0067】
また、図7の上部に示されるように、表示部17は、散布図SP1にプロットされた所定の点P(一例として、エントロピーが他の点Pよりも突出して大きい点P1)を選択するユーザ操作を受け付けた場合に、選択された点P1に対応するログ文章33を構成するログ情報31に関する詳細情報Dを表示してもよい。この例では、詳細情報Dは、選択された点P1に対応する文章IDと、エントロピーと、文字列(すなわち、ログ文章33の内容)と、搬送ID(T_ID)と、開始時点と、関連台車IDと、を含む。開始時点は、ログ文章33を構成する最初のログ情報31が記録された時点である。関連台車IDは、当該搬送IDに対応する搬送指令に関わった搬送車22(例えば、搬送指令が割り付けられた搬送車22)を識別する番号(ID)である。すなわち、関連台車IDは、上述したログ情報31に含まれる変数「vhl」に対応する情報である。上記構成によれば、ユーザが興味を持ったログ文章33(すなわち、選択された点P1に対応するログ文章33)の詳細情報Dをユーザに提示することにより、トラブル発生時のユーザのログ解析を効果的に支援することができる。
【0068】
ここで、複数のログ文章33間で内容(文字列)が同一となる場合があり得る。例えば、複数の異なる搬送IDの各々に対応する複数のログ文章33の内容が、いずれも図3のログ文章33Aと同一の内容(“C101~Kind0”)になる場合があり得る。また、本実施形態では一例として、文章IDは、ログ文章33の内容毎に割り当てられる。すなわち、内容が同一である複数のログ文章33が存在する場合、これらのログ文章33に対して同一の文章IDが割り当てられる。このように複数のログ文章33(すなわち、互いに異なる搬送IDに関する複数のログ文章33)に共通に割り当てられた文章IDに対応する点Pが選択された場合、表示部17は、当該文章IDに対応する複数のログ文章33についての複数の詳細情報Dを表示してもよい。
【0069】
なお、上述した文章IDは、複数のログ文章33間で重複しないように、ログ文章33毎に個別に割り当てられてもよい。例えば、文章IDは、搬送IDと一対一に対応するように割り当てられてもよい。或いは、搬送IDが文章IDとして用いられてもよい。ただし、上記のように内容が同一である複数のログ文章33を一つの文章ID(すなわち、散布図SP1上の一つの点P)に集約することにより、散布図SP1にプロットされる点Pの個数を減らすことができ、散布図SP1の見易さを向上させることができる。また、このように複数のログ文章33を一つの文章ID(一つの点P)に集約したとしても、上述した詳細情報Dを表示する機能があれば、当該文章IDに集約された個々のログ文章33の詳細を確認することが可能であるため、特に不都合は生じない。
【0070】
(第2の表示例)
図8に示されるように、表示部17は、ログ文章33を構成するログ情報31が記録された時点と、ログ文章33の第2スコア(本実施形態ではエントロピー)と、の組に対応する点Pがプロットされた散布図SP2を生成及び表示してもよい。一例として、上述した時点は、ログ文章33を構成する最初のログ情報31が記録された時点(すなわち、図7の「開始時点」に対応する時点)である。また、散布図SP2の横軸は上記時点(開始時点)を表し、散布図SP2の縦軸はエントロピーを表している。
【0071】
第2の表示例によれば、ユーザに、時系列に沿って複数のログ文章33のエントロピーの変化を視覚的且つ容易に把握させることができる。すなわち、ユーザは、他のログ文章33と比較してエントロピーが大きい特異なログ文章33(言い換えれば、トラブルに関連する可能性が高いログ文章33)を容易に発見できると共に、当該ログ文章33が発生した時点を容易に把握することができる。これにより、トラブル発生時のユーザのログ解析を効果的に支援することができる。なお、第2の表示例においても、表示部17は、散布図SP2にプロットされた所定の点Pを選択するユーザ操作を受け付けた場合に、選択された点Pに対応するログ文章33を構成するログ情報31に関する詳細情報Dを表示してもよい。
【0072】
(第3の表示例)
図9に示されるように、表示部17は、ログ文章33を構成するログ情報31が記録された時点(上述した通り、本実施形態では図7の「開始時点」に対応する時点)と、ログ文章33の少なくとも一つのトピックに対応する第1スコア(確率値)と、の組に対応する点Pがプロットされた散布図SP3を表示する。図9の例では、散布図SP3には、全てのログ文章33について、ユーザによって選択された一のトピック(ここでは一例としてTopic_5)に対応する確率値(トピック確率)を示す点Pがプロットされている。なお、散布図SP3に表示される内容は、ユーザ操作によって切替可能に構成されてもよい。すなわち、表示部17は、散布図SP3と共に、散布図SP3に表示する内容(トピック)を切り替えるためのタブ、ボタン等を表示してもよい。
【0073】
第3の表示例によれば、ユーザに、個別のトピックに分類されるログ文章33(すなわち、特定のトピックに対応する確率値が大きいログ文章33)の発生時期を視覚的且つ容易に把握させることができる。すなわち、ユーザは、どのトピックに対応するイベントがどの時期に発生していたかを容易に把握することができる。なお、第3の表示例においても、表示部17は、散布図SP3にプロットされた所定の点Pを選択するユーザ操作を受け付けた場合に、選択された点Pに対応するログ文章33を構成するログ情報31に関する詳細情報Dを表示してもよい。
【0074】
第3の表示例においては、図9に示されるように、表示部17は、散布図SP3と共に、モデルMにより抽出された各トピック(この例では、8つのTopic_0~Topic_8)に関連する内容を視覚的に示す表示情報50を表示してもよい。一のトピックに対応する表示情報50は、例えば、当該一のトピックに対する確率値が最大となる一以上のログ文章33に公知のワードクラウドを適用することにより生成された情報である。ワードクラウドは、文書(ここでは上記一以上のログ文章33)において出現頻度が高い単語ほど目立つように、文書に含まれる単語を視覚化する手法である。この場合、一のトピックに対応する表示情報50において、当該一のトピックに分類される確率が高いログ文章33に多く含まれている単語ほど、目立ち易い態様(例えば、他の単語よりもサイズが大きくされた態様)で表示される。
【0075】
このように散布図SP3と共に表示情報50(少なくとも散布図SP3の表示対象とされているトピックに対応する表示情報50)を表示することにより、特定のトピックに対応するイベントの発生時期をユーザに把握させると共に、当該特定のトピックの内容をユーザに把握させることができる。図9の例では、Topic_5に対応する表示情報50から、Topic_5が「C7857」及び「C5164」との関連性が高いトピックであることを視覚的且つ容易に把握することができる。ここで、例えば「C7857」が搬送経路の消失(軽異常)を示すイベントコードである場合、図9に示される散布図SP3及び表示情報50に基づいて、ユーザは、上記軽異常に関するイベントが時間帯Aにおいて多発していたという事実を把握することができる。このように、トラブル(軽異常を含む)との関連性が高いトピックが、モデルMによって抽出される場合もあり得る。従って、上記のように散布図SP3及び表示情報50をユーザに提示する構成によれば、このような場合においても、ユーザにトラブル(図9の例では、Topic_5)の発生期間と当該トラブルに関連するログ文章とを視覚的且つ容易に把握させることができる。
【0076】
また、上記第3の表示例において、表示部17は、ログ文章33を構成するログ情報31が記録された時点(上述した通り、本実施形態では図7の「開始時点」に対応する時点)と、ログ文章33の少なくとも二以上のトピックに対応する第1スコア(確率値)と、の組に対応する点Pがプロットされた散布図SP3を表示してもよい。例えば、ログ文章33毎に、最大の確率値を有するトピックの確率値が、散布図SP3にプロットしてもよい。この場合、散布図SP3上には、複数のトピックに対応する複数の点Pが混在することになる。ここで、散布図SP3上の全ての点Pを同じ態様(例えば、同一の形状、色等)で表示すると、各点Pがどのトピックの確率値を表しているのかを把握することができない。そこで、このような場合には、表示部17は、トピック毎に区別可能な態様で、各点Pを散布図SP3上に表示してもよい。例えば、表示部17は、各点Pをトピック毎に異なる色で表現してもよい。これにより、散布図SP3上に複数のトピックに対応する点Pを混在させつつ、各点Pがどのトピックに対応するかをユーザに視覚的に把握させることができる。
【0077】
なお、上記第3の表示例についてのここまでの説明では、ログ文章33毎に一つのトピックに対応する一つの点Pが散布図SP3上にプロットされる構成を例示したが、一つのログ文章33に対して二つ以上の点Pが散布図SP3上にプロットされてもよい。例えば、一つのログ文章33に対して、当該ログ文章33のトップ2の確率値(すなわち、最大の確率値とその次に大きい確率値)を有する二つのトピックに対応する二つの点Pがプロットされてもよい。
【0078】
図10は、ログ解析装置1の動作の一例を示すフローチャートである。まず、ログ情報取得部12は、対象期間Tのログ情報31をログDB11から取得する(ステップS1)。続いて、文章生成部13は、対象期間Tの複数のログ情報31に基づいて、複数のログ文章33を生成する(ステップS2、図3参照)。続いて、モデル生成部14は、文章生成部13により生成された複数のログ文章33に基づいてモデルMを生成する(ステップS3、図4参照)。続いて、第1スコア算出部15は、複数のログ文章33の各々についてモデルMから出力される確率分布を、第1スコアとして算出する(ステップS4)。続いて、第2スコア算出部16は、ログ文章33毎の第1スコア(確率分布)に基づいて上記式(1)により算出されるログ文章33毎のエントロピーを、第2スコアとして算出する(ステップS5)。続いて、表示部17は、ログ文章33毎の第2スコアを表示する(ステップS6)。例えば、表示部17は、上述した第1~第3の表示例に示したような表示処理を実行する。
【0079】
以上述べたログ解析装置1では、一連のイベント又は設定期間の単位で一以上のログ情報31が結合されたログ文章33毎に、複数のトピック(主題)の各々に分類される度合い(第1スコア)が算出されると共に、一つのトピックに分類することが困難な度合い(第2スコア)が算出される。搬送システム2を含む通常のシステムにおいて、処理が正常に行われる期間においては、有限個のログ文章のパターンのいずれかに対応する一連の処理が繰り返し実行されることが多い。このため、いずれかのトピックに分類されるログ文章33(すなわち、第2スコアが比較的低いログ文章33)は、正常な事象(例えば、上述したログ文章のパターンのうちの一つ)に対応している可能性が高い。これに対して、トラブル等の特異的な事象に対応するログ文章33は、上述したログ文章のパターンのいずれにも分類されないため、正常な事象に対応するログ文章33と比較して高い第2スコアが算出される可能性が高い。このようなログ文章33毎の第2スコアがユーザに対して表示されることにより、ユーザは、トラブル等の特異的な事象に対応する可能性が高いログ文章33(すなわち、第2スコアが比較的高いログ文章33)を、容易に把握することができる。また、上記仕組みにおいては、イベント単位(すなわち、ログ情報31単位)で見ると特異性がなくてもログ文章33単位で見ると特異性のある事象を把握することが可能となる。また、上記仕組みにおいては、トラブルに関連するログ情報31を抽出するために、発生し得るトラブルに関連するキーワードの事前作成等の作業は不要である。従って、ログ解析装置1によれば、トラブル発生時のユーザのログ解析を容易且つ正確に支援できる。また、処理が正常に行われている期間においては、ログ文章33のトピック毎の分類によって、搬送システム2内の処理の動向を容易に把握できる。
【0080】
また、対象期間Tは、トラブル期間T1と、トラブル期間T1よりも長く、且つ、搬送システム2においてトラブルが発生していなかった正常期間T2と、を含む。上記構成によれば、対象期間T内に取得された複数のログ情報31から生成される複数のログ文章33の中に、上述したログ文章のパターンのいずれかに対応する十分な数のログ文章33(すなわち、正常なパターンに対応するログ文章33)を確保し易くなる。これにより、より確実に、トラブルに関連するログ文章33の第2スコアをトラブルに関連しないログ文章33の第2スコアよりも高くすることができる。
【0081】
また、文章生成部13は、ログ情報31のうち予め不要な情報として定められた部分(不要部分31a)を除外して、ログ文章33を生成する(図3参照)。上記構成によれば、個々のログ文章33の内容を簡素化することにより、ログ文章33を記憶するために必要なログDB11の記憶領域を低減できると共に、ログ文章33に対する演算処理(例えば、第1スコア算出部15の処理)に必要な計算量を低減できる。また、上記不要な情報に対応する記載がトラブルに関連しないログ情報31及びトラブルに関連するログ情報31の両方に共通的に含まれている場合があり得る。このような共通的な記載を除去してログ文章33を生成することにより、トラブルに関連しないログ文章33とトラブルに関連するログ文章33との間で、内容的な差異をより大きくすることができる。その結果、トラブルに関連しないログ文章33とトラブルに関連するログ文章33とを区別しやすくなり、トラブルに関連しないログ文章33とトラブルに関連するログ文章33との間で第2スコアの差が大きくなることが期待できる。
【0082】
また、ログ解析装置1は、モデルMを生成するモデル生成部14を備えている。第1スコア算出部15は、モデルMから出力される確率分布を第1スコアとして算出する。第2スコア算出部16は、ログ文章33毎の第1スコアに基づいて、ログ文章33毎のエントロピーを第2スコアとして算出する。上記構成によれば、各ログ文章33が各トピックに分類される確率を示す確率分布に基づいて算出されるエントロピーを、一つのトピックに分類することの困難さの度合いを示す具体的な指標として得ることができる。また、エントロピーの大きさに基づいて、ログ文章33の特異性(トラブルに関連している蓋然性)を容易に把握することが可能となる。
【0083】
また、本実施形態では、ログ解析装置1による解析対象のシステムは、物品を搬送する一以上の搬送車22を含む搬送システム2であり、ログ文章33の単位となる一連のイベントは、コントローラ21によって搬送車22に割り付けられる一の搬送指令に対応して実行される一連の処理である。上記構成によれば、物品を搬送する搬送車22を備える搬送システム2において、搬送指令毎に結合されたログ文章33に対する解析を実行することにより、搬送システム2においてトラブルが発生した際のログ解析を容易に行うことが可能となる。
【0084】
[第2実施形態]
図11は、第2実施形態に係るログ解析装置1Aの機能構成の一例を示す図である。ログ解析装置1Aは、主に、複数のモデルMを用いるように構成されている点において、ログ解析装置1と相違している。ログ解析装置1Aは、モデル生成部14、第1スコア算出部15、第2スコア算出部16、及び表示部17の代わりに、モデル生成部14A、第1スコア算出部15A、第2スコア算出部16A、及び表示部17Aを備えると共に、モデル選定部18を更に備える点において、ログ解析装置1と相違している。
【0085】
モデル生成部14Aは、文章生成部13により生成された複数のログ文章33に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルMを生成する。モデル生成部14Aにより生成される複数のモデルMの各々は、各ログ文章33がモデルM毎に設定される複数のトピックの各々に分類される確率を示す確率分布を出力する。
【0086】
図12に示されるように、本実施形態では一例として、モデル生成部14Aは、3つのログ文章「Doc_A」、「Doc_B」、「Doc_C」に基づいて、モデルパラメータ(本実施形態では、トピック数(M)とランダムシード(seed)の組み合わせ)が以下のように互いに異なる4つのモデル(model_0、model_1、model_2、model_3)を生成する。
・model_0:トピック数=3、ランダムシード=30
・model_1:トピック数=3、ランダムシード=70
・model_2:トピック数=5、ランダムシード=30
・model_3:トピック数=5、ランダムシード=70
【0087】
第1スコア算出部15Aは、複数のログ文章33の各々について、複数のモデルM(本実施形態では、上記4つのモデル)の各々から出力される確率分布を、モデルM毎の第1スコアとして算出する。
【0088】
第2スコア算出部16Aは、ログ文章33毎の第1スコア(トピック毎の確率値)に基づいてログ文章33毎のエントロピーを算出する処理をモデルM毎に実行する。第2スコア算出部16Aは、ログ文章33毎に、複数のモデルMの各々について算出されたエントロピーの平均値を第2スコアとして算出する。
【0089】
図13は、複数のモデルM(model_0、model_1、model_2、model_3)の算出結果の一例を示す図である。図13に示されるように、第1スコア算出部15Aの処理によって、モデルM毎の第1スコア(トピック毎の確率値からなる確率分布)が算出される。
【0090】
図13の例では、ログ文章「Doc_A」について、モデル「model_0」によって、3つのトピックに対する確率分布[0.05,0.10,0.85]が得られている。一方、モデル「model_0」とはモデルパラメータ(ランダムシード)が異なるモデル「model_1」によって、異なる確率分布[0.15,0.80,0.05]が得られている。他のログ文章33とモデルMの組み合わせについても同様に、第1スコア算出部15Aの処理によって、それぞれに対応する確率分布が得られている。
【0091】
図13の例では、第2スコア算出部16Aの処理により、ログ文章「Doc_A」のエントロピーを算出する処理を、モデル「model_0」、「model_1」、「model_2」、「model_3」の各々について実行することにより、各モデルに対応するエントロピー「0.472」、「0.539」、「0.403」、「0.363」を算出する。そして、第2スコア算出部16Aは、これらのエントロピーの平均値(平均エントロピー)「0.444」を、ログ文章「Doc_A」の第2スコアとして算出する。第2スコア算出部16Aは、他のログ文章「Doc_B」、「Doc_C」についても同様の処理を実行することにより、それぞれのエントロピーの平均値「0.433」、「0.991」を、各ログ文章の第2スコアとして算出する。
【0092】
モデル選定部18は、以下の処理を実行することにより、複数のモデルMのうちから一の代表モデルを選定する。
【0093】
まず、モデル選定部18は、ログ文章33及びモデルMの組み合わせ毎のエントロピーを取得する。図13の例では、モデル選定部18は、3つのログ文章「Doc_A」、「Doc_B」、「Doc_C」と4つのモデル「model_0」、「model_1」、「model_2」、「model_3」の各組み合わせに対応する12個のエントロピーを取得する。モデル選定部18は、上述した第2スコア算出部16Aと同様の処理を実行することによりエントロピーを算出してもよいし、上述した第2スコア算出部16Aの算出結果を取得してもよい。
【0094】
続いて、モデル選定部18は、ログ文章33毎に、複数のモデルMの各々について算出されたエントロピーの平均値を取得する。モデル選定部18は、上述した第2スコア算出部16Aと同様の処理を実行することによりエントロピーの平均値を算出してもよいし、上述した第2スコア算出部16Aの算出結果を取得してもよい。図13の例では、モデル選定部18は、各ログ文章「Doc_A」、「Doc_B」、「Doc_C」のエントロピーの平均値「0.444」、「0.433」、「0.991」を取得する。
【0095】
続いて、モデル選定部18は、ログ文章33及びモデルMの組み合わせ毎に、各モデルMに対応するエントロピーと各ログ文章33について算出された平均値(平均エントロピー)との誤差に関する指標である誤差値を算出する。本実施形態では一例として、誤差値は、平均二乗誤差(MSE)である。例えば、モデル選定部18は、ログ文章「Doc_A」とモデル「model_0」との組み合わせについて、MSE「0.0008(=(0.472-0.444))」を算出する。モデル選定部18は、他のログ文章33とモデルMの組み合わせについても同様に、MSEを算出する。
【0096】
続いて、モデル選定部18は、複数のログ文章33の各々について算出されたMSEの総和が最小となるモデルMを代表モデルとして選定する。図13の例では、モデル「model_0」のMSEの総和は、「0.0084(=0.0008+0.0076+0.0001)」であり、モデル「model_1」のMSEの総和は、「0.0094(=0.0089+0.0004+0.0001)」であり、モデル「model_2」のMSEの総和は、「0.0027(=0.0017+0.0005+0.0004)」であり、モデル「model_3」のMSEの総和は、「0.0136(=0.0066+0.0069+0.0000)」である。よって、この例では、モデル選定部18は、最小のMSE総和「0.0027」を有するモデル「model_2」を代表モデルとして選定する。
【0097】
表示部17Aは、上述した第1の表示例及び第2の表示例の表示処理を行う際には、第2スコア算出部16Aにより算出された第2スコア(すなわち、複数のモデルMの各々について算出されたエントロピーの平均値)を用いて、散布図SP1,SP2を生成及び表示する。
【0098】
表示部17Aは、上述した第3の表示例の表示処理を行う際には、ログ文章33を構成するログ情報31が記録された時点(図7の「開始時点」に対応する時点)と、ログ文章33の少なくとも一つのトピックに対応する代表モデルの第1スコアと、の組に対応する点Pがプロットされた散布図SP3を生成及び表示する。
【0099】
図14は、ログ解析装置1Aの動作の一例を示すフローチャートである。ステップS11及びS12の処理は、図10のステップS1及びS2の処理と同様である。すなわち、ログ情報取得部12は、対象期間Tのログ情報31をログDB11から取得する(ステップS11)。続いて、文章生成部13は、対象期間Tの複数のログ情報31に基づいて、複数のログ文章33を生成する(ステップS12、図3参照)。続いて、モデル生成部14Aは、文章生成部13により生成された複数のログ文章33と互いに異なる複数のモデルパラメータとに基づいて、複数のモデルM(例えば、図12に例示した4つのモデル)を生成する(ステップS13)。続いて、第1スコア算出部15Aは、複数のログ文章33の各々について、複数のモデルM(本実施形態では、上記4つのモデル)の各々から出力される確率分布を、モデルM毎の第1スコアとして算出する(ステップS14、図13参照)。続いて、第2スコア算出部16Aは、ログ文章33毎の第1スコア(トピック毎の確率値)に基づいてログ文章33毎のエントロピーを算出する処理をモデルM毎に実行する(ステップS15、図13参照)。続いて、第2スコア算出部16は、ログ文章33毎に、複数のモデルMの各々について算出されたエントロピーの平均値を第2スコアとして算出する(ステップS16、図13参照)。続いて、モデル選定部18は、複数のモデルMのうちから一の代表モデルを選定する(ステップS17)。続いて、表示部17Aは、表示処理を実行する(ステップS18)。例えば、表示部17Aは、ステップS16で算出されたエントロピーの平均値(第2スコア)を用いた表示処理(例えば、第1の表示例及び第2の表示例の表示処理)を実行する。或いは、表示部17Aは、ステップS17で算出された代表モデル(図13の例では、model_2)を用いた表示処理(例えば、第3の表示例の表示処理)を実行する。
【0100】
以上述べた第2実施形態のログ解析装置1Aによれば、以下の効果が得られる。すなわち、ログ解析装置1Aによれば、複数のモデルMの出力から求まるエントロピーの平均値を第2スコアとして用いることにより、ログ解析のロバスト性(頑健性)を向上させることができる。例えば、モデルパラメータ(トピック数、ランダムシード)をどのように設定すれば適切なモデルMが得られるかは、搬送システム2の構成、対象期間T等によって異なり得る。このため、事前に適切なモデルパラメータを把握することが難しい場合がある。そのため、仮に単一のモデルパラメータに対応するモデルMのみを用いる場合であって、当該モデルMから適切な出力結果が得られない場合(例えば、トラブルに関連するログ文章33の第2スコアがトラブルに関連しないログ文章33の第2スコアよりも高くなるような結果が適切に得られない場合)、ログ解析を効率的に行うことができない。これに対して、複数のモデルMを用いるログ解析装置1Aによれば、仮にモデル生成部14Aにより生成された一のモデルMから適切な出力結果が得られなかったとしても、複数のモデルMの出力結果の平均値を採用することにより、当該一のモデルMの不具合を吸収し、適切な結果(第2スコア)をユーザに提示することが可能となる。
【0101】
また、ログ解析装置1Aによれば、複数のモデルMのうち全文章(複数のログ文章33)について最も平均的なエントロピーを出力したモデルM(すなわち、誤差値の総和が最小となるモデル)を代表モデルとして選定することができる。これにより、複数のモデルMの中で他のモデルMと大きく挙動が異なるモデル(すなわち、複数のモデルMの中でイレギュラーなモデルであり、適切な出力結果が得られない可能性が高いモデルM)が代表モデルとして選定されることを防止することができる。その結果、ユーザに対して適切な出力結果(すなわち、平均的なモデルである代表モデルの出力結果)を提示することができる。
【0102】
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されず、その要旨を逸脱しない範囲で様々な変更が可能である。
【0103】
例えば、上記実施形態(第2実施形態)では、説明を単純にするために、比較的トピック数が少ない4つのモデルMを用いる場合について例示したが、用いられるモデルMの個数は、上記に限られない。例えば、モデル生成部14Aは、4種類のトピック数(8,10,12,16)と5種類のランダムシード(10,30.50,70,90)との各組み合わせに対応する20個のモデルMを生成してもよい。
【0104】
また、上記実施形態では、ログ解析装置1が利用されるシステムとして、半導体工場等に設けられる搬送システム2を例示したが、ログ解析装置1は、搬送システム2以外のシステムにも適用できる。すなわち、ログ解析装置1は、搬送システム2以外のシステムにおいて出力されるログ情報を解析する用途に用いられてもよい。
【0105】
上記実施形態では、ログ解析装置1は搬送システム2の外部に設けられたが、ログ解析装置1は、搬送システム2の一部であってもよい。また、ログDB11は、コントローラ21内に設けられてもよい。また、コントローラ21にログ解析装置1が実装されてもよい。この場合、コントローラ21内で、上述したログ情報の解析(すなわち、上述したログ解析装置1の処理)が行われてもよい。
【0106】
上記実施形態では、ログ情報31は、特定のジョブ(本実施形態では搬送指令)に紐付くイベントに対応する第1ログ情報31Aと、特定のジョブに紐付かないイベントに対応する第2ログ情報31Bと、を含んでいたが、ログ情報31の構成は、上記に限られない。例えば、ログDB11に蓄積される全てのログ情報31が第1ログ情報31Aであってもよいし、ログDB11に蓄積される全てのログ情報31が第2ログ情報31Bであってもよい。
【0107】
なお、本明細書及び添付図面の記載により、少なくとも以下の態様1~態様13が明らかとなる。
【0108】
(態様1)
対象期間内に一以上の装置を含むシステムにおいてイベント毎に出力された文字列からなる複数のログ情報を取得するログ情報取得部と、
前記複数のログ情報に基づいて、一連のイベント毎又は予め定められた長さの設定期間毎に、それぞれ一以上の前記ログ情報が結合された複数のログ文章を生成する文章生成部と、
前記ログ文章毎に、前記複数のログ文章に基づいて設定された複数の主題の各々に分類される度合いを示す第1スコアを算出する第1スコア算出部と、
前記ログ文章毎に、前記第1スコアに基づいて、前記ログ文章を前記複数の主題のうちのいずれか一つの主題に分類することの困難さの度合いを示す第2スコアを算出する第2スコア算出部と、
前記ログ文章毎に算出された前記第2スコアをユーザに対して表示する表示部と、
を備えるログ解析装置。
【0109】
(態様2)
前記対象期間は、
前記システムにおいて解析対象のトラブルが発生していた期間を含むトラブル期間と、
前記トラブル期間よりも長く、且つ、前記システムにおいて前記トラブルが発生していなかった正常期間と、を含む、
態様1のログ解析装置。
【0110】
(態様3)
前記文章生成部は、前記ログ情報のうち予め不要な情報として定められた部分を除外して、前記ログ文章を生成する、
態様1又は態様2のログ解析装置。
【0111】
(態様4)
前記文章生成部により生成された複数のログ文章に基づいて、各前記ログ文章が前記複数の主題の各々に分類される確率を示す確率分布を出力するモデルを生成するモデル生成部を更に備え、
前記第1スコア算出部は、前記複数のログ文章の各々について、前記モデルから出力される前記確率分布を前記第1スコアとして算出し、
前記第2スコア算出部は、前記ログ文章毎の前記第1スコアに基づいて、前記ログ文章毎のエントロピーを前記第2スコアとして算出する、
態様1~態様3のいずれかのログ解析装置。
【0112】
(態様5)
前記表示部は、前記ログ文章に割り当てられた識別子と、前記ログ文章の前記第2スコアと、の組に対応する点がプロットされた散布図を生成及び表示する、
態様1~態様4のいずれかのログ解析装置。
【0113】
(態様6)
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の前記第2スコアと、の組に対応する点がプロットされた散布図を生成及び表示する、
態様1~態様5のいずれかのログ解析装置。
【0114】
(態様7)
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の少なくとも一つの前記主題に対応する前記第1スコアと、の組に対応する点がプロットされた散布図を生成及び表示する、
態様1~態様6のいずれかのログ解析装置。
【0115】
(態様8)
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の少なくとも二以上の前記主題に対応する前記第1スコアと、の組に対応する点がプロットされた前記散布図を生成及び表示し、
前記表示部は、前記主題毎に区別可能な態様で、各前記点を前記散布図上に表示する。
態様7のログ解析装置。
【0116】
(態様9)
前記表示部は、前記散布図にプロットされた所定の点を選択するユーザ操作を受け付けた場合に、前記選択された点に対応する前記ログ文章を構成する前記ログ情報に関する詳細情報を生成及び表示する、
態様5~態様8のいずれかのログ解析装置。
【0117】
(態様10)
前記表示部は、前記散布図と共に、前記複数の主題の各々に対応する内容を視覚的に示す表示情報を生成及び表示する、
態様5~態様9のいずれかのログ解析装置。
【0118】
(態様11)
前記文章生成部により生成された複数のログ文章に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルであって、それぞれ各前記ログ文章が前記複数の主題の各々に分類される確率を示す確率分布を出力する前記複数のモデルを生成するモデル生成部を更に備え、
前記第1スコア算出部は、前記複数のログ文章の各々について、前記複数のモデルの各々から出力される前記確率分布を、前記モデル毎の前記第1スコアとして算出し、
前記第2スコア算出部は、
前記ログ文章毎の前記第1スコアに基づいて前記ログ文章毎のエントロピーを算出する処理を前記モデル毎に実行し、
前記ログ文章毎に、前記複数のモデルの各々について算出されたエントロピーの平均値を前記第2スコアとして算出する、
態様1~態様10のいずれかのログ解析装置。
【0119】
(態様12)
前記文章生成部により生成された複数のログ文章に基づいて、互いに異なる複数のモデルパラメータに対応する複数のモデルであって、各前記ログ文章が前記モデル毎に設定される複数の主題の各々に分類される確率を示す確率分布を出力する前記複数のモデルを生成するモデル生成部と、
前記複数のモデルのうちから一の代表モデルを選定するモデル選定部と、
を更に備え、
前記第1スコア算出部は、前記複数のログ文章の各々について、前記複数のモデルの各々から出力される前記確率分布を、前記モデル毎の前記第1スコアとして算出し、
前記モデル選定部は、
前記ログ文章及び前記モデルの組み合わせ毎のエントロピーを取得し、
前記ログ文章毎に、複数の前記モデルの各々に対応するエントロピーの平均値を取得し、
前記ログ文章及び前記モデルの組み合わせ毎に、各前記モデルに対応するエントロピーと各前記ログ文章に対応する前記平均値との誤差に関する指標である誤差値を算出し、
複数の前記ログ文章の各々について算出された前記誤差値の総和が最小となる前記モデルを代表モデルとして選定し、
前記表示部は、前記ログ文章を構成する前記ログ情報が記録された時点と、前記ログ文章の少なくとも一つの前記主題に対応する前記代表モデルの前記第1スコアと、の組に対応する点がプロットされた散布図を表示する、
態様1~態様11のいずれかのログ解析装置。
【0120】
(態様13)
前記装置は、物品を搬送する搬送車であり、
前記一連のイベントは、コントローラによって前記搬送車に割り付けられる一の搬送指令に対応して実行される一連の処理である、
態様1~態様12のいずれかのログ解析装置。
【符号の説明】
【0121】
1,1A…ログ解析装置、2…搬送システム(システム)、12…ログ情報取得部、13…文章生成部、14,14A…モデル生成部、15,15A…第1スコア算出部、16,16A…第2スコア算出部、17,17A…表示部、18…モデル選定部、21…コントローラ、22…搬送車(装置)、31…ログ情報、33,33A,33B,33C…ログ文章、50…表示情報、D…詳細情報、M…モデル、P,P1…点、SP1,SP2,SP3…散布図、T…対象期間、T1…トラブル期間、T2…正常期間。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14