IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ・ボーイング・カンパニーの特許一覧

特開2024-45063材料名を照合するための方法及びシステム
<>
  • 特開-材料名を照合するための方法及びシステム 図1
  • 特開-材料名を照合するための方法及びシステム 図2
  • 特開-材料名を照合するための方法及びシステム 図3
  • 特開-材料名を照合するための方法及びシステム 図4
  • 特開-材料名を照合するための方法及びシステム 図5
  • 特開-材料名を照合するための方法及びシステム 図6
  • 特開-材料名を照合するための方法及びシステム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024045063
(43)【公開日】2024-04-02
(54)【発明の名称】材料名を照合するための方法及びシステム
(51)【国際特許分類】
   G06Q 50/26 20240101AFI20240326BHJP
【FI】
G06Q50/26
【審査請求】未請求
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023151555
(22)【出願日】2023-09-19
(31)【優先権主張番号】17/948,488
(32)【優先日】2022-09-20
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ブルートゥース
2.BLUETOOTH
3.WCDMA
4.UNIX
(71)【出願人】
【識別番号】500520743
【氏名又は名称】ザ・ボーイング・カンパニー
【氏名又は名称原語表記】The Boeing Company
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】ヤン, リー
(72)【発明者】
【氏名】クッパー, キャロリン ラニアー
(72)【発明者】
【氏名】トーマス, シジ
(72)【発明者】
【氏名】ハグラー, ジョージ マシュー
(72)【発明者】
【氏名】トンプソン, ウィリアム アラン
(72)【発明者】
【氏名】ツェルナー, ロビン リン
(57)【要約】      (修正有)
【課題】1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータに実装された方法、デバイスおよびプログラムを提供する。
【解決手段】方法は、1以上の材料ソースから材料名を抽出すること、材料名を前処理して、材料名のうちの1以上から無関係なデータを除去すること、材料名のうちの1つを選択すること、選択された材料名を安全データシート材料名と比較すること、材料名にマッチする安全データシート材料名を特定すること及び材料名と、マッチした安全データシート材料名とを表示するために、ユーザデバイスに出力を送信することを含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータに実装された方法であって、
処理回路(103)を使用して、前記1以上の材料ソース(21)から前記材料名を抽出すること、
前記処理回路(103)を使用して、前記材料名を前処理し、前記材料名のうちの1以上から無関係なデータを除去すること、
前記処理回路(103)を使用して、前記材料名のうちの1つを選択すること、
前記処理回路(103)を使用して、選択された前記材料名を前記安全データシート材料名と比較すること、
前記処理回路(103)を使用して、前記材料名にマッチする前記安全データシート材料名を特定すること、及び
前記処理回路(103)を使用して、前記材料名と、マッチした前記安全データシート材料名とを表示するために、ユーザデバイス(200)のディスプレイ用の出力を送信することを含む、方法。
【請求項2】
前記処理回路(103)を使用して、前記材料名が前記安全データシート材料名に一致する確率を特定することを更に含む、請求項1に記載の方法。
【請求項3】
前記確率に基づいてランク付けされた順序で、前記材料名にマッチした前記安全データシート材料名をリストアップすることを更に含む、請求項2に記載の方法。
【請求項4】
所定量を超える確率を有する前記安全データシート材料名を表示することを更に含む、請求項2に記載の方法。
【請求項5】
前記1以上の材料ソース(21)から前記材料名を抽出することは、拡張マークアップ言語(XML)のデータについて前記1以上の材料ソースを解析し、表(50)内の前記材料名についてXMLデータを構文解析することを含む、請求項1に記載の方法。
【請求項6】
前記1以上の材料ソース(21)から前記材料名を抽出することは、前記1以上の材料ソース(21)のテキストのセクションにパターン照合を適用して、前記材料名を特定することを含む、請求項1に記載の方法。
【請求項7】
前記材料名を前処理することは、色、種類、及びクラスを含む属性を前記材料名から除去することを含む、請求項1に記載の方法。
【請求項8】
前記材料名を前処理することは、トークン化を適用して、前記材料名から句読点を除去することを含む、請求項1に記載の方法。
【請求項9】
前記材料名にマッチした前記安全データシート材料名を所定の数だけ表示することを更に含む、請求項1に記載の方法。
【請求項10】
前記マッチした安全データシート材料名のうちの選択された1つを前記材料名とリンクさせることによって、データリポジトリを更新することを更に含む、請求項1に記載の方法。
【請求項11】
処理回路(103)、及び
プログラムを記憶したメモリ回路(104)を備える、コンピューティングデバイスであって、前記プログラムは、前記処理回路(103)で実行されると、動作を実行し、前記動作は、
1以上の材料ソース(21)から材料名を抽出すること、
前記材料名を1以上の安全データシートソース(23)からの安全データシート材料名と比較すること、
前記材料名にマッチする前記安全データシート材料名を特定すること、
マッチした前記安全データシート材料名が前記材料名に一致する確率を計算すること、及び
前記材料名と、前記マッチした安全データシート材料名と、対応する前記確率とを含む表示を生成することを含む、コンピューティングデバイス。
【請求項12】
前記動作は、マッチする前記安全データシート材料名を特定する前に、色、種類、及びクラスを含む属性を有する前記材料名から1以上の前記属性と句読点とを除去することを更に含む、請求項11に記載のコンピューティングデバイス。
【請求項13】
前記1以上の材料ソースから前記材料名を抽出することは、拡張マークアップ言語(XML)を含む表について前記1以上の材料ソースを特定し、前記表からの前記材料名を構文解析することを含む、請求項11に記載のコンピューティングデバイス。
【請求項14】
前記動作は、前記材料名を分類することを更に含み、前記材料名を分類することは、
前記材料名内に順次リストアップされている単語の組み合わせを特定すること、
前記組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定すること、
マッチが存在しないときに、前記組み合わせを前記材料名内に順次リストアップされている前記単語のより小さな組み合わせに分割すること、及び
前記より小さな組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定することを含む、請求項11に記載のコンピューティングデバイス。
【請求項15】
前記1以上の材料ソース(21)から前記材料名を抽出することは、前記1以上の材料ソース(21)のテキストのセクションにパターン照合を適用して、前記材料名を特定することを含む、請求項11に記載のコンピューティングデバイス。
【請求項16】
前記動作は、前記マッチした安全データシート材料名のうちの選択された1つを前記材料名とリンクさせることによって、データリポジトリを更新することを更に含む、請求項11に記載のコンピューティングデバイス。
【請求項17】
1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータプログラム製品であって、
コンピュータ可読プログラムコードが具現化された非一過性のコンピュータ可読ストレージ媒体を備え、前記コンピュータ可読プログラムコードは、処理回路(103)によって、動作を実行するように実行可能であり、前記動作は、
前記1以上の材料ソース(21)から前記材料名を抽出すること、
前記材料名を前処理して、前記材料名のうちの1以上から無関係なデータを除去すること、
前記材料名のうちの1つを選択すること、
選択された前記材料名を前記安全データシート材料名と比較すること、
前記材料名にマッチする前記安全データシート材料名を特定すること、
マッチした前記安全データシート材料名が前記材料名に一致する確率を計算すること、及び
前記材料名と、前記マッチした安全データシート材料名と、前記安全データシート材料名が前記材料名に一致する前記確率とを含む、ユーザデバイス(200)のディスプレイ用の出力を生成することを含む、コンピュータプログラム製品。
【請求項18】
前記動作は、前記材料名を分類することを更に含み、前記材料名を分類することは、
前記材料名内に順次リストアップされている単語の組み合わせを特定すること、
前記組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定すること、
マッチが存在しないときに、前記組み合わせを前記材料名内に順次リストアップされている前記単語のより小さな組み合わせに分割すること、及び
前記より小さな組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定することを含む、請求項17に記載のコンピュータプログラム製品。
【請求項19】
前記材料名を前処理することは、前記材料名を前記安全データシート材料名と照合する前に、色、種類、及びクラスを含む属性を前記材料名から除去することを含む、請求項17に記載のコンピュータプログラム製品。
【請求項20】
前記材料名を前処理することは、前記材料名を前記安全データシート材料名と照合する前に、トークン化を適用して、前記材料名から句読点を除去することを含む、請求項17に記載のコンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、広くは、材料名を照合する分野に関し、特に、一致を判断するために加工材料名を特定することに関する。
【背景技術】
【0002】
様々な政府規制機関が、環境規制を策定し、施行している。機関の例には、米国環境保護庁(EPA)、カナダ環境保護庁(EPA)、欧州連合(EU)の欧州化学物質庁(ECHA)が含まれる。これらの規制は、商業的に供給される製品の化学的組成を把握することを当事者に求めている。航空機メーカーなどの大きな製品のメーカーにとって、航空機に含まれる化学的組成物を追跡することは困難な場合が多い。更に、既存の規制に変更が加えられたり、新たな規制が導入されたりすると、コンプライアンスを確保することが難しくなり得る。
【0003】
政府機関が新たな化学物質規制を導入したときに、メーカーは自社製品が適合していることを確認する。これには、その物質をチェックするために複数のシステムに手作業で照会することによって、規制された物質を特定することが含まれる。しかし、これらの異なるシステムは、コンプライアンスを判断するために必要とされる限られた量のデータしか提供しないことが多い。例えば、あるシステムには、製造仕様、部品サプライヤー、部品のサプライヤー名、及び社内の命名規則が含まれる。第2のシステムには、物質の安全データシートが含まれ、これには、固有のサプライヤーの識別が含まれる。複数のシステムは、しばしば、異なる命名規則を使用しており、どのシステムも、物質の使用状況を包括的に見ることはできない。複数のシステムは、規制の影響を完全に評価するために統合されていない。
【0004】
物質の使用状況を効率的に特定することができないので、メーカーの適時の規制遵守が妨げられる可能性がある。これにより、生産が停止され、政府機関から多額の罰金が課せられ、製品が市場に出回らなくなるかもしれない。
【発明の概要】
【0005】
一態様は、1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータに実装された方法を対象とする。該方法は、処理回路を使用して、1以上の材料ソースから材料名を抽出すること、処理回路を使用して、材料名を前処理し、材料名のうちの1以上から無関係なデータを除去すること、処理回路を使用して、材料名のうちの1つを選択すること、処理回路を使用して、選択された材料名を安全データシート材料名と比較すること、処理回路を使用して、材料名にマッチ(match)する安全データシート材料名を特定すること、及び、処理回路を使用して、材料名と、マッチした安全データシート材料名とを表示するために、ユーザデバイスのディスプレイ用の出力を送信することを含む。
【0006】
別の一態様では、該方法が、処理回路を使用して、材料名が安全データシート材料名に一致する確率を特定することを更に含む。
【0007】
別の一態様では、該方法が、確率に基づいてランク付けされた順序で、材料名にマッチした安全データシート材料名をリストアップすることを更に含む。
【0008】
別の一態様では、該方法が、所定量を超える確率を有する安全データシート材料名を表示することを更に含む。
【0009】
別の一態様では、1以上の材料ソースから材料名を抽出することが、拡張マークアップ言語(XML)のデータについて1以上の材料ソースを解析し、表内の材料名についてXMLデータを構文解析することを含む。
【0010】
別の一態様では、1以上の材料ソースから材料名を抽出することが、1以上の材料ソースのテキストのセクションにパターン照合を適用して、材料名を特定することを含む。
【0011】
別の一態様では、材料名を前処理することが、色、種類、及びクラスを含む属性を材料名から除去することを含む。
【0012】
別の一態様では、材料名を前処理することが、トークン化を適用して、材料名から句読点を除去することを含む。
【0013】
別の一態様では、該方法が、材料名にマッチした安全データシート材料名を所定の数だけ表示することを更に含む。
【0014】
別の一態様では、該方法が、マッチした安全データシート材料名のうちの選択された1つを材料名とリンクさせることによって、データリポジトリを更新することを更に含む。
【0015】
一態様は、処理回路、及びプログラムを記憶したメモリ回路を備える、コンピューティングデバイスを対象とする。該プログラムは、処理回路で実行されると、動作を実行する。該動作は、1以上の材料ソースから材料名を抽出すること、材料名を安全データシート材料名と比較すること、材料名にマッチする安全データシート材料名を特定すること、マッチした安全データシート材料名が材料名に一致する確率を計算すること、及び、材料名と、マッチした安全データシート材料名と、対応する確率とを含む表示を生成することを含む。
【0016】
別の一態様では、該動作が、マッチする安全データシート材料名を特定する前に、色、種類、及びクラスを含む属性を有する材料名から属性と句読点とのうちの1以上を除去することを更に含む。
【0017】
別の一態様では、1以上の材料ソースから材料名を抽出することが、拡張マークアップ言語(XML)を含む表について1以上の材料ソースを特定し、表からの材料名を構文解析することを含む。
【0018】
別の一態様では、材料名を分類することが、材料名内に順次リストアップされている単語の組み合わせを特定すること、その組み合わせと安全データシート材料名との間にマッチが存在するかどうかを判定すること、マッチが存在しないときに、その組み合わせを材料名内に順次リストアップされている単語のより小さな組み合わせに分割すること、及び、そのより小さな組み合わせと安全データシート材料名との間にマッチが存在するかどうかを判定することを含む。
【0019】
別の一態様では、1以上の材料ソースから材料名を抽出することが、1以上の材料ソースのテキストのセクションにパターン照合を適用して、材料名を特定することを含む。
【0020】
別の一態様では、該動作が、マッチした安全データシート材料名のうちの選択された1つを材料名とリンクさせることによって、データリポジトリを更新することを更に含む。
【0021】
一態様は、1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータプログラム製品を対象とする。該コンピュータプログラム製品は、コンピュータ可読プログラムコードが具現化された非一過性のコンピュータ可読ストレージ媒体を備える。該コンピュータ可読プログラムコードは、処理回路によって、動作を実行するように実行可能である。該動作は、1以上の材料ソースから材料名を抽出すること、材料名を前処理して、材料名のうちの1以上から無関係なデータを除去すること、材料名のうちの1つを選択すること、選択された材料名を安全データシート材料名と比較すること、材料名にマッチする安全データシート材料名を特定すること、マッチした安全データシート材料名が材料名に一致する確率を計算すること、及び、材料名と、マッチした安全データシート材料名と、安全データシート材料名が材料名に一致する確率とを含む、ユーザデバイスのディスプレイ用の出力を生成することを含む。
【0022】
別の一態様では、材料名を分類することが、材料名内に順次リストアップされている単語の組み合わせを特定すること、その組み合わせと安全データシート材料名との間にマッチが存在するかどうかを判定すること、マッチが存在しないときに、その組み合わせを材料名内に順次リストアップされている単語のより小さな組み合わせに分割すること、及び、そのより小さな組み合わせと安全データシート材料名との間にマッチが存在するかどうかを判定することを含む。
【0023】
別の一態様では、材料名を前処理することが、材料名を安全データシート材料名と照合する前に、色、種類、及びクラスを含む属性を材料名から除去することを含む。
【0024】
別の一態様では、材料名を前処理することが、材料名を安全データシート材料名と照合する前に、トークン化を適用して、材料名から句読点を除去することを含む。
【0025】
上述の特徴、機能、及び利点は、様々な態様において単独で実現することができ、又は、更に別の態様において組み合わせることができるが、これらの詳細は、以下の説明及び添付図面を参照することによって確認することができる。
【図面の簡単な説明】
【0026】
図1】1以上のソースからの情報を記憶するデータベースを含むデータリポジトリの概略図である。
図2】材料名を安全データシート材料名と照合する方法のフローチャートである。
図3】文書から材料名を特定し、抽出する方法のフローチャートである。
図4】マッチを判定するために材料名の分類を使用する方法のフローチャートである。
図5】ユーザデバイスに表示された表の図である。
図6】材料名を照合するためのシステムの概略図である。
図7】コンピューティングデバイスの概略図である。
【発明を実施するための形態】
【0027】
図1は、エンティティによって使用される材料に関する情報を記憶したデータリポジトリ20を示している。データリポジトリ20は、エンティティによって使用される種々の材料に関する情報を記憶したデータベース24を含む。この情報には、非限定的に、材料の名称、識別番号、材料を供給したベンダー又はソース、材料の化学的組成、及び安全データシートの作成日又は改訂日を含む、材料に関する幅広い様々な情報が含まれ得る。1つの用途は、航空機メーカー向けのものであり、その場合、データベース24は、航空機を製造するために使用される材料を含む。
【0028】
データベース24には、様々な異なるソース21、23からの材料に関する情報が供給される。材料ソース21には、調達、経理、設計、製造を含む異なる部門などの、企業内の異なるエリアからの内部情報が含まれる。材料ソース21には、異なる部門又は子会社などの、より大きな企業全体の中の異なる部門も含まれ得る。材料ソース21はまた、材料に関する情報を収集する企業内の種々の人々であり得る。
【0029】
材料に関する情報の別の1つのソースは、安全データシートソース23である。安全データシートは、サプライヤー、ベンダー、又は作成者によって準備され、材料の名称、物理的特性、及び化学的特性を含む、材料に関する詳細な情報を含む。安全データシートは、通常、材料が購入されるか又は他の方法で取得されたときに入手される。
【0030】
材料ソース21と安全データシートソース23との両方からの材料に関する情報は、データベース24のデジタルファイル内に記憶される。図1は、2つの材料ソース21a、21b及び1つの安全データシートソース23が、情報をデータベース24に供給する一実施例を概略的に示している。本開示は、図1のこの配置を使用して方法論を説明することとなる。本開示は、データベース24に情報を供給するソース21、23の様々な数や配置に適用可能であることを理解されたい。
【0031】
材料ソース21と安全データシートソース23との間で材料名が一貫していないときに問題が生じる。これは、エンティティが材料が使用されているかどうかを正確に判定することを妨げる。一貫していない1つの理由は、異なる材料ソース21によって、及び/又は材料ソース21と安全データシートソース23との間で、異なる命名規則が使用されていることである。例えば、材料ソース21は、「カーボンFE溶剤共沸混合物」という材料の名称を含み、一方で、同じ材料が、安全データシートソース23において「カーボンFe」としてリストアップされている。一貫していない別の1つの理由は、材料名を簡略化するために切り捨てたり略したりする人や、材料名をインフォーマルな又はスラングのバージョンとして特定する人がいることである。一貫していない別の1つの例は、リブランディング、買収/合併、別のエンティティへの分割などを介して、サプライヤーによって材料の名称が変更されたときである。
【0032】
本出願は、異なるソース21、23からの材料の名称を比較し、マッチの表示を提供する、コンピューティングデバイス101によって使用されるプログラムであるツール30を開示する。次いで、マッチした項目は、データベース24内に記憶され、材料についての将来におけるより効果的な検索を提供する。
【0033】
図2は、データベース24用の正確で一貫した情報を生成することにおけるツール30の機能性を示している。ツール30は、1以上の材料ソース21から文書を読み出し、その文書から材料名を特定し、抽出する(ブロック91)。材料ソース21からの名称は、安全データシートソース23からの名称と比較される(ブロック93)。1以上のマッチが、潜在的に等しい材料として特定される(ブロック95)。次いで、ユーザデバイス用に出力するために、マッチした安全データシート材料名が準備される(ブロック97)。
【0034】
機能性はまた、ツール30の異なる複数の態様において1以上の更なるステップも含み得る。一実施例では、材料名が、適用可能な安全データシート材料名にマッチし、データベース24が更新される。一実施例では、マッチを特定する前に、材料名が前処理される。
【0035】
文書からの材料名の特定及び抽出(ブロック91)は、材料ソース21からの文書の性質により困難なことがある。1つの問題は、材料名が、表、ヘッダー、及びテキスト中などのように、文書内で異なるフォーマットになっていることである。別の1つの問題は、文書が材料名の中にノイズを有していることである。ノイズの例には、非限定的に、単語の種類、クラス、グレード、及び色が含まれる。
【0036】
材料名を特定して抽出する1つの方法が、図3で示されている。文書は、解析されて、拡張マークアップ言語(XML)フォーマットのデータを含むものが特定される(ブロック110)。次いで、特定された文書は、表について構文解析される(ブロック112)。次いで、表は、材料名について更に構文解析される(ブロック114)。表はまた、非限定的に、サプライヤー名や住所、及び分類などの、更なる情報についても構文解析され得る。同様の方法で、文書は、テキスト中にXMLデータを含むものが特定される。次いで、XMLテキストは、材料名について構文解析される。一実施例では、ディープラーニング手法と人工知能方法とを含む機械学習シーケンスタギングが、材料名を特定するために適用される。更に又は代替的に、パターン照合などの規則に基づく方法が、XMLセクションのうちのセクションに適用されて、材料名を特定する。
【0037】
材料ソース21から特定された材料名(ブロック114)を、安全データシート材料ソース23からのものと比較し、照合することは、異なる命名規則により困難なことがある。表1内には、材料ソース21からの製造仕様と安全データシートソース23からの対応する名称とを含む、一貫していない2つの例が含まれている。
【0038】
第1の例で示されているように、安全データシートソース23は、材料を「1234abcメタン緩染剤」としてリストアップしている。材料ソース21は、同じ材料を「メタン遅延剤」として特定している。第2の例は、「987gal-uivo緑543,6709メタン」という名称を使用する安全データシートソース23、及び「青543,6709abc2.0bocメタン,atl-ubd-8907e,タイプII」という名称を使用する材料ソース21を含む。
【0039】
比較を容易にするために、材料ソース21からの材料名が前処理されてよい。前処理には、照合を妨げ得る材料名内の無関係なデータを除去することが含まれる。無関係なデータには、1以上の単語又は文字が含まれ得る。前処理は、1以上の異なるステップを含み得る。1つのステップは、1以上の種類の句読点を材料名から除去するトークン化を適用することを含み得る。一実施例では、ハイフンが材料名から除去される(例えば、「フレオン‐剤」は「フレオン剤」になる)。別の一実施例では、カンマが材料名から除去される。前処理には、材料名から属性を除去することも含まれ得る。属性には、非限定的に、材料のクラス、材料の種類、及び色の識別子が含まれ得る。一実施例には、材料名「987gal-uivo緑543,6709メタン」を「987gal-uivo543,6709メタン」に処理することが含まれる。これは、材料名から色の記述子を除去することを含む。
【0040】
一実施例では、前処理することが、材料名を共通フォーマットで保存することを含む。これにより、異なるソース21、23からの異なる材料名を比較することが容易になる。一実施例では、材料名が、ジャバスクリプトオブジェクトノーション(JSON)フォーマットで保存される。材料名は、非限定的に、ジャバスクリプト、ヤムル(YAML)、及びProtobufを含む、様々な他のフォーマットで保存され得る。
【0041】
前処理済み又は前処理なしのいずれの材料名も、安全データシート23からの材料名と照合される(ブロック95)。名称を照合する1つのやり方は、材料名について分類を使用することである。図4は、マッチが存在するかどうかを判定するために分類を使用する一実施例を含む。材料名の分類が特定される(ブロック130)。一実施例では、分類が、順次一緒にされた材料名内の基本的な単語を特定することを含む。材料名は、単グラム(1語)、双グラム(2語)、三グラム(3語)などであり得る。例えば、「テトラクロロエチレン(Tetrachloroethylene)」と「フレオン(Freon)」は両方とも単グラムであり、「メタン遅延剤(Methane Retarder)」と「脱イオン水(Deionized Water)」は両方とも双グラムであり、「アクリル酸クロム炭素(Chromium acrylic carbon)」は三グラムである。
【0042】
該方法は、材料名の最上位分類について一致が存在するかどうかを判定する(ブロック132)。分類内の全ての単語が安全データシート材料名からのものとマッチするときに、最上位分類のマッチが生じる。単語の各々とのマッチが存在する場合、材料名は共にマッチする(ブロック134)。マッチが存在しない場合、該方法は、材料名が1以上のより小さな分類に分割され得るかどうかを判定することを含む(ブロック136)。より小さな分類が存在しない場合、材料名はマッチしない(ブロック137)。1以上の小さな分類が存在する場合、マッチが存在するかどうかを判定するために、より低い分類が使用される(ブロック138)。表1からの材料名を使用すると、「メタン遅延剤」は、より高い分類の双グラムであるが、「1234abcメタン緩染剤」とマッチしない。次いで、材料名は、双グラムから2つのより低い単グラム(「メタン」と「遅延剤」を含む)に分割される。この分割は、単グラム「メタン」が、安全データシート材料名「1234abcメタン緩染剤」内の単語のうちの1つにマッチするので、マッチを提供する。
【0043】
別の一実施例は、「塩化炭素、無水」を照合することを含む。この最上位分類の三グラムは、「塩化炭素」のみについて対応する材料名にマッチしない。三グラムとして一致することができなかった後で、該方法は、材料名をより小さな分類の双グラム「塩化炭素」に分割する。この双グラムは、安全データシートからの対応する名称とマッチする。
【0044】
材料名を照合するための別の分類システムは、材料名から1以上の語根を特定することを含む。次いで、材料名からの語根は、マッチが存在するかどうかを判定するために比較され得る。例えば、表1からの材料名「青543,6709abc2.0bocメタン,atl-ubd-8907e,タイプII」は、語根「メタン」を含む。これは、次いで、使用されて、他の材料名とマッチする。
【0045】
様々な照合ステップの順序は、変わる可能性がある。例えば、図4は、様々なステップを特定の順序で有する方法を含む。該方法は、特定のシーケンスに限定されないので、様々な異なる順序のステップを含み得る。
【0046】
該プロセスは、完全な一致を特定する。該プロセスはまた、材料名が安全データシート材料名に一致する確率を計算することも含み得る。これにより、名称が正しく一致している精度及び/又は信頼度を特定することができる。確率の採点は、照合技法のうちの1以上に基づき得る。例えば、採点は、名称の間でマッチする分類レベルに基づき得る。三グラムのマッチが最も高いスコアであり、次に双グラムのスコア、そして単グラムのスコアが最も低くなり得る。別の一実施例では、採点が、材料ソース21からの保存された材料名のマッチに基づく。材料名の根部分のみのマッチには、より小さなスコアが割り当てられる。完全な一致の特定は、1以上の複数の異なる照合技法及び採点システムに基づき得る。
【0047】
一実施例では、材料名の間の比較を実行するように構成されたツール30が、ロジスティック回帰モデルを含む。ロジスティック回帰モデルは、既知のマッチした及びマッチしなかったペアを使用して訓練された機械学習を使用する。一実施例では、ロジスティック回帰モデルが、材料名の一万三千(13,000)個のマッチしたペアと五千(5,000)個のマッチしなかったペアを使用して訓練される。使用中、材料名の間の一致の確率が、ロジスティック回帰モデルによって計算される。
【0048】
分類レベルを使用する一実施例では、より長い組み合わせ及びより短い組み合わせの特徴カウントが、計算と特定のために同時にロジスティック回帰モデルに入力される。三グラムと双グラムは、より長い組み合わせとして規定され、単グラムは、より短い組み合わせとして規定される。
【0049】
一実施例は、材料ソース21からの材料名「アクリルF3104」を含む。安全データシートソース23からの材料名が解析され、ツール30は図5で示されているような表50を出力する。表50は、材料ソース21からの名称に最も緊密にマッチする安全データシートソース23からの出力結果51のリストを含む。材料名に加えて、出力結果51は、安全データシート番号、ベンダー、及び一致の確率を含む、安全データシートソースからのデータを含む。出力結果51は、一致の確率が高い順序でリストアップされている。出力結果51の数は、変動し得る。
【0050】
含まれる出力結果51の数は、変動し得る。一実施例では、所定の数の出力結果51が表示されるように構成される。別の一実施例では、所定量を超える確率レベルを有すると判定された出力結果51が表示されるように構成される。
【0051】
材料名の各々についての一致の確率を計算して含めることで、プロセスが更に容易になる。一致の確率を使用して、一致が判定され得る。例えば、単一の材料名だけが所定の一致の確率を上回った場合、これが一致として選択される。計算が、高い一致の確率を有する複数の材料名を特定した場合、ツール30は、これらの選択肢を区別するために更なる処理を実行してよい。一実施例では、所定の確率を超える照合が存在しなかった場合、ツール30は、材料について一致する安全データシートが存在しなかったとの判定としてこれを使用することができる。
【0052】
材料ソース21及び/又は安全データシートソース23からのデータの量が潜在的に大きいので、処理方法は、処理時間を最小化するための技法を利用する。
【0053】
一実施例では、材料名について比較を実行し及び/又は材料名について一致の確率を計算するために、ロジスティックCUDAカーネル関数が、コンピューティングデバイス101によって実装され、利用される。一実施例では、一致度のランキングが、CUDA Thrustソート関数を使用して実行される。
【0054】
以下の表2は、145,000個の安全データシート材料名が処理され、材料名と比較されて、ランキングプロセスを行った試験結果である。
【0055】
図6は、材料ツール30を使用するためのシステム100を示すブロック図である。コンピューティングデバイス101が、通信ネットワーク102に接続されている。通信ネットワーク102は、インターネット、ローカルアクセスネットワーク、又はワイドアクセスネットワークを含む、任意の適切な通信ネットワークであり得る。通信ネットワーク102は、有線又は無線ネットワークであり得る。通信ネットワーク102は、任意の適切な無線プロトコルを含む、任意の適切な通信プロトコルを使用し得る。例えば、通信ネットワーク102は、802.11規格のようなIEEE(Institute for Electrical and Electronics Engineers)Wi-Fi規格、別のWi-Fi規格、セルラープロトコル(3G、LTE(Long-Term Evolution)、4Gなどを含む)、ブルートゥース(Bluetooth)などを使用し得る。更に、通信ネットワーク102は、幾つかの異なる通信プロトコルを使用し得る。
【0056】
通信ネットワーク102は、データリポジトリ20に更に接続されている。データリポジトリ20は、任意の適切なデータストレージ媒体であり得る。例えば、データリポジトリ20は、リレーショナルデータベース、又は任意の他の適切なデータベースを含み得る。一実施例では、データリポジトリ20が、通信ネットワーク102との通信を可能にするために、ネットワークインターフェースソフトウェア及びハードウェアを含む。一実施例では、データリポジトリ20が、ネットワークインターフェースを有するサーバコンピュータである。別の一実施例として、データリポジトリ20は、コンピューティングデバイス101内に含まれ得る。代替的に、データリポジトリ20は、通信ネットワーク102を介してアクセス可能なクラウドベースのストレージシステムであり得る。
【0057】
図7は、コンピューティングデバイス101の一実施例を示すブロック図である。コンピューティングデバイス101は、処理回路103、メモリ回路104、及び通信回路105を含む。
【0058】
処理回路103は、1以上の回路、マイクロコントローラ、マイクロプロセッサ、ハードウェア、又はそれらの組み合わせを含む。メモリ回路104は、コンピュータプログラム製品としてのツール30などのプログラム指示命令を記憶した非一過性のコンピュータ可読ストレージ媒体を含む。該媒体は、本明細書で説明される技法のうちの1以上を実装するように処理回路103を構成する。メモリ回路104は、例えば、リードオンリーメモリやフラッシュメモリなどの様々なメモリデバイスを含み得る。メモリ回路104は、図7で示されているような別個の構成要素であり得るか、又は処理回路103に組み込まれ得る。通信回路105は、データリポジトリ20及びユーザデバイス200との通信を提供する。通信回路105は、ネットワーク102を介した、ならびにネットワーク102の外側の他の方法を介した通信を可能にする。通信回路105は、異なる通信方法を提供する1以上のインターフェースを含み得る。通信回路105は、モバイル通信ネットワーク(例えば、WCDMA、LTE、又はWiMAXネットワーク)との通信を可能にするセルラーインターフェースを含み得る。通信回路105は、例えば無線アクセスポイントを介してローカルエリアネットワークと通信するように構成されたWLANインターフェースを含み得る。例示的なWLANインターフェースは、一般にWi-Fiインターフェースとして知られている802.11ファミリー規格に従って動作し得る。通信回路105は、Bluetoothインターフェースなどのパーソナルエリアネットワークインターフェースを更に含み得る。通信回路105はまた、近距離通信インターフェースも含み得る。それは、デバイスが近距離を経て互いに情報を共有することを可能にするために、磁場誘導を使用する近距離無線接続技術を提供する。
【0059】
コンピューティングデバイス101は、ユーザがツール30にアクセスし及びツール30を利用することを提供するユーザインターフェース106を含み得る。ユーザインターフェース106は、処理回路103にコマンドを入力するために、非限定的に、キーパッド、タッチパッド、ローラーボール、及びジョイスティックなどの、1以上の入力デバイスを含み得る。ユーザインターフェース106はまた、情報を表示するための1以上のディスプレイも含み得る。
【0060】
処理回路103は、メモリ回路104内に記憶されたプログラミング指示命令を含むツール30を読み出して、実行するとともに、データリポジトリ20内に常駐するアプリケーションデータを記憶して、読み出す。別の一実施例では、データリポジトリが、メモリ回路104の一部などのコンピューティングデバイス101の一部であるか、コンピューティングデバイス101内に含まれるか、又はさもなければコンピューティングデバイス101を伴って構成される。
【0061】
メモリ回路104は、オペレーティングシステム及びデータベース管理システム(DBMS)を含む。オペレーティングシステムは、概して、材料ツール30の実行を制御する。オペレーティングシステムの例には、非限定的に、UNIXのバージョン、Linux(登録商標)オペレーティングシステムの頒布、Microsoft(登録商標)Windows(登録商標)のバージョンなどが含まれる。DBMSは、概して、データリポジトリ20内のデータ(例えば、材料名)の取り込みと解析を容易にする。例えば、DBMSは、データリポジトリ20の規定、作成、照会、更新、及び管理を可能にし得る。一実施例として、DBMSは、クエリ(例えば、構造化クエリ言語(SQL)を使用して構成される)を受け取り得、これに応じて、データリポジトリ20に対して実行される1以上のアクセスルーチンを含む実行プランを生成し得る。次いで、DBMSは、(1以上の)アクセスルーチンを実行し得、任意の問い合わせ(クエリ)結果データを要求者に返し得る。
【0062】
一実施例では、該方法を使用して、航空機の製造中に使用される材料をモニタする。しかし、該方法はまた、工場、製造設備、及び他の適切な産業を含む、様々な他の産業や用途、業界にも適用可能である。
【0063】
更に、本開示は以下の条項による実施形態を含む。
【0064】
条項1.
1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータに実装された方法であって、
処理回路103を使用して、前記1以上の材料ソース21から前記材料名を抽出すること、
前記処理回路103を使用して、前記材料名を前処理し、前記材料名のうちの1以上から無関係なデータを除去すること、
前記処理回路103を使用して、前記材料名のうちの1つを選択すること、
前記処理回路103を使用して、選択された前記材料名を前記安全データシート材料名と比較すること、
前記処理回路103を使用して、前記材料名にマッチする前記安全データシート材料名を特定すること、及び
前記処理回路103を使用して、前記材料名と、マッチした前記安全データシート材料名とを表示するために、ユーザデバイス200のディスプレイ用の出力を送信することを含む、方法。
【0065】
条項2.
前記処理回路103を使用して、前記材料名が前記安全データシート材料名に一致する確率を特定することを更に含む、条項1に記載の方法。
【0066】
条項3.
前記確率に基づいてランク付けされた順序で、前記材料名にマッチした前記安全データシート材料名をリストアップすることを更に含む、条項2に記載の方法。
【0067】
条項4.
所定量を超える確率を有する前記安全データシート材料名を表示することを更に含む、条項2に記載の方法。
【0068】
条項5.
前記1以上の材料ソース21から前記材料名を抽出することは、拡張マークアップ言語(XML)のデータについて前記1以上の材料ソースを解析し、表50内の前記材料名についてXMLデータを構文解析することを含む、条項1に記載の方法。
【0069】
条項6.
前記1以上の材料ソース21から前記材料名を抽出することは、前記1以上の材料ソース21のテキストのセクションにパターン照合を適用して、前記材料名を特定することを含む、条項1に記載の方法。
【0070】
条項7.
前記材料名を前処理することは、色、種類、及びクラスを含む属性を前記材料名から除去することを含む、条項1に記載の方法。
【0071】
条項8.
前記材料名を前処理することは、トークン化を適用して、前記材料名から句読点を除去することを含む、条項1に記載の方法。
【0072】
条項9.
前記材料名にマッチした前記安全データシート材料名を所定の数だけ表示することを更に含む、条項1に記載の方法。
【0073】
条項10.
前記マッチした安全データシート材料名のうちの選択された1つを前記材料名とリンクさせることによって、データリポジトリを更新することを更に含む、条項1に記載の方法。
【0074】
条項11.
処理回路103、及び
プログラムを記憶したメモリ回路104を備える、コンピューティングデバイスであって、前記プログラムは、前記処理回路103で実行されると、動作を実行し、前記動作は、
1以上の材料ソース21から材料名を抽出すること、
前記材料名を1以上の安全データシートソース23からの安全データシート材料名と比較すること、
前記材料名にマッチする前記安全データシート材料名を特定すること、
マッチした前記安全データシート材料名が前記材料名に一致する確率を計算すること、及び
前記材料名と、前記マッチした安全データシート材料名と、対応する前記確率とを含む表示を生成することを含む、コンピューティングデバイス。
【0075】
条項12.
前記動作は、マッチする前記安全データシート材料名を特定する前に、色、種類、及びクラスを含む属性を有する前記材料名から1以上の前記属性と句読点とを除去することを更に含む、条項11に記載のコンピューティングデバイス。
【0076】
条項13.
前記1以上の材料ソースから前記材料名を抽出することは、拡張マークアップ言語(XML)を含む表について前記1以上の材料ソースを特定し、前記表からの前記材料名を構文解析することを含む、条項11に記載のコンピューティングデバイス。
【0077】
条項14.
前記動作は、前記材料名を分類することを更に含み、前記材料名を分類することは、
前記材料名内に順次リストアップされている単語の組み合わせを特定すること、
前記組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定すること、
マッチが存在しないときに、前記組み合わせを前記材料名内に順次リストアップされている前記単語のより小さな組み合わせに分割すること、及び
前記より小さな組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定することを含む、条項11に記載のコンピューティングデバイス。
【0078】
条項15.
前記1以上の材料ソース21から前記材料名を抽出することは、前記1以上の材料ソース21のテキストのセクションにパターン照合を適用して、前記材料名を特定することを含む、条項11に記載のコンピューティングデバイス。
【0079】
条項16.
前記動作は、前記マッチした安全データシート材料名のうちの選択された1つを前記材料名とリンクさせることによって、データリポジトリを更新することを更に含む、条項11に記載のコンピューティングデバイス。
【0080】
条項17.
1以上の材料ソースからの材料名を1以上の安全データシートソースからの安全データシート材料名と照合するためのコンピュータプログラム製品であって、
コンピュータ可読プログラムコードが具現化された非一過性のコンピュータ可読ストレージ媒体を備え、前記コンピュータ可読プログラムコードは、処理回路103によって、動作を実行するように実行可能であり、前記動作は、
前記1以上の材料ソース21から前記材料名を抽出すること、
前記材料名を前処理して、前記材料名のうちの1以上から無関係なデータを除去すること、
前記材料名のうちの1つを選択すること、
選択された前記材料名を前記安全データシート材料名と比較すること、
前記材料名にマッチする前記安全データシート材料名を特定すること、
マッチした前記安全データシート材料名が前記材料名に一致する確率を計算すること、及び
前記材料名と、前記マッチした安全データシート材料名と、前記安全データシート材料名が前記材料名に一致する前記確率とを含む、ユーザデバイス200のディスプレイ用の出力を生成することを含む、コンピュータプログラム製品。
【0081】
条項18.
前記動作は、前記材料名を分類することを更に含み、前記材料名を分類することは、
前記材料名内に順次リストアップされている単語の組み合わせを特定すること、
前記組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定すること、
マッチが存在しないときに、前記組み合わせを前記材料名内に順次リストアップされている前記単語のより小さな組み合わせに分割すること、及び
前記より小さな組み合わせと前記安全データシート材料名との間にマッチが存在するかどうかを判定することを含む、条項17に記載のコンピュータプログラム製品。
【0082】
条項19.
前記材料名を前処理することは、前記材料名を前記安全データシート材料名と照合する前に、色、種類、及びクラスを含む属性を前記材料名から除去することを含む、条項17に記載のコンピュータプログラム製品。
【0083】
条項20.
前記材料名を前処理することは、前記材料名を前記安全データシート材料名と照合する前に、トークン化を適用して、前記材料名から句読点を除去することを含む、条項17に記載のコンピュータプログラム製品。
【0084】
本発明は、本発明の本質的な特性から逸脱することなく、本明細書で具体的に説明した方法以外の方法で実施されてもよい。本実施形態は、あらゆる点で例示的であり、限定的ではないとみなされるべきであり、添付の特許請求の範囲の意味及び均等性の範囲内にある全ての変更は、そこに含まれることが意図される。
図1
図2
図3
図4
図5
図6
図7
【外国語明細書】