(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025003420
(43)【公開日】2025-01-09
(54)【発明の名称】機械学習のための装置及びコンピュータ実装された方法
(51)【国際特許分類】
G06V 10/82 20220101AFI20241226BHJP
G06F 16/903 20190101ALI20241226BHJP
G06T 7/00 20170101ALI20241226BHJP
G06N 3/04 20230101ALI20241226BHJP
G06N 20/00 20190101ALI20241226BHJP
【FI】
G06V10/82
G06F16/903
G06T7/00 350C
G06N3/04 100
G06N20/00
【審査請求】未請求
【請求項の数】11
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024100674
(22)【出願日】2024-06-21
(31)【優先権主張番号】23181257
(32)【優先日】2023-06-23
(33)【優先権主張国・地域又は機関】EP
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【弁理士】
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】ネルソン イゲラ
(72)【発明者】
【氏名】ヨハネス エッチュ
(72)【発明者】
【氏名】トーマス アイター
【テーマコード(参考)】
5B175
5L096
【Fターム(参考)】
5B175DA10
5B175KA12
5L096CA25
5L096DA02
5L096HA11
5L096HA13
5L096KA04
(57)【要約】 (修正有)
【課題】機械学習のための装置及びコンピュータ実装された方法、装置及びプログラムを提供する。
【解決手段】機械学習のためアーキテクチャであって、第1のモデル408は、ノード間の辺を認識し、第1の入力404に依存して辺にノードを関連付ける式410を決定し、第2のモデル412は、第1の入力に依存して、名称及び名称とノードとの間の関連付けを認識し、第1の入力に依存して、ノードに名称を関連付ける式414を決定し、第3のモデル416は、第2の入力406内の名称を認識し、第2の入力に依存して名称を含む式418を決定し、モジュール420は、第1のモデル、第2のモデル412及び第3のモデル416が出力する式に依存して、応答402を決定する。装置は、例えば、アーキテクチャに従って構成される。
【選択図】
図4
【特許請求の範囲】
【請求項1】
機械学習のためのコンピュータ実装された方法であって、
前記方法は、
入力(404)、特にデジタル画像又はグラフの記号的記述を提供するステップ(502)であって、前記入力(404)は、第1のノード、第1の名称、第2のノード及び第2の名称を含み、前記入力(404)は、前記第1のノードと前記第2のノードとの間の辺を含む、ステップ(502)と、
第1のモデル(408)を用いて、前記入力(404)に依存して、前記辺に前記第1のノード及び前記第2のノードを関連付ける式(410)を決定するステップ(506)であって、前記第1のモデル(408)は、前記辺が前記第1のノードと前記第2のノードとの間にあることを認識するように構成され、前記第1のモデル(408)は、前記入力(404)に依存して、前記辺に前記第1のノード及び前記第2のノードを関連付ける前記式(410)を決定するように構成される、ステップ(506)と、
第2のモデル(412)を用いて、前記入力(404)に依存して、前記第1のノードに前記第1の名称を関連付ける式(414)と、前記第2のノードに前記第2の名称を関連付ける式(414)とを決定するステップ(508)であって、前記第2のモデル(412)は、前記第1の名称を認識しかつ前記第1の名称が前記第1のノードに関連付けられていることを認識するように構成され、前記第2のモデル(412)は、前記第2の名称を認識しかつ前記第2の名称が前記第2のノードに関連付けられていることを認識するように構成され、前記第2のモデル(412)は、前記入力(404)に依存して、前記第1のノードに前記第1の名称を関連付ける前記式(414)と、前記第2のノードに前記第2の名称を関連付ける前記式(414)とを決定するように構成される、ステップ(508)と、
前記第1の名称と前記第2の名称とを含む質問(406)を提供するステップ(504)と、
第3のモデル(416)を用いて、前記質問(406)に依存して、前記第1の名称及び前記第2の名称を含む式(418)を決定するステップ(510)であって、前記第3のモデル(416)は、前記質問(406)において前記第1の名称及び前記第2の名称を認識し、前記質問(406)に依存して、前記第1の名称及び前記第2の名称を含む式(418)を決定するように構成される、ステップ(510)と、
前記式に依存して、前記質問(406)に対する応答(402)を決定するステップ(512)と、
を含む、ことを特徴とする方法。
【請求項2】
前記方法は、センサ(110)からの又はインタフェース(106)における入力(404)を受信するステップ(502)であって、前記入力(404)は、電気回路を表し、前記辺は、前記第1のノードによって表される第1の電気部品と、前記第2のノードによって表される第2の電気部品との間の電気的接続を表し、前記質問(406)は、前記電気回路の状態、前記第1の電気部品、前記第2の電気部品又は前記電気的接続の状態に関連し、前記応答は、前記状態を含む、ステップ(502)を含み、
前記方法は、前記状態を出力するステップ(514)、又は、前記状態に依存して前記電気回路を自動的に承認若しくは選別するステップ(514)を含む、請求項1に記載の方法。
【請求項3】
前記方法は、センサ(110)からの又はインタフェース(106)における入力(404)を受信するステップ(502)であって、前記入力(404)は、マップを表し、前記辺は、前記第1のノードによって表される第1のウェイポイントと、前記第2のノードによって表される第2のウェイポイントとの間の接続を表し、前記質問は、前記接続に関連し、又は、前記第1のウェイポイント、前記第2のウェイポイント、及び/又は、前記第1のウェイポイントと前記第2のウェイポイントとの間の接続を含むマップ内の接続に関連する、ステップ(502)を含み、
前記方法は、前記応答(402)に依存して、技術システムを運動させるための接続を選択し、前記接続を介して、前記技術システム(112)を運動させるステップ(514)を含む、請求項1に記載の方法。
【請求項4】
前記第1のモデル(408)は、前記デジタル画像のセマンティックセグメンテーションのために構成され、前記セマンティックセグメンテーションの結果に依存して、前記辺が前記第1のノードと前記第2のノードとの間にあることを認識するように構成されている、請求項1乃至3のいずれか一項に記載の方法。
【請求項5】
前記第1のモデル(408)は、前記第1のノードについての行と前記第2のノードについての列とを含み、前記行及び前記列にある前記行列の要素のエントリによって、前記第1のノードと前記第2のノードとの間の辺の存在を示す行列を決定するように構成され、
前記方法は、前記行列を決定し、かつ、前記行列に依存して、前記辺に前記第1のノード及び前記第2のノードを関連付ける式(410)を決定するステップ(506)を含む、請求項1乃至4のいずれか一項に記載の方法。
【請求項6】
前記第2のモデル(412)は、前記デジタル画像内の光学的文字認識のために構成され、前記光学的文字認識の結果に依存して、前記第1の名称及び前記第2の名称を決定するように構成される、請求項1乃至5のいずれか一項に記載の方法。
【請求項7】
前記第1のモデル(408)は、前記デジタル画像における前記第1のノードの位置、特に画素座標を決定するように構成され、前記第2のモデルは、前記デジタル画像における前記第1の名称の位置、特に画素座標を決定するように構成され、
前記方法は、前記位置を決定し、かつ、前記位置に依存して、前記第1のノードに前記第1の名称を関連付ける式を決定するステップ(506)を含む、請求項1乃至6のいずれか一項に記載の方法。
【請求項8】
前記第3のモデル(416)は、前記質問のためのテンプレートにおける第1の変数の位置に依存して前記質問における第1の名称を決定し、前記質問のためのテンプレートにおける第2の変数の位置に依存して前記質問における第2の名称を決定するように構成され、
前記方法は、前記テンプレートに依存して、前記第1の名称と前記第2の名称とを含む式を決定するステップ(510)を含む、請求項1乃至7のいずれか一項に記載の方法。
【請求項9】
前記方法は、前記式に依存して、応答セットプログラミング事実を決定し、かつ、前記応答セットプログラミング事実に依存して、前記応答を決定するステップ(512)を含む、請求項1乃至8のいずれか一項に記載の方法。
【請求項10】
機械学習のための装置(100)であって、
前記装置(100)は、
少なくとも1つのプロセッサ(102)と、
少なくとも1つのメモリ(104)と、
を備え、
前記少なくとも1つのプロセッサ(102)は、前記少なくとも1つのプロセッサ(102)によって実行されるときに、前記装置(100)に、請求項1乃至8のいずれか一項に記載の方法を実施させるための命令を実行するように構成されており、
前記少なくとも1つのメモリ(104)は、前記命令を格納するように構成されている
ことを特徴とする装置(100)。
【請求項11】
コンピュータプログラムであって、コンピュータによって実行されるときに、前記コンピュータに、請求項1乃至8のいずれか一項に記載の方法を実施させるためのコンピュータ実行可能命令を含む、ことを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習のための装置及びコンピュータ実装された方法に関する。
【背景技術】
【0002】
グラフに基づく構造の視覚的又は記号的表現は、情報を提示する一般的な形式であり、実生活でもインタネット上で広く使用されている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
発明の開示
機械学習のための装置及びコンピュータ実装された方法は、視覚的なグラフ質問応答を提供するものであり、ここで、入力は、自然言語の質問を伴うグラフのデジタル画像又は記号記述であり、タスクは、与えられた入力に対する質問に適正に応答することである。
【課題を解決するための手段】
【0004】
機械学習のためのコンピュータ実装された方法は、入力、特にデジタル画像又はグラフの記号的記述を提供するステップであって、入力は、第1のノード、第1の名称、第2のノード及び第2の名称を含み、入力は、第1のノードと第2のノードとの間の辺を含む、ステップと、第1のモデルを用いて、入力に依存して、辺に第1のノード及び第2のノードを関連付ける式を決定するステップであって、第1のモデルは、辺が第1のノードと第2のノードとの間にあることを認識するように構成され、第1のモデルは、入力に依存して、辺に第1のノード及び第2のノードを関連付ける式を決定するように構成される、ステップと、第2のモデルを用いて、入力に依存して、第1のノードに第1の名称を関連付ける式と、第2のノードに第2の名称を関連付ける式とを決定するステップであって、第2のモデルは、第1の名称を認識しかつ第1の名称が第1のノードに関連付けられていることを認識するように構成され、第2のモデルは、第2の名称を認識しかつ第2の名称が第2のノードに関連付けられていることを認識するように構成され、第2のモデルは、入力に依存して、第1のノードに第1の名称を関連付ける式と、第2のノードに第2の名称を関連付ける式とを決定するように構成される、ステップと、第1の名称と第2の名称とを含む質問を提供するステップと、第3のモデルを用いて、質問に依存して、第1の名称及び第2の名称を含む式を決定するステップであって、第3のモデルは、質問において第1の名称及び第2の名称を認識し、質問に依存して、第1の名称及び第2の名称を含む式を決定するように構成される、ステップと、式に依存して、質問に対する応答を決定するステップと、を含む。ノード及び辺は、グラフの一部を表す。グラフは、機械学習のためのコンピュータ実装された方法によって決定される。質問に対する応答は、グラフの内容に基づいて、機械学習のためのコンピュータ実装された方法によって決定される。
【0005】
一例によれば、本方法は、センサからの又はインタフェースにおける入力を受信するステップであって、入力は、電気回路を表し、辺は、第1のノードによって表される第1の電気部品と、第2のノードによって表される第2の電気部品との間の電気的接続を表し、質問は、電気回路の状態、第1の電気部品、第2の電気部品又は電気的接続の状態に関連し、応答は、状態を含む、ステップと、状態を出力するステップ、又は、状態に依存して電気回路を自動的に承認若しくは選別するステップと、を含む。機械学習のためのコンピュータ実装された方法は、電気的接続を製造するための検査の一部であるものとしてよい。
【0006】
一例によれば、本方法は、センサからの又はインタフェースにおける入力を受信するステップであって、入力は、マップを表し、辺は、第1のノードによって表される第1のウェイポイントと、第2のノードによって表される第2のウェイポイントとの間の接続を表し、質問は、接続に関連し、又は、第1のウェイポイント、第2のウェイポイント、及び/又は、第1のウェイポイントと第2のウェイポイントとの間の接続を含むマップ内の接続に関連する、ステップと、応答に依存して、技術システムを運動させるための接続を選択し、接続を介して、技術システムを運動させるステップと、を含む。マップは、メトロマップであるものとしてもよいし、施設のマップであるものとしてもよい。技術システムは、例えばロボット、特に車両や製造機械などの物理的システムであるものとしてよい。機械学習のためのコンピュータ実装された方法は、技術システムをマップ内の1つのウェイポイントから別のウェイポイントに自動的に運動させる、又は、部品をマップ内の1つのウェイポイントから別のウェイポイントに自動的に運動させるステップを支援することができる。
【0007】
一例によれば、第1のモデルは、デジタル画像のセマンティックセグメンテーションのために構成され、セマンティックセグメンテーションの結果に依存して、辺が第1のノードと第2のノードとの間にあることを認識するように構成される。セマンティックセグメンテーションは、デジタル画像の画素に、例えばノード、辺、その他のクラスを割り当てる。グラフの部分は、デジタル画像の画素座標及びクラスからコンピュータ実装された方法によって決定されるものとしてよい。
【0008】
一例によれば、第1のモデルは、第1のノードについての行と第2のノードについての列とを含み、行及び列にある行列の要素のエントリによって、第1のノードと第2のノードとの間の辺の存在を示す行列を決定するように構成され、ここで、本方法は、行列を決定し、行列に依存して、辺に第1のノード及び第2のノードを関連付ける式を決定するステップを含む。行列内のエントリは、特に、デジタル画像の画素座標及びクラスから、コンピュータ実装された方法によって決定される。
【0009】
一例によれば、第2のモデルは、デジタル画像内の光学的文字認識のために構成され、光学的文字認識の結果に依存して、第1の名称及び第2の名称を決定するように構成される。第1の名称及び第2の名称は、デジタル画像からコンピュータ実装された方法によって決定される。
【0010】
一例によれば、第1のモデルは、デジタル画像における第1のノードの位置、特に画素座標を決定するように構成され、第2のモデルは、デジタル画像における第1の名称の位置、特に画素座標を決定するように構成され、ここで、本方法は、位置を決定するステップと、位置に依存して、第1のノードに第1の名称を関連付ける式を決定するステップとを含む。
【0011】
一例によれば、第3のモデルは、質問のためのテンプレートにおける第1の変数の位置に依存して、質問における第1の名称を決定し、質問のためのテンプレートにおける第2の変数の位置に依存して、質問における第2の名称を決定するように構成され、ここで、本方法は、テンプレートに依存して、第1の名称と第2の名称とを含む式を決定するステップを含む。質問は、変数が名称に置き換えられたテンプレートのインスタンスである。
【0012】
一例によれば、本方法は、式に依存して、応答セットプログラミング事実を決定し、応答セットプログラミング事実に依存して、応答を決定するステップを含む。式は、組合せ問題を提示する。コンピュータ実装された方法は、質問について推論し、組合せ問題を解決する応答を決定するために、応答セットプログラミングを使用することができる。
【0013】
機械学習のための装置は、少なくとも1つのプロセッサと、少なくとも1つのメモリと、を備え、少なくとも1つのプロセッサは、少なくとも1つのプロセッサによって実行されるときに、本装置に、本方法を実施させるための命令を実行するように構成されており、少なくとも1つのメモリは、命令を格納するように構成されている。
【0014】
コンピュータによって実行されるときに、コンピュータに、本方法を実施させるためのコンピュータ実行可能命令を含むコンピュータプログラムは、本方法が提供する利点を有する。
【0015】
さらなる実施形態は、以下の説明及び図面から導かれる。
【図面の簡単な説明】
【0016】
【
図4】機械学習のためのアーキテクチャを示す図である。
【
図5】機械学習のためのコンピュータ実装された方法のステップを有するフローチャートである。
【発明を実施するための形態】
【0017】
図1は、機械学習のための装置100を概略的に示している。この装置100は、少なくとも1つのプロセッサ102と、少なくとも1つのメモリ104と、を備える。
【0018】
装置100は、インタフェース106を含み得る。このインタフェース106は、入力108を受信するように構成されるものとしてよい。この入力108は、デジタル画像であるものとしてもよいし、又は、グラフの記号的記述であるものとしてもよい。
【0019】
装置100は、質問に応答するように構成されている。この質問は、自然言語の質問であるものとしてよい。
【0020】
インタフェース106は、センサ110から入力108を受信するように構成されるものとしてよい。このセンサ110は、入力108を捕捉するように構成されるものとしてよい。センサ110は、カメラであるものとしてよい。
【0021】
装置100は、技術システム112を動作させるように構成されるものとしてよい。この技術システム112は、ロボット、特に車両又は製造機械であるものとしてよい。装置100は、技術システム112を動作させるために出力114を出力するように構成されるものとしてよい。インタフェース106は、出力114を出力するように構成されるものとしてもよい。
【0022】
入力108は、電気回路を表し得る。
【0023】
グラフは、電気回路を表し得る。このグラフは、電気部品を表すノードを含み得る。グラフは、電気部品間の電気的接続を表す辺を含み得る。グラフの辺は、グラフの第1のノードによって表される電気部品と、グラフの第2のノードによって表される第2の電気部品との間の電気的接続を表し得る。
【0024】
質問は、電気回路の状態に関し得る。質問は、第1の電気部品の状態に関し得る。質問は、第2の電気部品の状態に関し得る。質問は、電気的接続の状態に関し得る。
【0025】
応答は、状態を含み得る。
【0026】
装置100は、状態を出力するように構成されるものとしてよい。出力114は、状態を含み得る。
【0027】
装置100又は技術システム114は、状態に依存して電気回路を自動的に承認又は選別するように構成されるものとしてよい。装置100は、状態が電気回路、電気的接続又は電気部品の不具合を示す場合に、電気回路を選別するように製造機械を動作させるように構成されるものとしてよい。装置100は、状態が、電気回路、電気的接続及び/又は電気部品が承認されたことを示す場合に、電気回路を承認するように製造機械を動作させるように構成されるものとしてよい。
【0028】
入力108は、マップを表し得る。
【0029】
グラフは、マップを表し得る。グラフは、ウェイポイントを表すノードを含み得る。グラフは、ウェイポイント間の接続を表す辺を含み得る。グラフの辺は、グラフの第1のノードによって表される第1のウェイポイントと、グラフの第2のノードによって表される第2のウェイポイントとの間の接続を表し得る。
【0030】
質問は、接続に関し得る。質問は、マップ内の他の接続に関し得る。他の接続は、第1のウェイポイントを含み得る。他の接続は、第2のウェイポイントを含み得る。他の接続は、第1のウェイポイントと第2のウェイポイントとの間の接続を含み得る。
【0031】
装置100は、応答に依存して、技術システム112を運動させるための接続を選択し、接続を介して技術システム112を運動させるように構成されるものとしてよい。出力114は、接続を介して技術システム112を運動させる結果を生じさせる、選択された接続又は命令を含み得る。
【0032】
図2は、例示的な入力108を示している。この例示的な入力は、デジタル画像200を含む。
【0033】
デジタル画像200は、文字N1の隣に第1の要素202を、文字N2の隣に第2の要素204を、文字N3の隣に第3の要素206を、文字N4の隣に第4の要素208を、文字N5の隣に第5の要素210を示している。デジタル画像200は、より多くの要素又はより少ない要素を示し得る。これらの要素は、より多くの文字又はより少ない文字の隣に示されるものとしてもよい。
【0034】
デジタル画像200は、第1の要素202と第2の要素204との間に第1の接続212を示している。デジタル画像200は、第2の要素204と第3の要素206との間に第2の接続214を示している。デジタル画像200は、第3の要素206と第4の要素208との間に第3の接続216を示している。デジタル画像200は、第4の要素208と第5の要素210との間に第4の接続218を示している。
【0035】
デジタル画像200は、異なるタイプの接続及び要素を含み得る。
【0036】
この例によれば、デジタル画像200は、2つの異なるタイプの接続と3つの異なるタイプの要素とを含む。第1の要素群は、第1の要素202、第2の要素204、及び、第3の要素206を含む。第2の要素群は、第3の要素206、第4の要素208、及び、第5の要素210を含む。この例によれば、第1の要素202及び第2の要素204は、第1のタイプであり、第4の要素及び第5の要素210は、第2のタイプであり、第3の要素206は、第3のタイプである。
【0037】
異なるグループは、異なるタイプの接続を含み得る。この例によれば、第1の接続212及び第2の接続214は、第1のタイプの接続部である。この例によれば、第3の接続216及び第4の接続部218は、第2のタイプの接続である。
【0038】
この例によれば、第1のタイプの2つの要素間の接続は、第1のタイプである。この例によれば、第2のタイプの2つの要素間の接続は第2のタイプである。この例によれば、第1のタイプの要素と第3のタイプの要素との間の接続は第1のタイプである。この例によれば、第2のタイプの要素と第3のタイプの要素との間の接続は第2のタイプである。
【0039】
グラフは、要素を表すノードと、接続を表す辺とを含み得る。この例によれば、グラフは、第1の要素202を表す第1のノードと、第2の要素204を表す第2のノードと、第3の要素206を表す第3のノードと、第4の要素208を表す第4のノードと、第5の要素210を表す第5のノードとを含む。この例によれば、グラフは、第1の接続212を表す第1の辺と、第2の接続214を表す第2の辺と、第3の接続216を表す第3の辺と、第4の接続218を表す第4の辺とを含む。
【0040】
これらの要素は、ウェイポイントであるものとしてよい。これらの要素は、電気部品であるものとしてよい。
【0041】
図3は、「N1とN5との間にいくつの要素があるか」という例示的な質問の関数表現を示している。この関数表現においては、Subtract()は、関数Subtract()への入力間の差分を決定するための関数であり、Count()は、関数Count()への入力間の要素数を決定する関数であり、Int(2)は、値2を提供する関数であり、Element(N1)は、値N1を出力する関数であり、Element(N1)は、値N2を出力する関数である。
【0042】
N1及びN5は、デジタル画像200内の要素の名称である。
【0043】
例示的な質問は、以下のようにテンプレートに基づいている。
【0044】
「[Element1]と[Element2]との間にいくつの要素があるか」
【0045】
このテンプレートは、第1の変数[Element1]と第2の変数[Element2]とを含む。第1の変数は、質問における第1の名称のためのプレースホルダである。第2の変数は、質問における第2の名称のためのプレースホルダである。質問において名称が出現する順序は、関数表現における変数の挿入順序に対応し得る。
【0046】
関数表現は、上述したような関数Subtract()、Count()、Int()、ShortestPath()、関数Element(Element1)の第1の出現における名称N1に代わる第1の変数名Element1、及び、関数Element(Element2)の第2の出現における名称N5に代わる第2の変数名Element2を含むテンプレートに基づくものとしてよい。
【0047】
図4は、機械学習のためのアーキテクチャ400を示している。このアーキテクチャ400は、第1の入力404、例えばデジタル画像又はグラフの記号的記述、及び、第2の入力406、例えば質問に依存して、応答402を決定するように構成されている。応答402は、例えば、応答セットである。
【0048】
アーキテクチャ400は、第1のモデル408を含む。第1のモデル408は、ノード間の辺を認識し、第1の入力404に依存して辺にノードを関連付ける式410を決定するように構成されている。
【0049】
アーキテクチャ400は、第2のモデル412を含む。第2のモデル412は、第1の入力404に依存して、名称、及び、名称とノードとの間の関連付けを認識するように構成されている。
【0050】
第2のモデル412は、第1の入力404に依存して、ノードに名称を関連付ける式414を決定するように構成されている。
【0051】
アーキテクチャ400は、第3のモデル416を含む。第3のモデル416は、第2の入力406内の名称を認識し、第2の入力406に依存して名称を含む式418を決定するように構成されている。
【0052】
アーキテクチャ400は、モジュール420を含む。このモジュール420は、第1のモデル408、第2のモデル412及び第3のモデル416が出力する式に依存して、応答402を決定するように構成されている。
【0053】
装置100は、例えば、アーキテクチャ400に従って構成されている。
【0054】
図5は、機械学習のためのコンピュータ実装された方法のステップを伴うフローチャートを示している。本方法は、アーキテクチャ400を参照して説明される。
【0055】
本方法は、ステップ502を含む。
【0056】
ステップ502においては、入力404が提供される。
【0057】
本方法は、センサ110からの又はインタフェース106における入力404を受信するステップを含み得る。
【0058】
この例における入力404は、グラフのデジタル画像である。入力404は、グラフの記号的記述であるものとしてよい。
【0059】
入力404は、第1のノード、第1の名称、第2のノード、及び、第2の名称を含む。
【0060】
入力404は、より多くのノードと名称とを含み得る。入力404についての例は、デジタル画像200である。
【0061】
入力404は、第1のノードと第2のノードとの間の辺を含む。入力404は、第1の名称及び第2の名称を含む。
【0062】
辺についての例は、第1の要素202と第2の要素204との間の接続212である。第1のノードについての例は、第1の要素202である。第2のノードについての例は、第2の要素204である。第1の名称についての例は、N1である。第2の名称についての例は、N2である。
【0063】
本方法は、ステップ504を含む。
【0064】
ステップ504においては、第1の名称と第2の名称とを含む質問406が提供される。
【0065】
本方法は、ステップ506を含む。
【0066】
ステップ506においては、辺に第1のノード及び第2のノードを関連付ける式410が、入力404に依存して第1のモデル408を用いて決定される。
【0067】
第1のモデル408は、第1の入力404、特にデジタル画像のセマンティックセグメンテーションのために構成され、セマンティックセグメンテーションの結果に依存して、辺が第1のノードと第2のノードとの間にあることを認識するように構成されるものとしてよい。
【0068】
第1のモデル408は、第1のノードについての行と第2のノードについての列とを含みかつ行及び列にある行列の要素のエントリによって、第1のノードと第2のノードとの間の辺の存在を示す行列を決定するように構成されるものとしてよい。
【0069】
本方法は、行列を決定し、行列に依存して、辺に第1のノード及び第2のノードを関連付ける式410を決定するステップを含み得る。
【0070】
第1のモデル408は、入力404、例えばデジタル画像における第1のノードの位置、特に画素座標を決定するように構成されるものとしてよい。
【0071】
第1のモデル408は、入力404、例えばデジタル画像における第2のノードの位置、特に画素座標を決定するように構成されるものとしてよい。
【0072】
第1のモデル408は、入力404を式410及び/又は位置に写像するように構成された、例えば人工ニューラルネットワークを含む。
【0073】
本方法は、ステップ508を含む。
【0074】
ステップ508においては、第2のモデル412を用いて、入力404に依存して、第1のノードに第1の名称を関連付ける式414と、第2のノードに第2の名称を関連付ける式414とが決定される。
【0075】
第2のモデル412は、デジタル画像内の光学的文字認識のために構成され、光学的文字認識の結果に依存して、第1の名称及び第2の名称を決定するように構成されるものとしてよい。
【0076】
本方法は、光学式文字認識を用いて第1の名称及び第2の名称を決定するステップを含み得る。
【0077】
本方法は、入力404におけるそれぞれの位置に依存して、第1のノードに第1の名称を関連付け、第2のノードに第2の名称を関連付ける式414を決定するステップを含み得る。
【0078】
第2のモデル412は、入力404、例えばデジタル画像における第1の名称の位置、特に画素座標を決定するように構成されるものとしてよい。
【0079】
ステップ508は、位置を決定するステップと、位置に依存して、第1のノードに第1の名称を関連付ける式を決定するステップとを含み得る。
【0080】
本方法は、ステップ510を含む。
【0081】
ステップ510は、質問406に依存して、第3のモデル416と共に第1の名称及び第2の名称を含む式418を決定するステップを含む。
【0082】
第3のモデル416は、質問406のためのテンプレートにおける第1の変数の位置に依存して、質問406における第1の名称を決定するように構成されるものとしてよい。
【0083】
第3のモデル416は、質問406のためのテンプレートにおける第2の変数の位置に依存して、質問406における第2の名称を決定するように構成されるものとしてよい。
【0084】
ステップ510は、テンプレートに依存して、第1の名称及び第2の名称を含む式418を決定するステップを含み得る。
【0085】
本方法は、ステップ512を含む。
【0086】
ステップ512は、第1のモデル408が入力404に対して出力する式410、第2のモデル412が入力404に対して出力する式414、及び、第3のモデル416が質問406に対して出力する式418に依存して、質問406に対する応答402を決定するステップを含む。
【0087】
ステップ512は、第1のモデル408、第2のモデル412及び第3のモデル416が提供する式に依存して、応答セットプログラミング事実を決定するステップと、応答セットプログラミング事実に依存して、応答402を決定するステップと、を含み得る。
【0088】
本方法は、ステップ514を含み得る。
【0089】
入力404は、電気回路を表し得る。辺は、第1のノードによって表される第1の電気部品と、第2のノードによって表される第2の電気部品との間の電気的接続を表し得る。
【0090】
質問406は、電気回路の状態、第1の電気部品、第2の電気部品又は電気的接続の状態に関連し得る。
【0091】
応答402は、状態を含み得る。
【0092】
ステップ514は、特に技術システム112を用いて、状態を出力するステップ、又は、状態に依存して電気回路を自動的に承認若しくは選別するステップを含み得る。これは、技術システム112が、状態に依存して電気回路を承認又は選別するために、出力114に従って動作する場合があることを意味する。この出力114は、状態に依存して技術システム112を動作させるために、状態、又は、状態に依存して決定された信号であるものとしてよい。
【0093】
入力404は、マップを表し得る。辺は、第1のノードによって表される第1のウェイポイントと、第2のノードによって表される第2のウェイポイントとの間の接続を表し得る。質問は、接続に関し、又は、第1のウェイポイント、第2のウェイポイント、及び/又は、第1のウェイポイントと第2のウェイポイントとの間の接続を含むマップ内の接続に関し得る。
【0094】
ステップ514は、応答402に依存して、技術システムを運動させるための接続を選択するステップと、接続を介して技術システム112を運動させるステップとを含み得る。技術システム112は、出力114により操作されるものとしてよい。出力114は、応答402に依存して、例えば、第1のウェイポイントから第2のウェイポイントに運動するための軌道又は直接的操舵入力を技術システム112に提供するように決定されるものとしてよい。
【0095】
本方法は、隣接ノードに限定されるものではない。本方法は、グラフ内の経路によって接続されているノードにも同様に適用される。本方法は、2つのノードに限定されるものではない。本方法は、3つ以上のノードを含む経路にも同様に適用される。
【0096】
本方法が解決するタスクは、例えば、自然言語の質問に応答することである。自然言語の質問においては、特定の特性を有するステーションを回避しながら、メトロマップ内の2つのステーション間の最短経路を求めることができる。
【0097】
自然言語の質問に対して、本方法は、メトロマップを表すデジタル画像において発見可能である情報を用いて応答可能であるそれらの自然言語の質問のみを考慮することができる。本方法は、デジタル画像又は自然言語の質問からの他のすべての記号情報を無視することができる。本方法は、グラフを解析してノード及び辺を識別し、ステーションにラベル付けする名称を読み取って理解し、それらをグラフのノードに関連付け、自然言語の質問を理解し、当該自然言語の質問に応答するためにデジタル画像から抽出された情報を推論する。
【0098】
第1のモデル408は、例えば、C.Auer,C.Bachmaier,F.J.Brandenburg,A.Gleissner,J.Reislhuberらによる文献「Optical graph recognition, in: Graph Drawing, Springer Berlin Heidelberg, Berlin, Heidelberg, 2013, pp.529-540」に記載されているように、光学的グラフ認識のために構成されるものとしてよい。
【0099】
第2のモデル412は、A.M.Sabu,A.S.Dasらによる文献「A survey on various optical character recognition techniques, in: 2018 Conference on Emerging Devices and Smart Systems (ICEDSS), 2018, pp.152-155.」に記載されているように、光学的文字認識のために構成されるものとしてよい。
【0100】
第3のモデル416は、例えば、D.Mack,A.Jeffersonらによる文献「CLEVR graph: A dataset for graph question answering, 2018. URL: https://github.com/Octavian-ai/clevr-graph.」に記載されているように、CLEGRテンプレートを用いて自然言語の質問を表現する機能プログラムを決定するために構成されるものとしてよい。
【0101】
本方法は、例えば、G.Brewka,T.Eiter,M.Truszczynskiらによる文献「Answer set programming at a glance, Commun. ACM 54 (2011) 92-103」に記載されているように、アンサーセットプログラミングを使用することができる。
【0102】
モジュール420は、アンサーセットプログラミングソルバを含み得る。
【外国語明細書】