(58)【調査した分野】(Int.Cl.,DB名)
前記1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する学習用データセット生成段階を更に含むことを特徴とする請求項1に記載の自律走行のための学習対象イメージ抽出方法。
コンピュータと結合し、請求項1〜請求項8の何れか1項に記載の自律走行のための学習対象イメージ抽出方法を実行させるためにコンピュータ読み取り可能な記録媒体に格納されたコンピュータプログラム。
【発明を実施するための形態】
【0021】
本発明の利点及び特徴、そしてそれらを達成する方法は、添付の図面と共に詳細に後述されている実施形態を参照すれば明確になるはずである。しかし、本発明は、以下で開示される実施形態に限定されるものではなく、互いに異なる多様な形態で実現することができる。但し、本実施形態は、本発明の開示を完全なものにし、本発明が属する技術分野における通常の技術者に本発明の範囲を完全に理解させるために提供されるものであり、本発明は特許請求の範囲により定義されるに過ぎない。
【0022】
本明細書で用いられる用語は、実施形態を説明するためのものであり、本発明を制限しようとするものではない。本明細書において、単数型は特に言及しない限り複数型も含む。明細書で用いられる「含む(comprises)」及び/又は「含んでいる(comprising)」は、言及された構成要素以外に1つ以上の他の構成要素の存在又は追加を排除しない。明細書全体に亘って同一の図面符号は同一の構成要素を示し、「及び/又は」は言及された構成要素のそれぞれ及び1つ以上のあらゆる組み合わせを含む。たとえ「第1」「第2」などが多様な構成要素を叙述するために用いられていても、これらの構成要素はこれらの用語により限定されないのは当然である。これらの用語は、単に1つの構成要素を他の構成要素と区別するために用いる。従って、以下で言及される第1構成要素は、本発明の技術的思想内で第2構成要素であり得ることは当然である。
【0023】
他の定義がなければ、本明細書で用いられる全ての用語(技術及び科学的用語を含む)は、本発明が属する技術分野における通常の技術者が共通して理解できる意味として使用され得る。また、一般に用いられる辞典に定義されている用語は、明白に特に定義されていない限り、理想的に又は過度に解釈されない。
【0024】
以下、添付の図面を参照し、本発明の実施形態を詳細に説明する。
【0025】
図1は、本発明の一実施形態に係る自律走行のための学習対象イメージ抽出方法の概略的なフローチャートである。
【0026】
図1を参照すれば、自律走行のための学習対象イメージ抽出方法は、オリジナル動画受信段階(S100)と、1次サンプリング段階(S200)と、2次サンプリング段階(S300)と、を含む。
【0027】
段階S100で、オリジナル道路走行映像受信部610は、オリジナル道路走行映像を受信する。オリジナル道路走行映像は、車両内外部、車道などに設けられたカメラで収集される動画である。例えば、自動車の自律走行のための人工知能映像学習データを生成するためにオリジナル道路走行映像を受信する場合、オリジナル道路走行映像は、自律走行のための学習データの生成のためにカメラを取り付けた自動車から獲得した動画など、自律走行のための学習データの生成が可能な映像が全て含まれることができ、これに限定されない。
【0028】
段階S200で、第1サンプリング部620は、オリジナル道路走行映像のメタデータに基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。オリジナル道路走行映像のメタデータは、オリジナル道路走行映像と関連する車両のGPS情報、車両の移動速度情報、及び、オリジナル道路走行映像の撮影時間のうち1つ以上を含む。
【0029】
一実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの車両のGPS情報に基づいて、車両のGPS情報が事前に決定された地域に含まれる場合、該当地域に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、車両が繁華なA地域にある場合、1秒当たりに30フレームを抽出し、車両が閑静なB地域にある場合、1秒当たりに15フレームを抽出できる。
【0030】
一実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの車両移動速度情報に基づいて、車両の移動速度が事前に決定された速度範囲に含まれる場合、該当速度範囲に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、車両の移動速度が比較的高速な100km/hである場合、1秒当たりに30フレームを抽出し、車両の移動速度が比較的低速な50km/hである場合、1秒当たりに15フレームを抽出できる。
【0031】
一実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの撮影時間に基づいて、車両の移動時間が事前に決定された時間範囲に含まれる場合、該当時間範囲に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、車両の移動時間が混雑する出/退勤時間である7時から9時、又は、18時から20時までの場合、1秒当たりに30フレームを抽出し、車両の移動時間が閑散な明け方である1時から5時までの場合、1秒当たりに15フレームを抽出できる。
【0032】
他の実施形態において、第1サンプリング部620は、オリジナル道路走行映像のメタデータの撮影時間に相応する天気情報に基づいて、天気情報が事前に決定された天気に含まれる場合、該当天気に相応する数のフレームイメージを抽出する。例えば、第1サンプリング部620は、撮影時間に相応する天気情報が曇り、強風、暴雨、大雪などである場合、1秒当たりに30フレームを抽出し、天気情報が晴れである場合、1秒当たりに15フレームを抽出できる。
【0033】
段階S300で、第2サンプリング部630は、決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か、及び、第1学習対象オブジェクトの移動量に基づいて、決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する。2次サンプリング段階(S300)は、
図5で更に具体的に説明する。
【0034】
図2は、本発明の一実施形態に係る
図1の1次サンプリング段階により抽出されたフレームイメージの例示図である。
【0035】
図2を参照すれば、フレームイメージは、1次サンプリング段階(S200)により、例えば、60fps(frame per second)、30fps、又は、1fpsにて抽出できる。
【0036】
段階S200で、第1サンプリング部620は、オリジナル道路走行映像のメタデータに基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。例えば、オリジナル道路走行映像のフレームレート(frame rate)が60fpsである場合、第1サンプリング部620は、オリジナル道路走行映像のメタデータによって、1秒当たりに60個、30個又は1個のフレームを抽出できる。
【0037】
段階S200で、第1サンプリング部620は、オリジナル道路走行映像のメタデータに基づいてオリジナル道路走行映像を1次サンプリングするため(即ち、不要なデータを除去して2次サンプリング段階に伝達されるデータの量を減少させるため)、後に行われる2次サンプリング段階(S300)及び学習用データセット生成段階(S500)でデータを処理するのにかかるコストと時間を画期的に短縮することができる。
【0038】
図3は、
図1の2次サンプリング段階の概略的なフローチャートである。
【0039】
図3を参照すれば、2次サンプリング段階(S300)は、第1学習対象オブジェクト検出段階(S310)と、第1学習対象オブジェクト移動量測定段階(S320)と、を含む。
【0040】
段階S310で、第2サンプリング部630は、オブジェクト検出アルゴリズムを用いて、それぞれの決定された数のフレームイメージ上で予め定められた1つ以上の類型の1つ以上の第1学習対象オブジェクトを検出する。
【0041】
第1学習対象オブジェクトは、フレームイメージに含まれているオブジェクトである。フレームイメージには1つ以上の第1学習対象オブジェクトが含まれ、1つ以上の類型の第1学習対象オブジェクトが含まれる。例えば、第1学習対象オブジェクトは、人、自動車、自転車、建物、電信柱、オートバイ、木、花、子犬、猫、道路、交通表示板、過速防止用段差、ロードコーン、車線などを含むことができるが、前記例に限定されず、オブジェクトとして区別が可能なものを全て含む。また、第1学習対象オブジェクトの類型は、オブジェクトの前面、後面、右側面、左側面などを含むが、各学習対象オブジェクトの類型は、前記例に限定されず、前記例よりも細分化させて区分することができ、前記例とは全く異なる類型として区分することができる。
【0042】
第1学習対象オブジェクト検出で1つ以上の類型の1つ以上のオブジェクトを検出することは、オブジェクト検出アルゴリズムを用いて検出することであり、オブジェクト検出アルゴリズムは、R-CNNモデルを含むことができるが、これに限定されない。
【0043】
段階S320で、第2サンプリング部630は、第n(nは2以上の自然数)フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトの位置と、第nフレームイメージの直前の第n−1フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトの位置を比較し、第nフレームイメージ上の検出された1つ以上の第1学習対象オブジェクトそれぞれの移動量を測定する。
【0044】
学習対象フレームイメージを抽出する方法は、検出された1つ以上の第1学習対象オブジェクトの移動量が事前に決定された基準以上かを判断し、検出された1つ以上の第1学習対象オブジェクトのうち予め定められた数以上の第1学習対象オブジェクトの移動量が事前に決定された基準以上である場合、該当フレームイメージを学習対象フレームイメージとして選定する。しかし、検出された1つ以上の第1学習対象オブジェクトのうち予め定められた数以上の第1学習対象オブジェクトの移動量が事前に決定された基準以上に該当しない場合、該当フレームイメージを学習対象フレームイメージとして選定しない。
【0045】
第1学習対象オブジェクトの移動量の基準を設定し、事前に決定された基準以上のものに該当するフレームイメージを学習対象フレームイメージとして選定することによって、不要なフレームイメージは低減し、必要なフレームイメージのみを選定することができる。
【0046】
従って、学習対象フレームイメージは、抽出されたフレームイメージの全てが学習対象フレームイメージとして選定されず、オブジェクトの移動量が少なく、学習において影響を大きく及ぼさないフレームイメージを除いて残ったフレームイメージのみが、学習対象フレームイメージとして選定されることによって、以後の段階で学習データセットの量を低減することができる。従って、人工知能モジュールを学習するにおいて、量が減少した学習データセットを用いて、学習にかかる時間が短縮されることができる。
【0047】
他の実施形態において、第2サンプリング部630は、フレームイメージから交通統制オブジェクトの有無を判断し、該当交通統制オブジェクトが事前に決定された基準に符合する場合、交通統制オブジェクトに更に基づいて、フレームイメージから1つ以上の学習対象フレームイメージを抽出する。交通統制オブジェクトは、フレームイメージ上の信号機、交通安全標識、交通安全線、及び、道路附帯施設などであり得るが、これに限定されない。例えば、第2サンプリング部630は、フレームイメージから信号機が検出され、該当信号機が赤色から緑色へ変わる場合、該当フレームイメージ全部を学習対象フレームとして抽出し、該当信号機が赤色に維持される場合、1秒当たりのフレームイメージの数を半分にして該当フレームイメージの中から一部のみを学習対象フレームとして抽出できる。
【0048】
他の実施形態において、第2サンプリング部630は、オリジナル道路走行映像を撮影する時に、車両の内部音及び外部音のうち少なくとも1つを抽出し、車両の内部音及び外部音の周波数が所定の基準範囲にある場合、車両の内部音及び外部音のうち少なくとも1つに更に基づいて、フレームイメージから1つ以上の学習対象フレームイメージを抽出する。例えば、第2サンプリング部630は、ブラックボックスの道路走行映像からオーディオデータを抽出し、該当オーディオデータから悲鳴の声が検出される場合、1秒当たりに30個の学習対象フレームを抽出し、何らの音も検出されない場合、1秒当たりに15個の学習対象フレームを抽出できる。
【0049】
第1学習対象オブジェクト移動量測定段階(S320)は、
図4で具体的に説明する。
【0050】
図4は、
図1の2次サンプリング段階で第1学習対象オブジェクトの移動量を測定するための方法を説明する例示図である。
【0051】
図4を参照すれば、第1学習対象オブジェクト移動量測定段階(S320)での移動量測定方法が示される。
図4(a)は、第n−1フレームイメージ11、
図4(b)は、第nフレームイメージ12を示す。
【0052】
第1学習対象オブジェクトの移動量の測定は、第n−1フレームイメージ11上での第1学習対象オブジェクト21と、第nフレームイメージ12上での第1学習対象オブジェクト22の位置と、を比較するものである。
【0053】
第n−1フレームイメージ11上での第1学習対象オブジェクト21と第nフレームイメージ12上での第1学習対象オブジェクト22は、同一形態のオブジェクトであって、第1学習対象オブジェクトの同一位置に該当する部分をまず選定する。
【0054】
第1学習対象オブジェクトの同一位置に該当する部分の選定は、コンピュータが第n−1フレームイメージ11上の第1学習対象オブジェクト21において特定部分を「A」と選定したとするとき、第nフレームイメージ12上の第1学習対象オブジェクト22上において「A」と同一位置に該当する部分を「A’」として選定する。
【0055】
コンピュータは、第1学習対象オブジェクトの同一位置に該当する部分を選定した後、第n−1フレームイメージ11と第nフレームイメージ12を同一平面上に置いた後、「A」及び「A’」に対する座標を抽出する。
【0056】
コンピュータは、「A」及び「A’」に対する座標を抽出した後、「A」の座標と「A’」の座標の差を用いて移動量を測定する。
【0057】
図5は、背景除去段階が追加された
図1の2次サンプリング段階の概略的なフローチャートである。
【0058】
図5を参照すれば、背景除去段階(S330)は、第1学習対象オブジェクト検出段階(S310)の後に実行される。
【0059】
段階S330で、第2サンプリング部630は、それぞれの決定された数のフレームイメージ上で第1学習対象オブジェクトを除いた背景を除去する。
【0060】
背景除去段階(S330)は、フレームイメージ上で検出された第1学習対象オブジェクトを除いたものを背景として処理し、背景部分を全て除去する。背景部分の除去は、背景に該当する領域のピクセルの値をnull状態にするか、所定の特殊な値で処理することを含むことができる。例えば、背景に該当する領域のピクセルのグレー(gray)を0グレー又は256グレーで処理することができるが、これに限定されない。
【0061】
背景除去段階(S330)が追加された2次サンプリング段階(S300)は、
図6で具体的に説明する。
【0062】
図6は、背景除去段階が追加された
図1の2次サンプリング段階で背景が除去されたフレームイメージを用いて、第1学習対象オブジェクトの移動量を測定するための方法を説明する例示図である。
【0063】
図6を参照すれば、
図6(a)は1次サンプリング段階(S200)により抽出されたフレームイメージ10を示しており、フレームイメージ10は第1学習対象オブジェクト20及び背景30を含む。
【0064】
図6を参照すれば、
図6(b)は、
図6(a)であるフレームイメージ10で背景除去段階(S330)により背景30が除去されたことを示す図であって、フレームイメージ10は第1学習対象オブジェクト20のみを含む。
【0065】
図6を参照すれば、
図6(c)は、第n(nは2以上の自然数)フレームイメージ上の検出された1つ以上の第1学習対象オブジェクト21の位置と、第nフレームイメージの直前の背景が除去された第n−1フレームイメージ上の検出された1つ以上の第1学習対象オブジェクト22の位置とを比較することを示す図である。
【0066】
コンピュータは、それぞれの第1学習対象オブジェクト21、22間の比較を通じて、第1学習対象オブジェクトの移動量を測定できる。
【0067】
第1学習対象オブジェクト21、22の位置比較を通じて移動量を測定した後、コンピュータは、検出された1つ以上の第1学習対象オブジェクト20のうち、予め定められた数以上の第1学習対象オブジェクトの移動量が予め定められた基準以上の場合は、第nフレームイメージを学習対象フレームイメージとして選定し、そうでない場合には、第nフレームイメージを学習対象フレームイメージとして選定しない。
【0068】
例えば、コンピュータは、第1フレームイメージ上で検出された第1学習対象オブジェクトと第2フレームイメージ上で検出された第1学習対象オブジェクトの移動量とを比較して、移動量が予め定められた基準以上の場合は、第2フレームイメージを学習対象フレームイメージとして選定する。移動量が予め定められた基準以上に該当しない場合には、第2フレームイメージを学習対象フレームイメージとして選定しない。
【0069】
また、コンピュータは、第2フレームイメージを学習対象フレームイメージとして選定又は選定しないことに止まらず、再び第2フレームイメージ上で検出された第1学習対象オブジェクトと第3フレームイメージ上で検出された第1学習対象オブジェクトの移動量を比較し、移動量が予め定められた基準以上の場合には、第3フレームイメージを学習対象フレームイメージとして選定する。
【0070】
フレームイメージ上の第1学習対象オブジェクトの移動量を測定し、学習対象フレームイメージとして選定又は選定しない段階は、第n(nは2以上の自然数)フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトと第n−1フレームイメージ上の検出された1つ以上の第1学習対象オブジェクトの位置を比較することによって、抽出された全てのフレームイメージ上の検出された1つ以上の第1学習対象オブジェクトに対して比較し、学習対象フレームとして選定又は選定しないことが完了するまで繰り返される。
【0071】
第1学習対象オブジェクト20は1つ以上であって、コンピュータは1つのフレームイメージ10上に複数の第1学習対象オブジェクト20がある場合、それぞれの第1学習対象オブジェクト20を比較して、それぞれの第1学習対象オブジェクト20の移動量を測定する。
【0072】
例えば、1つのフレームイメージ10上に複数の第1学習対象オブジェクト20を含む場合、コンピュータは、複数の第1学習対象オブジェクト20全部の移動量を測定し、予め定められた数の第1学習対象オブジェクト20の移動量が予め定められた基準以上の場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
【0073】
一実施形態において、コンピュータは、複数の第1学習対象オブジェクト20全部の移動量を測定し、複数の第1学習対象オブジェクト20全部の移動量が予め定められた基準以上の場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
【0074】
他の実施形態において、コンピュータは、複数の第1学習対象オブジェクト20のうち予め定められた数の第1学習対象オブジェクト20の移動量のみを測定し、測定した第1学習対象オブジェクト20の移動量うち予め定められた数の第1学習対象オブジェクト20の移動量が予め定められた基準以上の場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
【0075】
更に他の実施形態において、コンピュータは、複数の第1学習対象オブジェクト20のうち予め定められた数の第1学習対象オブジェクト20の移動量のみを測定し、測定した第1学習対象オブジェクト20全部の移動量が予め定められた基準以上の場合、該当フレームイメージ10を学習対象フレームイメージとして選定する。
【0076】
図6(c)の移動量測定により選定された学習対象フレームイメージは、
図4の(d)に示すように、抽出されたフレームイメージ11、12、13、14、15の中から選定された学習対象フレームイメージ12、14として選定される。
【0077】
図7は、本発明の他の実施形態に係る密集変数算出段階が追加された自律走行のための学習対象イメージ抽出方法の概略的なフローチャートである。
【0078】
図7を参照すれば、密集変数算出段階(S400)は、オリジナル動画受信段階(S100)の後に実行される。
【0079】
段階S400で、密集変数算出部640は、オリジナル道路走行映像と関連する地域の密集変数を算出する。密集変数は、特定地域と関連して人口又は車両が密集している程度を示す。例えば、密集変数が相対的に高ければ、該当地域の自律走行のためには相対的に多くのデータの学習が必要であると解析できる。密集変数算出部640は、特定地域に対する人口統計データ又は車両統計データのうち1つ以上を用いて特定地域の密集変数を算出する。人口統計データは、道路走行映像が撮影された位置及び時間に対応する人口密度、人口分布及び流動人口のうち少なくとも1つを含むことができるが、これに限定されない。また、車両統計データは、道路走行映像が撮影された位置及び時間に対応する車両登録台数、時間帯別の交通量統計及び公共交通手段分布のうち少なくとも1つを含むことができるが、これに限定されない。密集変数算出部640は、オリジナル道路走行映像と関連する地域の人口統計データ又は車両統計データのうち1つ以上を用いてオリジナル道路走行映像と関連する地域の密集変数を算出する。
【0080】
第1サンプリング部620は、メタデータ以外にもオリジナル道路走行映像と関連する地域の密集変数に更に基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。
【0081】
一実施形態において、第1サンプリング部620は、密集変数が所定の基準以上である場合、フレームイメージを所定の基準以上の数で抽出する。例えば、密集変数が1ないし10の値を有することができると仮定する。第1サンプリング部620は、密集変数が10で比較的高い地域では1秒当たり30個のフレームイメージを抽出し、密集変数が5で比較的低い地域では1秒当たり15個のフレームイメージを抽出できる。
【0082】
第1サンプリング部620は、公共データサーバを介して人口統計データ又は車両統計データに該当する密集変数の提供を受けることができるが、これに限定されない。
【0083】
図8は、本発明の他の実施形態に係る学習用データセット生成段階が追加された自律走行のための学習対象イメージ抽出方法の概略的なフローチャートである。
【0084】
図8を参照すれば、学習用データセット生成段階(S500)は、2次サンプリング段階(S300)の後に実行される。
【0085】
段階S500で、学習用データセット生成部650は、1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する。段階S500は、
図9で具体的に説明する。
【0086】
図9は、
図8の学習用データセット生成段階の概略的なフローチャートである。
【0087】
図9を参照すれば、学習用データセット生成段階(S500)は、第2学習対象オブジェクト検出段階(S510)と、第2学習対象オブジェクト注釈化段階(S520)と、を含む。
【0088】
段階S510で、学習用データセット生成部650は、学習対象フレームイメージ上で予め定められた1つ以上の類型の1つ以上の第2学習対象オブジェクトを検出する。
【0089】
第2学習対象オブジェクトは、学習対象フレームイメージに含まれているオブジェクトである。学習対象フレームイメージには、1つ以上の第2学習対象オブジェクトが含まれ、1つ以上の類型の第1学習対象オブジェクトが含まれる。例えば、第2学習対象オブジェクトは、人、自動車、自転車、建物、電信柱、オートバイ、木、花、子犬、猫、道路、交通表示板、過速防止用段差、ロードコーン、車線などを含むことができるが、前記例に限定されず、オブジェクトとして区別が可能なものを全て含む。また、第2学習対象オブジェクトの類型は、オブジェクトの前面、後面、右側面、左側面などを含むが、各学習対象オブジェクトの類型は前記例に限定されず、前記例よりも細分化させて区分することができ、前記例とは全く異なる類型として区分することができる。
【0090】
上述した段階S300で、第1学習対象オブジェクトの検出が、人工知能の学習のためのイメージの選別、即ち、学習対象フレームイメージの選別のためのものであったのであれば、段階S510で、第2学習対象オブジェクトの検出は、注釈化処理のための対象の選別のためのものである。
【0091】
第2学習対象オブジェクトの検出で1つ以上の類型の1つ以上のオブジェクトを検出することは、オブジェクト検出アルゴリズムを用いて検出することであり、オブジェクト検出アルゴリズムは、R-CNNモデルを含むことができるが、これに限定されない。
【0092】
段階S520で、学習用データセット生成部650は、学習対象フレームイメージ上の検出された1つ以上の第2学習対象オブジェクトに対して、注釈化処理を行う。
【0093】
注釈化処理は、学習対象フレームイメージ上の検出された第2学習対象オブジェクトを説明するデータの生成作業を意味する。注釈化処理は、第2学習対象オブジェクトに対してラベリング(labeling)、カラーリング(coloring)又はレイヤリング(layering)を行うことを含む。また、第2学習対象オブジェクトが何であるかを表示することは、全て注釈化処理として含めることができる。例えば、学習対象フレームイメージ上の検出された1つ以上の第2学習対象オブジェクトは、ボックス(box)などの形態により領域を区分して表示することができる。注釈化処理は、自動処理されるツールを活用することができる。
【0094】
第2学習対象オブジェクトとして区分されて表示された領域に対して、各第2学習対象オブジェクトが何であるかの説明を作成することができ、ラベリングは、1つの単語で作成されてもよく、1つの単語ではない、文章で詳細に作成されてもよい。
【0095】
注釈化処理は、1つ以上の作業者がラベリング、カラーリング又はレイヤリングした情報をデータベース化し、コンピュータにより学習されたモジュールを生成し、学習されたモジュールにより、新しく入ってきた学習対象フレームイメージ上の第2学習対象オブジェクトがデータベース化された第2学習対象オブジェクトと類似しているかを判断することによって、該当第2学習対象オブジェクトにラベリング、カラーリング又はレイヤリングを行うことができる。
【0096】
他の実施形態において、学習用データセット生成部650は、映像処理を用いて学習対象フレームイメージ上の検出された1つ以上の第2学習対象オブジェクトの重要度を判断し、重要度が所定の基準以上である場合、該当第2学習対象オブジェクトに対する注釈情報を生成できる。学習用データセット生成部650は、1つ以上の第2学習対象オブジェクトがある場合、重要度が高い第2学習対象オブジェクトに対してのみ注釈情報を生成できる。例えば、学習対象フレームイメージ上に自動車、信号機がある場合、該当自動車、信号機を重要度が高いと判断し、該当学習自動車、信号機に対してのみ注釈情報を生成できる。
【0097】
図10は、有効性検証段階が追加された
図8の学習用データセット生成段階の概略的なフローチャートである。
【0098】
図10を参照すれば、有効性検証段階(S530)は、学習対象オブジェクト注釈化段階の後に実行される。
【0099】
段階S530で、検査者は、学習用データセットの有効性を検証する。検査者端末は、自律走行のための学習対象イメージ抽出装置600から学習用データセットを受信する。段階S530は、
図11で具体的に説明する。
【0100】
図11は、
図10の有効性検証段階の概略的なフローチャートである。
【0101】
図11を参照すれば、有効性検証段階(S530)は、学習用データセットの検査を要請する段階(S531)と、学習用データセットを検査する段階(S532と、)を含む。
【0102】
段階S531で、自律走行のための学習対象イメージ抽出装置600は、検査者端末に検査を要請する。
【0103】
段階S532で、検査者端末を介して、検査者は、学習用データセットを受信して検査を行う。
【0104】
一実施形態において、検査者端末は学習用データセットの検査結果、学習用データセットの信頼度が所定の基準以上である場合、該当学習用データセットと該当信頼度を自律走行のための学習対象イメージ抽出装置600に送信する。従って、自律走行のための学習対象イメージ抽出装置600は、該当学習用データセットが人工知能モジュールに対して使用することに適したデータセットであることを確認することができる。
【0105】
一実施形態において、学習用データセットの検査結果、学習用データセットの信頼度が所定の基準未満である場合、該当学習用データセットを返却する。その後、検査者端末は、自律走行のための学習対象イメージ抽出装置600に該当学習用データセットの再作業を要請する。自律走行のための学習対象イメージ抽出装置600により再作業された学習用データセットは、段階S531ないしS532の段階により再検査を受ける。
【0106】
図12は、本発明の他の実施形態に係る自律走行のための学習対象イメージ抽出装置の概略的な構成図である。
【0107】
図12を参照すれば、自律走行のための学習対象イメージ抽出装置600は、オリジナル道路走行映像受信部610と、第1サンプリング部620と、第2サンプリング部630と、密集変数算出部640と、学習用データセット生成部650と、を含む。
【0108】
図12の自律走行のための学習対象イメージ抽出装置600の構成要素は、
図1ないし
図11を参照して説明した方法の構成要素に対応する。オリジナル道路走行映像受信部610はオリジナル動画受信段階(S100)を実行し、第1サンプリング部620は1次サンプリング段階(S200)を実行し、第2サンプリング部630は2次サンプリング段階(S300)を実行し、密集変数算出部640は密集変数算出段階(S400)を実行し、学習用データセット生成部650は学習用データセット生成段階(S500)を実行できる。以下、装置600の各構成要素の機能又は動作を説明するにおいて重複する説明は省略する。
【0109】
オリジナル道路走行映像受信部610は、オリジナル道路走行映像を受信する。
【0110】
第1サンプリング部620は、オリジナル道路走行映像のメタデータに基づいて抽出数を決定し、オリジナル道路走行映像から決定された数のフレームイメージを抽出する。
【0111】
オリジナル道路走行映像のメタデータは、オリジナル道路走行映像と関連する車両のGPS情報、車両の移動速度情報及びオリジナル道路走行映像の撮影時間のうち1つ以上を含む。
【0112】
第2サンプリング部630は、決定された数のフレームイメージそれぞれが第1学習対象オブジェクトを含んでいるか否か及び第1学習対象オブジェクトの移動量に基づいて、決定された数のフレームイメージから1つ以上の学習対象フレームイメージを抽出する。
【0113】
密集変数算出部640は、オリジナル道路走行映像と関連する地域の密集変数を算出する。
【0114】
学習用データセット生成部650は、1つ以上の学習対象フレームイメージを加工処理して学習用データセットを生成する。
【0115】
本発明の実施形態と関連して説明された方法又はアルゴリズムの段階は、ハードウェアで直接実現するか、ハードウェアにより実行されるソフトウェアモジュールで実現するか、又はこれらの結合により実現することができる。ソフトウェアモジュールは、RAM(Random Access Memory)、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、フラッシュメモリ(Flash Memory)、ハードディスク、脱着型ディスク、CD-ROM又は本発明が属する技術分野における周知されている任意の形態のコンピュータ読み取り可能な記録媒体に存在することもできる。
【0116】
以上、添付の図面を参照して本発明の実施形態を説明したが、本発明が属する技術分野における通常の技術者は、本発明がその技術的思想や必須の特徴を変更することなく、他の具体的な形態で実施され得ることが理解できるはずである。従って、以上で記述した実施形態は全ての面で例示的なものであり、制約的ではないものとして理解すべきである。