IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三星電子株式会社の特許一覧

<>
  • 特開-車線生成方法及び装置 図1
  • 特開-車線生成方法及び装置 図2
  • 特開-車線生成方法及び装置 図3
  • 特開-車線生成方法及び装置 図4
  • 特開-車線生成方法及び装置 図5
  • 特開-車線生成方法及び装置 図6
  • 特開-車線生成方法及び装置 図7
  • 特開-車線生成方法及び装置 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023070132
(43)【公開日】2023-05-18
(54)【発明の名称】車線生成方法及び装置
(51)【国際特許分類】
   G06V 10/82 20220101AFI20230511BHJP
   G06T 7/00 20170101ALI20230511BHJP
   G06V 20/58 20220101ALI20230511BHJP
【FI】
G06V10/82
G06T7/00 650A
G06T7/00 350C
G06V20/58
【審査請求】未請求
【請求項の数】22
【出願形態】OL
(21)【出願番号】P 2022175987
(22)【出願日】2022-11-02
(31)【優先権主張番号】10-2021-0151184
(32)【優先日】2021-11-05
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2022-0001807
(32)【優先日】2022-01-05
(33)【優先権主張国・地域又は機関】KR
(71)【出願人】
【識別番号】390019839
【氏名又は名称】三星電子株式会社
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung-ro,Yeongtong-gu,Suwon-si,Gyeonggi-do,Republic of Korea
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】金 娜▲よん▼
(72)【発明者】
【氏名】卞 文燮
(72)【発明者】
【氏名】呉 度官
(72)【発明者】
【氏名】池 大▲ひょん▼
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA04
5L096EA26
5L096FA03
5L096FA66
5L096FA67
5L096FA69
5L096HA11
5L096JA11
5L096KA04
5L096KA15
(57)【要約】
【課題】車線情報を生成する方法及び装置を提供する。
【解決手段】一実施形態に係る神経網を用いて車線情報を生成する方法は、入力イメージに基づいて車線確率マップを生成するステップと、車線確率マップを第2神経網に印加することで、車線特徴情報及び深度特徴情報を生成するステップと、深度特徴情報を第3神経網に印加することで、深度分布情報を生成するステップと、車線特徴情報及び深度分布情報に基づいて空間情報を生成するステップと、空間情報を第4神経網に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成するステップと、オフセット情報を用いて3次元車線情報を生成するステップを含む。
【選択図】図1
【特許請求の範囲】
【請求項1】
神経網を用いて車線情報を生成する方法であって、
入力イメージに基づいて車線確率マップを生成するステップと、
前記車線確率マップを第2神経網に印加することで、車線特徴情報及び深度特徴情報を生成するステップと、
前記深度特徴情報を第3神経網に印加することで深度分布情報を生成するステップと、
前記車線特徴情報及び前記深度分布情報に基づいて空間情報を生成するステップと、
前記空間情報を第4神経網に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成するステップと、
前記オフセット情報を用いて3次元車線情報を生成するステップと、
を含む、車線情報を生成する方法。
【請求項2】
前記車線確率マップを生成するステップは、
入力イメージのピクセルそれぞれに対応する車線確率値を生成するように学習された第1神経網を用いて前記車線確率マップを生成するステップを含み、
前記車線確率値それぞれは、前記ピクセルのピクセルが車線である確率を含む、請求項1に記載の車線情報を生成する方法。
【請求項3】
前記第2神経網は、車線特徴に関する第1チャネルを用いて車線特徴情報を生成するように学習されるか、又は、深度特徴に関する第2チャネルを用いて深度特徴情報を生成するように学習される、請求項1に記載の車線情報を生成する方法。
【請求項4】
前記深度特徴情報は、基準線に垂直方向の長さである車線の高さ及び撮影装置と車線との間の距離のうち少なくとも1つを含む、請求項1に記載の車線情報を生成する方法。
【請求項5】
前記深度分布情報は、前記入力イメージに含まれた複数のピクセルそれぞれに対応する深度の確率分布を含む、請求項1に記載の車線情報を生成する方法。
【請求項6】
前記空間情報を生成するステップは、前記車線特徴情報及び前記深度分布情報の外積を介して切頭体基盤の第1空間情報を生成するステップを含む、請求項1に記載の車線情報を生成する方法。
【請求項7】
前記空間情報を生成するステップは、
前記車線特徴情報及び前記深度分布情報に基づいて切頭体基盤の第1空間情報を生成するステップと、
前記第1空間情報をボクセルマップ基盤の第2空間情報に変換するステップと、
チャネル次元情報に基づいて前記第2空間情報を第3空間情報に変換するステップと、
前記第3空間情報を前記空間情報として決定するステップと、
を含む、請求項1に記載の車線情報を生成する方法。
【請求項8】
前記第1空間情報は、前記入力イメージの視点に基づいた3次元座標系上の空間情報を含む、請求項7に記載の車線情報を生成する方法。
【請求項9】
前記第2空間情報は、車両の視点に基づいた3次元座標系上の空間情報を含む、請求項7に記載の車線情報を生成する方法。
【請求項10】
前記第2空間情報に変換するステップは、
キャリブレーションパラメータに基づいて前記第1空間情報を前記第2空間情報に変換するステップを含み、
前記キャリブレーションパラメータは、前記入力イメージを撮影するための撮影装置の内部パラメータ及び前記撮影装置の外部パラメータのうち任意の1つ又は任意の組み合わせを含む、請求項8に記載の車線情報を生成する方法。
【請求項11】
前記内部パラメータは、焦点距離、主点、縦横比、中心点及び非対称係数の1つ又は任意の組み合わせを含み、
前記外部パラメータは、前記撮影装置の設置の高さ、前記撮影装置のパン及び前記撮影装置のチルトを含む、請求項10に記載の車線情報を生成する方法。
【請求項12】
前記オフセット情報は、車両の進行方向と水平方向の第1オフセット及び前記基準線と垂直方向の第2オフセットのうち少なくとも1つを含む、請求項1に記載の車線情報を生成する方法。
【請求項13】
前記空間情報を第4神経網に印加することで基準線が車線である確率値、視認性情報、第1オフセットに対応する第1不確実度及び第2オフセットに対応する第2不確実度のうち少なくとも1つを生成するステップをさらに含む、請求項1に記載の車線情報を生成する方法。
【請求項14】
前記神経網は、第1不確実度及び第2不確実度のうち任意の1つ又は任意の組み合わせに基づいて定義された損失関数に基づいて学習された神経網を含む、請求項1に記載の車線情報を生成する方法。
【請求項15】
前記神経網は、水平方向のオフセットに関する第1不確実度及び垂直方向のオフセットに関する第2不確実度のうち任意の1つ又は任意の組み合わせに基づいて定義された損失関数を用いて学習された神経網を含む、請求項1に記載の車線情報を生成する方法。
【請求項16】
前記神経網は、基準線が車線である確率値に基づいて定義された損失関数を用いて学習された神経網を含む、請求項1に記載の車線情報を生成する方法。
【請求項17】
前記神経網は、視認性情報に基づいて定義された損失関数を用いて学習された神経網を含む、請求項1に記載の車線情報を生成する方法。
【請求項18】
前記第1神経網は、車線がラベリングされたイメージを正解データとして用いて学習された神経網を含む、請求項2に記載の車線情報を生成する方法。
【請求項19】
請求項1ないし18のうちの何れか1項に記載の方法をコンピュータに実行させるコンピュータプログラム。
【請求項20】
入力イメージに基づいて車線確率マップを生成し、前記車線確率マップを第2神経網に印加することで車線特徴情報及び深度特徴情報を生成し、前記深度特徴情報を第3神経網に印加することで深度分布情報を生成し、前記車線特徴情報及び前記深度分布情報に基づいて空間情報を生成し、前記空間情報を第4神経網に印加することで車線の位置と基準線との間の変位差を含むオフセット情報を生成し、そして、前記オフセット情報を用いて3次元車線情報を生成するプロセッサを含む、電子装置。
【請求項21】
車両は、
入力イメージを撮影するためのセンサと、
非一時的コンピュータで読み出し可能な格納媒体に格納された命令語を実行するように構成されたプロセッサと、
を含み、
前記プロセッサは、前記入力イメージのピクセルそれぞれに対応する車線確率値を生成するように学習された第1神経網に基づいて車線確率マップを生成し、
第2神経網に前記車線確率マップを印加することで車線特徴情報及び深度特徴情報を生成し、
前記深度特徴情報を第3神経網に印加することで深度分布情報を生成し、
前記車線特徴情報及び前記深度分布情報に基づいて空間情報を生成し、
前記空間情報を第4神経網に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成し、
前記オフセット情報を用いて3次元車線情報を生成し、
前記3次元車線情報を車両の車両制御部に出力する、車両。
【請求項22】
前記第2神経網は、前記車線特徴情報を生成するように学習された第1サブ神経網、及び前記深度特徴情報を生成するように学習された第2サブ神経網を含み、
前記第1サブ神経網及び前記第2サブ神経網は、1つ又はそれ以上のレイヤを共有する、請求項21に記載の車両。
【発明の詳細な説明】
【技術分野】
【0001】
車線情報を生成する方法及び装置に関する。
【背景技術】
【0002】
ディープラーニング基盤のイメージ処理技術が発展するにつれ、自律走行にイメージ処理ディープラーニング技術が適用される傾向がある。ディープラーニング基盤の自律走行技術が発展することで、ディープラーニング技術を利用した車線認識関連の技術に対する関心も高まっている。車線認識技術は、自律走行の基本となる技術であるためである。しかし、次第に多様化する道路環境でディープラーニング技術を用いた高い車線認識性能のためには、道路の地形的な特徴を理解しなければならない。したがって、入力イメージでディープラーニング技術を用いて道路の地形的な特徴を把握する技術に対する研究及び投資は次第に増加しつつある。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】米国特許出願公開第2021/0241005号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、車線情報を生成する方法及び装置を提供することにある。
【課題を解決するための手段】
【0005】
一実施形態に係る神経網を用いて車線情報を生成する方法は、入力イメージに基づいて車線確率マップを生成するステップと、前記車線確率マップを第2神経網に印加することで、車線特徴情報及び深度特徴情報を生成するステップと、前記深度特徴情報を第3神経網に印加することで深度分布情報を生成するステップと、前記車線特徴情報及び前記深度分布情報に基づいて空間情報を生成するステップと、前記空間情報を第4神経網に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成するステップと、前記オフセット情報を用いて3次元車線情報を生成するステップとを含む。
【0006】
一実施形態に係る前記車線確率マップを生成するステップは、入力イメージのピクセルそれぞれに対応する車線確率値を生成するように学習された第1神経網を用いて前記車線確率マップを生成するステップを含み、前記車線確率値それぞれは、前記ピクセルのピクセルが車線である確率を含むことができる。
【0007】
一実施形態に係る前記第2神経網は、車線特徴に関する第1チャネルを用いて車線特徴情報を生成するように学習されるか、又は、深度特徴に関する第2チャネルを用いて深度特徴情報を生成するように学習されることができる。
【0008】
一実施形態に係る前記深度特徴情報は、基準線に垂直方向の長さである車線の高さ及び撮影装置と車線との間の距離のうち少なくとも1つを含むことができる。
【0009】
一実施形態に係る前記深度分布情報は、前記入力イメージに含まれた複数のピクセルそれぞれに対応する深度の確率分布を含むことができる。
【0010】
一実施形態に係る前記空間情報を生成するステップは、前記車線特徴情報及び前記深度分布情報の外積を介して切頭体基盤の第1空間情報を生成するステップを含むことができる。
【0011】
一実施形態に係る前記空間情報を生成するステップは、前記車線特徴情報及び前記深度分布情報に基づいて切頭体基盤の第1空間情報を生成するステップと、前記第1空間情報をボクセルマップ基盤の第2空間情報に変換するステップと、チャネル次元情報に基づいて前記第2空間情報を第3空間情報に変換するステップと、前記第3空間情報を前記空間情報として決定するステップとを含むことができる。
【0012】
一実施形態に係る前記第1空間情報は、前記入力イメージの視点に基づいた3次元座標系上の空間情報を含むことができる。
【0013】
一実施形態に係る前記第2空間情報は、車両の視点に基づいた3次元座標系上の空間情報を含むことができる。
【0014】
一実施形態に係る前記第2空間情報に変換するステップは、キャリブレーションパラメータに基づいて前記第1空間情報を前記第2空間情報に変換するステップを含み、前記キャリブレーションパラメータは、前記入力イメージを撮影するための撮影装置の内部パラメータ及び前記撮影装置の外部パラメータのうち任意の1つ又は任意の組み合わせを含むことができる。
【0015】
一実施形態に係る前記内部パラメータは、焦点距離、主点、縦横比、中心点及び非対称係数の1つ又は任意の組み合わせを含み、前記外部パラメータは、前記撮影装置の設置の高さ、前記撮影装置のパン及び前記撮影装置のチルトを含むことができる。
【0016】
一実施形態に係る前記オフセット情報は、車両の進行方向と水平方向の第1オフセット及び前記基準線と垂直方向の第2オフセットのうち少なくとも1つを含むことができる。
【0017】
一実施形態に係る前記空間情報を第4神経網に印加することで基準線が車線である確率値、視認性情報、第1オフセットに対応する第1不確実度及び第2オフセットに対応する第2不確実度のうち少なくとも1つを生成するステップをさらに含むことができる。
【0018】
一実施形態に係る前記神経網は、第1不確実度及び第2不確実度のうち任意の1つ又は任意の組み合わせに基づいて定義された損失関数に基づいて学習された神経網を含むことができる。
【0019】
一実施形態に係る前記神経網は、水平方向のオフセットに関する第1不確実度及び垂直方向のオフセットに関する第2不確実度のうち任意の1つ又は任意の組み合わせに基づいて定義された損失関数を用いて学習された神経網を含むことができる。
【0020】
一実施形態に係る前記神経網は、基準線が車線である確率値に基づいて定義された損失関数を用いて学習された神経網を含むことができる。
【0021】
一実施形態に係る前記神経網は、視認性情報に基づいて定義された損失関数を用いて学習された神経網を含むことができる。
【0022】
一実施形態に係る前記第1神経網は、車線がラベリングされたイメージを正解データとして用いて学習された神経網を含むことができる。
【0023】
他の一実施形態に係る電子装置は、入力イメージに基づいて車線確率マップを生成し、前記車線確率マップを第2神経網に印加することで車線特徴情報及び深度特徴情報を生成し、前記深度特徴情報を第3神経網に印加することで深度分布情報を生成し、前記車線特徴情報及び前記深度分布情報に基づいて空間情報を生成し、前記空間情報を第4神経網に印加することで車線の位置と基準線との間の変位差を含むオフセット情報を生成し、そして、前記オフセット情報を用いて3次元車線情報を生成するプロセッサを含む。
【0024】
他の一実施形態に係る車両は、入力イメージを撮影するためのセンサと、非一時的コンピュータで読み出し可能な格納媒体に格納された命令語を実行するように構成されたプロセッサとを含み、前記プロセッサは、前記入力イメージのピクセルそれぞれに対応する車線確率値を生成するように学習された第1神経網に基づいて車線確率マップを生成し、第2神経網に前記車線確率マップを印加することで車線特徴情報及び深度特徴情報を生成し、前記深度特徴情報を第3神経網に印加することで深度分布情報を生成し、前記車線特徴情報及び前記深度分布情報に基づいて空間情報を生成し、前記空間情報を第4神経網に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成し、前記オフセット情報を用いて3次元車線情報を生成し、前記3次元車線情報を車両の車両制御部(vehicle control unit、VCU)に出力する。
【0025】
一実施形態に係る前記第2神経網は、前記車線特徴情報を生成するように学習された第1サブ神経網、及び前記深度特徴情報を生成するように学習された第2サブ神経網を含み、前記第1サブ神経網及び前記第2サブ神経網は、1つ又はそれ以上のレイヤを共有することができる。
【発明の効果】
【0026】
本発明によると、車線情報を生成する方法及び装置を提供することができる。
【図面の簡単な説明】
【0027】
図1】一実施形態に係る車線情報を生成するための神経網を説明するための図である。
図2】一実施形態に係る空間情報を説明するための図である。
図3】一実施形態に係る第4神経網の出力データを説明するための図である。
図4】一実施形態に係る車線情報生成過程を説明するための図である。
図5】一実施形態に係る神経網の学習方法を説明するための図である。
図6】一実施形態に係る車線情報を生成するための方法を説明するためのフローチャートである。
図7】一実施形態に係る電子装置を説明するためのブロック図である。
図8】一実施形態に係る車両を説明するための図である。
【発明を実施するための形態】
【0028】
実施形態に対する特定な構造的又は機能的な説明は単なる例示のための目的として開示されたものであって、様々な形態に変更されることができる。したがって、実施形態は特定な開示形態に限定されるものではなく、本明細書の範囲は技術的な思想に含まれる変更、均等物ないし代替物を含む。
【0029】
第1又は第2などの用語を複数の構成要素を説明するために用いることがあるが、このような用語は1つの構成要素を他の構成要素から区別する目的としてのみ解釈されなければならない。例えば、第1構成要素は第2構成要素と命名することができ、同様に、第2構成要素は第1構成要素にも命名することができる。
【0030】
いずれかの構成要素が他の構成要素に「連結」されているか「接続」されていると言及されたときには、その他の構成要素に直接的に連結されているか又は接続されているが、中間に他の構成要素が存在し得るものと理解されなければならない。
【0031】
単数の表現は、文脈上、明白に異なる意味をもたない限り複数の表現を含む。本明細書において、「含む」又は「有する」等の用語は、明細書上に記載した特徴、数字、ステップ、動作、構成要素、部品又はこれを組み合わせたものが存在することを示すものであって、1つ又はそれ以上の他の特徴や数字、ステップ、動作、構成要素、部品、又はこれを組み合わせたものなどの存在又は付加の可能性を予め排除しないものとして理解しなければならない。
【0032】
異なるように定義さがれない限り、技術的又は科学的な用語を含んで、ここで用いる全ての用語は、本実施形態が属する技術分野で通常の知識を有する者によって一般的に理解されるものと同じ意味を有する。一般的に用いられる予め定義された用語は、関連技術の文脈上で有する意味と一致する意味を有するものと解釈されなければならず、本明細書で明白に定義しない限り、理想的又は過度に形式的な意味として解釈されることはない。
【0033】
一実施形態に係るプロセッサは、例えば、ソフトウェア(例えば、プログラム)を実行し、プロセッサに接続された電子装置の少なくとも1つの他の構成要素(例えば、ハードウェア又はソフトウェア構成要素)を制御し、様々なデータ処理又は演算を行うことができる。一実施形態によれば、データ処理又は演算の少なくとも一部として、プロセッサは、他の構成要素から受信された命令又はデータを揮発性メモリに格納し、揮発性メモリに格納された命令又はデータを処理し、結果データを不揮発性メモリに格納してもよい。一実施形態によれば、プロセッサは、メインプロセッサ(例えば、中央処理装置又はアプリケーションプロセッサ)又はこれとは独立的又は共に運営可能な補助プロセッサ(例えば、グラフィック処理装置、神経網処理装置(NPU:neural processing unit)、イメージ信号処理部、センサハブプロセッサ、又は、コミュニケーションプロセッサ)を含んでもよい。例えば、電子装置がメインプロセッサ及び補助プロセッサを含む場合、補助プロセッサは、メインプロセッサよりも低電力を使用してもよいし、指定された機能に特化するように設定されてもよい。補助プロセッサは、メインプロセッサとは別個に、又は、その一部として実現され得る。
【0034】
以下、添付する図面を参照しながら実施形態を詳細に説明する。各図面に提示された同一の参照符号は同一の部材を示す。
【0035】
図1は、一実施形態に係る車線情報を生成するための神経網を説明するための図である。
【0036】
図1において、入力イメージ110、第1神経網130、車線確率マップ140、第2神経網150、車線特徴情報151、深度特徴情報152、第3神経網160、深度分布情報161、第1空間情報170、キャリブレーションパラメータ171、第2空間情報172、第3空間情報180、第4神経網190、及び第4神経網の出力データ191,192,193,194,195が図示されている。
【0037】
一実施形態に係るプロセッサ710(図7で説明される)は、神経網を用いて車線情報を生成することができる。一実施形態に係る神経網は、車線情報を生成するための神経網を含む。一実施形態に係る神経網は、第1神経網130、第2神経網150、第3神経網160及び第4神経網のうち少なくとも1つを含んでもよい。一実施形態に係る神経網は、一部の神経網(又は、レイヤ)を省略してもよいし、他の神経網(又は、レイヤ)をさらに含んでもよい。
【0038】
一実施形態に係るプロセッサ710は、入力イメージ110に基づいて車線確率マップ140を生成する。一実施形態に係るプロセッサ710は、入力イメージ110に含まれている複数のピクセルそれぞれに対応する車線確率値を生成するよう学習された第1神経網130を用いて、車線確率マップ140を生成することができる。一実施形態に係る入力イメージ110は、神経網に入力されるイメージを含んでもよい。一実施形態に係る入力イメージ110は、道路走行状況を撮影したイメージを含んでもよい。例えば、入力イメージ110には、複数の車線が含まれてもよい。一実施形態に係る車線確率マップ140は、入力イメージに含まれた複数のピクセルそれぞれに対応する車線確率値を含み得る。例えば、プロセッサ710は、ピクセルの1つあたり該当ピクセルが車線である確率値を第1神経網130を用いて生成することができる。例えば、ピクセル1が車線に該当する確率は98%であってもよい。この場合、ピクセル1は、車線である可能性が高い。異なる例として、ピクセル2が車線に該当する確率は8%であってもよい。この場合、ピクセル2は車線ではない可能性が高い。一実施形態に係る第1神経網130は、イメージセグメンテーション(image segmentation)を行うために学習された神経網を含み得る。一実施形態に係るイメージセグメンテーションは、ピクセル単位でオブジェクトを認識する方法を含むことができる。一実施形態に係る第1神経網130は、車線確率マップを生成するよう学習された神経網を含んでもよい。一実施形態に係るプロセッサ710は、車線にラベリングされた正解データを用いて第1神経網130を学習させる。例えば、第1神経網130学習に使用される学習データは、車線が含まれているイメージを入力イメージにし、車線がラベリングされたイメージを正解データにすることができる。一実施形態に係るプロセッサ710は、第1神経網のみを別途に学習させてもよい。この場合、第2神経網、第3神経網及び/又は第4神経網のパラメータは、アップデートされなくてもよい。
【0039】
一実施形態に係るプロセッサ710は、車線確率マップ140を第2神経網150に印加することで、車線特徴情報151及び深度特徴情報152を生成することができる。図1に示されたC+Dはチャネル数であり、Hはイメージの縦の長さ(例えば、縦方向のピクセル数)、Wは、イメージの横の長さ(例えば、横方向のピクセル数)である。一実施形態に係る第2神経網150は、車線特徴情報151及び深度特徴情報152を生成するよう学習された神経網を含む。一実施形態に係る第2神経網150は、第2-1サブ神経網及び第2-2サブ神経網を含んでもよい。第2-1サブ神経網は、車線特徴情報151を生成するよう学習された神経網を含み、第2-2サブ神経網は、深度特徴情報152を生成するように学習された神経網を含む。一実施形態に係る第2-1サブ神経網及び第2-2サブ神経網は、少なくとも一部のレイヤを共有してもよい。他の一実施形態に係る第2神経網150は、車線特徴に関する第1チャネルを用いて車線特徴情報を生成するように学習されてもよい。一実施形態に係る第1チャネルは、車線特徴に関するチャネルとして少なくとも1つのチャネルを含んでもよい。例えば、第1チャネルに含まれたチャネル数は、図1Cに表現されている。一実施形態に係る第2神経網150は、深度特徴に関する第2チャネルを用いて深度特徴情報を生成するように学習され得る。一実施形態に係る第2チャネルは、深度特徴に関する少なくとも1つのチャネルを含むことができる。例えば、第2チャネルに含まれたチャネル数は図1Dに表現されている。例えば、第2神経網150は、畳み込みレイヤ、バッチ正規化レイヤ(Batch Normalization Layer)、ReLU(Rectified Linear Unit)レイヤ、プーリングレイヤ及び/又は1×1畳み込みレイヤを含んでもよい。
【0040】
一実施形態に係る車線特徴情報151は、イメージ上で他のオブジェクトとは区分される車線の特徴関連情報を含むことができる。例えば、車線特徴情報151は、イメージ上に存在する道路構造物、車両オブジェクト又は背景などと区分される車線の特徴関連情報を含んでもよい。例えば、車線特徴情報151は、ベクトル形態に表現されてもよい。一実施形態に係るプロセッサ710は、第2神経網150で第1チャネルを用いて車線特徴情報151を生成することができる。例えば、第1チャネルのチャネル数がCである場合、車線特徴情報151の大きさはC×H×Wになる。一実施形態に係るプロセッサ710は、第2-1サブ神経網を用いて車線特徴情報151を生成してもよい。
【0041】
一実施形態に係る深度特徴情報152は、2次元イメージから3次元空間を形成するために、2次元イメージの特定ピクセルの深度に関する特徴情報を含むことができる。例えば、特定ピクセルの深度はx、y座標における深度値に表現されてもよい。一実施形態に係る深度特徴情報152は、特定ピクセルの深度情報をベクトル形態に表現されてもよい。一実施形態に係るプロセッサ710は、第2神経網150で第2チャネルを用いて深度特徴情報152を生成することができる。第2チャネルのチャネル数がDである場合、深度特徴情報152の大きさは、D×H×Wになる。異なる例として、プロセッサ710は、第2-2サブ神経網を用いて深度特徴情報152を生成してもよい。
【0042】
一実施形態に係る深度特徴情報152は、基準線を基準に垂直方向の長さである車線の高さ230(例、図2における車線の高さ230)及び撮影装置と車線との間の距離250(例、図2における撮影装置と車線との間の距離250)のうち少なくとも1つを含んでもよい。
【0043】
一実施形態に係る車線の高さ230は、3次元空間で基準線が含まれている基準面を基準として決定された車線の高さを意味する。図2に示すように、xy平面が基準面である場合、車線のz値が車線の高さになる。一実施形態に係る実際の道路環境において道路は高低が存在する。例えば、道路は、登り坂の道もあり、下り坂の道もある。したがって、3次元空間で道路の高さを正確に予測することが、道路状況の把握において極めて重要である。
【0044】
一実施形態に係る撮影装置と車線との間の距離250は、図2において撮影装置と車線との間のユークリッド距離を含むことができる。一実施形態に係る撮影装置と車線との間の距離250は、それぞれの座標を用いて算出され得る。
【0045】
一実施形態に係るプロセッサ710は、深度特徴情報152を第3神経網160に印加することで深度分布情報161を生成することができる。
【0046】
一実施形態に係る第3神経網160は、深度分布情報161を生成するように学習された神経網を含むことができる。一実施形態に係る第3神経網160は、ピクセル単位の深度分布情報161を生成するように学習された神経網を含んでもよい。一実施形態に係る第3神経網160は、正規化レイヤ(例えば、softmax layer)を含む。そのため、プロセッサ710は、第3神経網160を用いて該当ピクセルが特定の深度値に対応する確率値が0と1との間の値に表現される。一実施形態に係る第3神経網160は、1×1畳み込みレイヤを含んでもよい。したがって、第3神経網160の入力データの大きさと出力データの大きさは同一であってもよい。一実施形態に係る深度分布情報161の大きさは、入力データである深度特徴情報152の大きさ(例えば、D×H×W)と同一であってもよい。
【0047】
一実施形態に係る深度分布情報161は、入力イメージに含まれた複数のピクセルそれぞれに対応する深度の確率分布を含む。一実施形態に係る深度分布情報161は、特定ピクセルに対応する深度の確率分布を含み得る。一実施形態に係る深度の確率分布は、特定ピクセルが特定の深度を有する確率を示す確率分布を含むことができる。例えば、深度の確率分布は、連続確率分布及び/又は離散確率分布を含んでもよい。深度分布情報が離散確率分布である場合、深度分布情報は、深度区間を複数に割って各深度区間に対応する確率値を含むことができる。例えば、1つのピクセルの深度が0から1の間である確率10%、1から2の間の確率20%、2から3の間の確率40%、3から4の間の確率20%、4から5の間の確率10%という分布を含んでもよい。
【0048】
一実施形態に係るプロセッサ710は、車線特徴情報151及び深度分布情報161に基づいて空間情報を生成することができる。一実施形態に係る空間情報は、2次元入力イメージを3次元空間に表現するための情報を含むことができる。例えば、空間情報は、3次元座標系、3次元座標系における座標、基準点、基準線などを含んでもよい。
【0049】
一実施形態に係るプロセッサ710は、車線特徴情報151及び深度分布情報161に基づいて、切頭体基盤の第1空間情報170を生成することができる。一実施形態に係るプロセッサ710は、車線特徴情報151及び深度分布情報161の外積を介して切頭体基盤の第1空間情報170を生成してもよい。
【0050】
一実施形態に係る切頭体(frustum)は、ビュー角度(view angle)と近接平面(near plane)、遠隔平面(far plane)などのパラメータを用いて定義され、各パラメータ値は予め設定されてもよい。例えば、ビュー角度は、仮想カメラの視点から見た角度を意味する。一実施形態に係る近接平面と遠隔平面は、第1軸(例えば、xyz座標系においてz軸)を基準にして、仮想カメラの視点から所定の位置にそれぞれ存在するxy平面であってもよい。一実施形態に係るプロセッサ710は、近接平面と遠隔平面を介してレンダリングするオブジェクトを含む空間を決定することができる。一実施形態に係るz軸は、仮想カメラの視点方向、即ち、仮想カメラの眺めている方向を意味する。ここで、近接平面と遠隔平面との間の空間に含まれているオブジェクトはレンダリングされ、近接平面と遠隔平面との間の空間に含まれていないオブジェクトは取り外される。
【0051】
一実施形態に係る第1空間情報170は、入力イメージ110の視点に基づいた座標系上の空間情報を含むことができる。例えば、入力イメージ110は、特定の視点で撮影されたイメージであってもよい。例えば、同じ被写体(車線、車両など)でも撮影装置の位置が被写体よりも上方にあるか下方にあるなど、被写体との関係で撮影装置の位置が変わると、その視点が変わり得る。一実施形態に係る第1空間情報170は、車線特徴情報151及び深度分布情報161の外積を介して生成された切頭体基盤の空間情報を含むことができる。したがって、入力イメージ110に含まれた平面座標は、車線特徴情報151及び深度分布情報161の外積を介して切頭体として定義された空間における座標に表現される。一実施形態に係る第1空間情報170は、切頭体として定義された空間における座標を含んでもよい。例えば、第1チャネルに含まれたチャネル数がCであり、第2チャネルに含まれたチャネル数がDである場合、外積を介してC×Dマトリックスが生成される。イメージの横の長さ(例えば、横ピクセル数)がWであり、縦の長さ(例えば、縦ピクセル数)がHである場合、第1空間情報170の大きさはC×D×W×Hになる。
【0052】
一実施形態に係る外積(outer product)は、ベクトルのテンソル積を意味する。例えば、列ベクトルに表現される2つのベクトルを外積すれば、マトリックスが生成され得る。例えば、大きさがCである列ベクトルと大きさがDである列ベクトルを外積すれば、C×Dの大きさのマトリックスが生成される。
【0053】
一実施形態に係るプロセッサ710は、第1空間情報170をボクセルマップ基盤の第2空間情報172に変換することができる。一実施形態に係るボクセルマップは、複数のボクセルを含む。一実施形態に係るボクセル(Voxel)は、2次元的なピクセルを3次元の形態に実現したものを意味する。一実施形態に係るVoxelは、Volume+Pixelの合成語として、「体積を有するピクセル」を意味する。
【0054】
一実施形態に係る第2空間情報172は、車両の視点に基づいた3次元座標系上の空間情報を含むことができる。一実施形態に係る第2空間情報172は、ボクセルマップ基盤で車両の視点に基づいた空間情報を含んでもよい。例えば、車両の視点に基づいた3次元座標系は、車両の走行方向を一軸に決定してもよい。
【0055】
一実施形態に係る第1空間情報170の空間座標系と第2空間情報172の空間座標系は異なってもよい。一実施形態に係る第1空間情報170の視点と第2空間情報172の視点とが異なるため、それぞれの空間座標系は異なってもよい。例えば、入力イメージを撮影した撮影装置の位置は、第1空間情報170で空間座標系の原点になる。しかし、第2空間情報172において、空間座標系の原点は、第1空間情報170における撮影装置の位置ではない場合もある。例えば、車両の後車両軸が原点であってもよく、車両の前面部が原点であってもよい。更なる例として、第1空間情報と第2空間情報の空間座標系が異なるため、地面(例えば、xy平面)が異なる。したがって、第1空間情報170の視点を第2空間情報172の視点に変換させる必要がある。したがって、プロセッサ710は、キャリブレーションパラメータ171に基づいて第1空間情報170を第2空間情報172に変換することができる。そのため、プロセッサ710は、様々な角度での空間座標系を生成して3次元車線情報を生成することができる。
【0056】
一実施形態に係るキャリブレーションは、一座標系を他の座標系に変換するための方法を含む。一実施形態に係るキャリブレーションパラメータ171は、キャリブレーションのために必要なパラメータを含んでもよく、マトリックス形態に表現されてもよい。一実施形態に係るキャリブレーションパラメータは、撮影装置内部パラメータ及び/又は撮影装置外部パラメータを含む。一実施形態に係る撮影装置内部パラメータは、焦点距離、主点、非対称係数などを含んでもよい。一実施形態に係る撮影装置外部パラメータは、2つの座標系間の回転(rotate)パラメータ及び/又は平行移動(translation)パラメータを含む。一実施形態に係る撮影装置外部パラメータは、カメラ設置の高さ、方向(パン、チルト)など、カメラと外部空間との幾何学的関係に関するパラメータを含む。一実施形態に係る撮影装置内部パラメータは、カメラの焦点距離、アスペクト比(aspect ratio)、中心点など、カメラ自体の内部的なパラメータを意味する。
【0057】
一実施形態に係るプロセッサ710は、第1空間情報170をボクセルマップ基盤の第2空間情報172に変換できる。例えば、第1空間情報170に含まれた座標はp=(u,v,d)に表現されてもよい。第1空間情報170に含まれた座標は、サンプリングされてもよい。そして、第2空間情報172に含まれた座標は、サンプリングされた座標としてp=(x,y,z)に表現されてもよい。サンプリングされたpは、各ボクセルの中心点である。プロセッサ710は、キャリブレーションパラメータを用いてサンプリングされたpを第1空間情報170でサンプリングされたpに変換する。プロセッサ710は、サンプリングされたpでz軸に該当するd値を関数fを介して取得できる。例えば、d=f(p)であってもよい。dは深度であり、関数f=(r31,r32,r33,t)・(x,y,z,1)であってもよい。一実施形態に係るr31、r32、r33は、回転パラメータ
【0058】
【数1】

において3行に該当する因子であってもよい。一実施形態に係るtは、平行移動
パラメータ
【0059】
【数2】

において3行に該当する因子であってもよい。プロセッサ710は、dを深度区間に対応するdに変換する。一実施形態に係る第2空間情報172に含まれた座標であるp=(x,y,z)は、d値を用いて決定された
【0060】
【数3】

に基づいてトライリニア補間法(Trilinear Interpolation)を用いて決定され得る。そのため、プロセッサ710は、第1空間情報170を第2空間情報172に変換することができる。
【0061】
一実施形態に係る第2空間情報172の大きさは、x軸方向の大きさであるX、y軸方向の大きさであるY、z軸の大きさであるZ、及びチャネル数Cに基づいてC×Z×Y×Xに決定される。第2空間情報172の大きさは、第1空間情報170と同一であってもよく異なってもよい。第2空間情報172は、第1空間情報170に含まれた座標をサンプリングした後、補間法を介して決定された座標を含んでいるため、空間情報の大きさは変わり得る。一実施形態に係る図1に示されたCはチャネルの数である。一実施形態に係るチャネルの数は、第1チャネル及び第2チャネルのうち少なくとも1つに基づいて決定される。
【0062】
一実施形態に係るプロセッサ710は、チャネル次元情報に基づいて第2空間情報172を第3空間情報180に変換することができる。一実施形態に係る第3空間情報180は、チャネル次元情報に基づいて第2空間情報で垂直方向(例えば、図2においてz軸)にボクセルマップのボクセル大きさを変形した空間情報を含むことができる。一実施形態に係るプロセッサ710は、チャネル次元情報を垂直方向にチャネル接続(channel concatenate)することで、第2空間情報172に含まれたボクセルを変形させ得る。そのため、プロセッサ710は、より正確な車線の高さが含まれた第3空間情報180を取得することができる。第2空間情報172及び第3空間情報180におけるCは、チャネルの数である。チャネルの数は、第1チャネル及び第2チャネルのうち少なくとも1つに基づいて決定される。一実施形態に係るチャネル次元情報は、第1チャネルに含まれたチャネル数を含んでもよい。他の一実施形態に係るチャネル次元情報は、第1チャネルに含まれたチャネル数及び第2チャネルに含まれたチャネル数を含んでもよい。更なる一実施形態に係るチャネル次元情報は、第2チャネルに含まれたチャネル数を含んでもよい。一実施形態に係る(C*Z)において、*は接続又は連結(concatenate)を表現した演算子であり得る。
【0063】
一実施形態に係るプロセッサ710は、空間情報を第4神経網190に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成することができる。一実施形態に係るプロセッサ710は、第3空間情報180を第4神経網190に印加することでオフセット情報を生成する。一実施形態に係る第4神経網190は、3次元車線情報を生成するために必要な情報を生成するよう学習された神経網を含む。一実施形態に係る第4神経網190は、オフセット情報、基準線が車線である確率値、視認性情報及び不確実度のうち少なくとも1つを生成するように学習された神経網を含む。
【0064】
一実施形態に係るオフセット情報は、基準線から車線がどれほど離れているかに関する情報を含む。一実施形態に係るオフセット情報は、車線の位置と基準線との間の変位差を含む。一実施形態に係るオフセット情報は、車両の進行方向にある基準線と水平である方向の第1オフセット及び基準線と垂直にある方向の第2オフセットのうち少なくとも1つを含む。3次元空間において基準線は、車両の進行方向であってもよい。3次元空間において、y軸(longitudinal axis)が車両の進行方向である場合、基準線はy軸と平行する。3次元空間において基準線がy軸と平行である場合、車両の進行方向と水平方向は、x軸(lateral axis)であってもよい。また、車両の進行方向と垂直方向は、z軸(vertical axis)であってもよい。したがって、第1オフセットは、x軸(lateral axis)方向の変位差を含む。図1において、第1オフセットはx191に表示される。そして、第2オフセットは、z軸(vertical axis)方向の変位差を含む。図1において、第2オフセットはz192に表示される。
【0065】
一実施形態に係るプロセッサ710は、オフセット情報を用いて3次元車線情報を生成することができる。3次元車線情報は、3次元空間における車線情報を含む。例えば、3次元空間がユークリッド座標系に表現される場合、車線はx、y、z座標の集合に表現されることができる。そのため、車線の高さ情報も把握でき、プロセッサ710は、より正確な道路状況を認識することができる。一実施形態に係るプロセッサ710は、図3に示すように車両の進行方向と平行な複数の基準線を基準にして、オフセット情報を適用して3次元空間における車線情報を生成することができる。例えば、基準線Xは、車両の進行方向と同一であってもよい。基準線Xを基準にして第1オフセットはxij331である。基準面であるxy平面から車線の高さを意味する第2オフセットはzij332である。したがって、実際の車線は、基準線Xから水平方向にxij331だけ、垂直方向にxy平面からzij332だけ離れた箇所に配置される。
【0066】
一実施形態に係るプロセッサ710は、第3空間情報180を第4神経網190に印加することで、基準線が車線である確率値、視認性情報193、第1オフセットに対応する第1不確実度194、及び第2オフセットに対応する第2不確実度195のうち少なくとも1つを生成してもよい。
【0067】
一実施形態に係る基準線が車線である確率値は、基準線が車線に該当する確率値を含む。図2に示すように、xy平面に基準線は複数存在する。そして、それぞれの基準線が車線である確率が存在する。例えば、基準線が車線である確率値が98%である場合、該当の基準線は車線である可能性が高い。更なる例で、基準線が車線である確率値が5%である場合、該当基準線は、車線である可能性が極めて低い。
【0068】
一実施形態に係る視認性情報193は、対象物の存在又は形状が遠距離であっても識別が容易な程度に関連する情報を含んでもよい。一実施形態に係る視認性情報193は、原点から車線が見える確率を含む。一実施形態に係る視認性情報193は、車両から車線が見える確率を含む。
【0069】
一実施形態に係る不確実度(Uncertainty)は、神経網出力データの不確実度を含む。例えば、不確実度は、神経網の出力データがどれほど確実な情報であるかに対する尺度を含む。一実施形態に係る不確実度は、オフセット情報の分散及び/又は標準偏差に基づいて決定され得る。
【0070】
一実施形態に係る第1不確実度194は、第1オフセットに対応する不確実度を含む。一実施形態に係る第1不確実度194は、水平方向のオフセットに関する不確実度を含む。例えば、第1不確実度194が大きいほど、第1オフセットだけ離れた位置に車線が存在することが不確であることを意味する。
【0071】
一実施形態に係る第2不確実度195は、第2オフセットに対応する不確実度を含む。一実施形態に係る第2不確実度195は、垂直方向のオフセットに関する不確実度を含む。例えば、第2不確実度195が大きいほど、第2オフセットだけ離れた位置に車線が存在することが不確であることを意味する。
【0072】
一実施形態に係る損失関数は、比較対象データと神経網の出力データとの差に基づいて決定される。比較対象データは、ラベリングされた正解データ及び/又はラベリングされないデータであってもよい。一実施形態に係るプロセッサは、損失関数を低減する方向に神経網のパラメータをアップデートすることができる。
【0073】
一実施形態に係る神経網は、第1不確実度及び第2不確実度のうち少なくとも1つに基づいて定義された損失関数に基づいて学習された神経網を含む。一実施形態に係る神経網は、第1損失関数に基づいて学習された神経網を含んでもよい。一実施形態に係る第1損失関数は、第1不確実度及び第2不確実度のうち少なくとも1つに基づいて定義される。一実施形態に係るプロセッサ710は、第1損失関数に基づいて神経網のパラメータをアップデートする。一実施形態に係るプロセッサ710は、不確実度が小さい場合、神経網のパラメータを大幅にアップデートし得る。更なる例として、プロセッサ710は、不確実度が大きい場合、神経網のパラメータを小さい幅にアップデートし得る。
【0074】
一実施形態に係る第1損失関数は、数式(1)のように表現される。
【0075】
【数4】

一実施形態に係るiは、i番目の基準線を示す。図3において、yはy軸を予め決定された基準として分割して生じた複数の線のうちj番目の線を意味する。したがって、xijは、i番目の基準線とj番目の線の交差点から水平方向の変位差を意味する第1オフセットであってもよい。zijは、i番目の基準線とj番目の線の交差点から第1オフセットだけ移動した後、垂直方向の変位差を意味する第2オフセットであってもよい。x^ ij及びz^ ijは正解データを意味する。σijは第1不確実度、sijは第2不確実度を意味する。LapL1は、数式(2)のように定義される。
【0076】
【数5】

一実施形態に係る数式(2)は、ラプラス(Laplace)損失関数を意味する。数式(2)において、x^は正解データであってもよい。x及びσは、神経網の出力データであるオフセットとオフセットに対応する不確実度を意味する。
【0077】
一実施形態に係る神経網は、基準線が車線である確率値に基づいて定義された損失関数を用いて学習された神経網を含むことができる。一実施形態に係る神経網は、第2損失関数に基づいて学習される。一実施形態に係る第2損失関数は、基準線が車線である確率値に基づいて定義される。第2損失関数は、基準線が車線であるか否かの2進分類に基づいて定義される。一実施形態に係る第2損失関数は、クロスエントロピーに表現される。一実施形態に係る第2損失関数は、実際の基準線が車線である確率と、神経網を介して予測した基準線が車線である確率の差が小さいほど小さい値を有し、その差が大きいほど大きい値を有する。一実施形態に係るプロセッサ710は、第2損失関数の大きさが小さくなるように神経網のパラメータをアップデートすることができる。第2損失関数は、数式(3)のように表現される。
【0078】
【数6】

一実施形態に係るpiはi番目の基準線が車線である確率値を意味し、神経網の出力データであってもよい。一実施形態に係るp^ iは、i番目の基準線が実際の車線である確率値を意味し、正解データになり得る。
【0079】
一実施形態に係る神経網は、視認性情報に基づいて定義された損失関数を用いて学習された神経網を含むことができる。一実施形態に係る神経網は、第3損失関数に基づいて学習された神経網を含む。一実施形態に係る第3損失関数は、視認性情報に基づいて定義される。一実施形態に係る第3損失関数は、車線が見えるか否かである2進分類に基づいて決定されてもよい。一実施形態に係る第3損失関数は、クロスエントロピーに表現される。一実施形態に係る第3損失関数は、実際の車線が見える確率と、神経網を介して予測した車線が見える確率との差が小さいほど小さい値を有し、差が大きいほど大きい値を有する。一実施形態に係るプロセッサ710は、第3損失関数の大きさが小さくなるよう神経網のパラメータをアップデートすることができる。第3損失関数は、数式(4)のように表現される。
【0080】
【数7】

一実施形態に係るjは、図3におけるy軸を予め決定された基準として分割して生じた複数の線を意味する。一実施形態に係るvijは、i番目の基準線とj番目の線の交差点に対応する視認性情報を意味する。一実施形態に係るvijは、神経網の出力データである視認性情報を含む。一実施形態に係るv^ ijは、正解データである視認性情報を含む。
【0081】
一実施形態に係る損失関数は、第1損失関数、第2損失関数、及び第3損失関数のうち少なくとも1つに基づいて決定され得る。一実施形態に係る損失関数は、数式(5)のように表現される。
【0082】
【数8】

一実施形態に係るλreg、λcls、λvisは、それぞれ第1損失関数、第2損失関数、第3損失関数に対応する係数である。一実施形態に係るLregは第1損失関数、Lclsは第2損失関数、Lvisは第3損失関数を意味する
一実施形態に係る車線情報生成方法によって車線認識を行う場合、プロセッサ710が道路の深度情報を使用するために様々な道路の形態を容易に把握することができる。また、ボクセルマップの表現を介して様々な道路形態において車線を正確に認識することができる。
【0083】
図2は、一実施形態に係る空間情報を説明するための図である。
【0084】
図2では、撮影装置210、車線211、車線の高さ230、深度分布情報(1)231、車線特徴情報151、第1空間情報(1)260、撮影装置と車線との間の距離250、深度分布情報(2)251、及び第1空間情報(2)270が図示されている。
【0085】
一実施形態に係る深度特徴情報152は、基準線を基準にして垂直方向の長さである車線の高さ230及び撮影装置と車線との間の距離250を含む。
【0086】
一実施形態に係る車線の高さ230は、3次元空間で基準線の含まれている基準面を基準にして決定された車線の高さを意味する。図2に示すように、xy平面が基準面である場合、車線のz値が車線の高さになる。例えば、車線211の座標は(u、v)に表示され、座標(u、v)はxy平面の座標であってもよい。一実施形態に係る基準線には複数の点が存在する。例えば、基準線がy軸と平行である場合、基準線には(u、v)、(u、v)、(u、v)、(u、v)、(u、v)、(u、v)、(u、v)、(u、v)といった8個の点が存在する。そして、各点に対応して深度情報が存在する。例えば、8個の点に対応する車線の高さが存在してもよい。一実施形態に係る各点に対応する車線の高さは、確率分布に表示される。例えば、深度分布情報(1)231は、座標(u、v)に対応する車線の高さの確率分布を含む。したがって、深度分布情報(1)231は、座標(u、v)での車線の高さ230それぞれに対する確率値を要素として有するベクトルを含むことができる。
【0087】
一実施形態に係るプロセッサ710は、車線特徴情報151と深度分布情報(1)231を外積して第1空間情報(1)260を生成することができる。例えば、プロセッサ710が座標(u、v)に対応する車線特徴情報151と深度分布情報(1)231を外積する場合、第1空間情報(1)260において色塗りされた部分が生成し得る。
【0088】
一実施形態に係る撮影装置と車線との間の距離250は、図2で撮影装置と車線との間のユークリッド距離を含む。一実施形態に係る撮影装置と車線との間距離250は、それぞれの座標を用いて算出されることができる。例えば、プロセッサ710は、撮影装置210の座標と車線211の座標を用いて撮影装置210と車線211との間の距離を算出してもよい。
【0089】
一実施形態に係る深度特徴情報は、撮影装置と車線との間の距離250を含む。例えば、車線211に対応する撮影装置と車線との間の距離250は、深度分布情報(2)251に表示される。深度分布情報は、撮影装置210と車線との間のそれぞれの距離に対する確率分布を含む。したがって、深度分布情報(2)251は、座標(u、v)における撮影装置210と車線の間の距離250それぞれに対する確率値を要素として有するベクトルを含むことができる。
【0090】
一実施形態に係るプロセッサ710は、車線特徴情報151と深度分布情報(2)251を外積して第1空間情報(2)270を生成することができる。例えば、プロセッサ710が座標(u、v)に対応する車線特徴情報151と深度分布情報(2)251を外積する場合、第1空間情報(2)270で色塗りされた部分が生成し得る。
【0091】
一実施形態に係る深度分布情報は、車線の高さ230に対応する深度分布情報(1)231及び撮影装置と車線との間の距離250に対応する深度分布情報(2)251に基づいて決定された情報を含むことができる。したがって、一実施形態に係る第1空間情報は、第1空間情報(1)260及び第1空間情報(2)270のうち少なくとも1つを含んでもよい。
【0092】
図3は、一実施形態に係る第4神経網の出力データを説明するための図である。
【0093】
図3において、車両の進行方向であるy軸、y軸の水平方向であるx軸、y軸の垂直方向であるz軸、基準線310、i番目の基準線X340、x軸と平行なj番目の線320、第1オフセット331、第2オフセット332、視認性情報333、第1不確実度334、及び第2不確実度335が図示されている。
【0094】
一実施形態に係るプロセッサ710は、空間情報を第4神経網190に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成することができる。一実施形態に係るプロセッサ710は、第3空間情報180を第4神経網190に印加することで、オフセット情報を生成することができる。
【0095】
一実施形態に係る第4神経網190は、3次元車線情報を生成するために必要な情報を生成するよう学習された神経網を含む。一実施形態に係る第4神経網190は、オフセット情報331,332、基準線が車線である確率値、視認性情報333、及び不確実度334,335のうち少なくとも1つを生成するように学習された神経網を含んでもよい。
【0096】
一実施形態に係るオフセット情報は、基準線から車線がどれほど離れているかに関する情報を含む。一実施形態に係るオフセット情報は、車線の位置と基準線との間の変位差を含んでもよい。一実施形態に係るオフセット情報は、車両の進行方向(例えば、図3においてy軸方向)の基準線と、水平方向(例えば、図3において、x軸方向)の第1オフセット及び基準線と垂直方向(例えば、図3において、z軸方向)の第2オフセットのうち少なくとも1つを含んでもよい。3次元空間で基準線は、車両の進行方向であってもよい。3次元空間において、y軸(longitudinal axis)が車両の進行方向である場合、基準線はy軸と平行する。3次元空間において、基準線がy軸と平行する場合、車両の進行方向と水平方向はx軸(lateral axis)であってもよい。また、車両の進行方向と垂直方向はz軸(vertical axis)であってもよい。したがって、第1オフセットは、x軸(lateral axis)方向の変位差を含むことができる。図3において、第1オフセットは、xij331に表示され、第2オフセットは、zij332に表示される。
【0097】
一実施形態に係るプロセッサ710は、オフセット情報を用いて3次元車線情報を生成することができる。3次元車線情報は、3次元空間における車線情報を含むことができる。例えば、3次元空間がユークリッド座標系に表現される場合、車線は、(x、y、z)座標の集合に表現される。そのため、車線の高さ情報も把握でき、プロセッサ710は、より正確な道路状況を認識することができる。一実施形態に係るプロセッサ710は、図3に示すように車両の進行方向(y軸)と平行な複数の基準線(X、X、X、…X)を基準にしてオフセット情報を適用し、3次元空間における車線情報を生成することができる。例えば、Xはi番目の基準線であってもよい。yは、y軸を予め決定された基準にして分割して生じた複数の線のうちj番目の線を意味する。y軸は、予め決定された基準に基づいて任意に分割されてもよい。例えば、y軸は、10個に分割されてもよい。したがって、xij331は、i番目の基準線とj番目の線の交差点から水平方向変位差を意味する第1オフセットである。基準線Xを基準にして、第1オフセットはxij331である。基準面であるxy平面から車線の高さを意味する第2オフセットはzij332である。したがって、実際の車線は、基準線Xから水平方向にxij331だけ、垂直方向にzij332だけ離れた箇所に配置されてもよい。
【0098】
一実施形態に係る視認性情報333は、対象物の存在又は形状が遠距離であっても識別の容易な程度に関する情報を含み得る。一実施形態に係る視認性情報333は、原点から車線が見える確率を含む。一実施形態に係る視認性情報333は、車両から車線が見える確率を含む。図3において、視認性情報333はvijに表示されてもよい。
【0099】
一実施形態に係る第1不確実度334は、第1オフセットに対応する不確実度を含んでもよい。第1不確実度334は、図3において、σijに表現されてもよい。一実施形態に係るσijは、i番目の基準線とj番目の線の交差点に対応する第1オフセットの不確実度を意味する。一実施形態に係る第1不確実度334は、水平方向のオフセットに関する不確実度を含む。例えば、第1不確実度334が大きいほど、第1オフセットだけ離れた位置に車線が存在することが不確であることを意味する。
【0100】
一実施形態に係る第2不確実度335は、第2オフセットに対応する不確実度を含む。第2不確実度335は、sijに表現されてもよい。一実施形態に係るsijは、i番目の基準線とj番目の線の交差点に対応する第2オフセットの不確実度を意味する。一実施形態に係る第2不確実度335は、垂直方向のオフセットに関する不確実度を含む。例えば、第2不確実度335が大きいほど、第2オフセットだけ離れた位置に車線が存在することが不確であることを意味する。
【0101】
図4は、一実施形態に係る車線情報生成過程を説明するための図である。
【0102】
図4において、入力イメージ110、車線確率マップ140、第2神経網150、第3神経網160、3次元空間マッピング410、3次元車線情報430及び3次元車線450が図示されている。
【0103】
一実施形態に係るプロセッサ710は、入力イメージ110を第1神経網に印加することで、車線確率マップ140を生成することができる。
【0104】
一実施形態に係るプロセッサ710は、車線確率マップ140を第2神経網150に印加することで、車線特徴情報及び深度特徴情報を生成することができる。
【0105】
一実施形態に係るプロセッサ710は、深度特徴情報を第3神経網160に印加することで、深度分布情報を取得することができる。
【0106】
一実施形態に係るプロセッサ710は、車線特徴情報及び深度分布情報に基づいて空間情報を生成することができる。
【0107】
一実施形態に係るプロセッサ710は、生成された空間情報を他の3次元空間にマッピング410する。一実施形態に係るプロセッサ710は、生成された空間情報を互いに異なる視点から見た3次元空間にマッピング410することができる。
【0108】
一実施形態に係るプロセッサは、生成された空間情報を3次元空間にマッピング410するために、下記の動作を行う。
【0109】
一実施形態に係るプロセッサ710は、車線特徴情報及び深度分布情報に基づいて切頭体基盤の第1空間情報を生成する。一実施形態に係るプロセッサ710は、第1空間情報をボクセルマップ基盤の第2空間情報に変換する。一実施形態に係るプロセッサ710は、チャネル次元情報に基づいて第2空間情報を第3空間情報に変換する。
【0110】
一実施形態に係るプロセッサ710は、第3空間情報を用いて3次元車線情報430を生成することができる。
【0111】
一実施形態に係るプロセッサ710は、3次元車線情報430に基づいて3次元車線450をディスプレイに出力することができる。
【0112】
図5は、一実施形態に係る神経網の学習方法を説明するための図である。
【0113】
図5において、入力イメージ110、車線確率マップ140、第2神経網150、第3神経網160、3次元空間マッピング410、3次元車線情報430、3次元車線450、深度分布情報510及びライダー基盤正解データ530が図示されている。
【0114】
一実施形態に係る神経網は、教師なし学習及び/又は教師あり学習に行われる。一実施形態に係る教師なし学習は、ラベリングされないデータを正解データにして神経網を学習させる方法を含む。例えば、神経網は、車線の含まれているイメージを学習データにして学習されることができる。一実施形態に係る教師あり学習は、ラベリングされたデータを正解データにして神経網を学習させる方法を含む。例えば、ラベリングされたデータは、イメージで車線をラベリングしたデータを含んでもよい。
【0115】
一実施形態に係るプロセッサ710は、神経網を教師あり学習を行うことができる。一実施形態に係るプロセッサ710は、ラベリングされたデータを正解データにする学習データを用いて神経網を学習させることができる。一実施形態に係るラベリングされたデータは、シミュレーションを介して取得してもよい。例えば、プロセッサ710は、車両の道路走行シミュレーションにおいて、車線をラベリングしたデータを学習データにすることができる。
【0116】
図5では、ライダー基盤正解データ530を活用した神経網の学習方法が説明される。一実施形態に係るラベリングされたデータは、ライダー基盤正解データ530を含む。ライダー基盤正解データ530は、ライダー(LIDAR)センサを介して取得したデータに基づいて生成されたデータを含む。一実施形態に係るプロセッサ710は、ライダーセンサを介して深度情報を取得することができる。一実施形態に係るプロセッサ710は、ライダーセンサを介して取得した深度情報に基づいて、各ピクセルに対応する深度確率分布を取得してもよい。一実施形態に係るプロセッサ710は、ライダーセンサを介して取得した深度情報(又は、深度情報に基づいた確率分布)を正解データにすることができる。したがって、第3神経網160の出力データである深度分布情報510とライダー基盤正解データ530との比較により、その差を低減するように神経網のパラメータをアップデートすることができる。更なる例として、第2神経網150の出力である深度特徴データとライダー基盤正解データ530とを比較し、その差を低減するように神経網のパラメータをアップデートすることができる。
【0117】
図6は、一実施形態に係る車線情報を生成するための方法を説明するためのフローチャートである。
【0118】
一実施形態に係る電子装置700は、入力イメージに基づいて車線確率マップを生成する(S610)。
【0119】
一実施形態に係る電子装置700は、入力イメージに含まれた複数のピクセルそれぞれに対応する車線確率値を生成するよう学習された第1神経網を用いて車線確率マップを生成し得る。
【0120】
一実施形態に係る電子装置700は、車線確率マップを第2神経網に印加することで、車線特徴情報及び深度特徴情報を生成する(S620)。
【0121】
実施形態に係る電子装置700は、深度特徴情報を第3神経網に印加することで深度分布情報を生成する(S630)。
【0122】
一実施形態に係る電子装置700は、車線特徴情報及び深度分布情報に基づいて空間情報を生成する(S640)。
【0123】
一実施形態に係る電子装置700は、車線特徴情報及び深度分布情報の外積を介して切頭体基盤の第1空間情報を生成する。
【0124】
一実施形態に係る電子装置700は、車線特徴情報及び深度分布情報に基づいて切頭体基盤の第1空間情報を生成する。
【0125】
一実施形態に係る電子装置700は、第1空間情報をボクセルマップ基盤の第2空間情報に変換する。
【0126】
一実施形態に係る電子装置700は、チャネル次元情報に基づいて第2空間情報を第3空間情報に変換する。
【0127】
一実施形態に係る電子装置700は、第3空間情報を空間情報として決定する。
【0128】
一実施形態に係る電子装置700は、空間情報を第4神経網に印加することで、車線の位置と基準線との間の変位差を含むオフセット情報を生成する(S650)。
【0129】
一実施形態に係る電子装置700は、オフセット情報を用いて3次元車線情報を生成することができる。
【0130】
一実施形態に係る電子装置700は、空間情報を第4神経網に印加することで、基準線が車線である確率値、視認性情報、第1オフセットに対応する第1不確実度、及び第2オフセットに対応する第2不確実度のうち少なくとも1つを生成することができる。
【0131】
図7は、一実施形態に係る電子装置を説明するためのブロック図である。
【0132】
図7を参照すると、一実施形態に係る電子装置700は、メモリ720、プロセッサ710、及び通信インターフェース730を含む。メモリ720、プロセッサ710、及び通信インターフェース730は、通信バス740を介して接続される。
【0133】
メモリ720は、上述したプロセッサ710の処理過程で生成される様々な情報を格納する。その他にも、メモリ720は、各種のデータとプログラムなどを格納する。メモリ720は、揮発性メモリ又は不揮発性メモリを含む。メモリ720は、ハードディスクなどのような大容量格納媒体を備えて各種のデータを格納することができる。
【0134】
プロセッサ710は、目的とする動作(desired operations)を実行させるための物理的な構造を有する回路を有するハードウェアで具現された装置であってもよい。例えば、目的とする動作は、プログラムに含まれたコード(code)又は命令(instructions)を含む。例えば、ハードウェアで具現された分類装置は、マイクロプロセッサー(microprocessor)、中央処理装置(Central Processing Unit;CPU)、グラフィック処理装置(Graphic Processing Unit;GPU)、プロセッサコア(processor core)、マルチ-コアプロセッサ(multi-core processor)、マルチプロセッサ(multiprocessor)、ASIC(Application-Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、NPU(Neural Processing Unit)などを含む。
【0135】
プロセッサ710は、プログラムを実行して電子装置を制御することができる。プロセッサ710によって実行されるプログラムコードは、メモリ720に格納されてもよい。
【0136】
神経網は、入力データに対する応答として内部パラメータによって算出された値を出力する。神経網の少なくとも一部は、ソフトウェアで具現されたり、ニューラルプロセッサ(neural processor)を含むハードウェアで具現されたり、又は、ソフトウェア及びハードウェアの組み合せで具現されてもよい。神経網は、完全接続ネットワーク(fully connected network)、ディープコンボリューショナルネットワーク(deep convolutional network)及びリカレントニューラルネットワーク(recurrent neural network)などを含むディープニューラルネットワーク(deep neural network、DNN)に該当する。DNNは、複数のレイヤを含む。複数のレイヤは入力層(input layer)、1つ以上の隠れ層(hidden layer)、及び出力層(output layer)を含む。神経網はディープラーニングに基づいて非線形関係にある入力データ及び出力データを互いにマッピングすることによって与えられた動作を行うようにトレーニングされ得る。ディープラーニングは、ビッグデータセットから与えられた問題を解決するための機械学習方式である。ディープラーニングは、準備されたトレーニングデータを用いてニューラルネットワークを学習させ、エネルギーが最小化される地点を訪ねて行くニューラルネットワークの最適化過程である。
【0137】
図8は、一実施形態に係る車両を説明するための図である。
【0138】
図8を参照すれば、車両800は、神経網基盤の車線生成装置810を含む。神経網基盤の車線生成装置810は、メモリ、プロセッサ及び通信インターフェース(図示せず)を含む。制限されていない例として、このような神経網基盤の車線生成装置810のメモリ、プロセッサ、及び通信インターフェースは、図7に示すメモリ720、プロセッサ710、及び通信インターフェース730に対応する。したがって、上述の説明はここで繰り返さない。車両800は、例えば、電気車両、スマート車両、又は自動運転車両であってもよい。
【0139】
例示によれば、神経網基盤の車線生成装置810は、図1図7を参照して以上で説明したように、3次元車線情報を生成することができる。3次元車線生成情報は、車両800のディスプレイを介して出力されてもよいし、車両800の電子制御部(electronic control unit、ECU)又は車両制御部(vehicle control unit、VCU)に送信されてもよい。例えば、車両800のECU又はVCUは、3次元車線生成情報を自律走行、半自律走行又は車両800の車線ガイド/保持に適用し得る。例えば、車両800のECU又はVCUは、車両800のディスプレイを介して3次元車線生成情報を出力することができる。
【0140】
図1図7を参照して提供された説明は、図8を参照して提供された説明に適用可能であり、したがって、追加的な説明はここで繰り返さない。
【0141】
以上で説明された実施形態は、ハードウェア構成要素、ソフトウェア構成要素、又はハードウェア構成要素及びソフトウェア構成要素の組み合せで具現される。例えば、本実施形態で説明した装置及び構成要素は、例えば、プロセッサ、コントローラ、ALU(arithmetic logic unit)、デジタル信号プロセッサ(digital signal processor)、マイクロコンピュータ、FPA(field programmable array)、PLU(programmable logic unit)、マイクロプロセッサー、又は命令(instruction)を実行して応答する異なる装置のように、1つ以上の汎用コンピュータ又は特殊目的コンピュータを用いて具現される。処理装置は、オペレーティングシステム(OS)及びオペレーティングシステム上で実行される1つ以上のソフトウェアアプリケーションを実行する。また、処理装置は、ソフトウェアの実行に応答してデータをアクセス、格納、操作、処理、及び生成する。理解の便宜のために、処理装置は1つが使用されるものとして説明する場合もあるが、当技術分野で通常の知識を有する者は、処理装置が複数の処理要素(processing element)及び/又は複数類型の処理要素を含むことが把握する。例えば、処理装置は、複数のプロセッサ又は1つのプロセッサ及び1つのコントローラを含む。また、並列プロセッサ(parallel processor)のような、他の処理構成も可能である。
【0142】
ソフトウェアは、コンピュータプログラム、コード、命令、又はそのうちの一つ以上の組合せを含み、希望の通りに動作するよう処理装置を構成されたり、独立的又は結合的に処理装置を命令されたりすることができる。ソフトウェア及び/又はデータは、処理装置によって解釈されてもよいし、処理装置に命令又はデータを提供するために、いずれかの類型の機械、構成要素、物理的装置、仮想装置、コンピュータ格納媒体又は装置、又は送信される信号波に永久的又は一時的に具体化することができる。ソフトウェアはネットワークに連結されたコンピュータシステム上に分散され、分散した方法で格納されて実行されてもよい。ソフトウェア及びデータは一つ以上のコンピュータで読出し可能な記録媒体に格納され得る。
【0143】
本実施形態による方法は、様々なコンピュータ手段を介して実施されるプログラム命令の形態で具現され、コンピュータ読み取り可能な記録媒体に記録される。記録媒体は、プログラム命令、データファイル、データ構造などを単独又は組み合せて含む。記録媒体及びプログラム命令は、本発明の目的のために特別に設計して構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり使用可能なものであってもよい。コンピュータ読み取り可能な記録媒体の例として、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD-ROM、DVDのような光記録媒体、フロプティカルディスクのような磁気-光媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置を含む。プログラム命令の例としては、コンパイラによって生成されるような機械語コードだけでなく、インタプリタなどを用いてコンピュータによって実行される高級言語コードを含む。
【0144】
上記で説明したハードウェア装置は、本発明に示す動作を実行するために1つ以上のソフトウェアモジュールとして作動するように構成してもよく、その逆も同様である。
【0145】
上述したように実施形態をたとえ限定された図面によって説明したが、当技術分野で通常の知識を有する者であれば、上記の説明に基づいて様々な技術的な修正及び変形を適用することができる。例えば、説明された技術が説明された方法と異なる順に実行され、及び/又は説明されたシステム、構造、装置、回路などの構成要素が説明された方法とは異なる形態に結合又は組み合わせられてもよく、他の構成要素又は均等物によって置き換え又は置換されたとしても適切な結果を達成することができる。
【0146】
したがって、他の具現、他の実施形態および特許請求の範囲と均等なものも後述する特許請求範囲の範囲に属する。
図1
図2
図3
図4
図5
図6
図7
図8