(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-22
(54)【発明の名称】ゴルフスイングに関する情報を推定するための方法、デバイスおよび非一過性のコンピュータ読み取り可能な記録媒体
(51)【国際特許分類】
A63B 69/36 20060101AFI20240115BHJP
G06T 7/00 20170101ALI20240115BHJP
G06V 10/82 20220101ALI20240115BHJP
G06T 7/70 20170101ALI20240115BHJP
【FI】
A63B69/36 541W
G06T7/00 660B
G06T7/00 350C
G06V10/82
G06T7/70 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023541546
(86)(22)【出願日】2022-01-03
(85)【翻訳文提出日】2023-07-06
(86)【国際出願番号】 KR2022000009
(87)【国際公開番号】W WO2022149811
(87)【国際公開日】2022-07-14
(31)【優先権主張番号】10-2021-0002920
(32)【優先日】2021-01-08
(33)【優先権主張国・地域又は機関】KR
(81)【指定国・地域】
(71)【出願人】
【識別番号】523257808
【氏名又は名称】モアイス インコーポレーテッド
【氏名又は名称原語表記】MOAIS, INC.
【住所又は居所原語表記】6F, 114, Taebong-ro, Seocho-gu, Seoul 06764, Republic of Korea
(74)【代理人】
【識別番号】100101878
【氏名又は名称】木下 茂
(74)【代理人】
【識別番号】100187506
【氏名又は名称】澤田 優子
(72)【発明者】
【氏名】リー ヨングン
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA02
5L096AA06
5L096BA08
5L096BA18
5L096CA04
5L096DA02
5L096FA67
5L096FA69
5L096GA30
5L096GA40
(57)【要約】
本発明の一態様によると、ゴルフスイングに関する情報を推定するための方法であって、使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出する段階、および前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定する段階を含む方法が提供される。
【特許請求の範囲】
【請求項1】
ゴルフスイングに関する情報を推定するための方法であって、
使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出する段階、および
前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定する段階を含む、方法。
【請求項2】
前記シャフトに関する複数のキーポイントには、前記シャフトの上部に位置する任意のポイント、前記シャフトの下部に位置する任意のポイントおよび前記上部に位置する任意のポイントと前記下部に位置する任意のポイントの間のいずれか一位置のうち少なくとも二つの位置が含まれる、請求項1に記載の方法。
【請求項3】
前記推定段階で、前記少なくとも二つの位置に関する確率情報に基づいて前記クラブの姿勢を推定する、請求項2に記載の方法。
【請求項4】
前記クラブの姿勢には前記クラブのフェースの姿勢が含まれ、
前記フェースに関する複数のキーポイントには、前記フェースの姿勢を推定できるようにする少なくとも三つの位置が含まれる、請求項1に記載の方法。
【請求項5】
前記人工ニューラルネットワークモデルは深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)を利用して軽量化されたものである、請求項1に記載の方法。
【請求項6】
前記推定段階で、前記シャフトに関する複数のキーポイントの位置、前記フェースに関する複数のキーポイントの位置および前記使用者の少なくとも一つの関節の位置は、前記撮影イメージを変形したイメージから検出される前記シャフトに関する複数のキーポイント、前記撮影イメージを変形したイメージから検出される前記フェースに関する複数のキーポイントおよび前記撮影イメージを変形したイメージから検出される前記使用者の少なくとも一つの関節にそれぞれ基づいて決定される、請求項1に記載の方法。
【請求項7】
請求項1に記載された方法を実行するためのコンピュータプログラムを記録する非一過性のコンピュータ読み取り可能記録媒体。
【請求項8】
ゴルフスイングに関する情報を推定するためのデバイスであって、
使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出するクラブおよび関節検出部、および
前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定するゴルフスイング情報推定部を含む、デバイス。
【請求項9】
前記シャフトに関する複数のキーポイントには、前記シャフトの上部に位置する任意のポイント、前記シャフトの下部に位置する任意のポイントおよび前記上部に位置する任意のポイントと前記下部に位置する任意のポイントの間のいずれか一位置のうち少なくとも二つの位置が含まれる、請求項8に記載のデバイス。
【請求項10】
前記ゴルフスイング情報推定部が、前記少なくとも二つの位置に関する確率情報に基づいて前記クラブの姿勢を推定する、請求項9に記載のデバイス。
【請求項11】
前記クラブの姿勢には前記クラブのフェースの姿勢が含まれ、
前記フェースに関する複数のキーポイントには、前記フェースの姿勢を推定できるようにする少なくとも三つの位置が含まれる、請求項8に記載のデバイス。
【請求項12】
前記人工ニューラルネットワークモデルは深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)を利用して軽量化されたものである、請求項8に記載のデバイス。
【請求項13】
前記クラブおよび関節検出部が、前記撮影イメージを変形したイメージから検出される前記シャフトに関する複数のキーポイント、前記撮影イメージを変形したイメージから検出される前記フェースに関する複数のキーポイントおよび前記撮影イメージを変形したイメージから検出される前記使用者の少なくとも一つの関節にそれぞれ基づいて、前記シャフトに関する複数のキーポイントの位置、前記フェースに関する複数のキーポイントの位置および前記使用者の少なくとも一つの関節の位置をそれぞれ決定する、請求項8に記載のデバイス。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はゴルフスイングに関する情報を推定するための方法、デバイスおよび非一過性のコンピュータ読み取り可能な記録媒体に関する。
【背景技術】
【0002】
最近、ゴルファーのスイング映像を分析してゴルファーに有用な情報を提供するための技術が紹介されている。
【0003】
これに関する従来技術の一例として、韓国公開特許公報第2009-105031号に開示された映像処理器法を利用したゴルフクリニックシステムおよびその運用方法に関する技術を例にすることができるが、これによると、ゴルフ修練者の身体およびゴルフクラブに付着される複数個のマーカー、ゴルフ修練者のスイング動作を映像で収集する複数個のカメラ、前記複数個のカメラで収集される2次元映像を3次元映像に再構成し、動きによるマーカーの空間上の座標を抽出して人体の分節の角度値と各局面別データをリアルタイムで分析してクリニック結果をレポート形式で出力する映像分析器およびスイング動作に対する運動力学的クリニック情報が会員情報にマッチングされてデジタルデータで保存されるデータベースを含むことを特徴とする。
【0004】
しかし、前記のような従来技術をはじめとしてこれまで紹介された技術によると、ゴルファーのスイングを分析するために、ゴルファーの姿勢および動作を認識するための高価な装備を別途に利用しなければならなかったりゴルファーの身体およびゴルフクラブに別途のセンサ(マーカー)を付着しなければならないのが実情であった。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】韓国公開特許公報第2009-105031号
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、前述した従来技術の問題点をすべて解決することをその目的とする。
【課題を解決するための手段】
【0007】
また、本発明は、使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出する段階、および前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定することを他の目的とする。
【0008】
また、本発明は、深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)を利用して人工ニューラルネットワークモデルを軽量化し、その軽量化された人工ニューラルネットワークモデルを利用して使用者のゴルフスイングに関する撮影イメージからクラブの姿勢および前記使用者のゴルフスイングに関する情報を推定することをさらに他の目的とする。
【0009】
また、本発明は、使用者のゴルフスイングに関する情報を推定するにおいて、前記使用者の少なくとも一つの関節の位置だけでなく、前記使用者のゴルフスイングに関する撮影イメージから推定されるクラブの姿勢まで参照することをさらに他の目的とする。
【0010】
前記目的を達成するための本発明の代表的な構成は次の通りである。
【0011】
本発明の一態様によると、使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出する段階、および前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定する段階を含む方法が提供される。
【0012】
本発明の他の態様によると、使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出するクラブおよび関節検出部、および前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定するゴルフスイング情報推定部を含むデバイスが提供される。
【0013】
この他にも、本発明を具現するための他の方法、他のデバイスおよび前記方法を実行するためのコンピュータプログラムを記録する非一過性のコンピュータ読み取り可能な記録媒体がさらに提供される。
【発明の効果】
【0014】
本発明によると、使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出する段階、および前記シャフトに関する複数のキーポイントの位置および前記フェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいて前記クラブの姿勢を推定し、前記クラブの姿勢および前記使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定することによって、別途のセンサ(マーカー)や装備を利用せずとも撮影イメージのみで使用者のゴルフスイングに関する情報を推定できるようになる。
【0015】
また、本発明によると、深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)を利用して人工ニューラルネットワークモデルを軽量化し、その軽量化された人工ニューラルネットワークモデルを利用して使用者のゴルフスイングに関する撮影イメージからクラブの姿勢を推定することによって、別途のセンサ(マーカー)や装備を利用せずに、モバイルデバイスで正確かつ効率的に前記使用者のゴルフスイングに関する情報を推定できるようになる。
【0016】
また、本発明によると、使用者のゴルフスイングに関する情報を推定するにおいて、前記使用者の少なくとも一つの関節の位置だけでなく、前記使用者のゴルフスイングに関する撮影イメージから推定されるクラブの姿勢まで参照することによって、前記使用者の少なくとも一つの関節の位置だけでは把握し難い情報(例えば、手首のコントロールおよび/またはクラブのコントロールに関する情報)を推定できるようになる。
【図面の簡単な説明】
【0017】
[
図1]本発明の一実施例に係るデバイスの内部構成を詳細に図示する図面である。
【0018】
[
図2(a)]本発明の一実施例により一般的なコンボリューション(Convolution)が遂行される過程を例示的に示す図面である。
【0019】
[
図2(b)]本発明の一実施例により深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)が遂行される過程を例示的に示す図面である。
【0020】
[
図3~
図7]本発明の一実施例によりクラブの姿勢および使用者のゴルフスイングに関する情報を推定する過程を例示的に示す図面である。
【発明を実施するための形態】
【0021】
後述する本発明に対する詳細な説明は、本発明が実施され得る特定の実施例を例示として図示する添付図面を参照する。このような実施例は、当業者が本発明を十分に実施できるように詳細に説明される。本発明の多様な実施例は、互いに異なるが相互排他的である必要はないことが理解されるべきである。例えば、本明細書に記載されている特定形状、構造および特性は、本発明の精神と範囲を逸脱することなく一実施例から他の実施例に変更されて具現され得る。また、それぞれの実施例内の個別の構成要素の位置または配置も、本発明の精神と範囲を逸脱することなく変更され得ることが理解されるべきである。したがって、後述する詳細な説明は限定的な意味として行われるものではなく、本発明の範囲は特許請求の範囲の請求項が請求する範囲およびそれと均等なすべての範囲を包括するものと理解されるべきである。図面で類似する参照符号は多様な側面に亘って同一または類似する構成要素を示す。
【0022】
以下では、本発明が属する技術分野で通常の知識を有する者が本発明を容易に実施できるようにするために、本発明の多様な好ましい実施例に関して添付された図面を参照して詳細に説明することにする。
【0023】
本明細書で、ゴルフスイングに関する実施例がフルスイングに焦点を合わせて説明されるものの、本発明でのゴルフスイングはゴルフクラブを動かすためのすべての動作を含む最広義の概念として理解されるべきである。例えば、本発明の一実施例に係るゴルフスイングには、フルスイング、ハーフスイング、チップショット、ロブショット、パッティングなどが含まれ得る。
【0024】
デバイスの構成
【0025】
以下では、本発明の具現のために重要な機能を遂行するデバイス100の内部構成と各構成要素の機能について詳察することにする。
【0026】
図1は、本発明の一実施例に係るデバイス100の内部構成を詳細に図示する図面である。
【0027】
図1に図示された通り、本発明の一実施例に係るデバイス100は、クラブおよび関節検出部110、ゴルフスイング情報推定部120、通信部130および制御部140を含んで構成され得る。本発明の一実施例によると、クラブおよび関節検出部110、ゴルフスイング情報推定部120、通信部130および制御部140は、そのうち少なくとも一部が外部のシステム(図示されず)と通信するプログラムモジュールであり得る。このようなプログラムモジュールは運営システム、応用プログラムモジュールまたはその他プログラムモジュールの形態でデバイス100に含まれ得、物理的には多様な公知の記憶装置に保存され得る。また、このようなプログラムモジュールはデバイス100と通信可能な遠隔記憶装置に保存されてもよい。一方、このようなプログラムモジュールは本発明により後述する特定の業務を遂行したり特定の抽象データ類型を実行するルーチン、サブルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを包括するが、これに制限されはしない。
【0028】
一方、デバイス100に関して前記のように説明されたが、このような説明は例示的なものであり、デバイス100の構成要素または機能のうち少なくとも一部が必要に応じてサーバー(図示されず)内で具現されたり外部システム(図示されず)内に含まれてもよいことは当業者に自明である。
【0029】
一方、本発明の一実施例に係るデバイス100はメモリ手段を具備し、マイクロプロセッサを搭載して演算能力を備えたデジタル機器であって、スマートフォン、タブレット、スマートウォッチ、スマートバンド、スマートグラス、デスクトップコンピュータ、ノートパソコン、ワークステーション、PDA、ウェブパッド、移動電話機などが含まれ得る。ただし、デバイス100は前述した例示だけでなく本発明の目的を達成できる範囲内でいくらでも変更され得る。
【0030】
特に、デバイス100は、使用者がデバイス100からゴルフスイングに関する情報推定などのサービスの提供を受けることができるように支援するアプリケーション(図示されず)を含むことができる。このようなアプリケーションは外部のアプリケーション配布サーバー(図示されず)からダウンロードされたものであり得る。一方、このようなアプリケーションの性格は、後述するようなデバイス100のクラブおよび関節検出部110、ゴルフスイング情報推定部120、通信部130および制御部140と全般的に類似し得る。ここで、アプリケーションはその少なくとも一部が必要に応じてそれと実質的に同一であるか均等な機能を遂行できるハードウェア装置やファームウェア装置で置換されてもよい。
【0031】
まず、本発明の一実施例に係るクラブおよび関節検出部110は、使用者のゴルフスイングに関する撮影イメージが獲得されると、人工ニューラルネットワークモデルを利用して前記撮影イメージからクラブのシャフトに関する複数のキーポイントおよび前記クラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出する機能を遂行することができる。
【0032】
具体的には、本発明の一実施例によると、使用者のゴルフスイングに関する撮影イメージはデバイス100により撮影されたものであるか他のデバイス(図示されず)により撮影されたイメージをデバイス100が獲得したものであり得る。そして、本発明の一実施例によると、使用者のゴルフスイングに関する撮影イメージはRGBカメラによって撮影されるイメージを意味し得る。すなわち、本発明の一実施例に係るクラブおよび関節検出部110は、深度カメラや深度センサのような装備から獲得される深さ情報および使用者の身体やゴルフクラブに付着されたセンサ(マーカー)を利用せずに、使用者のゴルフスイングに関するRGBイメージのみを利用してクラブのシャフトに関する複数のキーポイントおよびそのクラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出することができる。一方、本発明で、使用者のゴルフスイングに関する撮影イメージは主に動画を意味するが、その形式にかかわらず使用者のゴルフスイングを視覚的な形態で表現できるすべてのデータを含む最広義の概念として理解されるべきである。
【0033】
そして、本発明の一実施例に係るクラブおよび関節検出部110は、人工ニューラルネットワークモデルを利用して、使用者のゴルフスイングに関する撮影イメージからクラブのシャフトに関する複数のキーポイントおよびそのクラブのフェースに関する複数のキーポイントのうち少なくとも一つの位置に関する確率情報と前記使用者の少なくとも一つの関節の位置に関する確率情報を導き出す機能を遂行することができる。
【0034】
具体的には、本発明の一実施例に係るクラブおよび関節検出部110によって導き出され得るクラブのシャフトに関する複数のキーポイントの位置に関する確率情報、クラブのフェースに関する複数のキーポイントの位置に関する確率情報および使用者の少なくとも一つの関節の位置に関する確率情報は、前記使用者のゴルフスイングに関する撮影イメージを人工ニューラルネットワークモデルの入力データとして生成される確率マップ(Map;すなわち、前記人工ニューラルネットワークモデルの出力データ)に含まれ得る。
【0035】
例えば、本発明の一実施例によると、前記確率マップは2次元ヒートマップ(Heat map)を意味し得る。そして、本発明の一実施例に係るクラブおよび関節検出部110は、人工ニューラルネットワークモデルを利用して使用者の少なくとも一つの関節ごとにその関節に対する少なくとも一つの2次元ヒートマップイメージを生成でき、その生成された少なくとも一つのヒートマップイメージを構成するピクセル値の大きさが大きいほど前記関節の2次元的位置が該当ピクセルに該当する確率が高いとか、前記ヒートマップで小さいピクセル値が広く分布すれば関節の位置が正確に特定される確率が低く、大きいピクセル値が狭く分布すれば関節の位置が正確に特定される確率が高いというなどの性質に基づいて、使用者の少なくとも一つの関節の2次元的位置に関する確率情報を導き出すことができる。そして、本発明の一実施例に係るクラブおよび関節検出部110は、前記のように導き出される確率情報を参照して使用者の少なくとも一つの関節の2次元的位置を決定し、その位置を使用者の少なくとも一つの関節として検出することができる。
【0036】
一方、前述した使用者の関節の位置に関する確率情報を導き出すことに関する内容は、本発明の一実施例に係るクラブおよび関節検出部110によってクラブのシャフトに関する複数のキーポイントおよび/またはクラブのフェースに関する複数のキーポイントが検出される場合にも類似するように適用され得るので(すなわち、前記複数のキーポイントそれぞれに対してそのキーポイントに対する少なくとも一つの2次元ヒートマップイメージが生成される)、詳しい説明は省略することにする。
【0037】
一方、本発明の一実施例に係る人工ニューラルネットワークモデルにはCNN(Convolutional Neural Network)モデル、RNN(Recurrent Neural Network)モデル、DBN(Deep Belief Network)モデル、または前記モデルが結合された人工ニューラルネットワークモデルなどが含まれ得る。ただし、本発明の一実施例に係る人工ニューラルネットワークモデルは前記列挙されたものに限定されるものではなく、本発明の目的を達成できる範囲内で多様に変更され得る。
【0038】
そして、本発明の一実施例に係る人工ニューラルネットワークモデルは、深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)を利用して軽量化されたモデルであり得る。
【0039】
また、本発明の一実施例に係る人工ニューラルネットワークモデルは枝刈り(Pruning)、加重値量子化(Quantization)、残差学習(Residual Learning)のような軽量化アルゴリズムを利用して軽量化されたモデルであってもよい。また、本発明の一実施例に係る人工ニューラルネットワークモデルは、エンコーダ-デコーダ(encoder-decoder)構造のモデルであり得、軽量化のためにデコーダがエンコーダに比べて非常に少ない数のチャネルと層で構成され得る。
【0040】
具体的には、物体認識技術において一般的に使われる人工ニューラルネットワークモデルは高い水準の認識性能のために高い水準のコンピューティング資源の消耗を必要とするので、モバイルデバイスのように限定的なコンピューティング資源のみが提供される環境では利用し難い場合が多い。したがって、本発明の一実施例によると、深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)を利用して人工ニューラルネットワークモデルを軽量化し、その軽量化された人工ニューラルネットワークモデルをモバイルデバイスで利用することによって、使用者のゴルフスイングに関する撮影イメージからクラブのシャフトに関する複数のキーポイントおよびそのクラブのフェースに関する複数のキーポイントのうち少なくとも一つと前記使用者の少なくとも一つの関節を検出することができる。
【0041】
ここで、本発明の一実施例に係る深さ別コンボリューション(Depthwise Convolution)とは、本発明の一実施例に係る人工ニューラルネットワークモデルでコンボリューション(Convolution)を遂行するにおいて、入力される層(Layer)の深さ(すなわち、入力層のチャネル)別にそれぞれカーネル(Kernel)を適用するコンボリューション過程を意味し得る。一方、カーネルを適用して演算する方法自体は一般的なコンボリューションと同一であるので、詳しい説明は省略することにする。
【0042】
そして、本発明の一実施例に係る地点別コンボリューション(Pointwise Convolution)とは、本発明の一実施例に係る人工ニューラルネットワークモデルでコンボリューションを遂行するにおいて、入力される層の地点別にそれぞれ1×1×M大きさのカーネル(すなわち、幅1、高さ1、深さMのカーネル)を適用するコンボリューション過程を意味し得る。
【0043】
図2(a)は、本発明の一実施例により一般的なコンボリューション(Convolution)が遂行される過程を例示的に示す図面である。
【0044】
図2(b)は、本発明の一実施例により深さ別コンボリューション(Depthwise Convolution)および地点別コンボリューション(Pointwise Convolution)が遂行される過程を例示的に示す図面である。
【0045】
図2(a)を参照すると、本発明の一実施例によると、入力される層211の幅、高さ、深さがそれぞれF、F、Nであり、各カーネル212の幅、高さ、深さがそれぞれK、K、Nであり、出力される層213の幅、高さ、深さがそれぞれF、F、Mである場合を仮定することができる。また、ここでは、適切な大きさのパディング(Padding)とストライド(Stride)を設定して、入力される層211と出力される層213の幅、高さの変化がないものと仮定した。このような場合に、一般的なコンボリューションでは、入力される層211にカーネル212が適用されて出力される層213の一つの深さを構成(すなわち、F×F×K×K×N回の演算)することになり、M個のカーネル212に対してこのような演算をすることになるので、総F×F×K×K×N×M回の演算を遂行することになる。
【0046】
図2(b)を参照すると、本発明の一実施例によると、入力される層221の幅、高さ、深さがそれぞれF、F、Nであり、深さ別コンボリューションでの各カーネル222の幅、高さ、深さがそれぞれK、K、1であり、地点別コンボリューションでの各カーネル224の幅、高さ、深さがそれぞれ1、1、Nであり、出力される層225の幅、高さ、深さがそれぞれF、F、Mである場合を仮定することができる。このような場合に、入力される層221の深さ別にカーネル222が適用されて中間層223の各深さを構成(すなわち、F×F×K×K×1×N回の演算)することになる。その次に、その中間層223に地点別にカーネル224が適用されて出力される層225の一つの深さを構成(すなわち、F×F×1×1×N回の演算)することになり、M個のカーネル224に対してこのような演算をすることになるので、地点別コンボリューションでは総F×F×1×1×N×M回の演算を遂行することになる。したがって、本発明の一実施例に係る深さ別コンボリューションと地点別コンボリューションの演算を足すと、総(F×F×K×K×1×N)+(F×F×1×1×N×M)回の演算を遂行することになるので、一般的なコンボリューションより演算量が減る効果がある。
【0047】
一方、本発明の一実施例に係る軽量化のためのアルゴリズムは必ずしも前記アルゴリズム(深さ別または地点別コンボリューション)に限定されるものではなく、前記各アルゴリズムの適用順序または回数も多様に変更され得る。
【0048】
一方、本発明の一実施例によると、クラブのシャフトに関する複数のキーポイントにはクラブのシャフトの上部に位置する任意のポイント、クラブのシャフトの下部に位置する任意のポイントおよびその上部に位置する任意のポイントと下部に位置する任意のポイントの間のいずれか一位置のうち少なくとも二つの位置が含まれ得る。
【0049】
図3は、本発明の一実施例によりクラブの姿勢および使用者のゴルフスイングに関する情報を推定する過程を例示的に示す図面である。
【0050】
例えば、本発明の一実施例によると、
図3(a)を参照すると、クラブのシャフトに関する複数のキーポイントにはクラブのシャフトの上部に位置する任意のポイント(313;すなわち、クラブの取っ手部分)、そのシャフトの下部に位置する任意のポイント(311;すなわち、クラブのヘッド部分)およびその上部に位置する任意のポイント313と下部に位置する任意のポイント311の中間(312;すなわち、クラブのシャフトの中間)が含まれ得る。
【0051】
他の例として、本発明の一実施例によると、
図3(b)を参照すると、使用者のゴルフスイングに関する撮影イメージにクラブの一部(例えば、クラブのヘッド部分)が含まれない場合を仮定することができる。本発明の一実施例によると、このような場合には、クラブのシャフトに関する複数のキーポイントにはクラブのシャフトの上部に位置する任意のポイント(322;すなわち、クラブの取っ手部分)およびクラブのシャフトの中間321が含まれ得る。
【0052】
ただし、本発明の一実施例に係るクラブのシャフトに関する複数のキーポイントは、前述されたものに限定されず、本発明の目的を達成できる範囲内で多様に変更され得る。
【0053】
そして、本発明の一実施例によると、クラブのフェースに関する複数のキーポイントには、そのフェースの姿勢を推定できるようにする少なくとも三つの位置が含まれ得る。ここで、本発明の一実施例によると、クラブのフェースの姿勢にはそのフェースが向かう方向、特定基準線(例えば、使用者の身体に関する基準線など)とそのフェースがなす角度、ゴルフスイング中のクラブの開閉程度などが含まれ得るが、これに制限されるものではない。
【0054】
図4は、本発明の一実施例によりクラブの姿勢および使用者のゴルフスイングに関する情報を推定する過程を例示的に示す図面である。
【0055】
例えば、本発明の一実施例によると、
図4を参照すると、クラブのフェース410に関する複数のキーポイントには、クラブフェース410の上端をなす線の中間(411;またはクラブフェースの上端)、クラブフェース410の下端をなす線の中間(413;またはクラブフェースの下端)およびクラブフェースの外側をなす線の中間(412;またはクラブフェースの最外側)が含まれ得る。
【0056】
ただし、本発明の一実施例に係るクラブのフェースに関する複数のキーポイントは前述されたものに限定されず、クラブのフェースに関する複数のキーポイントが直線をなす場合のように、そのフェースの姿勢を推定できなくする場合でなければ、本発明の目的を達成できる範囲内で多様に変更され得る。
【0057】
一方、本発明の一実施例に係るクラブおよび関節検出部110は、使用者のゴルフスイングに関する撮影イメージを変形し、その変形したイメージから検出されるクラブのシャフトに関する複数のキーポイント、その変形したイメージから検出されるクラブのフェースに関する複数のキーポイントおよびその変形したイメージから検出される使用者の少なくとも一つの関節にそれぞれ基づいて、前記シャフトに関する複数のキーポイントの位置、前記フェースに関する複数のキーポイントの位置および前記使用者の少なくとも一つの関節の位置をそれぞれ決定することができる。
【0058】
具体的には、本発明の一実施例に係るクラブおよび関節検出部110は、使用者のゴルフスイングに関する撮影イメージに含まれる少なくとも一部のフレームを変形することができる。本発明の一実施例によると、このような変形にはフレームを左右反転させたりフレーム(またはそのフレームに含まれる少なくとも一部の客体)の位置を移動させたりすることなどが含まれ得る。そして、本発明の一実施例に係るクラブおよび関節検出部110は、前記のように変形された使用者のゴルフスイングに関する撮影イメージからクラブのシャフトに関する複数のキーポイントおよびクラブのフェースに関する複数のキーポイントのうち少なくとも一つと使用者の少なくとも一つの関節を検出することができる。そして、本発明の一実施例に係るクラブおよび関節検出部110は、前記のように変形された使用者のゴルフスイングに関する撮影イメージでの検出結果と本来の使用者のゴルフスイングに関する撮影イメージでの検出結果をすべて参照(例えば、各イメージから生成されるヒートマップの平均値を参照)して、クラブのシャフトに関する複数のキーポイントおよびクラブのフェースに関する複数のキーポイントのうち少なくとも一つの位置と使用者の少なくとも一つの関節の位置を決定することによって、人工ニューラルネットワークモデルの検出正確度を高めることができる。
【0059】
ただし、本発明の一実施例に係るフレームの変形方法や変形回数は前述されたものに限定されるものではなく、本発明の目的を達成できる範囲内で多様に変更および/または組み合わせられ得る。
【0060】
一方、本発明の一実施例によると、前記のように変形されるフレームは使用者のゴルフスイングを分析するにおいて重要度が高いフレーム(例えば、バックスイングのトップに関するフレーム)であり得る。そして、本発明の一実施例に係るクラブおよび関節検出部110は、使用者のゴルフスイングに関する撮影イメージから一次的に検出されるクラブのシャフトに関する複数のキーポイントおよびクラブのフェースに関する複数のキーポイントのうち少なくとも一つと使用者の少なくとも一つの関節を参照して、前記のように変形されるフレームを決定することができる。
【0061】
また、本発明の一実施例に係るクラブおよび関節検出部110は、使用者のゴルフスイングに関する撮影イメージで複数回の検出を遂行してその検出結果をすべて参照することによって、人工ニューラルネットワークモデルの検出正確度を高めることができる。このために、例えば、ランダムフォレスト(Random Forest)、アダブースト(AdaBoost)等のアンサンブル(Ensemble)技法が利用され得る。
【0062】
次に、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブのシャフトに関する複数のキーポイントの位置およびそのクラブのフェースに関する複数のキーポイントの位置のうち少なくとも一つに基づいてそのクラブの姿勢を推定する機能を遂行することができる。
【0063】
具体的には、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブのシャフトに関する複数のキーポイントの間の位置関係およびクラブのフェースに関する複数のキーポイントの位置関係のうち少なくとも一つに基づいて、そのクラブの姿勢を推定することができる。ここで、本発明の一実施例によると、クラブの姿勢にはクラブのシャフトの姿勢、クラブのフェースの姿勢などが含まれ得、シャフトの姿勢にはそのシャフトの位置やそのシャフトが向かう方向、特定基準線(例えば、使用者の身体に関する基準線など)とシャフトがなす角度などが含まれ得るが、これに制限されるものではない。
【0064】
また、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブのシャフトの上部に位置する任意のポイント、そのシャフトの下部に位置する任意のポイントおよびその上部に位置する任意のポイントと下部に位置する任意のポイントの間のいずれか一位置のうち少なくとも二つの位置に関する確率情報に基づいて前記クラブの姿勢を推定することができる。
【0065】
例えば、
図3(a)を参照すると、本発明の一実施例に係るクラブおよび関節検出部110によって、使用者のゴルフスイングに関する撮影イメージからクラブのシャフトの上部に位置する任意のポイント313、そのシャフトの下部に位置する任意のポイント311およびそのシャフトの中間312がそのシャフトに関する複数のキーポイントとして検出されたし、下部に位置する任意のポイント311の位置に関する確率が所定の臨界値を超過する場合を仮定することができる。このような場合に、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブのシャフトの上部に位置する任意のポイント313から下部に位置する任意のポイント311をそのクラブの姿勢(またはクラブが向かう方向)として推定することができる。
【0066】
他の例として、
図3(a)を参照すると、本発明の一実施例に係るクラブおよび関節検出部110によって、使用者のゴルフスイングに関する撮影イメージからクラブのシャフトの上部に位置する任意のポイント313、そのシャフトの下部に位置する任意のポイント311およびそのシャフトの中間312がそのシャフトに関する複数のキーポイントとして検出されたし、下部に位置する任意のポイント311の位置に関する確率が所定の臨界値以下であり、中間312の位置に関する確率が所定の臨界値を超過する場合を仮定することができる。このような場合に、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブのシャフトの上部に位置する任意のポイント313から中間312をそのクラブの姿勢(またはクラブが向かう方向)として推定することができる。
【0067】
さらに他の例として、
図3(b)を参照すると、本発明の一実施例に係るクラブおよび関節検出部110によって、使用者のゴルフスイングに関する撮影イメージからクラブのシャフトの上部に位置する任意のポイント322およびそのシャフトの中間321がそのシャフトに関する複数のキーポイントとして検出されたし、中間321の位置に関する確率が所定の臨界値を超過する場合を仮定することができる。このような場合に、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブのシャフトの上部に位置する任意のポイント322から中間321をそのクラブの姿勢(またはクラブが向かう方向)として推定することができる。
【0068】
図5は、本発明の一実施例によりクラブの姿勢および使用者のゴルフスイングに関する情報を推定する過程を例示的に示す図面である。
【0069】
例えば、
図5を参照すると、本発明の一実施例に係るクラブおよび関節検出部110は、使用者のゴルフスイングに関する撮影イメージからクラブのフェース510に関する複数のキーポイント511を検出することができる。そして、本発明の一実施例に係るゴルフスイング情報推定部120は、複数のキーポイント511の位置関係(例えば、複数のキーポイントによって構成される面の形態、面積など)に基づいてそのクラブのフェース510の姿勢(例えば、そのフェースが向かう方向、特定基準線(例えば、使用者の身体に関する基準線など)とそのフェースがなす角度、ゴルフスイング中のクラブが開閉程度など)を推定することができる。
【0070】
また、本発明の一実施例に係るゴルフスイング情報推定部120は、前述した通り、推定されるクラブの姿勢および使用者の少なくとも一つの関節の位置を参照して前記使用者のゴルフスイングに関する情報を推定する機能を遂行することができる。
【0071】
具体的には、本発明の一実施例に係るゴルフスイング情報推定部120は、使用者の少なくとも一つの関節の位置に基づいて前記使用者の少なくとも一つの関節の種類、前記使用者の少なくとも一つの関節の位置、前記使用者の少なくとも一つの関節と前記使用者の他の少なくとも一つの関節の間の距離および前記使用者の少なくとも一つの関節と前記使用者の他の少なくとも一つの関節の間で形成される角度のうち少なくとも一つを推定でき、これに基づいて前記使用者の姿勢を推定することができる。そして、本発明の一実施例に係るゴルフスイング情報推定部120は、このように推定される前記使用者の姿勢およびクラブの姿勢に基づいて前記使用者のゴルフスイングに関する情報を推定することができる。
【0072】
ここで、本発明の一実施例によると、使用者のゴルフスイングに関する情報には、使用者の少なくとも一つの関節の位置だけでは把握し難い情報、すなわち、手首のコントロール、クラブのコントロールなどに関する情報が含まれ得る。例えば、本発明の一実施例によると、使用者のゴルフスイングに関する情報には、スイングプレーン(swing plane)に関する情報(例えば、ワンプレーンスウィングなのか、ツープレーンスウィングなのか、シャローイング(shallowing)スイングなのかなど)、コーキング(cocking)に関する情報(例えば、アーリーコーキング(early cocking)、コーキング、オーバースイング(over swing)、キャスティング(casting)、スクーピング(scooping)等が発生したかどうか)、バックスイング(back swing)時にクラブパス(club path)に関する情報(例えば、クラブを内側に抜くか、外側に抜くかなど)、クラブフェースに関する情報(例えば、テイクバック(take back)時またはバックスイングのトップ(back swing top)でクラブが閉じたか、開かれたかなど)などが含まれ得る。ただし、本発明の一実施例に係る使用者のゴルフスイングに関する情報は前記列挙されたものに限定されるものではなく、本発明の目的を達成できる範囲内で多様に変更され得る。
【0073】
一方、本発明の一実施例によると、使用者のゴルフスイングに関する情報はゴルフスイングを構成する部分動作別に区分されて推定され得る。
【0074】
具体的には、本発明の一実施例に係るゴルフスイングは、アドレス(address)、テイクアウェイ(take away)、バックスイング(back swing)、トップオブスイング(top of swing)、ダウンスイング(down swing)、インパクト(impact)、フォロースルー(follow through)およびフィニッシュ(finish)のような8段階の部分動作で構成され得る。そして、本発明の一実施例に係るゴルフスイング情報推定部120は、クラブの姿勢および使用者の少なくとも一つの関節の位置を参照して、その使用者のゴルフスイングに関して撮影されたイメージが前記8段階のうちいずれの段階に該当するかを導き出し、ゴルフスイングを構成する部分動作別に区分してその使用者のゴルフスイングに関する情報を推定する機能を遂行することができる。
【0075】
一方、本発明の一実施例に係るゴルフスイングは必ずしも前記のような8段階に区分されるものではない。すなわち、前記8段階それぞれを構成する細部的な段階をさらに含んで区分されてもよく、前記8段階の少なくとも一部が一つの段階を構成するものとして区分されてもよい。
【0076】
図6および
図7は、本発明の一実施例によりクラブの姿勢および使用者のゴルフスイングに関する情報を推定する過程を例示的に示す図面である。
【0077】
例えば、
図6を参照すると、本発明の一実施例に係るゴルフスイング情報推定部120は、使用者の少なくとも一つの関節の位置に基づいて推定され得る使用者の腕の角度(または方向、すなわち、使用者の姿勢)(611、621および631)およびクラブのフェースに関する複数のキーポイントに基づいて推定され得るクラブのフェースの姿勢(例えば、フェースが向かう方向)(610、620および630)を参照して、使用者のゴルフスイングに関する情報を推定することができる。
【0078】
他の例として、
図7を参照すると、本発明の一実施例に係るゴルフスイング情報推定部120は、使用者の少なくとも一つの関節の位置に基づいて推定され得る使用者の手首の方向(または角度、すなわち、使用者の姿勢)720およびクラブのシャフトに関する複数のキーポイントに基づいて推定され得るクラブのシャフトの姿勢(例えば、シャフトが向かう方向)710を参照して、使用者のゴルフスイングに関する情報を推定することができる。
【0079】
次に、本発明の一実施例に係る通信部130は、クラブおよび関節検出部110およびゴルフスイング情報推定部120からの/へのデータの送受信を可能にする機能を遂行することができる。
【0080】
最後に、本発明の一実施例に係る制御部140は、クラブおよび関節検出部110、ゴルフスイング情報推定部120および通信部130間のデータの流れを制御する機能を遂行することができる。すなわち、本発明の一実施例に係る制御部140は、デバイス100の外部からの/へのデータの流れまたはデバイス100の各構成要素間のデータの流れを制御することによって、クラブおよび関節検出部110、ゴルフスイング情報推定部120および通信部130でそれぞれ固有機能を遂行するように制御することができる。
【0081】
以上で説明された本発明に係る実施例は、多様なコンピュータ構成要素を通じて実行され得るプログラム命令語の形態で具現されてコンピュータ読み取り可能な記録媒体に記録され得る。前記コンピュータ読み取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記コンピュータ読み取り可能な記録媒体に記録されるプログラム命令語は、本発明のために特別に設計されて構成されたものであるかコンピュータソフトウェア分野の当業者に公知になっている使用可能なものであり得る。コンピュータ読み取り可能な記録媒体の例には、ハードディスク、フロッピーディスクおよび磁気テープのような磁気媒体、CD-ROMおよびDVDのような光記録媒体、フロプティカルディスク(floptical disk)のような磁気-光媒体(magneto-optical medium)、およびROM、RAM、フラッシュメモリなどのような、プログラム命令語を保存し実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるような機械語コードだけでなくインタープリタなどを使ってコンピュータによって実行され得る高級言語コードも含まれる。ハードウェア装置は本発明に係る処理を遂行するために一つ以上のソフトウェアモジュールに変更され得、その逆も同じである。
【0082】
以上、本発明が具体的な構成要素などのような特定事項と限定された実施例および図面によって説明されたが、これは本発明のより全般的な理解を助けるために提供されたものに過ぎず、本発明は前記実施例に限定されるものではなく、本発明が属する技術分野で通常の知識を有する者であればこのような記載から多様な修正と変更を図ることができる。
【0083】
したがって、本発明の思想は前述された実施例に限定されて定められてはならず、後述する特許請求の範囲だけでなくこの特許請求の範囲と均等なまたはこれから等価的に変更されたすべての範囲は本発明の思想の範疇に属すると言える。
【符号の説明】
【0084】
100:デバイス
110:クラブおよび関節検出部
120:ゴルフスイング情報推定部
130:通信部
140:制御部
【国際調査報告】