特許6076908 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ サムスン　エレクトロニクス　カンパニー　リミテッドの特許一覧

特許6076908ＣＰＵとＧＰＵを使用する異種システムにおいて仮想化を用いたアプリケーションのコンパイル及び実行方法、及び装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6076908

(24)【登録日】2017年1月20日

(45)【発行日】2017年2月8日

(54)【発明の名称】ＣＰＵとＧＰＵを使用する異種システムにおいて仮想化を用いたアプリケーションのコンパイル及び実行方法、及び装置

(51)【国際特許分類】

G06F 9/45 20060101AFI20170130BHJP

【ＦＩ】

G06F9/44 322L

【請求項の数】14

【全頁数】17

(21)【出願番号】特願2013-531479(P2013-531479)

(86)(22)【出願日】2011年9月26日

(65)【公表番号】特表2013-543616(P2013-543616A)

(43)【公表日】2013年12月5日

(86)【国際出願番号】KR2011007049

(87)【国際公開番号】WO2012044016

(87)【国際公開日】20120405

【審査請求日】2014年9月26日

(31)【優先権主張番号】10-2010-0093327

(32)【優先日】2010年9月27日

(33)【優先権主張国】KR

(73)【特許権者】

【識別番号】503447036

【氏名又は名称】サムスンエレクトロニクスカンパニーリミテッド

(74)【代理人】

【識別番号】100110364

【弁理士】

【氏名又は名称】実広信哉

(72)【発明者】

【氏名】キョン・フン・キム

(72)【発明者】

【氏名】イン・チュン・ヨ

(72)【発明者】

【氏名】スン・ウク・イ

(72)【発明者】

【氏名】ジュン・バイク・キム

(72)【発明者】

【氏名】イル・ホ・イ

(72)【発明者】

【氏名】ジョン・イグ・ソン

【審査官】長谷川篤男

(56)【参考文献】

【文献】特開２００８−２７６７４０（ＪＰ，Ａ）

【文献】米国特許出願公開第２００８／０１８４２１１（ＵＳ，Ａ１）

【文献】国際公開第２００９／０２９６９８（ＷＯ，Ａ１）

【文献】特開平１０−３２０２１４（ＪＰ，Ａ）

【文献】 The CUDA Compiler Driver NVCC，米国，NVIDIA Corporation，２００８年４月２４日，pp.1-28，ＵＲＬ，http://www.nvidia.com/object/io_1213955090354.html

【文献】岡田賢治，ＣＵＤＡ高速ＧＰＵプログラミング入門，株式会社秀和システム，２０１０年３月２５日，第1版，pp.34-37

【文献】 John R. Levine，Ｌｉｎｋｅｒｓ＆Ｌｏａｄｅｒｓ，株式会社オーム社，２００１年９月２５日，第1版，pp.59-62

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ９／４５

(57)【特許請求の範囲】

【請求項1】

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）とＧＰＵ（ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を使用するシステムで、アプリケーションのコンパイル及び実行方法であって、
ＣＰＵソースコードとＧＰＵソースコードを含むアプリケーションに対するコンパイル遂行要請を受信する段階と、
前記アプリケーションのコンパイルの時、前記ＣＰＵソースコードをＣＰＵ機械語にコンパイルし、前記ＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルして、前記ＣＰＵ機械語と前記ＧＰＵ仮想命令語を含む実行ファイルを生成する段階と、
前記実行ファイルに対する実行要請を受信した時は、前記ＧＰＵ仮想命令語をＧＰＵ機械語に変換（Ｔｒａｎｓｌａｔｉｏｎ）して前記実行ファイルを実行する段階を含み、
前記実行段階は、前記システムのオペレーティングシステム（ＯＳ）が前記実行ファイルを実行する段階と、
前記オペレーティングシステムが例外（ｅｘｃｅｐｔｉｏｎ）発生を感知したとき、少なくとも一つの仮想セクションを識別する段階と、
前記仮想セクションを識別する場合、前記ＧＰＵ仮想命令語を前記ＧＰＵ機械語に変換し、前記変換されたＧＰＵ機械語を前記ＧＰＵを介し、実行する段階を含み、
前記実行ファイルは、前記ＣＰＵ実行時間及び前記ＧＰＵ実行時間に関する情報を含む仮想セクションを含む
ことを特徴とするアプリケーションのコンパイル及び実行方法。

【請求項2】

前記実行ファイルを生成する段階は、
前記ＣＰＵ機械語と、前記ＧＰＵ仮想命令語を含む少なくとも１つの仮想セクションを含む前記実行ファイルを生成する
ことを特徴とする、請求項１に記載のアプリケーションのコンパイル及び実行方法。

【請求項3】

前記仮想セクションは、
前記仮想セクションを識別するウォーターマークを含む仮想セクションヘッダーと、前記ＣＰＵ機械語と、前記ＧＰＵ仮想命令語を含む
ことを特徴とする、請求項２に記載のアプリケーションのコンパイル及び実行方法。

【請求項4】

前記実行する段階は、
前記システムのオペレーティングシステム（ＯＳ）が前記実行ファイルを実行する段階と、
前記オペレーティングシステムが例外（ｅｘｃｅｐｔｉｏｎ）発生感知の時、システム制御権をハイブリッド仮想化ブロックに伝達する段階と、
前記ハイブリッド仮想化ブロックが前記仮想セクションの識別の時、前記ＧＰＵ仮想命令語を前記ＧＰＵ機械語に変換し、前記システム制御権を前記オペレーティングシステムに伝達する段階と、
前記オペレーティングシステムが前記変換されたＧＰＵ機械語を前記ＧＰＵを通して実行する段階をさらに含む
ことを特徴とする、請求項２に記載のアプリケーションのコンパイル及び実行方法。

【請求項5】

前記ハイブリッド仮想化ブロックはアプリケーション階層とハードウェア階層の間に位置する仮想化階層に位置する
ことを特徴とする、請求項４に記載のアプリケーションのコンパイル及び実行方法。

【請求項6】

前記実行する段階の以後に、
前記変換されたＧＰＵ機械語を前記実行ファイルの内部に位置させる段階と、
前記ＧＰＵ仮想命令語の実行の時、前記実行ファイルの内部に位置する変換されたＧＰＵ機械語を実行する段階をさらに含む
ことを特徴とする、請求項１に記載のアプリケーションのコンパイル及び実行方法。

【請求項7】

前記ＧＰＵ仮想命令語と前記ＧＰＵ機械語は、共に機械語レベル（ＭａｃｈｉｎｅＣｏｄｅＬｅｖｅｌ）である
ことを特徴とする、請求項１に記載のアプリケーションのコンパイル及び実行方法。

【請求項8】

ＣＰＵソースコードとＧＰＵソースコードを含むアプリケーションのコンパイル及び実行装置において、
ＣＰＵとＧＰＵを含むハードウェアと、
前記ＣＰＵソースコードをＣＰＵ機械語にコンパイルし、前記ＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルして、前記ＣＰＵ機械語と前記ＧＰＵ仮想命令語を含む実行ファイルを生成するコンパイラーと、
前記ＧＰＵ仮想命令語をＧＰＵ機械語に変換（Ｔｒａｎｓｌａｔｉｏｎ）し、実行するハイブリッド仮想化ブロックと、
前記実行ファイルを実行し、例外（ｅｘｃｅｐｔｉｏｎ）発生を感知した時、システム制御権を前記ハイブリッド仮想化ブロックに伝達するオペレーティングシステム（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ、ＯＳ）を含み、
前記実行ファイルは、前記ＣＰＵ実行時間及び前記ＧＰＵ実行時間に関する情報を含む仮想セクションを含む
ことを特徴とする、アプリケーションのコンパイル及び実行装置。

【請求項9】

前記ハイブリッド仮想化ブロックはアプリケーション階層とハードウェア階層の間に位置する
ことを特徴とする、請求項８に記載のアプリケーションのコンパイル及び実行装置。

【請求項10】

前記コンパイラーは、
前記ＣＰＵ機械語と、前記ＧＰＵ仮想命令語を含む少なくとも１つの仮想セクションを含む前記実行ファイルを生成する
ことを特徴とする、請求項８に記載のアプリケーションのコンパイル及び実行装置。

【請求項11】

前記仮想セクションは、
前記仮想セクションを識別するウォーターマークを含む仮想セクションヘッダーと、前記ＣＰＵ機械語と、前記ＧＰＵ仮想命令語を含む
ことを特徴とする、請求項１０に記載のアプリケーションのコンパイル及び実行装置。

【請求項12】

前記ハイブリッド仮想化ブロックは、
前記仮想セクションの識別の時、前記ＧＰＵ仮想命令語を前記ＧＰＵ機械語に変換し、前記システム制御権を前記オペレーティングシステムに伝達する
ことを特徴とする、請求項８に記載のアプリケーションのコンパイル及び実行装置。

【請求項13】

前記オペレーティングシステムは、
前記変換されたＧＰＵ機械語を前記実行ファイルの内部に位置させ、前記ＧＰＵ仮想命令語の実行の時、前記実行ファイルの内部に位置する変換されたＧＰＵ機械語を実行する
ことを特徴とする、請求項８に記載のアプリケーションのコンパイル及び実行装置。

【請求項14】

前記ＧＰＵ仮想命令語と前記ＧＰＵ機械語は共に機械語レベル（ＭａｃｈｉｎｅＣｏｄｅＬｅｖｅｌ）である
ことを特徴とする、請求項８に記載のアプリケーションのコンパイル及び実行装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ＣＰＵ(ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)とＧＰＵ(ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)を融合して使用する異種システムにおいて仮想化(Ｖｉｒｔｕａｌｉｚａｔｉｏｎ)を用いたアプリケーションのコンパイル及び実行方法、及び装置に関するものである。より具体的に本発明はアプリケーションに含まれたソースコードコンパイルの時、上記ソースコードに含まれたＧＰＵ(ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)ソースコードをＧＰＵ仮想命令語(ｉｎｓｔｒｕｃｔｉｏｎ)にコンパイルし、実行ファイル実行の時、上記コンパイルされたＧＰＵ仮想命令語をＧＰＵ機械語(ＧＰＵＭａｃｈｉｎｅＣｏｄｅ)に直接変換するアプリケーションのコンパイル及び実行に対する方法、及び装置に関するものである。

【背景技術】

【0002】

最近仮想化(Ｖｉｒｔｕａｌｉｚａｔｉｏｎ)技法を使用して異機種のオペレーティングシステム(Ｏｐｅｒａｔｉｎｇｓｙｓｔｅｍ、ＯＳ)を１つのシステムで動作させたり保安ソフトウェアと非保安ソフトウェアを区分してシステムクラッキングに対する保安機能を付加する方法が提案されている。

【0003】

これに関連してグラフィック処理装置(ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＧＰＵ)がコンピューター使用者の日常に変化をもたらしている。ＧＰＵはグラフィック演算を遂行する装置として映像コンテンツ利用量が少なかった過去にはコンピューター核心部品である中央処理装置(ＣＰＵ)の過負荷を防止する補助部品程度に認識された。

【0004】

しかし、最近には高解像度(ＨＤ)映画やゲーム、３Ｄ映像物等の需要が高くなりながらＧＰＵの重要性が大きくなっている。また、ＧＰＵはグラフィック処理のみならずＣＰＵの代わりを高用量演算を担当する装置としても脚光を浴びている。

【0005】

このようにＧＰＵが重要な役目を遂行しながらより效率的にＧＰＵを活用する方法に対する論議が必要な実情である。

【発明の概要】

【発明が解決しようとする課題】

【0006】

本発明は、上記のような必要性を満足させるために案出されたものとして、ＣＰＵとＧＰＵを融合して使用する異種システムにおいて仮想化を用いたアプリケーションのコンパイル及び実行方法、及び装置を提供することを目的とする。

【0007】

より具体的に本発明はアプリケーションに含まれたソースコードコンパイルの時、上記ソースコードに含まれたＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルし、実行ファイル実行の時、上記コンパイルされたＧＰＵ仮想命令語をＧＰＵ機械語に直接変換してＣＰＵとＧＰＵを效率的に使用することができる方法及び装置を提供することを目的とする。

【課題を解決するための手段】

【0008】

上記のような問題点を解決するための本発明のＣＰＵ(ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)とＧＰＵ(ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)を使用するシステムでアプリケーションのコンパイル及び実行方法は、ＣＰＵソースコードとＧＰＵソースコードを含むアプリケーションに対するコンパイル遂行要請を受信する段階、上記アプリケーションのコンパイルの時、上記ＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルして実行ファイルを生成する段階及び上記実行ファイルに対する実行要請受信の時、上記ＧＰＵ仮想命令語をＧＰＵ機械語に変換(Ｔｒａｎｓｌａｔｉｏｎ)して実行する段階を含むことを特徴とする。

【0009】

また、上記のような問題点を解決するための本発明のアプリケーションのコンパイル及び実行装置はＣＰＵ(ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)とＧＰＵ(ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)を含むハードウェア、ＣＰＵソースコードとＧＰＵソースコードを含むアプリケーション、上記アプリケーションに対するコンパイル遂行要請受信の時、上記ＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルして実行ファイルを生成するコンパイラー、及びアプリケーション階層とハードウェア階層の間に位置し、上記実行ファイルに対する実行要請受信の時、上記ＧＰＵ仮想命令語をＧＰＵ機械語に変換(Ｔｒａｎｓｌａｔｉｏｎ)して実行するハイブリッド仮想化ブロックを含むことを特徴とする。

【0010】

また、本発明の他の実施例によるアプリケーションのコンパイル及び実行装置はＣＰＵ(ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)とＧＰＵ(ＧｒａｐｈｉｃＰｒｏｃｅｓｓｉｎｇＵｎｉｔ)を含むハードウェア、ＣＰＵソースコードとＧＰＵソースコードを含むアプリケーション、上記アプリケーションに対するコンパイル遂行要請受信の時、上記ＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルして実行ファイルを生成するコンパイラー及び上記実行ファイルに対する実行要請受信の時、上記ＧＰＵ仮想命令語をＧＰＵ機械語に変換(ＴｒａｎＳｌａｔｉｏｎ)して実行するオペレーティングシステム(ＯｐｅｒａｔｉｎｇＳｙＳｔｅｍ、ＯＳ)を含むことを特徴とする。

【0011】

本発明によれば、アプリケーションに含まれたソースコードコンパイルの時、上記ソースコードに含まれたＧＰＵソースコードをＧＰＵ仮想命令語にコンパイルし、実行ファイル実行の時、上記コンパイルされたＧＰＵ仮想命令語をＧＰＵ機械語に直接変換(Ｔｒａｎｓｌａｔｉｏｎ)する。これによってＣＰＵとＧＰＵを同時に效率的に使用することができ、ＧＰＵ使用のためのリアルタイムコンパイル方式の問題点を補ってＧＰＵ実行效率を向上させることができる。また、本発明によれば、ＧＰＵソースコードが外部で露出されないので保安性が向上された。そして本発明で提案するＧＰＵ仮想命令語はハードウェアに中立的な命令語としてＧＰＵハードウェアを製造する製造社にかかわらず独立的に動作することができる。

【図面の簡単な説明】

【0012】

【図1】システムプログラム(ＯＳ)でライブラリを提供してＧＰＵを使用する方法に対するシステム構造を示す図面である。

【図2】ＧＰＵを使用するコードを応用プログラムに含ませてプログラム実行時間(ｒｕｎｔｉｍｅ)にＧＰＵで実行する方法を使用するシステム構造を示す図面である。

【図3】「ＯｐｅｎＣＬ」の応用プログラム実行過程を示すフローチャートである。

【図4】「ＯｐｅｎＣＬ」方式を適用したコード例題を示す図面である。

【図5】「ＯｐｅｎＣＬ」過程を遂行することができる実行ファイル(ＢｉｎａｒｙＩｍａｇｅ)構造を示す図面である。

【図6】「ＯｐｅｎＣＬ」と本発明によるアプリケーションの実行方法の差異点を比較する図面である。

【図7】本発明の実施例によってＣＰＵとＧＰＵを使用する異種コンピュータシステム構造を示す図面である。

【図8】本発明の実施例によるハイブリッド実行ファイル(ＨｙｂｒｉｄＢｉｎａｒｙＩｍａｇｅ)の構造を示す図面である。

【図9】本発明の実施例による、アプリケーションのコンパイル過程を示すフローチャートである。

【図10】本発明の実施例によって、仮想化階層(ＶｉｒｔｕａｌｉｚａｔｉｏｎＬａｙｅｒ)のハイブリッド仮想化ブロック７３０がハイブリッド実行ファイルを実行する過程を示すフローチャートである。

【図11】ＧＰＵ機械語が挿入されたハイブリッド実行ファイルの構造を示す図面である。

【図12】本発明の実施例によってさらにシステムＯＳがハイブリッド実行ファイルを実行する過程を示すフローチャートである。

【図13】本発明の第１実施例によるシステム構造を示す図面である。

【図14】本発明の第２実施例によるシステム構造を示す図面である。

【図15】本発明の第２実施例によるシステム構造を示す図面である

【発明を実施するための形態】

【0013】

以下で述べるアプリケーションとは、コンパイルされる以前の原始コード又はソースコード(ＳｏｕｒｃｅＣｏｄｅ)を含む応用プログラムを意味する。この場合、上記ソースコードはＣＰＵ演算を実行させるためのＣＰＵソースコード又はＧＰＵ演算を実行させるためのＧＰＵソースコードを含むことができる。

【0014】

また、本発明の実行ファイルとは、コンパイラー(Ｃｏｍｐｉｌｅｒ)によって上記アプリケーションがコンパイルされ生成されたファイルを意味する。

【0015】

以下、添付された図面を参照して本発明の好ましい実施例を詳しく説明する。この時、添付された図面で同一の構成要素はできるだけ同一の番号を付けることに留意すべきである。なお、本発明の要旨を濁すことができる公知機能及び構成に対する詳細な説明は省略であろう。

【0016】

アプリケーション(又は、応用プログラム)でＧＰＵを使用する方法には２つの方法が存在することができる。まず、第１の方法はＯＳのようなシステムプログラムでライブラリを提供し、上記ライブラリをアプリケーションが呼出して使用する方法である。そして第２の方法はＧＰＵを使用するためのコードをアプリケーションに含ませてプログラム実行時間(ｒｕｎｔｉｍｅ)にＧＰＵで直接実行する方法である。

【0017】

図１は、システムプログラム(ＯＳ)でライブラリを提供してＧＰＵを使用する方法に対するシステム構造を示す図面である。

【0018】

図１によるシステムは大きく、実際応用プログラムを含むアプリケーション階層(ＡｐｐｌｉｃａｔｉｏｎＬａｙｅｒ)、ＣＰＵ又はＧＰＵのような物理的なプロセッシングユニットを含むハードウェア階層(ＨａｒｄｗａｒｅＬａｙｅｒ)、上記アプリケーション階層とハードウェア階層の間に位置するミドルウェア階層(ＭｉｄｄｌｅｗａｒｅＬａｙｅｒ)、及びオペレーティングシステム(Ｏｐｅｒａｔｉｎｇｓｙｓｔｅｍ、ＯＳ)に区分されることができる。このようなシステムによればＯＳでＧＰＵライブラリを提供し、アプリケーションが上記ＧＰＵライブラリを直接呼出して当該の機能を遂行する。

【0019】

上記図１と同様の方法を遂行する代表的なシステムとして「ＯｐｅｎＧＬ」を例示することができる。「ＯｐｅｎＧＬ」は応用プログラムが３Ｄグラフィックを使用するためにＯｐｅｎＧＬＡＰＩ(ＡｐｐｌｉｃａｔｉｏｎＰｒｏｇｒａｍｍｉｎｇＩｎｔｅｒｆａｃｅ、関数)を呼出する方式でＧＰＵを使用する。ＯｐｅｎＧＬＡＰＩは標準に指定されており、応用プログラムはこの標準によって開発される。代表的な例はＯｐｅｎＧＬを用いたゲームプログラムを挙げることができる。しかし、このような方式は標準で提供された機能だけ使用することができるという短所がある。

【0020】

例えば、顔面認識演算のためにＧＰＵを使用しようとすれば顔面認識に対するＡＰＩが標準に指定されており、これが当該のシステムにライブラリに具現されていなければならない。もし、顔認識演算のためのライブラリが具現されていない場合、プログラム開発者はこのような演算を遂行することができないという問題点がある。

【0021】

一方、図２はＧＰＵを使用するコードを応用プログラムに含ませてプログラム実行時間(ｒｕｎｔｉｍｅ)にＧＰＵで実行する方法を使用するシステム構造を示す図面である。

【0022】

同様に図２によるシステムは大きく、実際応用プログラムを含むアプリケーション階層、ＣＰＵ又はＧＰＵのような物理的なプロセッシングユニットを含むハードウェア階層、上記アプリケーション階層とハードウェア階層の間に位置するミドルウェア階層、システムを運営するオペレーティングシステムに区分されることができる。ただ、図２のシステムと図１のシステムとの相異点はＧＰＵを動作させるためのＧＰＵコードがアプリケーションに直接挿入されるということである。

【0023】

上記図２と同様の方法を使用する代表的なシステムとして「ＯｐｅｎＧＬ」を挙げることができる。「ＯｐｅｎＧＬ」に対する具体的な説明は下記の図３を参考して説明する。

【0024】

図３は「ＯｐｅｎＧＬ」の応用プログラム実行過程を示すフローチャートである。

【0025】

図３に示すように、応用プログラム、すなわちアプリケーションがＳ３０５段階で実行される。ここで実行とはアプリケーションがコンパイル(Ｃｏｍｐｉｌｅ)されて生成された実行ファイルを実行(ｒｕｎ)する意味として使用されることができる。

【0026】

アプリケーション実行後、Ｓ３１０段階で実行ファイルにあるＣＰＵ機械語(ＣＰＵＭａｃｈｉｎｅＣｏｄｅ)が実行される。そして実行ファイルの実行が進行されながら、ＧＰＵを使用すべき場合はＳ３１５段階のように、明示的にＧＰＵを使用するためのソースコード(ＳｏｕｒｃｅＣｏｄｅ)レベルのコードをコンパイルするようになる。そしてＳ３２０段階で、上記コンパイル結果、生成されたＧＰＵ機械語(ＭａｃｈｉｎｅＣｏｄｅ)を実行する。そしてＧＰＵ機械語の実行が完了されればＳ３２５段階で、さらにＣＰＵ機械語実行を遂行する。

【0027】

一方、Ｓ３１５段階に示すようにＧＰＵソースコードは実行時間(ｒｕｎｔｉｍｅ)にコンパイルするようになり、具体的な過程は図３の右側に示すフローチャートのようである。

【0028】

すなわち、Ｓ３３０段階でＧＰＵソースコードコンパイルが開示されれば、Ｓ３３５段階の語彙分析段階(ｌｅｘｉｃａｌ-ｓｙｎｔａｘａｎａｌｙｓｉｓ)、Ｓ３４０段階の先処理段階(ＰｒｅｐｒｏｃｅＳｓｉｎｇ)、Ｓ３４５段階の構文分析段階(ＳｙｎｔａｘＡｎａｌｙｓｉｓ)、Ｓ３５０段階の分析段階(Ａｎａｌｙｓｉｓ)、Ｓ３５５段階の最適化段階(Ｏｐｔｉｍｉｚａｔｉｏｎ)、Ｓ３６０段階のコード生成段階(ＣｏｄｅＧｅｎｅｒａｔｉｏｎ)を経てＳ３６５段階でＧＰＵ機械語が生成される。

【0029】

上記方法の長所はＧＰＵ種類(製造社等)に構わずに、すべてのＧＰＵに対して当該のＧＰＵソースコードを実行することができるということである。すなわち、この場合には共通的なＧＰＵソースコードを配布して実行時間(ｒｕｎｔｉｍｅ)にコンパイルされて特定ＧＰＵ機械語で動作するようになる。

【0030】

以下では「ＯｐｅｎＧＬ」方式を適用したコード例題を通じて「ＯｐｅｎＧＬ」を説明する。

【0031】

図４は「ＯｐｅｎＧＬ」方式を適用したコード例題を示す図面である。

【0032】

上記図４に示すアプリケーションはＣＰＵとＧＰＵで動作するためのコードを同時に有するようになる。この場合、「ｍａｉｎ」で表示されるコードが一般的にＣＰＵで動作するコードであり、「ＫｅｒｎｅｌＳｏｕｒｃｅ」に表示されるコードがＧＰＵで動作するコードである。

【0033】

図４に示すコードをコンパイルするようになるとＣＰＵコード部分は機械語(ＭａｃｈｉｎｅＣｏｄｅ)に変換される。しかし、ＧＰＵコード部分はコンパイルされなくそのまま実行ファイルに文字列に挿入されたり外部ソースファイルに貯蔵される。上記のように、ＧＰＵソースコードは当該の応用プログラムが実行される際、コンパイルされ実行される。

【0034】

このように、「ＯｐｅｎＧＬ」過程を遂行することができる実行ファイル(ＢｉｎａｒｙＩｍａｇｅ)構造が図５に示す。

【0035】

図２のシステム、すなわちＧＰＵを使用するコードを応用プログラムに含ませてプログラム実行時間(ｒｕｎｔｉｍｅ)にＧＰＵで実行するシステムで使用する実行ファイルはヘッダーのようなメタデータ(図示せず)、ＣＰＵ機械語及びＧＰＵソースコードを含む。この場合、上記ＧＰＵソースコードは実行ファイルのデータ領域に挿入５１０されたり、又は実行ファイルと独立的な外部スクリプトソースファイル形式で参照５２０されることができる。

【0036】

上記では応用プログラムでＧＰＵを使用する２つの方法に対して説明した。

【0037】

ところが、最近ＧＰＵ機能が重要な役目を遂行することによって標準化されたＡＰＩだけ使用してＧＰＵを使用する上記の第１方法から脱して自由にＧＰＵを使用する方法に対する重要性が浮き彫りにされている。これによって、本発明ではアプリケーションがＧＰＵを活用する方法に対して提案しようとする。

【0038】

より具体的に説明すれば、「ＯｐｅｎＧＬ」のような技術の問題点は実行時間(ｒｕｎｔｉｍｅ)にＧＰＵソースコードに対するコンパイルを遂行するから、実行速度が顕著に落ちるということである。コンパイル作業は中間過程が多くて複雑で計算パワー(ＣｏｍｐｕｔｉｎｇＰｏｗｅｒ)が相対的に不足なエンベデッドシステム(ｅｍｂｅｄｄｅｄ)には致命的な問題点として作用することができる。

【0039】

ここで、ＧＰＵソースコードに対するコンパイル過程を単純化すれば、最適化されたＧＰＵ機械語を生成し難く、反対にＧＰＵ機械語最適化のためにはコンパイル演算量が増加するようになる矛盾した状況が発生する。また、「ＯｐｅｎＧＬ」のような方式はＧＰＵソースコードが図５に示すように、実行ファイルのデータ領域に挿入されたり又は外部スクリプトファイル形式で存在するようになる。したがって、ＧＰＵソースコードが外部にそのまま露出して保安に脆弱であるという問題がある。

【0040】

本発明は上記のような問題点を解決し、ＣＰＵ及びＧＰＵを效率的に使用することができる方法及び装置を提供する。すなわち、本発明は時間がたくさん所要されて複雑なＧＰＵコンパイル過程を最小化し、保安に問題になったＧＰＵソースコード露出を制御し、特定ＧＰＵだけでなくすべての種類のＧＰＵで実行可能なコンパイルされた仮想のＧＰＵ機械語を提供することをその目的とする。

【0041】

これを解決するため、本発明ではＧＰＵ動作のためにソースコードレベル(ＳｏｕｒｃｅＣｏｄｅＬｅｖｅｌ)ではない命令語レベル(ＩｎｓｔｒｕｃｔｉｏｎＬｅｖｅｌ)(又は、機械語レベル、ＭａｃｈｉｎｅＣｏｄｅＬｅｖｅｌ)にコンパイルされたコードを使用する。本発明ではＧＰＵソースコードが命令語レベルにコンパイルされたことをＧＰＵ仮想命令語(ＧＰＵＶｉｒｔｕａｌＩｎｓｔｒｕｃｔｉｏｎ)と名付ける事にする。上記ＧＰＵ仮想命令語は実際ＧＰＵハードウェアで動作する機械語ではない仮想の命令語である。上記ＧＰＵ仮想命令語は実行時間(ｒｕｎｔｉｍｅ)にＧＰＵ機械語(ＧＰＵＭａｃｈｉｎｅＣｏｄｅ)でリアルタイム変換(ＢｉｎａｒｙＴｒａｎＳｌａｔｉｏｎ)されて実行される。また、上記ＧＰＵ仮想命令語は特定ＧＰＵハードウェアでばかり動作するのではなく、すべての種類のＧＰＵハードウェアで動作することができる。

【0042】

本発明によるＧＰＵ仮想命令語はコンパイルの時、仮想の命令語にコンパイルされるから実行時間(ｒｕｎｔｉｍｅ)に遂行速度が早く保安にも強いという長所を有する。

【0043】

図６は「ＯｐｅｎＧＬ」と本発明によるアプリケーションの実行方法の差異を比較する図面である。

【0044】

上記のように「ＯｐｅｎＧＬ」によればＧＰＵソースコードはアプリケーションのコンパイルの時、別にコンパイルされない。代わり、実行ファイル(ＢｉｎａｒｙＩｍａｇｅ)の実行時間(ｒｕｎｔｉｍｅ)の間、ＧＰＵソースコードが語彙分析段階、先-処理段階、構文分析段階、最適化段階、コード生成段階等を経てコンパイルされ、上記コンパイル結果生成されるＧＰＵ機械語が実行された。

【0045】

しかし、本発明ではアプリケーションのコンパイルの時、ＧＰＵソースコードは命令語レベル(ｉｎｓｔｒｕｃｔｉｏｎｌｅｖｅｌ)であるＧＰＵ仮想命令語でコンパイルされる。そして実行ファイルの実行時間(ｒｕｎｔｉｍｅ)の間、上記ＧＰＵ仮想命令語がＧＰＵ機械語に変換(Ｔｒａｎｓｌａｔｉｏｎ)され、上記変換されたＧＰＵ機械語が実行される。

【0046】

すなわち、ＧＰＵソースコードが実行すべき時点で、従来方法はＧＰＵソースコードからコンパイルする過程を経なければならないが、本発明の実施例によれば予めコンパイルされたＧＰＵ仮想命令語が単純にＧＰＵ機械語に変換される過程だけ進行する。

【0047】

以下では本発明の実施例によるシステム構造及び動作手順を添付された図面を参考して詳細に説明する。

【0048】

図７は本発明の実施例によってＣＰＵとＧＰＵを使用する異種コンピュータシステム構造を示す図面である。図７に示すように、本発明の異種コンピュータシステムはアプリケーション７１０、コンパイラー７２０、ハイブリッド仮想化ブロック７３０を含むことができる。

【0049】

アプリケーション７１０はアプリケーション階層に位置し、ＣＰＵソースコードとＧＰＵソースコードを共に含む応用プログラムである。このような応用プログラムの例題を図 4に示した事がある。

【0050】

コンパイラー(Ｃｏｍｐｉｌｅｒ)７２０はアプリケーション７１０に含まれたＣＰＵソースコードとＧＰＵソースコードを機械語(ＭａｃｈｉｎｅＣｏｄｅ)にコンパイルする。この場合、コンパイラー７２０はＣＰＵソースコードの場合、上記ＣＰＵソースコードをＣＰＵ機械語にすぐコンパイルするが、ＧＰＵソースコードの場合には、上記ＧＰＵソースコードを本発明で提案するＧＰＵ仮想命令語(ＧＰＵＶｉｒｔｕａｌＩｎｓｔｒｕｃｔｉｏｎ)にコンパイルする。そして上記コンパイラー７２０は上記ＣＰＵ機械語及びＧＰＵ仮想命令語を含む実行ファイルを生成する。以下では上記のような過程によって生成された実行ファイルをハイブリッド実行ファイル(ＨｙｂｒｉｄＢｉｎａｒｙＩｍａｇｅ)だと名付けることにする。上記ハイブリッド実行ファイルに対する具体的な構造は図8で後述するようにする。

【0051】

ハイブリッド仮想化(ＨｙｂｒｉｄＶｉｒｔｕａｌｉｚａｔｉｏｎ)ブロック７３０はアプリケーション階層(ＡｐｐｌｉｃａｔｉｏｎＬａｙｅｒ)とハードウェア階層(ＨａｒｄｗａｒｅＬａｙｅｒ)の間の仮想化階層(ＶｉｒｔｕａｌｉｚａｔｉｏｎＬａｙｅｒ)に位置して実行時間(ｒｕｎｔｉｍｅ)にＧＰＵ仮想命令語を感知し、感知の時、上記ＧＰＵ仮想命令語をＧＰＵ機械語に変換(ＴｒａｎＳｌａｔｉｏｎ)する。だけでなく、上記ハイブリッド仮想化ブロック７３０はアプリケーションの実行全般過程を調律する。

【0052】

オペレーティングシステム７４０は少なくとも１つ以上の互いに異なる種類のオペレーティングシステムを含むことができ、システムの全般的な動作を制御する。

【0053】

図８は本発明の実施例によるハイブリッド実行ファイル(ＨｙｂｒｉｄＢｉｎａｒｙＩｍａｇｅ)の構造を示す図面である。ハイブリッド実行ファイルは従来システムとの互換性のために実行イメージ(ＢｉｎａｒｙＩｍａｇｅ)の形式による。

【0054】

図８に示すように、ハイブリッド実行ファイルはＣＰＵ機械語(ＣＰＵＭａｃｈｉｎｅＣｏｄｅ)と、ＧＰＵ仮想命令語を含む仮想セクション(ＶｉｒｔｕａｌＳｅｃｔｉｏｎ)８１０を含むことができる。ここでＧＰＵ仮想セクションはさらに仮想セクションヘッダー８２０、ＣＰＵ機械語８３０、ＧＰＵ仮想命令語８４０を含むことができる。

【0055】

上記仮想セクションヘッダー８２０は当該のセクションが仮想セクションなのかを識別するウォーターマーク(ｗａｔｅｒ-ｍａｒｋ)と、ＣＰＵ又はＧＰＵ実行時間などに対する動作情報を含むことができる。

【0056】

ＣＰＵ機械語領域８３０は当該のシステムにＧＰＵがなかったり又はＧＰＵが異なる作業を遂行しておりＣＰＵで動作することが正しいことと判断される際、実行するＣＰＵ機械語を含む。

【0057】

一方、ＧＰＵ仮想命令語領域８４０はＧＰＵで動作する命令語を含む。上記ＧＰＵ仮想命令語領域８４０は仮想命令語ヘッダー８５０と仮想命令語コード８６０を含むことができる。上記仮想命令語ヘッダー８５０はＧＰＵ演算を遂行するためのデータが入力又は出力されるメモリーのアドレス情報、推薦されるプロセッシング要素(ＰｒｏｃｅｓｓｉｎｇＥｌｅｍｅｎｔ、ＰＥ)の個数情報などを含むことができる。ＧＰＵ仮想命令語コードはＧＰＵで実行されるコードの仮想化された情報を含む。すなわち、上記ＧＰＵ仮想命令語コードは実質的に実行時間(ｒｕｎｔｉｍｅ)にＧＰＵ機械語に変換されるコードである。

【0058】

図９は本発明の実施例による、アプリケーションのコンパイル過程を示すフローチャートである。

【0059】

まず、Ｓ９１０段階で、ＣＰＵソースコードとＧＰＵソースコードを含むアプリケーションが生成されたことを仮定する。そして上記アプリケーションに対するコンパイルが要請される場合、コンパイラー７２０はＣＰＵソースコードとＧＰＵソースコードを区分してコンパイルする。

【0060】

より具体的に、コンパイラーはＣＰＵソースコード検出の時、Ｓ９２０段階でＣＰＵソースコードをコンパイルし、Ｓ９３０段階でＣＰＵで動作することができるＣＰＵ機械語(ＣＰＵＭａｃｈｉｎｅＣｏｄｅ)を生成する。一方、コンパイラーはＧＰＵソースコード検出の時、Ｓ９４０段階でＧＰＵソースコードをコンパイルし、Ｓ９５０段階で仮想のＧＰＵで動作することができるＧＰＵ仮想命令語(ＧＰＵＶｉｒｔｕａｌＩｎｓｔｒｕｃｔｉｏｎ)を生成する。上記ＧＰＵ仮想命令語に対する具体的な構造は図8に示されている

【0061】

そしてコンパイラーはＳ９６０段階で、上記生成されたＣＰＵ機械語とＧＰＵ仮想命令語をリンクさせ、Ｓ９７０段階でハイブリッド実行ファイル(ＨｙｂｒｉｄＢｉｎａｒｙＩｍａｇｅ)を生成する。

【0062】

上記のように、ハイブリッド実行ファイルはＣＰＵ機械語と仮想セクションを含む。上記ハイブリッド実行ファイルが実行される際、ＣＰＵ部分とＧＰＵ部分が仮想化階層(ＶｉｒｔｕａｌｉｚａｔｉｏｎＬａｙｅｒ)の調律によってそれぞれ実行されるところ、これに対しては下記の図１０を参考して説明する。

【0063】

図１０は本発明の実施例によって、仮想化階層(ＶｉｒｔｕａｌｉｚａｔｉｏｎＬａｙｅｒ)のハイブリッド仮想化ブロック７３０がハイブリッド実行ファイルを実行する過程を示すフローチャートである。

【0064】

上記の図１０ではシステムの階層的分類の時、本発明の仮想化階層(ＶｉｒｔｕａｌｉｚａｔｉｏｎＬａｙｅｒ)の上に一般ＯＳが位置する構造を仮定する。後述するが、本発明の仮想化階層を使用しなくてもハイブリッド実行ファイルを実行させることができるところ、これに対しては図１２で詳しく記述する。

【0065】

図１０に示す実施例において、ＯＳはＯＳ自分だけ実行されると感知しながらシステムを使用する。まず、ハイブリッド実行ファイルの一般的な駆動はＯＳを通して成るのでＳ１０１０段階でＯＳが実行される。それではＯＳはＳ１０１５段階でＧＰＵ仮想命令語が挿入されたハイブリッド実行ファイルを実行する。そうする間、Ｓ１０２０段階で、仮想セクションが実行されればＣＰＵで例外(ｅｘｃｅｐｔｉｏｎ)が発生する。それではシステムに対する制御権がＯＳで仮想化階層のハイブリッド仮想化ブロック７３０に移動する。

【0066】

ハイブリッド仮想化ブロック７３０はＳ１０３０段階で、仮想セクション内部のウォーターマークを通して仮想セクションなのか否かを判断する。もし、仮想セクションではなければ、ハイブリッド仮想化ブロック７３０はＳ１０５０段階で進行して既存の例外処理を遂行し、Ｓ１０５５段階でさらにシステム制御権をＯＳに移動させる。もし、仮想セクションであれば、ハイブリッド仮想化ブロック７３０はＳ１０３５段階でＧＰＵ仮想命令語(ＧＰＵＶｉｒｔｕａｌＩｎｓｔｒｕｃｔｉｏｎ)をＧＰＵ機械語(ＧＰＵＭａｃｈｉｎｅＣｏｄｅ)に変換する。そしてハイブリッド仮想化ブロック７３０はＳ１０４０段階で、上記変換されたＧＰＵ機械語を図１１のようにメモリー(又はファイル)実行領域に挿入する。

【0067】

上記の過程を遂行したハイブリッド仮想化ブロック７３０はＳ１０４５段階で制御権をさらにＯＳに越す。その後、ＯＳはＳ１０７０段階で、当該のＧＰＵ機械語をＧＰＵを通じて実行させる。

【0068】

一方、Ｓ１０２０段階で、例外が発生したのではなければ、Ｓ１０６０段階でＧＰＵ機械語実行なのか否かを判断し、ＧＰＵ機械語実行の場合にはＳ１０７０段階でＧＰＵ機械語を実行し、ＧＰＵ機械語ではない場合にはＳ１０６５段階でＣＰＵ機械語を遂行する。この場合、Ｓ１０６０段階及びＳ１０７０段階を通して実行されるＧＰＵ機械語はＳ１０３５段階で変換されてメモリー(又はファイル)上に存在するＧＰＵ機械語として、別途の変換過程無しに直ちに実行されることができる。

【0069】

図１２は本発明のさらにの実施例によってシステムＯＳがハイブリッド実行ファイルを実行する過程を示すフローチャートである。

【0070】

上記の図１０では仮想化階層(ＶｉｒｔｕａｌｉｚａｔｉｏｎＬａｙｅｒ)のハイブリッド仮想化ブロック７３０がハイブリッド実行ファイルを実行(ｒｕｎ)する実施例に対して記述した。

【0071】

一方、図１２では別途の仮想化階層を導入せず、ＯＳがハイブリッド実行ファイルを実行する実施例に対して記述する。この場合、ＧＰＵ仮想化命令語を生成するコンパイル過程は仮想化階層を導入するか否かに関係なく同一であるのでこれに対する説明を省略することにする。

【0072】

まず、Ｓ１２０５段階でハイブリッド実行ファイルが実行されれば、Ｓ１２１０段階でＣＰＵで例外(ｅｘｃｅｐｔｉｏｎ)が発生する。それではＯＳはＳ１２１５段階で、仮想セクション内部のウォーターマークを通して仮想セクションなのか否かを判断する。もし、仮想セクションではなければ、ＯＳはＳ１１２３５段階で進行して既存の例外処理を遂行し、Ｓ１２０４段階でＣＰＵ機械語を実行する。

【0073】

もし、仮想セクションであれば、ＯＳはＳ１２２０段階でＧＰＵ仮想命令語(ＧＰＵＶｉｒｔｕａｌＩｎｓｔｒｕｃｔｉｏｎ)をＧＰＵ機械語(ＧＰＵＭａｃｈｉｎｅＣｏｄｅ)に変換する。そしてＯＳはＳ１２２５段階で、上記変換されたＧＰＵ機械語を図１１のようにメモリー(又はファイル)実行領域に挿入する。

【0074】

上記の過程を遂行したＯＳはＳ１２３０段階で、当該のＧＰＵ機械語をＧＰＵを通して実行させる。

【0075】

一方、Ｓ１２１０段階で、例外が発生したのではなければ、ＯＳはＳ１２４５段階でＧＰＵ機械語実行なのか否かを判断し、ＧＰＵ機械語実行の場合にはＳ１２３０段階でＧＰＵ機械語を実行し、ＧＰＵ機械語ではない場合にはＳ１２４０段階でＣＰＵ機械語を遂行する。この場合、Ｓ１２４５段階及びＳ１２３０段階を通して実行されるＧＰＵ機械語はＳ１２２０段階で変換されてメモリー(又はファイル)上に存在するＧＰＵ機械語として、別途の変換過程無しに直ちに実行されることができる。

【0076】

以下では上記の本初明の２つの実施例の機能上の差異に対して記述する。

【0077】

まず、本発明の第１実施例によれば、実行時間(ｒｕｎｔｉｍｅ)の間、ＧＰＵ仮想命令語がＧＰＵ機械語に変換される過程は仮想化階層に位置するハイブリッド仮想化ブロック７３０によって遂行される。上記第１実施例によるシステム構造が図１３に具体的に図示される。

【0078】

図１３に示すように、ハイブリッド仮想化ブロック７３０はアプリケーション階層とハードウェア階層の間に、そしてＯＳ下位に位置する。上記ハイブリッド仮想化ブロック７３０でよって、上位に位置したＯＳは現在実行されるハイブリッド実行ファイルが既存の実行ファイルと同様であると認識する。すなわち、第１実施例によれば上位ＯＳを修正する必要無しにＧＰＵ仮想命令語を実行することができる。

【0079】

一方、本発明の第２実施例によれば、実行時間(ｒｕｎｔｉｍｅ)の間ＧＰＵ仮想命令語がＧＰＵ機械語に変換される過程はＯＳによって直接遂行される。上記第２実施例によるシステム構造が図１４及び図１５に示す。

【0080】

図１４及び図１５に示すように、ハイブリッド実行ファイルを実行するためのハイブリッド仮想化ブロックはＯＳ内部に含まれる。ここで図１４に示す第１オペレーティングシステムは例えば、マイクロソフト社の「ＭＳ」であることを例示することができ、図１５で示す第２オペレーティングシステムは例えば、アップル謝意「ＡｐｐｌｅＯＳ」であることを例示することができる。このような第2 実施例によれば実行時間の間の例外発生の時、ＧＰＵ仮想命令語をＧＰＵ機械語で変換する手続きはＯＳによって直接処理される。

【0081】

上記の本発明によれば、ＣＰＵとＧＰＵを同時に效率的に使用することができ、ＧＰＵ使用のためのリアルタイムコンパイル方式の問題点を補ってＧＰＵ実行效率を向上させることができる。

【0082】

本明細書及び図面に開示された本発明の実施例は本発明の記述内容を容易に説明し、発明の理解を助けるために特定例を提示したことに過ぎず、本発明の範囲を限定しようとすることではない。ここに開示された実施例以外にも本発明の技術的思想に基づいて他の変形例が実施可能であるということは本発明が属する技術分野で通常の知識を有する者に自明なものである。

【符号の説明】

【0083】

７１０アプリケーション
７２０コンパイラー
７３０ハイブリッド仮想化ブロック

【図1】