IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベーアーエスエフ・エスエーの特許一覧 ▶ ザ、チャンセラー、マスターズ、アンド、スカラーズ、オブ、ザ、ユニバーシティー、オブ、ケンブリッジの特許一覧

特表2024-509673日焼け止め製品のUV保護予測のための方法及びシステム
<>
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図1
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図2
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図3
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図4
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図5
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図6
  • 特表-日焼け止め製品のUV保護予測のための方法及びシステム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-03-05
(54)【発明の名称】日焼け止め製品のUV保護予測のための方法及びシステム
(51)【国際特許分類】
   G01N 33/15 20060101AFI20240227BHJP
   A61Q 17/04 20060101ALI20240227BHJP
【FI】
G01N33/15 Z
A61Q17/04
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023544343
(86)(22)【出願日】2022-01-05
(85)【翻訳文提出日】2023-07-19
(86)【国際出願番号】 EP2022050120
(87)【国際公開番号】W WO2022157011
(87)【国際公開日】2022-07-28
(31)【優先権主張番号】PCT/CN2021/073129
(32)【優先日】2021-01-21
(33)【優先権主張国・地域又は機関】CN
(81)【指定国・地域】
(71)【出願人】
【識別番号】521037411
【氏名又は名称】ベーアーエスエフ・エスエー
(71)【出願人】
【識別番号】516378426
【氏名又は名称】ケンブリッジ エンタープライズ リミテッド
(74)【代理人】
【識別番号】100188558
【弁理士】
【氏名又は名称】飯田 雅人
(74)【代理人】
【識別番号】100133086
【弁理士】
【氏名又は名称】堀江 健太郎
(74)【代理人】
【識別番号】100163522
【弁理士】
【氏名又は名称】黒田 晋平
(72)【発明者】
【氏名】リー,ドン リョル
(72)【発明者】
【氏名】シア,ジュン タオ
(72)【発明者】
【氏名】ソーン,ミリアム
(72)【発明者】
【氏名】ヘルツォーク,ベルント
(72)【発明者】
【氏名】ツァオ,リーウェイ
(72)【発明者】
【氏名】ラプキン,アレクセイ
【テーマコード(参考)】
4C083
【Fターム(参考)】
4C083BB46
4C083BB51
4C083CC19
4C083DD33
4C083DD41
4C083EE17
(57)【要約】
本発明は、日焼け止め製品のUV保護予測のための方法及びシステムに関し、この方法及びシステムは、a)日焼け止め製品の特徴量を選択する工程であって、この特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる工程と、c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに特徴量を入力する工程と、d)工程c)の予測モデルによって日焼け止め製品のUV保護予測値を計算する工程と、を含む。
【選択図】なし
【特許請求の範囲】
【請求項1】
日焼け止め製品のUV保護予測のための方法であって、
a)前記日焼け止め製品の特徴量を選択する工程であって、前記特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる工程と、
c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに前記特徴量を入力する工程と、
d)工程c)の前記予測モデルによって前記日焼け止め製品のUV保護予測値を計算する工程と、を含む方法。
【請求項2】
工程a)と工程c)の間に、1つ以上の次元削減法を実行することによって工程a)の前記特徴量を変換する工程b)を更に含むことを特徴とする、請求項1に記載の方法。
【請求項3】
工程b)において、主成分分析(PCA)、線形判別分析(LDA)、及びカーネル主成分分析(KPCA)からなる群から選択される1つ以上の次元削減法が実行されることを特徴とする、請求項2に記載の方法。
【請求項4】
工程b)において、主成分分析(PCA)を実行して、前記特徴量の4つの主成分を得ることを特徴とする、請求項2又は3に記載の方法。
【請求項5】
工程c)において、リッジ回帰、ベイズ回帰、サポートベクターマシン(SVM)、k-最近傍(k-NN)回帰、決定木、及びガウス過程回帰からなる群から選択される1つ以上の機械学習技術を使用することによって、前記予測モデルが構築及び適合されることを特徴とする、請求項1~4のいずれか一項に記載の方法。
【請求項6】
工程c)において、ベイズ回帰を使用することによって、前記予測モデルが構築及び適合されることを特徴とする、請求項1~5のいずれか一項に記載の方法。
【請求項7】
工程c)において、前記予測モデルに対してハイパーパラメータの調整が実行されることを特徴とする、請求項1~6のいずれか一項に記載の方法。
【請求項8】
工程c)において、前記予測モデルは、配合タイプ、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、吸収型UVフィルターと散乱/反射型UVフィルターの比、生体内でのSPFと生体外でのUVA-PFを含む前記特徴量のデータセットによって適合されることを特徴とする、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記UV保護予測値は、生体内でのSPFと生体外でのUVA-PFからなる群から選択されることを特徴とする、請求項1~8のいずれか一項に記載の方法。
【請求項10】
日焼け止め製品のUV保護予測のためのシステムであって、以下のモジュール:
a)前記日焼け止め製品の特徴量を選択するためのモジュールであって、前記特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれるモジュール、
c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに前記特徴量を入力するためのモジュール、並びに
d)モジュールc)の前記予測モデルによって前記日焼け止め製品のUV保護予測値を計算するためのモジュールを含むシステム。
【請求項11】
前記システムは、1つ以上の次元削減法を実行することによってモジュールa)の前記特徴量を変換するためのモジュールb)を更に含むことを特徴とする、請求項10に記載のシステム。
【請求項12】
モジュールb)において、主成分分析(PCA)、線形判別分析(LDA)、及びカーネル主成分分析(KPCA)からなる群から選択される1つ以上の次元削減法が実行されることを特徴とする、請求項11に記載のシステム。
【請求項13】
モジュールb)において、主成分分析(PCA)を実行して、前記特徴量の4つの主成分を得ることを特徴とする、請求項11又は12に記載のシステム。
【請求項14】
モジュールc)において、リッジ回帰、ベイズ回帰、サポートベクターマシン(SVM)、k-最近傍(k-NN)回帰、決定木、及びガウス過程回帰からなる群から選択される1つ以上の機械学習技術を使用することによって、前記予測モデルが構築及び適合されることを特徴とする、請求項10~13のいずれか一項に記載のシステム。
【請求項15】
モジュールc)において、ベイズ回帰を使用することによって、前記予測モデルが構築及び適合されることを特徴とする、請求項10~14のいずれか一項に記載のシステム。
【請求項16】
モジュールc)において、前記予測モデルに対してハイパーパラメータの調整が実行されることを特徴とする、請求項10~15のいずれか一項に記載のシステム。
【請求項17】
モジュールc)において、前記予測モデルは、配合タイプ、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、吸収型UVフィルターと散乱/反射型UVフィルターの比、生体内でのSPFと生体外でのUVA-PFを含む前記特徴量のデータセットによって適合されることを特徴とする、請求項10~16のいずれか一項に記載のシステム。
【請求項18】
前記UV保護予測値は、生体内でのSPFと生体外でのUVA-PFからなる群から選択されることを特徴とする、請求項10~17のいずれか一項に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、日焼け止め製品のUV保護予測(UV protection prediction)のための方法及びシステムに関し、この方法及びシステムは、a)日焼け止め製品の特徴量(feature)を選択する工程であって、この特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる工程と、c)1つ以上の機械学習技術を使用して構築及び適合される(fitted)予測モデルに特徴量を入力する工程と、d)工程c)の予測モデルによって日焼け止め製品のUV保護予測値を計算する工程と、を含む。
【背景技術】
【0002】
日焼け止め用途の開発では、生体内でのSPF及びUVA-PF試験プロトコルによる評価が必須であるため、性能評価は困難である。これらの試験は、開発段階で多額の費用がかかり、生体内で試験を行うため時間がかかる。この課題に対処するために、様々なモデル化によってUV保護性能を予測する試みが行われてきた。しかしながら、実際には、実際のUV保護性能は、UVフィルターの組み合わせだけでなく、皮膚軟化剤、乳化剤、ポリマーなどの他の配合成分によっても決まるため、UVの組み合わせに基づいたモデルでは予測精度が非常に制限されていた。更に、油中水型、水中油型、スプレー、ローションタイプなどの配合テクスチャーのタイプは全て、UV保護性能に影響する。別の手法は、生体外試験で性能を評価することであった。生体内での値と生体外での値の間の対応する相関関係を検証するための手法が、集中的に調査されている。しかしながら、SPFとUVA-PFの両方における生体内での値と生体外での値の間には依然としてギャップがあった。従って、生体外試験の使用は、予測ツールとして良好には受け入れられなかった。
【0003】
Jiyong Shim,Jun Man Lim,Sun Gyoo Park,Machine learning for the prediction of sunscreen sun protection factor and protection grade of UVA,Experimental Dermatology,2019,Volume 28,Issue 7,Pages:872-874は、機械学習に基づいた日焼け止めの日焼け防止指数(SPF)と紫外線(UV)Aの保護グレード(PA)の予測モデルを報告し、この場合、UVフィルター物質の濃度、並びに顔料の存在、顔料グレードの二酸化チタンの濃度、配合の種類及び製品の種類などの4つの更なる要素が、予測モデルに使用された。しかしながら、予測精度と効率は、依然としてあまり満足のいくものではなかった。
【発明の概要】
【発明が解決しようとする課題】
【0004】
従って、本発明の目的は、当技術分野における欠点を克服することである。
【課題を解決するための手段】
【0005】
本発明の一態様によれば、前述の目的は、日焼け止め製品のUV保護予測のための方法によって達成することができ、この方法は、以下の工程:
a)日焼け止め製品の特徴量を選択する工程であって、特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる工程と、
c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに特徴量を入力する工程と、
d)工程c)の予測モデルによって日焼け止め製品のUV保護予測値を計算する工程と、を含む。
【0006】
本発明による方法の一実施形態によれば、この方法は、工程a)と工程c)の間に、1つ以上の次元削減法(dimensionality reduction technique)を実行することによって工程a)の特徴量を変換する工程b)を任意に更に含むことができる。
【0007】
本発明の別の態様によれば、前述の目的は、日焼け止め製品のUV保護予測のためのシステムによって達成することができ、このシステムは、以下のモジュール:
a)日焼け止め製品の特徴量を選択するためのモジュールであって、特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれるモジュール、
c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに特徴量を入力するためのモジュール、並びに
d)モジュールc)の予測モデルによって日焼け止め製品のUV保護予測値を計算するためのモジュールを含む。
【0008】
本発明によるシステムの一実施形態によれば、システムは、1つ以上の次元削減法を実行することによってモジュールa)の特徴量を変換するためのモジュールb)を任意に更に含むことができる。
【0009】
本発明の各態様は、添付の図面と併せてより詳細に説明される。
【図面の簡単な説明】
【0010】
図1】例示的なデータセットの入力間の相関関係を示している、
図2】例示的なデータセットの入力と出力の間の相関関係を示している、
図3】例示的なデータセットにおけるO/Wタイプの日焼け止め製品のPCA分析における特徴量の重要度(feature importance)を示している、
図4】例示的なデータセットにおけるジェルタイプの日焼け止め製品のPCA分析における特徴量の重要度を示している、
図5】例示的なデータセットにおける全てのタイプの日焼け止め製品のPCA分析における特徴量の重要度を示している、
図6】例示的なデータセットにおけるO/Wタイプの日焼け止め製品のベイズ回帰モデル(Bayesian regression model)の予測と実験結果との間の相関関係を示している:(a)機械学習によって予測されたSPFと生体内で観察されたSPF、及び(b)機械学習によって予測されたUVAと生体外で観察されたSPF
図7】例示的なデータセットにおけるジェルタイプの日焼け止め製品のベイズ回帰モデルの予測と実験結果との間の相関関係を示している:(a)機械学習によって予測されたSPFと生体内で観察されたSPF、及び(b)機械学習によって予測されたUVAと生体外で観察されたSPF。
【発明を実施するための形態】
【0011】
本明細書で言及される全ての刊行物、特許出願、特許、及びその他の参考文献は、別段の指示がない限り、あたかも完全に記載されているかのように、あらゆる目的のためにその全体が参照により本明細書に明示的に組み込まれる。
【0012】
他に定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。矛盾が生じた場合には、定義を含む本明細書が優先される。
【0013】
量、濃度、或いはその他の値又はパラメータが、範囲、好ましい範囲、又は好ましい値より高い値及び好ましい値より低い値の一覧として示される場合、これは、範囲を別個に開示しているか否かに関わらず、任意の上限範囲又は好ましい値、及び任意の下限範囲又は好ましい値の任意の対から形成された全ての範囲を具体的に開示していると理解されたい。ある範囲の数値が本明細書において列挙される場合、特に明記しない限り、その範囲は、その終点、並びにその範囲内の全ての整数及び分数を含むことを意図している。
【0014】
本発明は、一態様によれば、日焼け止め製品のUV保護予測のための方法に関し、この方法は、以下の工程:
a)日焼け止め製品の特徴量を選択する工程であって、特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる工程と、
c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに特徴量を入力する工程と、
d)工程c)の予測モデルによって日焼け止め製品のUV保護予測値を計算する工程と、を含む。
【0015】
本発明による方法の一実施形態によれば、本方法は、工程a)と工程c)の間に、1つ以上の次元削減法を実行することによって工程a)の特徴量を変換する工程b)を任意に更に含むことができる。
【0016】
a)日焼け止め製品の特徴量を選択する工程
本発明による方法の別の実施形態によれば、工程a)において、日焼け止め製品の特徴量が選択されることができ、この場合、特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる。
【0017】
広範な研究の結果、本発明の発明者らは、皮膚軟化剤におけるUVB日焼け止めフィルターのUV吸収スペクトル挙動、例えば、308nmにおける最大吸光度(λmax)の波長及びモル吸光係数(ε)と、その溶解度パラメータとの間の相関関係に気づき(Seong-Rae Kim,Seung-Ki Lee,Choon-Koo Zhoh,Effect of Emollients on the UV Absorption Behavior of Ethylhexyl Methoxycinnamate,J.Kor.Soc.Esthe.& Cosm.Vol.7,No.1(2012)p.9-16)、更に、皮膚軟化剤の溶解特性は、その極性によって影響を受ける可能性があることを見出し、日焼け止めに標準的に使用される皮膚軟化剤の極性の違いが、UVフィルターの吸光度の違いにつながり、皮膚軟化剤の極性の増加が、UVA保護係数値の増加につながることを明らかにした(Myriam Sohn,Lola Amoros-Galicia,Stanislaw Krus,Karine Martin,Bernd Herzog,Effect of emollients on UV filter absorbance and sunscreen efficiency,Journal of Photochemistry & Photobiology,B:Biology 205(2020)111818)。皮膚軟化剤の極性とSPF値の間に相関関係があるとの仮説が立てられることができる。
【0018】
皮膚軟化剤の極性は、乳化プロセスで好ましいパラメータである油/水界面張力(IFT)によって決定されることができ、ペンダントドロップ法(pendant drop method)によって容易に測定されることができ、3つのグループに分類できる:
-低極性:IFT≧35mN/m、
-中極性:25mN/m≦IFT<35mN/M、
-高極性:IFT<25mN/m。
【0019】
いくつかの市販の皮膚軟化剤の極性分類を表1に要約する。
【0020】
【表1】
【0021】
更にまた、本発明の発明者らは、UVA及びUVBの範囲におけるバランスのとれた保護に加えて、油相及び水相におけるバランスのとれたUV保護が、高いSPFを達成するために重要になるであろうことを見出した。
【0022】
SPF予測のための機械学習において、これら全ての配合パラメータ及び影響を考慮して定量化することは非常に複雑になるであろう。従来技術における予測方法は、9つもの特徴量を含むことは決してなく、上記の特定の9つの特徴量は言うまでもない。例えば、Shimの機械学習方法(Shim’s machine learning method)には、UVフィルター物質の濃度、並びに顔料の存在、顔料グレードの二酸化チタンの濃度、及び配合の種類と製品の種類が含まれるに過ぎない。これに対して、本発明によれば、上記の9つの特徴量を考慮することができるため、日焼け止め製品の性能をより包括的に反映することができ、それにより得られる予測結果は、よりかなり正確になる。
【0023】
O/Wタイプの日焼け止め製品の例示的なデータセットを表2に要約する。例えば、このデータセットは、それぞれ、トレーニング(training)、検証及び試験において7:1:2の比で分割できる。
【0024】
【表2】
【0025】
特徴量の視覚化は、特徴量を包括的に理解するのに役立つであろう。しかしながら、高次元の特徴量空間の場合、特徴量空間を明確に視覚化することは、容易な作業ではないであろう。特徴量空間を一度に視覚化する代わりに、相関行列の計算が最も一般的な手法の1つである探索的データ解析(EDA)によってペアごとの相関関係を分析することが推奨されるであろう。rで示される相関行列は、ピアソンの積率相関係数に基づく正方行列であり、データセットにおける入力と出力の間の線形相関の尺度として使用されることができる。
【数1】
式中、nは、特徴量のサイズであり、xi、は、iでインデックス付けされた個々の点であり、
【数2】
は、特徴量
【数3】
の平均であり、
【数4】
についても同様である。
【0026】
ピアソンのr値の範囲は、+1から-1である。0の値は、2つの変数xとyの間に関連性がないことを示す。0より大きい値は、正の関連性を示し、これは、一方の変数の値が増加すると、もう一方の変数の値が増加することを意味する。0未満の値は、負の関連性を示し、これは、一方の変数の値が増加すると、もう一方の変数の値が減少することを意味する。ピアソンのr値に基づくEDAは、出力の特徴量と入力の特徴量の間の線形相関についてのいくつかの基本的な洞察を得るのに役立つであろう。従って、出力との関連性が比較的高い特徴量は、更なる機械学習モデルの構築のための「探索的特徴量」として選択されることができる。
【0027】
図1は、例示的なデータセットにおける入力間の相関関係を示しており、図2は、例示的なデータセットにおける入力と出力の間の相関関係を示している。入力パラメータ間の相関関係は大きくないが、2つの出力間の相関関係は強いことがわかる。
【0028】
データセットが高次元である場合、特徴量選択によって次元削減を実行することが常に推奨されるであろう。特徴量選択の基本的な考え方は、出力に対する各特徴量の重要度を評価し、機械学習モデルの性能にあまり影響を与えない特徴量を削除することであり、機械学習モデルにより大きな影響を与える特徴量を保持するのみである。選択される特徴量は、通常、機械学習モデルごとに異なる。ランダムフォレストアルゴリズムは、特徴量選択がどのように作用するかを示す例として使用できる。ランダムフォレストは、個別の決定木(decision tree)モデルを用いて構築できる。入力は、ノードとして表されることができ、考えられる結果は、エッジ(edge)として表されることができる。
【0029】
特徴量の重要度は、そのノードに到達する確率によって重み付けされたノードの不純物の減少として計算できる。ランダムフォレストモデル内の各決定木について、以下に示されるガニの重要度(Gani Importance)を使用してノードの重要度を計算できる。
NI=w-w左(j)左(j)-w右(j)右(j)
式中、NIは、ノードjの重要度であり、wは、ノードjに到達する試料の重み付けされた数であり、Cは、ノードjの不純物の値であり、左(j)は、ノードjの右分割からの子ノードであり、右(j)は、ノードjの右分割からの子ノードである。
【0030】
決定木における各特徴量の重要度は、以下のように計算できる。
【数5】
式中、FIは、特徴量iの特徴量の重要度であり、NIは、ノードjの重要度である。
【0031】
次いで、これらは、全ての特徴量の重要度の値の合計で割ることにより、0から1の値に標準化できる。
【数6】
【0032】
ランダムフォレストモデルの最後の特徴量の重要度は、全ての決定木の平均である。式は、次のように示される。
【数7】
式中、RFは、RFモデルにおける全ての決定木から計算された特徴量iの重要度であり、標準FIijは、決定木jにおける特徴量iの標準化された特徴量の重要度であり、Tは、決定木の総数である。
【0033】
例示的なデータセットにおける日焼け止め製品の特徴量の重要度を表3に要約する。
【0034】
【表3】
【0035】
b)工程a)の特徴量を変換する工程
本発明による方法の別の実施形態によれば、本方法は、工程a)と工程c)の間に、1つ以上の次元削減法を実行することによって工程a)の特徴量を変換するための工程b)を任意に更に含むことができる。
【0036】
本発明による方法の別の実施形態によれば、工程b)において、主成分分析(PCA)、線形判別分析(LDA)、及びカーネル主成分分析(KPCA)からなる群から選択される1つ以上の次元削減法を実行することができる。
【0037】
特徴量抽出(feature extraction)を次元削減に使用して、元の特徴量空間を特定の規則で投影することによって新しい特徴量空間を作成できる。特徴量抽出の例示的な例として、主成分分析(PCA)を選択できる。線形判別分析及びカーネル主成分分析など、他の特徴量抽出技術の実施も同様の方法で行うことができる。
【0038】
PCAを使用すると、特徴量の主成分と出力の間の共分散が最大になるという意味で特徴量の主成分を見つけることができる。PCAでは、元の特徴量空間x=[x,x,…,x]を新しい特徴量空間
【数8】
に変換するように、D×K次元の変換行列Wが構築され、
更なる分析を容易にする。通常、変換行列は、異なる特徴量間の共分散行列に基づいて構築される。特徴量xとxの間の共分散は、次のように計算できる。
【数9】
【0039】
このような共分散定義に基づいて、次いでK個の最大固有値とその対応する固有ベクトルを選択することによって、特徴量空間からのD×D次元共分散行列x=[x,x,…,x]を得ることができ、変換行列を構築できるであろう。このようなフレームワークでは、特徴量の重要度は、その対応する固有値と全ての固有値の合計との比として定義される。
【数10】
【0040】
主成分分析(PCA)、線形判別分析(LDA)、及びカーネル主成分分析(KPCA)の実験手順の詳細な情報は、例えば、Sebastian Raschka,Python Machine Learning,2nd Edition,Packt Publishing,2017に見られることができる。主成分分析(PCA)の特に詳細な情報は、例えば、I.T.Jolliffe,Principal Component Analysis,2nd Edition,Springer,2002に見られることができる。例えば、サイキット・ラーン(scikit-learn)(sklearn)は、モデルの適合、データの前処理、モデルの選択及び評価のための様々なツールを提供するオープンソース(open source)の機械学習ライブラリである。PCTは、sklearnによって実施されることができる。
【0041】
本発明による方法の別の実施形態によれば、工程b)において、主成分分析(PCA)を実行して、特徴量の4つの主成分を得ることができる。
【0042】
本発明の発明者らは、4つの主成分が、特徴量空間全体の情報の85%超に相当し得ることを見出した。更にまた、本発明の発明者らは、ベイズ回帰モデルを、それぞれ3、4、5、及び6つの主成分で適合し、4つの主成分を有するモデルで最も低い試験誤差(testing error)を見出した。
【0043】
図3は、例示的なデータセットにおけるO/Wタイプの日焼け止め製品のPCA分析における特徴量の重要度を示しており、図4は、例示的なデータセットにおけるジェルタイプの日焼け止め製品のPCA分析における特徴量の重要度を示しており、図5は、例示的なデータセットにおける全てのタイプの日焼け止め製品のPCA分析における特徴量の重要度を示している。
【0044】
c)特徴量を予測モデルに入力する工程
本発明による方法の別の実施形態によれば、工程c)において、特徴量は、1つ以上の機械学習技術を使用して構築及び適合される予測モデルに入力され得る。
【0045】
本発明による方法の別の実施形態によれば、工程c)において、リッジ回帰、ベイズ回帰、サポートベクターマシン(Supporting Vector Machine)(SVM)、k-最近傍(k-NN)回帰、決定木、及びガウス過程回帰からなる群から選択される1つ以上の機械学習技術を使用することによって、予測モデルを構築及び適合させることができる。
【0046】
リッジ回帰は、目標値が特徴量の線形結合であることが予想される線形モデルとして使用できる。
【数11】
【0047】
リッジリグレッサー(regressor)では、リッジ係数は、ペナルティ付き残差二乗和(penalized residual sum of squares)を最小化する。
【数12】
式中、wは、係数パラメータであり、α≧0は収縮係数であり、αが大きいほど、収縮量が大きくなり、従って係数は共線性に対してより堅固(robust)になる。αは、10-3から10まで試験でき、モデルの適合において最適な値を選択できる。
【0048】
SVM回帰は、εに依存しない損失を使用して高次元特徴量空間において線形回帰を実行するために使用でき、||ω||を最小化することでモデルの複雑さを軽減しようとする。これは、(非負の)スラック変数ξ,ξ*,i=1,…,nを導入して、εに依存しない領域外でのトレーニング試料の偏差を測定することによって説明できる。従って、SVM回帰は、以下の関数の最小化したものとして定式化できる。
【数13】
【0049】
この最適化問題(optimization problem)は、双対問題(dual problem)に変換でき、その解は、以下により与えられる。
【数14】
式中、nsvは、サポートベクター(SV)の数であり、Kは、カーネル関数である。
【数15】
【0050】
3つの異なるタイプのカーネル、つまり線形、RBF、多項式カーネルを試験できる。RBFカーネルの場合、パラメータγとCは、[10-3、10]の範囲内で試験でき、多項式カーネルの場合、別のパラメータの度合いを1~10で変更できる。
【0051】
k-NNリグレッサーは、特徴量の類似性を使用して新しいデータポイントの値を予測し、つまり、新しいポイントには、トレーニングデータセットにおけるポイントとの類似の度合いに基づいて値が割り当てられる。距離計算にはユークリッド距離を選択できる。n近傍の数を定義する鍵となるパラメータは、1~100の範囲内で試験できる。
【0052】
決定木は、特徴量から決定規則を学習することによってターゲットを予測するための教師付き機械学習モデル(supervised machine learning model)として使用できる。決定木は、再帰分割によって構築でき、つまり、決定木をルートノード(root node)から分割でき、各ノードを左右の子ノードに分割できる。決定木が、プルーニングされる(pruned)ときに、決定木の最大深さ(maximal depth)を限度として設定できる。最も情報を与える特徴量においてノードを分割するために、目的関数を使用して各分割での情報利得を最大化でき、これは次のように定義される。
【数16】
式中、fは、分割を実行する特徴量であり、D、D、及びDは、親ノードと子ノードのデータセットであり、Iは、不純物の測定値であり、Nは、親ノードにおける試料の総数であり、NとNは、子ノードの試料の数である。決定木の場合、nの様々な値は、5~15であり得、この場合、nは、分割されるn個以上の観測値を不純なノードが有する必要のあるような数であり、決定木の適合の段階で試験されることができる。最適なレベルのプルーニングは、相互検証を通じて評価されることができる(この場合、最適なレベルは、最小コストのサブツリーの1標準誤差以内にある最小の決定木を生成したものである)。
【0053】
ガウス過程リグレッサーは、ガウス過程(GP)に基づくノンパラメトリック(nonparametric)のカーネルベースの確率モデルとして使用できる。GPの事前分布(prior)は、トレーニングデータセットに基づいて指定される必要があり、事前分布の共分散は、カーネルオブジェクト(kernel object)をパスすること(passing)で指定されることができる。次いで、カーネルのハイパーパラメータは、以下の式で与えられる遅滞周辺尤度(lag-marginal-likelihood)の最大化に基づいて最適化される。
【数17】
式中、Kは、共分散行列であり、θは、ハイパーパラメータのベクトルであり、nは、データ点の数である。
【0054】
例えば、リッジ回帰、サポートベクターマシン(SVM)、k最近傍(k-NN)回帰、決定木、及びガウス過程回帰は、sklearnによって実施されることができる。
【0055】
本発明による方法の別の実施形態によれば、工程c)において、ベイズ回帰を使用することによって予測モデルを構築及び適合させることができる。
【0056】
ベイズリグレッサーは、回帰問題の確率モデルを評価するために使用できる。パラメータω、α、及びλは、モデルを適合するときに一緒に評価できる。係数ωの事前分布は、球面ガウス分布:
p(ω│λ)=N(ω│0,λ-1Ι)によって与えられ、
αとλの事前分布は、ガンマ分布になるように選択され、ガウス分布の精度における共役事前分布である。正則化パラメータαとλは、対数周辺尤度(log marginal likelihood)を最大化することによって評価できる。
【0057】
ベイズ回帰モデルの実験手順の詳細情報については、例えば、Christopher M.Bishop,Pattern Recognition and Machine Learning,Springer,2006に見られることができる。例えば、ベイズ回帰は、sklearnによって実施されることもできる。
【0058】
本発明による方法の別の実施形態によれば、工程c)において、予測モデルに対してハイパーパラメータの調整を実行することができる。
【0059】
例えば、ベイズ回帰モデルの場合、最大化手順の初期値を与えるために2つのハイパーパラメータα初期とλ初期を設定する必要がある。その他に、更に4つのハイパーパラメータ、α、α、λ、及びλが存在し、これらは、α及びλに渡るガンマ事前分布のパラメータである。α及びλは、α及びλに渡るガンマ分布の事前分布の形状パラメータである。α及びλは、α及びλに渡るガンマ分布の事前分布の逆スケールパラメータ(inverse scale parameter)(レートパラメータ(rate parameter))である。
【0060】
データセットは、トレーニングデータセット、検証データセット、及び試験データセットに分割できる。グリッドサーチ手法(grid search approach)は、最適化されたハイパーパラメータを得るためにハイパーパラメータ空間を網羅的にサンプリングするために適用できる。例えば、グリッドは次のように設定できる。
【数18】
【0061】
検証データセットにおける最小の平均二乗誤差を与えるパラメータの組み合わせをモデルのハイパーパラメータとして選択できる。
【0062】
本発明による方法の別の実施形態によれば、工程c)において、予測モデルは、配合タイプ、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、吸収型UVフィルターと散乱/反射型UVフィルターの比、生体内でのSPFと生体外でのUVA-PFを含む特徴量のデータセットによって適合させることができる。
【0063】
d)日焼け止め製品のUV保護予測値を計算する工程
本発明による方法の別の実施形態によれば、工程d)において、日焼け止め製品のUV保護予測値は、工程c)の予測モデルによって計算することができる。
【0064】
本発明による方法の別の実施形態によれば、工程d)において、UV保護予測値は、生体内でのSPFと生体外でのUVA-PFからなる群から選択され得る。
【0065】
図6は、例示的なデータセットにおけるO/Wタイプの日焼け止め製品のベイズ回帰モデルの予測と実験結果との間の相関関係を示している:(a)機械学習によって予測されたSPFと生体内で観察されたSPF、及び(b)機械学習によって予測されたUVAと生体外で観察されたSPF、並びに図7は、例示的なデータセットにおけるジェルタイプの日焼け止め製品のベイズ回帰モデルの予測と実験結果との間の相関関係を示している:(a)機械学習によって予測されたSPFと生体内で観察されたSPF、及び(b)機械学習によって予測されたUVAと生体外で観察されたSPF。
【0066】
相対予測誤差は、予測モデルの精度を評価するために次のように計算することもできる。
【数19】
式中、出力は、データセットにおける実験結果であり、予測は、予測モデルによって計算された予測値である。
【0067】
O/W及びジェルタイプの日焼け止め製品について、PCAを使用しない6つの予測モデルの相対予測誤差がそれぞれ表4及び5に要約され、この場合、O/W及びジェルタイプの日焼け止め製品の両方についてベイズ回帰が好まれる。
【0068】
【表4】
【0069】
【表5】
【0070】
O/Wタイプの日焼け止め製品について、6PCA、5PCA、4PCA、及び3PCAを使用しない及び使用したベイズ回帰の相対予測誤差が表6に要約され、この場合、4PCAを使用したベイズ回帰が、予測誤差が最も低くなるため好まれる。
【0071】
【表6】
【0072】
本発明は、別の態様によれば、日焼け止め製品のUV保護予測のためのシステムに関し、このシステムは、以下のモジュールを含む:
a)日焼け止め製品の特徴量を選択するためのモジュールであって、特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれるモジュール、
c)1つ以上の機械学習技術を使用して構築及び適合される予測モデルに特徴量を入力するためのモジュール、
d)工程c)の予測モデルによって日焼け止め製品のUV保護予測値を計算するためのモジュール。
【0073】
本発明によるシステムの一実施形態によれば、システムは、1つ以上の次元削減法を実行することによってモジュールa)の特徴量を変換するためのモジュールb)を任意に更に含むことができる。
【0074】
a)日焼け止め製品の特徴量を選択するためのモジュール
本発明によるシステムの別の実施形態によれば、モジュールa)において、日焼け止め製品の特徴量を選択することができ、この場合、特徴量には、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、及び吸収型UVフィルターと散乱/反射型UVフィルターの比が含まれる。
【0075】
例示的なデータセットの技術的詳細、及び特徴量の重要度及び相関分析は、本発明による方法の工程a)で見られることができる。
【0076】
b)モジュールa)の特徴量を変換するためのモジュール
本発明によるシステムの別の実施形態によれば、システムは、1つ以上の次元削減法を実行することによってモジュールa)の特徴量を変換するためのモジュールb)を任意に更に含むことができる。
【0077】
本発明による方法の別の実施形態によれば、モジュールb)において、主成分分析(PCA)、線形判別分析(LDA)、及びカーネル主成分分析(KPCA)からなる群から選択される1つ以上の次元削減法を実行することができる。
【0078】
本発明による方法の別の実施形態によれば、モジュールb)において、主成分分析(PCA)を実行して、特徴量の4つの主成分を得ることができる。
【0079】
特徴量抽出の技術的詳細、例えば、主成分分析(PCA)は、本発明による方法の工程b)に見られることができる。
【0080】
c)特徴量を予測モデルに入力するためのモジュール
本発明によるシステムの別の実施形態によれば、モジュールc)において、特徴量は、1つ以上の機械学習技術を使用して構築及び適合される予測モデルに入力され得る。
【0081】
本発明による方法の別の実施形態によれば、モジュールc)において、リッジ回帰、ベイズ回帰、サポートベクターマシン(SVM)、k-最近傍(k-NN)回帰、決定木、及びガウス過程回帰からなる群から選択される1つ以上の機械学習技術を使用することによって、予測モデルを構築及び適合させることができる。
【0082】
本発明による方法の別の実施形態によれば、モジュールc)において、ベイズ回帰を使用することによって予測モデルを構築及び適合させることができる。
【0083】
本発明による方法の別の実施形態によれば、モジュールc)において、予測モデルに対してハイパーパラメータ調整を実行することができる。
【0084】
本発明による方法の別の実施形態によれば、モジュールc)において、予測モデルは、配合タイプ、粘度、高極性皮膚軟化剤、中極性皮膚軟化剤、低極性皮膚軟化剤、UVAフィルター、UVBフィルター、UVBフィルターとUVAフィルターの比、油相のUVフィルターと水相のUVフィルターの比、吸収型UVフィルターと散乱/反射型UVフィルターの比、生体内でのSPFと生体外でのUVA-PFを含む特徴量のデータセットによって適合させることができる。
【0085】
6つの機械学習技術及びハイパーパラメータ調整の技術的詳細は、本発明による方法の工程c)に見られることができる。
【0086】
d)日焼け止め製品のUV保護予測値を計算するためのモジュール
本発明によるシステムの別の実施形態によれば、モジュールd)において、日焼け止め製品のUV保護予測値は、モジュールc)の予測モデルによって計算することができる。
【0087】
本発明による方法の別の実施形態によれば、モジュールd)において、UV保護予測値は、生体内でのSPFと生体外でのUVA-PFからなる群から選択され得る。
【0088】
予測精度の結果は、本発明による方法の工程d)で見られることができる。
【0089】
特定の実施形態を説明したが、これらの実施形態は、例としてのみ提示されており、本発明の範囲を限定することを意図していない。添付の特許請求の範囲及びその均等物は、本発明の範囲及び趣旨に含まれる全ての修正、置換及び変更を網羅することを意図している。
図1
図2
図3
図4
図5
図6
図7
【国際調査報告】