IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ネイバー コーポレーションの特許一覧

<>
  • 特許-ターゲット情報生成方法及びシステム 図1
  • 特許-ターゲット情報生成方法及びシステム 図2
  • 特許-ターゲット情報生成方法及びシステム 図3
  • 特許-ターゲット情報生成方法及びシステム 図4
  • 特許-ターゲット情報生成方法及びシステム 図5
  • 特許-ターゲット情報生成方法及びシステム 図6a
  • 特許-ターゲット情報生成方法及びシステム 図6b
  • 特許-ターゲット情報生成方法及びシステム 図6c
  • 特許-ターゲット情報生成方法及びシステム 図7
  • 特許-ターゲット情報生成方法及びシステム 図8
  • 特許-ターゲット情報生成方法及びシステム 図9a
  • 特許-ターゲット情報生成方法及びシステム 図9b
  • 特許-ターゲット情報生成方法及びシステム 図9c
  • 特許-ターゲット情報生成方法及びシステム 図10
  • 特許-ターゲット情報生成方法及びシステム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-18
(45)【発行日】2023-08-28
(54)【発明の名称】ターゲット情報生成方法及びシステム
(51)【国際特許分類】
   G06F 16/38 20190101AFI20230821BHJP
   G06Q 30/015 20230101ALI20230821BHJP
   G06F 40/56 20200101ALI20230821BHJP
【FI】
G06F16/38
G06Q30/015
G06F40/56
【請求項の数】 15
(21)【出願番号】P 2021212157
(22)【出願日】2021-12-27
(65)【公開番号】P2023043129
(43)【公開日】2023-03-28
【審査請求日】2021-12-27
(31)【優先権主張番号】10-2021-0123374
(32)【優先日】2021-09-15
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】505205812
【氏名又は名称】ネイバー コーポレーション
【氏名又は名称原語表記】NAVER Corporation
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】ジョン ジス
(72)【発明者】
【氏名】キム ジンウク
(72)【発明者】
【氏名】キム ソクフン
(72)【発明者】
【氏名】ホ ジエ
【審査官】三橋 竜太郎
(56)【参考文献】
【文献】特開2020-042403(JP,A)
【文献】特開2005-327107(JP,A)
【文献】特許第5542251(JP,B2)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06Q 30/00-30/08
G06F 40/56
(57)【特許請求の範囲】
【請求項1】
アイテムに関するターゲット情報を生成するコンピュータ実装方法であって、
前記コンピュータのプロセッサにより、サンプルデータ及び前記サンプルデータに対応するターゲットデータが含まれる異なる複数のサンプルデータセットを選択するステップと、
前記プロセッサにより、前記アイテムに関連する関連情報の入力を受けるステップと、
前記プロセッサにより、前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも1つのキーワードを含む、前記アイテムに関するターゲット情報を生成するステップと、
前記プロセッサにより、前記ターゲット情報に含めるサブキーワードに関連するテーマの選択を受けるステップと、を含む、
ことを特徴とする、方法。
【請求項2】
前記方法は、さらに、
前記プロセッサにより、前記異なる複数のサンプルデータセット及び前記関連情報を含むプロンプトを構成するステップと、
前記プロセッサにより、前記プロンプトを予め特定された大言語モデルの入力として処理するステップと、を含み、
前記ターゲット情報は、
前記大言語モデルの出力として生成される、
ことを特徴とする、請求項1に記載の方法。
【請求項3】
前記アイテムが商品に該当する場合、
前記サンプルデータセットに含まれるデータに対応する少なくとも1つのカテゴリーは、商品名、商品種類、ブランド、日付、レビュー、タグ、カラー、サイズ、及び、原産地、のうち少なくとも1つに該当する、
ことを特徴とする、請求項2に記載の方法。
【請求項4】
前記異なる複数のサンプルデータセットのそれぞれに、前記商品名に該当するカテゴリー及び前記レビューに該当するカテゴリーにそれぞれ対応するデータが含まれる場合、
前記ターゲット情報は、前記関連情報に関連するキーワード及び前記アイテムのレビューに関連するキーワードを含み、
前記異なる複数のサンプルデータセットのそれぞれに、前記商品名に該当するカテゴリー及び前記ブランドに該当するカテゴリーにそれぞれ対応するデータが含まれる場合、
前記ターゲット情報は、前記関連情報に関連するキーワード及び前記アイテムのブランドに関連するキーワードを含む、
ことを特徴とする、請求項3に記載の方法。
【請求項5】
前記方法は、さらに、
前記プロセッサにより、前記大言語モデルにより前記ターゲット情報が生成されることに基づいて、前記ターゲット情報が予め設定された検証基準を満たすか否かを判断するステップ、を含み、
前記予め設定された検証基準は、
前記ターゲット情報に含まれるテキストの長さ、前記ターゲット情報に予め設定された禁止語が含まれるか否か、及び、前記ターゲット情報と前記アイテムとの関連性の程度、のうち少なくとも1つに関するものである、
ことを特徴とする、請求項2~4のいずれか一項に記載の方法。
【請求項6】
前記判断の結果、前記ターゲット情報が前記予め設定された検証基準を満たしていない場合、
前記アイテムに関するターゲット情報を再生成するステップ、をさらに含む、
ことを特徴とする、請求項5に記載の方法。
【請求項7】
前記ターゲット情報を再生成するステップにおいては、
既に生成されたターゲット情報とは異なるターゲット情報が生成されるように、前記大言語モデルの少なくとも1つのインファレンスパラメータを調整する、
ことを特徴とする、請求項6に記載の方法。
【請求項8】
前記予め設定された検証基準を満たすターゲット情報が複数存在する場合、
前記複数のターゲット情報のそれぞれと前記アイテムとの類似度を判断し、
前記複数のターゲット情報のうち、前記アイテムとの類似度が最も高いいずれかのターゲット情報を、前記アイテムに関する最終のターゲット情報として決定する、
ことを特徴とする請求項5に記載の方法。
【請求項9】
前記類似度の判断は、
前記ターゲット情報と前記関連情報との類似度、及び、前記アイテムに関連して既に登録されたイメージと前記ターゲット情報との類似度の程度、のうち少なくとも一方に基づいて行う、
ことを特徴とする、請求項8に記載の方法。
【請求項10】
記ターゲット情報に前記テーマが選択されることに基づいて、前記ターゲット情報に前記テーマに関連するサブキーワードが含まれる確率が高くなる、
ことを特徴とする請求項1~9のいずれか一項に記載の方法。
【請求項11】
前記テーマが選択されることに基づいて、前記異なる複数のサンプルデータセットのそれぞれは、前記テーマに関連する単語が含まれるように構成される、
ことを特徴とする、請求項10に記載の方法。
【請求項12】
アイテムに関するターゲット情報を生成するシステムであって、
前記システムは、
サンプルデータ及び前記サンプルデータに対応するターゲットデータが含まれる異なる複数のサンプルデータセットを保存する保存部と、
前記アイテムに関連する関連情報及び前記複数のサンプルデータセットを用いて、前記関連情報に関連する少なくとも1つのキーワードを含む、前記アイテムに関するターゲット情報を生成するプロセスを実行する制御部と、
含み、
前記ターゲット情報に含めるサブキーワードに関連するテーマの選択を受ける、
ことを特徴とするシステム。
【請求項13】
サンプルデータ及び前記サンプルデータに対応するターゲットデータが含まれる異なる複数のサンプルデータセットの選択を受けるステップと、
アイテムに関連する関連情報の入力を受けるステップと、
前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも1つのキーワードを含む、前記アイテムに関するターゲット情報を生成するステップと、
前記ターゲット情報に含めるサブキーワードに関連するテーマの選択を受けるステップと、
を実行する、プログラム。
【請求項14】
アイテムに関するターゲット情報を生成するシステムであって、
前記システムは、
複数のサンプルデータセットを保存する保存部と、
ユーザの電子機器と通信する通信部と、
前記通信部を介して、前記ユーザの電子機器から少なくとも1つのカテゴリーにそれぞれ対応する関連情報の入力を受け、前記関連情報及び前記複数のサンプルデータセットを用いて、前記関連情報に関連する前記ターゲット情報が生成されるように大言語モデルと連動する制御部と、を含み、
前記制御部は、
前記ターゲット情報が前記ユーザの電子機器に出力されるように、前記通信部を介して、前記ターゲット情報を前記ユーザの電子機器に送信し、
前記ターゲット情報に含めるサブキーワードに関連するテーマの選択を受ける、
ことを特徴とする、システム。
【請求項15】
ターゲット情報を生成するコンピュータ実装方法であって、
前記コンピュータのプロセッサにより、通信部を介して、ユーザの電子機器から、特定のアイテムに関連する少なくとも1つのカテゴリーにそれぞれ対応する関連情報を受信するステップと、
前記プロセッサにより、複数のサンプルデータセットを選択するステップと、
前記プロセッサにより、サンプルデータ及び前記サンプルデータに対応する校正データがそれぞれ含まれる、異なる複数のサンプルデータセットを選択するステップと、
前記プロセッサにより、前記異なる複数のサンプルデータセット及び前記関連情報を含むプロンプトを構成するステップと、
前記プロセッサにより、前記プロンプトを予め特定された大言語モデルの入力として処理し、前記予め特定された大言語モデルから前記特定のアイテムに関するターゲット情報を取得するステップと、
前記プロセッサにより、前記ターゲット情報が前記ユーザの電子機器に出力されるように、前記通信部を介して、前記ターゲット情報を前記ユーザの電子機器に送信するステップと、
前記プロセッサにより、前記ターゲット情報に含めるサブキーワードに関連するテーマの選択を受けるステップと、
を含むことを特徴とする、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アイテムに関するターゲット情報を生成する方法及びシステムに関する。
【背景技術】
【0002】
人工知能の辞書的意味は、人間の学習能力、推論能力、知覚能力、自然言語理解能力などをコンピュータプログラムで実現した技術である。このような人工知能は、ディープラーニングにより飛躍的に発展してきた。
【0003】
特に、人工知能が発達するにつれて様々な言語モデル(Language Model)が開発されており、このような言語モデルは、テキストを認知し、その意味を理解するだけでなく、文書などのように膨大なテキストが含まれるデータから情報を抽出し、分類し、ひいては、直接テキストを生成するレベルに至っている。
【0004】
このような言語モデルは、様々な分野に積極的に用いられており、例えば、検索エンジン、文書作成(ex:履歴書作成、報告書作成、掲示物作成など)、様々なテーマに関する自由対話、与えられたテキストでのデータパース(ex:データ要約、分類など)、専門知識の提供、プログラミング、与えられた文章のスタイル変換などのように、テキストをベースとする様々な分野で用いられる。
【0005】
このような言語モデルに基づいて、従来人間が直接行っていた様々な業務の自動化を図ることができるようになった。特に、様々なサービス分野(例えば、ショッピングサービス、ニュースサービス、など)で人間により直接生成されるか、修正されていたテキストベースの作業の自動化が可能となった。よって、サービスの特性を加味して言語モデルを用いる方法に関する研究が必要である。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、様々なサービス分野に応じてカスタマイズされたターゲット情報を生成できるターゲット情報生成方法及びシステムを提供するためのものである。
【0007】
また、本発明は、ショッピングサービスに活用できるターゲット情報を生成するターゲット情報生成方法及びシステムを提供するためのものである。
【0008】
さらに、本発明は、言語モデル(Language Model、LM)を用いて、状況に適したテキストで構成された情報を生成できるターゲット情報生成方法及びシステムを提供するためのものである。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明によるターゲット情報生成方法は、特定のカテゴリーに該当するサンプルデータ及び前記サンプルデータに対応する校正データが一対(pair)としてそれぞれ含まれる異なる複数のサンプルデータセット(dataset)の入力を受けるステップと、前記特定のカテゴリーに該当し、アイテム(item)に関連する関連情報の入力を受けるステップと、前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも1つのキーワードを含むターゲット情報を生成するステップと、を含むようにしてもよい。
【0010】
また、本発明によるターゲット情報生成システムは、特定のカテゴリーに該当するサンプルデータ及び前記サンプルデータに対応する校正データが一対(pair)としてそれぞれ含まれる異なる複数のサンプルデータセット(dataset)を保存する保存部と、アイテム(item)に関連する関連情報及び前記複数のサンプルデータセットを用いて、前記関連情報に関連する少なくとも1つのキーワードを含むターゲット情報を生成するプロセスを実行する制御部と、を含むようにしてもよい。
【0011】
さらに、本発明による電子機器で1つ以上のプロセスにより実行され、コンピュータ可読記録媒体に格納されるプログラムは、特定のカテゴリーに該当するサンプルデータ及び前記サンプルデータに対応する校正データが一対(pair)としてそれぞれ含まれる異なる複数のサンプルデータセット(dataset)の入力を受けるステップ、前記特定のカテゴリーに該当し、アイテム(item)に関連する関連情報の入力を受けるステップ、並びに、前記複数のサンプルデータセット及び前記関連情報を用いて、前記関連情報に関連する少なくとも1つのキーワードを含むターゲット情報を生成するステップ、を実行させるコマンドを含むようにしてもよい。
【発明の効果】
【0012】
前述したように、本発明によるターゲット情報生成方法及びシステムは、サンプルデータセット及びアイテムに関連する関連情報が含まれるプロンプト(prompt)を入力とする言語モデルを用いて、アイテムに関するターゲット情報を生成することができる。本発明によるターゲット情報生成方法及びシステムにおいては、サンプルデータ及び前記サンプルデータに対応する校正データが一対として含まれるようにサンプルデータセットを構成することにより、言語モデルがプロンプトに基づいて校正データに対応する品質のターゲット情報を生成するように誘導することができる。
【0013】
よって、本発明によるターゲット情報生成方法及びシステムにより、アイテムに関連する関連情報に基づいて、校正データに対応する品質のターゲット情報を生成することができる。その結果、ユーザは、関連情報を校正もしくは修正してターゲット情報を生成するための作業を減らすことができ、業務効率を最大化することができる。
【図面の簡単な説明】
【0014】
図1】本発明によるターゲット情報生成方法及びシステムの活用例を説明するための概念図である。
図2】本発明によるターゲット情報生成システムを説明するための概念図である。
図3】本発明によるターゲット情報生成方法及びシステムで用いられるプロンプトを説明するための概念図である。
図4】本発明によるターゲット情報生成方法を説明するためのフローチャートである。
図5】本発明によるターゲット情報生成方法を説明するためのフローチャートである。
図6a】サンプルデータセット及びターゲット情報を説明するための概念図である。
図6b】サンプルデータセット及びターゲット情報を説明するための概念図である。
図6c】サンプルデータセット及びターゲット情報を説明するための概念図である。
図7】サンプルデータセット及びターゲット情報を説明するための概念図である。
図8】サンプルデータセット及びターゲット情報を説明するための概念図である。
図9a】サンプルデータセット及びターゲット情報を説明するための概念図である。
図9b】サンプルデータセット及びターゲット情報を説明するための概念図である。
図9c】サンプルデータセット及びターゲット情報を説明するための概念図である。
図10】サンプルデータセット及びターゲット情報を説明するための概念図である。
図11】サンプルデータセット及びターゲット情報を説明するための概念図である。
【発明を実施するための形態】
【0015】
以下、添付図面を参照して本発明の実施形態について詳細に説明するが、図面番号に関係なく、同一又は類似の構成要素には同一の符号を付し、それについての重複する説明は省略する。以下の説明で用いられる構成要素の接尾辞である「モジュール」や「部」は、明細書の作成を容易にするために付与又は混用されるものであり、それ自体が有意性や有用性を有するものではない。また、本発明の実施形態について説明するにあたり、関連する公知技術についての具体的な説明が本発明の実施形態の要旨を不明にすると判断される場合は、その詳細な説明を省略する。さらに、添付図面は本発明の実施形態の理解を助けるためのものにすぎず、添付図面により本発明の技術的思想が限定されるものではなく、本発明の思想及び技術範囲に含まれるあらゆる変更、均等物、乃至代替物を含むものと理解すべきである。
【0016】
「第1」、「第2」などのように序数を含む用語は、様々な構成要素を説明するために用いられるが、上記構成要素は上記用語により限定されるものではない。上記用語は、1つの構成要素を他の構成要素と区別する目的でのみ用いられる。
【0017】
ある構成要素が他の構成要素に「連結」又は「接続」されていると言及された場合は、他の構成要素に直接連結又は接続されていてもよく、中間に、さらに他の構成要素が存在してもよいものと解すべきである。それに対して、ある構成要素が他の構成要素に「直接連結」又は「直接接続」されていると言及された場合は、中間には、さらなる他の構成要素が存在しないものと解すべきである。
【0018】
単数の表現には、特に断らない限り複数の表現が含まれる。
【0019】
本明細書において、「含む」や「有する」などの用語は、本明細書に記載された特徴、数字、段階、動作、構成要素、部品、又はそれらの組み合わせが存在することを指定しようとするものであり、1つ又はそれ以上の他の特徴、数字、段階、動作、構成要素、部品、又はそれらの組み合わせの存在や付加可能性を予め排除するものではないと理解すべきである。
【0020】
前述したように、人工知能が発達するにつれて様々な言語モデルが開発されており、それに基づいて、従来人間が直接行っていた様々な業務の自動化を図ることができるようになった。特に、様々なサービス分野(例えば、ショッピングサービス、ニュースサービス、など)で人間により直接生成されるか、校正もしくは修正されていたテキストベースの作業の自動化が可能となった。本発明は、様々なサービス分野に応じてカスタマイズされた情報を生成できるターゲット情報生成方法及びシステムを提供するためのものである。
【0021】
本発明においては、説明の便宜上、「ターゲット情報」という用語を用いて、本発明によるターゲット情報生成方法及びシステムにより生成される情報を定義する。ただし、上記用語を自由に変更できることは言うまでもない。
【0022】
また、本発明における「ターゲット情報を生成する」とは、i)新たな情報を生成すること、および、ii)情報を校正もしくは修正すること、の両方を含む意味である。これは、情報の校正もしくは修正の結果物も情報の生成として捉えられるからである。
【0023】
なお、本発明によるターゲット情報生成方法及びシステムにおいては、アイテムを基準とし、アイテムに関するターゲット情報を生成するようにしてもよい。
【0024】
本発明におけるアイテムは、本発明が適用される分野に応じて様々に定義される。
【0025】
一例として、図1に示すように、本発明が適用される分野がショッピングサービス分野である場合、アイテムとは商品を意味する。この場合、本発明によるターゲット情報生成方法及びシステムにおいては、図1の(b)に示すように、アイテム、すなわち商品(例えば、靴や鞄など)に関するターゲット情報31a、32aを生成する。このようなターゲット情報31a、32aは、ショッピングサービスに活用される。また、ターゲット情報31a、32aは、図1の(b)に示すように、ショッピングサービスのためのショッピングサービスページ(例えば、ウェブページ又はアプリケーション(application)のページ)30に露出し、アイテムの商品名として活用され、または、アイテムを説明する用途に活用されるなど、様々に活用される。
【0026】
他の例として、本発明が適用される分野がニュースサービス分野である場合、アイテムとは記事(又は、ニュース記事)のコンテンツ(content)を意味する。この場合、本発明によるターゲット情報生成方法及びシステムにおいては、アイテム、すなわちニュース記事に関するターゲット情報を生成する。このようなターゲット情報は、ニュースサービスページ(例えば、ウェブページ又はアプリケーション(application)のページ)に露出し、アイテムのニュース記事のタイトル、ヘッドライン、アイテムを説明する用途に活用されるなど、様々に活用される。
【0027】
その他にも、本発明は、様々なサービス分野に活用され、本発明で生成されるターゲット情報は、アイテムのタイトル、アイテムに関する説明、アイテムに関する情報としての役割を果たす。
【0028】
一方、ターゲット情報は、アイテムに関連する情報に基づいて生成されてもよい。本発明においては、説明の便宜上、「アイテムに関連する情報」を「関連情報」とする。このような関連情報は、アイテムに関連して、少なくとも1つのサーバ(server)に保存(もしくは、登録)されるか、又は、少なくとも1つの保存部(もしくは、ストレージ)に保存された情報であってもよい。
【0029】
このような関連情報は、本発明によるシステム又は少なくとも1つの他のシステムにより生成された情報であってもよく、ユーザ又は管理者により入力された情報であってもよい。
【0030】
関連情報について例を挙げて説明すると、図1の(a)に示すように、関連情報は、アイテム(例えば、ショッピングアイテム又は商品)に関する様々な情報21、22のうち少なくとも1つであり、例えばアイテムの商品名21a、22aであってもよい。
【0031】
一例として、図1の(a)に示すように、第1アイテム(例えば、「靴」)に関する情報21のうち、第1関連情報21aは、第1アイテムの商品名である「サルヴァトーレ・シャッカフラワーヒールベルベットミュール01M90」である。
【0032】
他の例として、図1の(a)に示すように、第2アイテム(例えば、「鞄」)に関する情報22のうち、第2関連情報22aは、第2アイテムの商品名である「プリダ・SACCAサテンブラックショルダーバッグ・ブラック」である。
【0033】
なお、本発明によるターゲット情報生成方法及びシステムにおいては、前述したアイテムに関連する関連情報(例えば、第1関連情報21a、第2関連情報22a)を用いて、図1の(b)に示すように、ターゲット情報(例えば、第1ターゲット情報31a、第2ターゲット情報32b)を生成することができる。
【0034】
このように、本発明においては、関連情報を用いて様々なターゲット情報を生成することができ、当該ターゲット情報は、上記例のように、ショッピングアイテムの商品名やニュース記事のタイトルなどに活用することができる。
【0035】
一例として、本発明をショッピングアイテムの商品名校正器として活用する場合、関連情報のうち少なくとも一部には、ショッピングアイテムに関連する関連情報が含まれるようにしてもよく、本発明においては、それに基づいてショッピングアイテムに関するターゲット情報を生成することができる。
【0036】
他の例として、本発明をニュース記事のタイトル校正器として活用する場合、関連情報のうち少なくとも一部には、ニュース記事に関連する関連情報が含まれるようにしてもよく、本発明においては、それに基づいてニュース記事に関するターゲット情報を生成することができる。
【0037】
一方、関連情報に基づいて生成されるターゲット情報は、関連情報が属するカテゴリー(又は、関連情報の属性)と同じカテゴリー(又は、同じ属性)の情報であってもよい。すなわち、本発明においては、関連情報が属するカテゴリーと同じカテゴリーのターゲット情報を生成するようにしてもよい。この場合、ターゲット情報として取得したい特定のカテゴリーの情報が存在すると、本発明においては、関連情報として、前記特定のカテゴリーの情報を入力することにより、ターゲット情報を取得することができる。
【0038】
例えば、前述したように、関連情報がアイテムの商品名である場合、ターゲット情報は、アイテムの商品名であってもよい。
【0039】
また、関連情報に基づいて生成されるターゲット情報は、関連情報が属するカテゴリーとは異なるカテゴリーに属する情報であってもよいことは言うまでもない。本発明においては、ターゲット情報を生成するためのサンプルデータセットの構成を変化させることにより、必要な形態のターゲット情報を生成することができる。
【0040】
一方、本発明によるターゲット情報生成方法及びシステムにおいては、言語モデルを用いて、ターゲット情報を生成することができ、本発明においては、このような言語モデルを「大言語モデル」とする。なお、大言語モデルは、様々な用語で呼ばれ、本発明においては、その用語については特に限定しない。
【0041】
本発明で用いられる大言語モデルは、その種類が特に限定されるものではなく、様々な情報についての学習が行われた言語モデルであればよい。なお、近年盛んに研究されている大言語モデルは、フューショットラーニング(few-shot learning)などの方式を用いて、ファインチューニング(fine-tuning)することなく推論が可能な言語モデルであって、従来の一般言語モデルに比べてモデルサイズを100倍以上大きくすることができ、多くの量のデータを用いて学習が行われる。例えば、ハイパークローバ(HyperCLOVA)、GPT-3(Generative Pre-trained Transformer 3)などであり、本発明においても、これらの大言語モデルを用いることができる。
【0042】
本発明によるターゲット情報生成方法及びシステムにおいては、図1に示すように、大言語モデル10にアイテムに関連する関連情報及び追加情報(例えば、後述するサンプルデータセット)を入力することにより、ターゲット情報を生成することができる。
【0043】
以下、添付図面を参照して、本発明によるターゲット情報生成方法及びシステムについてより具体的に説明する。図2は、本発明によるターゲット情報生成システムを説明するための概念図であり、図3は、本発明によるターゲット情報生成方法及びシステムで用いられるプロンプトを説明するための概念図である。また、図4及び図5は、本発明によるターゲット情報生成方法を説明するためのフローチャートであり、図6a、図6b、図6c、図7図8図9a、図9b、図9c、図10、及び図11は、サンプルデータセット及びターゲット情報を説明するための概念図である。
【0044】
図2に示すように、本発明によるターゲット情報生成システム100は、入力部110、保存部120、及び制御部130の少なくとも1つを含んでもよい。また、図示していないが、本発明によるターゲット情報生成システム100は、通信部をさらに含んでもよい。通信部は、電子機器(又は、ユーザの電子機器)と通信を行うようにしてもよい。
【0045】
さらに、ターゲット情報生成システム100は、大言語モデル10と連動するようにしてもよい。すなわち、ターゲット情報生成システム100は、大言語モデル10を用いてターゲット情報を生成するものであり、ターゲット情報生成システム100の構成の少なくとも一部は、大言語モデル10への情報の入力を処理し、または、大言語モデル10から出力される情報を処理する役割を果たす。
【0046】
さらに、本発明によるターゲット情報生成システム100は、大言語モデル10を含むようにしてもよいことは言うまでもない。
【0047】
まず、入力部110は、大言語モデル10に入力されるプロンプトを構成する情報の入力又は選択を受ける役割を果たす。
【0048】
入力部110は、i)ユーザと本発明によるターゲット情報生成システム100、又は、ii)本発明によるターゲット情報生成システム100と少なくとも1つの他のシステムとを接続するインタフェース(interface)を含んでもよい。また、入力部110は、本発明によるターゲット情報生成システム100に含まれる構成要素間を接続するインタフェースを含んでもよい。
【0049】
本発明においては、大言語モデル10にプロンプト310を入力することにより、その結果物としてターゲット情報を取得することができる。ここで、プロンプト310は、図3の(a)に示すように、大言語モデル10に入力されるデータであり、様々なデータセットを含むようにしてもよい。
【0050】
プロンプト310は、少なくとも1つのサンプルデータセット311、312、及びターゲットデータセット313の少なくとも一方を含むようにしてもよい。
【0051】
ここで、サンプルデータセット311、312は、ターゲット情報を生成するために、大言語モデル10が参照するデータを含んでもよい。また、サンプルデータセット311、312は、各サンプルデータに関するターゲット情報をさらに含んでもよく、その詳細については後述する。
【0052】
ターゲットデータセット313は、ターゲット情報の生成の対象となるアイテムに関するデータを含んでもよい。前述したアイテムに関連する関連情報は、ターゲットデータセット313のデータとして含まれてもよい。すなわち、ターゲットデータセット313は、アイテムに関連する関連情報を含んでもよい。
【0053】
サンプルデータセット311、312、及びターゲットデータセット313に含まれるデータのそれぞれは、少なくとも1つのカテゴリー(又は、属性)に対応するようにしてもよい。
【0054】
また、サンプルデータセット311、312に含まれるデータのカテゴリー(又は、属性)と、ターゲットデータセット313に含まれるデータのカテゴリー(又は、属性)とは、少なくとも1つが同じであってもよい。例えば、ターゲットデータセット313に「商品名」カテゴリーが含まれる場合、サンプルデータセット311、312にも「商品名」カテゴリーが含まれるようにしでもよい。
【0055】
なお、本発明においては、上記例とは異なり、サンプルデータセット311、312に含まれるデータのカテゴリー(又は、属性)と、ターゲットデータセット313に含まれるデータのカテゴリー(又は、属性)とは、全て異なってもよいことは言うまでもない。
【0056】
さらに、サンプルデータセット311、312及びターゲットデータセット313を構成するデータは、それぞれのカテゴリー(又は、データタイプ、データ属性)に該当するデータフィールド(data filed)及びデータ値から構成されてもよい。
【0057】
データフィールドは、図3の(a)に示すように、「商品名」、「日付」、「校正文句」のように、データ値が示す意味又はデータ値の種類を定義するためのものである。このようなデータフィールドは、「カテゴリー名」、「データタイプ」、「データ属性」などと理解できる。
【0058】
一方、データフィールドは、大言語モデル10が認識できるように、事前に定義された規則に従うようにしてもよい。一例として、大言語モデル10は、「商品名:」に続いて入力されるデータを、「商品名」というデータフィールド(ex:カテゴリー)に該当するデータとして認識するようにしてもよい。
【0059】
他の例として、大言語モデル10は、特定のデータフィールド(例えば、「校正文句:」)に続いて入力されるデータを、該当データセットに含まれるデータ値に基づいて生成又は校正されたデータとして認識するようにしてもよい。
【0060】
例えば、図3の(a)に示すように、大言語モデル10は、特定のサンプルデータセット311に含まれる特定のデータフィールド(「校正文句:」)に対応するデータ値(「コーヒースター・タンブラー」)は、特定のサンプルデータセット311に含まれるサンプルデータ311a、311bに基づいて生成又は校正(もしくは、修正)されたデータとして認識するようにしてもよい。
【0061】
大言語モデル10と本発明によるターゲット情報生成システム100とは、様々なデータフィールドが有する意味及びデータ特性について、事前に定義された規則を共有するようにしてもよい。
【0062】
なお、本発明においては、プロンプト310の最後をデータフィールドにすることにより、それに対応するデータ値313dを、プロンプト310を入力とする大言語モデル10の出力として取得することができる。その結果、図3の(b)に示すように、「校正文句」データフィールド313cに対応するデータ値313d(「安全で快適なベッド」)を取得することができる。
【0063】
なお、データフィールドの名称は、状況に応じて適切な用語に変更できることは言うまでもない。
【0064】
プロンプト310は、異なるデータセットを区分するセパレータ(又は、区分データ、識別子)314を含んでもよい。セパレータ314は、同図に示すように「#####」で表してもよく、様々な文字や記号を用いて表してもよい。このようなセパレータ314は、大言語モデル10と事前に定義した規則に基づくようにしてもよい。大言語モデル10は、プロンプト310にセパレータ314が含まれる場合、セパレータ314の次にあるデータは、セパレータ314の前にあるデータとは異なるデータセットに含まれるデータとして認識する。
【0065】
次に、保存部120には、様々な情報が保存される。保存部120は、本発明によるターゲット情報生成システム100の内部又は外部の少なくとも一方に存在するようにしてもよい。保存部120は、サーバで構成されてもよく、クラウド方式のストレージで構成されてもよいことは言うまでもない。
【0066】
保存部120には、複数のサンプルデータセット及びターゲットデータセットの少なくとも一方に関するデータが保存されるようにしてもよい。保存部120には、プロンプト310に含まれるサンプルデータセットの他に、さらなる様々なサンプルデータセットが保存されるようにしてもよい。プロンプト310に含まれるサンプルデータセットは、保存部120に存在する様々なサンプルデータセットのうち、ユーザ又は制御部130により選択された少なくとも一部であってもよい。
【0067】
また、保存部120には、アイテムに関連する関連情報が保存されるようにしてもよい。制御部130は、保存部120に含まれるアイテムに関連する関連情報を用いて、ターゲットデータセットを構成することができる。
【0068】
次に、制御部130は、ターゲット情報を生成するための全般的な制御を行うことができる。例えば、制御部130は、大言語モデル10にプロンプト310が入力として処理されるように、大言語モデル10と連動することができる。また、本発明によるターゲット情報生成システム100は、大言語モデル10を一構成として含んでもよく、その場合、制御部130は、ターゲット情報の生成のために大言語モデル10に対する適切な制御を行うことができる。
【0069】
一方、制御部130は、大言語モデル10により生成されたターゲット情報の検証を行い、その検証の結果に基づいてターゲット情報を再生成する一連のプロセスを実行することができる。
【0070】
また、制御部130は、大言語モデル10により生成された複数のターゲット情報から少なくとも1つを最終的に選択し、または、最終選択のために複数のターゲット情報のそれぞれの意味分析を行うことができる。ここで、意味分析とは、複数のターゲット情報のそれぞれと関連情報との関連性の程度を判断することをいい、様々な方法に基づいて行うことができる。
【0071】
一方、大言語モデル10により生成されたターゲット情報は、保存部120に保存されるか、ユーザが確認できるように出力部(図示せず)に出力されるなど、状況に応じて適切に処理される。制御部130は、生成されたターゲット情報に関する処理を行い、例えば、ターゲット情報をユーザに対して視覚的に出力する場合、連動したディスプレイ部を用いてターゲット情報を出力することができる。例えば、出力部は、ユーザの電子機器に備えられたディスプレイ部であってもよい。
【0072】
本発明によるターゲット情報生成システム100は、ユーザの電子機器との通信により、ユーザの電子機器から関連情報が入力されるようにしてもよい。また、ターゲット情報生成システム100は、大言語モデル10を用いてユーザの電子機器から入力された関連情報に基づいてターゲット情報を生成し、それをユーザの電子機器に送信するようにしてもよい。
【0073】
ユーザの電子機器から入力された関連情報は、少なくとも1つのカテゴリーに関する情報であってもよい。
【0074】
例えば、本発明によるターゲット情報生成システム100がショッピングアイテムの商品名校正器として活用される場合、本発明によるターゲット情報生成システム100においては、ユーザの電子機器からショッピングアイテムに関連する少なくとも1つのカテゴリーに関する情報の入力を受けるようにしてもよい。ショッピングアイテムに関連する少なくとも1つのカテゴリーは、商品名、日付、レビュー、ブランド、カラー、サイズ、など様々である。
【0075】
ターゲット情報生成システム100は、ユーザの電子機器から入力された関連情報及び複数のサンプルデータセットを用いて、ターゲット情報を生成するようにしてもよい。
【0076】
ここで、複数のサンプルデータセットの選択は、ターゲット情報生成システム100の制御下で行われるようにしてもよく、ユーザの要求に基づいて行われるようにしてもよい。
【0077】
以下、前述した本発明によるターゲット情報生成システム100を参照して、ターゲット情報を生成する方法についてより具体的に説明する。
【0078】
図4に示すように、本発明においては、複数のサンプルデータセットを選択(又は、選定)する過程が行われる(S410)。ここで、複数のサンプルデータセットに含まれるデータは、プロンプトに含まれ、プロンプトは、大言語モデル10に入力され、ターゲット情報の生成に用いられる。
【0079】
サンプルデータセットを構成するデータについてより具体的に説明すると、サンプルデータセットは、異なる複数のカテゴリーにそれぞれ対応するデータを含んでもよい。
【0080】
ここで、カテゴリーは、データの意味、データの種類、データのタイプ、及びデータの属性の少なくとも1つを定義するためのものであり、例えば、図6aに示すような商品名611、日付612、校正文句613、図6bに示すような商品種類カテゴリー633、ブランド(brand)634、図6cに示すようなタグ(tag)655、など様々なカテゴリーが存在する。一方、上記列挙したカテゴリーのほとんどは、ショッピングサービスのカテゴリーであってもよい。このように、サンプルデータセットを構成するカテゴリーは、サンプルデータセットを構成するデータの内容によって様々である。
【0081】
例えば、サンプルデータセットを構成するデータの内容がニュース記事である場合、カテゴリーは、言論社、記事タイトル、日付、記事分野、コメント、校正文句、などから構成されてもよい。
【0082】
なお、本発明において、サンプルデータセットを構成するデータは、異なる特性を有するようにしてもよい。
【0083】
まず、サンプルデータセットを構成する第1特性のデータは、少なくとも1つのカテゴリーにそれぞれ対応するデータであり、本発明においては、それを「サンプルデータ」とする。
【0084】
本発明によるサンプルデータセットには、前述したサンプルデータ及びサンプルデータに対応するターゲット情報(又は、ターゲットデータ)が一対として含まれてもよい。ここで、ターゲット情報(又は、ターゲットデータ)を第2特性のデータとする。すなわち、サンプルデータセットには、ターゲット情報に該当するデータ(又は、ターゲットデータ、ターゲット文句)が含まれてもよい。
【0085】
本発明において、ターゲット情報に該当する「校正文句」カテゴリーのデータは、サンプルデータセットを構成するデータに基づいて生成又は校正(もしくは修正)された文句(又はテキスト、データ)である。ターゲット情報に該当する校正文句は、前述した第1特性のデータに基づいて生成又は校正された文句であってもよい。
【0086】
このように、サンプルデータセットに含まれるターゲット情報は、サンプルデータセットを構成するデータに基づいて生成又は校正することができる。ここで、ターゲット情報に該当するデータのカテゴリーは、サンプルデータに対応する少なくとも1つのカテゴリーと同じカテゴリーであってもよく、異なるカテゴリーであってもよい。
【0087】
ターゲット情報に該当するデータのカテゴリーがサンプルデータに対応する少なくとも1つのカテゴリーと同じ場合、例えば、第1特性のデータであるサンプルデータに商品名カテゴリーが含まれる場合、第2特性のデータである校正文句は、商品名カテゴリーに該当するデータであってもよい。一方、ターゲット情報カテゴリーに該当するデータは、本発明によるターゲット情報生成システム100により生成された情報であってもよく、ユーザ又は管理者により入力された情報であってもよい。
【0088】
ターゲット情報に該当するデータは、当該ターゲット情報に関するサンプルデータセットを構成するデータに関連するキーワードを少なくとも1つ含むようにしてもよい。ここで、キーワードは、サンプルデータセットを構成するデータに該当するテキスト(又は、トークン(token))の少なくとも一部と同一又は同様の意味を有するものであってもよい。
【0089】
ここで、「トークン」は、自然言語処理のために1つの単語を細分化した単語片からなる。韓国語の場合、単語は、平均して1つや2つのトークンからなる。例えば、「
(発音:マシッソ、意味:美味しい)」という表現は、それぞれ「
(マッ)」と「
(イッソ)」の2つのトークンに分けられる。
【0090】
例えば、図3の(a)に示すように、特定のサンプルデータセット310に「商品名」カテゴリーに該当するデータ(「コーヒースター・ステンレスTOGOカップタンブラー335ml」)331aが含まれる場合、ターゲット情報である校正文句は、「商品名」カテゴリーに含まれるデータの内容に関連するキーワードを含むデータ(「コーヒースター・タンブラー」)331cで構成される。
【0091】
このように、サンプルデータセットには、サンプルデータ及びサンプルデータに対応する校正文句(又は校正データ)が一対として含まれるようにしてもよい。
【0092】
ステップS410で選択された複数のサンプルデータセットのそれぞれには、少なくとも1つのカテゴリーにそれぞれ対応するサンプルデータが含まれるようにしてもよい。すなわち、サンプルデータセットには、1つ又はそれ以上のカテゴリーにそれぞれ対応するサンプルデータが含まれるようにしてもよい。
【0093】
よって、それぞれのサンプルデータセットには、図6a~図6cに示すように、第1カテゴリー(商品名)611、第2カテゴリー(日付)612、第3カテゴリー(商品種類)633、第4カテゴリー(ブランド)634、第5カテゴリー(タグ)655、などのように、様々なカテゴリーの少なくとも1つに該当するサンプルデータが含まれるようにしてもよい。
【0094】
例えば、図3の(a)に示すように、サンプルデータセット310には、「商品名」カテゴリーに該当するサンプルデータ311a、及び「日付」カテゴリーに該当するサンプルデータ311cが含まれる。
【0095】
なお、本発明において、ターゲット情報を生成するためにプロンプトに含まれるサンプルデータセットは、複数であってもよい。すなわち、ステップS410においては、複数のサンプルデータセットが選択されてもよい。本発明で選択されるサンプルデータの数は特に限定されない。
【0096】
一方、複数のサンプルデータセットのそれぞれに含まれるデータの内容は、ターゲット情報を生成するアイテムとの関連性がある内容であってもよい。例えば、アイテムが商品に関するものである場合、選択された複数のサンプルデータセットのそれぞれに含まれるデータの内容は、商品に関する内容であってもよい。
【0097】
また、ステップS410で選択された複数のサンプルデータセットのそれぞれに含まれるデータのカテゴリーは、互いに同じであってもよい。ステップS410においては、同じプロンプト内には同じカテゴリーを有するデータで構成された複数のサンプルデータセットが選択されるようにしてもよい。
【0098】
一例として、図6aに示すように、ステップS410で選択された複数のサンプルデータセット621、622、623のそれぞれには、商品名カテゴリー611、日付カテゴリー612、校正文句カテゴリー613に該当するデータが存在するようにしてもよい。
【0099】
他の例として、図6bに示すように、ステップS410で選択された複数のサンプルデータセット641、642、643のそれぞれには、商品名カテゴリー631、日付カテゴリー632、商品種類カテゴリー633、ブランドカテゴリー634、校正文句カテゴリー635に該当するデータが存在するようにしてもよい。
【0100】
さらに他の例として、図6cに示すように、ステップS410で選択された複数のサンプルデータセット661、662、663のそれぞれには、商品名カテゴリー651、日付カテゴリー652、商品種類カテゴリー653、ブランドカテゴリー654、タグカテゴリー655、校正文句カテゴリー656に該当するデータが存在するようにしてもよい。
【0101】
一方、上記例の他に、選択された複数のサンプルデータセットのそれぞれには、様々なカテゴリーにそれぞれ対応するデータが含まれるようにしてもよい。
【0102】
前述したように、ステップS410で選択された複数のサンプルデータセットのそれぞれは、互いに同じカテゴリーに該当するデータで構成されるが、図6a、図6b、及び図6cにおいて説明したように、複数のサンプルデータセットのそれぞれを構成するカテゴリーの数及び種類は特に限定されない。
【0103】
本発明において、ターゲット情報は、複数のサンプルデータセットを参照して生成されるので、複数のサンプルデータセットのそれぞれを構成するデータの内容によって、異なる内容を有するようになる。すなわち、大言語モデル10は、プロンプトに入力された複数のサンプルデータセットの内容に基づいて、ターゲット情報を生成するので、複数のサンプルデータセットを構成するデータの内容が異なると、異なるターゲット情報を生成するようになる。よって、図6a、図6b、及び図6cにおいて説明したように、サンプルデータを構成するカテゴリーの種類が異なると、異なるターゲット情報が生成される。すなわち、サンプルデータを構成するカテゴリーの種類によって、大言語モデル10の出力として生成されるターゲット情報が異なる。
【0104】
一例として、複数のサンプルデータセットのそれぞれに、商品名に該当するカテゴリー及びレビューに該当するカテゴリーにそれぞれ対応するデータが含まれる場合、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのレビューに関連するキーワードを含んでもよい。すなわち、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのレビューに関連するキーワードを含む確率が高くなる。
【0105】
ここで、アイテムのレビューに関連するキーワードは、サンプルデータセットを参照して生成されたものであってもよい。
【0106】
他の例として、複数のサンプルデータセットのそれぞれに、商品名に該当するカテゴリー及びブランドに該当する追加カテゴリーにそれぞれ対応するデータが含まれる場合、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのブランドに関連するキーワードを含んでもよい。すなわち、ターゲット情報は、アイテムに関連する関連情報に関連するキーワード及びアイテムのブランドに関連するキーワードを含む確率が高くなる。
【0107】
一方、ステップS410において、サンプルデータセットの選択は、制御部130の制御下で行われるようにしてもよく、ユーザ又は管理者の選択に基づいて行われるようにしてもよい。
【0108】
例えば、ユーザ又は管理者は、サンプルデータセットに含まれるカテゴリーを選択することができる。図7に示すように、サンプルデータセットのタイプ(以下、「サンプルデータタイプ」という)は、それぞれのサンプルデータセットに含まれるカテゴリーの種類によって複数のサンプルデータタイプに分けられる。
【0109】
例えば、サンプルデータタイプAは、図6aに示すカテゴリーである「商品名」、「日付」、「校正文句」のカテゴリー種類で構成され、サンプルデータタイプBは、図6bに示すカテゴリーである「商品名」、「日付」、「商品種類」、「ブランド」、「校正文句」のカテゴリー種類で構成される。
【0110】
制御部130は、ユーザ又は管理者により複数のサンプルデータタイプのいずれかが選択されると、図8に示すように、選択されたサンプルデータタイプに該当する異なる複数のサンプルデータセットをユーザ又は管理者に提供することができる。
【0111】
保存部120には、サンプルデータタイプ別に、それぞれマッチした異なる様々なサンプルデータセットが保存されるようにしてもよい。制御部130は、制御部の制御下で、ユーザ又は管理者の選択に基づいて、保存部120に保存されたサンプルデータセットのうち、ターゲット情報の生成のために用いられる複数のサンプルデータセットを特定することができる。
【0112】
なお、本発明においては、図8に示すように、ターゲット情報の生成のために選択できる様々なサンプルデータセットのそれぞれに関する様々な情報を管理することができる。
【0113】
例えば、制御部130は、サンプルデータセット別に、様々な指標に関する情報を保存することができる。ここで、指標は、サンプルデータセットが、ターゲット情報の生成のために大言語モデル10のプロンプトとして入力され、ターゲット情報の生成に用いられた場合、当該ターゲット情報を用いて達成する目標に関する指標であってもよい。例えば、アイテムが商品に関するものであり、ターゲット情報をショッピングサービスに活用する場合、ターゲット情報の目標は、消費者に当該商品に関心を持たせることであり、それはアイテムのクリック率や転換率などで評価される。
【0114】
制御部130は、ターゲット情報がサービス分野に活用される場合、ターゲット情報のモニタリングを行うことにより、ターゲット情報が目標を達成したかに関する評価を行うことができる。また、その評価の結果に関する指標を、ターゲット情報の生成時にプロンプトとして入力されたサンプルデータセットの指標として保存することができる。
【0115】
例えば、図8に示すように、保存部120は、それぞれのサンプルデータセット毎にクリック率指標がマッチングされて存在するようにしてもよい。よって、ユーザ又は管理者は、その指標に基づいて、サンプルデータセットを選択することができる。
【0116】
また、制御部130は、ユーザ又は管理者の選択がなくても、サンプルデータセットにそれぞれマッチされた指標に基づいて、ターゲット情報の生成に活用される複数のサンプルデータセットを選択又は推薦することができる。
【0117】
図8に示すように、制御部130は、クリック率の高いサンプルデータセットを優先的にターゲット情報の生成に活用されるサンプルデータとして選択することができる。
【0118】
一方、前述したように、ターゲット情報は、複数のサンプルデータセットのそれぞれを構成するデータの内容によって、異なる内容を有するようになる。すなわち、大言語モデル10は、プロンプトに入力された複数のサンプルデータセットの内容に基づいて、ターゲット情報を生成するので、選択された複数のサンプルデータセットの内容が異なると、異なるターゲット情報を生成するようになる。よって、本発明においては、様々な基準でサンプルデータセットを選択又は推薦することができる。
【0119】
以下、図6aに示す複数のサンプルデータセット621、622、623が選択された場合を例に説明する。
【0120】
図6aに示すように、複数のサンプルデータセット621、622、623が選択されると(S410)、本発明においては、複数のサンプルデータセット及びアイテムに関連する関連情報を含めてプロンプトを構成する過程が行われる(S420)。
【0121】
より具体的には、図5に示すように、プロンプトの構成のために、サンプルデータ及び校正データが一対としてそれぞれ含まれる異なる複数のサンプルデータセットの入力を受ける過程が行われる(S510)。
【0122】
図6aに示すように、ステップS410で選択された複数のサンプルデータセット621、622、623は、プロンプト620に入力される。
【0123】
次に、本発明においては、アイテムに関連する関連情報の入力を受ける過程が行われる(S520)。
【0124】
このような関連情報の入力を受ける過程は、関連情報を含むターゲットデータセットがプロンプトに入力される過程であるといえる。関連情報は、ユーザの電子機器から入力されるようにしてもよい。
【0125】
図6aに示すように、ターゲットデータセット624には、ターゲット情報の生成の対象となるアイテムに関するデータが含まれてもよい。
【0126】
ターゲットデータセット624には、ターゲット情報の生成に用いられる少なくとも1つのカテゴリーにそれぞれ対応するデータ624a、624bが含まれてもよい。また、ターゲットデータセット624には、ターゲット情報に該当するデータフィールド624cがさらに含まれてもよい。
【0127】
本発明によるターゲット情報生成システム100と大言語モデル10は、事前に定義された規則に従って、ターゲット情報に該当するデータフィールド(例えば、「校正文句:」)がプロンプト620に含まれる場合、ターゲット情報を生成させる命令として認識する。
【0128】
また、大言語モデル10は、ターゲットデータセット624に含まれるデータ624a、624bの少なくとも一部を用いて、ターゲット情報を生成することができる。
【0129】
一方、ターゲットデータセットに含まれるデータのカテゴリーは、ステップS410で選択されたサンプルデータセットに含まれるデータのカテゴリーと同じであってもよい(又は、対応するようにしてもよい)。また、ターゲットデータセット及びサンプルデータセットに含まれるデータのカテゴリーは、少なくとも1つが異なってもよいことは言うまでもない。さらに、ターゲットデータセット及びサンプルデータセットに含まれるデータのカテゴリーは、全て異なってもよい。
【0130】
ターゲットデータセット及びサンプルデータセットに含まれるデータのカテゴリーが同じ(対応する)場合を例に説明する。
【0131】
一例として、図6aに示すように、サンプルデータセット621、622、623に、「商品名」、「日付」カテゴリーにそれぞれ該当するデータが含まれる場合、ターゲットデータセット624にも、「商品名」、「日付」カテゴリーに該当するデータ624bが含まれる。
【0132】
他の例として、図6bに示すように、サンプルデータセット641、642、643に、「商品名」、「日付」、「商品種類」、「ブランド」カテゴリーにそれぞれ該当するデータが含まれる場合、ターゲットデータセット644にも、「商品名」、「日付」、「商品種類」、「ブランド」カテゴリーに該当するデータ644bが含まれる。
【0133】
さらに他の例として、図6cに示すように、サンプルデータセット661、662、663に、「商品名」、「日付」、「商品種類」、「ブランド」、「タグ」カテゴリーにそれぞれ該当するデータが含まれる場合、ターゲットデータセット664にも、「商品名」、「日付」、「商品種類」、「ブランド」、「タグ」カテゴリーに該当するデータ664bが含まれる。
【0134】
ステップS510及びステップS520において複数のサンプルデータセット及び関連情報が入力されると、ターゲット情報を生成する過程が行われる。
【0135】
より具体的には、複数のサンプルデータセット及び関連情報が入力されると、複数のサンプルデータセット及び関連情報を用いて、前記関連情報に関連する少なくとも1つのキーワードを含むターゲット情報を生成する過程が行われる(S530)。
【0136】
ステップS530は、図4に示すステップS430に対応するものであり、制御部130は、ターゲット情報の生成のために、構成されたプロンプトを大言語モデル10の入力として処理することができる。
【0137】
本発明において、ターゲット情報は、大言語モデル10の出力として生成されるようにしてもよい。
【0138】
大言語モデル10の出力として生成されたターゲット情報は、前述したように、ユーザの電子機器に送信されるようにしてもよい。よって、ユーザの電子機器のディスプレイ部にターゲット情報を出力(表示)することができる。
【0139】
制御部130は、大言語モデル10と連動して、又は、大言語モデル10に対する制御を行うことにより、ターゲット情報を出力させることができる。
【0140】
図9a、図9b、及び図9cに示すように、プロンプト810、820、830により、ターゲット情報811b、821b、831bを出力することができる。大言語モデル10の出力は、同図に示すように、プロンプト810、820、830により取得することができる。
【0141】
なお、本発明において、ターゲット情報には、関連情報に関連する少なくとも1つのキーワードが含まれ、キーワードは、関連情報に含まれる。ここで、キーワードとは、複数の単語の少なくとも一部と同一又は類似の意味を有する単語をいう。
【0142】
大言語モデル10においては、ターゲットデータセットに含まれる関連情報に基づいて、ターゲット情報が生成されるので、関連情報と同一又は類似の内容がターゲット情報に含まれるようにターゲット情報を生成することができる。このようなターゲット情報は、関連情報が校正もしくは修正されたものであると概念的に理解できる。
【0143】
例えば、図6aに示すように、関連情報624aとして「フリルズ・アクアイージークリーンファブリック生地ファミリベッド」がプロンプトに入力されると、図9aに示すように、ターゲット情報811bとして「ファミリベッド用ファブリックシーツ」が生成される。ターゲット情報811bは、「ファミリ」、「ベッド」、「ファブリック」のように、関連情報624aの少なくとも一部と同一又は類似の内容を含むようにしてもよい。
【0144】
このように、制御部130は、複数のサンプルデータセット及びターゲットデータセットに基づいて、ターゲット情報が生成されるように、大言語モデル10に対する適切な制御を行うことができる。
【0145】
一方、制御部130は、複数のサンプルデータセット及びターゲットデータセットに基づいて生成されるターゲット情報に、特定のテーマに関連するキーワード(以下、「サブキーワード」という)が含まれるようにすることができる。
【0146】
例えば、制御部130は、図10に示すように、ターゲット情報1024aに「季節」関連テーマが含まれるようにしてもよく、図11に示すように、ターゲット情報1124aに「割引」関連テーマが含まれるようにしてもよい。
【0147】
そのために、制御部130は、特定のテーマに関連するターゲット情報を生成するために、前記特定のテーマに該当するキーワードが含まれるサンプルデータセットを選択(又は、生成)することができる。
【0148】
一例として、図10に示すように、「季節」をテーマとしてターゲット情報を生成する場合、サンプルデータセット1021、1022、1023の各サンプルデータに関するターゲット情報(「校正文句」カテゴリー)には、「夏」、「サマー」、「春」のように、「季節」をテーマとするキーワードが多数含まれる。
【0149】
他の例として、図11に示すように、「割引」をテーマとしてターゲット情報を生成する場合、サンプルデータセット1121、1122、1123の各サンプルデータに関するターゲット情報(「校正文句」カテゴリー)には、「セール」、「割引」のように、「割引」をテーマとするキーワードが多数含まれる。このような特定のテーマは、様々な方法で特定することができ、例えば、アイテムが属するサービス分野における様々な統計資料、最近の社会イシュー、最近のニュース、ユーザの選択、など様々な方法で特定することができる。
【0150】
ユーザの選択に基づいて特定のテーマを特定する方法について説明すると、次の通りである。本発明においては、ターゲット情報に含めるサブキーワードに関連するテーマの選択を受ける過程が行われるようにしてもよい。テーマの選択を受ける時点は、ステップS410~ステップS430の少なくとも1つの過程から選択されてもよく、本発明においては、それについては特に限定しない。
【0151】
また、テーマの選択は、ターゲット情報が生成された後に行われることも可能である。この場合、制御部130は、生成されたターゲット情報に、選択されたテーマに該当するサブキーワードが含まれるか否かを判断し、判断の結果、サブキーワードが含まれない場合、ターゲット情報の再生成を行うようにしてもよい。
【0152】
一方、選択されたテーマに基づいてターゲット情報が生成された場合、本発明においては、ターゲット情報に選択されたテーマに関連するサブキーワードが含まれる確率が高くなる。
【0153】
一例として、図10に示すように、「季節」関連テーマが選択された場合、ターゲット情報1024aには、季節(例えば、「夏」)に関連するサブキーワード(例えば、「夏」、「アクア」)が含まれる。
【0154】
他の例として、図11に示すように、「割引」関連テーマが選択された場合、ターゲット情報1124aには、割引に関連するサブキーワード(例えば、「割引」)が含まれる。
【0155】
一方、テーマの選択が、ステップS410又はステップS420のように、サンプルデータセットを選択する過程又はサンプルデータセットをプロンプトに入力する過程で行われた場合、制御部130は、プロンプトに入力されるサンプルデータセットのそれぞれに、選択されたテーマに関連する単語が含まれるようにしてもよい。
【0156】
この場合、制御部130は、サンプルデータセットのそれぞれに、選択されたテーマに関連する内容を含むデータ及び選択されたテーマに関連する内容を含むデータと一対をなす校正文句に該当するデータに、選択されたテーマに関連する単語が含まれるように、サンプルデータセットを選択又は入力するようにしてもよい。
【0157】
一方、大言語モデル10は、サンプルデータセットに含まれるデータとそれに対応する校正文句間のパターン(又は、規則)に基づいて、ターゲット情報を生成するが、そのパターン(又は、規則)は整形化されないこともあるので、本発明においては、それについて特に限定しない。
【0158】
次に、前述したようにターゲット情報が生成されると、本発明においては、ターゲット情報の検証を行う過程が行われる(S440)。
【0159】
制御部130は、大言語モデル10によりターゲット情報が生成されることに基づいて、ターゲット情報が予め設定された検証基準を満たすか否かを判断することができる。
【0160】
ここで、予め設定された検証基準は、様々に設定することができる。例えば、予め設定された検証基準は、ターゲット情報に含まれるテキストの長さ及びターゲット情報に予め設定された禁止語が含まれるか否かの少なくとも一方に関するものであってもよい。
【0161】
一例として、モバイル画面や所定長さの画面に表示するテキストを生成するために、予め設定された検証基準として、ターゲット情報を構成するテキストは、予め設定された数の字(例えば、20字)を超えるか否かを判断するように設定してもよい。
【0162】
制御部130は、ターゲット情報が生成されると、生成されたターゲット情報が予め設定された数の字を超えるか否かを判断する。
【0163】
判断の結果、生成されたターゲット情報が予め設定された字の数を超える場合、制御部130は、生成されたターゲット情報が予め設定された検証基準を満たしていないと判断する。予め設定された時の数が20字であり、ターゲット情報に含まれるテキストが22字である場合、制御部130は、ターゲット情報が予め設定された検証基準を満たしていないと判断する。
【0164】
他の例として、予め設定された検証基準として、ターゲット情報を構成するテキストに予め設定された禁止語が含まれるか否かを判断するように設定してもよい。判断の結果、生成されたターゲット情報に予め設定された禁止語が含まれる場合、制御部130は、生成されたターゲット情報が予め設定された検証基準を満たしていないと判断する。予め設定された禁止語の設定は、制御部130の制御下で、ユーザ又は管理者の要求により行われるようにしてもよい。予め設定された禁止語には、アイテムが属する取引業界の公正取引を害する用語、俗語などがある。
【0165】
このように、判断の結果、ターゲット情報が予め設定された検証基準を満たしていない場合、制御部130は、アイテムに関するターゲット情報を再生成する過程を行うことができる。
【0166】
すなわち、制御部130は、既に生成されたターゲット情報とは異なるターゲット情報が生成されるように、大言語モデル10に対する適切な制御を行うことができる。制御部130は、大言語モデル10に対して、ターゲット情報の再生成を要求する信号を送信することができる。
【0167】
一方、制御部130は、既に生成されたターゲット情報とは異なるターゲット情報が生成されるように、大言語モデル10の少なくとも1つのインファレンスパラメータ(inference parameter)を調整することができる。
【0168】
インファレンスパラメータは、大言語モデル10の出力値を変更する因子であり、大言語モデル10で処理されるトークンに関連する確率値を調整する因子である。
【0169】
大言語モデル10は、確率に基づいてターゲット情報を生成するモデルからなり、大言語モデル10におけるインファレンスパラメータの調整は、ターゲット情報として選択されるトークンに対する確率の調整を意味する。よって、インファレンスパラメータの調整により、ターゲット情報を再生成する際に、既に生成されたターゲット情報に含まれるトークンとは異なるトークンが含まれる確率が高くなる。
【0170】
大言語モデル10に関連するインファレンスパラメータは様々である。一例として、第1インファレンスパラメータ(例えば、Top Pサンプリング)は、トークンの累積確率値に関するものであってもよい。大言語モデル10においては、第1インファレンスパラメータとして、予め設定された確率値に基づいて、予め設定された確率値に該当するトークンに対してのみ、ターゲット情報として含まれ得るトークンの候補として選択することができる。例えば、第1インファレンスパラメータの値が0.8に予め設定された場合、大言語モデル10は、上位80%に含まれるトークンに対してのみ、ターゲット情報として含まれ得るトークンの候補として選択することができる。
【0171】
よって、制御部130は、第1インファレンスパラメータを調整することにより、ターゲット情報として含まれ得るトークンの範囲を変更することができ、その結果、ターゲット情報を再生成する際に、既に生成されたターゲット情報とは異なるターゲット情報が生成されるように誘導することができる。
【0172】
他の例として、第1インファレンスパラメータとは異なる第2インファレンスパラメータ(例えば、Temperature)は、確率分布に加重値の変化を与えてターゲット情報として生成される文章の多様性を調整する値に関するものであってもよい。例えば、第2インファレンスパラメータの値が低く設定されると、ターゲット情報として含まれ得るトークン(「候補トークン」ともいう)の順位は変更されないが、ターゲット情報として含まれる確率が高いトークンは確率値がさらに高くなり、ターゲット情報として含まれる確率が低いトークンは確率値がさらに低なる。第2インファレンスパラメータの値が高くなるほど、ターゲット情報として含まれる可能性が最も高い順位のトークンが選択される確率が高くなる。
【0173】
制御部130は、前述した第1インファレンスパラメータ及び第2インファレンスパラメータの少なくとも一方、又は大言語モデル10に関連する様々なインファレンスパラメータを変更することにより、ターゲット情報として含まれ得るトークンに関連する確率を調整することができる。よって、本発明においては、ターゲット情報を再生成する際に、既に生成されたターゲット情報と同じターゲット情報が生成されることを避けることができる。
【0174】
一方、制御部130は、ターゲット情報が再生成されると、再生成されたターゲット情報に対して、上記ステップS440を同様に行うことができる。すなわち、制御部130は、再生成されたターゲット情報が予め設定された検証条件を満たすか否かを判断し、再生成されたターゲット情報が予め設定された検証条件を満たしていない場合、ターゲット情報の再生成を再び行うことができる。
【0175】
このとき、制御部130は、ターゲット情報の再生成を予め設定された回数だけ行い、ターゲット情報の再生成を予め設定された回数だけ行ったにもかかわらず、再生成されたターゲット情報が予め設定された検証条件を満たしていない場合、ステップS410で選択された複数のサンプルデータセットに基づくターゲット情報の再生成を行わないようにしてもよい。
【0176】
例えば、予め設定された回数を3回とすると、制御部130は、ターゲット情報の再生成回数が3回になるまで、大言語モデル10のインファレンスパラメータを調整してターゲット情報の再生成を行う。この場合、再生成回数が3回になる前でも、再生成されたターゲット情報が予め設定された検証条件を満たすと、ターゲット情報の再生成はそれ以上行わないようにしてもよい。
【0177】
また、制御部130は、ターゲット情報の再生成を予め設定された回数だけ行ったにもかかわらず、再生成されたターゲット情報が予め設定された検証条件を満たしていない場合、ステップS410で選択された複数のサンプルデータの少なくとも1つを変更し、ターゲット情報の生成過程を再び行うようにしてもよい。
【0178】
さらに、制御部130は、前記関連性の程度が予め設定された基準を満たしている場合、前記ターゲット情報を前記アイテムに関するターゲット情報として用いるようにしてもよい。さらに、制御部130は、前記関連性の程度が前記予め設定された基準を満たしていない場合、前記ターゲット情報を再生成するようにしてもよい。
【0179】
制御部130は、様々なサービス分野にターゲット情報を用いる(又は、活用する)ことができ、例えばショッピングサービス分野にターゲット情報を活用する場合、ターゲット情報を、ショッピングサービスのウェブページ又はアプリケーションのページに露出するように処理することができる。
【0180】
一方、ターゲット情報とアイテムとの関連性の程度が予め設定された基準を満たすか否かは、アイテムの関連情報とターゲット情報間のベクトルベースの類似度の程度に基づいて判断することができる。ここで、ベクトルベースの類似度を判断する方法は非常に様々であり、本発明においては、それについて特に限定しない。ここで、類似度の程度は、ターゲット情報がアイテムに関連する関連情報の内容を反映する程度に関するものであってもよい。
【0181】
一方、制御部130は、類似度の程度が予め設定された基準を満たしていない場合、前述した方式でターゲット情報の再生成を行うようにしてもよい。また、制御部130は、類似度の程度が予め設定された基準を満たしている場合、ターゲット情報を最終的にアイテムに関するターゲット情報として選択するようにしてもよい。
【0182】
さらに、ターゲット情報とアイテムとの関連性の程度が予め設定された基準を満たすか否かは、アイテムに関連するイメージとターゲット情報との類似度の程度に基づいて判断することができる。アイテムに関連するイメージは、アイテムに関連して保存部120又は少なくとも1つの外部サーバに保存又は登録されたイメージであってもよい。例えば、アイテムがショッピングアイテム(例えば、「靴」)である場合、制御部130は、アイテムに関連するイメージ(例えば、ショッピングアイテムに関連する「靴の写真」)とターゲット情報との類似度を判断し、アイテムに関連するイメージとターゲット情報との類似度の程度を判断するようにしてもよい。また、制御部130は、類似度の程度が予め設定された基準を満たしている場合、ターゲット情報を最終的にアイテムに関するターゲット情報として選択するようにしてもよい。ここで、類似度の程度は、ターゲット情報がアイテムに関連するイメージに該当する内容を反映する程度に関するものであってもよい。
【0183】
一方、制御部130は、上記ステップS410及びステップS440を複数回行うことにより、異なるターゲット情報をそれぞれ生成することができる。
【0184】
このとき、本発明においては、予め設定された検証条件を満たすターゲット情報から特定のターゲット情報を選択する過程が行われる(S450、図4参照)ようにしてもよい。すなわち、制御部130は、検証をパスしたターゲット情報から特定のターゲット情報を最終的に選択するようにしてもよい。
【0185】
制御部130は、選択されるサンプルデータセットを変化させ、異なるターゲット情報を生成することができる。例えば、図6a、図6b、及び図6cに示すように、制御部130は、異なるサンプルデータセットが含まれるプロンプト620、640、660を用いて、図9a、図9b、及び図9cに示すように、異なるターゲット情報811b、821b、831bをそれぞれ生成する。このとき、異なるターゲット情報の生成のために選択される異なるサンプルデータセットは、図6a、図6b、及び図6cに示すように、少なくとも1つのカテゴリーに該当するデータ(例えば、商品名カテゴリーに該当するデータ)は同じであってもよい。
【0186】
これとは異なり、異なるターゲット情報の生成のために選択される異なるサンプルデータセットは、サンプルデータセットを構成するデータの内容が全て異なるものであってもよい。
【0187】
このように、ステップS410及びステップS440を複数回行い、異なる複数のターゲット情報(例えば、図9の811b、821b、831b)が存在する場合、制御部130は、複数のターゲット情報のいずれかを最終的に選択することができる。最終的に選択されたターゲット情報は、前述したターゲット情報が活用されるサービス分野に活用することができる。例えば、ターゲット情報がショッピングサービス分野に活用される場合、最終的に選択されたターゲット情報は、ウェブページ又はアプリケーションのページに露出するように処理することができる。
【0188】
一方、ターゲット情報の最終選択のために、制御部130は、複数のターゲット情報のそれぞれが、前述した予め設定された検証基準を満たす場合、複数のターゲット情報のそれぞれとアイテムとの関連性の程度を判断する過程を行うようにしてもよい。
【0189】
例えば、制御部130は、前記予め設定された検証基準を満たすターゲット情報が複数存在する場合、複数のターゲット情報のそれぞれとアイテムに関連する関連情報との類似度を判断するようにしてもよい。
【0190】
また、制御部130は、前記複数のターゲット情報のうち、前記関連情報との類似度が最も高いいずれかのターゲット情報を、アイテムに関する最終のターゲット情報として決定するようにしてもよい。ここで、ターゲット情報と関連情報との類似度の判断については前述したので省略する。
【0191】
さらに、制御部130は、前記関連性の程度の判断において、前記複数のターゲット情報のそれぞれとアイテムに関連するイメージとの類似度の程度を判断し、類似度が最も高い特定のターゲット情報をアイテムに関する最終のターゲット情報として決定するようにしてもよい。
【0192】
前述したように、本発明によるターゲット情報生成方法及びシステムは、サンプルデータセット及びアイテムに関連する関連情報が含まれるプロンプトを入力とする言語モデルを用いて、アイテムに関するターゲット情報を生成することができる。本発明によるターゲット情報生成方法及びシステムにおいては、サンプルデータ及び前記サンプルデータに対応する校正データが一対として含まれるようにサンプルデータセットを構成することにより、言語モデルがプロンプトに基づいて校正データに対応する品質のターゲット情報を生成するように誘導することができる。
【0193】
よって、本発明によるターゲット情報生成方法及びシステムにより、アイテムに関連する関連情報に基づいて、校正データに対応する品質のターゲット情報を生成することができる。その結果、ユーザは、関連情報をターゲット情報で校正もしくは修正するための作業を減らすことができ、業務効率を最大化することができる。
【0194】
一方、前述した本発明は、コンピュータで1つ以上のプロセスにより実行され、コンピュータ可読媒体(又は、記録媒体)に格納可能なプログラムとして実現することができる。
【0195】
また、前述した本発明は、プログラム記録媒体にコンピュータ可読コード又はコマンドとして実現することができる。すなわち、本発明は、プログラムの形態で提供することができる。
【0196】
一方、コンピュータ可読媒体は、コンピュータシステムにより読み取り可能なデータが記録されるあらゆる種類の記録装置を含む。コンピュータ可読媒体の例としては、HDD(Hard Disk Drive)、SSD(Solid State Disk)、SDD(Silicon Disk Drive)、ROM、RAM、CD-ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ記憶装置、などが挙げられる。
【0197】
また、コンピュータ可読媒体は、ストレージを含み、電子機器が通信によりアクセスできるサーバ又はクラウドストレージであり得る。この場合、コンピュータは、有線又は無線通信により、サーバ又はクラウドストレージから本発明によるプログラムをダウンロードすることができる。
【0198】
さらに、本発明において、前述したコンピュータは、プロセッサ、すなわち中央処理装置(Central Processing Unit, CPU)が搭載された電子機器であり、その種類は特に限定されない。
【0199】
一方、本発明の詳細な説明は例示的なものであり、あらゆる面で制限的に解釈されてはならない。本発明の範囲は添付の特許請求の範囲の合理的解釈により定められるべきであり、本発明の等価的範囲内でのあらゆる変更が本発明の範囲に含まれる。
【符号の説明】
【0200】
100 ターゲット情報生成システム
110 入力部
120 保存部
130 制御部
図1
図2
図3
図4
図5
図6a
図6b
図6c
図7
図8
図9a
図9b
図9c
図10
図11