IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特許7551970人工知能モデル更新方法、装置、電子デバイス及び記憶媒体
<>
  • 特許-人工知能モデル更新方法、装置、電子デバイス及び記憶媒体 図1
  • 特許-人工知能モデル更新方法、装置、電子デバイス及び記憶媒体 図2
  • 特許-人工知能モデル更新方法、装置、電子デバイス及び記憶媒体 図3
  • 特許-人工知能モデル更新方法、装置、電子デバイス及び記憶媒体 図4
  • 特許-人工知能モデル更新方法、装置、電子デバイス及び記憶媒体 図5
  • 特許-人工知能モデル更新方法、装置、電子デバイス及び記憶媒体 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-09
(45)【発行日】2024-09-18
(54)【発明の名称】人工知能モデル更新方法、装置、電子デバイス及び記憶媒体
(51)【国際特許分類】
   G06N 3/08 20230101AFI20240910BHJP
   G06F 16/90 20190101ALI20240910BHJP
【FI】
G06N3/08
G06F16/90 100
【請求項の数】 10
(21)【出願番号】P 2023002287
(22)【出願日】2023-01-11
(65)【公開番号】P2024002884
(43)【公開日】2024-01-11
【審査請求日】2023-01-11
(31)【優先権主張番号】202210728915.9
(32)【優先日】2022-06-24
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】ワン、ファン
(72)【発明者】
【氏名】バオ、シキ
(72)【発明者】
【氏名】ウ、フア
(72)【発明者】
【氏名】ニウ、ゼンユ
(72)【発明者】
【氏名】ヘ、ジンジョウ
(72)【発明者】
【氏名】ワン、ハイフェン
【審査官】山本 俊介
(56)【参考文献】
【文献】特開2021-152961(JP,A)
【文献】特開2019-215483(JP,A)
【文献】特表2022-503838(JP,A)
【文献】米国特許出願公開第2021/0082398(US,A1)
【文献】韓国公開特許第10-2020-0031245(KR,A)
【文献】中国特許出願公開第109074502(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 16/90
(57)【特許請求の範囲】
【請求項1】
人工知能モデルの更新方法であって、
対話システムが、ユーザと自然なインタラクションを行って、いずれか一つの訓練サンプルに対して行われたM(Mは1より大きい正整数である)回の対話内容を含むインタラクション内容を取得することと、
前記対話システムが、前記訓練サンプルに対する前記ユーザとの対話が終了したと判定されたことに応答して、前記インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、前記更新ルールを利用して前記処理すべきモデルを更新することと、
を含み、
前記更新ルールは、前記処理すべきモデルのニューロン状態および/またはニューロン接続の更新方式情報を含み、
前記更新ルールを利用して前記処理すべきモデルを更新することは、前記更新ルールを利用して前記処理すべきモデルのニューロン状態及び/又はニューロン接続を更新することを含む、
人工知能モデルの更新方法。
【請求項2】
いずれ一回の対話内容は、ユーザ入力内容及び前記ユーザ入力内容に対して生成された応答をそれぞれ含み、
前記応答は、取得された前記処理すべきモデルの前記ニューロン状態及び前記ニューロン接続の情報に基づいて生成される応答を含む、
請求項に記載の人工知能モデルの更新方法。
【請求項3】
前記対話システムが、前記処理すべきモデルの予測結果であって前記更新ルールを用いて更新された前記処理すべきモデルによって生成された前記訓練サンプルの予測結果を取得し、前記予測結果に従って更新する、ことを更に含む、
請求項1または2に記載の人工知能モデルの更新方法。
【請求項4】
前記対話システムと前記処理すべきモデルは2つの独立したモデルであり、
あるいは、前記対話システムと前記処理すべきモデルは同一のモデルに統合される、
請求項1または2に記載の人工知能モデルの更新方法。
【請求項5】
対話システムに適用される人工知能モデルの更新装置であって、インタラクションモジュールと第1更新モジュールとを備え、
前記インタラクションモジュールは、ユーザと自然なインタラクションを行って、いずれか一つの訓練サンプルに対して行われたM(Mは1より大きい正整数である)回の対話内容を含むインタラクション内容を取得し、
前記第1更新モジュールは、前記訓練サンプルに対する前記ユーザとの対話が終了したと判定されたことに応答して、前記インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、前記更新ルールを利用して前記処理すべきモデルを更新前記更新ルールは、前記処理すべきモデルのニューロン状態および/またはニューロン接続の更新方式情報を含み、
前記更新ルールを利用して前記処理すべきモデルを更新することは、前記更新ルールを利用して前記処理すべきモデルのニューロン状態及び/又はニューロン接続を更新することを含む、
人工知能モデルの更新装置。
【請求項6】
いずれか一回の対話内容は、ユーザ入力内容及び前記ユーザ入力内容に対して生成された応答をそれぞれ含み、
前記応答は、取得された前記処理すべきモデルの前記ニューロン状態及び前記ニューロン接続の情報に基づいて生成される応答を含む、
請求項に記載の人工知能モデルの更新装置。
【請求項7】
前記処理すべきモデルの予測結果であって前記更新ルールを用いて更新された前記処理すべきモデルによって生成された前記訓練サンプルの予測結果を取得し、前記予測結果に従って前記対話システムを更新する第2更新モジュールを更に備える、
請求項5または6に記載の人工知能モデルの更新装置。
【請求項8】
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備え、
前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶されており、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに請求項1に記載の人工知能モデルの更新方法を実行させる電子デバイス。
【請求項9】
コンピュータに請求項1に記載の人工知能モデルの更新方法を実行させるためのコンピュータコマンドを記憶した非一時的なコンピュータ可読記憶媒体。
【請求項10】
プロセッサにより実行されると、請求項1に記載の人工知能モデルの更新方法を実現するコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、人工知能技術の分野に関し、特にディープラーニング及び自然言語処理などの分野における人工知能モデル更新方法、装置、電子デバイス及び記憶媒体に関する。
【背景技術】
【0002】
技術の発展に伴い、訓練で得られたディープラーニングモデルは、画像分類モデルを用いて画像を分類したり、感情認識モデルを用いてテキスト文を感情認識したりするなど、さまざまな場面で活用されるようになってきている。モデルのパフォーマンスを向上させるために、既存のモデルを最適化するなど、モデルを更新できる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本開示は、人工知能モデル更新方法、装置、電子機器及び記憶媒体を提供する。
【課題を解決するための手段】
【0004】
対話システムがユーザと自然なインタラクションを行って、いずれか一つの訓練サンプルに対して行われたM(Mは1より大きい正整数である)回の対話内容を含むインタラクション内容を取得し、前記対話システムが前記訓練サンプルに対する前記ユーザとの対話が終了したと判定されたことに応答して、前記インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、前記更新ルールを利用して前記処理すべきモデルを更新することを含む人工知能モデル更新方法が提供される。
【0005】
対話システムに適用され、インタラクションモジュールと第1更新モジュールとを備えており、前記インタラクションモジュールは、ユーザと自然なインタラクションを行って、いずれか一つの訓練サンプルに対して行われたM(Mは1より大きい正整数である)回の対話内容を含むインタラクション内容を取得し、前記第1更新モジュールは、前記訓練サンプルに対する前記ユーザとの対話が終了したと判定されたことに応答して、前記インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、前記更新ルールを利用して前記処理すべきモデルを更新する人工知能モデル更新装置が提供される。
【0006】
少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されたメモリとを備え、前記メモリに前記少なくとも1つのプロセッサにより実行可能なコマンドが記憶され、前記コマンドが前記少なくとも1つのプロセッサにより実行されると、前記少なくとも1つのプロセッサに前記方法を実行させる電子デバイスが提供される。
【0007】
コンピュータに前記方法を実行させるためのコンピュータコマンドを記憶した非一時的なコンピュータ可読記憶媒体が提供される。
【0008】
プロセッサにより実行されると、前記方法を実現するコンピュータプログラム/コマンドを含むコンピュータプログラム製品が提供される。
【0009】
理解すべきなのは、本セクションで説明される内容は、本開示の実施形態の重要な又は肝心な特徴を標識することでもなく、本開示の範囲を制限することでもない。本開示の他の特徴は、以下の明細書により容易に理解されるであろう。
【図面の簡単な説明】
【0010】
図面は、本技術案をより良く理解するためのものであり、本願に制限されない。図面において、
図1】本開示に記載された人工知能モデル更新方法の実施形態のフローチャートである。
図2】本開示に記載された対話システム及び処理すべきモデルが2つの独立したモデルである場合の実施形態の概略図である。
図3】本開示に記載された対話システム及び処理すべきモデルが同一のモデルに統合される場合の実施形態の概略図である。
図4】本開示に記載された人工知能モデル更新装置の第1実施形態400の構成の概略図である。
図5】本開示に記載された人工知能モデル更新装置の第2実施形態500の構成の概略図である。
図6】本開示の実施形態を実施可能な電子デバイス600の概略的なブロック図である。
【発明を実施するための形態】
【0011】
以下、図面に基づいて、本出願の例示的な実施例を説明する。理解を容易にするために、本出願の実施例の様々な詳細が含まれており、それらは単なる例示と見なされるべきである。従って、当業者は、本出願の範囲及び精神から逸脱することなく、本明細書に記載の実施形態に対して様々な変更及び修正を行うことができることを認識するはずである。同様に、簡明のために、以下の説明では、よく知られた機能と構造の説明は省略される。
【0012】
さらに、本明細書における用語「及び/又は」は、単に関連オブジェクトを記述する関連関係であり、3つの関係が存在し得ると意味する。例えば、A及び/又はBは、Aが単独で存在し、AとBが同時に存在し、Bが単独で存在するという三つの状況を意味することができる。また、本明細書における文字「/」は、一般的に前後の関連オブジェクトが「又は」の関係にあることを意味する。
【0013】
図1は、本開示に記載された人工知能モデル更新方法の実施形態のフローチャートである。図1に示すように、以下の具体的な実現方式が含まれる。
【0014】
ステップ101において、対話システムは、ユーザと自然なインタラクションを行って、いずれか一つの訓練サンプルに対して行われたM回の対話内容を含むインタラクション内容を取得する。Mは1より大きい正整数である。
【0015】
ステップ102において、対話システムは、前記訓練サンプルに対するユーザとの対話が終了したと判定されたことに応答して、インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、前記更新ルールを利用して処理すべきモデルを更新する。
【0016】
従来方式では、モデルを更新する必要がある場合、一般的に収集された訓練サンプルに基づいてモデルを更新する一方、上述した方法の実施形態に記載された技術案によれば、ユーザとの自然なインタラクションが可能となり、インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、さらに、更新ルールに基づいて処理すべきモデルを更新することが可能となり、即ちユーザが自然なインタラクションだけでモデルに対する更新の目的を実現でき、訓練サンプルの収集や標識などが不要となり、人的・時間的コストの削減と処理効率の向上を実現し、さらに、モデルの更新を行うことでモデルの性能の向上などが可能となる。
【0017】
上述した方法の実施形態に記載された技術案は、画像分類及び感情認識のような様々な場面に適用することができる。たとえば、画像分類の場面における画像分類モデルについて、上述した方法の実施形態に記載された技術案に従って画像分類モデルを更新可能であり、さらに更新された画像分類モデルを用いて画像分類を行うことができるため、分類結果の正確性が向上した。感情認識の場面における感情認識モデルについて、上述した方法の実施例に記載された技術案に従って感情認識モデルを更新可能であり、更に更新された感情認識モデルを利用して感情認識を行うことができるため、認識結果の正確性が向上した。
【0018】
実際の応用では、対話システムは、専門家等のようなユーザと自然なインタラクションを行ってインタラクション内容を取得し、インタラクション内容に基づいて、処理すべきモデルの更新ルールを決定することができる。
【0019】
前記インタラクション内容は、いずれか一つの訓練サンプルに対して行われたM回の対話内容を含むことができる。Mは1より大きい正整数である。それに応じて、当該訓練サンプルに対するユーザとの対話が終了したと判定されたことに応答して前記更新ルールを生成することができる。
【0020】
前記インタラクション内容は、以下のように例示することができる。
【0021】
1)画像分類の場面
一セットの新しいデータにおける画像分類モデルによる効果が良くないと仮定すると、ユーザは次のように対話システムと自然なインタラクションを行うことができる。
ユーザ:「こんにちは、あなたの効果はこのピクチャでは良くないです」。同時にピクチャaのような対応するピクチャを添付する。
対話システム:「このピクチャについて、叶と茎の形から見るとポトスとすべてマッチしているため、私の分類はポトスです」。
ユーザ:「このピクチャは実際にオウゴンカズラです。金色のしま模様がありますから」。
対話システム:「オウゴンカズラというタイプは今まで接触したことがありませんが、ポトスの一種ですか?」。
ユーザ:「いいえ、ポトスに属しません」。
対話システム:「新しいタイプであるオウゴンカズラ、その特徴及びその金色のしま模様について記録しました。二度と同じ過ちを犯すことはありません」。
ユーザ:「次はこちらのピクチャです…」。
以上からわかるように、ピクチャaという訓練サンプルについて、ユーザは対話システムと複数回の対話を行っており、ピクチャaに対するユーザとの対話が終了したと判定された場合には、前記複数回の対話内容に基づいて更新ルールを生成することができる。
ここで、ユーザにより表現された「次はこちらのピクチャです...」によれば、ピクチャaに対するユーザとの対話が終了したことを判定することができる。
【0022】
2)感情認識の場面
この場面では、ユーザは次のように対話システムと自然なインタラクションを行うことができる。
ユーザ:「「この店は、行った人は皆知っています。見るとすぐに宵越しのご飯を吐き出してしまう」という言葉について、あなたが分類した感情はどうして「中性」になるのでしょうか?」。
対話システム:「「行った人は皆知っています」という言葉は60%がポジティブになると思いますが、後ろの「宵越しのご飯を吐き出してしまう」はネガティブのように見えるので、中性に分類しました」。
ユーザ:「違いますね。「宵越しのご飯を吐き出してしまう」は明らかにネガティブです。前の「行った人は皆知っています」は単独ではポジティブかネガティブかわかりませんが、後の言葉を合わせると明らかな批判になります」。
対話システム:「「行った人は皆知っています」の本当の意味は文脈に依存するという意味?」。
ユーザ:「そうですよね」。
対話システム:「覚えました。修正しました」。
以上からわかるように、「この店は、行った人は皆知っています。見るとすぐに宵越しのご飯を吐き出してしまう」という訓練サンプルについて、ユーザは対話システムと複数回の対話を行っており、当該訓練サンプルに対するユーザとの対話が終了したと判定された場合に、前記複数回の対話内容に基づいて更新ルールを生成することができる。
複数回の対話内容を組み合わせることにより、ユーザの発話した意味をよりよく理解することができるため、生成される更新規則の正確性を向上させることができる。
【0023】
さらに、取得された更新ルールを用いて、処理すべきモデルを更新することができる。本開示の一実施形態では、処理すべきモデルを更新することは、処理すべきモデルのニューロン状態及び/又はニューロン接続を更新することを意味することができる。つまり、更新ルールを利用して、処理すべきモデルのニューロンの状態及び/又は接続を直接に恒久的に変更することにより、モデル更新の効果を達成し、簡単かつ便利に実現することができる。
【0024】
本開示の一実施形態では、いずれか一回の対話内容には、ユーザ入力内容と、ユーザ入力内容に対して生成された応答とがそれぞれ含まれて良い。ここで、前記応答は、取得された処理すべきモデルのニューロン状態及びニューロン接続情報に基づいて生成された応答を含んで良い。
【0025】
例えば、以下は一回の対話内容である。
ユーザ:「こんにちは、あなたの効果はこのピクチャでは良くないです」。同時にピクチャaのような対応するピクチャを添付する。
対話システム:「このピクチャについて、叶と茎の形から見るとポトスとすべてマッチしているため、私の分類はポトスです」。
ここで、「ユーザ」に対応する内容はユーザ入力内容であり、「対話システム」に対応する内容はユーザ入力内容に対して生成された応答であり、例えば取得された処理すべきモデルのニューロン状態やニューロン接続情報と合わせて、ピクチャの分類結果がポトスであることを判定し、それに応じて前記応答を生成することができる。
【0026】
つまり、処理すべきモデルに状態読み取りを行ってそのニューロン状態及びニューロン接続情報を取得し、さらに前記情報に基づいてユーザ入力内容に応じた応答を正確に生成することが可能となり、対話の質の向上などを図ることができる。
【0027】
実際の応用では、対話システムにエンコーダとデコーダを含めることができ、取得されたインタラクション内容に対して、エンコーダを用いて符号化などの処理を行って必要な更新ルールを得ることができる。また、デコーダを用いてユーザ入力内容に対する応答などを生成することができる。
【0028】
前記更新ルールの具体的な形態は限定されない。例えば、上記の例の「オウゴンカズラ」をピクチャaのラベルとして、対応する目的関数や学習率などを同時に生成し、これらの情報を更新ルールとし、この更新ルールによりグラジエントバック方式を用いて処理すべきモデルのニューロン状態及び/又はニューロン接続を更新することができる。別の例として、処理すべきモデルにより読み込まれるように、ニューロン状態及び/又はニューロン接続の更新方式を直接に生成してメモリ(memory)に格納し、それに応じてニューロン状態及び/又はニューロン接続を更新する。
【0029】
実際の応用では、更新ルールにより、処理すべきモデルのニューロン状態のみを更新することも、処理すべきモデルのニューロン接続のみを更新することも可能であり、また、処理すべきモデルのニューロン状態とニューロン接続を同時に更新することも、実際の必要に応じて可能である。
【0030】
本開示の一実施形態では、対話システムは、処理すべきモデルの予測結果を取得し、前記予測結果に従って更新することができる。ここで、前記予測結果は、更新ルールを使用して更新された処理すべきモデルによって生成された前記訓練サンプルの予測結果である。
【0031】
前述したように、前記インタラクション内容は、いずれか一つの訓練サンプルに対して行われるM回の対話内容を含むことができる。従って、更新ルールを用いて処理すべきモデルを更新した後、更に更新された処理すべきモデルを用いて当該訓練サンプルを処理し、例えば前記ピクチャaに画像分類を行うことにより、予測結果、すなわちピクチャaの画像分類結果を得ることができる。それに応じて、対話システムは、この予測結果を取得し、この予測結果に基づいて、強化学習などの方式に基づいて対話システムの更新を行い、例えばエンコーダやデコーダの更新などを行うことができる。
【0032】
依然としてピクチャaを例として、更新ルールを使用して処理すべきモデルを更新した後、理論的にはモデルの性能が向上するため、処理すべきモデルを用いてピクチャaを再予測すると、得られた予測結果は以前と異なる可能性がある。例えば、以前の予測結果はポトスである場合、再予測結果はポトスである可能性もあり、オウゴンカズラである可能性もある。もし再予測結果が依然としてポトスである場合に、生成された更新ルールは正確ではない可能性があることを示し、それに応じて対話システムを更新して、後続で生成された更新ルールの正確性を向上させることができる。
【0033】
つまり、上記の処理により、対話システムの更新を実現し、すなわち対話システムの性能を向上可能であり、さらに対話システムに基づいて生成される更新ルールの正確性を向上し、それに応じてモデルの更新効果などを向上することができる。
【0034】
本開示の一実施形態では、対話システム及び処理すべきモデルは、2つの独立したモデルであってもよく、同一のモデル内に統合されてもよい。具体的にどのような方法を採用するかは、実際の必要に応じて決定でき、非常に柔軟で便利である。
【0035】
図2は、本開示に記載された対話システム及び処理すべきモデルが2つの独立したモデルである場合の実現方式の概略図である。図2に示すように、対話システムには、エンコーダ及びデコーダが含まれてよい。対話システムは情報を受信し、即ち自然言語(例えば、ユーザが入力した文字)、ピクチャ、音声などを含めるユーザ入力内容を取得し、且つ情報を出力し、即ちユーザ入力内容に対する応答を生成してユーザと対話を行うことができる。ここでは、状態の読み取りにより、得られた処理すべきモデルのニューロン状態及びニューロン接続情報に基づいて応答を生成することができる。また、対話システムは、ユーザとの複数回の対話内容から更新ルールを生成し、更新ルールを用いて処理すべきモデルのニューロン状態及び/又はニューロン接続を更新することができる。さらに、更新された処理すべきモデルに複数回の対話内容に対応する訓練サンプルを入力して予測結果を得、予測結果を用いて対話システムを更新することもできる。
【0036】
上記の処理すべきモデルは、既に使用されている最適化すべきモデル、使用されていないが予めある程度の訓練を受けているモデル、訓練されていないモデルなど、任意のモデルであってもよい。
【0037】
図3は、本開示に記載された対話システム及び処理すべきモデルが同一のモデル内に統合される場合の実現方式の概略図である。図2に示した方式と比較して、実現原理は同じであるが、対話システムと処理すべきモデルとの間の情報のやりとりがインプリシットであるのみである。また、図面を簡略化するために、「訓練サンプル」と「予測結果」は示されていない。
【0038】
なお、前述の方法の実施形態について、説明の簡素化のため、実施例を一連の動作の組み合わせとして表現したが、当業者であればわかるように、本出願による幾らかのステップは他の順序に従って又は同時に実行することができるため、本出願は記述された動作の順序に制限されない。次に、当業者は、明細書に記述された実施例はいずれも好ましい実施例に該当し、関連する動作及びモジュールは必ずしも本出願によって必要とされないことを理解すべきである。
【0039】
要するには、本開示の方法の実施形態に記載された技術案によれば、ユーザは、自然なインタラクションの方法だけでモデルを更新する目的を達成することができ、ひいてはモデルの性能を向上させることができる。更に、前記更新方法は、簡単で便利である、モデルが実際の変化及びニーズ等に迅速に適応するようにすることができる。
【0040】
以上は、方法の実施形態についての説明であり、以下では、装置の実施形態を介して、本開示に記載された技術案についてさらに説明する。
【0041】
図4は、本開示に記載された人工知能モデル更新装置の第1実施形態400の構成図である。前記装置は、対話システムに適用することができる。図4に示すように、インタラクションモジュール401及び第1更新モジュール402を備える。
【0042】
インタラクションモジュール401は、ユーザと自然なインタラクションを行っていずれか一つの訓練サンプルに対して行われたM回の対話内容を含むインタラクション内容を取得する。Mは1より大きい正整数である。
【0043】
第1更新モジュール402は、前記訓練サンプルに対するユーザとの対話が終了したと判定されたことに応答して、前記インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、前記更新ルールを利用して処理すべきモデルを更新する。
【0044】
上述した装置の実施形態に記載された技術案によれば、ユーザとの自然なインタラクションが可能となり、インタラクション内容に基づいて処理すべきモデルの更新ルールを決定し、さらに、更新ルールに基づいて処理すべきモデルを更新することが可能となり、即ちユーザが自然なインタラクションだけでモデルに対する更新の目的を実現でき、訓練サンプルの収集や標識などが不要となり、人的・時間的コストの削減と処理効率の向上を実現し、さらに、モデルの更新を行うことでモデルの性能の向上などが可能となる。
【0045】
第1更新モジュール402は、取得された更新ルールを利用して処理すべきモデルを更新することができる。本開示の一実施形態では、処理すべきモデルを更新することは、処理すべきモデルのニューロン状態及び/又はニューロン接続を更新することを意味することができる。つまり、更新ルールを利用して、処理すべきモデルのニューロンの状態及び/又は接続を直接に恒久的に変更することにより、モデル更新の効果を達成することができる。
【0046】
つまり、更新ルールにより、処理すべきモデルのニューロン状態のみを更新してもよく、処理すべきモデルのニューロン接続のみを更新してもよく、処理すべきモデルのニューロン状態とニューロン接続を同時に更新してもよく、実際の必要に応じて決定すれば良い。
【0047】
本開示の一実施形態では、いずれか一回の対話内容には、ユーザ入力内容と、ユーザ入力内容に対して生成された応答とがそれぞれ含まれて良い。ここで、前記応答は、取得された処理すべきモデルのニューロン状態及びニューロン接続情報に基づいて生成された応答を含んで良い。
【0048】
つまり、処理すべきモデルに対して状態の読み取りを行ってそのニューロン状態及びニューロン接続情報を取得し、さらに前記情報に基づいてユーザ入力内容に応じた応答を生成することができる。
【0049】
図5は、本開示に記載された人工知能モデル更新装置の第2実施形態500の構成の概略図である。前記装置は、対話システムに適用することができる。図5に示すように、インタラクションモジュール401と、第1更新モジュール402と、第2更新モジュール403とを備える。
【0050】
ここで、インタラクションモジュール401及び第1更新モジュール402は、図4に示された実施形態と同じであり、これ以上説明しない。
【0051】
第2更新モジュール403は、処理すべきモデルの予測結果を取得し、予測結果に従って対話システムを更新する。ここで、前記予測結果は、更新ルールを用いて更新された処理すべきモデルによって生成された前記訓練サンプルの予測結果である。
【0052】
前述したように、前記インタラクション内容は、いずれか一つの訓練サンプルに対して行われるM回の対話内容を含むことができる。従って、更新ルールを用いて処理すべきモデルを更新した後、更に更新された処理すべきモデルを用いて当該訓練サンプルを処理し、例えば前記ピクチャaに画像分類を行うことにより、予測結果、すなわち画像aの画像分類結果を得ることもできる。それに応じて、第2更新モジュール403は、この予測結果を取得し、この予測結果に基づいて強化学習などの方式に従って対話システムを更新することができる。
【0053】
図4及び図5に示される装置の実施形態の具体的なワークフローは、前述の方法の実施形態における関連説明を参照することができ、これ以上説明しない。
【0054】
要するには、本開示の装置の実施形態に記載された技術案によれば、ユーザは、自然なインタラクションの方法だけでモデルを更新する目的を達成することができるため、モデルの性能を向上させることができる。更に、前記更新方法は、簡単で便利であるため、モデルが実際の変化及びニーズ等に迅速に適応するようにすることができる。
【0055】
本出願に記載された技術案は、人工知能の分野に適用することができ、特にディープラーニング及び自然言語処理等の分野に関する。人工知能は、コンピュータが人間の思考過程と知能行為(例えば学習、推理、思考、計画など)をシミュレートすることを研究する学科であり、ハードウェアレベルの技術とソフトウェアレベルの技術の両方がある。人工知能のハードウェア技術には、一般的に、例えばセンサ、専用人工知能チップ、クラウドコンピューティング、分散ストレージ、ビッグデータ処理等の技術が含まれる。人工知能のソフトウェア技術は、主にコンピュータビジョン技術、音声認識技術、自然言語処理技術及び機械学習/ディープラーニング、ビッグデータ処理技術、知識マップ技術等のいくつかの方向を含む。
【0056】
また、本開示の実施形態におけるインタラクション内容は、特定のユーザを対象としたものではなく、特定のユーザの個人情報を反映したものではない。また、本開示の方法の実施主体は、様々な開示、法令に準拠した方法で前記インタラクション内容を取得し、例えばユーザの許可を得てユーザ側から取得したりすることができる。
【0057】
本開示の技術案において、関わるユーザの個人情報の取得、記憶、応用、加工、伝送、提供及び配信等は、いずれも関連法律法規の規定に適合しており、公序良俗に反するものではない。
【0058】
本開示の実施形態によれば、本開示は更に電子デバイス、可読記憶媒体、及びコンピュータプログラム製品を提供する。
【0059】
図6は、本開示の実施形態を実施するために使用され得る電子デバイス600の模式的なブロック図である。電子デバイスは、ラップトップ、デスクトップコンピュータ、ワークベンチ、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような、様々な形態のデジタルコンピュータを表す。電子デバイスは更に、PDA、携帯電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。本明細書に示す構成要素、それらの接続及び関係、ならびにそれらの機能は、単なる一例であり、本明細書に記載及び/又は要求された本開示の実現を制限することではない。
【0060】
図6に示すように、デバイス600は、読み取り専用メモリ(ROM)602に記憶されたコンピュータプログラム、又は記憶手段608からランダムアクセスメモリ(RAM)603にロードされたコンピュータプログラムに従って、様々な適切な動作及び処理を実行することができる演算手段601を含む。RAM603には、デバイス600の動作に必要な各種のプログラムやデータが記憶されてもよい。演算手段601、ROM602及びRAM603は、バス604を介して接続されている。入出力(I/O)インターフェース605もバス604に接続されている。
【0061】
例えばキーボード、マウス等の入力手段606と、例えば様々なタイプのディスプレイ、スピーカ等の出力手段607と、例えば磁気ディスク、光ディスク等の記憶手段608と、例えばネットワークカード、モデム、無線通信トランシーバなどの通信手段609を含むデバイス600の複数の構成要素は、I/Oインターフェース605に接続される。通信手段609は、デバイス600が例えばインターネットのコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して他のデバイスと情報/データを交換することを可能にする。
【0062】
演算手段601は、処理能力及び演算能力を有する様々な汎用及び/又は専用の処理コンポーネントであってよい。演算手段601のいくつかの例は、中央処理ユニット(CPU)、グラフィック処理ユニット(GPU)、様々な専用の人工知能(AI)演算チップ、機械学習モデルアルゴリズムを実行する様々な演算ユニット、デジタル信号プロセッサ(DSP)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを含むが、これらに限定されない。演算手段601は、上述した様々な方法及び処理、例えば本開示に記載の方法を実行する。例えば、幾つかの実施形態では、本開示に記載の方法は、例えば記憶手段608のような機械可読媒体に物理的に組み込まれたコンピュータソフトウェアプログラムとして実装されてもよい。幾つかの実施形態では、コンピュータプログラムの一部又は全部は、ROM602及び/又は通信手段609を介してデバイス600にロード及び/又はインストールすることができる。コンピュータプログラムがRAM603にロードされ、演算手段601により実行されると、本開示に記載の方法の1つ又は複数のステップを実行することができる。代替的に、他の実施形態では、演算手段601は、本開示に記載の方法を実行するように、他の任意の適切な方法で(例えば、ファームウェアを介する)構成されてもよい。
【0063】
本明細書で前述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、専用集積回路(ASIC)、専用標準製品(ASSP)、システムオンチップシステム(SOC)、ロードプログラマブル論理デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はこれらの組み合わせにおいて実装されてもよい。これらの様々な実施形態は、1つ又は複数のコンピュータプログラムで実施されることを含んで良い。当該1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行及び/又は解釈することができる。当該プログラマブルプロセッサは、専用又は汎用のプログラマブルプロセッサであって、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、当該記憶システム、当該少なくとも1つの入力装置、及び当該少なくとも1つの出力装置にデータ及び命令を転送することができる。
【0064】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせを用いて記述することができる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供することにより、プログラムコードがプロセッサ又はコントローラにより実行されると、フローチャート及び/又はブロック図に指定された機能/動作を実行するようにすることができる。プログラムコードは、全てがマシン上で実行されても良く、一部がマシン上で実行されても良く、スタンドアロンパッケージとして一部的にマシン上で実行され且つ一部的にリモートマシン上で実行され、或いは全てがリモートマシン又はサーバ上で実行されても良い。
【0065】
本開示の文脈では、機械可読媒体は、有形の媒体であって、命令実行システム、装置又はデバイスにより使用され、或いは命令実行システム、装置又はデバイスと合わせて使用されるプログラムを含むか記憶することができる。機械可読媒体は、機械可読信号媒体又は機械可読記憶媒体であってよい。機械可読媒体は、電子的、磁気的、光学的、電磁気的、赤外線的、又は半導体的なシステム、装置又はデバイス、あるいはこれらの任意の適切な組み合わせを含んで良いが、これらに限定されない。機械可読記憶媒体のより具体的な例は、1つ又は複数のラインに基づく電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、携帯型コンパクトディスク読み取り専用メモリ(CD‐ROM)、光学記憶装置、磁気記憶装置、又はこれらの任意の適切な組み合わせを含む。
【0066】
ユーザとのインタラクションを提供するために、本明細書に記載されたシステム及び技術は、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)と、ユーザにより入力をコンピュータに提供するキーボード及びポインティングデバイス(例えば、マウス又はトラックボール)と備えるコンピュータ上に実施されてよい。他の種類の装置は、ユーザとのインタラクションを提供するためにも使用され得る。例えば、ユーザに提供されるフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であって良く、ユーザからの入力を任意の形式(音入力、音声入力、又は触覚入力を含む)で受信して良い。
【0067】
本明細書に記載されたシステム及び技術は、バックエンド構成要素を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア構成要素を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド構成要素を含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースもしくはウェブブラウザを有するクライアントコンピュータであり、ユーザは、当該グラフィカルユーザインターフェースもしくは当該ウェブブラウザを通じて本明細書で説明されるシステムと技術の実施形態とインタラクションすることができる)、そのようなバックエンド構成要素、ミドルウェア構成要素、もしくはフロントエンド構成要素の任意の組合せを含むコンピューティングシステムに実施されることが可能である。システムの構成要素は、任意の形態又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されることが可能である。通信ネットワークの例は、ローカルエリアネットワーク(「LAN」)、ワイド・エリア・ネットワーク(「WAN」)、インターネットワークを含む。
【0068】
コンピュータシステムは、クライアントとサーバーを含み得る。クライアントとサーバーは、一般的に互いから遠く離れており、通常は、通信ネットワークを通じてインタラクトする。クライアントとサーバとの関係は、相応するコンピュータ上で実行され、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生じる。サーバはクラウドサーバであっても良く、分散システムのサーバであっても良く、ブロックチェーンを組み合わせたサーバであってもよい。
【0069】
以上で示された様々な形式のフローを使用して、ステップを並べ替え、追加、又は削除できることを理解されたい。例えば、本出願に説明される各ステップは、並列の順序又は順次的な順序で実施されてもよいし、又は異なる順序で実行されてもよく、本出願で開示された技術案の望ましい結果が達成できる限り、ここで制限されない。
【0070】
上記の具体的な実施形態は本出願の保護範囲に対する制限を構成しない。設計要件及び他の要因に従って、様々な修正、組み合わせ、部分的組み合わせ及び置換を行うことができることを当業者は理解するべきである。本出願の精神及び原則の範囲内で行われる修正、同等の置換、改善は、何れも本出願の保護範囲内に含まれるべきである。
図1
図2
図3
図4
図5
図6