(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023182480
(43)【公開日】2023-12-26
(54)【発明の名称】情報処理装置、情報処理方法および情報処理プログラム
(51)【国際特許分類】
G06F 16/90 20190101AFI20231219BHJP
G06Q 10/04 20230101ALI20231219BHJP
G06N 5/022 20230101ALI20231219BHJP
【FI】
G06F16/90 100
G06Q10/04
G06N5/02 120
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022096121
(22)【出願日】2022-06-14
(71)【出願人】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(71)【出願人】
【識別番号】598121341
【氏名又は名称】慶應義塾
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】中原 英里
(72)【発明者】
【氏名】石井 方邦
(72)【発明者】
【氏名】倉沢 央
(72)【発明者】
【氏名】大槻 知明
【テーマコード(参考)】
5B175
5L049
【Fターム(参考)】
5B175EA01
5L049AA04
(57)【要約】
【課題】AIが出した結果をユーザに受容させることができる装置を提供する。
【解決手段】情報処理装置100は、取得部121と、特徴加工部122と、ラベル作成部123と、モデル構築部124とを有する。取得部121は、質問に対する回答データを取得する。特徴加工部122は、取得した回答データから、特徴量を加工する。ラベル作成部123は、取得した回答データから、ラベルを作成する。モデル構築部124は、加工された特徴量と作成されたラベルとを入力データとして、アルゴリズムを用いて、AIに関する信頼度を予測するモデルを学習する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
質問に対する回答データを取得する取得部と、
前記取得部により取得した回答データから、特徴量を加工する特徴加工部と、
前記取得部により取得した回答データから、ラベルを作成するラベル作成部と、
前記特徴加工部により加工された特徴量と前記ラベル作成部により作成されたラベルとから学習モデルを構築するモデル構築部と
を有することを特徴とする情報処理装置。
【請求項2】
前記ラベル作成部により作成されたラベルからフルセット質問のサブセットである限定質問セットを生成する限定質問生成部をさらに有する請求項1に記載の情報処理装置。
【請求項3】
前記取得部は、少なくとも信頼の考え方を含む質問に対する回答データを取得することを特徴とする請求項1に記載の情報処理装置。
【請求項4】
質問に対する回答データを取得する取得部と、
前記取得部により取得した回答データから、特徴量を加工する限定特徴加工部と、
前記取得部により取得した回答データから、ラベルを作成する限定ラベル作成部と、
前記限定特徴加工部により加工された特徴量と前記限定ラベル作成部により作成されたラベルとを入力データとして、AIに関する信頼度を推定する推定部と
を有することを特徴とする情報処理装置。
【請求項5】
前記推定部は、前記AIに関する信頼度として、AIの出力結果に関する信頼度およびAIの出力結果に関する説明手法の信頼度を推定することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記推定部は、前記AIに関する信頼度として、AI作成のためのデータ収集に協力する確率を推定することを特徴とする請求項4に記載の情報処理装置。
【請求項7】
質問に対する回答データを取得する取得工程と、
前記取得工程により取得した回答データから、特徴量を加工する特徴加工工程と、
前記取得工程により取得した回答データから、ラベルを作成するラベル作成工程と、
前記特徴加工工程により加工された特徴量と前記ラベル作成工程により作成されたラベルとを入力データとして、学習済みモデルを用いて、AIに関する信頼度を推定する推定工程と
を含むことを特徴とする情報処理方法。
【請求項8】
請求項1~請求項6の何れか1項に記載の情報処理装置の各部としての機能をコンピュータに実行させる情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。
【背景技術】
【0002】
AI技術は、膨大なデータの認識および高精度の予測を得意とする。このAI技術を事業に導入することにより、蓄積されたデータに基づく合理的な判断を可能とし、様々な資源を効率よく配分することができる。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Ashoori, M. & Weisz, J. D. In AI we trust? Factors that influence trustworthiness of AI-infused decision-making processes. 2019
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、AI技術の導入障壁という問題がある。例えば、AIがデータに基づく合理的な結果を示したとしても、ユーザの心理的な抵抗感が強く、受け入れられないと判断されてしまうことがある。また、AIに対する心理的な抵抗感から、AIが結果を出すために必要なデータの収集に協力できないと判断されてしまうことがある。このように、AIをユーザに受容してもらえず、円滑にAI技術を導入できないという課題が存在する。
【課題を解決するための手段】
【0005】
上述した課題を解決し目的を達成するため、請求項1に記載の情報処理装置は、質問に対する回答データを取得する取得部と、取得部より取得した回答データから特徴量を加工する特徴加工部と、取得部より取得した回答データから、ラベルを作成するラベル作成部と、特徴加工部により加工された特徴量と、ラベル作成部により作成されたラベルとから学習モデルを構築するモデル構築部とを有することを特徴とする。
【0006】
請求項4に記載の情報処理装置は、質問に対する回答データを取得する取得部と、取得部により取得した回答データから、特徴量を加工する限定特徴加工部と、取得部により取得した回答データから、ラベルを作成する限定ラベル作成部と、限定特徴加工部により加工された特徴量と限定ラベル作成部により作成されたラベルとを入力データとして、AIに関する信頼度を推定する推定部とを有することを特徴とする。
【発明の効果】
【0007】
本発明によれば、ユーザの属性情報やAIに対する考え方、信頼に対する考え方をといったAIによる提案の受容に影響する要素を考慮した上で、対象とするユーザがどの程度の確率でAIが出した結果を受容するかを推定し、推定結果を用いることで、円滑なAI技術の導入を可能とする。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施形態に係る情報処理装置の構成の一例を示すブロック図である。
【
図2】
図2は、実施形態に係る情報処理装置の概要を説明する図である。
【
図3】
図3は、実施形態に係る情報処理装置の特徴量加工処理の一例を示す図である。
【
図4】
図4は、実施形態に係る情報処理装置のラベル作成処理の一例を示す図である。
【
図5】
図5は、実施形態に係る情報処理装置のラベル作成処理の一例を示す図である。
【
図6】
図6は、実施形態に係る情報処理装置による推定処理の一例を示すフローチャートである。
【
図7】
図7は、実施形態に係る情報処理装置の概要を説明する図である。
【
図8】
図8は、情報処理プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して、本願に係る情報処理装置、情報処理方法および情報処理プログラムの実施形態を詳細に説明する。なお、この実施の形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示しており、重複する説明は、省略される。
【0010】
〔実施例1〕
〔情報処理装置の構成〕
まず、
図1を用いて、情報処理装置100の構成について説明する。
図1は、実施形態に係る情報処理装置100の構成の一例を示す図である。
図1が示すように、情報処理装置100は、通信部110と、制御部120と、記憶部130とを備える。なお、これらの各部は、複数の装置が分散して保持してもよい。以下にこれら各部の処理を説明する。
【0011】
通信部110は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネットなどの電気通信回線を介した外部装置と制御部120の通信を可能とする。例えば、通信部110は、外部装置と制御部120との通信を可能とする。
【0012】
記憶部130は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部130が記憶する情報としては、例えば、質問、回答データ、各種機械学習アルゴリズムに関するデータ、機械学習のための訓練データ、学習済みモデルなどが含まれる。なお、記憶部130が記憶する情報は上記に記載したものに限定されない。
【0013】
制御部120は、CPU(Central Processing Unit)やNP(Network Processor)やFPGA(Field Programmable Gate Array)等を用いて実現され、メモリに記憶された処理プログラムを実行する。
図1に示すように、制御部120は、取得部121と、特徴加工部122と、ラベル作成部123と、モデル構築部124と、限定質問生成部125と、限定特徴加工部126と、限定ラベル作成部127と、推定部128とを有する。以下、制御部120が有する各部について説明する。
【0014】
取得部121は、質問に対する回答データを取得する。例えば、取得部121は、基本属性、AIに対する考え方に加えて、信頼の概念に関する質問に対する回答データを取得する。例えば、取得部121は、基本属性に関する質問、性格や信頼に対する考え方に関する質問、AIに関する質問、職場へのAI活用に関する質問、XAI根拠図の理解・受け入れに関する質問、AIへの情報提供に関する質問に対する回答のデータを取得する。例えば、基本属性は、年齢、性別、年収、業界、職種、出身地といった項目を含む。また、例えば、性格や信頼に対する考え方に関する質問は、BigFiveを用いた性格診断や、一般的な信頼に関する考え方、家族、上司、同僚、企業に対する信頼、職務肯定感に関する質問を含む。
【0015】
また、例えば、AIに関する質問は、AIに対する知識、AIへの期待や不安、イメージに関する質問を含む。また、例えば、職場へのAI活用に関する質問は、職場でAIを活用している職種、業務、AIを業務に取り入れる意思などに関する質問を含む。また、例えば、XAI根拠図の理解・受け入れに関する質問は、誰からAIによる説明を受けたら受容するか、各XAI根拠図について理解可能か、AIの提案を受け入れられるか、各XAI根拠図に不足しているもの、各XAI根拠図に対するイメージといった質問を含む。
【0016】
また、例えば、取得部121は、少なくとも信頼の考え方を含む質問に対する回答データを取得する。なお、取得部121は、後述する限定質問生成部125により生成された質問に対する回答を取得してもよい。
【0017】
ここで、XAIとは、Explainable AIの略であって、モデルの出力結果について説明可能なAIを意味する。また、例えば、AIへの情報提供に関する質問は、生活支援AI、ヘルスケアAI、ビジネスAI、社内AIといった種々のAIに対して自身の情報を提供するかといった質問を含む。
【0018】
なお、これらの質問に対する回答には、どの程度質問に合意できるかを「あてはまる」からあてはまらないまで5段階または7段階で聴取するリッカート尺度や、対立する形容詞の対を用いて5段階または7段階の尺度で回答させる方法であるSD法(semantic differential method)などを用いることができる。具体的な取得データとして、リッカート尺度であれば取得部121は、ユーザ1が、「Q7:働いている会社は、私を大事にしてくれている」という質問に対して、「1:あてはまる」と回答した場合には、「ユーザ1、Q7、1」といった回答データを取得する。
【0019】
特徴加工部122は、取得した回答データから質問の特徴に応じて、特徴量を加工する。例えば、特徴加工部122は、年齢、性別、年収、業界、職種、出身地いったカテゴリ変数をOne hot Encodingにより特徴量化する。また、例えば、特徴加工部122は、一般的信頼尺度など人の心理や意識、行動傾向といった抽象的な概念を定量化するために用いられる心理的尺度を用いた質問の回答データについて、回答の合計値を算出することで特徴量化する。また、例えば、特徴加工部122は、回答の合計値に対して、分散や中央値または平均値など統計的に処理し、特徴量化する。
【0020】
ラベル作成部123は、取得した回答データから、ラベルを作成する。例えば、ラベル作成部123は、モデルの正解とする質問を選択しラベルを作成する。例えば、ラベル作成部123は、取得した回答データのうち、XAI根拠図の理解・受け入れに関する質問に対する回答データにラベルを付与する。具体的には、ラベル作成部123は、XAI根拠図の理解・受け入れに関する質問に対して、「提案を受け入れられる」といった表現を含む回答に、XAIを受容することを意味するラベルを付与する。一方、ラベル作成部123は、XAI根拠図の理解・受け入れに関する質問に対して、「提案を受け入れられない」といった表現を含む回答に、XAIを受容しないことを意味するラベルを付与する。
【0021】
ラベル作成部123によるラベルの作成方法は、分散や中央値または平均値など統計的に処理し、ラベルとする方法や、複数の質問の回答パターンに応じてラベルとする方法などが挙げられる。例えば、ラベル作成部123は、各XAIの受容ラベルまたは、非受容ラベルを集計し、回答のパターンを集計し、回答パターンに応じてAI受容ラベルまたは、AI非受容ラベルを付与してもよい。また、例えば、ラベル作成部123は、各XAIの受容ラベルまたは、非受容ラベルを集計し、需要件数の分布を算出し、閾値に応じてAI受容ラベルまたは、AI非受容ラベルを付与してもよい。なお、ラベル作成部123は、AI受容ラベルまたは、AI非受容ラベルを付与する閾値については適宜任意の値を設定することができる。
【0022】
モデル構築部124は、特徴加工部122により加工された特徴量と、ラベル作成部123により作成されたラベルとから学習モデルを構築する。例えば、モデル構築部124は、加工された特徴量と作成されたラベルとを入力として、アルゴリズムを用いて、AIに関する信頼度を予測するモデルを学習する。ここで、モデル構築部124が使用するアルゴリズムは、分類モデルを構築できるものであれはどの手法でも構わない。また、例えば、モデル構築部124は、この学習モデルをベースに、目標精度を保ちつつ、可能な限り質問を削除し、少数の質問でAIに関する信頼度を出力できる最終モデルを作成する。なお、モデル構築部124は、特徴量として入力する質問を削除する際は、正解ラベルとの相関係数や、相互情報量、予測への寄与度を算出するSHAP(Shapley Additive exPlanations)値などを基準に質問を選択し削除する。
【0023】
限定質問生成部125は、ラベル作成部123により作成されたラベルから、フルセット質問のサブセットである、限定質問セットを生成する。ここで、フルセット質問とは、回答データを取得するためのすべての質問を意味する。また、サブセットとは、フルセット質問に含まれる質問を意味する。また、限定質問セットとは、フルセット質問からラベルの作成に用いた質問または、モデル構築部により削除された質問を除外した質問を意味する。
【0024】
限定特徴加工部126は、取得部121により取得した回答データから、特徴量を加工する。例えば、限定特徴加工部126は、限定質問生成部125により生成された限定質問に対する回答データから、特徴量を加工する。なお、限定特徴加工部126は、特徴加工部122と同様の特徴加工処理を行ってもよい。
【0025】
限定ラベル作成部127は、取得部121により取得した回答データから、ラベルを作成する。例えば、限定ラベル作成部127は、限定質問生成部125により生成された限定質問に対する回答データから、ラベルを作成する。なお、限定ラベル作成部127は、ラベル作成部123と同様のラベル作成処理を行ってもよい。
【0026】
推定部128は、限定特徴加工部126により加工された特徴量と限定ラベル作成部127により作成されたラベルとを入力データとして、AIに関する信頼度を推定する。例えば、推定部128は、加工された特徴量とラベルとを入力データとして、学習済みモデルを用いて、AIに関する信頼度を推定する。また、例えば、推定部128は、学習済みの最終モデルを用いて、AIに関する信頼度を推定する。
【0027】
つまり、推定部128は、最終モデル構築に使用した少数の質問を対象ユーザに聴取し、回答データから特徴量を加工して、最終モデルに入力し、推論することで、AIに関する信頼度を出力する。例えば、推定部128は、AIに関する信頼度として、AIの出力結果に関する信頼度およびAIの出力結果に関する説明手法の信頼度およびAIの出力結果に関する説明手法の信頼度を推定する。
【0028】
また、例えば、推定部128は、AIの出力結果に関する説明手法の信頼度として、AIの出力結果がどの特徴量を重要としているか説明する手法、AIの出力結果がどのようなルールに基づいているかを説明する手法、AIの出力結果を反実仮想を用いて説明する手法、AIの出力結果を例示して説明する手法、AIの出力結果を統計的に説明する手法のうちいずれか1つまたは複数の手法に対する信頼度を推定する。具体的には、推定部128は、ユーザ1は、AIに関する信頼度が80%、XAI根拠のうち、特徴量重要度を用いた説明に対する信頼度が70%、ルール可視化による説明に対する信頼度が60%、反実仮想を用いた説明に対する信頼度が80%、例示による説明に対する信頼度が80%、統計的な説明に対する信頼度が90%であると推定し、その結果を出力する。
【0029】
〔情報処理装置が行う処理の概要〕
次に、
図2を用いて、実施形態に係る情報処理装置100が行う処理の一例について説明する。
図2は、実施形態に係る情報処理装置100が行う処理の概要を説明するための図である。まず、
図2(1)は、回答データである。例えば、回答データは、事前に作成されたユーザの信頼やAIに対する考え方を聴取する質問への回答を、ユーザごとにデータ化したものである。具体的には、回答データは、ユーザ1が、「Q7:働いている会社は、私を大事にしてくれている」という質問に対して、「1:あてはまる」と回答した場合、「ユーザ1、Q7、1」のように表示される。
【0030】
次に、
図2(2)は、情報処理装置100である。まず、取得部121は、回答データを取得する。次に、特徴加工部122は、回答データから特徴量を加工する。詳しくは、
図3(特徴量の加工)で説明する。それから、ラベル作成部123は、回答データからラベルの作成を行う。詳しくは、
図4(ラベル作成)で説明する。それから、推定部128は、特徴量とラベルとを入力データとして、学習および推定を行い、結果を出力する。
【0031】
そして、
図2(3)は、推定部128の推定結果である。推定部128は、ユーザごとのAIに関する信頼度とXAIの手法に対する信頼度とを推定する。例えば、推定部128は、ユーザ1のAIに関する信頼度は80%、特徴量重要度を用いた説明に対する信頼度は80%、ルール可視化による説明に対する信頼度は60%、統計的な説明に対する信頼度は90%と推定する。
【0032】
AI導入を推進する立場の説明者は、情報処理装置100が推定した結果を用いることで、ユーザに対するAI導入に関する説明コストを削減することができる。例えば、ある職場が本発明とは異なるAIを導入し、当該AIが営業方法の変更や人事異動などを提案した場合に、AI導入を推進する立場の説明者は、情報処理装置100による推定結果を活用し、AIに関する信頼度の高いユーザに対して、当該ユーザの信頼度の高い説明手法を用いて説明を行うことができる。
【0033】
〔特徴量加工処理〕
次に、
図3を用いて、実施形態に係る特徴量加工処理の一例について説明する。
図3は、実施形態に係る特徴量加工処理を説明するための図である。
図3(1)は、回答データである。回答データは、基本属性、性格や信頼に対する考え方の聴取、AIに関する質問、場面設定を伴うXAI根拠図の理解・受け入れに関する質問に対する回答を含む。特徴加工部122は、年齢、性別、年収、業界、職種、住所といった基本属性については、One hot Encodingにより特徴量化する。
【0034】
また、特徴加工部122は、性格や信頼に対する考え方の聴取、AIに関する質問といった項目については、項目群の回答の合計値を計算し、特徴量として使用する。なお、特徴加工部122は、場面設定を伴うXAI根拠図の理解・受け入れに関する質問に対する回答データについては、特徴量として使用しなくてもよい。
【0035】
〔XAIモデルのラベル作成処理〕
次に、
図4を用いて、実施形態に係るXAIモデルのラベル作成処理の一例について説明する。
図4は、実施形態に係るXAIモデルのラベル作成を説明するための図である。まず、
図4(1)は、XAI根拠図である。例えば、XAI根拠図は、特徴量重要度を示したもの、ルールを可視化したもの、反実仮想を用いたもの、例示を用いたもの、データを可視化したものを含む。
【0036】
次に、
図4(2)は、XAI根拠図の理解・受け入れに関する質問に対する回答項目である。例えば、XAI根拠図の理解・受け入れに関する質問に対する回答項目は、「理解ができて、提案を受け入れられる」、「理解はできたが、提案を受け入れられない」、「理解できないが、提案を受け入れられる」、「一部、理解できない箇所があり、提案を受け入れられない」、「全く理解できないし、提案を受け入れられない」といったものを含む。
【0037】
そして、
図4(3)は、ラベルの付与である。ラベル作成部123は、「提案を受け入れられる」といった表現を含む回答に対して、XAIを受容することを意味するラベルを付与する。例えば、ラベル作成部123は、「1.理解できて、提案を受け入れられる」という回答項目に対してラベル1を付与する。
【0038】
一方、ラベル作成部123は、「提案を受け入れられない」といった表現を含む回答に対して、XAIを受容しないことを意味するラベルを付与する。例えば、ラベル作成部123は、「5.全く理解できないし、提案を受け入れられない」という回答項目に対してラベル0を付与する。
【0039】
〔AIモデルのラベル作成処理〕
次に、
図5を用いて、実施形態に係るAIモデルのラベル作成処理の一例について説明する。
図5は、実施形態に係るAIモデルのラベル作成を説明するための図である。ラベル作成部123は、XAI受容ラベルに基づいてAI受容ラベルを付与する。例えば、ラベル作成部123は、XAIを受容することを意味するラベルが1つ以上存在する場合には、AIを受容することを意味するラベルを付与する。一方、ラベル作成部123は、XAIを受容することを意味するラベルが1つも存在しない場合には、AIを受容しないことを意味するラベルを付与する。
【0040】
〔モデル構築処理〕
モデル構築部124は、既存アルゴリズムによってデータを分類する機械学習モデルを構築する。例えば、推定部128は、XGBoostやLightGBM等の勾配ブースティング決定木を用いた学習により、機械学習モデルを構築する。なお、機械学習モデルの構築には、機械学習モデルの新規作成のみならず、既存の機械学習モデルの更新も含まれる。
【0041】
推定部128は、加工された特徴量と作成されたラベルとを入力データとして、上記の機械学習モデルを用いることで、ユーザごとのAIに関する信頼度と、各XAIの手法に対する信頼度を推定する。
【0042】
〔フローチャート〕
次に、
図6を用いて、情報処理装置100による推定処理の流れについて説明する。
図6は、本実施形態に係る推定処理の流れの一例を示すフローチャートである。
【0043】
まず、取得部121は、回答データを取得する(ステップS11)。例えば、取得部121は、基本属性に関する質問、性格や信頼に対する考え方に関する質問、AIに関する質問、職場へのAI活用に関する質問、XAI根拠図の理解・受け入れに関する質問、AIへの情報提供に関する質問に対する回答のデータを取得する。
【0044】
次に、特徴加工部122は、回答データから特徴量を加工する(ステップS12)。例えば、特徴加工部122は、年齢、性別、年収、業界、職種、出身地といったカテゴリ変数をOne hot Encodingにより特徴量化する。
【0045】
それから、ラベル作成部123は、回答データからラベルを作成する(ステップS13)。例えば、ラベル作成部123は、取得した回答データのうち、XAI根拠図の理解・受け入れに関する質問に対する回答データにラベルを付与する。
【0046】
それから、モデル構築部124は、特徴加工部122により加工された特徴量と、ラベル作成部123により作成されたラベルとから学習モデルを構築する(ステップS14)。例えば、モデル構築部124は、加工された特徴量と作成されたラベルとを入力として、アルゴリズムを用いて、AIに関する信頼度を予測するモデルを学習する。
【0047】
それから、限定質問生成部125は、ラベル作成部123により作成されたラベルから、フルセット質問のサブセットである、限定質問セットを生成する(ステップS15)。
【0048】
それから、取得部121は、回答データを取得する(ステップS16)。例えば、取得部121は、限定質問生成部125により生成された質問に対する回答データを取得する。
【0049】
それから、限定特徴加工部126は、取得部121により取得した回答データから、特徴量を加工する(ステップS17)。例えば、限定特徴加工部126は、限定質問生成部125により生成された限定質問に対する回答データから、特徴量を加工する。
【0050】
それから、限定ラベル作成部127は、取得部121により取得した回答データから、ラベルを作成する(ステップS18)。例えば、限定ラベル作成部127は、限定質問生成部125により生成された限定質問に対する回答データから、ラベルを作成する。
【0051】
そして、推定部128は、特徴量とラベルとを入力データとしてAIに関する信頼度を算出する(ステップS19)。例えば、推定部128は、加工された特徴量とラベルとを入力データとして、学習済みモデルを用いて、AIに関する信頼度を推定する。
【0052】
〔効果〕
このように、実施形態に係る情報処理装置100は、取得部121と、特徴加工部122と、ラベル作成部123と、モデル構築部124とを有する。取得部121は、質問に対する回答データを取得する。特徴加工部122は、取得した回答データから、特徴量を加工する。ラベル作成部123は、取得した回答データから、ラベルを作成する。モデル構築部124は、モデル構築部124は、特徴加工部122により加工された特徴量と、ラベル作成部123により作成されたラベルとから学習モデルを構築する。
【0053】
この構成により、実施形態に係る情報処理装置100は、回答データから加工した特徴量と回答データから作成したラベルとに基づいて、ユーザのAIに対する信頼度を推定し、AIに対する抵抗感が少なく信頼度が高いユーザの発見を可能とする学習モデルを構築することができる。
【0054】
また、実施形態に係る情報処理装置100は、ラベル作成部123により作成されたラベルからフルセット質問のサブセットである限定質問セットを生成する限定質問生成部を有する。この構成により情報処理装置100は、推測への寄与度が低い質問を除外し、推測への寄与度が高い質問を含む質問セットを生成することができる。
【0055】
また、実施形態に係る情報処理装置100において、取得部121は、少なくとも信頼の考え方を含む質問に対する回答データを取得する。この構成により情報処理装置100は、推測への寄与度が大きい質問に対する回答データを用いて学習モデルを構築することができる。
【0056】
また、実施形態に係る情報処理装置100は、取得部121と、限定特徴加工部126と、限定ラベル作成部127と、推定部128とを有する。取得部121は、質問に対する回答データを取得する。限定特徴加工部126は、取得した回答データから、特徴量を加工する。限定ラベル作成部127は、取得した回答データから、ラベルを作成する。推定部128は、限定特徴加工部126により加工された特徴量と限定ラベル作成部127により作成されたラベルとを入力データとして、AIに関する信頼度を推定する。
【0057】
この構成により、実施形態に係る情報処理装置100は、回答データから加工した特徴量と回答データから作成したラベルとに基づいて、ユーザのAIに対する信頼度を推定し、AIに対する抵抗感が少なく信頼度が高いユーザを発見し、円滑なAI技術の導入を可能とする。
【0058】
また、実施形態に係る情報処理装置100において、推定部128は、AIに関する信頼度として、AIの出力結果に関する信頼度およびAIの出力結果に関する説明手法の信頼度を推定する。この構成により情報処理装置100は、AIの出した結果を説明する際に、どのように説明するとユーザを納得させられるかといった期待値を手法毎に示し、説明コストを削減しつつ、円滑なAI技術の導入を可能とする。
【0059】
〔実施例2〕
上記実施例では、AIに関する信頼度として、AIの出力結果に関する信頼度およびAIの出力結果に関する説明手法の信頼度を推定する場合を説明した。しかし、本発明は、これに限定されるものでなく、AIに関する信頼度として、AI作成のためのデータ収集に協力する確率を推定するようにしてもよい。そこで、実施例2では、AIに関する信頼度として、AI作成のためのデータ収集に協力する確率を推定する場合について説明する。なお、実施例2では、主に、実施例1との相違点について説明し、実施例1と同様の構成要素については、適宜、その説明を省略する。
【0060】
〔情報処理装置の構成〕
推定部128は、AIに関する信頼度として、AI作成のためのデータ収集に協力する確率を推定する。例えば、推定部128は、ターゲット集団である営業職が、AI作成のために情報提供する確率を80%と推定する。
【0061】
〔情報処理装置が行う処理の概要〕
図7を用いて、実施形態に係る情報処理装置100が行う処理の一例について説明する。
図7は、実施形態に係る情報処理装置100が行う処理の概要を説明するための図である。まず、
図7(1)は、回答データである。例えば、回答データは、事前に作成された、AIへの情報提供に関する質問に対する回答を、職種ごとにデータ化したものである。
【0062】
次に、
図7(2)は、情報処理装置100である。まず、特徴加工部122は、回答データから特徴量を加工する。例えば、特徴加工部122は、AI導入に関する質問や、情報提供に関する質問項目群の回答の合計値を分散、平均、合計値など統計的に処理して特徴量として使用する。
【0063】
次に、ラベル作成部123は、回答データからラベルを作成する。例えば、ラベル作成部123は、集団ごとに活用されるAI分野のラベルを付与する。具体的には、ラベル作成部123は、営業職の提供情報が、人事分野、営業支援分野のAIへ活用されることを意味するラベルを付与する。一方、ラベル作成部123は、営業職の提供情報が、販売発注分野のAIに活用されないことを意味するラベルを付与する。
【0064】
また、例えば、ラベル作成部123は、質問に対して、職種ごとの回答の傾向から情報提供を受けられるかどうかのラベルを付与する。具体的には、ラベル作成部123は、「一般的な個人情報を提供するか」、「秘匿性の高い個人情報を提供するか」、「業務上のデータを提供するか」といった質問に対して、「情報を提供する」、「匿名化されれば、情報を提供する」という回答が多ければ、情報提供を行うことを意味するラベルを付与する。例えば、ラベル作成部123は、営業職に対して、「一般個人情報を提供し、秘匿性の高い個人情報を提供せず、業務上のデータを提供する」ことを意味するラベルを付与する。
【0065】
一方、ラベル作成部123は、「一般的な個人情報を提供するか」、「秘匿性の高い個人情報を提供するか」、「業務上のデータを提供するか」といった質問に対して、「情報を共有しない」、「どちらともいえない・判別がつかない」という回答が多ければ、「情報提供を行わない」ことを意味するラベルを付与する。
【0066】
なお、ターゲットとする集団は、目的にあわせて、業種、職種、年代といった所定の属性のグループを設定してもよい。また、ターゲットとする集団は、目的にあわせて、所定の質問に対して所定の回答を行ったグループを設定してもよい。
【0067】
そして、
図7(3)は、推定部128の推定結果である。推定部128は、職種ごとのAIに関する信頼度とXAIの手法に対する信頼度とを推定する。例えば、推定部128は、営業職のAIに関する信頼度は70%、特徴量重要度を用いた説明に対する信頼度は70%、ルール可視化による説明に対する信頼度は90%、統計的な説明に対する信頼度は60%であると推定する。
【0068】
〔効果〕
実施形態に係る情報処理装置100において、推定部128は、AIに関する信頼度として、AI作成のためのデータ収集に協力する確率を推定する。この構成により情報処理装置100は、AI導入先の母集団の性質や特徴を考慮した、AI作成のためのデータ収集の難易度の試算を可能とする。例えば、情報処理装置100は、AI作成のためのデータ収集の協力に意欲的な集団に対するデータ提供の依頼を可能とし、効率的に職場へのAI導入を進めることができる。
【0069】
つまり、情報処理装置100は、AIに関する信頼度が高いと推定される集団に対して、当該集団において信頼度の高いと推定される説明手法を用いた説明を可能とし、AI作成のためのデータ収集を容易とし、AI導入にかかるコストを大幅に削減することができる。
【0070】
〔プログラム〕
上記実施形態において説明した情報処理装置100が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。この場合、コンピュータがプログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかるプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。
【0071】
図8は、情報処理プログラムを実行するコンピュータの一例を示す図である。
図8に示すように、コントローラ200は、コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
【0072】
メモリ1010は、ROM(Read Only Memory)1011およびRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1041に接続される。ディスクドライブ1041には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1110およびキーボード1120が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1130が接続される。
【0073】
ここで、
図8に示すように、ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。上記実施形態で説明した各テーブルは、例えばハードディスクドライブ1090やメモリ1010に記憶される。
【0074】
また、制御プログラムは、例えば、コンピュータ1000によって実行される指令が記述されたプログラムモジュールとして、ハードディスクドライブ1090に記憶される。具体的には、上記実施形態で説明したコントローラ2000が実行する各処理が記述されたプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。
【0075】
また、制御プログラムによる情報処理に用いられるデータは、プログラムデータとして、例えば、ハードディスクドライブ1090に記憶される。そして、CPU1020が、ハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した各手順を実行する。
【0076】
なお、制御プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1041等を介してCPU1020によって読み出されてもよい。あるいは、制御プログラムに係るプログラムモジュール1093やプログラムデータ1094は、LAN(Local Area Network)やWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
【0077】
〔その他〕
様々な実施形態を、図面を参照して、本明細書で詳細に説明したが、これらの複数の実施形態は例であり、本発明をこれらの複数の実施形態に限定することを意図するものではない。すなわち、本願発明は、入力として用いる特徴量とラベルとを変更することによって、種々の多値分類モデルの学習、構築、更新を行い、目的とする確率を推定することが可能である。本明細書に記載された特徴は、当業者の知識に基づく様々な変形や改良を含む、様々な方法によって実現され得る。
【0078】
また、上述した「部(module、-er接尾辞、-or接尾辞)」は、ユニット、手段、回路などに読み替えることができる。例えば、通信部(communication module)、制御部(control module)および記憶部(storage module)は、それぞれ、通信ユニット、制御ユニットおよび記憶ユニットに読み替えることができる。
【符号の説明】
【0079】
100 情報処理装置
110 通信部
120 制御部
121 取得部
122 特徴加工部
123 ラベル作成部
124 モデル構築部
125 限定質問生成部
126 限定特徴加工部
127 限定ラベル作成部
128 推定部
130 記憶部