(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-02-08
(45)【発行日】2024-02-19
(54)【発明の名称】データ生成システム
(51)【国際特許分類】
G06Q 10/10 20230101AFI20240209BHJP
【FI】
G06Q10/10
(21)【出願番号】P 2023143585
(22)【出願日】2023-09-05
【審査請求日】2023-09-20
【早期審査対象出願】
(73)【特許権者】
【識別番号】521072515
【氏名又は名称】森 力
(74)【代理人】
【識別番号】110002022
【氏名又は名称】弁理士法人コスモ国際特許事務所
(72)【発明者】
【氏名】森 力
【審査官】上田 威
(56)【参考文献】
【文献】国際公開第2022/249390(WO,A1)
【文献】特表2022-545049(JP,A)
【文献】特開2013-080375(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介して
前記特定された特定分野に関するターゲットデータを収集するデータ収集部と、
前記ターゲットデータのうち、第1のAI処理により、
性別や年齢、障がいの有無に由来する思い込み、思考に関するいずれかの特定要素を含む固定概念データを抽出するデータ判別部と、
前記固定概念データから、第2のAI処理により、前記特定要素を除外して特定要素除外データを生成する特定要素除外部と、
前記固定概念データを除く前記ターゲットデータ及び前記特定要素除外データを含むデータをアウトプットデータとして生成するアウトプットデータ生成部と、
を有するデータ生成システム。
【請求項2】
前記第1のAI処理は、同一内容のデータが閾値以上の個数存在すること、同一内容のデータが存在する年代、所定条件を満たす発信者が情報源であること、の条件を含む、請求項1に記載のデータ生成システム。
【請求項3】
前記アウトプットデータ生成部は、前記特定分野の異なる第1の前記アウトプットデータと第2の前記アウトプットデータを生成し、前記第1の前記アウトプットデータと前記第2の前記アウトプットデータから新たな第3の前記アウトプットデータを生成する、請求項1又は請求項2に記載のデータ生成システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ生成システムに関する。
【背景技術】
【0002】
従来から、労働生産性を向上するためのシステムが提供されている。例えば、特許文献1には、ネットワークによって接続された複数のユーザ端末と管理サーバによって構成され、業績成果を示唆するファイルへの書き込みをユーザ端末で行い、この書き込みデータ量の累計を計算して、複数のユーザ間で累計を算出、比較して、当該累計の大小に基づいてユーザごとに相対評価値を決定する評価支援システムが開示されている。このシステムによれば、企業の従業員の評価を適切に行うことができ、労働生産性を向上することができる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
適正な評価を受けることで、従業員のモチベーションが向上することはある。しかしながら、評価が適正であっても、従業員の作業環境、特に、提供される情報を含む従業員を取り巻く環境が変化していない状況下においては、現状の能力以上の能力が発揮され難い。また、従業員は、会社等に雇われているものであって、自営等も含めた広い意味での労働者にとっては、上記の従来技術は有効に作用し難いことがある。よって、労働者の潜在的な能力や未だ引き出されていない能力等を発揮することができれば、更なる労働生産性の向上が期待できる。
【0005】
本発明は、労働生産性を上げて人的資本のレベルを向上させるデータ生成システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係るデータ生成システムは、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集するデータ収集部と、前記ターゲットデータのうち、第1のAI処理により、特定要素を含む固定概念データを抽出するデータ判別部と、前記固定概念データから、第2のAI処理により、前記特定要素を除外して特定要素除外データを生成する特定要素除外部と、前記固定概念データを除く前記ターゲットデータ及び前記特定要素除外データを含むデータをアウトプットデータとして生成するアウトプットデータ生成部と、を有する。
【発明の効果】
【0007】
本発明によれば、労働生産性を上げて人的資本のレベルを向上させるデータ生成システムを提供することができる。
【図面の簡単な説明】
【0008】
【
図1】本発明の実施形態に係るデータ生成システムの構成を示すブロック図である。
【
図2】本発明の実施形態に係るデータ生成システムの制御部の構成を示す機能ブロック図である。
【
図3】本発明の実施形態に係るデータ生成システムのデータ生成の対象となる特定分野、特定分野を特定するアウトプットデータ設定値を説明するための図である。
【
図4】本発明の実施形態に係るデータ生成システムのデータ判別部がターゲットデータから抽出する固定概念データを説明するための図である。
【
図5】本発明の実施形態に係るデータ生成システムにおける第1のAI処理及び第2のAI処理を説明するための図である。
【
図6】本発明の実施形態に係るデータ生成システムが(a)、(b)、(c)の順でアウトプットデータを生成する工程を説明するための図である。
【
図7】本発明の実施形態に係るデータ生成システムのフロー図である。
【発明を実施するための形態】
【0009】
本発明の実施形態を図に基づいて説明する。
図1は、データ生成システム100の構成を示すブロック図である。データ生成システム100は、記憶部101、制御部102、表示部103、通信部104、操作部105を有する。データ生成システム100は、例えば、学術分野や教育分野等の特定分野において活用することができるデータ(アウトプットデータ)を生成することができる。
【0010】
記憶部101は、例えば、少なくとも1つのメモリとしてのフラッシュメモリ、EEPROM(Electrically Erasable Programmable ROM)及びSSD(Solid State Drive)等の記憶装置等で構成される。記憶部101は、制御プログラムや、生成された各種データを一時的又は継続的に保存し、記憶させておくことができる。
【0011】
制御部102は、少なくとも1つのプロセッサとしてのCPU(Central Processing Unit)により構成され、記憶部101に記憶される制御プログラムを読み出し、各種の処理を実行する。制御部102は、システムバスSBを介して、記憶部101、表示部103、通信部104、操作部105と接続し、各部を制御する。
【0012】
表示部103は、例えばディスプレイにより構成される。通信部104は、例えばネットワークインタフェースコントローラ(NIC)であり、インターネットと接続して各種の情報を送受信することができる。
【0013】
図2は、記憶部101に記憶される制御プログラムが実行されることにより制御部102のCPUが機能する機能ブロック図である。データ生成システム100の制御部102は、データ収集部110、データ判別部120、特定要素除外部130、アウトプットデータ生成部140及びAI処理部150を含む。ここで、「AI」とは「人工知能」である。
【0014】
データ収集部110は、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集する。ここで、データ生成の対象となる特定分野とは、生成したアウトプットデータを活用する分野であって、
図3に示すように、例えば、学術分野、教育分野、医療分野、産業分野、宇宙工学分野等をいう。アウトプットデータ設定値は、特定分野を特定するデータであり、キーワード(テキストデータ)、数詞や記号、画像、音声データ等を含むことができる。なお、以下で説明するターゲットデータ、特定要素、固定概念データ、特定要素除外データ、アウトプットデータについても、テキストデータ、数値、画像、音声データ等を含むことができる。
【0015】
アウトプットデータ設定値は、階層構造とすることもできる。例えば、
図3に示すように、特定分野を「学術分野」としたとき、上位の第1のアウトプットデータ設定値は、社会科学、人文科学、自然科学等を特定するデータとすることができる。更に、下位の第2のアウトプットデータ設定値は、各分野における専門用語(例えば、社会科学における法学、そして法学における法律用語)や、公表される論文の執筆者名、情報を発信している大学名等のデータとすることができる。
【0016】
データ収集部110は、
図3に例示するアウトプットデータ設定値(第1のアウトプットデータ設定値、第2のアウトプットデータ設定値)に基づいて、インターネットを介して情報を収集する。ターゲットデータとは、データ収集部110において収集したデータをいう。より具体的には、例えば、社会科学分野の法学におけるA大学が発信する情報をターゲットデータとして収集する。
【0017】
データ判別部120は、データ収集部110により収集されたターゲットデータのうち、第1のAI処理により、固定概念データを抽出する。固定概念データとは、
図4に示すように、特定要素を含むデータである。特定要素とは、不変な固定的要素、例えば、性別、身体的・精神的障がい、年齢等を含むデータである。例えば、「女児はお人形を与えると喜ぶ」というデータは、「女児」という性別、年齢からなる特定要素を含むデータである。よって、「女児はお人形を与えると喜ぶ」というデータは、固定概念データに該当する可能性が高い。固定概念データに該当するか否かは、従来からの思考や思い込みであるか否かに基づいて、第1のAI処理にて判断する。
【0018】
同様に、例えば、「男らしさ≒強い」は「男」という性別からなる特定要素を含むデータである。データ判別部120では、ターゲットデータから、このような固定概念データを抽出する。なお、ここでいう「抽出」は、「特定」することも含まれる。換言すれば、データ判別部120は、多数のターゲットデータについて、固定概念データに属するデータと、固定概念データに属しないデータに判別することができる。
【0019】
固定概念データの抽出は、AI処理部150による第1のAI処理により行うことができる。固定概念データの事例を機械学習させたAI処理部150が行う第1のAI処理により、直接的なキーワードからの抽出だけではなく、データ(テキストデータ、数値、画像、音声データ等を含む)の意味内容を把握して固定概念データを抽出することができる。
【0020】
また、第1のAI処理は、固定概念データとして抽出する条件を設定することもできる。例えば、同一内容のデータが閾値以上の個数存在することを条件とすることができる。データが同一内容か否かは、データ内容をAI処理により解析して判断することができる。また、同一内容のデータが存在する年代を条件とすることもできる。ある年代(特定の年であってもよいし、年代の境界を厳密に設定していなくてもよい)以前からあるデータは古くからある概念として、固定概念データと判別することができる。また、設定した発信者(又は、所定条件を満たす者として抽出された発信者)が情報源であることを条件とすることができる。所定の思想を持つ発信者(個人又は組織(団体等)であってもよい)が情報源となるデータは固定概念データと判別することができる場合がある。
【0021】
特定要素除外部130は、データ判別部120で抽出した固定概念データから、AI処理部150が行う第2のAI処理により、特定要素を除外して特定要素除外データを生成する。具体的には、
図5に示すように、例えば、データ生成の対象となる特定分野が学術分野において、第1のAI処理により「機械工学は女性に向かない」といったデータ(固定概念データ)が抽出された場合に、この「機械工学は女性に向かない」という固定概念データに対して、第2のAI処理により削除する。つまり、第2のAI処理により行われる、固定概念データにおける特定要素の除外には、当該固定概念データそのものの削除も含まれる。
【0022】
更に
図5の例のうち、「発達障がい者が向く学術分野」に関するデータがある場合には、第2のAI処理により、「発達障がい者の特性を持つ者が向く学術分野」に変換する。AI処理部150は、「発達障がい者の特性」、例えば、高い集中力を備える等の特性を機械学習し、第2のAI処理を行うことができる。ここで、「発達障がい」は、特定要素である。また、「特定要素を除外」には、データの変換も含まれる。同様に、「50歳以上はIT研究できない」というデータについても変換して「50歳以上」の条件を能力的条件に置き換えることができる。
【0023】
アウトプットデータ生成部140は、固定概念データを除くターゲットデータ及び特定要素除外データを含むデータをアウトプットデータとして生成する。アウトプットデータが生成される工程は、
図6(a),(b),(c)の順で行われる。
図6(a)に示すように、データ収集部110が収集したターゲットデータは、データ判別部120が第1のAI処理を用いて抽出した固定概念データを含むものである。そして、
図6(b)に示すように、固定概念データは、特定要素除外部130が第2のAI処理を用いて、特定要素除外データに変換(生成)される。
図6(c)に示すように、アウトプットデータ生成部140は、特定要素除外部130で生成された特定要素除外データとターゲットデータを組み合わせて、アウトプットデータを生成する。
【0024】
データ生成システム100のデータ生成方法は、
図7のフロー図に示す工程を含む。
ターゲットデータ収集工程;ステップS10において、データ収集部110は、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集する。なお、アウトプットデータ設定値は、第1のアウトプットデータ設定値、第2のアウトプットデータ設定値を含む階層構造とすることもでき、階層毎にターゲットデータを収集することもできる。
【0025】
固定概念データ抽出工程;ステップS20において、データ判別部120は、データ収集部110が収集したターゲットデータのうち、第1のAI処理により、特定要素を含む固定概念データを抽出する。
特定要素除外データ生成工程;ステップS30において、特定要素除外部130は、ステップS20で抽出した固定概念データから、第2のAI処理により特定要素を除外して特定要素除外データを生成する。
【0026】
アウトプットデータ生成工程;ステップS40において、アウトプットデータ生成部140は、固定概念データを除くターゲットデータ及び特定要素除外データを含むデータをアウトプットデータとして生成する。なお、アウトプットデータは、ターゲットデータのすべてが固定概念データであった場合には、特定要素除外データのみからなるデータとなることもある。
【0027】
生成したアウトプットデータは、特定分野に応じたビッグデータとして利用することができる。生成したアウトプットデータは、性別や年齢、障がいの有無に由来する思い込み、思考が取り除かれたデータとされることから、従来のビッグデータを活用したアウトプットから脱却したアウトプットとなる。これにより、性別や年齢、障がいの有無により、従来は引き出されなかった能力を引き出すことができ、労働生産性を上げて人的資本のレベルを向上させることができる。
【0028】
例えば、特定分野を産業分野として生成したアウトプットデータは、企業における社内制度の制定や仕事のやり方の改善、商品開発、製造工程の改善等に利用することができる。生成されたアウトプットデータを利用したこれらの成果物は、ビッグデータとされる当該アウトプットデータをAI処理することで得ることもできる。生成したアウトプットデータは、特定要素を含む固定概念データが除外されているので、今までの、例えば「女性らしさ」、「男性らしさ」、「障がい者は」といった思考や思い込みから脱却した成果を得ることができる。ここで得られる成果、例えば、企業の社内制度であれば、性別や年齢、障がいの有無に関係なく、気付かなかった才能や能力を引き出すような制度を制定することができる。
【0029】
または、精神的な障がい者が働く福祉作業所の改善では、福祉作業所で生産するのに適した商品開発や、作業方法、勤務時間等の制度の策定等に利用することができる。本発明に係るデータ生成システムにより生成されたアウトプットデータを利用することで、人々のウェルビーイングが向上し、個人らしさや発想力が創出され、生産性が向上される。
【0030】
以上、本発明の実施形態を説明したが、本発明は本実施形態によって限定されることはなく、種々の変更を加えて実施することができる。
【符号の説明】
【0031】
100 データ生成システム 101 記憶部
102 制御部 103 表示部
104 通信部 105 操作部
110 データ収集部 120 データ判別部
130 特定要素除外部 140 アウトプットデータ生成部
150 AI処理部
【要約】
【課題】労働生産性を上げて人的資本のレベルを向上させるデータ生成システムを提供する。
【解決手段】データ生成システム100は、データ生成の対象となる特定分野を特定するアウトプットデータ設定値に基づいて、インターネットを介してターゲットデータを収集するデータ収集部110と、ターゲットデータのうち、第1のAI処理により、特定要素を含む固定概念データを抽出するデータ判別部120と、固定概念データから、第2のAI処理により、特定要素を除外して特定要素除外データを生成する特定要素除外部130と、固定概念データを除くターゲットデータ及び特定要素除外データを含むデータをアウトプットデータとして生成するアウトプットデータ生成部140と、を有する。
【選択図】
図2