IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 川上 成年の特許一覧

<>
  • 特許-発想支援プログラム及び方法 図1
  • 特許-発想支援プログラム及び方法 図2
  • 特許-発想支援プログラム及び方法 図3
  • 特許-発想支援プログラム及び方法 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-08-03
(45)【発行日】2022-08-12
(54)【発明の名称】発想支援プログラム及び方法
(51)【国際特許分類】
   G06F 40/279 20200101AFI20220804BHJP
   G06F 16/35 20190101ALI20220804BHJP
【FI】
G06F40/279
G06F16/35
【請求項の数】 2
(21)【出願番号】P 2021189051
(22)【出願日】2021-11-19
【審査請求日】2021-11-19
(31)【優先権主張番号】P 2021014051
(32)【優先日】2021-01-31
(33)【優先権主張国・地域又は機関】JP
(31)【優先権主張番号】P 2021026849
(32)【優先日】2021-02-23
(33)【優先権主張国・地域又は機関】JP
(31)【優先権主張番号】P 2021026867
(32)【優先日】2021-02-23
(33)【優先権主張国・地域又は機関】JP
【早期審査対象出願】
(73)【特許権者】
【識別番号】510255004
【氏名又は名称】川上 成年
(72)【発明者】
【氏名】川上 成年
【審査官】成瀬 博之
(56)【参考文献】
【文献】国際公開第2007/060780(WO,A1)
【文献】特開2012-014476(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 40/00-40/58
G06F 16/00-16/958
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータに、
特定対象に限定された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出する処理と、
潜在的ディリクレ配分法により、前記第1情報データにおける、前記特定対象に特有の複数のトピックの各々におけ前記複数の第1用語を抽出する処理と、
前記特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、前記特定対象に特有の前記複数のトピックの各々における前記複数の第1用語に共起する、前記第2情報データ中の第2用語を表示する処理と、
を実行させる発想支援プログラム。
【請求項2】
コンピュータが、
特定対象に限定された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出し、
潜在的ディリクレ配分法により、前記第1情報データにおける、前記特定対象に特有の複数のトピックの各々におけ前記複数の第1用語を抽出し、
前記特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、前記特定対象に特有の前記複数のトピックの各々における前記複数の第1用語に共起する、前記第2情報データ中の第2用語を表示する、発想支援方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、発想支援プログラム及び方法に関する。
【背景技術】
【0002】
特許文献1には、発想支援プログラムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特許第6830636号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、コーディングルール処理が設定されている。しかしながら、複数のコードの各々に対応した複数の用語を抽出してコーディングルールを設定する処理は難易度が高い場合があるという課題がある。
【0005】
本発明は、このような従来の問題を解決するためになされたもので、発想を支援することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、コンピュータに、特定対象について取得された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出する処理と、潜在的ディリクレ配分法により、第1情報データにおける、特定対象に特有の複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出する処理と、特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、複数のトピックの各々における複数の第1用語に共起する第2用語を抽出する処理とを実行させる発想支援プログラムである。
【0007】
本発明は、コンピュータが、特定対象について取得された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出し、潜在的ディリクレ配分法により、第1情報データにおける、特定対象に特有の複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出し、特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、複数のトピックの各々における複数の第1用語に共起する第2用語を抽出する発想支援方法である。
【発明の効果】
【0008】
本発明の発想支援プログラム及び方法によれば、発想を支援することができる。
【図面の簡単な説明】
【0009】
図1】発想支援プログラムを実行する装置のブロック図
図2】発想支援プログラムの処理を示すフローチャート
図3】トピックとそれに対応する抽出語の集合の一例を示す図
図4】第2情報データから生成された共起ネットワークを示す図
【発明を実施するための形態】
【0010】
以下、実施形態である発想支援プログラム及びその方法について、図を参照して詳細に説明をする。なお、実施形態では、特定の掃除機メーカーA社の新規用途の発想支援を行う例を示すが、分析対象はこれに限られず、分析目的に応じて、品質、状態、ニーズ、便益、機構、部品、機能、効果、構成、構造、用途等の発想を支援することでもよい。
【0011】
図1は、実施形態の発想支援プログラムを実行するための情報処理装置のブロック図である。
【0012】
システムバス108を介して、CPU(Central Processing Unit)101、ROM(Read Only Memory)102、RAM(Random Access Memory)103、HDD(Hard Disk Drive)105、外部I/F(Interface)106、及び、入力部107が接続される。CPU101とROM102とRAM103とで制御部104を構成する。
【0013】
ROM102は、CPU101により実行されるプログラムや閾値を予め記憶する。ROM102は、後述する第1情報データや第2情報データを記憶する。
【0014】
RAM103は、CPU101が実行するプログラムを展開するエリアと、プログラムによるデータ処理の作業領域となるワークエリアなどの様々なメモリエリア等を有する。RAM103は、後述する第1情報データや第2情報データを記憶してもよい。
【0015】
HDD105は、入力部107から入力された第1情報データや第2情報データ等のテキストデータ(自然言語文データ)等を記憶する。なお、第1情報データや第2情報データは外部I/F106を介して、外部装置から取得してもよい。
【0016】
外部I/F106は、例えばクライアント端末(PC)などの外部装置と通信するためのインターフェースである。外部I/F106は、外部装置とデータ通信を行うインターフェースであれば良く、たとえば、外部装置にローカルに接続する機器(USBメモリ等)であってもよいし、有線又は無線ネットワークを介して通信するためのネットワークインターフェースであってもよい。
【0017】
外部I/F106は、液晶ディスプレイ等の表示装置(不図示)と接続する。外部I/F106は、個人が所有するスマートフォン、タブレット等の携帯端末に接続する。
【0018】
入力部107は、キーボード、マウス、スキャナ(読取装置)等の入力装置である。
【0019】
図2は、実施形態の発想支援プログラムの処理手順を示すフローチャートである。実施形態では、分析対象を特定の掃除機メーカーとした場合の発想支援について説明する。もちろん、分析対象はこれに限られない。
【0020】
まず、特定対象に限定した第1情報データを取得する(STEP1)。実施形態では、第1情報データを、J-PlatPatなどの特許情報データベースから取得する。実施形態では、検索対象を特定の掃除機メーカーとした検索によりヒットした特許出願のうち、938件の特許出願の要約書を分析の対象とした。なお、抽出する件数は938件に限られず、解析目的に応じて増減させて良い。また、分析対象は要約書に限られず明細書本文でもよいし、請求の範囲でもよい。
【0021】
なお、実施形態では、第1情報データを特許情報データベースから取得するが、情報の取得源はこれに限られず、クレーム情報、顧客レビュー、顧客アンケート、顧客インタビュー、公開技報、マニュアル、単行本、国内技術雑誌、非技術雑誌、外国学会論文、国内学会論文、企業技報、団体機関誌、予稿集、及び、J-GLOBAL等の自然言語文の技術情報が集約されたデータベース、などからも適宜取得してもよい。
【0022】
第1情報データは、ROM102やRAM103やHDD105に記憶される。
【0023】
制御部104は、第1情報データ938件について形態素解析処理を実行する(STEP2)。これにより、第1情報データ938件のテキスト全体から分析対象となる多数の用語(第1用語)を抽出する処理を実行する。
【0024】
形態素解析とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報に基づき、形態素(言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する処理のことをいう。
【0025】
次に、制御部104は、潜在的ディリクレ配分法により、第1情報データにおける、分析対象に特有の複数のトピックと、複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出する(STEP3)。
【0026】
潜在的ディリクレ配分法(Latent Dirichlet Allocation、以下LDAともいう。)とは、1つの文章が複数の潜在的トピックから確率的に生成されると仮定した言語モデルの一種である。文書内の各単語はあるトピックが持つ確率分布に従って出現すると仮定される。LDAでは、トピックごとに単語の出現頻度分布を想定することで、トピック間の類似性やその意味を解析できる。
【0027】
LDAでは、文章(ここでは、多数の自然言語文からなる第1情報データ)を形態素解析した後に、コーパスを作成し、トピック分類する処理を実行する。LDA処理は、PythonライブラリのGensim等のLDAアルゴリズムを有するソフトウェアを使用すれば実行可能である。なお、トピック抽出処理はLDAに限られず、その他のモデルを使用しても良い。
【0028】
図3は、LDA処理にて出力されたトピックとそれに対応する抽出語(第1用語)の集合の一例を示す。図に示すように、LDA処理にて複数のトピック(topic#1~#14)が抽出されるとともに、トピック毎に対して出現頻度の高い順に用語(第1用語)の集合が抽出される(ここでは、トピック毎に出現頻度順に各5個の用語が抽出されている。)。このようにして、第1情報データから、複数のトピック(#1~#14)と、当該複数のトピックの各々に対応する5つの用語の集合が抽出される。なお、用語の数は5つに限られず、目的に応じて適宜増減させてよい。また、トピックの数は14に限られず、目的に応じて増減させて良い。図では、わかりやすさのため、topic#1~#14には、それぞれ「制御性」、「格納性」等の名称をつけている。これらトピックは、特定の掃除機メーカーA社の製品に存在する特有の特徴的なトピックといえる。
【0029】
抽出されたトピック、及び、トピック毎の出現頻度順の複数の用語は、ROM102やRAM103やHDD105に記憶される。
【0030】
次に、上記特定対象(ここではA社)に限定しない第2情報データを取得する(STEP4)。実施形態では、第2情報データを、J-PlatPatなどの特許情報データベースから取得する。
【0031】
実施形態では、検索対象を特定の掃除機メーカー以外の任意の対象も含む検索によりヒットした特許出願のうち2989件の特許出願を分析の対象とした。なお、抽出する件数は2989件に限られず、多いことが好ましい。すなわち、第2情報データは、第1情報データより、多数の自然言語文からなることが好ましい。これにより、A社に限定されない大量の情報データから、幅広くアイデアを抽出することができる。
【0032】
検索対象については特定の掃除機メーカーを含んでも含まなくてもよく、特定の掃除機メーカー以外の技術からも幅広くアイデアを抽出することが好ましい。すなわち、第2情報データは、第1情報データ以外の技術や用途に関する自然言語文を含むことが好ましい。第2情報データは、ROM102やRAM103やHDD105に記憶される。
【0033】
なお、実施形態では、第2情報データを特許情報データベースから取得するが、情報の取得源はこれに限られず、クレーム情報、顧客レビュー、顧客アンケート、顧客インタビュー、公開技報、マニュアル、単行本、国内技術雑誌、非技術雑誌、外国学会論文、国内学会論文、企業技報、団体機関誌、予稿集、及び、J-GLOBAL等の技術情報が集約されたデータベース、などからも適宜取得してもよい。
【0034】
制御部104は、第2情報データ2989件について形態素解析処理を実行する(STEP5)。これにより、第2情報データのテキスト全体から分析対象となる用語(第2用語)を抽出する処理を実行する。
【0035】
なお、発明の発想、用途の発想を行う場合には、特許情報を取得・処理することでもよく、潜在ニーズの発想を行う場合には、アンケートデータやレビューデータを取得・処理することでもよい。
【0036】
制御部104は、STEP5で形態素解析により抽出された用語(第2用語)と、特定の掃除機メーカー特有の複数のトピック(#1~#14)の各々における複数の第1用語との共起関係を抽出する(STEP6)。
【0037】
図4の共起ネットワークは、掃除機メーカーA社特有のトピック「分離性」とトピック「清浄性」に含まれる用語(第1用語)と、STEP5で形態素解析処理により第2情報データから抽出された用語(第2用語)とのJaccard係数を計算して生成されたものである。共起性の尺度は、Jaccard係数に限られない。例えば、Dice係数やSimpson係数や共起頻度やコサイン距離やユークリッド距離でもよい。
【0038】
図4は、第2情報データ中の用語とトピック「分離性」とトピック「清浄性」との共起ネットワークを示す。図4に示すように、トピック「分離性」とトピック「清浄性」を構成する用語(第1用語:図中の四角で囲われた文字)と共起する第2情報データ中の用語(第2用語:図中の丸で囲われた文字)は大量に存在する。これら多数の用語は、トピック「分離性」とトピック「清浄性」と何らかの共起関係を有する用語といえる。実施形態で収集した特許情報は特定の掃除機メーカーの業務範囲以外の対象を含むことから、特定の掃除機メーカーの業務範囲に限定されることなく幅広い用語が抽出されていることがわかる。
【0039】
なお、図4は、トピック「分離性」と「清浄性」(に含まれる用語)と共起する用語の関係を図示した共起ネットワークを示すが、発想や分析の目的に応じて、共起ネットワークを生成するトピックを単数・複数・多数、適宜選択して共起関係を抽出してもよい。例えば、トピック「格納性」及び「制御性」を加えて共起関係を抽出してもよいし、すべてのトピックとの共起関係を抽出してもよいし、ひとつのトピックとの共起関係を抽出してもよい。
【0040】
図に示すように、トピック「分離性」、「清浄性」に関連する用語として、「エアシャワー装置」や「換気装置」があることがわかる(図中の矢印A、B)。例えば、この「エアシャワー装置」や「換気装置」という用語を、A社の製品に存在するトピック「分離性」、「清浄性」を適用できる新規用途の候補として発想するヒントとすることができる。このように、特定の掃除機メーカーA社の製品に存在する特有のトピックと共起する、特定の掃除機メーカーA社に限定されない第2用語を抽出することにより、発想を支援することができる。
【0041】
以上、実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0042】
101 CPU、102 ROM、103 RAM、104 制御部、105 HDD、106 外部I/F、107 入力部、108 システムバス
【要約】      (修正有)
【課題】発想を支援することができる発想支援プログラム及びその方法を提供する。
【解決手段】発想支援プログラムは、特定対象に限定された複数の自然言語文からなる第1情報データについて形態素解析を行い、複数の第1用語を抽出する処理と、潜在的ディリクレ配分法により、第1情報データにおける、複数のトピックの各々における出現頻度に応じた複数の第1用語を抽出する処理と、特定対象に限定されない複数の自然言語文からなる第2情報データについて形態素解析を行い、複数のトピックの各々における複数の第1用語に共起する第2用語を抽出する処理とを実行させる。
【選択図】図2
図1
図2
図3
図4