IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

<>
  • 特許-当落予測プログラム、装置、及び方法 図1
  • 特許-当落予測プログラム、装置、及び方法 図2
  • 特許-当落予測プログラム、装置、及び方法 図3
  • 特許-当落予測プログラム、装置、及び方法 図4
  • 特許-当落予測プログラム、装置、及び方法 図5
  • 特許-当落予測プログラム、装置、及び方法 図6
  • 特許-当落予測プログラム、装置、及び方法 図7
  • 特許-当落予測プログラム、装置、及び方法 図8
  • 特許-当落予測プログラム、装置、及び方法 図9
  • 特許-当落予測プログラム、装置、及び方法 図10
  • 特許-当落予測プログラム、装置、及び方法 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-05
(45)【発行日】2024-11-13
(54)【発明の名称】当落予測プログラム、装置、及び方法
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20241106BHJP
   G06Q 50/26 20240101ALI20241106BHJP
【FI】
G06Q10/04
G06Q50/26
【請求項の数】 9
(21)【出願番号】P 2021055702
(22)【出願日】2021-03-29
(65)【公開番号】P2022152793
(43)【公開日】2022-10-12
【審査請求日】2023-12-07
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】藤重 雄大
(72)【発明者】
【氏名】浅井 達哉
(72)【発明者】
【氏名】大堀 耕太郎
【審査官】関 博文
(56)【参考文献】
【文献】特開2015-53039(JP,A)
【文献】特開2012-38041(JP,A)
【文献】国際公開第2021/038675(WO,A1)
【文献】米国特許出願公開第2019/0205770(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
政党に対する支持度合いに関するパラメータを政党毎に決定し、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定し、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する、
ことを含む処理をコンピュータに実行させるための当落予測プログラム。
【請求項2】
前記選挙当落を予測する処理は、前記複数の判定ルールのうち、前記候補者情報から抽出される1以上の特徴が充足する判定ルールの前記選挙当落の予測に対する重要度を、前記充足する判定ルールについて決定された前記パラメータ及び前記影響度合いで補正することを含む請求項1に記載の当落予測プログラム。
【請求項3】
前記重要度は、当落が既知の過去の選挙における候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、を用いた機械学習により算出される請求項2に記載の当落予測プログラム。
【請求項4】
前記影響度合いを決定する処理は、前記判定ルールに含まれる前記特徴毎に予め設定された影響度に基づいて決定することを含む請求項1~請求項3のいずれか1項に記載の当落予測プログラム。
【請求項5】
前記影響度合いを決定する処理は、前記判定ルールに含まれる前記特徴毎に予め設定された影響度の平均、和、重み付き和、又は積を前記影響度合いとして決定することを含む請求項4に記載の当落予測プログラム。
【請求項6】
前記複数の判定ルールは、前記特徴の網羅的な組み合わせのうち、前記選挙当落の予測への寄与度が所定値以上の組み合わせ、又は前記寄与度が上位所定個の組み合わせを選択したものである請求項1~請求項5のいずれか1項に記載の当落予測プログラム。
【請求項7】
前記パラメータを決定する処理は、インターネット上の情報における前記政党に関する肯定的意見又は否定的意見、及び前記政党への支持率の推移の少なくとも一方に基づいて決定することを含む請求項1~請求項6のいずれか1項に記載の当落予測プログラム。
【請求項8】
政党に対する支持度合いに関するパラメータを政党毎に決定する支持度決定部と、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定する影響度決定部と、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する予測部と、
を含む当落予測装置。
【請求項9】
政党に対する支持度合いに関するパラメータを政党毎に決定し、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定し、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する、
ことを含む処理をコンピュータが実行する当落予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
開示の技術は、当落予測プログラム、当落予測装置、及び当落予測方法に関する。
【背景技術】
【0002】
選挙に関する情報の分析を支援する技術が提案されている。例えば、選挙立候補予想者等の人物経歴情報、世論調査や意識調査等の調査結果情報、投開票情報等の各種情報を一元管理して、各種情報を収集、蓄積、配信可能にすると共に関連付けを行うシステムが提案されている。このシステムは、一元管理する情報の検索又は選挙シミュレーション等の運用、及びデータ管理作業を行う。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2003-114956号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
過去の選挙における候補者の特徴と、その候補者の当落の結果との関係について、機械学習を実行することによりモデルを生成し、このモデル、及び今後の選挙の候補者の特徴を用いて、その候補者の当落を予測することを考える。選挙の当落は、選挙時の情勢によっても左右されるため、過去の情報から生成されたモデルを用いて当落を予測する場合には、予測精度が低下する場合もある。
【0005】
一つの側面として、開示の技術は、選挙の当落の予測精度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
一つの態様として、開示の技術は、政党に対する支持度合いに関するパラメータを政党毎に決定し、それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定する。そして、開示の技術は、少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する。
【発明の効果】
【0007】
一つの側面として、選挙の当落の予測精度を向上させることができる、という効果を有する。
【図面の簡単な説明】
【0008】
図1】当落予測に政党への風の影響を反映する単純な手法を説明するための図である。
図2】当落予測装置の機能ブロック図である。
図3】学習データDBの一例を示す図である。
図4】ルールDBの一例を示す図である。
図5】学習時支持度DBの一例を示す図である。
図6】特徴影響度DBの一例を示す図である。
図7】予測対象データDBの一例を示す図である。
図8】当落予想装置として機能するコンピュータの概略構成を示すブロック図である。
図9】学習時処理の一例を示すフローチャートである。
図10】予測時処理の一例を示すフローチャートである。
図11】本実施形態の効果を説明するための図である。
【発明を実施するための形態】
【0009】
以下、図面を参照して、開示の技術に係る実施形態の一例を説明する。
【0010】
過去の選挙における候補者の特徴と、その候補者の当落の結果との関係について、機械学習を実行することによりモデルを生成し、このモデル、及び今後の選挙の候補者の特徴を用いて、その候補者の当落を予測することを考える。この場合の予測精度を向上させるために、予測時の情勢として、候補者が属する政党に対する支持度合い、いわゆる「政党への風」を予測に反映させることが考えられる。
【0011】
「政党への風」を予測に反映させる手法として、単純に想定される手法としては、候補者毎の当落の予測結果を、その候補者が属する政党に対する「政党への風」に基づいて補正することが考えられる。例えば、図1に示すように、機械学習により生成されたモデルを用いて、A党所属の候補者Sについて重要度が1.0、B党所属の候補者Tについて重要度が0.4と予測されたとする。なお、重要度は、値が大きいほど「当選」と予測される確率が高いことを表す指標である。また、「政党への風」を数値化したパラメータ(以下、「支持度」という)が、A党については「-0.5」、B党については「+0.5」であるとする。なお、この支持度は、値が大きいほど、政党への支持度合いが高いことを表す。したがって、この例では、A党は逆風、B党は追い風ということができる。
【0012】
例えば、図1に示すように、補正前の重要度と支持度との和を補正後の重要度とすると、候補者S及びTについての重要度、すなわち当落の予測が、「政党への風」を重要度に反映することで、補正前後で逆転することになる。しかし、例えば、候補者Sが、世襲かつ大臣経験者という、選挙において有利な特徴を持っている場合、「政党への風」に関わらず、当選確実な候補者であるといえる。上記のように、候補者毎の当落の予測結果を、その候補者が属する政党に対する「政党への風」に基づいて補正する場合、その政党に所属する全ての候補者に対して、「政党への風」の影響が同様に反映されてしまう。そのため、上記の候補者Sのような特徴を持つ候補者のように、「政党への風」の影響を受けない、又は影響が小さい特徴を持つ候補者の予測が不正確になる。
【0013】
そこで、本実施形態では、特徴毎に「政党への風」の影響度を考慮することで、予測精度の向上を図る。以下、本実施形態について詳述する。
【0014】
図2に示すように、当落予測装置10は、学習時に機能する機能部として、学習データ生成部11と、判定ルール生成部12と、学習時支持度決定部13と、影響度決定部14と、機械学習部15とを含む。また、当落予測装置10は、予測時に機能する機能部として、予測対象データ生成部31と、予測時支持度決定部33と、予測部35とを含む。また、当落予測装置10の所定の記憶領域には、学習データDB(Database)16と、学習時支持度DB17と、特徴影響度DB18と、ルールDB20と、予測対象データDB36と、予測時支持度DB37とが記憶される。
【0015】
まず、学習時に機能する機能部の詳細について説明する。
【0016】
学習データ生成部11は、当落予測装置10に入力される学習用資料を取得し、学習用資料から学習データを生成する。学習用資料としては、例えば、過去の選挙時における出口調査に関する資料、候補者の属性情報等が含まれる。学習用資料は、少なくとも候補者が所属する政党の情報、及び当落の結果を含むものとする。学習データ生成部11は、各学習用資料から、候補者毎の情報を抽出して学習データを生成し、各候補者の学習データを学習データDB16に記憶する。学習データは、開示の技術の「当落が既知の過去の選挙における候補者情報」の一例である。
【0017】
図3に、学習データDB16の一例を示す。図3の例では、学習データDB16の各行(各レコード)が候補者毎の学習データである。また、図3の例では、学習データは、候補者の「名前」、「年齢」、「性別」、「政党」、「都道府県」、「ブロック」、「当選回数」、「前期」、「出口調査の得票率」、「世襲」、「大臣経験」等の項目と、「当落」を示す正解ラベルとが含まれる。「政党」は候補者が所属する政党名である。「都道府県」及び「ブロック」は、候補者が立候補した選挙区を表す情報である。「当選回数」は、その候補者が過去の選挙で当選した回数である。「前期」は、候補者が現職、元職、及び新人のいずれであるかを示す情報である。なお、学習データに含まれる項目は図3の例に限定されず、主張の内容、学歴、選挙区が出身地か否か等、他の項目を含んでもよい。
【0018】
学習データにおける候補者の識別情報(図3の例では、「名前」)及び正解ラベルである「当落」以外の項目についての、項目名及び値が、それぞれ候補者の「特徴」となる。以下では、特徴を、「項目名=(又は不等号)値」の形式で表記する。
【0019】
判定ルール生成部12は、学習データDB16に記憶された学習データに含まれる特徴の網羅的な組み合わせを生成する。なお、値が数値の特徴については、値そのものを特徴として用いてもよいし、値が属する範囲を特徴として用いてもよい。例えば、項目「当選回数」についての特徴を、「当選回数=1回」、「当選回数=2回」、「当選回数≧3回」等としてよい。判定ルール生成部12は、生成した組み合わせ毎に、選挙当落の予測への寄与度を算出する。寄与度は、その組み合わせの特徴を有する学習データの正解ラベルが「当選」である学習データの数が多いほど高くなる値としてよい。判定ルール生成部12は、網羅的に生成した組み合わせのうち、寄与度が所定値以上の組み合わせ、又は寄与度が上位所定個の組み合わせを選択することにより、判定ルールを生成する。したがって、判定ルールは、それぞれが1以上の特徴の組み合わせで示される。
【0020】
判定ルール生成部12は、生成した判定ルールに識別情報を付与し、ルールDB20に記憶する。図4に、ルールDB20の一例を示す。図4において、「ルールID」は判定ルールの識別情報であり、ここでは、ルールIDを1,2,・・・の連番としている。以下では、ルールIDがjの判定ルールを「判定ルールj」と表記する。なお、図4における「影響度」及び「重要度」についての詳細は後述するが、この段階では空欄である。
【0021】
学習時支持度決定部13は、政党に対する支持度合い、すなわち「政党への風」に関するパラメータである支持度を、政党毎に決定する。例えば、学習時支持度決定部13は、インターネット上の情報における政党に関する肯定的意見又は否定的意見に基づいて、支持度を決定してよい。具体的には、学習時支持度決定部13は、ニュースサイトにおける政治記事や、SNS(Social Network Service)の投稿等の各意見から、政党に関するキーワードと、肯定的なキーワード又は否定的なキーワードとの組を抽出する。政党に関するキーワードは、例えば、政党名、政党の略称、党首名等としてよい。肯定的又は否定的なキーワードは、選挙公約、失言、政治的見解等に関連するキーワードに、そのキーワードが表す意味が肯定的か否定的かを示す情報を付与したものとしてよい。
【0022】
学習時支持度決定部13は、抽出したキーワードの組における肯定的なキーワード及び否定的なキーワードの出現頻度に基づいて、その意見が肯定的意見か、否定的意見かを特定する。例えば、学習時支持度決定部13は、意見に含まれる肯定的なキーワードの方が多い場合には、その意見を肯定的意見として特定し、否定的なキーワードの方が多い場合には、その意見を否定的意見として特定する。そして、学習時支持度決定部13は、肯定的意見の方が多いほど高く、否定的意見の方が多いほど低くなるように支持度を決定する。すなわち、学習時支持度決定部13は、肯定的意見の方が多い場合は「追い風」を表し、否定的意見の方が多い場合は「逆風」を表すように支持度を決定する。例えば、学習時支持度決定部13は、「A党への風を示す支持度=(A党に対する肯定的意見数-A党に対する否定的意見数)/(A党に対する肯定的意見数+A党に対する否定的意見数)」のように支持度を決定してよい。
【0023】
また、学習時支持度決定部13は、世論調査の結果等が示す、政党への支持率の情報を取得し、支持率の推移の増加傾向が高いほど高くなるように支持度を決定し、支持率の推移の減少傾向が高いほど低くなるように支持度を決定してもよい。すなわち、学習時支持度決定部13は、支持率の推移が増加傾向の場合には「追い風」を表し、支持率の推移が減少傾向の場合には「逆風」を表すように支持度を決定する。
【0024】
学習時支持度決定部13は、決定した政党毎の支持度を、学習時支持度DB17に記憶する。図5に、学習時支持度DB17の一例を示す。図5の例では、支持度がプラスの場合には、政党への風が追い風であることを表し、支持度がマイナスの場合には、政党への風が逆風であることを表している。
【0025】
影響度決定部14は、ルールDB20に記憶された判定ルールそれぞれについて、支持度の影響度合いを示す指標である影響度を決定する。具体的には、影響度決定部14は、特徴毎の特徴影響度が定義された特徴影響度DB18を参照して、ルールDB20に記憶された判定ルールに含まれる特徴毎の特徴影響度に基づいて、判定ルール毎に、支持度の影響度を決定する。
【0026】
図6に、特徴影響度DB18の一例を示す。図6の例では、特徴影響度を0~1の値としており、特徴影響度が1の場合には、政党への風の影響を最大限に受け、影響度が0の場合には、政党への風の影響を受けないことを表している。例えば、「政党=*」は、政党への風の影響を直接受ける特徴であるため、特徴影響度は1と定義されている。なお、「*」は、項目「政党」の値がいずれの政党を示す値であっても、特徴影響度は1であることを表している。また、新人ほど政党への風の影響を受け易いため、「当選回数」が少ないほど大きな特徴影響度を定義してよい。また、候補者の年齢や性別等、政党への風とは関係ない特徴については、影響度を0と定義すればよい。また、学習データに主張の内容等の項目が含まれる場合、その時々の政権や選挙で注目されている政策や支持団体等に応じて、主張の内容に応じた特徴影響度を定義してもよい。
【0027】
影響度決定部14は、例えば、判定ルールに含まれる特徴毎の特徴影響度を特徴影響度DB18から取得し、取得した特徴影響度の平均、和、重み付き和、積等を、その判定ルールについての影響度として決定する。影響度決定部14は、決定した影響度を、判定ルールに対応付けて、ルールDB20に記憶する。
【0028】
機械学習部15は、学習データDB16に記憶された学習データと、学習時支持度DB17に記憶された政党毎の支持度と、ルールDB20に記憶された複数の判定ルール、及び複数の判定ルールそれぞれについての影響度とを取得する。機械学習部15は、取得した情報を用いて、機械学習により、複数の判定ルールそれぞれについての重要度を算出する。具体的には、機械学習部15は、各学習データが充足する判定ルールについての重要度を、政党毎の支持度及びその影響度を加味した上で統合した値が、その学習データに含まれる正解ラベルが示す当選又は落選に対応するように、重要度を算出する。
【0029】
例えば、ロジスティック回帰を用いた手法の場合において、機械学習部15は、候補者iの当選確率をpとした場合、下記(1)式を回帰式として、判定ルールj(j=1,2,・・・,m、mは判定ルールの個数)の重要度βを算出する。ただし、γi,jは、「判定ルールjの影響度」×「候補者iの所属政党に対する支持度」、xj,i∈{0,1}は、候補者iの学習データが判定ルールjを充足する場合は1、充足しない場合は0を表す。
【0030】
【数1】
【0031】
例えば、図3に示す学習データDB16に記憶された1行目の学習データが示す候補者Rの当選確率をpとする。また、図4に示すルールDB20に記憶された判定ルール及び影響度と、図5に示す学習時支持度DB17に記憶された政党毎の支持度を用いるとする。この場合、候補者Rの学習データは、判定ルールのうち、判定ルール1、判定ルール3、及び判定ルール5を充足する。したがって、機械学習部15は、log(p/(1-p))=20.8×0.5β+0×β+20×0.5β+0×β+21×0.5β+0×β≒1.32β+β+1.41βを得る。機械学習部15は、βに、初期値又は繰り返し計算によりここまでに得られている値を代入し、pを計算する。そして、機械学習部15は、計算したpが、候補者Rの正解ラベル「当選」に対応するように、βの値を更新する処理を、各候補者の学習データを用いて繰り返し実行する。例えば、機械学習部15は、正解ラベルが「当選」の候補者の当選確率pが0.5以上、正解ラベルが「落選」の候補者の当選確率pが0.5未満となるように、βを算出する。
【0032】
機械学習部15は、機械学習により算出した判定ルール毎の重要度βを、判定ルールに対応付けてルールDB20に記憶する。
【0033】
次に、予測時に機能する機能部の詳細について説明する。
【0034】
予測対象データ生成部31は、当落予測装置10に入力される予測用資料を取得し、予測用資料から予測対象データを生成する。予測用資料としては、例えば、予測対象の選挙について、学習用資料と同様の資料としてよい。予測対象データ生成部31は、各予測用資料から、候補者毎の情報を抽出して予測対象データを生成し、各候補者の予測対象データを予測対象データDB36に記憶する。予測対象データは、開示の技術の「候補者情報」の一例である。図7に、予測対象データDB36の一例を示す。予測対象データDB36のデータ構成は、図3に示す学習データDB16のデータ構成と同様である。ただし、予測対象データについては、候補者の当落は未知であるため、学習データには含まれる正解ラベルである項目「当落」は含まれない。
【0035】
予測時支持度決定部33は、学習時支持度決定部13と同様に、予測対象の選挙時における、政党に対する支持度合い、すなわち「政党への風」に関するパラメータである支持度を、政党毎に決定する。予測時支持度決定部33は、決定した政党毎の支持度を、予測時支持度DB37に記憶する。予測時支持度DB37のデータ構成は、図5に示す学習時支持度DB17のデータ構成と同様である。
【0036】
予測部35は、予測対象データDB36に記憶された予測対象データと、予測時支持度DB37に記憶された政党毎の支持度と、ルールDB20に記憶された複数の判定ルール、及び複数の判定ルールそれぞれについての影響度とを取得する。予測部35は、取得した情報に基づいて、候補者の選挙当落を予測する。具体的には、予測部35は、複数の判定ルールのそれぞれの重要度を、各判定ルールについて決定された支持度及び影響度で補正する。そして、予測部35は、候補者の予測対象データから抽出される1以上の特徴が充足する判定ルールについての、補正後の重要度を統合した値に基づいて、その候補者の当落を予測する。
【0037】
例えば、(1)式の回帰式を用いる場合において、図7に示す予測対象データDB36に記憶された1行目の予測対象データが示す候補者Vの当選確率をpとする。また、図4に示すルールDB20に記憶された判定ルール、影響度、及び重要度を用いるとする。さらに、予測時支持度DB37に記憶されたC党の支持度が「+0.2」であるとする。この場合、候補者Vの予測対象データは、判定ルールのうち、判定ルール2及び判定ルール4を充足する。したがって、予測部35は、log(p/(1-p))=20.4×0.2×0.4+20.5×0.2×(-0.8)≒-0.43から、p≒0.39と算出する。なお、予測時においては、(1)式の2γ_i,jβが補正後の重要度に相当する。
【0038】
予測部35は、予測対象データDB36に予測対象データが記憶された各候補者についての当落の予測結果を出力する。予測結果は、上記のように算出した当選確率でもよいし、当選確率が0.5以上の場合には「当選」、0.5未満の場合には「落選」とする予測結果を出力してもよい。
【0039】
当落予測装置10は、例えば図8に示すコンピュータ40で実現することができる。コンピュータ40は、CPU(Central Processing Unit)41と、一時記憶領域としてのメモリ42と、不揮発性の記憶部43とを備える。また、コンピュータ40は、入力部、表示部等の入出力装置44と、記憶媒体49に対するデータの読み込み及び書き込みを制御するR/W(Read/Write)部45とを備える。また、コンピュータ40は、インターネット等のネットワークに接続される通信I/F(Interface)46を備える。CPU41、メモリ42、記憶部43、入出力装置44、R/W部45、及び通信I/F46は、バス47を介して互いに接続される。
【0040】
記憶部43は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等によって実現できる。記憶媒体としての記憶部43には、コンピュータ40を、当落予測装置10として機能させるための当落予測プログラム50が記憶される。当落予測プログラム50は、学習データ生成プロセス51と、判定ルール生成プロセス52と、学習時支持度決定プロセス53と、影響度決定プロセス54と、機械学習プロセス55とを有する。また、当落予測プログラム50は、予測対象データ生成プロセス61と、予測時支持度決定プロセス63と、予測プロセス65とを有する。また、記憶部43は、学習データDB16、学習時支持度DB17、特徴影響度DB18、ルールDB20、予測対象データDB36、及び予測時支持度DB37の各々を構成する情報が記憶される情報記憶領域70を有する。
【0041】
CPU41は、当落予測プログラム50を記憶部43から読み出してメモリ42に展開し、当落予測プログラム50が有するプロセスを順次実行する。CPU41は、学習データ生成プロセス51を実行することで、図2に示す学習データ生成部11として動作する。また、CPU41は、判定ルール生成プロセス52を実行することで、図2に示す判定ルール生成部12として動作する。また、CPU41は、学習時支持度決定プロセス53を実行することで、図2に示す学習時支持度決定部13として動作する。また、CPU41は、影響度決定プロセス54を実行することで、図2に示す影響度決定部14として動作する。また、CPU41は、機械学習プロセス55を実行することで、図2に示す機械学習部15として動作する。また、CPU41は、予測対象データ生成プロセス61を実行することで、図2に示す予測対象データ生成部31として動作する。また、CPU41は、予測時支持度決定プロセス63を実行することで、図2に示す予測時支持度決定部33として動作する。また、CPU41は、予測プロセス65を実行することで、図2に示す予測部35として動作する。また、CPU41は、情報記憶領域70から情報を読み出して、学習データDB16、学習時支持度DB17、特徴影響度DB18、ルールDB20、予測対象データDB36、及び予測時支持度DB37の各々をメモリ42に展開する。これにより、当落予測プログラム50を実行したコンピュータ40が、当落予測装置10として機能することになる。なお、プログラムを実行するCPU41はハードウェアである。
【0042】
なお、当落予測プログラム50により実現される機能は、例えば半導体集積回路、より詳しくはASIC(Application Specific Integrated Circuit)等で実現することも可能である。
【0043】
次に、本実施形態に係る当落予測装置10の作用について説明する。学習時において、当落予測装置10に学習用資料が入力されると、当落予測装置10において、図9に示す学習時処理が実行される。また、予測時において、当落予測装置10に予測用資料が入力されると、当落予測装置10において、図10に示す予測時処理が実行される。なお、学習時処理及び予測時処理は、開示の技術の当落予測方法の一例である。以下、学習時処理及び予測時処理の各々について説明する。
【0044】
まず、図9に示す学習時処理について説明する。
【0045】
ステップS11で、学習データ生成部11が、当落予測装置10に入力された学習用資料を取得し、各学習用資料から、候補者毎の情報を抽出して学習データを生成し、各候補者の学習データを学習データDB16に記憶する。
【0046】
次に、ステップS12で、判定ルール生成部12が、学習データDB16に記憶された学習データに含まれる特徴の網羅的な組み合わせを生成し、生成した組み合わせ毎に、選挙当落の予測への寄与度を算出する。そして、判定ルール生成部12が、網羅的に生成した組み合わせのうち、寄与度が所定値以上の組み合わせ、又は寄与度が上位所定個の組み合わせを選択することにより、判定ルールを生成する。そして、判定ルール生成部12が、生成した判定ルールに識別情報(ルールID)を付与し、ルールDB20に記憶する。
【0047】
次に、ステップS13で、学習時支持度決定部13が、インターネット上の情報における政党に関する肯定的意見又は否定的意見の数や、政党への支持率の推移に基づいて、「政党への風」に関するパラメータである支持度を、政党毎に決定する。そして、学習時支持度決定部13が、決定した政党毎の支持度を学習時支持度DB17に記憶する。なお、本ステップの処理は、ステップS11、S12、及びS14と処理の順番が入れ替わってもよいし、これらのステップの処理と並行して実行されてもよい。
【0048】
次に、ステップS14で、影響度決定部14は、特徴毎の特徴影響度が定義された特徴影響度DB18を参照して、ルールDB20に記憶された判定ルールに含まれる特徴毎の特徴影響度に基づいて、判定ルール毎に、支持度の影響度を決定する。そして、影響度決定部14が、決定した影響度を、判定ルールに対応付けて、ルールDB20に記憶する。
【0049】
次に、ステップS15で、機械学習部15が、学習データDB16に記憶された学習データと、学習時支持度DB17に記憶された政党毎の支持度と、ルールDB20に記憶された複数の判定ルール、及び複数の判定ルールそれぞれについての影響度とを取得する。そして、機械学習部15が、取得した情報を用いて、機械学習により、複数の判定ルールそれぞれについての重要度を算出する。機械学習部15は、算出した判定ルール毎の重要度を、判定ルールに対応付けてルールDB20に記憶し、学習時処理は終了する。
【0050】
次に、図10に示す予測時処理について説明する。
【0051】
ステップS21で、予測対象データ生成部31が、当落予測装置10に入力された予測用資料を取得し、各予測用資料から、候補者毎の情報を抽出して予測対象データを生成し、各候補者の予測対象データを予測対象データDB36に記憶する。
【0052】
次に、ステップS22で、予測時支持度決定部33が、学習時処理のステップS13と同様に、「政党への風」に関するパラメータである支持度を、政党毎に決定し、予測時支持度DB37に記憶する。なお、本ステップの処理は、ステップS21と処理の順番が入れ替わってもよいし、ステップS21の処理と並行して実行されてもよい。
【0053】
次に、ステップS23で、予測部35が、予測対象データDB36に記憶された予測対象データと、予測時支持度DB37に記憶された政党毎の支持度と、ルールDB20に記憶された複数の判定ルール及びそれらの影響度とを取得する。そして、予測部35が、複数の判定ルールのそれぞれの重要度を、各判定ルールについて決定された支持度及び影響度で補正する。また、予測部35が、候補者の予測対象データから抽出される1以上の特徴が充足する判定ルールについての、補正後の重要度を用いて、各候補者の当選確率を算出する。
【0054】
次に、ステップS24で、予測部35が、予測対象データDB36に予測対象データが記憶された各候補者について、上記ステップS23で算出した当選確率を予測結果として出力する。又は、予測部35は、当選確率を「当選」若しくは「落選」に置き換えた予測結果を出力してもよい。そして、予測時処理は終了する。
【0055】
以上説明したように、本実施形態に係る当落予測装置は、政党に対する支持度合いに関するパラメータ、いわゆる政党への風を示す支持度を政党毎に決定する。また、当落予測装置は、それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、支持度の影響度合いを示す指標である影響度を決定する。そして、当落予測装置は、少なくとも候補者の属する政党の情報を含む候補者情報と、支持度と、複数の判定ルールと、複数の判定ルールそれぞれについての影響度とに基づいて、候補者の選挙当落を予測する。これにより、政党への風の影響を、候補者の特徴に応じて反映させることができる。すなわち、同じ政党の候補者であっても、政党への風の影響を受け易い候補者と受け難い候補者とを区別して当落を予測することができる。したがって、選挙の当落の予測精度を向上させることができる。
【0056】
例えば、図11に示すように、予測対象の選挙時における、A党への風を示す支持度が「-0.5」、B党への風を示す支持度が「+0.5」が決定されているとする。また、判定ルールとして、判定ルール1、判定ルール2、及び判定ルール3が生成され、それぞれについて影響度及び重要度が算出されているとする。図11の例では、判定ルール1の影響度は0、判定ルール2及び判定ルール3の影響度は1である。これは、判定ルール1は、政党への風の影響を受けない特徴の組み合わせからなる判定ルールであり、判定ルール2及び判定ルール3は、政党への風の影響を受け易い特徴の組み合わせからなる判定ルールであることを表している。各判定ルールの重要度に、この影響度を加味して、政党への風を反映させたものが補正後の重要度である。すなわち、補正後の重要度は、各判定ルールについて、影響度及び支持度で重要度を補正したものである。また、図11左下の図に示すように、青森選挙区におけるA党所属の候補者Wの特徴は判定ルール2を充足し、B党所属の候補者Xの特徴は判定ルール3を充足するとする。また、図11右下の図に示すように、東京選挙区におけるA党所属の候補者Yの特徴は判定ルール1を充足し、B党所属の候補者Zの特徴は判定ルール3を充足するとする。
【0057】
図11左下の青森選挙区の図に示すように、候補者W及び候補者Xは両者とも政党への風の影響を受け易い判定ルールを充足、すなわち、政党への風の影響を受け易い特徴を有している。そのため、候補者Wについては、所属政党A党への逆風の影響を受け、候補者Xについては、所属政党B党への追い風の影響を受け、重要度の補正の前後で当落の予測が逆転することになる。また、図11右下の東京選挙区の図に示すように、候補者Yは政党への風の影響を受けない判定ルールを充足、すなわち、政党への風の影響を受けない特徴を有している。一方、候補者Zは政党への風の影響を受け易い判定ルールを充足、すなわち、政党への風の影響を受け易い特徴を有している。そのため、候補者Zは所属政党B党の追い風の影響を受けるが、候補者Yは所属政党Aへの逆風の影響を受けないため、重要度の補正の前後で当落の予測が逆転するには至っていない。このように、同じA党所属の候補者であっても、各候補者の特徴に応じて、政党への風の影響を受け易いか受け難いかを反映して、選挙の当落を予測することができる。
【0058】
なお、上記実施形態では、1つのコンピュータで、学習時に機能する機能部及び予測時に機能する機能部を実現する場合について説明したが、これに限定されない。例えば、学習時に機能する機能部を有する機械学習装置と、予測時に機能する機能部とを有する予測装置とをそれぞれ異なるコンピュータで実現するようにしてもよい。
【0059】
また、上記実施形態では、当落予測プログラムが記憶部に予め記憶(インストール)されている態様を説明したが、これに限定されない。開示の技術に係るプログラムは、CD-ROM、DVD-ROM、USBメモリ等の記憶媒体に記憶された形態で提供することも可能である。
【0060】
以上の実施形態に関し、更に以下の付記を開示する。
【0061】
(付記1)
政党に対する支持度合いに関するパラメータを政党毎に決定し、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定し、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する、
ことを含む処理をコンピュータに実行させるための当落予測プログラム。
【0062】
(付記2)
前記選挙当落を予測する処理は、前記複数の判定ルールのうち、前記候補者情報から抽出される1以上の特徴が充足する判定ルールの前記選挙当落の予測に対する重要度を、前記充足する判定ルールについて決定された前記パラメータ及び前記影響度合いで補正することを含む付記1に記載の当落予測プログラム。
【0063】
(付記3)
前記重要度は、当落が既知の過去の選挙における候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、を用いた機械学習により算出される付記2に記載の当落予測プログラム。
【0064】
(付記4)
前記影響度合いを決定する処理は、前記判定ルールに含まれる前記特徴毎に予め設定された影響度に基づいて決定することを含む付記1~付記3のいずれか1項に記載の当落予測プログラム。
【0065】
(付記5)
前記影響度合いを決定する処理は、前記判定ルールに含まれる前記特徴毎に予め設定された影響度の平均、和、重み付き和、又は積を前記影響度合いとして決定することを含む付記4に記載の当落予測プログラム。
【0066】
(付記6)
前記複数の判定ルールは、前記特徴の網羅的な組み合わせのうち、前記選挙当落の予測への寄与度が所定値以上の組み合わせ、又は前記寄与度が上位所定個の組み合わせを選択したものである付記1~付記5のいずれか1項に記載の当落予測プログラム。
【0067】
(付記7)
前記パラメータを決定する処理は、インターネット上の情報における前記政党に関する肯定的意見又は否定的意見、及び前記政党への支持率の推移の少なくとも一方に基づいて決定することを含む付記1~付記6のいずれか1項に記載の当落予測プログラム。
【0068】
(付記8)
前記肯定的意見又は否定的意見に基づいて前記パラメータを決定する処理は、前記インターネット上の情報から、前記政党に関するキーワードと、肯定的なキーワード又は否定的なキーワードとの組を抽出し、抽出された前記組における前記肯定的なキーワード及び前記否定的なキーワードの出現頻度に基づいて決定することを含む付記7に記載の当落予測プログラム。
【0069】
(付記9)
前記パラメータを決定する処理は、前記否定的なキーワードより前記肯定的なキーワードの出現頻度が高いほど、前記支持度合いが高くなるように決定する付記8に記載の当落予測プログラム。
【0070】
(付記10)
前記パラメータを決定する処理は、前記支持率の推移の増加傾向が高いほど、前記支持度合いが高くなるように決定する付記7に記載の当落予測プログラム。
【0071】
(付記11)
政党に対する支持度合いに関するパラメータを政党毎に決定する支持度決定部と、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定する影響度決定部と、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する予測部と、
を含む当落予測装置。
【0072】
(付記12)
前記予測部は、前記複数の判定ルールのうち、前記候補者情報から抽出される1以上の特徴が充足する判定ルールの前記選挙当落の予測に対する重要度を、前記充足する判定ルールについて決定された前記パラメータ及び前記影響度合いで補正する付記11に記載の当落予測装置。
【0073】
(付記13)
前記重要度は、当落が既知の過去の選挙における候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、を用いた機械学習により算出される付記12に記載の当落予測装置。
【0074】
(付記14)
前記影響度決定部は、前記判定ルールに含まれる前記特徴毎に予め設定された影響度に基づいて決定する付記11~付記13のいずれか1項に記載の当落予測装置。
【0075】
(付記15)
前記影響度決定部は、前記判定ルールに含まれる前記特徴毎に予め設定された影響度の平均、和、重み付き和、又は積を前記影響度合いとして決定する付記14に記載の当落予測装置。
【0076】
(付記16)
前記複数の判定ルールは、前記特徴の網羅的な組み合わせのうち、前記選挙当落の予測への寄与度が所定値以上の組み合わせ、又は前記寄与度が上位所定個の組み合わせを選択したものである付記11~付記15のいずれか1項に記載の当落予測装置。
【0077】
(付記17)
前記支持度決定部は、インターネット上の情報における前記政党に関する肯定的意見又は否定的意見、及び前記政党への支持率の推移の少なくとも一方に基づいて決定する付記11~付記16のいずれか1項に記載の当落予測装置。
【0078】
(付記18)
前記支持度決定部は、前記インターネット上の情報から、前記政党に関するキーワードと、肯定的なキーワード又は否定的なキーワードとの組を抽出し、抽出された前記組における前記肯定的なキーワード及び前記否定的なキーワードの出現頻度に基づいて、前記パラメータを決定する付記17に記載の当落予測装置。
【0079】
(付記19)
政党に対する支持度合いに関するパラメータを政党毎に決定し、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定し、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する、
ことを含む処理をコンピュータが実行する当落予測方法。
【0080】
(付記20)
政党に対する支持度合いに関するパラメータを政党毎に決定し、
それぞれが1以上の特徴の組み合わせで示される複数の判定ルールそれぞれについて、前記パラメータの影響度合いを決定し、
少なくとも候補者の属する政党の情報を含む候補者情報と、前記パラメータと、前記複数の判定ルールと、前記複数の判定ルールそれぞれについての前記影響度合いと、に基づいて、前記候補者の選挙当落を予測する、
ことを含む処理をコンピュータに実行させるための当落予測プログラムを記憶した記憶媒体。
【符号の説明】
【0081】
10 当落予測装置
11 学習データ生成部
12 判定ルール生成部
13 学習時支持度決定部
14 影響度決定部
15 機械学習部
16 学習データDB
17 学習時支持度DB
18 特徴影響度DB
20 ルールDB
31 予測対象データ生成部
33 予測時支持度決定部
35 予測部
36 予測対象データDB
37 予測時支持度DB
40 コンピュータ
41 CPU
42 メモリ
43 記憶部
49 記憶媒体
50 当落予測プログラム
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11